Ανίχνευση ρητορικής μίσους με χρήση του γλωσσικού μοντέλου BERT

Ο τεράστιος όγκος πληροφοριών που παράγεται καθημερινά στο διαδίκτυο και η μαζική χρήση μέσων κοινωνικής δικτύωσης έχουν δημιουργήσει πρωτόγνωρα φαινόμενα ρητορικής μίσους. Η πρόσφατη ραγδαία εξέλιξη του τομέα της τεχνητής νοημοσύνης και ιδιαίτερα των αρχιτεκτονικών βαθιάς μάθησης όπως η Transformer...

Full description

Saved in:
Bibliographic Details
Main Authors: Ζιώζας, Γεώργιος, Ziozas, George
Other Authors: Σταματάτος, Ευστάθιος
Language:el_GR
Published: 2023
Subjects:
Online Access:http://hdl.handle.net/11610/24503
Tags: Add Tag
No Tags, Be the first to tag this record!
_version_ 1828461349547540480
author Ζιώζας, Γεώργιος
Ziozas, George
author2 Σταματάτος, Ευστάθιος
author_facet Σταματάτος, Ευστάθιος
Ζιώζας, Γεώργιος
Ziozas, George
author_sort Ζιώζας, Γεώργιος
collection DSpace
description Ο τεράστιος όγκος πληροφοριών που παράγεται καθημερινά στο διαδίκτυο και η μαζική χρήση μέσων κοινωνικής δικτύωσης έχουν δημιουργήσει πρωτόγνωρα φαινόμενα ρητορικής μίσους. Η πρόσφατη ραγδαία εξέλιξη του τομέα της τεχνητής νοημοσύνης και ιδιαίτερα των αρχιτεκτονικών βαθιάς μάθησης όπως η Transformer, έχει βοηθήσει σημαντικά την διαδικασία αυτόματης ταξινόμησης κειμένων με βάση το περιεχόμενο τους. Στην έρευνα μας ξεκινάμε αναλύοντας τον τομέα της τεχνητής νοημοσύνης και της ταξινόμησης ρητορικής μίσους. Στην συνέχεια επικεντρωνόμαστε στην εξέταση συνόλων δεδομένων ρητορικής μίσους και προτείνουμε μια μεθοδολογία επιλογής αυτών με βάση την αντικειμενικότα. Στην πειραματική μας προσέγγιση, μετά την εκτενή επεξεργασία των δεδομένων, υλοποιούμε την αρχιτεκτονική Transformer B.E.R.T με σκοπό την δημιουργία ταξινομητή πολλαπλών ετικετών 6 κλάσεων στόχων. Τα αποτελέσματα μας παρουσιάζουν τις καλύτερες επιδόσεις στο συγκεκριμένο σύνολο δεδομένων και δίνουν κατευθύνσεις για μελλοντικές έρευνες.
id oai:hellanicus.lib.aegean.gr:11610-24503
institution Hellanicus
language el_GR
publishDate 2023
record_format dspace
spelling oai:hellanicus.lib.aegean.gr:11610-245032023-01-17T11:35:26Z Ανίχνευση ρητορικής μίσους με χρήση του γλωσσικού μοντέλου BERT Hate speech detection using BERT language model Ζιώζας, Γεώργιος Ziozas, George Σταματάτος, Ευστάθιος ανάλυση ρητορικής μίσους τεχνητή νοημοσύνη γλωσσικό μοντέλο BERT hate speech analysis artificial intelligence BERT language model Artificial intelligence Hate speech Ο τεράστιος όγκος πληροφοριών που παράγεται καθημερινά στο διαδίκτυο και η μαζική χρήση μέσων κοινωνικής δικτύωσης έχουν δημιουργήσει πρωτόγνωρα φαινόμενα ρητορικής μίσους. Η πρόσφατη ραγδαία εξέλιξη του τομέα της τεχνητής νοημοσύνης και ιδιαίτερα των αρχιτεκτονικών βαθιάς μάθησης όπως η Transformer, έχει βοηθήσει σημαντικά την διαδικασία αυτόματης ταξινόμησης κειμένων με βάση το περιεχόμενο τους. Στην έρευνα μας ξεκινάμε αναλύοντας τον τομέα της τεχνητής νοημοσύνης και της ταξινόμησης ρητορικής μίσους. Στην συνέχεια επικεντρωνόμαστε στην εξέταση συνόλων δεδομένων ρητορικής μίσους και προτείνουμε μια μεθοδολογία επιλογής αυτών με βάση την αντικειμενικότα. Στην πειραματική μας προσέγγιση, μετά την εκτενή επεξεργασία των δεδομένων, υλοποιούμε την αρχιτεκτονική Transformer B.E.R.T με σκοπό την δημιουργία ταξινομητή πολλαπλών ετικετών 6 κλάσεων στόχων. Τα αποτελέσματα μας παρουσιάζουν τις καλύτερες επιδόσεις στο συγκεκριμένο σύνολο δεδομένων και δίνουν κατευθύνσεις για μελλοντικές έρευνες. The huge daily volume of information produced on the internet and the massive use of social media has created unprecedented phenomena of hate speech. The recent rapid development of the field of artificial intelligence and especially of deep learning architectures such as Transformer has significantly helped the process of automatic text classification based on their content. In our research, we start by analyzing the field of artificial intelligence and the classification of hate speech. We then focus on examining hate speech data sets and proposing a methodology for selecting them based on the objective. In our experimental approach, after extensive data processing, we created the Transformer B.E.R.T architecture with the aim of creating a multi-tag classifier of 6 target classes. Our results show the best performance in this data set and give directions for future research. 2023-01-10T10:58:37Z 2023-01-10T10:58:37Z 2021-10-20 http://hdl.handle.net/11610/24503 el_GR Αναφορά Δημιουργού 4.0 Διεθνές http://creativecommons.org/licenses/by/4.0/ 102 σ. application/pdf Σάμος
spellingShingle ανάλυση ρητορικής μίσους
τεχνητή νοημοσύνη
γλωσσικό μοντέλο BERT
hate speech analysis
artificial intelligence
BERT language model
Artificial intelligence
Hate speech
Ζιώζας, Γεώργιος
Ziozas, George
Ανίχνευση ρητορικής μίσους με χρήση του γλωσσικού μοντέλου BERT
title Ανίχνευση ρητορικής μίσους με χρήση του γλωσσικού μοντέλου BERT
title_full Ανίχνευση ρητορικής μίσους με χρήση του γλωσσικού μοντέλου BERT
title_fullStr Ανίχνευση ρητορικής μίσους με χρήση του γλωσσικού μοντέλου BERT
title_full_unstemmed Ανίχνευση ρητορικής μίσους με χρήση του γλωσσικού μοντέλου BERT
title_short Ανίχνευση ρητορικής μίσους με χρήση του γλωσσικού μοντέλου BERT
title_sort ανίχνευση ρητορικής μίσους με χρήση του γλωσσικού μοντέλου bert
topic ανάλυση ρητορικής μίσους
τεχνητή νοημοσύνη
γλωσσικό μοντέλο BERT
hate speech analysis
artificial intelligence
BERT language model
Artificial intelligence
Hate speech
url http://hdl.handle.net/11610/24503
work_keys_str_mv AT ziōzasgeōrgios anichneusērētorikēsmisousmechrēsētouglōssikoumonteloubert
AT ziozasgeorge anichneusērētorikēsmisousmechrēsētouglōssikoumonteloubert
AT ziōzasgeōrgios hatespeechdetectionusingbertlanguagemodel
AT ziozasgeorge hatespeechdetectionusingbertlanguagemodel