Αναγνώριση προφίλ συγγραφέα (Author Profiling)

Το θέμα της παρούσας εργασίας είναι η αναγνώριση του προφίλ συγγραφέα με μεθόδους μηχανικής μάθησης. Στόχος είναι να μελετηθεί η δυνατότητα αναγνώρισης του φύλου του συγγραφέα θεωρώντας μόνο στυλιστικά χαρακτηριστικά. Στο θεωρητικό μέρος παρουσιάζονται βασικές αρχές της εποπτευόμενης μηχανικής μά...

Πλήρης περιγραφή

Αποθηκεύτηκε σε:
Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Σφουγγάρη, Ελένη
Άλλοι συγγραφείς: Σταματάτος, Ευστάθιος
Γλώσσα:el_GR
Δημοσίευση: 2020
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/11610/19798
Ετικέτες: Προσθήκη ετικέτας
Δεν υπάρχουν, Καταχωρήστε ετικέτα πρώτοι!
_version_ 1828460668977676288
author Σφουγγάρη, Ελένη
author2 Σταματάτος, Ευστάθιος
author_facet Σταματάτος, Ευστάθιος
Σφουγγάρη, Ελένη
author_sort Σφουγγάρη, Ελένη
collection DSpace
description Το θέμα της παρούσας εργασίας είναι η αναγνώριση του προφίλ συγγραφέα με μεθόδους μηχανικής μάθησης. Στόχος είναι να μελετηθεί η δυνατότητα αναγνώρισης του φύλου του συγγραφέα θεωρώντας μόνο στυλιστικά χαρακτηριστικά. Στο θεωρητικό μέρος παρουσιάζονται βασικές αρχές της εποπτευόμενης μηχανικής μάθησης και περιγράφεται η διαδικασία της κατηγοριοποίησης κειμένου. Ακολουθεί μια αναφορά στα βασικότερα σημεία του αλγορίθμου διανυσμάτων υποστήριξης και στις κυριότερες μετρικές αξιολόγησης. Τέλος περιγράφονται τα πακέτα και οι βιβλιοθήκες που χρησιμοποιήθηκαν για τη διεκπεραίωση των πειραμάτων της εργασίας και γίνεται μια ανασκόπηση της βιβλιογραφίας Στο πειραματικό μέρος αναπτύσσονται μοντέλα με βάση χαρακτηριστικά σε επίπεδο λέξεων, σε επίπεδο χαρακτήρων και σε συντακτικό επίπεδο. Επίσης μελετάται και ο συνδυασμός των παραπάνω χαρακτηριστικών με τις μεθόδους “early” και “late fusion”. Ολα τα μοντέλα εκπαιδεύονται σε δύο σετ εκπαίδευσης, το “blog authorship corpus” και τη συλλογή εκπαίδευσης από το PAN 2017, χρησιμοποιώντας ως μέθοδο επικύρωσης την “k-fold cross validation”. Στο τελευταίο κεφάλαιο ελέγχονται οι προβλεψεις των μοντέλων που αναπτύχθηκαν σε έξι διαφορετικές συλλογές: blogs, chat, discussion, emails, essays, interviews καθώς και στη συλλογή που προκύπτει από τον συνδυασμό τους με σκοπό να ερευνηθεί η ικανότητα των μοντέλων να εφαρμοστούν σε συλλογές διαφορετικού είδους από αυτό της συλλογής εκπαίδευσης.
id oai:hellanicus.lib.aegean.gr:11610-19798
institution Hellanicus
language el_GR
publishDate 2020
record_format dspace
spelling oai:hellanicus.lib.aegean.gr:11610-197982020-07-15T09:12:15Z Αναγνώριση προφίλ συγγραφέα (Author Profiling) Σφουγγάρη, Ελένη Σταματάτος, Ευστάθιος αναγνώριση προφίλ συγγραφέα μηχανική μάθηση κατηγοριοποίηση κειμένου author profiling machine learning text classification Text processing (Computer science) Machine learning Το θέμα της παρούσας εργασίας είναι η αναγνώριση του προφίλ συγγραφέα με μεθόδους μηχανικής μάθησης. Στόχος είναι να μελετηθεί η δυνατότητα αναγνώρισης του φύλου του συγγραφέα θεωρώντας μόνο στυλιστικά χαρακτηριστικά. Στο θεωρητικό μέρος παρουσιάζονται βασικές αρχές της εποπτευόμενης μηχανικής μάθησης και περιγράφεται η διαδικασία της κατηγοριοποίησης κειμένου. Ακολουθεί μια αναφορά στα βασικότερα σημεία του αλγορίθμου διανυσμάτων υποστήριξης και στις κυριότερες μετρικές αξιολόγησης. Τέλος περιγράφονται τα πακέτα και οι βιβλιοθήκες που χρησιμοποιήθηκαν για τη διεκπεραίωση των πειραμάτων της εργασίας και γίνεται μια ανασκόπηση της βιβλιογραφίας Στο πειραματικό μέρος αναπτύσσονται μοντέλα με βάση χαρακτηριστικά σε επίπεδο λέξεων, σε επίπεδο χαρακτήρων και σε συντακτικό επίπεδο. Επίσης μελετάται και ο συνδυασμός των παραπάνω χαρακτηριστικών με τις μεθόδους “early” και “late fusion”. Ολα τα μοντέλα εκπαιδεύονται σε δύο σετ εκπαίδευσης, το “blog authorship corpus” και τη συλλογή εκπαίδευσης από το PAN 2017, χρησιμοποιώντας ως μέθοδο επικύρωσης την “k-fold cross validation”. Στο τελευταίο κεφάλαιο ελέγχονται οι προβλεψεις των μοντέλων που αναπτύχθηκαν σε έξι διαφορετικές συλλογές: blogs, chat, discussion, emails, essays, interviews καθώς και στη συλλογή που προκύπτει από τον συνδυασμό τους με σκοπό να ερευνηθεί η ικανότητα των μοντέλων να εφαρμοστούν σε συλλογές διαφορετικού είδους από αυτό της συλλογής εκπαίδευσης. 2020-01-31T12:36:49Z 2020-01-31T12:36:49Z 2019-06-11 http://hdl.handle.net/11610/19798 el_GR Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές http://creativecommons.org/licenses/by-nc-nd/4.0/ 86 σ. application/pdf Σάμος
spellingShingle αναγνώριση προφίλ συγγραφέα
μηχανική μάθηση
κατηγοριοποίηση κειμένου
author profiling
machine learning
text classification
Text processing (Computer science)
Machine learning
Σφουγγάρη, Ελένη
Αναγνώριση προφίλ συγγραφέα (Author Profiling)
title Αναγνώριση προφίλ συγγραφέα (Author Profiling)
title_full Αναγνώριση προφίλ συγγραφέα (Author Profiling)
title_fullStr Αναγνώριση προφίλ συγγραφέα (Author Profiling)
title_full_unstemmed Αναγνώριση προφίλ συγγραφέα (Author Profiling)
title_short Αναγνώριση προφίλ συγγραφέα (Author Profiling)
title_sort αναγνώριση προφίλ συγγραφέα author profiling
topic αναγνώριση προφίλ συγγραφέα
μηχανική μάθηση
κατηγοριοποίηση κειμένου
author profiling
machine learning
text classification
Text processing (Computer science)
Machine learning
url http://hdl.handle.net/11610/19798
work_keys_str_mv AT sphoungarēelenē anagnōrisēprophilsyngrapheaauthorprofiling