Αναγνώριση προφίλ συγγραφέα (Author Profiling)
Το θέμα της παρούσας εργασίας είναι η αναγνώριση του προφίλ συγγραφέα με μεθόδους μηχανικής μάθησης. Στόχος είναι να μελετηθεί η δυνατότητα αναγνώρισης του φύλου του συγγραφέα θεωρώντας μόνο στυλιστικά χαρακτηριστικά. Στο θεωρητικό μέρος παρουσιάζονται βασικές αρχές της εποπτευόμενης μηχανικής μά...
Αποθηκεύτηκε σε:
| Κύριος συγγραφέας: | |
|---|---|
| Άλλοι συγγραφείς: | |
| Γλώσσα: | el_GR |
| Δημοσίευση: |
2020
|
| Θέματα: | |
| Διαθέσιμο Online: | http://hdl.handle.net/11610/19798 |
| Ετικέτες: |
Προσθήκη ετικέτας
Δεν υπάρχουν, Καταχωρήστε ετικέτα πρώτοι!
|
| _version_ | 1828460668977676288 |
|---|---|
| author | Σφουγγάρη, Ελένη |
| author2 | Σταματάτος, Ευστάθιος |
| author_sort | Σφουγγάρη, Ελένη |
| collection | DSpace |
| description | Το θέμα της παρούσας εργασίας είναι η αναγνώριση του προφίλ συγγραφέα με μεθόδους μηχανικής μάθησης. Στόχος είναι να μελετηθεί η δυνατότητα αναγνώρισης του φύλου του συγγραφέα θεωρώντας μόνο στυλιστικά χαρακτηριστικά.
Στο θεωρητικό μέρος παρουσιάζονται βασικές αρχές της εποπτευόμενης μηχανικής μάθησης και περιγράφεται η διαδικασία της κατηγοριοποίησης κειμένου. Ακολουθεί μια αναφορά στα βασικότερα σημεία του αλγορίθμου διανυσμάτων υποστήριξης και στις κυριότερες μετρικές αξιολόγησης. Τέλος περιγράφονται τα πακέτα και οι βιβλιοθήκες που χρησιμοποιήθηκαν για τη διεκπεραίωση των πειραμάτων της εργασίας και γίνεται μια ανασκόπηση της βιβλιογραφίας
Στο πειραματικό μέρος αναπτύσσονται μοντέλα με βάση χαρακτηριστικά σε επίπεδο λέξεων, σε επίπεδο χαρακτήρων και σε συντακτικό επίπεδο. Επίσης μελετάται και ο συνδυασμός των παραπάνω χαρακτηριστικών με τις μεθόδους “early” και “late fusion”. Ολα τα μοντέλα εκπαιδεύονται σε δύο σετ εκπαίδευσης, το “blog authorship corpus” και τη συλλογή εκπαίδευσης από το PAN 2017, χρησιμοποιώντας ως μέθοδο επικύρωσης την “k-fold cross validation”. Στο τελευταίο κεφάλαιο ελέγχονται οι προβλεψεις των μοντέλων που αναπτύχθηκαν σε έξι διαφορετικές συλλογές: blogs, chat, discussion, emails, essays, interviews καθώς και στη συλλογή που προκύπτει από τον συνδυασμό τους με σκοπό να ερευνηθεί η ικανότητα των μοντέλων να εφαρμοστούν σε συλλογές διαφορετικού είδους από αυτό της συλλογής εκπαίδευσης. |
| id | oai:hellanicus.lib.aegean.gr:11610-19798 |
| institution | Hellanicus |
| language | el_GR |
| publishDate | 2020 |
| record_format | dspace |
| title | Αναγνώριση προφίλ συγγραφέα (Author Profiling) |
| topic | αναγνώριση προφίλ συγγραφέα μηχανική μάθηση κατηγοριοποίηση κειμένου author profiling machine learning text classification Text processing (Computer science) Machine learning |
| url | http://hdl.handle.net/11610/19798 |
| work_keys_str_mv | AT sphoungarēelenē anagnōrisēprophilsyngrapheaauthorprofiling |