Ταξινόμηση κειμένων με προσαρμογή προ-εκπαιδευμένων γλωσσικών μοντέλων

Η Ταξινόμηση Κειμένων είναι μια σημαντική μελέτη στον τομέα της εξαγωγής πληροφορίας από κείμενα (Text Mining), έχοντας ένα μεγάλο εύρος εφαρμογής. Τα τελευταία χρόνια, μέσω της εξέλιξης αλγορίθμων νευρωνικών δικτύων (Neural Networks), έχουν αναπτυχθεί πολλές τεχνικές εξαγωγής γλωσσικών μοντέλων α...

Πλήρης περιγραφή

Αποθηκεύτηκε σε:
Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριοι συγγραφείς: Μπόνης, Αθανάσιος, Δημόπουλος, Γεώργιος
Άλλοι συγγραφείς: Σταματάτος, Ευστάθιος
Γλώσσα:el_GR
Δημοσίευση: 2020
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/11610/19676
Ετικέτες: Προσθήκη ετικέτας
Δεν υπάρχουν, Καταχωρήστε ετικέτα πρώτοι!
Περιγραφή
Περίληψη:Η Ταξινόμηση Κειμένων είναι μια σημαντική μελέτη στον τομέα της εξαγωγής πληροφορίας από κείμενα (Text Mining), έχοντας ένα μεγάλο εύρος εφαρμογής. Τα τελευταία χρόνια, μέσω της εξέλιξης αλγορίθμων νευρωνικών δικτύων (Neural Networks), έχουν αναπτυχθεί πολλές τεχνικές εξαγωγής γλωσσικών μοντέλων από μεγάλες συλλογές κειμένων γνωστά ως προ-εκπαιδευμένα γλωσσικά μοντέλα (Pre-Trained Language Models), οι οποίες βρίσκουν εφαρμογή σε ποικίλες εργασίες επεξεργασίας φυσικής γλώσσας (Natural Language Processing - NLP). Την συγκεκριμένη χρονική στιγμή, η βέλτιστη πρακτική για ταξινόμηση κειμένων, π.χ. αναγνώριση συγγραφέα, είναι η εφαρμογή των Pre-Trained Language Models με την κατάλληλη προσαρμογή τους (Fine-Tuning). Στην υπάρχουσα εργασία, θα αναλύσουμε και θα εφαρμόσουμε την τεχνική του Universal Language Model Fine Tuning της ερευνητικής ομάδας του fast.ai στον τομέα του NLP, σε διάφορες εφαρμογές της κατηγοριοποιήσης κειμένου, καθώς και σύγκριση με άλλες τεχνικές του FineTuning