Ταξινόμηση κειμένων με προσαρμογή προ-εκπαιδευμένων γλωσσικών μοντέλων
Η Ταξινόμηση Κειμένων είναι μια σημαντική μελέτη στον τομέα της εξαγωγής πληροφορίας από κείμενα (Text Mining), έχοντας ένα μεγάλο εύρος εφαρμογής. Τα τελευταία χρόνια, μέσω της εξέλιξης αλγορίθμων νευρωνικών δικτύων (Neural Networks), έχουν αναπτυχθεί πολλές τεχνικές εξαγωγής γλωσσικών μοντέλων α...
Αποθηκεύτηκε σε:
| Κύριοι συγγραφείς: | , |
|---|---|
| Άλλοι συγγραφείς: | |
| Γλώσσα: | el_GR |
| Δημοσίευση: |
2020
|
| Θέματα: | |
| Διαθέσιμο Online: | http://hdl.handle.net/11610/19676 |
| Ετικέτες: |
Προσθήκη ετικέτας
Δεν υπάρχουν, Καταχωρήστε ετικέτα πρώτοι!
|
| _version_ | 1828462613573402624 |
|---|---|
| author | Μπόνης, Αθανάσιος Δημόπουλος, Γεώργιος |
| author2 | Σταματάτος, Ευστάθιος |
| author_sort | Μπόνης, Αθανάσιος |
| collection | DSpace |
| description | Η Ταξινόμηση Κειμένων είναι μια σημαντική μελέτη στον τομέα της εξαγωγής πληροφορίας από κείμενα (Text Mining), έχοντας ένα μεγάλο εύρος εφαρμογής. Τα τελευταία
χρόνια, μέσω της εξέλιξης αλγορίθμων νευρωνικών δικτύων (Neural Networks), έχουν
αναπτυχθεί πολλές τεχνικές εξαγωγής γλωσσικών μοντέλων από μεγάλες συλλογές κειμένων γνωστά ως προ-εκπαιδευμένα γλωσσικά μοντέλα (Pre-Trained Language Models), οι οποίες βρίσκουν εφαρμογή σε ποικίλες εργασίες επεξεργασίας φυσικής γλώσσας (Natural Language Processing - NLP). Την συγκεκριμένη χρονική στιγμή, η βέλτιστη πρακτική για ταξινόμηση κειμένων, π.χ. αναγνώριση συγγραφέα, είναι η εφαρμογή των Pre-Trained Language Models με την κατάλληλη προσαρμογή τους (Fine-Tuning). Στην υπάρχουσα
εργασία, θα αναλύσουμε και θα εφαρμόσουμε την τεχνική του Universal Language Model Fine Tuning της ερευνητικής ομάδας του fast.ai στον τομέα του NLP, σε διάφορες εφαρμογές της κατηγοριοποιήσης κειμένου, καθώς και σύγκριση με άλλες τεχνικές του FineTuning |
| id | oai:hellanicus.lib.aegean.gr:11610-19676 |
| institution | Hellanicus |
| language | el_GR |
| publishDate | 2020 |
| record_format | dspace |
| title | Ταξινόμηση κειμένων με προσαρμογή προ-εκπαιδευμένων γλωσσικών μοντέλων |
| topic | text-mining NLP authorship-attribution fine-tuning ULMFiT ταξινόμηση κειμένων γλωσσικά μοντέλα ταξινόμηση ιστοσελίδων Data mining Text processing (Computer science) Linguistic models |
| url | http://hdl.handle.net/11610/19676 |
| work_keys_str_mv | AT mponēsathanasios taxinomēsēkeimenōnmeprosarmogēproekpaideumenōnglōssikōnmontelōn AT dēmopoulosgeōrgios taxinomēsēkeimenōnmeprosarmogēproekpaideumenōnglōssikōnmontelōn AT mponēsathanasios textcategorizationbasedonfinetuningofpretrainedlanguagemodels AT dēmopoulosgeōrgios textcategorizationbasedonfinetuningofpretrainedlanguagemodels |