Ανάπτυξη ενός εκπαιδεύσιμου ανιχνευτή ορίων φράσεων (text chunker) για τα νέα ελληνικά
Η παρούσα διπλωµατική εργασία υλοποιεί την ανάπτυξη ενός εκπαιδεύσιµου ανιχνευτή ορίων φράσεων σε προτάσεις φυσικής γλώσσας για τα Νέα Ελληνικά µε χρήση ∆έντρων Απόφασης (decision trees). Βασίζεται σε τµήµα της διδακτορικής διατριβής του επιβλέποντος καθηγητή της διπλωµατικής αυτής εργασίας. Η εκπαί...
Saved in:
| _version_ | 1828462501046517760 |
|---|---|
| author | Κούρλα, Ελένη Μπουμπάρης, Γεώργιος |
| author2 | Σταματάτος, Ευστάθιος |
| author_sort | Κούρλα, Ελένη |
| collection | DSpace |
| description | Η παρούσα διπλωµατική εργασία υλοποιεί την ανάπτυξη ενός εκπαιδεύσιµου ανιχνευτή ορίων φράσεων σε προτάσεις φυσικής γλώσσας για τα Νέα Ελληνικά µε χρήση ∆έντρων Απόφασης (decision trees). Βασίζεται σε τµήµα της διδακτορικής διατριβής του επιβλέποντος καθηγητή της διπλωµατικής αυτής εργασίας. Η εκπαίδευση και αξιολόγηση του συστήµατος της εργασίας έγιναν σε ένα σώµα κειµένων αποτελούµενο από άρθρα του ηµερήσιου τύπου. Για την τελική επιλογή του αλγορίθµου πραγµατοποιήθηκαν πειράµατα στο περιβάλλον αλγορίθµων Μηχανικής Μάθησης Weka, αξιολογούµενα από τρία µέτρα αξιολόγησης, την ακρίβεια, την ανάκληση και (τον συνδυασµό αυτών) τον αρµονικό µέσο όρο F. Τις υψηλότερες τιµές των τριών αυτών µετρικών έδωσε ο ταξινοµητής J48 των δέντρων απόφασης, µε την χρήση ενός βέλτιστου εύρους δεδοµένων εκπαίδευσης, ο οποίος και τελικά επιλέχθηκε µε τελική απόδοση (F) ίση µε 90,35%, Τέλος, εφαρµόστηκε και µια µέθοδος για την επίλυση του προβλήµατος της ανισορροπίας των κλάσεων µε αποτέλεσµα την βελτίωση της απόδοσης σε 94,69%. |
| id | oai:hellanicus.lib.aegean.gr:11610-8904 |
| institution | Hellanicus |
| language | Greek |
| publishDate | 2015 |
| record_format | dspace |
| title | Ανάπτυξη ενός εκπαιδεύσιμου ανιχνευτή ορίων φράσεων (text chunker) για τα νέα ελληνικά |
| topic | Ανιχνευτής Chunk Όρια Corpus Φράση Weka Αναλυτής Decision trees Computational linguistics |
| url | https://vsmart.lib.aegean.gr/webopac/List.csp?SearchT1=%CE%9A%CE%BF%CF%8D%CF%81%CE%BB%CE%B1%2C+%CE%95%CE%BB%CE%AD%CE%BD%CE%B7&Index1=Keywordsbib&Database=1&SearchMethod=Find_1&SearchTerm1=%CE%9A%CE%BF%CF%8D%CF%81%CE%BB%CE%B1%2C+%CE%95%CE%BB%CE%AD%CE%BD%CE%B7&OpacLanguage=gre&Profile=Default&EncodedRequest=D*0A*1E*9B*C4*02*CB*F1*14*C5*A3w*84*99*24c&EncodedQuery=D*0A*1E*9B*C4*02*CB*F1*14*C5*A3w*84*99*24c&Source=SysQR&PageType=Start&PreviousList=RecordListFind&WebPageNr=1&NumberToRetrieve=50&WebAction=NewSearch&StartValue=0&RowRepeat=0&ExtraInfo=&SortIndex=Year&SortDirection=-1&Resource=&SavingIndicator=&RestrType=&RestrTerms=&RestrShowAll=&LinkToIndex= http://hdl.handle.net/11610/8904 |
| work_keys_str_mv | AT kourlaelenē anaptyxēenosekpaideusimouanichneutēoriōnphraseōntextchunkergiataneaellēnika AT mpoumparēsgeōrgios anaptyxēenosekpaideusimouanichneutēoriōnphraseōntextchunkergiataneaellēnika |