Ανάπτυξη ενός εκπαιδεύσιμου ανιχνευτή ορίων φράσεων (text chunker) για τα νέα ελληνικά

Η παρούσα διπλωµατική εργασία υλοποιεί την ανάπτυξη ενός εκπαιδεύσιµου ανιχνευτή ορίων φράσεων σε προτάσεις φυσικής γλώσσας για τα Νέα Ελληνικά µε χρήση ∆έντρων Απόφασης (decision trees). Βασίζεται σε τµήµα της διδακτορικής διατριβής του επιβλέποντος καθηγητή της διπλωµατικής αυτής εργασίας. Η εκπαί...

Full description

Saved in:
Bibliographic Details
Main Authors: Κούρλα, Ελένη, Μπουμπάρης, Γεώργιος
Other Authors: Σταματάτος, Ευστάθιος
Language:Greek
Published: 2015
Subjects:
Online Access:https://vsmart.lib.aegean.gr/webopac/List.csp?SearchT1=%CE%9A%CE%BF%CF%8D%CF%81%CE%BB%CE%B1%2C+%CE%95%CE%BB%CE%AD%CE%BD%CE%B7&Index1=Keywordsbib&Database=1&SearchMethod=Find_1&SearchTerm1=%CE%9A%CE%BF%CF%8D%CF%81%CE%BB%CE%B1%2C+%CE%95%CE%BB%CE%AD%CE%BD%CE%B7&OpacLanguage=gre&Profile=Default&EncodedRequest=D*0A*1E*9B*C4*02*CB*F1*14*C5*A3w*84*99*24c&EncodedQuery=D*0A*1E*9B*C4*02*CB*F1*14*C5*A3w*84*99*24c&Source=SysQR&PageType=Start&PreviousList=RecordListFind&WebPageNr=1&NumberToRetrieve=50&WebAction=NewSearch&StartValue=0&RowRepeat=0&ExtraInfo=&SortIndex=Year&SortDirection=-1&Resource=&SavingIndicator=&RestrType=&RestrTerms=&RestrShowAll=&LinkToIndex=
http://hdl.handle.net/11610/8904
Tags: Add Tag
No Tags, Be the first to tag this record!
_version_ 1828462501046517760
author Κούρλα, Ελένη
Μπουμπάρης, Γεώργιος
author2 Σταματάτος, Ευστάθιος
author_facet Σταματάτος, Ευστάθιος
Κούρλα, Ελένη
Μπουμπάρης, Γεώργιος
author_sort Κούρλα, Ελένη
collection DSpace
description Η παρούσα διπλωµατική εργασία υλοποιεί την ανάπτυξη ενός εκπαιδεύσιµου ανιχνευτή ορίων φράσεων σε προτάσεις φυσικής γλώσσας για τα Νέα Ελληνικά µε χρήση ∆έντρων Απόφασης (decision trees). Βασίζεται σε τµήµα της διδακτορικής διατριβής του επιβλέποντος καθηγητή της διπλωµατικής αυτής εργασίας. Η εκπαίδευση και αξιολόγηση του συστήµατος της εργασίας έγιναν σε ένα σώµα κειµένων αποτελούµενο από άρθρα του ηµερήσιου τύπου. Για την τελική επιλογή του αλγορίθµου πραγµατοποιήθηκαν πειράµατα στο περιβάλλον αλγορίθµων Μηχανικής Μάθησης Weka, αξιολογούµενα από τρία µέτρα αξιολόγησης, την ακρίβεια, την ανάκληση και (τον συνδυασµό αυτών) τον αρµονικό µέσο όρο F. Τις υψηλότερες τιµές των τριών αυτών µετρικών έδωσε ο ταξινοµητής J48 των δέντρων απόφασης, µε την χρήση ενός βέλτιστου εύρους δεδοµένων εκπαίδευσης, ο οποίος και τελικά επιλέχθηκε µε τελική απόδοση (F) ίση µε 90,35%, Τέλος, εφαρµόστηκε και µια µέθοδος για την επίλυση του προβλήµατος της ανισορροπίας των κλάσεων µε αποτέλεσµα την βελτίωση της απόδοσης σε 94,69%.
id oai:hellanicus.lib.aegean.gr:11610-8904
institution Hellanicus
language Greek
publishDate 2015
record_format dspace
spelling oai:hellanicus.lib.aegean.gr:11610-89042021-03-10T13:56:57Z Ανάπτυξη ενός εκπαιδεύσιμου ανιχνευτή ορίων φράσεων (text chunker) για τα νέα ελληνικά Κούρλα, Ελένη Μπουμπάρης, Γεώργιος Σταματάτος, Ευστάθιος Ανιχνευτής Chunk Όρια Corpus Φράση Weka Αναλυτής Decision trees Computational linguistics Η παρούσα διπλωµατική εργασία υλοποιεί την ανάπτυξη ενός εκπαιδεύσιµου ανιχνευτή ορίων φράσεων σε προτάσεις φυσικής γλώσσας για τα Νέα Ελληνικά µε χρήση ∆έντρων Απόφασης (decision trees). Βασίζεται σε τµήµα της διδακτορικής διατριβής του επιβλέποντος καθηγητή της διπλωµατικής αυτής εργασίας. Η εκπαίδευση και αξιολόγηση του συστήµατος της εργασίας έγιναν σε ένα σώµα κειµένων αποτελούµενο από άρθρα του ηµερήσιου τύπου. Για την τελική επιλογή του αλγορίθµου πραγµατοποιήθηκαν πειράµατα στο περιβάλλον αλγορίθµων Μηχανικής Μάθησης Weka, αξιολογούµενα από τρία µέτρα αξιολόγησης, την ακρίβεια, την ανάκληση και (τον συνδυασµό αυτών) τον αρµονικό µέσο όρο F. Τις υψηλότερες τιµές των τριών αυτών µετρικών έδωσε ο ταξινοµητής J48 των δέντρων απόφασης, µε την χρήση ενός βέλτιστου εύρους δεδοµένων εκπαίδευσης, ο οποίος και τελικά επιλέχθηκε µε τελική απόδοση (F) ίση µε 90,35%, Τέλος, εφαρµόστηκε και µια µέθοδος για την επίλυση του προβλήµατος της ανισορροπίας των κλάσεων µε αποτέλεσµα την βελτίωση της απόδοσης σε 94,69%. 2015-11-17T10:32:43Z 2015-11-17T10:32:43Z 2007 https://vsmart.lib.aegean.gr/webopac/List.csp?SearchT1=%CE%9A%CE%BF%CF%8D%CF%81%CE%BB%CE%B1%2C+%CE%95%CE%BB%CE%AD%CE%BD%CE%B7&Index1=Keywordsbib&Database=1&SearchMethod=Find_1&SearchTerm1=%CE%9A%CE%BF%CF%8D%CF%81%CE%BB%CE%B1%2C+%CE%95%CE%BB%CE%AD%CE%BD%CE%B7&OpacLanguage=gre&Profile=Default&EncodedRequest=D*0A*1E*9B*C4*02*CB*F1*14*C5*A3w*84*99*24c&EncodedQuery=D*0A*1E*9B*C4*02*CB*F1*14*C5*A3w*84*99*24c&Source=SysQR&PageType=Start&PreviousList=RecordListFind&WebPageNr=1&NumberToRetrieve=50&WebAction=NewSearch&StartValue=0&RowRepeat=0&ExtraInfo=&SortIndex=Year&SortDirection=-1&Resource=&SavingIndicator=&RestrType=&RestrTerms=&RestrShowAll=&LinkToIndex= http://hdl.handle.net/11610/8904 el application/pdf Σάμος
spellingShingle Ανιχνευτής
Chunk
Όρια
Corpus
Φράση
Weka
Αναλυτής
Decision trees
Computational linguistics
Κούρλα, Ελένη
Μπουμπάρης, Γεώργιος
Ανάπτυξη ενός εκπαιδεύσιμου ανιχνευτή ορίων φράσεων (text chunker) για τα νέα ελληνικά
title Ανάπτυξη ενός εκπαιδεύσιμου ανιχνευτή ορίων φράσεων (text chunker) για τα νέα ελληνικά
title_full Ανάπτυξη ενός εκπαιδεύσιμου ανιχνευτή ορίων φράσεων (text chunker) για τα νέα ελληνικά
title_fullStr Ανάπτυξη ενός εκπαιδεύσιμου ανιχνευτή ορίων φράσεων (text chunker) για τα νέα ελληνικά
title_full_unstemmed Ανάπτυξη ενός εκπαιδεύσιμου ανιχνευτή ορίων φράσεων (text chunker) για τα νέα ελληνικά
title_short Ανάπτυξη ενός εκπαιδεύσιμου ανιχνευτή ορίων φράσεων (text chunker) για τα νέα ελληνικά
title_sort ανάπτυξη ενός εκπαιδεύσιμου ανιχνευτή ορίων φράσεων text chunker για τα νέα ελληνικά
topic Ανιχνευτής
Chunk
Όρια
Corpus
Φράση
Weka
Αναλυτής
Decision trees
Computational linguistics
url https://vsmart.lib.aegean.gr/webopac/List.csp?SearchT1=%CE%9A%CE%BF%CF%8D%CF%81%CE%BB%CE%B1%2C+%CE%95%CE%BB%CE%AD%CE%BD%CE%B7&Index1=Keywordsbib&Database=1&SearchMethod=Find_1&SearchTerm1=%CE%9A%CE%BF%CF%8D%CF%81%CE%BB%CE%B1%2C+%CE%95%CE%BB%CE%AD%CE%BD%CE%B7&OpacLanguage=gre&Profile=Default&EncodedRequest=D*0A*1E*9B*C4*02*CB*F1*14*C5*A3w*84*99*24c&EncodedQuery=D*0A*1E*9B*C4*02*CB*F1*14*C5*A3w*84*99*24c&Source=SysQR&PageType=Start&PreviousList=RecordListFind&WebPageNr=1&NumberToRetrieve=50&WebAction=NewSearch&StartValue=0&RowRepeat=0&ExtraInfo=&SortIndex=Year&SortDirection=-1&Resource=&SavingIndicator=&RestrType=&RestrTerms=&RestrShowAll=&LinkToIndex=
http://hdl.handle.net/11610/8904
work_keys_str_mv AT kourlaelenē anaptyxēenosekpaideusimouanichneutēoriōnphraseōntextchunkergiataneaellēnika
AT mpoumparēsgeōrgios anaptyxēenosekpaideusimouanichneutēoriōnphraseōntextchunkergiataneaellēnika