Κανονικοποίηση λέξεων : πτυχιακή εργασία

Στην εποχή μας,το θέμα της επεξεργασίας των χειρόγραφων λέξεων εξακολουθεί να είναι ένα «ανοικτό» ερευνητικό ζήτημα. Οι χειρόγραφες λέξεις λόγω της ποικιλομορφίας της γραφής, της ύπαρξης αλληλεπικαλυπτόμενων γραμμάτων, της συνεχόμενης γραφήςκαι ενδεχόμενης κλίσης είναι αρκετά πιο δύσκολα στην επεξερ...

Πλήρης περιγραφή

Αποθηκεύτηκε σε:
Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Τσακαλίδου, Ελίνα
Συγγραφή απο Οργανισμό/Αρχή: Πανεπιστήμιο Αιγαίου. Σχολή Θετικών Επιστημών. Τμήμα Μαθηματικών
Άλλοι συγγραφείς: Καβαλλιεράτου, Εργίνα (dgsf)
Μορφή: Thesis Βιβλίο
Γλώσσα:Greek
Δημοσίευση: 2014.
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/11610/8780
Ετικέτες: Προσθήκη ετικέτας
Δεν υπάρχουν, Καταχωρήστε ετικέτα πρώτοι!
Περιγραφή
Περίληψη:Στην εποχή μας,το θέμα της επεξεργασίας των χειρόγραφων λέξεων εξακολουθεί να είναι ένα «ανοικτό» ερευνητικό ζήτημα. Οι χειρόγραφες λέξεις λόγω της ποικιλομορφίας της γραφής, της ύπαρξης αλληλεπικαλυπτόμενων γραμμάτων, της συνεχόμενης γραφήςκαι ενδεχόμενης κλίσης είναι αρκετά πιο δύσκολα στην επεξεργασία τους. Στην παρούσα διπλωματική εργασία μελετήσαμε τα στάδια επεξεργασίας που συμβάλουν στην Κανονικοποίηση Λέξεων. Η κανονικοποίηση των λέξεων είναι απαραίτητη σε συστήματα όπως η Οπτική Αναγνώριση Χαρακτήρων (OCR), το Word Spotting, Αναγνώριση Γραφέα ,και γενικά σε όλα τα συστήματα που σχετίζονται με την επεξεργασία λέξεων και χαρακτήρων. Οι λέξεις που είχαμε να κανονικοποιήσουμε ήταν στο σύνολο 738 από 246 γραφείς που έγραψαν τρείς λέξεις, δημοκρατία, μάλλον και σαστίζω. Πιο συγκεκρίμενα στην αρχή μελετήσαμε και αναφέραμε ποιές επεξεργασίες πραγματοποιούνται σε κάθε σύστημα. Έπειτα γίνεται μια μελέτη στους χώρους όπου ύπαρχει η κανονικοποίηση λέξεων. Από την μελέτη αυτή αντλήσαμε ιδέες για να προσεγγίσουμε την κανονικοποίηση που θα παρουσιάσουμε. Η διαδικασία κανονικοποίησης που θα προκύψει είναι απαραίτητη για το ήδη υπάρχον σύστημα που διαθέτει η ομάδα. Το σύστημα αυτό ήδη δουλεύει με μεγάλη επιτυχία για δακτυλογραφημένες λέξεις [1]. Για να επιτύχει ο στόχος της εργασίας δημιουργήθηκαν διάφορα στάδια επεξεργασίας που εκτελέστηκαν σε διάφορους συνδυασμούςμε σκοπό την αποδοτικότερη κανονικοποίηση. Για να υλοποιηθούν όσα αναφέραμε παραπάνω εκτελέστηκαν τέσσερις συνδυασμοί, από τους όποιους την βέλτιστη απόδοση την είχε ο τελευταίος. Παράλληλα, αναπτύχθηκε και μια μεθοδολογία σύγκρισης των λέξεων για να εξεταστεί η ομοιότητα ανάμεσα τους. Η εφαρμογή αυτής της επεξεργασίας δείχνει αν ήταν επιτυχής η κανονικοποίηση για κάθε πείραμα. Η σύγκριση έγινε για κάθε λέξη με όλες τις υπόλοιπες. Τέλος θα παρουσιαστούν και θα αναλυθούν τα αποτελέσματα. Επίσης θα προταθούν διάφορες λύσεις για μελλοντική έρευνα.
Even nowadays, the research related to the processing of handwritten words, still remains open. What makes processing of handwritten words difficult is mainly their diversity, the overlapped letters and the cursive form of writing. This thesis studies the processing steps that contribute on Normalization of Handwritten Words. Normalizationof Handwritten Words is essential for systems like the Optical Character Recognition, the Word Spotting, the Writers Identification, and in general for all systems that are related to theprocessing of handwritten words and characters. We had to normalize a set of 738 Greek words written by 246 writers who wrote 3 words,δημοκρατία which means democracy,μάλλον which means rather and the verbσαστίζω translated meansflummox. In more detail, we first analyzed and recorded which processes are performed in each system. Then, we worked on discovering under which cases the handwritten word normalization is needed, and used those results to get an idea about how to approach the normalization presented here. The final words that will arise are needed by the system that our team possesses. This system is already working with a great success for typed words [1]. The objective of this study was accomplished by developing different processing stages, which were applied in different orders and different combinations, so that we find the most efficient normalization.To implement what was mentioned above,we performed 4 combinations from which the last one had the most efficient normalization.Additionally we developed a methodology for comparing words and for getting a similarity percentage between them. The application of this process showed as to whether the normalization was successful for each experiment. The comparison was done between all the words. Finally we will presenting and analyze the results and suggest various solutions for future research.
Περιγραφή τεκμηρίου:Μέλη της εξεταστικής επιτροπής: Καβαλλιεράτου Εργίνα, Σταματάτος Ευτάθιος, Μαραγκουδάκης Εμμανουήλ.
Περιορισμός στην πρόσβαση του ηλεκτρονικού τεκμηρίου
Φυσική περιγραφή:viii, 105 σ. : σχέδια, πιν. ; 30 εκ.
Βιβλιογραφία:Βιβλιογραφία: σ.80-88