Document image segmentation and text localization

Σε αυτή τη διατριβή διερευνώνται θέματα που σχετίζονται με την κατάτμηση των σελίδων και την εξαγωγή των πληροφοριών κειμένου από εικόνες εγγράφων. Νέες προσεγγίσεις για την αντιμετώπιση προβλημάτων παρουσιάζονται και, πιο συγκεκριμένα, μια μέθοδος ανάλυσης διάταξης σελίδας, μια τεχνική εντοπισμού κ...

Πλήρης περιγραφή

Αποθηκεύτηκε σε:
Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριοι συγγραφείς: Vasilopoulos, Nikos, Βασιλόπουλος, Νίκος
Άλλοι συγγραφείς: Καβαλλιεράτου, Εργίνα
Γλώσσα:English
Δημοσίευση: 2019
Θέματα:
Διαθέσιμο Online:https://catalog.lib.aegean.gr/iguana/www.main.cls?surl=search&p=ed763fb5-024d-4d04-a952-e71cbf110eaa#recordId=1.113779
http://hdl.handle.net/11610/19612
Ετικέτες: Προσθήκη ετικέτας
Δεν υπάρχουν, Καταχωρήστε ετικέτα πρώτοι!
_version_ 1828460664360796160
author Vasilopoulos, Nikos
Βασιλόπουλος, Νίκος
author2 Καβαλλιεράτου, Εργίνα
author_facet Καβαλλιεράτου, Εργίνα
Vasilopoulos, Nikos
Βασιλόπουλος, Νίκος
author_sort Vasilopoulos, Nikos
collection DSpace
description Σε αυτή τη διατριβή διερευνώνται θέματα που σχετίζονται με την κατάτμηση των σελίδων και την εξαγωγή των πληροφοριών κειμένου από εικόνες εγγράφων. Νέες προσεγγίσεις για την αντιμετώπιση προβλημάτων παρουσιάζονται και, πιο συγκεκριμένα, μια μέθοδος ανάλυσης διάταξης σελίδας, μια τεχνική εντοπισμού κειμένου σε εικόνα, καθώς και ένα σύστημα word-spotting και ανάκτησης κειμένου. Δύο εργαλεία λογισμικού αναπτύχθηκαν με σκοπό να δοκιμαστεί η απόδοση των προτεινόμενων αλγορίθμων. Αποτελέσματα λεπτομερών πειραμάτων παρουσιάζονται αναλυτικά. Στο Κεφάλαιο 2, παρουσιάζεται μια μέθοδος για την κατάτμηση εγγράφων με σύνθετη διάταξη (εφημερίδες, περιοδικά κλπ.). Δεν είναι απαραίτητη καμία γνώση για τη μορφή της σελίδας a priori. Μορφολογικοί τελεστές εφαρμόζονται προκειμένου να συνδεθούν γειτονικές περιοχές και να εντοπιστούν διαχωριστικές γραμμές και στήλες. Τεχνικές ανίχνευσης περιγράμματος χρησιμοποιούνται στη συνέχεια για την εξαγωγή πληροφοριών σχήματος και την ταξινόμηση των συνδεδεμένων αντικειμένων. Στο Κεφάλαιο 3, προτείνεται μια υβριδική μέθοδος για τον εντοπισμό, σε πραγματικό χρόνο, κειμένου που είναι ενσωματωμένο σε εικόνες. Συνδυάζει ανίχνευση ακμών, μορφολογικούς τελεστές και ένα σύνολο κριτηρίων με βάση χωρικά και γεωμετρικά χαρακτηριστικά των συνδεδεμένων αντικειμένων. Στο Κεφάλαιο 4, προτείνεται μια τεχνική κατάλληλη για την εξαγωγή όλων των πληροφοριών κειμένου από έγγραφα με σύνθετες διατάξεις. Συνδυάζει τμήματα της μεθόδου ανάλυσης διάταξης που παρουσιάζεται στο Κεφάλαιο 2 με την γρήγορη και αξιόπιστη μέθοδο για τον εντοπισμό κειμένου που παρουσιάζεται στο Κεφάλαιο 3. Η πρώτη χρησιμοποιείται για το διαχωρισμό των περιοχών της σελίδας σε κείμενο και εικόνες, ενώ η δεύτερη χρησιμοποιείται για την ανίχνευση κειμένου που μπορεί να περιέχεται μέσα στις εικόνες. Στο Κεφάλαιο 5, προτείνεται ένα σύστημα word-spotting, κατάλληλο για την αναζήτηση κειμένου σε εκτυπωμένες εικόνες ιστορικών εγγράφων. Το σύστημα απλοποιεί αρκετά τη διαδικασία της συνηθισμένης προσέγγισης. Δεν περιλαμβάνει κατάτμηση, εξαγωγή χαρακτηριστικών ή ταξινόμηση. Αντίθετα, αντιμετωπίζει τα ερωτήματα ως συμπαγή σχήματα και χρησιμοποιεί τεχνικές επεξεργασίας εικόνας, προκειμένου να εντοπιστεί ένα ερώτημα στις εικόνες των εγγράφων. Στο Κεφάλαιο 6, προτείνεται μια νέα τεχνική για την ανάκτηση κειμένου. Αν και είναι εμπνευσμένη από την τεχνική word-spotting που παρουσιάζεται στο Κεφάλαιο 5, εντοπίζει χαρακτήρες, γεγονός που καθιστά την ανάκτηση πιο ισχυρή και επιτρέπει τη χρήση ερωτημάτων σε μορφή κειμένου. Στο Κεφάλαιο 7 συνοψίζονται τα συμπεράσματα από όλα τα προηγούμενα κεφάλαια, ενώ στα προσαρτήματα διερευνώνται τρεις ακόμα εφαρμογές των προτεινόμενων αλγορίθμων κατάτμησης σελίδας και ανίχνευσης κειμένου: κατάτμηση σελίδων κόμικς, εντοπισμός κειμένου σε φωτογραφίες και εντοπισμός κειμένου σε βίντεο.
id oai:hellanicus.lib.aegean.gr:11610-19612
institution Hellanicus
language English
publishDate 2019
record_format dspace
spelling oai:hellanicus.lib.aegean.gr:11610-196122024-11-15T08:35:24Z Document image segmentation and text localization Vasilopoulos, Nikos Βασιλόπουλος, Νίκος Καβαλλιεράτου, Εργίνα other ανάλυση εγγράφου κατάτμηση σελίδας εντοπισμός κειμένου document analysis page segmentation text localization Document imaging systems (URL: http://id.loc.gov/authorities/subjects/sh92006218) Text processing (Computer science) (URL: http://id.loc.gov/authorities/subjects/sh85134304) Image analysis (URL: http://id.loc.gov/authorities/subjects/sh98002813) Σε αυτή τη διατριβή διερευνώνται θέματα που σχετίζονται με την κατάτμηση των σελίδων και την εξαγωγή των πληροφοριών κειμένου από εικόνες εγγράφων. Νέες προσεγγίσεις για την αντιμετώπιση προβλημάτων παρουσιάζονται και, πιο συγκεκριμένα, μια μέθοδος ανάλυσης διάταξης σελίδας, μια τεχνική εντοπισμού κειμένου σε εικόνα, καθώς και ένα σύστημα word-spotting και ανάκτησης κειμένου. Δύο εργαλεία λογισμικού αναπτύχθηκαν με σκοπό να δοκιμαστεί η απόδοση των προτεινόμενων αλγορίθμων. Αποτελέσματα λεπτομερών πειραμάτων παρουσιάζονται αναλυτικά. Στο Κεφάλαιο 2, παρουσιάζεται μια μέθοδος για την κατάτμηση εγγράφων με σύνθετη διάταξη (εφημερίδες, περιοδικά κλπ.). Δεν είναι απαραίτητη καμία γνώση για τη μορφή της σελίδας a priori. Μορφολογικοί τελεστές εφαρμόζονται προκειμένου να συνδεθούν γειτονικές περιοχές και να εντοπιστούν διαχωριστικές γραμμές και στήλες. Τεχνικές ανίχνευσης περιγράμματος χρησιμοποιούνται στη συνέχεια για την εξαγωγή πληροφοριών σχήματος και την ταξινόμηση των συνδεδεμένων αντικειμένων. Στο Κεφάλαιο 3, προτείνεται μια υβριδική μέθοδος για τον εντοπισμό, σε πραγματικό χρόνο, κειμένου που είναι ενσωματωμένο σε εικόνες. Συνδυάζει ανίχνευση ακμών, μορφολογικούς τελεστές και ένα σύνολο κριτηρίων με βάση χωρικά και γεωμετρικά χαρακτηριστικά των συνδεδεμένων αντικειμένων. Στο Κεφάλαιο 4, προτείνεται μια τεχνική κατάλληλη για την εξαγωγή όλων των πληροφοριών κειμένου από έγγραφα με σύνθετες διατάξεις. Συνδυάζει τμήματα της μεθόδου ανάλυσης διάταξης που παρουσιάζεται στο Κεφάλαιο 2 με την γρήγορη και αξιόπιστη μέθοδο για τον εντοπισμό κειμένου που παρουσιάζεται στο Κεφάλαιο 3. Η πρώτη χρησιμοποιείται για το διαχωρισμό των περιοχών της σελίδας σε κείμενο και εικόνες, ενώ η δεύτερη χρησιμοποιείται για την ανίχνευση κειμένου που μπορεί να περιέχεται μέσα στις εικόνες. Στο Κεφάλαιο 5, προτείνεται ένα σύστημα word-spotting, κατάλληλο για την αναζήτηση κειμένου σε εκτυπωμένες εικόνες ιστορικών εγγράφων. Το σύστημα απλοποιεί αρκετά τη διαδικασία της συνηθισμένης προσέγγισης. Δεν περιλαμβάνει κατάτμηση, εξαγωγή χαρακτηριστικών ή ταξινόμηση. Αντίθετα, αντιμετωπίζει τα ερωτήματα ως συμπαγή σχήματα και χρησιμοποιεί τεχνικές επεξεργασίας εικόνας, προκειμένου να εντοπιστεί ένα ερώτημα στις εικόνες των εγγράφων. Στο Κεφάλαιο 6, προτείνεται μια νέα τεχνική για την ανάκτηση κειμένου. Αν και είναι εμπνευσμένη από την τεχνική word-spotting που παρουσιάζεται στο Κεφάλαιο 5, εντοπίζει χαρακτήρες, γεγονός που καθιστά την ανάκτηση πιο ισχυρή και επιτρέπει τη χρήση ερωτημάτων σε μορφή κειμένου. Στο Κεφάλαιο 7 συνοψίζονται τα συμπεράσματα από όλα τα προηγούμενα κεφάλαια, ενώ στα προσαρτήματα διερευνώνται τρεις ακόμα εφαρμογές των προτεινόμενων αλγορίθμων κατάτμησης σελίδας και ανίχνευσης κειμένου: κατάτμηση σελίδων κόμικς, εντοπισμός κειμένου σε φωτογραφίες και εντοπισμός κειμένου σε βίντεο. 2019-11-11T09:10:52Z 2019-11-11T09:10:52Z 2016-05 https://catalog.lib.aegean.gr/iguana/www.main.cls?surl=search&p=ed763fb5-024d-4d04-a952-e71cbf110eaa#recordId=1.113779 http://hdl.handle.net/11610/19612 en Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 Διεθνές http://creativecommons.org/licenses/by-nc-sa/4.0/ 104 σ. application/pdf Σάμος
spellingShingle ανάλυση εγγράφου
κατάτμηση σελίδας
εντοπισμός κειμένου
document analysis
page segmentation
text localization
Document imaging systems (URL: http://id.loc.gov/authorities/subjects/sh92006218)
Text processing (Computer science) (URL: http://id.loc.gov/authorities/subjects/sh85134304)
Image analysis (URL: http://id.loc.gov/authorities/subjects/sh98002813)
Vasilopoulos, Nikos
Βασιλόπουλος, Νίκος
Document image segmentation and text localization
title Document image segmentation and text localization
title_full Document image segmentation and text localization
title_fullStr Document image segmentation and text localization
title_full_unstemmed Document image segmentation and text localization
title_short Document image segmentation and text localization
title_sort document image segmentation and text localization
topic ανάλυση εγγράφου
κατάτμηση σελίδας
εντοπισμός κειμένου
document analysis
page segmentation
text localization
Document imaging systems (URL: http://id.loc.gov/authorities/subjects/sh92006218)
Text processing (Computer science) (URL: http://id.loc.gov/authorities/subjects/sh85134304)
Image analysis (URL: http://id.loc.gov/authorities/subjects/sh98002813)
url https://catalog.lib.aegean.gr/iguana/www.main.cls?surl=search&p=ed763fb5-024d-4d04-a952-e71cbf110eaa#recordId=1.113779
http://hdl.handle.net/11610/19612
work_keys_str_mv AT vasilopoulosnikos documentimagesegmentationandtextlocalization
AT basilopoulosnikos documentimagesegmentationandtextlocalization