Σύγκριση αλγορίθμων machine learning για την επιβλεπόμενη ταξινόμηση τηλεσκοπικών δεδομένων

Η χρήση της ταξινόμησης στο κλάδο της Δορυφορικής Τηλεπισκόπησης αποτελεί ένα από τα βασικότερα εργαλεία της διότι, μέσα από αυτή ο ερευνητής μπορεί να εντοπίσει και να χαρτογραφήσει τα αντικείμενα που συνθέτουν την περιοχή μελέτης του. Όμως, για να παραχθούν σημαντικά αποτελέσματα με μικρές αποκλίσ...

Πλήρης περιγραφή

Αποθηκεύτηκε σε:
Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Κάρλες, Παναγιώτης
Άλλοι συγγραφείς: Καβρουδάκης, Δημήτριος
Γλώσσα:el_GR
Δημοσίευση: 2019
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/11610/18489
Ετικέτες: Προσθήκη ετικέτας
Δεν υπάρχουν, Καταχωρήστε ετικέτα πρώτοι!
Περιγραφή
Περίληψη:Η χρήση της ταξινόμησης στο κλάδο της Δορυφορικής Τηλεπισκόπησης αποτελεί ένα από τα βασικότερα εργαλεία της διότι, μέσα από αυτή ο ερευνητής μπορεί να εντοπίσει και να χαρτογραφήσει τα αντικείμενα που συνθέτουν την περιοχή μελέτης του. Όμως, για να παραχθούν σημαντικά αποτελέσματα με μικρές αποκλίσεις από την πραγματικότητα θα πρέπει τα στάδια της ταξινόμησης να εκτελεστούν με προσοχή. Σε αυτή την εργασία παρουσιάζεται μια μεθοδολογία σύγκρισης αλγορίθμων ταξινόμησης χρησιμοποιώντας μεθόδους Εκμάθησης Μηχανής και δεδομένα από τον δορυφόρο Sentinel-1 και το αρχείο χρήσεων γης του Corine 2000 για την περιοχή του Κόλπου της Γέρας. Από τα αποτελέσματα σημειώθηκε πως ο καλύτερος αλγόριθμος ταξινόμησης ήταν ο Random Forrest λόγο των τιμών Kappa και Accuracy. Επίσης παρουσιάστηκαν προβλήματα κατά την επεξεργασία των δεδομένων λόγο της υψηλής χωρικής ανάλυσης των δορυφορικών δεδομένων (10m) όπως και της αλγοριθμικής περιπλοκότητας (Big-O) που είχαν οι αλγόριθμοι ταξινόμησης. Αυτό είχε ως αποτέλεσμα τη χρήση χωρικής γενίκευσης των δορυφορικών δεδομένων και κατ επέκταση την απόκλιση των αποτελεσμάτων. Όμως ακόμα και με τη γενίκευση τα λάθη της ταξινόμησης δεν ήταν στατιστικά σημαντικά διότι όταν έγινε σύγκριση της ταξινόμησης του Random Forrest με την ψηφιοποιημένη μορφή των περιοχών μελέτης παρατηρήθηκε πως τα pixel που ταξινομήθηκαν λάθος ελάχιστα, περίπου το ένα εικοστό των δεδομένων.