Μοντελοποίηση χαρακτηριστικών κυτταρικού πυρήνα από δεδομένα εικόνας για τη διάγνωση του όγκου του μαστού με μεθόδους μηχανικής μάθησης
Η πρόοδος της ιατρικής αλλά και οι διαδικασίες που χρησιμοποιούνται για την αξιολόγηση και θεραπεία νοσημάτων αναμφίβολα εξελίσσονται και αναπτύσσονται με καλπάζοντες ρυθμούς με τη βοήθεια της τεχνολογίας και της επιστήμης. Γιατροί και μηχανικοί δεδομένων χρησιμοποιούν μαθηματικά μοντέλα και αλγορίθ...
Saved in:
| Main Author: | |
|---|---|
| Other Authors: | |
| Language: | el_GR |
| Published: |
2024
|
| Subjects: | |
| Online Access: | http://hdl.handle.net/11610/26070 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| _version_ | 1828462671106670592 |
|---|---|
| author | Παπαδόπουλος, Μιχαήλ |
| author2 | Βασιλείου, Ευάγγελος |
| author_sort | Παπαδόπουλος, Μιχαήλ |
| collection | DSpace |
| description | Η πρόοδος της ιατρικής αλλά και οι διαδικασίες που χρησιμοποιούνται για την αξιολόγηση και θεραπεία νοσημάτων αναμφίβολα εξελίσσονται και αναπτύσσονται με καλπάζοντες ρυθμούς με τη βοήθεια της τεχνολογίας και της επιστήμης. Γιατροί και μηχανικοί δεδομένων χρησιμοποιούν μαθηματικά μοντέλα και αλγορίθμους μηχανικής μάθησης έτσι ώστε να επιτευχθούν οι επιθυμητοί στόχοι, αντλώντας τα απαραίτητα δεδομένα κυρίως από το ιστορικό των ασθενών. Είναι πλέον εύκολο να διαγνωστεί εάν ένας κυτταρικός όγκος είναι καλοήθης ή κακοήθης μέσω μοντέλων τα οποία έχουν εκπαιδευτεί από το ιστορικό προηγούμενων ασθενών. Σε γενικές γραμμές, η προσέγγιση της μηχανικής μάθησης βασίζεται στην προσπάθεια δημιουργίας αυτοματοποιημένων διαδικασιών οι οποίες εξελίσσονται με βάση το πρότυπο του τρόπου με τον οποίο ο άνθρωπος αποκτά τη γνώση.
Το προτεινόμενο θέμα διπλωματικής ασχολείται με την μοντελοποίηση χαρακτηριστικών κυτταρικού πυρήνα από δεδομένα εικόνας για τη διάγνωση του όγκου του μαστού με μεθόδους μηχανικής μάθησης. Η ιστοσελίδα Kaggle, έχοντας τον ρόλο της ‘’τράπεζας δεδομένων’’, παρέχει τα δεδομένα του πεδίου εφαρμογής τα οποία προκύπτουν και αντλούνται μέσω της ψηφιοποιημένης εικόνας στην οποία απεικονίζονται τα χαρακτηριστικά του κυτταρικού πυρήνα έπειτα από βιοψία δια λεπτής βελόνης (Fine Needle Aspirate - FNA) μάζας μαστού.
Εν συντομία, η βιοψία δια λεπτής βελόνης όγκου αποτελεί μια μέθοδο κατά την οποία περισυλλέγονται κύτταρα από όλα τα σημεία της βλάβης (όγκου) μέσω αναρρόφησης με την βοήθεια βελόνης 21g παρόμοια με αυτή της αιμοληψίας. Τα δεδομένα αυτά αποτελούνται από χαρακτηριστικά τα οποία αφορούν τα κύτταρα του σημείου της βλάβης (όγκου). Για παράδειγμα, οι αποστάσεις από το κέντρο σε σημεία της περιμέτρου, η υφή (η οποία μετριέται
14
στη κλίμακα του γκρι), ο αριθμός κοίλων τμημάτων του περιγράμματος, η περιοχή, η ομαλότητα κ.α.
Στόχος της εν λόγω διπλωματικής εργασίας είναι η μοντελοποίηση και ανάλυση των δεδομένων που προκύπτουν από την προαναφερθείσα εξέταση και έπειτα η εκπαίδευση αλγορίθμων μηχανικής μάθησης για την ταυτοποίηση και ταξινόμηση βλαβών (όγκων) ως καλοήθεις ή κακοήθης.
Για την υλοποίηση της διπλωματικής εργασίας χρησιμοποιούνται αλγόριθμοι μηχανικής μάθησης με επίβλεψη για την ανάλυση, μοντελοποίηση και αξιολόγηση των δεδομένων σε περιβάλλον R. Αρχικά, γίνεται έλεγχος για το αν στα δεδομένα εμπεριέχονται ελλιπής τιμές, το πώς κατανέμονται οι παρατηρήσεις της κάθε επεξηγηματικής μεταβλητής αλλά και το ποσοστό των κακοηθών όγκων. Επίσης, παρουσιάζονται κάποια περιγραφικά στατιστικά και κατασκευάζονται αντίστοιχα γραφήματα (barplots, boxplots, ιστογράμματα (histograms), γραφήματα, κ.α.) Στη συνέχεια, αφού χωριστούν τα δεδομένα εκπαίδευσης και δεδομένα ελέγχου, εκπαιδεύονται εναλλακτικοί αλγόριθμοι μηχανικής μάθησης με επίβλεψη για την αναγνώριση των πιο σημαντικών προσδιοριστικών παραγόντων του υπό μελέτη φαινομένου. Συμπληρωματικά, αξιολογείται η ικανότητα τους ως προς την ταξινόμηση των όγκων σε καλοήθης ή κακοήθης με την βοήθεια κατάλληλών μέτρων αξιολόγησης όπως η ακρίβεια (accuracy), η ευαισθησία, η εξειδίκευση (specificity), οι καμπύλες ROC, οι καμπύλες lift, οι καμπύλες precision vs recall, κ.α.. Τέλος, επιχειρείται μία σύγκριση των υπό μελέτη μεθόδων όσον αφορά στα ιδιαίτερα χαρακτηριστικά τους και την απόδοση τους στο συγκεκριμένο σύνολο δεδομένων. |
| id | oai:hellanicus.lib.aegean.gr:11610-26070 |
| institution | Hellanicus |
| language | el_GR |
| publishDate | 2024 |
| record_format | dspace |
| title | Μοντελοποίηση χαρακτηριστικών κυτταρικού πυρήνα από δεδομένα εικόνας για τη διάγνωση του όγκου του μαστού με μεθόδους μηχανικής μάθησης |
| topic | αλγόριθμοι ταξινόμησης μέτρα αξιολόγησης κατηγοριοποίησης ανάλυση δεδομένων στατιστική μαθηματικά μέθοδοι εποπτευόμενης μηχανικής μάθησης λογιστική παλινδρόμηση δέντρα αποφάσεων μηχανές διανυσμάτων υποστήριξης τυχαία δάση μαστός support vector machines random forests algorithms logistic regression analysis breast Support vector machines Algorithms Statistics Logistic regression analysis Regression analysis Breast |
| url | http://hdl.handle.net/11610/26070 |
| work_keys_str_mv | AT papadopoulosmichaēl montelopoiēsēcharaktēristikōnkyttarikoupyrēnaapodedomenaeikonasgiatēdiagnōsētouonkoutoumastoumemethodousmēchanikēsmathēsēs |