Μοντελοποίηση χαρακτηριστικών κυτταρικού πυρήνα από δεδομένα εικόνας για τη διάγνωση του όγκου του μαστού με μεθόδους μηχανικής μάθησης

Η πρόοδος της ιατρικής αλλά και οι διαδικασίες που χρησιμοποιούνται για την αξιολόγηση και θεραπεία νοσημάτων αναμφίβολα εξελίσσονται και αναπτύσσονται με καλπάζοντες ρυθμούς με τη βοήθεια της τεχνολογίας και της επιστήμης. Γιατροί και μηχανικοί δεδομένων χρησιμοποιούν μαθηματικά μοντέλα και αλγορίθ...

Full description

Saved in:
Bibliographic Details
Main Author: Παπαδόπουλος, Μιχαήλ
Other Authors: Βασιλείου, Ευάγγελος
Language:el_GR
Published: 2024
Subjects:
Online Access:http://hdl.handle.net/11610/26070
Tags: Add Tag
No Tags, Be the first to tag this record!
_version_ 1828462671106670592
author Παπαδόπουλος, Μιχαήλ
author2 Βασιλείου, Ευάγγελος
author_facet Βασιλείου, Ευάγγελος
Παπαδόπουλος, Μιχαήλ
author_sort Παπαδόπουλος, Μιχαήλ
collection DSpace
description Η πρόοδος της ιατρικής αλλά και οι διαδικασίες που χρησιμοποιούνται για την αξιολόγηση και θεραπεία νοσημάτων αναμφίβολα εξελίσσονται και αναπτύσσονται με καλπάζοντες ρυθμούς με τη βοήθεια της τεχνολογίας και της επιστήμης. Γιατροί και μηχανικοί δεδομένων χρησιμοποιούν μαθηματικά μοντέλα και αλγορίθμους μηχανικής μάθησης έτσι ώστε να επιτευχθούν οι επιθυμητοί στόχοι, αντλώντας τα απαραίτητα δεδομένα κυρίως από το ιστορικό των ασθενών. Είναι πλέον εύκολο να διαγνωστεί εάν ένας κυτταρικός όγκος είναι καλοήθης ή κακοήθης μέσω μοντέλων τα οποία έχουν εκπαιδευτεί από το ιστορικό προηγούμενων ασθενών. Σε γενικές γραμμές, η προσέγγιση της μηχανικής μάθησης βασίζεται στην προσπάθεια δημιουργίας αυτοματοποιημένων διαδικασιών οι οποίες εξελίσσονται με βάση το πρότυπο του τρόπου με τον οποίο ο άνθρωπος αποκτά τη γνώση. Το προτεινόμενο θέμα διπλωματικής ασχολείται με την μοντελοποίηση χαρακτηριστικών κυτταρικού πυρήνα από δεδομένα εικόνας για τη διάγνωση του όγκου του μαστού με μεθόδους μηχανικής μάθησης. Η ιστοσελίδα Kaggle, έχοντας τον ρόλο της ‘’τράπεζας δεδομένων’’, παρέχει τα δεδομένα του πεδίου εφαρμογής τα οποία προκύπτουν και αντλούνται μέσω της ψηφιοποιημένης εικόνας στην οποία απεικονίζονται τα χαρακτηριστικά του κυτταρικού πυρήνα έπειτα από βιοψία δια λεπτής βελόνης (Fine Needle Aspirate - FNA) μάζας μαστού. Εν συντομία, η βιοψία δια λεπτής βελόνης όγκου αποτελεί μια μέθοδο κατά την οποία περισυλλέγονται κύτταρα από όλα τα σημεία της βλάβης (όγκου) μέσω αναρρόφησης με την βοήθεια βελόνης 21g παρόμοια με αυτή της αιμοληψίας. Τα δεδομένα αυτά αποτελούνται από χαρακτηριστικά τα οποία αφορούν τα κύτταρα του σημείου της βλάβης (όγκου). Για παράδειγμα, οι αποστάσεις από το κέντρο σε σημεία της περιμέτρου, η υφή (η οποία μετριέται 14 στη κλίμακα του γκρι), ο αριθμός κοίλων τμημάτων του περιγράμματος, η περιοχή, η ομαλότητα κ.α. Στόχος της εν λόγω διπλωματικής εργασίας είναι η μοντελοποίηση και ανάλυση των δεδομένων που προκύπτουν από την προαναφερθείσα εξέταση και έπειτα η εκπαίδευση αλγορίθμων μηχανικής μάθησης για την ταυτοποίηση και ταξινόμηση βλαβών (όγκων) ως καλοήθεις ή κακοήθης. Για την υλοποίηση της διπλωματικής εργασίας χρησιμοποιούνται αλγόριθμοι μηχανικής μάθησης με επίβλεψη για την ανάλυση, μοντελοποίηση και αξιολόγηση των δεδομένων σε περιβάλλον R. Αρχικά, γίνεται έλεγχος για το αν στα δεδομένα εμπεριέχονται ελλιπής τιμές, το πώς κατανέμονται οι παρατηρήσεις της κάθε επεξηγηματικής μεταβλητής αλλά και το ποσοστό των κακοηθών όγκων. Επίσης, παρουσιάζονται κάποια περιγραφικά στατιστικά και κατασκευάζονται αντίστοιχα γραφήματα (barplots, boxplots, ιστογράμματα (histograms), γραφήματα, κ.α.) Στη συνέχεια, αφού χωριστούν τα δεδομένα εκπαίδευσης και δεδομένα ελέγχου, εκπαιδεύονται εναλλακτικοί αλγόριθμοι μηχανικής μάθησης με επίβλεψη για την αναγνώριση των πιο σημαντικών προσδιοριστικών παραγόντων του υπό μελέτη φαινομένου. Συμπληρωματικά, αξιολογείται η ικανότητα τους ως προς την ταξινόμηση των όγκων σε καλοήθης ή κακοήθης με την βοήθεια κατάλληλών μέτρων αξιολόγησης όπως η ακρίβεια (accuracy), η ευαισθησία, η εξειδίκευση (specificity), οι καμπύλες ROC, οι καμπύλες lift, οι καμπύλες precision vs recall, κ.α.. Τέλος, επιχειρείται μία σύγκριση των υπό μελέτη μεθόδων όσον αφορά στα ιδιαίτερα χαρακτηριστικά τους και την απόδοση τους στο συγκεκριμένο σύνολο δεδομένων.
id oai:hellanicus.lib.aegean.gr:11610-26070
institution Hellanicus
language el_GR
publishDate 2024
record_format dspace
spelling oai:hellanicus.lib.aegean.gr:11610-260702024-02-15T21:14:51Z Μοντελοποίηση χαρακτηριστικών κυτταρικού πυρήνα από δεδομένα εικόνας για τη διάγνωση του όγκου του μαστού με μεθόδους μηχανικής μάθησης Παπαδόπουλος, Μιχαήλ Βασιλείου, Ευάγγελος αλγόριθμοι ταξινόμησης μέτρα αξιολόγησης κατηγοριοποίησης ανάλυση δεδομένων στατιστική μαθηματικά μέθοδοι εποπτευόμενης μηχανικής μάθησης λογιστική παλινδρόμηση δέντρα αποφάσεων μηχανές διανυσμάτων υποστήριξης τυχαία δάση μαστός support vector machines random forests algorithms logistic regression analysis breast Support vector machines Algorithms Statistics Logistic regression analysis Regression analysis Breast Η πρόοδος της ιατρικής αλλά και οι διαδικασίες που χρησιμοποιούνται για την αξιολόγηση και θεραπεία νοσημάτων αναμφίβολα εξελίσσονται και αναπτύσσονται με καλπάζοντες ρυθμούς με τη βοήθεια της τεχνολογίας και της επιστήμης. Γιατροί και μηχανικοί δεδομένων χρησιμοποιούν μαθηματικά μοντέλα και αλγορίθμους μηχανικής μάθησης έτσι ώστε να επιτευχθούν οι επιθυμητοί στόχοι, αντλώντας τα απαραίτητα δεδομένα κυρίως από το ιστορικό των ασθενών. Είναι πλέον εύκολο να διαγνωστεί εάν ένας κυτταρικός όγκος είναι καλοήθης ή κακοήθης μέσω μοντέλων τα οποία έχουν εκπαιδευτεί από το ιστορικό προηγούμενων ασθενών. Σε γενικές γραμμές, η προσέγγιση της μηχανικής μάθησης βασίζεται στην προσπάθεια δημιουργίας αυτοματοποιημένων διαδικασιών οι οποίες εξελίσσονται με βάση το πρότυπο του τρόπου με τον οποίο ο άνθρωπος αποκτά τη γνώση. Το προτεινόμενο θέμα διπλωματικής ασχολείται με την μοντελοποίηση χαρακτηριστικών κυτταρικού πυρήνα από δεδομένα εικόνας για τη διάγνωση του όγκου του μαστού με μεθόδους μηχανικής μάθησης. Η ιστοσελίδα Kaggle, έχοντας τον ρόλο της ‘’τράπεζας δεδομένων’’, παρέχει τα δεδομένα του πεδίου εφαρμογής τα οποία προκύπτουν και αντλούνται μέσω της ψηφιοποιημένης εικόνας στην οποία απεικονίζονται τα χαρακτηριστικά του κυτταρικού πυρήνα έπειτα από βιοψία δια λεπτής βελόνης (Fine Needle Aspirate - FNA) μάζας μαστού. Εν συντομία, η βιοψία δια λεπτής βελόνης όγκου αποτελεί μια μέθοδο κατά την οποία περισυλλέγονται κύτταρα από όλα τα σημεία της βλάβης (όγκου) μέσω αναρρόφησης με την βοήθεια βελόνης 21g παρόμοια με αυτή της αιμοληψίας. Τα δεδομένα αυτά αποτελούνται από χαρακτηριστικά τα οποία αφορούν τα κύτταρα του σημείου της βλάβης (όγκου). Για παράδειγμα, οι αποστάσεις από το κέντρο σε σημεία της περιμέτρου, η υφή (η οποία μετριέται 14 στη κλίμακα του γκρι), ο αριθμός κοίλων τμημάτων του περιγράμματος, η περιοχή, η ομαλότητα κ.α. Στόχος της εν λόγω διπλωματικής εργασίας είναι η μοντελοποίηση και ανάλυση των δεδομένων που προκύπτουν από την προαναφερθείσα εξέταση και έπειτα η εκπαίδευση αλγορίθμων μηχανικής μάθησης για την ταυτοποίηση και ταξινόμηση βλαβών (όγκων) ως καλοήθεις ή κακοήθης. Για την υλοποίηση της διπλωματικής εργασίας χρησιμοποιούνται αλγόριθμοι μηχανικής μάθησης με επίβλεψη για την ανάλυση, μοντελοποίηση και αξιολόγηση των δεδομένων σε περιβάλλον R. Αρχικά, γίνεται έλεγχος για το αν στα δεδομένα εμπεριέχονται ελλιπής τιμές, το πώς κατανέμονται οι παρατηρήσεις της κάθε επεξηγηματικής μεταβλητής αλλά και το ποσοστό των κακοηθών όγκων. Επίσης, παρουσιάζονται κάποια περιγραφικά στατιστικά και κατασκευάζονται αντίστοιχα γραφήματα (barplots, boxplots, ιστογράμματα (histograms), γραφήματα, κ.α.) Στη συνέχεια, αφού χωριστούν τα δεδομένα εκπαίδευσης και δεδομένα ελέγχου, εκπαιδεύονται εναλλακτικοί αλγόριθμοι μηχανικής μάθησης με επίβλεψη για την αναγνώριση των πιο σημαντικών προσδιοριστικών παραγόντων του υπό μελέτη φαινομένου. Συμπληρωματικά, αξιολογείται η ικανότητα τους ως προς την ταξινόμηση των όγκων σε καλοήθης ή κακοήθης με την βοήθεια κατάλληλών μέτρων αξιολόγησης όπως η ακρίβεια (accuracy), η ευαισθησία, η εξειδίκευση (specificity), οι καμπύλες ROC, οι καμπύλες lift, οι καμπύλες precision vs recall, κ.α.. Τέλος, επιχειρείται μία σύγκριση των υπό μελέτη μεθόδων όσον αφορά στα ιδιαίτερα χαρακτηριστικά τους και την απόδοση τους στο συγκεκριμένο σύνολο δεδομένων. 2024-01-29T12:20:50Z 2024-01-29T12:20:50Z 2023-06-27 http://hdl.handle.net/11610/26070 el_GR Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 Διεθνές https://creativecommons.org/licenses/by-nc-sa/4.0/ 278 σ. application/pdf Χίος
spellingShingle αλγόριθμοι ταξινόμησης
μέτρα αξιολόγησης κατηγοριοποίησης
ανάλυση δεδομένων
στατιστική
μαθηματικά
μέθοδοι εποπτευόμενης μηχανικής μάθησης
λογιστική παλινδρόμηση
δέντρα αποφάσεων
μηχανές διανυσμάτων υποστήριξης
τυχαία δάση
μαστός
support vector machines
random forests
algorithms
logistic regression analysis
breast
Support vector machines
Algorithms
Statistics
Logistic regression analysis
Regression analysis
Breast
Παπαδόπουλος, Μιχαήλ
Μοντελοποίηση χαρακτηριστικών κυτταρικού πυρήνα από δεδομένα εικόνας για τη διάγνωση του όγκου του μαστού με μεθόδους μηχανικής μάθησης
title Μοντελοποίηση χαρακτηριστικών κυτταρικού πυρήνα από δεδομένα εικόνας για τη διάγνωση του όγκου του μαστού με μεθόδους μηχανικής μάθησης
title_full Μοντελοποίηση χαρακτηριστικών κυτταρικού πυρήνα από δεδομένα εικόνας για τη διάγνωση του όγκου του μαστού με μεθόδους μηχανικής μάθησης
title_fullStr Μοντελοποίηση χαρακτηριστικών κυτταρικού πυρήνα από δεδομένα εικόνας για τη διάγνωση του όγκου του μαστού με μεθόδους μηχανικής μάθησης
title_full_unstemmed Μοντελοποίηση χαρακτηριστικών κυτταρικού πυρήνα από δεδομένα εικόνας για τη διάγνωση του όγκου του μαστού με μεθόδους μηχανικής μάθησης
title_short Μοντελοποίηση χαρακτηριστικών κυτταρικού πυρήνα από δεδομένα εικόνας για τη διάγνωση του όγκου του μαστού με μεθόδους μηχανικής μάθησης
title_sort μοντελοποίηση χαρακτηριστικών κυτταρικού πυρήνα από δεδομένα εικόνας για τη διάγνωση του όγκου του μαστού με μεθόδους μηχανικής μάθησης
topic αλγόριθμοι ταξινόμησης
μέτρα αξιολόγησης κατηγοριοποίησης
ανάλυση δεδομένων
στατιστική
μαθηματικά
μέθοδοι εποπτευόμενης μηχανικής μάθησης
λογιστική παλινδρόμηση
δέντρα αποφάσεων
μηχανές διανυσμάτων υποστήριξης
τυχαία δάση
μαστός
support vector machines
random forests
algorithms
logistic regression analysis
breast
Support vector machines
Algorithms
Statistics
Logistic regression analysis
Regression analysis
Breast
url http://hdl.handle.net/11610/26070
work_keys_str_mv AT papadopoulosmichaēl montelopoiēsēcharaktēristikōnkyttarikoupyrēnaapodedomenaeikonasgiatēdiagnōsētouonkoutoumastoumemethodousmēchanikēsmathēsēs