Εφαρμογή νοημόνων μεθόδων σε προβλήματα λήψης επιχειρηματικών αποφάσεων: εκτίμηση του χρηματοπιστωτικού κινδύνου με επαγωγική μηχανική μάθηση

Το αντικείμενο της παρούσας διπλωματικής εργασίας είναι η ανάλυση δεδομένων με μεθόδους υπολογιστικής νοημοσύνης από χρηματοοικονομικά δεδομένα διαθέσιμα σε βάση δεδομένων του διαδικτύου. Συγκεκριμένα μελετάται αν μπορούμε να προβλέψουμε ποιοι πελάτες μιας συγκεκριμένης τράπεζας στην Ταιβάν μπορεί...

Πλήρης περιγραφή

Αποθηκεύτηκε σε:
Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Παπανικολάου, Λεωνίδας
Άλλοι συγγραφείς: Δούνιας, Γεώργιος
Γλώσσα:el_GR
Δημοσίευση: 2020
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/11610/19828
Ετικέτες: Προσθήκη ετικέτας
Δεν υπάρχουν, Καταχωρήστε ετικέτα πρώτοι!
_version_ 1828461725608837120
author Παπανικολάου, Λεωνίδας
author2 Δούνιας, Γεώργιος
author_facet Δούνιας, Γεώργιος
Παπανικολάου, Λεωνίδας
author_sort Παπανικολάου, Λεωνίδας
collection DSpace
description Το αντικείμενο της παρούσας διπλωματικής εργασίας είναι η ανάλυση δεδομένων με μεθόδους υπολογιστικής νοημοσύνης από χρηματοοικονομικά δεδομένα διαθέσιμα σε βάση δεδομένων του διαδικτύου. Συγκεκριμένα μελετάται αν μπορούμε να προβλέψουμε ποιοι πελάτες μιας συγκεκριμένης τράπεζας στην Ταιβάν μπορεί να είναι φερέγγυοι στις υποχρεώσεις τους έτσι ώστε να τους επιτρέψει η τράπεζα να εκδώσουν πιστωτική κάρτα. Για την ανάλυση δεδομένων χρησιμοποιήθηκε το υπολογιστικό πρόγραμμα WEKA, το οποίο παρέχει στον χρήστη μια μεγάλη συλλογή έτοιμων αλγορίθμων που μπορούν να χρησιμοποιηθούν σε πληθώρα προβλημάτων ταξινόμησης, παλινδρόμησης και ομαδοποίησης. Στην συγκεκριμένη ανάλυση γίνεται προσπάθεια να δοθεί έμφαση στις επιδόσεις (ακρίβεια ταξινόμησης) των εφαρμοζόμενων μεθόδων σε νέα αταξινόμητα δεδομένα καθώς και σε κανόνες με υψηλή κατανοησιμότητα, απλότητα και άρα χρησιμότητα στην καθημερινή πρακτική από τους ειδικούς του χώρου εφαρμογής. Για την ανάλυση στη συγκεκριμένη μελέτη χρησιμοποιήθηκε μια βάση δεδομένων, η οποία περιέχει 30.000 περιπτώσεις πελατώνμιας τράπεζας στην Ταιβάν κατά το έτος 2005 και συγκρίνει την προβλεπτική ικανότητα της πιθανότητας αθέτησης των πληρωμών τους. Η παρούσα διπλωματική χωρίζεται σε πέντε (5) κεφάλαια. Στο πρώτο κεφάλαιο παρατίθενται στοιχεία για το πρόβλημα του πιστωτικού κινδύνου. Στο 2ο κεφάλαιο γίνεται αναφορά στις νοήμονες μεθόδους με βάση τη διεθνή βιβλιογραφία. Στο τρίτο κεφάλαιο γίνεται η περιγραφή των μεθόδων λειτουργίας κάθε αλγορίθμου και των παραμέτρων του, καθώς και η στατιστική ανάλυση των δεδομένων. Στο τέταρτο κεφάλαιο παρουσιάζονται οι πειραματισμοί που πραγματοποιήθηκαν με τους αλγορίθμους του προγράμματος WEKA που χρησιμοποιήθηκαν. Στο πέμπτο κεφάλαιο παρουσιάζουμε συγκεντρωτικά τα αποτελέσματα και τα συμπεράσματα μας. Στο τελευταίο έκτο κεφάλαιο παραθέτουμε την βιβλιογραφία που χρησιμοποιήσαμε για την εκπόνηση της διπλωματικής εργασίας. Ο καλύτερος αλγόριθμος που προτείνουμε σε αυτήν την διπλωματική σαν τον βέλτιστο αναμεσά στους υπόλοιπους που επεξεργαστήκαμε είναι ο αλγόριθμος J48. Δημιουργεί δέντρα απόφασης από ένα σύνολο δεδομένων εκπαίδευσης χρησιμοποιώντας την έννοια της εντροπίας πληροφοριών. Χρησιμοποιεί το γεγονός ότι κάθε χαρακτηριστικό των δεδομένων μπορεί να χρησιμοποιηθεί για να λάβει μια απόφαση, η οποία χωρίζει τα δεδομένα σε μικρότερα υποσύνολα. Από τον πρώτο κύκλο πειραμάτων ο αλγόριθμος με το μεγαλύτερο ποσοστό ακρίβειας σωστά ταξινομημένων περιπτώσεων είναι ο J48 με ποσοστό 82,02% και έχει ένα ικανοποιητικό μέγεθος δέντρου με 85 κανόνες και 73 κόμβους. Το μέγιστο ποσοστό που επιτυγχάνεται (περίπου 82%) θεωρείται γενικά ικανοποιητικό και σε συνδυασμό με την κατανοησιμότητα και την αποδοχή των κανόνων που προκύπτουν, θεωρείται πως θα μπορούσε να χρησιμοποιηθεί στο μέλλον σε πραγματικά προβλήματα του τραπεζικού χώρου. Σημειώνεται ότι μοντέλα με άλλες νοήμονες μεθόδους, διαφορετικής φιλοσοφίας, όπως εξελικτικοί αλγόριθμοι, νευρωνικά δίκτυα και άλλες υβριδικές νοήμονες προσεγγίσεις, θα μπορούσαν να επιτύχουν και πολύ μεγαλύτερα ποσοστά ακρίβειας ταξινόμησης σε νέα (άγνωστα) δεδομένα, αλλά δεν τυγχάνουν συνήθως της αποδοχής των ειδικών του χώρου εφαρμογής λόγω πολυπλοκότητας και χαμηλής κατανοησιμότητας. Σε μελλοντική έρευνα θα μπορούσαν να εφαρμοστούν τεχνικές «κλαδέματος» (Pruning) των δένδρων που προκύπτουν (λόγω του σχετικά μεγάλου μεγέθους τους) με απώτερο σκοπό ένα καλύτερο ποσοστό ακρίβειας των σωστά ταξινομημένων περιπτώσεων καθώς και εύρεση πιο ειδικών και κατανοητών κανόνων.
id oai:hellanicus.lib.aegean.gr:11610-19828
institution Hellanicus
language el_GR
publishDate 2020
record_format dspace
spelling oai:hellanicus.lib.aegean.gr:11610-198282020-02-04T11:21:16Z Εφαρμογή νοημόνων μεθόδων σε προβλήματα λήψης επιχειρηματικών αποφάσεων: εκτίμηση του χρηματοπιστωτικού κινδύνου με επαγωγική μηχανική μάθηση Παπανικολάου, Λεωνίδας Δούνιας, Γεώργιος πιστωτικός κίνδυνος δένδρα απόφασης μηχανική μάθηση decision trees credit risk machine learning Risk assessment Machine learning Decision trees Το αντικείμενο της παρούσας διπλωματικής εργασίας είναι η ανάλυση δεδομένων με μεθόδους υπολογιστικής νοημοσύνης από χρηματοοικονομικά δεδομένα διαθέσιμα σε βάση δεδομένων του διαδικτύου. Συγκεκριμένα μελετάται αν μπορούμε να προβλέψουμε ποιοι πελάτες μιας συγκεκριμένης τράπεζας στην Ταιβάν μπορεί να είναι φερέγγυοι στις υποχρεώσεις τους έτσι ώστε να τους επιτρέψει η τράπεζα να εκδώσουν πιστωτική κάρτα. Για την ανάλυση δεδομένων χρησιμοποιήθηκε το υπολογιστικό πρόγραμμα WEKA, το οποίο παρέχει στον χρήστη μια μεγάλη συλλογή έτοιμων αλγορίθμων που μπορούν να χρησιμοποιηθούν σε πληθώρα προβλημάτων ταξινόμησης, παλινδρόμησης και ομαδοποίησης. Στην συγκεκριμένη ανάλυση γίνεται προσπάθεια να δοθεί έμφαση στις επιδόσεις (ακρίβεια ταξινόμησης) των εφαρμοζόμενων μεθόδων σε νέα αταξινόμητα δεδομένα καθώς και σε κανόνες με υψηλή κατανοησιμότητα, απλότητα και άρα χρησιμότητα στην καθημερινή πρακτική από τους ειδικούς του χώρου εφαρμογής. Για την ανάλυση στη συγκεκριμένη μελέτη χρησιμοποιήθηκε μια βάση δεδομένων, η οποία περιέχει 30.000 περιπτώσεις πελατώνμιας τράπεζας στην Ταιβάν κατά το έτος 2005 και συγκρίνει την προβλεπτική ικανότητα της πιθανότητας αθέτησης των πληρωμών τους. Η παρούσα διπλωματική χωρίζεται σε πέντε (5) κεφάλαια. Στο πρώτο κεφάλαιο παρατίθενται στοιχεία για το πρόβλημα του πιστωτικού κινδύνου. Στο 2ο κεφάλαιο γίνεται αναφορά στις νοήμονες μεθόδους με βάση τη διεθνή βιβλιογραφία. Στο τρίτο κεφάλαιο γίνεται η περιγραφή των μεθόδων λειτουργίας κάθε αλγορίθμου και των παραμέτρων του, καθώς και η στατιστική ανάλυση των δεδομένων. Στο τέταρτο κεφάλαιο παρουσιάζονται οι πειραματισμοί που πραγματοποιήθηκαν με τους αλγορίθμους του προγράμματος WEKA που χρησιμοποιήθηκαν. Στο πέμπτο κεφάλαιο παρουσιάζουμε συγκεντρωτικά τα αποτελέσματα και τα συμπεράσματα μας. Στο τελευταίο έκτο κεφάλαιο παραθέτουμε την βιβλιογραφία που χρησιμοποιήσαμε για την εκπόνηση της διπλωματικής εργασίας. Ο καλύτερος αλγόριθμος που προτείνουμε σε αυτήν την διπλωματική σαν τον βέλτιστο αναμεσά στους υπόλοιπους που επεξεργαστήκαμε είναι ο αλγόριθμος J48. Δημιουργεί δέντρα απόφασης από ένα σύνολο δεδομένων εκπαίδευσης χρησιμοποιώντας την έννοια της εντροπίας πληροφοριών. Χρησιμοποιεί το γεγονός ότι κάθε χαρακτηριστικό των δεδομένων μπορεί να χρησιμοποιηθεί για να λάβει μια απόφαση, η οποία χωρίζει τα δεδομένα σε μικρότερα υποσύνολα. Από τον πρώτο κύκλο πειραμάτων ο αλγόριθμος με το μεγαλύτερο ποσοστό ακρίβειας σωστά ταξινομημένων περιπτώσεων είναι ο J48 με ποσοστό 82,02% και έχει ένα ικανοποιητικό μέγεθος δέντρου με 85 κανόνες και 73 κόμβους. Το μέγιστο ποσοστό που επιτυγχάνεται (περίπου 82%) θεωρείται γενικά ικανοποιητικό και σε συνδυασμό με την κατανοησιμότητα και την αποδοχή των κανόνων που προκύπτουν, θεωρείται πως θα μπορούσε να χρησιμοποιηθεί στο μέλλον σε πραγματικά προβλήματα του τραπεζικού χώρου. Σημειώνεται ότι μοντέλα με άλλες νοήμονες μεθόδους, διαφορετικής φιλοσοφίας, όπως εξελικτικοί αλγόριθμοι, νευρωνικά δίκτυα και άλλες υβριδικές νοήμονες προσεγγίσεις, θα μπορούσαν να επιτύχουν και πολύ μεγαλύτερα ποσοστά ακρίβειας ταξινόμησης σε νέα (άγνωστα) δεδομένα, αλλά δεν τυγχάνουν συνήθως της αποδοχής των ειδικών του χώρου εφαρμογής λόγω πολυπλοκότητας και χαμηλής κατανοησιμότητας. Σε μελλοντική έρευνα θα μπορούσαν να εφαρμοστούν τεχνικές «κλαδέματος» (Pruning) των δένδρων που προκύπτουν (λόγω του σχετικά μεγάλου μεγέθους τους) με απώτερο σκοπό ένα καλύτερο ποσοστό ακρίβειας των σωστά ταξινομημένων περιπτώσεων καθώς και εύρεση πιο ειδικών και κατανοητών κανόνων. 2020-02-03T13:23:09Z 2020-02-03T13:23:09Z 2019-10-14 http://hdl.handle.net/11610/19828 el_GR Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές http://creativecommons.org/licenses/by-nc-nd/4.0/ application/pdf Χίος
spellingShingle πιστωτικός κίνδυνος
δένδρα απόφασης
μηχανική μάθηση
decision trees
credit risk
machine learning
Risk assessment
Machine learning
Decision trees
Παπανικολάου, Λεωνίδας
Εφαρμογή νοημόνων μεθόδων σε προβλήματα λήψης επιχειρηματικών αποφάσεων: εκτίμηση του χρηματοπιστωτικού κινδύνου με επαγωγική μηχανική μάθηση
title Εφαρμογή νοημόνων μεθόδων σε προβλήματα λήψης επιχειρηματικών αποφάσεων: εκτίμηση του χρηματοπιστωτικού κινδύνου με επαγωγική μηχανική μάθηση
title_full Εφαρμογή νοημόνων μεθόδων σε προβλήματα λήψης επιχειρηματικών αποφάσεων: εκτίμηση του χρηματοπιστωτικού κινδύνου με επαγωγική μηχανική μάθηση
title_fullStr Εφαρμογή νοημόνων μεθόδων σε προβλήματα λήψης επιχειρηματικών αποφάσεων: εκτίμηση του χρηματοπιστωτικού κινδύνου με επαγωγική μηχανική μάθηση
title_full_unstemmed Εφαρμογή νοημόνων μεθόδων σε προβλήματα λήψης επιχειρηματικών αποφάσεων: εκτίμηση του χρηματοπιστωτικού κινδύνου με επαγωγική μηχανική μάθηση
title_short Εφαρμογή νοημόνων μεθόδων σε προβλήματα λήψης επιχειρηματικών αποφάσεων: εκτίμηση του χρηματοπιστωτικού κινδύνου με επαγωγική μηχανική μάθηση
title_sort εφαρμογή νοημόνων μεθόδων σε προβλήματα λήψης επιχειρηματικών αποφάσεων εκτίμηση του χρηματοπιστωτικού κινδύνου με επαγωγική μηχανική μάθηση
topic πιστωτικός κίνδυνος
δένδρα απόφασης
μηχανική μάθηση
decision trees
credit risk
machine learning
Risk assessment
Machine learning
Decision trees
url http://hdl.handle.net/11610/19828
work_keys_str_mv AT papanikolaouleōnidas epharmogēnoēmonōnmethodōnseproblēmatalēpsēsepicheirēmatikōnapophaseōnektimēsētouchrēmatopistōtikoukindynoumeepagōgikēmēchanikēmathēsē