Ερμηνεία της απόδοσης του S&P500 energy μέσω του twitter με χρήση της επεξεργασίας Φυσικής Γλώσσας

Το Twitter έχει γίνει μια ολοένα και πιο δημοφιλής πλατφόρμα έκφρασης απόψεων και ειδήσεων από χρήστες που μπορεί να είναι πολίτες, ερευνητές, ελεγκτές κανονιστικών προτύπων, επιχειρήσεις κλπ.. Αυτό το γεγονός το έχει καταστήσει πολύτιμη πηγή δεδομένων για τους ερευνητές που μελετούν τις εφαρμογές τ...

Πλήρης περιγραφή

Αποθηκεύτηκε σε:
Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Κουφόπουλος, Φίλιππος
Άλλοι συγγραφείς: Βασιλείου, Ευάγγελος Στ.
Γλώσσα:el_GR
Δημοσίευση: 2024
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/11610/26072
Ετικέτες: Προσθήκη ετικέτας
Δεν υπάρχουν, Καταχωρήστε ετικέτα πρώτοι!
Περιγραφή
Περίληψη:Το Twitter έχει γίνει μια ολοένα και πιο δημοφιλής πλατφόρμα έκφρασης απόψεων και ειδήσεων από χρήστες που μπορεί να είναι πολίτες, ερευνητές, ελεγκτές κανονιστικών προτύπων, επιχειρήσεις κλπ.. Αυτό το γεγονός το έχει καταστήσει πολύτιμη πηγή δεδομένων για τους ερευνητές που μελετούν τις εφαρμογές της Επεξεργασία Φυσικής Γλώσσας (Natural Language Processing - NLP) στις χρηματιστηριακές αγορές. Η NLP είναι ένας κλάδος της Τεχνητής Νοημοσύνης (Artificial Intelligence - AI) που επικεντρώνεται στην ανάλυση και κατανόηση της ανθρώπινης γλώσσας, με τρόπο που να είναι κατανοητός στους υπολογιστές και να μας επιτρέπει να εξάγουμε συμπεράσματα σε μεγάλο όγκο δεδομένων σε σχέση με τα συναισθήματα, τις τάσεις κλπ. των χρηστών. Στόχος της διπλωματικής εργασίας ήταν να χρησιμοποιήσουμε μεθόδους NLP σε κείμενα που προέρχονται από το Twitter και να εξετάσουμε εάν στην περίπτωση των χρηματιστηριακών αγορών, μπορεί να προσδιορίσουν έκφραση σε θετικό ή αρνητικό συναίσθημα ή οπτική απέναντι σε μία συγκεκριμένη είδηση. Τελικά, ελέγξαμε εάν αυτές οι εκτιμήσεις σχετικά με τα θετικά η αρνητικά συναισθήματα μπορούν να χρησιμοποιηθούν για να γίνουν προβλέψεις της μελλοντικής πορείας του δείκτη S&P 500 Energy. Έρευνες όπως αυτή των Shen, Urquhart και Want (2019) δείχνουν ότι ενώ η Google ή η Wikipedia είναι καλές πηγές σφαιρικότερης πληροφόρησης, οι πιο καλά πληροφορημένοι επενδυτές προτιμούν το Twitter για να πληροφορηθούν ή για να δημοσιεύσουν κάποιο πιο εξειδικευμένο θέμα. Παράλληλα, έχει εκφραστεί μεγάλο ενδιαφέρον για τη σχέση του Twitter και της Αγοράς της Ενέργειας. Σε μία πρόσφατη δημοσίευση, οι Polyzos και Wang (2022) υποστηρίζουν ότι οι δημοσιεύσεις στο Twitter μπορούν να προβλέψουν την Αγορά της Ενέργειας με περισσότερη ακρίβεια, ιδίως όταν αυτή είναι ανοδική (bull market). Τα κύρια ερωτήματα της διπλωματικής εργασίας, σχετίζονται με την εύρεση μίας κατάλληλης διαδικασίας, η οποία θα είναι ικανή να επεξεργαστεί ποιοτικά δεδομένα κατά τρόπο αποτελεσματικό, ώστε να μπορέσει τελικά να εξάγει τα προφίλ εκείνων των χρηστών που είναι ικανοί είτε να προβλέψουν είτε και να επηρεάσουν τις μελλοντικές κινήσεις της Αγοράς της Ενέργειας. Για την υλοποίηση της διπλωματικής πραγματοποιήθηκαν πρωτίστως Πειραματικές Μετρήσεις, ειδικότερα χρησιμοποιώντας τις κινήσεις της Αγοράς της Ενέργειας η οποία αποτυπώνεται μέσω του δείκτη S&P 500 Energy, κατά την τριετή περίοδο 15-10-2019 έως 15-10-2022. Ακόμη, υλοποιήσαμε ένα Λογισμικό Σύστημα το οποίο είναι ικανό να φιλτράρει κατάλληλα και να επιλέγει τις λέξεις - κλειδιά για τις αναζητήσεις εκείνες που προσφέρουν υψηλή προβλεπτική ικανότητα στην Αγορά της Ενέργειας (Afkhami, Cormack και Ghoddusi (2017)). Ως Εργαλείο Υλοποίησης, εφαρμόσαμε Προγραμματισμό Υπολογιστών με χρήση πακέτων λογισμικού. Οι τεχνικές NLP, χρησιμοποιούν κυρίως την Θεωρία Πιθανοτήτων και την Γραμμική Άλγεβρα. Οι τεχνικές αυτές μπορούν να συμβάλλουν στον εντοπισμό και στην ταξινόμηση των tweets που είναι πιθανότερο να παρέχουν πολύτιμες πληροφορίες για τις μελλοντικές κινήσεις της αγοράς. Με βάση αυτές τις τεχνικές, κατασκευάσαμε Συμπεριφορικούς Δείκτες (Sentiment Indicators) οι οποίοι επιχειρούν να προσδιορίσουν την τάση της αγοράς την επόμενη εργάσιμη ημέρα μέσω της ανάλυσης που γίνεται στο εκάστοτε tweet. Έπειτα ομαδοποιήσαμε τα tweets σε επίπεδο χρηστών της πλατφόρμας και επιλέξαμε τα προφίλ εκείνα, όπου εμπεριείχαν δείκτες με υψηλή προβλεπτική ικανότητα. Τα ευρήματα της διπλωματικής εργασίας καταδεικνύουν τις δυνατότητες της NLP για την πρόβλεψη των χρηματιστηριακών αγορών. Η χρήση δεδομένων που παρέχονται σε πραγματικό χρόνο αλλά και η συστηματική προσέγγιση που ακολουθήσαμε στην παρούσα εργασία για την ανάλυση και την ερμηνεία αυτών των δεδομένων, είναι ικανή να παρέχει πολύτιμες πληροφορίες τόσο για τους επενδυτές, τους επιχειρηματίες όσο και ενδεχομένως για τους ελεγκτές κανονιστικών προτύπων.