Forecasting stock markets and trading systems using financial news and mining techniques : πτυχιακή εργασία

Το ενδιαφέρον της δημιουργίας συστημάτων βασισμένων σε προβλέψεις αυξάνεται συνεχώς στις μέρες μας, ειδικά δε, όταν τα αποτελέσματα της επεξεργασίας θα μπορούσαν να αποφέρουν υψηλά οικονομικά οφέλη. Παραδείγματος χάριν, η ανάγκη για πρόβλεψη της μελλοντικής πορείας μιας μετοχής γίνεται όλο και πιο ε...

Πλήρης περιγραφή

Αποθηκεύτηκε σε:
Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Λινάρδος, Ευάγγελος
Συγγραφή απο Οργανισμό/Αρχή: Πανεπιστήμιο Αιγαίου. Σχολή Θετικών Επιστημών. Τμήμα Μηχανικών Πληροφοριακών και Επικοινωνιακών Συστημάτων
Μορφή: Thesis Βιβλίο
Γλώσσα:Greek
Δημοσίευση: 2010.
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/11610/8866
Ετικέτες: Προσθήκη ετικέτας
Δεν υπάρχουν, Καταχωρήστε ετικέτα πρώτοι!
Περιγραφή
Περίληψη:Το ενδιαφέρον της δημιουργίας συστημάτων βασισμένων σε προβλέψεις αυξάνεται συνεχώς στις μέρες μας, ειδικά δε, όταν τα αποτελέσματα της επεξεργασίας θα μπορούσαν να αποφέρουν υψηλά οικονομικά οφέλη. Παραδείγματος χάριν, η ανάγκη για πρόβλεψη της μελλοντικής πορείας μιας μετοχής γίνεται όλο και πιο επιτακτική εξαιτίας της παγκοσμιοποιημένης οικονομίας αλλά και της ανάγκης για μεγιστοποίηση των κερδών. Ως εκ τούτου, το χρηματιστήριο θα μπορούσε να αποτελέσει - κάλλιστα - ένα ιδιαίτερο πεδίο εφαρμογής με μεγάλη δυναμική για τον τομέα της εξόρυξης γνώσης από δεδομένα (data mining) εξαιτίας της ποσότητας και της ταχύτητας με την οποία αυτά παράγονται. Μέχρι σήμερα έχουν πραγματοποιηθεί αρκετές έρευνες που βασίζονται σε ιστορικές τιμές των μετοχών, καμία ιδιαίτερα δημοφιλής όμως που να λαμβάνει επιπλέον υπόψη της και χρηματιστηριακές ειδήσεις άμεσα συνδεδεμένες με αυτές. Παρά ταύτα όλα συνηγορούν προς την κατεύθυνση του ότι υπάρχει μια έντονη σχέση μεταξύ της χρονικής στιγμής που δημοσιεύεται η είδηση και εκείνης που πραγματοποιείται η μεταβολή στην τιμή της μετοχής. Για τον λόγο αυτό, η εφαρμογή των τεχνικών εξόρυξης γνώσης από κείμενα (text mining) και ανάλυσης χρονολογικών σειρών (time series analysis) πάνω σε χρηματιστικά δεδομένα αποτελεί ένα ιδιαίτερα ενδιαφέρον και συνάμα απαιτητικό ερευνητικό πεδίο της σημερινής εποχής που συνδυάζει τόσο την επιστήμη της πληροφορικής όσο κι εκείνη της στατιστικής. Κατά την διάρκεια της έρευνας μας ορίσαμε και κατόπιν εφαρμόσαμε δυο διαφορετικές προσεγγίσεις για την μοντελοποίηση των χρηματιστηριακών ειδήσεων με τις τελευταίες να συγκεντρώνονται από πηγές του διαδικτύου. Τα διαφορετικά σύνολα δεδομένων που παράχθηκαν περιελάμβαναν εκτός των ιστορικών τιμών του εκάστοτε οργανισμού, ιστορικές τιμές για τους δείκτες των σημαντικότερων αγορών και αγαθών του κόσμου, καθώς επίσης και κάποιους πολύ γνωστούς δείκτες τεχνικής αναλύσεως, ενώ ορισμένα από αυτά περιελάμβαναν και μια απλοποιημένη μορφή χρονολογικών σειρών. Τέλος, πέραν των ημερήσιων δοκιμάσαμε και την απόδοση των ίδιων συνόλων ανάγοντας τα σε επίπεδο εβδομαδιαίων προβλέψεων ή κατόπιν εφαρμογής των αλγορίθμων PCA ή LCA σκοπός των οποίων είναι η μείωση της διαστατικότητας των αρχικών συνόλων δεδομένων. Κατά την διεξαγωγή των πειραμάτων, ανάλογα με τον τρόπο που είχε οριστεί η κλάση ταξινόμησης στο αντίστοιχο σύνολο δεδομένων, έγινε χρήση είτε των αλγορίθμων κατηγοριοποίησης (classification) και είτε των αλγορίθμων παλινδρόμησης (regression). Το χτίσιμο και η επαλήθευση των 480 διαφορετικών μοντέλων που δημιουργήσαμε με σκοπό των εντοπισμό προτύπων (patterns) και τάσεων (trends) πραγματοποιήθηκε με την βοήθεια του εργαλείου Weka.Η επόμενη φάση αφορούσε την ανάλυση και παρουσίαση των αποτελεσμάτων. Επειδή στόχος της έρευνας ήταν να επαληθευτεί η επιρροή των χρηματιστηριακών ειδήσεων στην μελλοντική πορεία της μετοχής, η περιγραφή των αποτελεσμάτων πραγματοποιήθηκε συγκρίνοντας κάθε φορά το σύνολο ή την ομάδα συνόλων που ενσωματώνει την πληροφορία αυτή σε σύγκριση με το αντίστοιχο σύνολο ή ομάδα συνόλων που δεν την ενσωματώνει. Πράγματι, τα πειράματα σε ορισμένες περιπτώσεις έδειξαν βελτίωση των προβλέψεων έως και 16% ενώ είμαστε πεπεισμένοι πως με καλύτερη επιλογή της πηγής των ειδήσεων ή και κατάλληλη τροποποίηση του τρόπου μοντελοποίησης των κειμένων θα μπορούσαν να επιτευχθούν ακόμη υψηλότερες επιδόσεις. Προκειμένου να ανάγουμε τα αποτελέσματα των πειραμάτων και την ποιότητα των διαθέσιμων συνόλων δεδομένων σε ένα διαφορετικό επίπεδο, αναπτύξαμε ένα σύστημα προσημείωσης υλοποιημένο επίσης σε Java. Σκοπός του εγχειρήματος ήταν να εξεταστεί η απόδοση του επενδυμένου κεφαλαίου για κάποιο χρονικό διάστημα βάση των προβλέψεων που έδινε κάθε φορά το σύστημα. Οι επιδόσεις του συστήματος θα μπορούσαν να χαρακτηριστούν σε γενικές γραμμές καλές και σε ορισμένες περιπτώσεις άκρως εντυπωσιακές πετυχαίνοντας έως και 324% αύξηση του επενδυμένου κεφαλαίου, 307.2% επιπλέον κέρδος σε σχέση με την απλή τακτική επένδυσης (βλ. Buy and Hold), ενώ υπήρξαν και αρκετά μοντέλα που προέβλεψαν σωστά όλες ανεξαιρέτως τις κινήσεις των μετοχών είτε επιπέδου ημέρας είτε επιπέδου εβδομάδας για χρονικό διάστημα τριών μηνών. Τέλος, λάβαμε μέρος στον διαγωνισμό Virtual Trader πετυχαίνοντας αύξηση της αξίας του αρχικού - εικονικού - χρηματοφυλακίου μας εντός λίγων ημερών αποκομίζοντας παράλληλα σημαντική πρακτική εμπειρία σχετικά με τις διαδικασίες διαπραγμάτευσης. Βέβαια απείχαμε αισθητά από την απόδοση των ανταγωνιστών μας αλλά αυτό οφείλεται - κυρίως - στο γεγονός ότι η μετοχή που επιλέξαμε (σ.σ. Αεροπορία Αιγαίου Α.Ε. - ASE:ΑΡΑΙΓ) χαρακτηρίζεται ως χαμηλού κινδύνου και ως εκ τούτου χαμηλής απόδοσης. Όπως και να έχει, είναι γεγονός ότι στην πλειοψηφία των περιπτώσεων το σύστημα προέβλεπε προς την σωστή κατεύθυνση την μελλοντική πορεία της μετοχής.
Περιγραφή τεκμηρίου:Μέλη της εξετατστικής επιτροπής: Εμμανουήλ Μαραγκουδάκης, Ευριπίδης Λουκής, Αλέξιος Καπόρης.
Φυσική περιγραφή:xi, 208 σ. : εικ., πιν. ; 30 εκ.
Βιβλιογραφία:Βιβλιογραφία: σ. 159-166.
Πρόσβαση:Διάθεση πλήρους κειμένου ;