Εξαγωγή συμπερασμάτων από τα social media για την πορεία μιας ταινίας με βάση τα σχόλια των χρηστών : πτυχιακή εργασία
Στο πλαίσιο της παρούσας διπλωματικής εργασίας θα συλλεχθούν δεδομένα από τα Social Media, Twitter και YouTube, τα οποία αναφέρονται σε γνωστές ταινίες κατά το τρέχον έτος 2013-2014. Αφού συλλεχθούν τα δεδομένα θα επεξεργαστούν και μέσω τεχνικών Εξόρυξης Γνώσης από Δεδομένα (data mining), θα αξιολογ...
Αποθηκεύτηκε σε:
| Κύριος συγγραφέας: | |
|---|---|
| Συγγραφή απο Οργανισμό/Αρχή: | |
| Μορφή: | Thesis Βιβλίο |
| Γλώσσα: | Greek |
| Δημοσίευση: |
2014.
|
| Θέματα: | |
| Διαθέσιμο Online: | http://hdl.handle.net/11610/8807 |
| Ετικέτες: |
Προσθήκη ετικέτας
Δεν υπάρχουν, Καταχωρήστε ετικέτα πρώτοι!
|
| Περίληψη: | Στο πλαίσιο της παρούσας διπλωματικής εργασίας θα συλλεχθούν δεδομένα από τα Social Media, Twitter και YouTube, τα οποία αναφέρονται σε γνωστές ταινίες κατά το τρέχον έτος 2013-2014. Αφού συλλεχθούν τα δεδομένα θα επεξεργαστούν και μέσω τεχνικών Εξόρυξης Γνώσης από Δεδομένα (data mining), θα αξιολογηθεί κατά πόσο τα social media επηρεάζουν την πορεία μιας ταινίας. Πιο συγκεκριμένα θα αναπτυχθεί πρόγραμμα στο οποίο ο χρήστης θα περνάει απευθείας σε μια βάση δεδομένων τα σχόλια των χρηστών από το Twitter και το YouTube για τις ταινίες που θα επιλεχθούν. Στην συνέχεια, θα εφαρμοστούν στα δεδομένα αυτά οι κατάλληλες τεχνικές εξόρυξης κειμένου (text mining) και εξόρυξης γνώμης (opinion mining -sentiment analysis).Η μελέτη που γίνεται αφορά τη συλλογή δεδομένων για έξι διαφορετικές ταινίες .Τα δεδομένα που συλλέχθηκαν είχαν δημοσιευτεί την περίοδο 7 Μαρτίου με 17 Απριλίου (περίπου ένας μήνας). Στην συνέχεια με την δημιουργία κατάλληλης διεργασίας με βάση το Rapid Miner (δημιουργία 1ου μοντέλου) και με βάση όρων Λεξικού (δημιουργία 2ου μοντέλου) έγινε κατηγοριοποίηση (classification) των δεδομένων αυτών σε positive, negative και neutral.Το τελευταίο και πιο σημαντικό στάδιο της μελέτης επικεντρώνεται στα σχόλια που έχουν προσδιοριστεί ως positive και negative, στα οποία εφαρμόζεται η μέθοδος ανάλυσης χρονολογικών σειρών (time series analysis). Συνεπώς βλέπουμε για κάθε μια από τις έξι ταινίες, ποιό μοντέλο από τα δυο παρουσιάζει τη μεγαλύτερη ακρίβεια και με βάση αυτό βγάζουμε και τα κατάλληλα συμπεράσματα για το πώς επηρεάζεται η πορεία μιας ταινίας από τα σχόλια των χρηστών. In this thesis, data will be collected from Social Media, like Twitter and YouTube that are referred to well-known films of the current year 2013-2014. Having collected them, data will be processed through techniques of data mining, and will be assessed on how social media affect the box office of a film. Specifically, a program will be developed in which the user will store comments from Twitter and YouTube, referred to selected films, directly to a database. Then, techniques of text mining and opinion mining (sentiment analysis) will be used for these data.The study has to do with collected data from six different movies. The collected data were published in approximately one month's period from March 7 to April 17, 2014. By making an appropriate process in Rapid Miner (1st creation model) and a process based on the conditions of a Lexicon (2nd creation model), data were categorized through classification method to positive, negative or neutral.The last and most important part of the study focuses on the comments that have been classified as positive and negative, on which the method of time series analysis is applied. Thus, we can find out for each one of the six movies, which of the two models is more accurate and therefore we can make the best conclusions on how the users reviews affect the box office of a film. |
|---|---|
| Περιγραφή τεκμηρίου: | Μέλη της εξεταστικής επιτροπής: Μαραγκουδάκης Εμμανουήλ, Σταματάτος Ευστάθιος, Καβαλλιεράτου Εργίνα. |
| Φυσική περιγραφή: | ii, 90 σ. : διάγρ., εικ., πιν. ; 30 εκ. |
| Βιβλιογραφία: | Βιβλιογραφία: σ. 89-90. |
| Πρόσβαση: | Διάθεση πλήρους κειμένου ; |