Ανάλυση συναισθήματος σε διαδικτυακές κριτικές υπηρεσιών φιλοξενίας
Αντικείμενο αυτής της διπλωματικής εργασίας αποτελεί η ανάλυση συναισθημάτων σε σχόλια διαδικτυακών κριτικών υπηρεσιών φιλοξενίας με τεχνικές μηχανικής μάθησης. Ανάλυση συναισθήματος ονομάζεται η αυτοματοποιημένη διαδικασία μέσω της οποίας μπορούμε να εξάγουμε πληροφορίες και συμπεράσματα για το συν...
Saved in:
| Main Authors: | , |
|---|---|
| Other Authors: | |
| Language: | el_GR |
| Published: |
2021
|
| Subjects: | |
| Online Access: | http://hdl.handle.net/11610/21463 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Summary: | Αντικείμενο αυτής της διπλωματικής εργασίας αποτελεί η ανάλυση συναισθημάτων σε σχόλια διαδικτυακών κριτικών υπηρεσιών φιλοξενίας με τεχνικές μηχανικής μάθησης. Ανάλυση συναισθήματος ονομάζεται η αυτοματοποιημένη διαδικασία μέσω της οποίας μπορούμε να εξάγουμε πληροφορίες και συμπεράσματα για το συναίσθημα, το οποίο επικρατεί στο σύνολο ενός σώματος κειμένου. Συνήθως, την ανάλυση συναισθημάτων σε αυτό το πλαίσιο τη συναντάμε με την ονομασία «Συναισθηματική Πολικότητα», Sentiment Polarity, θέλοντας να δηλώσουμε την ύπαρξη δύο ξεχωριστών και αντίθετων συναισθηματικών πόλων (θετικού και αρνητικού) ενός σώματος κειμένου. Ο τομέας ανάλυσης συναισθημάτων συναντάται συχνά τα τελευταία χρόνια καθώς βρίσκει εφαρμογή στο χώρο της ανάλυσης κειμένων και συγκεκριμένα στον προσδιορισμό του συναισθήματος που «εκπέμπει» ένα κείμενο. Η συνεχής και αυξανόμενη διαθέσιμη ποσότητα διαδικτυακής πληροφορίας στο διαδίκτυο έχει οδηγήσει στην εφαρμογή και ανάπτυξη πολλαπλών μεθόδων και εφαρμογών που είναι άμεσα συνυφασμένες με τους τομείς της Μηχανικής Μάθησης και της Τεχνητής Νοημοσύνης. Αλματώδης είναι η πρόοδος η οποία έχει σημειωθεί στους συγκεκριμένους τομείς συντελώντας στην διεξαγωγή πληθώρας νέων ερευνών και ανάπτυξης εφαρμογών αποδεικνύοντας το εύρος της δύναμης και της επιρροής των μέσων κοινωνικής δικτύωσης στην καθημερινότητα των σύγχρονων ανθρώπων. Επιπλέον, έχει γίνει αναπόσπαστο κομμάτι ζωτικής σημασίας για εταιρίες και οργανισμούς αυξάνοντας την ικανότητα αντίληψης και ανταπόκρισής τους στο σύνολο των αναγκών των εκάστοτε πελατών τους.
Γενικά, ο τομέας της Ανάλυσης Συναισθήματος κυρίως αποσκοπεί στο διαχωρισμό και την ανάθεση του συναισθήματος σε δύο βασικές κατηγορίες, Θετική και Αρνητική. Στην παρούσα διπλωματική εργασία ασχοληθήκαμε με διαχωρισμό και ανάθεση σε κλάσεις διαδικτυακών κειμένων ή σχολίων που αφορούν κριτικές και σχόλια πελατών σε ξενοδοχεία, με διαχωρισμό τεσσάρων κατηγοριών συναισθημάτων, Χαράς, Ικανοποίησης, Απογοήτευσης, και Θυμού. Για αυτές τις κατηγορίες χρησιμοποιήσαμε 600 σχόλια, σε Ελληνική και Αγγλική γλώσσα, από τον ιστότοπο Booking.com. Για την ταξινόμηση των σχολίων επιλέξαμε τέσσερις βασικούς αλγόριθμους: λογιστική παλινδρόμηση (Logistic Regression), Naïve Bayes, μηχανές διανυσμάτων υποστήριξης (Supper Vector Machine) και τεχνητά νευρωνικά δίκτυα (Artificial Neural Network). Στην εργασία παρουσιάζουμε δύο μεθόδους ταξινόμησης. Στην πρώτη ακολουθούμε τη Δυαδική Ταξινόμηση όπου λαμβάνει χώρα η ανάθεση των σχολίων στις δύο βασικές κατηγορίες συναισθήματος, την Θετική και
4
Αρνητική. Στη δεύτερη, εφαρμόζουμε την Ταξινόμηση μίας κλάσης προς μία (One vs. One) εξετάζοντας 4 διαφορετικές κλάσεις συναισθήματος. Εξετάζεται η απόδοση 4 βασικών αλγορίθμων στις παραπάνω μεθόδους. Για την εξαγωγή των μοντέλων ταξινόμησης ακολουθούμε δυο επιλογές. Αρχικά, γίνεται χρήση των σχολίων του training set ενώ έπειτα γίνεται χρήση επιπλέον συναφών λέξεων αποσκοπώντας στη δημιουργία ενισχυμένων μοντέλων Ταξινόμησης. Επιπλέον, πραγματοποιείται παρουσίαση και αναλυτικός σχολιασμός ενός πλήθους διαγραμμάτων και αποτελεσμάτων των δύο εξεταζόμενων μεθόδων. |
|---|