Τεχνικές ταξινόμησης αποτελεσμάτων μηχανών αναζήτησης με βάση την ιστορία του χρήστη
Η παρούσα διπλωματική εργασία πραγματεύεται το πρόβλημα της ταξινόμησης αποτελεσμάτων που επιστρέφονται από την μηχανή αναζήτησης Google. Οι βασικές μέθοδοι που χρησιμοποιούνται για την αυτόματη ταξινόμησή τους, σε δύο κατηγορίες (ενδιαφέροντα και μη) στηρίζονται σε γλωσσικά και α...
Αποθηκεύτηκε σε:
| Περίληψη: | Η παρούσα διπλωματική εργασία πραγματεύεται το πρόβλημα της ταξινόμησης αποτελεσμάτων που επιστρέφονται από την μηχανή αναζήτησης Google. Οι βασικές μέθοδοι που χρησιμοποιούνται για την αυτόματη ταξινόμησή τους, σε δύο κατηγορίες (ενδιαφέροντα και μη) στηρίζονται σε γλωσσικά και αριθμητικά χαρακτηριστικά των αποτελεσμάτων και μηχανική μάθηση. Η προσέγγιση του προβλήματος στηρίζεται στη χρήση του αλγόριθμου ταξινόμησης Naïve Bayes, ο οποίος σύμφωνα με τα συμπεράσματα προηγούμενων εργασιών έχει καλές επιδόσεις στο συγκεκριμένο πρόβλημα. Η εργασία μελετά τρόπους εκμάθησης του ταξινομητή Naïve Bayes με την εξαγωγή χρήσιμων δεδομένων από το σώμα των αποτελεσμάτων. Επίσης, για λόγους πληρότητας υλοποιήθηκαν και τεχνικές μέσω των οποίων η εφαρμογή μπορεί να ‘καταλαβαίνει’ κατά πόσο δύο ερωτήματα είναι κοινά, με αποτέλεσμα να προτείνει στον χρήστη αποτελέσματα και από ερωτήματα που έχουν γίνει στο παρελθόν. Οι μέθοδοι που αναπτύχθηκαν επικεντρώνονται στην ταξινόμηση υπερσυνδέσμων , όπως τα αποτελέσματα που επιστρέφονται από κάποια μηχανή αναζήτησης. Σε αυτήν την περίπτωση η απόδοση του ταξινομητή ήταν ικανοποιητική. Από τα πειράματα φάνηκε ότι οι μέθοδοι που χρησιμοποιήθηκαν για την κατηγοριοποίηση των ερωτημάτων ήταν αποτελεσματικοί. |
|---|