Μελέτη και ανάπτυξη μεθόδων ανάκτησης πληροφορίας σε συλλογές υπερκειμένων
Η παρούσα εργασία έχει ως κίνητρο τη σύνδεση της πληροφορίας που ανακτάται από το περιεχόμενο ενός υπερκειμένου με αυτήν που προκύπτει από την ανάλυση των υπερσυνδέσμων του. Στοχεύει δε στην ενοποίηση των μεθόδων που εκμεταλλεύονται αυτή την πληροφορία καθώς και στην εφαρμογή του νέου αλγορίθμου σε...
Saved in:
| Summary: | Η παρούσα εργασία έχει ως κίνητρο τη σύνδεση της πληροφορίας που ανακτάται από το περιεχόμενο ενός υπερκειμένου με αυτήν που προκύπτει από την ανάλυση των υπερσυνδέσμων του. Στοχεύει δε στην ενοποίηση των μεθόδων που εκμεταλλεύονται αυτή την πληροφορία καθώς και στην εφαρμογή του νέου αλγορίθμου σε μία βάση δεδομένων υπερκειμένων. Για το σκοπό αυτό, περιγράφεται η διανυσματική αναπαράσταση των κειμένων, αναλύεται η μέθοδος Latent Semantic Indexing (LSI) και στη συνέχεια η μέθοδος Hypertext Induced Topic Search (HITS). Η πρώτη εκμεταλλεύεται σε μία συλλογή κειμένων τη νοηματική σχέση που υπάρχει ανάμεσα στα έγγραφα και τους όρους – λέξεις που τα αποτελούν έτσι ώστε να εξαγάγει χρήσιμη πληροφορία για τη σημασιολογία του εκάστοτε κειμένου. Η δεύτερη μέθοδος αξιολογεί τους συνδέσμους που υπάρχουν μεταξύ των υπερκειμένων μιας ομάδας. Τα κείμενα και στις δύο μεθόδους τελικά ταξινομούνται εξυπηρετώντας μία συγκεκριμένη αναζήτηση του χρήστη στη βάση δεδομένων. Τέλος, ο νέος αλγόριθμος που προκύπτει επιδιώκει να συνδυάσει τα πλεονεκτήματα των παραπάνω μεθόδων προς όφελος της αναζήτησης του χρήστη. |
|---|