Ευφυής εστιασμένη διάσχιση του παγκόσμιου ιστού : διπλωματική εργασία
Η συνεχής εξάπλωση του παγκόσμιου ιστού τα τελευταία χρόνια έκανε απαραίτητη την αποδοτική εύρεση πηγών πληροφορίας. Στην κατεύθυνση αυτή, βοήθεια στους χρήστες του διαδικτύου προσφέρουν οι μηχανές αναζήτησης. Οι μηχανές αυτές έχουν να αντιμετωπίσουν τον τεράστιο όγκο αλλά και τις συνεχείς μεταβολές...
Αποθηκεύτηκε σε:
| Κύριος συγγραφέας: | |
|---|---|
| Συγγραφή απο Οργανισμό/Αρχή: | |
| Μορφή: | Thesis Βιβλίο |
| Γλώσσα: | Greek |
| Δημοσίευση: |
Καρλόβασι, Σάμος :
Πανεπιστήμιο Αιγαίου, Τμήμα Μηχανικών Πληροφοριακών και Επικοινωνιακών Συστημάτων,
2007.
|
| Θέματα: | |
| Διαθέσιμο Online: | http://hdl.handle.net/11610/8809 |
| Ετικέτες: |
Προσθήκη ετικέτας
Δεν υπάρχουν, Καταχωρήστε ετικέτα πρώτοι!
|
| Περίληψη: | Η συνεχής εξάπλωση του παγκόσμιου ιστού τα τελευταία χρόνια έκανε απαραίτητη την αποδοτική εύρεση πηγών πληροφορίας. Στην κατεύθυνση αυτή, βοήθεια στους χρήστες του διαδικτύου προσφέρουν οι μηχανές αναζήτησης. Οι μηχανές αυτές έχουν να αντιμετωπίσουν τον τεράστιο όγκο αλλά και τις συνεχείς μεταβολές στην δομή του παγκόσμιου ιστού οι οποίες δυσχεραίνουν το έργο τους και το καταστούν χρονοβόρο και πολύ απαιτητικό σε υπολογιστική ισχύ και αποθηκευτικό χώρο. Οι μηχανές αναζήτησης χρησιμοποιούν τεχνολογίες που αναφέρονται ως Crawlers, Robots, Spiders ή Bots στόχος των οποίων είναι να διασχίζουν τον παγκόσμιο ιστό, να προσπελαύνουν ιστοσελίδες και να συλλέγουν πληροφορίες γι αυτές ώστε να καταστήσουν αποδοτική την αναζήτηση με χρήση διάφορων κριτηρίων.Σ αυτή την εργασία αναφέρονται πληροφορίες για τα είδη των Crawlers, τον τρόπο λειτουργίας τους και την δομή τους. Ακόμα αναφέρονται πληροφορίες για την δομή και τον τρόπο λειτουργίας των μηχανών αναζήτησης που χρησιμοποιούν αυτές τις εφαρμογές. Το πρόβλημα στο οποίο αναφέρεται η παρούσα διπλωματική είναι η αποδοτική αναζήτηση πληροφορίας στον παγκόσμιο ιστό: Πως είναι δυνατόν μια μηχανή αναζήτησης να εντοπίζει πληροφορία που ικανοποιεί κάποια κριτήρια/συνθήκη που θέτει ο χρήστης της (π.χ. λέξεις κλειδιά) διασχίζοντας το μικρότερο δυνατόν τμήμα του παγκόσμιου ιστού και προσπελαύνοντας τις λιγότερες δυνατές σελίδες; Για το σκοπό αυτό, στην εργασία αυτή εξετάζουμε την τεχνική της ευφυούς αναζήτησης. Το κύριο λοιπόν τμήμα της εργασίας αποτελείται από την αναλυτική περιγραφή της τεχνικής της ευφυούς αναζήτησης. Η τεχνική αυτή στηρίζεται στη διαρκή συλλογή πληροφορίας και στην αξιοποίησή της από τον Crawler με στόχο την αύξηση της αποδοτικότητάς του. Η πληροφορία που συλλέγεται αφορά στα εξής: 1) Το περιεχόμενο των ιστοσελίδων που είναι γνωστό ότι συνδέονται με μια ιστοσελίδα (το σύνολο των λέξεων που περιέχονται σ αυτές). 2) Οι λέξεις-συμβολοσειρές (tokens) που περιέχονται στην διεύθυνση (URL) της υποψήφιας ιστοσελίδας. 3) Η φύση των ιστοσελίδων που περιέχουν την διεύθυνση (URL) της υποψήφιας ιστοσελίδας ως σύνδεσμο (φύση των inlinking σελίδων). 4) Ο αριθμός των αδερφικών ιστοσελίδων που έχουν διασχιστεί και ικανοποιούν την συνθήκη του χρήστη. Τέλος περιγράφεται η υλοποίηση ενός ευφυούς Crawler (intelligent Crawler) που στόχος του είναι να συλλέγει την παραπάνω πληροφορία και να βελτιώνει την απόδοσή του κατά την διάρκεια των διασχίσεων στηριζόμενος στην γνώση που συλλέγεται κατά την διάρκεια της διάσχισης ή σε προπάρχουσα συσσωρευμένη γνώση από προηγούμενες διασχίσεις με κοινή συνθήκη του χρηστή (λέξη προς αναζήτηση). Στο τέλος της εργασίας παρουσιάζονται τα αποτελέσματα αποτίμησης της απόδοσης του συστήματος. |
|---|---|
| Περιγραφή τεκμηρίου: | Μέλη της εξεταστικής επιτροπής: Γεώργιος Βούρος, Κωνσταντίνος Στεργίου, Ευστάθιος Σταματάτος. |
| Φυσική περιγραφή: | 35 σ. : εικ. ; 30 εκ. |
| Βιβλιογραφία: | Βιβλιογραφία: σ. 35. |
| Πρόσβαση: | Διάθεση πλήρους κειμένου - Ελεύθερη πρόσβαση. |