Αλγόριθμοι κατάταξης ιστοσελίδων του διαδικτύου στις μηχανές αναζήτησης

Η παρούσα πτυχιακή εργασία έχει ως αντικείμενο μελέτης τη συμβολή των αλγόριθμων στη λειτουργία των Μηχανών Αναζήτησης του διαδικτύου καθώς και στα συστήματα και τις διαδικασίες που αυτές υλοποιούν. Παρουσιάζεται ένα δομικό συστατικό στοιχείο αυτών, ο web crawler ( περιηγητής ) και αναλύεται το πρόβ...

Πλήρης περιγραφή

Αποθηκεύτηκε σε:
Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Σπυρόπουλος, Κωνσταντίνος
Άλλοι συγγραφείς: Νάστου, Παναγιώτης
Γλώσσα:el_GR
Δημοσίευση: 2017
Θέματα:
Διαθέσιμο Online:http://catalog.lib.aegean.gr/webopac/FullBB.csp?WebAction=ShowFullBB&EncodedRequest=B*E5*9D*3D*CE*09I*C8*E5S*9C*BC*F0*5D*048&Profile=Default&OpacLanguage=gre&NumberToRetrieve=50&StartValue=1&WebPageNr=1&SearchTerm1=2017.1.114319&SearchT1=&Index1=Keywordsbib&SearchMethod=Find_1&ItemNr=1
http://hdl.handle.net/11610/17728
Ετικέτες: Προσθήκη ετικέτας
Δεν υπάρχουν, Καταχωρήστε ετικέτα πρώτοι!
_version_ 1828460178395103232
author Σπυρόπουλος, Κωνσταντίνος
author2 Νάστου, Παναγιώτης
author_facet Νάστου, Παναγιώτης
Σπυρόπουλος, Κωνσταντίνος
author_sort Σπυρόπουλος, Κωνσταντίνος
collection DSpace
description Η παρούσα πτυχιακή εργασία έχει ως αντικείμενο μελέτης τη συμβολή των αλγόριθμων στη λειτουργία των Μηχανών Αναζήτησης του διαδικτύου καθώς και στα συστήματα και τις διαδικασίες που αυτές υλοποιούν. Παρουσιάζεται ένα δομικό συστατικό στοιχείο αυτών, ο web crawler ( περιηγητής ) και αναλύεται το πρόβλημα της κατάταξης ιστοσελίδων που αντιμετωπίζουν οι web crawlers κατά τη διάρκεια της λειτουργίας τους. Σε πρώτο στάδιο γίνεται μια ιστορική αναδρομή στην εξελικτική πορεία των συστημάτων ανάκτησης πληροφορίας ( ΣΑΠ ), προγραμμάτων λογισμικού, δηλαδή, που βοηθούν τους χρήστες να αναζητήσουν πληροφορία, μέχρι να λάβουν την σημερινή τους μορφή. Η αρχιτεκτονική των Μηχανών Αναζήτησης περιέχει τρία συστατικά στοιχεία : To web crawling , την αρχειοθέτηση και την αναζήτηση. Το πιο σημαντικό εξ αυτών είναι το πρώτο, καθώς αποτελεί τον τρόπο με τον οποίο μια Μ-Α βρίσκει πληροφορία στο διαδίκτυο, υλοποιώντας ένα πρόγραμμα λογισμικού, τον web crawler. Καίριο ζήτημα εδώ, αποτελεί η σειρά με την οποία ένας crawler ανακαλύπτει τις σελίδες, καθώς διαθέτει περιορισμένους πόρους και πρέπει να εξασφαλίσει μια ικανοποιητική κάλυψη του διαδικτύου προτού σταματήσει η λειτουργία του, ενώ με τη χρήση διαφόρων τεχνικών θα πρέπει να προγραμματίζει την επαναληπτική λήψη σελίδων σε βάθος χρόνου ανα δεσμίδες (batch crawling) ή συνεχόμενα (incremental crawling), έτσι ώστε να διατηρεί το περιεχόμενο του ενημερωμένο. Για την αντιμετώπιση αυτού του προβλήματος αναπτύχθηκαν αλγόριθμοι, με την βοήθεια των οποίων οι crawlers αξιολογούν την αξία της κάθε σελίδας με χρήση διαφόρων μετρικών βάρους , με πιο διαδεδομένη τη μετρική Pagerank. Στην εργασία αναλύονται οι αλγόριθμοι : L-γειτονιάς , Rankmass, Παραθυρικός Rankmass.
id oai:hellanicus.lib.aegean.gr:11610-17728
institution Hellanicus
language el_GR
publishDate 2017
record_format dspace
spelling oai:hellanicus.lib.aegean.gr:11610-177282021-02-22T08:29:20Z Αλγόριθμοι κατάταξης ιστοσελίδων του διαδικτύου στις μηχανές αναζήτησης Σπυρόπουλος, Κωνσταντίνος Νάστου, Παναγιώτης Κατάταξη Ιστοσελίδων Αλγόριθμοι Περιηγητής Αρχιτεκτονική των Μηχανών Αναζήτησης Rankmass Pagerank Algorithms Rankmass Algorithm Web search engines (URL: http://id.loc.gov/authorities/subjects/sh97007463) Algorithms (URL: http://id.loc.gov/authorities/subjects/sh85003487) Η παρούσα πτυχιακή εργασία έχει ως αντικείμενο μελέτης τη συμβολή των αλγόριθμων στη λειτουργία των Μηχανών Αναζήτησης του διαδικτύου καθώς και στα συστήματα και τις διαδικασίες που αυτές υλοποιούν. Παρουσιάζεται ένα δομικό συστατικό στοιχείο αυτών, ο web crawler ( περιηγητής ) και αναλύεται το πρόβλημα της κατάταξης ιστοσελίδων που αντιμετωπίζουν οι web crawlers κατά τη διάρκεια της λειτουργίας τους. Σε πρώτο στάδιο γίνεται μια ιστορική αναδρομή στην εξελικτική πορεία των συστημάτων ανάκτησης πληροφορίας ( ΣΑΠ ), προγραμμάτων λογισμικού, δηλαδή, που βοηθούν τους χρήστες να αναζητήσουν πληροφορία, μέχρι να λάβουν την σημερινή τους μορφή. Η αρχιτεκτονική των Μηχανών Αναζήτησης περιέχει τρία συστατικά στοιχεία : To web crawling , την αρχειοθέτηση και την αναζήτηση. Το πιο σημαντικό εξ αυτών είναι το πρώτο, καθώς αποτελεί τον τρόπο με τον οποίο μια Μ-Α βρίσκει πληροφορία στο διαδίκτυο, υλοποιώντας ένα πρόγραμμα λογισμικού, τον web crawler. Καίριο ζήτημα εδώ, αποτελεί η σειρά με την οποία ένας crawler ανακαλύπτει τις σελίδες, καθώς διαθέτει περιορισμένους πόρους και πρέπει να εξασφαλίσει μια ικανοποιητική κάλυψη του διαδικτύου προτού σταματήσει η λειτουργία του, ενώ με τη χρήση διαφόρων τεχνικών θα πρέπει να προγραμματίζει την επαναληπτική λήψη σελίδων σε βάθος χρόνου ανα δεσμίδες (batch crawling) ή συνεχόμενα (incremental crawling), έτσι ώστε να διατηρεί το περιεχόμενο του ενημερωμένο. Για την αντιμετώπιση αυτού του προβλήματος αναπτύχθηκαν αλγόριθμοι, με την βοήθεια των οποίων οι crawlers αξιολογούν την αξία της κάθε σελίδας με χρήση διαφόρων μετρικών βάρους , με πιο διαδεδομένη τη μετρική Pagerank. Στην εργασία αναλύονται οι αλγόριθμοι : L-γειτονιάς , Rankmass, Παραθυρικός Rankmass. 2017-12-12T07:37:01Z 2017-12-12T07:37:01Z 2017-03-03 http://catalog.lib.aegean.gr/webopac/FullBB.csp?WebAction=ShowFullBB&EncodedRequest=B*E5*9D*3D*CE*09I*C8*E5S*9C*BC*F0*5D*048&Profile=Default&OpacLanguage=gre&NumberToRetrieve=50&StartValue=1&WebPageNr=1&SearchTerm1=2017.1.114319&SearchT1=&Index1=Keywordsbib&SearchMethod=Find_1&ItemNr=1 http://hdl.handle.net/11610/17728 el_GR Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές http://creativecommons.org/licenses/by-nc-nd/4.0/ 85 σ. application/pdf Σάμος
spellingShingle Κατάταξη Ιστοσελίδων
Αλγόριθμοι
Περιηγητής
Αρχιτεκτονική των Μηχανών Αναζήτησης
Rankmass
Pagerank
Algorithms
Rankmass Algorithm
Web search engines (URL: http://id.loc.gov/authorities/subjects/sh97007463)
Algorithms (URL: http://id.loc.gov/authorities/subjects/sh85003487)
Σπυρόπουλος, Κωνσταντίνος
Αλγόριθμοι κατάταξης ιστοσελίδων του διαδικτύου στις μηχανές αναζήτησης
title Αλγόριθμοι κατάταξης ιστοσελίδων του διαδικτύου στις μηχανές αναζήτησης
title_full Αλγόριθμοι κατάταξης ιστοσελίδων του διαδικτύου στις μηχανές αναζήτησης
title_fullStr Αλγόριθμοι κατάταξης ιστοσελίδων του διαδικτύου στις μηχανές αναζήτησης
title_full_unstemmed Αλγόριθμοι κατάταξης ιστοσελίδων του διαδικτύου στις μηχανές αναζήτησης
title_short Αλγόριθμοι κατάταξης ιστοσελίδων του διαδικτύου στις μηχανές αναζήτησης
title_sort αλγόριθμοι κατάταξης ιστοσελίδων του διαδικτύου στις μηχανές αναζήτησης
topic Κατάταξη Ιστοσελίδων
Αλγόριθμοι
Περιηγητής
Αρχιτεκτονική των Μηχανών Αναζήτησης
Rankmass
Pagerank
Algorithms
Rankmass Algorithm
Web search engines (URL: http://id.loc.gov/authorities/subjects/sh97007463)
Algorithms (URL: http://id.loc.gov/authorities/subjects/sh85003487)
url http://catalog.lib.aegean.gr/webopac/FullBB.csp?WebAction=ShowFullBB&EncodedRequest=B*E5*9D*3D*CE*09I*C8*E5S*9C*BC*F0*5D*048&Profile=Default&OpacLanguage=gre&NumberToRetrieve=50&StartValue=1&WebPageNr=1&SearchTerm1=2017.1.114319&SearchT1=&Index1=Keywordsbib&SearchMethod=Find_1&ItemNr=1
http://hdl.handle.net/11610/17728
work_keys_str_mv AT spyropouloskōnstantinos algorithmoikatataxēsistoselidōntoudiadiktyoustismēchanesanazētēsēs