Κατηγοριοποίηση ιστοσελίδων με χρήση τεχνικών μηχανικής μάθησης

Η Αυτόματη Κατηγοριοποίηση των Ιστοσελίδων είναι ένας επιστημονικός τομέας που συνεχώς κερδίζει έδαφος στις προτεραιότητες του κλάδου της Αυτόματης Κατηγοριοποίησης Κειμένου εξαιτίας της ραγδαίας ανάπτυξης του Διαδικτύου και της, αναλόγου μεγέθους, ανάγκης των χρηστών για ευκολότερη πρόσβαση στην πρ...

Πλήρης περιγραφή

Αποθηκεύτηκε σε:
Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Κωνσταντουδάκης, Νικόλαος
Άλλοι συγγραφείς: Σταματάτος, Ευστάθιος
Γλώσσα:Greek
Δημοσίευση: 2015
Θέματα:
Διαθέσιμο Online:https://vsmart.lib.aegean.gr/webopac/List.csp?SearchT1=%CE%9A%CF%89%CE%BD%CF%83%CF%84%CE%B1%CE%BD%CF%84%CE%BF%CF%85%CE%B4%CE%AC%CE%BA%CE%B7%CF%82%2C+%CE%9D%CE%B9%CE%BA%CF%8C%CE%BB%CE%B1%CE%BF%CF%82&Index1=Keywordsbib&Database=1&SearchMethod=Find_1&SearchTerm1=%CE%9A%CF%89%CE%BD%CF%83%CF%84%CE%B1%CE%BD%CF%84%CE%BF%CF%85%CE%B4%CE%AC%CE%BA%CE%B7%CF%82%2C+%CE%9D%CE%B9%CE%BA%CF%8C%CE%BB%CE%B1%CE%BF%CF%82&OpacLanguage=gre&Profile=Default&EncodedRequest=*84*D3*8B*A5mX*A4*E9Z*1Fd*03*A3*9B*AF*B9&EncodedQuery=*84*D3*8B*A5mX*A4*E9Z*1Fd*03*A3*9B*AF*B9&Source=SysQR&PageType=Start&PreviousList=RecordListFind&WebPageNr=1&NumberToRetrieve=50&WebAction=NewSearch&StartValue=0&RowRepeat=0&ExtraInfo=&SortIndex=Year&SortDirection=-1&Resource=&SavingIndicator=&RestrType=&RestrTerms=&RestrShowAll=&LinkToIndex=
http://hdl.handle.net/11610/8925
Ετικέτες: Προσθήκη ετικέτας
Δεν υπάρχουν, Καταχωρήστε ετικέτα πρώτοι!
Περιγραφή
Περίληψη:Η Αυτόματη Κατηγοριοποίηση των Ιστοσελίδων είναι ένας επιστημονικός τομέας που συνεχώς κερδίζει έδαφος στις προτεραιότητες του κλάδου της Αυτόματης Κατηγοριοποίησης Κειμένου εξαιτίας της ραγδαίας ανάπτυξης του Διαδικτύου και της, αναλόγου μεγέθους, ανάγκης των χρηστών για ευκολότερη πρόσβαση στην προσφερόμενη πληροφορία. Η παρούσα εργασία έχει ως σκοπό την σχεδίαση και ανάπτυξη ενός συστήματος αυτόματης ταξινόμησης ιστοσελίδων σε προκαθορισμένες κατηγορίες, που θα βασίζεται σε γνωστούς αλγορίθμους μηχανικής μάθησης. Για την επίτευξη του σκοπού αυτού μελετήθηκε το πρόβλημα της αυτόματης κατηγοριοποίησης κειμένου και η εφαρμογή του στην ιδιαίτερη φύση των ιστοσελίδων. Χρησιμοποιήθηκε ένα σώμα ιστοσελίδων από το οποίο καθορίστηκαν οι θεματικές κατηγορίες που άνηκαν τα στοιχεία του, καθώς και από το οποίο ορίστηκε το υποσύνολο του πάνω στο οποίο εκπαιδεύτηκε το σύστημα. Τα πειράματα που έγιναν για την παρούσα εργασία χαρακτηρίζονται από το είδος των αλγορίθμων μηχανικής μάθησης που χρησιμοποιήθηκαν, των τεχνικών εξαγωγής των χαρακτηριστικών, του τρόπου ανάθεσης βαρών στους όρους και των τεχνικών μείωσης του χώρου των χαρακτηριστικών. Τέλος, επιλεγούμε την τεχνική αυτή ταξινόμησης που επιφέρει την μεγαλύτερη αποτελεσματικότητα στο σύστημα που αναπτύξαμε.