Κατηγοριοποίηση ιστοσελίδων με χρήση τεχνικών μηχανικής μάθησης

Η Αυτόματη Κατηγοριοποίηση των Ιστοσελίδων είναι ένας επιστημονικός τομέας που συνεχώς κερδίζει έδαφος στις προτεραιότητες του κλάδου της Αυτόματης Κατηγοριοποίησης Κειμένου εξαιτίας της ραγδαίας ανάπτυξης του Διαδικτύου και της, αναλόγου μεγέθους, ανάγκης των χρηστών για ευκολότερη πρόσβαση στην πρ...

Full description

Saved in:
Bibliographic Details
Main Author: Κωνσταντουδάκης, Νικόλαος
Other Authors: Σταματάτος, Ευστάθιος
Language:Greek
Published: 2015
Subjects:
Online Access:https://vsmart.lib.aegean.gr/webopac/List.csp?SearchT1=%CE%9A%CF%89%CE%BD%CF%83%CF%84%CE%B1%CE%BD%CF%84%CE%BF%CF%85%CE%B4%CE%AC%CE%BA%CE%B7%CF%82%2C+%CE%9D%CE%B9%CE%BA%CF%8C%CE%BB%CE%B1%CE%BF%CF%82&Index1=Keywordsbib&Database=1&SearchMethod=Find_1&SearchTerm1=%CE%9A%CF%89%CE%BD%CF%83%CF%84%CE%B1%CE%BD%CF%84%CE%BF%CF%85%CE%B4%CE%AC%CE%BA%CE%B7%CF%82%2C+%CE%9D%CE%B9%CE%BA%CF%8C%CE%BB%CE%B1%CE%BF%CF%82&OpacLanguage=gre&Profile=Default&EncodedRequest=*84*D3*8B*A5mX*A4*E9Z*1Fd*03*A3*9B*AF*B9&EncodedQuery=*84*D3*8B*A5mX*A4*E9Z*1Fd*03*A3*9B*AF*B9&Source=SysQR&PageType=Start&PreviousList=RecordListFind&WebPageNr=1&NumberToRetrieve=50&WebAction=NewSearch&StartValue=0&RowRepeat=0&ExtraInfo=&SortIndex=Year&SortDirection=-1&Resource=&SavingIndicator=&RestrType=&RestrTerms=&RestrShowAll=&LinkToIndex=
http://hdl.handle.net/11610/8925
Tags: Add Tag
No Tags, Be the first to tag this record!
_version_ 1828462709324120064
author Κωνσταντουδάκης, Νικόλαος
author2 Σταματάτος, Ευστάθιος
author_facet Σταματάτος, Ευστάθιος
Κωνσταντουδάκης, Νικόλαος
author_sort Κωνσταντουδάκης, Νικόλαος
collection DSpace
description Η Αυτόματη Κατηγοριοποίηση των Ιστοσελίδων είναι ένας επιστημονικός τομέας που συνεχώς κερδίζει έδαφος στις προτεραιότητες του κλάδου της Αυτόματης Κατηγοριοποίησης Κειμένου εξαιτίας της ραγδαίας ανάπτυξης του Διαδικτύου και της, αναλόγου μεγέθους, ανάγκης των χρηστών για ευκολότερη πρόσβαση στην προσφερόμενη πληροφορία. Η παρούσα εργασία έχει ως σκοπό την σχεδίαση και ανάπτυξη ενός συστήματος αυτόματης ταξινόμησης ιστοσελίδων σε προκαθορισμένες κατηγορίες, που θα βασίζεται σε γνωστούς αλγορίθμους μηχανικής μάθησης. Για την επίτευξη του σκοπού αυτού μελετήθηκε το πρόβλημα της αυτόματης κατηγοριοποίησης κειμένου και η εφαρμογή του στην ιδιαίτερη φύση των ιστοσελίδων. Χρησιμοποιήθηκε ένα σώμα ιστοσελίδων από το οποίο καθορίστηκαν οι θεματικές κατηγορίες που άνηκαν τα στοιχεία του, καθώς και από το οποίο ορίστηκε το υποσύνολο του πάνω στο οποίο εκπαιδεύτηκε το σύστημα. Τα πειράματα που έγιναν για την παρούσα εργασία χαρακτηρίζονται από το είδος των αλγορίθμων μηχανικής μάθησης που χρησιμοποιήθηκαν, των τεχνικών εξαγωγής των χαρακτηριστικών, του τρόπου ανάθεσης βαρών στους όρους και των τεχνικών μείωσης του χώρου των χαρακτηριστικών. Τέλος, επιλεγούμε την τεχνική αυτή ταξινόμησης που επιφέρει την μεγαλύτερη αποτελεσματικότητα στο σύστημα που αναπτύξαμε.
id oai:hellanicus.lib.aegean.gr:11610-8925
institution Hellanicus
language Greek
publishDate 2015
record_format dspace
spelling oai:hellanicus.lib.aegean.gr:11610-89252021-03-10T13:39:42Z Κατηγοριοποίηση ιστοσελίδων με χρήση τεχνικών μηχανικής μάθησης Κωνσταντουδάκης, Νικόλαος Σταματάτος, Ευστάθιος Κατηγοριοποίηση Categorization Ιστοσελίδες Sites Αλγόριθμος Algorithm Machine learning Web site development--Computer programs Algorithms Η Αυτόματη Κατηγοριοποίηση των Ιστοσελίδων είναι ένας επιστημονικός τομέας που συνεχώς κερδίζει έδαφος στις προτεραιότητες του κλάδου της Αυτόματης Κατηγοριοποίησης Κειμένου εξαιτίας της ραγδαίας ανάπτυξης του Διαδικτύου και της, αναλόγου μεγέθους, ανάγκης των χρηστών για ευκολότερη πρόσβαση στην προσφερόμενη πληροφορία. Η παρούσα εργασία έχει ως σκοπό την σχεδίαση και ανάπτυξη ενός συστήματος αυτόματης ταξινόμησης ιστοσελίδων σε προκαθορισμένες κατηγορίες, που θα βασίζεται σε γνωστούς αλγορίθμους μηχανικής μάθησης. Για την επίτευξη του σκοπού αυτού μελετήθηκε το πρόβλημα της αυτόματης κατηγοριοποίησης κειμένου και η εφαρμογή του στην ιδιαίτερη φύση των ιστοσελίδων. Χρησιμοποιήθηκε ένα σώμα ιστοσελίδων από το οποίο καθορίστηκαν οι θεματικές κατηγορίες που άνηκαν τα στοιχεία του, καθώς και από το οποίο ορίστηκε το υποσύνολο του πάνω στο οποίο εκπαιδεύτηκε το σύστημα. Τα πειράματα που έγιναν για την παρούσα εργασία χαρακτηρίζονται από το είδος των αλγορίθμων μηχανικής μάθησης που χρησιμοποιήθηκαν, των τεχνικών εξαγωγής των χαρακτηριστικών, του τρόπου ανάθεσης βαρών στους όρους και των τεχνικών μείωσης του χώρου των χαρακτηριστικών. Τέλος, επιλεγούμε την τεχνική αυτή ταξινόμησης που επιφέρει την μεγαλύτερη αποτελεσματικότητα στο σύστημα που αναπτύξαμε. 2015-11-17T10:32:46Z 2015-11-17T10:32:46Z 2008 https://vsmart.lib.aegean.gr/webopac/List.csp?SearchT1=%CE%9A%CF%89%CE%BD%CF%83%CF%84%CE%B1%CE%BD%CF%84%CE%BF%CF%85%CE%B4%CE%AC%CE%BA%CE%B7%CF%82%2C+%CE%9D%CE%B9%CE%BA%CF%8C%CE%BB%CE%B1%CE%BF%CF%82&Index1=Keywordsbib&Database=1&SearchMethod=Find_1&SearchTerm1=%CE%9A%CF%89%CE%BD%CF%83%CF%84%CE%B1%CE%BD%CF%84%CE%BF%CF%85%CE%B4%CE%AC%CE%BA%CE%B7%CF%82%2C+%CE%9D%CE%B9%CE%BA%CF%8C%CE%BB%CE%B1%CE%BF%CF%82&OpacLanguage=gre&Profile=Default&EncodedRequest=*84*D3*8B*A5mX*A4*E9Z*1Fd*03*A3*9B*AF*B9&EncodedQuery=*84*D3*8B*A5mX*A4*E9Z*1Fd*03*A3*9B*AF*B9&Source=SysQR&PageType=Start&PreviousList=RecordListFind&WebPageNr=1&NumberToRetrieve=50&WebAction=NewSearch&StartValue=0&RowRepeat=0&ExtraInfo=&SortIndex=Year&SortDirection=-1&Resource=&SavingIndicator=&RestrType=&RestrTerms=&RestrShowAll=&LinkToIndex= http://hdl.handle.net/11610/8925 el application/pdf Σάμος
spellingShingle Κατηγοριοποίηση
Categorization
Ιστοσελίδες
Sites
Αλγόριθμος
Algorithm
Machine learning
Web site development--Computer programs
Algorithms
Κωνσταντουδάκης, Νικόλαος
Κατηγοριοποίηση ιστοσελίδων με χρήση τεχνικών μηχανικής μάθησης
title Κατηγοριοποίηση ιστοσελίδων με χρήση τεχνικών μηχανικής μάθησης
title_full Κατηγοριοποίηση ιστοσελίδων με χρήση τεχνικών μηχανικής μάθησης
title_fullStr Κατηγοριοποίηση ιστοσελίδων με χρήση τεχνικών μηχανικής μάθησης
title_full_unstemmed Κατηγοριοποίηση ιστοσελίδων με χρήση τεχνικών μηχανικής μάθησης
title_short Κατηγοριοποίηση ιστοσελίδων με χρήση τεχνικών μηχανικής μάθησης
title_sort κατηγοριοποίηση ιστοσελίδων με χρήση τεχνικών μηχανικής μάθησης
topic Κατηγοριοποίηση
Categorization
Ιστοσελίδες
Sites
Αλγόριθμος
Algorithm
Machine learning
Web site development--Computer programs
Algorithms
url https://vsmart.lib.aegean.gr/webopac/List.csp?SearchT1=%CE%9A%CF%89%CE%BD%CF%83%CF%84%CE%B1%CE%BD%CF%84%CE%BF%CF%85%CE%B4%CE%AC%CE%BA%CE%B7%CF%82%2C+%CE%9D%CE%B9%CE%BA%CF%8C%CE%BB%CE%B1%CE%BF%CF%82&Index1=Keywordsbib&Database=1&SearchMethod=Find_1&SearchTerm1=%CE%9A%CF%89%CE%BD%CF%83%CF%84%CE%B1%CE%BD%CF%84%CE%BF%CF%85%CE%B4%CE%AC%CE%BA%CE%B7%CF%82%2C+%CE%9D%CE%B9%CE%BA%CF%8C%CE%BB%CE%B1%CE%BF%CF%82&OpacLanguage=gre&Profile=Default&EncodedRequest=*84*D3*8B*A5mX*A4*E9Z*1Fd*03*A3*9B*AF*B9&EncodedQuery=*84*D3*8B*A5mX*A4*E9Z*1Fd*03*A3*9B*AF*B9&Source=SysQR&PageType=Start&PreviousList=RecordListFind&WebPageNr=1&NumberToRetrieve=50&WebAction=NewSearch&StartValue=0&RowRepeat=0&ExtraInfo=&SortIndex=Year&SortDirection=-1&Resource=&SavingIndicator=&RestrType=&RestrTerms=&RestrShowAll=&LinkToIndex=
http://hdl.handle.net/11610/8925
work_keys_str_mv AT kōnstantoudakēsnikolaos katēgoriopoiēsēistoselidōnmechrēsētechnikōnmēchanikēsmathēsēs