| _version_ |
1828461052863447040
|
| author |
Κατάνιας, Ευάγγελος-Γεράσιμος - Αντώνιος
|
| author2 |
Σταματάτος, Ευστάθιος
|
| author_facet |
Σταματάτος, Ευστάθιος
Κατάνιας, Ευάγγελος-Γεράσιμος - Αντώνιος
|
| author_sort |
Κατάνιας, Ευάγγελος-Γεράσιμος - Αντώνιος
|
| collection |
DSpace
|
| description |
Ένα από προβλήματα της σημερινής εποχής, στην οποία κυριαρχεί το Internet, είναι η λογοκλοπή.Η λογοκλοπή είναι η υιοθέτηση μέρους ή ολόκληρου του έργου των ιδεών ή των αντιλήψεων άλλων δημιουργών.Το κλεμμενο υλικό μπορεί να είναι αποσπάσματα από κείμενα , εικόνα , μουσική ακόμα και πηγαίος κώδικας.Αυτή η διπλωματική προσπαθεί να δώσει λύση στο πρόβλημα της ανίχνευσης λογοκλοπής κειμένων στην περίπτωσηπου δεν υπάρχουν βοηθητικές πήγες όπως π.χ. μια εξωτερική συλλογή κειμένων ή οι πηγές που έχει χρησιμοποιήσειο συγγραφέας του ,υπό προς έξεταση για λογοκλοπή , κειμένου. Στην περίπτωση αυτή πρέπει να γίνει μια υφολογική ανάλυση του κειμένου ώστε να ποσοτικοποιηθεί το στυλ του συγγραφέα. Θεωρητικά τα εδάφια που περιέχουν λογοκλοπή θα έχουν διαφορετικό στυλ από τα αυθεντικά κομμάτια. Η παρούσα διπλωματική εργασία προτείνει έναν αλγόριθμοημι-επιβλεπόμενης συσταδόποιησης για την ανίχνευση των εδαφίων που περιέχουν λογοκλοπή
|
| id |
oai:hellanicus.lib.aegean.gr:11610-12586
|
| institution |
Hellanicus
|
| language |
English
|
| publishDate |
2015
|
| record_format |
dspace
|
| spelling |
oai:hellanicus.lib.aegean.gr:11610-125862020-12-02T13:03:41Z Intrinsic plagiarism detection using clustering Κατάνιας, Ευάγγελος-Γεράσιμος - Αντώνιος Σταματάτος, Ευστάθιος Λογοκλοπή Συσταδoποίηση Ημι-επιβλεπόμενη Ύφος Plagiarism Stylometry Clustering Supervised Semi Plagiarism--Detection Document clustering Ένα από προβλήματα της σημερινής εποχής, στην οποία κυριαρχεί το Internet, είναι η λογοκλοπή.Η λογοκλοπή είναι η υιοθέτηση μέρους ή ολόκληρου του έργου των ιδεών ή των αντιλήψεων άλλων δημιουργών.Το κλεμμενο υλικό μπορεί να είναι αποσπάσματα από κείμενα , εικόνα , μουσική ακόμα και πηγαίος κώδικας.Αυτή η διπλωματική προσπαθεί να δώσει λύση στο πρόβλημα της ανίχνευσης λογοκλοπής κειμένων στην περίπτωσηπου δεν υπάρχουν βοηθητικές πήγες όπως π.χ. μια εξωτερική συλλογή κειμένων ή οι πηγές που έχει χρησιμοποιήσειο συγγραφέας του ,υπό προς έξεταση για λογοκλοπή , κειμένου. Στην περίπτωση αυτή πρέπει να γίνει μια υφολογική ανάλυση του κειμένου ώστε να ποσοτικοποιηθεί το στυλ του συγγραφέα. Θεωρητικά τα εδάφια που περιέχουν λογοκλοπή θα έχουν διαφορετικό στυλ από τα αυθεντικά κομμάτια. Η παρούσα διπλωματική εργασία προτείνει έναν αλγόριθμοημι-επιβλεπόμενης συσταδόποιησης για την ανίχνευση των εδαφίων που περιέχουν λογοκλοπή One of the most important problems in the present era - the Internet era - is plagiarism.Plagiarism can generally be defined as stealing someone else‘s ideas and passing them as one‘s own. The plagiarized material may be for example text , songs ,images or source code. Discovering plagiarized sections in a text can be difficult when a source reference corpora i.e. a collection of the original documents from whom the author might have copied these sections is not available. In this case a stylometric analysis must be performed on the document. It is likely that the plagiarized sections will differ in style in comparison to the entire document. In this thesis we propose a novel method that uses a semi-supervised clustering algorithm to detect the plagiarized sections. 2015-11-18T10:40:01Z 2015-11-18T10:40:01Z 2014 https://vsmart.lib.aegean.gr/webopac/List.csp?SearchT1=%CE%9A%CE%B1%CF%84%CE%AC%CE%BD%CE%B9%CE%B1%CF%82%2C&Index1=Keywordsbib&Database=1&SearchMethod=Find_1&SearchTerm1=%CE%9A%CE%B1%CF%84%CE%AC%CE%BD%CE%B9%CE%B1%CF%82%2C&OpacLanguage=gre&Profile=Default&EncodedRequest=S*B0*A5*D3*C9*5B*EB*15*ACFh*E3*0D*EC*0F*5D&EncodedQuery=S*B0*A5*D3*C9*5B*EB*15*ACFh*E3*0D*EC*0F*5D&Source=SysQR&PageType=Start&PreviousList=Level1&WebPageNr=1&NumberToRetrieve=50&WebAction=NewSearch&StartValue=0&RowRepeat=0&ExtraInfo=&SortIndex=Year&SortDirection=-1&Resource=&SavingIndicator=&RestrType=&RestrTerms=&RestrShowAll=&LinkToIndex= http://hdl.handle.net/11610/12586 en Σάμος
|
| spellingShingle |
Λογοκλοπή
Συσταδoποίηση
Ημι-επιβλεπόμενη
Ύφος
Plagiarism
Stylometry
Clustering
Supervised
Semi
Plagiarism--Detection
Document clustering
Κατάνιας, Ευάγγελος-Γεράσιμος - Αντώνιος
Intrinsic plagiarism detection using clustering
|
| title |
Intrinsic plagiarism detection using clustering
|
| title_full |
Intrinsic plagiarism detection using clustering
|
| title_fullStr |
Intrinsic plagiarism detection using clustering
|
| title_full_unstemmed |
Intrinsic plagiarism detection using clustering
|
| title_short |
Intrinsic plagiarism detection using clustering
|
| title_sort |
intrinsic plagiarism detection using clustering
|
| topic |
Λογοκλοπή
Συσταδoποίηση
Ημι-επιβλεπόμενη
Ύφος
Plagiarism
Stylometry
Clustering
Supervised
Semi
Plagiarism--Detection
Document clustering
|
| url |
https://vsmart.lib.aegean.gr/webopac/List.csp?SearchT1=%CE%9A%CE%B1%CF%84%CE%AC%CE%BD%CE%B9%CE%B1%CF%82%2C&Index1=Keywordsbib&Database=1&SearchMethod=Find_1&SearchTerm1=%CE%9A%CE%B1%CF%84%CE%AC%CE%BD%CE%B9%CE%B1%CF%82%2C&OpacLanguage=gre&Profile=Default&EncodedRequest=S*B0*A5*D3*C9*5B*EB*15*ACFh*E3*0D*EC*0F*5D&EncodedQuery=S*B0*A5*D3*C9*5B*EB*15*ACFh*E3*0D*EC*0F*5D&Source=SysQR&PageType=Start&PreviousList=Level1&WebPageNr=1&NumberToRetrieve=50&WebAction=NewSearch&StartValue=0&RowRepeat=0&ExtraInfo=&SortIndex=Year&SortDirection=-1&Resource=&SavingIndicator=&RestrType=&RestrTerms=&RestrShowAll=&LinkToIndex=
http://hdl.handle.net/11610/12586
|
| work_keys_str_mv |
AT kataniaseuangelosgerasimosantōnios intrinsicplagiarismdetectionusingclustering
|