Intrinsic plagiarism detection using clustering

Ένα από προβλήματα της σημερινής εποχής, στην οποία κυριαρχεί το Internet, είναι η λογοκλοπή.Η λογοκλοπή είναι η υιοθέτηση μέρους ή ολόκληρου του έργου των ιδεών ή των αντιλήψεων άλλων δημιουργών.Το κλεμμενο υλικό μπορεί να είναι αποσπάσματα από κείμενα , εικόνα , μουσική ακόμα και πηγαίος κώδικας.Α...

Πλήρης περιγραφή

Αποθηκεύτηκε σε:
Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Κατάνιας, Ευάγγελος-Γεράσιμος - Αντώνιος
Άλλοι συγγραφείς: Σταματάτος, Ευστάθιος
Γλώσσα:English
Δημοσίευση: 2015
Θέματα:
Διαθέσιμο Online:https://vsmart.lib.aegean.gr/webopac/List.csp?SearchT1=%CE%9A%CE%B1%CF%84%CE%AC%CE%BD%CE%B9%CE%B1%CF%82%2C&Index1=Keywordsbib&Database=1&SearchMethod=Find_1&SearchTerm1=%CE%9A%CE%B1%CF%84%CE%AC%CE%BD%CE%B9%CE%B1%CF%82%2C&OpacLanguage=gre&Profile=Default&EncodedRequest=S*B0*A5*D3*C9*5B*EB*15*ACFh*E3*0D*EC*0F*5D&EncodedQuery=S*B0*A5*D3*C9*5B*EB*15*ACFh*E3*0D*EC*0F*5D&Source=SysQR&PageType=Start&PreviousList=Level1&WebPageNr=1&NumberToRetrieve=50&WebAction=NewSearch&StartValue=0&RowRepeat=0&ExtraInfo=&SortIndex=Year&SortDirection=-1&Resource=&SavingIndicator=&RestrType=&RestrTerms=&RestrShowAll=&LinkToIndex=
http://hdl.handle.net/11610/12586
Ετικέτες: Προσθήκη ετικέτας
Δεν υπάρχουν, Καταχωρήστε ετικέτα πρώτοι!
_version_ 1828461052863447040
author Κατάνιας, Ευάγγελος-Γεράσιμος - Αντώνιος
author2 Σταματάτος, Ευστάθιος
author_facet Σταματάτος, Ευστάθιος
Κατάνιας, Ευάγγελος-Γεράσιμος - Αντώνιος
author_sort Κατάνιας, Ευάγγελος-Γεράσιμος - Αντώνιος
collection DSpace
description Ένα από προβλήματα της σημερινής εποχής, στην οποία κυριαρχεί το Internet, είναι η λογοκλοπή.Η λογοκλοπή είναι η υιοθέτηση μέρους ή ολόκληρου του έργου των ιδεών ή των αντιλήψεων άλλων δημιουργών.Το κλεμμενο υλικό μπορεί να είναι αποσπάσματα από κείμενα , εικόνα , μουσική ακόμα και πηγαίος κώδικας.Αυτή η διπλωματική προσπαθεί να δώσει λύση στο πρόβλημα της ανίχνευσης λογοκλοπής κειμένων στην περίπτωσηπου δεν υπάρχουν βοηθητικές πήγες όπως π.χ. μια εξωτερική συλλογή κειμένων ή οι πηγές που έχει χρησιμοποιήσειο συγγραφέας του ,υπό προς έξεταση για λογοκλοπή , κειμένου. Στην περίπτωση αυτή πρέπει να γίνει μια υφολογική ανάλυση του κειμένου ώστε να ποσοτικοποιηθεί το στυλ του συγγραφέα. Θεωρητικά τα εδάφια που περιέχουν λογοκλοπή θα έχουν διαφορετικό στυλ από τα αυθεντικά κομμάτια. Η παρούσα διπλωματική εργασία προτείνει έναν αλγόριθμοημι-επιβλεπόμενης συσταδόποιησης για την ανίχνευση των εδαφίων που περιέχουν λογοκλοπή
id oai:hellanicus.lib.aegean.gr:11610-12586
institution Hellanicus
language English
publishDate 2015
record_format dspace
spelling oai:hellanicus.lib.aegean.gr:11610-125862020-12-02T13:03:41Z Intrinsic plagiarism detection using clustering Κατάνιας, Ευάγγελος-Γεράσιμος - Αντώνιος Σταματάτος, Ευστάθιος Λογοκλοπή Συσταδoποίηση Ημι-επιβλεπόμενη Ύφος Plagiarism Stylometry Clustering Supervised Semi Plagiarism--Detection Document clustering Ένα από προβλήματα της σημερινής εποχής, στην οποία κυριαρχεί το Internet, είναι η λογοκλοπή.Η λογοκλοπή είναι η υιοθέτηση μέρους ή ολόκληρου του έργου των ιδεών ή των αντιλήψεων άλλων δημιουργών.Το κλεμμενο υλικό μπορεί να είναι αποσπάσματα από κείμενα , εικόνα , μουσική ακόμα και πηγαίος κώδικας.Αυτή η διπλωματική προσπαθεί να δώσει λύση στο πρόβλημα της ανίχνευσης λογοκλοπής κειμένων στην περίπτωσηπου δεν υπάρχουν βοηθητικές πήγες όπως π.χ. μια εξωτερική συλλογή κειμένων ή οι πηγές που έχει χρησιμοποιήσειο συγγραφέας του ,υπό προς έξεταση για λογοκλοπή , κειμένου. Στην περίπτωση αυτή πρέπει να γίνει μια υφολογική ανάλυση του κειμένου ώστε να ποσοτικοποιηθεί το στυλ του συγγραφέα. Θεωρητικά τα εδάφια που περιέχουν λογοκλοπή θα έχουν διαφορετικό στυλ από τα αυθεντικά κομμάτια. Η παρούσα διπλωματική εργασία προτείνει έναν αλγόριθμοημι-επιβλεπόμενης συσταδόποιησης για την ανίχνευση των εδαφίων που περιέχουν λογοκλοπή One of the most important problems in the present era - the Internet era - is plagiarism.Plagiarism can generally be defined as stealing someone else‘s ideas and passing them as one‘s own. The plagiarized material may be for example text , songs ,images or source code. Discovering plagiarized sections in a text can be difficult when a source reference corpora i.e. a collection of the original documents from whom the author might have copied these sections is not available. In this case a stylometric analysis must be performed on the document. It is likely that the plagiarized sections will differ in style in comparison to the entire document. In this thesis we propose a novel method that uses a semi-supervised clustering algorithm to detect the plagiarized sections. 2015-11-18T10:40:01Z 2015-11-18T10:40:01Z 2014 https://vsmart.lib.aegean.gr/webopac/List.csp?SearchT1=%CE%9A%CE%B1%CF%84%CE%AC%CE%BD%CE%B9%CE%B1%CF%82%2C&Index1=Keywordsbib&Database=1&SearchMethod=Find_1&SearchTerm1=%CE%9A%CE%B1%CF%84%CE%AC%CE%BD%CE%B9%CE%B1%CF%82%2C&OpacLanguage=gre&Profile=Default&EncodedRequest=S*B0*A5*D3*C9*5B*EB*15*ACFh*E3*0D*EC*0F*5D&EncodedQuery=S*B0*A5*D3*C9*5B*EB*15*ACFh*E3*0D*EC*0F*5D&Source=SysQR&PageType=Start&PreviousList=Level1&WebPageNr=1&NumberToRetrieve=50&WebAction=NewSearch&StartValue=0&RowRepeat=0&ExtraInfo=&SortIndex=Year&SortDirection=-1&Resource=&SavingIndicator=&RestrType=&RestrTerms=&RestrShowAll=&LinkToIndex= http://hdl.handle.net/11610/12586 en Σάμος
spellingShingle Λογοκλοπή
Συσταδoποίηση
Ημι-επιβλεπόμενη
Ύφος
Plagiarism
Stylometry
Clustering
Supervised
Semi
Plagiarism--Detection
Document clustering
Κατάνιας, Ευάγγελος-Γεράσιμος - Αντώνιος
Intrinsic plagiarism detection using clustering
title Intrinsic plagiarism detection using clustering
title_full Intrinsic plagiarism detection using clustering
title_fullStr Intrinsic plagiarism detection using clustering
title_full_unstemmed Intrinsic plagiarism detection using clustering
title_short Intrinsic plagiarism detection using clustering
title_sort intrinsic plagiarism detection using clustering
topic Λογοκλοπή
Συσταδoποίηση
Ημι-επιβλεπόμενη
Ύφος
Plagiarism
Stylometry
Clustering
Supervised
Semi
Plagiarism--Detection
Document clustering
url https://vsmart.lib.aegean.gr/webopac/List.csp?SearchT1=%CE%9A%CE%B1%CF%84%CE%AC%CE%BD%CE%B9%CE%B1%CF%82%2C&Index1=Keywordsbib&Database=1&SearchMethod=Find_1&SearchTerm1=%CE%9A%CE%B1%CF%84%CE%AC%CE%BD%CE%B9%CE%B1%CF%82%2C&OpacLanguage=gre&Profile=Default&EncodedRequest=S*B0*A5*D3*C9*5B*EB*15*ACFh*E3*0D*EC*0F*5D&EncodedQuery=S*B0*A5*D3*C9*5B*EB*15*ACFh*E3*0D*EC*0F*5D&Source=SysQR&PageType=Start&PreviousList=Level1&WebPageNr=1&NumberToRetrieve=50&WebAction=NewSearch&StartValue=0&RowRepeat=0&ExtraInfo=&SortIndex=Year&SortDirection=-1&Resource=&SavingIndicator=&RestrType=&RestrTerms=&RestrShowAll=&LinkToIndex=
http://hdl.handle.net/11610/12586
work_keys_str_mv AT kataniaseuangelosgerasimosantōnios intrinsicplagiarismdetectionusingclustering