Intrinsic plagiarism detection using clustering : μεταπτυχιακή διατριβή
Ένα από προβλήματα της σημερινής εποχής, στην οποία κυριαρχεί το Internet, είναι η λογοκλοπή.Η λογοκλοπή είναι η υιοθέτηση μέρους ή ολόκληρου του έργου των ιδεών ή των αντιλήψεων άλλων δημιουργών. Το κλεμμένο υλικό μπορεί να είναι αποσπάσματα από κείμενα , εικόνα , μουσική ακόμα και πηγαίος κώδικας....
Αποθηκεύτηκε σε:
| Κύριος συγγραφέας: | |
|---|---|
| Συγγραφή απο Οργανισμό/Αρχή: | |
| Μορφή: | Thesis Βιβλίο |
| Γλώσσα: | English |
| Δημοσίευση: |
2015.
|
| Θέματα: | |
| Διαθέσιμο Online: | http://hdl.handle.net/11610/12586 |
| Ετικέτες: |
Προσθήκη ετικέτας
Δεν υπάρχουν, Καταχωρήστε ετικέτα πρώτοι!
|
| Περίληψη: | Ένα από προβλήματα της σημερινής εποχής, στην οποία κυριαρχεί το Internet, είναι η λογοκλοπή.Η λογοκλοπή είναι η υιοθέτηση μέρους ή ολόκληρου του έργου των ιδεών ή των αντιλήψεων άλλων δημιουργών. Το κλεμμένο υλικό μπορεί να είναι αποσπάσματα από κείμενα , εικόνα , μουσική ακόμα και πηγαίος κώδικας. Αυτή η διπλωματική προσπαθεί να δώσει λύση στο πρόβλημα της ανίχνευσης λογοκλοπής κειμένων στην περίπτωση που δεν υπάρχουν βοηθητικές πήγες όπως π.χ. μια εξωτερική συλλογή κειμένων ή οι πηγές που έχει χρησιμοποιήσει ο συγγραφέας του ,υπό προς έξεταση για λογοκλοπή , κειμένου. Στην περίπτωση αυτή πρέπει να γίνει μια υφολογική ανάλυση του κειμένου ώστε να ποσοτικοποιηθεί το στυλ του συγγραφέα. Θεωρητικά τα εδάφια που περιέχουν λογοκλοπή θα έχουν διαφορετικό στυλ από τα αυθεντικά κομμάτια. Η παρούσα διπλωματική εργασία προτείνει έναν αλγόριθμοημι-επιβλεπόμενης συσταδόποιησης για την ανίχνευση των εδαφίων που περιέχουν λογοκλοπή. One of the most important problems in the present era - the Internet era - is plagiarism.Plagiarism can generally be defined as stealing someone else‘s ideas and passing them as one‘s own. The plagiarized material may be for example text , songs ,images or source code. Discovering plagiarized sections in a text can be difficult when a source reference corpora i.e. a collection of the original documents from whom the author might have copied these sections is not available. In this case a stylometric analysis must be performed on the document. It is likely that the plagiarized sections will differ in style in comparison to the entire document. In this thesis we propose a novel method that uses a semi-supervised clustering algorithm to detect the plagiarized sections. |
|---|---|
| Περιγραφή τεκμηρίου: | Μέλη της εξεταστικής επιτροπής: Σταματάτος Ευστάθιος, Καβαλιεράτου Εργίνα, Μαραγκουδάκης Εμμανουήλ. |
| Φυσική περιγραφή: | ii, 73 σ. : σχέδια, πιν. ; 30 εκ. |
| Πρόσβαση: | Διάθεση πλήρους κειμένου - Ελεύθερη πρόσβαση. |