Intrinsic plagiarism detection using clustering : μεταπτυχιακή διατριβή

Ένα από προβλήματα της σημερινής εποχής, στην οποία κυριαρχεί το Internet, είναι η λογοκλοπή.Η λογοκλοπή είναι η υιοθέτηση μέρους ή ολόκληρου του έργου των ιδεών ή των αντιλήψεων άλλων δημιουργών. Το κλεμμένο υλικό μπορεί να είναι αποσπάσματα από κείμενα , εικόνα , μουσική ακόμα και πηγαίος κώδικας....

Πλήρης περιγραφή

Αποθηκεύτηκε σε:
Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Κατάνιας, Ευάγγελος-Γεράσιμος
Συγγραφή απο Οργανισμό/Αρχή: Πανεπιστήμιο Αιγαίου. Σχολή Θετικών Επιστημών. Τμήμα Μηχανικών Πληροφοριακών και Επικοινωνιακών Συστημάτων. Π.Μ.Σ. Τεχνολογίες και Διοίκηση Πληροφοριακών και Επικοινωνιακών Συστημάτων
Μορφή: Thesis Βιβλίο
Γλώσσα:English
Δημοσίευση: 2015.
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/11610/12586
Ετικέτες: Προσθήκη ετικέτας
Δεν υπάρχουν, Καταχωρήστε ετικέτα πρώτοι!
Περιγραφή
Περίληψη:Ένα από προβλήματα της σημερινής εποχής, στην οποία κυριαρχεί το Internet, είναι η λογοκλοπή.Η λογοκλοπή είναι η υιοθέτηση μέρους ή ολόκληρου του έργου των ιδεών ή των αντιλήψεων άλλων δημιουργών. Το κλεμμένο υλικό μπορεί να είναι αποσπάσματα από κείμενα , εικόνα , μουσική ακόμα και πηγαίος κώδικας. Αυτή η διπλωματική προσπαθεί να δώσει λύση στο πρόβλημα της ανίχνευσης λογοκλοπής κειμένων στην περίπτωση που δεν υπάρχουν βοηθητικές πήγες όπως π.χ. μια εξωτερική συλλογή κειμένων ή οι πηγές που έχει χρησιμοποιήσει ο συγγραφέας του ,υπό προς έξεταση για λογοκλοπή , κειμένου. Στην περίπτωση αυτή πρέπει να γίνει μια υφολογική ανάλυση του κειμένου ώστε να ποσοτικοποιηθεί το στυλ του συγγραφέα. Θεωρητικά τα εδάφια που περιέχουν λογοκλοπή θα έχουν διαφορετικό στυλ από τα αυθεντικά κομμάτια. Η παρούσα διπλωματική εργασία προτείνει έναν αλγόριθμοημι-επιβλεπόμενης συσταδόποιησης για την ανίχνευση των εδαφίων που περιέχουν λογοκλοπή.
One of the most important problems in the present era - the Internet era - is plagiarism.Plagiarism can generally be defined as stealing someone else‘s ideas and passing them as one‘s own. The plagiarized material may be for example text , songs ,images or source code. Discovering plagiarized sections in a text can be difficult when a source reference corpora i.e. a collection of the original documents from whom the author might have copied these sections is not available. In this case a stylometric analysis must be performed on the document. It is likely that the plagiarized sections will differ in style in comparison to the entire document. In this thesis we propose a novel method that uses a semi-supervised clustering algorithm to detect the plagiarized sections.
Περιγραφή τεκμηρίου:Μέλη της εξεταστικής επιτροπής: Σταματάτος Ευστάθιος, Καβαλιεράτου Εργίνα, Μαραγκουδάκης Εμμανουήλ.
Φυσική περιγραφή:ii, 73 σ. : σχέδια, πιν. ; 30 εκ.
Πρόσβαση:Διάθεση πλήρους κειμένου - Ελεύθερη πρόσβαση.