Intrinsic plagiarism detection using clustering : μεταπτυχιακή διατριβή

Ένα από προβλήματα της σημερινής εποχής, στην οποία κυριαρχεί το Internet, είναι η λογοκλοπή.Η λογοκλοπή είναι η υιοθέτηση μέρους ή ολόκληρου του έργου των ιδεών ή των αντιλήψεων άλλων δημιουργών. Το κλεμμένο υλικό μπορεί να είναι αποσπάσματα από κείμενα , εικόνα , μουσική ακόμα και πηγαίος κώδικας....

Full description

Saved in:
Bibliographic Details
Main Author: Κατάνιας, Ευάγγελος-Γεράσιμος
Corporate Author: Πανεπιστήμιο Αιγαίου. Σχολή Θετικών Επιστημών. Τμήμα Μηχανικών Πληροφοριακών και Επικοινωνιακών Συστημάτων. Π.Μ.Σ. Τεχνολογίες και Διοίκηση Πληροφοριακών και Επικοινωνιακών Συστημάτων
Format: Thesis Book
Language:English
Published: 2015.
Subjects:
Online Access:http://hdl.handle.net/11610/12586
Tags: Add Tag
No Tags, Be the first to tag this record!

MARC

LEADER 00000cam a2200000 a 4500
001 1/112480
008 161205s2014####gr | ||| |||| ||eng||
040 |a GR-MyUa  |b gre  |c GR-MyUa  |e AACR2 
041 0 |a eng 
082 7 |a 808.0250285   |2 (23)  
100 1 |a Κατάνιας, Ευάγγελος-Γεράσιμος. 
245 1 0 |a Intrinsic plagiarism detection using clustering :   |b μεταπτυχιακή διατριβή /   |c Evangelos-Gerasimos Katanias ; supervisor Efstathios Stamatatos.  
260 |c 2015.  
300 |a ii, 73 σ. :   |b σχέδια, πιν. ;   |c 30 εκ.  
500 |a Μέλη της εξεταστικής επιτροπής: Σταματάτος Ευστάθιος, Καβαλιεράτου Εργίνα, Μαραγκουδάκης Εμμανουήλ.  
502 |a Διατριβή (μεταπτυχιακή) - Πανεπιστήμιο Αιγαίου, Σάμος, 2015.  
506 0 |a Διάθεση πλήρους κειμένου - Ελεύθερη πρόσβαση.  
520 8 |a Ένα από προβλήματα της σημερινής εποχής, στην οποία κυριαρχεί το Internet, είναι η λογοκλοπή.Η λογοκλοπή είναι η υιοθέτηση μέρους ή ολόκληρου του έργου των ιδεών ή των αντιλήψεων άλλων δημιουργών. Το κλεμμένο υλικό μπορεί να είναι αποσπάσματα από κείμενα , εικόνα , μουσική ακόμα και πηγαίος κώδικας. Αυτή η διπλωματική προσπαθεί να δώσει λύση στο πρόβλημα της ανίχνευσης λογοκλοπής κειμένων στην περίπτωση που δεν υπάρχουν βοηθητικές πήγες όπως π.χ. μια εξωτερική συλλογή κειμένων ή οι πηγές που έχει χρησιμοποιήσει ο συγγραφέας του ,υπό προς έξεταση για λογοκλοπή , κειμένου. Στην περίπτωση αυτή πρέπει να γίνει μια υφολογική ανάλυση του κειμένου ώστε να ποσοτικοποιηθεί το στυλ του συγγραφέα. Θεωρητικά τα εδάφια που περιέχουν λογοκλοπή θα έχουν διαφορετικό στυλ από τα αυθεντικά κομμάτια. Η παρούσα διπλωματική εργασία προτείνει έναν αλγόριθμοημι-επιβλεπόμενης συσταδόποιησης για την ανίχνευση των εδαφίων που περιέχουν λογοκλοπή.  
520 8 |a One of the most important problems in the present era - the Internet era - is plagiarism.Plagiarism can generally be defined as stealing someone else‘s ideas and passing them as one‘s own. The plagiarized material may be for example text , songs ,images or source code. Discovering plagiarized sections in a text can be difficult when a source reference corpora i.e. a collection of the original documents from whom the author might have copied these sections is not available. In this case a stylometric analysis must be performed on the document. It is likely that the plagiarized sections will differ in style in comparison to the entire document. In this thesis we propose a novel method that uses a semi-supervised clustering algorithm to detect the plagiarized sections.  
540 |a Κλειδωμένη η δυνατότητα αντιγραφής (copy) κειμένου.  
650 0 |a Plagiarism  |x Detection. 
650 0 |a Document clustering. 
650 0 |a Dissertations, Academic  |z Greece. 
700 1 |a Σταματάτος, Ευστάθιος,  |e dgs 
710 2 |a Πανεπιστήμιο Αιγαίου.   |b Σχολή Θετικών Επιστημών.   |b Τμήμα Μηχανικών Πληροφοριακών και Επικοινωνιακών Συστημάτων.   |b Π.Μ.Σ. Τεχνολογίες και Διοίκηση Πληροφοριακών και Επικοινωνιακών Συστημάτων. 
852 |a INST  |b SAMOS  |c DIATR  |e 20161205  |h 808.0250285 ΚΑΤ  |p 005300044010  |q 005300044010  |t MTXE  |y 23 
852 |a INST  |b SAMOS  |c DIATR  |e 20161205  |h 808.0250285 ΚΑΤ  |p 005300044011  |q 005300044011  |t MTXE  |y 23 
856 |u http://hdl.handle.net/11610/12586 
924 |a Κατάνιας  |b Ευάγγελος-Γεράσιμος  |y Σάμος  |z 2015-11 
970 |a Κοσιέρης  |b Χρήστος  |z 05-12-2016