Ανίχνευση λογοκλοπής σε κείμενα με χρήση αλγορίθμων ταιριάσματος βιολογικών ακολουθιών : μεταπτυχιακή εργασία

Η λογοκλοπή κειμένων είτε αντιγράφωντας επί λέξη κομμάτια κειμένου, είτε παραφράζοντας κομμάτια από άλλα κείμενα, είναι ένα φαινόμενο που λαμβάνει τεράστιες διαστάσεις στις μέρες μας. Στην εποχή που το Web χρησιμοποιείται όλο και περισσότερο, και ο σημασιολογικός ιστός διευκολύνει την εύρεση σχετικώ...

Full description

Saved in:
Bibliographic Details
Main Author: Κούρτης, Ιωάννης
Corporate Author: Πανεπιστήμιο Αιγαίου. Σχολή Θετικών Επιστημών. Τμήμα Μηχανικών Πληροφοριακών και Επικοινωνιακών Συστημάτων. Π.Μ.Σ. Τεχνολογίες και Διοίκηση Πληροφοριακών και Επικοινωνιακών Συστημάτων
Format: Thesis Book
Language:Greek
Published: 2012.
Subjects:
Online Access:http://hdl.handle.net/11610/14760
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:Η λογοκλοπή κειμένων είτε αντιγράφωντας επί λέξη κομμάτια κειμένου, είτε παραφράζοντας κομμάτια από άλλα κείμενα, είναι ένα φαινόμενο που λαμβάνει τεράστιες διαστάσεις στις μέρες μας. Στην εποχή που το Web χρησιμοποιείται όλο και περισσότερο, και ο σημασιολογικός ιστός διευκολύνει την εύρεση σχετικών κειμένων στο διαδίκτυο, τα προβλήματα πνευματικής ιδιοκτησίας συνεχώς αυξάνονται και η εύρεση του πραγματικού συγγραφέα ενός κειμένου καθώς και η απόδειξη ότι τα έργα του δεν είναι αντιγραφή ή παραλλαγή κάποιων άλλων, κρίνεται επιτακτική. Στο κείμενο αυτό θα μελετήσουμε μία τεχνική full fingerprinting εύρεσης λογοκλοπής σε κείμενα χρησιμοποιώτας ένα αναγνωρισμένο corpus αρχείων που δημοσιεύτηκε το 2010 (PAN10). Η μελέτη μας αφορά περιπτώσεις external plagiarism όπου από μία συλλογή τοπικών κειμένων (source-documents) προσπαθούμε να βρούμε αν υπάρχουν σε ύποπτα κείμενα (suspicious-documents) περιπτώσεις λογοκλοπής, και να προσδιορίσουμε τα ακριβή όρια στα κείμενα αυτά., χρησιμοποιώντας τον αλγόριθμο Needleman-Wunsch, ένα αλγόριθμο ταιριάσματος βιολογικών ακολουθιών. Προτείνουμε μία καινοτόμο μέθοδο η οποία βασίζεται στα stopword n-grams τα οποία φαίνεται ότι μπορούν να βρούν συντακτικές ομοιότητες μεταξύ κειμένων ακόμα και αν τα κείμενα έχουν τροποποιηθεί πολύ, αντικάθιστώντας λέξεις με συνώνυμες ή άλλες φράσεις.
Item Description:Μέλη της εξεταστικής επιτροπής: Σταματάτος Ευστάθιος, Εργίνα Καβαλλιεράτου, Μαραγκουδάκης Εμμανουήλ.
Physical Description:80 σ. : σχέδια, πιν. ; 30 εκ.
Bibliography:Βιβλιογραφία: σ. 75-78.
Access:Διάθεση πλήρους κειμένου - Ελεύθερη πρόσβαση.