Ανίχνευση λογοκλοπής σε κείμενα με χρήση αλγορίθμων ταιριάσματος βιολογικών ακολουθιών : μεταπτυχιακή εργασία

Η λογοκλοπή κειμένων είτε αντιγράφωντας επί λέξη κομμάτια κειμένου, είτε παραφράζοντας κομμάτια από άλλα κείμενα, είναι ένα φαινόμενο που λαμβάνει τεράστιες διαστάσεις στις μέρες μας. Στην εποχή που το Web χρησιμοποιείται όλο και περισσότερο, και ο σημασιολογικός ιστός διευκολύνει την εύρεση σχετικώ...

Πλήρης περιγραφή

Αποθηκεύτηκε σε:
Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Κούρτης, Ιωάννης
Συγγραφή απο Οργανισμό/Αρχή: Πανεπιστήμιο Αιγαίου. Σχολή Θετικών Επιστημών. Τμήμα Μηχανικών Πληροφοριακών και Επικοινωνιακών Συστημάτων. Π.Μ.Σ. Τεχνολογίες και Διοίκηση Πληροφοριακών και Επικοινωνιακών Συστημάτων
Μορφή: Thesis Βιβλίο
Γλώσσα:Greek
Δημοσίευση: 2012.
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/11610/14760
Ετικέτες: Προσθήκη ετικέτας
Δεν υπάρχουν, Καταχωρήστε ετικέτα πρώτοι!
Περιγραφή
Περίληψη:Η λογοκλοπή κειμένων είτε αντιγράφωντας επί λέξη κομμάτια κειμένου, είτε παραφράζοντας κομμάτια από άλλα κείμενα, είναι ένα φαινόμενο που λαμβάνει τεράστιες διαστάσεις στις μέρες μας. Στην εποχή που το Web χρησιμοποιείται όλο και περισσότερο, και ο σημασιολογικός ιστός διευκολύνει την εύρεση σχετικών κειμένων στο διαδίκτυο, τα προβλήματα πνευματικής ιδιοκτησίας συνεχώς αυξάνονται και η εύρεση του πραγματικού συγγραφέα ενός κειμένου καθώς και η απόδειξη ότι τα έργα του δεν είναι αντιγραφή ή παραλλαγή κάποιων άλλων, κρίνεται επιτακτική. Στο κείμενο αυτό θα μελετήσουμε μία τεχνική full fingerprinting εύρεσης λογοκλοπής σε κείμενα χρησιμοποιώτας ένα αναγνωρισμένο corpus αρχείων που δημοσιεύτηκε το 2010 (PAN10). Η μελέτη μας αφορά περιπτώσεις external plagiarism όπου από μία συλλογή τοπικών κειμένων (source-documents) προσπαθούμε να βρούμε αν υπάρχουν σε ύποπτα κείμενα (suspicious-documents) περιπτώσεις λογοκλοπής, και να προσδιορίσουμε τα ακριβή όρια στα κείμενα αυτά., χρησιμοποιώντας τον αλγόριθμο Needleman-Wunsch, ένα αλγόριθμο ταιριάσματος βιολογικών ακολουθιών. Προτείνουμε μία καινοτόμο μέθοδο η οποία βασίζεται στα stopword n-grams τα οποία φαίνεται ότι μπορούν να βρούν συντακτικές ομοιότητες μεταξύ κειμένων ακόμα και αν τα κείμενα έχουν τροποποιηθεί πολύ, αντικάθιστώντας λέξεις με συνώνυμες ή άλλες φράσεις.
Περιγραφή τεκμηρίου:Μέλη της εξεταστικής επιτροπής: Σταματάτος Ευστάθιος, Εργίνα Καβαλλιεράτου, Μαραγκουδάκης Εμμανουήλ.
Φυσική περιγραφή:80 σ. : σχέδια, πιν. ; 30 εκ.
Βιβλιογραφία:Βιβλιογραφία: σ. 75-78.
Πρόσβαση:Διάθεση πλήρους κειμένου - Ελεύθερη πρόσβαση.