Ανίχνευση λογοκλοπής σε κείμενα με χρήση αλγορίθμων ταιριάσματος βιολογικών ακολουθιών

Η λογοκλοπή κειμένων είτε αντιγράφωντας επί λέξη κομμάτια κειμένου, είτε παραφράζοντας κομμάτια από άλλα κείμενα, είναι ένα φαινόμενο που λαμβάνει τεράστιες διαστάσεις στις μέρες μας. Στην εποχή που το Web χρησιμοποιείται όλο και περισσότερο, και ο σημασιολογικός ιστός διευκολύνει την εύρεση σχετικώ...

Πλήρης περιγραφή

Αποθηκεύτηκε σε:
Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Κούρτης, Ιωάννης - Χρήστος
Άλλοι συγγραφείς: Σταματάτος, Ευστάθιος
Γλώσσα:Greek
Δημοσίευση: 2015
Θέματα:
Διαθέσιμο Online:https://vsmart.lib.aegean.gr/webopac/FullBB.csp?WebAction=ShowFullBB&EncodedRequest=*F9*5F*BE*CF*1D*5C*1C*89q*2D*08*11*2C*EA*D4*2E&Profile=Default&OpacLanguage=gre&NumberToRetrieve=50&StartValue=1&WebPageNr=1&SearchTerm1=2012%20.1.51060&SearchT1=&Index1=Keywordsbib&SearchMethod=Find_1&ItemNr=1
http://hdl.handle.net/11610/14760
Ετικέτες: Προσθήκη ετικέτας
Δεν υπάρχουν, Καταχωρήστε ετικέτα πρώτοι!
_version_ 1828462078403280896
author Κούρτης, Ιωάννης - Χρήστος
author2 Σταματάτος, Ευστάθιος
author_facet Σταματάτος, Ευστάθιος
Κούρτης, Ιωάννης - Χρήστος
author_sort Κούρτης, Ιωάννης - Χρήστος
collection DSpace
description Η λογοκλοπή κειμένων είτε αντιγράφωντας επί λέξη κομμάτια κειμένου, είτε παραφράζοντας κομμάτια από άλλα κείμενα, είναι ένα φαινόμενο που λαμβάνει τεράστιες διαστάσεις στις μέρες μας. Στην εποχή που το Web χρησιμοποιείται όλο και περισσότερο, και ο σημασιολογικός ιστός διευκολύνει την εύρεση σχετικών κειμένων στο διαδίκτυο, τα προβλήματα πνευματικής ιδιοκτησίας συνεχώς αυξάνονται και η εύρεση του πραγματικού συγγραφέα ενός κειμένου καθώς και η απόδειξη ότι τα έργα του δεν είναι αντιγραφή ή παραλλαγή κάποιων άλλων, κρίνεται επιτακτική. Στο κείμενο αυτό θα μελετήσουμε μία τεχνική full fingerprinting εύρεσης λογοκλοπής σε κείμενα χρησιμοποιώτας ένα αναγνωρισμένο corpus αρχείων που δημοσιεύτηκε το 2010 (PAN10). Η μελέτη μας αφορά περιπτώσεις “external plagiarism” όπου από μία συλλογή τοπικών κειμένων (source-documents) προσπαθούμε να βρούμε αν υπάρχουν σε ύποπτα κείμενα (suspicious-documents) περιπτώσεις λογοκλοπής, και να προσδιορίσουμε τα ακριβή όρια στα κείμενα αυτά., χρησιμοποιώντας τον αλγόριθμο Needleman-Wunsch, ένα αλγόριθμο ταιριάσματος βιολογικών ακολουθιών. Προτείνουμε μία καινοτόμο μέθοδο η οποία βασίζεται στα “stopword n-grams” τα οποία φαίνεται ότι μπορούν να βρούν συντακτικές ομοιότητες μεταξύ κειμένων ακόμα και αν τα κείμενα έχουν τροποποιηθεί πολύ, αντικάθιστώντας λέξεις με συνώνυμες ή άλλες φράσεις.
id oai:hellanicus.lib.aegean.gr:11610-14760
institution Hellanicus
language Greek
publishDate 2015
record_format dspace
spelling oai:hellanicus.lib.aegean.gr:11610-147602020-12-02T08:28:07Z Ανίχνευση λογοκλοπής σε κείμενα με χρήση αλγορίθμων ταιριάσματος βιολογικών ακολουθιών Κούρτης, Ιωάννης - Χρήστος Σταματάτος, Ευστάθιος Λογοκλοπή Ανίχνευση Συλλογή Βιοπληροφορική Βιολογία Αποτύπωμα External Plagiarism Stopword N grams Needleman Pairwise alignment Plagiarism--Detection Bioinformatics Η λογοκλοπή κειμένων είτε αντιγράφωντας επί λέξη κομμάτια κειμένου, είτε παραφράζοντας κομμάτια από άλλα κείμενα, είναι ένα φαινόμενο που λαμβάνει τεράστιες διαστάσεις στις μέρες μας. Στην εποχή που το Web χρησιμοποιείται όλο και περισσότερο, και ο σημασιολογικός ιστός διευκολύνει την εύρεση σχετικών κειμένων στο διαδίκτυο, τα προβλήματα πνευματικής ιδιοκτησίας συνεχώς αυξάνονται και η εύρεση του πραγματικού συγγραφέα ενός κειμένου καθώς και η απόδειξη ότι τα έργα του δεν είναι αντιγραφή ή παραλλαγή κάποιων άλλων, κρίνεται επιτακτική. Στο κείμενο αυτό θα μελετήσουμε μία τεχνική full fingerprinting εύρεσης λογοκλοπής σε κείμενα χρησιμοποιώτας ένα αναγνωρισμένο corpus αρχείων που δημοσιεύτηκε το 2010 (PAN10). Η μελέτη μας αφορά περιπτώσεις “external plagiarism” όπου από μία συλλογή τοπικών κειμένων (source-documents) προσπαθούμε να βρούμε αν υπάρχουν σε ύποπτα κείμενα (suspicious-documents) περιπτώσεις λογοκλοπής, και να προσδιορίσουμε τα ακριβή όρια στα κείμενα αυτά., χρησιμοποιώντας τον αλγόριθμο Needleman-Wunsch, ένα αλγόριθμο ταιριάσματος βιολογικών ακολουθιών. Προτείνουμε μία καινοτόμο μέθοδο η οποία βασίζεται στα “stopword n-grams” τα οποία φαίνεται ότι μπορούν να βρούν συντακτικές ομοιότητες μεταξύ κειμένων ακόμα και αν τα κείμενα έχουν τροποποιηθεί πολύ, αντικάθιστώντας λέξεις με συνώνυμες ή άλλες φράσεις. 2015-11-19T11:02:07Z 2015-11-19T11:02:07Z 2012 https://vsmart.lib.aegean.gr/webopac/FullBB.csp?WebAction=ShowFullBB&EncodedRequest=*F9*5F*BE*CF*1D*5C*1C*89q*2D*08*11*2C*EA*D4*2E&Profile=Default&OpacLanguage=gre&NumberToRetrieve=50&StartValue=1&WebPageNr=1&SearchTerm1=2012%20.1.51060&SearchT1=&Index1=Keywordsbib&SearchMethod=Find_1&ItemNr=1 http://hdl.handle.net/11610/14760 el Σάμος
spellingShingle Λογοκλοπή
Ανίχνευση
Συλλογή
Βιοπληροφορική
Βιολογία
Αποτύπωμα
External
Plagiarism
Stopword
N grams
Needleman
Pairwise alignment
Plagiarism--Detection
Bioinformatics
Κούρτης, Ιωάννης - Χρήστος
Ανίχνευση λογοκλοπής σε κείμενα με χρήση αλγορίθμων ταιριάσματος βιολογικών ακολουθιών
title Ανίχνευση λογοκλοπής σε κείμενα με χρήση αλγορίθμων ταιριάσματος βιολογικών ακολουθιών
title_full Ανίχνευση λογοκλοπής σε κείμενα με χρήση αλγορίθμων ταιριάσματος βιολογικών ακολουθιών
title_fullStr Ανίχνευση λογοκλοπής σε κείμενα με χρήση αλγορίθμων ταιριάσματος βιολογικών ακολουθιών
title_full_unstemmed Ανίχνευση λογοκλοπής σε κείμενα με χρήση αλγορίθμων ταιριάσματος βιολογικών ακολουθιών
title_short Ανίχνευση λογοκλοπής σε κείμενα με χρήση αλγορίθμων ταιριάσματος βιολογικών ακολουθιών
title_sort ανίχνευση λογοκλοπής σε κείμενα με χρήση αλγορίθμων ταιριάσματος βιολογικών ακολουθιών
topic Λογοκλοπή
Ανίχνευση
Συλλογή
Βιοπληροφορική
Βιολογία
Αποτύπωμα
External
Plagiarism
Stopword
N grams
Needleman
Pairwise alignment
Plagiarism--Detection
Bioinformatics
url https://vsmart.lib.aegean.gr/webopac/FullBB.csp?WebAction=ShowFullBB&EncodedRequest=*F9*5F*BE*CF*1D*5C*1C*89q*2D*08*11*2C*EA*D4*2E&Profile=Default&OpacLanguage=gre&NumberToRetrieve=50&StartValue=1&WebPageNr=1&SearchTerm1=2012%20.1.51060&SearchT1=&Index1=Keywordsbib&SearchMethod=Find_1&ItemNr=1
http://hdl.handle.net/11610/14760
work_keys_str_mv AT kourtēsiōannēschrēstos anichneusēlogoklopēssekeimenamechrēsēalgorithmōntairiasmatosbiologikōnakolouthiōn