Ανίχνευση λογοκλοπής σε κώδικα γλώσσας προγραμματισμού με τεχνικές ανάλυσης κειμένων και χρονοσειρών

Αντικείμενο της παρούσας διατριβής είναι η προσπάθεια εύρεσης λογοκλοπής σε πηγαίο κώδικα της ίδιας γλώσσας προγραμματισμού μέσω ενός ειδικά σχεδιασμένου εργαλείου διασυνδεδεμένου με ένα γραφικό περιβάλλον χρήστη φτιαγμένο σε Java. Πανεπιστήμια ή άλλα ιδρύματα τριτοβάθμιας εκπαίδευσης που προσφέ...

Πλήρης περιγραφή

Αποθηκεύτηκε σε:
Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Γκίκας, Αλέξιος - Παναγιώτης
Άλλοι συγγραφείς: Μαραγκουδάκης, Εμμανουήλ
Γλώσσα:el_GR
Δημοσίευση: 2022
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/11610/22766
Ετικέτες: Προσθήκη ετικέτας
Δεν υπάρχουν, Καταχωρήστε ετικέτα πρώτοι!
Περιγραφή
Περίληψη:Αντικείμενο της παρούσας διατριβής είναι η προσπάθεια εύρεσης λογοκλοπής σε πηγαίο κώδικα της ίδιας γλώσσας προγραμματισμού μέσω ενός ειδικά σχεδιασμένου εργαλείου διασυνδεδεμένου με ένα γραφικό περιβάλλον χρήστη φτιαγμένο σε Java. Πανεπιστήμια ή άλλα ιδρύματα τριτοβάθμιας εκπαίδευσης που προσφέρουν μαθήματα σε διαφορετικές γλώσσες προγραμματισμού και μπορούν να βρουν τη μέθοδο μας χρήσιμη για τον εντοπισμό πανομοιότυπων πηγαίων κωδίκων μεταξύ των μαθητών. Δεδομένου του υψηλού όγκου κειμένων (ο πηγαίος κώδικας στην περίπτωσή μας), δεν είναι εύκολο για έναν ανθρώπινο εξεταστή να αντιληφθεί με επιτυχία ένα πανομοιότυπο ή σχεδόν πανομοιότυπο κείμενο. Η προτεινόμενη μέθοδος μας χρησιμοποιεί την ίδια μεθοδολογία, που εφαρμόζεται και στην ανάλυση των χρονοσειρών προκειμένου να μπορέσει να εκτελέσει μια επιτυχημένη κατηγοριοποίηση και ανακάλυψη πανομοιότυπων κειμένων. Διάφοροι αλγόριθμοι που έχουν καλή απόδοση στην ανάλυση χρονοσειρών,(όπως SAX-VSM, DTW), χρησιμοποιήθηκαν ως βάση για τη μέθοδο μας. Τα αποτελέσματα αξιολογήθηκαν με απόδοση και συγκρίθηκαν με άλλες καθιερωμένες τεχνικές στην ανάλυση κειμένου. Η εφαρμογή μας μπορεί να αναγνωρίσει όχι μόνο τον ίδιο κώδικά, αλλά προσφέρει και γραφική απεικονίσει των τμημάτων που αναγνωρίστηκαν ως "πανομοιότυπα" με χρωμάτωση των μερών αυτών και επιστρέφει πληροφορίες σχετικά με το αν υπάρχουν συντακτικά λάθη ,που δεν επιτρέπει στον κώδικα να εκτελείτε σωστά. Όλα αυτά με γρήγορο αυτοματοποιημένο και αποδοτικό τρόπο.