| _version_ |
1828460272173449216
|
| author |
Γκίκας, Αλέξιος - Παναγιώτης
|
| author2 |
Μαραγκουδάκης, Εμμανουήλ
|
| author_facet |
Μαραγκουδάκης, Εμμανουήλ
Γκίκας, Αλέξιος - Παναγιώτης
|
| author_sort |
Γκίκας, Αλέξιος - Παναγιώτης
|
| collection |
DSpace
|
| description |
Αντικείμενο της παρούσας διατριβής είναι η προσπάθεια εύρεσης λογοκλοπής σε πηγαίο κώδικα της ίδιας γλώσσας προγραμματισμού μέσω ενός ειδικά σχεδιασμένου εργαλείου διασυνδεδεμένου με ένα γραφικό περιβάλλον χρήστη φτιαγμένο σε Java. Πανεπιστήμια ή άλλα ιδρύματα τριτοβάθμιας εκπαίδευσης που προσφέρουν μαθήματα σε διαφορετικές γλώσσες προγραμματισμού και μπορούν να βρουν τη μέθοδο μας χρήσιμη για τον εντοπισμό πανομοιότυπων πηγαίων κωδίκων μεταξύ των μαθητών. Δεδομένου του υψηλού όγκου κειμένων (ο πηγαίος κώδικας στην περίπτωσή μας), δεν είναι εύκολο για έναν ανθρώπινο εξεταστή να αντιληφθεί με επιτυχία ένα πανομοιότυπο ή σχεδόν πανομοιότυπο κείμενο. Η προτεινόμενη μέθοδος μας χρησιμοποιεί την ίδια μεθοδολογία, που εφαρμόζεται και στην ανάλυση των χρονοσειρών προκειμένου να μπορέσει να εκτελέσει μια επιτυχημένη κατηγοριοποίηση και ανακάλυψη πανομοιότυπων κειμένων. Διάφοροι αλγόριθμοι που έχουν καλή απόδοση στην ανάλυση χρονοσειρών,(όπως SAX-VSM, DTW), χρησιμοποιήθηκαν ως βάση για τη μέθοδο μας. Τα αποτελέσματα αξιολογήθηκαν με απόδοση και συγκρίθηκαν με άλλες καθιερωμένες τεχνικές στην ανάλυση κειμένου. Η εφαρμογή μας μπορεί να αναγνωρίσει όχι μόνο τον ίδιο κώδικά, αλλά προσφέρει και γραφική απεικονίσει των τμημάτων που αναγνωρίστηκαν ως "πανομοιότυπα" με χρωμάτωση των μερών αυτών και επιστρέφει πληροφορίες σχετικά με το αν υπάρχουν συντακτικά λάθη ,που δεν επιτρέπει στον κώδικα να εκτελείτε σωστά. Όλα αυτά με γρήγορο αυτοματοποιημένο και αποδοτικό τρόπο.
|
| id |
oai:hellanicus.lib.aegean.gr:11610-22766
|
| institution |
Hellanicus
|
| language |
el_GR
|
| publishDate |
2022
|
| record_format |
dspace
|
| spelling |
oai:hellanicus.lib.aegean.gr:11610-227662022-01-20T16:43:00Z Ανίχνευση λογοκλοπής σε κώδικα γλώσσας προγραμματισμού με τεχνικές ανάλυσης κειμένων και χρονοσειρών Γκίκας, Αλέξιος - Παναγιώτης Μαραγκουδάκης, Εμμανουήλ Τεχνολογίες και Διοίκηση Πληροφοριακών και Επικοινωνιακών Συστημάτων λογοκλοπή χρονοσειρές συντακτική ανάλυση εφαρμογή timeseries plagiarism detection syntax analysis application programming languages Plagiarism--Detection Time-series analysis Programming languages (Electronic computers) Αντικείμενο της παρούσας διατριβής είναι η προσπάθεια εύρεσης λογοκλοπής σε πηγαίο κώδικα της ίδιας γλώσσας προγραμματισμού μέσω ενός ειδικά σχεδιασμένου εργαλείου διασυνδεδεμένου με ένα γραφικό περιβάλλον χρήστη φτιαγμένο σε Java. Πανεπιστήμια ή άλλα ιδρύματα τριτοβάθμιας εκπαίδευσης που προσφέρουν μαθήματα σε διαφορετικές γλώσσες προγραμματισμού και μπορούν να βρουν τη μέθοδο μας χρήσιμη για τον εντοπισμό πανομοιότυπων πηγαίων κωδίκων μεταξύ των μαθητών. Δεδομένου του υψηλού όγκου κειμένων (ο πηγαίος κώδικας στην περίπτωσή μας), δεν είναι εύκολο για έναν ανθρώπινο εξεταστή να αντιληφθεί με επιτυχία ένα πανομοιότυπο ή σχεδόν πανομοιότυπο κείμενο. Η προτεινόμενη μέθοδος μας χρησιμοποιεί την ίδια μεθοδολογία, που εφαρμόζεται και στην ανάλυση των χρονοσειρών προκειμένου να μπορέσει να εκτελέσει μια επιτυχημένη κατηγοριοποίηση και ανακάλυψη πανομοιότυπων κειμένων. Διάφοροι αλγόριθμοι που έχουν καλή απόδοση στην ανάλυση χρονοσειρών,(όπως SAX-VSM, DTW), χρησιμοποιήθηκαν ως βάση για τη μέθοδο μας. Τα αποτελέσματα αξιολογήθηκαν με απόδοση και συγκρίθηκαν με άλλες καθιερωμένες τεχνικές στην ανάλυση κειμένου. Η εφαρμογή μας μπορεί να αναγνωρίσει όχι μόνο τον ίδιο κώδικά, αλλά προσφέρει και γραφική απεικονίσει των τμημάτων που αναγνωρίστηκαν ως "πανομοιότυπα" με χρωμάτωση των μερών αυτών και επιστρέφει πληροφορίες σχετικά με το αν υπάρχουν συντακτικά λάθη ,που δεν επιτρέπει στον κώδικα να εκτελείτε σωστά. Όλα αυτά με γρήγορο αυτοματοποιημένο και αποδοτικό τρόπο. This thesis, attempts to classify plagiarism in source code of the same programming language through a specifically designed tool interfaced with an intuitive GUI. Universities or other higher education institutions that offer modules on different programming languages may find our method useful in identifying identical source code amongst students. Given a high amount of text (source code in our case) it is not an easy task for a human to successfully classify identical or almost identical text. Our proposed method uses the same methodology for time series analysis in order to be able to perform a successful classification. Various algorithms that perform well in domain series analysis, were used as base for our method. The results were evaluated performance-wise and were compared with other established techniques in text analysis. Our application may identify not only identical source code, but makes notes of the parts that were identified as “identical” and return information on whether there are syntactic errors or not. All that in a fast automated and efficient way. 2022-01-17T08:20:33Z 2022-01-17T08:20:33Z 2018-06-29 http://hdl.handle.net/11610/22766 el_GR Default License 78 σ. application/pdf Σάμος
|
| spellingShingle |
λογοκλοπή
χρονοσειρές
συντακτική ανάλυση
εφαρμογή
timeseries
plagiarism detection
syntax analysis
application
programming languages
Plagiarism--Detection
Time-series analysis
Programming languages (Electronic computers)
Γκίκας, Αλέξιος - Παναγιώτης
Ανίχνευση λογοκλοπής σε κώδικα γλώσσας προγραμματισμού με τεχνικές ανάλυσης κειμένων και χρονοσειρών
|
| title |
Ανίχνευση λογοκλοπής σε κώδικα γλώσσας προγραμματισμού με τεχνικές ανάλυσης κειμένων και χρονοσειρών
|
| title_full |
Ανίχνευση λογοκλοπής σε κώδικα γλώσσας προγραμματισμού με τεχνικές ανάλυσης κειμένων και χρονοσειρών
|
| title_fullStr |
Ανίχνευση λογοκλοπής σε κώδικα γλώσσας προγραμματισμού με τεχνικές ανάλυσης κειμένων και χρονοσειρών
|
| title_full_unstemmed |
Ανίχνευση λογοκλοπής σε κώδικα γλώσσας προγραμματισμού με τεχνικές ανάλυσης κειμένων και χρονοσειρών
|
| title_short |
Ανίχνευση λογοκλοπής σε κώδικα γλώσσας προγραμματισμού με τεχνικές ανάλυσης κειμένων και χρονοσειρών
|
| title_sort |
ανίχνευση λογοκλοπής σε κώδικα γλώσσας προγραμματισμού με τεχνικές ανάλυσης κειμένων και χρονοσειρών
|
| topic |
λογοκλοπή
χρονοσειρές
συντακτική ανάλυση
εφαρμογή
timeseries
plagiarism detection
syntax analysis
application
programming languages
Plagiarism--Detection
Time-series analysis
Programming languages (Electronic computers)
|
| url |
http://hdl.handle.net/11610/22766
|
| work_keys_str_mv |
AT nkikasalexiospanagiōtēs anichneusēlogoklopēssekōdikaglōssasprogrammatismoumetechnikesanalysēskeimenōnkaichronoseirōn
|