| _version_ |
1828460253819174912
|
| author |
Μπερδέκας, Δημήτρης
|
| author2 |
Καμπουράκης, Γεώργιος
|
| author_facet |
Καμπουράκης, Γεώργιος
Μπερδέκας, Δημήτρης
|
| author_sort |
Μπερδέκας, Δημήτρης
|
| collection |
DSpace
|
| description |
Nowadays, the Internet has become the main, daily source of information formany people worldwide in the form of applications that simulate our society, theso-called social networks. The basic feature of social networks is the creation of aprofile, which is used by corresponding users as the most realistic representationof themselves in real life, aspiring to socialize with other users, the kind that theywould like to communicate with, in the real world, as well.This digital environment now hosts profiles that don’t belong to genuine users,the so-called Social Bots. The word “bot” is the short form of the word “robot”.Social Bots operate in an automated way and disturb the proper function of theaforementioned networks. Thus far, the scientific community has developed multi-ple techniques and suggestions for identifying and removing such malicious profiles.However, since Social Bots are a human creation, their behavior changes over time,imitating human behavior, to avoid being identified by the mechanisms of the net-works. This dissertation proposes a machine learning framework, which will initiallybe trained with a dataset, so that it can solve a classification problem: bot or notbot? In other words, the model uses the method of Supervised Learning. It is im-portant to note that the steps followed for the creation of features are thoroughlypresented and explained, along with the rationale which led to the selection of thebeforementioned features.Afterwards, the model uses the STL Framework, in order to obtain the ability tolearn from unknown data and to be able to identify profiles with deviating behavior.The creation of those features, as well as the structuring of the machine learningalgorithm was achieved through the Python programming language.Finally, while the number of chosen features is smaller in comparison with otherresearches in the same topic, the results were encouraging, indicating that the selec-tion of the features was efficient, meaning that those features can accurately describethe classification problem, so as to identify the differences between a genuine userand a bot. Concerning the implementation of the STL Framework, the results werepromising and the Precision of the model was increased. Nevertheless, the Recalldecreased, because the model can successfully identify profiles with deviated behav-ior, but there is a greater possibility that it will falsely classify them as genuineusers.
|
| id |
oai:hellanicus.lib.aegean.gr:11610-21834
|
| institution |
Hellanicus
|
| language |
el_GR
|
| publishDate |
2021
|
| record_format |
dspace
|
| spelling |
oai:hellanicus.lib.aegean.gr:11610-218342021-07-07T07:42:26Z Υλοποίηση συστήματος ανίχνευσης δραστηριότητας λογαριασμών ρομπότ κοινωνικών δικτύων A practical approach to uncover social bots’ activity Μπερδέκας, Δημήτρης Καμπουράκης, Γεώργιος Παπαμαρτζιβάνος, Δημήτριος social bot detection machine learning self taught learning εύρεση κοινωνικών bot μηχανική μάθηση κυβερνοασφάλεια Cyberspace--Security measures Machine learning Nowadays, the Internet has become the main, daily source of information formany people worldwide in the form of applications that simulate our society, theso-called social networks. The basic feature of social networks is the creation of aprofile, which is used by corresponding users as the most realistic representationof themselves in real life, aspiring to socialize with other users, the kind that theywould like to communicate with, in the real world, as well.This digital environment now hosts profiles that don’t belong to genuine users,the so-called Social Bots. The word “bot” is the short form of the word “robot”.Social Bots operate in an automated way and disturb the proper function of theaforementioned networks. Thus far, the scientific community has developed multi-ple techniques and suggestions for identifying and removing such malicious profiles.However, since Social Bots are a human creation, their behavior changes over time,imitating human behavior, to avoid being identified by the mechanisms of the net-works. This dissertation proposes a machine learning framework, which will initiallybe trained with a dataset, so that it can solve a classification problem: bot or notbot? In other words, the model uses the method of Supervised Learning. It is im-portant to note that the steps followed for the creation of features are thoroughlypresented and explained, along with the rationale which led to the selection of thebeforementioned features.Afterwards, the model uses the STL Framework, in order to obtain the ability tolearn from unknown data and to be able to identify profiles with deviating behavior.The creation of those features, as well as the structuring of the machine learningalgorithm was achieved through the Python programming language.Finally, while the number of chosen features is smaller in comparison with otherresearches in the same topic, the results were encouraging, indicating that the selec-tion of the features was efficient, meaning that those features can accurately describethe classification problem, so as to identify the differences between a genuine userand a bot. Concerning the implementation of the STL Framework, the results werepromising and the Precision of the model was increased. Nevertheless, the Recalldecreased, because the model can successfully identify profiles with deviated behav-ior, but there is a greater possibility that it will falsely classify them as genuineusers. Κύρια πηγή ενημέρωσης πολλών ανθρώπων ανά τον κόσμο καθημερινά είναι πλέον το διαδίκτυο και πιο συγκεκριμένα, εφαρμογές οι οποίες προσομοιώνουν την κοινωνία μας, τα λεγόμενα κοινωνικά δίκτυα. Η βασική δυνατότητα των κοινωνικών δικτύων είναι η δημιουργία ενός προφίλ μέσω του οποίου οι χρήστες προσπαθούν να προσομοιώσουν όσο το δυνατόν καλύτερα τους πραγματικούς εαυτούς τους με απώτερο σκοπό τη σύναψη σχέσεων με άλλους χρήστες με τους οποίους θα επικοινωνούσαν και στον πραγματικό κόσμο. Στο ίδιο περιβάλλον έχουν κάνει την εμφάνισή τους προφίλ τα οποία δεν ανήκουν σε πραγματικούς χρήστες, τα λεγόμενα Social Bot. Το όνομά τους είναι ο συνδυασμός δυο αγγλικών λέξεων bot (από τη λέξη robot) και social (κοινωνικός). Τα κοινωνικά bot λοιπόν λειτουργούν με αυτοματοποιημένο τρόπο και διαταράσσουν την ομαλή λει τουργία των δικτύων. Η επιστημονική κοινότητα έχει προχωρήσει στην ανάπτυξη πολ λών τεχνικών και προτάσεων για το πώς τέτοιες οντότητες μπορούν να εντοπιστούν και να απομακρυνθούν. Από τη στιγμή όμως που τα bot είναι ανθρώπινο δημιούργημα παρατηρείται εξέλιξη στη συμπεριφορά ώστε να μοιάζουν περισσότερα με πραγματικούς χρήστες και ξεφεύγουν από τις τεχνικές εντοπισμού των δικτύων. Σε αυτήν την διπλωματική εργασία προτείνουμε ένα μοντέλο τεχνητής νοημοσύνης το οποίο αρχικά θα εκπαιδεύεται με ένα σύνολο από δεδομένα και θα λύνει ένα πρόβλημα ταξινόμησης, bot ή όχι. Θα ακολουθείται δηλαδή η διαδικασία της Μάθησης με Επιτήρηση. Σημαντικό εδώ είναι πως παρουσιάζονται αναλυτικά τα βήματα τα οποία ακολουθήθηκαν για τη δημιουργία των χαρακτηριστικών, καθώς και η λογική την οποία ακολουθήσαμε για την επιλογή των συγκεκριμένων χαρακτηριστικών. Στη συνέχεια, γίνεται η χρήση του STL Framework ώστε να μπορέσουμε να δώ σουμε στο μοντέλο μας την ικανότητα να μαθαίνει από δεδομένα για τα οποία δεν έχει προηγούμενη γνώση και να μπορεί να αναγνωρίζει προφίλ με αλλαγμένη συμπεριφορά. Για τη δημιουργία των χαρακτηριστικών αλλά και τη δόμηση του μοντέλου αλγοριθμικά χρησιμοποιήθηκε η γλώσσα προγραμματισμού Python. Τέλος, σε σχέση με άλλες έρευνες, ενώ ο αριθμός των τελικών χαρακτηριστικών ήταν μικρός, είχαμε αρκετά καλά αποτελέσματα κάτι το οποίο δείχνει πως η επιλογή των χαρακτηριστικών έγινε προς τη σωστή κατεύθυνση. Τα χαρακτηριστικά μπορούν με αποτελεσματικό τρόπο να ορίσουν το προφίλ ως οντότητα ώστε να γίνει ο εντοπισμός των διαφορών οι οποίες διέπουν έναν πραγματικό χρήστη και ένα bot. ΄Οσον αφορά την εφαρμογή του STL, τα αποτελέσματα ήταν θετικά και υπήρξε αύξηση της ακρίβειας του μοντέλου. Υπήρξε όμως πτώση της αξιοπιστίας, καθώς ενώ μπορεί να εντοπίζει προφίλ με αλλαγή στη συμπεριφορά τείνει με μεγαλύτερη πιθανότητα να τα κατατάσσει ως πραγματικούς χρήστες. 2021-06-23T07:50:38Z 2021-06-23T07:50:38Z 2020-08-07 http://hdl.handle.net/11610/21834 el_GR Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 Διεθνές http://creativecommons.org/licenses/by-nc-sa/4.0/ 118 σ. application/pdf Σάμος
|
| spellingShingle |
social bot detection
machine learning
self taught learning
εύρεση κοινωνικών bot
μηχανική μάθηση
κυβερνοασφάλεια
Cyberspace--Security measures
Machine learning
Μπερδέκας, Δημήτρης
Υλοποίηση συστήματος ανίχνευσης δραστηριότητας λογαριασμών ρομπότ κοινωνικών δικτύων
|
| title |
Υλοποίηση συστήματος ανίχνευσης δραστηριότητας λογαριασμών ρομπότ κοινωνικών δικτύων
|
| title_full |
Υλοποίηση συστήματος ανίχνευσης δραστηριότητας λογαριασμών ρομπότ κοινωνικών δικτύων
|
| title_fullStr |
Υλοποίηση συστήματος ανίχνευσης δραστηριότητας λογαριασμών ρομπότ κοινωνικών δικτύων
|
| title_full_unstemmed |
Υλοποίηση συστήματος ανίχνευσης δραστηριότητας λογαριασμών ρομπότ κοινωνικών δικτύων
|
| title_short |
Υλοποίηση συστήματος ανίχνευσης δραστηριότητας λογαριασμών ρομπότ κοινωνικών δικτύων
|
| title_sort |
υλοποίηση συστήματος ανίχνευσης δραστηριότητας λογαριασμών ρομπότ κοινωνικών δικτύων
|
| topic |
social bot detection
machine learning
self taught learning
εύρεση κοινωνικών bot
μηχανική μάθηση
κυβερνοασφάλεια
Cyberspace--Security measures
Machine learning
|
| url |
http://hdl.handle.net/11610/21834
|
| work_keys_str_mv |
AT mperdekasdēmētrēs ylopoiēsēsystēmatosanichneusēsdrastēriotētaslogariasmōnrompotkoinōnikōndiktyōn
AT mperdekasdēmētrēs apracticalapproachtouncoversocialbotsactivity
|