Μέθοδοι ανίχνευσης ανωμαλιών σε γράφους

Σκοπός αυτής της πτυχιακής εργασίας είναι η µελέτη των µεθόδων ανίχνευσης ανωµαλιών σε γράφους. Ως ανίχνευση µιας ανωµαλίας, ορίζεται η ανακάλυψη σπάνιων περιστατικών στα σύνολα δεδοµένων. Αρχικά, ορίζουµε κάποιες εισαγωγικές έννοιες από την Αναγνώριση Προτύπων και την Εξόρυξη ∆εδοµένων. Συγκεκριµέν...

Full description

Saved in:
Bibliographic Details
Main Author: Εσιπέκογλου, Σοφία
Other Authors: Νάστου, Παναγιώτης
Language:el_GR
Published: 2019
Subjects:
Online Access:https://vsmart.lib.aegean.gr/webopac/List.csp?SearchT1=%CE%B5%CF%83%CE%B9%CF%80%CE%B5%CE%BA%CE%BF%CE%B3%CE%BB%CE%BF%CF%85&Index1=Keywordsbib&Database=1&SearchMethod=Find_1&SearchTerm1=%CE%B5%CF%83%CE%B9%CF%80%CE%B5%CE%BA%CE%BF%CE%B3%CE%BB%CE%BF%CF%85&OpacLanguage=gre&Profile=Default&EncodedRequest=i*17*E8*14*14*F9*AF*9Bp*09f*B5*83*C1*1E*94&EncodedQuery=i*17*E8*14*14*F9*AF*9Bp*09f*B5*83*C1*1E*94&Source=SysQR&PageType=Start&PreviousList=RecordListFind&WebPageNr=1&NumberToRetrieve=50&WebAction=NewSearch&StartValue=0&RowRepeat=0&ExtraInfo=&SortIndex=Year&SortDirection=-1&Resource=&SavingIndicator=&RestrType=&RestrTerms=&RestrShowAll=&LinkToIndex=
http://hdl.handle.net/11610/19634
Tags: Add Tag
No Tags, Be the first to tag this record!
_version_ 1828460665276203008
author Εσιπέκογλου, Σοφία
author2 Νάστου, Παναγιώτης
author_facet Νάστου, Παναγιώτης
Εσιπέκογλου, Σοφία
author_sort Εσιπέκογλου, Σοφία
collection DSpace
description Σκοπός αυτής της πτυχιακής εργασίας είναι η µελέτη των µεθόδων ανίχνευσης ανωµαλιών σε γράφους. Ως ανίχνευση µιας ανωµαλίας, ορίζεται η ανακάλυψη σπάνιων περιστατικών στα σύνολα δεδοµένων. Αρχικά, ορίζουµε κάποιες εισαγωγικές έννοιες από την Αναγνώριση Προτύπων και την Εξόρυξη ∆εδοµένων. Συγκεκριµένα, ορίζουµε τι είναι ένα χαρακτηριστικό ενός προτύπου, τους τύπους των χαρακτηριστικών που υπάρχουν, καθώς επίσης και το πεδίο ορισµού ενός χαρακτηριστικού. Στη συνέχεια, παρουσιάζουµε διάφορα µέτρα υπολογισµού της απόστασης µεταξύ προτύπων, από τα οποία εξάγουµε χρήσιµες πληροφορίες για τα πρότυπα, όπως το συντελεστή συσχέτισής τους, την οµοιότητα, την ανοµοιότητα, τη µέση και µέγιστη ανοµοιότητά τους κ.λπ. Επίσης, γίνεται µια αναφορά σε µερικές µεθόδους που χρησιµοποιούνται για την εξαγωγή και την επιλογή των χαρακτηριστικών που ϑα χρησιµοποιηθούν, προκειµένου να κατηγοριοποιηθούν σωστά τα δεδοµένα εισόδου. Στη συνέχεια, παρουσιάζουµε τη κατηγοριοποίηση των προτύπων εισόδου, δηλαδή τη διαδικασία απόδοσης ετικέτας (ονόµατος) σ΄ ένα πρότυπο εισόδου. Η διαδικασία αυτή πραγµατοποιείται ϐάσει ενός µοντέλου, το οποίο λαµβάνεται χρησιµοποιώντας διάφορους τύπους µάθησης. Ανάλογα µε τον τύπο µάθησης που χρησιµοποιείται, διακρίνονται κάποιοι τύποι κατηγοριοποίησης και µελετώνται αλγόριθµοι κατηγοριοποίησης για καθένα από αυτούς. Σε επόµενο κεφάλαιο, ϑα δούµε πως συνδυάζονται οι διάφοροι τύποι κατηγοϱιοποίησης µε τον εντοπισµό ανωµαλίας σ΄ ένα σύνολο δεδοµένων. Στο κεφάλαιο αυτό, ϑα αναφερθούµε στη χρησιµότητα των γράφων στην ανίχνευση ανωµαλιών καϑώς επίσης και στις δυσκολίες που καλείται κανείς να αντιµετωπίσει. Επίσης, ϑα µελετήσουµε την ανίχνευση ανωµαλιών τόσο σε στατικούς απλούς ή µε χαρακτηριστικά γράφους όσο και σε δυναµικούς γράφους και ϑα δούµε µεθόδους εντοπισµού ανωµαλίας για καθένα από αυτά. ΄Επειτα, παρουσιάζεται η εφαρµογή του αλγορίθµου OddBall, δηλαδή, µιας τεχνικής ανίχνευσης ανωµαλιών σε στατικούς γράφους, σε ένα πραγµατικό σύνολο δεδοµένων. Αναλύεται ο αλγόριθµος και παρουσιάζονται λεπτοµερώς τα αποτελέσµατα του πειράµατος. Ο αλγόριθµος OddBall εντοπίζει σπάνια γεγονότα και συνδέεται άµεσα µε την ανακάλυψη προτύπων και νόµων όπου η πλειοψηφία των κορυφών πρέπει να ακολουθεί. Αν κάποια κορυφή παραβιάζει το πρότυπο ή το νόµο µποϱούµε να τη ϑεωρήσουµε ως ακραία τιµή. Σ΄ αυτό το σηµείο δηµιουργούνται δύο ερωτήµατα, ποια πρότυπα και ποιους νόµους πρέπει οι γράφοι να υπακούν και ποια είναι εκείνα τα χαρακτηριστικά που πρέπει να εξάγουµε από κάθε κορυφή. Τέλος, ϑα αναφερθούµε σε κάποιες ανωµαλίες που έχουν ανιχνευθεί σε κοινωνικά δίκτυα όπως το Facebook, Twitter κ.λπ. όπου κυκλοφορούν κακόβουλα λογισµικά µε σκοπό να εκµεταλλευτούν ή να ϐλάψουν το χρήστη. Σε δίκτυα τηλεπικοινωνιών, όπου ο απατεώνας αποκτά πλαστή ταυτότητα προκειµένου να χρησιµοποιήσει κάποιες υπηρεσίες δωρεάν. Σε δίκτυα δηµοπρασίας, όπου ο πωλητής δεν αποστέλλει τα αγορασθέντα προιόντα στον αγοραστή. Σε δίκτυα οικονοµικών συναλλαγών, όπου µια οµάδα εµπόρων εκτελούν συναλλαγές µεταξύ τους προκειµένου να ανέβει η τιµή της µετοχής στη χρηµατιστηριακή αγορά και να αυξήσουν τα κέρδη τους. Καθώς επίσης και σε δίκτυα υπολογιστών, όπου παρακολουθείται η δραστηριότητα και η συµπεριφορά επικοινωνίας προκειµένου να εντοπιστεί µια επίθεση στο δίκτυο.
id oai:hellanicus.lib.aegean.gr:11610-19634
institution Hellanicus
language el_GR
publishDate 2019
record_format dspace
spelling oai:hellanicus.lib.aegean.gr:11610-196342020-06-25T11:32:36Z Μέθοδοι ανίχνευσης ανωμαλιών σε γράφους Graph-based anomaly detection methods Εσιπέκογλου, Σοφία Νάστου, Παναγιώτης γράφος ανωμαλία ανίχνευση oddball egonet outlierness Computational complexity (URL: http://id.loc.gov/authorities/subjects/sh85029473) Machine learning (URL: http://id.loc.gov/authorities/subjects/sh85079324) Coding theory (URL: http://id.loc.gov/authorities/subjects/sh85027654) Graph theory (URL: http://id.loc.gov/authorities/subjects/sh85056471) Σκοπός αυτής της πτυχιακής εργασίας είναι η µελέτη των µεθόδων ανίχνευσης ανωµαλιών σε γράφους. Ως ανίχνευση µιας ανωµαλίας, ορίζεται η ανακάλυψη σπάνιων περιστατικών στα σύνολα δεδοµένων. Αρχικά, ορίζουµε κάποιες εισαγωγικές έννοιες από την Αναγνώριση Προτύπων και την Εξόρυξη ∆εδοµένων. Συγκεκριµένα, ορίζουµε τι είναι ένα χαρακτηριστικό ενός προτύπου, τους τύπους των χαρακτηριστικών που υπάρχουν, καθώς επίσης και το πεδίο ορισµού ενός χαρακτηριστικού. Στη συνέχεια, παρουσιάζουµε διάφορα µέτρα υπολογισµού της απόστασης µεταξύ προτύπων, από τα οποία εξάγουµε χρήσιµες πληροφορίες για τα πρότυπα, όπως το συντελεστή συσχέτισής τους, την οµοιότητα, την ανοµοιότητα, τη µέση και µέγιστη ανοµοιότητά τους κ.λπ. Επίσης, γίνεται µια αναφορά σε µερικές µεθόδους που χρησιµοποιούνται για την εξαγωγή και την επιλογή των χαρακτηριστικών που ϑα χρησιµοποιηθούν, προκειµένου να κατηγοριοποιηθούν σωστά τα δεδοµένα εισόδου. Στη συνέχεια, παρουσιάζουµε τη κατηγοριοποίηση των προτύπων εισόδου, δηλαδή τη διαδικασία απόδοσης ετικέτας (ονόµατος) σ΄ ένα πρότυπο εισόδου. Η διαδικασία αυτή πραγµατοποιείται ϐάσει ενός µοντέλου, το οποίο λαµβάνεται χρησιµοποιώντας διάφορους τύπους µάθησης. Ανάλογα µε τον τύπο µάθησης που χρησιµοποιείται, διακρίνονται κάποιοι τύποι κατηγοριοποίησης και µελετώνται αλγόριθµοι κατηγοριοποίησης για καθένα από αυτούς. Σε επόµενο κεφάλαιο, ϑα δούµε πως συνδυάζονται οι διάφοροι τύποι κατηγοϱιοποίησης µε τον εντοπισµό ανωµαλίας σ΄ ένα σύνολο δεδοµένων. Στο κεφάλαιο αυτό, ϑα αναφερθούµε στη χρησιµότητα των γράφων στην ανίχνευση ανωµαλιών καϑώς επίσης και στις δυσκολίες που καλείται κανείς να αντιµετωπίσει. Επίσης, ϑα µελετήσουµε την ανίχνευση ανωµαλιών τόσο σε στατικούς απλούς ή µε χαρακτηριστικά γράφους όσο και σε δυναµικούς γράφους και ϑα δούµε µεθόδους εντοπισµού ανωµαλίας για καθένα από αυτά. ΄Επειτα, παρουσιάζεται η εφαρµογή του αλγορίθµου OddBall, δηλαδή, µιας τεχνικής ανίχνευσης ανωµαλιών σε στατικούς γράφους, σε ένα πραγµατικό σύνολο δεδοµένων. Αναλύεται ο αλγόριθµος και παρουσιάζονται λεπτοµερώς τα αποτελέσµατα του πειράµατος. Ο αλγόριθµος OddBall εντοπίζει σπάνια γεγονότα και συνδέεται άµεσα µε την ανακάλυψη προτύπων και νόµων όπου η πλειοψηφία των κορυφών πρέπει να ακολουθεί. Αν κάποια κορυφή παραβιάζει το πρότυπο ή το νόµο µποϱούµε να τη ϑεωρήσουµε ως ακραία τιµή. Σ΄ αυτό το σηµείο δηµιουργούνται δύο ερωτήµατα, ποια πρότυπα και ποιους νόµους πρέπει οι γράφοι να υπακούν και ποια είναι εκείνα τα χαρακτηριστικά που πρέπει να εξάγουµε από κάθε κορυφή. Τέλος, ϑα αναφερθούµε σε κάποιες ανωµαλίες που έχουν ανιχνευθεί σε κοινωνικά δίκτυα όπως το Facebook, Twitter κ.λπ. όπου κυκλοφορούν κακόβουλα λογισµικά µε σκοπό να εκµεταλλευτούν ή να ϐλάψουν το χρήστη. Σε δίκτυα τηλεπικοινωνιών, όπου ο απατεώνας αποκτά πλαστή ταυτότητα προκειµένου να χρησιµοποιήσει κάποιες υπηρεσίες δωρεάν. Σε δίκτυα δηµοπρασίας, όπου ο πωλητής δεν αποστέλλει τα αγορασθέντα προιόντα στον αγοραστή. Σε δίκτυα οικονοµικών συναλλαγών, όπου µια οµάδα εµπόρων εκτελούν συναλλαγές µεταξύ τους προκειµένου να ανέβει η τιµή της µετοχής στη χρηµατιστηριακή αγορά και να αυξήσουν τα κέρδη τους. Καθώς επίσης και σε δίκτυα υπολογιστών, όπου παρακολουθείται η δραστηριότητα και η συµπεριφορά επικοινωνίας προκειµένου να εντοπιστεί µια επίθεση στο δίκτυο. 2019-11-19T08:38:34Z 2019-11-19T08:38:34Z 2016-10-08 https://vsmart.lib.aegean.gr/webopac/List.csp?SearchT1=%CE%B5%CF%83%CE%B9%CF%80%CE%B5%CE%BA%CE%BF%CE%B3%CE%BB%CE%BF%CF%85&Index1=Keywordsbib&Database=1&SearchMethod=Find_1&SearchTerm1=%CE%B5%CF%83%CE%B9%CF%80%CE%B5%CE%BA%CE%BF%CE%B3%CE%BB%CE%BF%CF%85&OpacLanguage=gre&Profile=Default&EncodedRequest=i*17*E8*14*14*F9*AF*9Bp*09f*B5*83*C1*1E*94&EncodedQuery=i*17*E8*14*14*F9*AF*9Bp*09f*B5*83*C1*1E*94&Source=SysQR&PageType=Start&PreviousList=RecordListFind&WebPageNr=1&NumberToRetrieve=50&WebAction=NewSearch&StartValue=0&RowRepeat=0&ExtraInfo=&SortIndex=Year&SortDirection=-1&Resource=&SavingIndicator=&RestrType=&RestrTerms=&RestrShowAll=&LinkToIndex= http://hdl.handle.net/11610/19634 el_GR Default License 75 σ. application/pdf Σάμος
spellingShingle γράφος
ανωμαλία
ανίχνευση
oddball
egonet
outlierness
Computational complexity (URL: http://id.loc.gov/authorities/subjects/sh85029473)
Machine learning (URL: http://id.loc.gov/authorities/subjects/sh85079324)
Coding theory (URL: http://id.loc.gov/authorities/subjects/sh85027654)
Graph theory (URL: http://id.loc.gov/authorities/subjects/sh85056471)
Εσιπέκογλου, Σοφία
Μέθοδοι ανίχνευσης ανωμαλιών σε γράφους
title Μέθοδοι ανίχνευσης ανωμαλιών σε γράφους
title_full Μέθοδοι ανίχνευσης ανωμαλιών σε γράφους
title_fullStr Μέθοδοι ανίχνευσης ανωμαλιών σε γράφους
title_full_unstemmed Μέθοδοι ανίχνευσης ανωμαλιών σε γράφους
title_short Μέθοδοι ανίχνευσης ανωμαλιών σε γράφους
title_sort μέθοδοι ανίχνευσης ανωμαλιών σε γράφους
topic γράφος
ανωμαλία
ανίχνευση
oddball
egonet
outlierness
Computational complexity (URL: http://id.loc.gov/authorities/subjects/sh85029473)
Machine learning (URL: http://id.loc.gov/authorities/subjects/sh85079324)
Coding theory (URL: http://id.loc.gov/authorities/subjects/sh85027654)
Graph theory (URL: http://id.loc.gov/authorities/subjects/sh85056471)
url https://vsmart.lib.aegean.gr/webopac/List.csp?SearchT1=%CE%B5%CF%83%CE%B9%CF%80%CE%B5%CE%BA%CE%BF%CE%B3%CE%BB%CE%BF%CF%85&Index1=Keywordsbib&Database=1&SearchMethod=Find_1&SearchTerm1=%CE%B5%CF%83%CE%B9%CF%80%CE%B5%CE%BA%CE%BF%CE%B3%CE%BB%CE%BF%CF%85&OpacLanguage=gre&Profile=Default&EncodedRequest=i*17*E8*14*14*F9*AF*9Bp*09f*B5*83*C1*1E*94&EncodedQuery=i*17*E8*14*14*F9*AF*9Bp*09f*B5*83*C1*1E*94&Source=SysQR&PageType=Start&PreviousList=RecordListFind&WebPageNr=1&NumberToRetrieve=50&WebAction=NewSearch&StartValue=0&RowRepeat=0&ExtraInfo=&SortIndex=Year&SortDirection=-1&Resource=&SavingIndicator=&RestrType=&RestrTerms=&RestrShowAll=&LinkToIndex=
http://hdl.handle.net/11610/19634
work_keys_str_mv AT esipekoglousophia methodoianichneusēsanōmaliōnsegraphous
AT esipekoglousophia graphbasedanomalydetectionmethods