Εξόρυξη γνώσης από δεδομένα με διατήρηση της ιδιωτικότητας χρησιμοποιώντας νευρωνικά δίκτυα RBF για οριζόντια κατατετμημένα δεδομένα σε περιβάλλον μη έμπιστων χρηστών : πτυχιακή εργασία

Η εξόρυξη γνώσης από δεδομένα αποσκοπεί στην ανακάλυψη (ή αποκάλυψη καλύτερα) συσχετίσεων μεταξύ δεδομένων, που δίνονται συνήθως σε μορφή πινάκων. Η εξόρυξη γνώσης μπορεί να έχει κάθε φορά διαφορετικό σκοπό, όπως την πρόβλεψη κάποιας τιμής (classification) , την ταξινόμηση των δεδομένων σε n το πλήθ...

Full description

Saved in:
Bibliographic Details
Main Author: Παντελή, Αλέξανδρος Δ.
Corporate Author: Πανεπιστήμιο Αιγαίου. Σχολή Θετικών Επιστημών. Τμήμα Μηχανικών Πληροφοριακών και Επικοινωνιακών Συστημάτων
Format: Thesis Book
Language:Greek
Published: 2011.
Subjects:
Online Access:http://hdl.handle.net/11610/8843
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:Η εξόρυξη γνώσης από δεδομένα αποσκοπεί στην ανακάλυψη (ή αποκάλυψη καλύτερα) συσχετίσεων μεταξύ δεδομένων, που δίνονται συνήθως σε μορφή πινάκων. Η εξόρυξη γνώσης μπορεί να έχει κάθε φορά διαφορετικό σκοπό, όπως την πρόβλεψη κάποιας τιμής (classification) , την ταξινόμηση των δεδομένων σε n το πλήθος κατηγοριών (clustering) και την ανακάλυψη συσχετίσεων μεταξύ δεδομένων σε μορφή κανόνων (association rule discovery). Οι μεθοδολογίες αυτές χρησιμοποιούνται σε πάρα πολλούς τομείς από τα οικονομικά μέχρι την ιατρική, και σε συνδυασμό με την ανάγκη μεγάλου όγκου δεδομένων για υψηλή ακρίβεια των αποτελεσμάτων οδηγεί στο κρίσιμο ζήτημα της προστασίας της ιδιωτικότητας των δεδομένων αυτών. Για παράδειγμα αν δύο νοσοκομεία θέλουν να δουν αν υπάρχει συσχέτιση μεταξύ κάποιων συμπτωμάτων/ασθενειών και περιβαλλοντικών αιτιών (π.χ. δίαιτα, τόπος διαμονής κ.α.), για να έχει μεγάλη ακρίβεια το μοντέλο θα πρέπει να υπολογιστεί πάνω στο σύνολο των δεδομένων ενώ προφανώς δεν θα πρέπει το ένα νοσοκομείο να μάθει πληροφορίες για τους ασθενείς του άλλου. Σε αυτή την εργασία παρουσιάζεται ένας αλγόριθμος πολυωνυμικής πολυπλοκότητας (O(1) σε σχέση με τον μη ιδιωτικό υπολογισμό) για τον υπολογισμό ενός μοντέλου RBF (για όλες τα kernel) για την εξόρυξη γνώσης από δεδομένα μεταξύ δύο χρηστών. Συγκεκριμένα το πρωτόκολλο αυτό χρησιμοποιείται για ταξινόμηση/παλινδρόμηση σε οριζόντια κατατετμημένα δεδομένα. Η ιδιωτικότητα των δεδομένων του κάθε χρήστη διατηρείται χωρίς υποθέσεις για την «τιμιότητα» των χρηστών, δηλαδή δεν γίνεται υπόθεση semi-trusted εμπλεκομένων αλλά πλήρως κακόβουλων. Στη συνέχεια παρουσιάζεται η επέκταση του πρωτοκόλλου για χρήση από Ν το πλήθος χρήστες, ανάλυση χρονικής πολυπλοκότητας και επικοινωνιακής επιβάρυνσης και μελέτη της ασφάλειας (ιδιωτικότητας) που προσφέρεται. Εν τέλει παρουσιάζονται πειραματικά αποτελέσματα απόδοσης του όσο αφορά την ακρίβεια/αναακληση και χρόνο εκτέλεσης χρησιμοποιώντας ένα πραγματικό σύνολο δεδομένων.
Item Description:Μέλη της εξεταστικής επιτροπής: Μαραγκουδάκης Ε., Κωνσταντίνου Ε., Καμπουράκης.
Physical Description:x, 101 σ. : σχέδια., πιν. ; 30 εκ.
Bibliography:Βιβλιογραφία: σ. 75-76.
Access:Διάθεση πλήρους κειμένου - Ελεύθερη πρόσβαση.