Εξόρυξη γνώσης από δεδομένα με διατήρηση της ιδιωτικότητας χρησιμοποιώντας νευρωνικά δίκτυα RBF για οριζόντια κατατετμημένα δεδομένα σε περιβάλλον μη έμπιστων χρηστών : πτυχιακή εργασία

Η εξόρυξη γνώσης από δεδομένα αποσκοπεί στην ανακάλυψη (ή αποκάλυψη καλύτερα) συσχετίσεων μεταξύ δεδομένων, που δίνονται συνήθως σε μορφή πινάκων. Η εξόρυξη γνώσης μπορεί να έχει κάθε φορά διαφορετικό σκοπό, όπως την πρόβλεψη κάποιας τιμής (classification) , την ταξινόμηση των δεδομένων σε n το πλήθ...

Πλήρης περιγραφή

Αποθηκεύτηκε σε:
Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Παντελή, Αλέξανδρος Δ.
Συγγραφή απο Οργανισμό/Αρχή: Πανεπιστήμιο Αιγαίου. Σχολή Θετικών Επιστημών. Τμήμα Μηχανικών Πληροφοριακών και Επικοινωνιακών Συστημάτων
Μορφή: Thesis Βιβλίο
Γλώσσα:Greek
Δημοσίευση: 2011.
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/11610/8843
Ετικέτες: Προσθήκη ετικέτας
Δεν υπάρχουν, Καταχωρήστε ετικέτα πρώτοι!
Περιγραφή
Περίληψη:Η εξόρυξη γνώσης από δεδομένα αποσκοπεί στην ανακάλυψη (ή αποκάλυψη καλύτερα) συσχετίσεων μεταξύ δεδομένων, που δίνονται συνήθως σε μορφή πινάκων. Η εξόρυξη γνώσης μπορεί να έχει κάθε φορά διαφορετικό σκοπό, όπως την πρόβλεψη κάποιας τιμής (classification) , την ταξινόμηση των δεδομένων σε n το πλήθος κατηγοριών (clustering) και την ανακάλυψη συσχετίσεων μεταξύ δεδομένων σε μορφή κανόνων (association rule discovery). Οι μεθοδολογίες αυτές χρησιμοποιούνται σε πάρα πολλούς τομείς από τα οικονομικά μέχρι την ιατρική, και σε συνδυασμό με την ανάγκη μεγάλου όγκου δεδομένων για υψηλή ακρίβεια των αποτελεσμάτων οδηγεί στο κρίσιμο ζήτημα της προστασίας της ιδιωτικότητας των δεδομένων αυτών. Για παράδειγμα αν δύο νοσοκομεία θέλουν να δουν αν υπάρχει συσχέτιση μεταξύ κάποιων συμπτωμάτων/ασθενειών και περιβαλλοντικών αιτιών (π.χ. δίαιτα, τόπος διαμονής κ.α.), για να έχει μεγάλη ακρίβεια το μοντέλο θα πρέπει να υπολογιστεί πάνω στο σύνολο των δεδομένων ενώ προφανώς δεν θα πρέπει το ένα νοσοκομείο να μάθει πληροφορίες για τους ασθενείς του άλλου. Σε αυτή την εργασία παρουσιάζεται ένας αλγόριθμος πολυωνυμικής πολυπλοκότητας (O(1) σε σχέση με τον μη ιδιωτικό υπολογισμό) για τον υπολογισμό ενός μοντέλου RBF (για όλες τα kernel) για την εξόρυξη γνώσης από δεδομένα μεταξύ δύο χρηστών. Συγκεκριμένα το πρωτόκολλο αυτό χρησιμοποιείται για ταξινόμηση/παλινδρόμηση σε οριζόντια κατατετμημένα δεδομένα. Η ιδιωτικότητα των δεδομένων του κάθε χρήστη διατηρείται χωρίς υποθέσεις για την «τιμιότητα» των χρηστών, δηλαδή δεν γίνεται υπόθεση semi-trusted εμπλεκομένων αλλά πλήρως κακόβουλων. Στη συνέχεια παρουσιάζεται η επέκταση του πρωτοκόλλου για χρήση από Ν το πλήθος χρήστες, ανάλυση χρονικής πολυπλοκότητας και επικοινωνιακής επιβάρυνσης και μελέτη της ασφάλειας (ιδιωτικότητας) που προσφέρεται. Εν τέλει παρουσιάζονται πειραματικά αποτελέσματα απόδοσης του όσο αφορά την ακρίβεια/αναακληση και χρόνο εκτέλεσης χρησιμοποιώντας ένα πραγματικό σύνολο δεδομένων.
Περιγραφή τεκμηρίου:Μέλη της εξεταστικής επιτροπής: Μαραγκουδάκης Ε., Κωνσταντίνου Ε., Καμπουράκης.
Φυσική περιγραφή:x, 101 σ. : σχέδια., πιν. ; 30 εκ.
Βιβλιογραφία:Βιβλιογραφία: σ. 75-76.
Πρόσβαση:Διάθεση πλήρους κειμένου - Ελεύθερη πρόσβαση.