Αναγνώριση συγγραφέα με χρήση κατανεμημένων αναπαραστάσεων κειμένων

Τίτλος Μεταπτυχιακού: Τεχνολογίες Διαχείρισης Πληροφορίας και Παγκόσμιου Ιστού.

Saved in:
Bibliographic Details
Main Author: Κτίστου, Κλέαρχος
Other Authors: Σταματάτος, Ευστάθιος
Language:el_GR
Published: 2020
Subjects:
Online Access:http://hdl.handle.net/11610/19863
Tags: Add Tag
No Tags, Be the first to tag this record!
_version_ 1828461226848419840
author Κτίστου, Κλέαρχος
author2 Σταματάτος, Ευστάθιος
author_facet Σταματάτος, Ευστάθιος
Κτίστου, Κλέαρχος
author_sort Κτίστου, Κλέαρχος
collection DSpace
description Τίτλος Μεταπτυχιακού: Τεχνολογίες Διαχείρισης Πληροφορίας και Παγκόσμιου Ιστού.
id oai:hellanicus.lib.aegean.gr:11610-19863
institution Hellanicus
language el_GR
publishDate 2020
record_format dspace
spelling oai:hellanicus.lib.aegean.gr:11610-198632020-07-15T09:15:20Z Αναγνώριση συγγραφέα με χρήση κατανεμημένων αναπαραστάσεων κειμένων Authorship attribution using distributed document representations Κτίστου, Κλέαρχος Σταματάτος, Ευστάθιος Τεχνολογίες και Διοίκηση Πληροφοριακών και Επικοινωνιακών Συστημάτων doc2vec n-grams word recognition κατανεμημένη αναπαράσταση λέξεων αναπαράσταση λέξεων με τη μέθοδο της γειτνίασης εύρεση του συντάκτη Word recognition Natural language processing (Computer science) Authorship Τίτλος Μεταπτυχιακού: Τεχνολογίες Διαχείρισης Πληροφορίας και Παγκόσμιου Ιστού. Η κατανεμημένη αναπαράσταση λέξεων σε ένα χώρο διανυσμάτων είναι μια τεχνική που επιτρέπει να αναπαρίστανται λέξεις με τη μέθοδο της γειτνίασης. Οι κατανεμημένες αναπαραστάσεις μπορούν να επεκταθούν σε μεγαλύτερες δομές όπως φράσεις, προτάσεις, έγγραφα. Η ικανότητα κωδικοποίησης πληροφοριών κειμένου και η δυνατότητα χειρισμού δεδομένων μεγάλης διάστασης είναι οι λόγοι για τους οποίους ο τρόπος αυτός χρησιμοποιείται ευρέως σε διάφορες εργασίες επεξεργασίας φυσικών γλωσσών, Σε αυτή την εργασία, προσπαθούμε να κάνουμε την χρήση κατανεμημένης αναπαράστασης σε έγγραφα με σκοπό την εύρεση – ταυτοποίηση του συντάκτη.. Η προτεινόμενη μέθοδος χρησιμοποιεί κατανεμημένες αναπαραστάσεις διανυσμάτων σε έγγραφα και στη συνέχεια χρησιμοποιεί και n-grams για να εκτελέσει την αυτόματη απόδοση σε συγγραφέα. Χρησιμοποιούμε n-grams ως δεδομένα εισόδου για το μοντέλο, πραγματοποιείται έλεγχος σε κείμενα με σκοπό να επαληθεύσουμε το μοντέλο ή ακόμα και να βγάλουμε καλύτερα αποτελέσματα. 2020-02-04T11:38:15Z 2020-02-04T11:38:15Z 2019-09-26 http://hdl.handle.net/11610/19863 el_GR CC0 1.0 Παγκόσμια http://creativecommons.org/publicdomain/zero/1.0/ 59 σ. application/pdf Σάμος
spellingShingle doc2vec
n-grams
word recognition
κατανεμημένη αναπαράσταση λέξεων
αναπαράσταση λέξεων με τη μέθοδο της γειτνίασης
εύρεση του συντάκτη
Word recognition
Natural language processing (Computer science)
Authorship
Κτίστου, Κλέαρχος
Αναγνώριση συγγραφέα με χρήση κατανεμημένων αναπαραστάσεων κειμένων
title Αναγνώριση συγγραφέα με χρήση κατανεμημένων αναπαραστάσεων κειμένων
title_full Αναγνώριση συγγραφέα με χρήση κατανεμημένων αναπαραστάσεων κειμένων
title_fullStr Αναγνώριση συγγραφέα με χρήση κατανεμημένων αναπαραστάσεων κειμένων
title_full_unstemmed Αναγνώριση συγγραφέα με χρήση κατανεμημένων αναπαραστάσεων κειμένων
title_short Αναγνώριση συγγραφέα με χρήση κατανεμημένων αναπαραστάσεων κειμένων
title_sort αναγνώριση συγγραφέα με χρήση κατανεμημένων αναπαραστάσεων κειμένων
topic doc2vec
n-grams
word recognition
κατανεμημένη αναπαράσταση λέξεων
αναπαράσταση λέξεων με τη μέθοδο της γειτνίασης
εύρεση του συντάκτη
Word recognition
Natural language processing (Computer science)
Authorship
url http://hdl.handle.net/11610/19863
work_keys_str_mv AT ktistouklearchos anagnōrisēsyngrapheamechrēsēkatanemēmenōnanaparastaseōnkeimenōn
AT ktistouklearchos authorshipattributionusingdistributeddocumentrepresentations