Academic Journal

Analysis of the sentiment of the text in the Ukrainian language

Λεπτομέρειες βιβλιογραφικής εγγραφής
Τίτλος: Analysis of the sentiment of the text in the Ukrainian language
Πηγή: Bionics of Intelligence; Vol. 1 No. 96 (2021): Scientific and Technical Journal "Bionics of Intelligence"; 15-21
Бионика интеллекта; Том 1 № 96 (2021): Научно-технический журнал "Бионика интеллекта"; 15-21
Біоніка інтелекту; Том 1 № 96 (2021): Науково-технічний журнал "Біоніка інтелекту"; 15-21
Στοιχεία εκδότη: Kharkiv National University of Radio Electronics, 2021.
Έτος έκδοσης: 2021
Θεματικοί όροι: МАШИННЕ НАВЧАННЯ, СЕНТИМЕНТ-АНАЛИЗ, УКРАЇНСЬКА МОВА, УКРАИНСКИЙ ЯЗЫК, SENTIMENT ANALYSIS, СЕНТИМЕНТ-АНАЛІЗ, ТОНАЛЬНОСТЬ ТЕКСТА, MACHINE LEARNING, МАШИННОЕ ОБУЧЕНИЕ, ТОНАЛЬНІСТЬ ТЕКСТУ, UKRAINIAN LANGUAGE, TEXT VOLUME
Περιγραφή: Статья посвящена исследованию методов автоматического анализа тональности текста (сентимент-анализа) и выявление наиболее эффективных методов анализа тональности текста на украинском языке. В результате исследования решена задача генерирования набора данных (датасета) на украинском языке на основе отзывов пользователей о мобильных приложения. Полученный датасет использован для проведения эксперимента по выявлению оптимального алгоритма бинарной классификации для текстов на украинском языке, а также построена модель бинарного классификатора на основе результатов эксперимента. Решена задача бинарной классификации текста на украинском языке с помощью претренированной многоязычной BERT-модели с использованием сгенерированного датасета.
Стаття присвячена дослідженню методів автоматичного аналізу тональності тексту (сентимент-аналізу) та виявлення найбільш ефективних методів аналізу тональності тексту українською мовою. В результаті дослідження вирішена задача генерування набору даних (датасету) українською мовою на основі відгуків користувачів про мобільні додатки. Отриманий датасет використано для проведення експерименту з виявлення оптимального алгоритму бінарної класифікації для текстів українською мовою, а також побудована модель бінарного класифікатора на основі результатів експерименту. Вирішена задача бінарної класифікації тексту українською мовою за допомогою претренованої багатомовної BERT-моделі з використанням згенерованного датасету.
The article is devoted to the study of the methods of automatic sentiment analysis and the identification of the most effective methods of analysis of the sentiment of the text in the Ukrainian language. In the course of the work, the problem of generating a dataset in Ukrainian was solved based on user reviews of mobile applications. The resulting dataset was used to conduct an experiment to identify the optimal binary classification algorithm for texts in the Ukrainian language, and a binary classifier model was built based on the results of the experiment. The problem of binary classification of Ukrainian text was solved using a pretrained multilingual BERT model using a generated dataset.
Τύπος εγγράφου: Article
Περιγραφή αρχείου: application/pdf
Γλώσσα: Ukrainian
ISSN: 2663-3051
2663-306X
Σύνδεσμος πρόσβασης: http://bionics.nure.ua/article/view/316780
Αριθμός Καταχώρησης: edsair.scientific.p..919b16f4a1c3929a3b98a0fcfa8d5460
Βάση Δεδομένων: OpenAIRE