Academic Journal

Analysis of the sentiment of the text in the Ukrainian language

Bibliographic Details
Title: Analysis of the sentiment of the text in the Ukrainian language
Source: Bionics of Intelligence; Vol. 1 No. 96 (2021): Scientific and Technical Journal "Bionics of Intelligence"; 15-21
Бионика интеллекта; Том 1 № 96 (2021): Научно-технический журнал "Бионика интеллекта"; 15-21
Біоніка інтелекту; Том 1 № 96 (2021): Науково-технічний журнал "Біоніка інтелекту"; 15-21
Publisher Information: Kharkiv National University of Radio Electronics, 2021.
Publication Year: 2021
Subject Terms: МАШИННЕ НАВЧАННЯ, СЕНТИМЕНТ-АНАЛИЗ, УКРАЇНСЬКА МОВА, УКРАИНСКИЙ ЯЗЫК, SENTIMENT ANALYSIS, СЕНТИМЕНТ-АНАЛІЗ, ТОНАЛЬНОСТЬ ТЕКСТА, MACHINE LEARNING, МАШИННОЕ ОБУЧЕНИЕ, ТОНАЛЬНІСТЬ ТЕКСТУ, UKRAINIAN LANGUAGE, TEXT VOLUME
Description: Статья посвящена исследованию методов автоматического анализа тональности текста (сентимент-анализа) и выявление наиболее эффективных методов анализа тональности текста на украинском языке. В результате исследования решена задача генерирования набора данных (датасета) на украинском языке на основе отзывов пользователей о мобильных приложения. Полученный датасет использован для проведения эксперимента по выявлению оптимального алгоритма бинарной классификации для текстов на украинском языке, а также построена модель бинарного классификатора на основе результатов эксперимента. Решена задача бинарной классификации текста на украинском языке с помощью претренированной многоязычной BERT-модели с использованием сгенерированного датасета.
Стаття присвячена дослідженню методів автоматичного аналізу тональності тексту (сентимент-аналізу) та виявлення найбільш ефективних методів аналізу тональності тексту українською мовою. В результаті дослідження вирішена задача генерування набору даних (датасету) українською мовою на основі відгуків користувачів про мобільні додатки. Отриманий датасет використано для проведення експерименту з виявлення оптимального алгоритму бінарної класифікації для текстів українською мовою, а також побудована модель бінарного класифікатора на основі результатів експерименту. Вирішена задача бінарної класифікації тексту українською мовою за допомогою претренованої багатомовної BERT-моделі з використанням згенерованного датасету.
The article is devoted to the study of the methods of automatic sentiment analysis and the identification of the most effective methods of analysis of the sentiment of the text in the Ukrainian language. In the course of the work, the problem of generating a dataset in Ukrainian was solved based on user reviews of mobile applications. The resulting dataset was used to conduct an experiment to identify the optimal binary classification algorithm for texts in the Ukrainian language, and a binary classifier model was built based on the results of the experiment. The problem of binary classification of Ukrainian text was solved using a pretrained multilingual BERT model using a generated dataset.
Document Type: Article
File Description: application/pdf
Language: Ukrainian
ISSN: 2663-3051
2663-306X
Access URL: http://bionics.nure.ua/article/view/316780
Accession Number: edsair.scientific.p..919b16f4a1c3929a3b98a0fcfa8d5460
Database: OpenAIRE
Description
ISSN:26633051
2663306X