ВЕРИФИКАЦИЯ КОМПЬЮТЕРНЫХ ТЕРМИНОВ В ТЕКСТАХ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ ОБРАБОТКИ ЕСТЕСТВЕННОГО ЯЗЫКА

Bibliographic Details
Title: ВЕРИФИКАЦИЯ КОМПЬЮТЕРНЫХ ТЕРМИНОВ В ТЕКСТАХ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ ОБРАБОТКИ ЕСТЕСТВЕННОГО ЯЗЫКА
Publisher Information: Теория языка и межкультурная коммуникация, 2025.
Publication Year: 2025
Subject Terms: обработка естественного языка, метод распознавания именованных сущностей, computer term, компьютерный термин, text analytics, текстовая аналитика, natural language processing, named entity method
Description: This article discusses the problem of verification of computer terminology. The author substantiates the limited effectiveness of traditional methods of analysis to solve the stated problem, and suggests a solution using the methodological apparatus of natural language processing. The main research method is the named entity recognition method, implemented using the DeepSeek-LLM. The purpose of this paper is to describe a multi-level verification algorithm that includes the stages of text preprocessing, morphological, syntactic, and contextual analysis, followed by validation using specialized reference resources. The research was based on the texts of domestic and foreign scientific and popular scientific periodicals (WIRED, Business Informatics, IT Expert, Jetinfo). The results of the experiment demonstrate the high efficiency of the tested method. The named entity recognition method allows not only to identify computer terms, but also to accurately categorize them, as well as distinguish the selected lexemes into actual terms and professions.
В данной статье рассматривается проблема верификации компьютерных терминов. Автором обоснована недостаточная эффективность традиционных методов текстового анализа для решения заявленной проблемы и предложено решение с применением методологического аппарата обработки естественного языка. Основным методом исследования выступает метод распознавания именованных сущностей, реализуемый с помощью языковой модели DeepSeek-LLM. Целью работы является описание многоуровневого алгоритма верификации, включающего такие этапы, как предварительная обработка текста, морфологический, синтаксический и контекстуальный анализ с последующей валидацией выявленных компьютерных терминов по специализированным справочным ресурсам. Материалом для исследования послужили тексты отечественных и зарубежных научных и научно-популярных периодических изданий (WIRED, Бизнес-информатика, IT Expert, Jetinfo). Результаты проведенного исследования демонстрируют высокую эффективность апробируемого метода.
Document Type: Research
DOI: 10.24412/2219-8660-2025-58-43-53
Rights: CC BY
Accession Number: edsair.doi...........8bbd4aff701a8af578220ffc416a05ce
Database: OpenAIRE
Description
DOI:10.24412/2219-8660-2025-58-43-53