Academic Journal

Специальные выражения для поиска в структурированном тексте с использованием грамматических свойств

Bibliographic Details
Title: Специальные выражения для поиска в структурированном тексте с использованием грамматических свойств
Source: Цифровая экономика.
Publisher Information: Central Economic Mathematical Institute of the Russian Academy of Sciences - Cifra, 2023.
Publication Year: 2023
Subject Terms: regular expressions, семантическая связь, онтология, holonym, semantic network, meronym, ontology, мероним, холоним, регулярные выражения, semantic relation, семантическая сеть
Description: В данной статье рассматривается применение специально разработанных регулярных выражений для извлечения словоформ, а также семантических отношений, полученных из структурированных и слабоструктурированных источников, рассматриваются основные элементы семантической сети (концепты, лексемы, словоформы, отношения и атрибуты), а также основные типы связей между элементами. Новизну исследования составляет применение регулярных выражений не к символам, а к лексемам. Приводится классификация методов для автоматизированного извлечения семантических связей из текста. Представлено сравнение производительности разработанного алгоритма и утилиты «grep» с точки зрения количества квантификаторов, входящих в шаблоны для поиска. This article is devoted to the specially designed regular expressions for extracting word forms, as well as semantic relations obtained from structured and semi-structured sources, it contains description of the main elements of the semantic network (concepts, lexemes, word forms, relations and attributes), as well as the main types of relations between elements. The novelty of the research is the applicability of regular expressions not to symbols, but to lexemes. A classification of methods for automated extraction of semantic relations from text is given. Comparison of the performance of the developed algorithm and the utility “grep” is presented in terms of the number of quantifiers included in the search patterns.
Document Type: Article
Language: Russian
ISSN: 2686-956X
DOI: 10.34706/de-2023-03-05
Accession Number: edsair.doi...........b9a7e3536d24c408d0b04de32f557bc7
Database: OpenAIRE
Description
ISSN:2686956X
DOI:10.34706/de-2023-03-05