| Description: |
В данной статье рассматривается применение специально разработанных регулярных выражений для извлечения словоформ, а также семантических отношений, полученных из структурированных и слабоструктурированных источников, рассматриваются основные элементы семантической сети (концепты, лексемы, словоформы, отношения и атрибуты), а также основные типы связей между элементами. Новизну исследования составляет применение регулярных выражений не к символам, а к лексемам. Приводится классификация методов для автоматизированного извлечения семантических связей из текста. Представлено сравнение производительности разработанного алгоритма и утилиты «grep» с точки зрения количества квантификаторов, входящих в шаблоны для поиска. This article is devoted to the specially designed regular expressions for extracting word forms, as well as semantic relations obtained from structured and semi-structured sources, it contains description of the main elements of the semantic network (concepts, lexemes, word forms, relations and attributes), as well as the main types of relations between elements. The novelty of the research is the applicability of regular expressions not to symbols, but to lexemes. A classification of methods for automated extraction of semantic relations from text is given. Comparison of the performance of the developed algorithm and the utility “grep” is presented in terms of the number of quantifiers included in the search patterns. |