Academic Journal

Специальные выражения для поиска в структурированном тексте с использованием грамматических свойств

Λεπτομέρειες βιβλιογραφικής εγγραφής
Τίτλος: Специальные выражения для поиска в структурированном тексте с использованием грамматических свойств
Πηγή: Цифровая экономика.
Στοιχεία εκδότη: Central Economic Mathematical Institute of the Russian Academy of Sciences - Cifra, 2023.
Έτος έκδοσης: 2023
Θεματικοί όροι: regular expressions, семантическая связь, онтология, holonym, semantic network, meronym, ontology, мероним, холоним, регулярные выражения, semantic relation, семантическая сеть
Περιγραφή: В данной статье рассматривается применение специально разработанных регулярных выражений для извлечения словоформ, а также семантических отношений, полученных из структурированных и слабоструктурированных источников, рассматриваются основные элементы семантической сети (концепты, лексемы, словоформы, отношения и атрибуты), а также основные типы связей между элементами. Новизну исследования составляет применение регулярных выражений не к символам, а к лексемам. Приводится классификация методов для автоматизированного извлечения семантических связей из текста. Представлено сравнение производительности разработанного алгоритма и утилиты «grep» с точки зрения количества квантификаторов, входящих в шаблоны для поиска. This article is devoted to the specially designed regular expressions for extracting word forms, as well as semantic relations obtained from structured and semi-structured sources, it contains description of the main elements of the semantic network (concepts, lexemes, word forms, relations and attributes), as well as the main types of relations between elements. The novelty of the research is the applicability of regular expressions not to symbols, but to lexemes. A classification of methods for automated extraction of semantic relations from text is given. Comparison of the performance of the developed algorithm and the utility “grep” is presented in terms of the number of quantifiers included in the search patterns.
Τύπος εγγράφου: Article
Γλώσσα: Russian
ISSN: 2686-956X
DOI: 10.34706/de-2023-03-05
Αριθμός Καταχώρησης: edsair.doi...........b9a7e3536d24c408d0b04de32f557bc7
Βάση Δεδομένων: OpenAIRE
FullText Text:
  Availability: 0
Header DbId: edsair
DbLabel: OpenAIRE
An: edsair.doi...........b9a7e3536d24c408d0b04de32f557bc7
RelevancyScore: 898
AccessLevel: 3
PubType: Academic Journal
PubTypeId: academicJournal
PreciseRelevancyScore: 897.639770507813
IllustrationInfo
Items – Name: Title
  Label: Title
  Group: Ti
  Data: Специальные выражения для поиска в структурированном тексте с использованием грамматических свойств
– Name: TitleSource
  Label: Source
  Group: Src
  Data: <i>Цифровая экономика</i>.
– Name: Publisher
  Label: Publisher Information
  Group: PubInfo
  Data: Central Economic Mathematical Institute of the Russian Academy of Sciences - Cifra, 2023.
– Name: DatePubCY
  Label: Publication Year
  Group: Date
  Data: 2023
– Name: Subject
  Label: Subject Terms
  Group: Su
  Data: <searchLink fieldCode="DE" term="%22regular+expressions%22">regular expressions</searchLink><br /><searchLink fieldCode="DE" term="%22семантическая+связь%22">семантическая связь</searchLink><br /><searchLink fieldCode="DE" term="%22онтология%22">онтология</searchLink><br /><searchLink fieldCode="DE" term="%22holonym%22">holonym</searchLink><br /><searchLink fieldCode="DE" term="%22semantic+network%22">semantic network</searchLink><br /><searchLink fieldCode="DE" term="%22meronym%22">meronym</searchLink><br /><searchLink fieldCode="DE" term="%22ontology%22">ontology</searchLink><br /><searchLink fieldCode="DE" term="%22мероним%22">мероним</searchLink><br /><searchLink fieldCode="DE" term="%22холоним%22">холоним</searchLink><br /><searchLink fieldCode="DE" term="%22регулярные+выражения%22">регулярные выражения</searchLink><br /><searchLink fieldCode="DE" term="%22semantic+relation%22">semantic relation</searchLink><br /><searchLink fieldCode="DE" term="%22семантическая+сеть%22">семантическая сеть</searchLink>
– Name: Abstract
  Label: Description
  Group: Ab
  Data: В данной статье рассматривается применение специально разработанных регулярных выражений для извлечения словоформ, а также семантических отношений, полученных из структурированных и слабоструктурированных источников, рассматриваются основные элементы семантической сети (концепты, лексемы, словоформы, отношения и атрибуты), а также основные типы связей между элементами. Новизну исследования составляет применение регулярных выражений не к символам, а к лексемам. Приводится классификация методов для автоматизированного извлечения семантических связей из текста. Представлено сравнение производительности разработанного алгоритма и утилиты «grep» с точки зрения количества квантификаторов, входящих в шаблоны для поиска. This article is devoted to the specially designed regular expressions for extracting word forms, as well as semantic relations obtained from structured and semi-structured sources, it contains description of the main elements of the semantic network (concepts, lexemes, word forms, relations and attributes), as well as the main types of relations between elements. The novelty of the research is the applicability of regular expressions not to symbols, but to lexemes. A classification of methods for automated extraction of semantic relations from text is given. Comparison of the performance of the developed algorithm and the utility “grep” is presented in terms of the number of quantifiers included in the search patterns.
– Name: TypeDocument
  Label: Document Type
  Group: TypDoc
  Data: Article
– Name: Language
  Label: Language
  Group: Lang
  Data: Russian
– Name: ISSN
  Label: ISSN
  Group: ISSN
  Data: 2686-956X
– Name: DOI
  Label: DOI
  Group: ID
  Data: 10.34706/de-2023-03-05
– Name: AN
  Label: Accession Number
  Group: ID
  Data: edsair.doi...........b9a7e3536d24c408d0b04de32f557bc7
PLink https://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsair&AN=edsair.doi...........b9a7e3536d24c408d0b04de32f557bc7
RecordInfo BibRecord:
  BibEntity:
    Identifiers:
      – Type: doi
        Value: 10.34706/de-2023-03-05
    Languages:
      – Text: Russian
    Subjects:
      – SubjectFull: regular expressions
        Type: general
      – SubjectFull: семантическая связь
        Type: general
      – SubjectFull: онтология
        Type: general
      – SubjectFull: holonym
        Type: general
      – SubjectFull: semantic network
        Type: general
      – SubjectFull: meronym
        Type: general
      – SubjectFull: ontology
        Type: general
      – SubjectFull: мероним
        Type: general
      – SubjectFull: холоним
        Type: general
      – SubjectFull: регулярные выражения
        Type: general
      – SubjectFull: semantic relation
        Type: general
      – SubjectFull: семантическая сеть
        Type: general
    Titles:
      – TitleFull: Специальные выражения для поиска в структурированном тексте с использованием грамматических свойств
        Type: main
  BibRelationships:
    IsPartOfRelationships:
      – BibEntity:
          Dates:
            – D: 29
              M: 08
              Type: published
              Y: 2023
          Identifiers:
            – Type: issn-print
              Value: 2686956X
            – Type: issn-locals
              Value: edsair
          Titles:
            – TitleFull: Цифровая экономика
              Type: main
ResultId 1