Academic Journal

Концептуальная неоднозначность в англоязычных текстах о терроризме: причины возникновения и методы разрешения

Λεπτομέρειες βιβλιογραφικής εγγραφής
Τίτλος: Концептуальная неоднозначность в англоязычных текстах о терроризме: причины возникновения и методы разрешения
Πηγή: International Journal of Open Information Technologies. 8
Στοιχεία εκδότη: Internet Media League, 2020.
Έτος έκδοσης: 2020
Θεματικοί όροι: концептуальная разметка, English, conceptual ambiguity, terrorism, английский язык, conceptual annotation, 16. Peace & justice, концептуальная неоднозначность, терроризм
Περιγραφή: Актуальные исследования в области автоматической обработки текста нередко затрагивают тему семантизации контента (в частности неструктурированных текстовых потоков), которая достигается посредством семантической разметки или ее вариации, основанной на концептуальной модели и ориентированной на ограниченную предметную область, — концептуальной разметки. В процессе автоматической концептуальной разметки возникает концептуальная неоднозначность, которая проявляется во множественных связях между лексической единицей и концептами онтологии. В статье рассматриваются причины возникновения концептуальной неоднозначности в текстах ограниченной предметной области на материале новостных сообщений о терактах на английском языке. Предлагаются и анализируются возможные количественные методы разрешения такой неоднозначности, основанные на корпусных данных. Делается предположение о пользе применения рассмотренных методов при автоматизированном снятии неоднозначности с участием человека. Today’s natural language processing research frequently addresses the issue of content semantization (including the semantization of unstructured texts such as electronic news) by means of semantic annotation or its special case, ontology-based and domain-oriented conceptual annotation. Conceptual annotation is often complicated by conceptual ambiguity manifested in one-to-many mappings between lexical items and ontology concepts. This paper examines the causes of conceptual ambiguity in restricted domain texts, with the case study of English-language electronic news on terror attacks. Four causes of conceptual ambiguity are revealed: part-of speech homonymy, lexical ambiguity, the plurality of conceptual meanings (the most productive), and the extralinguistic context (the least productive, but the hardest to resolve). Three quantitative disambiguation methods are studied: a) tag ranking, b) a bigram-model-based contextual method, and c) a positional method. All the methods are found useful for computer-aided conceptual disambiguation, yet it is pointed out that these quantitative methods are not quite accurate when used alone and rule-based methods would be a good addition.
Τύπος εγγράφου: Article
Γλώσσα: Russian
ISSN: 2307-8162
DOI: 10.25559/injoit.2307-8162.08.202011.64-72
Αριθμός Καταχώρησης: edsair.doi...........74e8f6c0c87d6bfe10a7fcfa2f09f682
Βάση Δεδομένων: OpenAIRE
FullText Text:
  Availability: 0
CustomLinks:
  – Url: https://resolver.ebsco.com/c/fiv2js/result?sid=EBSCO:edsair&genre=article&issn=23078162&ISBN=&volume=8&issue=&date=20201106&spage=&pages=&title=International Journal of Open Information Technologies&atitle=%D0%9A%D0%BE%D0%BD%D1%86%D0%B5%D0%BF%D1%82%D1%83%D0%B0%D0%BB%D1%8C%D0%BD%D0%B0%D1%8F%20%D0%BD%D0%B5%D0%BE%D0%B4%D0%BD%D0%BE%D0%B7%D0%BD%D0%B0%D1%87%D0%BD%D0%BE%D1%81%D1%82%D1%8C%20%D0%B2%20%D0%B0%D0%BD%D0%B3%D0%BB%D0%BE%D1%8F%D0%B7%D1%8B%D1%87%D0%BD%D1%8B%D1%85%20%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%B0%D1%85%20%D0%BE%20%D1%82%D0%B5%D1%80%D1%80%D0%BE%D1%80%D0%B8%D0%B7%D0%BC%D0%B5%3A%20%D0%BF%D1%80%D0%B8%D1%87%D0%B8%D0%BD%D1%8B%20%D0%B2%D0%BE%D0%B7%D0%BD%D0%B8%D0%BA%D0%BD%D0%BE%D0%B2%D0%B5%D0%BD%D0%B8%D1%8F%20%D0%B8%20%D0%BC%D0%B5%D1%82%D0%BE%D0%B4%D1%8B%20%D1%80%D0%B0%D0%B7%D1%80%D0%B5%D1%88%D0%B5%D0%BD%D0%B8%D1%8F&aulast=&id=DOI:10.25559/injoit.2307-8162.08.202011.64-72
    Name: Full Text Finder (for New FTF UI) (ns324271)
    Category: fullText
    Text: Full Text Finder
    MouseOverText: Full Text Finder
Header DbId: edsair
DbLabel: OpenAIRE
An: edsair.doi...........74e8f6c0c87d6bfe10a7fcfa2f09f682
RelevancyScore: 837
AccessLevel: 3
PubType: Academic Journal
PubTypeId: academicJournal
PreciseRelevancyScore: 837.258850097656
IllustrationInfo
Items – Name: Title
  Label: Title
  Group: Ti
  Data: Концептуальная неоднозначность в англоязычных текстах о терроризме: причины возникновения и методы разрешения
– Name: TitleSource
  Label: Source
  Group: Src
  Data: <i>International Journal of Open Information Technologies</i>. 8
– Name: Publisher
  Label: Publisher Information
  Group: PubInfo
  Data: Internet Media League, 2020.
– Name: DatePubCY
  Label: Publication Year
  Group: Date
  Data: 2020
– Name: Subject
  Label: Subject Terms
  Group: Su
  Data: <searchLink fieldCode="DE" term="%22концептуальная+разметка%22">концептуальная разметка</searchLink><br /><searchLink fieldCode="DE" term="%22English%22">English</searchLink><br /><searchLink fieldCode="DE" term="%22conceptual+ambiguity%22">conceptual ambiguity</searchLink><br /><searchLink fieldCode="DE" term="%22terrorism%22">terrorism</searchLink><br /><searchLink fieldCode="DE" term="%22английский+язык%22">английский язык</searchLink><br /><searchLink fieldCode="DE" term="%22conceptual+annotation%22">conceptual annotation</searchLink><br /><searchLink fieldCode="DE" term="%2216%2E+Peace+%26+justice%22">16. Peace & justice</searchLink><br /><searchLink fieldCode="DE" term="%22концептуальная+неоднозначность%22">концептуальная неоднозначность</searchLink><br /><searchLink fieldCode="DE" term="%22терроризм%22">терроризм</searchLink>
– Name: Abstract
  Label: Description
  Group: Ab
  Data: Актуальные исследования в области автоматической обработки текста нередко затрагивают тему семантизации контента (в частности неструктурированных текстовых потоков), которая достигается посредством семантической разметки или ее вариации, основанной на концептуальной модели и ориентированной на ограниченную предметную область, — концептуальной разметки. В процессе автоматической концептуальной разметки возникает концептуальная неоднозначность, которая проявляется во множественных связях между лексической единицей и концептами онтологии. В статье рассматриваются причины возникновения концептуальной неоднозначности в текстах ограниченной предметной области на материале новостных сообщений о терактах на английском языке. Предлагаются и анализируются возможные количественные методы разрешения такой неоднозначности, основанные на корпусных данных. Делается предположение о пользе применения рассмотренных методов при автоматизированном снятии неоднозначности с участием человека. Today’s natural language processing research frequently addresses the issue of content semantization (including the semantization of unstructured texts such as electronic news) by means of semantic annotation or its special case, ontology-based and domain-oriented conceptual annotation. Conceptual annotation is often complicated by conceptual ambiguity manifested in one-to-many mappings between lexical items and ontology concepts. This paper examines the causes of conceptual ambiguity in restricted domain texts, with the case study of English-language electronic news on terror attacks. Four causes of conceptual ambiguity are revealed: part-of speech homonymy, lexical ambiguity, the plurality of conceptual meanings (the most productive), and the extralinguistic context (the least productive, but the hardest to resolve). Three quantitative disambiguation methods are studied: a) tag ranking, b) a bigram-model-based contextual method, and c) a positional method. All the methods are found useful for computer-aided conceptual disambiguation, yet it is pointed out that these quantitative methods are not quite accurate when used alone and rule-based methods would be a good addition.
– Name: TypeDocument
  Label: Document Type
  Group: TypDoc
  Data: Article
– Name: Language
  Label: Language
  Group: Lang
  Data: Russian
– Name: ISSN
  Label: ISSN
  Group: ISSN
  Data: 2307-8162
– Name: DOI
  Label: DOI
  Group: ID
  Data: 10.25559/injoit.2307-8162.08.202011.64-72
– Name: AN
  Label: Accession Number
  Group: ID
  Data: edsair.doi...........74e8f6c0c87d6bfe10a7fcfa2f09f682
PLink https://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsair&AN=edsair.doi...........74e8f6c0c87d6bfe10a7fcfa2f09f682
RecordInfo BibRecord:
  BibEntity:
    Identifiers:
      – Type: doi
        Value: 10.25559/injoit.2307-8162.08.202011.64-72
    Languages:
      – Text: Russian
    Subjects:
      – SubjectFull: концептуальная разметка
        Type: general
      – SubjectFull: English
        Type: general
      – SubjectFull: conceptual ambiguity
        Type: general
      – SubjectFull: terrorism
        Type: general
      – SubjectFull: английский язык
        Type: general
      – SubjectFull: conceptual annotation
        Type: general
      – SubjectFull: 16. Peace & justice
        Type: general
      – SubjectFull: концептуальная неоднозначность
        Type: general
      – SubjectFull: терроризм
        Type: general
    Titles:
      – TitleFull: Концептуальная неоднозначность в англоязычных текстах о терроризме: причины возникновения и методы разрешения
        Type: main
  BibRelationships:
    IsPartOfRelationships:
      – BibEntity:
          Dates:
            – D: 06
              M: 11
              Type: published
              Y: 2020
          Identifiers:
            – Type: issn-print
              Value: 23078162
            – Type: issn-locals
              Value: edsair
            – Type: issn-locals
              Value: edsairFT
          Numbering:
            – Type: volume
              Value: 8
          Titles:
            – TitleFull: International Journal of Open Information Technologies
              Type: main
ResultId 1