Academic Journal

Концептуальная неоднозначность в англоязычных текстах о терроризме: причины возникновения и методы разрешения

Bibliographic Details
Title: Концептуальная неоднозначность в англоязычных текстах о терроризме: причины возникновения и методы разрешения
Source: International Journal of Open Information Technologies. 8
Publisher Information: Internet Media League, 2020.
Publication Year: 2020
Subject Terms: концептуальная разметка, English, conceptual ambiguity, terrorism, английский язык, conceptual annotation, 16. Peace & justice, концептуальная неоднозначность, терроризм
Description: Актуальные исследования в области автоматической обработки текста нередко затрагивают тему семантизации контента (в частности неструктурированных текстовых потоков), которая достигается посредством семантической разметки или ее вариации, основанной на концептуальной модели и ориентированной на ограниченную предметную область, — концептуальной разметки. В процессе автоматической концептуальной разметки возникает концептуальная неоднозначность, которая проявляется во множественных связях между лексической единицей и концептами онтологии. В статье рассматриваются причины возникновения концептуальной неоднозначности в текстах ограниченной предметной области на материале новостных сообщений о терактах на английском языке. Предлагаются и анализируются возможные количественные методы разрешения такой неоднозначности, основанные на корпусных данных. Делается предположение о пользе применения рассмотренных методов при автоматизированном снятии неоднозначности с участием человека. Today’s natural language processing research frequently addresses the issue of content semantization (including the semantization of unstructured texts such as electronic news) by means of semantic annotation or its special case, ontology-based and domain-oriented conceptual annotation. Conceptual annotation is often complicated by conceptual ambiguity manifested in one-to-many mappings between lexical items and ontology concepts. This paper examines the causes of conceptual ambiguity in restricted domain texts, with the case study of English-language electronic news on terror attacks. Four causes of conceptual ambiguity are revealed: part-of speech homonymy, lexical ambiguity, the plurality of conceptual meanings (the most productive), and the extralinguistic context (the least productive, but the hardest to resolve). Three quantitative disambiguation methods are studied: a) tag ranking, b) a bigram-model-based contextual method, and c) a positional method. All the methods are found useful for computer-aided conceptual disambiguation, yet it is pointed out that these quantitative methods are not quite accurate when used alone and rule-based methods would be a good addition.
Document Type: Article
Language: Russian
ISSN: 2307-8162
DOI: 10.25559/injoit.2307-8162.08.202011.64-72
Accession Number: edsair.doi...........74e8f6c0c87d6bfe10a7fcfa2f09f682
Database: OpenAIRE
Description
ISSN:23078162
DOI:10.25559/injoit.2307-8162.08.202011.64-72