Academic Journal
Концептуальная неоднозначность в англоязычных текстах о терроризме: причины возникновения и методы разрешения
| Τίτλος: | Концептуальная неоднозначность в англоязычных текстах о терроризме: причины возникновения и методы разрешения |
|---|---|
| Πηγή: | International Journal of Open Information Technologies. 8 |
| Στοιχεία εκδότη: | Internet Media League, 2020. |
| Έτος έκδοσης: | 2020 |
| Θεματικοί όροι: | концептуальная разметка, English, conceptual ambiguity, terrorism, английский язык, conceptual annotation, 16. Peace & justice, концептуальная неоднозначность, терроризм |
| Περιγραφή: | Актуальные исследования в области автоматической обработки текста нередко затрагивают тему семантизации контента (в частности неструктурированных текстовых потоков), которая достигается посредством семантической разметки или ее вариации, основанной на концептуальной модели и ориентированной на ограниченную предметную область, — концептуальной разметки. В процессе автоматической концептуальной разметки возникает концептуальная неоднозначность, которая проявляется во множественных связях между лексической единицей и концептами онтологии. В статье рассматриваются причины возникновения концептуальной неоднозначности в текстах ограниченной предметной области на материале новостных сообщений о терактах на английском языке. Предлагаются и анализируются возможные количественные методы разрешения такой неоднозначности, основанные на корпусных данных. Делается предположение о пользе применения рассмотренных методов при автоматизированном снятии неоднозначности с участием человека. Today’s natural language processing research frequently addresses the issue of content semantization (including the semantization of unstructured texts such as electronic news) by means of semantic annotation or its special case, ontology-based and domain-oriented conceptual annotation. Conceptual annotation is often complicated by conceptual ambiguity manifested in one-to-many mappings between lexical items and ontology concepts. This paper examines the causes of conceptual ambiguity in restricted domain texts, with the case study of English-language electronic news on terror attacks. Four causes of conceptual ambiguity are revealed: part-of speech homonymy, lexical ambiguity, the plurality of conceptual meanings (the most productive), and the extralinguistic context (the least productive, but the hardest to resolve). Three quantitative disambiguation methods are studied: a) tag ranking, b) a bigram-model-based contextual method, and c) a positional method. All the methods are found useful for computer-aided conceptual disambiguation, yet it is pointed out that these quantitative methods are not quite accurate when used alone and rule-based methods would be a good addition. |
| Τύπος εγγράφου: | Article |
| Γλώσσα: | Russian |
| ISSN: | 2307-8162 |
| DOI: | 10.25559/injoit.2307-8162.08.202011.64-72 |
| Αριθμός Καταχώρησης: | edsair.doi...........74e8f6c0c87d6bfe10a7fcfa2f09f682 |
| Βάση Δεδομένων: | OpenAIRE |
| FullText | Text: Availability: 0 CustomLinks: – Url: https://resolver.ebsco.com/c/fiv2js/result?sid=EBSCO:edsair&genre=article&issn=23078162&ISBN=&volume=8&issue=&date=20201106&spage=&pages=&title=International Journal of Open Information Technologies&atitle=%D0%9A%D0%BE%D0%BD%D1%86%D0%B5%D0%BF%D1%82%D1%83%D0%B0%D0%BB%D1%8C%D0%BD%D0%B0%D1%8F%20%D0%BD%D0%B5%D0%BE%D0%B4%D0%BD%D0%BE%D0%B7%D0%BD%D0%B0%D1%87%D0%BD%D0%BE%D1%81%D1%82%D1%8C%20%D0%B2%20%D0%B0%D0%BD%D0%B3%D0%BB%D0%BE%D1%8F%D0%B7%D1%8B%D1%87%D0%BD%D1%8B%D1%85%20%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%B0%D1%85%20%D0%BE%20%D1%82%D0%B5%D1%80%D1%80%D0%BE%D1%80%D0%B8%D0%B7%D0%BC%D0%B5%3A%20%D0%BF%D1%80%D0%B8%D1%87%D0%B8%D0%BD%D1%8B%20%D0%B2%D0%BE%D0%B7%D0%BD%D0%B8%D0%BA%D0%BD%D0%BE%D0%B2%D0%B5%D0%BD%D0%B8%D1%8F%20%D0%B8%20%D0%BC%D0%B5%D1%82%D0%BE%D0%B4%D1%8B%20%D1%80%D0%B0%D0%B7%D1%80%D0%B5%D1%88%D0%B5%D0%BD%D0%B8%D1%8F&aulast=&id=DOI:10.25559/injoit.2307-8162.08.202011.64-72 Name: Full Text Finder (for New FTF UI) (ns324271) Category: fullText Text: Full Text Finder MouseOverText: Full Text Finder |
|---|---|
| Header | DbId: edsair DbLabel: OpenAIRE An: edsair.doi...........74e8f6c0c87d6bfe10a7fcfa2f09f682 RelevancyScore: 837 AccessLevel: 3 PubType: Academic Journal PubTypeId: academicJournal PreciseRelevancyScore: 837.258850097656 |
| IllustrationInfo | |
| Items | – Name: Title Label: Title Group: Ti Data: Концептуальная неоднозначность в англоязычных текстах о терроризме: причины возникновения и методы разрешения – Name: TitleSource Label: Source Group: Src Data: <i>International Journal of Open Information Technologies</i>. 8 – Name: Publisher Label: Publisher Information Group: PubInfo Data: Internet Media League, 2020. – Name: DatePubCY Label: Publication Year Group: Date Data: 2020 – Name: Subject Label: Subject Terms Group: Su Data: <searchLink fieldCode="DE" term="%22концептуальная+разметка%22">концептуальная разметка</searchLink><br /><searchLink fieldCode="DE" term="%22English%22">English</searchLink><br /><searchLink fieldCode="DE" term="%22conceptual+ambiguity%22">conceptual ambiguity</searchLink><br /><searchLink fieldCode="DE" term="%22terrorism%22">terrorism</searchLink><br /><searchLink fieldCode="DE" term="%22английский+язык%22">английский язык</searchLink><br /><searchLink fieldCode="DE" term="%22conceptual+annotation%22">conceptual annotation</searchLink><br /><searchLink fieldCode="DE" term="%2216%2E+Peace+%26+justice%22">16. Peace & justice</searchLink><br /><searchLink fieldCode="DE" term="%22концептуальная+неоднозначность%22">концептуальная неоднозначность</searchLink><br /><searchLink fieldCode="DE" term="%22терроризм%22">терроризм</searchLink> – Name: Abstract Label: Description Group: Ab Data: Актуальные исследования в области автоматической обработки текста нередко затрагивают тему семантизации контента (в частности неструктурированных текстовых потоков), которая достигается посредством семантической разметки или ее вариации, основанной на концептуальной модели и ориентированной на ограниченную предметную область, — концептуальной разметки. В процессе автоматической концептуальной разметки возникает концептуальная неоднозначность, которая проявляется во множественных связях между лексической единицей и концептами онтологии. В статье рассматриваются причины возникновения концептуальной неоднозначности в текстах ограниченной предметной области на материале новостных сообщений о терактах на английском языке. Предлагаются и анализируются возможные количественные методы разрешения такой неоднозначности, основанные на корпусных данных. Делается предположение о пользе применения рассмотренных методов при автоматизированном снятии неоднозначности с участием человека. Today’s natural language processing research frequently addresses the issue of content semantization (including the semantization of unstructured texts such as electronic news) by means of semantic annotation or its special case, ontology-based and domain-oriented conceptual annotation. Conceptual annotation is often complicated by conceptual ambiguity manifested in one-to-many mappings between lexical items and ontology concepts. This paper examines the causes of conceptual ambiguity in restricted domain texts, with the case study of English-language electronic news on terror attacks. Four causes of conceptual ambiguity are revealed: part-of speech homonymy, lexical ambiguity, the plurality of conceptual meanings (the most productive), and the extralinguistic context (the least productive, but the hardest to resolve). Three quantitative disambiguation methods are studied: a) tag ranking, b) a bigram-model-based contextual method, and c) a positional method. All the methods are found useful for computer-aided conceptual disambiguation, yet it is pointed out that these quantitative methods are not quite accurate when used alone and rule-based methods would be a good addition. – Name: TypeDocument Label: Document Type Group: TypDoc Data: Article – Name: Language Label: Language Group: Lang Data: Russian – Name: ISSN Label: ISSN Group: ISSN Data: 2307-8162 – Name: DOI Label: DOI Group: ID Data: 10.25559/injoit.2307-8162.08.202011.64-72 – Name: AN Label: Accession Number Group: ID Data: edsair.doi...........74e8f6c0c87d6bfe10a7fcfa2f09f682 |
| PLink | https://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsair&AN=edsair.doi...........74e8f6c0c87d6bfe10a7fcfa2f09f682 |
| RecordInfo | BibRecord: BibEntity: Identifiers: – Type: doi Value: 10.25559/injoit.2307-8162.08.202011.64-72 Languages: – Text: Russian Subjects: – SubjectFull: концептуальная разметка Type: general – SubjectFull: English Type: general – SubjectFull: conceptual ambiguity Type: general – SubjectFull: terrorism Type: general – SubjectFull: английский язык Type: general – SubjectFull: conceptual annotation Type: general – SubjectFull: 16. Peace & justice Type: general – SubjectFull: концептуальная неоднозначность Type: general – SubjectFull: терроризм Type: general Titles: – TitleFull: Концептуальная неоднозначность в англоязычных текстах о терроризме: причины возникновения и методы разрешения Type: main BibRelationships: IsPartOfRelationships: – BibEntity: Dates: – D: 06 M: 11 Type: published Y: 2020 Identifiers: – Type: issn-print Value: 23078162 – Type: issn-locals Value: edsair – Type: issn-locals Value: edsairFT Numbering: – Type: volume Value: 8 Titles: – TitleFull: International Journal of Open Information Technologies Type: main |
| ResultId | 1 |