Academic Journal
The Covert Helps Parse the Overt
| Τίτλος: | The Covert Helps Parse the Overt |
|---|---|
| Συγγραφείς: | Xun Zhang, Weiwei Sun, Xiaojun Wan |
| Πηγή: | Proceedings of the 21st Conference on Computational Natural Language Learning (CoNLL 2017). :343-353 |
| Στοιχεία εκδότη: | Association for Computational Linguistics (ACL), 2017. |
| Έτος έκδοσης: | 2017 |
| Θεματικοί όροι: | Syntax-based Translation Models, Artificial neural network, Artificial intelligence, S-attributed grammar, Overfitting, 02 engineering and technology, 01 natural sciences, Inference, Artificial Intelligence, Parser combinator, 0202 electrical engineering, electronic engineering, information engineering, Regularization (linguistics), Natural Language Processing, 0105 earth and related environmental sciences, Parsing, 2. Zero hunger, Topic Modeling, Natural language processing, Physics, 4. Education, Linguistics, Optics, Statistical Machine Translation and Natural Language Processing, Dependency grammar, Bottom-up parsing, 15. Life on land, Focus (optics), Computer science, FOS: Philosophy, ethics and religion, Philosophy, Top-down parsing, Dependency Parsing, Computer Science, Physical Sciences, Dialogue Act Modeling for Spoken Language Systems, FOS: Languages and literature, Covert |
| Περιγραφή: | Cet article porte sur la question de savoir si les informations syntaxiques profondes peuvent aider l'analyse de surface, avec un accent particulier sur les catégories vides. Nous concevons de nouveaux algorithmes pour produire des arbres de dépendance dans lesquels les éléments vides sont autorisés, et évaluons l'impact des informations sur la catégorie vide sur l'analyse des éléments manifestes. De telles informations sont utiles pour réduire l'erreur d'approximation dans un modèle d'analyse structuré, mais augmentent l'espace de recherche pour l'inférence et, par conséquent, l'erreur d'estimation. Pour faire face au surajustement basé sur la structure, nous proposons d'intégrer des modèles de désambiguïsation avec et sans éléments vides, et d'effectuer la régularisation de la structure via un décodage conjoint. Des expériences sur des banques d'arbres anglais et chinois avec différents modèles d'analyse indiquent que l'incorporation d'éléments vides améliore systématiquement l'analyse de surface. Este documento se ocupa de si la información sintáctica profunda puede ayudar a analizar la superficie, con un enfoque particular en las categorías vacías. Diseñamos nuevos algoritmos para producir árboles de dependencia en los que se permiten elementos vacíos y evaluamos el impacto de la información sobre la categoría vacía en el análisis de elementos abiertos. Dicha información es útil para reducir el error de aproximación en un modelo de análisis estructurado, pero aumenta el espacio de búsqueda para la inferencia y, en consecuencia, el error de estimación. Para hacer frente al sobreajuste basado en la estructura, proponemos integrar modelos de desambiguación con y sin elementos vacíos, y realizar la regularización de la estructura a través de la decodificación conjunta. Los experimentos en bancos de árboles ingleses y chinos con diferentes modelos de análisis indican que la incorporación de elementos vacíos mejora constantemente el análisis de la superficie. This paper is concerned with whether deep syntactic information can help surface parsing, with a particular focus on empty categories.We design new algorithms to produce dependency trees in which empty elements are allowed, and evaluate the impact of information about empty category on parsing overt elements.Such information is helpful to reduce the approximation error in a structured parsing model, but increases the search space for inference and accordingly the estimation error.To deal with structure-based overfitting, we propose to integrate disambiguation models with and without empty elements, and perform structure regularization via joint decoding.Experiments on English and Chinese TreeBanks with different parsing models indicate that incorporating empty elements consistently improves surface parsing. تهتم هذه الورقة بما إذا كانت المعلومات النحوية العميقة يمكن أن تساعد في تحليل السطح، مع التركيز بشكل خاص على الفئات الفارغة. نقوم بتصميم خوارزميات جديدة لإنتاج أشجار تبعية يُسمح فيها بالعناصر الفارغة، وتقييم تأثير المعلومات حول الفئة الفارغة على تحليل العناصر العلنية. هذه المعلومات مفيدة لتقليل خطأ التقريب في نموذج تحليل منظم، ولكنها تزيد من مساحة البحث عن الاستدلال وبالتالي خطأ التقدير. للتعامل مع الإفراط في التجهيز القائم على الهيكل، نقترح دمج نماذج توضيح الغموض مع العناصر الفارغة وبدونها، وإجراء تنظيم الهيكل عبر فك تشفير مشترك. تشير التجارب على بنوك الشجرة الإنجليزية والصينية مع نماذج تحليل مختلفة إلى أن دمج العناصر الفارغة يحسن باستمرار تحليل السطح. |
| Τύπος εγγράφου: | Article Other literature type |
| DOI: | 10.18653/v1/k17-1035 |
| DOI: | 10.60692/7fzed-82p60 |
| DOI: | 10.60692/0y0qx-94706 |
| Σύνδεσμος πρόσβασης: | https://www.aclweb.org/anthology/K17-1035.pdf https://aclweb.org/anthology/K17-1035 https://dblp.uni-trier.de/db/conf/conll/conll2017.html#ZhangSW17 |
| Rights: | CC BY |
| Αριθμός Καταχώρησης: | edsair.doi.dedup.....c38b2c11a2f949c94c653a14d9aa636c |
| Βάση Δεδομένων: | OpenAIRE |
| DOI: | 10.18653/v1/k17-1035 |
|---|