Academic Journal

Программное средство извлечения сущностей из семантически аннотированных табличных данных: A tool for extraction of entities from semantically annotated tabular data

Bibliographic Details
Title: Программное средство извлечения сущностей из семантически аннотированных табличных данных: A tool for extraction of entities from semantically annotated tabular data
Source: Информационные и математические технологии в науке и управлении. :138-151
Publisher Information: Melentiev Energy Systems Institute, 2023.
Publication Year: 2023
Subject Terms: приобретение знаний, граф знаний, пополнение графа знаний, таблица, семантический веб, извлечение фактов, семантическая интерпретация таблиц
Description: В настоящее время графы знаний широко применяются в различных предметных областях, например, в промышленности, торговле, финансах и социальных сетях. Граф знаний представляет собой мощное средство объединения и представления информации с использованием стандартизированных методов моделирования знаний. Однако, разработка графов знаний и, в частности, пополнение их новыми конкретными сущностями (фактами) остается сложной задачей. Использование различных информационных источников может облегчить этот процесс. Таким источником могут быть таблицы, которые потенциально содержат богатую семантическую информацию. В статье предлагается подход и его программная реализация для автоматизированного извлечения значимой информации из табличных данных в виде фактов и пополнения ими целевого графа знаний. Основной особенностью предлагаемого подхода является сочетание эвристических методов с моделями глубокого машинного обучения для семантического аннотирования табличных данных. Применимость подхода продемонстрирована на двух примерах: при анализе рынка труда Иркутской области и оценке технического состояния нефтехимического оборудования.
Document Type: Article
Language: Russian
ISSN: 2413-0133
DOI: 10.25729/esi.2023.30.2.014
Accession Number: edsair.doi...........2892cb051d4f12e17173307d84579af5
Database: OpenAIRE
Description
ISSN:24130133
DOI:10.25729/esi.2023.30.2.014