Извлечение отношений - Relationship extraction

А извлечение отношений задача требует обнаружения и классификации семантические отношения упоминаний в наборе артефакты обычно из текст или же XML документы. Задача очень похожа на задачу извлечение информации (IE), но IE дополнительно требует удаления повторяющихся отношений (устранение неоднозначности ) и обычно относится к извлечению множества различных отношений.

Приложения

Области приложений, в которых полезно извлечение взаимосвязей, включают взаимосвязи ген-болезнь,[1] белок-белковое взаимодействие[2] и Т. Д.

Бесконечное изучение языка это семантический машинное обучение система разработан исследовательской группой в Университет Карнеги Меллон который извлекает отношения из открытой сети.

Подходы

Один из подходов к этой проблеме предполагает использование домена онтологии.[3][4]Другой подход включает визуальное обнаружение значимых отношений в параметрических значениях объектов, перечисленных в таблице данных, которые меняют позиции, когда таблица переставляется автоматически, как это контролируется пользователем программного обеспечения. Плохое покрытие, редкость и стоимость разработки, связанные со структурированными ресурсами, такими как семантические лексики (например. WordNet, UMLS ) и онтологии предметной области (например, Генная онтология ) привела к появлению новых подходов, основанных на обширных, динамичных фоновых знаниях в Интернете. Например, техника АРХИЛЕС[5] использует только количество страниц в Википедии и поисковой системе для получения крупномасштабных отношений для создания облегченных онтологий.

Отношения могут быть представлены с использованием различных формализмов / языков. Одним из таких языков представления данных в Интернете является RDF.

Совсем недавно были предложены сквозные системы, которые совместно учатся извлекать упоминания сущностей и их семантические отношения с большим потенциалом для получения высокой производительности.[6]

Смотрите также

Рекомендации

  1. ^ Хон-Ву Чун; Йошимаса Цуруока; Джин-Донг Ким; Рие Шиба; Наоки Нагата; Теруёси Хишики; Дзюн-ичи Цудзи (2006). «Извлечение связи ген-болезнь из Medline с использованием словарей предметной области и машинного обучения». Тихоокеанский симпозиум по биокомпьютингу. CiteSeerX  10.1.1.105.9656.
  2. ^ Минли Хуан, Сяоянь Чжу, Ю Хао, Дональд Г. Паян, Кунбинь Цюй и Мин Ли (2004). «Обнаружение закономерностей для извлечения белок-белковых взаимодействий из полных текстов». Биоинформатика. 20 (18): 3604–3612. Дои:10.1093 / биоинформатика / bth451. PMID  15284092.
  3. ^ Т. К. Риндфлеш, Л. Танабе, Дж. Н. Вайнштейн и Л. Хантер (2000). «Эдгар: Извлечение лекарств, генов и отношений из биомедицинской литературы». Proc. Тихоокеанский симпозиум по биокомпьютингу. С. 514–525. ЧВК  2709525.
  4. ^ К. Рамакришнан, К. Дж. Кочут и А. П. Шет (2006). «Платформа для обнаружения взаимосвязей на основе схемы из неструктурированного текста». Proc. Международная конференция по семантической сети. С. 583–596.
  5. ^ В. Вонг, В. Лю и М. Беннамун (2009). «Получение семантических отношений с помощью Интернета для создания облегченных онтологий». Proc. 13-я Тихоокеанско-азиатская конференция по открытию знаний и интеллектуальному анализу данных (PAKDD). Дои:10.1007/978-3-642-01307-2_26.
  6. ^ Дат Куок Нгуен и Карин Верспур (2019). «Сквозное извлечение нейронных отношений с использованием глубокого биаффинного внимания». Труды 41-й Европейской конференции по поиску информации (ECIR). arXiv:1812.11275. Дои:10.1007/978-3-030-15712-8_47.