DSSim - DSSim

DSSim[1][2] является отображение онтологий система, которая была задумана для достижения определенного уровня предполагаемого машинный интеллект на Семантическая сеть. Основными движущими факторами его разработки было предоставление альтернативы существующей эвристике или машинное обучение подходы, основанные на мультиагентном подходе, который использует неопределенные рассуждения. Система обеспечивает возможный подход к установлению машинного понимания данных Семантической паутины посредством мультиагентных убеждений и разрешения конфликтов.

Теоретические основы

Фреймворк DSSim для отображения онтологий был представлен в 2005 году.[3] Миклоша Надя и Марии Варгас-Вера в Открытый университет (ОУ). DSSim решает три проблемы семантической сети:

  • Неопределенность: агенты отображения онтологий принимают Теория Демпстера – Шафера для создания убеждений по гипотезе картирования. Основываясь на свидетельствах сходства, картографические агенты объединяют свои убеждения, чтобы обеспечить согласованное представление о сопоставлениях. Система основана на теоретической ментальной модели программных агентов для представления убеждений о сходстве различных терминов в разных онтологиях. Посредством этих убеждений, которые получены с использованием различных мер сходства и базовых знаний, каждый агент может установить определенное понимание терминов и их контекста.
  • Несогласованность: конфликты убеждений разрешаются с помощью механизма нечеткого голосования. Обработка данных в семантической сети создает сценарии, в которых разные агенты имеют противоречивые взгляды на конкретное решение. В этих ситуациях агентам необходимо разрешить свои конфликты, чтобы выбрать наилучшее возможное решение, например в нашем случае отображение. Картографические агенты используют нечеткое голосование для определения наилучшего решения для агентского общества, но в случае, если избиратели ошибаются в своих суждениях, то альтернатива большинства (если она существует) статистически наиболее вероятно будет лучшим выбором. Применение голосования для картографических агентов - это возможный способ сделать системы более интеллектуальными, то есть имитировать процесс принятия решений, как люди принимают решение по проблемному вопросу.
  • Обширность: Генетические алгоритмы методы оптимизации на основе используются, чтобы обеспечить разумные временные рамки для комбинации убеждений с использованием больших онтологий. Одним из основных недостатков использования теории Демпстера-Шафера для неопределенных рассуждений является вычислительная сложность комбинации убеждений. DSSim решает проблему, используя генетический алгоритм для создания графической структуры, которая используется для эффективного вычисления комбинации убеждений в контексте отображения онтологии.

DSSim использует новые методы трехмерной визуализации результатов как отображения, так и рассуждения. Основная цель хранения и визуализации рассуждений - сохранить состояния рассуждений, чтобы впоследствии визуализировать их для конечных пользователей. Основная цель - показать конечным пользователям, почему система выбрала кандидата на отображение из двух разных онтологий.

Оценка системы

Оценка системы проводилась в рамках Ontology Alignment Evaluation Initiative (OAEI). DSSim участвовал в 2006 г.,[4] 2007,[5] 2008[6] и 2009 г.[7] достижение постепенно улучшающихся результатов. В следующих разделах представлены результаты двух треков из 8 OAEI 2008.

ГодДоступные трекиУчаствовавшие трекиКоличество участвовавших системПокрытие трека DSSim
2006511020%
2007761785%
20088813100%
2009871687%

Библиотечный трек на OAEI 2008

Согласно исходной постановке задачи[8] предоставленный организаторами OAEI 2008, дорожка библиотеки включала выравнивание двух голландских тезаурусов. Эти голландские тезаурусы используются для индексации книг из двух коллекций Национальной библиотеки Нидерландов (KB). KB поддерживает две большие коллекции: депозитарную коллекцию, содержащую все голландские печатные публикации (один миллион экземпляров), и научную коллекцию, содержащую около 1,4 миллиона книг, в основном об истории, языке и культуре Нидерландов. Каждая коллекция описывается в соответствии со своей системой индексации и концептуальным словарем. С одной стороны, Научная коллекция была описана с использованием GTT, огромного словаря, содержащего 35 000 общих понятий, начиная от Wolkenkrabbers (Sky-scrapers) и заканчивая Verzorging (Care). С другой стороны, книги, содержащиеся в Депозитной коллекции, в основном индексируются по тезаурусу Бринкмана, содержащему большой набор заголовков (более 5000), которые, как ожидалось, будут служить глобальными тематиками книг. Для каждого понятия тезаурусы предоставляли обычную лексическую и семантическую информацию: предпочтительные ярлыки, синонимы и примечания, более широкие и родственные концепции и т. Д. Язык обоих тезаурусов был голландским, но довольно существенная часть концепций Бринкмана (около 60%) пришла. с английскими этикетками. Библиотечный трек был трудным отчасти из-за его относительно большого размера и из-за его многоязычного представления. Тем не менее, в треке библиотеки DSSim показал лучшее из 3-х участвующих систем. Однако эти онтологии содержат связанные и более широкие термины, поэтому отображение может быть выполнено без обращения к многоязычным базовым знаниям.

Dssim-oaei2008-library.png

Справочник трека на OAEI 2008

Как указано в исходном определении задачи[9] Этот трек, предоставленный организаторами OAEI 2008, предназначен для оценки качества отображения в реальном сценарии интеграции таксономии. Основная цель - определить, согласование онтологий инструменты могут эффективно применяться для интеграции «мелких онтологий». Набор оценочных данных был извлечен из Google, Yahoo! и Выглядит умным веб-каталоги. Создание этих пар онтологий основывалось на эталонной интерпретации узлов, построенной на основе анализа их использования. Предполагалось, что семантика узлов могла быть получена из их прагматика, а именно из анализа, какие документы были классифицированный под какими узлами. Таким образом, основная идея заключалась в том, чтобы вычислить гипотезы взаимосвязи на основе совпадение документов. Конкретные характеристики набора данных были:

  • Более 4500 задач сопоставления узлов, где каждая задача сопоставления узлов состоит из путей к корню узлов в веб-каталогах.
  • Экспертные сопоставления для всех подходящих задач.
  • Простые отношения. В основном веб-каталоги содержат только один тип отношений, так называемое «отношение классификации».
  • Расплывчатая терминология и принципы моделирования: задачи сопоставления включают типичное моделирование «реального мира» и терминологические ошибки.
СистемаPrec.Рек.F-мера.
DSSim0.600.410.49
СИДР0.600.380.47
Лили0.590.370.46
TaxoMap[10]0.590.390.43
MapPSO[11]0.570.310.40
РИМОМ[12]0.550.170.26
АСМОВ0.640.120.20

В треке каталога в 2008 году участвовало всего 6 систем. F-значение DSSim показал лучшие результаты, однако разница была незначительной по сравнению с системами CIDER или Lily.

использованная литература

  1. ^ Миклош Надь и Мария Варгас-Вера. На пути к автоматической интеграции семантических данных: подход многоагентной структуры. Семантическая сеть. Ган Ву (изд), Глава 7, стр. 107-134; In-Tech Education и Publishing KG; 2010, ISBN  978-953-7619-54-1.
  2. ^ Надь, Миклош; Варгас-Вера, Мария (2011). «Мультиагентная структура отображения онтологий для семантической сети». Транзакции IEEE по системам, человеку и кибернетике - Часть A: Системы и люди. Институт инженеров по электротехнике и радиоэлектронике (IEEE). 41 (4): 693–704. Дои:10.1109 / tsmca.2011.2132704. ISSN  1083-4427.CS1 maint: ref = harv (ссылка на сайт)
  3. ^ Миклош Надь, Мария Варгас-Вера и Энрико Мотта. Многоагентная структура отображения онтологий в системе ответов на вопросы AQUA. то Четвертая мексиканская международная конференция по искусственному интеллекту (MICAI-2005), Конспект лекций по искусственному интеллекту LNAI 3789, Gelbukh, A de Albornoz and H. Terashima (Eds), стр. 70-79, Монтеррей, Мексика, 14–18 ноября 2005 г.
  4. ^ Жером Эузенат, Малгожата Мохол, Павел Швайко, Хайнер Штукеншмидт, Ондрей Сваб, Войтех Святек, Виллем Роберт ван Хаге, Николай Яцкевич: результаты инициативы по оценке согласования онтологий 2006. В материалах 1-го международного семинара по сопоставлению онтологий, ISWC 2006
  5. ^ Жером Евзена, Антуан Исаак, Кристиан Мейлике, Павел Швайко, Хайнер Штукеншмидт, Ондржей Шваб, Войтех Святек, Виллем Роберт ван Хаге, Николай Яцкевич (2007). «Результаты Инициативы по оценке согласования онтологий 2007» (PDF). Материалы 2-го Международного семинара по сопоставлению онтологий, ISWC 2007.CS1 maint: несколько имен: список авторов (ссылка на сайт)
  6. ^ Катерина Караччоло, Жером Эузенат, Лаура Холлинк, Рютаро Ичизе, Антуан Исаак, Вероника Малаезе, Кристиан Мейлике, Хуан Пане, Павел Швайко, Хайнер Штукеншмидт, Ондржей Шваб-Замазечил: результаты инициативы по охране окружающей среды в 2008 г. и Vojtántology. В материалах 3-го Международного семинара по сопоставлению онтологий, ISWC 2008
  7. ^ Жером Эузенат, Альфио Феррара, Лаура Холлинк, Антуан Исаак, Клифф Жослин, Вероник Малазе, Кристиан Мейлике, Андрей Николов, Хуан Панэ, Марта Сабу, Франсуа Шарфф, Павел Швайко, Василис Спилиопуцвенш, Швайнер Швайнер Швайнерштазендж, Швайнер Швайнер Швайнер Касия Троян душ Сантуш, Джордж Вурос и Шэнхуэй Ван: Результаты инициативы по оценке согласования онтологий 2007. В материалах 4-го Международного семинара по сопоставлению онтологий, ISWC 2009
  8. ^ Инициатива по оценке соответствия онтологий :: Библиотечный трек
  9. ^ Инициатива по оценке согласования онтологий :: Название трека
  10. ^ http://sunsite.informatik.rwth-aachen.de/Publications/CEUR-WS/Vol-431/oaei08_paper12.pdf
  11. ^ https://sourceforge.net/projects/mappso/
  12. ^ Хуанзи Ли; Цзе Тан; Йи Ли; Цюн Луо (2019-04-16). «RiMOM: платформа динамического согласования онтологий с множеством стратегий». IEEE Transactions по разработке знаний и данных. 21 (8): 1218–1232. CiteSeerX  10.1.1.649.4619. Дои:10.1109 / TKDE.2008.202.

внешние ссылки