Семантическая совместимость - Semantic interoperability

Семантическая совместимость это способность компьютер системы для обмена данные с недвусмысленным общим смыслом. Семантический совместимость - это требование, позволяющее машинно вычислить логика, логический вывод, обнаружение знаний и объединение данных между информационные системы.[1]

Таким образом, семантическая совместимость касается не только упаковки данных (синтаксис ), но одновременная передача смысла с данными (семантика ). Это достигается путем добавления данных о данных (метаданные ), связывая каждый элемент данных с управляемым, общим словарный запас. Смысл данных передается вместе с самими данными в одном самоописывающем «информационном пакете», который не зависит от какой-либо информационной системы. Именно этот общий словарь и связанные с ним ссылки на онтология, который обеспечивает основу и возможности машинной интерпретации, вывода и логики.

Синтаксическая совместимость (см. ниже ) является предпосылкой семантической совместимости. Синтаксическая совместимость относится к механизмам упаковки и передачи данных. В здравоохранении NHL используется более тридцати лет (что предшествовало появлению Интернета и веб-технологий) и использует вертикальную черту (|) в качестве разделителя данных. Текущий интернет-стандарт для разметка документа является XML, в котором в качестве разделителя данных используется "<>". Разделители данных не передают никакого смысла, кроме как структурировать данные. Без словаря данных для перевода содержимого разделителей данные остаются бессмысленными. Несмотря на то, что существует множество попыток создания словарей данных и информационных моделей для связи с этими механизмами упаковки данных, ни одна из них не была осуществлена. Это только увековечило продолжающуюся «бабелизацию» данных и неспособность обмениваться данными со смыслом.

С момента введения Семантическая сеть концепция Тим Бернерс-Ли в 1999 году,[2] наблюдается растущий интерес и применение W3C (Консорциум World Wide Web), обеспечивающий возможности обмена семантическими данными в масштабе сети, объединения и вывода данных.

Семантика как функция синтаксической совместимости

Синтаксическая совместимость, обеспечиваемая, например, XML или SQL стандартов, является предпосылкой семантического. Он включает в себя общий формат данных и общий протокол для структурирования любых данных, чтобы способ обработки информации можно было интерпретировать из структуры. Это также позволяет обнаруживать синтаксические ошибки, что позволяет принимающим системам запрашивать повторную отправку любого сообщения, которое кажется искаженным или неполным. Семантическая связь невозможна, если синтаксис искажен или не может представить данные. Однако информация, представленная в одном синтаксисе, в некоторых случаях может быть точно переведена в другой синтаксис. Там, где возможен точный перевод синтаксиса, системы, использующие другой синтаксис, также могут точно взаимодействовать. В некоторых случаях возможность точного перевода информации между системами с использованием разных синтаксисов может быть ограничена одним направлением, когда используемые формализмы имеют разные уровни выразительность (умение выражать информацию).

Единая онтология, содержащая представления каждого термина, используемого в каждом приложении, обычно считается невозможной из-за быстрого создания новых терминов или присвоения новых значений старым терминам. Однако, хотя предвидеть каждый концепция, которую пользователь может пожелать представить на компьютере, существует возможность найти некоторый конечный набор «примитивных» представлений концепций, которые можно комбинировать для создания любых более конкретных концепций, которые могут понадобиться пользователям для любого заданного набора приложений или онтологии. Имея базовую онтологию (также называемую верхняя онтология ), который содержит все эти примитивные элементы, обеспечит прочную основу для общей семантической совместимости и позволит пользователям определять любые новые термины, которые им нужны, используя базовый перечень элементов онтологии, и при этом эти вновь определенные термины должным образом интерпретируются любой другой компьютерной системой. который может интерпретировать основную онтологию. Вопрос о том, действительно ли число таких примитивных представлений понятий конечно, или будет неограниченно расширяться, находится в стадии активного исследования. Если он конечен, то стабильная базовая онтология, подходящая для поддержки точной и общей семантической совместимости, может развиваться после того, как некоторая исходная базовая онтология была протестирована и использована широким кругом пользователей. В настоящее время ни одна фундаментальная онтология не была принята широким сообществом, поэтому такая стабильная фундаментальная онтология все еще находится в будущем.

Слова и значения

При обсуждении семантики постоянно возникает недопонимание, это «смешение слов и значений». Значения слов меняются, иногда быстро. Но формальный язык, используемый в онтологии, может кодировать значения (семантику) концепций в неизменяемой форме. Чтобы определить, что означает конкретное слово (или термин в база данных, например) необходимо пометить каждое фиксированное представление концепта в онтологии словом (ами) или термином (ами), которые могут относиться к этому концепту. Когда несколько слов относятся к одному и тому же (фиксированному) понятию в языке, это называется синонимия; когда одно слово используется для обозначения более чем одного понятия, это называется двусмысленность. Двусмысленность и синонимия являются одними из факторов, затрудняющих понимание языка компьютером. Использование слов для обозначения понятий (значения используемых слов) очень чувствительно к контексту и цели любого использования многих понятных человеку терминов. Использование онтологий для поддержки семантического взаимодействия заключается в предоставлении фиксированного набора концепций, значения и отношения которых стабильны и могут быть согласованы пользователями. Затем задача определения терминов и контекстов (каждая база данных представляет собой отдельный контекст) отделяется от задачи создания онтологии и должна выполняться разработчиком базы данных или разработчиком формы для ввода данных. или разработчик программы для понимания языков. Когда значение слова, используемого в некотором интероперабельном контексте, изменяется, то для сохранения интероперабельности необходимо изменить указатель на элемент (ы) онтологии, который определяет значение этого слова.

Требования и языки представления знаний

Язык представления знаний может быть достаточно выразительным, чтобы описывать нюансы значения в хорошо понятных областях. Есть как минимум пять уровней сложности этих[уточнить ].

Для общего полуструктурированные данные можно использовать язык общего назначения, такой как XML.[3]

Языки со всей мощью логика предикатов первого порядка может потребоваться для многих задач.

Человеческие языки очень выразительны, но считаются слишком неоднозначными, чтобы обеспечить желаемую точную интерпретацию, учитывая текущий уровень технологии человеческого языка.

Предварительное согласие не требуется

Семантическую интероперабельность можно отличить от других форм интероперабельности, если учесть, имеет ли передаваемая информация в переданной форме все значение, необходимое принимающей системе для ее правильной интерпретации, даже если алгоритмы используемые принимающей системой неизвестны отправляющей системе. Рассмотрите возможность отправки одного числа:

Если это число должно быть денежной суммой, которую одна компания должна другой, это подразумевает действие или бездействие со стороны как тех, кто его отправляет, так и тех, кто его получает.

Его можно правильно интерпретировать, если он отправлен в ответ на конкретный запрос и получен в то время и в ожидаемой форме. Эта правильная интерпретация зависит не только от самого числа, которое может представлять почти любой из миллионов типов количественных измерений, но и зависит строго от обстоятельств передачи. То есть интерпретация зависит от обеих систем, ожидающих, что алгоритмы в другой системе используют число в точно таком же смысле, и дополнительно зависит от всего пакета передач, которые предшествовали фактической передаче голого числа. Напротив, если передающая система не знает, как информация будет использоваться другими системами, необходимо иметь общее соглашение о том, как информация с определенным значением (из многих возможных значений) будет появляться в сообщении. Для конкретной задачи одним из решений является стандартизация формы, например, запроса на оплату; этот запрос должен будет стандартным образом закодировать всю информацию, необходимую для его оценки, такую ​​как: агент должен деньги, агент должен деньги, характер действия, приводящего к возникновению долга, агенты, товары , services и других участников этого действия; время действия; сумма долга и валюта, в которой он рассчитывается; время, отведенное для оплаты; требуемая форма оплаты; и другая информация. Когда две или более системы договорились о том, как интерпретировать информацию в таком запросе, они могут достичь семантической совместимости. для этого конкретного типа транзакции. Для семантической совместимости в целом необходимо предоставить стандартизованные способы описания значений гораздо большего, чем просто коммерческие транзакции, и количество концепций, представление которых необходимо согласовать, составляет как минимум несколько тысяч.

Онтологические исследования

Как достичь семантической совместимости для более чем нескольких ограниченных сценариев в настоящее время является предметом исследований и дискуссий. Для проблемы общей семантической совместимости используется некоторая форма базовой онтологии ('верхняя онтология '), который является достаточно полным, чтобы дать определение концепций для более специализированных онтологий в нескольких областях. За последнее десятилетие было разработано более десяти базовых онтологий, но ни одна из них еще не была принята широким кругом пользователей.

Потребности в единой всеобъемлющей всеобъемлющей онтологии для поддержки семантической совместимости можно избежать, разработав общую базовую онтологию как набор базовых («примитивных») концепций, которые можно комбинировать для создания логических описаний значений терминов, используемых в онтологии локального домена или локальные базы данных. Эта тактика основана на том принципе, что:

Если:

(1) значения и использование примитивных элементов онтологии в базовой онтологии согласованы, и (2) элементы онтологии в онтологиях предметной области конструируются как логические комбинации элементов в базовой онтологии,

Потом:

Предполагаемые значения элементов онтологии предметной области могут быть автоматически вычислены с помощью логики логики FOL (логики первого порядка) любой системой, которая принимает значения элементов в базовой онтологии и имеет как базовую онтологию, так и логические спецификации элементы в онтологии предметной области.

Следовательно:

Любая система, желающая точно взаимодействовать с другой системой, должна передавать только подлежащие передаче данные, а также любые логические описания терминов, используемых в этих данных, которые были созданы локально и еще не входят в общую базовую онтологию.

Эта тактика затем ограничивает необходимость предварительного согласования значений только теми элементами онтологии в общей онтологии основания (FO). Исходя из нескольких соображений, это, вероятно, будет менее 10 000 элементов (типов и отношений).

На практике, вместе с FO, сфокусированным на представлении примитивных концепций, вероятно, также будет использоваться набор онтологий расширения предметной области для FO с элементами, заданными с помощью элементов FO. Такие уже существующие расширения снизят стоимость создания онтологий предметной области, предоставив существующим элементам предполагаемое значение, и уменьшат вероятность ошибки при использовании элементов, которые уже были протестированы. Онтологии доменных расширений могут быть логически несовместимы друг с другом, и это необходимо определить, используются ли разные доменные расширения в любом обмене данными.

Также исследуется вопрос о том, можно ли избежать использования такой единой базовой онтологии с помощью сложных методов отображения среди независимо разработанных онтологий.

Важность

Практическое значение семантического взаимодействия было измерено в нескольких исследованиях, в которых оценивается стоимость (в потерянной эффективности) из-за отсутствия семантического взаимодействия. Одно исследование,[4] акцентируя внимание на потерянной эффективности передачи медицинской информации, по оценкам, 77,8 млрд долларов США в год можно было бы сэкономить за счет внедрения эффективного стандарта совместимости в этой области. Другие исследования в строительной отрасли[5] и цепи поставок автомобилестроения,[6] оценивают затраты в более чем 10 миллиардов долларов США в год из-за отсутствия семантической совместимости в этих отраслях. В сумме эти цифры могут быть экстраполированы, чтобы показать, что ежегодно теряется более 100 миллиардов долларов США из-за отсутствия широко используемого стандарта семантической совместимости только в США.

Еще не проводилось исследование каждой области политики, которая могла бы обеспечить значительную экономию средств за счет применения стандартов семантической совместимости. Но чтобы увидеть, какие области политики могут получить прибыль от семантической совместимости, см.Совместимость ' в целом. Такие поля политики электронное правительство, здоровье, безопасность и многое другое. ЕС также учредил Центр семантической совместимости в Европе в июне 2007 г.

Смотрите также

Рекомендации

  1. ^ NCOIC, "ОБЪЕМ", Консорциум индустрии сетевых операций, 2008
  2. ^ Бернерс-Ли, Тим; Фишетти, Марк (1999). Плетение сети. HarperSanFrancisco. Глава 12. ISBN  978-0-06-251587-2.
  3. ^ XML как инструмент семантического взаимодействия Семантическая совместимость в Интернете, Джефф Хефлин и Джеймс Хендлер
  4. ^ Ян Уокер, Эрик Пэн, Дуглас Джонстон, Джулия Адлер-Мильштейн, Дэвид Бейтс и Блэкфорд Миддлтон, Ценность обмена медицинской информацией и функциональной совместимости Департамент здравоохранения, 19 января 2005 г.
  5. ^ Microsoft Word - 08657 Final Rpt_8-2-04.doc
  6. ^ https://www.nist.gov/director/prog-ofc/report99-1.pdf

внешняя ссылка