Gellish - Gellish

Gellish является язык онтологии для хранения данных и передачи данных, разработанный Андриес ван Ренссен с середины 1990-х годов.[1] Он начинался как язык инженерного моделирования («Generic Engineering Language», дав ему название «Gellish»), но превратился в универсальный и расширяемый концептуальное моделирование данных язык с общими приложениями. Поскольку он включает в себя терминологию и определения, относящиеся к предметной области, он также является семантическое моделирование данных язык и методология моделирования Gellish является членом семейства методологий семантического моделирования.

Хотя его концепции имеют «имена» и определения на различных естественных языках, Gellish - это естественный язык -независимый формальный язык. Любой вариант естественного языка, например, Gellish Formal English, является контролируемый естественный язык. Информация и знания могут быть выражены таким образом, что они могут быть интерпретированы компьютером, а также независимы от системы и естественного языка. Каждый вариант естественного языка представляет собой структурированное подмножество этого естественного языка и подходит для информационного моделирования и представление знаний на этом конкретном языке. Все выражения, концепции и отдельные вещи представлены в Gellish с помощью (числовых) уникальных идентификаторов (Gellish UID). Это позволяет программному обеспечению переводить выражения с одного формального естественного языка на любые другие формальные естественные языки.


Обзор

Gellish предназначен для выражения фактов (утверждений), запросов, ответов и т. Д. Например, для полной и однозначной спецификации бизнес-процессов, продуктов, средств и физических процессов; для информации об их приобретении, изготовлении, установке, эксплуатации и обслуживании; и для обмена такой информацией между системами, хотя и системно-независимым, интерпретируемым компьютером и независимым от языка способом. Он также предназначен для выражения знаний и требований о таких вещах.

Определение Gellish можно вывести из определения Gellish Formal English, рассматривая «выражения» как отношения только между Уникальными идентификаторами. Определение Gellish Formal English приведено в Gellish English Dictionary - Таксономия, что является большимумный словарь 'концептов со связями между этими концептами (ранее он назывался STEPlib). Словарь-таксономия называется «умным словарем», потому что понятия расположены в виде подтип -супертипная иерархия, что делает его таксономия что поддерживает наследование свойств от понятий супертипа до понятий подтипа. Более того, поскольку вместе с другими отношениями между понятиями умный словарь расширяется до онтология. Gellish имеет в основном расширенную структуру объект-отношение-объект для выражения фактов отношениями, тогда как каждый факт может сопровождаться рядом вспомогательных фактов о главном факте. Примерами вспомогательных фактов являются автор, дата, статус и т. Д. Для обеспечения однозначной интерпретации Gellish включает определение большого числа (более 650) стандартных типов отношений, которые определяют возможности богатого семантического выражения языка.

В принципе, для каждого естественного языка есть свой вариант Gellish, специфичный для этого языка. Например, Gellish Dutch (Gellish Nederlands), Gellish Italian, Gellish English, Gellish русский и т. д. Gellish не изобретает собственной терминологии, такой как эсперанто, но использует термины из естественных языков. Таким образом, словарь-таксономия Gellish English подобен (электронному) обычному словарю, который расширен дополнительными понятиями и отношениями между понятиями.

Например, словарь-таксономия Gellish содержит определения многих понятий, которые также встречаются в обычных словарях, таких как виды физических объектов, таких как здание, самолет, автомобиль, насос, труба, такие свойства, как масса и цвет, шкалы, такие как кг и бар. , а также виды деятельности и процессы, такие как ремонт, отопление и т. д. Кроме того, в словаре есть понятия со сложными названиями, например, «шпилька-теплообменник», которая не встречается в обычных словарях. Основное отличие от обычных словарей состоит в том, что словарь Gellish также включает определения стандартных видов отношений (типы отношений), которые обозначаются стандартными фразами Gellish English. Например, он определяет типы отношений, такие как «является подтипом», «классифицируется как а», «имеет как аспект», «количественно оценивается как», «может быть исполнителем а», «должен иметь как часть ⟩ И т. Д. Такие стандартные типы отношений и определения концептов позволяют программному обеспечению на основе Gellish правильно и однозначно интерпретировать выражения Gellish.

Желтоватые выражения могут быть выражены в любом подходящем формате, например SQL или же RDF или же СОВА или даже в виде таблицы электронных таблиц при условии, что их содержимое эквивалентно табличной форме Gellish Naming Tables (которые определяют словарь) и Fact Tables (вместе определяют содержимое Gellish Database) или эквивалентно Gellish Message Tables (для обмена данными). Пример ядра таблицы сообщений следующий:

Левый членТип отношенияПравый термин
центробежный насосэто подтипнасос
П-123классифицируется какцентробежный насос
П-123имеет как аспектмасса Р-123
масса Р-123классифицируется какмасса
масса Р-123квалифицируется как50 кг

Полная таблица сообщений Gellish требует дополнительных столбцов для уникальных идентификаторов, цели выражения, языка выражения, количества элементов, единицы измерения, контекста действительности, статуса, даты создания, автора, ссылок и различных других столбцов. Gellish Light требует только трех столбцов выше, но тогда он не поддерживает, например, возможности различать омонимы; автоматический перевод; управление версиями и т. д. Эти и некоторые другие возможности поддерживаются Full Gellish. В следующем примере показано использование некоторых дополнительных столбцов в таблице сообщений Gellish, где UoM означает «единица измерения».

Факт UIDНамерениеЛевый UIDЛевый срокRelat. UIDТип отношенияПравый UIDПравильный срокUID UoMUoMПоложение дел
201утверждение130058центробежный насос1146это подтип130206насоспринято
202утверждение102П-1231225классифицируется как130058центробежный насоспредложил
203утверждение102П-1231727имеет как аспект103масса Р-123предложил
204утверждение103масса Р-1231225классифицируется как550020массапредложил
205утверждение103масса Р-1235020квалифицируется как92030350570039кгпредложил

Набор стандартных типов отношений определяет виды фактов, которые могут быть выражены на геллишском языке, хотя любой может создать свое собственное расширение словаря и, таким образом, может добавлять концепции и типы отношений по мере необходимости.

Поскольку Gellish является формальным языком, любое выражение Gellish может использовать только те концепции, которые определены в Gellish словаре, или определение любого понятия должно быть специальным в коллекции Gellish выражений. Базы знаний могут быть созданы с использованием Gellish языка и его определений в Gellish Dictionary. Примеры применения словаря Gellish используются в качестве источника классов для классификация оборудования, документов и т. д. или в качестве стандартной терминологии (метаданные ) или для согласования данных в различных компьютерных системах, или как тезаурус или таксономию в поисковый движок.

Gellish обеспечивает автоматический перевод и позволяет использовать синонимы, аббревиатуры и коды, а также омонимы благодаря использованию уникального независимого идентификатора естественного языка (UID) для каждого понятия. Например, 130206 (насос) и 1225 (классифицируется как а). Это гарантирует, что понятия идентифицируются независимым от естественного языка способом. Поэтому разные словари Gellish используют одни и те же UID для одного и того же понятия. Это означает, что эти словари предоставляют переводы имен объектов, а также перевод стандартных типов отношений. UID позволяют автоматически переводить и представлять информацию и знания, которые выражены в одном языковом варианте Gellish, и представлять их с помощью программного обеспечения на любом другом языке, для которого доступен Gellish словарь. Например, фраза «классифицируется как a» и фраза «st klassifiziert als »являются обозначениями одного и того же UID 1225.
Например, компьютер может автоматически выразить вторую строку в приведенном выше примере на немецком языке следующим образом:

Левый членТип отношенияПравый термин
П-123ist klassifiziert alsЦентробежный насос

Также могут быть высказаны вопросы (запросы). Запросы упрощаются с помощью стандартных терминов, таких как что, что, где и когда. Их можно использовать в сочетании с зарезервированными UID для неизвестных в диапазоне 1–100. Это позволяет использовать выражения Gellish для таких запросов, как:

- запрос: что <находится в> Париже

Программное обеспечение на основе Gellish должно быть в состоянии предоставить правильный ответ на этот запрос, сравнивая выражение с фактами в базе данных, и должно ответить:

- ответ: Эйфелева башня <находится в> Париже

Обратите внимание, что возможность автоматического перевода подразумевает, что запрос / вопрос, выраженный на определенном языке, например на английском, может использоваться для поиска в базе данных Gellish на другом языке (например, китайском), тогда как ответ может быть представлен на английском языке.

Информационные модели на Gellish

Информационные модели можно разделить на две основные категории:

  • Модели об отдельных вещах. Эти модели могут касаться отдельных физических объектов, а также действий, процессов и событий или их комбинации. Информационная модель об отдельном физическом объекте и, возможно, также о его эксплуатации и обслуживании, таком как технологический завод, корабль, самолет, объект инфраструктуры или типовая конструкция (например, автомобиля или компонента), называется Информационная модель объекта или Модель продукта, тогда как для здания это называется Информационная модель здания (BIM). Эти модели об отдельных вещах характеризуются своей иерархией состава, которая определяет (все) их части, и тем фактом, что сборки, а также части классифицируются по видам или типам вещей.
  • Модели о разных вещах. Эти модели выражаются как совокупность отношений определенного вида между видами вещей. Их можно далее подразделить на следующие подкатегории:
- Модели знаний, которые представляют собой наборы выражений фактов о том, что может иметь место (смоделированные знания).
- Модели требований, которые представляют собой наборы выражений фактов о том, что должно иметь место в конкретном контексте действительности (смоделированные требования). Это может включать смоделированные версии содержания документов требований, таких как стандартные спецификации и стандартные типы компонентов (например, в каталогах компонентов и оборудования).
- Модели определения, каждая из которых состоит из семантический фрейм. Модель определения - это набор выражений о том, что по определению является случаем для всех вещей в своем роде. Электронный интеллектуальный словарь-таксономия или онтология Gellish является примером набора моделей определений.
- Модели, представляющие собой коллекции, включающие комбинацию выражений вышеуказанных типов.

Все эти категории моделей могут включать чертежи и другие документы, а также информацию о трехмерных формах (ядро трехмерных моделей). Все они могут быть выражены и интегрированы в Gellish.

Отношение классификации между отдельными вещами и видами вещей делает определения, знания и требования о видах вещей доступными для отдельных вещей. Более того, иерархия подтипа-супертипа в Gellish Dictionary-Taxonomy подразумевает, что знания и требования, которые определены для определенного типа вещей, наследуются всеми их подтипами. Как следствие, когда кто-то проектирует индивидуальный элемент и классифицирует его по определенному типу, тогда все знания и требования, которые известны для супертипов этого типа, также будут распознаны и могут быть доступны автоматически.

Каждая категория информационной модели требует своей собственной семантики, потому что для выражения индивидуального факта, что что-то реальное имеет место, требуются другие виды отношений, чем выражение общего факта, что что-то может иметь место, что опять же отличается от факта, выражающего что что-то должно иметь место в конкретном контексте или что что-то по определению всегда так. Эти семантические различия приводят к тому, что различные категории информационных моделей требуют своих собственных подмножеств стандартных типов отношений, поэтому Геллиш проводит различие между следующими категориями типов отношений:

  • Типы отношений для отношений между видами вещей (классами). Они предназначены для выражения знаний, требований и определений. Различные подкатегории знаний, требований и определений моделируются с помощью различных видов отношений: типов отношений для вещей, которые могут иметь место, вещей, которые должны иметь место, и вещей, которые по определению имеют место. Все три в пределах применимых ограничения мощности. Например, отношение специализации в первой строке в приведенном выше примере используется для определения концепции (центробежный насос). Типы отношений <могут иметь как часть> и <должны иметь как часть> - это примеры видов отношений, которые используются для определения знаний и требований соответственно.
  • Типы отношений для отношений между отдельными вещами. Они предназначены для выражения информации об отдельных вещах. Например, наличие аспектного отношения на третьей из вышеуказанных строк.
  • Типы отношений для отношений между отдельными вещами и видами вещей. Они предназначены для связи между отдельными вещами и общими понятиями в словаре (или с частными расширениями этого словаря). Например, приведенные выше классификационные и квалификационные отношения.
  • Типы отношений для отношений между коллекциями и для отношений между коллекцией и элементом в коллекции или общим аспектом всех элементов.

Gellish базы данных и сообщения обмена данными

Gellish обычно выражается в форме Gellish Data Tables. Есть три категории таблиц данных:

  • Таблицы именования, которые содержат словарь словаря и собственные термины, которые используются в выражениях.
  • Таблицы фактов, которые содержат выражения фактов в форме отношений между UID, вместе с рядом вспомогательных фактов.

А Gellish База данных обычно состоит из одной или нескольких таблиц именования и одной или нескольких таблиц фактов вместе. Таблицы данных и таблицы фактов однозначно эквивалентны таблицам сообщений.

  • Таблицы сообщений, которые объединяют содержимое таблиц имен и таблиц фактов в объединенные таблицы. Таблицы сообщений предназначены для обмена данными между системами и сторонами. Таблица сообщений - это единая стандартная таблица для выражения любых фактов, включая уникальные идентификаторы (UID 'для фактов), типы отношений и связанные объекты, но также включая их имена (термины) и ряд вспомогательных фактов, все объединено в одну таблицу. Несколько таблиц сообщений в разных местах можно объединить в одну распределенную базу данных.

Все столбцы таблицы стандартизированы, поэтому каждая таблица данных Gellish категории содержит одни и те же стандартные столбцы или подмножество стандартных столбцов. Это обеспечивает стандартные интерфейсы для обмена данными между системами приложений. Содержимое таблиц данных может также включать ограничения и требования (модели данных ), которые определяют тип данных, которые должны и могут быть предоставлены для конкретных приложений. Такие модели требований делают специализированные проекты баз данных излишними. Таблицы Gellish Data могут использоваться как часть центральной базы данных или могут формировать распределенные базы данных, но таблицами также можно обмениваться в файлах обмена данными или в качестве тела Gellish Messages.

Таблица именования связывает термины в языковом и языковом сообществе («речевое сообщество») с уникальным идентификатором. Это позволяет однозначно использовать синонимы, сокращения и коды, а также омонимы на нескольких языках. Следующая таблица является примером таблицы именования:

UID языкаUID языкового сообществаUID на срокОбратный индикаторСрок (имя)Комментарий
9100361932631302060насосАнглийский инженерный термин для концепции 130206
9100381932631302060ПомпаНемецкий
9100371932631302060пышностьнидерландский язык

Обратный индикатор уместен только тогда, когда фразы используются для обозначения типов отношений, потому что каждый стандартный тип отношения обозначается как минимум одной стандартной фразой, а также как минимум одной стандартной обратной фразой. Например, фраза имеет обратную фразу . Обе фразы обозначают один и тот же вид отношения (композиционное отношение). Однако, когда обратная фраза используется для выражения факта, тогда левый и правый объекты в выражении должны иметь обратное положение. Таким образом, следующие выражения будут распознаваться как два равнозначных выражения одного и того же факта (с одним и тем же UID факта):

- A <является частью> B- B <имеет как часть> A

Таким образом, обратный индикатор указывает для типов отношений, является ли фраза базовой фразой (1) или обратной фразой (2).

Таблица фактов содержит выражения любых фактов, каждый из которых сопровождается рядом вспомогательных фактов, которые предоставляют дополнительную информацию, относящуюся к основным фактам. Примеры вспомогательных фактов: намерение, статус, автор, дата создания и т. Д.

Таблица фактов Gellish состоит из столбцов для основного факта и ряда столбцов для вспомогательных фактов. Вспомогательные факты позволяют указать такие вещи, как роли, мощности, контексты действительности, единицы измерения, дату последнего изменения, автора, ссылки и т. Д .:
Столбцы для основного факта в таблице фактов:

- UID факта, который выражен в этой строке таблицы 
- UID намерения, с помощью которого факт передается или сохраняется (например, как утверждение, запрос и т. д.)
- UID левого объекта
- UID типа отношения
- UID правого объекта
- UID единицы измерения (необязательно)
- строка, образующая описание (текстовое определение) левого объекта.

Эти столбцы также отображаются в таблице сообщений, как показано ниже.

Полная таблица Gellish Message - это фактически комбинация таблицы имен и таблицы фактов. Он содержит не только столбцы для выражения фактов, но также столбцы для имен связанных объектов и дополнительные столбцы для выражения вспомогательных фактов. Это позволяет использовать единую таблицу, а также для спецификации и использования синонимов и омонимов, нескольких языков и т. Д. Ядро таблицы сообщений показано в следующей таблице:

ЯзыкUID левого объектаНазвание левого объектаUID фактаUID типа отношенияИмя типа отношенияUID правого объектаНазвание правого объектаПоложение дел
английский101Эйфелева башня2015138расположен в102Парижпринято
английский101Эйфелева башня2021225классифицируется как40903башняпринято
английский102Париж2031225классифицируется как700008городпринято

В приведенном выше примере концепции с именами, а также (стандартные) типы отношений выбираются с их UID из словаря Gellish English Dictionary.

Таблица Gellish Database может быть реализована в любом табличном формате. Например, он может быть реализован как база данных на основе SQL или иначе, как файл STEP (согласно ISO 10303 -21) или в виде простой электронной таблицы, как в Excel, например, самого Gellish Dictionary.
Таблицы Gellish базы данных также могут быть описаны в эквивалентной форме с помощью RDF /Обозначение3 или же XML. Представление «Gellish in XML» определено в стандарте Схема XML. XML-файл с данными в соответствии с этой XML-схемой рекомендуется иметь в качестве расширения файла GML, тогда как GMZ означает «Gellish in XML zip».

Одно из различий между Gellish и RDF, XML или OWL заключается в том, что Gellish English включает обширный английский словарь понятий, в том числе большой (и расширяемый) набор стандартных типов отношений для создания интерпретируемых компьютером выражений (в форме, которая также является доступно для чтения не ИТ-профессионалам). С другой стороны, «языки», такие как RDF, XML и OWL, определяют только несколько основных концепций, что оставляет большую свободу их пользователям определять свои собственные концепции «языка предметной области».
Эта привлекательная свобода имеет тот недостаток, что пользователи таких «языков», как RDF, XML или OWL, по-прежнему не используют общий язык и по-прежнему не могут интегрировать данные, полученные из разных источников. Желтый язык разработан, чтобы обеспечить реальный общий язык, по крайней мере в гораздо большей степени и, следовательно, обеспечивает большую стандартизацию и единообразие терминологии и выражений.

Gellish по сравнению с OWL

СОВА (Язык веб-онтологий / Ontological Web Language) и Gellish предназначены для использования на семантическая сеть. Gellish можно использовать в сочетании с OWL или отдельно. Между двумя языками есть много общего, например, использование уникальных идентификаторов (Gellish UID, OWL URI (Унифицированные идентификаторы ресурсов ))[2] но и важные отличия. Основные отличия заключаются в следующем:

1. Целевая аудитория и мета-уровень
OWL - это метаязык, включая базовую грамматику, но без словаря. OWL предназначен для использования разработчиками компьютерных систем и разработчиками онтологий для создания онтологий. Gellish - это язык, который включает в себя грамматику, а также словарь-таксономию и онтологию. Gellish предназначен для использования разработчиками компьютерных систем, а также конечными пользователями, а также может использоваться разработчиками онтологий, когда они хотят расширить онтологию Gellish или построить свою собственную онтологию предметной области. Gellish не делает различия между метаязыком и языком пользователя; концепции из обоих «миров» объединены на одном языке. Итак, словарь Gellish English содержит понятия, эквивалентные концепциям OWL, но также содержит понятия из обычного английского словаря.

2. Словари и онтологии
OWL можно использовать для явного представления значений терминов в словари и отношения между этими терминами. Другими словами, его можно использовать для определения таксономии или же онтологии. Термины из такого словаря не становятся частью языка OWL. Таким образом, OWL не содержит определений терминов на естественном языке, таких как дорога, автомобиль, болт или длина. Однако его можно использовать для их определения и построения онтологии.
Верхняя часть онтологии Gellish также может использоваться для определения терминов и отношений между ними. Однако многие из таких терминов естественного языка уже определены в самой нижней части словаря-таксономии Gellish. Таким образом, в гелльском языке такие термины, как дорога, машина, болт или длина, являются частью гелльского языка. Таким образом, Gellish English - это разновидность естественного английского языка.

3. Синонимы и многоязычие.
Геллиш проводит различие между концепциями и различными терминами, которые используются в качестве имен (синонимов, сокращений и переводов) для обозначения этих концепций в разных контекстах и ​​на разных языках. Каждое понятие идентифицируется уникальным идентификатором, который не зависит от естественного языка и может иметь множество различных терминов на разных языках для обозначения концепции. Это обеспечивает автоматический перевод между различными версиями Gellish на естественном языке. В OWL различные термины на разных языках и синонимы, в принципе, представляют собой разные концепции, которые должны быть объявлены одинаковыми с помощью явных отношений эквивалентности (если альтернативы не выражены в терминах свойств аннотации альтернативных меток).[3] С одной стороны, подход OWL проще, но он делает выражения неоднозначными и делает интеграция данных а автоматический перевод значительно усложняется.

4. Верхняя онтология
OWL можно рассматривать как верхняя онтология который состоит из 54 «языковых конструкций» (конструкторов или концептов).[4] Верхняя часть онтологии Gellish в настоящее время состоит из более чем 1500 концептов, из которых около 650 являются стандартными типами отношений. В дополнение к этому Gellish Dictionary-Taxonomy содержит более 40 000 концепций. Это свидетельствует о большом семантический богатство и выразительные возможности Gellish. Кроме того, Gellish содержит определения многих фактов об определенных концепциях, которые выражаются как отношения между этими концепциями.

5. Расширяемость
OWL имеет фиксированный набор понятий (терминов), которые расширяются только при расширении стандарта OWL. Gellish может быть расширен любым пользователем под Открытый исходный код условия.

История

Gellish - это дальнейшее развитие ISO 10303 -221 (AP221) и ISO 15926. Gellish - это интеграция и расширение концепций, определенных в обоих стандартах. Основное различие с обоими стандартами ISO заключается в том, что Gellish проще в реализации, имеет более (точные) возможности семантического выражения, а также подходит для выражения запросов и ответов. Особая философия пространственно-временных частей, которая используется в ISO 15926 для представления дискретных периодов времени для представления времени, также может использоваться в Gellish, однако рекомендуемое представление времени в Gellish является более интуитивным методом, который указывает, что факты имеют определенную достоверность. продолжительность. Например, каждое свойство может иметь несколько числовых значений на шкале, которая выражается в виде нескольких фактов, тогда как для каждого из этих фактов может быть добавлена ​​(необязательная) спецификация момента или периода времени, в течение которого этот факт действителен.

Подмножество Gellish Dictionary (Taxonomy) используется для создания ISO 15926 -4. Gellish в RDF стандартизируется как ISO 15926 -11.

Рекомендации

  1. ^ Ван Ренссен, 2006
  2. ^ Филдинг (2005).
  3. ^ Стивенс (2012).
  4. ^ "Обзор языка веб-онтологий OWL". w3c. Получено 5 апреля 2019.

Библиография

внешняя ссылка