Попытка контролируемого английского - Attempto Controlled English

Попытка контролируемого английского (ТУЗ) это контролируемый естественный язык, т.е. подмножество стандартных английский с ограниченным синтаксисом и ограниченной семантикой, описываемой небольшим набором правил построения и интерпретации.[1] Он разрабатывался в Цюрихский университет с 1995 года. В 2013 году была анонсирована версия 6.7 ACE.[2]

ACE может служить представление знаний, Технические характеристики, и язык запросов, и предназначен для профессионалов, которые хотят использовать формальные обозначения и формальные методы, но могут быть не знакомы с ними. Хотя ACE кажется совершенно естественным - его может прочитать и понять любой человек, говорящий по-английски - на самом деле это формальный язык.[1]

ACE и связанные с ним инструменты использовались в областях спецификации программного обеспечения, доказательство теорем, текстовые резюме, онтологии, правила, запросы, медицинская документация и планирование.

Вот несколько простых примеров:

  1. Каждая женщина - человек.
  2. Женщина - это человек.
  3. Мужчина примеряет новый галстук. Если галстук нравится его жене, мужчина покупает его.

Правила построения ACE требуют, чтобы каждое существительное вводилось определителем (а, каждый, нет, немного, не менее 5, ...). Что касается приведенного выше списка примеров, правила интерпретации ACE решают, что (1) интерпретируется как универсально определяемый, а (2) интерпретируется как экзистенциально количественно. Такие предложения, как «Женщины - люди», не соответствуют синтаксису ACE и, следовательно, недействительны.

Правила интерпретации разрешают анафорические ссылки в (3): галстук и Это второго предложения относятся к новый галстук первого предложения, а его и тот человек второго предложения относятся к человек первого предложения. Таким образом, текст ACE представляет собой связную совокупность анафорически связанных предложений.

Механизм анализа попыток (APE) однозначно переводит тексты ACE в структуры представления дискурса (DRS), которые используют вариант языка логика первого порядка.[3] В дальнейшем DRS можно перевести на другие формальные языки, например AceRules с разной семантикой,[4] СОВА,[5] и SWRL. Перевод текста ACE в (фрагмент) логики первого порядка позволяет пользователям: причина о тексте, например, чтобы проверять, к подтверждать, и чтобы запрос Это.

Обзор

В качестве обзора текущей версии 6.6 ACE этот раздел:

  • Кратко описывает словарный запас
  • Дает отчет о синтаксисе
  • Обобщает обработку неоднозначности.
  • Объясняет обработку анафорических ссылок.

Словарный запас

Словарь ACE включает:

  • Предопределенные функциональные слова (например, определители, союзы)
  • Предопределенные фразы (например, "это ложь, что ...", "возможно, что ...")
  • Слова содержания (например, существительные, глаголы, прилагательные, наречия).

Грамматика

Грамматика ACE определяет и ограничивает форму и значение предложений и текстов ACE. Грамматика ACE выражается как набор правила строительства. Смысл предложений описывается как небольшой набор правила интерпретации. А Руководство по устранению неполадок описывает, как использовать ACE и как избежать ошибок.

Тексты ACE

Текст ACE - это последовательность повествовательных предложений, которые могут быть анафорически взаимосвязаны. Кроме того, ACE поддерживает вопросы и команды.

Простые предложения

Простое предложение утверждает, что что-то имеет место - факт, событие, состояние.

Температура -2 ° C.
Покупатель вставляет 2 карты.
Действительны карта и код.

Простые предложения ACE имеют следующую общую структуру:

подлежащее + глагол + дополнения + дополнения

В каждом предложении есть подлежащее и глагол. Дополнения (прямые и косвенные объекты) необходимы для переходных глаголов (вставить что-нибудь) и дитранзитивные глаголы (дать что-нибудь кому-нибудь), тогда как дополнения (наречия, предложные фразы) необязательны.

Все элементы простого предложения можно детализировать, чтобы описать ситуацию более подробно. Для дальнейшего уточнения существительных покупатель и карта, мы могли бы добавить прилагательные:

Доверенный клиент вставляет две действующие карты.

притяжательные существительные и из-предложительные фразы:

Клиент Джона вставляет карточку Мэри.

или переменные как аппозиции:

Джон вставляет карточку A.

Возможны и другие модификации существительных через относительные предложения:

Клиент, которому доверяют, вставляет свою карту.

которые описаны ниже, поскольку они составляют составное предложение. Мы также можем подробно описать событие вставки, например добавив наречие:

Клиент вставляет несколько карточек вручную.

или, что то же самое:

Клиент вручную вставляет несколько карточек.

или, добавив предложные фразы:

Покупатель вставляет несколько карт в слот.

Мы можем объединить все эти разработки, чтобы получить:

Клиент Джона, которому доверяют, вставляет действительную карту Мэри вручную в слот A.

Составные предложения

Составные предложения рекурсивно строятся из более простых предложений через координация, подчинение, количественная оценка, и отрицание. Обратите внимание, что составные предложения ACE перекрываются с тем, что лингвисты называют составными предложениями и сложными предложениями.

Координация

Координация и возможно между предложениями и фразами одного синтаксического типа.

Клиент вставляет карту, и автомат проверяет код.
Есть покупатель, который вставляет карту и вводит код.
Клиент вставляет карту и вводит код.
Старый и проверенный клиент вводит карту и код.

Обратите внимание, что согласованность словосочетаний с существительными карточка и код представляет объект множественного числа.

Координация или же возможно между предложениями, глагольными фразами и относительными придаточными предложениями.

Покупатель вставляет карту или автомат проверяет код.
Клиент вставляет карту или вводит код.
У клиента есть недействительная или поврежденная карта.

Координация и и или же регулируется стандартным логическим порядком привязки, т.е. и связывает сильнее, чем или же. Запятые можно использовать для отмены стандартного порядка привязки. Таким образом, предложение:

Клиент вставляет карту VisaCard или карту MasterCard и вставляет код.

означает, что клиент вставляет карту VisaCard и код или, альтернативно, MasterCard и код.

Подчинение

Есть четыре конструкции подчинения: относительные предложения, если-то предложения, модальность и подчиненность предложений.

Относительные предложения, начинающиеся с ВОЗ, который, и который позволяют добавлять детали к существительным:

Клиент, которому доверяют, вставляет свою карту.

С помощью если-то предложения мы можем указать условные или гипотетические ситуации:

Если карта действительна, покупатель вставляет ее.

Обратите внимание на анафорическую ссылку через местоимение Это в тогда-часть к существительной фразе карточка в если-часть.

Модальность позволяет нам выразить возможность и необходимость:

Доверенный клиент может / должен вставить карту.
Возможно / необходимо, чтобы доверенный клиент вставил карту.

Подчинение приговора принимает разные формы:

Верно / неверно, что покупатель вставляет карту.
Невозможно доказать, что покупатель вставляет карту.
Клерк считает, что покупатель вставляет карту.
Количественная оценка

Количественная оценка позволяет говорить обо всех объектах определенного класса (универсальная количественная оценка ), либо явно обозначить существование хотя бы одного объекта этого класса (экзистенциальная количественная оценка ). Текстуальное вхождение универсального или экзистенциального квантора открывает его область действия, которая простирается до конца предложения или, согласованно, до конца соответствующего согласованного предложения.

Чтобы выразить, что все вовлеченные клиенты вставляют карты, мы можем написать

Каждый покупатель вставляет карту.

Это предложение означает, что каждый покупатель вставляет карту, которая может совпадать или не совпадать с картой, вставленной другим покупателем. Чтобы указать, что все клиенты вставляют одну и ту же карту - какой бы нереалистичной ни казалась эта ситуация - мы можем написать:

Карту вставляет каждый покупатель.

или, что то же самое:

Есть карточка, которую вставляет каждый покупатель.

Чтобы указать, что каждую карту вставляет покупатель, мы пишем:

Каждую карту вставляет покупатель.

или, несколько косвенно:

Каждую карту вставляет покупатель.
Отрицание

Отрицание позволяет нам сказать, что что-то не так:

Клиент не вставляет карту.
Карта недействительна.

Чтобы отрицать что-либо для всех объектов определенного класса, используется нет:

Ни один покупатель не вставляет более двух карт.

или же, здесь нет:

Нет клиента, вставляющего карту.

Чтобы отрицать полное утверждение, используется отрицание предложения:

Неверно, что покупатель вставляет карту.

Эти формы отрицания являются логическими отрицаниями, т. Е. Утверждают, что что-то доказуемо не так. Отрицание как несостоятельность утверждает, что положение дел нельзя доказать, то есть нет информации о том, так обстоит дело или нет.

Невозможно доказать, что покупатель вставляет карту.

Запросы

ACE поддерживает две формы запросов: да нет-запросы и wh-запросы.

Да нет-запросы запрашивают наличие или отсутствие указанной ситуации. Если мы указали:

Покупатель вставляет карту.

тогда мы можем спросить:

Клиент вставляет карту?

чтобы получить положительный ответ. Обратите внимание, что вопросительные предложения всегда заканчиваются вопросительным знаком.

С помощью wh-запросы, то есть запросы со словами запроса, мы можем запросить текст для деталей указанной ситуации. Если мы указали:

Доверенный клиент вставляет действующую карту вручную утром в банке.

мы можем запросить каждый элемент предложения, за исключением глагола.

Кто вставляет карту?
Какой клиент вставляет карту?
Что вставляет клиент?
Как клиент вставляет карту?
Когда покупатель вводит карту?
Куда покупатель вводит карту?

Запросы также могут быть построены из последовательности декларативных предложений, за которыми следует одно вопросительное предложение, например:

Есть покупатель и есть карта, которую покупатель вводит. Клиент вводит карту?

Команды

ACE также поддерживает команды. Некоторые примеры:

Джон, иди в банк!
Джон и Мэри, подождите!
Каждая собака лает!
Брат Иоанна, подари книгу Марии!

Команда всегда состоит из существительной фразы (адресат), за которой следует запятая, за которой следует несогласованная глагольная фраза. Кроме того, команда должна заканчиваться восклицательным знаком.

Ограничение двусмысленности

Чтобы ограничить двусмысленность полного естественного языка, ACE использует три простых средства:

  • Некоторые неоднозначные конструкции не являются частью языка; на их место доступны однозначные альтернативы
  • Все оставшиеся неоднозначные конструкции интерпретируются детерминистически на основе небольшого количества правил интерпретации.
  • Пользователи могут либо принять назначенную интерпретацию, либо они должны перефразировать ввод, чтобы получить другую.

Избежание двусмысленности

В естественном языке относительные предложения в сочетании с согласованиями могут внести двусмысленность:

Клиент вставляет действительную карту и открывает счет.

В ACE предложение имеет однозначное значение, что клиент открывает счет, что отражено в перефразировке:

Карта действительна. Клиент вставляет карту. Клиент открывает счет.

Чтобы выразить альтернативу - хотя и не очень реалистичную - означающую, что карта открывает счет, относительное местоимение который должны повторяться, что приводит к согласованию относительных предложений:

Клиент вставляет действительную карту и открывает счет.

Это предложение однозначно эквивалентно по смыслу пересказу:

Карта действительна. Карта открывает счет. Клиент вставляет карту.

Правила толкования

Не все неоднозначности можно безопасно удалить из ACE, не сделав его искусственным. Для детерминированной интерпретации синтаксически правильных предложений ACE мы используем небольшой набор правил интерпретации. Например, если мы напишем:

Покупатель вставляет карту с кодом.

тогда с кодом присоединяется к глаголу вставки, но не карточка. Однако, вероятно, мы хотели сказать не это. Чтобы выразить это код связан с карта мы можем использовать правило интерпретации, согласно которому относительное предложение всегда изменяет непосредственно предшествующую именную фразу, и перефразировать ввод как:

Клиент вставляет карту с кодом.

давая пересказ:

На карте есть код. Клиент вставляет карту.

или - указать, что покупатель вставляет карту и код - как:

Покупатель вставляет карту и код.

Анафорические ссылки

Обычно тексты ACE состоят из более чем одного предложения:

Покупатель вводит карту и код. Если код действителен, SimpleMat принимает карту.

Чтобы выразить, что все вхождения карты и кода должны означать одну и ту же карту и один и тот же код, ACE предоставляет анафорические ссылки через определенный артикль:

Покупатель вводит карту и код. Если код действителен, SimpleMat принимает карту.

Во время обработки текста ACE все анафорические ссылки заменяются самыми последними и наиболее доступными именными фразами, которые совпадают по роду и числу. В качестве примера «самого последнего и самого конкретного» предположим, что синтаксическому анализатору ACE дано предложение:

Клиент вводит красную карточку и синюю карточку.

Потом:

Карта правильная.

относится ко второй карте, а:

Красная карточка правильная.

относится к первой карте.

Существительные фразы внутри если-то предложения, универсальные количественные предложения, отрицания, модальность и подчиненные предложения не могут быть анафорически отнесены к последующим предложениям, то есть такие словосочетания с существительными не "доступны" из следующего текста. Таким образом, для каждого из предложений:

Если у клиента есть карта, он ее вводит.
Каждый покупатель вводит карту.
Клиент не вводит карту.
Покупатель может ввести карту.
Клерк считает, что покупатель вводит карту.

мы не можем ссылаться на карточка с:

Карта правильная.

Возможны также анафорические ссылки через личные местоимения:

Покупатель вводит карту и код. Если он действителен, SimpleMat принимает карту.

или через переменные:

Клиент вводит карту Икс и код Y. Если Y действительно, то SimpleMat принимает Икс.

Анафорические ссылки через определенные статьи и переменные могут быть объединены:

Клиент вводит карту Икс и код Y. Если код Y действителен, то SimpleMat принимает карту Икс.

Обратите внимание, что имена собственные, такие как SimpleMat всегда относятся к одному и тому же объекту.

Смотрите также

Рекомендации

  1. ^ а б Норберт Э. Фукс; Каарел Кальюранд; Герольд Шнайдер (2006). «Attempto Controlled English решает проблемы представления знаний, рассуждений, взаимодействия и пользовательских интерфейсов» (PDF). FLAIRS 2006.
  2. ^ "Attempto News".
  3. ^ Норберт Э. Фукс; Каарел Кальюранд; Тобиас Кун (2010). "Структуры репрезентации дискурса для ACE 6.6" (PDF). Технический отчет ifi-2010.0010, факультет информатики, Цюрихский университет.
  4. ^ Тобиас Кун (2007). «AceRules: выполнение правил на контролируемом естественном языке» (PDF). Первая международная конференция по веб-мышлению и системам правил (RR 2007).
  5. ^ Каарел Кальюранд; Норберт Э. Фукс (2007). "Вербализация OWL на английском языке, контролируемом попытками" (PDF). OWL: Опыт и направления (OWLED 2007).

внешняя ссылка