Q-системы - Q-systems

Q-системы являются методом ориентированный граф преобразования в соответствии с данными грамматика правила, разработанные в Université de Montréal к Ален Колмерауэр в 1967-70 для использования в обработка естественного языка. Университет Монреаля машинный перевод система, ТАУМ-73, использовал Q-Systems в качестве языкового формализма.

Структура данных, управляемая Q-системой, представляет собой Q-график, который представляет собой ориентированный ациклический граф с одним входным узлом и одним выходным узлом, где каждая дуга несет маркированное заказанное дерево. Входное предложение обычно представлено линейным Q-графом, в котором каждая дуга содержит слово (дерево, сведенное к одному узлу, помеченному этим словом). После анализа Q-граф обычно представляет собой связку путей с одной дугой, каждая дуга имеет возможное дерево анализа. После генерации цель обычно состоит в том, чтобы создать столько путей, сколько требуется на выходе, опять же с одним словом на дугу.

Q-система состоит из последовательности Q-процедуры, каждый из которых представляет собой набор Q-правила, имеющего форму == []. Q-обработки применяются последовательно, если одна из них не дает пустой Q-граф, и в этом случае результатом является последний полученный Q-граф. Три части правила могут содержать переменные для меток, деревьев и лесов. Все переменные после "==" должны появиться в части . Переменные являются локальными для правил.

Q-обработка состоит из двух этапов: добавления и очистки. Сначала он исчерпывающе применяет все свои правила, используя реализация (одностороннее объединение), тем самым добавляя новые пути к текущему Q-графу (добавленные дуги и их деревья могут использоваться для создания новых путей). Если и когда этот процесс добавления останавливается, все дуги, использованные в каком-либо успешном применении правила, стираются, а также все неиспользуемые дуги, которых больше нет на любом пути от входного узла к выходному узлу. Следовательно, результат, если он есть (если завершается этап сложения), снова является Q-графом. Это позволяет объединить в цепочку несколько Q-систем, каждая из которых выполняет определенную задачу, вместе формируя сложную систему. Например, TAUM 73 состоял из пятнадцати связанных Q-систем.

Расширение основной идеи Q-систем, а именно замена инстанцирования на объединение (проще говоря, разрешить "новые" переменные в правой части правила и заменить параметризованные помеченные деревья логическими терминами) привело к Пролог, разработано Ален Колмерауэр и Филипп Руссель в 1972 году. Уточнения в другом направлении (уменьшение недетерминизма и введение типизированных меток) Джон Чандиу привело к GramR, используется для программирования МЕТЕО с 1985 года.

В 2009 году Хонг Тай Нгуен из GETALP[1], Laboratoire d'Informatique de Grenoble[2] (повторно реализовал Q-язык на C, используя ANTLR для компиляции Q-систем и Q-графиков, а также алгоритм, предложенный Кристианом Бойте (поскольку ни один не был опубликован, а исходные коды предыдущей реализации Fortran были утеряны). был исправлен, дополнен и расширен (для этикеток, использующих символы Unicode, а не только печатаемые символы CDC6600 исторической версии) Дэвидом Каттанео в 2010-11 годах.

Смотрите также

Рекомендации

  1. ^ "Groupe d'Etude en Traduction Automatique / Traitement Automatisé des Langues et de la Parol" (На французском).
  2. ^ "LIG" (На французском).

дальнейшее чтение

  • Colmerauer, A: Les systèmes Q ou un formisme pour analyzer et synthétiser des phrases sur ordinateur. Мимео, Монреаль, 1969.
  • Нгуен, H-T: Des systèmes de TA homogènes aux systèmes de TAO hétérogènes. этот UJF, Гренобль, 2009.

внешняя ссылка