Комбинаторно-категориальная грамматика - Combinatory categorial grammar

Комбинаторно-категориальная грамматика (CCG) является эффективным разборчивый, но при этом лингвистически выразительный грамматический формализм. Он имеет прозрачный интерфейс между поверхностным синтаксисом и базовым семантическим представлением, включая структуру предиката-аргумента, количественную оценку и информационную структуру. Формализм порождает структуры на основе избирательных округов (в отличие от структур, основанных на зависимости) и, следовательно, является типом грамматика фразовой структуры (в отличие от грамматика зависимостей ).

CCG полагается на комбинаторная логика, обладающий такой же выразительной силой, как и лямбда-исчисление, но строит свои выражения иначе. Первые лингвистические и психолингвистические аргументы в пользу построения грамматики на комбинаторах были выдвинуты Steedman и Сабольчи. Более поздние видные сторонники этого подхода: Полин Якобсон и Джейсон Болдридж.

Например, комбинатор B (наборщик) полезен при создании зависимостей на большом расстоянии, например, в "Как вы думаете, о ком говорит Мэри?" а комбинатор W (дубликатор) полезен в качестве лексической интерпретации возвратных местоимений, например, в «Мэри говорит о себе». Вместе с I (тождественное отображение) и C (перестановщик) они образуют набор примитивных, взаимоопределимых комбинаторов. Якобсон интерпретирует личные местоимения как комбинатор I, и их связыванию помогает сложный комбинатор Z, как в «Мэри сбилась с пути». Z определима с помощью W и B.

Части формализма

Формализм CCG определяет ряд комбинаторов (наиболее распространенными являются приложение, композиция и повышение типа). Они работают с лексическими элементами с синтаксической типизацией с помощью Естественный вычет доказательства стиля. Цель доказательства - найти способ применения комбинаторов к последовательности лексических элементов до тех пор, пока в доказательстве не останется неиспользованных лексических элементов. Тип, полученный после завершения доказательства, - это тип всего выражения. Таким образом, доказательство того, что некоторая последовательность слов является предложением некоторого языка, равносильно доказательству того, что слова сводятся к типу S.

Синтаксические типы

Синтаксический тип лексического элемента может быть примитивным типом, например S, N, или НП, или сложные, такие как SNP, или NP / N.

Сложные типы, схематизируемые как X / Y и XY, обозначают типы функторов, которые принимают аргумент типа Y и вернуть объект типа Икс. Прямая косая черта означает, что аргумент должен отображаться справа, а обратная косая черта означает, что аргумент должен отображаться слева. Любой тип может заменить Икс и Y здесь, делая синтаксические типы в CCG системой рекурсивных типов.

Комбинаторы приложений

Комбинаторы приложений, часто обозначаемые > для подачи заявки и < для обратного применения примените лексический элемент с типом функтора к аргументу с соответствующим типом. Определение приложения дается как:

Комбинаторы композиции

Комбинаторы композиции, часто обозначаемые для форвардного состава и для обратной композиции аналогичны композиции функций из математики и могут быть определены следующим образом:

Комбинаторы с повышением типа

Комбинаторы, повышающие тип, часто обозначаемые как для прямого набора и для обратного повышения типа преобразуйте типы аргументов (обычно примитивные типы) в типы функторов, которые принимают в качестве аргументов функторы, которые до повышения типа принимали бы их в качестве аргументов.

пример

Предложение «собака укусила Джона» имеет ряд возможных доказательств. Ниже приведены некоторые из них. Разнообразие доказательств демонстрирует тот факт, что в CCG предложения не имеют единой структуры, как в других моделях грамматики.

Пусть типы этих лексических единиц будут

Мы можем провести простейшее доказательство (немного изменив обозначения для краткости) как:

Решив набрать и составить некоторые из них, мы могли бы получить полностью инкрементное доказательство слева направо. Возможность построить такое доказательство является аргументом в пользу психолингвистической правдоподобности CCG, потому что слушатели действительно создают частичные интерпретации (синтаксические и семантические) высказываний до того, как они будут завершены.

Формальные свойства

CCG, как известно, могут генерировать язык (что неконтекстно индексированный язык ). Грамматику этого языка можно найти у Виджая-Шанкера и Вейра (1994).[1]

Виджай-Шанкер и Вейр (1994)[1] демонстрирует, что Линейные индексированные грамматики, Комбинаторные категориальные грамматики, Грамматики, примыкающие к дереву, и Головные грамматики находятся слабо эквивалентный формализмов, поскольку все они определяют одни и те же строковые языки. Kuhlmann et al. (2015)[2] показать, что эта эквивалентность и способность CCG описывать , в решающей степени полагаются на способность ограничивать использование комбинаторных правил определенными категориями способами, не описанными выше.

Смотрите также

использованная литература

  1. ^ а б Виджай-Шанкер К. и Вейр Дэвид Дж. 1994. Эквивалентность четырех расширений контекстно-свободных грамматик. Математическая теория систем 27 (6): 511–546.
  2. ^ Кульман, М., Коллер, А., Сатта, Г. 2015. Лексикализация и генеративная сила в CCG. Компьютерная лингвистика 41 (2): 215-247.

дальнейшее чтение

  • Майкл Мортгат, Логика категориального типа, Глава вторая в J. van Benthem and A. ter Meulen (ред.) Справочник по логике и языку. Эльзевир, 1997 г., ISBN  0-262-22053-9
  • homepages.inf.ed.ac.uk

внешняя ссылка