Комбинаторно-категориальная грамматика - Combinatory categorial grammar
эта статья может быть слишком техническим для большинства читателей, чтобы понять. Пожалуйста помогите улучшить это к Сделайте это понятным для неспециалистов, не снимая технических деталей. (Ноябрь 2018) (Узнайте, как и когда удалить этот шаблон сообщения) |
Комбинаторно-категориальная грамматика (CCG) является эффективным разборчивый, но при этом лингвистически выразительный грамматический формализм. Он имеет прозрачный интерфейс между поверхностным синтаксисом и базовым семантическим представлением, включая структуру предиката-аргумента, количественную оценку и информационную структуру. Формализм порождает структуры на основе избирательных округов (в отличие от структур, основанных на зависимости) и, следовательно, является типом грамматика фразовой структуры (в отличие от грамматика зависимостей ).
CCG полагается на комбинаторная логика, обладающий такой же выразительной силой, как и лямбда-исчисление, но строит свои выражения иначе. Первые лингвистические и психолингвистические аргументы в пользу построения грамматики на комбинаторах были выдвинуты Steedman и Сабольчи. Более поздние видные сторонники этого подхода: Полин Якобсон и Джейсон Болдридж.
Например, комбинатор B (наборщик) полезен при создании зависимостей на большом расстоянии, например, в "Как вы думаете, о ком говорит Мэри?" а комбинатор W (дубликатор) полезен в качестве лексической интерпретации возвратных местоимений, например, в «Мэри говорит о себе». Вместе с I (тождественное отображение) и C (перестановщик) они образуют набор примитивных, взаимоопределимых комбинаторов. Якобсон интерпретирует личные местоимения как комбинатор I, и их связыванию помогает сложный комбинатор Z, как в «Мэри сбилась с пути». Z определима с помощью W и B.
Части формализма
Формализм CCG определяет ряд комбинаторов (наиболее распространенными являются приложение, композиция и повышение типа). Они работают с лексическими элементами с синтаксической типизацией с помощью Естественный вычет доказательства стиля. Цель доказательства - найти способ применения комбинаторов к последовательности лексических элементов до тех пор, пока в доказательстве не останется неиспользованных лексических элементов. Тип, полученный после завершения доказательства, - это тип всего выражения. Таким образом, доказательство того, что некоторая последовательность слов является предложением некоторого языка, равносильно доказательству того, что слова сводятся к типу S.
Синтаксические типы
Синтаксический тип лексического элемента может быть примитивным типом, например S, N, или НП, или сложные, такие как SNP, или NP / N.
Сложные типы, схематизируемые как X / Y и XY, обозначают типы функторов, которые принимают аргумент типа Y и вернуть объект типа Икс. Прямая косая черта означает, что аргумент должен отображаться справа, а обратная косая черта означает, что аргумент должен отображаться слева. Любой тип может заменить Икс и Y здесь, делая синтаксические типы в CCG системой рекурсивных типов.
Комбинаторы приложений
Комбинаторы приложений, часто обозначаемые > для подачи заявки и < для обратного применения примените лексический элемент с типом функтора к аргументу с соответствующим типом. Определение приложения дается как:
Комбинаторы композиции
Комбинаторы композиции, часто обозначаемые для форвардного состава и для обратной композиции аналогичны композиции функций из математики и могут быть определены следующим образом:
Комбинаторы с повышением типа
Комбинаторы, повышающие тип, часто обозначаемые как для прямого набора и для обратного повышения типа преобразуйте типы аргументов (обычно примитивные типы) в типы функторов, которые принимают в качестве аргументов функторы, которые до повышения типа принимали бы их в качестве аргументов.
пример
Предложение «собака укусила Джона» имеет ряд возможных доказательств. Ниже приведены некоторые из них. Разнообразие доказательств демонстрирует тот факт, что в CCG предложения не имеют единой структуры, как в других моделях грамматики.
Пусть типы этих лексических единиц будут
Мы можем провести простейшее доказательство (немного изменив обозначения для краткости) как:
Решив набрать и составить некоторые из них, мы могли бы получить полностью инкрементное доказательство слева направо. Возможность построить такое доказательство является аргументом в пользу психолингвистической правдоподобности CCG, потому что слушатели действительно создают частичные интерпретации (синтаксические и семантические) высказываний до того, как они будут завершены.
Формальные свойства
Эта секция нуждается в расширении. Вы можете помочь добавляя к этому. (Июнь 2008 г.) |
CCG, как известно, могут генерировать язык (что неконтекстно индексированный язык ). Грамматику этого языка можно найти у Виджая-Шанкера и Вейра (1994).[1]
Виджай-Шанкер и Вейр (1994)[1] демонстрирует, что Линейные индексированные грамматики, Комбинаторные категориальные грамматики, Грамматики, примыкающие к дереву, и Головные грамматики находятся слабо эквивалентный формализмов, поскольку все они определяют одни и те же строковые языки. Kuhlmann et al. (2015)[2] показать, что эта эквивалентность и способность CCG описывать , в решающей степени полагаются на способность ограничивать использование комбинаторных правил определенными категориями способами, не описанными выше.
Смотрите также
использованная литература
- ^ а б Виджай-Шанкер К. и Вейр Дэвид Дж. 1994. Эквивалентность четырех расширений контекстно-свободных грамматик. Математическая теория систем 27 (6): 511–546.
- ^ Кульман, М., Коллер, А., Сатта, Г. 2015. Лексикализация и генеративная сила в CCG. Компьютерная лингвистика 41 (2): 215-247.
- Болдридж, Джейсон (2002), "Лексически определенный деривационный контроль в комбинаторно-категориальной грамматике. "Докторская диссертация. Эдинбургский университет.
- Карри, Хаскелл Б. и Ричард Фейс (1958), Combinatory Logic, Vol. 1. Северная Голландия.
- Джейкобсон, Полин (1999), «К семантике без переменных. » Лингвистика и философия 22, 1999. 117–184.
- Стидман, Марк (1987), «Комбинаторные грамматики и паразитические пробелы ». Естественный язык и лингвистическая теория 5, 403–439.
- Стидман, Марк (1996), Структура поверхности и интерпретация. MIT Press.
- Стидман, Марк (2000), Синтаксический процесс. MIT Press.
- Сабольчи, Анна (1989), "Связанные переменные в синтаксисе (есть ли?). »Семантика и контекстное выражение, под ред. Барча, ван Бентема и ван Эмде Боаса. Foris, 294–318.
- Сабольчи, Анна (1992), "Комбинаторная грамматика и проекция из лексикона. "Лексические вопросы. CSLI Lecture Notes 24, ed. Sag and Szabolcsi. Stanford, CSLI Publications. 241–269.
- Сабольчи, Анна (2003), «Связывание на лету: анафора с перекрестными предложениями в семантике без переменных ». Чувствительность ресурсов в связывании и анафоре, под ред. Авторы Kruijff и Oehrle. Kluwer, 215–229.
дальнейшее чтение
- Майкл Мортгат, Логика категориального типа, Глава вторая в J. van Benthem and A. ter Meulen (ред.) Справочник по логике и языку. Эльзевир, 1997 г., ISBN 0-262-22053-9
- homepages.inf.ed.ac.uk
внешняя ссылка
- Сайт по комбинаторной категориальной грамматике
- Вики-страница ACL CCG (вероятно, будет более актуальным, чем этот)
- Семантический анализ с комбинаторными категориальными грамматиками - Учебник, описывающий общие принципы построения семантических парсеров