Глубокая лингвистическая обработка - Википедия - Deep linguistic processing

Глубокая лингвистическая обработка это обработка естественного языка рамки, которые опираются на теоретические и описательная лингвистика. Он моделирует язык преимущественно посредством теоретической синтаксической / семантической теории (например, CCG, HPSG, LFG, ТЕГ, то Пражская школа ). Подходы глубокой лингвистической обработки отличаются от «более мелких» методов тем, что они дают более выразительные и структурные представления, которые непосредственно фиксируют зависимости на большом расстоянии и лежащие в основе предикат -аргумент конструкции.[1]
Наукоемкий подход к глубокой лингвистической обработке требует значительных вычислительных мощностей и в прошлом иногда считался неразрешимым. Однако исследования в начале 2000-х годов значительно повысили эффективность глубокой обработки.[2][3] Сегодня эффективность больше не является серьезной проблемой для приложений, использующих глубокую лингвистическую обработку.

В отличие от «поверхностной лингвистической обработки»

Традиционно глубокая лингвистическая обработка связана с разработкой компьютерной грамматики (для использования в обоих разбор и поколение). Эти грамматики разрабатывались, обслуживались вручную и требовали больших вычислительных затрат на выполнение. В последние годы подходы машинного обучения (также известные как неглубокая лингвистическая обработка ) коренным образом изменили сферу обработка естественного языка. Быстрое создание надежных и универсальных инструментов машинного обучения НЛП требует значительно меньшего количества ручного труда. Таким образом, методы глубокой лингвистической обработки получили меньше внимания.

Однако некоторые компьютерные лингвисты считают, что[ВОЗ? ] чтобы компьютеры понимали естественный язык или вывод, подробный синтаксис и семантическое представление необходимо. Более того, хотя люди могут легко понять предложение и его значение, неглубокой лингвистической обработке может не хватать «понимания» человеческого языка. Например:[4]

а) Все было бы иначе, если бы Microsoft располагалась в Грузии.

В предложении (а) неглубокий извлечение информации Система могла ошибочно сделать вывод, что штаб-квартира Microsoft находится в Джорджии. В то время как люди, мы понимаем из предложения, что офис Microsoft никогда не был в Джорджии.

б) Национальный институт психологии в Израиле был основан в мае 1971 года как Израильский центр психобиологии профессором Джоэлем.

В предложении (b) поверхностная система может ошибочно сделать вывод о том, что Израиль был основан в мае 1971 года. Люди знают, что это Национальный институт психобиологии, который был основан в 1971 году.
Подводя итог сравнению глубокой и поверхностной языковой обработки, можно сказать, что глубокая лингвистическая обработка обеспечивает богатый знаниями анализ языка с помощью грамматик и языковых ресурсов, разработанных вручную. Принимая во внимание, что неглубокая лингвистическая обработка обеспечивает основанный на знаниях анализ языка посредством статистического / машинного обучения манипулирования текстами и / или аннотированный лингвистический ресурс.

Суб-сообщества

«Глубокие» компьютерные лингвисты делятся на различные подсообщества на основе грамматического формализма, который они приняли для глубокой лингвистической обработки. Основные подсообщества включают:

  • DEep Lпаховый пработа с ЧАСПСЖ - Винициативный (DELPH-IN ) сотрудничество, работающее с HPSG формализм. В Конференция HPSG центральная конференция по обмену знаниями / продвижению HPSG на основе глубокой обработки.
  • ParGram/ParSem международное сотрудничество по LFG разработка грамматики и семантики на основе. В LFG конференция центральная конференция по обмену знаниями / продвижению LFG на основе глубокой обработки.
  • Исследовательская группа XTAG, работающая с формализмом TAG. В TAG + конференция центральная конференция по обмену знаниями / продвижению ТЕГ на основе глубокой обработки.

Приведенный выше список не является исчерпывающим представителем всех сообществ, работающих над глубокой лингвистической обработкой.

Смотрите также

Рекомендации

  1. ^ Тимоти Болдуин, Марк Драс, Джулия Хокенмайер, Трейси Холлоуэй Кинг и Гертьян ван Норд. 2007 г. Влияние глубокой лингвистической обработки на технологию синтаксического анализа. В Proc. 10-го Международного семинара по технологиям синтаксического анализа (IWPT-2007), страницы 36–8, Прага, Чешская Республика.
  2. ^ Ульрих Каллмайер. ПЭТ - платформа для экспериментов с эффективными методами обработки HPSG. Инженерия естественного языка, 6 (1): 99-108, 2000.
  3. ^ Ганс Ушкорейт. Новые возможности для глубокой лингвистической обработки В архиве 2005-11-03 на Wayback Machine. В Proceedings of COLING 2002, страницы xiv – xxvii, Тайбэй, Тайвань, 2002.
  4. ^ У. Шафер. 2007. ¨ Интеграция компонентов глубокой и поверхностной обработки естественного языка - представления и гибридные архитектуры. Кандидат наук. защитил диссертацию на факультете математики и информатики Саарландского университета, Саарбрюккен, Германия.