Разметка семантических ролей - Semantic role labeling

В обработка естественного языка, маркировка семантических ролей (также называемый неглубокий семантический анализ или же заполнение щелей) - это процесс присвоения ярлыков словам или фразам в предложении, указывающим на их смысловая роль в предложении, например, в агент, цель или результат.[1]

Он состоит из обнаружения семантических аргументов, связанных с предикат или же глагол из приговор и их классификацию на их специфические роли. Например, для предложения типа «Мэри продала книгу Джону» задача состоит в том, чтобы распознать глагол «продать» как представляющий предикат, "Мэри" как представитель продавца (агент ), «книга» как представляющая товары (тема ) и "Джон" как представляющий получатель. Это важный шаг на пути к осмыслению значения предложения. Семантический анализ такого рода находится на более низком уровне абстракции, чем семантический анализ. синтаксическое дерево, т.е. в нем больше категорий, поэтому в каждой категории группируется меньше статей. Например, «книга принадлежит мне» потребуются два ярлыка, такие как «одержимый» и «владелец», тогда как «книга была продана Джону» потребуются два других ярлыка, такие как «цель» (или «тема») и « получатель »(или« получатель »), хотя эти два предложения будут очень похожи в том, что касается функций« субъект »и« объект ».

История

В FrameNet Проект создал первый крупный вычислительный лексикон, который систематически описывал многие предикаты и их соответствующие роли. Даниэль Гильдеа (Калифорнийский университет в Беркли / Международный институт компьютерных наук ) и Даниэль Джурафски (в настоящее время преподает в Стэндфордский Университет, но ранее работал в Колорадский университет и Калифорнийский университет в Беркли ) разработал первую систему автоматического назначения семантических ролей на базе FrameNet. В PropBank корпус добавил созданные вручную аннотации семантических ролей в Penn Treebank корпус Wall Street Journal тексты. Многие системы автоматического назначения семантических ролей использовали PropBank в качестве обучающего набора данных, чтобы научиться автоматически комментировать новые предложения.

Смотрите также

Рекомендации

  1. ^ Джурафский, Даниэль; Мартин, Джеймс Х. "Глава 20 - Семантическое обозначение ролей" (PDF). Получено 28 января 2019.
  • Автоматическая маркировка семантических ролей, Даниэль Гильдеа и Даниэль Джурафски. В Труды 38-й ежегодной конференции Ассоциации компьютерной лингвистики (ACL-00), pp. 512–520, Гонконг, октябрь 2000 г.

внешняя ссылка