MontyLingua - MontyLingua

MontyLingua популярный обработка естественного языка Инструментарий. Это набор библиотеки и программы для символьных и статистических обработка естественного языка (НЛП) как для Python и Ява языки программирования. Он обогащен здравый смысл знания о повседневном мире от Открытый разум, здравый смысл. Из предложений на английском языке он извлекает кортежи субъекта / глагола / объекта, извлекает прилагательные, словосочетания с существительными и словосочетания с глаголами, а также извлекает имена людей, места, события, даты и время, а также другую семантическую информацию. Не требует обучения. Это было написано Хьюго Лю в Массачусетский технологический институт в 2003 г.
Потому что он обогащен здравый смысл знание позволяет избежать многих ошибок. например.:

  • "(NX the / DT mosquito / NN bit / NN NX) (NX the / DT boy / NN NX)"


против.

  • "(NX the / DT mosquito / NN NX) (VX bit / VBD VX) (NX the / DT boy / NN NX)"[1]

Некоммерческое использование бесплатно. Если вы намерены использовать это программное обеспечение в некоммерческих, не являющихся собственниками целях, например, в целях академических исследований, это программное обеспечение является бесплатным и подпадает под действие GNU. Лицензия GPL.

Способности

  • MontyTokenizer: нормализует пунктуацию, интервалы и сокращения с учетом сокращений.
  • MontyTagger: Пометка части речи используя Penn Treebank набор тегов, обогащенный "Здравым смыслом" из проекта Open Mind Common Sense. Превышает точность тэггер Brill94 tbl с использованием файлов обучения по умолчанию
  • MontyREChunker: разбивает текст с тегами на глаголы, существительные и прилагательные (VX, NX и AX соответственно)
  • MontyExtractor: извлекает структуры глагола-аргумента, фразы и другую семантически ценную информацию из предложений и возвращает предложения как «дайджесты».
  • MontyLemmatiser: лемматизация, чувствительная к частям речи. Полоски множественного числа (гуси -> гусь) и напряженного (были -> быть, имели -> иметь). Включает регулярные выражения из morph.lex Хамфриса и Кэрролла и корпус XTAG от UPENN.
  • MontyNLGenerator: генерирует сводки, генерирует предложения поверхностной формы, определяет и нумерует глаголы NP и времен, учитывает тип предложения

Рекомендации

  1. ^ "MontyLingua V.2.1 (Python и Java) Свободный, обогащенный здравым смыслом инструмент понимания естественного языка для английского языка". Получено 2008-12-30.

внешняя ссылка