LinguaStream - LinguaStream

LinguaStream это общая платформа для Обработка естественного языка (NLP), основанный на постепенном обогащении электронных документов. LinguaStream разработан в GREYC (Французский: Groupe de recherche en informatique, image, automatique et Instrumentation de Caen) Исследовательская группа в области компьютерных наук (Université de Caen ) с 2001 года. Он доступен бесплатно для частного использования и исследовательских целей.

Описание

LinguaStream позволяет проектировать и оценивать сложные потоки обработки, объединяя компоненты анализа различных типов и уровней: часть речи, синтаксис, семантика, дискурс или же статистический. Каждый этап потока обработки обнаруживает и создает новую информацию, на которую могут полагаться последующие этапы. В конце потока несколько инструментов позволяют удобно визуализировать проанализированные документы и их аннотации.

LinguaStream - это, прежде всего, виртуальная лаборатория, ориентированная на исследователей НЛП. Это позволяет удобно проводить сложные эксперименты на корпусах, используя различные типы декларативных формализмов и значительно снижая затраты на разработку. Его использование варьируется от корпоративных исследований до разработки полностью функциональных автоматических анализаторов. Вместе с платформой предоставляется интегрированная среда, в которой могут быть достигнуты все этапы реализации эксперимента.

Технологии

В качестве платформы LinguaStream предоставляет обширный Ява API. Например, его можно интегрировать с Java EE серверы для разработки веб-приложений на основе потоков обработки. Он также используется для обучения и предоставляет специальные модули, предназначенные для студентов.

Рекомендации

  • «LinguaStream: интегрированная среда для экспериментов в компьютерной лингвистике», Ф. Билхаут и А. Видлёхер (2006). В материалах 11-й конференции Европейского отделения Ассоциации компьютерной лингвистики (EACL) (Companion Volume), Тренто, Италия.
  • "Une plateform logicielle et une démarche pour la validation de linguistiques sur corpus: application à l'évaluation de la detection automatique de cadres temporels", S. Ferrari, F. Bilhaut, A. Widlöcher, M. Laignelet (2005) . В Actes des 4èmes Journées de Linguistique de Corpus, Лорьян, Франция.
  • "La plate-forme LinguaStream: un outil d'exploration linguistique sur corpus", A. Widlöcher и F. Bilhaut (2005). В Actes de la 12e Conférence Traitement Automatique du Language Naturel (TALN), Dourdan.
  • "La plate-form LinguaStream", Ф. Бильхаут и А. Видлёхер (2005). Journée ATALA "Articuler les traitements sur corpus", Париж, Франция.
  • «Платформа LinguaStream», Ф. Билхаут (2003). В трудах 19-й конференции Испанского общества по обработке естественного языка (SEPLN), Алькала-де-Энарес, Испания, 339-340.

внешняя ссылка