Программа DARPA TIDES - DARPA TIDES program

Обнаружение, извлечение и обобщение транслингвальной информации (TIDES) это программа развития технологий, финансируемая Агентством перспективных исследовательских проектов Министерства обороны США (DARPA ), ориентированный на автоматизированную обработку и понимание языковых данных. Основная цель программы - дать возможность англоговорящим людям быстро и эффективно находить и интерпретировать необходимую информацию независимо от языка оригинала.

Компоненты

Четыре компонента технологии, разрабатываемой TIDES, включают:

  • Обнаружение - поиск необходимой информации.
  • Извлечение - извлечение ключевых фактов.
  • Обобщение - Сокращение информации до читаемой длины.
  • Перевод - преобразование текста с другого языка на английский.

Инструменты для обнаружения, извлечения и резюмирования должны работать в пределах одного языка (одноязычно) и между языками (транслингвально), чтобы их могли использовать люди, говорящие только на английском. Помимо разработки технологий, TIDES также изучает методы быстрой и дешевой адаптации к другим языкам, включая языки с ограниченными лингвистическими ресурсами. TIDES стремится интегрировать возможности компонентов вместе с другими технологиями для создания инструментов для реальных приложений.

Хранилище данных расследований

В ФБР с Хранилище данных расследований содержит библиотеку новостей с открытым исходным кодом, содержащую новости, собранные программой TIDES. Информация собирается с общедоступных веб-сайтов по всему миру, в том числе Гаарец, Правда, то Jordan Times, The People's Daily, Вашингтон Пост, и другие.[1] Он использует Miter Text and Audio Processing (MiTAP ) система.[2]

Смотрите также

Примечания и библиография

  • Отдел информационных ресурсов ФБР (IRD) (2003-12-03). «План обеспечения безопасности системы хранилища данных расследований - SECRET (IDW-S)» (PDF). Electronic Frontier Foundation. п. 58.
  • Офис ФБР по управлению программами (2004-11-29). «Концепция безопасности операций (S-CONOPS), программа хранилищ данных расследований (IDW)» (PDF). Electronic Frontier Foundation. п. 50.

внешние ссылки