Пользовательский интерфейс на естественном языке - Википедия - Natural-language user interface

Пользовательский интерфейс на естественном языке (LUI или же NLUI) является разновидностью компьютерный человеческий интерфейс где языковые явления, такие как глаголы, фразы и предложения, действуют как элементы управления пользовательского интерфейса для создания, выбора и изменения данных в программных приложениях.

В дизайн интерфейса, интерфейсы на естественном языке пользуются спросом из-за их скорости и простоты использования, но большинство из них понимание широкий выбор неоднозначный ввод.[1]Интерфейсы на естественном языке - активная область исследований в области обработка естественного языка и компьютерная лингвистика. Интуитивно понятный общий интерфейс на естественном языке - одна из активных целей Семантическая сеть.

Текстовые интерфейсы в разной степени «естественны». Многие формальные (неестественные) языки программирования включают идиомы естественного человеческого языка. Точно так же традиционный Поиск по ключевой фразе Engine можно описать как «неглубокий» пользовательский интерфейс на естественном языке.

Обзор

Теоретически поисковая система на естественном языке найдет целевой ответы на вопросы пользователей (в отличие от поиска по ключевым словам). Например, когда задается вопрос о форме "который НАС. у государства самый высокий подоходный налог ? ', обычные поисковые системы игнорируют вопрос и вместо этого ищут ключевые слова «государство», «доход» и «налог». С другой стороны, поиск на естественном языке пытается использовать обработку на естественном языке, чтобы понять природу вопроса, а затем искать и возвращать подмножество сети, которая содержит ответ на вопрос. Если это работает, результаты будут иметь более высокую релевантность, чем результаты поисковой системы по ключевым словам, из-за включения вопроса.[нужна цитата ]

История

Интерфейсы Prototype Nl появились уже в конце 60-х - начале 70-х годов.[2]

  • ШРДЛУ, интерфейс на естественном языке, который управляет блоками в виртуальном "мире блоков"
  • Лунный, интерфейс на естественном языке к базе данных, содержащей химические анализы лунных пород Аполлона-11. Уильям А. Вудс.
  • Чат-80 превратили английские вопросы в Пролог выражения, которые оценивались по базе данных Prolog. Код Chat-80 получил широкое распространение и лег в основу нескольких других экспериментальных интерфейсов N1. Онлайн-демонстрация доступна на сайте LPA.[3]
  • ELIZA, написанный в Массачусетском технологическом институте Джозефом Вайценбаумом между 1964 и 1966 годами, имитировал психотерапевта и работал путем обработки ответов пользователей на сценарии. Не используя почти никакой информации о человеческих мыслях или эмоциях, сценарий DOCTOR иногда давал поразительно человеческое взаимодействие. Онлайн-демонстрация доступна на сайте LPA.[4]
  • Янус также одна из немногих систем, поддерживающих временные вопросы.
  • Интеллект из Тринзич (образована в результате слияния AICorp и Aion).
  • BBN’s Язык основан на опыте разработки Русь и Ирус системы.
  • IBM Доступ к языку
  • Вопросы и ответы из Symantec.
  • Datatalker от Natural Language Inc.
  • Локи от BIM Systems.
  • Английский мастер из Корпорация лингвистических технологий.
  • iAskWeb от Anserity Inc. полностью реализовано в Пролог предоставлял интерактивные рекомендации на NL пользователям в налоговой и инвестиционной областях в 1999-2001 гг.[5]

Вызовы

Интерфейсы на естественном языке в прошлом побуждали пользователей антропоморфизировать компьютер или, по крайней мере, приписывать машинам больше интеллекта, чем это требуется. Со стороны пользователя это привело к нереалистичным ожиданиям от возможностей системы. Такие ожидания затруднят изучение ограничений системы, если пользователи приписывают ей слишком большие возможности, и в конечном итоге приведут к разочарованию, когда система не сможет работать так, как ожидалось, как это было в случае AI зима 1970-х и 80-х годов.

А Бумага 1995 г. озаглавленный «Интерфейсы естественного языка для баз данных - введение», описывает некоторые проблемы:[2]

Вложение модификатора
Запрос «Перечислить всех сотрудников компании с водительскими правами» неоднозначен, если вы не знаете, что компании не могут иметь водительские права.
Конъюнкция и дизъюнкция
«Перечислите всех претендентов, которые живут в Калифорнии и Аризоне» двусмысленно, если вы не знаете, что человек не может жить в двух местах одновременно.
Разрешение анафоры
решить, что пользователь имеет в виду под «он», «она» или «он» в запросе с указанием самих себя.

Другие цели, которые следует учитывать в более общем плане, - это скорость и эффективность интерфейса, во всех алгоритмах эти два момента являются основным моментом, который определяет, будут ли одни методы лучше других и, следовательно, иметь больший успех на рынке. Кроме того, локализация на многоязычных сайтах требует особого внимания - это основано на разной структуре предложений и вариациях синтаксиса между большинством языков.

Наконец, что касается используемых методов, основная проблема, которую необходимо решить, - это создание общего алгоритма, который может распознавать весь спектр разных голосов, не обращая внимания на национальность, пол или возраст. Существенные различия между извлеченными функциями - даже от говорящих, которые произносят одно и то же слово или фразу - должны быть успешно преодолены.

Использование и приложения

Интерфейс на естественном языке дает начало технологии, используемой для множества различных приложений.

Некоторые из основных применений:

  • Диктант, является наиболее частым использованием автоматическое распознавание речи (ASR) сегодня. Сюда входят медицинские расшифровки, юридические и деловые диктовки, а также общий текстовый редактор. В некоторых случаях используются специальные словари для повышения точности системы.
  • Командование и контрольСистемы ASR, которые предназначены для выполнения функций и действий в системе, определяются как системы управления и контроля. Такие фразы, как «Open Netscape» и «Start a new xterm», сделают именно это.
  • Телефония, некоторые АТС /Голосовая почта системы позволяют вызывающим абонентам произносить команды вместо нажатия кнопок для отправки определенных сигналов.
  • Носимые, поскольку входы для носимых устройств ограничены, разговор - это естественная возможность.
  • Медицина, инвалидность, многие люди испытывают трудности с набором текста из-за физических ограничений, таких как травмы от повторяющихся деформаций (RSI), мышечная дистрофия и многие другие. Например, люди с проблемами слуха могут использовать систему, подключенную к их телефону, для преобразования речи вызывающего абонента в текст.
  • Встроенные приложения, некоторые новые сотовые телефоны включают функцию распознавания речи C&C, которая позволяет произносить такие фразы, как «позвонить домой». Это может стать важным фактором в будущем автоматического распознавания речи и Linux.
  • Разработка программного обеспечения: An интегрированная среда развития может встраивать интерфейсы на естественном языке, чтобы помочь разработчикам.[6]

Ниже приведены названия и определения некоторых приложений, которые используют распознавание естественного языка и, следовательно, имеют интегрированные утилиты, перечисленные выше.

Повсеместность

Вездесущность, добавить за Mozilla Firefox, представляет собой набор быстрых и простых команд на естественном языке, которые действуют как гибридные приложения веб-служб, что позволяет пользователям получать информацию и связывать ее с текущими и другими веб-страницами.

вольфрам Альфа

Wolfram Alpha - это онлайн-сервис, который отвечает на фактические запросы напрямую, вычисляя ответ на основе структурированных данных, а не предоставляет список документов или веб-страниц, которые могут содержать ответ в виде поисковый движок бы.[7] Об этом объявили в марте 2009 г. Стивен Вольфрам, и был опубликован 15 мая 2009 года.[8]

Siri

Siri - это умный личный помощник приложение интегрировано с операционной системой iOS. Приложение использует обработка естественного языка ответить на вопросы и дать рекомендации.

Маркетинговые утверждения Siri включают в себя то, что он со временем приспосабливается к индивидуальным предпочтениям пользователя и персонализирует результаты, а также выполняет такие задачи, как резервирование столиков на ужин при попытке поймать такси.[9]

Другие

  • Ask.com - Первоначальная идея «Спроси Дживса» (Ask.com) заключалась в традиционном поиске по ключевым словам с возможностью получать ответы на вопросы, задаваемые повседневным естественным языком. Текущий Ask.com по-прежнему поддерживает это, с добавленной поддержкой математических, словарных и конверсионных вопросов.
  • Braina[10] - Braina - это интерфейс на естественном языке для ОС Windows который позволяет вводить или произносить предложения на английском языке, чтобы выполнить определенное действие или найти информацию.
Скриншот классического интерфейса GNOME DO.
  • GNOME Do - Позволяет быстро находить различные артефакты среды GNOME (приложения, контакты Evolution и Pidgin, закладки Firefox, исполнители и альбомы Rhythmbox и т. Д.) И выполнять с ними основные действия (запуск, открытие, электронная почта, чат, игра и т. Д.) ).[11]
  • хакия - hakia была поисковой машиной в Интернете. Компания изобрела новую инфраструктуру, альтернативную индексации, которая использовала алгоритм SemanticRank, смесь решений из дисциплин онтологической семантики, нечеткой логики, вычислительной лингвистики и математики. hakia закрылся в 2014 году.
  • Lexxe - Lexxe была поисковой системой в Интернете, которая использовала обработку запросов на естественном языке (семантический поиск). Для поиска можно использовать ключевые слова, фразы и вопросы, например "Сколько лет Википедии?" Lexxe закрыла свои поисковые системы в 2015 году.
  • Pikimal - Pikimal использовал естественный язык, привязанный к предпочтениям пользователя, чтобы давать рекомендации по поиску по шаблону. Пикимал закрылся в 2015 году.
  • Powerset - 11 мая 2008 г. компания представила инструмент для поиска фиксированного набора Википедия используя разговорные фразы, а не ключевые слова.[12] 1 июля 2008 г. его приобрела Microsoft.[13]
  • Q-go - Технология Q-go обеспечивает релевантные ответы пользователям в ответ на запросы на веб-сайте компании или в корпоративной интранете, сформулированные как естественными предложениями, так и введенными ключевыми словами. Q-go был приобретен RightNow Technologies в 2011.
  • Yebol - Yebol - это вертикальная поисковая машина, которая «решает», которая разработала платформу семантического поиска, основанную на знаниях. Алгоритмы искусственного интеллекта Yebol, основанные на человеческом интеллекте, автоматически группируют и классифицируют результаты поиска, веб-сайты, страницы и контент, который он представляет, в визуально индексированном формате, который больше соответствует первоначальным намерениям человека. Yebol использует алгоритмы ассоциации, ранжирования и кластеризации для анализа связанных ключевых слов или веб-страниц. Yebol объединяет обработку естественного языка, открытые сложные системы с метасинтетической инженерией и машинные алгоритмы с человеческими знаниями для каждого запроса, чтобы создать веб-каталог, который фактически `` учится '', используя алгоритмы корреляции, кластеризации и классификации для автоматического создания запроса знаний, который является сохранен и регенерирован вперед.[14]

Смотрите также

Рекомендации

  1. ^ Хилл, I. (1983). «Естественный язык против компьютерного языка». В М. Сайме и М. Кумбс (ред.) Проектирование взаимодействия человека с компьютером. Академическая пресса.
  2. ^ а б Интерфейсы естественного языка для баз данных - Введение, I. Андроутсопулос, Г. Ричи, П. Таниш, факультет искусственного интеллекта, Эдинбургский университет
  3. ^ "Демо Чат-80". Архивировано из оригинал 11 ноября 2016 г.. Получено 29 января 2018.
  4. ^ "ELIZA demo". Архивировано из оригинал 26 ноября 2016 г.. Получено 29 января 2018.
  5. ^ Галицкий, Борис (2003). Ответы на вопросы на естественном языке: техника семантических заголовков. Аделаида, Австралия: Advance Knowledge International. ISBN  0868039799.
  6. ^ Киммиг, Маркус; Монперрус, Мартин; Мезини, Мира (2011). «Запрос исходного кода на естественном языке». 2011 26-я Международная конференция IEEE / ACM по автоматизированной разработке программного обеспечения (ASE 2011). С. 376–379. arXiv:1205.6361. Дои:10.1109 / ase.2011.6100076. ISBN  978-1-4577-1639-3. S2CID  6898947.
  7. ^ Джонсон, Бобби (2009-03-09). «Британская поисковая система» может составить конкуренцию Google'". Хранитель. Получено 2009-03-09.
  8. ^ «Так много для тихого старта». Блог Wolfram Alpha. 2009-05-08. Получено 2009-10-20.
  9. ^ «iOS - Siri». яблоко. Получено 29 января 2018.
  10. ^ «Braina - программа искусственного интеллекта для Windows». www.brainasoft.com. Получено 29 января 2018.
  11. ^ Описание добавления / удаления приложений Ubuntu 10.04 для GNOME Do
  12. ^ Хелфт, Мигель (12 мая 2008 г.). «Дебют Powerset с поиском в Википедии». Нью-Йорк Таймс.
  13. ^ Джонсон, Марк (1 июля 2008 г.). «Microsoft приобретает Powerset». Блог Powerset. Архивировано из оригинал 25 февраля 2009 г.
  14. ^ Хамфрис, Мэтью. «Yebol.com выходит на поисковый рынок» Geek.com. 31 июля 2009 г.