Прямой голосовой ввод - Википедия - Direct voice input

Прямой голосовой ввод (DVI) (иногда называют управление голосовым вводом (ВИК)) это стиль человеко-машинное взаимодействие «HMI», в котором пользователь делает голосовые команды для выдачи инструкций машине.

DVI был установлен в кабинах нескольких современных военных самолетов, таких как Еврофайтер Тайфун, то Lockheed Martin F-35 Lightning II, то Dassault Rafale и Saab JAS 39 Грипен. Такие системы также использовались для различных других целей, включая промышленные системы управления и помощь в распознавании речи для людей с ограниченными возможностями.

Обзор

Системы DVI можно разделить на две основные категории функциональных возможностей: «зависимые от пользователя» и «независимые от пользователя». Система, зависящая от пользователя, требует, чтобы персональный голосовой шаблон был создан для конкретного человека; шаблон для этого человека должен быть загружен на назначенный ему компьютер до использования системы DVI, чтобы он функционировал должным образом. Напротив, независимая от пользователя система не требует какого-либо личного голосового шаблона, поскольку предназначена для правильного ответа на голос любого пользователя.[1] Их также можно разделить на «дискретное распознавание» и «непрерывное распознавание». Пользователи дискретной системы распознавания должны делать паузу между каждым словом, чтобы система DVI могла идентифицировать разделение между каждым словом, в то время как система распознавания непрерывной речи способна понимать нормальную скорость речи.[2]

В середине 2000-х гг. Исследователи Национальная аэрокосмическая лаборатория в Нидерланды изучили использование DVI в симуляторе «GRACE»; Всего в последующем эксперименте приняли участие двенадцать пилотов. По имеющимся сведениям, проведенные тесты показали, что, хотя само оборудование функционировало хорошо, перед его реальным развертыванием на самолетах желательно несколько улучшений, поскольку операции DVI фактически занимали больше времени по сравнению с традиционными существующими методами. Рекомендации по улучшению включали принятие более простого синтаксис, достижение большей скорости распознавания и уменьшения времени отклика; все возникшие проблемы были определены как технологические, и их можно было решить. Исследователи пришли к выводу, что в кабинах пилотов, особенно во время аварийных ситуаций, когда пилотам приходится действовать самостоятельно, система DVI может быть очень актуальной, но не имеет решающего значения во время большинства других возможных сценариев.[3]

Примерно в то же время в рамках проекта SafeSound, координируемого Управлением гражданской авиации, были проведены оценки систем DVI для целей гражданской авиации. Евросоюз. Он включал в себя наблюдение за рабочими нагрузками пилота в реальных кабинах и сопоставление их с деятельностью пилота в имитаторах полета с использованием как обычных систем, так и помощи DVI. Проект был направлен на повышение безопасности полетов и снижение нагрузки как при наземных, так и при полетах за счет применения расширенных звуковых функций.[4]

Приложения

Авиация

Перед его повсеместным развертыванием несколько обычных военных самолетов были преобразованы в испытательные системы DVI; примеры включают Харриер АВ-8Б и F-16 VISTA. В другом случае General Dynamics F-16 Fighting Falcon симулятор был модифицирован с помощью DVI для исследования голосового управления, которое проводилось Королевские ВВС Нидерландов.[5] Испытания DVI также проводились на вертолеты, в том числе Боинг AH-64 Apache, демонстрируя потенциал повышения безопасности полетов и эффективности миссии.[6][7]

Многочисленные современные истребители были оснащены системами DVI, часто в сочетании с различными другими схемами интерфейса человек-машина, такими как HOTAS -соответствующие элементы управления и другие передовые технологии управления. Комбинация схем управления Voice и HOTAS иногда упоминается как концепция "V-TAS". Известный истребитель, который будет оснащен кабиной V-TAS, - это Еврофайтер Тайфун.[8] В Lockheed Martin F-35 Lightning II также имеет систему DVI, разработанную Адасел.[9] Другие примеры включают Dassault Rafale и Saab JAS 39 Грипен.[5]

Планировалось, что многие самолеты будут использовать DVI. На одном этапе ВВС США стремился интегрировать DVI в Lockheed Martin F-22 Raptor; однако в конечном итоге было сочтено, что технология представляла слишком много технических рисков на тот момент, и поэтому от таких усилий отказались.[10]

Личное

К 1990 г. были продемонстрированы работающие прототипы цифровых систем распознавания слов; они продвигались с целью обеспечения эффективного человеко-машинного интерфейса для людей с ораторами с нарушениями речи.[11] Применяемые методы включали в себя цифровую речь с временным кодированием и автоматический выбор набора токенов. Сообщается, что исследования этих ранних систем DVI включали использование автоматических диагностических процедур и ограниченные испытания с участием добровольцев.[11]

В течение 2010-х годов различные компании предлагали системы распознавания голоса широкой публике.[2] Одним из примеров является Гугл голос сервис, который позволяет пользователям задавать вопросы с помощью пакета DVI, установленного на персональный компьютер, планшет, или же мобильный телефон. Многочисленные цифровые помощники были разработаны, такие как Amazon Echo, Siri, и Кортана, которые используют DVI для взаимодействия с пользователями.[2]

Коммерческий

Технология DVI позволила автоматизировать телефон системы для широкого развертывания. Многие компании обычно используют централизованные телефонные системы, которые направляют звонящих в нужный отдел такими методами.[2] Различные производители автомобилей также оснастили свои дорожные транспортные средства системами DVI; они обычно позволяют водителям управлять информационно-развлекательная система системы и взаимодействовать с мобильными телефонами с большим удобством, чем унаследованные методы.[2]

В конце 1980-х годов исследования использования систем DVI для управления Станки с ЧПУ и другое производственное оборудование.[12] В течение 2010-х годов такие системы использовались для целей логистики и управления складами.[13]

Рекомендации

  1. ^ Джарретт, Д.Н. (2005), Cockpit Engineering. Олдершот, Ashgate Publishing Limited ISBN  978-0-7546-1751-8.
  2. ^ а б c d е "Распознавание голоса". computerhope.com. 16 мая 2020.
  3. ^ Зон, Г.Д.Р., Рёрдинк, М.И., (2007), Использование голоса для управления полетной палубой Civil, Отчет NLR-TP-2006-720, (Этот отчет основан на презентации, проведенной в HCI Aero, Сиэтл, США, 20–22 сентября 2006 г.).[1] В архиве 2016-03-04 в Wayback Machine
  4. ^ «Практикум по проектированию будущих станций управления и вопросам деятельности человека на атомных электростанциях». Международное агентство по атомной энергии (МАГАТЭ). 8–10 мая 2006 г. С. 296–320.
  5. ^ а б Гиббон, Д., Мертинс, И. и Мур, Р.К. (2000) «Справочник по ресурсам, терминологии и оценке продуктов для мультимодальных и речевых диалоговых систем» (серия Springer International в области инженерии и информатики, том 565), Массачусетс, Kluwer Academic Publishers ISBN  978-0-7923-7904-1
  6. ^ Хантер, Дональд Джеймс (декабрь 2003 г.). «Определение задач летного экипажа для использования прямого голосового ввода (DVI) для снижения рабочей нагрузки пилотов в AH-64D Apache Longbow». trace.tennessee.edu.
  7. ^ Хердман, Крис, Йоханнсдоттир, Камилла, Лессард, Линда, Ярмаш, Ежи., Черчилль, Лаура и Фаррелл, Филип (январь 2001 г.). «Значительные преимущества и затраты, связанные с интеграцией системы прямого голосового ввода (DVI) в среду вертолета с несколькими экипажами».CS1 maint: использует параметр авторов (связь)
  8. ^ Оуэн, Пол С. «Кабина Еврофайтера». Eurofighter-typhoon.co.uk 7 декабря 1997 г. Дата обращения: 28 ноября 2009 г. В архиве 28 августа 2008 г. Wayback Machine
  9. ^ Шютте, Джон (10 октября 2007 г.). «Исследователи отлаживают речевую систему пилота F-35». af.mil. ВВС США. Архивировано из оригинал 23 апреля 2016 г.
  10. ^ Гебель, Грег. «Локхид Мартин F-22 Raptor». airvectors.net, 1 июля 2011 г. Дата обращения: 10 ноября 2012 г.
  11. ^ а б А. Г. Уорнер, Р. Д. Хьюз и Р. А. Кинг (1990). «Стратегия прямого голосового ввода человеко-машинного интерфейса для обеспечения голосового доступа для говорящих с серьезными нарушениями». Конференция UK IT 1990. С. 279–285.CS1 maint: использует параметр авторов (связь)
  12. ^ J.Y. Чжу и К.Г. Сюй (7 января 1988 г.). «Исследование системы голосового ввода для станков с ЧПУ». Нанкинский авиационный институт.CS1 maint: использует параметр авторов (связь)
  13. ^ «Приложения с голосовым управлением». lucasware.com. Получено 9 августа 2020.

внешняя ссылка