Беззвучный речевой интерфейс - Silent speech interface

Беззвучный речевой интерфейс это устройство, которое позволяет речевое общение без использования звука, издаваемого людьми, звуки речи. Таким образом, это тип электронного чтение по губам. Он работает с помощью компьютера, определяющего фонемы что человек произносит из неаудиторских источников информации об их речевые движения. Затем они используются для воссоздания речь с помощью синтез речи.[1]

Источники информации

Системы немого речевого интерфейса были созданы с использованием УЗИ и оптический вход камеры язык и губа движения.[2] Электромагнитные устройства - еще один метод отслеживания движений языка и губ.[3] Обнаружение речевых движений электромиография речевых артикуляторов, мышц и гортань это еще одна техника.[4][5] Еще один источник информации - это голосовой тракт резонансные сигналы, которые передаются через костная проводимость называется неслышным ропотом.[6] Они также были созданы как интерфейс мозг-компьютер используя мозговую активность в моторная кора получен из внутрикортикальные микроэлектроды.[7]

Использует

Такие устройства созданы как помощь тем, кто не может создавать звук. звучание необходимо для слышимой речи, например, после ларингэктомия.[8] Другое использование - для общения, когда речь замаскирована фоновый шум или искаженный автономный дыхательный аппарат. Дальнейшее практическое использование - это там, где существует потребность в бесшумном общении, например, когда требуется конфиденциальность в общественном месте или когда требуется бесшумная передача данных без помощи рук военные или охранная операция.[2][9]

В 2002 году японская компания NTT DoCoMo объявил, что создал тихую мобильный телефон с помощью электромиография и визуализация движения губ. «Стимулом к ​​разработке такого телефона, - заявили в компании, - стало избавление от шума в общественных местах», добавив, что «ожидается, что эта технология также поможет людям, которые навсегда потеряли голос».[10] С тех пор была показана возможность использования интерфейсов беззвучной речи для практического общения.[11]

В художественной литературе

Расшифровка немой речи с помощью компьютера сыграла важную роль в Артур Кларк история и Стэнли Кубрик связанный фильм Космическая одиссея. В этом, HAL 9000, компьютер, управляющий космическим кораблем Discovery One, направляясь к Юпитеру, обнаруживает заговор, чтобы отключить его астронавтами миссии Дэйв Боуман и Фрэнк Пул через чтение по губам их разговоры.[12]

В Орсон Скотт Кард Серии (включая Игра Эндера ), с искусственным интеллектом можно разговаривать, в то время как главный герой носит датчик движения в челюсти, что позволяет ему общаться с ИИ без шума. Он также носит ушной имплант.

Смотрите также

использованная литература

  1. ^ Денби Б., Шульц Т., Хонда К., Хьюбер Т., Гилберт Дж. М., Брумберг Дж. С. (2010). Беззвучные речевые интерфейсы. Речевое общение 52: 270–287. Дои:10.1016 / j.specom.2009.08.002
  2. ^ а б Хюбер Т., Бенароя Э. Л., Чоллет Г., Денби Б., Дрейфус Г., Стоун М. (2010). Разработка интерфейса беззвучной речи на основе ультразвуковых и оптических изображений языка и губ. Речевое общение, 52 288–300. Дои:10.1016 / j.specom.2009.11.004
  3. ^ Ван Дж., Самал А. и Грин Дж. Р. (2014). Предварительное тестирование интерактивного интерфейса беззвучной речи в реальном времени на основе электромагнитного артикулографа, 5-й семинар ACL / ISCA по обработке речи и языка для вспомогательных технологий, Балтимор, Мэриленд, 38-45.
  4. ^ Йоргенсен С., Душан С. (2010). Речевые интерфейсы на основе поверхностной электромиографии. Речевая коммуникация, 52: 354–366. Дои:10.1016 / j.specom.2009.11.003
  5. ^ Шульц Т., Ванд М. (2010). Моделирование коартикуляции в распознавании непрерывной речи на основе ЭМГ. Речевое общение, 52: 341-353. Дои:10.1016 / j.specom.2009.12.002
  6. ^ Хирахара Т., Отани М., Симидзу С., Тода Т., Накамура К., Накадзима Ю., Шикано К. (2010). Усиление беззвучной речи с помощью проводимых телом сигналов голосового тракта. Речевое общение, 52: 301–313. Дои:10.1016 / j.specom.2009.12.001
  7. ^ Брумберг Дж. С., Ньето-Кастанон А., Кеннеди П. Р., Гюнтер Ф. Х. (2010). Интерфейсы мозг – компьютер для речевого общения. Речевое общение 52: 367–379. 2010 г. Дои:10.1016 / j.specom.2010.01.001
  8. ^ Дэн Ю., Патель Р., Хитон Дж. Т., Колби Г., Гилмор Л. Д., Кабрера Дж., Рой С. Х., Де Лука С. Дж., Мельцнер Г. С. (2009). Нарушение распознавания речи с помощью акустических сигналов и сигналов sEMG. В INTERSPEECH-2009, 644-647.
  9. ^ Дэн Ю., Колби Г., Хитон Дж. Т. и Мельцнер Х.Г. С. (2012). Усовершенствования обработки сигналов для системы распознавания беззвучной речи на основе MUTEsEMG. Конференция по военной связи, МИЛКОМ 2012.
  10. ^ Фицпатрик М. (2002). Мобильный телефон для чтения по губам заглушает крикунов. Новый ученый.
  11. ^ Жезл М, Шульц Т. (2011). Независимое от сеанса распознавание речи на основе EMG. Труды 4-й Международной конференции по биотехнологическим системам и обработке сигналов.
  12. ^ Кларк, Артур С. (1972). Затерянные миры 2001 года. Лондон: Сиджвик и Джексон. ISBN  0-283-97903-8.