Устройство для генерации речи - Speech-generating device

Стивен Хокинг, покойный астрофизик и известный пользователь SGD

Речевые устройства (SGD), также известен как голосовые средства связи, электронные дополнительное и альтернативное общение (AAC) системы, используемые для дополнения или замены речи или письма для людей с тяжелым нарушения речи, позволяя им устно общаться.^[1] SGD важны для людей с ограниченными средствами вербального взаимодействия, поскольку они позволяют людям стать активными участниками коммуникативных взаимодействий. Они особенно полезны для пациентов, страдающих боковой амиотрофический склероз (БАС), но в последнее время они использовались для детей с прогнозируемыми дефектами речи.^[2]

Существует несколько методов ввода и отображения для пользователей с различными способностями, позволяющих использовать SGD. Некоторые SGD имеют несколько страниц символов для размещения большого количества высказываний, и, таким образом, только часть доступных символов видна в любой момент времени, когда коммуникатор перемещается по различным страницам. Речевые устройства могут воспроизводить электронный речевой вывод с помощью оцифрованные записи естественной речи или через синтез речи - которые могут нести менее эмоциональную информацию, но могут позволить пользователю произносить новые сообщения.^[3]

На содержание, организацию и обновление словаря в SGD влияет ряд факторов, таких как потребности пользователя и контексты, в которых будет использоваться устройство.^[4] Разработка методов улучшения доступного словарного запаса и скорости произнесения речи является активной областью исследований. Словарные элементы должны вызывать большой интерес у пользователя, быть часто применимыми, иметь широкий диапазон значений и быть прагматичными по функциональности.^[5]

Существует несколько методов доступа к сообщениям на устройствах: прямо или косвенно или с использованием специализированных устройств доступа, хотя конкретный метод доступа будет зависеть от навыков и способностей пользователя.^[1] Выходной сигнал SGD обычно намного медленнее, чем речь, хотя стратегии повышения ставок может увеличить скорость вывода пользователя, что приведет к повышению эффективности связи.^[6]

Первый известный SGD был прототипирован в середине 1970-х, и быстрый прогресс в оборудование и программного обеспечения разработка означает, что возможности SGD теперь могут быть интегрированы в такие устройства, как смартфоны. Известные пользователи SGD включают Стивен Хокинг, Роджер Эберт, Тони Праудфут, и Пит Фрейтс (основатель ALS Ice Bucket Challenge ).

Системы генерации речи могут быть специализированными устройствами, разработанными исключительно для AAC, или неспециализированными устройствами, такими как компьютеры, на которых запущено дополнительное программное обеспечение, позволяющее им функционировать как устройства AAC.^[7]^[8]

История

Селекторный механизм, управляемый пациентом (POSM или POSSUM), был разработан в начале 1960-х годов.

SGD уходят корнями в первые средства электронной связи. Первая такая помощь была глоток и затяжка Контроллер пишущей машинки назвал управляемый пациентом селекторный механизм (POSSUM), прототип которого был разработан Reg Maling в Соединенном Королевстве в 1960 году.^[9]^[10] ПОССУМ сканированный через набор символов на дисплее с подсветкой.^[9] Исследователи из Делфтский университет В 1970 году в Нидерландах создали пишущую машинку с управляемым световым пятном (LOT), в которой использовались небольшие движения головы, чтобы направить небольшое световое пятно на матрицу символов, каждый из которых оснащен фотоэлементом. Несмотря на коммерческую неудачу, LOT был хорошо принят пользователями.^[11]

В 1966 году Барри Ромич, студент-первокурсник инженерного факультета Университета Кейс Вестерн Резерв, и Эд Прентке, инженер больницы Хайленд Вью в Кливленде, штат Огайо, создали партнерство, создав Компания Прентке Ромич.^[12] В 1969 году компания выпустила свое первое коммуникационное устройство - систему набора текста, основанную на списанной машине Teletype.

В течение 1970-х и начала 1980-х годов начали появляться несколько других компаний, которые с тех пор стали известными производителями SGD. Тоби Черчилль основал компанию Toby Churchill Ltd в 1973 году после потери речи из-за энцефалита.^[13] В США, Dynavox (тогда известная как Sentient Systems Technology) выросла из студенческого проекта в Университет Карнеги Меллон, созданный в 1982 году, чтобы помочь молодой женщине с церебральный паралич общаться.^[14]Начиная с 1980-х годов, усовершенствования технологий привели к значительному увеличению количества, разнообразия и производительности коммерчески доступных устройств связи, а также уменьшению их размера и цены. Альтернативные методы доступа, такие как сканирование цели (также известное как наведение глаз), калибруют движение глаз пользователя, чтобы направить SGD для создания желаемой фазы речи. Сканирование, при котором пользователю последовательно представляются альтернативы, стало доступно на устройствах связи.^[10]^[15] Возможности вывода речи включали как оцифрованную, так и синтезированную речь.^[10]

Быстрый прогресс в оборудование и программного обеспечения развитие продолжалось, в том числе проекты, финансируемые европейское сообщество. Первые коммерчески доступные устройства для генерации речи с динамическим экраном были разработаны в 1990-х годах. Были разработаны программы, позволяющие производить на компьютере доски связи.^[10]^[15] Высокотехнологичные устройства продолжают становиться меньше и легче,^[15] при увеличении доступности и возможностей; к устройствам связи можно получить доступ, используя системы айтрекинга, выполнять роль компьютера для обработка текста и использование Интернета, и как устройство контроля окружающей среды для независимого доступа к другому оборудованию, такому как телевизор, радио и телефоны.^[16]

Стивен Хокинг стал ассоциироваться с уникальным голосом своего синтезатора. Хокинг не мог говорить из-за сочетания тяжелых нарушений, вызванных: ALS, и чрезвычайная ситуация трахеотомия.^[17] За последние 20 лет или около того SGD приобрели популярность среди маленьких детей с дефектами речи, такими как аутизм, синдром Дауна и прогнозируемым повреждением головного мозга в результате хирургического вмешательства.

Начиная с начала 2000-х годов специалисты увидели пользу использования SGD не только для взрослых, но и для детей. Нейролингвисты обнаружили, что SGD столь же эффективны в помощи детям, которые подвергались риску временного дефицита речи после операции на головном мозге, как и пациентам с БАС. В частности, оцифрованные SGD использовались в качестве средств коммуникации для педиатрических пациентов в процессе выздоровления.

Методы доступа

Существует множество методов доступа к сообщениям на устройствах: прямо, косвенно и с помощью специализированных устройств доступа. Методы прямого доступа предполагают физический контакт с системой с помощью клавиатуры или сенсорного экрана. Пользователи, обращающиеся к SGD косвенно и через специализированные устройства, должны манипулировать объектом, чтобы получить доступ к системе, например, маневрировать джойстик, головная мышь, оптический указатель на голову, световой указатель, инфракрасный указатель или переключатель доступа сканера.^[1]

Конкретный метод доступа будет зависеть от навыков и способностей пользователя. При прямом выборе части тела, указателя, адаптированного мышь, джойстик, или можно использовать отслеживание взгляда,^[18] в то время как переключить доступ сканирования часто используется для косвенного отбора.^[8]^[19] В отличие от прямого выбора (например, набора текста на клавиатуре, касания экрана), пользователи Target Scanning могут делать выбор только тогда, когда индикатор сканирования (или курсор) электронного устройства находится на желаемом выборе.^[20] Те, кто не может указывать, обычно калибруют свои глаза, чтобы использовать взгляд как способ указывать и блокировать как способ выбора желаемых слов и фраз. Скорость и схема сканирования, а также способ выбора элементов индивидуализируются в зависимости от физических, визуальных и когнитивных возможностей пользователя.^[20]

Построение сообщения

Скриншот Дашер программа повышения ставок

Дополнительное и альтернативное общение обычно намного медленнее, чем речь,^[6] пользователи обычно производят 8–10 слов в минуту.^[21] Стратегии повышения скорости могут повысить скорость вывода пользователя примерно до 12–15 слов в минуту,^[21] и, как следствие, повысить эффективность общения.

В любом SGD может быть большое количество речевых выражений, которые способствуют эффективному и действенному общению, включая приветствия, выражение желаний и задавание вопросов.^[22] Некоторые SGD содержат несколько страниц символы чтобы вместить большое количество голосовых выражений, и, таким образом, только часть доступных символов видна в любой момент, когда коммуникатор перемещается по различным страницам.^[23] Устройства генерации речи обычно отображают набор вариантов выбора либо с помощью динамически изменяющегося экрана, либо с помощью фиксированного дисплея.^[24]

Есть два основных варианта увеличения скорости передачи данных для SGD: кодирование и прогнозирование.^[6]

Кодирование позволяет пользователю создавать слово, предложение или фразу, используя только одну или две активации их SGD.^[6] Иконические стратегии кодирования, такие как Семантическое уплотнение комбинируйте последовательности значков (графических символов) для создания слов или фраз.^[25] В числовой, буквенно-цифровой и буквенной кодировке (также известной как аббревиатура-расширение) слова и предложения кодируются как последовательности букв и цифр. Например, ввод «ЧЧ» или «G1» (для приветствия 1) может привести к ответу «Привет, как дела?».^[25]

Прогнозирование - это стратегия повышения скорости, в которой SGD пытается уменьшить количество нажатий клавиш, предсказывая слово или фразу, написанную пользователем. Затем пользователь может выбрать правильный прогноз без необходимости писать все слово. Предсказание слова программное обеспечение может определять варианты, которые будут предлагаться, в зависимости от их частоты использования в языке, ассоциации с другими словами, прошлых выборов пользователя или грамматической пригодности.^[6]^[25]^[26] Однако было показано, что пользователи производят больше слов в минуту (с использованием интерфейса сканирования) со статической раскладкой клавиатуры, чем с прогнозирующей раскладкой сетки, что позволяет предположить, что когнитивные накладные расходы на просмотр новой компоновки сводят на нет преимущества предиктивной раскладки при использовании интерфейс сканирования.^[27]

Другой подход к повышению скорости: Дашер,^[28] который использует языковые модели и арифметическое кодирование для представления альтернативных буквенных обозначений на экране с размером относительно их вероятности с учетом истории.^[29]^[30]

Скорость произнесения слов может сильно зависеть от концептуального уровня системы: система TALK, которая позволяет пользователям выбирать между большим количеством высказываний на уровне предложения, демонстрирует скорость вывода, превышающую 60 слов в минуту.^[31]

Фиксированные и динамические устройства отображения

Фиксированные устройства отображения

Устройство генерации речи с фиксированным дисплеем

Устройства фиксированного отображения относятся к устройствам, в которых символы и элементы «фиксированы» в определенном формате; некоторые источники называют их "статическими" дисплеями.^[32] Такие устройства отображения имеют более простую кривую обучения, чем некоторые другие устройства.

Фиксированные устройства отображения воспроизводят типичную компоновку низкотехнологичных устройств AAC (низкотехнологичные - это те устройства, которым не нужны батареи, электричество или электроника), например доски связи. У них есть некоторые недостатки; например, они обычно ограничиваются ограниченным числом символов и, следовательно, сообщениями.^[24] Важно отметить, что с технологическим прогрессом, достигнутым в двадцать первом веке, SGD с фиксированным дисплеем больше не используются повсеместно.

Устройства динамического отображения

Устройства с динамическими дисплеями обычно также сенсорный экран устройств. Обычно они генерируют визуальные символы, созданные в электронном виде, при нажатии на которые изменяется отображаемый набор выбранных элементов. Пользователь может изменять доступные символы, используя ссылки на страницы для перехода к соответствующим страницам словаря и сообщений.

Устройство для генерации речи с динамическим дисплеем, способное выводить как синтезированную, так и оцифрованную речь

«Домашняя» страница устройства динамического отображения может отображать символы, относящиеся ко многим различным контекстам или темам разговора. Нажатие любого из этих символов может открыть другой экран с сообщениями, относящимися к этой теме.^[24] Например, при просмотре волейбольного матча пользователь может нажать символ «спорт», чтобы открыть страницу с сообщениями, относящимися к спорту, а затем нажать символ, показывающий табло, чтобы произнести фразу «Какой счет?».

Преимущества устройств с динамическим отображением включают доступность гораздо большего словарного запаса и возможность видеть строящееся предложение.^[22] Еще одним преимуществом устройств динамического отображения является то, что базовая операционная система способна предоставлять варианты для нескольких каналов связи, включая Сотовый телефон, текстовых сообщений и электронная почта.^[33] Работа Линчёпингский университет показал, что такая практика написания электронных писем позволяет детям, которые были пользователями SGD, развивать новые социальные навыки и расширять свое участие в жизни общества.^[34]

Говорящие клавиатуры

Клавиатура, используемая для создания речи по телефону с помощью преобразователя текста в речь.

Недорогие системы также могут включать в себя комбинацию клавиатуры и аудиоколонок без динамического дисплея или визуального экрана. Этот тип клавиатуры отправляет набранный текст прямо на динамик. Он может позволить произнести любую фразу без необходимости использования визуального экрана, который не всегда требуется. Одно простое преимущество заключается в том, что говорящая клавиатура при использовании со стандартным телефоном или громкой связью позволяет человеку с нарушением голоса вести двусторонний разговор по телефону.^{[нужна цитата ]}

Вывод

Выходные данные SGD могут быть оцифрованы и / или синтезированы: оцифрованные системы воспроизводят непосредственно записанные слова или фразы, в то время как синтезированная речь использует программное обеспечение для преобразования текста в речь, которое может нести меньше эмоциональной информации, но позволяет пользователю произносить новые сообщения, вводя новые слова.^[35]^[36] Сегодня люди используют комбинацию записанных сообщений и методов преобразования текста в речь на своих SGD.^[36] Однако некоторые устройства ограничены только одним типом вывода.

Оцифрованная речь

Простое устройство для генерации речи с переключателем

Слова, фразы или целые сообщения могут быть оцифрованы и сохранены на устройстве для воспроизведения, которое будет активировано пользователем.^[1] Этот процесс официально известен как голосовой банкинг.^[37] К преимуществам записанной речи можно отнести то, что она (а) обеспечивает естественное просодия и естественность речи для слушателя^[3] (например, для записи сообщений может быть выбран человек того же возраста и пола, что и пользователь AAC),^[3] и (б) он обеспечивает дополнительные звуки, которые могут быть важны для пользователя, такие как смех или свист. Кроме того, цифровые SGD обеспечивают определенную степень нормальности как для пациента, так и для его семей, когда они теряют способность говорить самостоятельно.

Основным недостатком использования только записанной речи является то, что пользователи не могут создавать новые сообщения; они ограничиваются сообщениями, предварительно записанными в устройство.^[3]^[38] В зависимости от устройства может быть ограничение на длину записей.^[3]^[38]

Синтезированная речь

SGD, которые используют синтезированную речь, применяют фонетический правила языка для перевода сообщения пользователя в речевой вывод (синтез речи ).^[1]^[36] Пользователи могут создавать новые слова и сообщения, не ограничиваясь теми, которые были предварительно записаны на их устройство другими.^[36]

Смартфоны и компьютеры расширили использование устройств с синтезированной речью благодаря созданию приложений, которые позволяют пользователю выбирать из списка фраз или сообщений для произнесения тем голосом и языком, которые он выбрал. Такие приложения, как SpeakIt! или Assistive Express для iPhone - это дешевый способ использования устройства, генерирующего речь, без необходимости посещения врача или обучения использованию специального оборудования.

Синтезированные SGD могут допускать несколько методов создания сообщений, которые можно использовать по отдельности или в комбинации: сообщения могут быть созданы из букв, слов, фраз, предложений, изображений или символов.^[1]^[38] С синтезированной речью имеется практически неограниченный объем памяти для сообщений с небольшими требованиями к пространству памяти.^[3]

Механизмы синтезированной речи доступны на многих языках,^[36]^[38] и параметры движка, такие как скорость речи, диапазон высоты тона, пол, образцы напряжений, паузы и исключения произношения, могут быть изменены пользователем.^[38]

Программирование

Устройство преобразования текста в речь с помощью клавиатуры

Набор для выбора и словарь

Набор для выбора SGD - это набор всех сообщений, символов и кодов, которые доступны человеку, использующему это устройство.^[39] Содержание, организация и обновление этого набора являются областями активных исследований и зависят от ряда факторов, включая способности, интересы и возраст пользователя.^[4] Набор для выбора для системы AAC может включать слова, которые пользователь еще не знает - они включены для пользователя, чтобы «вырасти».^[4] Контент, установленный на любом данном SGD, может включать в себя большое количество предустановленных страниц, предоставляемых производителем, с рядом дополнительных страниц, созданных пользователем или группой обслуживания пользователя в зависимости от потребностей пользователя и контекстов, в которых устройство будет использоваться. .^[4]

Первоначальный выбор контента

Исследователи Бекельман и Миренда перечисляют ряд возможных источников (например, членов семьи, друзей, учителей и обслуживающий персонал) для выбора исходного контента для SGD. Требуется ряд источников, потому что, как правило, у одного человека не будет знаний и опыта для создания всех вокальных выражений, необходимых в любой данной среде.^[4] Например, родители и терапевты могут не подумать добавить сленговые термины, такие как "innit ".^[40]

В предыдущей работе было проанализировано как словарный запас обычно развивающихся динамиков, так и использование слов пользователями AAC для создания контента для новых устройств AAC. Такие процессы хорошо работают для генерации основного набора высказываний или речевых выражений, но менее эффективны в ситуациях, когда требуется определенный словарный запас (например, термины, непосредственно связанные с интересом пользователя к верховой езде). Термин «периферийная лексика» относится к лексике, которая специфична или уникальна для личных интересов или потребностей человека. Типичный метод развития периферийного словаря для устройства - это проведение интервью с несколькими «информаторами»: братьями и сестрами, родителями, учителями, коллегами и другими вовлеченными лицами.^[4]

Другие исследователи, такие как Масселвайт и Сент-Луис, предполагают, что начальные словарные элементы должны представлять большой интерес для пользователя, быть часто применимыми, иметь широкий диапазон значений и быть прагматичными по функциональности.^[5] Эти критерии широко используются в области AAC в качестве экологической проверки содержания SGD.^[4]

Автоматическое обслуживание контента

Пользователь AAC с настраиваемым устройством

Бекельман и Миренда подчеркивают, что выбор словарного запаса также включает постоянное поддержание словарного запаса;^[4] однако сложность в AAC состоит в том, что пользователи или их опекуны должны вручную программировать любые новые высказывания (например, имена новых друзей или личные истории), а существующих коммерческих решений для автоматического добавления контента нет.^[21] Ряд исследовательских подходов пытались преодолеть эту трудность,^[41] они варьируются от «предполагаемых входных данных», таких как создание контента на основе журнала разговоров с друзьями и семьей пользователя,^[42] к данным, полученным из Интернета, чтобы найти языковые материалы, такие как проект Webcrawler.^[43] Более того, используя Лайфлоггинг На основе подходов содержимое устройства может быть изменено в зависимости от событий, которые происходят с пользователем в течение дня.^[41]^[44] Получая доступ к большему количеству данных пользователя, можно генерировать более качественные сообщения с риском раскрытия конфиденциальных данных пользователя.^[41] Например, используя системы глобального позиционирования, содержимое устройства может быть изменено в зависимости от географического положения.^[45]^[46]

Этические проблемы

Многие недавно разработанные SGD включают инструменты измерения и анализа производительности чтобы помочь контролировать контент, используемый физическим лицом. Это вызывает опасения по поводу Конфиденциальность, и некоторые утверждают, что пользователь устройства должен участвовать в принятии решения о мониторинге использования таким образом.^[47]^[48] Аналогичные опасения были высказаны в отношении предложений для устройств с автоматическим созданием контента,^[44] и конфиденциальность становится все более важным фактором при разработке SGD.^[40]^[49] Поскольку устройства AAC предназначены для использования во всех сферах жизни пользователя, существуют важные юридические, социальные и технические проблемы, связанные с широким семейством устройств. управление личными данными проблемы, которые можно найти в контексте использования AAC. Например, SGD может быть спроектирован так, чтобы он поддерживал право пользователя удалять журналы разговоров или контент, который был добавлен автоматически.^[50]

Вызовы

Программирование устройств динамической генерации речи обычно выполняется специалистами по дополнительным коммуникациям. От специалистов требуется, чтобы они удовлетворяли потребности пациентов, потому что пациенты обычно выбирают, какие слова / фразы им нужны. Например, пациенты используют разные фразы в зависимости от своего возраста, инвалидности, интересов и т. Д. Таким образом, организация контента занимает очень много времени. Кроме того, медицинские страховые компании редко покрывают SGD. В результате ресурсы очень ограничены как в отношении финансирования, так и укомплектования персоналом. Доктор Джон Костелло из Бостонской детской больницы был движущей силой сбора пожертвований, чтобы эта программа работала и укомплектовывалась персоналом как в своей больнице, так и в больницах по всей стране.

Смотрите также

Orca (вспомогательные технологии)

использованная литература

^ ^а ^б ^c ^d ^е ^ж Aetna Inc. (2010)
^ Блищак и др. (2003)
^ ^а ^б ^c ^d ^е ^ж Гленнен и Декост стр. 88–90
^ ^а ^б ^c ^d ^е ^ж ^г ^час Бекельман и Миренда, Глава 2
^ ^а ^б Musselwhite & Louis
^ ^а ^б ^c ^d ^е Вашингтонский университет (2009)
^ Гленнен С. 62–63.
^ ^а ^б Янс и Кларк (1998) С. 37–38.
^ ^а ^б Вандерхайде (2002)
^ ^а ^б ^c ^d Зангари (1994)
^ Стассен и др., п. 127
^ История КНР
^ Тоби Черчилль (О нас)
^ Dynavox (История компании)
^ ^а ^б ^c Hourcade (2004).
^ Робитайль С. 151–153.
^ Стивен Хокинг и БАС
^ Мэти (2000)
^ Гленнен и Декост стр 62–63
^ ^а ^б Бекельман и Миренда, стр. 97–101
^ ^а ^б ^c Хиггинботам и др. (2007)
^ ^а ^б Бекельман и Миренда
^ Хохштейн и др. (2004)
^ ^а ^б ^c Бекельман и Миренда п. 84-85
^ ^а ^б ^c Венкатагири (1995)
^ Augmentative Communication, Incorporated
^ Йохансен и др. (2003)
^ Уорд и др. (2000)
^ Рорк и др. (2010)
^ Макки (2003), стр.119
^ Тодман (2000)
^ Хохштейн и др. (2003)
^ Dynavox на www.speechbubble.org.uk
^ Сундквист и Рённберг (2010)
^ Шлоссер, Блищак и Коул (2003)
^ ^а ^б ^c ^d ^е Бекельман и Миренда п. 105-106
^ Бекельман и Миренда, п. 105.
^ ^а ^б ^c ^d ^е Радомский и др. (2007)
^ Бекельман и Миренда п. 83
^ ^а ^б @article {wickenden2011whose, title = {Чей это голос ?: Проблемы идентичности, голоса и репрезентации, возникающие в этнографическом исследовании жизни подростков с ограниченными возможностями, использующих дополнительное и альтернативное общение (AAC)}, автор = {Викенден, М. }, journal = {Disability Studies Quarterly}, volume = {31}, number = {4}, year = {2011}}
^ ^а ^б ^c Реддингтон и Тинтарев (2011)
^ Ашраф и др. (2002)
^ Луо и др. (2007)
^ ^а ^б Блэк и др. (2010)
^ Dominowska et al.
^ Патель и Радхакришнан
^ Бекельман и Миренда, п. 30
^ Blackstone et al. (2002)
^ Rackensperger et al. (2005)
^ Реддингтон и Коулз-Кемп (2011)

Список используемой литературы

Aetna Inc. (2010). «Бюллетень клинической политики: устройства для генерации речи».
Ashraf, S .; Warden, A .; Ширер, А. Дж .; Джадсон, А .; Ricketts, I.W .; Уоллер, А .; Alm, N .; Гордон, Б .; MacAulay, F .; Brodie, J. K .; Этчелс, М. (2002). «Захват фраз для ICU-Talk, средства коммуникации для интубированных пациентов интенсивной терапии». Материалы пятой международной конференции ACM по ассистивным технологиям - Assets '02. п. 213. Дои:10.1145/638249.638288. ISBN 1581134649. S2CID 4474005.
Бекельман, Д.; Миренда, П. (15 июня 2005 г.). Дополнительное и альтернативное общение: поддержка детей и взрослых со сложными коммуникативными потребностями (3-е изд.). Паб Пола Х. Брукса. Co. ISBN 978-1-55766-684-0.
Блэк, Р., Реддингтон, Дж., Райтер, Э., Тинтарев, Н., и Уоллер А. 2010. Использование NLG и датчиков для поддержки личного повествования детей со сложными коммуникативными потребностями. В материалах семинара NAACL HLT 2010 по обработке речи и языка для вспомогательных технологий (SLPAT '10). Ассоциация компьютерной лингвистики, Страудсбург, Пенсильвания, США, 1–9.
Blackstone, S.W .; Уильямс, М. Б.; Джойс, М. (2002). «Будущие потребности в технологиях AAC: потребительские перспективы». Вспомогательные технологии. 14 (1): 3–16. Дои:10.1080/10400435.2002.10132051. PMID 12739846. S2CID 42895721.
Блищак, Д. М., Ломбардино, Л. Дж., И Дайсон, А. Т. (2003). Использование устройств для генерации речи: для поддержки естественной речи. Дополнительное и альтернативное общение, 19
Брюэр, Н. (8 февраля 2011 г.). "'Технология дает мальчику право голоса ".
Демпстер, М., Альм, Н., и Рейтер, Э .. 2010. Автоматическая генерация речевых высказываний и повествования для усиливающей и альтернативной коммуникации: система-прототип. В материалах семинара NAACL HLT 2010 по обработке речи и языка для вспомогательных технологий (SLPAT '10). Ассоциация компьютерной лингвистики, Страудсбург, Пенсильвания, США, 10–18.
Dominowska, E., Roy, D., & Patel, R. (2002). Адаптивное контекстно-зависимое средство коммуникации. Труды Международной конференции CSUN по технологиям и инвалидам, Нортридж, Калифорния.
Центр ACE. «Динавокс Серии 5». Архивировано из оригинал 25 апреля 2012 г.
"История компании Dynavox". Архивировано из оригинал 5 августа 2016 г.. Получено 26 декабря 2011.
Лунд, Дж. "Журнал Роджера Эберта: обретение собственного голоса 8/12/2009". Blogs.suntimes.com. Архивировано из оригинал 19 августа 2011 г.. Получено 17 октября 2009.
Фридман, М. Б., Г. Килиани, М. Дзмара, Д. Андерсон. "Система связи Eyetracker", Джонс Хопкинс Технический дайджест APL, т. 3, вып. 3, 1982. 250–252
Фридман, М.Б., Килиани, Г., Дзмура, М. (1985) Клавиатура, управляемая глазами. Материалы 2-й Международной конференции по Реабилитационная инженерия, 446–447
Хэнлон, М. «Стивен Хокинг выбирает новый голос». Получено 10 августа 2009.
Гленнен, Шэрон Л. и Декост, Дениз К. (1997). Справочник по дополнительным и альтернативным коммуникациям. Singular Publishing Group, Inc .: Сан-Диего, Калифорния.
Хокинг, С. «Стивен Хокинг и БАС». Получено 10 августа 2009.
Хедман, Гленн (1990). Технологии реабилитации. Рутледж. С. 100–01. ISBN 978-1-56024-033-4.
Хиггинботэм, Д. Дж .; Шейн, H .; Russell, S .; Пещеры, К. (2007). «Доступ к AAC: настоящее, прошлое и будущее». Дополнительное и альтернативное общение. 23 (3): 243–257. Дои:10.1080/07434610701571058. PMID 17701743. S2CID 17891586.
Hochstein, D. D .; McDaniel, M.A .; Nettleton, S .; Нойфельд, К. Х. (2003). «Плодотворность номотетического подхода к исследованию AAC: сравнение двух схем кодирования речи у детей с церебральным параличом и детей без инвалидности». Американский журнал патологии речи и языка. 12 (1): 110–120. Дои:10.1044/1058-0360(2003/057). PMID 12680818.
Hochstein, D. D .; McDaniel, M.A .; Нетлтон, С. (2004). «Распознавание словарного запаса у детей и подростков с церебральным параличом: сравнение двух схем речевого кодирования». Дополнительное и альтернативное общение. 20 (2): 45–62. Дои:10.1080/07434610410001699708. S2CID 62243903.
Hourcade, J .; Everhart Pilotte, T .; West, E .; Паретт, П. (2004). «История дополнительного и альтернативного общения для людей с тяжелыми и глубокими нарушениями». Сосредоточьтесь на аутизме и других нарушениях развития. 19 (4): 235–244. Дои:10.1177/10883576040190040501. S2CID 73593697.
Infinitec.org. «Дополнительное альтернативное общение». Архивировано из оригинал 16 мая 2011 г.. Получено 16 марта 2011.
Jans, D .; Кларк, С. (1998). «Высокотехнологичные средства коммуникации» (PDF). В Уилсоне, Аллане (ред.). Усиливающая коммуникация на практике: введение. CALL-центр Эдинбургского университета. ISBN 978-1-898042-15-0.
Йохансен, А.С., Хансен, Дж. П., Хансен, Д. В., Ито, К., и Машино, С. 2003. Языковая технология в предсказательной, ограниченной экранной клавиатуре с динамической раскладкой для людей с тяжелыми формами инвалидности. В материалах семинара EACL 2003 г. по языковому моделированию для методов ввода текста (TextEntry '03). Ассоциация компьютерной лингвистики, Страудсбург, Пенсильвания, США, 59–66.
Луо, Ф., Хиггинботам, Д. Дж., И Лешер, Г. (2007). Webcrawler: улучшенная аугментативная коммуникация. Документ представлен на конференции CSUN по технологиям для инвалидов, март, Лос-Анджелес.
Мэти; Йоркстон, Гуттман (2000). «Аугментативное общение для людей с боковым амиотрофическим склерозом». В Beukelman, D .; Yorkston, K .; Райхле, Дж. (Ред.). Расстройства аугментативной и альтернативной коммуникации для взрослых с приобретенными неврологическими расстройствами. Балтимор: P.H.Brookes Pub. ISBN 978-1-55766-473-0.
Дэвид Дж. С. Маккей (2003). Теория информации, логические выводы и алгоритмы обучения. Издательство Кембриджского университета. п. 119. ISBN 978-0-521-64298-9.
Musselwhite, C. R .; Сент-Луис, К. У. (май 1988 г.). Коммуникативные программы для людей с тяжелыми физическими недостатками: вокальные и аугментативные стратегии. Pro-Ed. ISBN 978-0-89079-388-6.
Р. Патель и Р. Радхакришнан. 2007. Расширение доступа к ситуационному словарю за счет использования географического контекста. Результаты и преимущества вспомогательных технологий
Rackensperger, T .; Крезман, Ц .; McNaughton, D .; Уильямс, М. Б.; д'Сильва, К. (2005). ""Когда я впервые получил это, я хотел сбросить его со скалы ": проблемы и преимущества изучения технологий AAC, описанные взрослыми, которые используют AAC". Дополнительное и альтернативное общение. 21 (3): 165. Дои:10.1080/07434610500140360. S2CID 143533447.
Радомский, М. В., Тромбли Латам, К. А. (2007). Трудотерапия при соматической дисфункции. Липпинкотт Уильямс и Уилкинс. п. 527. ISBN 978-0-7817-6312-7.
Реддингтон, Дж .; Тинтарев, Н. (2011). «Автоматическое создание историй из данных датчиков». Материалы 15-й международной конференции по интеллектуальным пользовательским интерфейсам - IUI '11. п. 407. Дои:10.1145/1943403.1943477. ISBN 9781450304191. S2CID 10394365.
Реддингтон, Дж., И Коулз-Кемп, Л. (2011). Trap Hunting: обнаружение проблем с управлением персональными данными в устройствах AAC нового поколения. В материалах второго семинара по обработке речи и языка для вспомогательных технологий (стр. 32–42). Эдинбург, Шотландия, Великобритания: Ассоциация компьютерной лингвистики.
Рорк, Б., де Вильерс, Дж., Гиббонс, К., и Фрид-Окен, М., 2010. Методы сканирования и языковое моделирование для ввода двоичного переключателя. В материалах семинара NAACL HLT 2010 по обработке речи и языка для вспомогательных технологий (SLPAT '10). Ассоциация компьютерной лингвистики, Страудсбург, Пенсильвания, США, 28–36.
Шлоссер, Р. В., Блищак, Д. М., К., Раджиндер К. (2003). «Роли речевого вывода в AAC». В R. W. Schlosser (ed.). Эффективность дополнительной и альтернативной коммуникации: к практике, основанной на фактах. Сан-Диего: академический. С. 472–532. ISBN 0-12-625667-5.CS1 maint: несколько имен: список авторов (ссылка на сайт)
«Возвращение подарка Гэба: карманные компьютеры NexGen позволяют немому общаться». Получено 10 августа 2009.
Stassen, H.G .; Sheridan, T. B .; Ван Люнтерен, Т. (1997). Взгляды на человека-контролера: очерки в честь Хенка Г. Стассена. Психология Press. ISBN 978-0-8058-2190-1.
Sundqvist, A .; Рённберг, Дж. (2010). «Качественный анализ электронного взаимодействия детей, использующих дополнительное и альтернативное общение». Дополнительное и альтернативное общение. 26 (4): 255–266. Дои:10.3109/07434618.2010.528796. PMID 21091302. S2CID 29481.
Тодман, Дж. (2000). «Скорость и качество разговоров с использованием системы AAC с хранением текста: учебное исследование для одного случая». Дополнительное и альтернативное общение. 16 (3): 164–179. Дои:10.1080/07434610012331279024. S2CID 144178797.
«Типы устройств AAC, дополнительные средства связи, объединенные». Получено 19 марта 2009.^{[постоянная мертвая ссылка ]}
"Тоби Черчилль, о нас". Архивировано из оригинал 10 декабря 2011 г.. Получено 26 декабря 2011.
Вандерхайде, Г. К. (2002). «Путешествие по раннему дополнительному общению и доступу к компьютеру». Журнал исследований и разработок в области реабилитации. 39 (6 Suppl): 39–53. PMID 17642032.
Венкатагири, Х. С. 1995. Методы повышения производительности коммуникации в AAC: обзор исследований. Американский журнал патологии речи и языка 4, 36–45.
Ward, D. J .; Блэквелл, А.Ф.; Маккей, Д. Дж. С. (2000). «Dasher --- интерфейс ввода данных с использованием непрерывных жестов и языковых моделей». Материалы 13-го ежегодного симпозиума ACM по программному обеспечению и технологиям пользовательского интерфейса - UIST '00. п. 129. Дои:10.1145/354401.354427. ISBN 1581132123. S2CID 189874.
«Повышение рейтинга, дополнительные и альтернативные способы коммуникации в Вашингтонском университете, Сиэтл». Получено 19 марта 2009.
Зангари, С .; Lloyd, L .; Викер, Б. (1994). «Дополнительное и альтернативное общение: историческая перспектива». Дополнительное и альтернативное общение. 10 (1): 27–59. Дои:10.1080/07434619412331276740.

[aetna-1] а ^б ^c ^d ^е ^ж Aetna Inc. (2010)

[2] Блищак и др. (2003)

[glennen-3] а ^б ^c ^d ^е ^ж Гленнен и Декост стр. 88–90

[Beukelman2005Chap2-4] а ^б ^c ^d ^е ^ж ^г ^час Бекельман и Миренда, Глава 2

[MusselwhiteLouis1988-5] а ^б Musselwhite & Louis

[rate_enhancement-6] а ^б ^c ^d ^е Вашингтонский университет (2009)

[GlennenDeCoste62-7] Гленнен С. 62–63.

[jansclark1998-8] а ^б Янс и Кларк (1998) С. 37–38.

[vanD-9] а ^б Вандерхайде (2002)

[Zangari-10] а ^б ^c ^d Зангари (1994)

[StassenSheridan1997-11] Стассен и др., п. 127

[PRC-12] История КНР

[toby-13] Тоби Черчилль (О нас)

[14] Dynavox (История компании)

[Hourcade2004-15] а ^б ^c Hourcade (2004).

[16] Робитайль С. 151–153.

[17] Стивен Хокинг и БАС

[18] Мэти (2000)

[19] Гленнен и Декост стр 62–63

[bm97-20] а ^б Бекельман и Миренда, стр. 97–101

[hig-21] а ^б ^c Хиггинботам и др. (2007)

[bm-22] а ^б Бекельман и Миренда

[hoch1-23] Хохштейн и др. (2004)

[beu84-24] а ^б ^c Бекельман и Миренда п. 84-85

[venkatagiri-25] а ^б ^c Венкатагири (1995)

[types_of_aac_devices-26] Augmentative Communication, Incorporated

[Hansen-27] Йохансен и др. (2003)

[dasher-28] Уорд и др. (2000)

[roark-29] Рорк и др. (2010)

[30] Макки (2003), стр.119

[tod-31] Тодман (2000)

[hoch-32] Хохштейн и др. (2003)

[33] Dynavox на www.speechbubble.org.uk

[34] Сундквист и Рённберг (2010)

[schlosserblischakkoul-35] Шлоссер, Блищак и Коул (2003)

[beu-36] а ^б ^c ^d ^е Бекельман и Миренда п. 105-106

[37] Бекельман и Миренда, п. 105.

[radom-38] а ^б ^c ^d ^е Радомский и др. (2007)

[beu83-39] Бекельман и Миренда п. 83

[Articlewickendenwhose-40] а ^б @article {wickenden2011whose, title = {Чей это голос ?: Проблемы идентичности, голоса и репрезентации, возникающие в этнографическом исследовании жизни подростков с ограниченными возможностями, использующих дополнительное и альтернативное общение (AAC)}, автор = {Викенден, М. }, journal = {Disability Studies Quarterly}, volume = {31}, number = {4}, year = {2011}}

[red-41] а ^б ^c Реддингтон и Тинтарев (2011)

[42] Ашраф и др. (2002)

[webcrawler-43] Луо и др. (2007)

[black-44] а ^б Блэк и др. (2010)

[gps-45] Dominowska et al.

[46] Патель и Радхакришнан

[47] Бекельман и Миренда, п. 30

[48] Blackstone et al. (2002)

[49] Rackensperger et al. (2005)

[50] Реддингтон и Коулз-Кемп (2011)

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

[41]

[42]

[43]

[44]

[45]

[46]

[47]

[48]

[49]

[50]