Преобразование текста в речь в цифровом телевидении - Text to speech in digital television

Преобразование текста в речь в цифровом телевидении относится к цифровое телевидение продукты, которые используют синтез речи (компьютерная речь, обеспечивающая продукт, который «разговаривает» с конечным пользователем), чтобы обеспечить доступ слепые или слабовидящие люди. Объединив решение цифрового телевидения ( телевидение, телеприставки, персональный видеомагнитофон или другой тип приемник ) с помощью механизма синтеза речи слепые и слабовидящие люди могут получать доступ к информации, которая отображается для других пользователей визуально на экране, и, следовательно, могут управлять меню и электронные программы передач приемника.

Потребность пользователя

Использование аудиовизуального носителя связано с очевидными проблемами для определенных групп людей с ограниченными возможностями, особенно для людей с потерей зрения или слуха. Эти проблемы можно разделить на интерфейс доступность барьеры и препятствия в использовании самого контента. Текст в речь в телевизионных продуктах - это функция, которая устраняет барьеры доступности интерфейса для слепых и слабовидящих людей, которые не могут использовать стандартный визуальный интерфейс, даже если он имеет специальные функции, такие как крупные шрифты, лупы, настраиваемые цветовые схемы и т. д.

Решения для цифрового телевидения часто являются более сложными продуктами по сравнению с их аналоговыми предками.[1] Возможность перемещаться по многим меню, просматривать информацию о программах на экране и просматривать электронные руководства по программам или экранные списки контента, чтобы узнать, что доступно для просмотра - все это необходимо для использования цифрового телевидения.

Политики во всем мире признали важность доступа к (цифровому) телевидению:

  • Концерт 64 Директивы ЕС об аудиовизуальных медиауслугах (AVMS) [2] состояния: "Право людей с ограниченными возможностями и пожилых людей на участие и интеграцию в социальную и культурную жизнь Сообщества неразрывно связано с предоставлением доступных аудиовизуальных медиа-услуг."
  • Первоначальный отчет исследования Европейской комиссии «Измерение прогресса электронной доступности в Европе»[3] относится к телевидению как к одной из областей "которые сейчас являются важными элементами социальной и экономической жизни".
  • Конвенция ООН о правах инвалидов[4] делает конкретную ссылку на услуги доступа к телевидению в статье 30 (1) («Участие в культурной жизни, отдыхе, досуге и спорте»): «Государства-участники признают право инвалидов на участие наравне с другими в культурной жизни и принимают все соответствующие меры для обеспечения того, чтобы инвалиды: [...] б. Получите доступ к телевизионным программам, фильмам, театру и другим культурным мероприятиям в доступных форматах.".

История

Программное обеспечение для преобразования текста в речь было широко доступно для настольных компьютеров с 1990-х годов и Закон Мура увеличивается в ЦПУ и объем памяти возможности сделали их включение в программные и аппаратные решения более осуществимым. Вследствие этих тенденций в информационных технологиях преобразование текста в речь находит свое применение в повседневной жизни. бытовая электроника. Помимо решений для преобразования текста в речь для компьютеров, сейчас существуют говорящие часы, календари, термометры, кухонные принадлежности и многие другие продукты. Говорящие книги тоже существуют уже некоторое время, и системы навигации GPS также стали широко использоваться.[5]

Организации, представляющие слепых и слабовидящих людей, давно поддерживают технологию преобразования текста в речь в бытовой электронике. В Великобритании Королевский национальный институт слепых (RNIB) выступает за продукты для радио и телевидения с начала века и поддерживает производителей в создании таких решений.[6][7]

В Группа цифрового ТВ Британская отраслевая ассоциация цифрового телевидения впервые обсудила эту тему в 2007 году, а затем объединила представителей отрасли для написания технической спецификации преобразования текста в речь на горизонтальном рынке в 2009 году. Это стало частью правительства Великобритании. BERR План действий по удобству использования.[8] По завершении он был отправлен в Digital Europe для стандартизации ETSI, а также опубликован в виде Белой книги. Впоследствии это было включено в Руководство U-Book - UK Digital TV Usability and Accessibility, включая Text to Speech.[9]

В 2010 году в Великобритании на рынок вышли два говорящих продукта для цифрового телевидения. Sky Talker - это дополнение к Небо телеприставки. Он обеспечивает функции разговора для информации о программах и каналах, а также управление воспроизведением. Sky Talker управляется стандартным пультом дистанционного управления Sky. В том же году Smart Talk Freeview (наземное цифровое вещание ) также была выпущена на рынок Великобритании. Это Гудманс фирменная приставка Freeview, разработанная партнерством между Harvard International Ltd и RNIB. Это было первое полноценное голосовое решение для цифрового телевидения в Великобритании, включающее использование электронного гида программ, меню и предоставление голосовой помощи во время настройки.

В Японии оба Panasonic и Mitsubishi Electric производят телевидение и Блю рей продуктов с 2010 года. Согласно информации, собранной японской организацией по борьбе с слепотой Lighthouse for the Blind, существует около 70 с лишним продуктов от Mitsubishi и такое же количество от Panasonic с говорящими функциями.[10]

Примерно в 2011 году в Испании появилось «говорящее» решение для телевизионной приставки на базе Linux с бесплатным Фестиваль механизм преобразования текста в речь был бесплатно распространен среди слепых и слабовидящих Министерством промышленности, туризма и торговли. Однако этот продукт больше не доступен.

В 2012 году Panasonic выпустила на рынок Великобритании свое решение голосового управления.[11] Это набор говорящих функций для их линейки Viera 2012 (и не только). Голосовые подсказки объявляют информацию на экране и наиболее важные меню, а также поддерживают функции напоминаний, записи и воспроизведения. Это доступно для Freesat и Freeview приемники. При создании своего решения компания Panasonic учла советы специалистов RNIB.[12]

Также в 2012 г. TVonics, бывший британский производитель цифровых видеомагнитофонов, запустила свое решение с говорящим PVR - двухканальный тюнер Freeview. HD регистратор на основе Ивона Двигатель TTS, который широко известен группами людей с ограниченными возможностями за высокое качество голоса. Решение TVonics, по сути, было программным дополнением к существующей платформе, и его можно было развернуть как обновление программного обеспечения для клиентов существующих продуктов. TVonics перешла к администрации в июне 2012 года.[13] RNIB приобрел ядро DVR IP включая систему преобразования текста в речь. Бренд TVonics был куплен в Питерборо. Пульс-восемь.

Особенности преобразования текста в речь для телевидения[14]

Поскольку основная цель преобразования текста в речь в телевизионных продуктах состоит в том, чтобы сделать их доступными для слепых и слабовидящих людей, функции разговора в идеале должны охватывать все телевизионные операции, от начальной настройки до базовых и расширенных функций приемника до программирования и воспроизведения. На практике возникают серьезные технические проблемы, в частности, в отношении динамической информации, интерактивных приложений, функций наверстывания и по запросу в Подключенные телевизоры и обработка диалогов, что означает, что ни один из текущих продуктов для преобразования текста в речь не покрывает 100% всех функций через свой голосовой интерфейс.

Основным принципом при разработке решений преобразования текста в речь для продуктов цифрового телевидения должно быть создание говорящего интерфейса, который обеспечивает функциональную эквивалентность тому, что может делать зрячий пользователь, используя стандартный (визуальный) интерфейс. В частности, цель состоит в том, чтобы человек, управляющий решением через систему преобразования текста в речь, получал ту же обратную связь и мог выполнять те же задачи, что и кто-то, выполняющий это через интерфейс по умолчанию (обычно экран в сочетании с пультом дистанционного управления).

Список возможных функций преобразования текста в речь

  • Первоначальная установка и настройка (для подключенных телевизоров это может включать сеть конфигурация, в том числе аутентификация в домашнюю сеть).
  • Контроль цикла питания (включение, выключение, режим ожидания).
  • Объявление о текущем показе канала и программы, а также список доступных каналов.
  • Помощь и обратная связь для основных функций приемника, таких как переключение канала и регулировка громкости.
  • Говоря о Электронный программный гид (EPG) и помощь пользователю в навигации по EPG и другим спискам услуг и контента, включая просмотр контента по запросу и последующего контента, ранее записанного или загруженного контента, а также настраиваемых пользователем списков (избранное и т. Д.).
  • Речевой отзыв для отчетности и изменения состояния служб доступа (в частности Аудио Описание, видеть Поддержка аудио-описания / видео-описания ).
  • Обсуждение функций для поддержки воспроизведения и записи, включая управление расписанием записи.
  • Уведомление о платном просмотре и другом ограниченном контенте, ограничениях и условиях, а также контроль над этими функциями, включая механизм авторизации.
  • Обратная связь и управление информационными баннерами, диалогами и меню на экране (включая модальный и другие внеполосные подсказки).

Взаимодействие с интерактивными сервисами и виджеты.

Настройка говорящих функций

У разных потребителей разные возможности и предпочтения. Это также верно для слепых и слабовидящих людей, использующих телевизионные продукты с функцией преобразования текста в речь. Кроме того, начинающие пользователи, как правило, требуют дополнительных указаний на ранних этапах использования продукта, тогда как более продвинутые пользователи предпочтут иметь возможность ориентироваться в системе как можно более эффективно. Следовательно, функция преобразования текста в речь в решении для говорящего телевидения должна позволять пользователю управлять и настраивать параметры ее функций:

  • Пользователи должны иметь возможность устанавливать уровень громкости преобразования текста в речь независимо от уровня звука основного телевизора.
  • Пользователи также должны иметь возможность настраивать такие свойства, как тип голоса, высоту тона и скорость вывода текста.
  • Хорошие реализации также позволяют настраивать многословность того, что говорится, от очень подробного (обычно для начинающих пользователей) до только самого необходимого (полезно для опытных пользователей, хорошо знакомых с системой).

Поддержка аудио-описания / видео-описания

Поскольку слепые и слабовидящие пользователи являются основной целевой группой преобразования текста в речь в цифровом телевидении, особое внимание следует уделять поддержке тех функций продукта, которые представляют наибольшую ценность для этой группы потребителей.

В частности, возможность контролировать Аудио описание / видео описание соответствующие настройки продукта имеют большое значение для этих пользователей в тех странах, где такие услуги доступны. Аудиоописание / Видеоописание содержит дополнительное повествование, описывающее визуальные действия или элементы, которые слепые или слабовидящие люди не увидят, но которые важны для отслеживания истории. Обычно повествование включает персонажей, изменения сцены, текст на экране и другие визуальные подсказки, которые иначе не включены в звуковой поток по умолчанию.

Функции разговора в продукте должны полностью поддерживать меню и другие элементы управления, относящиеся к аудиоописанию / описанию видео (что также включает в себя рекламу доступности этой службы доступа к контенту при просмотре Электронной программы передач и других реестров контента).

Продукты цифрового телевидения с поддержкой преобразования текста в речь

Австралия

Франция

Япония

Испания

Великобритания

нас

Руководство по внедрению и стандартизация

Ранняя попытка уловить требования пользователя и определить функциональную спецификацию была предпринята Группа цифрового ТВ (DTG) в Великобритании, который опубликовал Белую книгу по этому вопросу. С тех пор эта Белая книга была включена в публикацию «Руководство по использованию и доступности цифрового телевидения Великобритании».[15] (известный как U-Book). Та же Белая книга также использовалась в качестве основы для обсуждения между группами пользователей с ограниченными возможностями и DigitalEurope,[16] европейский отраслевой орган производителей потребительского оборудования по теме преобразования текста в речь для телевидения. Рабочий поток DigitalEurope привел к Международная электротехническая комиссия (IEC) создание проектной группы (IEC 62731) для создания международного стандарта преобразования текста в речь в цифровом телевидении. Первое издание стандарта IEC 62731: 2013 было официально опубликовано как международный стандарт в январе 2013 года.[14] Стандарт не предписывает реализацию, но предоставляет функциональное описание того, как телевизионный продукт с поддержкой преобразования текста в речь должен вести себя и о чем и когда следует говорить.

внешняя ссылка

Рекомендации

  1. ^ Данкер, Даниэль (2 марта 2012 г.). «Я и мой телевизор - как мы можем соединиться?» (PDF). Интернет-блог BBC. Получено 2013-02-17.
  2. ^ «Директива 65». 11 декабря 2007 г. о согласовании определенных положений, установленных законом, постановлением или административными мерами в государствах-членах в отношении предоставления аудиовизуальных медиауслуг (Директива об аудиовизуальных медиауслугах)
  3. ^ Кубичке, Лутц; Каллен, Кевин; Мейер, Инго, ред. (Октябрь 2007 г.), «MeAC - Измерение прогресса электронной доступности в Европе» (PDF), Оценка состояния электронной доступности в Европе - Основной отчет, Бонн
  4. ^ Объединенные Нации (2006). «Конвенция о правах инвалидов». Объединенные Нации. Получено 2013-02-17.
  5. ^ RNIB. «Десять лучших говорящих продуктов». RNIB. Получено 2013-02-17.
  6. ^ «Оборудование цифрового телевидения: уязвимые требования потребителей» (PDF), Отчет Группы потребительских экспертов для правительства и Digital UK, Лондон: Consumer Expert Group, март 2006 г.
  7. ^ RNIB (6 сентября 2012 г.). "Вы действительно слушаете?". RNIB. Получено 2013-02-17.
  8. ^ «План действий по удобству использования» (PDF).
  9. ^ «Руководство Великобритании по использованию и доступности цифрового телевидения, включая преобразование текста в речь».
  10. ^ NipponLighthouse. 日本 ラ イ ト ハ ウ ス 情報 文化 セ ン タ ー - 音 声 読 み 上 げ き 地 デ ジ テ 大 番 リ ス ト [Список моделей с цифровым ТВ и поддержкой преобразования текста в речь] (на японском языке). Получено 2013-02-17.
  11. ^ Panasonic (27 марта 2012 г.). «Panasonic запускает линейку говорящих телевизоров». Получено 2013-02-17.
  12. ^ RNIB (10 июля 2012 г.). «Телевизор Panasonic с голосовым управлением». Получено 2013-02-17. По советам экспертов RNIB
  13. ^ Уитфилд, Найджел (27 июня 2012 г.). «После краха TVonics администратор ожидает распродажи DVR - основатели фирмы Freeview HD Recorder». Реестр. Получено 2013-02-17.
  14. ^ а б Международная электротехническая комиссия (29 января 2013 г.). «IEC 62731 ed1.0: Преобразование текста в речь для телевидения - Общие требования». Международная электротехническая комиссия. Получено 2013-02-17.
  15. ^ «Книги и официальные документы» (PDF). Руководство Великобритании по использованию и доступности цифрового телевидения, включая преобразование текста в речь. Группа цифрового ТВ. Сентябрь 2011 г.. Получено 2013-02-17.
  16. ^ «Отраслевые обязательства» (PDF), Повышение доступности оборудования для приема цифрового ТВ, продаваемого в Европейском Союзе, Брюссель: DigitalEurope, 30 ноября 2007 г.