CereProc - CereProc

CereProc
CereProcLogo 2.png
Разработчики)CereProc Ltd., Великобритания
изначальный выпуск2006; 14 лет назад (2006)
Написано вC / Python
Операционная системаКроссплатформенность
Доступно вАнглийский, немецкий, французский, испанский, итальянский, голландский, каталонский, румынский, японский, португальский, шотландский гэльский, шведский, польский, ирландский
ТипТекст в речь
ЛицензияКоммерческий
Интернет сайтwww.cereproc.com

CereProc это синтез речи компания, базирующаяся в Эдинбурге, Шотландия, основана в 2005 году. Компания специализируется на создании естественного и выразительно звучащего текст в речь голоса, синтез голоса с региональным акцентом, и в клонирование голоса.

Технология построения голоса

CereProc создает голоса, используя две различные технологии построения голоса: синтез выбора единиц и параметрическое моделирование.

Голоса выбора модулей CereProc построены из больших базы данных записанной речи. Во время создания базы данных каждое записанное высказывание сегментируется на некоторые или все из следующих: отдельные телефоны, слоги, морфемы, слова, фразы, и фразы. Разделение на сегменты производится с помощью специально модифицированной распознаватель речи.[1] An индекс единиц в речевой базе данных создается на основе сегментации и акустических параметров, таких как основная частота (подача ), длительность, положение в слоге и соседние телефоны. В время выполнения, желаемое целевое высказывание создается путем определения наилучшей цепочки единиц-кандидатов из базы данных (выбор единицы). Выбор единицы измерения обеспечивает максимальную естественность, поскольку применяется цифровая обработка сигналов (DSP) к записанной речи только в точках конкатенации. DSP часто делает записанную речь менее естественной.

Параметрические голоса CereProc производят синтез речи на основе методологий статистического моделирования. В этой системе частотный спектр (голосовой тракт ), основная частота (вокальный источник) и продолжительность (просодия ) речи моделируются одновременно. Речь формы волны генерируются из этих параметров с помощью вокодер. Важно отметить, что эти голоса могут быть построены из значительно меньшего количества записанной речи, чем голоса выбора единиц, и при установке занимают гораздо меньшую площадь, из-за чего они используются для клонирования частного голоса.[2]

Голоса и языки

CereProc имеет 46 общедоступных голосов, говорящих на четырнадцати языках с различными региональными акцентами:

  • Американский английский: Изабелла, Кэтрин, Ханна, Меган, Адам, Натан, Энди (детский голос), Джордан (детский голос), Кэролин
  • Британский английский: Сара, Уильям, Джек, Лорен, Джайлз, Эми
  • Северный английский: Джесс
  • Шотландский английский: Хизер, Кирсти, Стюарт, Эндрю (детский голос), Майри (детский голос)
  • Глазго английский: Додо
  • Ланкаширский английский: Клэр
  • Ирландский английский: Кейтлин
  • Уэст-Мидлендс английский: Сью
  • Специальные голоса FX: демон, призрак, гоблин, пикси, робот
  • Метрополитен французский: Сюзанна, Лоран
  • Канадский французский: Флоренция
  • Каталанский: Рита
  • Кастильский испанский: Сара
  • Латиноамериканский испанский: Ана
  • Итальянский: Лаура
  • Ирландский: Peig
  • Голландский: Ада
  • Немецкий: Гудрун, Алекс
  • Австрийский немецкий: Леопольд
  • Португальский: Lúcia
  • Бразильский португальский: Габриэль
  • Японский: Юки
  • Шотландский гэльский: Ceitidh
  • Шведский: Ylva
  • Польский: Pola
  • Румынский: Дарья
  • Английский с французским акцентом: Николь
  • Русский: Аврора
  • Мандарин: Майлин

Кроме того, компания разработала ряд голосов знаменитостей, которые обычно не доступны широкой публике. К ним относятся Джордж Буш, Барак Обама и Арнольд Шварцнеггер.[3]

Клонирование голоса

В 2009 году кинокритик Роджер Эберт использовал CereProc для создания синтетической версии своего голоса. Эберт потерял дар речи после операции по лечению рак щитовидной железы. CereProc добывал ленты и комментарии на DVD с голосом Эберта, чтобы создать голос для преобразования текста в речь, который больше походил на его собственный.[4] Роджер Эберт использовал этот голос в своем выступлении 2 марта 2010 г. Шоу Опры Уинфри.

Игрок НФЛ Стив Глисон клонировал его голос CereProc после диагноза БДН. Глисон появился в Microsoft с Суперкубок XLVIII реклама, восхваляющая мощь технологий, используя свой синтетический голос для повествования.

Технология клонирования голоса CereProc в настоящее время используется в Великобритании людьми, страдающими БДН, для создания синтезированных голосов до того, как они потеряют способность говорить. Этот процесс был описан в BBC Radio 4 документальный, Вернуть критику его голос, эфир в августе 2011 года.[5]

Совместимость системы

Голоса CereProc можно развернуть на разных операционные системы и на разных типах устройств. Настольные голоса CereProc совместимы с Майкрософт Виндоус и Apple Mac OS X. Они устанавливаются как системные голоса и могут использоваться другими приложениями с поддержкой речи. CereProc's клиент / сервер система cServer, ориентированная в основном на рынок корпоративных IVR, может работать на Windows и Linux. Голоса CereProc Mobile могут быть развернуты на Android и Apple iOS. SDK доступен для Android, Linux, MacOS, iOS и Windows. SDK имеет привязки для C / C ++, C #, Java и Python.

Смотрите также

Рекомендации

  1. ^ Алан В. Блэк, Идеальный синтез для всех людей в любое время. IEEE TTS Workshop 2002.
  2. ^ "Cerevoice Me".
  3. ^ "CereProc Voices".
  4. ^ Роджер Эберт: самый важный мужчина "Esquire", 16 февраля 2010 г. Дата обращения: 21.09.2011.
  5. ^ "Вернуть критику его голос". BBC Программы Радио Шотландии. Проверено 26 октября 2011 года.

внешняя ссылка