Lessac Technologies - Википедия - Lessac Technologies

Lessac Technologies, Inc. (LTI) - американская фирма, занимающаяся разработкой синтез голоса программное обеспечение, лицензирует технологию и продает синтезированные романы в виде файлов MP3.[1] В настоящее время у фирмы есть семь выданных патентов.[2][3][4][5][6][7][8] и еще три ожидают его автоматизированных методов преобразования цифрового текста в человеческую речь, более точного распознавания человеческой речи и вывода текста, представляющего слова и фразы упомянутой речи, наряду с распознаванием эмоционального состояния говорящего.

Технология LTI частично основана на работе последнего Артур Лессак, профессор театра в Государственном университете Нью-Йорка и создатель Lessac Kinesensic Training, и LTI имеет исключительные права на использование охраняемых авторским правом произведений Артура Лессака в области синтеза речи и распознавания речи. Основываясь на представлении о том, что музыка - это речь, а речь - это музыка, работы и книги Лессака сосредоточены на телесных и речевых энергиях, а также на их взаимодействии. Система текстовых аннотаций Артура Лессака, которая изначально была разработана, чтобы помочь актерам, певцам и ораторам размечать сценарии для подготовки к выступлению, адаптирована в системе синтеза речи LTI в качестве основного представления синтезируемой речи (Lessemes), в отличие от ко многим другим системам, использующим фонетическое представление.[9][10][11]

Программное обеспечение LTI состоит из двух основных компонентов: (1) лингвистический интерфейс, преобразующий простой текст в последовательность просодических и фоносенсорных графических символов (Lessemes) на основе системы аннотаций Артура Лессака, которые определяют синтезируемые речевые единицы; (2) серверная часть обработки сигналов, которая принимает Lessemes в качестве акустических данных и производит синтезированную речь, звучащую как человек, в качестве вывода, используя выбор и объединение единиц.

Система преобразования текста в речь LTI заняла второе место на всемирном конкурсе Blizzard Challenge в 2011 и 2012 годах. Команда, занявшая первое место в 2011 году, также использовала «интерфейсную» технологию LTI, но со своим собственным сервером.[12][13] Конкурс Blizzard Challenge, проводимый Институт языковых технологий из Университет Карнеги Меллон, был разработан как способ оценки методов синтеза речи с помощью различных исследовательских групп, создающих голоса из одних и тех же записей голосовых актеров, и сравнения результатов с помощью тестов на прослушивание.

LTI была основана в 2000 году Х. Дональд Уилсон (председатель), юрист, LexisNexis предприниматель и деловой партнер Артура Лессака; и Гэри А. Марпл (главный изобретатель) после того, как Марпл предположил, что кинезиологическое обучение голоса Артура Лессака можно применить в компьютерной лингвистике. После смерти Уилсона в 2006 году генеральным директором фирмы стал его племянник Джон Райхенбах.

Рекомендации

  1. ^ «Первые аудиокниги с синтетической речью», аналитик Уолт Течнер в ежемесячном отраслевом информационном бюллетене ASRNews
  2. ^ 8 мая 2012 г. (#8,175,879) Системная аннотация текста для выразительной просодии при синтезе и распознавании речи: «Лессак + Технологии»
  3. ^ 25 января 2011 г. (#7,877,259) речевые текстовые коды и их использование в компьютеризированных речевых системах: «Лессак + Технологии»
  4. ^ 9 октября 2007 г. (#7,280,964) «Lessac + Technologies Метод распознавания разговорной речи с распознаванием языкового цвета.: "
  5. ^ 8 ноября 2005 г. (#6,963,841) Методика обучения речи с альтернативной базой правильного произношения:
  6. ^ 8 марта 2005 г. (#6,865,533) Текст в речь:
  7. ^ 25 января 2005 г. (#6,847,931) Экспрессивный синтаксический анализ в компьютеризированном преобразовании текста в речь:
  8. ^ 22 июня 2012 г. (Уведомление о разрешении по заявке № US 11/909 514) Компьютеризированный синтезатор речи для синтеза речи из текста:
  9. ^ М. Манро, С. Тернер, А. Манро и К. Кэмпбелл [ред.] (2010), Коллективные сочинения о голосе и работе с телом Lessac: Festschrift, Llumina Press. ISBN  1605943436 (в частности, раздел под названием «Использование Lessemes в синтезе текста в речь» Р. Нитисарой и Г. А. Марпл)
  10. ^ «TTS находит свой путь» Лорен Шопп, опубликовано 1 ноября 2007 г.): http://www.speechtechmag.com/Articles/Editorial/Feature/TTS-Is-Finding-Its-Way-40067.aspx; а именно параграфы 5–7 «Определение выражения»
  11. ^ Лессак, Артур (1997). Использование и тренировка человеческого голоса: биодинамический подход к вокальной жизни (3-е изд.). Маунтин-Вью, Калифорния: Mayfield Pub .. стр. Xv, 291 стр. : больной. ; 22 см .. ISBN  1-55934-696-5. LCCN 96018629; и Лессак, Артур (1981, c1978), Мудрость тела: использование и тренировка человеческого тела (1-е изд.). Нью-Йорк, штат Нью-Йорк: специалисты по драматургии. С. VII, 278 с. : больной. ; 27 см .. ISBN  0-89676-070-7. LCCN 81005472. OCLC 7671791.
  12. ^ * «Данные для Blizzard Challenge 2011 ... предоставлены Lessac Technologies» (информация включена на странице SynSig, посвященной Blizzard Challenge 2011): http://www.synsig.org/index.php/Blizzard_Challenge_2011
  13. ^ Участие в Blizzard Challenge: http://festvox.org/blizzard/bc2011/LESSAC_Blizzard2011.pdf

внешняя ссылка