Adobe Voco - Википедия - Adobe Voco

Adobe Voco это неизданный редактор аудио и создание прототип программного обеспечения Adobe что позволяет по-новому редактировать и генерировать аудио. Дублированный "Фотошоп -для-голос ",[1] он был впервые показан на Adobe MAX мероприятие в ноябре 2016 года. Технология, показанная на Adobe MAX, представляла собой предварительную версию, которую потенциально можно было бы включить в Adobe Creative Cloud. Позже выяснилось, что Voco никогда не предназначался для выпуска и должен был стать исследовательским прототипом.[2][3], в основном из-за опасений по поводу манипуляции голосом и юридических проблем, связанных с Adobe.

Технические детали

Как показала демонстрация, программное обеспечение отводит приблизительно 20 минут речи желаемой цели, а затем генерирует звукоподобный голос с ровным фонемы которые не присутствовали в материале целевого примера. Adobe заявила, что Voco снизит стоимость аудиопроизводства.[1] С появлением Adobe Voco и аналогичных WaveNet, произведено DeepMind.[3]

Обеспокоенность

Проблемы этики и безопасности были подняты в связи с возможностью изменить аудиозапись, включив в нее слова и фразы, которые исходный говорящий никогда не произносил, а также потенциальным риском для отпечатка голоса. биометрия.[1]

Также возникли опасения, что его можно использовать вместе с:

Альтернативы

Отсутствие публичного продвижения Adobe открыло возможности для других компаний создавать продукты, альтернативные VOCO, такие как LyreBird.[6]

WaveNet похоже, но Открытый исходный код исследовательский проект в лондонской фирме искусственного интеллекта DeepMind, независимо разработанная примерно в то же время, что и Adobe Voco.

Рекомендации

  1. ^ а б c "сапический". BBC.com. BBC. 2016-11-07. Получено 2016-07-05.
  2. ^ https://community.adobe.com/t5/audition/beta-testing-voco/td-p/8635263?page=1
  3. ^ а б "Adobe VoCo мертв?". Adobe Блог. 2018-01-27. Получено 2020-06-17.
  4. ^ Роджерс, Джулиан. «Adobe Voco - стоит ли бояться?». Эксперт по производству. Профессиональные инструменты. Получено 14 декабря 2018.
  5. ^ Тиз, Юстус (2016). «Face2Face: захват лиц в реальном времени и воспроизведение видео в формате RGB». Proc. Компьютерное зрение и распознавание образов (CVPR), IEEE. Получено 2016-06-18.
  6. ^ «Лирохвост - Создайте цифровую копию голоса». lyrebird.ai. Архивировано из оригинал на 2018-04-24. Получено 2018-03-27.