Стив Янг (академик) - Википедия - Steve Young (academic)

Стив Янг
Стив Янг; ФРС
Родившийся	Стивен Джон Янг; 1951 (68–69 лет); Ливерпуль, Соединенное Королевство
Национальность	Британский
Альма-матер	Кембриджский университет
Известен	Набор инструментов HTK; Разговорная диалоговая система;
	Научная карьера
Поля	Автоматическое распознавание речи; Разговорная диалоговая система;
Учреждения	Кембриджский университет; Apple Inc.;
Тезис	Синтез речи от концепции с приложениями до вывода речи из систем (1978)
Докторант	Фрэнк Фолсайд
Интернет сайт	ми.eng.cam.ac.Великобритания/ ~ sjy

Стивен Джон Янг ФРС британский исследователь,^[1] Профессор информационной инженерии в Кембриджский университет и предприниматель. Он один из пионеров автоматизированного распознавания речи.^[2] и статистические системы разговорного диалога.^[3]^[4] С 2009 по 2015 год он занимал должность старшего про-проректора Кембриджского университета, отвечая за планирование и ресурсы. В настоящее время он занимает совместную должность профессора в Кембридже и яблоко, где он является старшим членом Siri Команда разработчиков.^[5]

ранняя жизнь и образование

Янг родился в Ливерпуле 23 января 1951 года. Он учился в Кембриджском университете, получив степень бакалавра электротехнических наук в 1973 году и докторскую степень в области распознавания речи в 1978 году под руководством профессора Фрэнка Фолсайда с инженерного факультета. Он читал лекции в Манчестере и Кембридже, прежде чем был избран на кафедру информационной инженерии Кембриджского университета в 1994 году.^{[нужна цитата ]}

Исследования и академическая карьера

Он наиболее известен как ведущий автор инструментария HTK,^[2] программный пакет для использования скрытых марковских моделей для моделирования временных рядов, в основном используемых для распознавания речи. Его первая версия была первоначально разработана Янгом в Лаборатории машинного интеллекта Инженерный факультет Кембриджского университета (CUED) в 1989 году. В связи с растущей популярностью этого инструментария во всем мире, Microsoft решила снова сделать основной инструментарий HTK доступным и снова лицензировала программное обеспечение CUED после приобретения Entropic, стартапа, соучредителем которого Стив был в 1993 году для распространения и распространения. поддерживать инструментарий HTK. Книга HTK,^[6] который является учебным пособием по инструментарию HTK, получил более 6000 ссылок.^{[нужна цитата ]}

В конце девяностых годов исследовательские интересы Стива сместились в сторону разработки статистических речевых диалоговых систем. Его наиболее заметный вклад в эту область - это основанная на частично наблюдаемом марковском процессе принятия решений (POMDP) структура управления диалогом,^[3]^[7]^[8] который включает диалоговую модель скрытого информационного состояния (HIS),^[9] первая практическая модель управления диалогом, основанная на структуре POMDP. Его исследования направлены на разработку систем речевого диалога, устойчивых к шуму, создаваемому шумными распознавателями речи, а также адаптируемых и масштабируемых онлайн при взаимодействии с реальными пользователями. Одним из примечательных примеров этого подхода является применение Гауссовский процесс основан обучение с подкреплением для быстрой оптимизации политики.^[10]^[11] В последние годы исследовательская группа Стива успешно применила глубокое обучение методы для различных подмодулей статистических диалоговых систем,^[12]^[13]^[14]^[15] многократные победы на престижных конференциях по выступлению и НЛП.

Предпринимательство

Помимо своего академического и научного вклада, Стив также является успешным предпринимателем. За свою карьеру он стал соучредителем трех стартапов:

Entropic, компания-разработчик программного обеспечения для распознавания речи, разработавшая приложения для голосовой связи в Интернете через операторов мобильной связи. Компания была приобретена Microsoft в 1999 году.^[16]
Phonetic Arts - компания, занимающаяся синтезом речи, которая разработала технологию для создания естественной выразительной речи. Технология, разработанная компанией, позволяла компьютерным играм произносить различные предложения разными голосами. Фонетическое искусство было приобретено Google в 2010 году.^[16]
VocalIQ, компания по производству диалоговых технологий, которая создала первый в мире интерфейс программирования приложений для диалоговой системы. Технология компании предоставила платформу для голосовых интерфейсов, позволяющую компаниям использовать голосовые функции для мобильных устройств и проприетарных приложений. VocalIQ была приобретена Apple в 2015 году. Янг был одним из двух соучредителей и председателя совета директоров компании.^[16]

Награды и награды

Янг является членом Королевская инженерная академия, то Институт инженерии и технологий (IET), Институт инженеров по электротехнике и электронике (IEEE), ЮАР и Международная ассоциация речевой коммуникации (ISCA).^[5]

Он получил премию IEEE Signal Processing Society в области технических достижений в 2004 году и медаль ISCA за научные достижения в 2010 году. Он также получил награду за индивидуальные технические достижения Европейского общества обработки сигналов в 2013 году и Премия IEEE Джеймса Л. Фланагана за речь и обработку звука в 2015 году.^[5]

В 2020 году он был избран Член Королевского общества (ФРС) ^[17]|

внешняя ссылка

Энтропийный, Фонетические искусства, и VocalIQ страницы на crunchbase.com.

[1] "Стив Янг - цитирование ученых Google". Google ученый. Получено 2 мая 2017.

[:0-2] а ^б «Набор средств распознавания речи HTK». Кембриджский университет.

[jason-3] а ^б Уильямс, Джейсон; Янг, Стив (2007). «Частично наблюдаемые марковские процессы принятия решений для голосовых диалоговых систем» (PDF). Компьютерная речь и язык.

[4] Янг, Стив; и другие. «Модель скрытого информационного состояния: практическая основа для управления речевым диалогом на основе POMDP» (PDF). Компьютерная речь и язык.

[cam.ac.uk-5] а ^б ^c «Профессор Стив Янг, профессор информационной инженерии». Кембриджский университет.

[6] Молодой, Стив. "Книга ХТК" (PDF). Инженерный факультет Кембриджского университета.

[7] Блез Томпсон и Стив Янг (2010). «Байесовское обновление состояния диалога: структура POMDP для речевых диалоговых систем» (PDF). Компьютерная речь и язык. Цитировать журнал требует | журнал = (помощь)

[8] Янг, Стив (2013). «Статистические разговорные диалоговые системы на основе POMDP: обзор» (PDF). Proc IEEE. Цитировать журнал требует | журнал = (помощь)

[9] Стив Янг; и другие. (2010). «Модель скрытого информационного состояния: практическая основа для управления речевым диалогом на основе POMDP» (PDF). Компьютерная речь и язык. Цитировать журнал требует | журнал = (помощь)

[10] Милица Гасич и Стив Янг (2014). «Гауссовские процессы для оптимизации диалогового менеджера на основе POMDP». IEEE Trans. Обработка звука, речи и языка. Цитировать журнал требует | журнал = (помощь)

[11] Пей-Хао Су; и другие. (2016). «Онлайн-обучение с активным вознаграждением для оптимизации политики в системах разговорного диалога» (PDF). Proc ACL. Цитировать журнал требует | журнал = (помощь)

[12] Лина Рохас-Бараона; и другие. (2016). «Использование предложений и контекстных представлений в глубоких нейронных моделях для понимания разговорной речи». Proc Coling. Цитировать журнал требует | журнал = (помощь)

[13] Никола Мркшич; и другие. (2017). "Нейронный трекер убеждений: отслеживание состояния диалога на основе данных" (PDF). Proc ACL. Цитировать журнал требует | журнал = (помощь)

[14] Цзун-Сянь Вэнь; и другие. (2015). «Семантически обусловленная генерация естественного языка на основе LSTM для систем разговорного диалога» (PDF). Proc EMNLP. Цитировать журнал требует | журнал = (помощь)

[15] Цзун-Сянь Вэнь эль аль (2017). «Сетевая сквозная обучаемая диалоговая система, ориентированная на задачи» (PDF). Proc EACL. Цитировать журнал требует | журнал = (помощь)

[bloomberg.com-16] а ^б ^c «Стив Янг: профиль и биография руководителя». Bloomberg L.P.

[17] "Стивен Янг". Королевское общество. Получено 20 сентября 2020.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

Стипендиаты из Королевское общество избранный в 2020 году
Стипендиаты	Тимоти Беренс Йошуа Бенжио Малькольм Дж. Беннетт Бен Беркс Зульфикар Бхутта Кевин Бриндл Гордон Браун Уильям К. Кэмпбелл Генри Чепмен Г. Мариус Клор Викрам Дешпанде Джон Эндлер Адам Эйр-Уокер Дэниел Фрост Франсуа Гийемо Дэвид Харел Мариан Холнесс Эхуд Грушовски Эндрю П. Джексон Джордж Джексон Синь Лу Александр Макаров Кит Мэтьюз Иэн МакКаллох Линда Назар Питер Неллист Джайлз Олдройд Хью Осборн Оливер Л. Филлипс Раймон Пьерумберт Джон Самолет Кэти Дж. Прайс Кэрол Привс Дидье Келоз Николас Рид Майкл Рудницки Уильям Шафер Найджел Скраттон Джон Шайн Стивен Смарт Ральф Спет Молли Стивенс Донна Стрикленд Эндрю М. Стюарт Сара Тайхманн Ричард Томпсон Джек Торн Николас Тернер Джейн Висвадер Алан М. Уилсон Стив Янг
Почетный	Дэвид Кукси
Иностранный	Фрэнсис Арнольд Фрэнсис Коллинз Керри Эмануэль Бен Феринга Эльза Мари Фриис Регине Каманн Маргарет Кивельсон Рамамурти Рамеш Венделин Вернер Ада Йонат