Стив Янг (академик) - Википедия - Steve Young (academic)
Этот биография живого человека требует дополнительных цитаты за проверка.Ноябрь 2017 г.) (Узнайте, как и когда удалить этот шаблон сообщения) ( |
Стив Янг | |
---|---|
Родившийся | Стивен Джон Янг 1951 (68–69 лет) |
Национальность | Британский |
Альма-матер | Кембриджский университет |
Известен | |
Научная карьера | |
Поля | |
Учреждения | |
Тезис | Синтез речи от концепции с приложениями до вывода речи из систем (1978) |
Докторант | Фрэнк Фолсайд |
Интернет сайт | ми |
Стивен Джон Янг ФРС британский исследователь,[1] Профессор информационной инженерии в Кембриджский университет и предприниматель. Он один из пионеров автоматизированного распознавания речи.[2] и статистические системы разговорного диалога.[3][4] С 2009 по 2015 год он занимал должность старшего про-проректора Кембриджского университета, отвечая за планирование и ресурсы. В настоящее время он занимает совместную должность профессора в Кембридже и яблоко, где он является старшим членом Siri Команда разработчиков.[5]
ранняя жизнь и образование
Янг родился в Ливерпуле 23 января 1951 года. Он учился в Кембриджском университете, получив степень бакалавра электротехнических наук в 1973 году и докторскую степень в области распознавания речи в 1978 году под руководством профессора Фрэнка Фолсайда с инженерного факультета. Он читал лекции в Манчестере и Кембридже, прежде чем был избран на кафедру информационной инженерии Кембриджского университета в 1994 году.[нужна цитата ]
Исследования и академическая карьера
Он наиболее известен как ведущий автор инструментария HTK,[2] программный пакет для использования скрытых марковских моделей для моделирования временных рядов, в основном используемых для распознавания речи. Его первая версия была первоначально разработана Янгом в Лаборатории машинного интеллекта Инженерный факультет Кембриджского университета (CUED) в 1989 году. В связи с растущей популярностью этого инструментария во всем мире, Microsoft решила снова сделать основной инструментарий HTK доступным и снова лицензировала программное обеспечение CUED после приобретения Entropic, стартапа, соучредителем которого Стив был в 1993 году для распространения и распространения. поддерживать инструментарий HTK. Книга HTK,[6] который является учебным пособием по инструментарию HTK, получил более 6000 ссылок.[нужна цитата ]
В конце девяностых годов исследовательские интересы Стива сместились в сторону разработки статистических речевых диалоговых систем. Его наиболее заметный вклад в эту область - это основанная на частично наблюдаемом марковском процессе принятия решений (POMDP) структура управления диалогом,[3][7][8] который включает диалоговую модель скрытого информационного состояния (HIS),[9] первая практическая модель управления диалогом, основанная на структуре POMDP. Его исследования направлены на разработку систем речевого диалога, устойчивых к шуму, создаваемому шумными распознавателями речи, а также адаптируемых и масштабируемых онлайн при взаимодействии с реальными пользователями. Одним из примечательных примеров этого подхода является применение Гауссовский процесс основан обучение с подкреплением для быстрой оптимизации политики.[10][11] В последние годы исследовательская группа Стива успешно применила глубокое обучение методы для различных подмодулей статистических диалоговых систем,[12][13][14][15] многократные победы на престижных конференциях по выступлению и НЛП.
Предпринимательство
Помимо своего академического и научного вклада, Стив также является успешным предпринимателем. За свою карьеру он стал соучредителем трех стартапов:
- Entropic, компания-разработчик программного обеспечения для распознавания речи, разработавшая приложения для голосовой связи в Интернете через операторов мобильной связи. Компания была приобретена Microsoft в 1999 году.[16]
- Phonetic Arts - компания, занимающаяся синтезом речи, которая разработала технологию для создания естественной выразительной речи. Технология, разработанная компанией, позволяла компьютерным играм произносить различные предложения разными голосами. Фонетическое искусство было приобретено Google в 2010 году.[16]
- VocalIQ, компания по производству диалоговых технологий, которая создала первый в мире интерфейс программирования приложений для диалоговой системы. Технология компании предоставила платформу для голосовых интерфейсов, позволяющую компаниям использовать голосовые функции для мобильных устройств и проприетарных приложений. VocalIQ была приобретена Apple в 2015 году. Янг был одним из двух соучредителей и председателя совета директоров компании.[16]
Награды и награды
Янг является членом Королевская инженерная академия, то Институт инженерии и технологий (IET), Институт инженеров по электротехнике и электронике (IEEE), ЮАР и Международная ассоциация речевой коммуникации (ISCA).[5]
Он получил премию IEEE Signal Processing Society в области технических достижений в 2004 году и медаль ISCA за научные достижения в 2010 году. Он также получил награду за индивидуальные технические достижения Европейского общества обработки сигналов в 2013 году и Премия IEEE Джеймса Л. Фланагана за речь и обработку звука в 2015 году.[5]
В 2020 году он был избран Член Королевского общества (ФРС) [17]|
Рекомендации
- ^ "Стив Янг - цитирование ученых Google". Google ученый. Получено 2 мая 2017.
- ^ а б «Набор средств распознавания речи HTK». Кембриджский университет.
- ^ а б Уильямс, Джейсон; Янг, Стив (2007). «Частично наблюдаемые марковские процессы принятия решений для голосовых диалоговых систем» (PDF). Компьютерная речь и язык.
- ^ Янг, Стив; и другие. «Модель скрытого информационного состояния: практическая основа для управления речевым диалогом на основе POMDP» (PDF). Компьютерная речь и язык.
- ^ а б c «Профессор Стив Янг, профессор информационной инженерии». Кембриджский университет.
- ^ Молодой, Стив. "Книга ХТК" (PDF). Инженерный факультет Кембриджского университета.
- ^ Блез Томпсон и Стив Янг (2010). «Байесовское обновление состояния диалога: структура POMDP для речевых диалоговых систем» (PDF). Компьютерная речь и язык. Цитировать журнал требует
| журнал =
(помощь) - ^ Янг, Стив (2013). «Статистические разговорные диалоговые системы на основе POMDP: обзор» (PDF). Proc IEEE. Цитировать журнал требует
| журнал =
(помощь) - ^ Стив Янг; и другие. (2010). «Модель скрытого информационного состояния: практическая основа для управления речевым диалогом на основе POMDP» (PDF). Компьютерная речь и язык. Цитировать журнал требует
| журнал =
(помощь) - ^ Милица Гасич и Стив Янг (2014). «Гауссовские процессы для оптимизации диалогового менеджера на основе POMDP». IEEE Trans. Обработка звука, речи и языка. Цитировать журнал требует
| журнал =
(помощь) - ^ Пей-Хао Су; и другие. (2016). «Онлайн-обучение с активным вознаграждением для оптимизации политики в системах разговорного диалога» (PDF). Proc ACL. Цитировать журнал требует
| журнал =
(помощь) - ^ Лина Рохас-Бараона; и другие. (2016). «Использование предложений и контекстных представлений в глубоких нейронных моделях для понимания разговорной речи». Proc Coling. Цитировать журнал требует
| журнал =
(помощь) - ^ Никола Мркшич; и другие. (2017). "Нейронный трекер убеждений: отслеживание состояния диалога на основе данных" (PDF). Proc ACL. Цитировать журнал требует
| журнал =
(помощь) - ^ Цзун-Сянь Вэнь; и другие. (2015). «Семантически обусловленная генерация естественного языка на основе LSTM для систем разговорного диалога» (PDF). Proc EMNLP. Цитировать журнал требует
| журнал =
(помощь) - ^ Цзун-Сянь Вэнь эль аль (2017). «Сетевая сквозная обучаемая диалоговая система, ориентированная на задачи» (PDF). Proc EACL. Цитировать журнал требует
| журнал =
(помощь) - ^ а б c «Стив Янг: профиль и биография руководителя». Bloomberg L.P.
- ^ "Стивен Янг". Королевское общество. Получено 20 сентября 2020.
внешняя ссылка
- Энтропийный, Фонетические искусства, и VocalIQ страницы на crunchbase.com.