Мартин Кей - Martin Kay

Мартин Кей это специалист в области информатики, родился в 1935 г., особенно известен своими работами в компьютерная лингвистика.

Родился и вырос в Соединенном Королевстве, получил степень магистра в Тринити-колледж, Кембридж, в 1961 году. В 1958 году начал работать на Кембриджский отдел языковых исследований, один из первых центров исследований в области компьютерной лингвистики. В 1961 году он переехал в Rand Corporation в Санта-Моника, Калифорния, США, где он в конечном итоге стал руководителем отдела исследований в области лингвистики и машинного перевода. Он покинул Rand в 1972 году, чтобы стать заведующим кафедрой компьютерных наук в Калифорнийский университет в Ирвине. В 1974 году он переехал в Исследовательский центр Xerox в Пало-Альто в качестве научного сотрудника. В 1985 году, сохранив свою позицию в Xerox PARC, он поступил на факультет Стэндфордский Университет перерыв. В настоящее время он является профессором лингвистики в Стэнфордском университете и почетным профессором компьютерной лингвистики в Саарский университет.

Жизнь

Он родился в Эджуэре (Мидлсекс, Великобритания) в 1935 году. Изучал лингвистику и компьютерную лингвистику в Тринити-колледже в Кембридже.

Его основные интересы - перевод, выполняемый как людьми, так и машинами, и вычислительные лингвистические алгоритмы, особенно в области морфологии и синтаксиса.

Работа

Кей начал свою карьеру в Кембриджский отдел языковых исследований в Кембридже, Англия, под Маргарет Мастерман. В 1961 г. Дэвид Г. Хейс нанял его работать на RAND Corporation; впоследствии он работал в Калифорнийский университет в Ирвине и Xerox PARC. Кей - один из пионеров компьютерная лингвистика и машинный перевод. Он отвечал за введение понятия разбора диаграмм в вычислительной лингвистике и понятия унификации в лингвистике в целом.

С Рон Каплан, он был пионером в исследованиях и разработке приложений в конечной морфологии. Он давний участник и критик работы над машинным переводом. В своей основополагающей статье «Надлежащее место людей и машин в языковом переводе»^[1] Кей выступал за системы машинного перевода, которые были бы тесно интегрированы в процесс человеческого перевода. Он был рецензентом и критиком EUROTRA, Verbmobil и многих других проектов MT.

Кей - бывший председатель Ассоциации компьютерной лингвистики и президент Международный комитет по компьютерной лингвистике. Он был научным сотрудником в Xerox PARC до 2002 г. Имеет почетную докторскую степень. Гётеборгский университет. Кей получил награду за заслуги перед ассоциацией компьютерной лингвистики за его постоянную роль интеллектуального лидера исследований НЛП в 2005 году.

Достижения и награды

Его достижения включают разработку анализ диаграммы и грамматика функциональной унификации и большой вклад в применение конечных автоматов в вычислительной фонологии и морфологии. Он также считается ведущим специалистом по машинный перевод.
Его награды включают почетного доктора философии из Гётеборгский университет и 2005 Ассоциация компьютерной лингвистики ' Премия за заслуги в жизни. Он бессменный председатель Международный комитет по компьютерной лингвистике.

Взносы

1. «Правильный» доклад Мартина Кея [1]. После отчета ALPAC в 1966 году был сделан вывод: «Не существует непосредственной или предсказуемой перспективы полезного машинного перевода, обеспечивающего полезный перевод общенаучных текстов». [2] И из-за этого в области машинного перевода наступили темные времена. С 1966 по 1976 год, почти десять лет, исследований проводилось мало. Однако в 80-е годы наступил период Возрождения. [3] «Надлежащее место людей и машин в языковом переводе» привлекло больше внимания к машинному переводу. В этой статье были высказаны новые мысли о взаимосвязи между машинным переводом и человеческим переводом. В то время, когда применялись более дешевые компьютеры и широко использовались домены в машинном переводе, крайне требовалась высококачественная продукция. А теория полностью автоматического высококачественного перевода была просто идеальным уровнем для машинного перевода после критики Бар-Хиллелем в его обзоре прогресса машинного перевода 1960-х годов: «Целью машинного перевода не должно быть полностью автоматического высококачественного перевода (FAHQT), который может заменить переводчиков-людей. Вместо этого МП должна ставить перед собой менее амбициозные цели, например, более экономичное взаимодействие человека и машины, и стремиться к повышению продуктивности человеческого перевода ». [4] Польза человеческого перевода была поднята на новый, более высокий уровень. В соответствии с этой мыслью Мартин Кей предложил более практическую идею об отношениях между человеком и машиной в процессе машинного перевода, названную «переводчик amanuensis».

1.1 Два аргумента против полезности машинного перевода Поскольку эта идея включает в себя человека и машину одновременно, поэтому и компьютерщики, и лингвисты несут ответственность за МП. Но «их никогда не следует просить предоставить инженерное решение проблемы, которую они лишь смутно понимают». Им просто необходимо достичь, «делая только то, что можно сделать с абсолютной уверенностью и надежностью… может быть практически гарантировано всем заинтересованным сторонам». В качестве основных частей перевода приводятся два связанных аргумента против правдоподобия машинного перевода как промышленного предприятия с точки зрения лингвистики и информатики. Обычно приводятся два аргумента в пользу специальных решений проблем машинного перевода. Согласно первому аргументу, «специальные решения обычно основываются на индивидуальном анализе того, что лингвисты называют поверхностными явлениями, по сути, строками слов, а также на реальных или воображаемых статистических свойствах определенных стилей письма и областей дискурса». Это простое статистическое утверждение, которое можно опровергнуть. Во втором аргументе, специальные решения относятся только к пониманию второго языка путем чтения текста и называются учеником чародея, потому что «этот вид аргумента заключается в том, что своего рода неполная теория, которую имеют лингвисты и компьютерные ученые. может предоставить худшую основу для построения практических приемов, чем отсутствие теории вообще, потому что теория не знает, когда остановиться ». «Основная проблема с аргументом ученика чародея заключается в том, что решение о том, что предложение может быть переведено без анализа, может быть принято только постфактум. Пример предложения показывает, что существует более одной интерпретации предложения на определенном уровне, и дальнейший анализ показывает что существует единственный перевод, совместимый с каждым из них. Короче говоря, алгоритм, необходимый для принятия решения о том, когда требуется анализ, должен будет использовать результаты того самого анализа, которого он призван избежать ».

1.2 Amanuensis переводчика и память переводов Это основная часть статьи, для иллюстрации того, что такое amanuensis переводчика, автор показал три аспекта: редактирование текста, средства перевода и машинный перевод ». Предположим, что переводчикам предоставляется терминал, состоящий из клавиатура, экран и способ указания отдельных слов и букв. Дисплей на экране разделен на два окна. Текст для перевода отображается в верхнем окне, а перевод будет составлен в нижнем ». Это форма amanuensis переводчика, которая не является настоящим приемом и никогда не будет. «Оба окна ведут себя одинаково. Используя указательное устройство, переводчик может выбрать букву, слово, предложение, строку или абзац и, нажав соответствующую клавишу, вызвать с ним выполнение некоторой операции».

Эти два рисунка показывают процесс перевода от начального отображения до выбора. Это устройство не так просто, как эти два рисунка, с его помощью переводчику могут быть оказаны более специальные услуги. В пособиях по переводу автор показал третью цифру:

«Относительно тривиальным дополнением был бы словарь. Переводчик выбирает слово или последовательность слов и дает команду для их поиска… Это новое окно дает эффект наложения некоторой части уже имеющихся окон. В этом случае , новое окно содержит обманчиво простую словарную статью для выбранного слова ". Более того, у устройства есть много других функций. Например, простота словарной статьи, синтаксис слов и семантика будут включены при указании на символы, изменяемые словарные статьи и временные поправки сделают это устройство более практичным. Затем объясните машинный перевод. "Один из вариантов, который должен быть предложен пользователю гипотетической системы, которую я описал, на довольно ранней стадии, - это команда, которая будет указывать программе переводить текущий выбранный модуль. Что произойдет, когда будет дана эта команда будет отличаться на разных этапах разработки системы. Но пользователь системы всегда будет иметь право вмешиваться в процесс перевода в той степени, в которой он сам указывает. Если он решит не вмешиваться вообще, фрагмент текста, предназначенный для перевести текущую единицу будет отображаться в нижнем окне его экрана. Он сможет редактировать это как угодно, как это делали в прошлом постредакторы. Кроме того, он может попросить проконсультироваться с ним всякий раз, когда программа сталкивается с решением определенного типа, когда обнаруживаются определенные виды двусмысленности или что-то еще. В этих случаях система задает вопрос переводчику-человеку. Он может, например, попросить, чтобы с ним проконсультировались по вопросу s местоименной ссылки ». В этой части идея памяти переводов была показана как словарная операция. "Предположим, например, что слово помещено в локальное хранилище - ту часть словаря, которая сохраняется только до тех пор, пока этот документ работает, - если оно встречается в тексте значительно чаще, чем статистика, хранящаяся в основном словаре. указать. Фраза будет отмечена, если она встречается два или три раза, но не распознается словарем как идиома или заданная фраза. Изучив содержимое этого магазина перед переводом, пользователь может надеяться получить предварительный просмотр о предстоящих трудностях и заранее принять некоторые решения о том, как их лечить. Эти решения, конечно же, будут записаны в самом магазине. В ходе этого или, действительно, по любой причине переводчик может запросить отображение всех единиц текста, содержащих определенное слово, фразу, строку символов или что-то еще. В конце концов, самая важная ссылка, которую нужно иметь при переводе текста, - это сам текст. Если фрагмент текста, который нужно перевести следующий будет любой hing, но совершенно прямолинейно, переводчик может начать с выдачи команды, заставляющей систему отображать в магазине все, что может иметь к ней отношение. Это привлечет его внимание к решениям, которые он принял до начала фактического перевода, статистически значимым словам и фразам, а также записи всего, что привлекало внимание, когда это произошло раньше. Прежде чем продолжить, он может изучить прошлые и будущие фрагменты текста, содержащие аналогичный материал ».

1.3 Ожидание лучшей производительности переводчика amanuensis В конце статьи Кей упомянул несколько причин, по которым следует ожидать лучшей производительности этого устройства. Во-первых, система в состоянии привлечь внимание своего сотрудника-человека к вопросам, которые, скорее всего, в этом нуждаются, во-вторых, решения, которые должны быть приняты в процессе перевода отрывка, редко бывают независимыми, в-третьих, одним из наиболее важных Средства в системе - это средства, которые отслеживают слова и фразы, которые каким-то образом используются в текущем тексте.

«Жизнь в языке». Речь в знак признательности присуждению Премии за выслугу лет на 43-м ежегодном собрании Ассоциации компьютерной лингвистики, Анн-Арбор, Мичиган, 27 июня 2005 г. http://www.stanford.edu/~mjkay/LifeOfLanguage.pdf
Выравнивание строк с помощью деревьев суффиксов. Статья о возможном использовании суффиксных деревьев для выравнивания текстов и их переводов. http://www.stanford.edu/~mjkay/CYCLING.pdf
Незавершенные размышления о природе перевода. Вот несколько незаконченных размышлений о характере перевода. http://www.stanford.edu/~mjkay/CurrentState.pdf
Несколько недоработанных мыслей о языковых моделях в статистическом НЛП, в которых мне нужна помощь. http://www.stanford.edu/~mjkay/language_models.pdf
Его статья 1994 г. "Регулярные модели систем фонологических правил ". Компьютерная лингвистика 20 (3): 331–378" с Рональдом Капланом. http://www.stanford.edu/~mjkay/Kaplan%26Kay.pdf

Книги

Лингвистика и информатика (с Карен Спарк Джонс ), Академическая пресса, 1973.
Естественный язык в информатике (под редакцией Д. Э. Уокера и Ханса Карлгрена), Скриптор, Стокгольм, 1977 г.
Verbmobil: система перевода для личного диалога (с Жаном Марком Гавроном и Питер Норвиг ), CSLI, Стэнфорд, Калифорния, 1994.
Введение в машинный перевод. У. Джон Хатчинс и Гарольд Л. Сомерс. Лондон: Academic Press, 1992.
Справочник по компьютерной лингвистике. Руслан Митков (ред.). Oxford University Press, 2003. (Введение).

Избранные статьи

"Правила интерпретации - подход к проблеме вычисления в семантике естественного языка ", в материалах Второго Международного конгресса Международной федерации обработки информации, 1962 г.
«Процедура анализа» Труды Второго Международного Конгресса Международной Федерации Обработки Информации, 1962 г.
«Общая процедура перезаписи строк», доклад, представленный на ежегодном собрании Ассоциации машинного перевода и компьютерной лингвистики, Блумингтон, Индиана, 1964.
Логика когнитивного распознавания в исторической лингвистике, RM-4224-PR, Санта-Моника, корпорация RAND, июль 1964 г.
Программа синтаксического анализа категориальных грамматик, RM-4283-PR, Санта-Моника, корпорация RAND, август 1964 г.
Табличный синтаксический анализатор: программа анализа структуры фраз и зависимости, RM-4933-PR, Санта-Моника, корпорация RAND, июль 1966 г.
Компьютерная система в помощь полевому лингвисту, P-4095, Санта-Моника, корпорация RAND, май 1969 г.
Система MIND: Программа морфологического анализа, RM-6265/2-PR, Санта-Моника, корпорация RAND, апрель 1970 г. (с Гэри Р. Мартинсом).
«Автоматический перевод естественных языков» в языке как проблема человека: Дедал, 1973.
"Грамматика функциональной унификации: формализм машинного перевода "в материалах Международной конференции по компьютерной лингвистике (COLING 84), Ассоциация компьютерной лингвистики, 1984.
«Анализ на языках свободного порядка слов» (с Лаури Карттуненом), в Даути, Дэвид Р., Лаури Карттунен и Арнольд М. Цвикки, Анализ естественного языка, Cambridge University Press, 1985.
«Унификация в грамматике», у Даля В. и П. Сен-Дизье, Понимание естественного языка и логическое программирование, Северная Голландия, 1985.
«Теоретические вопросы проектирования рабочего места переводчика», Труды семинара IBM по компьютерам и переводу, Копенгаген.
"Регулярные модели систем фонологических правил" (совместно с Р. М. Капланом), Компьютерная лингвистика 20: 3 (сентябрь 1994 г., совместно с Р. М. Капланом).
«Выравнивание подстроки с использованием деревьев суффиксов». Компьютерная лингвистика и интеллектуальная обработка текста, Спрингер, Конспект лекций по информатике, 2004 г.

Чтения курса

Дизъюнктивное объединение http://www.stanford.edu/~mjkay/DisjunctiveUnification.pdf
Функциональная неопределенность http://www.stanford.edu/~mjkay/FunctionalUncertainty.pdf
HPSG1 http://www.stanford.edu/~mjkay/pollard-foundations.pdf
HPSG2 http://www.stanford.edu/~mjkay/levine03.pdf
Поколение HPSG http://www.stanford.edu/~mjkay/Shieber.pdf
CCG http://www.stanford.edu/~mjkay/Steedman%26Baldridge.pdf
Типизированные функции http://www.stanford.edu/~mjkay/Copestake.pdf
Зависимость http://www.stanford.edu/~mjkay/covington.pdf

Награды

Он имеет звание почетного профессора Саарского университета и почетного доктора университетов Гетеборга и Женевы.
Он также выиграл 2005 ACL Премия за заслуги в жизни. Его благодарственная речь была озаглавлена «Языковая жизнь».^[2]

внешняя ссылка

Домашняя страница Стэнфорда
Домашняя страница Саарландского университета
Цитирование ACL Lifetime Achievement Award
"Жизнь языка" - Речь присуждения награды ACL Lifetime - Мартин Кей, рассказывающий о своей работе в области компьютерной лингвистики (13 страниц)
Анонс лекции с биографической справкой
Интервью (видео и аудио) с Мартином Каем в Оксфордском институте Интернета, 18 июня 2009 г.

Предшествует Карен Спарк Джонс	Премия ACL за выслугу лет 2005	Преемник Ева Гайчова

[1] Кей, Мартин. "Надлежащее место людей и машин в языковом переводе. »машинный перевод 12.1-2 (1997): 3-23.

[2] «Получатели награды ACL за выслугу лет». ACL вики. ACL. Получено 24 августа 2017.

[1]

[2]