ARPABET - ARPABET
ARPABET (также пишется ARPAbet) представляет собой набор фонетическая транскрипция коды, разработанные Агентство перспективных исследовательских проектов (ARPA) как часть их Исследование понимания речи проект 1970-х гг. Это представляет фонемы и аллофоны из Общий американский английский с различными последовательностями ASCII символы. Две системы, каждая из которых представляет сегмент с одним символом (чередование прописных и строчных букв) и другим с одним или двумя (без учета регистра), последний получил гораздо большее распространение.[1]
ARPABET использовался в нескольких синтезаторы речи, включая Computalker для системы S-100, SAM для Коммодор 64, СКАЖИТЕ за Amiga, TextAssist для ПК и Speakeasy от Intelligent Artefacts, которые использовали Вотракс Микросхема синтезатора речи SC-01. Он также используется в Словарь произношения CMU. Обновленная версия ARPABET используется в ТИМИТ корпус.[1]
Символы
Стресс обозначается цифрой сразу после гласной. Вспомогательные символы идентичны в одно- и двухбуквенных кодах. В двухбуквенном обозначении сегменты разделяются пробелом.
ARPABET | IPA | Примеры) | |
---|---|---|---|
1 буква | 2-буквенный | ||
а | AA | ɑ | бальм, бот |
@ | AE | æ | бат |
А | AH | ʌ | бтытт |
c | АО | ɔ | улоry |
W | AW | аʊ | бОУт |
Икс | ТОПОР | ə | комма |
Нет данных | AXR[3] | ɚ | латышэ |
Y | AY | аɪ | бяte |
E | EH | ɛ | бет |
р | ER | ɝ | бird |
е | EY | eɪ | байт |
я | IH | ɪ | бят |
Икс | IX | ɨ | rosеs, кроликят |
я | IY | я | беат |
о | OW | oʊ | боат |
О | OY | ɔɪ | бой |
U | ЭМ-М-М | ʊ | бооk |
ты | UW | ты | боот |
Нет данных | UX[3] | ʉ | dтыде |
ARPABET | IPA | Пример | |
---|---|---|---|
1 буква | 2-буквенный | ||
б | B | б | буу |
C | CH | tʃ | Chв |
d | D | d | dт.е. |
D | DH | ð | thу |
F | DX | ɾ | буттэ |
L | EL | l̩ | дноле |
M | ЭМ | м̩ | ритмм |
N | EN | n | задницана |
ж | F | ж | жправо |
грамм | грамм | ɡ | граммуу |
час | HH или же ЧАС[3] | час | часкайф |
J | JH | dʒ | jя |
k | K | k | kите |
л | L | л | лт.е. |
м | M | м | му |
п | N | п | пкайф |
грамм | NX или же NG[3] | ŋ | синг |
Нет данных | NX[3] | ɾ̃ | winnэ |
п | п | п | пт.е. |
Q | Q | ʔ | Эм-м-м-ой |
р | р | ɹ | рвы |
s | S | s | sкайф |
S | SH | ʃ | шу |
т | Т | т | тт.е. |
Т | TH | θ | thкайф |
v | V | v | vт.е. |
ш | W | ш | шise |
ЧАС | WH | ʍ | whу |
у | Y | j | уахт |
z | Z | z | zоо |
Z | ZH | ʒ | мольбаsуре |
AB | Описание |
---|---|
0 | Нет стресса |
1 | Первичный стресс |
2 | Вторичный стресс |
3... | Третичный и дальнейший стресс |
- | Тишина |
! | Неречевой сегмент |
+ | Морфема граница |
/ | Граница слова |
# | Высказывание граница |
: | Группа тонов граница |
:1 или же . | Падение или снижение соединение |
:2 или же ? | Рост или внутреннее соединение |
:3 или же . | Падение-подъем или нетерминальное соединение |
ТИМИТ
В ТИМИТ, помимо перечисленных выше используются следующие символы:[4]
Символ | IPA | Пример | Описание |
---|---|---|---|
AX-H | ə̥ | sтыспектр | Посвященный / ə / |
BCL | b̚ | обtain | [b] закрытие |
DCL | d̚ | width | [d] закрытие |
ENG | ŋ̍ | Стиркаingтонна | Слоговое письмо [ŋ] |
GCL | ɡ̚ | делатьграммзуб | [ɡ] закрытие |
HV | ɦ | ачасead | Озвучен /час/ |
KCL | k̚ | делатьcтор | [k] закрытие |
PCL | п | приниматьпт | [п] закрытие |
TCL | t̚ | октущипнуть | [т] закрытие |
PAU | Нет данных | Нет данных | Пауза |
EPI | Нет данных | Нет данных | Мимолетная тишина |
ЧАС# | Нет данных | Нет данных | Маркер начала / конца |
Смотрите также
- Сравнение кодировок ASCII международного фонетического алфавита
- САМПА, зависит от языка
- X-SAMPA, кодирующий весь международный фонетический алфавит
- Изменение произношения для английского языка
Рекомендации
- ^ а б Клаутау, Альдебаро (2001). «ARPABET и алфавит TIMIT» (PDF). Архивировано из оригинал (PDF) 3 июня 2016 г.. Получено 8 сентября, 2017.
- ^ а б c Райс, Ллойд (апрель 1976 г.). «Аппаратное и программное обеспечение для синтеза речи». Журнал доктора Добба по компьютерной гимнастике и ортодонтии. 1 (4): 6–8.
- ^ а б c d е Юрафски, Даниэль; Мартин, Джеймс Х. (2000). Обработка речи и языка: введение в обработку естественного языка, компьютерную лингвистику и распознавание речи. Прентис Холл. С. 94–5. ISBN 0-1309-5069-6.
- ^ «Таблица всех фонематических и фонетических символов, используемых в лексиконе TIMIT». Консорциум лингвистических данных. 12 октября 1990 г.. Получено 8 сентября, 2017.