Спецификация слова произношения - Pronunciation Lexicon Specification

В Словарь терминов произношения (PLS) - это W3C Рекомендация, которая предназначена для обеспечения возможности взаимодействия спецификации информации о произношении для обоих распознавание речи и синтез речи движки в приложениях голосового просмотра. Язык предназначен для облегчения использования разработчиками, одновременно поддерживая точную спецификацию информации о произношении для международного использования.

Язык позволяет указать одно или несколько произношений для слова или фразы с использованием стандартного алфавита произношения или, при необходимости, с использованием алфавитов конкретного производителя. Произношения сгруппированы в документ PLS, на который можно ссылаться из других языков разметки, таких как Спецификация грамматики распознавания речи. SRGS и язык разметки синтеза речи SSML.

Применение

Вот пример документа PLS:

 <?xml version="1.0" encoding="UTF-8"?> <словарь версия ="1.0"      xmlns ="http://www.w3.org/2005/01/pronuction-lexicon"     xmlns: xsi ="http://www.w3.org/2001/XMLSchema-instance"      xsi: schemaLocation ="http://www.w3.org/2005/01/pronuction-lexicon        http://www.w3.org/TR/2007/CR-pronuction-lexicon-20071212/pls.xsd "     алфавит ="ипа" xml: lang ="en-US">   <lexeme>     <grapheme>суждение</grapheme>     <grapheme>суждение</grapheme>     <phoneme>ˈDʒʌdʒ.mənt</phoneme>            "ˈDʒʌdʒ.mənt" ->    </lexeme>   <lexeme>     <grapheme>жених</grapheme>     <grapheme>жених</grapheme>     <phoneme>fiˈɒns.eɪ</phoneme>            "fiˈɒns.eɪ" ->      <phoneme>ˌFiː.ɑːnˈseɪ</phoneme>            "ˌFiː.ɑːnˈseɪ" ->    </lexeme> </lexicon>

что можно использовать для улучшения TTS как показано в следующем SSML 1.0 документ:

 <?xml version="1.0" encoding="UTF-8"?> <говорить версия ="1.0"      xmlns ="http://www.w3.org/2001/10/synthesis"      xmlns: xsi ="http://www.w3.org/2001/XMLSchema-instance"     xsi: schemaLocation ="http://www.w3.org/2001/10/synthesis       http://www.w3.org/TR/speech-synthesis/synthesis.xsd "     xml: lang ="en-US">   <словарь uri ="http://www.example.org/lexicon_defined_above.xml"/>   <p> По мнению моего жениха, Лас-Вегас - лучшее место для медового месяца. Я ответил, что предпочитаю Венецию и не считаю венецианское казино приемлемым компромиссом.</p> </speak>

но и улучшить ASR В следующих SRGS 1.0 грамматика:

 <?xml version="1.0" encoding="UTF-8"?> <грамматика версия ="1.0"     xmlns ="http://www.w3.org/2001/06/grammar"     xmlns: xsi ="http://www.w3.org/2001/XMLSchema-instance"      xsi: schemaLocation ="http://www.w3.org/2001/06/grammar        http://www.w3.org/TR/speech-grammar/grammar.xsd "     xml: lang ="en-US" корень ="фильмы" режим ="голос">   <словарь uri ="http://www.example.org/lexicon_defined_above.xml"/>   <правило id ="фильмы" сфера действия ="общественный">     <one-of>             <item>Терминатор 2: Судный день</item>              <item>Мой большой толстый неприятный жених</item>              <item>Судный день Плутона</item>     </one-of>    </rule> </grammar>

Общие варианты использования

Несколько произношений для одной и той же орфографии

За ASR В системах часто используется несколько вариантов произношения одного и того же слова или фразы, чтобы справиться с вариациями произношения в пределах одного языка. В языке лексики произношения несколько вариантов произношения представлены более чем одним элементом (или ) в одном элементе .

В следующем примере слово «Ньютон» имеет два возможных произношения.

 <?xml version="1.0" encoding="UTF-8"?> <словарь версия ="1.0"       xmlns ="http://www.w3.org/2005/01/pronuction-lexicon"      xmlns: xsi ="http://www.w3.org/2001/XMLSchema-instance"       xsi: schemaLocation ="http://www.w3.org/2005/01/pronuction-lexicon         http://www.w3.org/TR/2007/CR-pronuction-lexicon-20071212/pls.xsd "      алфавит ="ипа" xml: lang ="en-GB">   <lexeme>     <grapheme>Ньютон</grapheme>     <phoneme>ˈNjuːtən</phoneme>     <!-- IPA string is: "ˈnjuːtən" -->     <phoneme>ˈNuːtən</phoneme>     <!-- IPA string is: "ˈnuːtən" -->   </lexeme> </lexicon>

Множественные орфографии

В некоторых ситуациях существуют альтернативные текстовые представления одного и того же слова или фразы. Это может возникнуть по ряду причин. Подробности см. В разделе 4.5 PLS. Поскольку это представления, имеющие одно и то же значение (в отличие от омофонов), рекомендуется их представлять с помощью одного элемента , содержащего несколько графем.

Вот два простых примера множественной орфографии: альтернативное написание английского слова и множественное написание японского слова.

 <?xml version="1.0" encoding="UTF-8"?> <словарь версия ="1.0"       xmlns ="http://www.w3.org/2005/01/pronuction-lexicon"      xmlns: xsi ="http://www.w3.org/2001/XMLSchema-instance"       xsi: schemaLocation ="http://www.w3.org/2005/01/pronuction-lexicon         http://www.w3.org/TR/2007/CR-pronuction-lexicon-20071212/pls.xsd "      алфавит ="ипа" xml: lang ="en-US">   <!-- English entry showing how alternative spellings are handled -->   <lexeme>     <grapheme>цвет</grapheme>     <grapheme>цвет</grapheme>     <phoneme>ˈKʌlər</phoneme>     <!-- IPA string is: "ˈkʌlər" -->   </lexeme> </lexicon> <?xml version="1.0" encoding="UTF-8"?> <словарь версия ="1.0"       xmlns ="http://www.w3.org/2005/01/pronuction-lexicon"      xmlns: xsi ="http://www.w3.org/2001/XMLSchema-instance"       xsi: schemaLocation ="http://www.w3.org/2005/01/pronuction-lexicon         http://www.w3.org/TR/2007/CR-pronuction-lexicon-20071212/pls.xsd "      алфавит ="ипа" xml: lang ="jp">             орфографии ромадзи, кандзи и хирагана ->   <lexeme>     <grapheme>нихонго</grapheme>     <grapheme>日本語</grapheme>     <grapheme>に ほ ん ご</grapheme>     <phoneme>ihoŋɡo</phoneme>     <!-- IPA string is: "ɲihoŋɡo" -->   </lexeme> </lexicon>

Омофоны

В большинстве языков есть омофоны, слова с одинаковым произношением, но разными значениями (и, возможно, разным написанием), например, «семя» и «уступить». Рекомендуется представлять их в виде разных лексем.

 <?xml version="1.0" encoding="UTF-8"?> <словарь версия ="1.0"       xmlns ="http://www.w3.org/2005/01/pronuction-lexicon"      xmlns: xsi ="http://www.w3.org/2001/XMLSchema-instance"       xsi: schemaLocation ="http://www.w3.org/2005/01/pronuction-lexicon         http://www.w3.org/TR/2007/CR-pronuction-lexicon-20071212/pls.xsd "      алфавит ="ипа" xml: lang ="en-US">   <lexeme>     <grapheme>уступать</grapheme>     <phoneme>Сид</phoneme>     <!-- IPA string is: "siːd" -->   </lexeme>   <lexeme>     <grapheme>семя</grapheme>     <phoneme>Сид</phoneme>     <!-- IPA string is: "siːd" -->   </lexeme> </lexicon>

Омографы

В большинстве языков есть слова с разными значениями, но с одинаковым написанием (а иногда и с различным произношением), называемые омографы. Например, в английском языке слова bass (рыба) и слово bass (в музыке) имеют одинаковое написание, но разные значения и произношение. Хотя рекомендуется, чтобы эти слова были представлены с использованием отдельных элементов , которые отличаются разными значениями атрибута role (см. Раздел 4.4 PLS 1.0), если автор словаря произношения не хочет различать два слова, они могут просто быть представленным как альтернативное произношение внутри того же элемента . В последнем случае TTS процессор не сможет различить, когда применить первую или вторую транскрипцию.

В этом примере показано произношение омографа «бас».

 <?xml version="1.0" encoding="UTF-8"?> <словарь версия ="1.0"       xmlns ="http://www.w3.org/2005/01/pronuction-lexicon"      xmlns: xsi ="http://www.w3.org/2001/XMLSchema-instance"       xsi: schemaLocation ="http://www.w3.org/2005/01/pronuction-lexicon         http://www.w3.org/TR/2007/CR-pronuction-lexicon-20071212/pls.xsd "      алфавит ="ипа" xml: lang ="en-US">   <lexeme>     <grapheme>бас</grapheme>     <phoneme>bs</phoneme>     <!-- IPA string is: bæs -->     <phoneme>быть</phoneme>     <!-- IPA string is: beɪs -->   </lexeme> </lexicon>

Обратите внимание, что английский язык содержит множество примеров пар существительное-глагол, которые можно трактовать как омографы или как альтернативные варианты произношения, в зависимости от предпочтений автора. Двумя примерами являются существительное / глагол «отказаться» и существительное / глагол «адрес».

 <?xml version="1.0" encoding="UTF-8"?> <словарь версия ="1.0"       xmlns ="http://www.w3.org/2005/01/pronuction-lexicon"      xmlns: xsi ="http://www.w3.org/2001/XMLSchema-instance"       xsi: schemaLocation ="http://www.w3.org/2005/01/pronuction-lexicon         http://www.w3.org/TR/2007/CR-pronuction-lexicon-20071212/pls.xsd "      xmlns: mypos ="http://www.example.org/my_pos_namespace"      алфавит ="ипа" xml: lang ="en-US">   <лексема роль ="mypos: глагол">     <grapheme>отказаться</grapheme>     <phoneme>Rfjuːz</phoneme>     <!-- IPA string is: "rɪˈfjuːz" -->   </lexeme>   <лексема роль ="mypos: существительное">     <grapheme>отказаться</grapheme>     <phoneme>ˈRɛfjuːs</phoneme>     <!-- IPA string is: "ˈrɛfjuːs" -->   </lexeme> </lexicon>

Произношение по орфографии

Для некоторых слов и фраз произношение может быть быстро и удобно выражено как последовательность других. орфографии. От разработчика необязательно иметь лингвистические знания, вместо этого он использует произношение которые, как ожидается, уже будут доступны. Для выражения произношения с использованием других орфографий можно использовать элемент .

Эта функция может быть очень полезна при расширении аббревиатуры.

 <?xml version="1.0" encoding="UTF-8"?> <словарь версия ="1.0"       xmlns ="http://www.w3.org/2005/01/pronuction-lexicon"      xmlns: xsi ="http://www.w3.org/2001/XMLSchema-instance"       xsi: schemaLocation ="http://www.w3.org/2005/01/pronuction-lexicon         http://www.w3.org/TR/2007/CR-pronuction-lexicon-20071212/pls.xsd "      алфавит ="ипа" xml: lang ="en-US">   <!--      Расширение аббревиатуры   -->   <lexeme>     <grapheme>W3C</grapheme>     <alias>Консорциум World Wide Web</alias>   </lexeme>   <!--      представление числа   -->   <lexeme>     <grapheme>101</grapheme>     <alias>сто один</alias>   </lexeme>   <!--      механизм грубого произношения   -->   <lexeme>     <grapheme>Таиланд</grapheme>     <alias>связать землю</alias>   </lexeme>   <!--      грубый механизм произношения и расширение акронима   -->   <lexeme>     <grapheme>BBC 1</grapheme>     <alias>будь морским</alias>   </lexeme> </lexicon>

Статус и будущее

  • PLS 1.0 получил статус рекомендации W3C 14 октября 2008 г.

Смотрите также

Рекомендации

внешняя ссылка