ISO 15924 - ISO 15924

ISO 15924, Коды для представления названий скриптов, определяет два набора кодов для ряда системы письма (скрипты). Каждому сценарию дается как четырехбуквенный, так и цифровой код.[1]Сценарий определяется как «набор графических символов, используемых для письменной формы одного или нескольких языков».[1]

По возможности коды взяты из ISO 639-2 где имя сценария и имя языка, использующего сценарий, идентичны (пример: Гуджарати ISO 639 guj, ISO 15924 Gujr). Предпочтение отдается библиографическим кодам 639-2, которые отличаются от часто предпочитаемых терминологических кодов.[1]

4-буквенные коды ISO 15924 включены в реестр языковых подтэгов для Языковые теги IETF и поэтому может использоваться в форматах файлов, в которых используются такие языковые теги. Например, их можно использовать в HTML и XML помочь Веб-браузеры определить, какие шрифт использовать для иностранного текста. Таким образом можно было различить, например, между сербский написано в Кириллица (sr-Cyrl) или же латинский (sr-Latn) скрипт или отметка романизированный текст как таковой.

Обслуживание

ISO назначила Консорциум Unicode как Орган регистрации (RA) для стандарта. RA отвечает за назначение регистратора, который работает с Объединенным консультативным комитетом (JAC) при разработке и внедрении стандарта. Регистратором с 2004 по 2018 гг. Майкл Эверсон, а с января 2019 года регистратором является Маркус Шерер, технический директор Консорциума Unicode.[2][3] JAC состоит из шести членов: один представитель РА (Маркус Шерер), один представитель ISO 639-2 (Рэндалл К. Барри из Библиотека Конгресса ), один представитель ISO TC37 (Кристиан Галински), один представитель ISO TC46 (Пеэтер Пелл) и два представителя ISO / IEC JTC 1 / SC 2 (Рик Макгоуэн и Кен Уистлер, оба также сотрудники Консорциума Unicode).[4]

Коды скриптов

Числовые диапазоны

Специальные коды

  • Кааа – Кабкс (900–949): 50 кодов зарезервированы для частного использования.
  • Zsye 993: Эмодзи
  • Zinh 994: Код для унаследованного скрипта[а]
  • Zmth 995: Математические обозначения
  • Zsym 996: Символы
  • Zxxx 997: Код для ненаписанных языков
  • Зыыы 998: Код для неопределенного скрипта
  • Zzzz 999: Код для некодированного скрипта

Исключительно зарезервированные коды

Два четырехбуквенных кода зарезервированы по запросу Общий репозиторий данных локали Проект (CLDR):[7]

  • Корень: Зарезервировано для не зависящей от языка базы дерева локалей CLDR.
  • Истинный: Зарезервировано для логический значение "истина"

Список кодов

Этот список кодов взят из стандарта ISO 15924.[7]

ISO 15924 коды скриптов[а][b] и Unicode[c][d]
ISO 15924Скрипт в Юникоде[e]
КодНет.ИмяПсевдоним[f]НаправлениеВерсия
(добавлен)
ПерсонажиЗамечание
Adlm166АдламАдламR-to-L9.088
Афак439АфакаВарьируетсяНе в Unicode, предложение рассматривается Техническим комитетом Unicode[8][9]
Aghb239Кавказский албанскийКавказский албанскийСлева направо7.053Древний / исторический
Ахом338Ахом, Тай АхомАхомСлева направо8.058Древний / исторический
Араб160арабскийарабскийR-to-L1.01,291
Аран161Арабский (вариант насталик)СмешанныйТипографский вариант арабского языка
Арми124Императорский арамейскийИмператорский арамейскийR-to-L5.231Древний / исторический
Armn230АрмянскийАрмянскийСлева направо1.096
Avst134АвестийскийАвестийскийR-to-L5.261Древний / исторический
Бали360БалийскийБалийскийСлева направо5.0121
Баму435БамумБамумСлева направо5.2657
Бас259Басса ВахБасса ВахСлева направо7.036Древний / исторический
Батк365БатакБатакСлева направо6.056
Beng325Бенгальский (бангла)БенгальскийСлева направо1.096
Bhks334БхайкукиБхайкукиСлева направо9.097Древний / исторический
Blis550БлиссимволыВарьируетсяНе в Unicode, предложение находится на начальной / исследовательской стадии[8]
Бопо285БопомофоБопомофоСлева направо1.077
Брах300БрахмиБрахмиСлева направо6.0109Древний / исторический
Brai570Шрифт БрайляШрифт БрайляСлева направо3.0256
Буги367БугийскийБугийскийСлева направо4.130
Buhd372БухидБухидСлева направо3.220
Cakm349ЧакмаЧакмаСлева направо6.171
Банки440Единая слоговая речь канадских аборигеновКанадские аборигеныСлева направо3.0710
Кари201КарийскийКарийскийСлева направо5.149Древний / исторический
Чам358ЧамЧамСлева направо5.183
Шер445ЧерокиЧерокиСлева направо3.0172
Chrs109ХорезмистХорезмистСмешанный13.028Древний / исторический
Cirt291CirthВарьируетсяНе в Юникоде
Копт204КоптскийКоптскийСлева направо1.0137Древний / исторический, разделенный с греческим в 4.1
Cpmn402Кипро-минойскийСлева направоНе в Юникоде
Cprt403Кипрское слоговое письмоКиприотR-to-L4.055Древний / исторический
Кирл220КириллицаКириллицаСлева направо1.0443
Cyrs221Кириллица (старославянский вариант)ВарьируетсяДревний / исторический, типографский вариант кириллицы
Дева315Деванагари (Нагари)ДеванагариСлева направо1.0154
Диак342Дайвс АкуруДайвс АкуруСлева направо13.072Древний / исторический
Dogr328ДограДограСлева направо11.060Древний / исторический
Dsrt250Дезерет (мормон)DeseretСлева направо3.180
Dupl755Стенография Дуплояна, стенография ДуплоянаДуплоянСлева направо7.0143
Египет070Египетский демотикСмешанныйНе в Юникоде
Египет060Египетский иератическийСмешанныйНе в Юникоде
Египетский050Египетские иероглифыЕгипетские иероглифыСлева направо5.21,080Древний / исторический
Эльба226ЭльбасанЭльбасанСлева направо7.040Древний / исторический
Elym128ElymaicElymaicR-to-L12.023Древний / исторический
Эти430Эфиопский (геэз)ЭфиопскийСлева направо3.0495
Геок241Хуцури (Асомтаврули и Нусхури)ГрузинскийВарьируетсяUnicode объединяет Геока и Геора как «грузинское»
Геор240Грузинский (Мхедрули и Мтаврули)ГрузинскийСлева направо1.0173Для Unicode см. Также Geok
Glag225ГлаголицаГлаголицаСлева направо4.1132Древний / исторический
Гонг312Гунджала ГондиГунджала ГондиСлева направо11.063
Гонм313Масарам ГондиМасарам ГондиСлева направо10.075
Гот206ГотикаГотикаСлева направо3.127Древний / исторический
Бабушка343ГрантаГрантаСлева направо7.085Древний / исторический
Грек200ГреческийГреческийСлева направо1.0518Иногда выражается как бустрофедон (зеркальное отображение чередующихся строк, а не только слева направо)
Гуджр320ГуджаратиГуджаратиСлева направо1.091
Гуру310ГурмукхиГурмукхиСлева направо1.080
Ханб503Хан с Бопомофо (псевдоним Хан + Бопомофо)ВарьируетсяСм. Хани, Бопо
Вешать286Хангыль (Hangŭl, Hangeul)ХангыльСлева направо1.011,739Слоги хангыль перемещены в 2.0
Хани500Хан (ханзи, кандзи, ханджа)ХанСлева направо1.094,204
Hano371Хануноо (Hanunóo)ХанунооСлева направо3.221
Ганс501Хан (упрощенный вариант)ВарьируетсяПодмножество Хани
Хант502Хан (традиционный вариант)ВарьируетсяПодмножество Хани
Hatr127ХатранХатранR-to-L8.026Древний / исторический
Hebr125ивритивритR-to-L1.0134
Хира410ХираганаХираганаСлева направо1.0379
Hluw080Анатолийские иероглифы (лувийские иероглифы, хеттские иероглифы)Анатолийские иероглифыСлева направо8.0583Древний / исторический
Хмнг450Пахау ХмонгПахау ХмонгСлева направо7.0127
Hmnp451Nyiakeng Puachue HmongNyiakeng Puachue HmongСлева направо12.071
Hrkt412Слоговые алфавиты японского языка (псевдоним Хирагана + Катакана)Катакана или ХираганаВарьируетсяСм. Хира, Кана
Подвешенный176Древневенгерский (венгерский рунический)ДревневенгерскийR-to-L8.0108Древний / исторический
Inds610Инд (Хараппан)СмешанныйНе в Unicode, предложение находится на начальной / исследовательской стадии[8]
Ital210Старый курсив (этрусский, осканский и др.)Старый курсивСлева направо3.139Древний / исторический
Джамо284Джамо (псевдоним Jamo подмножества хангыля)ВарьируетсяПодмножество Hang
Ява361ЯванскийЯванскийСлева направо5.290
Jpan413Японский (псевдоним Хан + Хирагана + Катакана)ВарьируетсяУвидеть Хани, Хиру и Кана
Jurc510ЧжурчжэньСлева направоНе в Юникоде
Кали357Кая ЛиКая ЛиСлева направо5.147
Кана411КатаканаКатаканаСлева направо1.0304
Хар305KharoshthiKharoshthiR-to-L4.168Древний / исторический
Кхмр355КхмерскийКхмерскийСлева направо3.0146
Ходж322ХойкиХойкиСлева направо7.062Древний / исторический
Китл505Кидань большой шрифтСлева направоНе в Юникоде
Наборы288Киданьский маленький шрифтКиданьский маленький шрифтТ-к-Б13.0471Древний / исторический
Knda345КаннадаКаннадаСлева направо1.089
Kore287Корейский (псевдоним хангыль + хань)Слева направоУвидеть Хани и Ханг
Kpel436KpelleСлева направоНе в Unicode, предложение находится на начальной / исследовательской стадии[8]
Кти317KaithiKaithiСлева направо5.267Древний / исторический
Лана351Тай Тхам (Ланна)Тай ТхамСлева направо5.2127
Лаоо356ЛаосскийЛаосскийСлева направо1.082
Latf217Латинский (вариант Fraktur)ВарьируетсяТипографский вариант латыни
Латг216Латинский (гэльский вариант)Слева направоТипографский вариант латыни
Latn215латинскийлатинскийСлева направо1.01,374Видеть Латинский шрифт в Юникоде
Леке364ЛекеСлева направоНе в Юникоде
Лепц335Лепча (Ронг)ЛепчаСлева направо5.174
Конечности336ЛимбуЛимбуСлева направо4.068
Лина400Линейное письмо АЛинейное письмо АСлева направо7.0341Древний / исторический
Linb401Линейное письмо BЛинейное письмо BСлева направо4.0211Древний / исторический
Лису399Лису (Фрейзер)ЛисуСлева направо5.249
Лома437ЛомаСлева направоНе в Unicode, предложение находится на начальной / исследовательской стадии[8]
Lyci202ЛикийскийЛикийскийСлева направо5.129Древний / исторический
Lydi116ЛидийскийЛидийскийR-to-L5.127Древний / исторический
Mahj314МахаджаниМахаджаниСлева направо7.039Древний / исторический
Мака366МакасарМакасарСлева направо11.025Древний / исторический
Манд140Мандайский, мандейскийМандайскийR-to-L6.029
Мани139МанихейскийМанихейскийR-to-L7.051Древний / исторический
Марк332МарченМарченСлева направо9.068Древний / исторический
майя090Иероглифы майяСмешанныйНе в Юникоде
Медф265Медефайдрин (Обери Окайме, Обери Окаимо)МедефайдринСлева направо11.091
Исправить438Менде КикакуиМенде КикакуиR-to-L7.0213
Merc101Меройский курсивМеройский курсивR-to-L6.190Древний / исторический
Меро100Меройские иероглифыМероитские иероглифыR-to-L6.132Древний / исторический
Млым347МалаяламМалаяламСлева направо1.0118
Моди324Моди, MoīМодиСлева направо7.079Древний / исторический
Монг145МонгольскийМонгольскийТ-к-Б3.0167Включает Прозрачный, Маньчжурский скрипты
Луна218Луна (код Луны, сценарий Луны, тип Луны)СмешанныйНе в Unicode, предложение находится на начальной / исследовательской стадии[8]
Mroo264Мро, МруMroСлева направо7.043
Мтей337Мейтей Майек (Meithei, Meetei)Митей МайекСлева направо5.279
Mult323МултаниМултаниСлева направо8.038Древний / исторический
Mymr350Мьянма (бирманский)МьянмаСлева направо3.0223
Nand311НандинагариНандинагариСлева направо12.065Древний / исторический
Нарб106Old North Arabian (Древний северноаравийский)Старый северноаравийскийR-to-L7.032Древний / исторический
Нбат159НабатейскийНабатейскийR-to-L7.040Древний / исторический
Newa333Нева, невар, невари, непала липиNewaСлева направо9.097
Nkdb085Наси Донгба (na²¹ɕi³³ to³³ba²¹, Nakhi Tomba)Слева направоНе в Юникоде
НКГБ420Накхи Геба (na²¹ɕi³³ gʌ²¹ba²¹, 'Na-'Khi ²Ggŏ-baw, Накхи Геба)Слева направоНе в Unicode, предложение находится на начальной / исследовательской стадии[8]
Nkoo165N’KoНКоR-to-L5.062
Ншу499НюшуНушуСлева направо10.0397
Огам212ОгамОгамСмешанный3.029Древний / исторический
Olck261Ол Чики (Ol Cemet ’, Ol, Santali)Ol ChikiСлева направо5.148
Орх175Древнетюркский, орхонский руническийДревнетюркскийR-to-L5.273Древний / исторический
Оря327Ория (Одиа)ОрияСлева направо1.091
Osge219ОсейджОсейджСлева направо9.072
Осма260ОсманьяОсманьяСлева направо4.040
ладонь126ПальмиренаПальмиренаR-to-L7.032Древний / исторический
Паук263По Чин ХауПо Чин ХауСлева направо7.057
Пермь227Старая ПермьСтарая ПермьСлева направо7.043Древний / исторический
Phag331Phags-paPhags-paТ-к-Б5.056Древний / исторический
Phli131Пехлеви с надписьюПехлеви с надписьюR-to-L5.227Древний / исторический
Phlp132Псалтырь ПехлевиПсалтырь ПехлевиR-to-L7.029Древний / исторический
Phlv133Бронировать ПехлевиСмешанныйНе в Юникоде
Phnx115ФиникийскийФиникийскийR-to-L5.029Древний / исторический
Piqd293Клингонский (KLI pIqaD)Слева направоОтклонено для включения в стандарт Unicode[10][11]
Plrd282Мяо (Поллард)МяоСлева направо6.1149
Прти130Письменный парфянскийПисьменный парфянскийR-to-L5.230Древний / исторический
Кааа900Зарезервировано для частного использования (начало)Не в Юникоде
Каай908(Частное использование)Не в Unicode (до версии 5.2 он использовался вместо Zinh)
Qabx949Зарезервировано для частного использования (конец)Не в Юникоде
Rjng363Реджанг (Реджанг, Каганга)RejangСлева направо5.137
Рог167Ханифи РохинджаХанифи РохинджаR-to-L11.050
Роро620РонгоронгоСмешанныйНе в Unicode, предложение находится на начальной / исследовательской стадии[8]
Runr211РуническийРуническийСлева направо3.086Древний / исторический
Samr123СамаритянинСамаритянинR-to-L5.261
Сара292СаратиСмешанныйНе в Юникоде
Сарб105Старый южноаравийскийСтарый южноаравийскийR-to-L5.232Древний / исторический
Саур344СаураштраСаураштраСлева направо5.182
Sgnw095ЗнакЗнакТ-к-Б8.0672
Шоу281Шавиан (Шоу)ШавианСлева направо4.048
Shrd319Шарада, ШарадаШарадаСлева направо6.196
Шуй530ШуйшуСлева направоНе в Юникоде
Сидд302Сиддхам, Сиддхах, СиддхаматрикаСиддхамСлева направо7.092Древний / исторический
Синд318Худавади, синдхиХудавадиСлева направо7.069
Sinh348СингальскийСингальскийСлева направо3.0111
Согдийская141СогдийскийСогдийскийR-to-L11.042Древний / исторический
Сого142Старый согдийскийСтарый согдийскийR-to-L11.040Древний / исторический
Сора398Сора СомпенгСора СомпенгСлева направо6.135
Сойо329СоёмбоСоёмбоСлева направо10.083Древний / исторический
Сунд362СуданскийСуданскийСлева направо5.172
Sylo316Силоти НагриСилоти НагриСлева направо4.145Древний / исторический
Syrc135СирийскийСирийскийR-to-L3.088
Syre138Сирийский (вариант Эстранджело)СмешанныйТипографский вариант сирийского языка
Сырдж137Сирийский (западный вариант)СмешанныйТипографский вариант сирийского языка
Сырн136Сирийский (восточный вариант)СмешанныйТипографский вариант сирийского языка
Tagb373TagbanwaTagbanwaСлева направо3.218
Такр321Такри, Шакри, ШанкриТакриСлева направо6.167
Сказка353Тай ЛеТай ЛеСлева направо4.035
Талу354Новый Тай ЛюНовый Тай ЛюСлева направо4.183
Тамл346ТамильскийТамильскийСлева направо1.0123
Тан520ТангутскийТангутскийСлева направо9.06,914Древний / исторический
Тавт359Тай ВьетТай ВьетСлева направо5.272
Телу340телугутелугуСлева направо1.098
Teng290ТенгварСлева направоНе в Юникоде
Tfng120Тифинаг (берберский)ТифинагСлева направо4.159
Tglg370Тагальский (байбайын, алибата)ТагальскийСлева направо3.220
Таа170ThaanaThaanaR-to-L3.050
Тайский352ТайскийТайскийСлева направо1.086
Тибт330тибетскийтибетскийСлева направо2.0207Добавлено в 1.0, удалено в 1.1 и повторно введено в 2.0
Тирх326ТирхутаТирхутаСлева направо7.082
Тото294ТотоСлева направоНе в Юникоде
Угар040УгаритскийУгаритскийСлева направо4.031Древний / исторический
Вайи470ВайВайСлева направо5.1300
Visp280Видимая речьСлева направоНе в Юникоде
Вара262Варанг Сити (Варанг Кшити)Варанг СитиСлева направо7.084
Wcho283WanchoWanchoСлева направо12.059
Воле480WoleaiСмешанныйНе в Unicode, предложение находится на начальной / исследовательской стадии[8]
Xpeo030ДревнеперсидскийДревнеперсидскийСлева направо4.150Древний / исторический
Xsux020Клинопись, шумеро-аккадскийКлинописьСлева направо5.01,234Древний / исторический
Йези192ЕзидыЕзидыR-to-L13.047Древний / исторический
Yiii460ЙиЙиСлева направо3.01,220
Занб339Площадь Занабазар (Zanabazarin Dörböljin Useg, Xewtee Dörböljin Bicig, Horizontal Square Script)Площадь ЗанабазарСлева направо10.072Древний / исторический
Zinh994Код для унаследованного скриптаУнаследованоУнаследовано573
Zmth995Математические обозначенияСлева направоНе скрипт в Юникоде
Зым996СимволыНе скрипт в Юникоде
Zsye993Символы (вариант смайликов)Не скрипт в Юникоде
Zxxx997Код для неписаных документовНе скрипт в Юникоде
Зыыы998Код для неопределенного сценарияОбщийСмешанный8,087
Zzzz999Код для некодированного скриптаНеизвестный970,188Все остальные кодовые точки
Примечания
  1. ^
    Публикации ISO 15924 По состоянию на 16 апреля 2020 г.
  2. ^
    ISO 15924 Нормативный текстовый файл По состоянию на 16 апреля 2020 г.
  3. ^
    Изменения ISO 15924 (включая псевдонимы для Unicode; по состоянию на 16 апреля 2020 г.)
  4. ^
    Unicode версии 13.0
  5. ^
  6. ^
    Unicode использует «Псевдоним значения свойства» (Псевдоним) в качестве имени сценария. Эти псевдонимы являются частью Unicode и публикуются для информации рядом с ISO 15924. Имя сценария псевдонима может использоваться в имени персонажа: ладонь, Пальмирена → U + 10860 𐡠 ПАЛЬМИРЕНОВАЯ БУКВА АЛЕФ.

Отношение к другим стандартам

Следующие стандарты считаются обязательными в ISO 15924.

  • ISO 639-2: 1998 Коды для представления названий языков - Часть 2: Код Alpha-3
  • ISO / IEC 9541-1: 1991 Информационные технологии. Обмен информацией о шрифтах. Часть 1. Архитектура.
  • ИСО / МЭК 10646-1: 2000 Информационные технологии - Универсальный набор символов с множеством октетов (UCS)

Для определения шрифта и глифа стандарт ссылается на

  • ИСО / МЭК 9541-1: 1991

Около 154 скриптов определены в Unicode. Посредством закрепления, называемого «Псевдоним значения свойства», Unicode установил связь 1: 1 между заданным скриптом и его стандартом ISO 15924. Видеть Скрипт (Юникод).

Смотрите также

Примечания

  1. ^ Согласно Стандарт Юникода, Приложение № 24, версия 13.0.0 Унаследовано - это значение свойства сценария Unicode для символов, которые могут использоваться в нескольких сценариях и которые наследуют свой сценарий от предыдущего базового символа. К ним относятся объединяющие знаки без интервала и включающие объединяющие знаки, а также U + 200C ZERO WIDTH NON-JOINER и U + 200D СОЕДИНИТЕЛЬ НУЛЕВОЙ ШИРИНЫ ". Значение Унаследовано описывается как соответствие коду ISO 15924 Zinh.

Рекомендации

  1. ^ а б c «ISO 15924: 2004». Получено 2011-06-21.
  2. ^ «Орган регистрации ISO 15924». Консорциум Unicode. Получено 24 января 2019.
  3. ^ "Директора, должностные лица и персонал Unicode". Консорциум Unicode. Получено 24 января 2019.
  4. ^ «Объединенный консультативный комитет ISO 15924 / RA-JAC». Консорциум Unicode. Получено 24 января 2019.
  5. ^ В июле 2010 г. Стенография дуплоян был присвоен код 755, хотя диапазон 700-799 все еще имел свое первоначальное обозначение (не назначен). Вскоре после этого в редакции 1.1 разъяснялось, что коды в 700 зарезервированы для «сокращений и других обозначений», хотя эта редакция является лишь предварительной, пока она не будет подтверждена руководящими комитетами.
  6. ^ «ISO 15924: 2004 Информация и документация - Коды для представления имен скриптов». Консорциум Unicode. 2004-01-09.
  7. ^ а б «ISO 15924: 2004 - Коды для представления названий скриптов». Unicode. 2020.
  8. ^ а б c d е ж грамм час я «Предлагаемые новые сценарии». Консорциум Unicode. 2018-05-25. Получено 2018-09-12.
  9. ^ «Дорожная карта к СМП». Консорциум Unicode. 2018-08-08. Получено 2018-09-12.
  10. ^ Майкл Эверсон (1997-09-18). «Предложение по кодированию клингонов в плоскости 1 стандарта ISO / IEC 10646-2».
  11. ^ Консорциум Unicode (14 августа 2001 г.). «Утвержденный протокол совместного заседания UTC 87 / L2 184».

внешняя ссылка