Блок Юникода - Unicode block
А Блок Юникода является одним из нескольких смежных диапазонов кодов цифровых символов (кодовые точки ) из Unicode набор символов, который определяется Консорциум Unicode для административных и документальных целей. Обычно такие предложения, как добавление новых глифов, обсуждаются и оцениваются путем рассмотрения соответствующего блока или блоков в целом.
Каждый блок обычно, но не всегда, предназначен для предоставления глифов, используемых одним или несколькими конкретными языками или в какой-либо общей области приложения, такой как математика, геодезия, декоративный наборный, социальные форумы и т. д.
Дизайн и реализация
Блоки Unicode идентифицируются уникальными именами, которые используют только символы ASCII и обычно описывают природу символов в английский; такие как «Тибетский» или «Дополнительные стрелки-А». (При сравнении имен блоков предполагается, что прописные буквы приравниваются к строчным буквам и игнорируются любые пробелы, дефисы и символы подчеркивания; таким образом, последнее имя эквивалентно «additional_arrows__a» и «SUPPLEMENTALARROWSA».[1]
Блоки попарно непересекающиеся, то есть они не перекрываются. Начальная кодовая точка и размер (количество кодовых точек) каждого блока всегда кратны 16; поэтому в шестнадцатеричная запись, начальная (наименьшая) точка - U +ххх0, а конечная (самая большая) точка - U +гггF, где ххх и ггг являются тремя или более шестнадцатеричными цифрами. (Эти ограничения предназначены для упрощения отображения глифов в документах Unicode Consortium в виде таблиц с 16 столбцами, помеченных последней шестнадцатеричной цифрой кодовой точки.[1]) Размер блока может варьироваться от минимум 16 до максимум 65 536 кодовых точек.
Каждая назначенная кодовая точка имеет свойство глифа, называемое «Блок», значение которого представляет собой строку символов, указывающую уникальный блок, которому принадлежит эта точка.[2] Однако блок также может содержать неназначенные кодовые точки, обычно зарезервированные для будущих добавлений символов, которые «логически» должны принадлежать этому блоку. Кодовые точки, не принадлежащие ни одному из названных блоков, например в неназначенном самолеты 3–13, имеют значение block = "No_block".[1]
Другие классификации
Каждая точка Unicode также имеет свойство, называемое "Общая категория ", который пытается описать роль соответствующего символа в языках или приложениях, ради которых он был включен в систему. Примеры общих категорий:" Lu "(означает заглавную букву)," Nd "(десятичная цифра) , «Pi» (пунктуация в открытых кавычках) и «Mn» (знак без пробелов, т. Е. Диакритический знак для предыдущего глифа). Это деление полностью не зависит от кодовых блоков: кодовые точки с данной общей категорией обычно охватывают множество блоки, и не обязательно должны быть последовательными, даже внутри каждого блока.[3]
Каждая кодовая точка также имеет свойство скрипта, указав, какие система письма он предназначен или предназначен ли он для нескольких систем письма. Это также не зависит от блока.
В описаниях системы Unicode блок может быть разделен на более конкретные подгруппы, такие как "Шахматные символы "в блоке"Разные символы ". Эти подгруппы не являются" блоками "в техническом смысле, используемом консорциумом Unicode, и названы только для удобства пользователей.
Список блоков
Unicode 13.0 определяет 308 блоков:[1]
- 163 в плоскости 0, базовая многоязычная плоскость (BMP)
- 134 в плоскости 1, дополнительная многоязычная плоскость (SMP)
- 6 в плоскости 2, дополнительной идеографической плоскости (SIP)
- 1 в плоскости 3, третичной идеографической плоскости (TIP)
- 2 в плоскости 14 (E в шестнадцатеричный ), Дополнительный самолет специального назначения (SSP)
- По одному в самолетах 15 (Fшестнадцатеричный) и 16 (10шестнадцатеричный), называемые Зонами дополнительного частного использования-A и -B
Блоки Unicode и содержал скрипты | |||||
---|---|---|---|---|---|
Самолет | Блокировать диапазон | Имя блока | Кодовые точки[а] | Назначенные символы | Скрипты[b][c][d][e][f] |
0 BMP | U + 0000..U + 007F | Базовая латынь[грамм] | 128 | 128 | латинский (52 символа), Общий (76 символов) |
U + 0080..U + 00FF | Дополнение Latin-1[час] | 128 | 128 | Латинский (64 символа), Общий (64 символа) | |
U + 0100..U + 017F | Расширенная латиница-A | 128 | 128 | латинский | |
U + 0180..U + 024F | Расширенная латиница-B | 208 | 208 | латинский | |
U + 0250..U + 02AF | Расширения IPA | 96 | 96 | латинский | |
U + 02B0..U + 02FF | Буквы модификатора интервала | 80 | 80 | Бопомофо (2 символа), латинский (14 символов), общий (64 символа) | |
U + 0300..U + 036F | Комбинирование диакритических знаков | 112 | 112 | Унаследовано | |
U + 0370..U + 03FF | Греческий и коптский | 144 | 135 | Коптский (14 символов), Греческий (117 символов), Обычный (4 символа) | |
U + 0400..U + 04FF | Кириллица | 256 | 256 | Кириллица (254 символа), унаследовано (2 символа) | |
U + 0500..U + 052F | Дополнение к кириллице | 48 | 48 | Кириллица | |
0 BMP | U + 0530..U + 058F | Армянский | 96 | 91 | Армянский |
U + 0590..U + 05FF | иврит | 112 | 88 | иврит | |
U + 0600..U + 06FF | арабский | 256 | 255 | арабский (237 символов), Common (6 символов), Inherited (12 символов) | |
U + 0700..U + 074F | Сирийский | 80 | 77 | Сирийский | |
U + 0750..U + 077F | Дополнение на арабском языке | 48 | 48 | арабский | |
U + 0780..U + 07BF | Thaana | 64 | 50 | Thaana | |
U + 07C0..U + 07FF | НКо | 64 | 62 | Nko | |
U + 0800..U + 083F | Самаритянин | 64 | 61 | Самаритянин | |
U + 0840..U + 085F | Мандайский | 32 | 29 | Мандайский | |
U + 0860..U + 086F | Сирийское дополнение | 16 | 11 | Сирийский | |
0 BMP | U + 08A0..U + 08FF | Арабский расширенный-A | 96 | 84 | Арабский (83 символа), Общий (1 символ) |
U + 0900..U + 097F | Деванагари | 128 | 128 | Деванагари (122 символа), общий (2 символа), наследуемый (4 символа) | |
U + 0980..U + 09FF | Бенгальский | 128 | 96 | Бенгальский | |
U + 0A00..U + 0A7F | Гурмукхи | 128 | 80 | Гурмукхи | |
U + 0A80..U + 0AFF | Гуджарати | 128 | 91 | Гуджарати | |
U + 0B00..U + 0B7F | Ория | 128 | 91 | Ория | |
U + 0B80..U + 0BFF | Тамильский | 128 | 72 | Тамильский | |
U + 0C00..U + 0C7F | телугу | 128 | 98 | телугу | |
U + 0C80..U + 0CFF | Каннада | 128 | 89 | Каннада | |
U + 0D00..U + 0D7F | Малаялам | 128 | 118 | Малаялам | |
0 BMP | U + 0D80..U + 0DFF | Сингальский | 128 | 91 | Сингальский |
U + 0E00..U + 0E7F | Тайский | 128 | 87 | Тайский (86 символов), Обычный (1 символ) | |
U + 0E80..U + 0EFF | Лаосский | 128 | 82 | Лаосский | |
U + 0F00..U + 0FFF | тибетский | 256 | 211 | тибетский (207 знаков), Обычный (4 символа) | |
U + 1000..U + 109F | Мьянма | 160 | 160 | Мьянма | |
U + 10A0..U + 10FF | Грузинский | 96 | 88 | Грузинский (87 символов), Обычный (1 символ) | |
U + 1100..U + 11FF | Хангыль джамо | 256 | 256 | Хангыль | |
U + 1200..U + 137F | Эфиопский | 384 | 358 | Эфиопский | |
U + 1380..U + 139F | Эфиопское дополнение | 32 | 26 | Эфиопский | |
U + 13A0..U + 13FF | Чероки | 96 | 92 | Чероки | |
0 BMP | U + 1400..U + 167F | Единая слоговая речь канадских аборигенов | 640 | 640 | Канадские аборигены |
U + 1680..U + 169F | Огам | 32 | 29 | Огам | |
U + 16A0..U + 16FF | Рунический | 96 | 89 | Рунический (86 символов), Обычный (3 символа) | |
U + 1700..U + 171F | Тагальский | 32 | 20 | Тагальский | |
U + 1720..U + 173F | Хануноо | 32 | 23 | Хануноо (21 символ), Обычный (2 символа) | |
U + 1740..U + 175F | Бухид | 32 | 20 | Бухид | |
U + 1760..U + 177F | Tagbanwa | 32 | 18 | Tagbanwa | |
U + 1780..U + 17FF | Кхмерский | 128 | 114 | Кхмерский | |
U + 1800..U + 18AF | Монгольский | 176 | 157 | Монгольский (154 символа), Обычный (3 символа) | |
U + 18B0..U + 18FF | Унифицированная слоговая речь канадских аборигенов расширенная | 80 | 70 | Канадские аборигены | |
0 BMP | U + 1900..U + 194F | Лимбу | 80 | 68 | Лимбу |
U + 1950..U + 197F | Тай Ле | 48 | 35 | Тай Ле | |
U + 1980..U + 19DF | Новый Тай Лю | 96 | 83 | Новый Тай Лю | |
U + 19E0..U + 19FF | Кхмерские символы | 32 | 32 | Кхмерский | |
U + 1A00..U + 1A1F | Бугийский | 32 | 30 | Бугийский | |
U + 1A20..U + 1AAF | Тай Тхам | 144 | 127 | Тай Тхам | |
U + 1AB0..U + 1AFF | Объединение диакритических знаков расширено | 80 | 17 | Унаследовано | |
U + 1B00..U + 1B7F | Балийский | 128 | 121 | Балийский | |
U + 1B80..U + 1BBF | Суданский | 64 | 64 | Суданский | |
U + 1BC0..U + 1BFF | Батак | 64 | 56 | Батак | |
0 BMP | У + 1C00..U + 1C4F | Лепча | 80 | 74 | Лепча |
U + 1C50..U + 1C7F | Ol Chiki | 48 | 48 | Ol Chiki | |
У + 1C80..U + 1C8F | Кириллица расширенная-C | 16 | 9 | Кириллица | |
U + 1C90..U + 1CBF | Грузинский расширенный | 48 | 46 | Грузинский | |
U + 1CC0..U + 1CCF | Сунданская добавка | 16 | 8 | Суданский | |
U + 1CD0..U + 1CFF | Ведические расширения | 48 | 43 | Обычный (16 символов), Унаследованный (27 символов) | |
U + 1D00..U + 1D7F | Фонетические расширения | 128 | 128 | Кириллица (2 символа), греческий (15 символов), латиница (111 символов) | |
U + 1D80..U + 1DBF | Дополнение к фонетическим расширениям | 64 | 64 | Греческий (1 символ), латинский (63 символа) | |
У + 1DC0..U + 1DFF | Дополнение для комбинирования диакритических знаков | 64 | 63 | Унаследовано | |
U + 1E00..U + 1EFF | Латинская расширенная дополнительная | 256 | 256 | латинский | |
0 BMP | U + 1F00..U + 1FFF | Греческий расширенный | 256 | 233 | Греческий |
U + 2000..U + 206F | Общая пунктуация | 112 | 111 | Обычный (109 символов), Унаследованный (2 символа) | |
U + 2070..U + 209F | Верхние и нижние индексы | 48 | 42 | Латинский (15 знаков), Обычный (27 знаков) | |
U + 20A0..U + 20CF | Символы валюты | 48 | 32 | Общий | |
U + 20D0..U + 20FF | Комбинирование диакритических знаков для символов | 48 | 33 | Унаследовано | |
U + 2100..U + 214F | Буквенные символы | 80 | 80 | Греческий (1 символ), латинский (4 символа), общий (75 символов) | |
U + 2150..U + 218F | Числовые формы | 64 | 60 | Латинский (41 символ), Обычный (19 символов) | |
U + 2190..U + 21FF | Стрелки | 112 | 112 | Общий | |
U + 2200..U + 22FF | Математические операторы | 256 | 256 | Общий | |
U + 2300..U + 23FF | Разное Техническое | 256 | 256 | Общий | |
0 BMP | U + 2400..U + 243F | Контрольные изображения | 64 | 39 | Общий |
U + 2440..U + 245F | Оптическое распознавание символов | 32 | 11 | Общий | |
U + 2460..U + 24FF | Вложенные буквенно-цифровые символы | 160 | 160 | Общий | |
U + 2500..U + 257F | Рисунок Коробки | 128 | 128 | Общий | |
U + 2580..U + 259F | Блочные элементы | 32 | 32 | Общий | |
U + 25A0..U + 25FF | Геометрические фигуры | 96 | 96 | Общий | |
U + 2600..U + 26FF | Разные символы | 256 | 256 | Общий | |
U + 2700..U + 27BF | Дингбаты | 192 | 192 | Общий | |
U + 27C0..U + 27EF | Разные математические символы-A | 48 | 48 | Общий | |
U + 27F0..U + 27FF | Дополнительные стрелки-A | 16 | 16 | Общий | |
0 BMP | U + 2800..U + 28FF | Шаблоны Брайля | 256 | 256 | Шрифт Брайля |
U + 2900..U + 297F | Дополнительные стрелки-B | 128 | 128 | Общий | |
U + 2980..U + 29FF | Разные математические символы-B | 128 | 128 | Общий | |
U + 2A00..U + 2AFF | Дополнительные математические операторы | 256 | 256 | Общий | |
U + 2B00..U + 2BFF | Разные символы и стрелки | 256 | 253 | Общий | |
U + 2C00..U + 2C5F | Глаголица | 96 | 94 | Глаголица | |
У + 2C60..U + 2C7F | Расширенная латиница-C | 32 | 32 | латинский | |
U + 2C80..U + 2CFF | Коптский | 128 | 123 | Коптский | |
У + 2Д00..У + 2Д2Ф | Грузинская добавка | 48 | 40 | Грузинский | |
У + 2Д30..У + 2Д7Ф | Тифинаг | 80 | 59 | Тифинаг | |
0 BMP | У + 2Д80..У + 2ДДФ | Эфиопский расширенный | 96 | 79 | Эфиопский |
U + 2DE0..U + 2DFF | Кириллица расширенная-A | 32 | 32 | Кириллица | |
U + 2E00..U + 2E7F | Дополнительная пунктуация | 128 | 83 | Общий | |
U + 2E80..U + 2EFF | Приложение CJK Radicals | 128 | 115 | Хан | |
U + 2F00..U + 2FDF | Kangxi Radicals | 224 | 214 | Хан | |
U + 2FF0..U + 2FFF | Символы идеографического описания | 16 | 12 | Общий | |
U + 3000..U + 303F | Символы и знаки препинания CJK | 64 | 64 | Хан (15 символов), Хангыль (2 символа), Обычный (43 символа), Унаследованный (4 символа) | |
U + 3040..U + 309F | Хирагана | 96 | 93 | Хирагана (89 символов), общий (2 символа), наследуемый (2 символа) | |
U + 30A0..U + 30FF | Катакана | 96 | 96 | Катакана (93 символа), Обычный (3 символа) | |
U + 3100..U + 312F | Бопомофо | 48 | 43 | Бопомофо | |
0 BMP | U + 3130..U + 318F | Совместимость с хангыль Джамо | 96 | 94 | Хангыль |
U + 3190..U + 319F | Канбун | 16 | 16 | Общий | |
U + 31A0..U + 31BF | Бопомофо расширенный | 32 | 32 | Бопомофо | |
U + 31C0..U + 31EF | CJK инсульты | 48 | 36 | Общий | |
U + 31F0..U + 31FF | Фонетические расширения катаканы | 16 | 16 | Катакана | |
U + 3200..U + 32FF | Приложенные письма и месяцы CJK | 256 | 255 | Хангыль (62 символа), Катакана (47 символов), Общий (146 символов) | |
U + 3300..U + 33FF | Совместимость с CJK | 256 | 256 | Катакана (88 символов), Обычный (168 символов) | |
U + 3400..U + 4DBF | Расширение унифицированных иероглифов CJK A | 6,592 | 6,592 | Хан | |
У + 4DC0..U + 4DFF | Символы гексаграммы Ицзин | 64 | 64 | Общий | |
U + 4E00..U + 9FFF | Унифицированные идеограммы CJK | 20,992 | 20,989 | Хан | |
0 BMP | U + A000..U + A48F | Yi слоги | 1,168 | 1,165 | Йи |
U + A490..U + A4CF | Yi Radicals | 64 | 55 | Йи | |
U + A4D0..U + A4FF | Лису | 48 | 48 | Лису | |
U + A500..U + A63F | Вай | 320 | 300 | Вай | |
U + A640..U + A69F | Кириллица расширенная-B | 96 | 96 | Кириллица | |
U + A6A0..U + A6FF | Бамум | 96 | 88 | Бамум | |
U + A700..U + A71F | Тональные буквы модификатора | 32 | 32 | Общий | |
U + A720..U + A7FF | Расширенная латиница-D | 224 | 180 | Латинский (175 символов), Обычный (5 символов) | |
U + A800..U + A82F | Силоти Нагри | 48 | 45 | Силоти Нагри | |
U + A830..U + A83F | Общие индийские числовые формы | 16 | 10 | Общий | |
0 BMP | U + A840..U + A87F | Phags-pa | 64 | 56 | Phags Pa |
U + A880..U + A8DF | Саураштра | 96 | 82 | Саураштра | |
U + A8E0..U + A8FF | Деванагари расширенный | 32 | 32 | Деванагари | |
U + A900..U + A92F | Кая Ли | 48 | 48 | Кая Ли (47 символов), Обычный (1 символ) | |
U + A930..U + A95F | Rejang | 48 | 37 | Rejang | |
U + A960..U + A97F | Хангыль Джамо расширенный-А | 32 | 29 | Хангыль | |
U + A980..U + A9DF | Яванский | 96 | 91 | Яванский (90 символов), Обычный (1 символ) | |
U + A9E0..U + A9FF | Мьянма Extended-B | 32 | 31 | Мьянма | |
U + AA00..U + AA5F | Чам | 96 | 83 | Чам | |
U + AA60..U + AA7F | Мьянма Extended-A | 32 | 32 | Мьянма | |
0 BMP | U + AA80..U + AADF | Тай Вьет | 96 | 72 | Тай Вьет |
U + AAE0..U + AAFF | Расширения Meetei Mayek | 32 | 23 | Митей Майек | |
U + AB00..U + AB2F | Эфиопский язык Extended-A | 48 | 32 | Эфиопский | |
U + AB30..U + AB6F | Расширенная латиница-E | 64 | 60 | Латинский (56 символов), греческий (1 символ), общий (3 символа) | |
U + AB70..U + ABBF | Дополнение Cherokee | 80 | 80 | Чероки | |
U + ABC0..U + ABFF | Митей Майек | 64 | 56 | Митей Майек | |
U + AC00..U + D7AF | Слоги хангыль | 11,184 | 11,172 | Хангыль | |
U + D7B0..U + D7FF | Хангыль Джамо расширенный-B | 80 | 72 | Хангыль | |
U + D800..U + DB7F | Высокие суррогаты | 896 | 0 | Неизвестно | |
U + DB80..U + DBFF | Суррогаты с высоким уровнем частного использования | 128 | 0 | Неизвестно | |
0 BMP | U + DC00..U + DFFF | Низкие суррогаты | 1,024 | 0 | Неизвестно |
U + E000..U + F8FF | Зона частного использования | 6,400 | 6,400 | Неизвестно | |
U + F900..U + FAFF | Идеографы совместимости CJK | 512 | 472 | Хан | |
U + FB00..U + FB4F | Алфавитные формы представления | 80 | 58 | Армянский (5 символов), иврит (46 символов), латинский (7 символов) | |
U + FB50..U + FDFF | Формы представления на арабском языке-A | 688 | 611 | Арабский (609 символов), Общий (2 символа) | |
U + FE00..U + FE0F | Селекторы вариаций | 16 | 16 | Унаследовано | |
U + FE10..U + FE1F | Вертикальные формы | 16 | 10 | Общий | |
U + FE20..U + FE2F | Объединение половинок | 16 | 16 | Кириллица (2 символа), Унаследованное (14 символов) | |
U + FE30..U + FE4F | Формы совместимости CJK | 32 | 32 | Общий | |
U + FE50..U + FE6F | Варианты малой формы | 32 | 26 | Общий | |
U + FE70..U + FEFF | Формы представления на арабском языке-B | 144 | 141 | Арабский (140 символов), общий (1 символ) | |
U + FF00..U + FFEF | Формы половинной и полной ширины | 240 | 225 | Хангыль (52 символа), катакана (55 символов), латиница (52 символа), общий (66 символов) | |
U + FFF0..U + FFFF | Специальные | 16 | 5 | Общий | |
1 SMP | U + 10000..U + 1007F | Слоговое письмо линейного письма B | 128 | 88 | Линейное письмо B |
U + 10080..U + 100FF | Идеограммы линейного письма Б | 128 | 123 | Линейное письмо B | |
U + 10100..U + 1013F | Эгейские числа | 64 | 57 | Общий | |
U + 10140..U + 1018F | Древнегреческие числа | 80 | 79 | Греческий | |
U + 10190..U + 101CF | Древние символы | 64 | 14 | Греческий (1 символ), Общий (13 символов) | |
U + 101D0..U + 101FF | Фестский диск | 48 | 46 | Обычный (45 символов), Унаследованный (1 символ) | |
U + 10280..U + 1029F | Ликийский | 32 | 29 | Ликийский | |
U + 102A0..U + 102DF | Карийский | 64 | 49 | Карийский | |
U + 102E0..U + 102FF | Коптские номера эпактов | 32 | 28 | Обычный (27 символов), Унаследованный (1 символ) | |
U + 10300..U + 1032F | Старый курсив | 48 | 39 | Старый курсив | |
1 SMP | U + 10330..U + 1034F | Готика | 32 | 27 | Готика |
U + 10350..U + 1037F | Старая Пермь | 48 | 43 | Старая Пермь | |
U + 10380..U + 1039F | Угаритский | 32 | 31 | Угаритский | |
U + 103A0..U + 103DF | Староперсидский | 64 | 50 | Староперсидский | |
U + 10400..U + 1044F | Deseret | 80 | 80 | Deseret | |
U + 10450..U + 1047F | Шавиан | 48 | 48 | Шавиан | |
U + 10480..U + 104AF | Османья | 48 | 40 | Османья | |
U + 104B0..U + 104FF | Осейдж | 80 | 72 | Осейдж | |
U + 10500..U + 1052F | Эльбасан | 48 | 40 | Эльбасан | |
U + 10530..U + 1056F | Кавказский албанский | 64 | 53 | Кавказский албанский | |
1 SMP | U + 10600..U + 1077F | Линейное письмо А | 384 | 341 | Линейное письмо А |
U + 10800..U + 1083F | Кипрская слоговая азбука | 64 | 55 | Киприот | |
U + 10840..U + 1085F | Императорский арамейский | 32 | 31 | Императорский арамейский | |
U + 10860..U + 1087F | Пальмирена | 32 | 32 | Пальмирена | |
U + 10880..U + 108AF | Набатейский | 48 | 40 | Набатейский | |
U + 108E0..U + 108FF | Хатран | 32 | 26 | Хатран | |
U + 10900..U + 1091F | Финикийский | 32 | 29 | Финикийский | |
U + 10920..U + 1093F | Лидийский | 32 | 27 | Лидийский | |
U + 10980..U + 1099F | Мероитские иероглифы | 32 | 32 | Мероитские иероглифы | |
U + 109A0..U + 109FF | Меройский курсив | 96 | 90 | Меройский курсив | |
1 SMP | U + 10A00..U + 10A5F | Kharoshthi | 96 | 68 | Kharoshthi |
U + 10A60..U + 10A7F | Старый южноаравийский | 32 | 32 | Старый южноаравийский | |
U + 10A80..U + 10A9F | Старый северноаравийский | 32 | 32 | Старый северноаравийский | |
U + 10AC0..U + 10AFF | Манихейский | 64 | 51 | Манихейский | |
U + 10B00..U + 10B3F | Авестийский | 64 | 61 | Авестийский | |
U + 10B40..U + 10B5F | Письменный парфянский | 32 | 30 | Письменный парфянский | |
U + 10B60..U + 10B7F | Пехлеви с надписью | 32 | 27 | Пехлеви с надписью | |
U + 10B80..U + 10BAF | Псалтырь Пехлеви | 48 | 29 | Псалтырь Пехлеви | |
U + 10C00..U + 10C4F | Древнетюркский | 80 | 73 | Древнетюркский | |
U + 10C80..U + 10CFF | Древневенгерский | 128 | 108 | Древневенгерский | |
1 SMP | U + 10D00..U + 10D3F | Ханифи Рохинджа | 64 | 50 | Ханифи Рохинджа |
U + 10E60..U + 10E7F | Цифровые символы Руми | 32 | 31 | арабский | |
U + 10E80..U + 10EBF | Езиды | 64 | 47 | Езиды | |
U + 10F00..U + 10F2F | Старый согдийский | 48 | 40 | Старый согдийский | |
U + 10F30..U + 10F6F | Согдийский | 64 | 42 | Согдийский | |
U + 10FB0..U + 10FDF | Хорезмист | 48 | 28 | Хорезмист | |
U + 10FE0..U + 10FFF | Elymaic | 32 | 23 | Elymaic | |
U + 11000..U + 1107F | Брахми | 128 | 109 | Брахми | |
U + 11080..U + 110CF | Kaithi | 80 | 67 | Kaithi | |
U + 110D0..U + 110FF | Сора Сомпенг | 48 | 35 | Сора Сомпенг | |
1 SMP | U + 11100..U + 1114F | Чакма | 80 | 71 | Чакма |
U + 11150..U + 1117F | Махаджани | 48 | 39 | Махаджани | |
U + 11180..U + 111DF | Шарада | 96 | 96 | Шарада | |
U + 111E0..U + 111FF | Сингальские архаические числа | 32 | 20 | Сингальский | |
U + 11200..U + 1124F | Хойки | 80 | 62 | Хойки | |
U + 11280..U + 112AF | Мултани | 48 | 38 | Мултани | |
U + 112B0..U + 112FF | Худавади | 80 | 69 | Худавади | |
U + 11300..U + 1137F | Гранта | 128 | 86 | Гранта (85 символов), унаследовано (1 символ) | |
U + 11400..U + 1147F | Newa | 128 | 97 | Newa | |
U + 11480..U + 114DF | Тирхута | 96 | 82 | Тирхута | |
1 SMP | U + 11580..U + 115FF | Сиддхам | 128 | 92 | Сиддхам |
U + 11600..U + 1165F | Моди | 96 | 79 | Моди | |
U + 11660..U + 1167F | Монгольское дополнение | 32 | 13 | Монгольский | |
U + 11680..U + 116CF | Такри | 80 | 67 | Такри | |
U + 11700..U + 1173F | Ахом | 64 | 58 | Ахом | |
U + 11800..U + 1184F | Догра | 80 | 60 | Догра | |
U + 118A0..U + 118FF | Варанг Сити | 96 | 84 | Варанг Сити | |
U + 11900..U + 1195F | Дайвс Акуру | 96 | 72 | Дайвс Акуру | |
U + 119A0..U + 119FF | Нандинагари | 96 | 65 | Нандинагари | |
U + 11A00..U + 11A4F | Площадь Занабазар | 80 | 72 | Площадь Занабазар | |
1 SMP | U + 11A50..U + 11AAF | Соёмбо | 96 | 83 | Соёмбо |
U + 11AC0..U + 11AFF | По Чин Хау | 64 | 57 | По Чин Хау | |
U + 11C00..U + 11C6F | Бхайкуки | 112 | 97 | Бхайкуки | |
U + 11C70..U + 11CBF | Марчен | 80 | 68 | Марчен | |
U + 11D00..U + 11D5F | Масарам Гонди | 96 | 75 | Масарам Гонди | |
U + 11D60..U + 11DAF | Гунджала Гонди | 80 | 63 | Гунджала Гонди | |
U + 11EE0..U + 11EFF | Макасар | 32 | 25 | Макасар | |
U + 11FB0..U + 11FBF | Дополнение Lisu | 16 | 1 | Лису | |
U + 11FC0..U + 11FFF | Тамильское дополнение | 64 | 51 | Тамильский | |
U + 12000..U + 123FF | Клинопись | 1,024 | 922 | Клинопись | |
1 SMP | U + 12400..U + 1247F | Клинописные числа и знаки препинания | 128 | 116 | Клинопись |
U + 12480..U + 1254F | Раннединастическая клинопись | 208 | 196 | Клинопись | |
U + 13000..U + 1342F | Египетские иероглифы | 1,072 | 1,071 | Египетские иероглифы | |
U + 13430..U + 1343F | Органы управления форматом египетских иероглифов | 16 | 9 | Египетские иероглифы | |
U + 14400..U + 1467F | Анатолийские иероглифы | 640 | 583 | Анатолийские иероглифы | |
U + 16800..U + 16A3F | Бамум Дополнение | 576 | 569 | Бамум | |
U + 16A40..U + 16A6F | Mro | 48 | 43 | Mro | |
U + 16AD0..U + 16AFF | Басса Вах | 48 | 36 | Басса Вах | |
U + 16B00..U + 16B8F | Пахау Хмонг | 144 | 127 | Пахау Хмонг | |
U + 16E40..U + 16E9F | Медефайдрин | 96 | 91 | Медефайдрин | |
1 SMP | U + 16F00..U + 16F9F | Мяо | 160 | 149 | Мяо |
U + 16FE0..U + 16FFF | Идеографические символы и знаки препинания | 32 | 7 | Хан (2 символа), Киданьский маленький шрифт (1 символ), Нушу (1 символ), Тангут (1 символ), Общий (2 символа) | |
U + 17000..U + 187FF | Тангутский | 6,144 | 6,136 | Тангутский | |
U + 18800..U + 18AFF | Тангутские компоненты | 768 | 768 | Тангутский | |
U + 18B00..U + 18CFF | Киданьский маленький шрифт | 512 | 470 | Киданьский маленький шрифт | |
U + 18D00..U + 18D8F | Тангутское дополнение | 144 | 9 | Тангутский | |
U + 1B000..U + 1B0FF | Дополнение кана | 256 | 256 | Хирагана (255 символов), Катакана (1 символ) | |
U + 1B100..U + 1B12F | Кана Расширенная-А | 48 | 31 | Хирагана | |
U + 1B130..U + 1B16F | Маленькое расширение Кана | 64 | 7 | Хирагана (3 символа), Катакана (4 символа) | |
U + 1B170..U + 1B2FF | Нушу | 400 | 396 | Нюшу | |
1 SMP | U + 1BC00..U + 1BC9F | Дуплоян | 160 | 143 | Дуплоян |
U + 1BCA0..U + 1BCAF | Элементы управления сокращенным форматом | 16 | 4 | Общий | |
U + 1D000..U + 1D0FF | Византийские музыкальные символы | 256 | 246 | Общий | |
U + 1D100..U + 1D1FF | Музыкальные символы | 256 | 231 | Обычный (209 символов), Унаследованный (22 символа) | |
U + 1D200..U + 1D24F | Древнегреческая музыкальная нотация | 80 | 70 | Греческий | |
U + 1D2E0..U + 1D2FF | Цифры майя | 32 | 20 | Общий | |
У + 1Д300..У + 1Д35Ф | Символы Тай Сюань Цзин | 96 | 87 | Общий | |
U + 1D360..U + 1D37F | Счетные числа на стержнях | 32 | 25 | Общий | |
У + 1D400..U + 1D7FF | Математические буквенно-цифровые символы | 1,024 | 996 | Общий | |
U + 1D800..U + 1DAAF | Знак Саттона | 688 | 672 | Знак | |
1 SMP | U + 1E000..U + 1E02F | Дополнение к глаголице | 48 | 38 | Глаголица |
U + 1E100..U + 1E14F | Nyiakeng Puachue Hmong | 80 | 71 | Nyiakeng Puachue Hmong | |
U + 1E2C0..U + 1E2FF | Wancho | 64 | 59 | Wancho | |
U + 1E800..U + 1E8DF | Менде Кикакуи | 224 | 213 | Менде Кикакуи | |
U + 1E900..U + 1E95F | Адлам | 96 | 88 | Адлам | |
U + 1EC70..U + 1ECBF | Индийские числа сияк | 80 | 68 | Общий | |
U + 1ED00..U + 1ED4F | Османские числа Siyaq | 80 | 61 | Общий | |
U + 1EE00..U + 1EEFF | Арабские математические алфавитные символы | 256 | 143 | арабский | |
U + 1F000..U + 1F02F | Маджонг Плитки | 48 | 44 | Общий | |
U + 1F030..U + 1F09F | Домино Плитка | 112 | 100 | Общий | |
1 SMP | U + 1F0A0..U + 1F0FF | Играя в карты | 96 | 82 | Общий |
U + 1F100..U + 1F1FF | Прилагаемое буквенно-цифровое приложение | 256 | 200 | Общий | |
U + 1F200..U + 1F2FF | Прилагаемое идеографическое приложение | 256 | 64 | Хирагана (1 символ), Обычный (63 символа) | |
U + 1F300..U + 1F5FF | Разные символы и пиктограммы | 768 | 768 | Общий | |
U + 1F600..U + 1F64F | Смайлики | 80 | 80 | Общий | |
U + 1F650..U + 1F67F | Декоративные дингбаты | 48 | 48 | Общий | |
U + 1F680..U + 1F6FF | Транспортные и картографические символы | 128 | 114 | Общий | |
1 SMP | U + 1F700..U + 1F77F | Алхимические символы | 128 | 116 | Общий |
U + 1F780..U + 1F7FF | Расширенные геометрические фигуры | 128 | 101 | Общий | |
U + 1F800..U + 1F8FF | Дополнительные стрелки-C | 256 | 150 | Общий | |
U + 1F900..U + 1F9FF | Дополнительные символы и пиктограммы | 256 | 254 | Общий | |
U + 1FA00..U + 1FA6F | Шахматные символы | 112 | 98 | Общий | |
U + 1FA70..U + 1FAFF | Расширенные символы и пиктограммы-A | 144 | 57 | Общий | |
U + 1FB00..U + 1FBFF | Символы для устаревших вычислений | 256 | 212 | Общий | |
2 SIP | U + 20000..U + 2A6DF | Расширение B унифицированных иероглифов CJK | 42,720 | 42,718 | Хан |
U + 2A700..U + 2B73F | Расширение унифицированных иероглифов CJK C | 4,160 | 4,149 | Хан | |
U + 2B740..U + 2B81F | Расширение унифицированных иероглифов CJK D | 224 | 222 | Хан | |
U + 2B820..U + 2CEAF | Расширение унифицированных иероглифов CJK E | 5,776 | 5,762 | Хан | |
U + 2CEB0..U + 2EBEF | Расширение унифицированных иероглифов CJK F | 7,488 | 7,473 | Хан | |
U + 2F800..U + 2FA1F | Приложение к идеографам совместимости CJK | 544 | 542 | Хан | |
3 СОВЕТ | U + 30000..U + 3134F | Расширение унифицированных иероглифов CJK G | 4,944 | 4,939 | Хан |
14 SSP | U + E0000..U + E007F | Теги | 128 | 97 | Общий |
U + E0100..U + E01EF | Дополнение к селекторам вариаций | 240 | 240 | Унаследовано | |
15 PUA-A | U + F0000..U + FFFFF | Зона дополнительного частного использования-A | 65,536 | 65,534 | Неизвестно |
16 PUA-B | U + 100000..U + 10FFFF | Зона дополнительного частного использования-B | 65,536 | 65,534 | Неизвестно |
|
Удаленные блоки
Политика стабильности Unicode требует, чтобы символ, однажды назначенный, нельзя было перемещать или удалять, хотя это может быть устаревшим. Это относится к Unicode 2.0 и всем последующим версиям.
До этого были удалены следующие бывшие блоки:
Блокировать диапазон | Имя блока | Дальность теперь занята | Заменено блоком | Кодовые точки | Назначенные символы | Скрипты |
---|---|---|---|---|---|---|
U + 1000..U + 105F | тибетский[4] | Мьянма | тибетский | 96 | 71 | тибетский |
U + 3400..U + 3D2D | Хангыль[5] | Расширение унифицированных иероглифов CJK A | Слоги хангыль | 2350 | 2350 | Хангыль |
U + 3D2E..U + 44B7 | Дополнительный хангыль-A[5] | Расширение унифицированных иероглифов CJK A | 1930 | 1930 | Хангыль | |
U + 44B8..U + 4DFF | Дополнительный хангыль-B[5] | Расширение унифицированных иероглифов CJK A | 2376 | 2376 | Хангыль | |
Символы гексаграммы Ицзин |
Рекомендации
- ^ а б c d "Файл данных Unicode Blocks, версия Unicode 13.0". Консорциум Unicode. Получено 2019-04-29.}
- ^ Глоссарий Unicode
- ^ «Основная спецификация Unicode, Глава 4: Свойства символов» (PDF). Получено 2020-03-14.
- ^ «3.8: Блок-за-блок-схемы» (PDF). Стандарт Юникода. Версия 1.0. Консорциум Unicode.
- ^ а б c «Приложение E: Имена блоков» (PDF). Стандарт Юникода. Версия 1.1. Консорциум Unicode.
внешняя ссылка
- Официальный сайт Консорциума Unicode (Английский)