Z-вариант - Z-variant
В Unicode, два глифы как говорят Z-варианты (часто пишется z Варианты), если они имеют одинаковую этимологию, но имеют немного разный внешний вид и разные Unicode кодовые точки. Например, символы Unicode U + 8AAA 說 и U + 8AAC 説 являются Z-вариантами. Понятие Z-дисперсии применимо только к "CJKV скрипты "- китайский, японский, корейский и вьетнамский - и является подтемой Ханьское объединение.
Отличия по оси Z
Философия Unicode распределения кодовых точек для языков CJK организована по трем принципам:топоры. «Ось X представляет различия в семантике; например, латинская заглавная A (U + 0041 A) и греческая заглавная альфа (U + 0391 Α) представлены двумя разными кодовыми точками в Unicode и могут быть названы» X-варианты »(хотя этот термин не является распространенным). Ось Y отображает существенные различия во внешнем виде, но не в семантике; например, традиционный китайский иероглиф мао «кошка» (U + 8C93 貓) и упрощенный китайский иероглиф (U + 732B 猫) являются Y-вариантами.[1]
Ось Z отображает незначительные типографские различия. Например, китайские иероглифы (U + 838A 莊) и (U + 8358 荘) являются Z-вариантами, как и (U + 8AAA 說) и (U + 8AAC 説). Глоссарий на Unicode.org определяет «Z-вариант» как «Две унифицированные идеограммы CJK с идентичной семантикой и унифицированными формами»,[1] где «унифицируемый» понимается в смысле объединения Хань.
Таким образом, если бы объединение Хань было совершенно успешным, Z-вариантов не существовало бы. Они существуют в Юникоде, потому что считалось полезным иметь возможность передавать документы в оба конца между Юникодом и другими кодировками CJK, такими как Big5 и CCCII. Например, символ 莊 имеет кодировку CCCII 21552D, тогда как его Z-вариант 荘 имеет кодировку CCCII 2D552D. Таким образом, этим двум вариантам были присвоены разные кодовые точки Unicode, так что преобразование документа CCCII в Unicode и обратно было бы без потерь операция.
Путаница
Есть некоторая путаница с точным определением «Z-вариант». Например, в Интернет-проект (из RFC 3743 ) от 2002 г.,[2] можно найти bù «нет» (U + 4E0D 不 ) и (U + F967 不 ) описывается как «варианты шрифта», причем термин «Z-вариант» явно зарезервирован для межъязыковых пар, таких как Мандаринский китайский tù «кролик» (U + 5154 兔 ) и японцы к «кролик» (U + 514E 兎 ). Тем не менее Консорциум Unicode с Unihan база данных [3] рассматривает обе пары как Z-варианты.
Смотрите также
Рекомендации
- ^ а б «Глоссарий». www.unicode.org.
- ^ Хуанг, К .; Ko, Y .; Кониши, К .; Цянь, Х. «Рекомендации совместной инженерной группы (JET) по регистрации и администрированию интернационализированных доменных имен (IDN) для китайского, японского и корейского языков». tools.ietf.org.
- ^ "Поиск в базе данных Unihan". www.unicode.org.