Набор дополнительных символов Гонконга - Hong Kong Supplementary Character Set
В Набор дополнительных символов Гонконга (Китайский : 香港 增補 字符 集; обычно сокращенно HKSCS) представляет собой набор Китайские символы - всего 4702 в первоначальном выпуске - использовалось в Кантонский, а также при написании названия некоторых мест в Гонконге (будь то в письменный кантонский диалект или стандартный письменный китайский фразы).[1] Он развился из предыдущего Правительственный набор китайских символов (政府 通用 字庫) или GCCS. GCCS - это набор дополнительных Китайские символы кодируется в определяемых пользователем областях Big5 набор символов. Первоначально он использовался в Правительство Гонконга и позже используется публикой. Позже он превратился в Гонконгский дополнительный набор символов, когда символы из набора были отправлены в ISO-10646 для кодирования.
История развития
MIME / IANA | Big5-HKSCS |
---|---|
Псевдоним (а) | big5hk, csBig5HKSCS |
Язык (и) | Традиционный китайский, Кантонский |
Классификация | 8 бит CJK DBCS |
Расширяется | Big5 ETen |
Из-за присущих различий между стандартный письменный китайский и письменный кантонский, правительство Гонконга признало необходимость в стандартизированном наборе проприетарный символы, которые позволили бы упростить электронную коммуникацию; в то время Big5 Схема кодирования китайского языка не содержала подавляющего большинства этих символов (некоторые были ошибочно указаны в перекрестном списке с похожими символами).
В Правительственный набор китайских символов (政府 通用 字庫) или GCCS таким образом был разработан правительством. Набор символов состоит из китайских иероглифов, обычно используемых в Гонконге. Некоторые персонажи Кантонский -специфичны, а некоторые представляют собой альтернативные формы символов. Набор не очень хорошо организован, и персонажи не изучены внимательно.
Впоследствии был разработан HKSCS-1999 (спецификация HKSCS 1999). После его принятия новые версии были выпущены в 2001 году (добавлено 116 новых символов) и в 2004 году (добавлено 123 новых символа), всего 4941 символ. 106 символов GCCS были удалены из HKSCS-1999 в результате унификации, а их кодовые точки Big5 зарезервированы для совместимости.[2][3] Устаревшие "неподдающиеся проверке" символы GCCS находятся в Источники UTC (UTC-00877 – UTC-00898),[4] откуда они получены от Adobe-CNS1-1,[5] ан Adobe-CNS1 Дополнение реализовано для поддержки GCCS.[6]
HKSCS закодирован в Big5 (Big5-HKSCS,[7] big5hk[8]) и ISO 10646 (Unicode ). Начиная с HKSCS-2004, все символы, ранее использовавшиеся в разделе Unicode Private Use Area[а] переназначены, и многие из них переназначены в блок расширения B или дополнительный блок совместимости идеографической плоскости.[9] Однако для сохранения совместимости с программами, генерирующими кодовые точки PUA, выделенные кодовые точки зарезервированы, и никакие новые символы не будут отображаться в PUA.
История версий
HKSCS прошел несколько итераций.[10]
Версия | Всего персонажей | Дата публикации |
---|---|---|
GCCS | 3,049 | 1995 |
HKSCS-1999 | 4,702 | 09/1999 |
HKSCS-2001 | 4,818 | 12/2001 |
HKSCS-2004 | 4,941 | 05/2005 |
HKSCS-2008 | 5,009 | 12/2009 |
HKSCS-2016 | 5,033 | 05/2017 |
Последним выпуском HKSCS, который закодировал все свои символы в Big5, был HKSCS-2008, в то время как символы, добавленные в HKSCS-2016, отображаются только в Unicode (как Единые иероглифы CJK горизонтальное расширение глифа там, где это необходимо).[11]
Дополнительный набор символов Макао
Как и в случае с Гонконгом, есть также персонажи, которые нужны Макао, но не включены ни в Big5, ни в HKSCS, следовательно, Дополнительный набор символов Макао был разработан на основе HKSCS с дополнительными символами, отображаемыми в Unicode. Первая партия из 121 символа MSCS была отправлена для добавления или горизонтального расширения в Unicode (в зависимости от ситуации) в 2009 году.[12] а первая финальная версия MSCS была создана в 2020 году.[11]
Совместимость
Операционные системы
Майкрософт Виндоус
В Майкрософт Виндоус 98, NT 4.0, 2000, XP, поддержку HKSCS можно включить с помощью патча Microsoft. В реализации Microsoft приложение, использующее кодовая страница 950 автоматически использует скрытый кодовая страница 951 стол для Big5 кодирование расширений HKSCS. Таблица поддерживает все кодовые точки в HKSCS-2001, за исключением кодовых точек совместимости, указанных в стандарте.[13] Кроме того, шрифт MingLiU изменен с помощью патча Microsoft. Известно, что этот патч создает конфликты в таких приложениях, как Майкрософт офис, или любое приложение, использующее шрифты, поддерживающие упрощенные китайские иероглифы (например.: Simsun ). Если целевая среда содержит настраиваемый шрифт, сопоставленный кодовым точкам, затронутым патчем Microsoft, пользовательские шрифты могут отменить патч Microsoft. Кроме того, патч нарушает работу редактора EUDC, поставляемого с уязвимыми версиями Windows.[14]
Начиная с Windows Vista, символы HKSCS-2004 поддерживаются только как Unicode 4.1 или новее.[15] Всем персонажам присваиваются стандартные, не-PUA кодовые точки. Символы отображаются с MingLiU шрифт, и эти символы можно вводить с клавиатуры. Патч, обеспечивающий Big5 кодирование HKSCS не поддерживается в Windows Vista и более поздних версиях. Утилита, предоставляемая Microsoft, доступна для преобразования символов в кодировке HKSCS и Unicode PUA в версию Unicode 4.1.[16]
В 2010 году Microsoft опубликовала патч HKSCS-2004 для Windows XP и Windows Server 2003.[17] Он заменяет версию MingLiu, PMingLiu и MingLiu_HKSCS для Windows XP (если был применен патч HKSCS-2001) версией MingLiu, PMingLiu и MingLiu_HKSCS для Windows 7. Кроме того, в целевую систему будут добавлены шрифты MingLiU-ExtB, MingLiU_HKSCS-ExtB и PMingLiU-ExtB. Однако IME не обновляется, как это было в случае патча HKSCS-2001, а шрифты взяты из предварительной версии Windows 7.
Для более ранних версий ОС поддержка HKSCS требует использования патча Microsoft или утилит Digital 21 правительства Гонконга.
IBM
IBM присваивает форму Big5 HKSCS-2001 как кодовая страница 5471.[18][19]
Linux
Добавлена поддержка HKSCS в glibc в 2000 году, но с тех пор не обновлялся. Поддержка HKSCS-2004 обрабатывается как Unicode 4.1 и выше.
Для freedesktop.org настроить, AR PL ShanHeiSun Uni шрифт полностью поддерживает HKSCS-2004 с версии 0.1-0.dot.1, последняя версия HKSCS-2004 поддерживается в версии 0.1.20060903-1.
Современные настольные дистрибутивы (например, Ubuntu) включают Arphic Technology HKSCS-совместимые шрифты UKai и UMing из коробки, когда во время установки выбрана поддержка традиционного китайского языка. Их также можно будет установить вручную позже.
Mac OS
Mac OS X 10.0–10.2 поддерживает HKSCS-1999. 10.3–10.4 поддерживает HKSCS-2001. Некоторые буквы, добавленные в HKSCS-2004, поддерживаются через Unicode PUA в OS X 10.4. Начиная с OS X 10.5, все символы HKSCS-2004 поддерживаются с помощью стандартных кодовых точек Unicode 4.1.
Приложения и Интернет
Mozilla 1.5 и выше поддерживает HKSCS, с поддержкой HKSCS-2004, добавленной в базу кода Gecko 1.8.1.[20] В отличие от вышеупомянутого патча, Mozilla использует собственную таблицу кодовых страниц. Однако исправление для ошибки 343129 не поддерживает символы, сопоставленные с кодовыми точками выше базовой многоязычной плоскости.[21]
QT Приложения на основе 3.x (например: KDE ) поддерживают только символы, сопоставленные с кодовыми точками FFFF или ниже. В QT4 символы вне BMP поддерживаются через суррогаты. Текстовый кодек Big5-HKSCS поддерживает HKSCS-1999 еще в Qt-2.3.x, но было слишком поздно в графике разработки Qt, чтобы быть официально включенным в серию Qt-2.3.x, поэтому он был официально поддержан в Qt-3.0.1 . Поддержка HKSCS-2001 была добавлена в Qt-3.0.5.[22]
ГНОМ поддерживает символы HKSCS в диапазонах Unicode, кроме тех, которые сопоставлены с блоком совместимости Basic Multilingual Plane. Патчи для поддержки персонажей, отображаемых на вышеупомянутую Basic Multilingual Plane, были введены в Pango 1.1.[23]
В WHATWG Стандарт кодирования (используется HTML5 ) включает HKSCS в свое определение Big5 (используется даже с простой меткой Big5). Однако только его декодер использует все расширения HKSCS, в то время как его кодировщик явно исключает те, у которых ведущие байты ниже 0xA1 (таким образом исключая большинство расширений HKSCS, но включая, например, те, которые унаследованы от Big5 ETEN ).[24] Новые браузеры следуют этому стандарту, в том числе Fire Fox.
Смотрите также
Заметки
использованная литература
- ^ Часто задаваемые вопросы об онлайн-сервисах GovHK - другие технические вопросы и устранение неполадок
- ^ "Big5CMP.txt". Архивировано из оригинал 13 сентября 2016 г. Найдено на Таблица сопоставления - HKSCS-2008
- ^ «Приложение IV к HKSCS-2004. Точки совместимости для GCCS» (PDF). Архивировано из оригинал (PDF) 30 сентября 2016 г.. Получено 29 сентября 2016.
- ^ «Группа: Big5-GCCS 外 字». Получено 30 сентября 2016.
- ^ "Символы U-источника" (PDF). Получено 30 сентября 2016.
- ^ «Коллекция персонажей Adobe-CNS1-6» (PDF). Получено 30 сентября 2016.
- ^ «Наборы символов». IANA.
- ^ http://infocenter.sybase.com/help/topic/com.sybase.infocenter.dc34789.1550/html/ocsinunx/CIHEBHFB.htm
- ^ "Big5-HKSCS: 2004".
- ^ OGCIO - Разработка HKSCS
- ^ а б Правительство Специального административного района Макао (11 июня 2020 г.). «Подача вертикального расширения Макао (символы UNC), горизонтального расширения и регистрации IVSes для MSCS» (PDF). ISO / IEC JTC 1 / SC 2 / РГ 2 IRGN 2430.
- ^ Рабочая группа по компьютерному кодированию китайских иероглифов (12 июня 2009 г.). «Представление персонажей из набора символов информационных систем Макао» (PDF). ISO / IEC JTC 1 / SC 2 / РГ 2 IRGN 1580. Архивировано с оригинал (PDF) 4 января 2015 г.
- ^ Стил, Шон. "CP 951 & HKSCS". Я не клингон. Блог разработчиков MS. Получено 13 сентября 2016.
- ^ 通 資訊 網: 小心! 有人 悄悄 換掉 了 你 的 Windows 系統 字型
- ^ Microsoft: дополнительный набор символов для Гонконга - поддержка платформы Windows
- ^ Процедуры преобразования кода символов Microsoft для HKSCS-2004
- ^ Пакет шрифтов Windows XP для ISO 10646: 2003 + поправка 1 Поддержка традиционного китайского
- ^ «Идентификаторы кодированного набора символов - CCSID 5471». IBM Глобализация. IBM. Архивировано из оригинал 29 ноября 2014 г.
- ^ Международные компоненты для Unicode (ICU), ibm-5471_P100-2006.ucm, 9 мая 2007 г.
- ^ Mozilla.org: ошибка 343129 - Big5-HKSCS 2004 <==> Обновление таблицы Unicode
- ^ Ошибка 162431 - добавление поддержки Unicode, отличного от BMP (уровень 1 и выше. Суррогат), в кодировщик / декодер кодировки.
- ^ "Qt 4.7: Кодек текста Big5-HKSCS". Архивировано из оригинал 4 марта 2016 г.. Получено 10 ноября 2011.
- ^ Ошибка 101081 - символы не-BMP (от плоскости 1 до плоскости 16) не поддерживаются.
- ^ ван Кестерен, Энн. «Стандарт кодирования». WHATWG.
внешние ссылки
- Сайт правительства Гонконга на HKSCS Загружаемые документы и шрифт HKSCS
- Поддержка Microsoft HKSCS для платформы Windows
- 香港 參考 宋體 Страница загрузки Dynalab (華 康 科技 有限公司) шрифт HKSCS.
- Графическое представление Big5-HKSCS в проводнике конвертеров ICU
- Набор символов, который работает в Mac OS X
- UMing / UKai - бесплатный шрифт с открытым исходным кодом, поддерживающий HKSCS.
- Проект шрифтов с открытым исходным кодом для Гонконга