Кодовая страница 936 (Microsoft Windows) - Code page 936 (Microsoft Windows)

Кодовая страница Windows 936 (сокращенно MS936, Окна-936 или (неоднозначно) CP936),[1] кодировка символов Microsoft для упрощенный китайский, один из четырех DBCS за Восточноазиатские языки. Изначально Windows-936 покрывала ГБ 2312 (в своем EUC-CN форма), но он был расширен, чтобы покрыть большую часть ГБК с выпуском Windows 95.

Кодовая страница IBM 936[2] это другая кодировка для упрощенного китайского, хотя Международные компоненты для Unicode не включает кодек IBM-936 и использует кодовую страницу Windows для метки «cp936».[1] Кодовая страница IBM для покрытия GBK: Кодовая страница 1386 (CP1386 или же IBM-1386), который определяется как комбинация одного байта Кодовая страница 1114 и двойной байт Кодовая страница 1385.[3]

Он был заменен кодовая страница 54936 (ГБ 18030 ), но по состоянию на 2014 г. по-прежнему широко использовались. В Командная строка Windows использует CP936 в качестве кодовой страницы по умолчанию для упрощенных китайских установок, хотя часть GB 18030 была сделана обязательной для всех программных продуктов, продаваемых в Китае. В 2002 году имя IANA в Интернете ГБК был зарегистрирован с отображением Windows-936,[4][5] сделать это де-факто Определение GBK в Интернете.

Понятия «Windows-936», «ГБК»,[а] «GB2312» и «EUC-CN» иногда путают в различных программных продуктах. Кодовые страницы MS936 и 1386 не идентичны GBK, потому что кодовая страница кодирует символы, тогда как GBK только[нужна цитата ] определяет кодовые точки. В дополнение Знак евро (€), закодированный как 0x80 как в Windows-936, так и в IBM-1386, не определен в GBK. С другой стороны, 95 символов, определенных в GBK, изначально не были закодированы в Windows-936.

Это частично решено в более поздних версиях Windows, и, как и в Windows 7, все символы GBK не входят в Unicode BMP. Зона частного использования может отображаться с использованием кодовой страницы 936, но кодирование 95 символов все еще не поддерживалось по состоянию на 2014 год.. Однако "CP936" и "GBK" часто используются как синонимы из-за популярности продуктов Microsoft на китайском рынке, когда GBK был тогда опубликован.

Поскольку GBK давно заменил GB 2312, эти два термина также стали практически эквивалентными для многих пользователей, поэтому многие неправильно понимают «Windows-936», «GBK» и «GB 2312» как одно и то же, хотя на самом деле они значительно различаются. Вместо поддержки именно EUC-CN / GB 2312 большинство современных программных продуктов на базе Windows подразумевают частичную поддержку GBK через Windows-936, когда они используют термин «GB 2312» в качестве варианта кодировки символов. Это можно наблюдать в таких продуктах, как Microsoft Internet Explorer и Notepad ++.

Примечания

  1. ^ GBK 1.0

Рекомендации

  1. ^ а б "windows-936-2000 (псевдоним cp936)". Демонстрация ICU - Конвертер Explorer. Международные компоненты для Unicode.
  2. ^ «Идентификаторы кодированного набора символов - CCSID 936». IBM Глобализация. IBM. Архивировано из оригинал на 2014-12-01.
  3. ^ «Идентификаторы кодированного набора символов - CCSID 1386». IBM. Архивировано из оригинал 2014-11-29.
  4. ^ «Наборы символов». Получено 3 октября 2016.
  5. ^ Применение регистрации кодировки IANA для GBK

внешняя ссылка

Windows-936:

IBM-1386: