JIS X 0212 - JIS X 0212

JIS X 0212
Язык (и)Предназначен для использования вместе с JIS X 0208 за Японский поддерживать. Сам по себе не поддерживает никаких языков.
СтандартJIS X 0212: 1990
КлассификацияДополнительная кодировка, ISO 2022, DBCS, Кодирование CJK
РасширяетсяJIS X 0208 при использовании вместе
Форматы кодированияEUC-JP
ISO-2022-JP-1
ПреемникJIS X 0213

JIS X 0212 это Японский промышленный стандарт определение набора кодированных символов для кодирования дополнительных символов для использования в японском языке. Этот стандарт предназначен для дополнения JIS X 0208 (Кодовая страница 952). Он пронумерован 953 или же 5049 как кодовую страницу IBM (см. ниже).

Это один из исходных стандартов Unicode. Унифицированные идеограммы CJK.

История

В 1990 г. Японская ассоциация стандартов (JSA) выпустила дополнительный стандарт набора символов: JIS X 0212-1990 Код дополнительного набора японских графических символов для обмена информацией (情報 交換 用 漢字 符号 - 補助 漢字, Jōhō Kōkan'y Kanji Fugō - Ходзё кандзи). Этот стандарт был предназначен для расширения круга персонажей, доступных в основном JIS X 0208 набор символов и устранить недостатки в охвате этого набора.

Функции

Диаграмма Эйлера сравнение репертуаров JIS X 0208, JIS X 0212, JIS X 0213, Окна-31J, стандартный репертуар Microsoft и Unicode.

Стандарт определяет 6067 знаков, включая:

  • 21 греческий символ с диакритическими знаками
  • 26 восточноевропейских символов с диакритическими знаками (в основном кириллица)
  • 198 буквенных знаков с диакритическими знаками
  • 5,801 кандзи

Кодировки

Следующие кодировки или инкапсуляции используются для включения символов JIS X 0212 в файлах и т. Д.

  • в EUC-JP символы представлены тремя байтами, первый из которых равен 0x8F, а следующие два - в диапазоне от 0xA1 до 0xFE.
  • в ISO 2022 последовательность «ESC $ (D» используется для обозначения символов JIS X 0212.

Отсутствие инкапсуляции символов JIS X 0212 в популярных Shift JIS кодирование возможно, так как Shift JIS не имеет достаточного незанятого кодового пространства для символов.

Реализации

JIS X 0212 называется Кодовая страница 953 от IBM, который включает расширения поставщиков.[1][2][3] Альтернатива CCSID 5049 исключает эти расширения.[4]

Поскольку символы JIS X 0212 не могут быть закодированы в Shift JIS, системе кодирования, которая традиционно доминировала в японской обработке информации, было выполнено несколько практических реализаций набора символов. Как упоминалось выше, он может быть закодирован в EUC-JP, который обычно используется в системах Unix / Linux, и именно здесь произошло большинство реализаций:

  • в начале 1990-х базовые шрифты "BDF" были скомпилированы для использования в Unix X Window System;
  • был скомпилирован файл преобразования IME для системы WNN;
  • то kterm приложение окна консоли было расширено для его поддержки;
  • то Emacs и jstevie редакторы были расширены для его поддержки.

Многие браузеры WWW, такие как Netscape / Mozilla /Fire Fox family, Opera и т. д. и сопутствующие приложения, такие как Mozilla Thunderbird поддерживает отображение символов JIS X 0212 в кодировке EUC-JP, однако Internet Explorer не поддерживает символы JIS X 0212. Современные пакеты эмуляции терминала, такие как Терминал GNOME также поддерживают символы JIS X 0212.

Приложения, которые поддерживают JIS X 0212 в кодировке EUC, включают:

  • то xjdic программа-словарь для Unix / Linux;
  • то WWWJDIC Японский сервер словарей (однако как Internet Explorer не поддерживает расширения JIS X 0212 в EUC, этот сервер отправляет растровую графику для этих символов при установке в режиме EUC-JP.)

JIS X 0212 и Unicode

Кандзи в JIS X 0212 были взяты в качестве одного из источников для Ханьское объединение что привело к единому набору CJK символы в начальных ISO 10646 /Unicode стандарт. Были включены все 5801 кандзи.

Будущее

Помимо упомянутых выше приложений, стандарт JIS X 0212 фактически мертв. 2743 кандзи из него были включены в более поздние JIS X 0213 стандарт. В более долгосрочной перспективе его вклад, вероятно, будет заключаться в 5,801 кандзи, которые были включены в Unicode.

Смотрите также

Рекомендации

  • JIS X 0212-1990 情報 交換 用 漢字 符号 - 補助 漢字, 日本 規格 協会, 東京 (1990 年 10 1 制定).(документ японских стандартов)
  • Понимание обработки информации в Японии, Кен Лунде, O'Reilly & Assoc. 1993 г.
  • Обработка информации CJKV, Кен Лунде, O'Reilly & Assoc. 1999, 2008.
  1. ^ «Кодовая страница 953 информационного документа». Архивировано из оригинал на 2016-03-17.
  2. ^ «Информационный документ CCSID 953». Архивировано из оригинал 28 марта 2016 г.
  3. ^ Кодовая страница CPGID 00953 (pdf) (PDF), IBM
  4. ^ «Информационный документ CCSID 5049». Архивировано из оригинал on 2016-03-27.

внешняя ссылка