ISO-IR-111 - ISO-IR-111

КОИ8-Э (1986)
Псевдоним (а)ISO-IR-111
Язык (и)русский, Белорусский, македонский, сербский, украинец (частичный)
СтандартECMA-113: 1986
КлассификацияРасширенный ASCII, КОИ
РасширяетсяКОИ8-Б
ПреемникECMA-113: 1988 (ISO-8859-5 )
Другая связанная кодировка (и)КОИ8-Ф

ISO-IR-111[1] или же КОИ8-Э[2] представляет собой 8-битный набор символов. Это многонациональное расширение КОИ-8 за Белорусский, македонский, сербский, и украинец (Кроме Ґ ґ который добавлен к КОИ8-Ф ). Название «ISO-IR-111» относится к его регистрационному номеру в ISO-IR реестр и обозначает его как набор, который можно использовать с ISO / IEC 2022.

Это было определено первой (1986) редакцией ECMA-113,[3] какой Ecma International стандарт, соответствующий ИСО / МЭК 8859-5, и как таковой также соответствует черновой версии ISO-8859-5 1987 года.[4] Опубликованные издания ИСО / МЭК 8859-5 вместо этого соответствуют последующим редакциям ECMA-113, в которых определяется другая кодировка.[5]

Путаница в именах

ISO-IR-111, редакция ECMA-113 1985 г. (также называемая «ECMA-Cyrillic» или «KOI8-E»), была основана на редакции ГОСТ 19768 1974 г. (т. Е. КОИ-8 ). В 1987 году ECMA-113 был модернизирован.[5] Эти новые редакции ECMA-113 эквивалентны ISO-8859-5,[5][6] и не следуйте макету KOI. Эта путаница привела к распространенному заблуждению о том, что ISO-8859-5 был определен в ГОСТ 19768-74 или основан на нем.[6]

Возможно, как еще одно следствие этого, RFC  1345 ошибочно перечисляет другую кодовую страницу под названиями «ISO-IR-111» и «ECMA-Cyrillic», напоминающую ISO-8859-5 с переупорядоченными строками и частично совместимую с Окна-1251.[7][6] Из-за опасений, что существующие реализации могут использовать определение RFC 1345 для этих двух меток, было предложено, чтобы IANA дополнительно признать КОИ8-Э как этикетка для содержимого ECMA-113: 1985,[7] и в настоящее время IANA перечисляет этот ярлык как псевдоним.[2]

Набор символов

В следующей таблице показана кодировка ISO-IR-111. Каждый символ показан с его эквивалентом Unicode кодовая точка.

ISO-IR-111
_0_1_2_3_4_5_6_7_8_9_A_B_C_D_E_F
0_
0
1_
16
2_
32
SP
0020
!
0021
"
0022
#
0023
$
0024
%
0025
&
0026
'
0027
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
3_
48
0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
4_
64
@
0040
А
0041
B
0042
C
0043
D
0044
E
0045
F
0046
грамм
0047
ЧАС
0048
я
0049
J
004A
K
004B
L
004C
M
004D
N
004E
О
004F
5_
80
п
0050
Q
0051
р
0052
S
0053
Т
0054
U
0055
V
0056
W
0057
Икс
0058
Y
0059
Z
005A
[
005B
\
005C
]
005D
^
005E
_
005F
6_
96
`
0060
а
0061
б
0062
c
0063
d
0064
е
0065
ж
0066
грамм
0067
час
0068
я
0069
j
006A
k
006B
л
006C
м
006D
п
006E
о
006F
7_
112
п
0070
q
0071
р
0072
s
0073
т
0074
ты
0075
v
0076
ш
0077
Икс
0078
у
0079
z
007A
{
007B
|
007C
}
007D
~
007E
8_
128
9_
144
A_
160
NBSP
00A0
ђ
0452
ѓ
0453
ё
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
љ
0459
њ
045A
ћ
045B
ќ
045C
ЗАСТЕНЧИВЫЙ
00AD
ў
045E
џ
045F
B_
176

2116
Ђ
0402
Ѓ
0403
Ё
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408
Љ
0409
Њ
040A
Ћ
040B
Ќ
040C
¤
00A4
Ў
040E
Џ
040F
C_
192
ю
044E
а
0430
б
0431
ц
0446
д
0434
е
0435
ф
0444
г
0433
х
0445
и
0438
й
0439
к
043A
л
043B
м
043C
н
043D
о
043E
D_
208
п
043F
я
044F
р
0440
с
0441
т
0442
у
0443
ж
0436
в
0432
ь
044C
ы
044B
з
0437
ш
0448
э
044D
щ
0449
ч
0447
ъ
044A
E_
224
Ю
042E
А
0410
Б
0411
Ц
0426
Д
0414
Е
0415
Ф
0424
Г
0413
Х
0425
И
0418
Й
0419
К
041A
Л
041B
М
041C
Н
041D
О
041E
F_
240
П
041F
Я
042F
Р
0420
С
0421
Т
0422
У
0423
Ж
0416
В
0412
Ь
042C
Ы
042B
З
0417
Ш
0428
Э
042D
Щ
0429
Ч
0427
Ъ
042A

  Письмо  Число  Пунктуация  Символ  Другой  Неопределенный

Расширенные и модифицированные версии

Модифицированная версия под названием KOI8 Unified или КОИ8-Ф использовался в программном обеспечении, произведенном Fingertip Software, добавляя Ґ в его КОИ8-У место (замена мягкий дефис и вытесняя универсальный знак валюты ) и добавление графических символов в Коды управления C1 области, в основном из КОИ8-Р и Окна-1251.[4][6][8][9]

Неправильная кодовая страница RFC 1345

RFC 1345 "ECMA-Cyrillic"
Язык (и)русский, Белорусский, македонский, сербский
СтандартRFC  1345
КлассификацияРасширенный ASCII
Преобразует / кодируетISO-IR-111
Другая связанная кодировка (и)ISO-8859-5, Окна-1251

RFC  1345 ошибочно перечисляет другую кодовую страницу под именем ISO-IR-111, кодирующую те же символы кириллицы, но с другой раскладкой. Он напоминает смесь Окна-1251 и ISO-8859-5.[7] В частности, строка A_ соответствует ISO-8859-5, строки C_ - F_ соответствуют Windows-1251.[6] (эквивалент строк от B_ до E_ стандарта ISO-8859-5), а строка B_ почти соответствует строке F_ стандарта ISO-8859-5, за исключением § заменяется ¤.

Некоторые коды напоминают ISO-IR-111 с перевернутым регистром букв, что, возможно, внесло путаницу. Большинство из них различаются и показаны ниже с жирной рамкой.

Кодовая страница ошибочно помечена как "ISO-IR-111" или "ECMA-Cyrillic" в RFC  1345
_0_1_2_3_4_5_6_7_8_9_A_B_C_D_E_F
8_
128
9_
144
A_
160
NBSP
00A0
Ё
0401
Ђ
0402
Ѓ
0403
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408
Љ
0409
Њ
040A
Ћ
040B
Ќ
040C
ЗАСТЕНЧИВЫЙ
00AD
Ў
040E
Џ
040F
B_
176

2116
ё
0451
ђ
0452
ѓ
0453
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
љ
0459
њ
045A
ћ
045B
ќ
045C
¤
00A4
ў
045E
џ
045F
C_
192
А
0410
Б
0411
В
0412
Г
0413
Д
0414
Е
0415
Ж
0416
З
0417
И
0418
Й
0419
К
041A
Л
041B
М
041C
Н
041D
О
041E
П
041F
D_
208
Р
0420
С
0421
Т
0422
У
0423
Ф
0424
Х
0425
Ц
0426
Ч
0427
Ш
0428
Щ
0429
Ъ
042A
Ы
042B
Ь
042C
Э
042D
Ю
042E
Я
042F
E_
224
а
0430
б
0431
в
0432
г
0433
д
0434
е
0435
ж
0436
з
0437
и
0438
й
0439
к
043A
л
043B
м
043C
н
043D
о
043E
п
043F
F_
240
р
0440
с
0441
т
0442
у
0443
ф
0444
х
0445
ц
0446
ч
0447
ш
0448
щ
0449
ъ
044A
ы
044B
ь
044C
э
044D
ю
044E
я
044F

  Письмо  Число  Пунктуация  Символ  Другой  Неопределенный  Отклонение от ISO-IR-111 (исключая отклонения только в случае)

Смотрите также

Рекомендации

  1. ^ ECMA (1 августа 1985 г.). Правая часть кириллического алфавита (PDF). ITSCJ /IPSJ. ISO-IR-111.
  2. ^ а б «Наборы символов». IANA.
  3. ^ ECMA-113. 8-битные однобайтовые наборы графических символов - латинский / кириллица (1-е изд., Июнь 1986 г.)
  4. ^ а б Чиборра, Роман (1998-11-30) [1998-05-25]. "Суп с кириллической кодировкой". Архивировано из оригинал на 2016-12-03. Получено 2016-12-03.
  5. ^ а б c ECMA-113. 8-битные однобайтовые наборы графических символов - латинский / кириллица (2-е изд., Июнь 1988 г.)
  6. ^ а б c d е Нечаев, Валентин (2013) [2001]. «Обзор вселенной 8-битных кодировок кириллицы». В архиве из оригинала от 05.12.2016. Получено 2016-12-05.
  7. ^ а б c Соколов, Михаил (2005-04-05). "ECMA-кириллический псевдоним iso-ir-111 sore". IETF Список рассылки кодировок.
  8. ^ «КОИ8 Единый». Программное обеспечение для пальцев. Архивировано из оригинал на 1998-01-09. Получено 2020-02-11.
  9. ^ Лейшер, Марк (2008) [1998-03-05]. "Таблица отображения унифицированной кириллицы в Unicode 2.1 KOI8". Отделение математических наук, Государственный университет Нью-Мексико. Получено 2020-05-02.