Многонациональный набор символов - Multinational Character Set

Многонациональный набор символов (MCS)
MIME / IANADEC-MCS
Псевдоним (а)IBM1100, CP1100, WE8DEC, csDECMCS, декабрь
Язык (и)английский, различные другие
РасширяетсяUS-ASCII
ПреемникISO 8859-1, LICS, BraSCII, Кодирование пробки

В Многонациональный набор символов (DMCS или же MCS) это кодировка символов создан в 1983 г. Корпорация цифрового оборудования (DEC) для использования в популярных VT220 Терминал. Это было 8-битное расширение ASCII добавлены символы с диакритическими знаками, символы валюты, и другие глифы символов, отсутствующие в 7-битном ASCII. Это только один из кодовые страницы реализовано для VT220 Набор национальных заменяющих символов (NRCS).[1][2] MCS зарегистрирован как IBM кодовая страница /CCSID 1100 (Многонациональная эмуляция) с 1992 года.[3][4] В зависимости от связанной сортировки Oracle называет это WE8DEC, N8DEC, DK8DEC, S8DEC, или же SF8DEC.[5][6]

Такой "расширенный ASCII "наборы были обычными (Национальный набор заменяющих символов предоставлял наборы для более чем десятка европейских языков), но MCS является предком ECMA-94 в 1985 году[7] и ISO 8859-1 в 1987 г.[8]

Таблица кодов MCS с ECMA-94, ISO 8859-1 и первыми 256 кодовыми точками Unicode сходства гораздо больше, чем различий. Помимо неиспользуемых кодовых точек, отличия от ISO 8859-1 заключаются в следующем:

Кодовая точка MCSОтображение UnicodeХарактер
0xA8U + 00A4¤
0xD7U + 0152Œ
0xDDU + 0178Ÿ
0xF7U + 0153œ
0xFDU + 00FFÿ

Набор символов

Отличия от ISO-8859-1 показаны более темным оттенком поверх цветов легенды.

Многонациональный набор символов DEC[3][9][10][11][12][13][14]
_0_1_2_3_4_5_6_7_8_9_A_B_C_D_E_F
0_
0
NUL
0000
SOH
0001
STX
0002
ETX
0003
EOT
0004
ENQ
0005
ACK
0006
BEL
0007
BS
0008
HT
0009
LF
000A
VT
000B
FF
000C
CR
000D
ТАК
000E
SI
000F
1_
16
DLE
0010
DC1
0011
DC2
0012
DC3
0013
DC4
0014
НАК
0015
SYN
0016
ETB
0017
МОЖЕТ
0018
ЭМ
0019
SUB
001A
ESC
001B
FS
001C
GS
001D
RS
001E
нас
001F
2_
32
SP
0020
!
0021
"
0022
#
0023
$
0024
%
0025
&
0026
'
0027
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
3_
48
0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
4_
64
@
0040
А
0041
B
0042
C
0043
D
0044
E
0045
F
0046
грамм
0047
ЧАС
0048
я
0049
J
004A
K
004B
L
004C
M
004D
N
004E
О
004F
5_
80
п
0050
Q
0051
р
0052
S
0053
Т
0054
U
0055
V
0056
W
0057
Икс
0058
Y
0059
Z
005A
[
005B
\
005C
]
005D
^
005E
_
005F
6_
96
`
0060
а
0061
б
0062
c
0063
d
0064
е
0065
ж
0066
грамм
0067
час
0068
я
0069
j
006A
k
006B
л
006C
м
006D
п
006E
о
006F
7_
112
п
0070
q
0071
р
0072
s
0073
т
0074
ты
0075
v
0076
ш
0077
Икс
0078
у
0079
z
007A
{
007B
|
007C
}
007D
~
007E
DEL
007F
8_
128
IND
0084
NEL
0085
SSA
0086
ЕКА
0087
HTS
0088
HTJ
0089
СУДС
008A
PLD
008B
PLU
008C
RI
008D
SS2
008E
SS3
008F
9_
144
DCS
0090
PU1
0091
PU2
0092
СТС
0093
CCH
0094
МВт
0095
СПА
0096
EPA
0097
CSI
009B
ST
009C
OSC
009D
ВЕЧЕРА
009E
APC
009F
A_
160
¡
00A1
¢
00A2
£
00A3
¥
00A5
§
00A7
¤
00A4
©
00A9
ª
00AA
«
00AB
B_
176
°
00B0
±
00B1
²
00B2
³
00B3
µ
00B5

00B6
·
00B7
¹
00B9
º
00BA
»
00BB
¼
00BC
½
00BD
¿
00BF
C_
192
А
00C0
Á
00C1
Â
00C2
Ã
00C3
Ä
00C4
Å
00C5
Æ
00C6
Ç
00C7
È
00C8
É
00C9
Ê
00CA
Ë
00CB
Я
00CC
Я
00CD
Я
00CE
Я
00CF
D_
208
Ñ
00D1
Ò
00D2
Ó
00D3
Ô
00D4
Õ
00D5
Ö
00D6
Œ
0152
Ø
00D8
Ù
00D9
Ú
00DA
Û
00 дБ
Ü
00DC
Ÿ
0178
SS
00DF
E_
224
à
00E0
á
00E1
â
00E2
ã
00E3
ä
00E4
å
00E5
æ
00E6
ç
00E7
è
00E8
é
00E9
ê
00EA
ë
00EB
я
00EC
я
00ED
я
00EE
я
00EF
F_
240
ñ
00F1
ò
00F2
ó
00F3
ô
00F4
х
00F5
ö
00F6
œ
0153
ø
00F8
ù
00F9
ú
00FA
û
00FB
ü
00FC
ÿ
00FF

  Письмо  Число  Пунктуация  Символ  Другой  Неопределенный

Смотрите также

Рекомендации

  1. ^ "Справочное руководство программиста VT220" (2-е изд.). Корпорация цифрового оборудования (DEC). 1984 [1983].
  2. ^ «Эмулятор TinyTERM - Национальный набор заменяемых символов (NRCS)». Century Software. В архиве из оригинала на 2016-12-01. Получено 2016-12-01. [sic]
  3. ^ а б "Информация о кодовой странице SBCS - CPGID: 01100 / Название: Многонациональная эмуляция". Программное обеспечение IBM: Глобализация: Наборы кодированных символов и связанные ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц. 1. IBM. 1992-10-01. В архиве из оригинала от 03.12.2016. Получено 2016-12-02. [1] [2] [3]
  4. ^ «Информационный документ CCSID 1100». Архивировано из оригинал на 2014-12-01.
  5. ^ Бэрд, Кэти; Чиба, Дэн; Чу, Уинсон; Фан, Джессика; Хо, Клэр; Закон, Саймон; Ли, Джефф; Линсли, Питер; Мацуда, Кени; Осрофт, Тамзин; Такеда, Шиге; Танака, Линус; Тозава, Макото; Трюте, Барри; Цудзимото, Маюми; У, Инь; Яу, Майкл; Ю, Тим; Ван, Чао; Вонг, Саймон; Чжан, Вейран; Чжэн, Лэй; Чжу, Ян; Мур, Валари (2002) [1996]. «Приложение A: Данные локали». Руководство по поддержке глобализации баз данных Oracle9i (PDF) (Выпуск 2 (9.2) изд.). Корпорация Oracle. Оракул A96529-01. В архиве (PDF) из оригинала на 2017-02-14. Получено 2017-02-14.
  6. ^ "Описание набора символов Oracle для 9.2". Дневные химические информационные системы. 2017 г. В архиве из оригинала от 17.06.2016. Получено 2017-02-14.
  7. ^ Стандартный ECMA-94: 8-битный однобайтовый набор графических символов (PDF) (1-е изд.). Европейская ассоциация производителей компьютеров (ECMA). Март 1985 [1984-12-14]. В архиве (PDF) из оригинала от 02.12.2016. Получено 2016-12-01. С 1982 года острая необходимость в 8-битном однобайтовом кодированном наборе символов была признана в ECMA, а также в ANSI / X3L2, и эти две группы обменялись многочисленными рабочими документами. В феврале 1984 года ECMA TC1 представил ISO / TC97 / SC2 предложение о таком наборе кодированных символов. На своем заседании в апреле 1984 года SC решил подать в TC97 предложение о новом элементе работы по этой теме. Технические обсуждения во время и после этой встречи привели TC1 к принятию схемы кодирования, предложенной X3L2. Часть 1 проекта международного стандарта DTS 8859 основана на этом совместном предложении ANSI / ECMA .... Принят в качестве стандарта ECMA Генеральной ассамблеей 13–14 декабря 1984 г.
  8. ^ Чиборра, Роман (1998). «ISO 8859-1 и MCS». Суп с алфавитом ISO 8859. В архиве из оригинала на 2016-12-01. Получено 2016-12-01. [4] [5]
  9. ^ "Справочное руководство программиста VT220". Корпорация цифрового оборудования (DEC). Таблица 2-3: Многонациональный набор символов DEC (коды C1 и GR). Получено 2016-12-02.
  10. ^ VAX / VMS Руководство пользователя. Корпорация цифрового оборудования (DEC). Апрель 1986 г. AI-Y517A-TE.
  11. ^ DEC (февраль 1992 г.) [ноябрь 1989 г.]. «Глава 2: Кодирование символов - Набор дополнительных графических символов DEC». Справочное руководство программатора VT420 (PDF) (2-е изд.). Корпорация цифрового оборудования. С. 24–25. EK – VT420 – RM.002. В архиве (PDF) из оригинала от 29.01.2017. Получено 2017-01-29.
  12. ^ Флор, Гвидо (2016) [2006]. "Locale :: RecodeData :: DEC_MCS - Процедуры преобразования для DEC_MCS". CPAN libintl-perl. 1.0. В архиве из оригинала на 2017-01-14. Получено 2017-01-14.
  13. ^ Костис, Коста. «Многонациональный набор символов DEC (DEC MCS)». 1.20. В архиве из оригинала на 2017-01-16. Получено 2017-01-16.
  14. ^ Коуэн, Джон Вольдемар (1999-07-07). "Многонациональный набор символов DEC (1987) в Unicode". 0.1. Unicode, Inc. Архивировано из оригинал на 2017-02-18. Получено 2017-02-18.