Окна-1258 - Windows-1258

Окна-1258
MIME / IANAокна-1258
Язык (и)вьетнамский, английский
СделаноMicrosoft
СтандартСтандарт кодирования WHATWG
Классификациярасширенный ASCII, Окна-125x
На основеОкна-1252

Окна-1258 это кодовая страница используется в Майкрософт Виндоус представлять вьетнамский тексты. Он использует комбинирование диакритических знаков.

Windows-1258 не совместима ни с вьетнамским стандартом (TCVN 5712 / VSCII), ни различные другие кодировки, используемые на практике (VISCII, ВНИ, VPS ). Скорее он очень похож на Окна-1252 с той разницей, что отсутствуют s-caron и z-caron (которые были добавлены в Windows-1252 позже), пять букв с диакритическими знаками были заменены объединением диакритических знаков для Вьетнамские тональные знаки, один был заменен на ông знак, а восемь других (по четыре на случай) были заменены на четыре, не поддерживаемые другими способами. Вьетнамские буквы.

Использование комбинированных диакритических знаков означает, что Windows-1258 может охватывать большое количество комбинаций букв и тоновых знаков на вьетнамском языке без ущерба для покрытия управляющих кодов или символов. Однако это также означает, что программное обеспечение должно быть осторожным при обработке преобразований между предварительно составленными символами и правильном объединении последовательностей при преобразовании в / из других кодировок и затрудняет определение видимой для пользователя длины строки.

IBM использует кодовую страницу 1258 (CCSID 1258 и знак евро расширенный CCSID 5354) для Windows-1258.[1][2][3]

UTF-8 является предпочтительной кодировкой для вьетнамского языка в современных приложениях. Windows-1258 не всегда может поездка в оба конца Unicode закодировал вьетнамский язык из-за изменений, вызванных Юникод нормализация.[4] Комбинированные диакритические знаки кодируются после буквы как в Windows-1258, так и в Unicode.[4] (подобно ВНИ, В отличие от ANSEL ).

Набор символов

В следующей таблице показан Windows-1258. Каждый символ показан со своим Unicode эквивалент.

Окна-1258[5][6][7][8][9][10]
_0_1_2_3_4_5_6_7_8_9_A_B_C_D_E_F
0_
0
NUL
0000
SOH
0001
STX
0002
ETX
0003
EOT
0004
ENQ
0005
ACK
0006
BEL
0007
BS
0008
HT
0009
LF
000A
VT
000B
FF
000C
CR
000D
ТАК
000E
SI
000F
1_
16
DLE
0010
DC1
0011
DC2
0012
DC3
0013
DC4
0014
НАК
0015
SYN
0016
ETB
0017
МОЖЕТ
0018
ЭМ
0019
SUB
001A
ESC
001B
FS
001C
GS
001D
RS
001E
нас
001F
2_
32
SP
0020
!
0021
"
0022
#
0023
$
0024
%
0025
&
0026
'
0027
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
3_
48
0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
4_
64
@
0040
А
0041
B
0042
C
0043
D
0044
E
0045
F
0046
грамм
0047
ЧАС
0048
я
0049
J
004A
K
004B
L
004C
M
004D
N
004E
О
004F
5_
80
п
0050
Q
0051
р
0052
S
0053
Т
0054
U
0055
V
0056
W
0057
Икс
0058
Y
0059
Z
005A
[
005B
\
005C
]
005D
^
005E
_
005F
6_
96
`
0060
а
0061
б
0062
c
0063
d
0064
е
0065
ж
0066
грамм
0067
час
0068
я
0069
j
006A
k
006B
л
006C
м
006D
п
006E
о
006F
7_
112
п
0070
q
0071
р
0072
s
0073
т
0074
ты
0075
v
0076
ш
0077
Икс
0078
у
0079
z
007A
{
007B
|
007C
}
007D
~
007E
DEL
007F
8_
128

20AC

201A
ƒ
0192

201E

2026

2020

2021
ˆ
02C6

2030

2039
Œ
0152
9_
144

2018

2019

201C

201D

2022

2013

2014
˜
02DC

2122

203A
œ
0153
Ÿ
0178
A_
160
NBSP
00A0
¡
00A1
¢
00A2
£
00A3
¤
00A4
¥
00A5
¦
00A6
§
00A7
¨
00A8
©
00A9
ª
00AA
«
00AB
¬
00AC
ЗАСТЕНЧИВЫЙ
00AD
®
00AE
¯
00AF
B_
176
°
00B0
±
00B1
²
00B2
³
00B3
´
00B4
µ
00B5

00B6
·
00B7
¸
00B8
¹
00B9
º
00BA
»
00BB
¼
00BC
½
00BD
¾
00BE
¿
00BF
C_
192
А
00C0
Á
00C1
Â
00C2
Ă
0102
Ä
00C4
Å
00C5
Æ
00C6
Ç
00C7
È
00C8
É
00C9
Ê
00CA
Ë
00CB
̀
0300
Я
00CD
Я
00CE
Я
00CF
D_
208
Đ
0110
Ñ
00D1
̉
0309
Ó
00D3
Ô
00D4
Ơ
01A0
Ö
00D6
×
00D7
Ø
00D8
Ù
00D9
Ú
00DA
Û
00 дБ
Ü
00DC
Ư
01AF
̃
0303
SS
00DF
E_
224
à
00E0
á
00E1
â
00E2
ă
0103
ä
00E4
å
00E5
æ
00E6
ç
00E7
è
00E8
é
00E9
ê
00EA
ë
00EB
́
0301
я
00ED
я
00EE
я
00EF
F_
240
đ
0111
ñ
00F1
̣
0323
ó
00F3
ô
00F4
ơ
01A1
ö
00F6
÷
00F7
ø
00F8
ù
00F9
ú
00FA
û
00FB
ü
00FC
ư
01B0

20AB
ÿ
00FF

  Письмо  Число  Пунктуация  Символ  Другой  Неопределенный  Отличия от Окна-1252

Кодовая страница 1129

Кодовая страница IBM 1129 (CCSID 1129 и знак евро расширенный CCSID 1163)[11][12][13] аналогична кодовой странице 1258, но со следующими отличиями:

Кодовая страница 1129 (отличия от кодовой страницы 1258)[14][15][16][17][18][19]
_0_1_2_3_4_5_6_7_8_9_A_B_C_D_E_F
8_
128
9_
144
A_
160
NBSP
00A0
¡
00A1
¢
00A2
£
00A3
¤
00A4
¥
00A5
¦
00A6
§
00A7
œ
0153
©
00A9
ª
00AA
«
00AB
¬
00AC
ЗАСТЕНЧИВЫЙ
00AD
®
00AE
¯
00AF
B_
176
°
00B0
±
00B1
²
00B2
³
00B3
Ÿ
0178
µ
00B5

00B6
·
00B7
Œ
0152
¹
00B9
º
00BA
»
00BB
¼
00BC
½
00BD
¾
00BE
¿
00BF

  Письмо  Число  Пунктуация  Символ  Другой  Неопределенный  Отличия от Windows-1258

Смотрите также

Рекомендации

  1. ^ «Кодовая страница 1258 информационного документа». Архивировано из оригинал на 03.03.2016.
  2. ^ «Информационный документ CCSID 1258». Архивировано из оригинал 2014-11-29.
  3. ^ «Информационный документ CCSID 5354». Архивировано из оригинал 2014-11-29.
  4. ^ а б Каплан, Майкл С. (19 апреля 2005 г.). "Несколько ошибок MultiByteToWideChar". Сортировка всего.
  5. ^ Стил, Шон (1998-04-15). "cp1258 в таблицу Unicode". Microsoft.
  6. ^ Отображение Unicode окон 1258 с "наилучшим соответствием"
  7. ^ Кодовая страница CPGID 01258 (pdf) (PDF), IBM
  8. ^ Кодовая страница CPGID 01258 (txt), IBM
  9. ^ Международные компоненты для Unicode (ICU), ibm-1258_P100-1997.ucm, 2002-12-03
  10. ^ Международные компоненты для Unicode (ICU), ibm-5354_P100-1998.ucm, 2002-12-03
  11. ^ «Кодовая страница 1129 информационного документа». Архивировано из оригинал 21 сентября 2010 г.
  12. ^ «Информационный документ CCSID 1129». Архивировано из оригинал on 2016-03-27.
  13. ^ «Информационный документ CCSID 1163». Архивировано из оригинал 2014-11-29.
  14. ^ Лунде, Кен. «Приложение L: вьетнамские наборы символов» (PDF). CJKV Обработка информации (2-е изд.). ISBN  978-0-596-51447-1.
  15. ^ Кодовая страница CPGID 01129 (pdf) (PDF), IBM
  16. ^ Кодовая страница CPGID 01129 (txt), IBM
  17. ^ Международные компоненты для Unicode (ICU), ibm-1129_P100-1997.ucm, 2002-12-03
  18. ^ Кодовая страница CPGID 01163 (pdf) (PDF), IBM
  19. ^ Кодовая страница CPGID 01163 (txt), IBM

внешняя ссылка