VSCII - VSCII

VSCII
Псевдоним (а)x-viet-tcvn5712[1]
Язык (и)вьетнамский, английский
СделаноTCVN / TC1
СтандартTCVN 5712: 1993
Классификация8 бит SBCS;
Расширенный ASCII (ВСКИИ-2 / -3)

VSCII (Вьетнамский стандартный код для обмена информацией), также известный как TCVN 5712,[2] ISO-IR-180,[3] .VN,[4] ABC[4] или просто Кодировки TCVN,[4][5] представляет собой набор из трех тесно связанных Вьетнамский национальный стандарт кодировки символов за использование вьетнамского языка с компьютерами, разработанный Техническим комитетом по информационным технологиям TCVN (TCVN / TC1) и впервые принятый в 1993 году (как TCVN 5712: 1993).[2]

Его не следует путать с одноименным неофициальным VISCII кодирование, которое иногда использовалось иностранцами, говорящими на вьетнамском языке.[4] VISCII также должен был обозначать Вьетнамский стандартный код для обмена информацией, но не имеет отношения к VSCII.[6]

VSCII (TCVN) широко использовался на севере Вьетнама, в то время как ВНИ был популярен на юге.[4] Unicode и Окна-1258 кодовые страницы теперь используются практически для всех вьетнамских компьютерных данных,[нужна цитата ] но устаревшие файлы или заархивированные сообщения могут нуждаться в преобразовании.

Кодировки

Все три формы VSCII сохраняют 95 печатных символов ASCII немодифицированный.

ВСКИИ-3, также известный как TCVN 5712-3, VN3 или просто TCVN3,[7] включает наименьшее количество заданий. Это расширенный ASCII, потому что он сохраняет все 128 кодов ASCII без изменений. Он не переназначает ни один из Коды управления C0 и C1. В сравнении с ASCII, он добавляет 75 символов:

  • 67 строчных символов, что обеспечивает полную поддержку строчных букв.
  • 7 символов в верхнем регистре, что обеспечивает поддержку прописных букв для 29 базовых букв без тоновых знаков.
  • В неразрывное пространство.

Тональные отметки на гласных в верхнем регистре выполняются в TCVN3 путем переключения на шрифт, состоящий только из заглавных букв.[8]

ВСКИИ-2, также известный как TCVN 5712-2 и VN2, является расширенным набором VSCII-3. Это расширенный ASCII, потому что он сохраняет все 128 кодов ASCII без изменений. Он не переназначает ни один из Коды управления C0 и C1, что делает его совместимым с ISO 2022 как 96-набор.[2][3] По сравнению с VSCII-3 он добавляет (всего 96 символов, отличных от ASCII):

  • Еще 16 прописных символов с заранее составленными тональными метками (всего 23 прописных символа, отличных от ASCII)
  • 5 сочетание диакритических знаков за тональные знаки, позволяя представить другие комбинации прописных букв и тоновых знаков. Комбинированные знаки следуют базовой букве[2] как в ВНИ (а не предшествовать им, как в ANSEL ).

ВСКИИ-1, также известный как TCVN 5712-1 и VN1, является расширением VSCII-2 и является модифицированным ASCII, поскольку заменяет 12 из 33 управляющие символы с заранее составленными символами. По сравнению с VSCII-2 он (всего 140 символов, отличных от ASCII):

  • Добавляет еще 44 заранее составленных заглавных буквы, доводя их до того же количества, что и строчных
  • Делается это путем замены 12 управляющих символов ASCII и выделения 32 графических символов в область управления C1, нарушая совместимость ISO 2022.

Преобразование из VSCII-3 в VSCII-2 или VSCII-1 и преобразование из VSCII-2 в VSCII-1 не требуется, но может привести к уменьшению размера файлов.

Преобразование из VSCII-1 в VSCII-2 или VSCII-3 и преобразование из VSCII-2 в VSCII-3 требует расширения некоторых предварительно составленных символов.

Набор символов

ВСКИИ-1[2]
_0_1_2_3_4_5_6_7_8_9_A_B_C_D_E_F
0_
0
NUL
0000
Ú
00DA

1EE4
ETX
0003

1EEA

1EEC

1EEE
BEL
0007
BS
0008
HT
0009
LF
000A
VT
000B
FF
000C
CR
000D
ТАК
000E
SI
000F
1_
16
DLE
0010

1EE8

1EF0

1EF2

1EF6

1EF8
Ý
00DD

1EF4
МОЖЕТ
0018
ЭМ
0019
SUB
001A
ESC
001B
FS
001C
GS
001D
RS
001E
нас
001F
2_
32
SP
0020
!
0021
"
0022
#
0023
$
0024
%
0025
&
0026
'
0027
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
3_
48
0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
4_
64
@
0040
А
0041
B
0042
C
0043
D
0044
E
0045
F
0046
грамм
0047
ЧАС
0048
я
0049
J
004A
K
004B
L
004C
M
004D
N
004E
О
004F
5_
80
п
0050
Q
0051
р
0052
S
0053
Т
0054
U
0055
V
0056
W
0057
Икс
0058
Y
0059
Z
005A
[
005B
\
005C
]
005D
^
005E
_
005F
6_
96
`
0060
а
0061
б
0062
c
0063
d
0064
е
0065
ж
0066
грамм
0067
час
0068
я
0069
j
006A
k
006B
л
006C
м
006D
п
006E
о
006F
7_
112
п
0070
q
0071
р
0072
s
0073
т
0074
ты
0075
v
0076
ш
0077
Икс
0078
у
0079
z
007A
{
007B
|
007C
}
007D
~
007E
DEL
007F
8_
128
А
00C0

1EA2
Ã
00C3
Á
00C1

1EA0

1EB6

1EAC
È
00C8

1EBA

1EBC
É
00C9

1EB8

1EC6
Я
00CC
Я
1EC8
Я
0128
9_
144
Я
00CD
Я
1ECA
Ò
00D2

1ECE
Õ
00D5
Ó
00D3

1ECC

1ED8

1EDC

1EDE

1EE0

1EDA

1EE2
Ù
00D9

1EE6
Ũ
0168
A_
160
NBSP
00A0
Ă
0102
Â
00C2
Ê
00CA
Ô
00D4
Ơ
01A0
Ư
01AF
Đ
0110
ă
0103
â
00E2
ê
00EA
ô
00F4
ơ
01A1
ư
01B0
đ
0111

1EB0
B_
176
̀
0300
̉
0309
̃
0303
́
0301
̣
0323
à
00E0

1EA3
ã
00E3
á
00E1

1EA1

1EB2

1EB1

1EB3

1EB5

1EAF

1EB4
C_
192

1EAE

1EA6

1EA8

1EAA

1EA4

1EC0

1EB7

1EA7

1EA9

1EAB

1EA5

1EAD
è
00E8

1EC2

1EBB

1EBD
D_
208
é
00E9

1EB9

1EC1

1EC3

1EC5
ế
1EBF

1EC7
я
00EC
я
1EC9

1EC4

1EBE

1ED2
я
0129
я
00ED
я
1ECB
ò
00F2
E_
224

1ED4

1ECF
х
00F5
ó
00F3

1ECD

1ED3

1ED5

1ED7

1ED1

1ED9

1EDD

1EDF

1EE1

1EDB

1EE3
ù
00F9
F_
240

1ED6

1EE7
ũ
0169
ú
00FA

1EE5

1EEB

1EED

1EEF

1EE9

1EF1

1EF3

1EF7

1EF9
ý
00FD

1EF5

1ED0

  Письмо  Число  Пунктуация  Символ  Другой  Неопределенный

Затенение шахматной доски указывает символы, которых нет в VSCII-3. Затененные символы в строках 0_, 1_, 8_ и 9_ не входят в VSCII-2 или VSCII-3.[9]

Рекомендации

  1. ^ Сивонен, Анри (26.09.2014). «Для изменения кодировки символов в m-c требуется действие c-c». mozilla.dev.apps.thunderbird.
  2. ^ а б c d е "[новости] TCVN 5712: 1993 (VSCII) - вьетнамский национальный стандарт". 1993-06-02. Архивировано из оригинал на 2017-01-11.
  3. ^ а б TVCN (1993). «ISO-IR-180: Правая часть кодовой таблицы VSCII-2» (PDF). ITSCJ /IPSJ.
  4. ^ а б c d е Нго, Хок Динь; Тран, Тубинь. «5. Зачем нужна вьетнамская кодировка (набор символов - кодировка)?». Некоторые специальные функции WinVNKey.
  5. ^ Нгуен, Минь Т. «Вьетнамские преобразования (Vietnet / VIQR, VNI, VPS, VISCII, VNU, TCVN, VietWare, unicode)».
  6. ^ Лунде, Кен. «Глава 1: Обзор обработки информации CJKV (§ Идентичны ли VISCII и VSCII? А как насчет TCVN?)». CJKV Обработка информации (2-е изд.). п. 17. ISBN  978-0-596-51447-1.
  7. ^ "Юникод и вьетнамские кодировки символов из унаследованных". Вьетнамский Unicode: часто задаваемые вопросы.
  8. ^ "Юникод и вьетнамские кодировки символов из унаследованных". Вьетнамский Unicode: часто задаваемые вопросы. TCVN3 не является двухбайтовым, но из-за характера его кодирования заглавные буквы (гласные) отображаются в отдельный заглавный шрифт, аналогичный обычному строчному.
  9. ^ Лунде, Кен. «Приложение L: вьетнамские наборы символов» (PDF). CJKV Обработка информации (2-е изд.). ISBN  978-0-596-51447-1.

внешняя ссылка