Окна-1256 - Windows-1256

Окна-1256 это кодовая страница раньше писал арабский (и, возможно, некоторые другие языки, использующие Арабский шрифт, например персидский и урду) под Майкрософт Виндоус. Эта кодовая страница нет совместим с ISO 8859-6 и Макарабский кодировки.

Он кодирует каждый Абстрактные одна буква базового арабского алфавита, а не каждая конкретная визуальная форма отдельных, начальных, средних, конечных или лигатурированных вариантов формы букв (т.е. кодирует символы, а не глифы). Арабские буквы в диапазоне C0-FF расположены в арабском алфавитном порядке, но некоторые латинские символы вкраплены между ними. Это некоторые Окна-1252 Латинские символы используются для Французский, поскольку этот европейский язык имеет историческое значение для бывших французских колоний в Северной Африке, таких как Марокко и Алжир. Это позволяло смешивать французский и арабский текст при использовании Windows 1256 без необходимости переключения кодовых страниц (однако прописные буквы с диакритическими знаками не включались).

IBM использует кодовую страницу 1256 (CCSID 1256, знак евро расширенный CCSID 5352 и еще более расширенный CCSID 9448) для Windows-1256.[1][2][3][4]

Unicode предпочтительнее Windows 1256 в современных приложениях, особенно в Интернете; имея в виду доминирующую UTF-8 кодировка для веб-страниц (см. также Арабский шрифт в Юникоде, для полного покрытия, в отличие от, например, Windows 1256 или ISO-8859-6 которые не покрывают дополнительные услуги). По состоянию на сентябрь 2019 года менее 0,1% всех веб-страниц использовали Windows-1256.[5][6]

Набор символов

Поскольку оригинал кодовая страница осталось 9 значений (байтов), помеченных как «НЕ ИСПОЛЬЗУЕМЫЕ» в исходной спецификации,[7] эти байты использовались позже для дополнительных символов, необходимых для Персидско-арабский шрифт (для Персидский и Урду языков), плюс знак евро.[8]

В следующей таблице показана расширенная версия Windows-1256. Каждый символ показан со своим Unicode эквивалент и его десятичный код.

Здесь каждая арабская буква показана изолированно. Фактические формы букв внутри арабских слов отображаются с помощью комбинации правил программного обеспечения и соответствующей поддержки шрифтов.

Окна-1256[8][9][10][11][12][13][14]
_0_1_2_3_4_5_6_7_8_9_A_B_C_D_E_F
0_
0
NUL
0000
SOH
0001
STX
0002
ETX
0003
EOT
0004
ENQ
0005
ACK
0006
BEL
0007
BS
0008
HT
0009
LF
000A
VT
000B
FF
000C
CR
000D
ТАК
000E
SI
000F
1_
16
DLE
0010
DC1
0011
DC2
0012
DC3
0013
DC4
0014
НАК
0015
SYN
0016
ETB
0017
МОЖЕТ
0018
ЭМ
0019
SUB
001A
ESC
001B
FS
001C
GS
001D
RS
001E
нас
001F
2_
32
SP
0020
!
0021
"
0022
#
0023
$
0024
%
0025
&
0026
'
0027
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
3_
48
0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
4_
64
@
0040
А
0041
B
0042
C
0043
D
0044
E
0045
F
0046
грамм
0047
ЧАС
0048
я
0049
J
004A
K
004B
L
004C
M
004D
N
004E
О
004F
5_
80
п
0050
Q
0051
р
0052
S
0053
Т
0054
U
0055
V
0056
W
0057
Икс
0058
Y
0059
Z
005A
[
005B
\
005C
]
005D
^
005E
_
005F
6_
96
`
0060
а
0061
б
0062
c
0063
d
0064
е
0065
ж
0066
грамм
0067
час
0068
я
0069
j
006A
k
006B
л
006C
м
006D
п
006E
о
006F
7_
112
п
0070
q
0071
р
0072
s
0073
т
0074
ты
0075
v
0076
ш
0077
Икс
0078
у
0079
z
007A
{
007B
|
007C
}
007D
~
007E
DEL
007F
8_
128

20AC
پ
067E

201A
ƒ
0192

201E

2026

2020

2021
ˆ
02C6

2030
ٹ
0679

2039
Œ
0152
چ
0686
ژ
0698
ڈ
0688
9_
144
گ
06AF

2018

2019

201C

201D

2022

2013

2014
ک
06A9

2122
ڑ
0691

203A
œ
0153
ZWNJ
200C
ZWJ
200D
ں
06BA
A_
160
NBSP
00A0
،
060C
¢
00A2
£
00A3
¤
00A4
¥
00A5
¦
00A6
§
00A7
¨
00A8
©
00A9
ھ
06BE
«
00AB
¬
00AC
ЗАСТЕНЧИВЫЙ
00AD
®
00AE
¯
00AF
B_
176
°
00B0
±
00B1
²
00B2
³
00B3
´
00B4
µ
00B5

00B6
·
00B7
¸
00B8
¹
00B9
؛
061B
»
00BB
¼
00BC
½
00BD
¾
00BE
؟
061F
C_
192
ہ
06C1
ء
0621
آ
0622
أ
0623
ؤ
0624
إ
0625
ئ
0626
ا
0627
ب
0628
ة
0629
ت
062A
ث
062B
ج
062C
ح
062D
خ
062E
د
062F
D_
208
ذ
0630
ر
0631
ز
0632
س
0633
ش
0634
ص
0635
ض
0636
×
00D7
ط
0637
ظ
0638
ع
0639
غ
063A
ـ
0640
ف
0641
ق
0642
ك
0643
E_
224
à
00E0
ل
0644
â
00E2
م
0645
ن
0646
ه
0647
و
0648
ç
00E7
è
00E8
é
00E9
ê
00EA
ë
00EB
ى
0649
ي
064A
я
00EE
я
00EF
F_
240
ً
064B
ٌ
064C
ٍ
064D
َ
064E
ô
00F4
ُ
064F
ِ
0650
÷
00F7
ّ
0651
ù
00F9
ْ
0652
û
00FB
ü
00FC
LRM
200E
RLM
200F
ے
06D2

  Письмо  Число  Пунктуация  Символ  Другой  Неопределенный

Смотрите также

Рекомендации

  1. ^ «Кодовая страница 1256 информационного документа». Архивировано из оригинал на 03.03.2016.
  2. ^ «Информационный документ CCSID 1256». Архивировано из оригинал on 2016-03-27.
  3. ^ «Информационный документ CCSID 5352». Архивировано из оригинал 2014-11-29.
  4. ^ «Информационный документ CCSID 9448». Архивировано из оригинал 2014-11-29.
  5. ^ «Исторические тенденции использования кодировок символов для веб-сайтов, сентябрь 2019 г.». w3techs.com.
  6. ^ "Часто задаваемые вопросы". w3techs.com.
  7. ^ Архивные документы. "Кодовая страница 1256 Windows, арабский". docs.microsoft.com.
  8. ^ а б "cp1256 в таблицу Unicode" (PDF). www.unicode.org. Получено 2019-05-31.
  9. ^ Отображение Unicode окон 1256 с "наилучшим соответствием"
  10. ^ Кодовая страница CPGID 01256 (pdf) (PDF), IBM
  11. ^ Кодовая страница CPGID 01256 (txt), IBM
  12. ^ Международные компоненты для Unicode (ICU), ibm-1256_P110-1997.ucm, 2002-12-03
  13. ^ Международные компоненты для Unicode (ICU), ibm-5352_P100-1998.ucm, 2002-12-03
  14. ^ Международные компоненты для Unicode (ICU), ibm-9448_X100-2005.ucm, 2005-11-15

внешняя ссылка