Окна-1255 - Windows-1255

Окна-1255 это кодовая страница используется под Майкрософт Виндоус написать иврит. Это почти совместимый надмножество ISO 8859-8 - большинство символов находятся в тех же позициях (за исключением A4, который является «знаком шекелей» в Windows-1255, но «общим знаком валюты» в ISO 8859-8 и за исключением DF, который не определен в Windows-1255, но двойная нижняя линия 'в ISO 8859-8), но Windows-1255 добавляет гласные и другие знаки в нижних позициях.

IBM использует кодовую страницу 1255 (CCSID 1255, знак евро расширенный CCSID 5351 и дополнительно расширенный CCSID 9447) для Windows-1255.[1][2][3][4]

Современные приложения предпочитают Unicode в Windows-1255, особенно в Интернете;[5] смысл UTF-8, доминирующая кодировка для веб-страниц (или UTF-16, но не в Интернете по соображениям безопасности). Windows-1255 используется менее чем на 0,1% веб-сайтов.[6]

Набор символов

В следующей таблице показана Windows-1255. Каждый символ показан со своим Unicode эквивалент.

Окна-1255[7][8][9][10][11][12][13]
_0_1_2_3_4_5_6_7_8_9_A_B_C_D_E_F
0_
0
NUL
0000
SOH
0001
STX
0002
ETX
0003
EOT
0004
ENQ
0005
ACK
0006
BEL
0007
BS
0008
HT
0009
LF
000A
VT
000B
FF
000C
CR
000D
ТАК
000E
SI
000F
1_
16
DLE
0010
DC1
0011
DC2
0012
DC3
0013
DC4
0014
НАК
0015
SYN
0016
ETB
0017
МОЖЕТ
0018
ЭМ
0019
SUB
001A
ESC
001B
FS
001C
GS
001D
RS
001E
нас
001F
2_
32
SP
0020
!
0021
"
0022
#
0023
$
0024
%
0025
&
0026
'
0027
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
3_
48
0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
4_
64
@
0040
А
0041
B
0042
C
0043
D
0044
E
0045
F
0046
грамм
0047
ЧАС
0048
я
0049
J
004A
K
004B
L
004C
M
004D
N
004E
О
004F
5_
80
п
0050
Q
0051
р
0052
S
0053
Т
0054
U
0055
V
0056
W
0057
Икс
0058
Y
0059
Z
005A
[
005B
\
005C
]
005D
^
005E
_
005F
6_
96
`
0060
а
0061
б
0062
c
0063
d
0064
е
0065
ж
0066
грамм
0067
час
0068
я
0069
j
006A
k
006B
л
006C
м
006D
п
006E
о
006F
7_
112
п
0070
q
0071
р
0072
s
0073
т
0074
ты
0075
v
0076
ш
0077
Икс
0078
у
0079
z
007A
{
007B
|
007C
}
007D
~
007E
DEL
007F
8_
128

20AC

 

201A
ƒ
0192

201E

2026

2020

2021
ˆ
02C6

2030

 

2039

 

 

 

 
9_
144

 

2018

2019

201C

201D

2022

2013

2014
˜
02DC

2122

 

203A

 

 

 

 
A_
160
NBSP
00A0
¡
00A1
¢
00A2
£
00A3

20AA
¥
00A5
¦
00A6
§
00A7
¨
00A8
©
00A9
×
00D7
«
00AB
¬
00AC
ЗАСТЕНЧИВЫЙ
00AD
®
00AE
¯
00AF
B_
176
°
00B0
±
00B1
²
00B2
³
00B3
´
00B4
µ
00B5

00B6
·
00B7
¸
00B8
¹
00B9
÷
00F7
»
00BB
¼
00BC
½
00BD
¾
00BE
¿
00BF
C_
192
ְ
05B0
ֱ
05B1
ֲ
05B2
ֳ
05B3
ִ
05B4
ֵ
05B5
ֶ
05B6
ַ
05B7
ָ
05B8
 ֹ
05B9
 ֺ
05BA
ֻ
05BB
ּ
05BC
ֽ
05BD
־
05BE
ֿ
05BF
D_
208
׀
05C0
ׁ
05C1
ׂ
05C2
׃
05C3
װ
05F0
ױ
05F1
ײ
05F2
׳
05F3
״
05F4

 
E_
224
א
05D0
ב
05D1
ג
05D2
ד
05D3
ה
05D4
ו
05D5
ז
05D6
ח
05D7
ט
05D8
י
05D9
ך
05DA
כ
05 дБ
ל
05DC
ם
05DD
מ
05DE
ן
05DF
F_
240
נ
05E0
ס
05E1
ע
05E2
ף
05E3
פ
05E4
ץ
0-55
צ
05E6
ק
05E7
ר
05E8
ש
05E9
ת
05EA
LRM
200E
RLM
200F

  Письмо  Число  Пунктуация  Символ  Другой  Неопределенный  Отличия от ISO 8859-8

использование

Windows-1255 Иврит всегда находится в логическом порядке (в отличие от визуального). Продукты Microsoft иврита (Windows, Office и Internet Explorer) сделали логически упорядоченный иврит повсеместно используемым, в результате чего Windows-1255 является кодировкой иврита, которую можно найти больше всего в Интернете, вытеснив визуально упорядоченную ISO-8859-8, и предпочел логически упорядоченный ISO-8859-8-I потому что в нем предусмотрены гласные.

Отношение к Unicode

В Unicode Блок на иврите (U + 0590 – U + 05FF) следует за Windows-1255, кодируя буквы и гласные в тех же относительных положениях, что и Windows-1255. Unicode идет дальше в кодировании кантилляция отметки в нижних положениях. Юникод на иврите всегда в логическом порядке.

Для современных приложений UTF-8 или же UTF-16 является предпочтительной кодировкой.

Смотрите также

Рекомендации

  1. ^ «Кодовая страница 1255 информационного документа». Архивировано из оригинал на 2016-03-04.
  2. ^ «Информационный документ CCSID 1255». Архивировано из оригинал on 2016-03-27.
  3. ^ «Информационный документ CCSID 5351». Архивировано из оригинал 2014-11-29.
  4. ^ «Информационный документ CCSID 9447». Архивировано из оригинал on 2016-03-26.
  5. ^ Джон, Николас А. (2013). «Строительство многоязычного Интернета: Юникод, иврит и глобализация». Журнал компьютерных коммуникаций. 18 (3): 321–338. Дои:10.1111 / jcc4.12015. ISSN  1083-6101. Предыстория: проблема иврита и Интернета
  6. ^ «Статистика использования Windows-1255 для веб-сайтов, январь 2019 г.». w3techs.com. Получено 2019-01-17.
  7. ^ Таблица сопоставления Unicode для Windows 1255
  8. ^ Отображение Unicode окон 1255 с "наилучшим соответствием"
  9. ^ Кодовая страница CPGID 01255 (pdf) (PDF), IBM
  10. ^ Кодовая страница CPGID 01255 (txt), IBM
  11. ^ Международные компоненты для Unicode (ICU), ibm-1255_P100-1995.ucm, 2002-12-03
  12. ^ Международные компоненты для Unicode (ICU), ibm-1251_P100-1995.ucm, 2002-12-03
  13. ^ Международные компоненты для Unicode (ICU), ibm-5351_P100-1998.ucm, 2002-12-03

внешняя ссылка