Тамильский скрипт для обмена информацией - Tamil Script Code for Information Interchange
Тамильский скрипт для обмена информацией (TSCII) - схема кодирования для представления Тамильский сценарий. Нижние 128 кодовых точек просты ASCII, верхние 128 кодовых точек зависят от TSCII. После долгих лет использования в Интернете только по частному соглашению, он был успешно зарегистрирован в IANA в 2007.[1]
TSCII кодирует символы в визуальном (письменном) порядке, параллельно с использованием тамильской пишущей машинки.
Unicode использовал стратегию кодирования логического порядка для тамильского языка, следуя ISCII, в отличие от случая Тайский, где кодирование визуального порядка унаследовано ТИС-620 был принят.
Правительство Тамил Наду поддерживает собственные стандарты TAB / TAM для 8-битного кодирования, а другие, более старые схемы кодирования все еще можно найти в WWW.
Бесплатная коллекция etext на Проект Мадурай использует TSCII кодирование, но уже начали предоставлять Unicode версии.
История
Потребность в общей кодировке для тамильского языка ощущалась участниками различных форумов, основанных на списках рассылки, в середине 1990-х годов, поскольку на этих форумах преобладали шрифты с настраиваемой кодировкой. Хотя некоторые из коммерческих кодировок были популярны, чем другие, они не были приняты широким сообществом из-за конфликта коммерческих интересов. Хотя Unicode был принят большинством в качестве стандарта будущего, большинство настольных систем в то время все еще не могли обрабатывать Unicode для тамильского языка, и требовалось промежуточное 8-битное кодирование.
Отдельный список рассылки для обсуждения таких кодировок ([email protected]) был создан в 1997 году, чтобы инициировать это обсуждение, начиная с электронного письма, написанного Доктор К. Кальянасундарам популярному тамильскому автору Суджата возглавивший комитет по стандартизации тамильской клавиатуры.[2] Этот форум быстро привлек активных участников со всего мира, в том числе нескольких видных тамильских ученых. Архивы этих обсуждений поддерживаются INFITT.[3]
После публикации TSCII большинство членов списка рассылки [email protected] стали частью INFITT, которая представляет собой более широкую инициативу по стандартизации и постоянному развитию в различных областях тамильских вычислений.
Макет кодовой страницы
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8_ 128 | ௦[а] 0BE6 | ௧ 0BE7 | ஸ்ரீ 0BB8 0BCD 0BB0 0BC0 | ஜ 0B9C | ஷ 0BB7 | ஸ 0BB8 | ஹ 0BB9 | க்ஷ 0B95 0BCD 0BB7 | ஜ் 0B9C 0BCD | ஷ் 0BB7 0BCD | ஸ் 0BB8 0BCD | ஹ் 0BB9 0BCD | க்ஷ் 0B95 0BCD 0BB7 0BCD | ௨ 0BE8 | ௩ 0BE9 | ௪ 0BEA |
9_ 144 | ௫ 0BEB | ‘ 2018 | ’ 2019 | “ 201C | ” 201D | ௬ 0BEC | ௭ 0КРОВАТЬ | ௮ 0BEE | ௯ 0BEF | ஙு 0B99 0BC1 | ஞு 0B9E 0BC1 | ஙூ 0B99 0BC2 | ஞூ 0B9E 0BC2 | ௰ 0BF0 | ௱ 0BF1 | ௲ 0BF2 |
A_ 160 | NBSP 00A0 | ா 0BBE | ி 0BBF | ீ 0BC0 | ு 0BC1 | ூ 0BC2 | ெ 0BC6 | ே 0BC7 | ை 0BC8 | © 00A9 | ௗ 0BD7 | அ 0B85 | ஆ 0B86 | ஈ 0B88 | உ 0B89 | |
B_ 176 | ஊ 0B8A | எ 0B8E | ஏ 0B8F | ஐ 0B90 | ஒ 0B92 | ஓ 0B93 | ஔ 0B94 | ஃ 0B83 | க 0B95 | ங 0B99 | ச 0B9A | ஞ 0B9E | ட 0B9F | ண 0BA3 | த 0BA4 | ந 0BA8 |
C_ 192 | ப 0BAA | ம 0BAE | ய 0BAF | ர 0BB0 | ல 0BB2 | வ 0BB5 | ழ 0BB4 | ள 0BB3 | ற 0BB1 | ன 0BA9 | டி 0B9F 0BBF | டீ 0B9F 0BC0 | கு 0B95 0BC1 | சு 0B9A 0BC1 | டு 0B9F 0BC1 | ணு 0BA3 0BC1 |
D_ 208 | து 0BA4 0BC1 | நு 0BA8 0BC1 | பு 0BAA 0BC1 | மு 0BAE 0BC1 | யு 0BAF 0BC1 | ரு 0BB0 0BC1 | லு 0BB2 0BC1 | வு 0BB5 0BC1 | ழு 0BB4 0BC1 | ளு 0BB3 0BC1 | று 0BB1 0BC1 | னு 0BA9 0BC1 | கூ 0B95 0BC2 | சூ 0B9A 0BC2 | டூ 0B9F 0BC2 | ணூ 0BA3 0BC2 |
E_ 224 | தூ 0BA4 0BC2 | நூ 0BA8 0BC2 | பூ 0BAA 0BC2 | மூ 0BAE 0BC2 | யூ 0BAF 0BC2 | ரூ 0BB0 0BC2 | லூ 0BB2 0BC2 | வூ 0BB5 0BC2 | ழூ 0BB4 0BC2 | ளூ 0BB3 0BC2 | றூ 0BB1 0BC2 | னூ 0BA9 0BC2 | க் 0B95 0BCD | ங் 0B99 0BCD | ச் 0B9A 0BCD | ஞ் 0B9E 0BCD |
F_ 240 | ட் 0B9F 0BCD | ண் 0BA3 0BCD | த் 0BA4 0BCD | ந் 0BA8 0BCD | ப் 0BAA 0BCD | ம் 0BAE 0BCD | ய் 0BAF 0BCD | ர் 0BB0 0BCD | ல் 0BB2 0BCD | வ் 0BB5 0BCD | ழ் 0BB4 0BCD | ள் 0BB3 0BCD | ற் 0BB1 0BCD | ன் 0BA9 0BCD | இ 0B87 |
Письмо Число Пунктуация Символ Другой Неопределенный
- ^ U + 0BE6 TAMIL DIGIT ZERO, который был добавлен с Unicode версии 4.1 в марте 2005 г.
Инструменты преобразования
Вы можете преобразовать документы в кодировке UTF-8 в TSCII с помощью инструментов GNU iconv следующим образом:
$ iconv -f utf-8 -t tscii hello.utf8> hello.tscii
В то время как преобразование из TSCII в UTF-8 выполняется путем замены -f и -t флаги.
Визуальное приложение
Проект с открытым исходным кодом доступен по адресу AnyTaFont2UTF8 поддерживается Тамильское сообщество Исайини
Смотрите также
- TACE16 (Все символы тамильского алфавита)