Кодекс ацтеков - Aztec Code

Кодировка: «Это пример ацтекского символа для Википедии».

Кодекс ацтеков это тип 2D штрих-код изобретен Эндрю Лонгакр-младший и Роберт Хасси в 1995 году.[1] Код был опубликован AIM, Inc. в 1997 году. Хотя код ацтеков был запатентован,[1] этот патент официально стал общественным достоянием.[2] Код ацтеков также опубликован как стандарт ISO / IEC 24778: 2008, названный в честь сходства шаблона центрального искателя с шаблоном Пирамида ацтеков, Код Aztec может занимать меньше места, чем другие матричные штрих-коды, потому что для него не требуется окружающая пустая «тихая зона».

Структура

Символ построен на квадратной сетке с рисунком «бычий глаз» в центре для определения местоположения кода. Данные закодированный концентрическими квадратными кольцами по образцу «бычий глаз». Центральный мишень - 9 × 9 или 13 × 13. пиксели и одна строка пикселей вокруг, которая кодирует основные параметры кодирования, создавая «ядро» из 11 × 11 или 15 × 15 квадратов. Данные добавляются «слоями», каждый из которых содержит два кольца пикселей, что дает общие размеры 15 × 15, 19 × 19, 23 × 23 и т. Д.

В углах сердечника имеются метки ориентации, позволяющие считывать код при повороте или отражении. Декодирование начинается с угла с тремя черными пикселями и продолжается по часовой стрелке до углов с двумя, одним и нулевым черными пикселями. Переменные пиксели в центральном ядре кодируют размер, поэтому нет необходимости отмечать границу кода пустой «тихой зоной», хотя для некоторых считывателей штрих-кода она требуется.

Компактное ядро ​​кода Aztec может быть окружено от 1 до 4 слоев, создавая символы от 15 × 15 (место для 13 цифр или 12 букв) до 27 × 27. Дополнительно есть специальная «руна» 11 × 11, которая кодирует один байт информации. Полное ядро ​​поддерживает до 32 слоев, 151 × 151 пиксель, которые могут кодировать 3832 цифры, 3067 букв или 1914 байтов данных.

Какая бы часть символа не использовалась для основных данных, используется для Исправление ошибок Рида – Соломона, и разделение полностью настраивается между 1 словом данных и 3 контрольными словами. Рекомендуемое количество контрольных слов составляет 23% символьной емкости плюс 3 кодовых слова.[3]

Предполагается, что Aztec Code может создавать читаемые коды с помощью различных технологий печати. Он также хорошо подходит для дисплеев сотовых телефонов и других мобильных устройств.

Кодирование

Процесс кодирования состоит из следующих этапов:

  1. Преобразование исходного сообщения в строку битов
  2. Вычисление необходимого размера символа и сообщения режима, которое определяет размер кодового слова Рида – Соломона
  3. Битовая набивка сообщение в кодовые слова Рида – Соломона
  4. Добавление сообщения к границе кодового слова
  5. Добавление контрольных кодовых слов
  6. Расположение всего сообщения по спирали вокруг ядра

Все преобразования между битовыми строками и другими формами выполняются в соответствии с прямой порядок байтов (сначала старший бит) соглашение.

Набор символов

Могут быть закодированы все 8-битные значения плюс два escape-кода:

  • FNC1, escape-символ, используемый для обозначения наличия идентификатора приложения, таким же образом, как и в GS1-128 стандарт.
  • ECI, побег с последующим 6-значным Расширенная интерпретация канала code, который определяет набор символов, используемый для интерпретации следующих байтов.

По умолчанию коды 0–127 интерпретируются в соответствии с ANSI X3.4 (ASCII ), а 128–255 интерпретируются согласно ISO 8859-1: Латинский алфавит № 1. Соответствует ECI 000003.

Байты преобразуются в 4- и 5-битные коды на основе текущего режима декодирования со сдвигом и кодами защелки для изменения режимов. Байтовые значения, недоступные таким образом, могут быть закодированы с использованием общего кода «двоичного сдвига», за которым следует длина и количество 8-битных кодов.

Для смены режимов сдвиг влияет только на интерпретацию одного следующего кода, в то время как защелка влияет на все следующие коды. В большинстве режимов используются 5-битные коды, но в цифровом режиме используются 4-битные коды.

Кодировка символов ацтекского кода
КодРежимКодРежим
ВерхнийНижняяСмешанныйПунктЦифраВерхнийНижняяСмешанныйПункт
0P / SP / SP / SFLG (п)P / S16Оо^\+
1SPSPSPCRSP17пп^],
2Аа^ АCR LF018Qq^^-
3Bб^ B. SP119рр^_.
4Cc^ C, ИП220Ss@/
5Dd^ D: SP321Тт\:
6Eе^ E!422Uты^;
7Fж^ F"523Vv_<
8гг^ G#624Wш`=
9ЧАСчас^ H$725ИксИкс|>
10яя^ Я%826Yу~?
11Jj^ J&927Zz^?[
12Kk^ K',28Л / лНАСЛ / л]
13Lл^ L(.29М / лМ / лЕд / л{
14Mм^ M)Ед / л30D / LD / LP / L}
15Nп^[*НАС31Б / СБ / СБ / СЕд / л
  • Исходный режим - «Верхний».
  • x / S = Перейти в режим x для одного символа; B / S = переход на 8-битный двоичный
  • x / L = фиксировать в режиме x для следующих символов
  • Пункты 2–5 кодируют по два байта каждый.
  • В таблице перечислены символы ASCII, но это байтовые значения, которые кодируются, даже если используются символы, отличные от ASCII.

B / S (двоичный сдвиг) следует за 5-битной длиной. Если не ноль, это означает, что за ним следуют 1–31 8-битных байтов. Если ноль, 11 битов дополнительной длины кодируют количество следующих байтов меньше 31 (обратите внимание, что для 32–62 байтов две 5-битные последовательности сдвига байтов более компактны, чем одна 11-битная). В конце двоичной последовательности, возобновляется предыдущий режим.

FLG (п) следует 3-битный п ценность. п= 0 кодирует FNC1. п= 1–6 следует за 1–6 цифрами (в цифровом режиме), которые дополняются нулями для создания 6-битного идентификатора ECI. п= 7 зарезервировано и в настоящее время недопустимо.

Сообщение режима

Сообщение режима кодирует количество слоев (L слои, закодированные как целое число L−1), а количество кодовых слов данных (D кодовые слова, закодированные как целое число D−1) в сообщении. Все остальные кодовые слова используются как проверочные кодовые слова.

Для компактных кодов Aztec количество слоев кодируется как 2-битовое значение, а количество кодовых слов данных как 6-битовое значение, в результате чего получается 8-битовое слово режима. Для полных кодов Aztec количество слоев закодировано в 5 битах, а количество кодовых слов данных закодировано в 11 битах, образуя 16-битовое слово режима.

Слово режима разбивается на 2 или 4 4-битных кодовых слова в GF (16), и добавляются 5 или 6 контрольных слов Рида – Соломона, образуя 28- или 40-битное сообщение в режиме, которое оборачивается однопиксельным слоем вокруг ядра.

Поскольку L + 1-слойный компактный код Aztec может содержать больше данных, чем полный L-слойный код, полные коды с менее чем 4 уровнями используются редко.

Что наиболее важно, количество слоев определяет размер используемых кодовых слов Рида – Соломона. Это варьируется от 6 до 12 бит:

Полиномы конечного поля ацтекского кода
БитыПолеПолиномиальныйИспользуется для
4GF (16)Икс4+Икс+1Сообщение режима
6GF (64)Икс6+Икс+11-2 слоя
8GF (256)Икс8+Икс5+Икс3+Икс2+13–8 слоев
10GF (1024)Икс10+Икс3+19–22 слоя
12GF (4096)Икс12+Икс6+Икс5+Икс3+123–32 слоя

Размер кодового слова б - наименьшее четное число, которое гарантирует, что общее количество кодовых слов в символе меньше предела в 2б−1, который можно исправить кодом Рида – Соломона.

Как упоминалось выше, рекомендуется, чтобы не менее 23% доступных кодовых слов плюс 3 были зарезервированы для исправления, а размер символа выбирался таким образом, чтобы сообщение поместилось в доступное пространство.

Битовая начинка

Биты данных разбиваются на кодовые слова, причем первый бит соответствует наиболее значимому коэффициенту. При этом кодовые слова все-ноль и все-единицы избегаются немного набивки: если первый б-1 бит кодового слова имеет одно и то же значение, дополнительный бит с дополнительным значением вставляется в поток данных. Эта вставка происходит независимо от того, имел ли последний бит кодового слова такое же значение или нет.

Также обратите внимание, что это относится только к строкам б-1 бит в начале кодового слова. Допускаются более длинные строки одинаковых битов, если они пересекают границу кодового слова.

При декодировании кодовое слово, состоящее из всех нулей или всего единицы, может считаться стирание, и исправляется более эффективно, чем обычная ошибка.

Этот процесс увеличивает длину сообщения, и окончательное количество кодовых слов данных, записанных в сообщении режима, неизвестно, пока оно не будет завершено. В редких случаях может потребоваться перейти к следующему по величине символу и начать процесс заново, чтобы сохранить минимальную долю проверочных слов.

Обивка

После вставки битов строка данных дополняется до границы следующего кодового слова путем добавления 1 бита. Если это приведет к кодовому слову, состоящему из всех единиц, последний бит будет изменен на ноль (и будет проигнорирован декодером как бит вставки битов). При декодировании биты заполнения могут быть декодированы как коды сдвига и защелки, но это не повлияет на содержимое сообщения. Читатель должен принять и проигнорировать частичный код в конце сообщения, если он состоит из единиц.

Кроме того, если общее количество битов данных, доступных в символе, не кратно размеру кодового слова, строка данных снабжается префиксом из соответствующего числа 0 битов, чтобы занять дополнительное пространство. Эти биты не учитываются при вычислении контрольного слова.

Проверить кодовые слова

И слово режима, и данные должны иметь добавленные контрольные слова, чтобы заполнить доступное пространство. Это вычисляется путем добавления K проверьте такие слова, чтобы все сообщение было кратным полиному Рида – Соломона (Икс−2)(Икс−4)...(Икс−2K).

Обратите внимание, что контрольные слова не подлежит заполнению битами и может быть нулевым или единичным. Таким образом, невозможно обнаружить стирание контрольного слова.

Размещение сообщения

6-слой (41 × 41) Ацтекский код опорного показ сетка.

Полный ацтекский кодовый символ, помимо ядра, имеет «справочную сетку» из чередующихся черных и белых пикселей, занимающих каждую 16-ю строку и столбец. Эти известные пиксели позволяют читателю поддерживать выравнивание по пиксельной сетке над большими символами. Для 4 слоев (31 × 31 пиксель) он состоит только из одиночных линий, идущих наружу от ядра, продолжающих чередующийся узор. Однако внутри 5-го слоя дополнительные строки и столбцы чередующихся пикселей вставляются на ± 16 пикселей от центра, поэтому 5-й слой расположен на ± 17 и ± 18 пикселей от центра, а 5-слойный символ имеет размер 37 × 37 пикселей. .

Кроме того, дополнительные строки и столбцы координатной сетки вставлены ± 32 пикселя от центра, что делают символ а 12-слоя 67 × 67 пикселей. В этом случае 12-й слой занимает кольца ± 31 и ± 33 пикселя от центра. Образец продолжается до бесконечности наружу, с 15-пиксельными блоками данных, разделенных строками и столбцами исходной сетки.

Один из способов создания символа - полностью удалить опорную сетку и начать с ядра 14 × 14 пикселей, центрированного на белом квадрате 2 × 2 пикселя. Затем разбейте его на блоки размером 15 × 15 пикселей и вставьте между ними опорную сетку.

Сообщение режима начинается в верхнем левом углу ядра и оборачивается вокруг него по часовой стрелке слоем толщиной 1 бит. Он начинается со старшего разряда числа слоев и заканчивается контрольными словами. Для компактного кода Aztec он разбит на четыре 7-битных части, чтобы оставить место для отметок ориентации. Для полного кода Aztec он разбит на четыре 10-битных части, каждая из которых делится пополам с помощью справочной сетки.

В некоторых случаях общая емкость матрицы не делится равномерно на полные кодовые слова. В таких случаях основное сообщение дополняется 0 битами в начале. Эти биты не включаются в вычисление контрольного слова и должны быть пропущены во время декодирования. Общая емкость матрицы для полного символа может быть рассчитана как (112 + 16 * L) * L для полного ацтекского кода и (88 + 16 * L) * L для компактного ацтекского кода, где L - размер символа в слоях. .[4] Например, общая емкость матрицы компактного кода Aztec с 1 слоем составляет 104 бита. Поскольку кодовые слова составляют шесть битов, это дает 17 кодовых слов и два дополнительных бита. Два нулевых бита добавляются к сообщению в качестве заполнения и должны быть пропущены во время декодирования.

Расширенное основное сообщение начинается в левом верхнем углу всего символа и закручивается по спирали вокруг него. против часовой стрелки в 2-битном слое, заканчивающемся прямо над верхним левым углом ядра. Это помещает заполненные битами слова данных, для которых могут быть обнаружены стирания, на самых внешних слоях символа, которые наиболее подвержены стиранию. Контрольные слова хранятся ближе к ядру. Последнее контрольное слово заканчивается чуть выше левого верхнего угла яблочка.

Когда ядро ​​находится в его стандартной ориентации, первый бит первого слова данных размещается в верхнем левом углу, а дополнительные биты размещаются в столбце шириной 2 бита слева направо и сверху вниз. Это продолжается до 2-х рядов от нижнего края символа, когда шаблон поворачивается на 90 градусов против часовой стрелки, и продолжается в 2-битном верхнем ряду снизу вверх и слева направо. После 4-х четвертей одинакового размера спираль продолжается до верхнего левого угла следующего внутреннего слоя, заканчиваясь на один пиксель выше левого верхнего угла ядра.

Наконец, 1 бит печатается как черные квадраты, а 0 бит печатается как белые квадраты.

Применение

Онлайн-билет от Deutsche Bahn. Обратите внимание, что штрих-код Aztec в этом образце билета не читается.

Транспорт

Штрих-код ацтекского кода широко используется для оформления транспортных билетов.

Кодекс Aztec был выбран авиационной отраслью (ИАТА BCBP стандарт) для электронных посадочных талонов. Некоторые авиакомпании отправляют ацтекские коды на мобильные телефоны пассажиров в качестве посадочных талонов. Они часто интегрируются с приложениями на телефонах пассажиров, в том числе Кошелек Apple.

Коды ацтеков также используются на железных дорогах, в том числе Тегеранский Метро, Евростар, Deutsche Bahn, DSB, Ческе Драхи, Словацкие железные дороги, Словенские железные дороги, Хорватские железные дороги, Trenitalia, Nederlandse Spoorwegen, ПКП Интерсити, VR Group, Национальная железная дорога, По железной дороге, Швейцарские федеральные железные дороги, SNCB и SNCF для билетов, проданных онлайн и распечатанных клиентами или отображаемых на экранах мобильных телефонов. Код Aztec сканируется портативным сканером персоналом в поезде или на турникете для подтверждения билета.

Правительственный

Документы на регистрацию автомобиля в Польша содержат сводку, сжатую алгоритмом NRV2E, закодированную как Aztec Code. В настоящее время ведутся работы, позволяющие компаниям по страхованию автомобилей автоматически вводить соответствующую информацию на основе цифровых фотографий документа в качестве первого шага при заключении нового договора страхования.

Федеральная налоговая служба в Россия кодирует платежную информацию в налоговых уведомлениях как код Aztec.

Коммерческий

Много счета в Канаде теперь также используют эту технологию, в том числе ИстЛинк (компания), Шоу кабель, Белл Алиант и многое другое.

использованная литература

  1. ^ а б *США 5591956, Лонгакр младший, Эндрю И Роберт Хасси, "Двумерная структура кодирования данных и символика для использования с оптическими считывающими устройствами", опубликовано 15 мая 1995 г., выпущено 7 января 1997 г. 
  2. ^ Официальная газета. Патентное ведомство США. 17 июня 1997 г. Настоящим посвящается публике весь срок действия указанного патента. Щелкните «изображения», затем «исправление», чтобы увидеть посвящение общественному достоянию.
  3. ^ Расс Адамс. «Страница с двумерным штрих-кодом». Получено 2009-07-09.
  4. ^ http://recog.ru/blog/standarts/6.html

внешние ссылки