Алгоритм Верхоффа - Verhoeff algorithm

В Алгоритм Верхоффа[1] это контрольная сумма формула для обнаружение ошибок разработан голландским математиком Якобус Верхофф и впервые был опубликован в 1969 году.[2][3] Это была первая десятичная дробь контрольная цифра алгоритм, который обнаруживает все однозначные ошибки и все ошибки транспонирования, связанные с двумя соседними цифрами,[4] что в то время казалось невозможным с таким кодом.

Цели

Верхофф поставил перед собой цель найти десятичный код, в котором контрольная цифра является одной десятичной цифрой, который обнаружил все однозначные ошибки и все перестановки соседних цифр. В то время предполагаемые доказательства несуществования[5] из этих кодов сделали коды base-11 популярными, например, в Контрольная цифра ISBN.

Его цели также были практическими, и он основывал оценку различных кодов на оперативных данных голландской почтовой системы, используя систему взвешенных баллов для различных видов ошибок. Анализ разбил ошибки на несколько категорий: во-первых, по количеству ошибочных цифр; для тех, у кого две цифры ошибочны, есть транспозиции (abба), двойняшки (аа â † ’'bb'), прыжковые транспозиции (abccba), фонетический (а0), и прыгать близнецы (абаcbc). Дополнительно пропущены и добавлены цифры. Хотя частота некоторых из этих видов ошибок может быть небольшой, некоторые коды могут быть невосприимчивы к ним в дополнение к основным целям обнаружения всех одиночных чисел и транспозиций.

Фонетические ошибки, в частности, показали лингвистические эффекты, потому что в голландском языке числа обычно читаются парами; а также, хотя 50 звучит как 15 в голландском языке, 80 не звучит как 18.

Взяв в качестве примера шестизначные числа, Верхофф сообщил о следующей классификации ошибок:

Ошибочные цифрыКлассификацияСчитатьЧастота
1Транскрипция9,57479.05%
2Транспозиции1,23710.21%
Двойняшки670.55%
Фонетический590.49%
Другие смежные2321.92%
Прыжковые транспозиции990.82%
Прыгать близнецы350.29%
Другие ошибки прыжка430.36%
Другой980.81%
31691.40%
41180.97%
52191.81%
61621.34%
Общий12,112

Описание

Верхофф разработал свой алгоритм, используя свойства группа диэдра порядка 10 (некоммутативная система операций над десятью элементами, что соответствует повороту и отражению правильного пятиугольника) в сочетании с перестановкой. Он утверждал, что это было первое практическое использование двугранной группы, и подтвердил принцип, что в конце концов вся прекрасная математика найдет себе применение.[6] хотя на практике алгоритм будет реализован с использованием простых таблицы поиска без необходимости понимать, как создавать эти таблицы из базовой теории групп и перестановок.

Это более правильно рассматривать как семейство алгоритмов, поскольку возможны и другие перестановки, и это обсуждается в трактовке Верхоффа. Он отмечает, что эта конкретная перестановка,

является особенным, так как имеет свойство обнаруживать 95,3% фонетических ошибок.[7]

Сильные стороны алгоритма заключаются в том, что он обнаруживает все ошибки транслитерации и транспонирования, а также большинство двойных, двойных прыжков, прыжковых транспозиций и фонетических ошибок.

Основная слабость алгоритма Верхоффа - его сложность. Требуемые расчеты нелегко выразить в виде формулы. Таблицы подстановки необходимы для упрощения вычислений. Аналогичный код - это Алгоритм дамма, обладающий схожими качествами.

Табличный алгоритм

Алгоритм Верхоффа может быть реализован с использованием трех таблиц: таблица умножения d, обратная таблица inv, и таблица перестановок п.

Первая таблица, d, основана на умножении в группе диэдра D5.[9] и это просто Стол Кэли группы. Обратите внимание, что эта группа не коммутативный, то есть для некоторых значений j и k, d(j,k) ≠ d(k, j).

Обратная таблица inv представляет собой мультипликативную обратную цифру, то есть значение, которое удовлетворяет d(j, inv(j)) = 0.

Таблица перестановок п применяет перестановка к каждой цифре в зависимости от ее позиции в номере. На самом деле это единственная перестановка (1 5 8 9 4 2 7 0) (3 6), применяемая итеративно; т.е. п(я+j,п) = п(я, п(j,п)).

Расчет контрольной суммы Верхоффа выполняется следующим образом:

  1. Создать массив п из отдельных цифр номера, взятых справа налево (крайняя правая цифра п0, так далее.).
  2. Инициализировать контрольную сумму c до нуля.
  3. Для каждого индекса я массива п, начиная с нуля, заменить c с d (c, p (i mod 8, nя)).

Исходный номер действителен тогда и только тогда, когда с = 0.

Чтобы создать контрольную цифру, добавьте 0, произведите расчет: правильная контрольная цифра inv (c).

Примеры

Рекомендации

  1. ^ Verhoeff, J. (1969). Ошибка при обнаружении десятичных кодов (тракт 29). Математический центр, Амстердам. Дои:10.1002 / zamm.19710510323.
  2. ^ Киртланд, Джозеф (2001). Идентификационные номера и схемы контрольных цифр. Математическая ассоциация Америки. п. 153. ISBN  0-88385-720-0. Получено 26 августа, 2011.
  3. ^ Саломон, Дэвид (2005). Кодирование для данных и компьютерных коммуникаций. Springer. п. 56. ISBN  0-387-21245-0. Получено 26 августа, 2011.
  4. ^ Хаунспергер, Дина; Кеннеди, Стивен, ред. (2006). Край Вселенной: празднование десятилетия математических горизонтов. Математическая ассоциация Америки. п. 38. ISBN  978-0-88385-555-3. LCCN  2005937266. Получено 26 августа, 2011.
  5. ^ Сиссон, Роджер Л., Улучшенная проверка десятичным избыточным кодом, Связь ACM Vol. 1, вып. 5, May 1958, pp10-12, стр. Дои:10.1145/368819.368854.
  6. ^ Верхофф, Дж. (1975). Ошибка обнаружения десятичных кодов (тракт 29), вторая печать. Математический центр, Амстердам.
  7. ^ Verhoeff 1969, стр. 95
  8. ^ Verhoeff 1969, стр. 83
  9. ^ Галлиан, Джозеф А. (2010). Современная абстрактная алгебра (7-е изд.). Брукс / Коул. п.111. ISBN  978-0-547-16509-7. LCCN  2008940386. Получено 26 августа, 2011. контрольная цифра verhoeff.

внешняя ссылка