Контрольная сумма - Checksum

Эффект типичной функции контрольной суммы (Unix cksum полезность)

А контрольная сумма малогабаритный датум полученный из блокировать из цифровые данные с целью обнаружение ошибок которые могли быть введены во время коробка передач или же место хранения. Сами по себе контрольные суммы часто используются для проверки целостности данных, но не используются для проверки данных. подлинность.

В процедура который генерирует эту контрольную сумму, называется функция контрольной суммы или же алгоритм контрольной суммы. В зависимости от целей разработки хороший алгоритм контрольной суммы обычно выводит существенно другое значение, даже при небольших изменениях, внесенных во входные данные. Особенно это касается криптографические хеш-функции, который может использоваться для обнаружения множества ошибок повреждения данных и проверки в целом целостность данных; если вычисленная контрольная сумма для текущего ввода данных совпадает с сохраненным значением ранее вычисленной контрольной суммы, существует очень высокая вероятность того, что данные не были случайно изменены или повреждены.

Функции контрольной суммы связаны с хэш-функции, отпечатки пальцев, функции рандомизации, и криптографические хеш-функции. Однако у каждой из этих концепций разные приложения и, следовательно, разные цели проектирования. Например, функция, возвращающая начало строки, может предоставить хэш, подходящий для некоторых приложений, но никогда не будет подходящей контрольной суммой. Контрольные суммы используются как криптографические примитивы в более крупных алгоритмах аутентификации. Для криптографических систем с этими двумя конкретными целями проектирования см. HMAC.

Проверить цифры и биты четности - особые случаи контрольных сумм, подходящие для небольших блоков данных (например, Номера социального страхования, банковский счет числа компьютерные слова, Один байты, так далее.). Немного коды с исправлением ошибок основаны на специальных контрольных суммах, которые не только обнаруживают типичные ошибки, но также позволяют в определенных случаях восстанавливать исходные данные.

Алгоритмы

Байт четности или слово четности

Самый простой алгоритм контрольной суммы - это так называемый продольная проверка четности, который разбивает данные на «слова» с фиксированным числом п бит, а затем вычисляет Эксклюзивный или (XOR) всех этих слов. Результат добавляется к сообщению как дополнительное слово. Чтобы проверить целостность сообщения, получатель вычисляет исключающее или всех его слов, включая контрольную сумму; если результат не является словом, состоящим из п нули, получатель знает, что произошла ошибка передачи.

С этой контрольной суммой любая ошибка передачи, которая переворачивает один бит сообщения или нечетное количество битов, будет обнаружена как неправильная контрольная сумма. Однако ошибка, затрагивающая два бита, не будет обнаружена, если эти биты находятся в одной позиции в двух разных словах. Также замена двух или более слов не будет обнаружена. Если затронутые биты независимо выбраны случайным образом, вероятность того, что двухбитовая ошибка не будет обнаружена, равна 1 /п.

Сумма дополнения

Вариант предыдущего алгоритма состоит в том, чтобы добавить все «слова» как двоичные числа без знака, отбросив любые биты переполнения, и добавить два дополнения от общей суммы в качестве контрольной суммы. Чтобы подтвердить сообщение, получатель таким же образом складывает все слова, включая контрольную сумму; если результат не является словом, полным нулей, вероятно, произошла ошибка. Этот вариант также обнаруживает любые однобитовые ошибки, но промодульная сумма используется в SAE J1708.[1]

Зависит от позиции

Простые контрольные суммы, описанные выше, не позволяют обнаружить некоторые общие ошибки, которые затрагивают сразу несколько битов, такие как изменение порядка слов данных или вставка или удаление слов со всеми битами, установленными в ноль. Наиболее часто используемые на практике алгоритмы контрольной суммы, такие как Контрольная сумма Флетчера, Адлер-32, и циклический контроль избыточности (CRC) устраняют эти недостатки, учитывая не только значение каждого слова, но и его положение в последовательности. Эта функция обычно увеличивает Стоимость вычисления контрольной суммы.

Нечеткая контрольная сумма

Идея нечеткой контрольной суммы была разработана для обнаружения электронный спам путем создания кооперативных баз данных от нескольких интернет-провайдеров электронной почты, подозреваемой в спаме. Содержание такого спама часто может отличаться по деталям, что делает обычное вычисление контрольной суммы неэффективным. Напротив, «нечеткая контрольная сумма» сокращает основной текст до характерного минимума, а затем генерирует контрольную сумму обычным образом. Это значительно увеличивает вероятность того, что несколько различающиеся спам-письма будут давать одинаковую контрольную сумму. Программное обеспечение для обнаружения спама интернет-провайдера, такое как SpamAssassin, сотрудничающих интернет-провайдеров отправляет контрольные суммы всех электронных писем в централизованную службу, такую ​​как DCC. Если количество отправленных нечетких контрольных сумм превышает определенный порог, база данных отмечает, что это, вероятно, указывает на спам. Пользователи службы ISP аналогичным образом генерируют нечеткую контрольную сумму для каждого из своих электронных писем и запрашивают службу на предмет вероятности спама.[2]

Общие Соображения

Сообщение, которое м бит длиной можно рассматривать как угол м-мерный гиперкуб. Эффект алгоритма контрольной суммы, который дает n-битную контрольную сумму, заключается в отображении каждого м-битовое сообщение в угол большего гиперкуба с измерением . 2м+п углы этого гиперкуба представляют все возможные полученные сообщения. Допустимые полученные сообщения (те, которые имеют правильную контрольную сумму) составляют меньший набор, всего 2м углы.

Тогда однобитовая ошибка передачи соответствует смещению от допустимого угла (правильное сообщение и контрольная сумма) к одному из м смежные углы. Ошибка, влияющая на k бит перемещает сообщение в угол, который k ступеньки удалены из правильного угла. Цель хорошего алгоритма контрольной суммы состоит в том, чтобы раздвинуть допустимые углы как можно дальше друг от друга, чтобы увеличить вероятность того, что «типичные» ошибки передачи окажутся в недопустимом углу.

Смотрите также

Общая тема

Исправление ошибки

Хеш-функции

Связанные понятия

Рекомендации

  1. ^ "SAE J1708". Kvaser.com. Архивировано из оригинал 11 декабря 2013 г.
  2. ^ «IXhash». Apache. Получено 7 января 2020.

внешняя ссылка