КЕДР-ФОКС - CEDAR-FOX

Это программный комплекс для судебной экспертизы. сравнение почерка. Он был разработан в КЕДР, Центр передового опыта в области анализа и распознавания документов при Университете Буффало.[1][2][3] КЕДР-ФОКС имеет возможности для взаимодействия с эксперт по проверке документов для прохождения этапов обработки, таких как извлечение интересующих областей из отсканированного документа, определение строк и слов текста, распознавание текстовых элементов. Конечная цель - сравнить два образца письма, чтобы определить логарифмическое отношение правдоподобия при гипотезах обвинения и защиты. Его также можно использовать для сравнения образцов подписей. Программное обеспечение, защищенное патентом США. [4] можно получить по лицензии от Cedartech, Inc.

Подробности

Проверка писателя - это задача определить, написаны ли два рукописных образца одним и тем же писателем или нет. Он используется экспертом по проверке документов. Используя набор показателей, CedarFox может связать меру уверенности, написаны ли два документа одним и тем же человеком или разными людьми. CedarFox позволяет вам выбрать либо весь документ, либо определенную область документа, чтобы получить сравнение. Сравнение основано на макро-характеристиках (которые измеряют глобальные характеристики, такие как наклон, возможность соединения и т. Д.), Микро-функциях (которые основаны на индивидуальных формах символов) и стилевых характеристиках (например, формах пар символов или биграммах). Доступны два различных режима проверки автора: (i) сомнительный документ сравнивается с одним известным документом (основанием для этого сравнения является статистика, основанная на том, сколько вариантов может быть у человека), и (ii) сравнивается сомнительный документ. против "нескольких известных" документов. Здесь система узнает из известных документов о писательских привычках. Для использования этого режима должно быть доступно как минимум четыре известных документа. Задача идентификации пользователя разбита на две части:

Обработка документов и извлечение признаков

CEDAR-FOX выполняет множество операций с документами, чтобы подготовить их для сравнения. Они включают определение порога, удаление строк, сегментацию строк, сегментацию слов и отображение транскриптов.

Проанализируйте свойство изображения.

Обработка изображений

  • Установление пороговых значений преобразует изображение шкалы серого в двоичное для отделения пикселя переднего плана от пикселя фона. Используемые методы определения пороговых значений - это определение порога Оцу, адаптивное определение порога и определение порога текстуры.
  • Если документ написан на бумаге с линиями правил, пользователь может выполнить операцию удаления подчеркивания. Для этой операции применяется преобразование Хафа, и пользователь может выбрать для него правильный порог. Выбор высокого порога приведет к удалению некоторых штрихов символов, и пользователь должен будет подобрать правильное значение для порога.
  • Сегментация строк разделяет каждую строку в документе и использует концепцию двумерной гауссовой плотности. Сегментация слов действует аналогичным образом и разделяет каждое слово в документе.
    Сегментация слов.
  • Сопоставление стенограмм - это сопоставление достоверных данных, при котором программному обеспечению предоставляется текстовый файл, содержащий расшифровку рукописного изображения. Это полезно, когда разные субъекты должны написать от руки одно и то же содержимое, а затем оно сопоставляется с неизвестным документом. Он находит лучшее выравнивание на уровне слов между транскриптом и рукописным изображением. Изображения персонажей извлекаются и могут использоваться для сравнения сходства между документами.

Системные утилиты

CedarFox имеет пользовательский интерфейс для прямого сканирования документов, а также для ввода результатов непосредственно в электронные таблицы и для печати промежуточных результатов. Доступ к базе данных также доступен для хранения метаданных документа.

Сравнение документов

CEDAR-FOX предлагает множество опций для сравнения документов. Используются четыре основные модели верификации:

  • Выявление различающих элементов.
Функции делятся на макро (глобальные) и микро (локальные). Макро-функции рассчитываются для всего документа, тогда как Микро-функции рассчитываются для выбранных символов / биграмм / слов. Макро-функции основаны на шкале серого, на основе контура, на основе наклона, ширины штриха, наклона, высоты и промежутка между словами. Эти функции используются для сравнения.
  • Отображение пространственного объекта в расстояние с помощью мера сходства.
Сравнение карт документа от пространственного объекта к пространственному пространству. Макро-функции имеют реальную ценность, поэтому отображение на расстояние между двумя объектами является абсолютной разницей. Сходство для двоичного признака можно вычислить, используя расстояние Хэмминга, Евклидово расстояние и так далее. В качестве наилучшего показателя рекомендуется использовать показатель корреляционного сходства.
  • Параметрическое моделирование пространственного распределения расстояний с использованием pdf.
Распределение для расстояния в пространстве моделируется с использованием функции плотности вероятности, которая представлена ​​как распределение Гаусса или Гамма. характер документов влияет на микрокомпоненты, но не на макрофункции. Рассчитывается коэффициент правдоподобия (LR), за которым следует логарифмический коэффициент правдоподобия (LLR).
  • Вычисление силы доказательства из 9 баллов.
LLR отображается по 9-балльной качественной шкале. Эта шкала соответствует силе доказательства, связанной со значением LLR. Он соответствует 9-балльной шкале технологии ASTM. [1 - Определено как то же самое, 2 - Высокая вероятность, 3 - Вероятно, 4 - Показания имели, 5 - Нет заключения, 6 - Нет, 7 - Вероятно, нет, 8 - С высокой степенью вероятности нет, 9 - Определено как Устранение].

Поиск

CedarFox имеет несколько способов поиска в рукописных документах ключевых слов. Определение слов позволяет пользователю выбрать изображение слова в качестве запроса, который используется для поиска похожих изображений слов в указанном документе. Другой тип поиска позволяет пользователю ввести слово, которое используется для ранжирования всех слов в документе (ах) с точки зрения того, насколько вероятно слово соответствует запросу.

Распознавание почерка

CedarFox имеет возможность автоматического распознавания символов. Также встроено распознавание слов с заранее заданной лексикой. Пользователь также может вручную вводить идентификационные данные символов, если требуется наивысшая точность распознавания символов с целью проверки / идентификации писателя.

Сравнение образцов почерка.

Разборчивость и анализ читаемости

Поддерживается сравнение пропусков слов и сравнение с метриками Палмера.

Рекомендации

  1. ^ С. Н. Шрихари, Ч. Хуанг и Х. Шринивасан, «О различимости почерка близнецов», Журнал судебной медицины В архиве 2010-11-23 на Wayback Machine , Март 2008, т. 53 (2), стр. 430-446
  2. ^ Шрихари С. Н., С. Х. Ча, Х. Арора и С. Ли, «Индивидуальность почерка»,Журнал судебной медицины В архиве 2010-11-23 на Wayback Machine, 2002, 47(4): 856-872
  3. ^ С. Н. Шрихари, Х. Сринивасан и К. Десаи, "Проверка документов с помощью CEDAR-FOX",Журнал судебно-медицинской экспертизы документов, 18, 2007, стр. 1-20
  4. ^ С. Н. Шрихари и др., Метод и устройство для анализа и / или сравнения рукописных или биометрических образцов, Патент США № 7,580,551, 29 августа 2009 г.

внешняя ссылка