КЕДР-ФОКС - CEDAR-FOX
Это программный комплекс для судебной экспертизы. сравнение почерка. Он был разработан в КЕДР, Центр передового опыта в области анализа и распознавания документов при Университете Буффало.[1][2][3] КЕДР-ФОКС имеет возможности для взаимодействия с эксперт по проверке документов для прохождения этапов обработки, таких как извлечение интересующих областей из отсканированного документа, определение строк и слов текста, распознавание текстовых элементов. Конечная цель - сравнить два образца письма, чтобы определить логарифмическое отношение правдоподобия при гипотезах обвинения и защиты. Его также можно использовать для сравнения образцов подписей. Программное обеспечение, защищенное патентом США. [4] можно получить по лицензии от Cedartech, Inc.
Подробности
Проверка писателя - это задача определить, написаны ли два рукописных образца одним и тем же писателем или нет. Он используется экспертом по проверке документов. Используя набор показателей, CedarFox может связать меру уверенности, написаны ли два документа одним и тем же человеком или разными людьми. CedarFox позволяет вам выбрать либо весь документ, либо определенную область документа, чтобы получить сравнение. Сравнение основано на макро-характеристиках (которые измеряют глобальные характеристики, такие как наклон, возможность соединения и т. Д.), Микро-функциях (которые основаны на индивидуальных формах символов) и стилевых характеристиках (например, формах пар символов или биграммах). Доступны два различных режима проверки автора: (i) сомнительный документ сравнивается с одним известным документом (основанием для этого сравнения является статистика, основанная на том, сколько вариантов может быть у человека), и (ii) сравнивается сомнительный документ. против "нескольких известных" документов. Здесь система узнает из известных документов о писательских привычках. Для использования этого режима должно быть доступно как минимум четыре известных документа. Задача идентификации пользователя разбита на две части:
Обработка документов и извлечение признаков
CEDAR-FOX выполняет множество операций с документами, чтобы подготовить их для сравнения. Они включают определение порога, удаление строк, сегментацию строк, сегментацию слов и отображение транскриптов.
Обработка изображений
- Установление пороговых значений преобразует изображение шкалы серого в двоичное для отделения пикселя переднего плана от пикселя фона. Используемые методы определения пороговых значений - это определение порога Оцу, адаптивное определение порога и определение порога текстуры.
- Если документ написан на бумаге с линиями правил, пользователь может выполнить операцию удаления подчеркивания. Для этой операции применяется преобразование Хафа, и пользователь может выбрать для него правильный порог. Выбор высокого порога приведет к удалению некоторых штрихов символов, и пользователь должен будет подобрать правильное значение для порога.
- Сегментация строк разделяет каждую строку в документе и использует концепцию двумерной гауссовой плотности. Сегментация слов действует аналогичным образом и разделяет каждое слово в документе.
- Сопоставление стенограмм - это сопоставление достоверных данных, при котором программному обеспечению предоставляется текстовый файл, содержащий расшифровку рукописного изображения. Это полезно, когда разные субъекты должны написать от руки одно и то же содержимое, а затем оно сопоставляется с неизвестным документом. Он находит лучшее выравнивание на уровне слов между транскриптом и рукописным изображением. Изображения персонажей извлекаются и могут использоваться для сравнения сходства между документами.
Системные утилиты
CedarFox имеет пользовательский интерфейс для прямого сканирования документов, а также для ввода результатов непосредственно в электронные таблицы и для печати промежуточных результатов. Доступ к базе данных также доступен для хранения метаданных документа.
Сравнение документов
CEDAR-FOX предлагает множество опций для сравнения документов. Используются четыре основные модели верификации:
- Выявление различающих элементов.
- Функции делятся на макро (глобальные) и микро (локальные). Макро-функции рассчитываются для всего документа, тогда как Микро-функции рассчитываются для выбранных символов / биграмм / слов. Макро-функции основаны на шкале серого, на основе контура, на основе наклона, ширины штриха, наклона, высоты и промежутка между словами. Эти функции используются для сравнения.
- Отображение пространственного объекта в расстояние с помощью мера сходства.
- Сравнение карт документа от пространственного объекта к пространственному пространству. Макро-функции имеют реальную ценность, поэтому отображение на расстояние между двумя объектами является абсолютной разницей. Сходство для двоичного признака можно вычислить, используя расстояние Хэмминга, Евклидово расстояние и так далее. В качестве наилучшего показателя рекомендуется использовать показатель корреляционного сходства.
- Параметрическое моделирование пространственного распределения расстояний с использованием pdf.
- Распределение для расстояния в пространстве моделируется с использованием функции плотности вероятности, которая представлена как распределение Гаусса или Гамма. характер документов влияет на микрокомпоненты, но не на макрофункции. Рассчитывается коэффициент правдоподобия (LR), за которым следует логарифмический коэффициент правдоподобия (LLR).
- Вычисление силы доказательства из 9 баллов.
- LLR отображается по 9-балльной качественной шкале. Эта шкала соответствует силе доказательства, связанной со значением LLR. Он соответствует 9-балльной шкале технологии ASTM. [1 - Определено как то же самое, 2 - Высокая вероятность, 3 - Вероятно, 4 - Показания имели, 5 - Нет заключения, 6 - Нет, 7 - Вероятно, нет, 8 - С высокой степенью вероятности нет, 9 - Определено как Устранение].
Поиск
CedarFox имеет несколько способов поиска в рукописных документах ключевых слов. Определение слов позволяет пользователю выбрать изображение слова в качестве запроса, который используется для поиска похожих изображений слов в указанном документе. Другой тип поиска позволяет пользователю ввести слово, которое используется для ранжирования всех слов в документе (ах) с точки зрения того, насколько вероятно слово соответствует запросу.
Распознавание почерка
CedarFox имеет возможность автоматического распознавания символов. Также встроено распознавание слов с заранее заданной лексикой. Пользователь также может вручную вводить идентификационные данные символов, если требуется наивысшая точность распознавания символов с целью проверки / идентификации писателя.
Разборчивость и анализ читаемости
Поддерживается сравнение пропусков слов и сравнение с метриками Палмера.
Рекомендации
- ^ С. Н. Шрихари, Ч. Хуанг и Х. Шринивасан, «О различимости почерка близнецов», Журнал судебной медицины В архиве 2010-11-23 на Wayback Machine , Март 2008, т. 53 (2), стр. 430-446
- ^ Шрихари С. Н., С. Х. Ча, Х. Арора и С. Ли, «Индивидуальность почерка»,Журнал судебной медицины В архиве 2010-11-23 на Wayback Machine, 2002, 47(4): 856-872
- ^ С. Н. Шрихари, Х. Сринивасан и К. Десаи, "Проверка документов с помощью CEDAR-FOX",Журнал судебно-медицинской экспертизы документов, 18, 2007, стр. 1-20
- ^ С. Н. Шрихари и др., Метод и устройство для анализа и / или сравнения рукописных или биометрических образцов, Патент США № 7,580,551, 29 августа 2009 г.