Парадокс Сайреса - Википедия - Sayres paradox

Парадокс Сэйра это дилемма, возникающая при разработке автоматизированных распознавание почерка системы. Стандартное утверждение парадокса состоит в том, что слово, написанное курсивом, не может быть распознано, не будучи сегментированный и не может быть сегментирован, не будучи распознанным.[1] Парадокс был впервые сформулирован в публикации 1973 г. Кеннет М. Сэйр, в честь которого он был назван.[2]

Природа проблемы

Относительно легко разработать автоматизированные системы, способные распознавать слова, написанные в печатном формате. Такие слова разбиваются на буквы в момент написания их на странице. При наличии шаблонов, соответствующих типичной форме букв на данном языке, отдельные буквы можно идентифицировать с высокой степенью вероятности. В случаях двусмысленности возможные последовательности букв можно сравнить с набором правильно написанных слов на этом языке (называемых лексиконом).[3] При необходимости можно применить синтаксические особенности языка для в целом точной идентификации рассматриваемых слов.[4] Подобные системы распознавания печатных знаков обычно используются при обработке стандартных правительственных форм, сортировке почты по почтовому индексу и т. Д.

Однако при скорописном письме буквы, составляющие данное слово, обычно идут последовательно без промежутков между ними. В отличие от последовательности печатных букв, буквы, соединенные курсивом, заранее не сегментируются. Здесь в игру вступает парадокс Сэйра. Если слово уже не сегментировано на буквы, методы сопоставления шаблонов, подобные описанным выше, не могут быть применены. То есть сегментация - это предварительное условие для распознавания слов. Но не существует надежных методов разбивки слова на буквы, если само слово не идентифицировано. Для распознавания слов требуется сегментация букв, а сегментация букв требует распознавания слов. Система распознавания курсивного письма, использующая стандартные методы сопоставления шаблонов, не может выполнять и то и другое одновременно.

Преимущества, которые можно получить за счет использования автоматизированных систем распознавания курсивного письма, включают маршрутизацию почты с рукописными адресами, чтение рукописных банковских чеков и автоматическую оцифровку рукописных документов.[5] Это практические стимулы для поиска способов обойти парадокс Сейра.

Как избежать парадокса

Один из способов смягчить неблагоприятные последствия парадокса - нормализовать распознавание надписей. Нормализация сводится к устранению идиосинкразии в почерке писателя, например необычного наклона букв и необычного наклона курсивной линии.[6] Эта процедура может повысить вероятность правильного совпадения с шаблоном письма, что приведет к постепенному повышению уровня успешности системы. Однако, поскольку улучшение такого рода все еще зависит от точной сегментации, оно остается объектом ограничений парадокса Сейра.[7] Исследователи пришли к выводу, что единственный способ обойти парадокс - это использовать процедуры, не основанные на точной сегментации.[8]

Направления текущих исследований

Сегментация является точной в той мере, в какой она соответствует различию букв в фактических надписях, представленных системе для распознавания (входные данные). Иногда это называют «явной сегментацией».[9] «Неявная сегментация», напротив, представляет собой разделение курсивной линии на большее количество частей, чем количество букв в самой курсивной строке. Обработка этих «неявных частей» для достижения окончательной идентификации слов требует определенных статистических процедур, включающих Скрытые марковские модели (ХМ).

А Марковская модель представляет собой статистическое представление случайного процесса, то есть процесса, в котором будущие состояния не зависят от состояний, произошедших до настоящего. В таком процессе данное состояние зависит только от условной вероятности его следования за состоянием непосредственно перед ним. Примером может служить серия результатов последовательных бросков кубика. HMM - это марковская модель, отдельные состояния которой полностью не известны. Условные вероятности между состояниями все еще определены, но идентичность отдельных состояний полностью не раскрыта.

Распознавание происходит путем сопоставления HMM слов, подлежащих распознаванию, с заранее подготовленными HMM слов в лексиконе. Лучшее совпадение в данном случае используется для обозначения подлинности рассматриваемого рукописного слова. Как и в случае с системами, основанными на явной сегментации, автоматизированные системы распознавания, основанные на неявной сегментации, оцениваются как более или менее успешные в соответствии с процентом выполненных ими правильных идентификаций.

Вместо явных методов сегментации в большинстве автоматизированных систем распознавания рукописного текста сегодня используется неявная сегментация в сочетании с процедурами сопоставления на основе HMM.[10] Ограничения, воплощенные в парадоксе Сейра, в значительной степени ответственны за этот сдвиг в подходе.

Рекомендации

  1. ^ См. Докторскую диссертацию Алессандро Винчиарелли «Автономный рукописный ввод: от слова к распознаванию текста» (http://infoscience.epfl.ch/record/82879 ). См. Также Машинное обучение: теория и приложения, Vol. 31 Справочника по статистике, под ред. Б. В. Эльзевьера, с. 422 (https://one.overdrive.com/media/1358341/machine-learning-theory-and-applications ).
  2. ^ Кеннет М. Сэйр, «Машинное распознавание рукописных слов: отчет о проекте», «Распознавание образов», Pergamon Press, Vol. 5, 1973, стр. 213-228.
  3. ^ Алессандро Винчиарелли, «Обзор [sic] автономного курсивного распознавания слов», «Распознавание образов», Vol. 35, выпуск 7. Июль 2002 г., стр. 1433–1446.
  4. ^ См. «Введение статистической информации в синтаксический анализатор для распознавания изображений документов» Андре О. Маронезе, Бертран Куашон и Орели Леметр (http://proceedings.spiedigitallibrary.org/proceeding.aspx?articleid=731511 ).
  5. ^ См. Алессандро Винчиарелли, «Offline Cursive Handwriting: From Word to Text Recognition», op. соч.
  6. ^ Алессандро Винчиарелли, «Обзор [sic] автономного курсивного распознавания слов», op. соч.
  7. ^ Алессандро Винчиарелли, «Автономный рукописный ввод: от слова к распознаванию текста», op. соч.
  8. ^ Алессандро Винчиарелли, «Автономный рукописный ввод: от слова к распознаванию текста», op. соч.
  9. ^ Алессандро Винчиарелли, «Обзор [sic] автономного курсивного распознавания слов», op. соч.
  10. ^ Алессандро Винчиарелли, «Автономный рукописный ввод: от слова к распознаванию текста», op. соч.

внешняя ссылка