Оптическое распознавание меток - Optical mark recognition

Оптическое распознавание меток (также называемый оптическое считывание меток и OMR) - это процесс сбора данных, помеченных человеком, из формы документов такие как опросы и тесты. Они используются для чтения анкет, экзаменационных работ с несколькими вариантами ответов в виде линий или заштрихованных областей.

OMR фон

Форма испытания OMR с регистрационными метками и выпадающими цветами, предназначенная для сканирования специальным устройством OMR

Многие традиционные устройства OMR работают с выделенным сканер устройство, которое направляет луч света на бланк. Контрастный отражательная способность в заранее определенных положениях на странице затем используется для обнаружения этих отмеченных областей, поскольку они отражают меньше света, чем пустые области бумаги.

Некоторые устройства OMR используют формы, которые предварительно напечатаны на «трансоптической» бумаге, и измеряют количество света, проходящего через бумагу; таким образом, отметка на обеих сторонах бумаги уменьшит количество света, проходящего через бумагу.

В отличие от специального устройства OMR, настольное программное обеспечение OMR позволяет пользователю создавать свои собственные формы в текстовом редакторе и распечатывать их на лазерном принтере. Затем программное обеспечение OMR работает с обычным настольным сканером изображений с устройством подачи документов для обработки заполненных форм.

OMR обычно отличается от оптическое распознавание символов (OCR) тем, что сложная распознавание образов двигатель не требуется. То есть метки построены таким образом, что вероятность неправильного чтения меток мала. Это действительно требует, чтобы изображение имело высокую контрастность и легко узнаваемую или несущественную форму. Связанное с OMR и OCR поле - это признание штрих-коды, такой как Штрих-код UPC находится на упаковке продукта.

Одним из наиболее известных приложений оптического распознавания знаков является использование Карандаш # 2 (HB в Европе) пузырь оптические листы ответов в вопрос с множественным выбором экзамены. Учащиеся отмечают свои ответы или другую личную информацию темными кружками, отмеченными на заранее распечатанном листе. После этого лист автоматически классифицируется сканирующим устройством. В Соединенных Штатах и ​​большинстве европейских стран горизонтальная или вертикальная «галочка» в прямоугольной «ромбовидной форме» является наиболее часто используемым типом формы OMR; Самым распространенным приложением в Соединенном Королевстве является форма национальной лотереи Великобритании.[нужна цитата ] Таблетки в форме ромбов являются более поздней технологией и имеют то преимущество, что их легче маркировать и легче стирать. Большие «пузырьковые» метки - это технология, унаследованная от очень ранних машин OMR, которые были настолько нечувствительны, что для надежности требовалась большая метка. В большинстве азиатских стран используется специальный маркер для заполнения оптический лист ответов. Учащиеся также отмечают ответы или другую информацию затемненными кружками на заранее распечатанном листе. Затем лист автоматически оценивается сканирующим устройством.

Многие из сегодняшних приложений OMR требуют заполнения специализированных форм. Эти формы оптимизированы для компьютерного сканирования с тщательной регистрацией при печати и тщательным дизайном, чтобы двусмысленность сводилась к минимуму. Благодаря крайне низкому уровню ошибок, низкой стоимости и простоте использования OMR является популярным методом подсчета голосов.[1][2][3][4][5][6][7][8][9][10]

Метки OMR также добавляются к элементам физической почты, чтобы можно было использовать оборудование для вставки папок. Метки добавляются к каждой (обычно лицевой / нечетной) странице почтового документа и состоят из последовательности черных штрихов, которые сканирует устройство для вставки папок, чтобы определить, когда письмо следует сложить, а затем вставить в конверт.

Оптический лист ответов

Ответ на СИДЕЛ вопрос по математике, отмеченный на оптическом листе ответов

An оптический лист ответов или же пузырчатый лист это особый вид форма используется в вопрос с множественным выбором экзамены. Оптическое распознавание меток используется для обнаружения ответов. Самой известной компанией в США, занимающейся оптическими листами ответов, является Scantron Corporation, хотя для некоторых целей требуется собственная настраиваемая система.[нужна цитата ]

Оптические листы ответов обычно имеют набор пустых овалов или квадратов, соответствующих каждому вопросу, часто на отдельных листах бумаги. Штрих-коды может пометить лист для автоматической обработки, и каждая серия заполненных овалов будет возвращать определенное значение при чтении. Таким образом, ответы учащихся могут быть записаны в цифровом виде или идентифицированы.

Чтение

Первые оптические листы с ответами были прочитаны путем прохождения света через лист и измерения того, сколько света было заблокировано с помощью фототрубки с противоположной стороны.[11] Поскольку некоторые фотолаборы в основном чувствительны к синему концу видимый спектр,[12] синие ручки использовать нельзя, так как синие чернила отражают и передавать синий свет. Из-за этого, карандаши номер два пришлось использовать для заполнения пузырей -графит это очень непрозрачный вещество, которое поглощает или отражает большую часть падающего на него света.[11]

Современные оптические листы ответов читаются на основе отраженного света, измерения освещенности и темноты. Их не нужно заполнять карандашом номер два, хотя они рекомендуются по сравнению с другими типами (это из-за более светлых отметок, сделанных карандашами с большим номером, и пятен от карандашей номер 1). Черные чернила будут считываться, хотя многие системы игнорируют метки того же цвета, что и форма.[11] Это также позволяет делать оптические листы ответов двусторонними, потому что отметки, сделанные на противоположной стороне, не будут мешать показаниям отражательной способности так же сильно, как показаниям непрозрачности.

Большинство систем подходят для человеческая ошибка в заполнении овалов неточно - до тех пор, пока они не попадают в другие овалы и овал почти заполнен, сканер определит его как заполненный.

Ошибки

Оптические листы ответов могут быть напечатаны неправильно, так что все овалы будут считаться заполненными. Это происходит, если очертания овалов слишком толстые или неровные. Вовремя 2008 президентские выборы в США, это произошло с более чем 19 000 открепительные удостоверения в Грузия графство Гвиннетт, и был обнаружен после того, как около 10 000 уже были возвращены. Небольшая разница не была очевидна для невооруженным глазом, и не был обнаружен до тех пор, пока в конце октября не был проведен тестовый запуск. Это потребовало всего бюллетени переводить на правильно напечатанные, изолирован работники совет по выборам, под закрытием наблюдение членами Демократичный и Республиканец (но нет Другой ) политические партии и округ шериф депутаты. Передача по закону не могла произойти до день выборов (4 ноября).[нужна цитата ]грамм

Программное обеспечение OMR

Бланк опроса OMR на обычной бумаге без регистрационных меток и выпадающих цветов, предназначенный для сканирования с помощью сканера изображений и программного обеспечения OMR

Программное обеспечение OMR - это компьютерное программное приложение, которое делает возможным OMR на настольном компьютере с помощью Сканер изображений для обработки опросов, тестов, ведомостей посещаемости, контрольных списков и других форм на обычной бумаге, напечатанных на лазерном принтере.

Программное обеспечение OMR используется для сбора данных с листов OMR. Во время сбора данных сканирующие устройства фокусируются на многих факторах, таких как толщина бумаги, размеры листа OMR и шаблон проектирования.

Коммерческое программное обеспечение OMR

Одним из первых пакетов программного обеспечения OMR, в котором использовались изображения с обычных сканеров изображений, был Remark Office OMR, разработанный Gravic, Inc. (первоначально называвшийся Principia Products, Inc.). Remark Office OMR 1.0 был выпущен в 1991 году.

Потребность в программном обеспечении OMR возникла из-за того, что в ранних системах оптического распознавания меток использовались специальные сканеры и специальные предварительно напечатанные формы с выпадающими цветами и регистрационными метками. Такие формы обычно стоят от 0,10 до 0,19 доллара за страницу.[13] Напротив, пользователи программного обеспечения OMR создают свои собственные формы с распознаванием отметок с помощью текстового процессора или встроенного редактора форм, распечатывают их локально на принтере и могут сэкономить тысячи долларов на большом количестве форм.[14]

Идентификация оптических меток в форме, например, для обработки форм переписи, была предложена многими компаниями, занимающимися обработкой форм (пакетный захват транзакций) с конца 1980-х годов. В основном это основано на битональном изображении и количестве пикселей с минимальным и максимальным количеством пикселей для устранения посторонних меток, таких как те, которые стираются грязным ластиком, которые при преобразовании в черно-белое изображение (битональное) могут выглядеть как допустимые метки. . Таким образом, этот метод может вызвать проблемы, когда пользователь передумает, и поэтому некоторые продукты начали использовать оттенки серого, чтобы лучше идентифицировать цель маркера - внутренне скантрон и сканеры NCS использовали оттенки серого.

Программное обеспечение OMR также используется для добавления меток OMR к почтовым документам, чтобы их можно было сканировать с помощью устройства для вставки папок. Примером программного обеспечения OMR является Mail Markup от британского разработчика Funasset Limited. Это программное обеспечение позволяет пользователю настраивать и выбирать последовательность OMR, а затем применять метки OMR к почтовым документам перед печатью.

Библиотеки разработки OMR

КомпанияТоварГод основания
ABBYYABBYY FineReader Engine1993
AccusoftFormFix1991
ЗадаватьЧитатель и парсер .NET OMR2001
GDP picture.NET OMR и SDK для распознавания шаблонов2003
LEAD TechnologiesLEADTOOLS1990
ВинтаСофтПодключаемый модуль .NET для обработки форм2001

Программное обеспечение OMR с открытым исходным кодом

Некоторое программное обеспечение OMR, разработанное и распространяемое под бесплатными лицензиями или лицензиями с открытым исходным кодом:

Список программного обеспечения OMR
ИмяСоздательПримечанияПоследняя стабильная версияРасходы (АМЕРИКАНСКИЙ ДОЛЛАР$ )Лицензия на программное обеспечениеОткрытый исходный код
FormScannerАльберто Борсеттамультиплатформенное приложение Java, поддерживает пользовательские формы2017-06-07СвободныйGPLv3да
queXFАвстралийский консорциум социальных и политических исследований Incorporatedможет использоваться отдельно или вместе с опросами, экспортированными из LimeSurvey2019-05-13СвободныйGPLv2да
Удай ОМРАадитешвар Сет2007СвободныйGPLv2да
Общая система анкет (SQS)2016СвободныйЛицензия Apache v2.0да
Авто множественный выборАлексис Бьенвенюэдля классных тестов с форматированием LaTeX2018-12-29СвободныйGPLv2да
Moodle Викторина OMRонлайн-поддержка автономных викторин, проводимых на листах OMRСвободныйGPLv3да
SDAPS: Скрипты для сбора данных с бумажными опросамиБенджамин Бергдля опросов поддерживает документы в формате LaTeX и ODT2019-06-02СвободныйGPLv3да
OMR Mark EngineРеализация C # поддерживает массовое сканирование с помощью настраиваемых форм2015СвободныйЛицензия Apache v2.0да
G'n'T EvalСтефан Бройниг2013СвободныйЛицензия ISCда

История

Оптическое распознавание метки (OMR) - это сканирование бумаги для обнаружения наличия или отсутствия метки в заранее заданном месте.[4] Оптическое распознавание знаков развилось из нескольких других технологий. В начале 19-го и 20-го века были выданы патенты на машины, которые помогали слепым.[2]

OMR теперь используется как устройство ввода для ввода данных. Две ранние формы OMR: бумажная лента и перфокарты в которых используются настоящие отверстия, пробитые в среде, вместо заполненных карандашом кружков в среде. Бумажная лента использовалась еще в 1857 году как устройство ввода для телеграфа.[10] Перфокарты были созданы в 1890 году и использовались в качестве устройств ввода для компьютеров. Использование перфокарт сильно сократилось в начале 1970-х с появлением персональных компьютеров.[8] В современных OMR, где распознается присутствие карандаша, заполненного пузырем, распознавание осуществляется с помощью оптического сканера.

Первый отметьте смысл сканер был Машина для подсчета результатов теста IBM 805; эти метки считываются путем измерения электропроводности графитового грифеля карандаша с помощью пар проволочных щеток, сканировавших страницу. В 1930-е годы Ричард Уоррен в IBM экспериментировали с системами оптического распознавания меток для оценки результатов тестирования, как описано в патентах США 2150256 (подана в 1932 г., выдана в 1939 г.) и 2,010,653 (подана в 1933 г., выдана в 1935 г.). Первый успешный оптический сканер считывания меток был разработан Эверетт Франклин Линдквист как задокументировано в патенте США 3 050 248 (подана в 1955 г., выдана в 1962 г.). Линдквист разработал множество стандартизированных образовательных тестов и нуждался в более совершенной машине для подсчета результатов, чем тогдашний стандартный IBM 805. Права на патенты Линдквиста принадлежали Исследовательскому центру измерений до 1968 года, когда Университет Айовы продал операцию Westinghouse Corporation.

В тот же период IBM также разработала успешную оптическую машину для оценки распознавания меток, как описано в патенте США 2 944 734 (подана в 1957 г., выдана в 1960 г.). В 1962 году IBM коммерциализировала это в качестве считывающего устройства для оптических оценок IBM 1230. Это и множество связанных с ним компьютеров позволили IBM перенести широкий спектр приложений, разработанных для своих отметьте смысл машины на новую оптическую технологию. Эти приложения включали в себя различные формы управления запасами и отчетов о проблемах, большинство из которых имели размеры стандартных перфокарта.

В то время как другие игроки на арене образовательного тестирования сосредоточились на продаже услуг сканирования, Scantron Корпорация, основанная в 1972 году,[15] была другая модель; он будет распространять недорогие сканеры в школах и получать прибыль от продажи тестовых форм. В результате многие люди стали думать обо всех формах восприятия меток (независимо от того, воспринимаются они оптически или нет) как скантрон формы. Scantron работает как дочерняя компания M&F Worldwide (MFW)[16] и предоставляет системы и услуги тестирования и оценки, а также услуги по сбору и анализу данных для образовательных учреждений, предприятий и правительства.

В 1983 году Westinghouse Learning Corporation была приобретена National Computer Systems (NCS). В 2000 году NCS была приобретена Pearson Education, где технология OMR составила ядро ​​группы управления данными Pearson. В феврале 2008 года M&F Worldwide приобрела группу управления данными у Pearson; группа теперь является частью бренда Scantron.[17]

OMR использовался во многих ситуациях, как указано ниже. Использование OMR в системах инвентаризации было переходом между перфокартами и штрих-кодами и не так часто используется для этой цели.[8] Однако OMR по-прежнему широко используется для опросов и тестирования.

использование

Использование OMR не ограничивается школами или агентствами по сбору данных; многие предприятия и учреждения здравоохранения используют OMR для оптимизации процессов ввода данных и уменьшения ошибок ввода. Технологии OMR, OCR и ICR позволяют собирать данные из бумажных форм. OMR также может быть выполнен с использованием сканера OMR (дискретная считывающая головка) или сканера изображений.[18]

Приложения

Форма ставок OMR, используемая в Японская гоночная ассоциация Ипподром Фукусима, Япония.
Билет для ставок с использованием этой формы.

Есть много других приложений для OMR, например:

Типы полей

OMR имеет разные поля, чтобы предоставить желаемый формат. Эти поля включают:

  • Множественный, где есть несколько вариантов, но выбран только один. Например, форма может запрашивать один из вариантов ABCDE; 12345; совершенно не согласен, не согласен, безразличен, согласен, полностью согласен; или похожие.
  • Сетка: пузыри или линии настроены в формате сетки, чтобы пользователь мог ввести номер телефона, имя, идентификационный номер и так далее.
  • Сложить, суммировать ответы до одного значения
  • Логическое значение, отвечающее да или нет на все применимые
  • Двоичный, отвечая да или нет только на один
  • Поля с пунктирными линиями, разработанные Smartshoot OMR, позволяют убирать границы, как при традиционном падении цвета.

Возможности / требования

В прошлом и в настоящее время для некоторых систем OMR требуется специальная бумага, специальные чернила и специальный считыватель ввода (Bergeron, 1998). Это ограничивает типы вопросов, которые можно задать, и не допускает большого разнообразия при вводе формы. Прогресс в OMR теперь позволяет пользователям создавать и распечатывать свои собственные формы и использовать сканер (желательно с устройством подачи документов) для чтения информации.[19] Пользователь может упорядочивать вопросы в формате, который соответствует их потребностям, при этом при этом имея возможность легко вводить данные.[20] Системы OMR достигают стопроцентной точности и требуют всего 5 миллисекунды в среднем для распознавания знаков.[19] Пользователи могут использовать квадраты, круги, эллипсы и шестиугольники для зоны отметки. Затем программное обеспечение можно настроить на распознавание заполненных пузырьков, крестиков или галочек.

OMR также можно использовать в личных целях. На рынке есть многофункциональные принтеры, которые будут печатать фотографии, выбранные пользователем, путем заполнения пузырьков для выбора размера и выбора бумаги на напечатанном индексном листе. После того, как лист заполнен, человек помещает лист на сканер для сканирования, и принтер распечатывает фотографии в соответствии с указанными отметками.[нужна цитата ]

Недостатки

У OMR также есть некоторые недостатки и ограничения. Если пользователь хочет собрать большие объемы текста, OMR усложняет сбор данных.[21] Также существует вероятность пропуска данных в процессе сканирования, и неправильные или ненумерованные страницы могут привести к их сканированию в неправильном порядке. Кроме того, если не приняты меры предосторожности, страницу можно повторно сканировать, обеспечивая дублирование данных и искажение данных.[19]

В результате широкого распространения и простоты использования OMR стандартизированные экзамены могут состоять в основном из вопросов с несколькими вариантами ответов, что меняет характер того, что проверяется.

Смотрите также

Списки

Рекомендации

  1. ^ «Оптическое распознавание меток». Архивировано из оригинал 13 июня 2006 г.. Получено 13 июня, 2006.
  2. ^ а б Исследования оптического распознавания символов | Научная библиотека Macmillan: компьютерные науки. Bookrags.com. 2010-11-02. Получено 2015-07-03.
  3. ^ «Оптические сканирующие системы -». Aceproject.org. Получено 2015-07-03.
  4. ^ а б Хааг, С., Каммингс, М., Маккаббри, Д., Пинсонно, А., Донован, Р. (2006). Информационные системы управления для информационного века (3-е изд.). Канада: Макгроу-Хилл Райерсон.
  5. ^ «Библиотека статистиков: использование сканеров и программного обеспечения OMR для доступного ввода данных». Архивировано из оригинал 10 ноября 2005 г.. Получено 13 июня, 2006.
  6. ^ «Сбор данных по дешевке». Июль 2015 г. Архивировано с оригинал (PPT) на 2015-07-22. Получено 2015-07-21.
  7. ^ «Remark Office OMR от Gravic (Principia Products) работает с популярными сканерами изображений для сканирования опросов, тестов и других форм на обычной бумаге». Omrsolutions.com. Получено 2015-07-03.
  8. ^ а б c Палмер, Роджер К. (1989, сентябрь) Основы автоматической идентификации [Электронная версия]. Канадские системы данных, 21 (9), 30-33
  9. ^ «Технология обработки форм». Tkvision.com. Архивировано из оригинал на 2008-05-11. Получено 2015-07-03.
  10. ^ а б Устройства ввода для исследований | Научная библиотека Macmillan: компьютерные науки. Bookrags.com. 2010-11-02. Получено 2015-07-03.
  11. ^ а б c Блумфилд, Луи А. «Вопрос 1529: Почему тесты типа скантрон читают только карандаши №2? Могут ли работать другие карандаши?». HowEverythingWorks.org.
  12. ^ Техническое руководство Mullard, том 4, раздел 4: Фотоэмиссионные элементы (издание 1960 г.)
  13. ^ «Архивная копия» (PDF). Архивировано из оригинал (PDF) на 2009-03-20. Получено 2009-03-12.CS1 maint: заархивированная копия как заголовок (связь)
  14. ^ Майкл Вагенхайм. «Оценка экзаменов по биологии в большом государственном университете». RemarkSoftware.com. Получено 2015-07-21.
  15. ^ «Рынок образовательного тестирования». Bc.edu. Получено 2015-07-03.
  16. ^ "M&F Worldwide Corp". Архивировано из оригинал 25 июля 2008 г.. Получено 20 июля, 2008.
  17. ^ "NCS Pearson, Inc". Архивировано из оригинал 14 июня 2010 г.. Получено 14 июня, 2010.
  18. ^ http://datamanagement.scantron.com/pdf/icr-ocr-omr.pdf[мертвая ссылка ]
  19. ^ а б c Бержерон,[ВОЗ? ]
  20. ^ ЛоПрести, 1996 г.[ВОЗ? ]
  21. ^ Зеленый, 2000[ВОЗ? ]