Оптическое распознавание меток - Optical mark recognition
Оптическое распознавание меток (также называемый оптическое считывание меток и OMR) - это процесс сбора данных, помеченных человеком, из формы документов такие как опросы и тесты. Они используются для чтения анкет, экзаменационных работ с несколькими вариантами ответов в виде линий или заштрихованных областей.
OMR фон
Многие традиционные устройства OMR работают с выделенным сканер устройство, которое направляет луч света на бланк. Контрастный отражательная способность в заранее определенных положениях на странице затем используется для обнаружения этих отмеченных областей, поскольку они отражают меньше света, чем пустые области бумаги.
Некоторые устройства OMR используют формы, которые предварительно напечатаны на «трансоптической» бумаге, и измеряют количество света, проходящего через бумагу; таким образом, отметка на обеих сторонах бумаги уменьшит количество света, проходящего через бумагу.
В отличие от специального устройства OMR, настольное программное обеспечение OMR позволяет пользователю создавать свои собственные формы в текстовом редакторе и распечатывать их на лазерном принтере. Затем программное обеспечение OMR работает с обычным настольным сканером изображений с устройством подачи документов для обработки заполненных форм.
OMR обычно отличается от оптическое распознавание символов (OCR) тем, что сложная распознавание образов двигатель не требуется. То есть метки построены таким образом, что вероятность неправильного чтения меток мала. Это действительно требует, чтобы изображение имело высокую контрастность и легко узнаваемую или несущественную форму. Связанное с OMR и OCR поле - это признание штрих-коды, такой как Штрих-код UPC находится на упаковке продукта.
Одним из наиболее известных приложений оптического распознавания знаков является использование Карандаш # 2 (HB в Европе) пузырь оптические листы ответов в вопрос с множественным выбором экзамены. Учащиеся отмечают свои ответы или другую личную информацию темными кружками, отмеченными на заранее распечатанном листе. После этого лист автоматически классифицируется сканирующим устройством. В Соединенных Штатах и большинстве европейских стран горизонтальная или вертикальная «галочка» в прямоугольной «ромбовидной форме» является наиболее часто используемым типом формы OMR; Самым распространенным приложением в Соединенном Королевстве является форма национальной лотереи Великобритании.[нужна цитата ] Таблетки в форме ромбов являются более поздней технологией и имеют то преимущество, что их легче маркировать и легче стирать. Большие «пузырьковые» метки - это технология, унаследованная от очень ранних машин OMR, которые были настолько нечувствительны, что для надежности требовалась большая метка. В большинстве азиатских стран используется специальный маркер для заполнения оптический лист ответов. Учащиеся также отмечают ответы или другую информацию затемненными кружками на заранее распечатанном листе. Затем лист автоматически оценивается сканирующим устройством.
Многие из сегодняшних приложений OMR требуют заполнения специализированных форм. Эти формы оптимизированы для компьютерного сканирования с тщательной регистрацией при печати и тщательным дизайном, чтобы двусмысленность сводилась к минимуму. Благодаря крайне низкому уровню ошибок, низкой стоимости и простоте использования OMR является популярным методом подсчета голосов.[1][2][3][4][5][6][7][8][9][10]
Метки OMR также добавляются к элементам физической почты, чтобы можно было использовать оборудование для вставки папок. Метки добавляются к каждой (обычно лицевой / нечетной) странице почтового документа и состоят из последовательности черных штрихов, которые сканирует устройство для вставки папок, чтобы определить, когда письмо следует сложить, а затем вставить в конверт.
Оптический лист ответов
An оптический лист ответов или же пузырчатый лист это особый вид форма используется в вопрос с множественным выбором экзамены. Оптическое распознавание меток используется для обнаружения ответов. Самой известной компанией в США, занимающейся оптическими листами ответов, является Scantron Corporation, хотя для некоторых целей требуется собственная настраиваемая система.[нужна цитата ]
Оптические листы ответов обычно имеют набор пустых овалов или квадратов, соответствующих каждому вопросу, часто на отдельных листах бумаги. Штрих-коды может пометить лист для автоматической обработки, и каждая серия заполненных овалов будет возвращать определенное значение при чтении. Таким образом, ответы учащихся могут быть записаны в цифровом виде или идентифицированы.
Чтение
Первые оптические листы с ответами были прочитаны путем прохождения света через лист и измерения того, сколько света было заблокировано с помощью фототрубки с противоположной стороны.[11] Поскольку некоторые фотолаборы в основном чувствительны к синему концу видимый спектр,[12] синие ручки использовать нельзя, так как синие чернила отражают и передавать синий свет. Из-за этого, карандаши номер два пришлось использовать для заполнения пузырей -графит это очень непрозрачный вещество, которое поглощает или отражает большую часть падающего на него света.[11]
Современные оптические листы ответов читаются на основе отраженного света, измерения освещенности и темноты. Их не нужно заполнять карандашом номер два, хотя они рекомендуются по сравнению с другими типами (это из-за более светлых отметок, сделанных карандашами с большим номером, и пятен от карандашей номер 1). Черные чернила будут считываться, хотя многие системы игнорируют метки того же цвета, что и форма.[11] Это также позволяет делать оптические листы ответов двусторонними, потому что отметки, сделанные на противоположной стороне, не будут мешать показаниям отражательной способности так же сильно, как показаниям непрозрачности.
Большинство систем подходят для человеческая ошибка в заполнении овалов неточно - до тех пор, пока они не попадают в другие овалы и овал почти заполнен, сканер определит его как заполненный.
Ошибки
Оптические листы ответов могут быть напечатаны неправильно, так что все овалы будут считаться заполненными. Это происходит, если очертания овалов слишком толстые или неровные. Вовремя 2008 президентские выборы в США, это произошло с более чем 19 000 открепительные удостоверения в Грузия графство Гвиннетт, и был обнаружен после того, как около 10 000 уже были возвращены. Небольшая разница не была очевидна для невооруженным глазом, и не был обнаружен до тех пор, пока в конце октября не был проведен тестовый запуск. Это потребовало всего бюллетени переводить на правильно напечатанные, изолирован работники совет по выборам, под закрытием наблюдение членами Демократичный и Республиканец (но нет Другой ) политические партии и округ шериф депутаты. Передача по закону не могла произойти до день выборов (4 ноября).[нужна цитата ]грамм
Программное обеспечение OMR
Программное обеспечение OMR - это компьютерное программное приложение, которое делает возможным OMR на настольном компьютере с помощью Сканер изображений для обработки опросов, тестов, ведомостей посещаемости, контрольных списков и других форм на обычной бумаге, напечатанных на лазерном принтере.
Программное обеспечение OMR используется для сбора данных с листов OMR. Во время сбора данных сканирующие устройства фокусируются на многих факторах, таких как толщина бумаги, размеры листа OMR и шаблон проектирования.
Коммерческое программное обеспечение OMR
Одним из первых пакетов программного обеспечения OMR, в котором использовались изображения с обычных сканеров изображений, был Remark Office OMR, разработанный Gravic, Inc. (первоначально называвшийся Principia Products, Inc.). Remark Office OMR 1.0 был выпущен в 1991 году.
Потребность в программном обеспечении OMR возникла из-за того, что в ранних системах оптического распознавания меток использовались специальные сканеры и специальные предварительно напечатанные формы с выпадающими цветами и регистрационными метками. Такие формы обычно стоят от 0,10 до 0,19 доллара за страницу.[13] Напротив, пользователи программного обеспечения OMR создают свои собственные формы с распознаванием отметок с помощью текстового процессора или встроенного редактора форм, распечатывают их локально на принтере и могут сэкономить тысячи долларов на большом количестве форм.[14]
Идентификация оптических меток в форме, например, для обработки форм переписи, была предложена многими компаниями, занимающимися обработкой форм (пакетный захват транзакций) с конца 1980-х годов. В основном это основано на битональном изображении и количестве пикселей с минимальным и максимальным количеством пикселей для устранения посторонних меток, таких как те, которые стираются грязным ластиком, которые при преобразовании в черно-белое изображение (битональное) могут выглядеть как допустимые метки. . Таким образом, этот метод может вызвать проблемы, когда пользователь передумает, и поэтому некоторые продукты начали использовать оттенки серого, чтобы лучше идентифицировать цель маркера - внутренне скантрон и сканеры NCS использовали оттенки серого.
Программное обеспечение OMR также используется для добавления меток OMR к почтовым документам, чтобы их можно было сканировать с помощью устройства для вставки папок. Примером программного обеспечения OMR является Mail Markup от британского разработчика Funasset Limited. Это программное обеспечение позволяет пользователю настраивать и выбирать последовательность OMR, а затем применять метки OMR к почтовым документам перед печатью.
Библиотеки разработки OMR
Компания | Товар | Год основания |
---|---|---|
ABBYY | ABBYY FineReader Engine | 1993 |
Accusoft | FormFix | 1991 |
Задавать | Читатель и парсер .NET OMR | 2001 |
GDP picture | .NET OMR и SDK для распознавания шаблонов | 2003 |
LEAD Technologies | LEADTOOLS | 1990 |
ВинтаСофт | Подключаемый модуль .NET для обработки форм | 2001 |
Программное обеспечение OMR с открытым исходным кодом
Некоторое программное обеспечение OMR, разработанное и распространяемое под бесплатными лицензиями или лицензиями с открытым исходным кодом:
Имя | Создатель | Примечания | Последняя стабильная версия | Расходы (АМЕРИКАНСКИЙ ДОЛЛАР$ ) | Лицензия на программное обеспечение | Открытый исходный код |
---|---|---|---|---|---|---|
FormScanner | Альберто Борсетта | мультиплатформенное приложение Java, поддерживает пользовательские формы | 2017-06-07 | Свободный | GPLv3 | да |
queXF | Австралийский консорциум социальных и политических исследований Incorporated | может использоваться отдельно или вместе с опросами, экспортированными из LimeSurvey | 2019-05-13 | Свободный | GPLv2 | да |
Удай ОМР | Аадитешвар Сет | 2007 | Свободный | GPLv2 | да | |
Общая система анкет (SQS) | 2016 | Свободный | Лицензия Apache v2.0 | да | ||
Авто множественный выбор | Алексис Бьенвенюэ | для классных тестов с форматированием LaTeX | 2018-12-29 | Свободный | GPLv2 | да |
Moodle Викторина OMR | онлайн-поддержка автономных викторин, проводимых на листах OMR | Свободный | GPLv3 | да | ||
SDAPS: Скрипты для сбора данных с бумажными опросами | Бенджамин Берг | для опросов поддерживает документы в формате LaTeX и ODT | 2019-06-02 | Свободный | GPLv3 | да |
OMR Mark Engine | Реализация C # поддерживает массовое сканирование с помощью настраиваемых форм | 2015 | Свободный | Лицензия Apache v2.0 | да | |
G'n'T Eval | Стефан Бройниг | 2013 | Свободный | Лицензия ISC | да |
История
Оптическое распознавание метки (OMR) - это сканирование бумаги для обнаружения наличия или отсутствия метки в заранее заданном месте.[4] Оптическое распознавание знаков развилось из нескольких других технологий. В начале 19-го и 20-го века были выданы патенты на машины, которые помогали слепым.[2]
OMR теперь используется как устройство ввода для ввода данных. Две ранние формы OMR: бумажная лента и перфокарты в которых используются настоящие отверстия, пробитые в среде, вместо заполненных карандашом кружков в среде. Бумажная лента использовалась еще в 1857 году как устройство ввода для телеграфа.[10] Перфокарты были созданы в 1890 году и использовались в качестве устройств ввода для компьютеров. Использование перфокарт сильно сократилось в начале 1970-х с появлением персональных компьютеров.[8] В современных OMR, где распознается присутствие карандаша, заполненного пузырем, распознавание осуществляется с помощью оптического сканера.
Первый отметьте смысл сканер был Машина для подсчета результатов теста IBM 805; эти метки считываются путем измерения электропроводности графитового грифеля карандаша с помощью пар проволочных щеток, сканировавших страницу. В 1930-е годы Ричард Уоррен в IBM экспериментировали с системами оптического распознавания меток для оценки результатов тестирования, как описано в патентах США 2150256 (подана в 1932 г., выдана в 1939 г.) и 2,010,653 (подана в 1933 г., выдана в 1935 г.). Первый успешный оптический сканер считывания меток был разработан Эверетт Франклин Линдквист как задокументировано в патенте США 3 050 248 (подана в 1955 г., выдана в 1962 г.). Линдквист разработал множество стандартизированных образовательных тестов и нуждался в более совершенной машине для подсчета результатов, чем тогдашний стандартный IBM 805. Права на патенты Линдквиста принадлежали Исследовательскому центру измерений до 1968 года, когда Университет Айовы продал операцию Westinghouse Corporation.
В тот же период IBM также разработала успешную оптическую машину для оценки распознавания меток, как описано в патенте США 2 944 734 (подана в 1957 г., выдана в 1960 г.). В 1962 году IBM коммерциализировала это в качестве считывающего устройства для оптических оценок IBM 1230. Это и множество связанных с ним компьютеров позволили IBM перенести широкий спектр приложений, разработанных для своих отметьте смысл машины на новую оптическую технологию. Эти приложения включали в себя различные формы управления запасами и отчетов о проблемах, большинство из которых имели размеры стандартных перфокарта.
В то время как другие игроки на арене образовательного тестирования сосредоточились на продаже услуг сканирования, Scantron Корпорация, основанная в 1972 году,[15] была другая модель; он будет распространять недорогие сканеры в школах и получать прибыль от продажи тестовых форм. В результате многие люди стали думать обо всех формах восприятия меток (независимо от того, воспринимаются они оптически или нет) как скантрон формы. Scantron работает как дочерняя компания M&F Worldwide (MFW)[16] и предоставляет системы и услуги тестирования и оценки, а также услуги по сбору и анализу данных для образовательных учреждений, предприятий и правительства.
В 1983 году Westinghouse Learning Corporation была приобретена National Computer Systems (NCS). В 2000 году NCS была приобретена Pearson Education, где технология OMR составила ядро группы управления данными Pearson. В феврале 2008 года M&F Worldwide приобрела группу управления данными у Pearson; группа теперь является частью бренда Scantron.[17]
OMR использовался во многих ситуациях, как указано ниже. Использование OMR в системах инвентаризации было переходом между перфокартами и штрих-кодами и не так часто используется для этой цели.[8] Однако OMR по-прежнему широко используется для опросов и тестирования.
использование
Использование OMR не ограничивается школами или агентствами по сбору данных; многие предприятия и учреждения здравоохранения используют OMR для оптимизации процессов ввода данных и уменьшения ошибок ввода. Технологии OMR, OCR и ICR позволяют собирать данные из бумажных форм. OMR также может быть выполнен с использованием сканера OMR (дискретная считывающая головка) или сканера изображений.[18]
Приложения
Есть много других приложений для OMR, например:
- В процессе институциональное исследование
- Опросы сообщества
- Опросы потребителей
- Тесты и оценки
- Оценки и отзывы
- Сбор данных
- Оценка продукта
- Табели учета рабочего времени и инвентаризация
- Формы подписки на членство
- Лотереи и голосование
- Геокодирование (например, почтовые индексы )
- Ипотечный заем, банковские и страховые приложения
Типы полей
OMR имеет разные поля, чтобы предоставить желаемый формат. Эти поля включают:
- Множественный, где есть несколько вариантов, но выбран только один. Например, форма может запрашивать один из вариантов ABCDE; 12345; совершенно не согласен, не согласен, безразличен, согласен, полностью согласен; или похожие.
- Сетка: пузыри или линии настроены в формате сетки, чтобы пользователь мог ввести номер телефона, имя, идентификационный номер и так далее.
- Сложить, суммировать ответы до одного значения
- Логическое значение, отвечающее да или нет на все применимые
- Двоичный, отвечая да или нет только на один
- Поля с пунктирными линиями, разработанные Smartshoot OMR, позволяют убирать границы, как при традиционном падении цвета.
Возможности / требования
В прошлом и в настоящее время для некоторых систем OMR требуется специальная бумага, специальные чернила и специальный считыватель ввода (Bergeron, 1998). Это ограничивает типы вопросов, которые можно задать, и не допускает большого разнообразия при вводе формы. Прогресс в OMR теперь позволяет пользователям создавать и распечатывать свои собственные формы и использовать сканер (желательно с устройством подачи документов) для чтения информации.[19] Пользователь может упорядочивать вопросы в формате, который соответствует их потребностям, при этом при этом имея возможность легко вводить данные.[20] Системы OMR достигают стопроцентной точности и требуют всего 5 миллисекунды в среднем для распознавания знаков.[19] Пользователи могут использовать квадраты, круги, эллипсы и шестиугольники для зоны отметки. Затем программное обеспечение можно настроить на распознавание заполненных пузырьков, крестиков или галочек.
OMR также можно использовать в личных целях. На рынке есть многофункциональные принтеры, которые будут печатать фотографии, выбранные пользователем, путем заполнения пузырьков для выбора размера и выбора бумаги на напечатанном индексном листе. После того, как лист заполнен, человек помещает лист на сканер для сканирования, и принтер распечатывает фотографии в соответствии с указанными отметками.[нужна цитата ]
Недостатки
У OMR также есть некоторые недостатки и ограничения. Если пользователь хочет собрать большие объемы текста, OMR усложняет сбор данных.[21] Также существует вероятность пропуска данных в процессе сканирования, и неправильные или ненумерованные страницы могут привести к их сканированию в неправильном порядке. Кроме того, если не приняты меры предосторожности, страницу можно повторно сканировать, обеспечивая дублирование данных и искажение данных.[19]
В результате широкого распространения и простоты использования OMR стандартизированные экзамены могут состоять в основном из вопросов с несколькими вариантами ответов, что меняет характер того, что проверяется.
Смотрите также
- Эффект ИИ
- Приложения искусственного интеллекта
- Отметка часов
- Электронный сбор данных
- Отметить смысл
- Распознавание объекта
- Оптическое распознавание символов
- Распознавание образов
- Бенджамин Д. Вуд
- Списки
Рекомендации
- ^ «Оптическое распознавание меток». Архивировано из оригинал 13 июня 2006 г.. Получено 13 июня, 2006.
- ^ а б Исследования оптического распознавания символов | Научная библиотека Macmillan: компьютерные науки. Bookrags.com. 2010-11-02. Получено 2015-07-03.
- ^ «Оптические сканирующие системы -». Aceproject.org. Получено 2015-07-03.
- ^ а б Хааг, С., Каммингс, М., Маккаббри, Д., Пинсонно, А., Донован, Р. (2006). Информационные системы управления для информационного века (3-е изд.). Канада: Макгроу-Хилл Райерсон.
- ^ «Библиотека статистиков: использование сканеров и программного обеспечения OMR для доступного ввода данных». Архивировано из оригинал 10 ноября 2005 г.. Получено 13 июня, 2006.
- ^ «Сбор данных по дешевке». Июль 2015 г. Архивировано с оригинал (PPT) на 2015-07-22. Получено 2015-07-21.
- ^ «Remark Office OMR от Gravic (Principia Products) работает с популярными сканерами изображений для сканирования опросов, тестов и других форм на обычной бумаге». Omrsolutions.com. Получено 2015-07-03.
- ^ а б c Палмер, Роджер К. (1989, сентябрь) Основы автоматической идентификации [Электронная версия]. Канадские системы данных, 21 (9), 30-33
- ^ «Технология обработки форм». Tkvision.com. Архивировано из оригинал на 2008-05-11. Получено 2015-07-03.
- ^ а б Устройства ввода для исследований | Научная библиотека Macmillan: компьютерные науки. Bookrags.com. 2010-11-02. Получено 2015-07-03.
- ^ а б c Блумфилд, Луи А. «Вопрос 1529: Почему тесты типа скантрон читают только карандаши №2? Могут ли работать другие карандаши?». HowEverythingWorks.org.
- ^ Техническое руководство Mullard, том 4, раздел 4: Фотоэмиссионные элементы (издание 1960 г.)
- ^ «Архивная копия» (PDF). Архивировано из оригинал (PDF) на 2009-03-20. Получено 2009-03-12.CS1 maint: заархивированная копия как заголовок (связь)
- ^ Майкл Вагенхайм. «Оценка экзаменов по биологии в большом государственном университете». RemarkSoftware.com. Получено 2015-07-21.
- ^ «Рынок образовательного тестирования». Bc.edu. Получено 2015-07-03.
- ^ "M&F Worldwide Corp". Архивировано из оригинал 25 июля 2008 г.. Получено 20 июля, 2008.
- ^ "NCS Pearson, Inc". Архивировано из оригинал 14 июня 2010 г.. Получено 14 июня, 2010.
- ^ http://datamanagement.scantron.com/pdf/icr-ocr-omr.pdf[мертвая ссылка ]
- ^ а б c Бержерон,[ВОЗ? ]
- ^ ЛоПрести, 1996 г.[ВОЗ? ]
- ^ Зеленый, 2000[ВОЗ? ]