Требования к качеству изображения

Ihar Kliashchou -

Ниже приведены требования к размеру и качеству изображений документов, полученных на каком-либо устройстве,  необходимые  для успешной обработки с помощью Document Reader SDK:

  • Документ должен полностью находиться в рамках изображения; края документа не должны совпадать с краями изображения.
  • Фон должен быть контрастным по отношению к документу (белый документ на белом фоне, так же как и черный документ на черном фоне не может быть распознан).
  • Желательно, чтобы документ занимал 70–80 % площади изображения (это важно, так как даже если размер изображения был 12 MP, но после того, как он был обнаружен и вырезан, его разрешение стало 640×480, то такой документ не будет разпознан корректно).
  • Сжатие JPEG должно быть не менее 70 % от оригинала.
  • Угол наклона должен быть не более 10 градусов в любом направлении (горизонтальном или вертикальном), в противном случае искажение будет слишком сильным для того, чтобы его можно было исправить без ущерба для качества изображения.

Если, к примеру, у вас есть изображение документа размером 800×600 пикселов, полученное при помощи веб-камеры, то вполне вероятно, что этот документ будет занимать не более 80 % всей площади изображения. Если веб-камера является стандартной камерой ноутбука, то, скорее всего, у нее фиксированный фокус (а не автофокус), и документ не будет находиться в фокусе на таком расстоянии от камеры, чтобы отвечать этому требованию. В этом случае успешные результаты оптического распознавания символов маловероятны.

Если формат документа, о котором идет речь, соответствует ID1 (идентификационная карта, например), то его размер составляет 86×54 мм. Проведем следующий математический расчет:  800 пикселов * 0,8 (80 %) / 86 мм * 25,4 (мм на дюйм) = 189 ppi (пикселов на дюйм). Это меньше, чем требуется для корректного распознавания символов. Так, например, шрифт, используемый на немецкой идентификационной карте, составляет всего 2 мм в высоту, поэтому он будет иметь на изображении высоту максимум 15 пикселов с учетом артефактов сжатия JPEG и фонового шума. Все это будет приводить к ошибкам и низкой вероятности распознавания символов.

Для успешного распознавания данное изображение документа должно быть не менее 300 ppi / 25,4 = ~ 12 ppm (пикселов на мм) -> 86 мм * 12 ppm = 1032 пиксела для ширины документа -> 1032 / 0,8 (80%) = 1290 пикселов для ширины изображения. При этом документ должен находиться на плоской поверхности без наклона к камере.

Для таких документов, как паспорта, расчеты должны выполняться с учетом их большего размера - 125×88 мм.

Однако, паспорт имеет машиночитаемую зону (MRZ), которая может быть распознана и при более низком разрешении. В случае если паспорт занимает 80 % изображения с разрешением 800×600 пикселов, то его машиночитаемая зона будет с высокой вероятностью распознана в 90% случаев и более, при условии, что все другие требования к качеству изображения будут соблюдены.

В заключение всего вышесказанного, мы рекомендуем для качественного распознавания идентификационных документов любых размеров использовать изображения, полученные при помощи камеры с разрешением Full HD (1920×1080) и с автофокусом.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Была ли эта статья полезной?
Пользователи, считающие этот материал полезным: 0 из 0
Еще есть вопросы? Отправить запрос

0 Комментарии

Статья закрыта для комментариев.