porque ocr a 300 ppp es un norma

Escanear a 300 ppp  (puntos por pulgada) no es oficialmente un estándar de OCR (reconocimiento óptico de caracteres), pero se considera el patrón oro.

Algunas personas piensan que se puede escanear a un menor ppp y luego usar el software del escáner para aumentar la resolución por interpolación. Sin embargo, hay que recordar que la interpolación en realidad no proporciona un beneficio significativo para OCR. Por lo general, sólo hace una imagen más grande agregando píxeles extra entre sus seres escaneados o por el estiramiento de píxeles, pero estos enfoques siempre dan lugar a una aproximación. Su imagen siempre se pierde algo de claridad y calidad. Es mejor utilizar el escaneo de un documento a 300 ppp para empezar.

Los OCR más líderes y compañías de Software recomiendan una resolución mínima de 300 puntos por pulgada para la extracción de datos eficaz. De hecho, muchos tienen 300 ppp como su configuración por defecto. En otras palabras, por cada centímetro cuadrado de papel, el escáner captura 300 puntos horizontales y 300 puntos verticales o 90.000 puntos totales (300 x 300 = 90.000 puntos por pulgada cuadrada). Si utiliza una resolución de 200 ppp en vez de 300 ppp, sólo verá los 40.000 puntos por pulgada cuadrada en lugar de 90.000. Como podéis observar es una diferencia importante.

Por tanto una mayor resolución de escaneo es igual a la mejora de la precisión del OCR automático. Cuantos más puntos por pulgada tiene el OCR mas nivel de precisión permite al equipo.

A continuación mostramos un ejemplo de lo que puede suceder por no tener suficientes puntos por pulgada.

Ejemplo resolución



utilizacion de la funcion rotacion automatica de scansnap