| Artículos | 01 SEP 1998

Programas de Reconocimiento Óptico de Caracteres

Tags: Histórico
Omnipage Pro 8.0, OCR Master 3.3E, Recognita 4.0 y TextBridge 98

Las últimas novedades en OCR consiguen resultados muy espectaculares, tanto en precisión como en posibilidades, sobre todo a la hora de conservar el formato de página .

En los albores de la informática, los programas de reconocimiento óptico de caracteres fueron una grata sorpresa tanto en el ámbito doméstico como en las oficinas, pues permitían un proceso casi mágico: convertir las imágenes de textos procedentes de documentos impresos, como libros, revistas, manuales, etc . en archivos basados en caracteres tratables por los procesadores de textos . Ni que decir tiene la gran ventaja que supone disponer, por ejemplo, de un archivo de Word compacto, editable, reutilizable, convertible a otros formatos, frente a la hoja de papel impresa que está ahora mismo leyendo . Con el tiempo, la popularidad de dichos programas fue descendiendo, no tanto por su utilidad, que es más alta si cabe, sino por el hecho de convertirse en algo muy común . Prácticamente cualquier escáner, incluso los de gama baja, trae consigo un software de OCR, con lo que las necesidades de los usuarios esporádicos están cubiertas . Precisamente, un error muy común es pensar que no es preciso adquirir software OCR porque ya se suministra con el escáner o dispositivo similar . Este pensamiento se debe o bien a que en verdad no necesitamos el OCR, o bien a nuestra ignorancia al no tener nunca en nuestras manos un software más ?profesional? . Precisión, velocidad y un resultado más parecido al original respetando formatos y tablas, son tres de los factores que diferencian con claridad a unas aplicaciones de otras .

Por lo general, las versiones gratuitas ( o versiones light incluidas con el dispositivo ) están basadas en una generación anterior en lo que al reconocimiento de caracteres se refiere, con las limitaciones que ello conlleva . Además, el número de opciones adicionales es mucho menor, habitualmente lo justo para un funcionamiento básico . También es común que existan ofertas para actualizar la versión con posterioridad, en función de un precio que suele ser bastante económico .

El OCR ideal

Lo más importante de un OCR es, básicamente, la precisión o tasa de aciertos/errores en el reconocimiento . Aunque lo ideal sería alcanzar el 100% de aciertos, en la práctica esto todavía no es posible . Como veremos, cualquiera de los productos analizados supera en las pruebas el 90% ( que supondría 10 errores de cada 100 caracteres reconocidos ) , formándose un margen entre el 91 y el 99% .

Tal vez pueda parecer que estos resultados son excelentes y que no existen grandes diferencias entre unas y otras aplicaciones . Nada más lejos de la realidad: tan sólo un 1% de diferencia entre un programa y otro puede significar mucho a la hora de corregir los textos generados . De hecho, cuando la precisión baja del 95%, tenemos como resultado que en cada línea hay unos dos errores de media, lo que obliga a una verificación exhaustiva y muy incómoda .

La velocidad del proceso es enemiga de la precisión, siendo muy común que, pretendiendo una buena dosis de seguridad, también se alargue el tiempo necesario para analizar una página . Este es uno de los parámetros habitualmente configurables en los OCR . No obstante, si el ordenador donde se ejecuta la aplicación es un moderno Pentium II, apenas se necesitarán unos pocos segundos para completar la tarea .

Definir la precisión como un parámetro aislado es erróneo, ya que va en función de la calidad y tipo de la imagen que se está procesando . Existen tres factores que son muy importantes . Uno de ellos es relativo al escáner, que debe tener los ajustes apropiados, buscando la máxima resolución óptica y adecuado contraste, de forma que en modo monocromo los caracteres se perfilen lo mejor posible .

Otro es el error de giro, producido al introducir la hoja un poco inclinada respecto los márgenes, o bien porque el material impreso ya contiene ese error . Aunque puede parecer trivial, este es un problema muy común en versiones anteriores, que afectaba drásticamente a la precisión del proceso . Cuando son varias las hojas a escanear, tendemos a colocarlas con bastante poco cuidado . Si se trata de fotocopias, es muy habitual que esta falta de cuidado ya nos venga dada en el original . Los programas que analizamos, excepto OCR Master, de forma totalmente automática enderezan la imagen antes de analizarla .

También hemos de considerar a la versatilidad del proceso de reconocimiento para encajar distintas fuentes o tipos de letra . Las aplicaciones más avanzadas son capaces de reconocer de forma adecuada casi cualquier tipo de letra impreso ( e incluso números manuscritos ) . Antiguamente debíamos conformarnos con resultados basados en textos sencillos de una única fuente y tamaño, pero hoy en día tenemos que exigir, al menos, que el tamaño de la fuente y atributos como negrilla y cursiva, puedan ser detectados .

Con el fin de obtener un resultado lo más parecido al original, se debe llegar más lejos, reconociendo ciertas características que afectan no sólo al texto en sí, sino a la configuración del párrafo o de la hoja . Columnas, tablas, cabeceras y pies de página son más que deseables . No sólo eso . ¿ Es posible encontrar documentos sin gráficos ? Sin duda muy pocos, con lo cual, lo que habitualmente era descartado ahora necesariamente debe formar parte del reconocimiento . Más aún, es posible obtener un formato final muy parecido al original, incluyendo las fotografías entrelazadas con el texto .

Para una adecuada manipulación de las páginas más sofisticadas, los programas OCR dividen la imagen escaneada en diferentes zonas, según sea la información que contienen . Principalmente se tratará de texto, pero también, como hemos visto, de tablas y gráficos . Las zonas son ordenadas secuencialmente, asignándoles un número correlativo o, como ocurre con Recognita, una bonitas flechas que son más que intuitivas . Esto es de especial importancia en el texto, que ha de seguir el orden adecuado, fluyendo de una columna a otra . En ocasiones el programa se equivoca y es por eso por lo que invariablemente, hemos de reasignar manualmente dichas zonas . También es posible empezar desde cero y crear las zonas una a una desde el principio . De hecho, en los programas de bajo nivel, ésta es la única opción y en muchos de los ?gratuitos? es lo que se dice muy engorroso procesar textos con múltiples columnas en una misma hoja .

Finalmente, una vez concluido el trabajo, sólo queda el exportar el documento generado . Cualquier aplicación que se precie no debe limitarse a un sencillo fichero, sino que debe ser capaz de gestionar los formatos de los procesadores más populares, que aparecen recogidos en la tabla de características .

OmniPage Pro 8 . 0

Caere OmniPage siempre ha ocupado lugares destacados y, hasta hace poco, era líder del mercado, ya que ni Recognita 3 . 2 ni TextBridge 96 le igualaban . De hecho, a principios de año el dúo OmniPage 8 . 0/TextBridge Pro 98 resultaban muy aventajados respecto a otros productos . No sabemos si la unión Recognita/Caere ha tenido un efecto decisivo en la aparición de la nueva versión de Recognita, diferente en estilo pero con muchas afinidades con OmniPage .

Dotado de una agradable interfaz y un todavía más agradable asistente hace que procesar un documento sea un juego de niños . En caso de que no deseemos emplear el asistente, el cual automatiza todos los procesos, siempre queda la posibilidad de realizar las tareas una a una: exploración del documento, definición de zonas, reconocimiento de caracteres y exportación a fichero del producto final . Para cada una de estas tareas tenemos otros tantos botones, los cuales son a su vez configurables para determinar ciertas peculiaridades adicional

Contenidos recomendados...

Comentar
Para comentar, es necesario iniciar sesión
Se muestran 0 comentarios
X

Uso de cookies

Esta web utiliza cookies técnicas, de personalización y análisis, propias y de terceros, para facilitarle la navegación de forma anónima y analizar estadísticas del uso de la web. Consideramos que si continúa navegando, acepta su uso. Obtener más información