| Artículos | 01 ABR 1995

Programas OCR para Windows

Tags: Histórico
Eugenio Barahona.

Los programas de reconocimiento óptico de caracteres (OCR) pueden terminar con las tediosas horas delante del ordenador transcribiendo documentos impresos.

Desde hace ya bastante tiempo el campo del reconocimiento de caracteres y, en general, el reconocimiento de formas y de imágenes ha sido objeto de estudio por multitud de investigadores. El objetivo de todo este esfuerzo es la obtención de sistemas capaces de reconocer caracteres impresos, manuscritos y crear la tecnología, tanto hardware como software, para, en último término, crear sistemas de visión artificial.

Estas metas, que hasta hace pocos años sólo parecían alcanzables por costosos mainframes, en la actualidad se encuentran al alcance de la mano de los ordenadores personales compatibles PC. Esto ha sido posible gracias al constante incremento de potencia que han experimentado las máquinas del tipo PC y, además, por los avances que constantemente se producen en la investigación de sistemas de inteligencia artificial, no siendo extraño encontrar en los programas de OCR actuales más avanzados técnicas como, por ejemplo, las redes neuronales.

Actualmente existen en el mercado una amplia variedad de productos, desde aplicaciones de bajo precio destinadas al mercado de consumo, hasta programas totalmente profesionales, con precios muchos más elevados, que ofrecen unas prestaciones realmente sorprendentes.

Debemos hacer notar que, sin embargo, no todo es tan maravilloso como los párrafos anteriores pueden hacer creer al lector. Se debe tener muy en cuenta que, como con otros tipos de aplicaciones, los resultados que se obtienen dependen, en gran medida, de la calidad de los datos de entrada que se suministran al programa. Es decir, en el caso que nos ocupa, el grado de acierto que proporciona una determinada aplicación de reconocimiento de caracteres, se encuentra en relación directa con la calidad del documento original que ha sido digitalizado.

Aparte de la calidad de los documentos a tratar se debe tener muy en cuenta el tipo de tecnología usada para realizar el proceso de reconocimiento, ya que, como en casi todo, hay varias formas de resolver el problema.

Comparación de patrones y extracción de características

Los sistemas OCR usan actualmente, para realizar el reconocimiento de caracteres, una de estas técnicas: la comparación de patrones o la extracción de características.

Bajo éstos pomposos nombres subyacen dos tipos de tecnología totalmente diferentes y que ofrecen al usuario distintos grados de acierto.

La comparación de patrones se basa, como su nombre indica, en comparar los mapas de bits de los presuntos caracteres que han sido digitalizados con los correspondientes de uno o varios juegos de caracteres. Como el lector puede intuir esta tecnología presenta inconvenientes obvios, siendo el más importante que si el juego de caracteres del documento a tratar no coincide con el utilizado por el programa OCR los resultados que se obtendrán serán bastante pobres.

Una solución a esta deficiencia es la inclusión, dentro del OCR, de diversos juegos de caracteres que den soporte a los más frecuentemente utilizados.

Sin embargo, esta tecnología encuentra otro importante obstáculo al tratar documentos procedentes de máquinas fotocopiadoras y de fax. Generalmente, este tipo de escritos, suelen tener tonos negros situados entre los caracteres. Estos tonos pueden aparecer en la imagen digitalizada en forma de puntos entre los caracteres, lo cual puede acabar confundiendo al programa OCR.

Mucho más precisa es la tecnología de extracción de características, la cual es usada actualmente por prácticamente todos los productos que se encuentran en el mercado.

Se trata de un sistema que busca características propias de cada carácter del alfabeto. Pongamos un ejemplo. En un documento en el cual se encuentra el carácter A, el programa OCR buscaría dos líneas oblicuas con un punto en común unidas, a su vez, por otra línea horizontal.

Como el lector puede suponer la posible confusión entre caracteres similares se reduce de forma ostensible. Sin embargo, la aparición de puntos sueltos entre los caracteres, también puede llevar a confusión, en algunos casos, a este tipo de programas.

Para subsanar, dentro de lo posible, este problema las aplicaciones OCR más modernas utilizan sistemas de auto aprendizaje, mediante los cuales se solicita al usuario que introduzca el carácter correcto correspondiente a uno que no ha podido ser reconocido correctamente para que, en posteriores sesiones, el carácter sea reconocido automáticamente.

Características evaluadas

Para poder comparar los productos analizados hemos fijado los siguientes criterios de valoración:

- Compatibilidad Twain. Mediante este protocolo las aplicaciones son capaces de adquirir imágenes de multitud de dispositivos. Actualmente sería imperdonable que un programa OCR no soportara dispositivos compatibles con este protocolo.

- Reconocimiento desde ficheros. En muchos casos el usuario no dispone de escáner, sino que debe reconocer los caracteres desde documentos almacenados en ficheros como, por ejemplo, TIFF, GIF, JPEG, BMP, etc. Es pues fundamental que se soporten la mayor cantidad posible de formatos de ficheros gráficos.

- Uso desde otros programas. Lo más cómodo sería disponer, por ejemplo, de un OCR que incluya en los menús de otros programas una opción para realizar el reconocimiento, y una vez finalizado este proceso, incluyera en el documento con el que estuviésemos trabajando el texto reconocido.

- Soporte de ficheros de procesadores de texto. En algunas ocasiones el programa OCR debe ser usado por separado, es decir, no va a ser ejecutado desde los menús de un procesador de textos para Windows. En este caso es imprescindible que se soporten los formatos de fichero nativos de programas como, por ejemplo, Ami Pro, Word para Windows, WordPerfect, etc.

- Filtros de mejora de la imagen. Si vamos a trabajar habitualmente con documentos procedentes de máquinas fotocopiadoras o de fax será muy recomendable, sino imprescindible, disponer de algún tipo de filtro que mejore la calidad de la imagen escaneada y ayude, por lo tanto, a obtener unos resultados más precisos durante el proceso de reconocimiento.

- Detección automática de gráficos en el documento. Muchas veces los originales con los que trabajamos incluyen, además de texto, imágenes. Si el programa OCR no las detecta de forma automática intentará reconocerlas como si se tratase de texto, lo cual le llevará a generar multitud de caracteres erróneos. Lo más adecuado es que esta detección se realice de forma automática por el software, si bien en algunos OCR esta tarea debe realizarla el usuario de forma manual.

- Autoaprendizaje y grado de acierto. Una característica muy útil es la siguiente: cuando el OCR detecta un carácter que no puede reconocer se lo comunica al usuario, de forma que éste introduce por teclado el carácter correcto para que cuando dicho carácter sea encontrado de nuevo sea reconocido automáticamente. Junto con el autoaprendizaje se puntua el grado de acierto obtenido en las pruebas realizadas en el Laboratorio de PC World.

- Documentación. Unos manuales claros, bien estructurados y en Castellano son un valor añadido que no debemos despreciar en ningún caso, aunque algunos distribuidores de nuestro país no tienen en cuenta esta circunstancia en prácticamente ninguna ocasión.

- Precio. Como siempre este es un factor que, en la mayoría de las ocasiones, determina la decisión final de compra de los usuarios. El precio debe estar, por lo tanto, adecuado a las prestaciones del producto y a su presentación. Se realizaron, con cada programa, tres pruebas. En la primera de ellas se procesaba la imagen correspondiente a una página de PC World, digitaliz

Contenidos recomendados...

Comentar
Para comentar, es necesario iniciar sesión
Se muestran 0 comentarios
X

Uso de cookies

Esta web utiliza cookies técnicas, de personalización y análisis, propias y de terceros, para facilitarle la navegación de forma anónima y analizar estadísticas del uso de la web. Consideramos que si continúa navegando, acepta su uso. Obtener más información