Software

OmniPage Pro 10

Software de reconocimiento óptico

de caracteres de gran precisión

Número:167, Julio/Agosto de 2000

 Sección:Primer Contacto Página:148

Jesús Díez Sebastián

[email protected]

OmniPage Pro 10

estrella.gif (192 bytes)estrella.gif (192 bytes)estrella.gif (192 bytes)estrella.gif (192 bytes)estrella.gif (192 bytes)

FABRICANTE: Caere Corporation

DISTRIBUIDOR: Ingram Micro

Tel. 902 48 49 50

GTI Tel. 91 677 95 95

Memory Set Tel. 902 24 02 50

www.caere.com

IDIOMA: castellano

PVP: 24.900 PTA (149,65 euros)

El software de reconocimiento óptico de caracteres (OCR) ha experimentado una curiosa evolución en todos estos años. Originalmente, todo lo que se pedía al software de OCR era fiabilidad en la transcripción del texto. Bastaba con tener buena precisión en este aspecto, porque posteriormente el texto sería utilizado en un procesador, para aplicarle el formato final que se necesitara. Con el tiempo, la utilización del ordenador para autoedición, unida a la proliferación de formatos complejos, ha añadido un nuevo problema al OCR. Los diseños con múltiples columnas, gráficos, tablas, diferentes tipos de letra y tamaños de fuente, están a la orden del día, y suponen un verdadero desafío para el software de OCR. Al software actual se le demanda cada vez más, la mejor precisión posible a la hora de reconocer el texto, pero también la máxima fiabilidad a la hora de respetar el formato del documento original. El objetivo final que se busca, generalmente, es disponer rápidamente de una versión electrónica completa del documento en papel, que pueda ser editado, modificado e impreso en un momento. Omnipage Pro es un producto con solera, referencia obligada desde hace años en este tipo de software, que no ha sido ajeno a esta evolución del OCR, y que ahora nos presenta su versión 10.

[pulse sobre la imagen para ampliarla]

OmniPage Pro 10 presenta una completa interfaz de usuario, que divide la pantalla en tres zonas de izquierda a derecha, muy intuitivas respecto al proceso de OCR. La primera parte contiene las miniaturas gráficas de las diferentes páginas que vamos escaneando, la zona central permite ver la hoja actual, con la división por zonas activas de análisis, y por último el área de la derecha muestra el producto final del OCR, sea el documento con formato o simplemente el texto. Esta disposición es, en cualquier caso, totalmente configurable por el usuario. El proceso de OCR se puede iniciar desde el mismo programa o, gracias a la función Direct OCR, desde el menú de nuestro procesador de texto favorito. Omnipage puede trabajar con multitud de escáneres, siempre que cuenten con un controlador estándar TWAIN.

Existen tres modos de funcionamiento del programa, según el grado de implicación del usuario. El más sencillo es un asistente que va haciendo ciertas preguntas al usuario sobre el tipo de trabajo que se desea realizar. El siguiente es un modo semiautomático, en el que el usuario sólo tiene que definir el tipo de original y el destino de los datos. En el último modo, manual, el programa deja al usuario toda la responsabilidad sobre cómo y dónde debe escanear el documento.

[pulse sobre la imagen para ampliarla]

En los modos automáticos, resulta llamativa la enorme capacidad del programa para analizar la estructura de los documentos y discriminar las zonas de las que debe extraer texto o gráficos. OmniPage Pro localiza con facilidad datos tabulados, separándolos del texto corriente y manteniendo el formato de cada elemento. También se retienen los gráficos, y dentro de lo posible, los tipos y tamaños de letras del texto original. Por otro lado, siempre que se desee, el programa puede filtrar la información de formato y extraer tan sólo el texto limpio, para procesarlo posteriormente. En nu