| Artículos | 01 FEB 1999

Herramientas de dictado continuo

Tags: Histórico
NaturallySpeaking Standard, NaturallySpeaking Preferred, NaturallySpeaking Professional, Point & Speak, ViaVoice 98 Executive y ViaVoice 98 Home
Felipe Corsino.

Han pasado ya algunos años desde que las escenas de películas de ciencia-ficción, en las que se hablaba con un potente ordenador, han perdido espectacularidad . Aunque los ordenadores personales aún no sean tan potentes como en las películas, en la actualidad sí que se pueden encontrar ya diversos programas con los que podremos comunicarnos por nuevas vías con nuestro PC .

La idea de poder comunicarnos con nuestro ordenador de una manera más natural es para nosotros muy atractiva y ya no dudamos que, en un futuro, la voz pueda reemplazar realmente a los dispositivos de entrada habituales hoy en día, como el teclado y el ratón . De momento, ya podemos disfrutar de algunas aplicaciones que ofrecen hacer más sencillos nuestros quehaceres diarios con el ordenador, entre las que se encuentran las herramientas de dictado continuo . Lamentablemente desde la aparición de este tipo de programas viene siendo habitual llevarse algunos desengaños, al ver que el programa no resulta ser tan extremadamente útil como en ocasiones llegamos a pensar .

Cuando se dieron a conocer este tipo de productos para su funcionamiento en ordenadores personales, se trataba de aplicaciones que eran capaces de reconocer palabras sueltas únicamente, lo que se denominó reconocimiento de habla discreta . La manera en que el usuario tenia que dictar era palabra por palabra, haciendo pausas entre ellas . Además, las condiciones óptimas para su correcto funcionamiento distaban mucho de las condiciones normales que se dan en entornos de oficinas, con bastante ruido de fondo, que no hacían más que confundir al programa y producir resultados bastante desconcertantes . Son varios los años que se llevan trabajando en mejorar la tecnología . Los revolucionarios proyectos puestos en marcha por múltiples corporaciones y universidades están perfeccionándose cada día más y son muchas las direcciones sobre recursos de información que se pueden encontrar en Internet . La mayoría de estas investigaciones nacieron y siguen desarrollándose en muchos centros universitarios de todo el mundo, funcionando bajo grandes computadoras basadas en Unix . Aparte del reconocimiento de la voz ( convertir voz a texto ) y la síntesis de ésta ( texto a voz ) , los esfuerzos actuales se encaminan aún más allá, llegando al control de datos mediante la voz, que permitirá, en un futuro no muy lejano, realizar consultas al ordenador y que éste las responda adecuadamente .

Situación actual

Ya ha transcurrido bastante tiempo desde que aparecieran los primeros programas de reconocimiento de voz para PC, y en la actualidad todas las aplicaciones son capaces de reconocer, con mejor o peor resultado, frases pronunciadas de manera continuada, sin dejar pausas entre las palabras . Ahora es posible dictar cartas y formatear texto directamente con la voz, incluso existen soluciones para poder controlar mediante comandos dictados, el funcionamiento básico del sistema . Todo esto puede resultar útil para un trabajo orientado en su mayor parte a la edición de texto, pero en otros muchos campos, el reconocimiento de voz no sólo es irrelevante, sino que de hecho complica más el trabajo . Por ejemplo, en todos los productos analizados resulta muy sencillo editar, copiar y cortar texto mediante los comandos de voz, siempre que esto se realice en editores y procesadores de texto . En una hoja de cálculo, estas operaciones son bastante complicadas y con frecuencia se consiguen resultados muy distintos, resultando mucho más práctico apuntar a una celda y dictar el contenido sobre ella . El control de las aplicaciones mediante comandos de voz pierde definitivamente su sentido y utilidad cuando tratamos con aplicaciones de retoque fotográfico o diseño, donde evidentemente todo está diseñado y pensado alrededor de dispositivos convencionales, mucho más precisos que el habla, como el ratón, teclado o tabletas gráficas .

En todas las versiones de los productos analizados, el número de términos incluidos en los diccionarios es más que suficiente para comenzar a dictar sin problemas . En la tabla incluida en el artículo se hace referencia al numero de términos existentes en el vocabulario principal y en el diccionario de respaldo . En el vocabulario principal se encuentran las palabras que se encuentran en el llamado diccionario activo, es decir, aquellas que por su frecuente uso están siempre presentes . Este vocabulario se puede ampliar con términos nuevos añadidos por el usuario . Por otra parte existe un diccionario de respaldo con términos menos habituales y que completan mucho más el diccionario activo . Los vocabularios activos o iniciales se pueden ampliar también con diccionarios personalizados creados por el usuario o adquiridos por separado con vocabularios profesionales específicos, para derecho, medicina, etc .

Inscripción de voz

Otro objetivo de las investigaciones que se llevan acabo en la actualidad es lograr un motor para el reconocimiento de la voz que sea independiente del interlocutor, es decir, que interprete de igual manera un mismo mensaje aunque éste sea pronunciado por personas diferentes . Aunque esto ya se ha conseguido experimentalmente, esta importante característica aún no se encuentra disponible en el ámbito de los ordenadores personales .

La instalación de estos programas en nuestro ordenador es todo lo sencilla que cabe esperar de cualquier programa para Windows actual, aunque para que cualquiera de ellos funcione correctamente hay que completar algunos pasos después de la instalación, con el fin de que el programa reconozca adecuadamente nuestras palabras . En todos los productos analizados, esta tarea, aunque no imprescindible, es fundamental para poder obtener un funcionamiento mínimamente correcto . Se trata generalmente de configurar el sistema de sonido de nuestro equipo para ajustar los niveles de entrada de audio del micrófono y la salida a través de los altavoces o los auriculares conectados a la tarjeta de sonido .

Tras estos primeros ajustes generales, necesitamos leer algunas frases que nos irá indicando un programa asistente, a fin de obtener algunos datos que caractericen nuestra voz . De esta manera el programa acomoda el reconocimiento al timbre de voz del usuario y el acento al hablar . Este procedimiento ha de completarse una vez por cada usuario, de manera que es posible utilizar un mismo programa por distintas personas, empleando cada una de ellas su configuración personalizada .

En nuestra comparativa hemos analizado versiones profesionales y domésticas de dos de las firmas que se han hecho hueco en el mercado del reconocimiento de voz por méritos propios . Hemos de decir que existen otros productos aparte de los mencionados en este artículo, pero sólo están disponibles por el momento para la lengua inglesa ( ver cuadro Otros Productos ) . Además de los productos de compañías como Phillips y Lernout & Hauspie, Dragon Systems dispone de otras herramientas software que completan su gama de programas de reconocimiento de voz, incluyendo kits para el desarrollo de aplicaciones que hagan uso de estas características de dictado o de control de comandos por voz ( ver cuadro Hablar por teléfono con el ordenador )

Uso general de las aplicaciones

Tras realizar la instalación y la inscripción de voz en estos programas ya estamos listos para empezar a usarlo en nuestro editor de texto favorito . Todos los programas analizados dejan un icono en forma de micrófono que se queda residente en el área de notificación de la barra de tareas de Windows . Pulsando sobre ellos con el botón izquierdo del ratón activamos y desactivamos el reconocimiento del habla . Esto resulta muy útil cuando queremos hacer pausas largas durante un dictado y no deseamos que la aplicación este intentando reconocer sonidos

Contenidos recomendados...

Comentar
Para comentar, es necesario iniciar sesión
Se muestran 0 comentarios
X

Uso de cookies

Esta web utiliza cookies técnicas, de personalización y análisis, propias y de terceros, para facilitarle la navegación de forma anónima y analizar estadísticas del uso de la web. Consideramos que si continúa navegando, acepta su uso. Obtener más información