| Artículos | 01 SEP 1996

IBM VoiceType 3.0 para Windows 95

Tags: Histórico
Sistema de dictado que, mediante la tarjeta de sonido estándar, nos permite escribir sin teclear nada
Oscar G. Peinado.

El último sistema de dictado de IBM está compuesto únicamente por un CD-ROM que contiene el software de reconocimiento de voz y unos auriculares, similares a los utilizados por las telefonistas, que incorporan el micrófono y se conectan directamente a cualquier tarjeta de sonido. Junto con los auriculares se incluyen varios adaptadores para garantizar el correcto funcionamiento con cualquier equipo.

Una vez instalado el software, tenemos la posibilidad de recorrer un tutorial que nos explicará, paso a paso, las posibilidades del sistema. Desde su uso como "traductor de comandos", en el cual daremos únicamente ciertos comandos concretos que servirán para movernos por el escritorio y/o las aplicaciones; hasta el novedoso sistema de dictado, que nos permitirá introducir cualquier texto en nuestra aplicación favorita.

Antes de empezar a hablar es imprescindible haber ajustado bien el micrófono. Este debe estar cerca de la boca, pero no demasiado, y sobre todo nunca ha de situarse directamente delante de esta, pues simplemente con la respiración se estarán introduciendo ruidos en el micrófono, que si bien normalmente los interpreta como tales, en muchas ocasiones los entiende como comandos y, por ejemplo, tiene bastante tendencia a ejecutar la orden "Zoom" de MS Word. Hay que decir que no es imprescindible usar el auricular y micrófono que se suministran, de modo que si ya disponemos de otro micro al que estemos más acostumbrados o que posea mejores características, podremos usarlo sin ningún problema. No obstante, el suministrado por IBM, está formado por dos micrófonos, uno interior y otro exterior, que permiten distinguir la voz de los ruidos. Igualmente podremos conectar la salida de audio a los altavoces habituales.

Una vez ajustado físicamente el micrófono, habrá que hacerlo eléctricamente, es decir, regular su sensibilidad de acuerdo con nuestra voz. Para ello dispone permanentemente de una barra de volumen que, a modo de vúmetro, nos indica si la señal es muy baja (amarillo), muy alta (rojo) o normal (verde). Nuestro consejo es que se ajuste la sensibilidad más bien baja, y se hable alto para facilitar la separación de la voz y el ruido de fondo. En cualquier caso, lo mejor es experimentar un poco, hasta dar con la mejor posición tanto del micrófono como del control de sensibilidad. Con el sistema ya ajustado a nuestras características y gustos, lo mejor será hacer la "Inscripción". Este es un proceso de aprendizaje (del software, no del usuario) que consiste en la lectura de un mínimo de 50 frases y un máximo de 250, mediante las cuales el software reconocerá las peculiaridades de nuestra voz: acentos, defectos de pronunciación, entonaciones, etc. Como curiosidad, diremos que las frases están extraídas de El Quijote, y cada vez que no entiende una palabra hay que repetir la frase entera, así que es un buen momento para aficionarse a la literatura de Cervantes. En realidad esta fase no es imprescindible, aunque tanto más aconsejable cuanto menos perfecta sea nuestra pronunciación. Si el equipo lo van a utilizar diferentes personas, se puede realizar una inscripción para cada una de ellas, sin embargo, al iniciar una sesión de dictado no se pide el nombre de usuario en primer lugar, sino que hay que recordar comprobar que está ajustado a nuestras características. En caso contrario pueden producirse errores fácilmente. Imaginemos, por un momento, que los usuarios son un catalán y un gallego (por ejemplo), con fuerte acento. En caso de utilizar uno los parámetros del otro, probablemente el sistema no le entendería ni una palabra.

Para manejar el sistema de dictado utilizaremos el VoiceCenter, una pequeña ventana que muestra los botones de control, la barra de volumen y las palabras que va entendiendo. Cuando se vaya a realizar una sesión de dictado larga, se debe utilizar VoicePad de IBM (incluido en el CD-ROM) o Microsoft Word, que también está habilitado para manejarse por medio del habla. En este último caso, aparecerán dos nuevos botones en la barra de tareas, para comenzar y parar dictados. Cuando dictemos un texto, hay que practicar lo que IBM denomina "habla aislada", es decir, realizar una pequeña pausa entre cada palabra, además de decir todos los signos de puntuación y comandos de estilo que sean necesarios. A pesar de las pausas entre palabras, el programa de reconocimiento se toma cierto tiempo en descubrir que palabra hemos dicho (las pruebas se realizaron en un Pentium a 150 MHz con 16 MB de RAM), de modo que normalmente se estará escribiendo una palabra mientras que decimos otra, lo cual puede crear cierta confusión al principio, hasta que nos acostumbramos a no esperar al ordenador. Hay que tener en cuenta que el programa distingue entre palabras con el mismo sonido realizando un análisis del contexto, y esto lleva su tiempo. En cualquier caso, el fabricante afirma que se pueden conseguir velocidades de entre 70 y 100 palabras por minuto, eso sin contar la posibilidad de utilizar macros para, por ejemplo, insertar direcciones habituales.

Para escribir en aplicaciones que no posean soporte de voz, disponemos del VoiceType Directo, que presenta una ventana similar a la del VoiceCenter que permite seleccionar la aplicación en la que queremos escribir, y muestra una barra que nos va indicando si ha captado nuestras palabras, además de permitir la inmediata corrección de las palabras que el VoiceType no ha entendido adecuadamente. Entre sus características técnicas destacamos unos elevados requerimientos de hardware, que constan de un Pentium a 90 MHz con 16 MB de RAM, además de una tarjeta de sonido Mwave o compatible Sound Blaster, aunque existe otra versión para procesadores 486. VoiceType dispone de un diccionario formado por 42.000 palabras, ampliable hasta 62.000 con términos del usuario, que pueden ser utilizados para introducir términos técnicos específicos. Dispone de un sistema de aprendizaje continuo, de modo que cuanto más se utiliza mejor reconoce la voz.

En el breve período en que dispusimos del equipo de IBM, no llegamos a acostumbrarnos por completo a su uso, por lo que resultó algo tedioso intentar dictar este artículo y, finalmente, recurrimos al método tradicional que, por el momento, nos resulta más cómodo y rápido. No obstante, tras el necesario período de adaptación y aprendizaje (tanto por parte del usuario como de la maquina), los resultados pueden resultar bastante aceptables y, con la práctica suficiente, es más que probable que se pueda llegar a hablar a un ritmo casi normal.

Hay que tener en cuenta que no estamos hablando con el ordenador, sino dictándole textos, y esto ya suele implicar un ritmo más lento de pronunciación. No cabe ninguna duda de que nos encontramos ante una tecnología con futuro, y una vez que consiga el grado necesario de desarrollo e implantación supondrá una gran revolución aunque, por el momento, su elevado precio lo deja fuera del alcance de la gran mayoría de usuarios.

FICHA DE PRODUCTO

Nombre: IBM VoiceType 3.0 para Windows 95

Fabricante: IBM

Distribuidor: IBM España

Sta. Hortensia, 26-28

28002 Madrid

Tel. (91) 397 60 00

Fax (91) 519 39 90

Idioma: Castellano

PVP: 126.440 pesetas

Calificación: 3 estrellas

Contenidos recomendados...

Comentar
Para comentar, es necesario iniciar sesión
Se muestran 0 comentarios
X

Uso de cookies

Esta web utiliza cookies técnicas, de personalización y análisis, propias y de terceros, para facilitarle la navegación de forma anónima y analizar estadísticas del uso de la web. Consideramos que si continúa navegando, acepta su uso. Obtener más información