| Noticias | 20 SEP 1999

Philips lanza un reconocedor de la voz en 14 idiomas, castellano y catalán incluidos

Tags: Histórico
El mercado de los sistemas de conversión de voz a texto crece. Philips ha anunciado la comercialización de FreeSpeech 2000, el software de reconocimiento continuo de la voz humana y conversión a textos en 14 idiomas diferentes, incluido el castellano y el catalán.
Joan Carles Ambrojo
Esta solución es capaz de abrir ficheros, cerrar programas, crear textos o navegar por Internet con el control de la voz del usuario. La aplicación dispone de un vocabulario de 30.000 palabras, ampliable por el usuario hasta 64.000, e incluso reconoce voces de niños. Está dirigida al mercado del ?soho? y doméstico.
FreeSpeech es el primer programa de reconocimiento de voz y conversión a texto que funciona en catalán. La Generalitat de Catalunya ha financiado su desarrollo con 43,2 millones de pesetas, que ha corrido a cargo de la multinacional holandesa e investigadores de Teoría de la Señal y Comunicaciones de la Universidad Politécnica de Catalunya, entre otros científicos españoles.
Este acuerdo forma parte de los objetivos del Comisionado para la Sociedad de la Información, que apoya la presencia del catalán en las Tecnologías de la Información y la Comunicación.

Investigación española
Los recursos lingüísticos desde el punto de vista acústico, fonético y léxico, como la grabación de voces (110 adultos y 30 niños), conjunto de unidades fonéticas y diccionarios transcritos fonéticamente han sido proporcionados por un equipo de trabajo de la Politécnica de Catalunya, coordinado por Javier Hernando. En las tareas de transcripción fonética se han considerado cuatro variantes dialectales del catalán.
De este modo se ha adaptado al catalán el denominado juego de recursos lingüísticos (Language Resource Package), que ha permitido disponer del núcleo tecnológico del reconocimiento del habla continua y desarrollar aplicaciones finales a partir de las diferentes plataformas tecnológicas de Philips Speech Processing: SpeechMagic es una plataforma tecnológica para el desarrollo de aplicaciones de reconocimiento y conversión del habla en texto basadas en PC; SpeechMania, en cambio, es una herramienta para crear aplicaciones telefónicas de reconocimiento y comprensión de la voz.
FreeSpech 2000, que se comercializará a mediados de octubre, se presenta en inglés (americano y británico), francés, alemán y alemán de Austria, holandés, flamenco, portugués de Portugal y de Brasil, castellano con las variantes de Norteamérica, Centroamérica y Suramérica, y las cuatro variantes del catalán.
El desarrollo en catalán ha sido posible por el acuerdo firmado por el comisionado con la empresa Philips Speech Processing, unidad de negocio de Philips Royal Electronics. La Generalitat de Cataluña ha previsto la compra de 5.000 licencias para implantarlas en diversos servicios internos. En el programa también han participado los departamentos de Filología Catalana de la Universidad de Barcelona y de Filología Española de la Universidad Autónoma de Barcelona, así como el Instituto de Lingüística Aplicada de la Universidad Pompeu Fabra, Enciclopèdia Catalana, el Institut d´Estudis Catalans y la Fundación per a la Universitat Oberta de Catalunya, que han ofrecido recursos textuales.
FreeSpeech 2000 utiliza la tecnología HSA de Philips que agiliza el reconocimiento y minimiza los errores de transcripción. Además, aprende a la voz y al estilo de dictado del usuario, características que incrementan la velocidad. También permite que diferentes usuarios trabajen con el mismo ordenador.

Corel WordPerfect Office 2000
El programa permite dictar en aplicaciones Windows 95, 98 y 2000, desde Microsoft Office a Lotus Notes. Próximamente se ofrecerá una versión del futuro Corel WordPerfect Office 2000 con el sistema de reconocimiento del habla incluido en el paquete; una posibilidad que, sin embargo, no se ha planteado con un programa con un mercado tan masificado como el Office de Microsoft.

Sólo para Explorer
Un aviso para navegantes: FreeSpeech funciona correctamente con Internet Explorer... pero no soporta Netscape Navigator, como reconocen los creadores del programa. Las funciones EasyEdit y EasyCorrect permite la corrección del texto.
La aplicación ha sido completamente optimizada para ordenadores con Pentium III (aumenta la eficacia en un 30 por ciento, según los técnicos). Pero aseguran que funciona también, pero con mayor lentitud, en un Pentium MMX de 166 MHz y 48 MB RAM.
El reconocedor es multilingüe: es decir, permite crear, editar y formatear documentos en 14 idiomas distintos. Eso sí, los comandos (más de 2.000 de serie) sólo funcionarán en el mismo idioma que el sistema operativo del ordenador. El sistema incluye macros para texto, teclado, ratón y para comandos de programa y permite al usuario definir los suyos.
La solución se comercializa en dos versiones: Speech Mike incluye micrófono, ratón y auriculares (precio recomendado: 29.900 pesetas, IVA incluido: 179,70 euros); la económica se comercializa con microauriculares (19.900 pesetas, IVA incluido: 119,60 euros). Philips tiene en desarrollo versiones profesionales y para trabajo en red.

www.speech.philips.com

Contenidos recomendados...

Comentar
Para comentar, es necesario iniciar sesión
Se muestran 0 comentarios
X

Uso de cookies

Esta web utiliza cookies técnicas, de personalización y análisis, propias y de terceros, para facilitarle la navegación de forma anónima y analizar estadísticas del uso de la web. Consideramos que si continúa navegando, acepta su uso. Obtener más información