| Noticias | 09 SEP 2010

HTML5 podría hacer que las páginas Web hablen y escuchen

El World Wide Consortium está investigando la posibilidad de integrar capacidades del habla en la Web. Así, En algún momento en un futuro cercano, los usuarios podrían no sólo leer páginas Web, sino también mantener conversaciones con ellas, al menos, si un nuevo grupo de actividad del W3C tiene sus frutos.
Paula Bardera

El W3C está investigando la posibilidad de incorporar reconocimiento de voz e interfaces de síntesis de voz dentro de las páginas Web. Un nuevo grupo de trabajo realizará un informe al respecto dentro de un año, en el que resumirá la posibilidad de añadir características de voz y habla en HTML, el estándar del W3C para renderizar páginas Web.

De hecho, AT&T, Google, Microsoft y la Fundación Mozilla, entre otros, tienen ingenieros trabajando en este sentido.

La voz humana y la Web no son extraños. Google incluye una aplicación de búsqueda web basada en voz en su sistema operativo Android  y Microsoft promete nuevas características de voz en su próximo Windows Phone 7. El HTML Speech Incubator Group está estudiando la posibilidad de desarrollar una interfaz Web estándar tanto para reconocimiento de voz como para síntesis del habla, según ha explicado el responsable del grupo, Dan Brunett, que también es el director de tecnologías de voz y estándares del proveedor de sistemas de respuesta por voz, Voxeo.

Una interfaz de ese tipo podría utilizarse en múltiples navegadores. Utilizando un plugin de reconocimiento de voz y síntesis del habla, los navegadores podrían leer páginas en alto o permitir que los usuarios rellenen formularios en la Web de forma audible.

Si bien este trabajo podría superponerse con otro proyecto de W3C basado en la voz, VoiceXML, los dos esfuerzos son ligeramente distintos. VoiceXML no funcionaría con la Web, puesto que fue diseñado en principio para aplicaciones controladas por voz, tales como sistemas de respuesta basados en voz para teléfonos, donde es ampliamente utilizado.

Burnett también señaló que, si finalmente se considera posible desarrollar este tipo de capacidades, sería otro grupo del W3C el encargado de ello. Por ejemplo, el HTML Working Group.

El W3C ha estado muy ocupado con tecnologías de voz en toda una serie de frentes. La organización lanzó recientemente la versión 3.0 de VoiceXML. En ella, el grupo de trabajo añadió descripciones semánticas de las características y organizó la funcionalidad de las mismas en módulos.

El W3C también planea lanzar en breve la versión 1.1 de SSML, Speech Synthesis Markup Language, que se utiliza a menudo con VoiceXML y que incorporará idiomas asiáticos. Además, proporcionará a los desarrolladores más flexibilidad en la selección de la voz y en el manejo de lenguas no muy frecuentes.

Contenidos recomendados...

Comentar
Para comentar, es necesario iniciar sesión
Se muestran 0 comentarios
X

Uso de cookies

Esta web utiliza cookies técnicas, de personalización y análisis, propias y de terceros, para facilitarle la navegación de forma anónima y analizar estadísticas del uso de la web. Consideramos que si continúa navegando, acepta su uso. Obtener más información