VoiceXML 2.1 extiende el lenguaje con ocho nuevas características que incluyen acceso dinámico a gramática y escritura, detección mediante un aviso de que el usuario está ausente y procesado de múltiples juegos de datos con un único acceso al servidor. Todas las aplicaciones de la versión anterior, VoiceXML 2.0, trabajan bajo la nueva especificación sin requerir modificación alguna.

Las recomendaciones las ha anunciado Max Ball, director de producto del laboratorio de Genesys Telecommunications, uno de los principales proveedores de software para centros de llamadas. Según Max, “VoiceXML 2.1 ofrece una significante mejora con respecto a especificaciones anteriores, con una mayor madurez para ser utilizada en los negocios y poder ser más productivos”.

VoiceXML es el principal componente de la W3C Speech Interface Framework, el cual también incluye Speech Recognition Grammar Specifications (SRGS 1.0), Speech Syntesis Markup Language (SSML 1.0) y la nueva Semantic Interpretation for Speech Recognition (SISR 1.0). Esta última permite a los desarrolladores extraer y traducir las representaciones textuales de palabras mediante un sistema de reconocimiento de voz con el fin de estructurar los resultados y presentarlos en un formato adecuado para su procesamiento. Por ejemplo, con SISR, la secuencia “quiero volar de Madrid a Barcelona” puede ser convertida a una estructura de datos que tan sólo contenga “salida: MAD” y “destino: BCN”.

El protocolo de etiquetas XML ha permitido la creación de diálogos de voz con características como grabación, DTMF, telefonía, o conversaciones simultáneas. Hasta ahora, VoiceXML 2.0 ha aportado grandes avances en el desarrollo de numerosas aplicaciones de voz con el fin de poder integrarlas en los servicios web multimedia.