| Artículos | 01 JUN 2003

Intel enseña al ordenador a leer los labios

Tags: Histórico
José M. Alarcón.
Los investigadores de Intel Corporation han puesto a disposición pública un software bajo una licencia de código abierto que permite a los desarrolladores crear programas que ven y leen los labios de la misma manera que lo hacen los humanos para entender mejor los comandos hablados.
Los algoritmos de reconocimiento de voz actuales funcionan bien cuando se elimina el ruido de fondo (con filtros de software o un micrófono con cancelación de ruido), pero su precisión de reconocimiento se ve mermada en entornos ruidosos como los lugares públicos. Utilizando en parte los algoritmos de detección de facciones de la librería de visión artificial OpenCV de Intel, el software Audio Visual Speech Recognition (AVSR) permite a los ordenadores detectar la cara de un orador y seguir los movimientos de su boca. El apoyo del reconocimiento de voz con el seguimiento simultáneo del contorno de la boca ayuda a mejorar enormemente la precisión del reconocimiento en entornos ruidosos. Desde www.intel.com/research/mrl/research/avcsr.htm se puede descargar el código fuente del programa con información de interés y bibliotecas de visión artificial y reconocimiento de voz, todo ello de forma gratuita.

Contenidos recomendados...

Comentar
Para comentar, es necesario iniciar sesión
Se muestran 0 comentarios
X

Uso de cookies

Esta web utiliza cookies técnicas, de personalización y análisis, propias y de terceros, para facilitarle la navegación de forma anónima y analizar estadísticas del uso de la web. Consideramos que si continúa navegando, acepta su uso. Obtener más información