La Inteligencia Artificial de Google da un nuevo paso en su empeño por aprender de la interacción humana: después de miles de horas viendo televisión ya es capaz de leer los labios. Su eficacia es del 46,8 %; un profesional humano consiguió un 12,6 % de acierto en la lectura de labios.
La experiencia en Inteligencia Artificial sigue aumentando para Google y su equipo de investigación Deepmind. El experimento se llevó a cabo con 5.000 horas de TV de la cadena BBC. El software de Google fue capaz de aprender por sí mismo haciendo uso de una red neuronal.
El sistema de IA y red neuronal fue capaz de aprender por sí mismo
De las 5.000 horas visionadas por el software de Inteligencia Artificial de Google, equipado con una cámara y software de reconocimiento de caras, el software aprendió de un total de más de 118.000 frases con 17.500 palabras únicas. Los programas de TV proyectados fueron de diverso tipo; con distintos presentadores de los que aprendió la lectura de labios sin ningún tipo de condicionante.
Lo más revolucionario del experimento es que las variables no eran conocidas, por lo que el sistema aprendió en circunstancias que el equipo no controlaba. Expresiones habituales y menos, con un número de palabras altísimo en comparación con otros experimentos similares. El porcentaje de acierto del 47,8 % es un avance enorme en un software de su tipo. También si se compara con un profesional de lectura de labios.
El experimento facilitaría el reconocimiento labial en cámaras de seguridad
En Deepmind afirman que los resultados se dirigen a eliminar las barreras que las personas ciegas tienen a diario. También podría utilizarse para hacer más útiles los asistentes personales en el móvil, como Google Assistant: aparte de escuchar las palabras la cámara podría reconocer los labios con ayuda del nuevo software.
Tampoco se esconde la aplicación práctica aplicada a la seguridad: la Inteligencia artificial de Google podría leer los labios de las personas grabadas con una cámara de seguridad. Aunque en Deepmind afirman que será complicado dada la escasa tasa de frames por segundo que poseen esas grabaciones.
Puedes encontrar todos los resultados del experimento en este PDF.
Vía The Verge