Varios ejemplos de los algoritmos de Facebook.

Varios ejemplos de los algoritmos de Facebook.

Investigación

Facebook logra abrir los ojos cerrados en fotos con inteligencia artificial

Usa algoritmos GAN para mantener la "identidad" de la personas

19 junio, 2018 12:00

Los retoques fotográficos son el pan de cada día. Borrar imperfecciones de la piel, eliminar los dichosos ojos rojos o añadir una máscara de maquillaje artificial son tareas casi imprescindibles antes de subir una imagen a una red social. Algunas de estas acciones ya empiezan a automatizarse gracias a la visión artificial o el aprendizaje automático. 

"Los humanos somos muy sensibles a los pequeños errores en la estructura facial, especialmente si esos rostros son los suyos o de personas que conocen bien", dicen los investigadores de Facebook en un estudio que promete cambiar el gran incordio de las fotografías: los ojos cerrados.  

No es la primera vez que se intenta resolver este problema con inteligencia artificial, pero sí que se logra una solución personalizada. Según indican Brian Dolhansky y Cristian Canton en su investigación, hasta ahora se han utilizado redes neuronales convolucionales (DNN), un tipo de algoritmo de aprendizaje profundo, que obtienen resultados "realistas y semánticamente plausibles".

¿El problema? "No preservan la identidad de la persona en la foto". Los investigadores apuntan que "no hay ninguna garantía de que los nuevos ojos correspondan a la estructura específica ocular del individio". De hecho, los DNN insertan un par de ojos en función de rostros similares del entrenamiento. El resultado, por tanto, es "indeseable y parcial".

Los ingenieros de Facebook han dado con la clave recurriendo a otro tipo de algoritmos de inteligencia artificial: las Redes Generativas Antagónicas (GAN), una clase de aprendizaje profundo que ha demostrado con éxito ser capaz de generar rostros desde cero o completar determinadas partes.

En concreto, el equipo ha utilizado una variante de esta tecnología que se llama GAN ejemplar (ExGAN) y usa información modelo para producir resultados de alta calidad y personalizados. Estos algoritmos "no tienen que inventar texturas o estructuras desde el principio, pero mantienen la semántica de la imagen original". 

Pero si hay algo que consiguen estas redes es ofrecer una imagen automática y personalizada. De hecho, el generador puede usar otro ejemplo de los ojos para garantizar que se mantiene la identidad de la persona en la fotografía.