Los retoques fotográficos son el pan de cada día. Borrar imperfecciones de la piel, eliminar los dichosos ojos rojos o añadir una máscara de maquillaje artificial son tareas casi imprescindibles antes de subir una imagen a una red social. Algunas de estas acciones ya empiezan a automatizarse gracias a la visión artificial o el aprendizaje automático.
"Los humanos somos muy sensibles a los pequeños errores en la estructura facial, especialmente si esos rostros son los suyos o de personas que conocen bien", dicen los investigadores de Facebook en un estudio que promete cambiar el gran incordio de las fotografías: los ojos cerrados.
No es la primera vez que se intenta resolver este problema con inteligencia artificial, pero sí que se logra una solución personalizada. Según indican Brian Dolhansky y Cristian Canton en su investigación, hasta ahora se han utilizado redes neuronales convolucionales (DNN), un tipo de algoritmo de aprendizaje profundo, que obtienen resultados "realistas y semánticamente plausibles".
¿El problema? "No preservan la identidad de la persona en la foto". Los investigadores apuntan que "no hay ninguna garantía de que los nuevos ojos correspondan a la estructura específica ocular del individio". De hecho, los DNN insertan un par de ojos en función de rostros similares del entrenamiento. El resultado, por tanto, es "indeseable y parcial".
Los ingenieros de Facebook han dado con la clave recurriendo a otro tipo de algoritmos de inteligencia artificial: las Redes Generativas Antagónicas (GAN), una clase de aprendizaje profundo que ha demostrado con éxito ser capaz de generar rostros desde cero o completar determinadas partes.
En concreto, el equipo ha utilizado una variante de esta tecnología que se llama GAN ejemplar (ExGAN) y usa información modelo para producir resultados de alta calidad y personalizados. Estos algoritmos "no tienen que inventar texturas o estructuras desde el principio, pero mantienen la semántica de la imagen original".
Pero si hay algo que consiguen estas redes es ofrecer una imagen automática y personalizada. De hecho, el generador puede usar otro ejemplo de los ojos para garantizar que se mantiene la identidad de la persona en la fotografía.