Ignacio Arganda, investigador Ikerbasque en la UPV/EHU.

Ignacio Arganda, investigador Ikerbasque en la UPV/EHU.

Investigación

Investigadores vascos enseñan a las máquinas a entender lo que ven

Desde la UPV/EHU están desarrollando un modelo de inteligencia artificial capaz de predecir la belleza facial y de estimar la edad facial

3 enero, 2020 11:00

El grupo Computer Vision and Pattern Discovery  de la UPV/EHU está desarrollando avances en la visión por ordenador y el aprendizaje automático para aplicarlos en la predicción de la belleza facial y en la estimación de la edad facial. El objetivo es conseguir “la máquina inteligente ideal“ capaz de percibir su entorno y llevar a cabo acciones que maximicen sus posibilidades de éxito en una tarea.

Así, los investigadores Ikerbasque Fadi Dornaika e Ignacio Arganda del departamento de Ciencias de la Computación e Inteligencia Artificialde la UPV/EHU están utilizando, “básicamente, técnicas modernas de inteligencia artificial para resolver problemas de imagen muy diversos, en imágenes de todo tipo: 2D, 3D, vídeos, entre otros.”, explica Ignacio Arganda, investigador Ikerbasque de este departamento.

De hecho, este equipo de investigación está especializado en ámbitos tan diversos como imágenes biomédicas (detección de células, tejidos, tumores…); imágenes faciales (percepción de la belleza, estimación de la edad); o imágenes de la calle (localización de vehículos, peatones…).

“En general, son técnicas de aprendizaje automático, porque normalmente partimos de un conjunto de datos, imágenes o vídeos etiquetados (en los que se conoce dónde están los objetos o qué tipo de categoría tienen), con los que enseñamos o entrenamos a nuestros modelos estadísticos o de inteligencia artificial a asignar esas mismas etiquetas a ejemplos que no habían visto antes”, explica Arganda.

Así, en la investigación sobre la predicción de la belleza, estos investigadores están intentando ”replicar las puntuaciones de belleza dadas en diferentes bases de datos, utilizando técnicas semisupervisadas (en las que no todas las imágenes están etiquetadas)”, subraya el doctor Arganda. Para eso, están utilizando redes en las que se extraen diferentes características que se utilizan para entrenar a los modelos con los que predecir la belleza.

En esta línea, los miembros del equipo han demostrado que “el aprendizaje semisupervisado, nunca utilizado hasta ahora para este tipo de problema, da tan buenos resultados o incluso mejores que el supervisado (en el que todas las imágenes están etiquetadas)”, apunta el investigador vasco.

“Las técnicas de aprendizaje automático nos afectan en la vida más de lo que pensamos”

Para la estimación de la edad, se utilizan redes neuronales convolucionales: “Lo que se tiene es una imagen de entrada y una serie de filtros va extrayendo características que ayudan a tomar la decisión final, o sea un número, en este caso la edad”, añade.

En esta línea, “hicimos un estudio empírico para ver qué funciones de error ayudan a entrenar mejor a las redes en este ámbito, porque el error en las estimaciones se puede minimizar de maneras diferentes”, explica el investigador. Los resultados experimentales obtenidos han demostrado la manera en la que se puede mejorar la estimación de la edad.

Para este tipo de predicciones y estimaciones se utilizan redes neuronales profundas: “Redes con muchísimas conexiones, muchísimos filtros, millones de datos… Pero es importante entender en qué se está fijando la red para predecir la edad de una persona, o hacer cualquier otro tipo de predicción. Actualmente, existe otro campo de investigación, en el que estamos sumergidos, llamado inteligencia artificial explicable o interpretable, que estudia técnicas con las que dilucidar en qué pone la red su atención”, apunta Arganda.

Asimismo, el investigador alerta de que “las técnicas de aprendizaje automático nos afectan en la vida más de lo que pensamos“, ya que se están generando muchísimos datos y se están tomando decisiones de alto nivel en función de estos sistemas.

Por ello, incide, “es muy importante tener en cuenta el factor ético. De hecho, en el aprendizaje automático se utilizan bases de datos gigantescas con las que se entrenan los modelos, y todos los sesgos que contienen estos datos se replican en las predicciones y estimaciones que hacen los modelos, y puede ser realmente nocivo. En ese sentido, hay investigaciones abiertas en la que se estudia cómo quitar los diferentes sesgos de los datos”. En opinión de Arganda, “estamos en un momento apasionante en este campo”.

Fadi Dornaika, Ikerbasque research professor del Departamento de Ciencias de la Computación e Inteligencia Artificial de la UPV/EHU, es líder del grupo de investigación Computer Vision and Pattern Discovery y está especializado en visión por ordenador, procesamiento de imagen, reconocimiento de patrones y aprendizaje automático. En las investigaciones han participado, además de Dornaika y Arganda, los investigadores del grupo Anne Elorza y Abdelmalik Moujahid, así como el estudiante de doctorado en cotutela Kunwei Wang, y, por otra parte, S.E. Bekhouche de la Universidad de Oulu (Finlandia) y la Universidad de Djelfa (Argelia).