Científicos del Consejo Superior de Investigaciones Científicas (CSIC) lideran el proyecto europeo DEEP Hybrid DataCloud (DEEP), una plataforma que permite desarrollar, entrenar y compartir en la nube aplicaciones basadas en inteligencia artificial. Así, DEEP hace uso de las infraestructuras de la European Open Science Cloud (EOSC) o nube de ciencia abierta en Europa, que pretende crear un entorno de computación y datos sin fronteras dentro del continente, de forma que los científicos puedan compartir, almacenar y reutilizar datos de investigación.
En concreto, este proyecto europeo, basado en hacer accesible herramientas de machine y deep learning, ofrece una serie de módulos diseñados para facilitar a la comunidad científica el desarrollo, uso y explotación de herramientas de análisis de datos, como las redes neuronales, el procesamiento en paralelo de grandes conjuntos de datos o el análisis de flujo de datos online.
Las técnicas de machine learning permiten que una máquina aprenda a realizar ciertas tareas directamente a partir de los datos. Para este aprendizaje, los modelos más utilizados hoy en día son las llamadas redes neuronales. Deep Learning es una subrama del machine learning donde dichas redes neuronales tienen un tamaño mayor permitiendo así resolver problemas más complejos.
“Ambas técnicas están hoy en día a la vanguardia de la inteligencia artificial, dando forma a herramientas que se están utilizando para lograr niveles muy altos de precisión en muchos campos de investigación diferentes. El entrenamiento de un modelo de deep learning es una tarea muy compleja y de gran intensidad computacional. Requiere que el usuario tenga una configuración completa que involucre un cierto hardware, los controladores adecuados, software dedicado y suficientes recursos de memoria y almacenamiento”, precisa la investigadora del CSIC Lara Lloret, del Instituto de Física de Cantabria (CSIC-Universidad de Cantabria).
A menudo, el desarrollador de una aplicación de deep learning no es un experto en computación, por lo que quiere que toda esta tecnología sea tan accesible y transparente como sea posible para poder concentrarse solo en la creación de un nuevo modelo o en aplicar un modelo ya preentrenado a algún conjunto de datos. “Esto es exactamente lo que ofrecemos: un marco para todos los usuarios, no solo para unos pocos expertos, que permite desarrollar, entrenar y compartir modelos de deep y machine learning tanto localmente, como en un sistema cloud, de una manera sencilla”, recalca Lloret.
El proyecto fue ganador del concurso de demos de la conferencia EOSChub week 2020, que este año tuvo lugar virtualmente.