Investigación
J.M. Hernández (Cambridge): "La conexión entre empresas y la universidad acelera la IA"
El investigador español ha obtenido una de las 15 becas Alan Turing que cada año concede la UK Research and Innovation.
27 diciembre, 2020 02:44Noticias relacionadas
José Miguel Hernández Lobato baila tango argentino. Fue en Cambridge donde aprendió a acompasar sus movimientos con las notas de este género musical tan particular. Este madrileño, nacido en 1982, acudía a clases de baile al mismo tiempo que realizaba su primer postdoctorado sobre aprendizaje automático en la ciudad británica y ocupaba parte de su tiempo en la lectura de libros de divulgación científica.
Gracias a esta afición, la del baile, conoció a su mujer durante su estancia en Boston, a donde viajó para cursar un segundo postdoctorado. De vuelta en Cambridge, y tras haber formado una familia –tiene un hijo de dos años– acaba de recibir uno de los premios Alan Turing de 2020.
Una beca que dará impulso a su investigación “sobre el diseño de nuevos métodos de aprendizaje automático capaces de identificar moléculas con propiedades óptimas de forma más rápida y barata”, explica él mismo a D+I durante una conversión vía correo electrónico.
Trabajar en métodos de inteligencia artificial y en un proyecto de investigación que les permita alcanzar un puesto de liderazgo a nivel mundial, son dos de los requisitos que han de cumplir quienes solicitan esta beca. Hernández Lobato fue uno de los tres investigadores internos seleccionados por Cambridge para optar a esta financiación que otorga cada año el organismo púbico UK Research and Innovation (UKRI).
¿Qué problemas vendría a resolver su investigación?
Todo lo que nos rodea está compuesto de moléculas que están formadas por átomos. Estos, a su vez, se pueden combinar entre sí como piezas de lego para crear nuevas moléculas. De esas combinaciones pueden resultar, por ejemplo, nuevos materiales para fabricar pantallas de televisión con mejor calidad de color y contraste. Mientras que otras pueden dar lugar a nuevos fármacos que podrían utilizarse para tratar enfermedades como el VIH o la Covid-19.
El problema es que la mayoría de las combinaciones de átomos no resultan en moléculas que sean útiles en la práctica, y encontrar la adecuada requiere una estrategia de prueba y error que puede ser muy costosa de llevar a cabo. Mi investigación se centra en crear nuevos algoritmos que permitan encontrar la combinación de átomos adecuada para un problema en particular de forma mucho más rápida de lo que es posible en la actualidad.
¿Cuáles son las características que hacen únicos a esos algoritmos?
Los algoritmos que diseñaré se basan en modelos generativos de aprendizaje profundo. Estos modelos utilizan redes neuronales para aprender y capturar las características típicas de un conjunto de datos. Una vez que las han aprendido, dichos modelos pueden generar nuevos datos sintéticos similares a los utilizados en su aprendizaje, pero con propiedades distintas. Se trata de un proceso similar al que seguiría una persona que escribiera una nueva novela policiaca después de haber leído un gran número de libros ya existentes de este género literario.
Mi proyecto de investigación utilizará modelos generativos de aprendizaje profundo y los aplicará a datos relativos a moléculas que ya han sido catalogadas y sintetizadas en la actualidad. Una vez entrenados, generarán nuevas moléculas con una alta probabilidad de tener mejores propiedades que las existentes y que, a su vez, serán evaluadas para ajustar los modelos generativos, de modo que éstos aprendan, de forma iterativa, a generar mejores moléculas. La clave es cómo llevar a cabo este proceso minimizando el número de moléculas que se necesitan antes de encontrar las mejores.
¿Qué significa para su investigación y para su trayectoria profesional esta beca?
Proporcionará recursos que se utilizarán para contratar personal investigador y de soporte administrativo, así como para financiar la interacción con mis colaboradores expertos en el diseño de fármacos, la síntesis química, el diseño de materiales y los cálculos cuántico mecánicos. Entre ellos están Rafael Gómez-Bombarelli, otro español profesor en el Instituto de Tecnología de Massachussetts y que trabaja en el campo de la ciencia de materiales computacional; y Ola Engkvist, director asociado de química computacional en Astra Zeneca, una de las mayores compañías biofarmacéuticas y que tiene una de sus sedes en Cambridge.
La beca también me ayudará a reducir mis compromisos de docencia y administración con la universidad, para que pueda dedicarme a fondo a mis investigaciones científicas. Entre mis objetivos también está formar a investigadores postdoctorales y a estudiantes de doctorado en este área y organizar escuelas de verano que reúnan a los mayores expertos en el campo.
Desde septiembre de 2016, es profesor universitario en aprendizaje automático en el Departamento de Ingeniería de la Universidad de Cambridge, ¿cuál ha sido su experiencia en estos años dedicados a la investigación?
Mi puesto de profesor universitario en Cambridge fue un cambio muy significativo. Antes tenía libertad para explorar problemas científicos en profundidad y pocas responsabilidades adicionales. Ahora dirijo un grupo con unos 14 estudiantes de doctorado y varios investigadores postdoctorales, además de dar clase y realizar labores de administración para la universidad.
Esto es posible porque, por una parte, la carga docente en Cambridge es en general más baja que en otras universidades: doy solamente unas 25 horas de clase al año. Además, el nivel de los estudiantes es extremadamente alto y les permite avanzar muy rápido. Varios de ellos se incorporan al doctorado tras finalizar el programa de máster en aprendizaje automático en Cambridge, que tiene una tasa de aceptación de solicitudes del 5%. De los estudiantes de máster, solamente un 10% suele ser admitido en el programa de doctorado, por lo que hay un nivel muy alto.
Dirigir un grupo de investigación como el mío requiere un alto grado de multitarea y puede ser muy estresante en momentos determinados cuando el trabajo se acumula. Sin embargo, también ofrece muchas ventajas, como la oportunidad de trabajar con algunos de los mejores estudiantes de doctorado en aprendizaje automático del mundo.
¿Cuál es la relación de una institución como la Universidad de Cambridge con la empresa privada?
Una de las cosas que he notado en Cambridge es que hay una conexión muy importante entre ambas. En mi caso, más de la mitad de la financiación de mi grupo de investigación procede de compañías como Samsung, Microsoft, Intel o Google. Estas empresas saben que la universidad cuenta con investigadores que son expertos a nivel mundial en sus campos de experiencia y les interesa financiarles porque les permite tener un contacto muy próximo con los avances más novedosos y con mayor potencial de impacto en sus negocios.
Su primera formación académica la recibió en la Universidad Autónoma de Madrid (UAM), pero no tardó en desarrollar tu carrera profesional en Reino Unido, ¿escasean las oportunidades para investigadores de inteligencia artificial en España?
El campo de la inteligencia artificial ha experimentado en los últimos 5-10 años un crecimiento exponencial debido al alto impacto de varios avances científicos recientes. Tecnologías que antes eran consideradas incapaces de salir del laboratorio han pasado a formar parte de innumerables productos comerciales. Esto ha incrementado las oportunidades para investigadores de IA en todo el mundo, incluyendo España. Sin embargo, es cierto que en el Reino Unido son mucho mayores.
Hay que tener en cuenta que gigantes tecnológicos, como Google, Facebook, Microsoft o Amazon, están invirtiendo de forma significativa en investigación en IA atrayendo a los mejores científicos. Estas compañías tienen en el Reino Unido muchos de sus centros de investigación y crean una gran cantidad de oferta laboral. Además, la competencia entre empresas también ha contribuido a incrementar los salarios que ofrecen de forma muy significativa.
En España, sin embargo, la presencia del sector empresarial en la investigación en IA es mucho más reducida. A lo que hay que añadir la escasez de grupos de investigación universitarios que publiquen de forma regular en las conferencias internacionales en aprendizaje automático. La mejor en este área es NeurIPS y el número de artículos de grupos españoles que aparecen anualmente es muy reducido, aunque no inexistente. Por el contrario, este año el Reino Unido es el tercer país en número de artículos científicos aceptados en NeurIPS, por detrás de Estados Unidos y China.
¿Cuáles son los principales obstáculos para desarrollar una carrera científica en nuestro país?
España es un país en el que, desafortunadamente, la inversión en investigación como porcentaje del producto interior bruto ha sido siempre muy inferior a otros países como Estados Unidos, Alemania o Reino Unido. En estas condiciones es muy difícil competir y los investigadores con un alto grado de excelencia tienden a irse. Aún así, España cuenta con científicos de muy alta calidad, pero la falta de soportes necesarios no permite que alcancen todo su potencial.
Por ejemplo, en comparación con Cambridge, los profesores universitarios en España suelen tener una carga docente y administrativa demasiado elevada. Esto hace que el tiempo que puedan dedicar a la investigación sea muy reducido. Otro factor limitante es el reducido acceso a fondos públicos para financiar proyectos de investigación. En el Reino Unido, la financiación típica suele ser de más de un millón de libras durante tres años a repartir entre unos dos o tres profesores universitarios, y estos fondos se suelen utilizar para contratar a investigadores postdoctorales. En España, se reduce a unos 100.000 euros durante tres años, a repartir entre un grupo de hasta diez profesores universitarios, lo que provoca que apenas haya investigadores postdoctorales.