De izquierda a derecha, los investigadores Yoan Gutiérrez, Mar Bonora, Fran Valero y Rafa Muñoz.

De izquierda a derecha, los investigadores Yoan Gutiérrez, Mar Bonora, Fran Valero y Rafa Muñoz. Iván Villarejo

En colaboración con:

Innovación

CENID ultima una IA que permitirá reducir un 80% el tiempo de búsquedas bibliográficas científicas

El proyecto a Análisis de tendencias de información en documentos es uno de los más relevantes en España en Inteligencia Artificial del Lenguaje.

21 octubre, 2023 06:20
Alicante

Cualquier persona que comience un proyecto de investigación científica sabe que una de las labores a la que más tiempo debe dedicar es a la recopilación de la información bibliográfica. Y posteriormente, a la jerarquización de esa información para que su hipótesis o trabajo esté fundamentado. El Centro de Inteligencia Digital de la provincia de Alicante (CENID), está en una fase muy avanzada de un proyecto que puede ahorrar hasta un 80% ese tiempo de búsqueda.

Se trata de la "Plataforma de análisis avanzado de textos científico-técnicos para la extracción de tendencias y conocimiento mediante técnicas de PLN (T2KNOW)". Uno de los pocos proyectos financiados por la Agencia Valenciana de la Innovación (AVI) en 2022 en la provincia, promovido además de por CENID, por el Instituto de Investigación Sanitaria y Biomédica de Alicante y la empresa alcoyana Difusión Comunicación.

Basado en tecnologías de Procesamiento de Lenguaje Natural del Departamento de Lenguajes y Sistemas Informáticos de la Universidad de Alicante (UA), puntero en España en la IA junto a los del País Vasco y Galicia, bucea en todo tipo de fuentes de información, desde un PDF a un Word (o incluso podría hacerlo en Redes Sociales si se configura para ello) para recopilar referencias bibliográficas.

[El CENID crea un proyecto para que Policía y Guardia Civil se alíen con la Inteligencia Digital]

Su objetivo es detectar la información que esté relacionada -en este primer caso en los ámbitos de la salud, el plástico la tecnología- e identificar a partir de la IA, con unos sensores específicos, las palabras relevantes en el objeto de estudio en concreto. Después, relaciona esas palabras con otros términos y otras fuentes en un espacio temporal determinado por el propio investigador para cribar las fuentes bibliográficas que necesita.

Como explican los codirectores del proyecto por parte de CENID, el catedrático Lenguajes y Sistemas Informáticos de la UA, Rafael Muñoz, y el profesor titular de la UA, Yoan Gutiérrez (en ISABIAL la investigadora principal es Alexandra Gomis), en esta fase de creación de la tecnología se han centrado en investigaciones, pero se puede desarrollar en un futuro a otras necesidades en el ámbito sanitario que utilice el mismo lenguaje específico Incluso en un producto comercial.

El profesor Rafa Muñoz.

El profesor Rafa Muñoz. Iván Villarejo

Por ejemplo, señala Muñoz, optimizar los recursos hospitalarios ante una crisis sanitaria conociendo los primeros síntomas de una epidemia o establecer los patrones que sigue una enfermedad para atajarla. Las posibilidades son casi ilimitadas, incluso desarrollarse para otros sectores productivos fuera de la salud.

Una de las presentaciones del proyecto.

Una de las presentaciones del proyecto. CENID

Para ello, sus investigadores han comenzado a trabajar con fuentes restringidas y verificables que certifiquen la veracidad de los datos. Así, la fase de investigación está casi acabada. En los próximos 10 meses, generaran la tecnología a partir de una la primera versión del producto que ya funciona pero del que quieren aumentar su eficacia. 

Los dos aspectos que hacen único a este proyecto de IA en el ámbito internacional, asegura Gutiérrez, es que "se especializa en el dominio de la biomedicina, es decir, en la salud en la época de plástico, y en que tiene una base de conocimiento enriquecido semánticamente". A eso hay que añadir que al estar relacionado con el lenguaje España es la referencia para 500 millones de personas que hablan el mismo idioma.

"Al tener toda esta información representada en una base de conocimiento semántico tienes la potencia de poder interrogarla de muchísimas formas. Es decir, no creamos una base de datos. Va más allá porque todo el contenido se relaciona con el resto y te permite identificarlo, encontrarlo y saber su importancia en el ámbito concreto", comenta Gutiérrez. 

El profesor Yoan Gutiérrez.

El profesor Yoan Gutiérrez. Iván Villarejo

En este proyecto trabajan ingenieros informáticos, lingüistas, traductores, una criminóloga, matemáticos, físicos, médicos e investigadores médicos. Y es que además de las dos instituciones y la empresa alcoyana, colaboran en el proyecto el Instituto Tecnológico del Plástico (AIMPLAS) y el Instituto Tecnológico de Informática (ITI).

IA del lenguaje

Gutiérrez explica que la IA aporta al ser humano la sensación de que está tratando con otro ser humano, o "al menos, que hay inteligencia del otro lado a la hora de plantear cualquier problema". Por esa razón la IA del Lenguaje constituye el 60% de toda la tecnología en este ámbito que se está desarrollando en el mundo.

De este modo existe la IA "generativa" (como puede ser el ChatGPT que es una de las inteligencias artificiales más conocidas) que "construye" o genera una respuesta a partir de otras muchas, señala Muñoz. No obstante, en CENID se trabaja en modelos de IA "predictiva".

La IA predictiva no genera una respuesta sino que ofrece al investigador, en este caso, los documentos en los que puede encontrar esa respuesta, jerarquizados según los parámetros que haya incluido por el número de veces que han sido referenciados en otras publicaciones.

Una vez que el sistema ha "aprendido" ya no necesita la capacidad de almacenamiento de datos que requiere, en esta fase, su lanzamiento. "Se genera una especie de ecuación (un sistema informático mucho más complejo) que resuelve un problema, en este caso relacionado con la salud, y luego se puede aplicar a otros campos", añade Muñoz.

[El CENID lanza VIVES, una campaña con voces para entrenar a la IA en el valenciano]

De hecho, en CENID trabajan en otros proyectos como la aplicación de IA a enfermos cardiometabólicos, que dirige el también catedrático de la UA, Andrés Montoyo, o el proyecto Vives, dirigido por el catedrático Manuel Palomar, mucho más amplio, utilizando diferentes lenguas para entrenar a la IA o para proporcionar una herramienta de lectura fácil para personas con discapacidad.

"Nosotros trabajamos en arquitecturas comunes, que luego se especializa en cada uno de los proyectos. No vamos a repetir la rueda dos veces porque está inventada, vamos a utilizar la misma rueda todos, esa arquitectura común como un nexo, que luego se va especializando dependiendo de las necesidades", concluye Muñoz.