Un gran número de los gráficos que se muestran en los medios de comunicación se repiten e, incluso, en ocasiones, simplemente se actualizan los de periodos anteriores: el paro, los impuestos, la deuda pública, el PIB o la afiliación a la seguridad social… “En realidad, los infografistas aportan poco valor a estos gráficos, que son siempre los mismos”, por lo que lo único que hacen es “restarles tiempo para elaborar otro tipo de contenidos más sofisticados”, subraya Rafa Höhr, socio de Prodigioso Volcán y director del proyecto graf+IA.
Este es uno de los motivos por los que nace la idea de desarrollar un proyecto que evite este particular “déjà vu en las redacciones”. El reto era crear un sistema para generar esos gráficos de manera automática. “Unir la inteligencia artificial y el machine learning a la experiencia de los infografistas y periodistas, para ayudar a los medios a ser más ágiles”, explica Rafaela Campani, periodista y consultora de Prodigioso Volcán al frente del proyecto. “Buscamos que la IA sea algo normal en el flujo de trabajo de los medios de comunicación, integrarla en las redacciones”, incide Campani.
Para desarrollarlo, además de conseguir la financiación de Google DNI Fund -programa de Google para impulsar el periodismo en la era digital-, se aliaron con los ingenieros de Intelygenz. Así surge graf+IA, una plataforma de generación automática de gráficos simples y recurrentes a través de inteligencia artificial, en concreto de Machine Learning Comprehension (MRC). Se ha desarrollado un toolkit de código abierto que usa representaciones distribuidas de texto para capturar similitudes entre conceptos escritos en el mismo.
Graf+IA monitoriza el texto a medida que el redactor va escribiendo: titular, entradilla, primeras líneas… El sistema va asociando palabras y expresiones hasta deducir (según su experiencia/aprendizaje) la temática que aborda. En cuanto lo detecta, el sistema parpadea y ofrece la previsualización de un gráfico que, si encaja en el contenido, el redactor puede incorporarlo al texto y adaptar los colores del gráfico al estilo de cada web.
Para “entrenar” al sistema, se ha alimentado la plataforma con un paquete de fuentes de noticias procedentes de diferentes medios sobre diferentes temas concretos para que “pudiera discriminar qué es y qué no es el tema del que tratamos. Cuanto más aprende sobre lo que no es, más se acerca a lo que es”. Así, detecta las palabras de cada párrafo y las envía al servidor para hacer un análisis de concepto. El sistema valora los diferentes bloques que encuentra en el texto y analiza la probabilidad de que se refieran a un determinado tema que pueda visualizarse en un gráfico.
Proyecto escalable
A día de hoy trabaja con tres conceptos: PIB, IPC y paro y utiliza el INE como fuente de información para generar los gráficos. La idea es escalar la plataforma: ampliando los conceptos y fuentes que utiliza, ampliando los tipos de gráficos generados y, finalmente, ampliando su uso a otros entornos que no sean los medios de comunicación. “Creemos que graf+IA puede ayudar en la producción de informes y memorias en un entorno empresarial, por ejemplo”, puntualiza Campani.