Alexa, el conocido altavoz inteligente desarrollado por Amazon Web Services (AWS), irrumpía con fuerza hace justo un año en los despachos del departamento de Urbanismo del Ayuntamiento de Madrid. El proyecto Cibeles llegaba para establecer una comunicación entre el usuario (funcionarios, vecinos…) y el altavoz en torno a la información urbanística.

Según explican desde AWS, "el uso de la voz se traduce en una mejora significativa de la experiencia de búsqueda de información, dado que el procesamiento del lenguaje natural considera la pregunta completa y no sólo las palabras clave".

¿Resultado? "Con este sistema, reducimos un 80% el tiempo que habitualmente necesitábamos para conseguir una información", explica Jesús Cerezo, jefe de servicio de Integración de Procesos en la Subdirección General de Innovación e Información Urbana del Ayuntamiento de Madrid. 

La pregunta es: ¿cómo podía evolucionar Cibeles? La respuesta, no por evidente, deja de sorprender: entrenando a la inteligencia artificial de Alexa para que aprenda más y más información.

Así es como ha nacido Cibeles+, esa evolución del proyecto original que ahora pone el foco en todo el corpus de normativa legal relacionada con el urbanismo madrileño y que puede ser de gran utilidad dependiendo de las circunstancias que rodeen a una determinada consulta.

Desarrollado por Saturno Labs bajo la dirección de José María Boyano Sánchez, subdirector general de Innovación e Información Urbana, y Jesús Cerezo Arillo, jefe de Servicio de Integración de Procesos, el Prototipo Cibeles+ ha sido dotado de la habilidad para leer textos normativos y responder utilizando voz o escritura mediante procesamiento del lenguaje natural.

La intención es completar ese proceso de ruptura de las barreras en el acceso a la información urbanística que había iniciado su antecesor, el Prototipo Cibeles.

Total disponibilidad

La alta tecnología empleada en Cibeles+ garantiza total accesibilidad a las normas, ofrece un completo servicio de información urbanística las 24 horas del día, los 7 días de la semana y los 365 días al año y mejora la comodidad y eficiencia de la interacción con la administración apoyándose en un lenguaje natural y sencillo.

Según explican sus impulsores a D+I, "aunque el proceso de definición de Cibeles+ es complejo, su funcionamiento es bien sencillo: interactúa con la persona interesada en localizar cierta información urbanística y, mediante los recursos que ofrecen ramas de la Inteligencia Artificial como el procesamiento del lenguaje natural y el machine learning, el sistema consigue responder a cuestiones tan complejas como las urbanísticas".

Básicamente, se apoya en Alexa y Twitter como canales para recibir la pregunta sobre la normativa urbanística y responder los datos extraídos de los textos normativos del Plan General.

Detecta qué le están preguntando y para qué localización; en función de esa posición, localiza la información dentro del articulado y elabora una respuesta que incluye tanto el dato concreto solicitado como el número y epígrafe del artículo de las Normas Urbanísticas en que se encuentra.

Por si eso no fuera suficiente, además, invita a su interlocutor a que reciba en su correo electrónico un resumen con enlaces a la documentación.

Para la elaboración de este prototipo, por supuesto, ha habido barreras. La primera, se encuentra en el idioma, "pues no existen grandes proyectos globales de investigación para potenciar el procesamiento del lenguaje natural en lengua castellana", explican las mismas fuentes.

De hecho, "es la primera vez que se realiza un proyecto de esta complejidad en español. La falta de conjuntos de datos bien estructurados en esta lengua no permite el entrenamiento de modelos similares, lo que convierte al proyecto en todo un reto a la hora de combinar el uso de la voz y el procesamiento del lenguaje natural con los servicios municipales y con el objetivo de localizar la información en tiempo real y mediante cualquier dispositivo".

Como texto de partida se toman las Normas Urbanísticas del Plan General de 1997 en su edición consolidada actual, se someten a un proceso de extracción y limpieza para obtener de forma automatizada un documento en formato CSV.

'Dataset'

A continuación, se atomiza de forma automática este documento con el fin de integrar subestructuras más pequeñas y fáciles de indexar, eliminando extractos de textos no útiles, como las notas a pie de página.

Una vez extraído, limpiado e indexado el texto de forma automática, se obtiene un dataset con el que ya puede trabajar el resto del sistema. Dada la volatilidad de las normas urbanísticas, con constantes actualizaciones, una de las máximas del prototipado ha sido conseguir que el uso de la herramienta de acceso a la normativa sea universal, sin programar reglas o contemplar casuísticas específicas.

En definitiva, el proyecto constituirá un servicio de consulta único, automático e inteligente que puede ser utilizado en diversas plataformas.

Como se ha apuntado, se define con la indexación múltiple entre los textos de manera interna y la creación de un modelo de Inteligencia Artificial propio, utilizando el dataset creado a partir de las normas urbanísticas.

Las búsquedas se realizan mediante ElasticSearch, un software open-source basado en Lucene que provee de un motor de búsqueda de texto completo, distribuido y con capacidad de multitenencia con interfaz web RESTfull y formato JSON, similar a otras soluciones, pero con una arquitectura propia de una base de datos dinámica, facilitando enormemente la implementación del sistema final.

El uso de ElasticSearch ha resultado totalmente satisfactorio, consiguiendo un porcentaje del 100% de acierto en las pruebas realizadas para la detección del artículo concreto al que se refiere una pregunta.

Obtenido ese dato, el sistema debe ser capaz de generar una respuesta con la información pedida. Para ello se han probado y analizado los ocho modelos de inteligencia artificial más potentes en el ámbito de la Question Answering, obteniendo resultados desiguales.

La estrategia planteada ha consistido en medir el desempeño de cada modelo para un tipo de respuesta a través de una puntuación numérica y elegir la mejor opción para cada caso.

Algunos modelos son capaces de ofrecer respuestas completas, otros las dan más cortas y específicas con la información requerida, otros disponen un texto más elaborado, pero ninguno de ellos llega a ser capaz de dar una solución que abarque toda la problemática de una manera totalmente eficiente.

Ese análisis tan exhaustivo ha permitido elaborar un documento de directrices que habrá que tener en cuenta a la hora de redactar unas normas urbanísticas.

La integración con una skill de Alexa y con Twitter mediante DialogFlow ha permitido añadir el acceso a las normas urbanísticas como una intención más dentro de las que ya estaban presentes en el proyecto anterior, Prototipo Cibeles.

Noticias relacionadas