La IA que aprende de sonidos industriales salva el obstáculo de la falta de datos en su primer año de vigencia
El centro tecnológico ITI avanza en un ambicioso proyecto que sigue ampliando su corpus de información acústica al tiempo que impulsa la fase de 'machine listening'.
18 mayo, 2024 01:34Hace poco más de un año a alguien se le ocurrió un juego de palabras nada casual. En un 2023 en el que se conmemoraba la muerte del afamado pintor Joaquín Sorolla, nació en Valencia -cuna del artista- un proyecto tecnológico llamado Soroll-IA.
Para entender por qué la iniciativa podía aprovecharse de este juego de palabras hay que aclarar que en tierras valencianas soroll significa ruido. Las siglas IA no hace falta explicarlas.
ITI, el centro tecnológico especializado en TIC, se embarcó hace un año en un proyecto que persigue hacer más eficiente el trabajo en la industria a través de la interpretación de señales acústicas por parte de la inteligencia artificial.
[Redit Summit, el altavoz de grandes mentes y de pequeñas empresas innovadoras]
El caso de uso que más se ha explicado para entender la idea es el que se refiere a que una empresa tenga la posibilidad de realizar un mantenimiento automático y preventivo de su maquinaria gracias a que una IA le avisa de que ha escuchado unos ruidos raros en esa maquinaria que podrían ser el origen de algún problema mayor.
Como casi todo en el ámbito tecnológico, suena fácil, pero no lo es tanto. Durante este primer año de vida, Soroll-IA -ahora ya Sorolla-IA2- ha tenido que salvar sus propios obstáculos. Bueno, realmente uno principalmente: la falta de datos.
Hasta ahora, el principal problema era la falta de audios para entrenar los modelos de IA. Por ello, la primera fase del proyecto se ha centrado en recopilar los datos necesarios para crear una base de datos de sonidos contextualizados en la Comunidad Valenciana dentro de un entorno industrial a través de una red de sensores acústicos de internet de las cosas (IoT, por sus siglas en inglés).
En este sentido, la principal característica de Soroll-IA2 es la captación de sonidos para su posterior clasificación en tres tipos de ambientes diferentes: exteriores, interiores y en sala.
Para cada tipo de grabación ITI está colaborando con empresas del sector industrial con el objetivo de obtener datos de valor que puedan aportar información relevante en el día a día. El Puerto de Valencia, por ejemplo, está aportando los sonidos en exteriores enmarcados en un entorno portuario.
Más ejemplos. Las empresas DCM Automatizada y CASVA Simetría ofrecen la oportunidad de grabar sonidos industriales en ambientes interiores y, de la mano de Fermax y sus videoporteros, se está llevando a cabo la recolección de sonidos grabados en sala.
Los datos de audio constituyen la información con la que se entrenan los modelos de IA para que estos realicen tareas de detección, clasificación y reconocimiento de patrones de sonido. Una posible aplicación de lo que se obtiene gracias a los sonidos es la identificación de fuentes de contaminación acústica, pero, tal y como destaca Andrea Ceba, gestora del proyecto Soroll-IA2 en ITI, "lo verdaderamente importante del proyecto es la información obtenida".
Los sonidos, debidamente procesados, "dan información de valor que puede ser utilizada en diversos ámbitos, aunque el proyecto se está centrando en el uso de estos datos en entornos industriales", explican desde ITI.
Sonidos para prevenir averías
Cabe insistir en que el mantenimiento predictivo es el objetivo futuro al que se quiere llegar gracias al análisis de los sonidos que más adelante deriven en averías.
"Una de las principales características de las máquinas industriales es que hacen ruido, un análisis de dichos sonidos mediante IA puede darnos información del estado de la máquina y observar si se está produciendo una desviación respecto a su funcionamiento normal. Se espera que el mantenimiento predictivo acabe reemplazando al mantenimiento preventivo clásico, debido a la reducción de costes que conllevaría su uso", señala el investigador principal del Grupo de Investigación de Audición por Computador en ITI, Pedro Zuccarello.
En el marco del proyecto, ITI ha creado una sala de grabación propia en la que está recogiendo, por ejemplo, los sonidos de los videoporteros de Fermax con el objetivo concreto de recoger datos para entrenar algoritmos de IA que sean capaces de reconocer alarmas sonoras.
Esta sala de aproximadamente 11 metros cuadrados, ubicada en la nueva sede del centro tecnológico en el Parque Tecnológico de Paterna, es semianecoica.
Esto significa que el camino directo del sonido prevalece ante las reverberaciones. Esta condición, sumada a los equipos de audio de alta precisión, permiten al equipo de ITI obtener evidencias de sonido de primera calidad. La sala de grabación otorga, además, una mayor autonomía a ITI para llevar a cabo grabaciones de sonidos en proyectos concretos y adaptarse mejor a posibles necesidades de empresas colaboradoras, que requieran de este tipo de servicio.
La sala semianecoica de ITI, según explica Zuccarello, "permitirá un desarrollo mucho más eficiente y acertado de proyectos de I+D orientados a dar soluciones industriales basadas en modelos de IA dentro del área de audición por computador".
El proyecto, que se encuentra en su segunda anualidad, se ha dividido en dos partes. Por un lado, la grabación y captura de datos de audio en entornos industriales y, por el otro, el etiquetado y la clasificación de estos.
Los datos se recogen a través de una serie de nodos acústicos ubicados en lugares estratégicos y, mediante técnicas de machine listening, se extrae información de valor. Se trata de una tecnología que trabaja y diseña algoritmos y modelos capaces de extraer conocimiento e información relevante a partir de señales de audio.
ITI está trabajando en el proyecto gracias a la financiación del Instituto Valenciano de Competitividad Empresarial (IVACE+i) y el Fondo Europeo de Desarrollo Regional (FEDER).