MADRID, 8 (Portaltic/EP)
Google ha presentado SummAE IA, un sistema neuronal que resume textos sin supervisión humana a través de la Inteligencia Artificial (IA), y que logra sintetizar párrafos enteros en una sola oración, salvando las dificultades de otras herramientas similares para resumir textos, aunque todavía está alejado de la capacidad humana.
SummAE propone el uso de un sistema de descodificación abstracto, que elimina el ruido para codificar oraciones y párrafos del texto que analiza. Funciona a través de un descodificador que pone un token en las frases o párrafos.
El sistema genera resúmenes identificando y descodificando cada frase y párrafo, y de esta manera es capaz de lograr resúmenes de párrafos de cinco oraciones en una sola frase.
Los investigadores del proyecto, desarrollado por Google Brain -la unidad de Google especializada en IA y aprendizaje profundo-, aseguran que su modelo abstracto "mejora notablemente" los mecanismos actuales para producir resúmenes. "Descubrimos que los codificadores tradicionales secuencia a secuencia fracasan a la hora de producir buenos resúmenes", explican en la investigación.
Para este proceso se utilizaron tres técnicas de eliminación de ruido para entrenar a SummAE, la primera cambiar el orden de las oraciones dentro de los párrafos, y después probaron a enmascarar aleatoriamente algunos tokens.
La última técnica fue introducir un componente con capacidad crítica que distinguía entre oraciones y párrafos. Se le práctico un preentrenamiento para que el codificador entendiera como una oración continua narrativamente en un párrafo.
Tras más de 100.000 entrenamientos el equipo de investigadores concluyó de que uno de los modelos superaba a otros generadores de oraciones extractivas. También informaron que un estudio cualitativo llevado a cabo por Amazon Mechanical Turk decía que varias personas comentaban que algunos modelos de SummAE eran fluidos y que daban información relevante en un 80 por ciento de los casos.
Aunque los propios autores del estudio reconocen que "el rendimiento (de SummAE) está aún muy por detrás del de los humanos", han destacado las mejoras que supone sobre los modelos de decodificadores por extracción y lo consideran como "un gran paso hacia la sintetización abstracta no supervisada".