El proyecto European Language Equality (ELE), que mide y analiza el empleo de las tecnologías lingüísticas de los idiomas europeos, ha concluido que el gallego está a la cola en cuanto a recursos y aplicaciones respecto al resto de lenguas oficiales del Estado. El proyecto está financiado por la Unión Europea y la Universidad de Vigo forma parte del consorcio a lo que están adheridos un total de 52 universidades, consorcios y empresas de Europa.

El grupo de investigación en Tecnologías Multimedia (GTM) del Centro de Investigación en Tecnologías de Telecomunicación (atlanTTic) de la Universidad de Vigo fue el encargado de analizar la situación en cuanto a recursos, servicios y comunidades de hablantes del gallego. "El objetivo de ELE es analizar la adaptación tecnológica de los idiomas de Europa con el fin de que exista plena igualdad lingüística digital en 2030. Ahora, hay que hacer una hoja de ruta para cambiar esta situación", subraya Carmen García Mateo, coordinadora del grupo de investigación de atlanTTic.

Como conclusión general, según el informe presentado por los investigadores de la UVigo, "hay pocas aplicaciones de síntesis y de reconocimiento de voz, corrección ortográfica y gramatical y traducción automáticas; por lo tanto, un vacío importante en cuanto a recursos multimedia adecuados para desarrollar aplicaciones tan importantes en el mundo actual como los agentes conversacionales por voz de última generación".

Brecha entre el gallego y otras lenguas estatales

Por lo contrario, el gallego, según el informe, "sí tiene buena presencia en bases de datos de texto de gran dimensión calidad, y las tecnologías y los servicios basados en texto están en una fase más madura".

En el conjunto del Estado, los datos recopilados muestran una brecha considerable en comparación con otras lenguas con mayor número de hablantes, pero también con las otras lenguas cooficiales del estado español (catalán y euskera). "Esta diferencia es crítica en cuanto a recursos y servicios relacionados con datos de tipo multimedia o del ámbito de la salud, pues los existentes son pobres en diversidad y pequeños en tamaño", señala el estudio.

El mayor peligro a corto plazo es que, de no revertirse esta situación, el gallego quede fuera de la revolución que el Big Data y la inteligencia artificial está provocando en muchos sectores estratégicos por la falta de recursos para aplicar estas tecnologías.

Redes sociales

Como ejemplo positivo, el informe apunta el sitio web de la Radio Televisión de Galicia por la producción de contenidos multimedia. También hay un número creciente de diarios locales digitales escritos en gallego. Aunque algunas plataformas como Facebook o Youtube, o grandes empresas de software como Microsoft o Apple ofrecen una versión con soporte para lo gallego en sus interfaces, muchas otras como TikTok, Twitch o Adobe, lo utilizan en beta o con menor apoyo como el caso de Twitter.

También se produce una falta extrema de apoyo al gallego en los asistentes virtuales como Alexa, Siri, Google Assistant o Cortana. En los últimos años, continúa el informe, se desarrollaron una serie de productos y servicios destinados a la incorporación del gallego en las TIC. Ejemplos interesantes son el portal de la Real Academia Gallega, el traductor Gaio o el sitio web del Gobierno gallego.

La actual colaboración interdisciplinar de los investigadores de atlanTTic junto con los docentes de la Facultad de Filología y Traducción de la Universidad de Vigo ayuda a cambiar esta situación. "Estamos desarrollando ya herramientas y recursos lingüísticos. Esta alianza es, en gran medida, la responsable en los últimos cuatro años de un aumento considerable de la producción de recursos y servicios de calidad para la lengua gallega". Los investigadores también destacan en el informe la propia estrategia puesta en marcha por la Xunta de Galicia.

"Por otro lado, observamos una tendencia en las grandes empresas del sector consistente en reducir sus esfuerzos en desarrollar tecnologías específicas para lenguas minoritarias como el gallego". También advierten de la falta de interés por las lenguas cooficiales en general en algunas estrategias nacionales relacionadas con las tecnologías del habla cómo en la Estrategia del Procesamiento del Lenguaje Natural 2020 o la Estrategia Nacional de Inteligencia Artificial 2020.

Propuestas de mejora

Como propuestas de mejora, los investigadores de atlanTTic recomiendan, en primer lugar, "la creación de una oficina pública que custodie de manera centralizada y estandarizada todos los recursos desarrollados para la lengua gallega ya que, en la actualidad, se encuentran diseminados en páginas web o en servidores internos de los desarrolladores haciendo compleja su búsqueda".

En segundo lugar, según los investigadores "es necesario invertir en la creación de bases de datos de recursos lingüísticos de calidad y gran tamaño con contenido multimedia, se diga grabaciones de audio o vídeo, que cubran las distintas variantes y estilos de la lengua hablada en el territorio gallego".

En tercer lugar, "apoyar la producción científica y la transferencia tecnológica basada en tecnologías del habla y el lenguaje para que el gallego gane presencia en soluciones comerciales y sea considerado como un nicho de mercado de interés".

En cuanto a las comunidades de hablantes "creemos indispensable que consuman y produzcan contenidos en gallego; pero también que exijan soporte para el gallego en aquellos servicios y productos que consumen regularmente (plataformas de contenidos, medios digitales, aplicaciones móviles o de escritorio, sistemas operativos, etc)".