El Proxecto Nós, impulsado por la Xunta de Galicia y la Universidade de Santiago de Compostela (USC), da nuevos pasos en su objetivo de generar recursos en gallego en la era digital. Será la propia Administración autonómica la que aplicará en su sistema informático las herramientas desarrolladas hasta ahora en el marco del programa.
Así se ha informado este lunes después del Consello de la Xunta, en el que se ha evaluado un informe con los resultados de las acciones llevadas a cabo en el marco de esta iniciativa entre 2021 y 2023.
Con el objetivo de fomentar el empleo del gallego en las plataformas tecnológicas, la Xunta pondrá en marcha dos proyectos pilotos. Uno está relacionado con mejoras en el traductor Gaio y otro con la integración de una voz femenina que permita escuchar en gallego todo el contenido institucional de la web.
El proyecto, que arrancó en 2021, cuenta con más de diez corpus de voz y de textos, -recopilación y almacenamiento de datos representativos de la lengua-, y con un prototipo de pruebas para crear un generador automático de descripciones textuales.
Recogida de datos
Para seguir avanzando en la generación de recursos, es esencial la búsqueda, recopilación y almacenamiento de datos en gallego, tanto de texto como de voz. Por eso, resulta fundamental la colaboración con entidades que cuentan con este tipo de información. Desde el inicio del proceso, se han contactado con más de 40 entidades. Además, la USC firmó más de una veintena de acuerdos de colaboración, tanto públicos como privados, para la cesión de datos.
Además, la Consellería de Cultura, Lingua e Xuventude recuerda que la campaña Doa a túa voz está abierta a toda la ciudadanía que quiera colaborar. El objetivo es tener un banco de voces en gallego, que incluya personas de diferentes edades, género y variedades dialectales.
Retos
El desarrollo de este proyecto comezó en 2021 con el convenio firmado entre la Xunta, la USC y la Agencia para la Modernización Tecnológica de Galicia, dependiente del Gobierno autonómico.
Tras un segundo acuerdo firmado en 2022 para desarrollar la iniciativa, el proyecto recibió a través de la USC dos millones de euros del Perte Nueva Economía de Lengua, para el periodo 2023-2024. Ya en 2023 se incorporó al proyecto la UVigo.
El Parlamento de Galicia ha aprobado el pasado 10 de julio que la Xunta se dirija al Gobierno central para completar la parte de dotación incluida en el marco del PERTE para aportar la totalidad de los 15 millones comprometidos.
Desde el Gobierno gallego señalan que la hoja de ruta incluye la puesta en marcha de sistemas que impliquen corrección y evaluación lingüística automática, resumen de documentos o clasificación de información según contenidos.