Linguatec IA: un proyecto para avanzar en la digitalización del aragonés, catalán, euskera y occitano, mediante la IA
El objetivo del proyecto Linguatec IA es desarrollar conocimiento en inteligencia artificial sobre nuevos modelos de lenguaje neuronales aplicables a lenguas con pocos recursos, para avanzar en la digitalización del aragonés, catalán, euskera y occitano, y en la construcción de una infraestructura lingüística e inteligente transfronteriza que facilite la comunicación entre los hablantes de las distintas lenguas y el acceso multilingüe a la información.
El consorcio está compuesto, además de nosotros, de Lo Congrés Permanent de la Lenga Occitana, HITZ zentroa (UPV/EHU), Universidad Jean Jaures de Toulouse, Universidad de Perpiñán, IKER-CNRS de Baiona, Gobierno de Aragón y Universidad de Lleida.
El proyecto pretende:
- Construir nuevos algoritmos y arquitecturas neuronales para generar modelos de lenguaje neuronales adaptados a regímenes de cómputo y recursos lingüísticos limitados.
- Mejorar los sistemas de transcripción, traducción automática neuronal y síntesis de voz del euskara, catalán, occitano, aragonés y sus variantes dialectales, que combinen con el francés y el español.
- Desarrollar una Plataforma lingüística multilingüe de subtitulado y doblaje automático.
- Crear una plataforma o repositorio online de recursos, tecnologías y aplicaciones para las lenguas de los Pirineos
- Consolidar la “Red Transfronteriza de Excelencia en Tecnologías de la lengua”.
El proyecto europeo EFA 104/01-LINGUATEC IA (Inteligencia Artificial) está cofinanciado por el Fondo Europeo de Desarrollo Regional (FEDER) a través de la 1ª convocatoria INTERREG POCTEFA 2021-2027. Esta ayuda permitirá incrementar el esfuerzo en innovación, apostando por la investigación aplicada en Inteligencia Artificial en Procesamiento del Lenguaje Natural (PLN), así como contribuir a la articulación social y cultural del territorio transfronterizo, reforzando un elemento clave de la cultura local, las lenguas.