El proyecto AINA se va de gira por territorios de habla catalana para sumar voces de todas las variantes dialectales

El proyecto AINA puso en marcha hoy una gira por territorios de habla catalana con el objetivo de sumar voces de las diferentes variantes dialectales de la lengua catalana.

Según los últimos datos disponibles, las variantes dialectales menos representadas en la plataforma Common Voice de Mozilla son el balear (1%), el noroccidental (1%), el septentrional (3%) y el valenciano (5%). Con la gira de AINA, se pretende esperonar a los hablantes de estas variantes para que se sumen a la campaña de recogida de voces a través de la web projecteaina.cat con el objetivo último de incrementar notablemente estos porcentajes para garantizar que el corpus de voz resultante contemple toda la diversidad lingüística de la lengua catalana.

Imatge campanya recollida de veus AINA

Una gira en dos fases

Impulsada por el Departamento de la Vicepresidencia y de Políticas Digitales y Territorio con la colaboración de diferentes entidades y asociaciones culturales y de defensa de la lengua de los territorios de habla catalana, la gira de la AINA se desarrollará en dos fases. La primera hará parada en la Cataluña Norte, el País Valenciano y las Islas Baleares.

El saque de salida tendrá lugar hoy, 4 de abril, en Perpiñán (Catalunya Nord), con un acto de presentación del proyecto encabezado por el vicepresidente Puigneró y la colaboración del Consejo Departamental Pirineos Orientales y la Oficina Pública de la Lengua Catalana (OPLC). La misma semana, concretamente el jueves 7 de abril, la gira hará parada en la ciudad de Valencia (País Valencià), que acogerá el acto de presentación impulsado en colaboración con Acció Cultural del País Valencià. Finalmente, el día 11 de abril la gira de la AINA pasará también por Palma (Mallorca), con un acto organizado en colaboración con el Govern de les Illes Balears.

En estos tres actos, tanto las personas participantes como las asistentes podrán grabar sus voces en un punto de recolección de voces itinerante del projecteaina.cat.

La gira de la AINA continuará antes del verano con una segunda fase que recorrerá todo el territorio catalán, con actos de presentación del proyecto en un municipio de cada una de las ocho veguerías catalanas.

Más de 640.000 voces registradas

A mediados del pasado mes de febrero, el Gobierno de Cataluña lanzó la campaña ‘Nuestra lengua es tu voz’ en el marco del proyecto AINA con el objetivo de recoger el máximo de voces posible para nutrir de contenidos la primera versión del corpus de voz del catalán, imprescindible para enseñar a las máquinas a entender y hablar nuestra lengua.

La campaña invita a la ciudadanía de habla catalana de todas las edades, géneros, condiciones y procedencias a «dar» su voz a través de la web projecteaina.cat, desde donde todo el mundo puede leer, grabar y validar un número ilimitado de frases agrupadas de 5 en 5 en la plataforma Common Voice de Mozilla.

La excelente acogida de la campaña por parte de la ciudadanía ha hecho que, en poco más de un mes, se hayan alcanzado cifras de grabaciones y de horas de grabación que han superado las mejores expectativas, llegando actualmente a los más de 640.000 cortes de voz (frases) grabados y más de 900 horas de grabación desde el inicio de la campaña. Además, el catalán ha pasado a ser la segunda lengua del mundo con más locutores en Common Voice (más de 25.500 personas), solo por detrás del inglés.

Pese a ello, la variante dialectal dominante en la plataforma sigue siendo el catalán central, que supera el 75% de las voces registradas.

Sobre el proyecto AINA

Impulsado por el Departamento de la Vicepresidencia y de Políticas Digitales y Territorio en colaboración con el Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS), AINA es un proyecto basado en tecnologías de datos e Inteligencia Artificial para hacer posible que las máquinas entiendan y hablen el catalán.

Se trata de un proyecto estratégico que tiene como objetivo último enseñar catalán a las máquinas de manera que la ciudadanía pueda relacionarse con ellas y participar en el mundo digital en catalán al mismo nivel que los hablantes de una lengua global, como el inglés, y evitar, así, la extinción digital de la lengua catalana.

En este sentido, el proyecto AINA está construyendo los corpus y los modelos de lengua del catalán para facilitar que las empresas tecnológicas puedan desarrollar sus soluciones o servicios específicos (traductores, asistentes personales, sintetizadores de voz, clasificadores de textos, etc.) en nuestra lengua.El proyecto AINA se enmarca en la estrategia digital del Gobierno a través de dos iniciativas lideradas por la Vicepresidencia: la Estrategia de Inteligencia Artificial de Cataluña (Catalonia.AI) y el Consejo de Dirección interdepartamental para la promoción del catalán en Internet y en las tecnologías digitales avanzadas.

Author: bcnmag2020