Fem que la tecnologia entengui i parli l’aranès

Si volem que les noves tecnologies parlin i entenguin l’aranès, necessitem aconseguir centenars d’hores de veu enregistrades per moltes persones parlants de l’aranès.

T’hi sumes?

Contribueix al Projecte Araina

Ara com ara no és possible que les màquines parlin o entenguin aranès. Perquè això sigui possible es necessita una base de dades amb centenars de gravacions de veus en aquesta llengua. Enregistrar la teva veu és senzill, només cal que segueixis les indicacions de la plataforma Common Voice. La teva veu servirà per construir el primer corpus de veu en aranès a partir de la participació col·lectiva.

Marató de veus a Vielha

El cap de setmana de 17-18 Diciembre 2022, la Marató de veus del Projecte Araina va recollir més de 8 hores de veu enregistrades en aranès d’un centenar de participants. L’activitat, celebrada en format presencial i virtual, va comptar amb persones de parla d’aranès de diverses edats, registres i parlars que es van gravar llegint fins a 4.000 frases en aquesta varietat de la llengua occitana. Podeu llegir més detalls sobre els resultats de la marató en aquesta publicació.

Tot i que la Marató va acabar, la campanya de recollida de veus estarà activa sempre a la plataforma CommonVoice per eixamplar el corpus oral. També podeu seguir registrant les vostres veus i convidant els vostres familiars i amics a participar-hi. Per mantenir la motivació, podeu crear grups de WhatsApp i Telegram i fins i tot organitzar les vostres pròpies maratons!

El Projecte Araina, votzes en aranés

L’objectiu del Projecte Araina és contribuir a la supervivència de l’aranès mitjançant la creació d’un corpus de parla en aquesta varietat occitana. El reconeixement automàtic de veu és un component necessari en el desenvolupament d’assistents basats en intel·ligència artificial i necessita centenars d’hores de dades de parla de moltes persones parlants de la llengua.

En el cas de les llengües majoritàries, el procés de generació dels prototips i el desenvolupament de les tecnologies de la parla és relativament senzill gràcies a l’existència dels serveis proporcionats per les empreses tecnològiques. En canvi, és difícil trobar solucions per a les llengües minoritzades com l’aranès. Aquesta és una de les conseqüències de la bretxa tecnològica entre les llengües amb recursos suficients i les llengües amb menys recursos, cosa que agreuja encara més el perill d’extinció digital de les segones.

Qui som?

El Projecte Araina està impulsat per la cooperativa Col·lectivaT amb la col·laboració de l’investigador de la Universitat de Lleida Jordi Suïls Subirà i de la investigadora Helena Torres Purroy, membres del Conselh Consultatiu der Aranés.

Col·lectivaT és una cooperativa sense ànim de lucre que promou el coneixement obert i el diàleg entre diferents realitats, mitjançant la investigació social i la prestació de serveis lingüístics i tecnològics. Dins d’aquest últim àmbit, una de les seves tasques centrals és el desenvolupament de tecnologies innovadores al servei de llengües minoritzades. En aquest sentit, han desenvolupat el primer sintetitzador de veu basat en xarxes neuronals en català, el Catotron, i segueixen col·laborant per la digitalització de llengües com l’amazic, el judeo-castellà i el gallec.

El Projecte Araina està subvencionat pel Departament de Cultura de la Generalitat de Catalunya en el marc de les “Subvencions per promoure el coneixement i l’ús de l’occità, aranès a l’Aran, a Catalunya” i rep el suport del Conselh Generau d’Aran, Lo Congrès permanent de la lenga occitana i la fundació Mozilla.

Contacte

Per a més informació pots contactar a través del correu info@collectivat.cat

Si vols estar al dia sobre els usos innovadors de les tecnologies de la parla i l’aranès, deixa’ns el teu correu electrònic per subscriure’t al butlletí.

Col·lectivaT utilitzarà aquesta informació per estar en contacte amb tu a través del butlletí setmanal i per comunicacions extraordinàries de l’entitat. Necessitem que confirmis que vols seguir rebent els correus. Si en algun moment canvies d’opinió, pots donar-te de baixa a l’enllaç que trobaràs al peu de pàgina de qualsevol dels correus electrònics que rebràs. Per obtenir més informació sobre la nostra política de privacitat, visita el nostre lloc web. En fer clic a continuació, acceptes que podrem processar la teva informació d’acord amb aquests termes.

Projecte Araina 2022 · Una iniciativa de Col·lectivaT
Amb el suport de:
Avís legal
Política de privacitat

Common Voice ei ua plataforma creada pera fondacion Mozilla entà crear conjunts de donades de parlar possades pes votzes de collaboradors volontaris de tot eth mon. Es donades de votz arrecuelhudes se publiquen dubèrtament entà qu’es persones que volgatz crear aplicacions de votz pogatz entrenar modèls d’aprendissatge automatic. Er emplec de Common Voice ei fòrça simple. Podetz enregistrar era vòsta votz o validar es enregistraments hèti per d’auti collaboradors. Ei important registrar-se ena plataforma entà mantier un registre des tues metadades e poder veir es tues estadistiques de contribucion. Entà obtier mès informacion sus com foncione era Common Voice, podetz consultar era sua pagina.

 

ReVOc Ei un programa de desvolopament entara reconeishença de votz en occitan (varietats gascones e lengadocianes) iniciat peth Congrès Permanent de la Lenga Occitana. Podetz veir com foncione ací.

Common Voice és una plataforma creada per la fundació Mozilla per crear conjunts de dades de parla impulsades per les veus de col·laboradors voluntaris d’arreu del món. Les dades de veu recopilades es publiquen obertament perquè les persones que vulguin crear aplicacions de veu puguin entrenar models d’aprenentatge automàtic. L’ús de Common Voice és molt senzill. Podeu gravar la vostra veu o validar les gravacions fetes per altres col·laboradors. És important registrar-se a la plataforma per mantenir un registre de les teves metadades i poder veure les teves estadístiques de contribució. Per obtenir més informació sobre com funciona Common Voice, podeu consultar la seva pàgina.

Marató de veus

Us convidem a participar al marató de veu el cap de setmana del 17 de desembre per posar en marxa la nostra campanya de recollida de dades de veu en aranès. Ens trobarem a Conselh Generau d’Aran (Passeg dera Libertat, 16) entre les 10 i les 14h. Només heu de portar el vostre portàtil o telèfon intel·ligent. A més, si no podeu arribar a Vielha, podeu participar-hi de manera virtual durant el cap de setmana del 17 i 18 de desembre, des de casa. Emetrem parts de l’esdeveniment a YouTube.

Necessitem disposar i emmagatzemar les vostres dades i de contacte per a les finalitats del projecte Araina i per la pròpia organització de la Marató, per informar-vos. No compartirem les dades amb tercers ni seran utilitzades per a finalitats diferents a Projecte Araina. Tota la informació d’identificació personal s’eliminarà després de l’esdeveniment.