Les màquines aprenen català

Softcatalà i Mozilla engeguen el projecte Common Voice de reconeixement de veu en català i la Generalitat treballa amb Google

El català és una de les llengües més actives a internet i en el món digital en relació amb el nombre de parlants com ho demostren casos com el de la versió catalana de la Viquipèdia, però té encara alguns buits importants. Un d’aquests és la presència de la llengua en els assistents de veu virtuals com els famosos Siri (IOS) i Google Now (Android).

A hores d’ara, com passa amb la gran majoria d’idiomes, no és possible donar ordres de veu en català a un ordinador o un mòbil perquè executi accions quotidianes com comprar entrades per al cinema, posar la cafetera en marxa o dir-nos quin temps farà. Per això, Softcatalà, amb el suport de la Direcció General de Política Lingüística (DGPL) col·labora amb el projecte Common Voice de Mozilla, que pretén ensenyar a les màquines a reconèixer altres idiomes més enllà dels més parlats del món com l’anglès i el castellà.

“Cap gran plataforma, ni Android ni IOS, inclou el reconeixement de veu en català”, certifica Joan Montané, membre de Softcatalà, que veu en Mozilla, de codi obert, una oportunitat d’oferir “diversos usos lingüístics per al català”.

La idea -explica Montané- és facilitar que les empreses puguin accedir a dades que normalment “són molt costoses de generar” i que ja tindrien a la seva disposició amb el projecte Common voice. I què se’n podria fer, d’aquestes dades? Doncs “donar ordres de veu al mòbil, a la tauleta i a l’ordinador”. “Això pot resultar útil -afegeix Montané- per a persones amb algunes discapacitats físiques, per a un conductor, un periodista que vol transcriure una entrevista, etc…”. “Android i Chrome, per exemple, tenen la funció de dictat per veu però no la d’interpretar ordres de veu com fa el Siri o Google Now”, remarca el responsable de Softcatalà, que avança que el resultat del projecte “es podria aplicar a My Croft, un assistent virtual de codi obert”.

L’eina, però, avisa Montané, “ha d’estar ben entrenada”. És per això que s’ha engegat el projecte Common Voice en català, consistent a elaborar un conjunt d’enregistraments de veu lliure, és a dir, una gran base de dades de veu en català.

“L’objectiu ideal per a les llengües seria tenir mil hores de gravació, però és gairebé impossible”, explica Montané. “Caldrien més de deu anys per aconseguir-ho i per això ens hem fixat l’objectiu d’arribar a les cent”. De moment, ja en tenen més de seixanta. El nombre d’hores de gravació necessàries per entrenar la màquina, però, depèn de cada llengua. Si l’escriptura és molt fonètica i l’idioma s’escriu com es pronuncia, com passa amb l’euskera, el procés és més fàcil.

El projecte Common Voice en català necessita moltes hores de gravació i, sobretot, la participació de molts voluntaris. Qui vulgui ajudar ho pot fer a través del web Voice.mozilla.org o amb l’aplicació que hi ha als aparells IOS i, un cop allà, escollir l’opció del català. Tot seguit, haurà d’enregistrar les frases que li facin llegir (de textos amb llicència oberta). En una fase posterior, hi ha voluntaris que fan de revisors, comproven que l’àudio es correspon amb el text i validen cada tall de veu.

La intenció dels promotors de la iniciativa és comptar amb la participació de milers de voluntaris i que cadascú hi aporti el seu granet de sorra durant una estona. “Es poden enregistrar frases en tongades de cinc minuts”, suggereix Montané, que recorda que el participant pot declarar, si vol, dades demogràfiques com l’edat, el sexe i el dialecte perquè el software tingui dades més acurades.

En un futur, el projecte de Mozilla pot tenir aplicacions per a coses com els cotxes autònoms i l’internet de les coses on convindria que el català s’anés situant en una bona posició.

Mentre aquesta iniciativa de codi obert va fent camí, la Direcció General de Política Lingüística està abordant un projecte de reconeixement de veu amb Google perquè hi hagi més eines i aplicacions d’ús quotidià d’aquest gegant tecnològic que incorporin el català oral, és a dir, que les màquines parlin la llengua pròpia del país, cosa que no passa amb gaires idiomes.