Le projet de Mozilla reçoit le soutien du gĂ©ant des GPU, qui a dĂ©cidĂ© dây investir 1,5 million de dollars. Nvidia compte bien profiter des jeux de donnĂ©es vocales de Common Voice pour dĂ©velopper ses modĂšles et les proposer gracieusement Ă la communautĂ©.
Common Voice sâest fait discret depuis 2017. Ce projet consistant Ă collecter des enregistrements vocaux, dans toutes les langues, a abouti en novembre 2017 Ă la mise en ligne dâune premiĂšre base de donnĂ©es de 500 heures dâenregistrements, grĂące Ă la participation de 20 000 personnes. Ce qui faisait de Common Voice la deuxiĂšme plus importante base dâenregistrements audio libre, derriĂšre Librispeech.
Mais, depuis, lâinitiative est quelque peu tombĂ©e dans lâoubli. Et ce malgrĂ© 9000 heures dâenregistrements supplĂ©mentaires publiĂ©es entre fin 2017 et aujourdâhui. Dâautant que le secteur de la âVoice Techâ nâest pas moribond. Et si la majoritĂ© des bases de donnĂ©es appartiennent Ă des gĂ©ants du secteur, dont un certain Nuance (qui vient d'ĂȘtre rachetĂ© par Microsoft), de nouveaux projets naissent Ă lâinstar de Voice Lab en France.Â
Tel a sans doute Ă©tĂ© le constat de Nvidia. Le gĂ©ant des GPU nâest pas en reste pour tout ce qui touche Ă lâIA : il travaille autour de ses cartes graphiques avec une grande variĂ©tĂ© dâacteurs, de Baidu Ă TomTom. Alors que Microsoft dĂ©pense des milliards de dollars pour sâoffrir Nuance, Nvidia a dĂ©cidĂ© pour sa part de placer ses billes dans Common Voice. Mozilla annonce en effet que le projet a reçu un investissement de 1,5 million de dollars de la part du fabricant de GPU.
Plus dâheures, plus de langues
Cet investissement permettra Ă Common Voice de croĂźtre en impliquant davantage de communautĂ©s et de bĂ©nĂ©voles dans le projet et facilitera le recrutement de nouveaux employĂ©s. Et, pour marquer le coup, la structure de lâinitiative change et la voici dĂ©sormais intĂ©grĂ©e Ă la fondation Mozilla, au sein de sa branche consacrĂ©e Ă lâIA.Â
âLa demande d'IA conversationnelle augmente, les chatbots et les assistants virtuels ayant un impact sur presque tous les secteursâ explique de son cĂŽtĂ© Kari Briski, directrice Accelerated Computing Software and AI Product chez Nvidia. "GrĂące aux ensembles de donnĂ©es ouverts de Common Voice, nous sommes en mesure de dĂ©velopper des modĂšles prĂ©-entraĂźnĂ©s et de les proposer gratuitement Ă la communautĂ©. Ensemble, nous travaillons Ă un objectif commun de soutien et de crĂ©ation de communautĂ©s, en particulier pour les langues sous-financĂ©es et mal desserviesâ.