L’initiative française dans la Voice Tech reçoit le soutien de la BPI sous la forme de 4,7 millions d’euros en subventions et en prêts. VoiceLab a l’ambition de collecter 100 000 heures de data vocales qui serviront de fondation à une plateforme capable de concurrencer les géants nord-américains du secteur.
VoiceLab, association des acteurs français de la « Voice Tech », continue son bonhomme de chemin. En mars dernier, nous interrogions son président, Karel Bourgeois, au sujet de la campagne de crowdsourcing que VoiceLab venait de lancer. Objectif : collecter plusieurs milliers d’heures de voix en appelant les internautes francophones à exercer leur droit à la portabilité de leurs données. Y compris leurs données vocales enregistrées par leurs assistants vocaux.
Mais par un malheureux concours de circonstances, les grands acteurs américains ont par la suite retiré la voix des données récupérables, fermant le robinets pour VoiceLab, qui en appelle désormais aux entreprises, à l’Etat, aux collectivités et jusqu’aux particuliers pour obtenir de précieuses données de voix. Ainsi le ministère des Finances a été en mesure de fournir plusieurs centaines d’heures d’enregistrement, issues entre autres de travaux de sous-titrage de conférences vidéo, nous apprend ce matin Karel Bourgeois.
Soutien de la BPI
Autre preuve de l’engagement de l’Etat aux côtés de l’association, la BPI vient d’investir 4,7 millions d’euros dans VoiceLab dans le cadre du PIA (Programme d'investissements d'avenir), pour moitié des subventions et le reste en prêts remboursables. Cette aide de la BPI vient soutenir le projet de l'association de constituer une base de 100000 heures de données vocales, données qui serviront à développer une place de marché dotée d'API à laquelle viendront se connecter des acteurs de la reconnaissance vocale afin qu’ils entraînent leurs moteurs.
Karel Bourgeois vise un projet à cinq ans, “quatre pour construire la plateforme et la cinquième année pour industrialiser”. Et, après, penser l’initiative à l’échelle européenne. L’association fondée par les sociétés Aday, Batvoice, Kwalys, Linagora et Voxist dispose déjà de 8000 heures de voix apportées par ses membres, qu’il s’agit de mutualiser et de normaliser. Car, selon le président de l’association, la France a de nombreuses ressources en la matière, ainsi que les compétences, mais une industrie de la voix extrêmement fragmentée : “l’écosystème est riche, mais peut-être encore un peu jeune. Ce que l’on voit émerger, c’est un écosystème d’acteurs de plus en plus amenés à travailler ensemble, qui va partager non seulement des données, mais aussi des bonnes pratiques. Donc oui, il y a une filière de la voix qui émerge en France”.