L’assistant vocal de Mountain View vous écoute, mais il n’est pas le seul. Les enregistrements audios sont transmis à des prestataires qui ont pour mission de les retranscrire afin d’améliorer toujours plus l’assistant.
La semaine dernière, le Flamand VRT NWS dévoilait dans un article que les enregistrements audio de Google Assistant, intégrés non seulement aux enceintes Home mais aussi à de nombreux smartphones sous Android, étaient écoutés par des humains. En l’occurrence des prestataires de Mountain View chargés de retranscrire des commandes vocales que l’assistant peine à comprendre.
Dans le cas présent, les enregistrements sont placés dans Crowdsource, un outil de Google permettant à n’importe qui d’aider à l’entraînement des algorithmes du géant pour la reconnaissance d’images. Une partie de cette plateforme toutefois n’est pas accessible au public, mais à des sous-traitants de Google : s’y trouvent les fameux enregistrements audio qui doivent être traités manuellement afin d’améliorer l’algorithme.
VRT NWS explique avoir eu accès à environ un millier d’extraits audio. Tous sont anonymisés, mais compte tenu des informations contenues dans les enregistrements, il est aisé selon nos confères d’en retrouver les auteurs. Ce que les journalistes ont fait. En outre, une partie de ces enregistrements n’auraient jamais dû exister. En effet, il s’agit de ces fameux « déclenchements par erreur » de l’Assistant, qui parfois s’active sans avoir été sollicité, parce qu’il a entendu quelque chose ressemblant à OK Google ou que, sur smartphone, le mauvais bouton a été pressé un peu trop longtemps.
Il entend tout
« Cela signifie que de nombreuses conversations sont enregistrées de manière non intentionnelle : conversations sur l’oreiller, conversations entre parents et enfants, mais également des disputes et des appels professionnels contenant de nombreuses informations confidentielles » écrit VRT NWS. Y compris des violences domestiques, ce qui pose un cas éthique. Mais le fait est que ces écoutes ont reçu l’assentiment des utilisateurs : les conditions d’utilisation du service mentionnent l’enregistrement et le traitement des conversations.
« Nous travaillons en partenariat avec des experts en langues du monde entier qui comprennent les nuances et les accents d'une langue spécifique. Ces experts en langues étudient et transcrivent un petit groupe de questions pour nous aider à mieux comprendre ces langues » explique Google en réponse à l’article. Toujours afin d’améliorer son assistant vocal. Mountain View en profiter pour reconnaître l’existence des « faux positifs ».
Surtout, le géant s’en prend aux sources du site d’informations. « Nous venons d'apprendre qu'un de ces réviseurs de langue a violé nos politiques de sécurité des données en divulguant des données audio néerlandaises confidentielles. Nos équipes de sécurité et de confidentialité ont été activées sur ce problème, enquêtent et nous prendrons des mesures. Nous procédons actuellement à un examen complet de nos garanties dans cet espace afin d'empêcher qu'une telle inconduite ne se reproduise ». Ça va barder !