Selon, The Intercept, le magazine qui avait révélé l’affaire Snowden, Interpol aurait à disposition une base de données d’échantillons de voix en provenance de 192 agences chargées de l’application de la loi dans le monde.
Interpol peut désormais identifier la voix d’un locuteur inconnu grâce à une base de données regroupant des échantillons vocaux en provenance d’agences gouvernementales du monde entier.
La plate-forme appelée SiiP (Speaker Identification Integrated Project), dont le développement a débuté en 2014 avec un budget de près de 10 millions de dollars, vise à identifier les personnes au son de leur voix. Celle-ci, comme les empreintes digitales ou les fonds d’yeux, a une empreinte unique.
S’appuyant sur une plate-forme de Big Data, les échantillons de voix sont analysés et transformés dans un modèle algorithmique. Il est ensuite possible d’identifier une voix quelle que soit la langue utilisée et de manière automatisée. Le système permet aussi de filtrer les échantillons de voix par sexe, âge, langue ou accent.
Des voix d'origine incertaine
De nombreuses agences gouvernementales utilisent déjà des systèmes de reconnaissance vocale. Un document d’Interpol révèle ainsi que « plus d’une cinquantaine d’organismes en provenance de 69 pays » utilisent déjà des programmes d’identification automatisée des locuteurs. La Chine, notamment, utiliserait un système intégré aux réseaux de téléphonie mobile capable d’identifier les voix en temps réel.
The Intercept met en avant les réserves qu’un tel système peut avoir pour les libertés individuelles et remarque que l’on ne connaît pas d’où proviennent réellement les échantillons de voix et si des citoyens quelconques sont dans la base de données ou si des conversations récupérés sur des réseaux sociaux ou Internet sont utilisées.