StopCovid : une utilité limitée et trop de données envoyées

L’application française de contact tracing n’en finit pas de faire débat. Accusé de fournir les adresses IP de ses utilisateurs à Google, StopCovid se voit désormais reprocher d’envoyer trop de données au serveur central. Et ce alors même que Cédric O admet que l’utilité de l’application est “relative” dans le contexte actuel. 

StopCovid a tout juste deux semaines et pourtant les problèmes n’en finissent plus de s’accumuler. La semaine dernière, le recours par l’application à l’outil reCaptcha de Google faisait débat. En effet, cette fonctionnalité permet au géant américain de connaître l’adresse IP des utilisateurs de StopCovid lorsque ceux-ci prouvent qu’ils sont bien humains. Le secrétariat d’Etat au numérique expliquait qu’il s’agissait d’une solution temporaire, la seule qui pour le moment remplit certaines conditions en termes d’accessibilité. Le temps du moins qu’Orange développe sa propre solution, ce qui devrait être le cas dans les prochaines semaines selon le cabinet de Cédric O, qui nous rassure ainsi... depuis déjà plusieurs semaines. 

Plus récemment, la question des données envoyée par l’application s’est posée. Gaëtan Leurent, chercheur à l’Inria, a repéré que StopCovid envoie au serveur tous les contacts croisés lors des 14 derniers jours par une personne déclarée malade. Or le décret relatif à l’application avait suivi l’avis de la Cnil, stipulant que ne sont envoyés au serveur central que les informations relatives à un terminal qui s’est trouvé à une proximité suffisante du smartphone du malade à moins d'un mètre pendant au moins 15 minutes. 

Goinfrer le serveur

Le chercheur a fait le test “en installant StopCovid sur deux téléphones, et en l'activant une dizaine de seconde avec les deux téléphones dans deux pièces différentes (environ 5 mètres de distance, plus un mur)”. “Quand je me déclare ensuite comme malade, mon appli envoie bien ce contact sur le serveur, alors qu'il n'a aucun intérêt épidémiologique. (Je me déclare évidemment avec un faux code de malade, et le serveur refuse mes données, mais cela permet de bien voir ce qui est envoyé)” explique-t-il sur le dépôt GitLab. 

Un fonctionnement déjà confirmé par les administrateurs de l’application, qui soulignait en réponse à une autre question sur le dépôt que “pour le moment”, le seul calcul effectué sur l'appareil est l'ajustement du RSSI de chaque paquet hello avec TX & RX. Il n'y a pas de filtrage. Tous les paquets hello sont téléchargés et l'exposition au risque et le score de risque sont calculés sur le serveur sur la base du modèle statistique développé par Gorce et al.” Ce qui en soit ne serait pas un souci, si la Cnil et le décret ne précisait pas que l’application ne doit traiter que les contacts dits “à risque de contamination ", c’est-à-dire en contact avec l’utilisateur à moins d’un mètre pendant 15 minutes. Dans le cas présent, ce n’est pas le cas, ce qui contrevient au principe de minimisation des données voulu par le régulateur. 

Proportionné ? 

StopCovid “envoie donc une grande quantité de données au serveur qui n'a pas d'intérêt pour tracer la propagation du virus, mais qui pose un vrai danger pour la vie privée” signale Gaëtan Leurent. Contacté par Mediapart, le secrétariat d’Etat au Numérique a reconnu cet envoi, mais a souligné que ce choix était justifié du fait que, puisqu’un nouvel identifiant est attribué toutes les 15 minutes à un appareil, un contact qui ne durerait que cinq minutes pourrait être la suite d’un contact de douze minutes : deux contacts que seul le serveur est capable de relier pour comprendre qu’il s’agit, en réalité, d’un seul, de 17 minutes, donc à risques. 

Une justification plausible mais qui ne correspond pas aux recommandations de la Cnil qui a assuré contrôler de près StopCovid. Quitte à lui faire connaître le même sort que l’application norvégienne Smittestopp ? Selon France Info, StopCovid compte 1,7 million d’utilisateurs. Soit un peu plus de 2 % de la population française et un taux d’adoption extrêmement faible. Tant et si bien que Cédric O admet que “vu la faiblesse de l’épidémie, l’utilité de l’application est relative". On peut donc se demander si la finalité de l’application est bien proportionnée au volume de données collectées et traitées.