RĂ©guliĂšrement, des bases de donnĂ©es provenant de LinkedIn font surface sur des forums de hackers. AprĂšs 500 millions dâentrĂ©es en avril, une nouvelle base a Ă©tĂ© mise en vente fin juin, avec 700 millions dâentrĂ©es cette fois. Mais point de vol de donnĂ©es ici, il sâagit de donnĂ©es publiques « scrappĂ©es », soit automatiquement rĂ©cupĂ©rĂ©es.
Ăa en devient lassant. Il ne se passe plus un mois sans quâune base donnĂ©es soi-disant dĂ©robĂ©es Ă telle ou telle plateforme ne fasse surface sur un quelconque forum. Ici, ce sont quelque 700 millions dâentrĂ©es en provenance de LinkedIn qui ont Ă©tĂ© mises en vente sur RaidForums, le vendeur mettant en ligne un fichier dâun million dâentrĂ©es pour vĂ©rification.
Le site spĂ©cialisĂ© PrivacySharks a menĂ© sa petite enquĂȘte et a confirmĂ© lâauthenticitĂ© des donnĂ©es contenues dans lâĂ©chantillon. Cette vente survient environ trois mois aprĂšs quâune premiĂšre base de 500 millions de donnĂ©es ait Ă©tĂ© proposĂ©e Ă la vente. Noms complets, postes et numĂ©ros de tĂ©lĂ©phone y figurent.
Extraction automatisée
ContactĂ©, LinkedIn a indiquĂ© Ă nos confrĂšres que, si ses investigations sont encore en cours, « l'analyse initiale indique que l'ensemble de donnĂ©es comprend des informations scrappĂ©es de LinkedIn ainsi que des informations obtenues Ă partir d'autres sources ». Aucune information privĂ©e nâa Ă©tĂ© dĂ©robĂ©e Ă lâoccasion dâune intrusion dans les systĂšmes de LinkedIn, il sâagit ici dâinformations contenues sur des profils publics qui sont « scrappĂ©es », entendre par lĂ rĂ©cupĂ©rĂ©es de maniĂšre automatisĂ©e au moyen de scripts conçus dans ce but. Ce qui contrevient tout de mĂȘme aux conditions dâutilisation du rĂ©seau social professionnel.
Notons que le scrapping nâest pas rĂ©servĂ© aux mĂ©chants hackers : des gĂ©ants du numĂ©rique sây livrent allĂ©grement, ce qui a dâailleurs valu Ă IBM dâĂȘtre Ă©pinglĂ© pour avoir constituĂ© une base dâun million de visages sans demander lâautorisation Ă qui que ce soit.
Dans le cas de LinkedIn, la base mise en vente en avril avait, comme celle de juin, Ă©tĂ© obtenue au moyen du scrapping de millions de profils LinkedIn. Dâailleurs, lâauteur du post sur RaidForum nâen est pas Ă son coup dâessai : il avait par le passĂ© proposĂ© une base de donnĂ©es de 530 millions dâentrĂ©es extraites de Facebook et obtenues, lĂ encore, par scrapping.