L’opérateur historique a publié les résultats de son enquête interne, pointant un bug logiciel survenu au niveau de la plateforme d’interconnexion entre la VoIP et le réseau commuté. C’est ce dysfonctionnement qui a empêché 11800 appels d’urgence d’être transmis vers les services concernés entre 16h45 et minuit le 2 juin.
Orange est presque blanc comme neige dans la crise du 2 juin. C’est du moins ce qui ressort de l’enquête menée par l’opérateur historique : le dysfonctionnement vient des équipements d'un « partenaire fournisseur » tandis que la panne a « relevé la nécessité d’améliorer la rapidité de la diffusion de l’information vers les différentes parties prenantes de cette crise : les pouvoirs publics, les services d’urgence et les médias ».
Par suite de ce dysfonctionnement majeur des numéros d’urgence qui, le 2 juin, avait fortement perturbé l’accès aux services d’urgence, Orange a lancé une enquête interne « afin d’en identifier les causes précises et d’émettre des recommandations visant à en tirer tous les enseignements ». Le groupe en a publié une première synthèse. On y apprend donc que ce sont 11 800 appels qui n’ont pas pu être acheminés vers les services d’urgence, soit 11% du volume total des appels.
Bug logiciel
Le problème se situait au niveau de l’interconnexion entre les services voix mobile sur VoIP et sur ceux hébergés sur le réseau commuté, « suite à une opération de modernisation et d’augmentation capacitaire du réseau, débutée début mai, pour répondre à l’accroissement du trafic ». C’est sur la plateforme de call servers que s’était niché un bug logiciel, qui s’est déclenché lors d’une reconnexion « usuelle », « perturbant le fonctionnement global des call servers malgré leur redondance entre les six sites distincts ».
Le bug a ensuite été identifié par « le partenaire fournisseur des équipements concernés » qui y a appliqué un correctif. Orange de son côté « a identifié le dysfonctionnement logiciel immédiatement » et commencé à agir sans toutefois parvenir à rétablir le service. Qui restera donc « planté » entre 16h45 et minuit. « La complexité de la panne, la variété des technologies et des architectures réseau des services d’urgence ont retardé le diagnostic » explique l’opérateur.
Une cellule de crise trop lente
Non, le vrai problème aux yeux d’Orange était le retard dans l’activation de la cellule de crise managériale. Retard qui a, par ricochet, retardé la communication des informations aux « différentes parties prenantes de cette crise : les pouvoirs publics, les services d’urgence et les médias ». C’est sur ce point que la synthèse de l’enquête de l’Inspection générale du Groupe s’attarde, avec une liste de recommandations qui portent moins sur le volet technique que sur la gestion de crise.
Ainsi, l’enquête estime qu’il est nécessaire de « réduire de deux heures à 30 minutes maximum le délai de déclenchement d’une cellule de crise, en cas de perturbation touchant les appels aux services d’urgence et services vitaux au niveau national », tout en améliorant la surveillance de l’état des services d’urgence. Elle recommande en outre « d’accompagner les services de l’Etat dans l’accélération de la migration vers la technologie IP des centres d’appel des services publics et des entreprises en RTC », un vaste sujet qui continue de faire débat quant au plan d’abandon du RTC par Orange.
Tirer des leçons au niveau mondial
Enfin, l’inspection générale recommande la mise en place d’un numéro dédié pour l’Etat, ses services, les CHU, etc. en cas de problèmes sur les numéros d’urgence et propose en outre un « mécanisme de diffusion massive par SMS de consignes d’usage en cas de panne affectant les services d’urgence ». Qui espérons-le, ne reposera pas sur la même infrastructure que les numéros d’urgence.
Notons que l’enquête signale que le problème n’arrive pas qu’en France et conseille de procéder à une « analyse comparative » avec des incidents survenus en Allemagne, en Belgique, aux Etats-Unis… Stéphane Richard veut d’ailleurs également profiter de sa position de président de la GSMA pour pousser au niveau mondial « une cellule chargée de répertorier et analyser les dysfonctionnements réseau sensibles afin de partager les retours d’expérience entres opérateurs ». Le tout est sans surprise accompagné d’excuses et d’engagement de mobilisation aux côté des usagers.