« Dès le début de l’épidémie, les  données  ont  nourri  le débat public comme jamais !  Le  fait que des acteurs de la société civile se mettent à publier des indicateurs et des analyses a poussé les pouvoirs publics à fournir des data de meilleure qualité et plus lisibles », souligne le sociologue Samuel Goëta, maître de conférences associé à Sciences Po Aix, spécialiste de l’ouverture des données publiques.

Mathilde Hoang, chargée  de l’open data chez Etalab.
Mathilde Hoang, chargée  de l’open data chez Etalab.

En matière de data, comme dans beaucoup d’autres domaines, il y aura un avant et un après la pandémie de Covid-19. D’abord parce que, dès les premières attaques du nouveau virus, face à la montée des taux de contamination et à la saturation des hôpitaux, le besoin de disposer de données s’est imposé comme un élément essentiel du pilotage de la crise. Ensuite, parce que la gravité de  la situation a obligé les services sanitaires à accélérer leur démarche de récolte, de traitement et de diffusion d’indicateurs chiffrés. Ceci pour répondre aux demandes pressantes et souvent inquiètes du grand public, mais aussi des journalistes, des scientifiques et des professionnels de santé, tous mobilisés dans une tempête sanitaire inédite. Très vite, il a  fallu  développer de nouveaux outils de gestion de crise en temps réel, contourner la frilosité de certaines administrations et se jeter sans délai dans un bon en avant numérique.

Indicateurs

« La nature des données produites et observées a évolué au fur et à mesure de la progression de l’épidémie et des moyens mis en œuvre pour y faire face, détaille Mathilde Hoang, chargée  de l’open data chez Etalab, le département de la direction interministérielle du numérique (Dinum) qui orchestre la stratégie de l’État dans le domaine de l’open data. Au départ, on scrutait les remontées hospitalières, les admissions aux urgences, l’occupation des lits de réanimation. Puis, l’intérêt s’est porté sur les résultats des tests PCR, la situation épidémiologique par région. Plus tard, sur les chiffres de la vaccination et ceux de la propagation des variants. Cette batterie d’indicateurs a permis à la fois de planifier les ressources sanitaires, de piloter la réponse hospitalière, de concevoir les modèles de confinement et de couvre-feu, mais aussi d’offrir aux citoyens une vision transparente de la situation sanitaire et de soutenir la confiance dans l’action de l’Etat. »

 

Un collectif de bénévoles

Samuel Goëta, maître de conférences associé à Sciences Po Aix, spécialiste de l’ouverture des données publiques.
Samuel Goëta, maître de conférences associé à Sciences Po Aix, spécialiste de l’ouverture des données publiques.

« Les données de veille épidémique ont tout de suite attiré beaucoup d’attention, rappelle Samuel Goëta, en particulier celles de l’université Johns-Hopkins de Baltimore, qui a publié un tableau de bord très utilisé, mis à jour quotidiennement. Mais, à l’origine, l’open data vient plutôt des sciences, notamment de la génomique. »  C’est ainsi que, le11 janvier 2020, les autorités sanitaires de Wuhan (Chine) livrent en open data le génome du SARS- CoV-2, une publication qui mobilise la communauté scientifique et assoit la certitude que l’ouverture des données sera cruciale dans le pilotage de la pandémie.

De fait, sept jours plus tard, l’Institut de virologie de la Charité, à Berlin, développe grâce à ce partage les premiers tests PCR : l’open data fait la démonstration de son utilité dans le cadre d’une réaction rapide à la crise.

« Il y a eu une demande très forte d’ouverture des données publiques, mais au départ, leur qualité et leur fiabilité étaient assez discutables, commente le sociologue. Finalement, contrairement à ce que l’on aurait pu penser, l’ouverture des données est moins le fait de la loi pour une République numérique (lire encadré ci- dessous) que celui de la mobilisation de la société civile. Je pense par exemple à cette communauté de développeurs et data scientists bénévoles qui, le soir, le week-end, a entrepris de collecter et de consolider, dans l’outil contributif veille-coronavirus.fr, les chiffres officiels disponibles sur la progression de l’épidémie. »

Besoin d’immédiateté

Paul Duan, fondateur de l’ONG Bayes Impact
Paul Duan, fondateur de l’ONG Bayes Impact.

Un élan citoyen que confirme Paul Duan, fondateur de l’ONG Bayes Impact, à qui l’on doit la solution de traçage des cas contacts Briser la chaîne, utilisée par l’Assurance maladie.  « Durant la crise, alors que nous étions tous face au mur et que le gouvernement ne détenait pas toutes les réponses, les innovations citoyennes se sont imposées assez naturellement. On a vu émerger un certain nombre d’initiatives, comme Briser la chaîne ou comme les différents dashboards conçus par le data scientist Guillaume Rozier sur son site CovidTracker. Les citoyens avaient besoin d’une forme d’immédiateté, d’une lisibilité, d’éléments qui les placent en capacité de faire des analyses et d’être, à leur échelle, des chercheurs actifs de la situation sanitaire. »

Du côté de la puissance publique, un temps d’adaptation des systèmes d’information a été nécessaire. Le 18 mars 2020, Santé publique France décide de créer une page sur la plateforme ouverte des données publiques data.gouv.fr, pour y diffuser quotidiennement les indicateurs liés à la Covid-19, également accessibles sur l’observatoire cartographique Géodes, destiné à un public plus averti.

Cartes de chaleur

Germain Forestier, enseignant-chercheur en informatique à l’université de Haute-Alsace.
Germain Forestier, enseignant-chercheur en informatique à l’université de Haute-Alsace.

Une fois partagées, ces données trouvent rapidement leur audience. Au plus fort de la première vague, sur son compte Twitter suivi à l’époque par quelque 300 abonnés, Germain Forestier, enseignant-chercheur en informatique à l’université de Haute-Alsace, à Mulhouse, se met à poster des graphiques sur les chiffres des contaminations. « Voyant ma femme médecin partir faire de la régulation au Samu le week-end, je me suis demandé ce que, moi, je pouvais faire à mon niveau. De par ma formation, j’avais les compétences pour automatiser les visualisations de données. J’ai donc développé un programme qui récupère les fichiers en open data sur les sites publics et, chaque jour, je poste une infographie actualisée : c’est pour moi une forme d’engagement citoyen. »

Grâce aux conseils d’une communauté grandissante sur les réseaux sociaux, le data scientist cherche à perfectionner la présentation des données. En août 2020, il propose une visualisation des résultats des tests PCR sous forme de cartes de chaleur, avec un dégradé allant du vert au rouge pour figurer l’intensité de l’épidémie par département et par classe d’âge. « Sans jamais faire de pronostics, cela visait à montrer dans quelles régions le virus avait   vraisemblablement un risque de repartir », précise Germain Forestier, aujourd’hui suivi par près de 23000 abonnés, et dont certaines visualisations ont été reprises dans des avis du Conseil scientifique.

 

Générer la confiance

« Certaines personnes ont plus confiance dans les graphes que je produis que dans ceux du gouvernement. Le fait de se dire que je ne suis pas rémunéré par l’Etat pour ces productions est sans doute un facteur, au même titre que ma capacité à donner à voir les données disponibles. Quand les sources officielles annoncent un nombre de contaminations, mon programme est capable de montrer, par exemple, que sur l’ensemble de ces nouveaux cas, il y en a eu tant chez les 30-39 ans, tant chez les 40-49 ans, tant dans tel département… Expliquer les chiffres, pouvoir entrer dans ce niveau de détail, c’est cela qui génère la confiance », estime cet enseignant-chercheur, qui sent monter la pression au même rythme que le compteur de ses abonnés. « Plus il augmente et plus je vérifie mes informations avant de poster, même si cela se fait au détriment de la production. »

 

Réutilisations fiables

Comme CovidTracker et d’autres outils développés par des citoyens  lambda, le compte Twitter de Germain Forestier a constitué une réponse à une demande de données solides, d’explications abordables et de réutilisations fiables.

« De fait, aux côtés des épidémiologistes, qui sont devenus des figures, on a vu apparaître des data scientists qui, sans être des experts de la virologie, ont néanmoins joué un rôle de médiation tout aussi important », relève Samuel Goëta. Pour ce spécialiste, à partir de la seconde vague de Covid-19, la réutilisation est devenue massive, avec des données plus qualitatives et des systèmes d’information plus robustes, dans le cadre de ce que l’on pourrait appeler une « logique infrastructurelle » : le temps n’est plus à la simple reproduction de graphiques, mais à la mise à jour automatisée de tableaux de bord en temps réel, comparable à celle des cours de la Bourse.

Au fil des vagues successives, le rapport aux données évolue. « On est passé d’une première vague, avec une ouverture sous contrainte, à une deuxième, durant laquelle les données ont servi à débattre, à mesurer l’efficacité des mesures gouvernementales, comme le couvre-feu, ou encore à accélérer la cadence, comme ce fut le cas avec la vaccination », note Samuel Goëta.

Nécessité de collaborer

Ainsi, lorsque le site Our World in Data de Max Roser, chercheur à l’université d’Oxford, met en ligne un outil de visualisation du nombre de personnes vaccinées par pays, le retard de la France ressort franchement. « Ces indicateurs, plus que tout autre argument, ont joué dans l’accélération de la campagne de vaccination », remarque-t-il. C’est aussi durant cette séquence que le gouvernement prend conscience de la nécessité de collaborer avec les acteurs de la société civile, ce qu’il fait en s’appuyant sur les solutions proposées par Vite ma dose ou Covidliste pour donner une autre dimension à la couverture vaccinale.

« Il n’est pas question d’un monopole d’Etat ou d’une quelconque concurrence, mais d’une complémentarité, fait valoir Mathilde Hoang. La source est la donnée produite par l’Etat, qui la génère, la monte en qualité et la partage, comme on l’a vu avec la première version du dashboard Covid-19 publié en avril 2020 sur gouvernement.fr. Ce tableau de bord était le fruit d’une collaboration entre la société civile et l’administration. Il a démarré grâce au travail du collectif OpenCovid19, qui avait entrepris de consolider de manière collaborative les données issues, entre autres, des bulletins de Santé publique France, des agences régionales de santé, des préfectures et des interventions de la direction générale de la Santé. »

 

Un « service public citoyen »

La complémentarité entre l’administration et les citoyens anime également les réflexions de Paul Duan. « Proposer une autre solution de traçage de cas n’est pas une critique contre celle développée par le gouvernement. Dire que les visualisations de Guillaume Rozier sont innovantes n’est pas un signe que Santé publique France est ringarde… », soutient ce jeune entrepreneur, qui croit à la possibilité d’un « service public citoyen ». « L’Etat n’a pas le monopole de la production des services publics et pourrait s’appuyer sur les forces de l’innovation citoyenne et aider ces initiatives à passer à l’échelle. »

Dans le rapport que lui a confié la Digital New Deal Foundation, il défend la création d’« un mécanisme d’industrialisation de l’innovation sociale dans une logique de filière, pour dépasser le plafond de verre qui sépare encore ces initiatives, séduisantes mais à petite échelle, des services publics produits par les institutions officielles ».

Pour un changement de paradigme dans la production des services publics, il faut sortir de l’écosystème confidentiel de l’innovation sociale et toucher le grand public, préconise Paul Duan. « Plus on aura de cas d’usage comme ceux qui sont apparus pendant la crise, plus la prise de conscience s’opérera. Prenons le cas d’un prochain Guillaume Rozier, qui aimerait nouer un partenariat avec l’administration. Comment aborder la puissance publique quand on n’a pas de réseau? A ce futur Guillaume Rozier, il faudrait pouvoir dire autre chose que : “Deviens viral sur Twitter, ce qui te permettra de taper dans l’œil du président de la République, et donc d’avoir accès aux interlocuteurs pertinents au sein du gouvernement.” Ces coopérations relèvent encore un peu trop du régime d’exception : il faudrait les démocratiser, en instaurant des logiques répétables. »

Information du citoyen vs protection des secrets

En France, le cadre légal pour l’ouverture et la circulation des données a été renforcé en 2016 par la loi pour une République numérique, dite loi [Axelle] Lemaire, qui modifie le code des relations entre le public et l’administration (CRPA).

Toute administration ou collectivité territoriale de plus de 3 500 habitants et employant plus de 50 agents est tenue de publier en open data l’ensemble des informations qu’elle produit, à l’exception de celles relevant du secret défense ou du secret des délibérations, et de celles relatives à la vie privée des individus.

 

Le décret du 10 décembre 2018, dernier texte d’application de cette loi, identifie les documents administratifs pouvant être rendus publics, sans occultation des données à caractère personnel y figurant.

 

En avril 2021, une circulaire du Premier ministre consolide la gouvernance des données publiques et installe un administrateur ministériel des données dans chaque ministère, sous la houlette d’un administrateur général en la personne du directeur interministériel du numérique. C’est à lui qu’il revient de mettre en œuvre la stratégie de la donnée, des algorithmes et des codes sources.

 

« La France compte parmi les pionniers de l’open data, assure Mathilde Hoang, chargée de l’open data chez Etalab. Elle a notamment été l’un des premiers pays à ouvrir ses données après les premiers cas de contamination à la Covid-19. Depuis 2017, elle se classe parmi les trois premiers pays en Europe, selon l’Open Data Maturity Index de la Commission européenne et OURdata Index de l’OCDE. Reste à former l’ensemble des acteurs publics, à acculturer les administrations et les collectivités, à renforcer leur connaissance du cadre légal et à les accompagner dans l’adaptation de leurs systèmes d’information. »