L’algorithme qui garde un œil sur les traumatismes
L’intelligence artificielle est une solution à explorer pour construire des indicateurs fiables sans alourdir la tâche de professionnels de santé déjà surchargés, assure Gabrielle Chenais, docteure en informatique médicale, chercheuse à l’Inserm. C’est l’objectif du projet Tarpon, qui automatise l’analyse du langage clinique des comptes rendus des urgences pour constituer un observatoire national de surveillance des traumatismes.
En quoi consiste le projet Tarpon, que vous expérimentez depuis 2018 ?
Gabrielle Chenais – Le projet Tarpon [traitement automatique des résumés de passages aux urgences pour un observatoire national] mené par des chercheurs de l’Inserm et de l’université de Bordeaux avec le CHU de Bordeaux est parti d’un constat : il y a 21 millions de passages aux urgences par an, en France. Un tiers concernent des personnes qui viennent à la suite d’un traumatisme. C’est un volume énorme, sur lequel on pourrait agir via des politiques de prévention ciblées. Mais on dispose de peu de chiffres à l’échelle nationale.
Les données associées aux accidents de la voie publique qui figurent dans les rapports des forces de l’ordre sont connues par le biais des bulletins d’analyse des accidents de la circulation, les BAAC. Mais ces remontées sous-estiment les événements traumatiques, notamment ceux qui se développent avec les mobilités dites douces comme la trottinette ou le vélo.
De même, les indicateurs sur les violences conjugales ne sont collectés qu’à travers les dépôts de plainte, dont on sait qu’ils ne sont pas systématiques. En revanche, les victimes sont souvent vues aux urgences pour des constatations. D’où l’idée d’utiliser une intelligence artificielle qui automatiserait l’exploitation des comptes-rendus de ces consultations pour bâtir un observatoire national des traumatismes.
Quel peut être l’apport de l’intelligence artificielle en la matière ?
G. C. – Près de 75% des informations des dossiers médicaux y figurent sous la forme de données textuelles et ce sont des mines d’or sous-exploitées ! Par manque de temps, plutôt que de se livrer à une succession de choix parmi des items proposés par des menus déroulants, les urgentistes préfèrent rédiger leur compte rendu sous forme de texte. Autant une information chiffrée, comme la mesure d’une tension artérielle, est facile à extraire d’un compte rendu médical, autant savoir repérer les informations pertinentes à l’intérieur d’un texte libre est beaucoup plus complexe.
Dans le registre du Rhône, qui récolte les données issues des 245 hôpitaux et services d’urgence du département, les données des patients sont d’ailleurs traitées manuellement, ce qui n’autorise pas une exploitation à grande échelle. L’algorithme Tarpon est entraîné pour analyser automatiquement les notes cliniques issues des anamnèses. Il sait interpréter le jargon médical et les abréviations, y compris lorsqu’un même sigle renvoie à différentes significations.
Au-delà des variables classiques comme l’âge, le genre, le poids, il extrait des informations permettant de qualifier les circonstances du traumatisme. A-t-il eu lieu au domicile de la victime ? Dans son jardin ? Sur la voie publique ? S’il s’agit d’un accident, quel a été l’antagoniste ? Quelle activité la personne pratiquait-elle ? S’il s’agit d’un sport, quel type de sport ? La personne était-elle en état d’ébriété ? Si c’est une tentative de suicide, y a-t-il eu des précédents ? Dans quel contexte s’est déroulé le passage à l’acte ? Après une perte d’emploi, une dispute ?
Pour bâtir des indicateurs fiables, sans rajouter du travail à des professionnels de santé qui sont déjà en surcharge, voire en burn out, du fait de problèmes organisationnels, l’intelligence artificielle est une solution à exploiter.
A quoi peuvent servir ces données ?
G. C. – L’objectif, c’est de faire de la prévention ciblée. Si l’on constate qu’à un certain carrefour, dans un petit village en Beauce, il y a plus d’accidents qu’à l’intersection voisine, on saura qu’il faut repenser le schéma de circulation ou la signalisation. De même, on pourra observer dans une ville donnée, ou dans un contexte particulier, comme durant l’épidémie de Covid, une recrudescence de violences conjugales. Le fait de disposer de données exhaustives, partout sur le territoire en temps réel permet d’exploiter ces signaux et d’agir en prévention. C’est d’autant plus précieux que, par essence, les traumatismes sont des événements de santé évitables.
Si l’on prend la population des personnes âgées, on sait qu’elles sont l’objet d’une surprescription de psychotropes, alors que la porosité de leur barrière hémato-encéphalique les rend plus vulnérables aux effets de ces médicaments et aux risques de chutes associés.
Il n’y a pas, jusqu’ici, d’étude de cohorte sur l’ensemble de la population qui documente l’impact des consommations de médicaments sur le risque d’accident. Ici, le caractère exhaustif et prospectif des indicateurs que nous pouvons obtenir grâce à notre algorithme leur donne beaucoup plus de poids auprès des prescripteurs. Le but étant de discuter de l’opportunité de mettre à jour les recommandations concernant cette classe thérapeutique.
Autre exemple : dans quelques mois, l’âge du permis de conduire sera abaissé à 17 ans. L’analyse exhaustive des passages aux urgences de ces jeunes conducteurs pourrait permettre de mesurer leur part dans le volume total des accidents de la circulation et, le cas échéant, de faire évoluer la loi.
Où en est le projet Tarpon à ce stade ?
G. C. – Après la validation du modèle, entraîné sur plus de 500 000 comptes rendus des urgences du CHU de Bordeaux, une deuxième phase va bientôt démarrer, avec vingt autres services d’urgence. Auparavant, il a fallu définir la manière de l’implanter dans les autres hôpitaux et quelle infrastructure utiliser.
Ainsi, l’Institut interdisciplinaire d’intelligence artificielle (3IA) de la technopole Sophia Antipolis (Alpes-Maritimes) a mis à notre disposition un système de d’apprentissage fédéré, qui permet d’entraîner la machine à partir de données décentralisées. Ce sont des données de santé, donc des données sensibles, qui doivent rester in situ et anonymes. Leur exploitation en temps réel rendue possible par ce super modèle devrait apporter un éclairage nouveau sur des enjeux majeurs de santé publique.