Définition
L’intelligence artificielle générative est une catégorie d’IA capable de créer du texte, des images et d’autres données en utilisant des modèles génératifs. À l’inverse de l’IA classique, qui automatise des processus humains, l’IA générative génère du contenu réaliste et plausible à partir d’une description initiale. Ces deux types d’IA se rejoignent toutefois : comme les programmes informatiques utilisés dans l’IA classique, ceux de l’IA générative ne sont “pas conçus par des humains mais par des algorithmes d’IA et de machine learning à partir de données” explique à mind Health Clément Chastagnol, Chief Data Science Expert chez IQVIA.
L’IA générative repose couramment sur les réseaux de neurones artificiels. On retrouve au cœur du modèle “deux programmes symétriques d’encodage et de décodage” qui vont permettre de “changer la représentation des données” précise Clément Chastagnol. Ils saisissent des modèles et structures complexes sur lesquels ils sont formés, pour générer de nouvelles données présentant des attributs similaires. Les progrès récents dans les réseaux neuronaux profonds basés sur des transformeurs ont donné naissance à des systèmes d’IA générative dotés d’une capacité à répondre aux prompts en langage naturel. Parmi ceux-ci figurent des chabots tels que ChatGPT, Bing Chat, Bard et LLaMA.
Comment l’IA générative s’est imposée
Le cabinet d’études de marché Market.us estime dans un rapport que le marché mondial de l’IA générative dans le domaine de la santé devrait atteindre 17,2 milliards de dollars en 2032, contre 800 millions de dollars en 2022.
À l’image de la rapidité avec laquelle ChatGPT s’est fait connaître du grand public et des entreprises (ChatGPT a dépassé les 100 millions d’utilisateurs actifs seulement deux mois après son lancement), l’IA générative a connu une adoption massive en très peu de temps. Aujourd’hui, les grandes entreprises technologiques se sont toutes lancées dans la course à l’IA générative en santé et les établissements de santé commencent à élaborer leurs propres outils.
Aux États-Unis, cette vague s’apparente à un raz-de-marée : environ 75 % des entreprises américaines de soins de santé expérimentent déjà l’IA générative ou envisagent de la développer à leur échelle, selon l’enquête “2024 Life Sciences and Health Care Generative AI Outlook Survey” du Deloitte Center for Health Solutions. Lors de l’édition 2023 du salon HIMSS, qui laissait la part belle aux LLM (Large Language Models), Julius Bogdan, analyste spécialisé en IA, partageait à mind Health son étonnement : “Le domaine de la santé a mis au moins dix ans à adopter l’intelligence artificielle traditionnelle et son impact a mis du temps à se faire sentir. L’IA générative a surgi de manière beaucoup plus rapide. Ce qui me surprend le plus est la rapidité avec laquelle elle a été intégrée au système de soins.”
Thomas Clozel, cofondateur et CEO d’Owkin
En France, l’IA générative accapare aussi les esprits, bien que le marché soit plus resserré. Selon un rapport de Wavestone, neuf start-up travaillaient en effet sur l’IA générative en santé l’an passé, à l’instar de Nabla, d’Owkin et d’Iktos. Ces sociétés sont relativement jeunes, puisqu’elles ont en moyenne 4,5 années d’existence, selon le baromètre.
Après la hype, vient le temps du déploiement. Les nouveaux acteurs émergents qui ont levé des fonds vont devoir prouver la plus value de leurs outils.
Actualités
En mars 2023, le spécialiste de la reconnaissance vocale Nuance annonce l’intégration de GPT-4, le modèle d’OpenAI, à son logiciel de traitement de langage naturel Dragon Ambient eXperience (DAX) Express. Pour rappel, Microsoft avait fait l’acquisition de Nuance en mars 2022 pour 19,7 Mds $.En mars 2023, la start-up française Nabla dévoile Nabla Copilot, un outil pensé pour réduire le temps administratif des médecins, basé en partie sur GPT-4 et des modèles de machine learning internes.En avril 2023, une collaboration entre Epic et Microsoft voit le jour. Epic intègre l’IA générative dans les dossiers de santé pour créer une note clinique à la suite d’une consultation avec un patient et améliorer les processus de facturation.En juin 2023, Google Cloud annonce que la Mayo Clinic utilise son nouvel outil de recherche d’IA générative. Intitulé Enterprise Search on Generative AI App Builder, il permet de créer des chatbots personnalisés et des applications de recherche sémantique afin que les médecins et les chercheurs puissent trouver et accéder plus rapidement à des informations telles que les antécédents médicaux d’un patient, des dossiers d’imagerie, des données génomique ou des analyses de laboratoires.En juillet 2023, Amazon dévoile son outil HealthScribe qui s’appuie sur la reconnaissance vocale et l’IA générative pour créer automatiquement une documentation clinique à partir des conversations entre patients et médecins.Dans le cadre de sa nouvelle stratégie en santé dévoilée en octobre 2023, Docaposte s’associe à LightOn, Aleia et NumSpot pour proposer une solution souveraine et industrielle d’IA générative.En novembre 2023, Doctolib annonce travailler sur un assistant médical et un assistant personnel pour aider les soignants dans leurs tâches (transcription en temps réel des consultations, préparation des plans de traitements, classement automatique de documents).En décembre 2023, Google dévoile MedLM, sa suite de modèles d’IA générative construite sur Med-PaLM 2 et disponible pour les clients Google Cloud aux États-Unis.En janvier 2024, Nabla annonce un financement de 24 millions de dollars en série B, dirigé par Cathay Innovation avec la participation de Zebox Ventures.À l’occasion de la J.P. Morgan Healthcare Conference 2024, la Mayo Clinic signe un partenariat avec la start-up Cerebras pour développer un modèle de fondation basé sur les données structurées et non structurées détenues par l’institution américaine.En février 2024, Owkin s’associe à AWS pour développer des applications d’IA générative et des modèles de fondation, en s’appuyant sur l’infrastructure et les services cloud de l’hyperscaler américain.Des cadres d’Owkin lancent la start-up Bioptimus dédiée aux modèles de fondation. Bioptimus lève 35 M$ en phase d’amorçage pour créer un modèle de fondation en biologie, alimenté par un accès mondial fédéré aux données multimodales des patients en provenance d’hôpitaux universitaires. En mars 2024, lors de sa conférence mondiale dédiée à l’IA, Nvidia annonce le lancement de nouveaux services basés sur l’IA générative ainsi qu’un partenariat avec Johnson & Johnson MedTech autour de la drug discovery.
Une foule d’applications
Certains cas d’usage sont déjà en production, quand d’autres semblent plus expérimentaux. Selon Sequoia Capital, les principales applications de cette technologie à l’heure actuelle ont pour principaux objectifs la réduction des coûts et l’automatisation des opérations de back-office, optimisant ainsi le workflow pour les professionnels.
À l’occasion d’un webinar dédié à l’IA générative organisé par IQVIA en octobre 2023, Clément Chastagnol a fait le tour des applications envisageables de la technologie :
Les chatbots : “Boostés à l’IA générative, les chatbots sont remis au goût du jour” observe Clément Chastagnol, citant notamment l’arrivée des chatbots pour “la formation des médecins en simulant des interactions avec les patients”. L’usage de chatbots ultra personnalisés pourrait aussi permettre de mieux suivre les patients à distance, à commencer par les besoins post-opératoires, décrit à mind Health Barnabé Lecouteux, directeur associé, en charge de l’incubateur Life Sciences de Capgemini Invent au niveau mondial. “Certains patients gagneraient à discuter avec des chatbots, en complément ou pour initier une démarche” souligne Clément Chastagnol, prenant l’exemple du suivi médicamenteux pour les maladies chroniques (rappels, conseils personnalisés, informations relatives aux risques potentiels, etc.). Diagnostic et prise en charge : Sur l’aide au diagnostic, Clément Chastagnol précise qu’il s’agit plutôt d’un “support à la décision” pour “donner plus d’information et recouper des informations de nature différente, comme des comptes rendus d’hospitalisation, des images, des résultats de biologie, etc”.Aide administrative : Des cas d’usage apparaissent autour de la rédaction de compte-rendu d’hospitalisation, avec une prise en compte automatique des antécédents médicaux et du parcours de soin du patient ou encore l’aide au codage des actes. Oracle a par exemple lancé un assistant clinique pour aider aux tâches administratives. Doctolib travaille également à la création d’un assistant pour les médecins et le personnel administratif, afin de les aider dans leurs tâches du quotidien, comme la retranscription de consultations ou l’aide à la facturation.Drug discovery : Ce sujet fait partie des principales débouchées attendues, notamment pour la partie préclinique. “La principale application de l’IA générative est la drug discovery, le design et la création de nouveaux médicaments” indique le Pr Jean-Emmanuel Bibault, oncologue et chercheur en intelligence artificielle, à mind Health. En recherche pharmacologique, Clément Chastagnol mentionne deux cas d’usage : l’identification de nouvelles molécules (Microsoft a notamment publié en open source un modèle qui peut générer des protéines, EvoDiff) et les modèles prédictifs de cellules humaines pour “prédire comment le corps réagit à un médicament à terme”. L’Initiative Chan Zuckerberg a annoncé le financement et la construction d’un supercalculateur de plus de 1000 GPU à cet effet.Publication scientifique : La technologie peut aider à résumer et recouper des articles dans l’exercice de la veille bibliographique. Jean-Gabriel Ganascia, professeur d’informatique à la faculté des sciences de Sorbonne Université, a souligné à mind Health que les grands modèles de langage sont une aide en matière de documentation scientifique grâce à leur capacité à résumer des textes, à partir desquels pourront être extraites des connaissances. “C’est essentiel pour faire de la reconnaissance d’entités nommées. Dans le domaine médical, c’est central, car beaucoup d’articles sont publiés sur différents sujets à l’international”.Recherche clinique : Le monitoring des études (automatisation de la lecture des dossiers patients pour le contrôle qualité des données recueillies), le reporting (automatisation de la rédaction des états des lieux réguliers) et l’aide au recrutement des patients (analyse automatique des dossiers patients pour sélectionner plus efficacement les patients) sont ici visés.Prévention : Sur ce volet, Clément Chastagnol donne trois cas pratiques : la surveillance épidémiologique (aide au recueil et à l’interprétation de signaux), l’aide à la pharmacovigilance (aide à l’analyse des informations remontées sur les événements indésirables) et la surveillance à distance des patients (analyse des données collectées par les capteurs et dispositifs médicaux connectés).Communication avec les patients et les professionnels de santé : Les assistants virtuels pourront également être des ressources pour la prise en charge de rendez-vous et le suivi du parcours de soin.
Les systèmes d’IA générative
Dans un rapport consacré aux enjeux et perspectives des systèmes d’IA générative, l’Académie de Médecine décrit les “SIAgen” comme des “systèmes numériques capables de produire de multiples résultats, des textes comme des images ou des vidéos, à des fins diverses telles que la production de comptes-rendus, la traduction, la production de code informatique, l’aide au diagnostic ou à la décision, la synthèse de structures comme l’impression 3D, etc.”
Les modèles de fondation
Il faut d’abord distinguer les modèles de fondation – l’appellation “Foundation Model” a été introduite par le Stanford Institute for Human-Centered Artificial Intelligence – qui permettent de produire un résultat présentant un certain degré de similarité avec les données d’apprentissage qui ont servi à le construire. Selon l’Académie de Médecine, un modèle de fondation est “un réseau de neurones, profond, entraîné sur une grande quantité de données non annotées, généralement par apprentissage auto-supervisé.”
Les modèles de fondation sont des systèmes d’IA formés sur des quantités massives de données multimodales pouvant convenir à de multiples usages. GPT-3, annoncé en mars 2020 par OpenAI, était doté de 175 milliards de paramètres, tandis que Bard, construit par Google, utilise le modèle de fondation PaLM entraîné avec 540 milliards de paramètres. L’Académie de Médecine note toutefois qu’il “n’est pas certain que des modèles encore plus grands apporteraient des performances plus élevées”. D’autant que l’impact environnemental et la dépense énergétique entrent aussi dans l’équation. Ainsi, Google a publié PaLM-2 avec moins de paramètres que son prédécesseur PaLM.
Quelques projets de modèles de fondation naissent dans l’Hexagone :
Raidium pour l’imagerie :
La start-up Raidium a fait partie des lauréats “Golden Tickets” d’Amgen France pour bénéficier d’un accès exclusif à l’incubateur BioLabs. Elle conçoit un tout premier modèle de fondation dédié à l’imagerie. L’objectif est de définir des biomarqueurs d’imagerie destinés à l’oncologie, aux maladies cardiovasculaires et métaboliques (notamment la maladie de NASH). Paul Herent, radiologue et CEO de Raidium, explique à mind Health qu’à la différence de ChatGPT ou de Gemini entraînés sur des données généralistes, “Raidium est un modèle de fondation spécialisé en radiologie, entraîné à apprendre ce qu’un radiologue apprend, en qualité de spécialiste de médecine et d’image combiné”. La méthode consiste à “entraîner le modèle de fondation sur des données de vie réelle massives. Nous avons un premier batch de données substantiel issu d’un partenariat avec le centre d’imagerie du Nord à Saint-Denis. Nous voulons le faire mûrir avec des usages industriels, notamment dans l’industrie pharmaceutique.”
Bioptimus pour la biologie :
La deeptech Bioptimus est aussi nouvelle dans le paysage. Fondée par des cadres d’Owkin en début d’année, elle vise à opérer un modèle de fondation en biologie, alimenté par un accès mondial fédéré aux données multimodales des patients en provenance d’hôpitaux universitaires. “L’application des modèles fondamentaux et de l’IA générative à la biologie va profondément transformer la science” a déclaré le Pr Jean-Philippe Vert, directeur R&D chez Owkin, qui fait partie de l’aventure. “En utilisant la puissance de ces modèles sur des bases de données vastes et multimodales, nous pourrons mieux saisir les mécanismes biologiques complexes restés jusqu’à présent méconnus. Cette compréhension holistique de la biologie à différentes échelles sera cruciale pour propulser les sciences biomédicales et environnementales vers de nouveaux horizons”.
Les LLM
Les LLM peuvent être assimilés à une sous-catégorie des modèles de fondation. Selon l’Académie de Médecine, ces grands modèles de langue sont des modèles de fondation entraînés sur un corpus de textes, qui “ouvrent de nouvelles perspectives et introduisent un nouveau paradigme dans le traitement de la langue, mais aussi dans le traitement des signaux multimodaux”. Ces modèles sont pré-entraînés sur de grands corpus pouvant être optimisés pour réaliser une nouvelle tâche.
Les grands modèles de langage, tel que GPT-4, sont spécialisés dans le traitement du langage naturel (NLP). Selon Clément Chastagnol, les LLM “sont capables de s’appliquer à des tâches pour lesquelles ils n’ont pas été entraînés spécifiquement.”
ChatGPT est sans doute le plus connu de ces modèles. Son usage en santé reste controversé à cause du phénomène d’hallucination, n’étant pas conçu spécifiquement pour des usages médicaux, à la différence par exemple de Med-Palm de Deep Mind.
Pr Jean-Emmanuel Bibault, oncologue et radiothérapeute à l’hôpital européen Georges Pompidou
Le manque de fiabilité de ces modèles n’empêche pas les chercheurs de continuer à explorer les capacités et les limites des LLM. En décembre 2022, ChatGPT a réussi l’United States Medical Licensing Examination, le programme d’examen permettant d’obtenir un permis d’exercer le métier de médecin aux États-Unis. Le modèle d’IA a dépassé le seuil de précision nécessaire pour valider l’examen. Les chercheurs ont également constaté son potentiel pour aider les étudiants en médecine à le préparer. En France, GPT-4 a été testé dans le suivi des effets secondaires en radiothérapies. Le Pr Jean-Emmanuel Bibault, co-auteur de cette étude, mène ses investigations avec prudence : à l’heure actuelle, “il n’est pas possible d’utiliser ces grands modèles sans autorisation, car il faut être en mesure de les maîtriser et de les évaluer avant de les déployer” confiait-il à mind Health.
À noter qu’une étude publiée dans Nature a comparé les connaissances cliniques des LLMs. Ce benchmark, baptisé “MultiMedQA”, propose de “combiner six ensembles de données de réponses à des questions médicales existantes couvrant la médecine professionnelle, la recherche et les requêtes des consommateurs et un nouvel ensemble de données de questions médicales communément recherchées en ligne, HealthSearchQA”.
L’IA ambiante
Capture écran – Test de Nabla Copilot avec le Dr Alexis Roullaud (Ramsay Santé)
L’IA ambiante gagne de l’ampleur, en témoigne le parcours de Nabla. La start-up française commercialise depuis plus d’un an son outil “Nabla Copilot”, présenté comme un “assistant d’IA ambiante” dont l’objectif est de réduire l’épuisement professionnel des praticiens tout en améliorant les soins aux patients. L’outil, installé sur un ordinateur ou un smartphone, “écoute” la consultation entre un médecin et son patient et permet aux médecins de recueillir les informations clés échangées lors d’une consultation en générant automatiquement un compte rendu médical structuré. Il est disponible pour des consultations en personne ou à distance. Nabla Copilot est partiellement basé sur GPT-4 d’OpenAI ainsi que sur des modèles de machine learning internes. Nabla se déploie essentiellement sur le marché américain, même si l’entreprise s’est aussi rapprochée de groupes en France à l’instar de Ramsay Santé. Parmi les partenariats phares, citons celui passé avec le groupe Kaiser Permanente, l’un des plus gros systèmes de santé américains qui gère 39 hôpitaux et plus de 600 centres de soins.
Quelles limites ?
Si les possibilités offertes par l’IA générative sont grandes, les inquiétudes se font entendre sur les limites technologiques et éthiques. Les hallucinations, l’effet “boîte noire”, le manque de confidentialité des données et les biais liés aux données d’entraînement font partie des principales craintes exprimées par les utilisateurs de ces systèmes.
Les craintes sont particulièrement élevées dès lors qu’elles touchent à un sujet vital. En santé, les LLM peuvent produire des résultats dangereux, tels que des diagnostics erronés. “La grande question, au centre de tous les fantasmes et de toutes les inquiétudes, reste celle de la capacité de ces intelligences à poser un diagnostic médical” soutenait Julius Bogdan à mind Health.
Des mesures peuvent être prises pour contrer ces effets néfastes, comme la pose de filtres par les concepteurs des systèmes d’IA générative. L’Académie de Médecine note au passage que ce processus “n’est ni transparent ni vérifié”. Elle précise que “la méthode d’évaluation adversaire par les équipes humaines, appelées red teaming, a été étendue au-delà de son domaine d’origine en cybersécurité et appliquée aux LLM. Elle désigne l’utilisation de nombreux types de sondages, de tests et d’attaques des systèmes d’IA (par exemple, par injection de prompts) afin de mettre à jour les biais ou les comportements émergents de ces modèles.”
Au GenAI4care festival, qui s’est tenu en décembre 2023, Jean-Philippe Vert d’Owkin, alertait contre les risques d’overfitting de ces IA, qui naissent lorsqu’un modèle finit par trop s’habituer à son jeu de données d’entraînement. “Nous validons [nos modèles] sur des données historiques. Évidemment, cela n’est pas fait à l’aveugle, des outils de benchmark permettent de mesurer la performance des modèles. Quand on fait de l’IA, c’est assez facile d’overfitter après quelques itérations. Un modèle peut très bien prédire tous les essais passés, mais ne marchera pas à l’avenir à force de s’évaluer sur un jeu de données. C’est le travail des boites de technologie de mettre en place des procédures pour éviter cet overfitting” soulignait-il.
Un deuxième aspect du problème, soulevé aussi par Jean-Philippe Vert, est le coût. “Les coûts de calcul augmentent dans notre budget” reconnaît-il. “Néanmoins, dit-il, dans l’IA générative il faut distinguer dans les structures de coûts la construction et l’entraînement d’un nouveau modèle d’une part et l’utilisation de ce modèle d’autre part. Aujourd’hui, l’utilisation de ce modèle coûte très cher. Quand on met en place un chatbot, chaque réponse coûte de l’argent. Dans la recherche pharmaceutique, le coût d’entraînement va être important mais le modèle va nous servir à faire des diagnostics plus précis donc cela va permettre de réduire fortement le coût d’utilisation. C’est un investissement qui est rapidement rentabilisé si cela permet d’augmenter de quelques pourcentages l’outil de diagnostic. Je pense que, même si les coûts sont élevés, les opportunités sont bien réelles.”
Les freins réglementaires constituent une autre part de l’équation à prendre en compte. Le nouveau cadre juridique européen encadrant l’usage de l’intelligence artificielle (AI Act) vient classer les IA selon leurs niveaux de risque. Le Pr Jean-Emmanuel Bibault craint que ce règlement pénalise les acteurs européens sur la scène internationale, voire représente un risque de “tuer l’innovation” à défaut de faire monter de nouvelles initiatives.
Pour aller plus loin
Les acteurs à suivre
Les personnes à suivre
Les Articles à lire
Clarisse Treilles
IA générative : où sont les opportunités en santé ?
SYNTHÈSE Aller plus loin
Source link