Alors que des modèles de langage tels que ChatGPT et Gemini ont inauguré une nouvelle ère de l’IA dans la Silicon Valley, les entreprises technologiques les plus puissantes du monde se tournent vers la découverte de médicaments et la biologie numérique.
Lorsque Jensen Huang, PDG de Nvidia, a balayé du regard le public de la JPMorgan Healthcare Conference en janvier dernier à San Francisco, le plus grand événement de l’année dans le domaine des technologies de la santé, il a reconnu qu’il se trouvait sur un terrain inhabituel.
« Vous n’êtes pas mon public habituel », a-t-il déclaré à la salle de technologues de la santé et de la biologie, au cours d’une discussion avec Recursion, une entreprise de découverte de médicaments que Nvidia a financée à hauteur de 50 millions de dollars l’année dernière.
L’auditoire ne faisait peut-être pas partie de son cœur démographique, mais il espère que cela changera. À maintes reprises, M. Huang a vanté les mérites de la biologie numérique, qu’il considère comme la « prochaine révolution technologique ». Avec le boom de l’IA dans la Silicon Valley, Nvidia a développé une activité de plus de 60 milliards de dollars par an et est devenue, l’été dernier, l’une des rares entreprises dont la capitalisation boursière se chiffre en milliers de milliards. Dans le domaine de la santé et de la biotechnologie, l’entreprise voit d’autres possibilités d’alimenter sa croissance.
Kimberly Powell, vice-présidente de Nvidia chargée de la santé, a souligné à Forbes : « On a déclaré que nous étions la prochaine activité de plusieurs milliards de dollars pour Nvidia ». Elle a précisé que l’entreprise avait pour objectif de fournir des puces, une infrastructure en nuage et d’autres outils à un plus grand nombre d’entreprises de biotechnologie.
Maintenant que les grands modèles de langage tels que ChatGPT d’OpenAI et Gemini de Google DeepMind ont généralisé l’IA générative, plusieurs des entreprises technologiques les plus puissantes du monde considèrent la biotechnologie comme la prochaine frontière de l’intelligence artificielle – une frontière où l’IA ne génère pas des poèmes amusants à partir d’une commande, mais plutôt le prochain médicament qui sauvera des vies.
« Pourquoi le même secteur de la découverte de médicaments assistée par ordinateur ne donnerait-il pas naissance à la prochaine entreprise pharmaceutique d’une valeur de mille milliards de dollars ? »
Chez Nvidia, sans doute l’un des piliers de la révolution de l’IA grâce à ses puissantes puces GPU, la majeure partie des investissements de la branche de capital-risque de l’entreprise au cours des deux dernières années ont été consacrés à la découverte de médicaments. Chez DeepMind, le modèle AlphaFold du laboratoire d’IA de Google – un outil révolutionnaire pour prédire les structures des protéines – a été utilisé par des chercheurs universitaires au cours de l’année écoulée pour mettre au point une seringue « moléculaire » permettant d’injecter des médicaments directement dans les cellules, et pour rechercher des cultures moins dépendantes des pesticides. L’intérêt pour la biotechnologie s’étend à l’ensemble de l’industrie : Microsoft, Amazon et même Salesforce ont également des projets de conception de protéines.
Bien que l’utilisation de l’IA dans la découverte de médicaments ne soit pas exactement une nouvelle tendance – DeepMind a dévoilé AlphaFold pour la première fois en 2018 – les cadres de DeepMind et de Nvidia ont déclaré à Forbes qu’il s’agissait d’un moment décisif, grâce à la confluence de trois éléments : la masse de données d’entraînement désormais disponibles, l’explosion des ressources informatiques et les progrès des algorithmes d’IA. « Les trois ingrédients sont réunis pour la première fois », a déclaré M. Powell. « Cela n’était pas possible il y a cinq ans. »
L’IA a un grand potentiel dans le domaine de la biotechnologie en raison de sa complexité – il suffit de prendre le problème ciblé par AlphaFold. Les protéines constituent la machinerie de base de votre corps, gérant une grande variété de fonctions. Toutes ces fonctions dépendent de la forme tridimensionnelle d’une protéine. Chaque protéine est constituée d’une séquence d’acides aminés, et les interactions entre ces acides aminés et l’environnement externe déterminent la façon dont la protéine se « plie » – ce qui dicte sa forme finale. La possibilité de prédire la forme d’une protéine sur la base de ses séquences d’acides aminés présente un grand intérêt pour les entreprises de biotechnologie, qui peuvent utiliser ces informations pour tout concevoir, des nouveaux médicaments aux plastiques biodégradables, en passant par les cultures améliorées.
C’est là que l’apprentissage profond entre en jeu : l’entraînement de modèles d’IA sur des centaines de millions de séquences de protéines différentes et leurs structures sous-jacentes permet à ces modèles de découvrir des schémas biologiques sans nécessairement devoir effectuer les calculs coûteux requis par une véritable simulation de dynamique moléculaire. La simulation complète des protéines nécessite des ressources informatiques tellement intenses que des institutions ont conçu et construit des superordinateurs spécialement pour traiter ce type de problème, comme l’Anton 2 du Pittsburgh Supercomputing Center.
L’essor des technologies de découverte de médicaments ne provient pas uniquement des géants de l’IA. Depuis 2021, 281 opérations de capital-risque ont été réalisées dans le monde entier dans des startups spécialisées dans la découverte de médicaments par l’IA, représentant 7,7 milliards de dollars d’investissement, selon Pitchbook. Le pic le plus important s’est produit en 2021, lorsque la pandémie s’est installée, avec 105 transactions, contre 65 l’année précédente, avant de retomber à 67 en 2023. Dans un rapport publié au début du mois, le cabinet d’analystes a noté qu’il y a toujours un fort niveau d’enthousiasme « pour les entreprises en phase de démarrage qui intègrent l’IA dans la découverte et le développement de médicaments ». L’essor de l’IA générative a également suscité un intérêt accru, a déclaré David Baker, directeur de l’Institute for Protein Design à l’université de Washington.
« Cela a toujours été une sorte de folie, un phénomène marginal. Très en marge du courant dominant », a déclaré M. Baker. Aujourd’hui, a-t-il ajouté, « tout le monde en parle ». Depuis la création de l’Institute of Protein Design en 2012, plus de 20 start-ups ont été créées dans le cadre du programme, a indiqué M. Baker. Dix d’entre elles – dont Archon Biosciences, qui développe des nanomatériaux pour la médecine régénérative et le cancer, et Lila, qui crée des traitements pour les maladies fibrotiques – ont vu le jour ces dernières années, depuis 2021.
Chez DeepMind, ce n’est que lorsque la pandémie de Covid-19 a frappé que les chercheurs ont vraiment compris les enjeux de leurs recherches. Ils ont travaillé pendant près de 5 ans pour développer AlphaFold, et alors qu’ils entraînaient le modèle pour sa deuxième génération, le monde entier a commencé à se mettre à l’abri à cause d’un mystérieux virus. « Cela a vraiment fait prendre conscience de l’importance du problème », a déclaré Pushmeet Kohli, vice-président de la science chez DeepMind, à Forbes.
Le résultat du recyclage de DeepMind a été AlphaFold 2, un modèle révolutionnaire capable de prédire avec une telle précision les structures des protéines que les organisateurs du CASP, un concours mondial de recherche sur le repliement des protéines, ont envoyé un courriel à DeepMind pour lui demander si l’entreprise n’avait pas triché d’une manière ou d’une autre, se souvient Kohli en riant.
Les efforts ont été si prometteurs que le cofondateur Demis Hassabis a créé une entreprise distincte au sein d’Alphabet sur la base des percées d’AlphaFold en 2021. Baptisée Isomorphic Labs, la startup se concentre sur la découverte de médicaments et est dirigée par Hassabis lui-même. Cette année, par exemple, Isomorphic Labs a conclu des accords de recherche avec Lilly et Novartis, d’une valeur totale de près de 3 milliards de dollars si toutes les étapes sont franchies – sans compter les redevances lucratives sur les ventes potentielles de médicaments résultant de ces partenariats.
« Lorsque j’assiste à des conférences et que je vois le changement entre la façon dont les biologistes faisaient leur travail auparavant et la façon dont ils le font aujourd’hui, c’est une transformation stupéfiante. »
En 2022, Nvidia a dévoilé BioNeMo, une plateforme d’IA générative qui aide les développeurs à accélérer la formation, le déploiement et la mise à l’échelle de grands modèles de langage pour la découverte de médicaments. Chez Nventures, la branche de capital-risque du fabricant de puces, sept des 19 transactions globales de l’unité ont été réalisées dans des startups spécialisées dans la découverte de médicaments par l’IA, notamment Genesis Therapeutics, Terray et Generate Biomedicines – le plus grand nombre de toutes les catégories d’investissement.
« L’industrie de la conception assistée par ordinateur a créé la première entreprise de puces électroniques d’une valeur de 2 000 milliards de dollars », a déclaré M. Powell, en faisant référence à Nvidia et à son ascension fulgurante au cours de l’année écoulée. « Pourquoi le même secteur de la découverte de médicaments assistée par ordinateur ne donnerait-il pas naissance à la prochaine entreprise pharmaceutique d’une valeur de mille milliards de dollars ? » Et d’ajouter : « C’est pourquoi nous investissons comme nous le faisons ».
Plusieurs autres géants de la technologie déploient leurs propres efforts en matière de pliage des protéines. L’année dernière, Salesforce a présenté ProGen, un modèle d’IA générant des protéines, et Microsoft a publié EvoDiff, un modèle similaire mais open source. Amazon a également mis à disposition des outils de pliage de protéines pour SageMaker, sa plateforme d’apprentissage automatique AWS. Même ByteDance, la société mère de TikTok, semble recruter des équipes scientifiques et de conception de médicaments, comme l’a rapporté Forbes en janvier.
Pourtant, aussi prometteuse et médiatisée que soit la découverte de médicaments par l’IA, il y a des revers. Il faut toujours des années pour que les médicaments soient soumis à des essais cliniques, et bien que la FDA ait jusqu’à présent autorisé les essais cliniques pour plus de 100 nouveaux médicaments candidats qui utilisent l’IA ou l’apprentissage automatique pour leur développement, il faudra probablement des années avant que l’un d’entre eux n’arrive sur le marché.
Dans certains cas, les difficultés associées à la découverte de médicaments ont poussé les grandes entreprises technologiques à abandonner la recherche. En août dernier, Meta, la société mère de Facebook, a fermé son équipe chargée du repliement des protéines. Les chercheurs de l’unité se sont ensuite mis à leur compte, fondant une société appelée EvolutionaryScale, a rapporté Forbes l’année dernière. Meta a refusé de commenter les raisons de la fermeture du projet.
Un goulot d’étranglement important sur lequel les entreprises technologiques devront se concentrer est le fait de disposer de suffisamment de données d’entraînement. Les nouveaux modèles fondamentaux tels que le GPT reposent sur l’apprentissage par renforcement, une méthode qui permet aux algorithmes de traiter des informations non étiquetées par essais et erreurs. Cela les rend encore plus dépendants de données de haute qualité, a expliqué à Forbes Anna Marie Wagner, responsable de l’IA pour l’entreprise de biologie synthétique Ginkgo Bioworks. L’été dernier, son entreprise a conclu un partenariat stratégique de cinq ans avec Google Cloud afin d’associer son expertise en matière d’IA à la capacité de Ginkgo à générer rapidement des données biologiques dans ses laboratoires automatisés, qui peuvent ensuite être immédiatement réintégrées dans le modèle d’IA en tant que nouvelles données d’entraînement. Cette combinaison, dit-elle, permet de mieux optimiser le processus de découverte.
En outre, Ginkgo a la capacité de valider rapidement les prédictions du modèle. De manière contre-intuitive, cela fait de la bizarrerie des modèles d’IA qui hallucinent parfois – produisant des résultats erronés ou trompeurs à une invite – « une caractéristique et non un bogue », car elle peut conduire à des découvertes intéressantes qui auraient été inimaginables pour les scientifiques. « Nous voulons que le modèle produise des résultats soit farfelus, car c’est là que nous commençons à voir des améliorations ».
Kohli exprime le problème des données de manière plus directe : « Des déchets à l’entrée, des déchets à la sortie ». Alors que l’industrie s’efforce de résoudre ces problèmes, M. Kohli a déjà constaté l’impact de l’IA sur la recherche biologique. « Lorsque j’assiste à des conférences et que je vois le changement entre la façon dont les biologistes faisaient leur travail auparavant et la façon dont ils le font aujourd’hui, c’est une transformation stupéfiante », a-t-il déclaré.