Encoder la créativité dans la découverte de médicaments


L’intelligence artificielle (IA) a été de plus en plus utilisée pour soutenir la découverte de médicaments au cours de la dernière décennie. Des start-up pionnières se sont efforcées de convaincre les entreprises traditionnelles que l’IA et l’apprentissage automatique peuvent faire gagner du temps et de l’argent, tout en amplifiant la nouveauté.

On estime que 86 % des programmes de développement de médicaments se sont soldés par un échec entre 2000 et 2015. Pendant ce temps, les estimations du coût de mise sur le marché d’un nouveau médicament vont de centaines de millions à plusieurs milliards de dollars. «Nous devons changer l’économie de l’industrie pharmaceutique. Nous devons changer la façon dont les médicaments sont inventés », déclare Andrew Hopkins, fondateur d’Exscientia.

Lorsque Exscientia a commencé il y a environ 10 ans, se souvient Hopkins, « il y avait une très forte résistance au concept selon lequel les algorithmes et l’apprentissage automatique pourraient faire quelque chose d’aussi créatif que la découverte de médicaments ». Mais les mentalités ont changé. Les grandes sociétés pharmaceutiques parient sur l’IA et les partenariats se multiplient entre les sociétés pharmaceutiques établies et les nouvelles start-ups.

Sanofi s’est associé à Exscientia en 2022, contribuant 100 millions de dollars (80 millions de livres sterling) en espèces pour aider à développer 15 nouvelles petites molécules candidates en oncologie et en immunologie. Si le projet atteint ses jalons de développement, Sanofi pourrait débourser jusqu’à 5,2 milliards de dollars. AI biotech Recursion dans l’Utah, aux États-Unis, a signé un accord avec Roche et Genentech pour découvrir des molécules utilisant l’IA pour des indications neurologiques et cancéreuses, rapportant 150 millions de dollars à l’avance, avec jusqu’à 300 millions de dollars supplémentaires en paiements d’étape. Et l’année dernière, AstraZeneca a élargi sa collaboration en matière de découverte de médicaments avec BenevolentAI pour englober le lupus et l’insuffisance cardiaque.

Le secret est de réunir l’intuition et l’expérience humaines et les données

En janvier 2023, Bayer et Google Cloud ont annoncé un effort conjoint pour accélérer les calculs de chimie quantique de Bayer afin de favoriser la découverte précoce de médicaments via l’apprentissage automatique. Cela devrait dynamiser la modélisation in silico des systèmes biologiques et chimiques, et ainsi contribuer à l’identification de candidats médicaments. Cependant, fin janvier, la société mère de Google, Alphabet, a confirmé qu’elle supprimerait 12 000 emplois dans le monde, dont de nombreux dans ses équipes soutenant la découverte de médicaments. À peu près au même moment, BioNTech a acquis la société d’IA InstaDeep pour 362 millions de livres sterling pour aider à développer des immunothérapies et des vaccins.

«La capacité de cartographier de nouvelles voies pathologiques et d’identifier de nouvelles cibles présente un énorme potentiel», déclare Miraz Rahman, chimiste médicinal au King’s College de Londres, au Royaume-Uni. « C’est pourquoi nous voyons de grandes sociétés pharmaceutiques s’associer à des sociétés basées sur l’IA. » Ceci est étayé par un déluge de données, qui peuvent être exploitées par l’IA, et des expériences de laboratoire humide de plus en plus automatisées.

Voir passé la biologie désordonnée

La biologie est compliquée, tandis que la découverte de médicaments est alimentée par l’information. Recursion a été mis en place pour dresser de meilleures cartes de la biologie des maladies humaines afin de permettre aux scientifiques de découvrir de meilleurs médicaments. « Nous avons un réel manque de compréhension de la biologie humaine fondamentale – c’est d’une complexité indescriptible », déclare Joseph Carpenter, qui dirige la chimie médicinale chez Recursion. Dans le même temps, le volume de nouvelles publications scientifiques ainsi que de données sur les cellules, les tissus et les patients concernant le ciblage des maladies est énorme et augmente rapidement. L’IA peut repérer des modèles dans des trésors de données impossibles à reconnaître pour un humain.

Evotec, dont le siège est à Hambourg, en Allemagne, considère l’IA comme un outil permettant de rapprocher les biologistes et les chimistes, de digérer le flot d’articles et d’idées scientifiques – en utilisant le traitement du langage naturel – et de le transformer en un graphe de connaissances. «Vous pouvez rassembler les données, en un seul endroit, où vous pouvez avoir une conversation entre différents types de scientifiques», explique David Pardoe, responsable des architectes moléculaires mondiaux chez Evotec. « Le secret est de réunir l’intuition humaine, l’expérience et les données. »

Alors que l’IA et l’apprentissage automatique doivent convertir la biologie en valeurs quantifiables, l’humain reste un élément essentiel de l’équation. «Nous voulons coder la découverte de médicaments», déclare Hopkins. « Mais nous devons comprendre l’expertise humaine, les connaissances tacites et la créativité, et nous demander comment cela devient quelque chose de codable, reproductible et évolutif. » C’est la raison pour laquelle l’entreprise appelle sa plate-forme d’IA Centaur, d’après la créature hybride homme-cheval du mythe grec. Des molécules créées à l’aide de Centaur font actuellement l’objet d’essais cliniques pour traiter le cancer, le trouble obsessionnel-compulsif et la psychose de la maladie d’Alzheimer – ces deux derniers ont tous deux été développés avec la société japonaise Sumitomo Dainippon Pharma.

Le domaine a bénéficié des avancées technologiques. «La première chose qui a changé est la puissance de calcul, ainsi que la grande quantité de données disponibles», déclare Rahman. Les modèles prédictifs fonctionnent mieux lorsqu’il existe de grands ensembles d’entraînement, et certaines biotechnologies de l’IA s’appuient désormais sur les superordinateurs les plus rapides au monde. Rahman a une fois mis six mois pour exécuter une simulation de dynamique moléculaire d’une molécule interagissant avec une cible protéique; mais une meilleure résolution est désormais possible en quelques jours ou semaines. «Cela signifie que vous obtenez des données beaucoup plus réalistes sur la façon dont les composés interagissent avec le système biologique», explique Rahman. Une meilleure compréhension de l’amarrage moléculaire, de la dynamique moléculaire et des propriétés pharmacocinétiques des molécules est cruciale dans la phase préclinique si elles ne doivent pas échouer, coûteusement, plus tard.

Beaucoup de travail avec

À l’aide de l’IA, Insilico a identifié une nouvelle cible pour la fibrose pulmonaire idiopathique, une maladie pulmonaire chronique, puis a conçu un candidat-médicament à petite molécule. Cela n’a été possible qu’en puisant dans d’énormes quantités d’informations. « Pour notre plate-forme d’IA, nous disposons de 10 millions d’échantillons de données, de 40 millions de publications et de près de deux millions de composés ainsi que de données biologiques, y compris la structure, l’activité, la sécurité et la pharmacogabilité », déclare Feng Ren, co-directeur général d’Insilico. Carpenter note que Recursion a collecté 21 pétaoctets de données.

Exploitant des ensembles de données colossaux, l’apprentissage automatique et l’IA visent à fournir des molécules moins nombreuses mais supérieures. Cela contraste avec l’approche combinatoire traditionnelle adoptée dans les années 1990, qui synthétisait des millions de composés, dont une infime proportion sortait du laboratoire. Pardoe dit que l’accent est mis de plus en plus sur la création de molécules riches en informations. «Nous ne voulons plus fabriquer des milliers de molécules», dit-il. « Nous voulons des molécules qui vous aident à comprendre ce qu’est un [drug] ressemble à un site de liaison, ou où vous allez interagir avec un site de liaison.’

Nous ne voulons plus fabriquer des milliers de molécules. Nous voulons des molécules qui nous aident à comprendre les problèmes

Exscientia a rapporté un nouvel inhibiteur de CDK7, avec un potentiel pour le traitement du cancer. Seulement 136 nouveaux composés ont été fabriqués et testés – en moins d’un an – pour trouver cet inhibiteur. Pendant ce temps, son nouveau candidat immuno-oncologique pour les patients atteints de tumeurs solides a été « généré par nos algorithmes dans un processus de découverte rapide, avec environ 176 nouveaux composés fabriqués et testés pour trouver ce composé », explique Hopkins. Il dit qu’en moyenne, ils fabriquent environ 250 nouvelles molécules allant d’une idée à un médicament candidat, alors que l’industrie en fabrique en moyenne environ 2 500 à 5 000. 78 molécules sur une période de 10 mois de « conception, fabrication, test », avant de sélectionner une molécule anticancéreuse qui a été autorisée à entrer dans un essai clinique chez des patients atteints de lymphome.

Des scientifiques d'Insilico observent un bras robotique en train de faire des expériences en laboratoire

Une découverte plus rapide est présentée comme un avantage majeur de l’IA. Un article de 2019 d’Insilico a rendu compte d’un modèle génératif profond pour les petites molécules qui optimise la faisabilité synthétique, la nouveauté et l’activité biologique pour la fibrose et d’autres maladies. «Les expériences ont été réalisées en 21 jours, et nous avons généré une molécule qui a atteint la souris en 46 jours», explique le fondateur Alex Zhavoronkov. Pardoe dit qu’Evotec peut désormais passer de l’exploration d’une cible à la possession d’un candidat au développement préclinique en 21 mois ou moins.

Mais Rahman prévient que, malgré des quantités gargantuesques de données, les modèles prédictifs sont toujours faillibles. « Vous avez besoin des données expérimentales pour valider [the models]’, ajoute-t-il, ‘mais ce qui se passera probablement dans les cinq à 10 prochaines années, c’est que les ensembles de données expérimentales vont augmenter, enrichir ces modèles d’IA. Cela augmentera probablement considérablement le taux de réussite. Insilico est l’une des nombreuses sociétés d’IA à investir dans des laboratoires humides hautement automatisés.

Carpenter de Recursion est d’accord : « Avoir des ensembles de données massifs est essentiel, mais les données doivent être fiables », dit-il. Plus de deux millions d’expériences en laboratoire humide sont effectuées chaque semaine dans le laboratoire hautement automatisé de la société à Salt Lake City, aux États-Unis. Les prédictions et les calculs, la synthèse et les expériences de laboratoire sont ensuite réunis pour la découverte de médicaments.

Accéder à tous les domaines

Les adeptes de l’IA s’empressent de dire que leurs algorithmes sont indépendants du domaine thérapeutique. Mais les efforts sont néanmoins biaisés, notamment vers le cancer. « C’est là que le retour sur investissement est nettement plus élevé », déclare Rahman. Il préconise d’intensifier l’utilisation de l’IA pour explorer les antimicrobiens, en particulier pour les bactéries Gram-négatives difficiles telles que Pseudomonas aeruginosa, où toute amélioration des taux de réussite serait la bienvenue. Le laboratoire de Jim Collins au Massachusetts Institute of Technology, aux États-Unis, recrute l’IA pour découvrir de nouveaux antibiotiques, tandis qu’Exscientia collabore avec la Fondation Bill & Melinda Gates pour développer des thérapies contre les virus à potentiel pandémique.

Il existe également un intérêt pour les maladies neurodégénératives, pour lesquelles il est notoirement difficile de développer des médicaments. «Ce sont des maladies pour lesquelles les approches traditionnelles n’ont pas eu beaucoup de succès, et il existe un grand besoin clinique non satisfait», note Rahman. L’IA pourrait découvrir des cibles médicamenteuses pour la maladie d’Alzheimer – où il y a sans doute un manque de cibles de maladie claires. BenevolentAI a mené un essai de phase 2 au Royaume-Uni pour son candidat inspiré de l’IA pour la maladie de Parkinson. Le pipeline de la société comprend désormais un candidat pour la dermatite atopique en phase 2. Aux États-Unis, Insitro a entamé une collaboration de cinq ans avec Bristol Myers Squibb en 2020 pour travailler sur deux maladies neurodégénératives – la sclérose latérale amyotrophique et la démence frontotemporale. Insilico s’intéresse également aux troubles du système nerveux central, dont la maladie de Parkinson, ainsi qu’à la fibrose, à l’oncologie et à l’immunologie. Tous sont liés au vieillissement, explique Ren : « Nous voulons utiliser notre algorithme pour comprendre la biologie du vieillissement et des maladies liées à l’âge. »

Mise à l’échelle de la complexité

Au-delà de l’examen des médicaments à petites molécules, l’IA et l’apprentissage automatique commencent à s’adresser à des médicaments biologiques beaucoup plus complexes. Fin 2022, Exscientia a commencé à essayer de concevoir des anticorps humains. «Nous le considérons comme une preuve de concept pour utiliser des approches d’apprentissage en profondeur pour générer et cribler, virtuellement, des bibliothèques incroyablement grandes d’anticorps virtuels», déclare Hopkins. L’objectif ultime est de développer des anticorps contre des cibles spécifiques.

Pour les thérapies à base de protéines ou pour étudier des cibles médicamenteuses qui ne sont pas facilement disponibles pour être étudiées en laboratoire, la modélisation de leur repliement est un facteur crucial pour déterminer leur comportement. AlphaFold, l’algorithme développé par la filiale de Google DeepMind, a considérablement amélioré les prédictions des structures protéiques 3D à partir de séquences d’acides aminés. Et bien qu’il soit peu probable qu’il révolutionne immédiatement la découverte de médicaments, Pardoe prédit qu’AlphaFold aura un impact majeur.

D’autres, comme Generate Biomedicines aux États-Unis, développent leurs propres algorithmes. Generate a combiné la caractérisation informatique et en laboratoire de protéines connues, en recherchant des modèles statistiques dans la séquence, la structure et la fonction des acides aminés. Apprendre les principes généraux du repliement à partir de structures existantes pourrait permettre à l’entreprise de concevoir des architectures de protéines entièrement nouvelles ou de fabriquer des liants pour perturber les protéines humaines de la bonne manière pour traiter un état pathologique, déclare John Ingraham, responsable de l’apprentissage automatique chez Generate. La société collabore avec Amgen sur cinq cibles cliniques.

Une autre tendance consiste à utiliser l’IA non seulement dans la découverte précoce de médicaments, mais dans le développement : pour l’optimisation des pistes, la prédiction de la toxicité, la pharmacocinétique et même la sélection de sous-groupes de patients dans les essais cliniques. « L’ensemble du processus d’intégration de l’IA va changer notre façon de voir la découverte et le développement de médicaments », prédit Rahman. « Notre objectif est de rendre les entreprises pharmaceutiques plus productives, avec une combinaison d’humains et de machines », déclare Hopkins. « Je pense que nous avons gagné l’argument, et nous pensons que tous les médicaments à l’avenir seront conçus de cette manière. »

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*