Un algorithme d'apprentissage profond prédit les structures des assemblages biomoléculaires


Un nouvel algorithme d’apprentissage profond peut prédire la structure des protéines liées à diverses autres molécules telles que les médicaments, les fluorophores et les métaux. Les travaux, qui ont permis aux chercheurs de concevoir des protéines capables de se lier à des molécules spécifiques, pourraient être utiles dans des domaines tels que la catalyse enzymatique.

Les protéines comprennent des milliers d’atomes, il est donc impossible de résoudre leur structure à l’aide de modèles de minimisation de l’énergie comme la théorie fonctionnelle de la densité. Les algorithmes d'apprentissage profond tels qu'AlphaFold (développé par Google DeepMind) et RoseTTAFold (de l'Institute for Protein Design de l'Université de Washington) se sont révélés extrêmement utiles, parcourant les structures connues dans la banque de données internationale sur les protéines pour apprendre à résoudre des structures inconnues. «Ces méthodes d'apprentissage profond fonctionnent toutes en termes de probabilités et non d'énergies», explique le biologiste informatique David Baker, directeur de l'Institute for Protein Design.

Un facteur qui complique la situation est que les protéines dans la nature n’existent pas sous forme de chaînes d’acides aminés isolées. «Certaines protéines ne se replient pas à moins qu'elles ne se lient à des métaux ou à d'autres types de cofacteurs qui pourraient être de petites molécules», explique Nicholas Polizzi de la Harvard Medical School dans le Massachusetts, aux États-Unis. « Le ligand est souvent impliqué dans AlphaFold ou RoseTTAFold car ils ont été formés sur des protéines qui ont été cristallisées et dont la structure a été résolue avec les ligands liés. » Cependant, cela empêche les chercheurs de comprendre l’effet du ligand ou de concevoir une protéine capable de se lier à un ligand spécifique.

Dans le nouveau travail, Baker et ses collègues ont développé une forme modifiée de RoseTTAFold appelée RoseTTAFold All-Atom, qui leur a permis de combiner les structures de chaînes d'acides aminés de la protéine avec des représentations atomiques des ligands de petites molécules. Ils ont obtenu des données sur les structures protéines-petites molécules, les complexes protéine-métal et les protéines avec des acides aminés liés de manière covalente auprès de la banque de données sur la structure des protéines et les ont utilisées pour entraîner un algorithme, lui permettant de développer des capacités prédictives générales. Il a prédit avec un haut niveau de précision les structures récemment résolues qui ne figuraient pas dans la formation. Les chercheurs ont également utilisé le modèle pour concevoir et synthétiser expérimentalement des protéines qui se lient à trois ligands communs : le cofacteur enzymatique hème, la digoxigénine, un médicament contre les maladies cardiaques, et la molécule de collecte de lumière, la biline.

Chiffre

Les chercheurs envisagent plusieurs applications, notamment la conception de médicaments et de capteurs à petites molécules. «Nous sommes très intéressés par l'utilisation de cela dans la conception de catalyseurs, où nous pouvons modéliser l'état de transition d'une réaction chimique et concevoir une protéine pour la stabiliser», explique Baker.

Polizzi, qui n'a pas participé aux travaux, décrit ces travaux comme une « étape importante ». Cependant, il prévient que l’un des obstacles à l’amélioration de la méthode résidera dans la recherche de davantage de données pour alimenter l’algorithme. «La prédiction de la structure des protéines a fait de grands progrès parce qu'il existe des milliards de points de données pour la séquence des protéines, mais il n'existe pas d'équivalent à l'heure actuelle pour les petites molécules», note-t-il.

Polizzi dit que la dernière version de RoseTTAFold semble être « vraiment bonne pour essayer de prédire la structure d'une protéine avec une molécule liée lorsque vous [already] savoir que la molécule se lie à la protéine ». Cependant, il souligne que de nombreuses personnes voudront tester si une molécule se liera à une protéine. «Je l'essaierais quand même personnellement… mais je ne ferais pas aveuglément confiance à ces résultats», dit-il.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*