«Incroyable», «révolutionnaire», «bluffant»… Quand ils évoquent la plateforme AlphaFold, dévoilée il y a quelques jours par DeepMind (une fililale d’Alphabet, maison mère de Google), les spécialistes ne manquent pas de superlatifs. Cet outil d’intelligence artificielle est capable de prédire la structure de la quasi-totalité des protéines codées par le génome humain. De quoi ouvrir de nouvelles perspectives notamment en médecine, la plupart des produits thérapeutiques ayant pour cible des protéines. Après la publication du génome humain en 2003, la mise à disposition de la quasi-totalité de ce «protéome» humain pourrait marquer un nouveau tournant pour la recherche biomédicale.
Quand l’ADN et le temps nous sont contés
Constituants fondamentaux des êtres vivants, les protéines régulent le fonctionnement de chacune de nos cellules. Elles sont essentielles à toute fonction biologique, de la digestion à la communication neuronale en passant par la reproduction. Enzymes, hormones, récepteurs, transporteurs… Les protéines sont partout. «Comprendre leurs fonctions est une étape incontournable pour savoir comment les organismes fonctionnent mais aussi comment les réparer en cas de défaillance. Si le moteur de votre voiture est une boîte noire, vous aurez du mal à agir en cas de panne»,explique Cécile Breyton, directrice adjointe de l’Institut de biologie structurale de Grenoble.
Intimement liées à notre ADN (chaque gène codant pour une protéine), elles sont produites dans les cellules grâce à une machinerie (elle-même faite de protéines!) capable de traduire le code génétique en acides aminés. Ces petites briques élémentaires sont assemblées de manière linéaire un peu comme les perles d’un collier. Sous l’effet de forces qui s’exercent entre ces perles, la protéine va se replier pour former une structure en trois dimensions. Et c’est le résultat de cet origami de précision qui détermine les fonctionnalités de la protéine, dont la forme globale joue un rôle crucial dans son fonctionnement. «Pouvoir prédire la structure d’une protéine offre un gain de temps considérable, en permettant de cibler les domaines qui ont un intérêt particulier et sur lesquels il faut réaliser des vérifications expérimentales», souligne Thomas Simonson, directeur de recherche spécialisé en biologie des protéines à l’École polytechnique (Palaiseau), qui imagine déjà comment AlphaFold va accélérer le rythme des travaux de son laboratoire.
Rapidité, simplicité et fiabilité sont trois des atouts d’AlphaFold, qui a supplanté tous ses concurrents lors de la dernière édition du CASP, la compétition internationale bisannuelle de prédiction de structure de protéines. «Ce qui est encore plus surprenant, c’est que DeepMind ne s’est attaqué à cette thématique du repliement des protéines que récemment,souligne Thomas Simonson. On les a vus la première fois à la 13e édition en 2019, et deux ans plus tard, ils sont les premiers, loin devant les autres!» Développés majoritairement par des laboratoires académiques, les autres programmes n’ont pas fait le poids face à la puissance de calcul et aux investissements du nouveau venu. Interrogé sur le coût de ce projet, Demis Hassabis, le fondateur de DeepMind, n’a pas donné de chiffres, mais a souligné les énormes efforts consentis pour ce qu’il a présenté comme «le plus gros investissement» de sa société, qui a monopolisé une équipe de 30 personnes durant cinq ans. «Il est évident qu’aucun laboratoire académique ne peut déployer autant de ressources pour tenter de coder un programme», commente Cécile Breyton.
Comme sa consoeur, Alexis Verger, chercheur à l’Institut des sciences biologiques du CNRS, salue la décision de DeepMind d’avoir opté pour un accès libre à AlphaFold et d’avoir publié le code source du programme. «Mais n’oublions pas que, sans le travail de tous les biologistes structuraux des cinquante dernières années, AlphaFold n’existerait pas, car ce sont leurs résultats qui ont servi à “entraîner” l’intelligence artificielle du programme. Et c’est grâce à nos futures données expérimentales que l’IA d’AlphaFold deviendra encore plus performante. C’est un excellent exemple du cercle vertueux des sciences ouvertes.»
Comment je suis partie à la rencontre de mes ancêtres avec un test ADN
AlphaFold devrait intéresser de nombreux laboratoires car, en plus du protéome humain, la base de données contient déjà les prédictions de milliers de structures de protéines d’animaux utilisés comme modèles de recherche, de la mouche à la souris en passant par le poisson zèbre. Il contient aussi les structures des protéines de la bactérie de la tuberculose et de Plasmodium falciparum, responsable du paludisme. DeepMind a d’ailleurs démarré une collaboration dans l’espoir de trouver parmi les protéines du parasite de nouvelles cibles thérapeutiques. «Le champ des applications est vaste et ne sera limité que par notre imagination», s’est enthousiasmée Edith Heard, directrice générale du European Molecular Biology Laboratory (EMBL), institut en charge de la mise en ligne et de la maintenance de la base de données des structures prédites par AlphaFold.
Une révolution pour la recherche médicale
Des maladies infectieuses aux cancers, les traitements ciblent la plupart du temps une ou plusieurs protéines. Lors du développement d’un médicament, l’enjeu est d’identifier une protéine d’intérêt, puis de trouver quelle zone dans sa structure contient des sites cibles.«Historiquement, les médicaments étaient mis au point de manière empirique, comme la pénicilline. Mais la biologie structurale a permis de comprendre quelle était l’action de cet antibiotique sur les protéines bactériennes et ensuite de produire des pénicillines synthétiques plus efficaces», illustre Cécile Breyton, directrice adjointe de l’Institut de biologie structurale de Grenoble.
Le laboratoire de David Baker, expert mondialement reconnu de la biologie structurale des protéines, a récemment lancé un projet pour mettre au point des mini-protéines qui pourraient bloquer le Sars-CoV-2. Son équipe s’est concentrée sur la fameuse Spike, qui permet au virus de s’introduire dans les cellules et qu’il faudrait inactiver. Ces travaux ont déjà fait l’objet de deux publications, dont une dans la revue Nature.
Vaccins à ARN messager: la protéine Spike est-elle «toxique et dangereuse» pour l’homme?
Dans les années 1990, l’étude du VIH a permis de développer le saquinavir, qui bloque le fonctionnement d’une protéine essentielle à la réplication du virus. AlphaFold sera sûrement une aide précieuse pour accélérer le développement de nouveaux produits thérapeutiques. Il pourrait aussi être très utile pour améliorer la compréhension des maladies génétiques rares en permettant de mieux comprendre l’impact des mutations sur la structure des protéines déficientes dans ces pathologies.
La rédaction vous conseille