DeepMind, la branche de Google dédiée à l’intelligence artificielle (IA), a fait une annonce remarquée le 8 mai dans la revue Nature: la sortie d’AlphaFold 3, leur logiciel de pointe pour la biologie. D’après Demis Hassabis, le directeur de DeepMind, sa nouvelle mouture est plus rapide, plus précise, et capable de gérer des challenges plus compliqués. Elle a la faculté de modéliser pratiquement toutes les protéines et leurs interactions, ce qui est une grande avancée pour la création de nouveaux médicaments. Néanmoins, elle a reçu un accueil mitigé de la communauté scientifique, car, contrairement à la précédente version, Google n’a pas dévoilé le code de l’algorithme.
La modélisation de la structure des protéines pourrait sembler insignifiante, mais les implications sont considérables. Les protéines sont des molécules importantes qui contribuent au fonctionnement des êtres vivants. Parmi elles, on retrouve les anticorps, les enzymes ou encore l’hémoglobine, qui véhicule l’oxygène dans notre sang. Les protéines sont formées d’une longue chaîne d’acides aminés, ressemblant à un collier de perles qui se plie de manière compliquée, comme si vous aviez laissé s’entremêler un paquet de câbles dans votre poche. Chaque protéine se plie d’une manière bien précise pour assurer sa fonction. Une protéine mal formée ne pourra donc pas fonctionner correctement, comme c’est le cas dans la drépanocytose où une anomalie de l’hémoglobine diminue sa capacité à transporter l’oxygène dans le sang.
Même si nous avons la possibilité de connaître la composition en acides aminés de n’importe quelle protéine, la tâche de définir son pliage est un défi majeur et complexe. Cela exige des périodes de travail en laboratoire pouvant aller de quelques mois à plusieurs années, pour une seule protéine. Et pourtant, nous savons que chez les êtres humains, il existe près de 20 000 protéines différentes !
L’apparition d’AlphaFold 2 en 2021 a créé une véritable révolution. Grâce à l’intelligence artificielle, le programme peut prédire en moins d’un jour le pliage de n’importe quelle protéine. Il suffit de donner la séquence d’acides aminés à l’IA pour qu’elle prévoie la structure tridimensionnelle, souvent avec une exactitude et une assurance stupéfiantes. Le mécanisme clé de ce processus ? Le deep learning ou l’apprentissage profond. L’IA a d’abord été formée sur toutes les protéines dont la structure était déjà connue, et elle prédit maintenant par analogie le pliage des autres protéines.
Il vous reste encore 64.39% de cet article à lire. La suite est réservée aux abonnés.