Les avancées de la recherche
Une IA change la donne de l’évolution dirigée
Grâce au travail du chercheur Ulisse Ferrari, publié dans Nature Communications, les scientifiques de l’Institut de la Vision pourront bénéficier d’un algorithme de machine learning capable d’optimiser leurs protocoles d’évolution dirigée. Cette IA a notamment permis d’accélérer la recherche de nouveaux vecteurs viraux pour les thérapies géniques.

« C’est une innovation significative dans l’optimisation des protocoles d’évolution dirigée, mais également une avancée majeure pour réduire l’utilisation de modèles expérimentaux précliniques en diminuant le nombre de variants à tester. »
L'évolution dirigée est un processus contrôlé et guidé visant à induire des changements spécifiques dans les caractéristiques génétiques ou phénotypiques des protéines. Contrairement à l’évolution naturelle qui se produit au hasard par sélection naturelle, l’évolution dirigée implique une intervention délibérée pour orienter et accélérer les changements souhaités. Elle est souvent utilisée en recherche et en bio-ingénierie pour améliorer certaines caractéristiques des protéines, comme leur structure en lien avec leurs fonctions et leurs capacités à interagir avec des tissus spécifiques.
À l’Institut de la Vision, la directrice de recherche Deniz Dalkara utilise l’évolution dirigée pour identifier des virus capables de transporter des gènes thérapeutiques, destinés par exemple aux thérapies géniques de la rétine. Ces protocoles, qui nécessitent la production et le séquençage de plusieurs millions de variants, génèrent d’immenses quantités de données biologiques dont le déchiffrage est souvent très coûteux en temps et en argent.
Pour optimiser leur analyse, le physicien Ulisse Ferrari a développé un algorithme basé sur l’apprentissage automatisé (machine learning), nommé ACIDES (Accurate Confidence Intervals for Directed Evolution Scores). Les données sont enregistrées, compilées, comparées par l’algorithme, qui est particulièrement efficace pour identifier les erreurs et les inexactitudes, nombreuses dans ces grands volumes de données issues du séquençage. Cette intelligence artificielle synthétise les informations en fonction du but recherché pour en livrer un résultat plus fiable, plus précis, plus pertinent.
L’algorithme ACIDES est notamment capable de recommander un nombre optimal de cycles de mutation pour obtenir un variant efficace, l’un des défis majeurs de l’évolution dirigée car chaque itération est très couteuse.
(a) La méthode d’évolution dirigée crée de nombreuses versions d’un gène (variants). Le séquençage ADN (NGS) compte chaque version.
(b) ACIDES utilise ces comptes pour évaluer l’efficacité de chaque variant.
(c) Les variants sont classés par efficacité. ACIDES corrige ce classement pour plus de précision.
(d) ACIDES calcule la « Robustesse du Rang » (RR).
(e, f) Exemples de correction de classement par ACIDES. Les lignes vertes montrent l’intervalle possible des rangs. Les croix rouges indiquent le rang réel.
(g) Valeurs de RR pour les exemples (e) et (f). Un RR élevé indique des résultats fiables.
Publication : Nemoto, T., Ocari, T., Planul, A. et al. ACIDES: on-line monitoring of forward genetic screens for protein engineering. Nat Commun 14, 8504. https://doi.org/10.1038/s41467-023-43967-9