Résultat scientifique | Biologie structurale

3e version du serveur InterEvDock : mieux exploiter les données d’évolution des séquences protéiques pour améliorer la prédiction des structures d’interfaces

Des chercheurs de l’I2BC/CEA-Joliot, en collaboration avec la plateforme RPBS, ont développé la troisième version de leur serveur InterEvDock pour la modélisation structurale des interactions protéines-protéines. Le serveur intègre de nouveaux algorithmes pour exploiter les informations sur l’évolution des séquences et améliore fortement ses performances pour la génération de modèles d’assemblage corrects.

Publié le 21 juin 2021

Prédire la structure des protéines et leurs modes d’interactions constitue un véritable défi pour les bio-informaticiens spécialistes de biologie structurale. Outre le fossé entre le nombre de protéines dont la séquence est connue et le nombre de structures disponibles, la protéomique a récemment révélé la partie jusque-là immergée de l’iceberg : des centaines de milliers d’interactions physiques entre protéines. Or, connaître les surfaces impliquées dans les interactions est essentiel, non seulement pour comprendre les mécanismes qui régissent le fonctionnement d’une cellule ou d’un organisme, mais aussi pour la conception de nouvelles molécules thérapeutiques ou enzymatiques pour la pharmacologie et les biotechnologies.

Jessica Andreani et Raphaël Guérois (équipe Assemblages Moléculaires et Intégrité du Génome/LBSR/I2BC) s’intéressent depuis plusieurs années à la modélisation des interactions protéines-protéines. Ils contribuent notamment à l’amélioration des méthodes de prédiction en intégrant une dimension évolutive aux outils de « docking » moléculaire. En effet, les interfaces protéiques tendent à être plus conservées que les autres régions à la surface des protéines. De plus, des signes de co-évolution peuvent être détectés aux interfaces, où des mutations potentiellement perturbatrices sont compensées par des mutations dans des positions de contact sur le partenaire protéique. L’équipe a ainsi développé et mis à disposition, en collaboration avec la Ressource Parisienne en Bioinformatique Structurale (RPBS, Université de Paris), le serveur InterEvDock. Comme dans les versions précédentes, ce serveur propose une recherche systématique des interfaces possibles entre deux partenaires et génère de nombreuses conformations (on parle de « docking » libre) qu’il classe notamment en tenant compte d’informations sur l’évolution des séquences protéiques. Ce serveur de modélisation unique traite des requêtes d’utilisateurs de format varié (données structurales ou seulement séquences, données sur l’un des partenaires ou les 2).

Le logiciel en est désormais à sa troisième version (InterEvDock3). Celle-ci intègre 3 nouveaux modes de prédiction qui sont décrits dans deux articles publiés dans NAR¹ et Bioinformatics². Le premier mode, qui n’est pas basé sur du docking libre, permet de modéliser par homologie de gros complexes à basse identité de séquence. Il utilise en entrée des séquences (aucune structure) et exécute un protocole de modélisation basé sur des modèles en recherchant des homologues proches et éloignés de manière exhaustive pour générer des modèles d'assemblages.

Le deuxième mode permet de prédire la structure de complexes à partir des cartes de contacts résultant de méthodes combinant des analyses de covariation et d’apprentissage profond. Ce mode utilise des structures 3D de monomères ou d’homomultimères (comme un hexamère d’hélicase) pour exécuter une approche de docking libre en essayant de satisfaire les contacts prédits dans la carte de contacts. Il est capable de traiter certaines informations ambiguës, en particulier si l’un des deux partenaires est un homomultimère (avec donc ses résidus présents plusieurs fois dans la structure) et qu’un contact de la carte prédite peut donc se matérialiser de différentes façons.

Enfin, le troisième mode utilise des structures 3D de monomères ou de complexes multimères (éventuellement modélisés à partir des séquences du mode 1) et met en œuvre une nouvelle stratégie d’évaluation des interfaces avec des informations sur la coévolution. De 10 à 40 paires représentatives de séquences homologues (c’est-à-dire 10 à 40 interactions conservées entre homologues au cours de l’évolution) sont sélectionnées et modélisées à l’échelle atomique et un score leur est attribué. Ce nouvel algorithme, testé sur une base de données de 752 complexes (voir Bioinformatics²), permet d’augmenter de 30% le nombre de complexes correctement prédits.

A titre indicatif, il faut généralement entre 20 et 60 minutes au serveur pour proposer un modèle d’interaction. Développé avec le financement de deux infrastructures nationales en biologie santé (FRISBI et IFB), le serveur est accessible depuis la RPBS : https://bioserv.rpbs.univ-paris-diderot.fr/services/InterEvDock3/

Représentation schématique des 3 modes de fonctionnement d'InterEvDock3.

Un autre serveur pour analyser les données d'interactions obtenues par protéomique
L'équipe collabore également avec la RPBS sur le serveur Proteo3Dnet³ conçu pour analyser les interactions identifiées par des techniques de protéomique en intégrant des informations structurales (notamment des structures 3D de complexes connues). Développé avec le financement de trois infrastructures nationales en biologie santé (FRISBI, ProFI et IFB), il est accessible depuis la RPBS : https://bioserv.rpbs.univ-paris-diderot.fr/services/Proteo3Dnet/

Contacts Joliot :

Jessica Andreani (jessica.andreani@cea.fr)

Raphaël Guérois (raphael.guerois@cea.fr)

1 Chloé Quignot, Guillaume Postic, Hélène Bret, Julien Rey, Pierre Granger, Samuel Murail, Pablo Chacón, Jessica Andreani*, Pierre Tufféry* and Raphaël Guerois*. InterEvDock3: a combined template-based and free docking server with increased performance through explicit modeling of complex homologs and integration of covariation-based contact maps. | Nucleic Acids Res, 2021 May 12;gkab358.

2 Chloé Quignot, Pierre Granger, Pablo Chacón, Raphael Guerois, Jessica Andreani. Atomic-level evolutionary information improves protein-protein interface scoring. | Bioinformatics, 2021 Apr 26;btab254.

3 Guillaume Postic, Jessica Andreani, Julien Marcoux, Victor Reys, Raphaël Guerois, Julien Rey, Emmanuelle Mouton-Barbosa, Yves Vandenbrouck, Sarah Cianferani, Odile Burlet-Schiltz, Gilles Labesse , Pierre Tufféry. Proteo3Dnet: a web server for the integration of structural information with interactomics data. | Nucleic Acids Res, 2021 May 8;gkab332.

Haut de page

Mots clés : HADDOCK | FRODOCK | CAPRI | coMSAs

Commissariat à l'Énergie Atomique et aux Énergies Alternatives

Acteur majeur de la recherche, du développement et de l'innovation, le CEA intervient dans quatre grands domaines : énergies bas carbone, défense et sécurité, technologies pour l’information et technologies pour la santé.

Institut des sciences du vivant Frédéric-Joliot

Dans la même rubrique :

3e version du serveur InterEvDock : mieux exploiter les données d’évolution des séquences protéiques pour améliorer la prédiction des structures d’interfaces

Contacts Joliot :

Références

Mots clés : HADDOCK | FRODOCK | CAPRI | coMSAs

Sur le même thème

Naviguer dans le site

Commissariat à l'Énergie Atomique et aux Énergies Alternatives

Naviguer dans le portail

Institut des sciences du vivant Frédéric-Joliot

Accueil

Les entités de recherche

Plateformes & infrastructures

Partenariats

Les actualités de l'institut des sciences du vivant Frédéric Joliot

Dans la même rubrique :

3e version du serveur InterEvDock : mieux exploiter les données d’évolution des séquences protéiques pour améliorer la prédiction des structures d’interfaces

Contacts Joliot :

Références

Mots clés : HADDOCK | FRODOCK | CAPRI | coMSAs

Sur le même thème

Naviguer dans le site

Commissariat à l'Énergie Atomique et aux Énergies Alternatives

Naviguer dans le portail