Les interactions protéines-ARN jouent un rôle essentiel dans de nombreux processus cellulaires normaux et pathologiques. Pouvoir décrire et prédire la structure tridimensionnelle fine de ce type de complexe est précieux pour les biologistes. À long terme, ces connaissances ouvrent des voies de développements thérapeutiques. Comme pour les interactions protéine-protéine, des outils bioinformatiques sont nécessaires pour prédire les modes d'interaction de ces structures complexes. Mais, alors que la prédiction des interactions protéine-protéine jouit de la richesse des données structurales déjà établies, de l'exploitation des pressions évolutives et plus récemment de méthodes d'apprentissage profond performantes, la prédiction des interactions protéine-ARN est à la traîne, en raison de la rareté des données structurales et de la flexibilité impliquée dans ces complexes. L'équipe de Jessica Andreani (laboratoire AMIG/B3S/I2BC) a mené un projet visant à exploiter des données de diverses natures pour essayer de prédire ces surfaces d'interaction.
Elle avait notamment à sa disposition des données « évolutives » qui reposent sur le fait que malgré la divergence plus ou moins importante de séquences des protéines et des ARN au cours de l'évolution, des interactions soient maintenues.
L'équipe a d'abord identifié un ensemble de données vaste et diversifié de plus de 2 000 paires d'interfaces structuralement similaires (appelées interologues structuraux) et a confirmé l'existence d'une relation évolutive dans la plupart de ces paires d'interfaces. L'équipe a analysé les paires d'acides aminés et de nucléotides proches dans l'espace à travers l'interface :
- elles sont le plus souvent similaires entre les interologues, même lorsque les interfaces ont fortement divergé ;
- Cependant, les contacts polaires tels que les liaisons hydrogène sont le plus souvent distribués différemment entre les interologues, même dans les interfaces étroitement liées.
Cette découverte souligne que l'arrangement spatial est plus conservé que la séquence dans les interactions protéine-ARN et suggère des principes guidant l'évolution de ces associations moléculaires.
Cette étude a des implications importantes pour la prédiction des interactions protéine-ARN :
- elle fournit des règles utiles pour transférer les contacts d'un modèle dont la structure est connue vers une interface d'intérêt ;
- elle ouvre la voie à l'application de techniques d'apprentissage automatique pour intégrer ces modèles de conservation des contacts.
A terme, on peut imaginer que ces informations devraient accélérer l'identification de cibles thérapeutiques potentielles et améliorer notre compréhension moléculaire des mécanismes pathologiques médiés par les interactions protéine-ARN.
Actualité basée sur la traduction du « Author summary » de l'article.
Contact Institut des sciences du vivant Frédéric-Joliot :