Vous êtes ici : Accueil > L'institut > Analyse de données de co-séquençage microARN-ARN messagers à l'échelle de la cellule unique et comparaison d'algorithmes de prédiction de cibles de microARN

Agenda


Soutenance de thèse

Analyse de données de co-séquençage microARN-ARN messagers à l'échelle de la cellule unique et comparaison d'algorithmes de prédiction de cibles de microARN

Jeudi 02 octobre 2025 à 14:00, Salle 445, Bâtiment 10.05, CEA Grenoble, 

Publié le 2 octobre 2025
Louise V​elut​​
BioSanté, Institut de Recherche Interdisciplinaire de Grenoble ​
Les microARN (miARN) sont de petits ARN non-codants qui jouent un rôle crucial dans la régulation post-transcriptionnelle de l'expression des ARN messagers (ARNm). Ils influencent une large gamme de processus biologiques, physiologiques et pathologiques. Les miARN suscitent un intérêt croissant pour leur potentiel thérapeutique, notamment dans le domaine de la cancérologie. Les défis actuels liés à l’application clinique des miARN consistent à mieux comprendre leurs modes d’action, à identifier avec précision leurs cibles et à évaluer leurs impacts phénotypiques. Bien que de nombreuses méthodes, expérimentales et bio-informatiques, aient été développées pour identifier ou prédire ces cibles, la faible concordance entre leurs prédictions souligne que cette question nécessite encore des avancées significatives.
​ Depuis 2018, cinq groupes de recherche ont développé des techniques expérimentales permettant le co-séquençage des miARN et des ARNm à l'échelle de la cellule unique. Les données générées représentent des ressources précieuses pour l'étude des miARN. Plus précises que les données de séquençage "bulk" classiques, ces approches unicellulaires permettent d'analyser avec une plus grande exactitude les effets des miARN sur leurs cibles prédites. La première partie de cette thèse est consacrée à l’analyse des corrélations entre l’expression des miARN et leurs cibles prédites dans ces jeux de données de co-séquençage. Pour cela, nous nous sommes basées sur la courte étude bio-informatique réalisée dans l’article de Wang et al. (Nat. Comm., 2019) qui est associée à un jeu de données de co-séquençage de 19 cellules de la lignée K562. Notre analyse approfondie de ce jeu de données a permis de corriger plusieurs biais statistiques et de montrer que seule une faible proportion de miARN est significativement anti-corrélée avec ses cibles. De plus, notre étude a mis en évidence un compromis entre l’analyse d’un petit nombre de cibles prédites avec une grande confiance et l’inclusion d’un plus grand nombre de cibles. Ces conclusions ont été validées en utilisant deux autres jeux de données de co-séquençage (Xiao et al. Genome Biol., 2018 et Li et al. Sci. Rep., 2025).
La seconde partie de cette thèse porte sur l’utilisation d’analyses de corrélations appliquées aux données de co-séquençage, dans le but de comparer les performances de différents algorithmes de prédictions de cibles de miARN et de bases de données de cibles validées expérimentalement. Ces jeux de données récents constituent une ressource originale pour ces comparaisons puisqu’ils n’ont jamais été utilisés pour développer un algorithme de prédictions de cibles. Les outils ont été évalués pour leur capacité à prédire des cibles significativement anti-corrélées avec les miARN, dans un contexte de lignées cellulaires humaines et de cellules primaires de poumons de souris. Sept algorithmes parmi les plus populaires ont été comparés : Diana microT, miRDB, mirDIP, miRmap, miRWalk, RNA22 et TargetScan ainsi que les bases de données miRTarBase et TarBase. Les analyses ont permis d’établir des différences de performances de certains outils entre les miARN humains et murins. De plus, cette étude met en évidence l’intérêt de restreindre les cibles prédites à celles validées expérimentalement ainsi que le bénéfice d’utiliser des consensus construits à partir de différents algorithmes.
Ces travaux mettent en avant l’intérêt de générer des données de co-séquençage miARN-ARNm à l’échelle de la cellule unique pour mieux comprendre l’impact des miARN sur l’expression de leurs cibles. Cependant, l'analyse de ces données complexes doit être menée de manière systémique et rigoureuse. D’autre part, ces jeux de données précurseurs peuvent être employés pour comparer des outils de prédiction de cible et ainsi fournir des conseils clairs pour leur usage.