La métabolomique, c'est-à-dire l'étude globale des petites molécules (métabolites) présentes dans un échantillon biologique, est d'un intérêt majeur pour la recherche de biomarqueurs. La spectrométrie de masse en tandem (MS/MS ou MS2) est l'approche de référence pour l'identification des métabolites, qui demeure plus que jamais un enjeu majeur en raison de la diversité structurale des composés et de la taille limitée des bases de données.
En parallèle des développements instrumentaux récents permettant d'acquérir des spectres MS2 à haut-débit, de nouvelles approches in silico sont donc requises pour faciliter l'annotation et l'identification automatique de ces spectres. Une stratégie consiste à construire un réseau de similarités entre les spectres (e.g., par calcul d'un produit scalaire deux à deux) afin de propager les annotations des composés connus vers les inconnus. Pour aller plus loin dans l'interprétation structurale des similarités entre spectres, une approche de recherche de motifs communs entre les spectres a été proposée. Toutefois cette méthode est probabiliste et ne prend pas en compte l'ensemble des différences de masses entre les pics.
Des chercheurs du LI-MS (SPI/DMTS), en collaboration avec le CEA-List et le centre de recherche TOXALIM, au sein de l'infrastructure nationale de métabolomique MetaboHUB, proposent une stratégie algorithmique innovante d'élucidation structurale exacte qui extrait les motifs de fragmentation des différences m/z au sein de collections de spectres MS/MS. L'approche permet de repérer automatiquement des motifs de fragmentation communs à plusieurs composés, ce qui aide à deviner leurs similarités structurales même quand on ne connaît pas leur formule chimique. La méthode comprend deux étapes :
- chaque spectre est représenté sous forme d'un graphe dont les nœuds correspondent aux pics (fragments) et les arrêtes aux différences de masse entre ces fragments.
- un algorithme combinatoire extrait ensuite les sous-graphes fréquents, c'est-à-dire les motifs de fragmentation communs à plusieurs spectres.
La méthode a été testée aussi bien sur des spectres de composés purs que sur des acquisitions en matrices biologiques et dans tous les cas, les motifs de fragmentation capturent de nouvelles similarités structurales, complémentaires des méthodes existantes.
L'ensemble de la méthodologie est implémenté dans la librairie logicielle mineMS2 disponible publiquement (https://github.com/odisce/mineMS2).
Financement
Ces travaux sont soutenus par l'Infrastructure Nationale en Biologie Santé MétaboHub. Contact Institut des sciences du vivant Frédéric-Joliot :