Logo UMR CRIStAL

Les données de ZooMS résultent du séquençage d'une protéine cible, telle que le collagène abondamment présent dans les fragments osseux. On mesure la masse des peptides obtenus par digestion, ce qui donne une information indirecte sur la séquence d'acides aminés de la protéine présente. Pour exploiter ces masses, la communauté travaille ensuite avec des peptides marqueurs, qui servent en quelque sorte de codes barres moléculaires pour l'assignation taxonomique. Mais l'utilisation de ces peptides marqueurs souffre de deux limites: elle reste manuelle et elle néglige la dimension évolutive des données. Il y a donc un vrai besoin de formalisation et d'automatisation des méthodes, afin d'obtenir des assignations robustes, reproductibles et cela même à grande échelle. Cela pose de multiples questions: Comment utiliser les peptides marqueurs pour l'assignation taxonomique de spectres ? Comment inférer des peptiques marqueurs à différents niveaux taxonomiques ? Comment mesurer le signal phylogénétique contenu dans la protéine cible et ses peptides ? Comment reconstruire les séquences protéiques ancestrales à partir des spectres et des séquences contemporaines pour enrichir les jeux de données contemporains ? Les méthodes développées combineront des méthodes bioinformatiques issues de l'algorithmique des séquences et de cadres probabiliste utilisant des modèles d'évolution des séquences protéiques afin de reconstruire les arbres phylogénétiques et les séquences ancestrales. Les résultats attendus sont de deux natures: développer une boîte à outils pour l'analyse des données, et proposer un cadre méthodologique pour une utilisation éclairée des peptides marqueurs en ZooMS.

Plus d’informations :
[Site web CNRS]