top of page

PeptideProphet est un algorithme de post-traitement et de re-notation conçu pour évaluer la fiabilité des identifications de spectres MS / MS obtenues par une recherche dans une base de données.  Pour un algorithme de recherche donné, chaque spectre observé est comparé aux peptides de la base de données. Pour chaque spectre, le peptide dont le score est le plus élevé (en fonction du critère de score) est généralement choisi comme meilleur résultat. La meilleure correspondance est donc la séquence peptidique qui aurait potentiellement généré le spectre de masse obtenu. Ainsi, nous avons des spectres N qui ont été appariés à un peptide et nous nous référerons à ces spectres en tant que spectres identifiés.

 

Cependant, bruit de fond qui rend difficile la tâche de déterminer si le spectre correspond bien au peptide trouvé. De plus, lors de la recherche dans la base de données, la séquence peptidique correcte peut être absente. Aussi, l'inférence statistique est nécessaire pour modéliser la présence de bruit.

 

PeptideProphet est basé sur un modèle de probabilité et une approche empirique bayésienne de l'ajustement du modèle. Ce n'est plus un modèle unique, mais une famille de modèles. Ainsi, il s’ajuste automatiquement à chaque de jeu de données et génère des statistiques. Ce qui le rend facile à interpréter et surtout, permet de comparer des jeux de données différents.

PeptideProphet fonctionne en 4 étapes (Ma et al.,2012).

 

Étape 1 : Rescoring

Production d’un score reflétant la qualité d'un spectre identifié, tout en résumant plusieurs données utilisées par les algorithmes de recherche telles que XCorr et ΔCn  (SEQUEST)ou logDot et ΔDot (Tandem). La nouvelle notation sépare autant que possible les scores des spectres correctement et incorrectement identifiés.

 

Étape 2 : Modélisation

Production d’un modèle basé sur les probabilités pour la distribution des spectres correctement et incorrectement identifiés. Le modèle doit ensuite être ajusté aux scores de tous les spectres identifiés.

 

Étape 3 : Évaluation de la qualité de l'ajustement

Déterminer dans quelle mesure les scores correspondent au modèle fondé sur les probabilités.

 

Étape 4 : Inférence 

  • Évaluation de la confiance dans les spectres individuels identifiés en utilisant la probabilité postérieure,

  • Évaluation de la confiance dans des ensembles de spectres identifiés: produit une limite sur les scores pour déterminer un ensemble de spectres correctement identifiés tout en contrôlant le taux de fausses découvertes, défini comme la proportion attendue de faux positifs.

bottom of page