ProLuCID | Bif7002 Hiver2019

ProLuCID ou SEQUEST-like est un algorithme qui permet l’identification de peptides obtenus par MS par une recherche dans les bases de données protéiques(Xu, Park et al. 2015). ProLuCID, utilise trois niveaux de scoring dans son processus d’identification de peptides. Le but est d’identifier la meilleure correspondance au spectre peptidique et la qualité de ce match.

Le premier score est un score de probabilité binomial : il sert à distinguer les matchs aléatoires des peptides candidats. Ce score est utilisé pour déterminer un score final de corrélation-croisée. Ce dernier score est beaucoup plus sensible mais il nécessite des ressources computationnelles importantes. Comme SEQUEST, ProLuCID sélectionne par défaut 500 peptides candidats pour un scoring final.

Le deuxième score est généré par une mesure de corrélation croisée entre les peptides MS et le spectre théorique obtenu des bases de données. Cette corrélation est différente de celle calculée par SEQUEST qui se base sur les fragments d’ions de chaque séquence peptidique. ProLuCID modélise la distribution d’isotope de chaque fragment d’ions pour un spectre plus proche du spectre théorique pour la corrélation croisée. L’avantage d’utiliser une distribution d’isotope est de pouvoir modéliser même les données de faible résolution.

Le score Statistique Z : ProLuCID produit aussi un score pour chaque hit de peptide. Ce score reflète la qualité du match obtenu par l’algorithme. Un score Z élevé indique que le match spectre/peptide est plus susceptible d’être juste, ce qui augmente la spécificité.

L’utilisation de ces trois scores dans ProLuCID augmente la sensibilité et la spécificité de cet algorithme qui semble être beaucoup plus intéressant que celui de SEQUEST en identifiant 10% à 25% plus de protéines que ce dernier(figure 3).

.Figure 3: comparaison des hits de peptides obtenus par SEQUEST et ProLuCID (Xu, Park et al. 2015)

Suite