Sequest | Bif7002 Hiver2019

Ce programme est l’un des premiers programmes utilisés pour identifier des peptides à partir des données de MS. Développé pour la première fois en 1994 (Eng, McCormack et al. 1994), il n’a cessé d’évoluer depuis (Zhang, Li et al. 2007, Eng, Fischer et al. 2008, Klammer, Park et al. 2009, Tabb 2015, Yates 2015).

SEQUEST fait appel aux base de données protéiques GENPEPT et PIR pour extraire les séquences peptidiques et les matcher avec des peptides identifiés par MS. L’avantage de ce programme est qu’il permet d’identifier des peptides générés par des protéases avec une spécificité inconnue envers les acides aminées d’une protéine (Eng, McCormack et al. 1994). Le programme fonctionne en plusieurs étapes (figure 2).

mass-spectrometry-protein-identification

Figure 2 : L’algorithme derrière SEQUEST (Dumontier, 2010)

Étape 1 : la réduction

Cette première étape a pour but la réduction des données MS à analyser. Elle commence par une analyse pré-recherche. Il s’ensuit des analyses dont le but est d’éviter l’inflation des scores en se focalisant seulement sur l’ion précurseur du fragment peptidique à matcher. Par la suite, le nombre d’ions à considérer est réduit. Les 200 les plus abondants sont exclus et le nombre d’ions est normalisé à 100 ions. L’augmentation des nombres d’ions n’augmente pas forcement l’efficacité du programme.

Étape 2 : la recherche

Les séquences protéiques sont extraites et scannées pour essayer de trouver des combinaisons linéaires d’acides aminés qui pourraient matcher avec les spectres des peptides à étudier. Le processus s’effectue de N à C terminal dans le processus de matching des peptides. Les masses des peptides recherchés dans la base de données sont additionnés jusqu’à atteindre la masse du peptide qu’on veut matcher.

Étape 3 : le scoring

Une fois que la séquence d’acide aminés correspond à la masse du peptide à matcher, un score lui est attribué. Ce score est calculé en utilisant divers critères dont : le nombre et l'abondance des fragments d'ions prédits qui correspondent au ions observés dans le spectre, la continuité d'une série d'ions et le nombre total des séquences prédites.

Étape 4 : la corrélation croisée

Le but de cette étape est de faire une comparaison entre les 500 séquences obtenues de la recherche dans les bases de données et les séquences peptidiques obtenues par MS. Ceci pour rechercher les similarités entre les spectres de ces 500 séquences et ceux de la MS. Pour cela, un spectre est reconstruit à partir de la séquence des acides aminés recherchés. Ensuite ce spectre est comparé à celui obtenu par MS.

Une différence de 0,1 entre la corrélation croisée normalisée de la première et la deuxième recherche est en faveur d’un match réussi entre la séquence et le spectre.

Suite