LE MATRICI PAM

Le matrici di sostituzione PAM furono proposte nel 1978 da Margaret Dayhoff e dai suoi collaboratori, sulla base di uno studio di filogenesi molecolare compiuto su 71 famiglie di proteine. L'assunzione di partenza è che analizzando sequenze correlate filogeneticamente, si possa calcolare la probabilità con cui ogni aminoacido subisce un evento di sostituzione, ovvero una percent accepted mutation (percentuale di mutazioni accettate), da cui l'acronimo PAM. Due sequenze che differiscono di 1 PAM hanno il 99% di residui identici. Per coppie di sequenze che abbiano un livello di divergenza minore di 1 PAM, è probabile che non ci sia più di un cambiamento a livello di ogni posizione. Raccogliendo i dati statistici per coppie di sequenze con una correlazione così elevata, e introducendo delle correzioni per la diversa abbondanza degli aminoacidi, si produce la matrice di sostituzione di 1 PAM. Allo scopo di creare una matrice appropriata per specie più ampiamente divergenti, possiamo avvalerci di questa matrice. Il livello PAM 250, che corrisponde circa a un 20% di identità complessiva di sequenza, è il grado più basso di similarità di sequenza per il quale possiamo sperare di ottenere un allineamento corretto in base alla sola analisi di sequenza.
  Le matrici PAM generalmente utilizzate sono comprese tra la PAM 10 e la PAM 240. Si pone quindi il problema di capire quale matrice sia più opportuno usare. Come regola generale, se si vogliono confrontare sequenze filogeneticamente vicine, in cui si può ipotizzare un numero molto limitato di sostituzioni, sarà opportuno usare una matrice PAM a basso indice, per esempio la PAM 10. Viceversa, se due sequenze sono filogeneticamente distanti sarà più opportuno usare matrici PAM con indici alti, come la PAM 240.

CALCOLO DI UNA MATRICE PAM

s(a,b) = int(10xlog(M(a,b)/C(a,b)))

dove s(a,b) è il punteggio (score) da attribuire all'appaiamento tra i due aminoacidi a e b;

int sta per intero del valore ottenuto moltiplicando per 10 il logaritmo decimale del rapporto fra M(a,b) e C(a,b);

M(a,b) è la probabilità di sostituzione espressa nella matrice PAM;

C(a,b) è la probabilità di appaiamento casuale dei due aminoacidi.


[ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39  ]