CODIFICA DEI MOTIVI

Consensus
La sequenza consensus riporta in ogni posizione la base più rappresentata in un multi-allineamento di sequenze che sicuramente codificano la funzione.

Il contenuto informativo di un consensus non è sufficiente a identificare in modo univoco tutte e sole le sequenze che possiedono la funzione ad esse associata.
Il metodo WordUP è una valida alternativa alla ricerca di un consensus.

Weight Matrices
Un segnale s costituito da L nucleotidi viene solitamente rappresentato da una matrice Ws costituita da 4 righe, corrispondenti ai quattro nucleotidi A, C, G, T e da L colonne.

Espressioni regolari
Le espressioni regolari sono formule che si possono usare per definire pattern testuali utilizzando le lettere dell’alfabeto e meta-caratteri <$+*[{( )?. ecc. ai quali è associata una determinata funzione.

La banca dati PROSITE annota i patterns utilizzando le espressioni regolari.

Il programma motif del pacchetto GCG confronta una sequenza proteica a funzione incognita con la banca dati PROSITE utilizzando un algoritmo che si basa sulle regole di codifica delle espressioni regolari.

[ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46  ]