Consensus
La sequenza consensus riporta in ogni posizione la base più rappresentata in un multi-allineamento di sequenze che sicuramente codificano la funzione.
Il contenuto informativo di un consensus non è sufficiente a identificare in modo univoco tutte e sole le sequenze che possiedono la funzione ad esse associata.
Il metodo WordUP è una valida alternativa alla ricerca di un consensus.
Weight Matrices
Un segnale s costituito da L nucleotidi viene solitamente rappresentato da una matrice Ws costituita da 4 righe, corrispondenti ai quattro nucleotidi A, C, G, T e da L colonne.
Espressioni regolari
Le espressioni regolari sono formule che si possono usare per definire pattern testuali utilizzando le lettere dell’alfabeto e meta-caratteri <$+*[{( )?. ecc. ai quali è associata una determinata funzione.
La banca dati PROSITE annota i patterns utilizzando le espressioni regolari.
Il programma motif del pacchetto GCG confronta una sequenza proteica a funzione incognita con la banca dati PROSITE utilizzando un algoritmo che si basa sulle regole di codifica delle espressioni regolari.