BANCHE DATI DI MOTIVI E DOMINI PROTEICI

Una banca dati è un utilissimo strumento di consultazione sia per effettuare ricerche testuali ed estrarre quindi informazioni specifiche relativamente a un dato argomento sia come strumento di comparazione per individuare, in nuove sequenze, caratteristiche strutturali e funzionali già riscontrate in altre sequenze ed annotate in specifiche banche dati. Tra i due il più interessante, dal punto di vista bioinformatico, è la comparazione, che può essere effettuata attraverso l'applicazione di tecniche di ricerca di similarità (Paragr. 4.10) o, quando la ricerca di similarità non evidenzia sequenze simili a quelle in oggetto, attraverso l'applicazione di tecniche di ricerca di segnali (pattern recognition) basate su algoritmi più o meno complessi (Cap. 5); questo secondo approccio consente di ritrovare segnali, motivi o domìni strutturali e funzionali che si conservano nel tempo.
Numerose banche dati specializzate che annotano informazioni relative a motivi e domini funzionali sono state integrate in InterPRO, una risorsa bioinformatica, sviluppata all'EBI (centro di raccolta), che consente di ricercare contemporaneamente informazioni funzionali e strutturali relative a una proteina o a una famiglia di proteine su più banche dati, distribuite su calcolatori diversi e strutturate in modo differente. La ricerca dei dati in InterPRO viene effettuata attraverso un sistema di ricerca semplice basato su componenti del DBMS Oracle o attraverso il sito SRS dell'EBI. Inoltre attraverso il software InterPROscan è possibile ricercare motivi strutturali e funzionali annotati nelle banche dati integrate in InterPRO al fine di caratterizzare dal punto di vista funzionale nuove proteine derivate da progetti di sequenziamento genomico. Una delle banche dati integrate in InterPRO è PROSITE che annota patterns amminoacidici individuati in set di sequenze proteiche determinati sperimentalmente in una o più proteine e riportati in letteratura. La banca dati PROSITE contiene motivi codificati in due modi diversi: i pattern e le matrici. I pattern sono motivi definiti con una sintassi riconducibile a espressioni regolari mentre le matrici sono invece definite facendo ricorso alle matrici posizionali di peso, compresi gli Hidden Markov Models (paragr. 5.4).


[ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39  ]