Banche Dati di profili di espressione
La tecnologia
dei microarrays permette in un solo esperimento di quantificare i trascritti di un intero genoma (il trascrittoma) e quindi di confrontare la variabilità di espressione di ciascun gene in tessuti diversi, in individui diversi, in stati patologici diversi.
In pratica consente di associare il livello di espressione di un gene al corrispondente fenotipo.
Molte delle altre risorse dei profili di espressione sono invece prodotte in modo non
coordinato.
Si è dato quindi avvio a progetti coordinati per la raccolta di
questi dati, progetti che si stanno concretizzando nella realizzazione di tre banche dati:
GEO, ArrayExpress e KEGG/Expression
- GEO (Gene Expression Omnibus) è sviluppato all’NCBI come risorsa eterogenea per la sottomissione e il retrieval di dati correlati a esperimenti basati sulla tecnologia dei microarrays e preposti allo studio di espressione di geni e di ibridizzazione fra genomi. I dati sono classificati in 3 categorie: platform (dati su tutte le sonde molecolari identificative di ciascuno spot per l’allestimento di un microarray), samples (dati sulle molecole che devono essere analizzate) e series (tutti i dati relativi a un esperimento).
- ArrayExpress è l’equivalente europeo di GEO e raccoglie dati eterogenei su profili di espressione. E’ strutturato utilizzando il DMBS Oracle secondo una definizione a oggetti. Riporta tutti i dati su interi esperimenti e anche le immagini grezze del profilo come viene prodotto dall’esperimento. Il database può essere interrogato attraverso un sistema semplice di ricerca testuale ed è interfacciato al sistema Expression Profiler che consente di analizzare i profili di espressione e di effettuare confronti tra differenti esperimenti. Le informazioni annotate in ArrayExpress sono raggruppabili in tre grandi categorie: Experiment, Array e Protocol.
- KEGG/Expression è un database che raccoglie dati sui profili di espressione ottenuti con la tecnica dei microarrays in vari laboratori giapponesi.