Banche dati primarie e banche dati specializzate

Le banche dati possono essere di due tipi: primarie o specializzate.

Le banche dati primarie contengono informazioni e annotazioni molto generiche delle sequenze di acidi nucleici (DNA e RNA). Le principali banche dati primarie più importanti sono la EMBL datalibrary, la GenBank e la DDBJ.

Nel 1981 nasce nel Laboratorio Europeo di Biologia Molecolare ad Heidelberg (Germania) l’EMBL-datalibrary, 519 entries con sequenze di DNA e RNA, l'autore è Kurt Stueber.

La EMBL datalibrary è la banca dati europea costituita nel 1980 nel laboratorio Europeo di Biologia Molecolare di Heidelberg (Germania) e comprende numerose fonti, le seguenti:



La GenBank è la corrispondente banca americana costituita nel 1982 da Walter Goad

La DDBJ infine è la corrispondente giapponese della GenBank, nata nel 1986 dal National Institute of Genetics in Mishima (Giappone).

Fra le tre banche dati è stato stipulato un accordo internazionale per cui il contenuto dei dati di sequenza presenti nelle tre banche dati è quasi del tutto coincidente in quanto gli aggiornamenti quotidiani apportati in ciascuna banca dati vengono automaticamente trasmessi alle altre due.



Le banche dati specializzate si sono sviluppate successivamente e raccolgono insiemi di dati omogenei dal punto di vista tassonomico e/o funzionale disponibili nelle Banche dati Primarie e/o in Letteratura, o derivanti da vari approcci sperimentali, rivisti e annotati con informazioni di valore aggiunto.

Un elenco dettagliato e aggiornato di tutte le banche dati biologiche disponibili e operative si può ottenere consultando la compilazione di banche dati sviluppata da Baxevanis in concomitanza con la pubblicazione annuale del volume speciale pubblicato annualmente da Nucleic Acids Research.

Esistono anche banche dati a supporto di analisi sperimentali di routine. Ad esempio la REBASE è una banca dati che elenca tutti i nomi degli enzimi di restrizione isolati.