Cosa sono le Banche Dati
In informatica, il termine database, tradotto in italiano
con banca dati, base di dati o anche base dati, indica un
insieme di dati riguardanti uno stesso argomento, o più argomenti correlati tra
loro, strutturata in modo tale da consentire l'uso dei dati stessi (e il loro
aggiornamento) da parte di applicazioni software.
La base di dati, oltre ai dati veri e propri, deve contenere anche le informazioni sulle loro rappresentazioni e sulle relazioni che li legano.
In un sistema informatico, una base di dati può essere manipolata direttamente dai programmi applicativi, interfacciandosi con il sistema operativo. Tale strategia era quella adottata universalmente fino agli anni sessanta, ed è tuttora impiegata quando i dati hanno una struttura molto semplice, o quando sono elaborati da un solo programma applicativo.
Tuttavia, a partire dalla fine degli anni sessanta, per gestire basi di dati complesse condivise da più applicazioni, si sono utilizzati appositi sistemi software, detti sistemi per la gestione di basi di dati (in inglese "Database Management System" o "DBMS").
Una delle attività principali dei bioinformatici consiste nella progettazione, costruzione e
uso di banche dati di interesse biologico.
Gli avanzamenti della biologia molecolare e dell'ingegneria genetica degli ultimi anni sono stati accompagnati da tecnologie strumentali sempre più sofisticate. Tutto questo sta portando ad una enorme produzione di dati, inimmaginabile fino a poco tempo fa.
Questa figura è stata tratta da un lavoro di Mark Boguski (www.sciencemag.org); si può osservare che stiamo vivendo un momento molto particolare in cui la quantità di dati prodotti (sequenze di DNA nell'esempio) aumenta in modo molto più veloce rispetto al numero di pubblicazioni scientifiche.
Il grafico si riferisce ai dati di sequenze di DNA che a loro volta corrispondono a geni e a proteine. Oltre ai dati di sequenze si stanno producendo molti altri dati in modo sistematico, ad esempio sull'espressione genica mediante la tecnica dei chip di DNA
(microarray), oppure di espressione e interazione proteica con le tecniche della proteomica.
Non avrebbe senso aumentare il numero di pubblicazioni scientifiche perchè non si può pensare che si possano leggere milioni di articoli diversi. E' quindi necessario disporre di nuovi sistemi di immagazzinamento e accesso all'informazione. Questa esigenza trova una risposta nelle banche dati che nel settore biologico si stanno diffondendo moltissimo e sono diventate uno strumento indispensabile per la ricerca e per la diffusione dei risultati.
Una banca dati biologica raccoglie informazioni e dati che possono essere derivati dalla letteratura o da analisi effettuate in laboratorio (analisi in vitro o in vivo) oppure attraverso applicazioni di analisi bioinformatiche, dette analisi in silico (si dice "in silico", in quanto i processori dei calcolatori sono costituiti da silicio) e dalla letteratura scientifica.
Le banche dati sono progettate come contenitori costruiti per immagazzinare dati in
modo efficiente e razionale al fine di renderli facilmente accessibili a tutti gli utenti: ricercatori, medici, studenti, etc.