INTRODUZIONE

Numerosissime sono oggi le banche dati biologiche esistenti, ciò in relazione allo sviluppo delle biotecnologie molecolari che hanno portato alla produzione diversificata di enormi quantità di dati biologici. Attualmente, le banche dati delle sequenze nucleotidiche contengono 16 x 109 basi (che si abbrevia in 16 Gbp). Buona parte delle banche dati biologiche disponibili risulta essere ben strutturata e di notevole supporto alla moderna ricerca biomolecolare, per cui in questa sezione si intende offrire una panoramica completa di esse distinguendole per grandi categorie.
  Prima di passare alla descrizione delle varie categorie, risulta necessario definire alcuni elementi fondamentali che sono di supporto alla comprensione dei contenuti e della organizzazione delle banche dati. Una banca dati biologica raccoglie informazioni e dati derivati dalla letteratura e da analisi effettuate sia in laboratorio sia attraverso l'applicazione di analisi bioinformatiche. Ogni banca dati biologica è caratterizzata da un elemento biologico centrale che costituisce l'oggetto principale intorno al quale viene costruita la entry della banca dati. L'esempio seguente ci può aiutare a comprendere questo concetto: nelle banche dati di sequenze di acidi nucleici l'elemento centrale è la sequenza nucleotidica di DNA o RNA a cui vengono associate annotazioni classificanti l'elemento stesso quali il nome della specie, la funzione e le referenze bibliogafiche. Ciascuna entry raccoglie quindi le informazioni caratterizzanti l'elemento centrale. Ogni qual volta si organizza una banca dati si definiscono i tipi di attributi da annotare nella banca dati e anche il formato con cui tali informazioni vengono organizzate: si definisce cioè la struttura della banca dati.


[ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39  ]