GLI ALGORITMI PER IL DATABASE SIMILARITY SEARCHING

Ambedue i metodi (FASTA e BLAST) effettuano ricerche di similaritÓ mediante applicazioni di metodi per allineamenti locali e, dal confronto di una sequenza anonima con set di sequenze a funzione nota, selezionano le sequenze con punteggi di similaritÓ (scores) superiore ad una certa soglia (threshold), valutata su basi statistiche e dinamicamente in correlazione con il dataset sotto studio.

Ambedue i metodi ottengono una elevata velocitÓ di esecuzione grazie alla trasformazione delle sequenze in vettori. Scelta la dimensione w della stringa su cui operare per la ricerca delle similaritÓ, le sequenze da confrontare sono trasformate in vettori di dimensione Dw, in ogni cella dei quali sono riportate le posizioni in cui la i-esima "stringa" di dimensione w ricorre nella sequenza.

[ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46  ]