ANALISI DEL TRASCRITTOMA E DEL PROTEOMA

Clustering e assemblaggio di sequenze di trascritti
Per eseguire il clustering di EST non si possono dare regole generali o dei programmi pronti da eseguire. Il problema sta nel fatto che ogni progetto di clustering è in qualche modo diverso dagli altri; nei casi più complessi il clustering può essere realizzato a partire da tutte le sequenze note di trascritti di un determinato organismo, mentre nei casi più semplici è limitato a piccoli progetti di EST di organismi precedentemente ignorati dal punto di vista molecolare.
Uno dei problemi generali più difficili da risolvere riguarda i criteri secondo cui due sequenze debbano essere poste in uno stesso cluster piuttosto che in due cluster diversi.

Algoritmi di clusterig

Gli algoritmi di clusterig possono essere divisi in

  1. Gerarchici - Non è necessaria nessuna informazione a priori sui dati e il risultato dell’algoritmo è una serie di cluster
  2. Non-Gerarchici - Cercano di raggruppare gli elementi in un numero predefinito k di gruppi, senza specificare alcuna relazione tra di essi

Metodi Gerarchici: Sono semplici e facili da interpretare. Esso è un metodo agglomerativo e, quindi, parte con un numero di cluster pari al numero totale di geni per raggrupparli successivamente in base al grado di similarità. Esso si articola nel seguente modo

Metodi non-gerarchici: cercano di raggruppare gli elementi in modo tale che siano il più possibile omogenei all’interno dei cluster e il più possibile disomogenei tra i vari cluster. Non viene prodotto alcun albero come risultato. I passi principali sono:

[ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46  ]