Ragioni e metodologie per il sequenziamento del genoma

Il sequenziamento dei genomi è sofisticato, complesso e richiede una tecnologia specializzata. Un segmento di 500-800 bp può essere sequenziato. Tuttavia i genomi sono molto grandi, ad es. E. coli con 4, 2 x 10 6 bp e 3, 2 x 10 9 bp per gli esseri umani.

Quindi per il sequenziamento sono necessari piccoli segmenti. Tali segmenti sono prodotti rompendo a caso il DNA genomico in piccoli frammenti. Tali frammenti di solito si sovrappongono ad altri frammenti alle loro estremità. I frammenti sono clonati in un vettore per generare una libreria genomica dell'organismo.

Ragioni per il sequenziamento completo di un genoma:

(i) Fornisce informazioni per la base per la scoperta di geni e fornisce l'inventario dei geni.

(ii) Rappresenta le possibili relazioni tra i geni.

(iii) Il sequenziamento dei genomi fornisce una serie di strumenti per ulteriori sperimentazioni.

(iv) L'informazione genetica di un organismo è resa disponibile dalla sequenza genica.

(v) Il sequenziamento genetico completo di un organismo fornisce tutte le informazioni genetiche necessarie per formare un organismo.

Metodologie utilizzate per il sequenziamento del genoma:

(i) Sequencing diretto di contigs Bacterial Artificial Chromosome (BAC):

I cromosomi artificiali batterici sono semplicemente plasmidi progettati per la clonazione di segmenti molto lunghi (cioè da 100.000 a 300.000 bp) di DNA. Questi vettori sono usati per creare librerie genomiche in cui la dimensione dell'inserto è 80-100 kb. Frammenti di DNA di migliaia di coppie di basi sono clonati nel vettore BAC.

La biblioteca genomica è schermata individuando i cloni di restrizione comuni chiamati contigs. I membri di contig contengono alcune regioni sovrapposte per consentire la determinazione precisa della loro posizione in contig.

Lo scopo ultimo dei metodi di mappatura fisica è di ricevere un contig completo per ciascun cromosoma del genoma. I contig mappati sono sequenziati rompendo grandi frammenti di DNA in piccoli segmenti. Ogni clone del contig viene sequenziato. La sequenza nucleotidica è identificata da sola in base al clone fino al sequenziamento del genoma completo.

(ii) Sequenza a sequenza casuale o approccio Bottom-up:

È possibile clonare in un organismo qualsiasi gene desiderato da un altro organismo mediante sparatoria. Per questo intero genoma del primo organismo viene digerito con endonucleasi di restrizione per produrre una miscela casuale di frammenti.

Le librerie casuali (shotgim) del DNA genomico sono costruite in piccoli vettori plasmidici di dimensioni pari a 2, 0 kb e medie cioè 10 kb insieme a una libreria BAC di inserti di grandi dimensioni shotgun genomico (80-100 kb). I frammenti vengono inseriti nel vettore plasmidico e i plasmidi ricombinanti trasformati nella cellula ospite desiderata.

Nel sequenziamento con pallini da fuoco i cloni scelti a caso vengono sequenziati fino a quando i cloni nella libreria genomica vengono analizzati. In altre parole, possiamo dire che in caso di sequenziamento casuale i cromosomi delle pistole sono suddivisi in sezioni e quindi la sezione del DNA genomico viene suddivisa in milioni di piccoli segmenti e tutti i segmenti sono sequenziati in modo imparziale.

Aree di DNA sovrapposto sono abbinate che formano segmenti sempre più grandi di DNA genomico. Il sequenziamento del DNA viene eseguito a entrambe le estremità degli inserti di cloni scelti a caso da entrambe le librerie di plasmidi a inserto piccolo e medio per fornire almeno tre volte una copertura del genoma.

Piccoli frammenti di DNA vengono inseriti in diverse molecole di plasmidi in modo casuale. In caso di inserimenti sovrapposti, provengono tutti dalla stessa posizione genomica ma da regioni diverse spostate a sinistra oa destra l'una rispetto all'altra.

I frammenti sovrapposti sono allineati in coting o in una sequenza per la regione interessata (metodo della pistola di lancio). I genomi procariotici hanno un piccolo rispettivo DNA e il sequenziamento delle armi da fuoco fornisce buoni risultati. Gli eucarioti portano molte sequenze ripetute.

Tutto ciò porta alla confusione. Tuttavia, la sovrapposizione di frammenti viene sfruttata in fase di assemblaggio mediante esercizio computazionale. Il programma per computer identifica le sequenze sovrapposte e le unisce in un unico tratto continuo. Questo processo è stato applicato con successo per il sequenziamento di tutte le sequenze del genoma microbico pubblicate da Celera Genomics.