Progetto genoma umano: caratteristiche e obiettivi silenziosi del progetto genoma umano

Leggi questo articolo per conoscere le funzioni silenziose, gli obiettivi, le applicazioni e le sfide future del progetto del genoma umano!

Ogni individuo ha un'identità dovuta al proprio corredo genetico. Non esistono due individui simili (eccetto i gemelli mono-zigote) perché differiscono nella loro composizione genetica.

Per gentile concessione dell'immagine: img.mit.edu/newsoffice/images/article_images/original/20130103132743-0.jpg

Le differenze nella composizione genetica sono dovute alle differenze nelle sequenze nucleotidiche dei loro DNA. Era, quindi, sempre un'ambizione di scienziati per mappare il genoma umano. I progressi delle tecniche di ingegneria genetica hanno permesso di isolare e clonare pezzi di DNA e determinare sequenze nucleotidiche di questi frammenti.

Pertanto, nel 1990, il Dipartimento dell'Energia degli Stati Uniti e l'Istituto Nazionale della Sanità intrapresero e coordinarono il progetto di sequenziamento del genoma umano chiamato HGP o Progetto Genoma Umano. Welcome Trust (UK) ha aderito al progetto come partner principale. Successivamente anche il Giappone, la Francia, la Germania, la Cina e alcuni altri paesi vi aderirono.

L'HGP è un mega progetto che comporta un sacco di soldi, tecniche più avanzate, numerosi computer e scienziati al lavoro. L'entità del progetto può essere immaginata che se il costo del sequenziamento di un bp è di 3 dollari, il sequenziamento di 10х 10 9 bp costerebbe un miliardo di dollari. Se i dati devono essere archiviati nei libri, con ogni libro con 1000 pagine e ogni pagina con 1000 lettere, saranno necessari circa 3300 libri. Qui il data base di bioinformatica e altri dispositivi computazionali ad alta velocità hanno contribuito all'analisi, alla memorizzazione e al reperimento di informazioni.

obiettivi:

HGP ha stabilito i seguenti obiettivi.

1. Determina la sequenza e il numero di tutte le coppie di basi nel genoma umano.

2. Identificare tutti i geni presenti nel genoma umano.

3. Determina le funzioni di tutti i geni.

4. Identificare i vari geni che causano disturbi genetici.

5. Determinare la predisposizione genetica e l'immunità a vari disturbi.

6. Conservare le informazioni in basi di dati.

7. Migliora gli strumenti per l'analisi dei dati.

8. Scopri le possibilità di trasferimento della tecnologia sviluppata durante HGP per l'industria.

9. Il progetto può comportare molte questioni etiche, legali e sociali (ELSI) che devono essere affrontate e risolte.

Il progetto doveva essere completato per il sequenziamento nel 2003. Il 12 febbraio 2001 è stato fatto un annuncio formale sul completamento del progetto. Tuttavia, l'annuncio del sequenziamento dei singoli cromosomi avvenne nel maggio 2006 con il completamento dell'assegnazione delle sequenze nucleotidiche ai cromosomi I.

Metodologia:

Esistono due tipi di approcci per analizzare il genoma,

(i) Identificare tutti i geni che sono espressi come RNA - etichette di sequenza espresse o EST

(ii) Sequenziare l'intero genoma (entrambe le regioni codificanti e non codificanti) e successivamente assegnare le diverse regioni con le annotazioni delle funzioni.

HGP ha seguito la seconda metodologia che prevede i seguenti passaggi.

(i) L'intero DNA della cellula è isolato e spezzato a caso in frammenti,

(ii) Sono inseriti in vettori specializzati come ВАС (cromosomi artificiali batterici) e YAC (cromosoma artificiale di lievito),

(iii) I frammenti sono clonati in ospiti idonei come batteri e lieviti. La PCR (polymerase chain reaction) può anche essere usata per clonare o fare copie di frammenti di DNA,

(iv) I frammenti sono sequenziati come sequenze di DNA annotate (una propaggine di metodologia sviluppata dal doppio premio Nobel, Frederick Sanger),

(v) Le sequenze sono state quindi disposte sulla base di alcune regioni sovrapposte. Richiedeva la generazione di frammenti sovrapposti per il sequenziamento,

(vi) I programmi basati su computer sono stati usati per allineare le sequenze.

(vii) Le sequenze sono state quindi annotate e assegnate a diversi cromosomi. Tutti i cromosomi umani sono stati sequenziati, 22 autosomi, X e Y. Il cromosoma I è stato l'ultimo ad essere sequenziato nel maggio 2006. (viii) Con l'aiuto del polimorfismo nei siti di riconoscimento di microsatelliti e di restrizione dell'endonucleasi, le mappe genetiche e fisiche del il genoma è stato anche preparato.

Caratteristiche salienti del genoma umano:

1. Il genoma umano ha 3.167 miliardi di coppie di basi nucleotidiche.

2. La dimensione media del gene è di 3000 paia di basi. Il gene più grande è quello della distrofia muscolare di Duchenne sul cromosoma X. Ha 2, 4 milioni (2400 chilogrammi) di paia di basi. I geni B-globina e insulina sono meno di 10 kilobasi.

3. Il genoma umano consiste di circa 30.000 geni. In precedenza era stimato contenere da 80.000 a 100.000 geni. Il numero dei geni umani è all'incirca uguale a quello del topo. Nove decimi di geni sono identici a quelli del mouse. Abbiamo più del doppio dei geni fruttati (Drosophila melanogaster) e sei volte più geni che nel batterio Escherichia coli.

La dimensione del genoma o del numero di geni non è correlata alla complessità dell'organizzazione del corpo, ad esempio, Lily ha 18 volte più DNA del genoma umano, tuttavia produce meno proteine ​​di noi perché il suo DNA ha più introni e meno esoni.

4. Il cromosoma I ha 2968 geni mentre il cromosoma Y ha 231 geni. Sono i geni massimi e minimi per i cromosomi umani.

5. La funzione di oltre il 50% dei geni scoperti è sconosciuta.

6. Meno del 2% del genoma rappresenta i geni strutturali che codificano per le proteine.

7. Il 99, 9% delle basi nucleotidiche sono esattamente simili in tutti gli esseri umani.

8. Solo lo 0, 1% del genoma umano con circa 3, 2 milioni di nucleotidi rappresenta la variabilità osservata negli esseri umani.

9. A circa 1, 4 milioni di posizioni si verificano differenze di singolo nucleotide chiamate SNP (cernita) o polimorfismo a singolo nucleotide. Hanno il potenziale per aiutare a trovare posizioni cromosomiche per sequenze associate alla malattia e per tracciare la storia umana.

10. Sequenze ripetute o ripetitive costituiscono una grande porzione del genoma umano. Ci sono circa 30.000 loci minisatelliti, ciascuno con 11 -60 bp ripetuti in tandem fino a mille volte. Questi sono circa 2.000.000 microsatelliti, ciascuno con un massimo di 10 bp ripetuto 10-100 volte.

11. Le sequenze ripetitive sono sequenze nucleotidiche che vengono ripetute molte volte, a volte centinaia o migliaia di volte. Non hanno una funzione di codifica diretta ma forniscono informazioni sulla struttura cromosomica, la dinamica e l'evoluzione.

12. Circa 1 milione di copie di sequenze ripetute di brevi 5-8 paia di basi sono raggruppate attorno ai centromeri e vicino alle estremità dei cromosomi. Rappresentano il DNA spazzatura.

Applicazioni e sfide future:

1. Disturbi:

Più di 1200 geni sono responsabili di comuni malattie cardiovascolari umane, malattie endocrine (come il diabete), disturbi neurologici (come il morbo di Alzheimer), tumori e molti altri.

2. Cancro:

Sono in corso degli sforzi per determinare i geni che cambieranno le cellule cancerose alla normalità.

3. Assistenza sanitaria:

Indichera 'le prospettive per una vita piu' sana, farmaci di marca, diete geneticamente modificate e infine la nostra identità genetica.

4. Interazioni:

Sarà possibile studiare come vari geni e proteine ​​lavorano insieme in una rete interconnessa.

5. Studio dei tessuti.

Tutti i geni o trascritti di un particolare tessuto, organo o tumore possono essere analizzati per conoscere la causa dell'effetto prodotto in esso.

6. Organismi non umani:

Le informazioni sulle capacità naturali degli organismi non umani possono essere utilizzate per affrontare le sfide relative all'assistenza sanitaria, all'agricoltura, alla produzione di energia e al risanamento ambientale. Per questo sono stati sequenziati numerosi organismi modello, ad es. Batteri, lievito Coenorhabditis elegans (nematode non patogeno vivente libero), Drosofila (fruttuosamente), Riso, Arabidopsis ecc.