
Il genoma umano è il genoma dell'Homo sapiens, che è composto da 46 distinti cromosomi (22 paia di autosomi + X + Y) con un totale di approssimativamente 3,2 miliardi di paia di basi di DNA contenenti all'incirca 20 000–25 000 geni.Il Progetto Genoma Umano ha prodotto una sequenza di riferimento eucromatica del genoma umano, che è utilizzata a livello globale nelle scienze biomediche. Il Genoma Umano presenta più geni interspersi di quanto fosse stato inizialmente predetto all'inizio del Progetto Genoma Umano, con circa l'1.5% della sua totale lunghezza che si basa su esoni codificanti proteine.
Cromosomi

Geni
È stata ipotizzata l'esistenza di 20.000–25.000 geni codificanti proteine. Il numero stimato di geni umani è stato ripetutamente abbassato dalle iniziali predizioni di 100 000 o più man mano che la qualità del sequenziamento genomico e dei metodi di predizione dei geni sono migliorati, e potrebbe scendere ulteriormente. Secondo una stima di Craig Venter (nel 2007) i geni sarebbero 23.224, mentre secondo Jim Kent (2007) sarebbero 20.433 codificanti e 5.871 non codificanti.
Sorprendentemente, il numero di geni umani sembra essere solo poco più del doppio rispetto a quello di organismi molto più semplici, come Caenorhabditis elegans e Drosophila melanogaster. In ogni caso, le cellule umane utilizzano massicciamente lo splicing alternativo per produrre un gran numero di proteine differenti da un singolo gene, e si pensa che il proteoma umano sia molto più grande di quello degli organismi summenzionati.
La maggior parte dei geni umani ha esoni multipli e degli introni, che sono frequentemente molto più lunghi degli esoni fiancheggianti.
I geni umani sono distribuiti in maniera non uniforme lungo i cromosomi. Ogni cromosoma contiene varie regioni ricche di geni e poveri di geni, che sembrano correlate con le bande cromosomiche e il contenuto in GC. Il significato di questa alternanza non casuale di densità genica non è ben compresa allo stato attuale della conoscenza scientifica.
In aggiunta ai geni codificanti proteine, il genoma umano contiene diverse migliaia di geni codificanti un RNA incluso il tRNA, l'RNA ribosomico, microRNA, e altri geni a RNA non codificanti.
Il genoma umano ha molte differenti sequenze regolatrici che sono cruciali nel controllare l'espressione del gene. Queste sono di solito brevi sequenze che appaiono in prossimità e all'interno dei geni. Una conoscenza sistematica di queste sequenze regolatrici e come agiscono assieme in una rete regolatrice genica sta cominciando solo ora a emergere dall'alta capacità di trattare informazioni attraverso gli studi di genomica comparata.
L'identificazione delle sequenze regolatrici si basa in parte sulla conservazione evoluzionistica. L'evento di divergenza evolutiva tra gli uomini e i topi, per esempio, ha avuto luogo 70–90 milioni di anni fa.In questa maniera paragoni computerizzati di sequenze di geni che identificano sequenze non codificanti conservate daranno indicazione della loro importanza in compiti come la regolazione dei geni.
Un altro approccio della genomica comparata per localizzare le sequenze regolatrici negli uomini consiste nel sequenziamento dei geni del pesce palla. Questi vertebrati hanno essenzialmente gli stessi geni e le stesse sequenze geniche regolatorie dell’uomo, ma con solo un ottavo di DNA “spazzatura”. La sequenza compatta del DNA del pesce palla rende molto più facile la localizzazione dei geni regolatori.
Altro DNA
Le sequenze codificanti proteine (specificamente, codificanti esoni) comprendono meno dell’1,5% del genoma umano. A parte i geni e le sequenze regolatrici conosciute, il genoma umano contiene ampie regioni di DNA la cui funzione, se esiste, rimane ignota. Queste regioni comprendono di fatto la maggior parte, da alcuni stimata intorno al 97%, del genoma umano. Molta di essa comprende:
Elementi ripetuti
Trasposoni
- Retrotrasposoni
- Trasposoni a DNA
Pseudogeni
Ciononostante, vi è ancora una grande quantità di sequenze che non cade all’interno di alcune categoria nota.
Molte di queste sequenze potrebbero essere un artefatto evolutivo che non presenta alcun fine oggi, e queste regioni sono a volte indicate nel loro complesso come DNA spazzatura o junk DNA. Esiste, tuttavia, una varietà di prove emergenti che indicano come alcune sequenze all’interno di queste regioni possano funzionare in modi non ancora compresi. Recenti esperimenti con microarray hanno rivelato che una frazione sostanziale di DNA non-genico è di fatto trascritto in RNA, che conduce all’ipotesi che i trascritti risultanti possano avere delle funzioni sconosciute. Inoltre, la conservazione evolutiva lungo i genomi dei Mammiferi di un numero di sequenze così alto da superare la porzione codificante proteine indica che molti, e forse la maggior parte, degli elementi funzionali del genoma rimangano ignoti. Attualmente, nonostante queste eccitanti prospettive, gran parte del genoma umano non viene trascritto e non mostra avere una sequenza altamente conservata. La ricerca sull’informazione portata dalle vaste sequenze del genoma umano le cui funzioni rimangono sconosciute è tuttora una delle strade più importanti dell’indagine scientifica.
Molti degli studi sulla variabilità genetica umana si sono focalizzati sugli SNPs, single nucleotide polymorphisms, che sono sostituzioni di una singola base lungo un cromosoma. Diverse analisi stimano che uno SNP sia presente in media ogni 100 o ogni 1000 paia di basi nell’eucromatina del genoma umano, sebbene essi non si presentino con una densità uniforme. Di conseguenza è rispettato il detto comune che afferma che “tutti gli uomini sono geneticamente identici almeno al 99%”, anche se questo dovrebbe essere definito da molti genetisti. Una sfida collaborativa su larga scala per catalogare gli SNPs del genoma umano è stata intrapresa dall’ International HapMap Project.
I loci genomici e la lunghezza di alcuni tipi di piccole sequenze ripetute sono altamente variabili da persona a persona, e questa caratteristica è alla base del DNA fingerprinting e delle tecnologie per i test di paternità basati sull’analisi del DNA. La porzione eterocromatica del genoma umano, che consta in totale di parecchie centinaia di milioni di paia di basi, è ritenuta essere abbastanza variabile all’interno della popolazione umana (è così ripetitiva e così lunga che non può essere sequenziata accuratamente con le attuali tecnologie). Questa regione non contiene geni e sembra improbabile che risulti qualche effetto fenotipico significativo dalle variazioni tipiche nelle ripetizioni o nell’eterocromatina.
Molte mutazioni genomiche grossolane nelle cellule germinali danno probabilmente embrioni non vitali; tuttavia, un certo numero di patologie umane è correlato ad anomalie genomiche su larga scala. La sindrome di Down, la sindrome di Turner e un numero di altre malattie sono il risultato della non-disgiunzione di interi cromosomi. Le cellule cancerose mostrano frequentemente aneuploidia dei cromosomi e dei bracci cromosomici, sebbene non sia ancora stata stabilita una relazione di causa ed effetto tra l’aneuploidia e il tumore.
In un articolo pubblicato nel 2006 su Nature, alcuni ricercatori avevano scoperto che la variazione del numero di copie (CNV) delle sequenze di DNA nell’uomo e in altri animali può essere considerevole. Delezioni, inserzioni, duplicazioni e varianti di più siti, indicate complessivamente come variazioni del numero di copie (CNVs) o polimorfismi del numero di copie (CNPs), sono state individuate in tutti gli uomini e animali esaminati.
Malattie genetiche
Queste condizioni sono causate dall’espressione anomala di uno o più geni che si associano a un fenotipo clinico. La malattia potrebbe essere causata da una mutazione genica, da un numero anomalo di cromosomi, da mutazioni nella ripetizione ed espansione di triplette. Il numero attuale di malattie genetiche riconosciute è all’incirca 4 000, di cui la più comune è la fibrosi cistica.
Gli studi sulle malattie genetiche sono spesso svolti utilizzando la genetica di popolazione. Il trattamento viene effettuato da un medico-genetista specializzato in genetica clinica. I risultati del Progetto Genoma Umano probabilmente aumenteranno la disponibilità di test genetici per le relative malattie genetiche e alla fine potrebbero anche portare a miglioramenti nei protocolli di cura. I genitori possono essere sottoposti a esami per vagliare le loro condizioni ereditarie e per essere informati delle loro conseguenze, sulla probabilità che una certa malattia venga ereditata e su come evitarla o alleviarla nei loro figli.
Uno degli effetti maggiormente evidenti a livello di fenotipo umano deriva dal dosaggio genico, i cui effetti giocano un ruolo nelle malattie causate da duplicazioni, perdita o rottura dei cromosomi. Per esempio, un alto tasso di individui affetti dalla sindrome di Down, o trisomia 21 sono soggetti al morbo di Alzheimer, un effetto che si pensa sia dovuto alla sovraespressione della proteina precursore dell’amiloide, una sostanza correlata all’Alzheimer il cui gene mappa sul cromosoma 21. Viceversa, i pazienti affetti da sindrome di Down sono meno soggetti al tumore al seno: questo può essere probabilmente dovuto alla sovraespressione di un gene oncosoppressore.
Studi di genomica comparata sui genomi dei mammiferi suggeriscono che all’incirca il 5% del genoma umano si è conservato durante l’evoluzione a partire dalla divergenza avvenuta tra queste specie approssimativamente 200 milioni di anni fa. Questa porzione conservata contiene un’ampia maggioranza di geni e sequenze regolatrici. Intrigantemente, dal momento che geni e sequenze regolatrici rappresentano probabilmente meno del 2% del genoma, questo suggerisce che possano esserci più sequenze funzionali sconosciute che conosciute. Una frazione più piccola, ma comunque ampia, di geni umani sembra essere condivisa tra la maggior parte dei vertebrati analizzati.
Il genoma dello scimpanzé è per il 98.77% identico a quello umano. In media, un gene codificante una proteina in un uomo differisce dal suo ortologo nello scimpanzé per solo due sostituzioni aminoacidiche; quasi un terzo dei geni umani ha esattamente la stessa traduzione proteica dei loro ortologhi nello scimpanzé. Una grande differenza tra i due genomi è rappresentata dal cromosoma 2 umano, che è il prodotto della fusione dei cromosomi 12 e 13 dello scimpanzé.
La specie umana ha subito una massiccia perdita di recettori olfattivi durante la sua recente evoluzione e ciò può spiegare perché il nostro senso dell’olfatto sia approssimativo rispetto a quello della maggioranza dei mammiferi. Prove evolutive suggeriscono che lo sviluppo della visione dei colori nell’uomo e in diversi altri primati possa aver ridotto il bisogno del senso dell’olfatto.
Il genoma mitocondriale umano, che generalmente non viene incluso quando si cita il genoma umano, è di grande interesse per i genetisti, dal momento che esso gioca indubbiamente un ruolo importante nelle malattie genetiche mitocondriali. Inoltre, esso è in grado di chiarificare alcuni punti “oscuri” dell’evoluzione umana; per esempio, l’analisi della variabilità del genoma mitocondriale umano ha portato a ipotizzare un recente comune antenato per tutti gli uomini lungo la linea di discendenza materna. (vedi Eva mitocondriale)
A causa della mancanza di un sistema di controllo degli errori di copiatura, il DNA mitocondriale (mtDNA) mostra un tasso maggiore di variazione rispetto al DNA nucleare. Questo aumento di 20 volte (circa) nel tasso di mutazione consente l’utilizzo del mtDNA come strumento per risalire con miglior accuratezza all’antenato materno. Studi del mtDNA nelle popolazioni hanno permesso di tracciare gli antichi flussi migratori, come la migrazione degli Indiani d’America dalla Siberia o dei Polinesiani dall’Asia sud-orientale. È stato inoltre utilizzato per dimostrare che c’è traccia del DNA dell’uomo di Neanderthal nel genoma dell’uomo europeo che condivide l'1-4% del genoma
La brevettabilità del genoma umano pone un problema di bioetica, tanto per il diritto universale alla salute e i costi sanitari delle promettenti terapie geniche legate a questione di copyright, quanto per il divieto delle pratiche eugenetiche.
Tutto ciò che non è prodotto dell'invenzione umana ed è esistente in natura, come il genoma umano o le vitamine. Oltre a essere una giurisprudenza consolidata per le sostanze naturali e per i principi nutritivi, esistono dei precedenti anche in merito al genoma umano.
La prima sentenza di questo tipo è il pronunciamento del Dipartimento di Giustizia di Manhattan (marzo 2010) nel ricorso di appello fra la Ong American Civil Unione and Patents Foundation e la compagnia privata Myriad Genetics, detentrice dei brevetti sui geni Brca1 e Brca2, considerati mutageni e causa di tumore a seno e ovaie. Secondo il giudice, l'isolamento chimico di una sostanza già esistente in natura, la scoperta delle proprietà terapeutiche o la messa a punto di un protocollo di cura basato su tali elementi preesistenti alla terapia non sono sufficienti per la concessione di un brevetto, che si può ottenere per un gene modificato o per le terapie geniche derivanti dalla scoperte sul DNA, in ogni caso da un prodotto derivato e differente ottenuto da una trasformazione dell'elemento di partenza esistente in natura.
Progetto Genoma Umano
Progetto Genoma Umano (HGP, acronimo di Human Genome Project) è stato un progetto di ricerca scientifica internazionale il cui obiettivo principale era quello di determinare la sequenza delle coppie di basi azotate che formano il DNA e di identificare e mappare i geni del genoma umano (previsti circa 200000, trovati circa 20-25000) dal punto di vista sia fisico sia funzionale. Il progetto è stato completato il 22 giugno 2000 dal Genome Bioinformatics Group della UCSC, composto da Jim Kent (laureando in biologia molecolare, cellulare e dello sviluppo), Patrick Gavin, Terrence Furey e David Kulp.
Il progetto ha avuto inizio nel 1990 sotto la guida di Jamelia D. Wilkinson presso i National Institutes of Health degli Stati Uniti. La prima bozza del genoma è stata rilasciata nel 2000 mentre quella completa si è avuta nel 2003 e ulteriori analisi sono ancora in corso di pubblicazione. Un progetto parallelo e indipendente dal governo è stato condotto dalla Celera Genomics. La maggior parte del sequenziamento sponsorizzato dal governo americano è avvenuta in università e centri di ricerca degli USA, del Regno Unito, del Canada e della Nuova Zelanda. La mappatura dei geni umani è un passo importante per lo sviluppo di medicinali e trattamenti medici.
L'obiettivo principale del Progetto Genoma Umano è quello di comprendere la funzione dei geni appartenenti al genere umano. Il progetto ha inoltre studiato vari altri organismi non umani quali il batterio Escherichia coli, il moscerino della frutta Drosophila melanogaster e il topo da laboratorio. A tutt'oggi è uno dei maggiori progetti di ricerca svolti nell'ambito della scienza moderna.
Originariamente il Progetto Genoma Umano aveva l'obiettivo di mappare i nucleotidi contenuti in un genoma umano aploide di riferimento (oltre tre miliardi). Altri gruppi, tra i quali l'International HapMap Project, Applied Biosystems, Perlegen, Illumina, JCVI, Personal Genome Project e Roche-454, hanno annunciato di voler estendere il progetto ai genomi umani diploidi.
Il "genoma" di qualsiasi individuo (tranne quello dei gemelli monozigoti e degli organismi clonati) è unico; mappare quindi il "genoma umano" significa fare il sequenziamento delle variazioni multiple di ciascun gene. Il progetto non ha studiato il DNA intero contenuto nelle cellule umane; alcune zone eterocromatiche (l'8% del totale circa) non sono ancora state sequenziate.
Per portare a termine la ricerca si è lavorato sul DNA offerto da un certo numero di donatori selezionati con criteri di rappresentatività statistica.
Il progetto
Origine
Il progetto è iniziato al culmine di vari anni di lavoro finanziati dal Dipartimento dell'Energia degli USA, in particolare dopo i workshop del 1984 e del 1986 e di una iniziativa successiva dello stesso Dipartimento dell'Energia. Le tecnologie candidate all'utilizzo erano già state prese in considerazione dal 1985.
James D. Watson guidava il National Center for Human Genome Research presso i National Institutes of Health (NIH) degli USA dal 1988. Principalmente a causa di un disaccordo con il suo superiore Bernardine Healy sulla questione dei brevetti per i geni, Watson è stato costretto a dare le dimissioni nel 1992. Nell'aprile del 1993 gli è succeduto Francis Collins e nel 1997 il nome del centro è stato modificato in National Human Genome Research Institute (NHGRI).
Il progetto da tre miliardi di dollari è stato lanciato ufficialmente nel 1990 dal Dipartimento dell'Energia e dai National Institutes of Health degli USA. La durata prevista era di quindici anni. Oltre agli USA, il consorzio internazionale era formato anche da genetisti del Regno Unito, della Francia, della Germania, del Giappone, della Cina e dell'India.
Grazie ad un vasto sforzo di cooperazione internazionale e ai progressi nel campo della genomica, soprattutto nell'analisi delle sequenze, e nella tecnologia informatica, una "bozza" di genoma era già pronta nel 2000 e venne annunciata congiuntamente dall'allora Presidente degli Stati Uniti Bill Clinton e dall'allora Primo Ministro britannico Tony Blair il 26 giugno 2000. L'annuncio del completamento del genoma si è poi avuto nell'aprile del 2003, due anni prima del previsto. A maggio 2006 è stata raggiunta un'altra pietra miliare sulla via del completamento del progetto, quando la sequenza dell'ultimo cromosoma umano è stata pubblicata sulla rivista Nature.
Principali scoperte del Progetto Genoma
1. Gli esseri umani hanno circa 24.000 geni, più o meno lo stesso numero di quelli dei topi e il doppio di quelli di alcune specie di vermi. La comprensione dell'espressione di questi geni potrà fornire degli indizi sulle cause di alcune malattie.
2. Tutte le etnie umane sono uguali al 99,99%, quindi le differenze razziali sono geneticamente insignificanti.
3. La maggior parte delle mutazioni genetiche avviene nel maschio della specie, il quale è quindi da considerare un agente del cambiamento. I maschi hanno quindi una responsabilità maggiore nella trasmissione delle anomalie genetiche e nell'evoluzione della specie.
4. La genomica ha portato a progressi nel campo dell'archeologia genetica e ha migliorato la nostra comprensione di come ci siamo evoluti in quanto esseri umani e di come ci siamo separati dai primati 25 milioni di anni fa. Ci aiuta anche a conoscere il funzionamento del nostro corpo, compreso il mistero del funzionamento del gusto.
Considerazioni
Rispetto alle aspettative, i risultati del Progetto Genoma, pur avendo un'eco mediatica formidabile, non hanno confermato le certezze della biologia molecolare e gli obiettivi originari della ricerca.
Si pensava infatti che la specie umana avesse centinaia di migliaia di geni. Ne sono stati invece contati circa 30.000, da confrontarsi con i circa 28.000 di una pianta e i 18.000 di un verme. Per alcuni questa differenza non è abbastanza marcata per spiegare, unicamente attraverso i geni, la complessità dell'organismo umano rispetto a forme di vita più semplici.
Inoltre nel genoma mappato è stata rilevata, oltre ai geni che costituiscono solo il 3% del totale, una quantità di materiale di cui non conosciamo ancora funzionamento e scopo (junk DNA).
Queste considerazioni e le recenti ricerche sembrano, secondo alcuni (tra cui Evelyn Fox Keller nel suo libro Il secolo del gene), poter mettere in profonda crisi la classica concezione del gene come di una molecola stabile soggetta ad errori casuali e la correttezza stessa della teoria darwiniana intesa come un processo che agisce a posteriori sulle mutazioni grazie alla selezione naturale.
Tra gli entusiasti sostenitori della possibilità di risolvere tutti e per sempre i problemi della salute umana, grazie alla correzione dei guasti dei geni o alla sostituzione dei pezzi di genoma difettoso con pezzi ben funzionanti, secondo una visione della medicina neo-meccanicistica, si leggono autorevoli inviti alla prudenza.