Codice genetico

Dizionario di Medicina (2010)

codice genetico

Nicoletta Rossi

Sistema attraverso cui si conserva e si trasmette l’informazione genetica. La trasmissione dell’informazione avviene a partire dalla sequenza nucleotidica di una molecola di DNA che viene trascritta nell’RNA messaggero (mRNA), e poi tradotta nella sequenza di amminoacidi di una proteina. Quindi il c. g. stabilisce la corrispondenza fra una successione di nucleotidi nella molecola del DNA (e dell’RNA messaggero) e una successione di amminoacidi nella molecola proteica. Il c. g. (o per meglio dire, l’unità del c. g.) consiste di triplette di nucleotidi, dette codoni, che corrispondono ciascuna a un particolare amminoacido o a un segnale di terminazione.

codice genetico

Trasmissione dell’informazione genetica

Secondo il ‘dogma centrale’ della biologia molecolare, il flusso dell’informazione genetica avviene unidirezionalmente e segue un principio di colinearità: un gene, ossia un tratto di DNA costituito da una sequenza lineare dei nucleotidi, viene trascritto in un filamento complementare di RNA messaggero, e questo a sua volta specifica una sequenza corrispondente di amminoacidi appartenenti al polipeptide che verrà sintetizzato. L’informazione genetica viene conservata e trasmessa alle cellule figlie mediante un processo di replicazione, in cui un acido nucleico a doppio filamento viene duplicato per dare origine a copie identiche.

codice genetico

Espressione dell’informazione genetica

L’informazione genetica viene espressa mediante due passaggi: la trascrizione, che produce un RNA a singolo filamento identico nella sequenza a uno dei due filamenti del DNA stampo (mRNA); la traduzione, che converte la sequenza nucleotidica dell’mRNA nella sequenza amminoacidica della proteina. Negli eucarioti la trascrizione avviene nel nucleo, mentre la sintesi proteica (traduzione) viene effettuata sui ribosomi, grandi complessi ribonucleoproteici situati nel citoplasma.

codice genetico

Sintesi proteica

L’assemblaggio di un polipeptide a partire dai suoi amminoacidi costituenti è governato dal c. g. a triplette dei codoni: gruppi di tre nucleotidi adiacenti sulla sequenza lineare dell’mRNA sono decodificati sequenzialmente in modo da specificare i singoli amminoacidi che formeranno il polipeptide. I codoni sulla molecola di mRNA non riconoscono direttamente gli amminoacidi da essi specificati: il processo di decodificazione viene mediato da adattatori, gli RNA transfer o tRNA, molecole di RNA lunghe circa 80 nucleotidi con una struttura terziaria a L. A ogni differente molecola di tRNA è legato covalentemente un amminoacido diverso, per azione di un enzima specifico, l’amminoacil-tRNA sintetasi. Ciascun tRNA è in grado di riconoscere un codone corrispondente sull’mRNA attraverso l’appaiamento con l’anticodone, una sequenza di tre nucleotidi complementare al codone, situata sull’RNA transfer stesso. In questo modo a ciascun codone viene associato un amminoacido corrispondente. Affinché un amminoacido possa essere inserito nella catena polipeptidica che si sta sintetizzando sui ribosomi, il suo codone corrispondente, situato sulla molecola dell’mRNA, deve essere riconosciuto attraverso l’appaiamento di basi con l’anticodone complementare su una molecola di tRNA specifica per il trasporto di quell’amminoacido. Le proteine vengono sintetizzate tramite la formazione di un legame (chiamato peptidico) fra due amminoacidi successivi. Poiché l’mRNA è un polimero lineare di quattro nucleotidi diversi (adenina, guanina, citosina e uracile), esistono 43=64 possibili combinazioni di tre nucleotidi, a ognuna delle quali corrisponde un amminoacido. Essendo le proteine costituite da soli 20 diversi amminoacidi, gran parte degli amminoacidi è specificata da più di una tripletta, e il c. g. viene detto ridondante o degenerato.

Universalità del codice

La decifrazione di un unico codice che traduce l’informazione contenuta nel DNA in proteine, completata a metà degli anni Sessanta, è considerata una delle più grandi scoperte del Novecento. Sembra che l’origine del c. g. nell’evoluzione sia antecedente alla divisione del mondo vivente nei tre maggiori regni, Batteri, Archea ed Eucarioti. Il c. g. è perciò considerato universale ed è presente in tutti gli organismi viventi conosciuti. In realtà esistono delle eccezioni nel ruolo interpretato dai codoni. Nell’uomo, il c. g. nucleare e quello mitocondriale sono simili, ma non identici. Il codice mitocondriale prevede quattro codoni di stop invece di tre, due codoni per l’amminoacido metionina anziché uno, quattro codoni per l’arginina invece di sei, e così via. Queste interpretazioni alternative di alcuni codoni, dette anche riassegnazioni dei codoni, sono probabilmente dovute alla divergenza evolutiva degli organuli cellulari. In altri casi, alcuni segnali presenti in determinati RNA messaggeri citoplasmatici portano alla ridefinizione dei codoni. Ad esempio, il codone di terminazione UGA può essere interpretato come un amminoacido aggiuntivo, la selenocisteina, presente in Batteri, Archea ed Eucarioti. Un altro amminoacido, la pirrolisina, è stato identificato in Batteri e Archea, ed è codificato anch’esso da un codone di terminazione (UAG). Per questo, la selenocisteina e la pirrolisina sono considerati, rispettivamente, il 21° e il 22° amminoacido.

Degenerazione del codice genetico
codice genetico
Nicoletta Rossi

Degenerazione del codice genetico

La traduzione della sequenza nucleotidica dell’mRNA in quella amminoacidica della proteina si fonda sull’appaiamento delle basi complementari fra una tripletta (codone) dell’mRNA e la corrispondente tripletta complementare (anticodone) del tRNA che trasporta uno specifico amminoacido. Per ciascuna delle tre posizioni in un codone vi sono quattro basi nucleotidiche possibili. I quattro nucleotidi presenti nella molecola del DNA, a gruppi di 3, danno luogo a 64 codoni diversi. Di questi, 3 codoni (UAG, UAA e UGA) non codificano nessun amminoacido ma segnalano la fine del messaggio genetico e vengono pertanto definiti codoni di arresto o codoni non senso. Rimangono così 61 codoni che specificano 20 amminoacidi (codoni di senso); perciò la maggior parte degli amminoacidi corrisponde a più di un codone. Per questo motivo si parla di degenerazione del codice genetico.

L’imprecisione dell’appaiamento

La degenerazione del codice implica che un singolo tRNA possa corrispondere per appaiamento di basi a più di un codone e che ad ognuno degli amminoacidi debba corrispondere più di un tRNA. In effetti si verificano entrambe le situazioni: per alcuni amminoacidi esiste realmente più di una molecola di tRNA, inoltre la costituzione dell’anticodone di alcune molecole di tRNA è tale da esigere l’appaiamento accurato delle basi solo nelle prime due posizioni del codone mentre viene tollerata una discordanza nella terza base. Tale fenomeno, per cui un tRNA può riconoscere più codoni, viene definito vacillamento del codice genetico. L’appaiamento tra codone e anticodone è regolare per quanto riguarda A-U e G-C per le basi nelle prime due posizioni del codone, ma ammette l’appaiamento G-U nella terza posizione. In generale, quando la base in terza posizione dei codoni è una pirimidina (U o C), uno stesso anticodone può appaiarsi a due codoni alternativi. Questo appaiamento ‘incerto’ spiega come mai molti dei codoni alternativi per lo stesso amminoacido differiscono solo nel terzo nucleotide della tripletta. Nei batteri l’appaiamento codone/anticodone rende possibile l’abbinamento di 20 amminoacidi ai rispettivi 61 codoni con soli 31 tipi di molecole di tRNA. Il numero dei differenti tRNA varia da una specie all’altra. Per esempio, la specie umana ha 497 geni per i tRNA, ma tra di essi sono rappresentati solo 49 diversi anticodoni.

Mutazioni silenti e conservative

Nell’attribuzione del codice, l’ordine dei nucleotidi nelle triplette sembra essere non causale. Per es., quando le due prime basi sono identiche la terza può essere sia citosina (C) che uracile (U), e il codone codificherà lo stesso amminoacido. Inoltre i codoni con pirimidine (citosina, timina e uracile) in seconda posizione specificano prevalentemente amminoacidi idrofobici, mentre quelli con purine (adenina e guanina) nella stessa posizione specificano principalmente amminoacidi polari. Quindi una mutazione nella terza lettera porta generalmente allo stesso amminoacido, mentre una nella seconda determina la codifica di amminoacidi simili. Anche nelle basi in prima posizione nelle triplette si possono verificare sostituzioni silenti o conservative, ma con minore frequenza. Il codice genetico sembra quindi essere stato ottimizzato dall’evoluzione per minimizzare gli effetti delle mutazioni sulla struttura delle proteine. Il DNA di tutti gli organismi è soggetto a una varietà di cambiamenti ereditabili, ossia a mutazioni. Alcune mutazioni avvengono per sostituzioni di basi sulla sequenza del DNA; solitamente esse consistono nella sostituzione di un unico nucleotide. Le mutazioni che si verificano sul DNA codificante possono essere ‘sinonime’ o silenti, quando non modificano la sequenza del prodotto genico, oppure ‘non sinonime’ se alterano la sequenza del prodotto genico. Una mutazione sinonima determina un cambiamento di codone, ma non di amminoacido, in virtù della degenerazione del codice genetico. Questo tipo di mutazione è quello che si osserva più frequentemente nel DNA codificante, perché non è soggetto alla pressione selettiva della selezione naturale. Le posizioni di basi in cui le tre possibili sostituzioni nella base in terza posizione sono sinonime vengono dette siti degenerati 4 volte. Anche alcune sostituzioni della prima base del codone possono essere silenti. Le mutazioni non sinonime che danno origine a un codone che specifica un amminoacido diverso da quello originario, possono essere però conservative, ossia l’amminoacido viene sostituito da un altro chimicamente simile, con effetti ininfluenti sulla funzione della proteina. Il codice genetico sembra essersi evoluto in modo che codoni specificanti amminoacidi simili siano a loro volta simili. Ad esempio, i codoni che codificano l’acido aspartico (GAC e GAT) e l’acido glutammico (GAA e GAG) garantiscono che l’incertezza nella terza base in un codone GAX (dove X è un qualsiasi nucleotide) abbia un effetto minimo. Anche alcuni cambiamenti della prima base possono essere conservativi, per es. CUX (leucina) e GUX (valina).

Il codon usage

Il recente sequenziamento di vari geni ha permesso di mostrare che anche il modo in cui nelle diverse specie vengono utilizzati i codoni codificanti lo stesso amminoacido sembra non essere casuale. Alcuni di questi codoni sono presenti quasi sempre, mentre altri non compaiono mai. La scelta preferenziale di alcuni codoni anziché altri per incorporare lo stesso amminoacido, a seconda del gruppo sistematico (ad es. Batteri o Mammiferi), è un fenomeno dovuto all’evoluzione, e viene detto codon usage. L’utilizzo dei codoni è correlato con l’abbondanza di alcuni tRNA rispetto ad altri; i codoni usati più di frequente sono quelli i cui tRNA isoaccettori sono presenti nella cellula in numero maggiore. Anche la forza dell’interazione codone-anticodone influisce sull’uso preferenziale di alcuni codoni rispetto ad altri.

PUB


TAG

Informazione genetica

Selezione naturale

Acido glutammico

Sintesi proteica

Acido aspartico