Está en la página 1de 11

El código 

genético
¿Cómo se decodifica la información en una secuencia de ARNm para formar un polipéptido?
Aprende cómo grupos de tres nucelótidos, llamados codones, especifican los animoácidos
(así como las señales de inicio y terminación para la traducción).

Introducción
¿Alguna vez le has escrito un mensaje secreto a alguno de tus amigos? Si
es así, tal vez hayas usado algún tipo de código para mantener el mensaje
oculto. Por ejemplo, tal vez hayas reemplazado letras de las palabras con
números o símbolos siguiendo un conjunto particular de reglas. Para que
el amigo que recibe el mensaje pueda entenderlo, es necesario que
conozca el código y aplique el mismo conjunto de reglas, en reversa,
para decodificar lo que hayas escrito.

Resulta que la decodificación de mensajes también es un paso clave en


la expresión génica, el proceso a través del cual se utiliza la información
de un gen para construir una proteína (u otro producto funcional). ¿Cómo
están codificadas las instrucciones para generar una proteína en el ADN
y cómo las descifra la célula? En este artículo revisaremos con más
detalle el código genético, que permite que las secuencias de nucleótidos
del ADN y ARN se traduzcan en los aminoácidos que representan.

Resumen: expresión génica y el código


genético
Los genes que contienen instrucciones para generar proteínas se expresan
en un proceso de dos pasos.

 En la transcripción, la secuencia de ADN de un gen se "vuelve a


escribir" con nucleótidos de ARN. En eucariontes, el ARN debe
someterse a pasos de procesamiento adicionales para convertirse en ARN
mensajero, o ARNm.

 En la traducción, la secuencia de nucleótidos del ARNm se


"traduce" en la secuencia de aminoácidos de un polipéptido (proteína o
subunidad de proteína).

Las células decodifican el ARNm cuando leen sus nucleótidos en grupos


de tres, llamados codones. Cada codón indica un aminoácido en
particular o, en algunos casos, proporciona una señal de terminación que
finaliza la traducción. Además, el codón AUG tiene un papel especial:
sirve como codón de inicio en el que comienza la traducción. El
conjunto completo de correspondencias entre codones y aminoácidos (o
señales de terminación) se conoce como código genético. 
[Tabla de codones]
La secuencia del ARNm es:

5'-AUGAUCUCGUAA-5'

La traducción implica leer los nucleótidos del ARNm en grupos de tres,


cada uno de los cuales especifica un aminoácido (o proporciona una señal
de terminación que indica que ha finalizado la traducción).

3'-AUG AUC UCG UAA-5'

AUG \rightarrow→right arrow metionina AUC \rightarrow→right


arrow isoleucina UCG \rightarrow→right arrow serina
UAA \rightarrow→right arrow "alto"

Secuencia del polipéptido: (extremo-N) metionina-isoleucina-serina


(extremo-C)

En el resto de este artículo, examinaremos más de cerca el código


genético. Primero veremos cómo se descubrió. Luego veremos con más
detalle sus propiedades y cómo se puede utilizar para predecir el
polipéptido codificado por un ARNm.

Descifrando códigos: cómo se descubrió el


código genético
Para descifrar el código genético, los investigadores necesitaban
averiguar cómo las secuencias de nucleótidos de una molécula de ADN o
ARN podían codificar la secuencia de aminoácidos de un polipéptido.
¿Por qué era un problema difícil? En uno de los códigos posibles más
simples, cada nucleótido de una moléculas de ARN o ADN podía
corresponder a un aminoácido de un polipéptido. Sin embargo, este
código en realidad no funciona, puesto que en las proteínas normalmente
hay 202020 aminoácidos y solo 444 bases nucleotídicas en el ARN o
ADN. Por lo tanto, los investigadores sabían que el código debía estar
compuesto de algo más complejo que una relación uno a uno entre los
nucleótidos y los aminoácidos.

La hipótesis del triplete


A mediados de la década de 1950, el físico George Gamow profundizó
en estas ideas para deducir que el códgio genético probablemente estaba
compuesto de tripletes de nucleótidos. Es decir, propuso que un grupo
de 333 nucleótidos sucesivos en un gen podría codificar un aminoácido
en un polipéptido.

El razonamiento de Gamow era que incluso un código de dobletes


(222 nucelótidos por aminoácido) tampoco funcionaría, puesto que solo
permitiría 161616 grupos ordenados de nucleótidos (4^2424, squared),
insuficientes para representar los 202020 aminoácidos que normalmente
se usan para generar proteínas. No obstante, un código basado en
tripletes parecía prometedor: dicho código permite 646464 secuencias
únicas de nucleótidos (4^3434, cubed), más que suficientes para cubrir
los 202020 aminoácidos.
[Más acerca de las matemáticas]

Nirenberg, Khorana y la identificación de codones


La hipótesis de tripletes de Gamow parecía lógica y se aceptó
ampliamente. Sin embargo, no se había probado experimentalmente y los
investigadores seguían sin saber cuales eran los tripletes de nucleótidos
correspondientes a cada aminoácido.

En 1961 se comenzó a descifrar el código genético con el trabajo del


bioquímico estadounidense Marshall Nirenberg. Por primera vez,
Nirenberg y sus colegas fueron capaces de identificar los tripletes
específicos de nucleótidos que correspondían a aminoácidos en
particular. Su éxito se debió a dos innovaciones experimentales:

 Una manera de generar moléculas de ARNm artificial con


secuencias específicas y conocidas.

 Un sistema para traducir ARNm en polipéptidos fuera de la célula


(un sistema "libre de células"). El sistema de Nirenberg estaba
compuesto de citoplasma de células lisadas de E. coli, las cuales
contienen todos los materiales necesarios para la traducción.

Primero, Nirenberg sintetizó una molécula de ARNm compuesta


únicamente del nucleótido uracilo (llamada poli-U). Al añadir ARNm de
poli-U al sistema libre de células, encontró que los polipéptidos
generados estaban compuestos exclusivamente del aminoácido
fenilalanina. Dado que el único triplete en el ARNm de poli-U es UUU,
Nirenberg concluyó que UUU podría codificar para fenilalanina.
Mediante la misma técnica, demostró que el ARNm de poli-C se traducía
en polipéptidos compuestos exclusivamente del aminoácido prolina, lo
que sugería que el triplete CCC podría codificar para prolina.
Otros investigadores, como el bioquímico Har Gobind Khorana en la
Universidad de Wisconsin, amplió los experimentos de Nirenberg al
sintetizar ARNm artificial con secuencias más complejas. Por ejemplo,
en un experimento, Khorana generó un ARNm de poli-UC
(UCUCUCUCUC…) y lo añadió a un sistema libre de células similar al
de Nirenberg. El ARNm de poli-UC se tradujo en polipéptidos con un
patrón alternante de los aminoácidos serina y leucina. Estos y otros
resultados confirmaron sin ambigüedad alguna que el código genético
estaba formado por tripletes, o codones. Hoy en día sabemos que el
codón UCU codifica serina y que CUC codifica leucina.

En 1965, con ayuda del sistema libre de células y otras técnicas,


Nirenberg, Khorana y sus colegas ya habían descifrado completamente el
código genético. Esto es, ya habían identificado el aminoácido o señal de
"alto" correspondiente a cada uno de los 646464 codones de nucleótidos.
Por sus contribuciones, Nirenberg y Khorana (junto con otro investigador
del código genético, Robert Holley) recibieron el premio Nobel en 1968.

_Izquierda: imagen modificada de "Marshall Nirenberg y Heinrich Matthaei," de N. MacVicar (dominio


público). Derecha: "Har Gobind Khorana" (dominio público)._
Propiedades del código genético
Como vimos anteriormente, el código genético se basa en tripletes de
nucleótidos llamados codones, los cuales especifican aminoácidos
individuales en un polipéptido (o señales de "terminación" al final). Los
codones de un ARNm se "leen" uno por uno dentro de estructuras de
ARN y proteína llamadas ribosomas; se comienza por el extremo 5' del
gen y se avanza hacia el extremo 3'. Vamos a revisar el código genético
con más atención en el contexto de la traducción.

Tipos de codones (inicio, terminación y "normales")


Tabla del código genético. Cada secuencia de tres letras de nucleótidos
de ARNm corresponde a un aminoácido en específico o a un codón de
terminación. UGA, UAG y UAA son codones de terminación. AUG es el
codón de metionina además de ser el codón de inicio.
_Crédito de la imagen: "The genetic code", de OpenStax College, Biología (CC BY 3.0)_

La traducción siempre comienza en el codón de inicio, el cual tiene la


secuencia AUG y codifica el aminoácido metionina (Met) en la mayoría
de los organismos. Por lo tanto, todos los polipéptidos suelen comenzar
con metionina, aunque la metionina inicial puede ser cortada en etapas
posteriores de procesamiento. Se necesita de un codón de inicio para
comenzar la traducción, pero el codón AUG también puede aparecer
después en la secuencia codificante de un ARNm y simplemente
especificará el aminoácido metionina.

Una vez que la traducción ha comenzado en el codón de inicio, los


siguientes codones del ARNm se leerán uno por uno en dirección 5' a 3'.
Conforme se lee cada codón, el aminoácido correspondiente se añade al
extremo carboxilo del polipéptido. La mayoría de los codones del código
genético especifican aminoácidos y se leen durante esta fase de la
traducción. 
[¿Cómo se lee la tabla de codones?]

La traducción continúa hasta llegar a un codón de paro. Hay tres


codones de paro en el código genético: UAA, UAG y UGA. A diferencia
del codón de inicio, los codones de paro no codifican aminoácidos. En
cambio, funcionan como señales de "alto": indican que el polipéptido
está completo y causan que se libere del ribosoma. Pueden haber más
nucleótidos después del codón de paro en el ARNm, pero no se
traducirán como parte del polipéptido.
Marco de lectura
El codón de inicio es crítico debido a que determina el lugar en el que
comenzará la traducción del ARNm. Aún más importante, la posición del
codón de inicio determina el marco de lectura, o sea, la manera en que
la secuencia del ARNm se divide en grupos de tres nucleótidos dentro
del ribosoma. Como se muestra en el siguiente diagrama, la misma
secuencia de nucleótidos puede codificar polipétidos completamente
diferentes según el marco con el que se lea. El codón de inicio determina
el marco de lectura elegido y así asegura que se produzca el polipéptido
correcto.
Para entender qué es el marco de lectura, podría ayudar considerar una
analogía en la que utilizamos palabras y letras. El siguiente mensaje tiene
sentido para nosotros porque lo leemos en el marco correcto (lo
dividimos correctamente en grupos de tres letras): HOY ANA FUE CON
LEO. Si cambiamos el marco de lectura y agrupamos las letras en grupos
de tres y comenzamos a leer una posición después obtenemos: OYA
NAF UEC ONL EO. El desplazamiento en el marco provoca que el
mensaje ya no tenga sentido.

Un punto importante que debemos resaltar aquí es que los nucleótidos de


un gen no están organizados físicamente en grupos de tres. Por el
contrario, lo que constituye un codon es simplemente una cuestión de
dónde comienza a leer el ribosoma y qué secuencia de nucleótidos se
encuentra después del codón de inicio. Las mutaciones que insertan o
eliminan solo un nucleótido pueden alterar el marco de lectura, lo que
resulta en la producción de una proteína "que no se entiende" similar a la
oración revuelta del ejemplo anterior.

Un aminoácido, muchos codones


Como se mencionó antes, el código genético consta de 646464 codones
únicos. Pero si solo hay 202020 aminoácidos, ¿para que son los
otros 444444 codones? Como ya vimos, hay unos cuantos codones de
terminación, pero la mayoría no lo son. En vez de esto, el código
genético resulta ser un código degenerado, lo que significa que algunos
aminoácidos están especificados por más de un codón. Por ejemplo,
prolina está representada por cuatro codones (CCU, CCC, CCA, y CCG).
Si cualquiera de ellos aparece en un ARNm, causará que se agregue
prolina a la cadena polipeptídica.
La mayoría de los aminoácidos del código genético se codifican por al
menos dos codones. De hecho, la metionina y el triptófano son los únicos
aminoácidos que se codifican solo por un codón. Es importante resaltar
que lo contrario no es cierto: cada codón codifica solo un aminoácido o
señal de terminación. Por lo tanto no hay ambigüedad (incertidumbre) en
el código genético. Un codón en particular siempre se traducirá de
manera predecible en un aminoácido en particular o en una señal de
terminación.

El código genético es (casi) universal


Con unas cuantas excepciones, todos los seres vivos de la Tierra usan el
mismo código genético. Esto significa que los codones que especifican
los 202020 aminoácidos en tus células son los mismos que utilizan las
bacterias que habitan las fuentes hidrotermales al fondo del océano
Pacífico. Incluso en los organismos que no utilizan el código "estándar",
las diferencias son relativamente pequeñas, tales como un cambio en el
aminoácido codificado por un codón en particular.

Un código genético compartido por tan diversos organismos proporciona


una importante evidencia de un origen común de la vida en la Tierra.
Esto es, las numerosas especies de la Tierra hoy en día probablemente
evolucionaron de un organismo en el cual el código genético ya se
encontraba presente. Debido a que el código es esencial para la función
celular, debería tender a permanecer sin cambios en las especies a través
de las generaciones, puesto que los individuos con cambios importantes
serían incapaces de sobrevivir. Este tipo de proceso evolutivo puede
explicar la notable similitud del código genético en los organismos
presentes en la actualidad.

También podría gustarte