Está en la página 1de 7

¿QUÉ ES UN GEN?

La idea de los genes como cuentas de un collar de ADN se está desvaneciendo


rápidamente. Las secuencias codificantes de proteínas no tienen claro su principio ni fin y
el ARN es una parte clave del paquete de información, informa Helen Pearson.

'Gen' no es una palabra típica de tres letras. No es una grosería. No es aclamada en


programas de televisión. Y aunque el significado de la mayoría de las palabras de tres letras
es muy claro, el de gen no lo es. Entre más científicos expertos se vuelquen a la genética
molecular, menos fácil será estar seguros de lo que, en todo caso, es realmente un gen.

Rick Young, un genetista en el Instituto Whitehead en Cambridge, Massachusetts, dice que


cuando él comenzó a trabajar como profesor principiante hace dos décadas, le llevó cerca
de dos horas enseñar a los estudiantes más avezados lo que era un gen y los mecanismos y
retruécanos de cómo funcionaba. Hoy en día, él y sus colegas necesitan tres meses de
conferencias para transmitir el concepto de gen, y no porque los estudiantes sean menos
brillantes. “Se necesita todo un semestre para enseñar estas cosas a los graduados con
talento”, dice Young. “Solía poderse dar una definición de una sola vez y ahora es mucho
más complicado.”

En la genética clásica, un gen era un concepto abstracto — una unidad de herencia que
transportaba alguna característica de los padres a los hijos. Como la bioquímica se apropió
de esto, esas características se asociaron con enzimas o proteínas, una por cada gen. Y con
el advenimiento de la biología molecular, los genes llegaron a ser reales, cosas físicas
—secuencias reales de ADN que cuando se convierten en hebras del así llamado mensajero
RNA pueden ser utilizadas como la base para la construcción de su proteína asociada pieza
por pieza. Las grandes espirales de moléculas de ADN de los cromosomas eran vistas como
largas cadenas a las que las secuencias de genes se unían como cuentas o perlas
diferenciadas.

Este panorama es todavía el modelo de trabajo para muchos científicos. Pero los que están a
la vanguardia de la investigación genética ven como cada vez más pasa de moda —una
burda aproximación que, a lo más, esconde fascinantes nuevas complejidades y, en lo peor,
ciega a sus usuarios a nuevos caminos útiles de investigación.

La información, al parecer, está repartida a lo largo de los cromosomas de una manera


mucho más compleja de lo que se suponía en un principio. Las moléculas de ARN no son
sólo conductos pasivos a través de los cuales fluye el mensaje del gen al mundo sino
reguladores activos de procesos celulares. En algunos casos, el ARN puede incluso pasar la
información a través de generaciones —normalmente dominio exclusivo del ADN.
Un estudio revelador del año pasado planteó la posibilidad de que las plantas a veces
vuelven a escribir su ADN a partir de los mensajes de ARN heredados de generaciones
pasadas1.Un estudio en la página 469 de ese número sugiere que un fenómeno similar
podría ocurrir en ratones, y por implicación en otros mamíferos2. Si este tipo de fenómeno
es efectivamente generalizado, “tendría enormes implicaciones”, dice el genetista evolutivo
Laurence Hurst de la Universidad de Bath, Reino Unido.

“Toda esa información pone en duda gravemente nuestra definición convencional de gen”,
dice el biólogo molecular Bing Ren de la Universidad de California, San Diego. Y el
cuestionamiento de la información está a punto de ser aún más difícil. A finales de este año,
A finales de este año, una superabundancia de datos se dará a conocer a partir de la
Enciclopedia Internacional de Elementos de ADN del proyecto (ENCODE). La fase piloto
de ENCODE implica escudriñar más o menos 1% del genoma humano en un detalle sin
precedentes, el objetivo es encontrar todas las secuencias que sirven a un propósito útil y
explicar cuál es ese propósito. “Cuando comenzamos el proyecto ENCODE tuve una visión
diferente de lo que era un gen”, dice el investigador Roderic Guigo en el Centro de
Regulación Genómica de Barcelona. “No se espera el grado de complejidad que hemos
visto.”

Bajo el fuego

La primera de las complejidades para cuestionar el paradigma de la biología molecular de


una secuencia única de ADN que codifica una sola proteína fue el empalme alternativo,
descubierto en los virus en 1977 (ver 'Hard to track'/ 'difícil de rastrear' al dorso). La mayor
parte de las secuencias de ADN que describen las proteínas en los seres humanos tienen
una disposición modular en la que los exones, que llevan las instrucciones para hacer
proteínas, se intercalan con los intrones no codificantes. En el empalme alternativo, la
célula corta los intrones y cose juntos los exones en varios órdenes diferentes, creando
mensajes que pueden codificarse para diferentes proteínas. Con los años los genetistas
también han documentado la superposición de genes, los genes dentro de los genes y un
sinnúmero de otros arreglos extraños (ver 'Muddling sobre genes', al dorso).

El empalme alternativo, sin embargo, no requiere por sí mismo un replanteamiento radical


de la noción de gen; sólo demostró que algunas secuencias de ADN podrían describir más
que una proteína. El ataque actual al concepto de gen es de muy gran alcance, impulsado en
gran parte por estudios que muestran posibilidades nunca antes imaginadas del ARN.

El gen, como idea de proteínas está siendo objeto de especial controversia por
investigadores que están extrayendo y analizando exhaustivamente los mensajes de ARN, o
sus transcripciones, fabricados por los genomas, incluyendo el genoma humano y de ratón.
Los investigadores dirigidos por Thomas Gingeras de la companía Affymetrix en Santa
Clara, California, por ejemplo, estudiaron recientemente todas las transcripciones de diez
cromosomas a través de ocho líneas celulares humanas y calcularon con precisión de dónde
venía cada una de las transcripciones en los cromosomas.3

La imagen que estos estudios retratan es de una increíble complejidad. En lugar de los
genes independientes obedientemente produciendo en masa transcripciones idénticas de
ARN, una masa repleta de transcripciones convierte muchos segmentos del genoma en
múltiples cintas de ARN de diferentes longitudes. Estas cintas pueden ser generadas a partir
de ambas cadenas de ADN, en lugar de sólo una como se había pensado
convencionalmente. Algunas de estas transcripciones provienen de regiones de ADN
previamente identificadas como contenedores de los genes codificadores de proteínas. Pero
muchos no lo hacen. “Es algo revolucionario”, dice el colega de Gingeras, Phillip
Kapranov. “Hemos llegado a la conclusión de que el genoma está lleno de superposiciones
de transcripciones”.

Otros estudios, uno por el equipo de Guigo4, y uno por el genetista Rotem Sorek5, ahora en
la Universidad de Tel Aviv, Israel, y sus colegas, han hecho alusión a las razones detrás de
la masa de la transcripción. Los dos equipos investigaron informes ocasionales de que la
transcripción puede comenzar en una secuencia de ADN asociada con una proteína y
encaminarse directamente a través del gen para una proteína completamente diferente,
produciendo una transcripción fusionada. Al profundizar en las bases de datos de las
transcripciones de ARN humanos, el equipo de Guigo estimó que 4-5% del ADN en las
regiones reconocidas convencionalmente como genes se transcribieron de esta manera. La
producción de transcripciones fusionadas podría ser una forma para la célula de generar una
mayor variedad de proteínas a partir de un número limitado de exones, dicen los
investigadores.

Muchos científicos están empezando a pensar que las descripciones de las proteínas
codificadas en el ADN no conocen fronteras —que cada secuencia llega a la siguiente y
más allá. Esta idea va a ser uno de los puntos centrales que surgirá del proyecto ENCODE,
cuando sus resultados se publiquen a finales de este año.

Kapranov y otros dicen que se han documentado numerosos ejemplos de transcripciones


en las que los exones codificadores de proteínas de una parte del genoma se combinan con
los exones de otra parte que pueden estar a cientos de miles de bases de distancia, con
varios “genes” entre ellas. Esta continuidad de genes puede incluso extenderse a los límites
de los cromosomas: el año pasado, Richard Flavell de la Escuela Universitaria de Medicina
de Yale en New Haven, Connecticut, documentó genes del sistema inmunológico humano
que parecen estar controlados por regiones reguladoras de otro cromosoma6. “Los genes
independientes están empezando a desaparecer”, dice Guigo. “Tenemos una continuidad de
transcripciones.”
Concepto resbaladizo

Los grandes estudios transcripcionales sugieren que una gran cantidad del ARN fabricado
por el ratón y el genoma humano no codifican proteínas. El año pasado, un consorcio de
investigadores de Japón, por ejemplo, estima que un enorme 63% del genoma del ratón se
transcribe7,8; sólo 1-2% del genoma se cree que está abarcado por las secuencias que
contienen los exones de todos los días.

El descubrimiento de las secuencias de ARN que no sólo son intermedios entre el ADN y la
maquinaria productora de proteínas no es nuevo en sí mismo; el aparato de construcción de
proteínas de la célula requiere de una serie de moléculas de ARN, así como proteínas para
operar. Pero el hallazgo de los 'microRNAs' y de otras moléculas de ARN ahora se sabe que
son de vital importancia en el control de muchos procesos celulares en las plantas y los
animales, y la efervescencia recién revelada de la transcripción del ARN, contribuye a la
idea de que el ARN procesa de forma activa y lleva a cabo las instrucciones del genoma.

Tal vez las regiones que componen el ARN no codificador también deben llevar el estado
de los genes, si no el propio nombre. “Creo que es hora de que la gente tome un profundo
respiro y de un paso atrás”, dice el biólogo molecular John Mattick, de la Universidad de
Queensland, en Brisbane, Australia. “Mucha de la información en el sistema está siendo
tramitado por el ARN.”

Aunque las funciones han sido identificadas para varias moléculas de ARN, el meollo del
debate actual es el grado en que todo el ARN juega un papel adicional. Cabe pensar que es
más fácil sobre transcribir e ignorar la basura que invertir en sistemas que producen sólo lo
que se necesita. Un estudio del año pasado, sin embargo, sugiere que al menos algunos de
los medios de ARN está haciendo algo útil.

Trabajando en el Instituto de Genómica de la Fundación de Investigación Novartis en San


Diego, California, John Hogenesch y sus colaboradores aplacaron sistemáticamente la
actividad de más de 500 RNAs no codificantes en células humanas y encontraron que ocho
fueron implicados en la señalización celular y el crecimiento9.

Pero Hogenesh, y muchos otros científicos, siguen convencidos de que los ARN no
codificantes son mucho menos importantes, funcionalmente, que los que describen las
proteínas; en el pasado, cuando los científicos han buscado la base genética de una
enfermedad u otra característica han encontrado abrumadoramente la mutación subyacente
para estar en un gen que codifica la proteína en lugar de en otra región. “La preponderancia
de la evidencia sugiere que los genes codificadores de proteínas mantienen su cuenta
cuando el día ha terminado”, dice Hogenesh.

Algunos de los recientes descubrimientos —que el genoma humano hace una continuidad
de las transcripciones y que las células producen masas de moléculas de ARN no
codificante— no han planteado un gran problema para la gente fuera del mundo de la
biología molecular. Genetistas de población pueden examinar cómo se transmite un rasgo y
evoluciona independientemente del mecanismo molecular preciso que subyace. Por
ejemplo, los genetistas pueden construir modelos que muestran cómo se hereda una
mutación si afecta a una proteína, un ARN no codificante o una región reguladora. “Yo en
realidad no me preocupo si se está haciendo una proteína o no”, dice Hurst. “Las
ecuaciones siguen siendo las mismas.”

Pero lo mismo no puede decirse de los estudios que revelan los llamados modos
extragenomicos de herencia. En recientes años, muchos investigadores se han centrado en
la herencia epigenética, en la que la información se pasa de padres a descendencia
independiente de la secuencia de ADN. Y esta semana en la revista Nature (ver página
469), el equipo de Minoo Rassoulzadegan del Instituto Nacional Francés de Salud e
Investigación Médica (INSERM) en Niza, Francia, informa de que el ARN a veces puede
complicar los modelos tradicionales de herencia.

En ratones, las mutaciones en el gen Kit causan manchas blancas en la cola y las patas; si
un ratón tiene un gen Kit normal y uno mutado uno producirá las manchas. Lo curioso es
que algunos de los descendientes de esos ratones, que heredan dos genes Kit normales
todavía tienen la cola blanca. El grupo francés sugiere que el gen KIT mutante fabrica
moléculas de ARN anormales, que se acumulan en el esperma y pasan en el huevo. Estos
trozos de ARN de alguna manera silencian el gen Kit normal en la próxima generación y
las subsiguientes, produciendo el efecto de cola manchada. “Estamos convencidos de que
se trata de un fenómeno más general,” dice el co-autor Francois Cuzin.

Si esto es extraño, el trabajo reportado el año pasado sobre la planta de berro Arabidopsis
por Robert Pruitt y sus colegas en la Universidad de Purdue en West Lafayette, Indiana, es
aún más extraño. Aquí el gen implicado se llama HOTHEAD (cabeza caliente). El análisis
de Pruitt y sus colaboradores muestra que algunas plantas no tienen la versión mutante de
HOTHEAD que sus padres poseían. Estas plantas habían reemplazado la secuencia de
ADN anormal con el código normal poseído por las generaciones anteriores. “Es como,
vaya, esto lo cambia todo”, dice Pruitt. “Definitivamente cambia mi visión de la herencia”.

Pruitt está trabajando ahora para explicar cómo la planta podría realizar tal hazaña. Una
idea es que llevan una copia de respaldo de la información genética de sus abuelos,
codificada en el ARN que se pasa en las semillas junto con el ADN normal y luego se
utiliza como plantilla para 'corregir' ciertos genes. Es concebible, dice Pruitt, que algunas
de las misteriosas transcripciones no codificantes podrían ser las responsables. “Creo que
hay algo que se hereda fuera lo que pensamos que es el genoma de ADN convencional.”
Cambiar la visión

Las implicaciones de estos hallazgos para nuestra comprensión de la evolución todavía no


se han descubierto, pero la investigación sobre el papel del ARN como portador de la
información a través de generaciones promete enriquecer y complicar la noción de gen aún
más.

Dejando a un lado la caja de Pandora que los estudios sobre la epigenética están empezando
a abrir, ¿no importa que muchos científicos que no se ocupan directamente de los
mecanismos moleculares sigan pensando la genética en términos más simples? Algunos
genetistas dicen que sí. Se preocupan de que los investigadores que trabajan con una idea
demasiado simplista del gen podrían descartar los resultados importantes que no encajan.
Un investigador médico, por ejemplo, puede pasar por alto las muchas transcripciones
diferentes generadas por una secuencia en un solo lugar. Y la falta de una idea clara de lo
que es un gen también podría dificultar la colaboración. “Creo que es a veces muy difícil
explicar lo que quiere decir alguien cuando habla de genes porque no compartimos la
misma definición”, dice el genetista del desarrollo William Gelbert de la Universidad de
Harvard en Cambridge, Massachusetts.

Sin una definición clara de gen, la vida también es difícil para los bioinformáticos que
quieren usar programas de computadora para detectar secuencias de la señal en el ADN que
señalan dónde termina un gen y donde inicia el siguiente. Pero llegar a un consenso sobre la
definición es prácticamente imposible, como Karen Eilbeck puede atestiguar. Eilbeck,
quien trabaja en la Universidad de California en Berkeley, es un coordinador del consorcio
Secuencia Ontología. Este define etiquetas para puntos de referencia dentro de las bases de
datos sobre secuencias genéticas de organismos, tales como el ratón y la mosca, por lo que
las bases de datos pueden ser más fáciles de comparar. El consorcio pretende, por ejemplo,
decidir si una secuencia de codificación de proteínas debe incluir siempre el terceto de
bases de ADN que marcan el final.

Eilbeck dice que le tomó a 25 científicos la mayor parte de dos días llegar a una definición
de gen con la que todos podrían trabajar. “Tuvimos varias reuniones que se prolongaron
durante horas y todos se gritaban el uno al otro” , dice. El grupo finalmente se decidió por
una definición amplia que se podía acomodar a las demandas de todos. (Ya que lo
preguntas: “Una región localizable de la secuencia genómica, que corresponde a una unidad
de herencia, que se asocia con regiones reguladoras, regiones transcritas y / u otras regiones
de secuencias funcionales.”)

En lugar de esforzarse por alcanzar una definición única —y llegar a los golpes en el
proceso— la mayoría de los genetistas están incorporando en su lugar palabras menos
ambiguas en su vocabulario como transcripciones y exones. Cuando se usa el término
“gen” es frecuentemente precedido por 'la codificación de proteínas' u otro descriptor. “Casi
tenemos que añadir un adjetivo cada vez que utilizamos ese sustantivo”, dice Francis
Collins, director del Instituto Nacional de Investigación del Genoma Humano de los
Institutos Nacionales de Salud en Bethesda, Maryland.

Pero por mucho que los genetistas tengan dificultades para precisar al evasivo gen, es
precisamente su naturaleza ambigua lo que aviva su constante curiosidad. “Es cada vez más
fascinante”, dice Young de Whitehead. Algunas cosas, así parece, no están mejor
representadas por una palabra simple de tres letras.

Helen Pearson es periodista que trabaja para Natura, en Nueva York.

También podría gustarte