Está en la página 1de 7

ORGANIZACIN Y SECUENCIACIN DE LOS GENOMAS CELULARES Como material gentico, el ADN proporciona un patrn que dirige todas las

actividades celulares y determina el plan de desarrollo de los organismos multicelulares. Por lo tanto, entender la estructura gentica y su funcin resulta fundamental para obtener una visin de la biologa molecular de las clulas. Los genomas de la mayora de los eucariotas son grandes y ms complejos que los de procariotas. El gran tamao de los genomas eucariotas no resulta sorprendente, puesto que uno debe esperar encontrar ms genes en organismos que son ms complejos. Esta aparente paradoja se resolvi por el descubrimiento de que los genomas de la mayora de las clulas eucariotas contienen no solo genes funcionales sino tambin grandes cantidades de secuencias de ADN que no codifican protenas. La diferencia de tamao entre los genomas de la salamandra y del hombre refleja grandes cantidades de ADN no codificante, en lugar de ms genes. La presencia de grandes cantidades de secuencias no codificantes es una propiedad universal de los genomas de los eucariotas complejos. Intrones y exones En trminos moleculares, un gen puede definirse como un segmento de ADN que se expresa para dar un producto funcional, que puede ser un ARN (p. ej. ribosmico y de transferencia) o un polipptido. Algunos ADN no codificantes en eucariotas representan largas secuencias de ADN que residen entre genes (secuencias espaciadoras). Sin embargo, tambin se encuentran grandes cantidades de ADN no codificante dentro de la mayora de los genes eucariotas. Tales genes presentan una estructura dividida en la que los segmentos de secuencia codificante (llamados exones) estn separados por secuencias no codificantes (intrones). El gen completo se transcribe para producir una molcula larga de ARN en la que los intrones se han retirado mediante splicing (empalme y pega), por lo que slo los exones se encuentran incluidos en el ARN mensajero (ARNm). Aunque la mayora de los intrones no tienen una funcin conocida, representan una parte sustancial de ADN en los genomas de los eucariotas superiores. La estructura intrn-exn de muchos genes eucariotas es complicada, siendo la cantidad de ADN en las secuencias de los intrones con frecuencia ms grande que la de los exones. La secuencia del genoma humano indica que un gen humano promedio contiene aproximadamente 9 exones, interrumpidos por 8 intrones y distribuidos a lo largo de aproximadamente 30,000 pares de bases (30 kilobases o kb) de ADN genmico. Generalmente los exones suman alrededor de 2 kb, de modo que ms del 90% de un gen humano promedio consiste de intrones. Adems, no se encuentran intrones en la mayora de los genes de los eucariotas simples, como las levaduras. Por otra parte, los intrones estn presentes en raros genes procariotas. La presencia o ausencia de intrones no es por tanto una distincin absoluta entre los genes procariotas y eucariotas, aunque los intrones prevalezcan en los eucariotas superiores (plantas y animales). La mayora de los intrones no especifican la sntesis de un producto celular, aunque algunos si codifican ARNs o protenas funcionales. Sin embargo, los intrones juegan papeles importantes en el control de la expresin gnica. Por ejemplo, la presencia de intrones permite que los exones de un gen se unan en distintas combinaciones, resultando en la sntesis de distintas protenas a

partir del mismo gen. Este proceso, denominado procesamiento alternativo o splicing alternativo, ocurre con frecuencia en los genes de eucariotas complejos, y se cree muy importante para la extensin del repertorio funcional de los 30,000 40,000 genes del genoma humano. Adems se cree que los intrones han jugado un papel importante en la evolucin, facilitando la recombinacin entre regiones codificantes de protena (exones) de distintos genes, un proceso conocido como arrastre de exones. Los exones con frecuencia codifican dominios de protenas funcionales, de modo que la recombinacin entre intrones de diferentes genes da lugar a nuevos genes con nuevas combinaciones de secuencias codificantes de protenas. Tal y como se predijo en la hiptesis, los estudios de secuenciacin del ADN han demostrado que algunos genes son quimeras de exones derivados de otros genes, y proporcionan evidencia directa de que se pueden formar nuevos genes mediante la recombinacin de secuencias de intrones. Secuencias de ADN repetitivas Los intrones forman una contribucin sustancial al gran tamao de los genomas de eucariotas superiores. En humanos, por ejemplo, los intrones forman aproximadamente el 25% del ADN genmico total. Sin embargo, una porcin incluso mayor del genoma de los eucariotas complejos consiste en secuencias altamente repetidas de ADN no codificante. Un mayor anlisis, culminando en la secuenciacin de genomas completos, ha identificado varios tipos de estas secuencias altamente repetidas. Una clase (denominada repeticiones de secuencias sencillas) consiste en repeticiones en tndem de hasta miles de copias de secuencias cortas, que varan desde 1 hasta 500 nucletidos. Ya que estas secuencias repetidas de ADN bandean como satlites separados de la banda principal de ADN, a menudo se denominan ADNs satlite. Estas secuencias estn repetidas millones de veces por genoma, constituyendo aproximadamente el 10% del ADN, de la mayora de los eucariotas superiores. Los ADN de secuencia sencilla no se transcriben y no proporcionan informacin gentica funcional. Algunos, sin embargo, representan papeles importantes en la estructura cromosmica. Otras secuencias repetitivas de ADN se encuentran dispersas a travs del genoma en lugar de agrupadas en repeticiones en tndem. Estos elementos repetitivos dispersos son un contribuyente muy importante para el tamao del genoma, constituyendo aproximadamente el 45% del ADN genmico humano. Las dos clases ms predominantes de estas secuencias se denominan SINEs (short interspersed elements). Los SINEs poseen una longitud de 100 a 300 pares de bases. Unas 1.5 millones de estas secuencias se encuentran dispersas a travs del genoma, constituyendo aproximadamente un 13% del ADN humano total. Aunque los SINEs se transcriben a ARN, no codifican protenas y su funcin es desconocida. Los principales LINEs (long interspersed elements) humanos poseen una longitud de 6-8 kb, aunque muchas de las secuencias repetidas derivadas de LINEs son ms cortas, con un tamao aproximado de 1 kb. Existen aproximadamente 850,000 repeticiones de secuencias LINEs en el genoma, constituyendo el 21% del ADN humano. Los LINEs se transcriben y al menos algunos de ellos codifican para protenas, pero al igual que los SINEs, no poseen una funcin conocida en la fisiologa celular. Tanto las secuencias SINEs como LINEs son ejemplos de elementos transponibles, que son capaces de moverse a puntos distintos en el ADN genmico.

Una tercera clase de secuencias repetitivas dispersas, que se asemejan fuertemente a los retrovirus se denominan elementos semejantes a retrovirus, tambin se mueven dentro del genoma por transcripcin inversa. Los elementos semejantes a retrovirus humanos varan desde aproximadamente 2-10 kb de longitud. Existen aproximadamente 450,000 elementos semejantes a retrovirus en el genoma humano, lo que constituye aproximadamente un 8% de ADN humano. Por el contrario, la cuarta clase de elementos repetitivos dispersos (transposones de ADN) se mueven por el genoma siendo copiados y reinsertados como secuencias de ADN, en lugar de moverse mediante transcripcin inversa. En el genoma humano existen unas 300,000 copias de transposones de ADN, variando de 80 a 3,000 pares de bases de longitud y constituyendo aproximadamente un 3% del ADN humano. As, prcticamente la mitad del genoma humano consiste en elementos repetitivos dispersos que se han replicado y movido a travs del genoma a travs de intermediarios de ARN o ADN. Merece la pena notar que la gran mayora de estos elementos se transponen a travs de intermediarios de ARN, de modo que la transcripcin inversa ha sido responsable de la generacin de ms del 40% del genoma humano. Algunas de estas secuencias pueden ayudar en la regulacin de la expresin gnica, pero la mayora de las secuencias repetitivas dispersas no parecen hacer una contribucin til a la clula. Por el contrario, parecen representar los elementos de ADN egostas que han sido seleccionados por su propia capacidad de replicacin dentro del genoma, en lugar de proporcionar una ventaja selectiva a su husped. En algunos casos, sin embargo, los elementos transponibles han jugado un papel evolutivo importante, estimulando los reordenamientos genticos y contribuyendo a la generacin de la diversidad gentica. Duplicacin gnica y pseudogenes Otro de los factores que favorecen al gran tamao de los genomas eucariotas es que algunos genes estn presentes en mltiples copias, algunas de las cuales frecuentemente son afuncionales. En algunos casos, mltiples copias de genes son necesarias para producir ARNs o protenas requeridas en grandes cantidades, como los ARNs ribosmicos o las histonas. En otros casos, miembros concretos de un grupo de genes relacionados (denominado una familia gnica) pueden ser transcritos en diferentes tejidos o en diferentes etapas del desarrollo. Las familias de genes se cree que han surgido de la duplicacin de un gen ancestral original, divergiendo los diferentes miembros de una familia como consecuencia de mutaciones durante la evolucin. Tal divergencia puede desembocar en la evolucin de protenas relacionadas capaces de funcionar en tejidos diferentes o en distintas etapas del desarrollo. Como cabra esperar, sin embargo, no todas las mutaciones favorecen la funcin del gen. Algunas copias genticas presentan mutaciones sustanciales que ocasionan la prdida de la capacidad para producir un producto gentico funcional. Composicin del genoma en los eucariotas superiores Una vez vistos los diferentes tipos de ADN no codificante que contribuyen a la complejidad genmica de los eucariotas superiores, es de inters revisar la composicin de los genomas celulares. En los genomas bacterianos, la mayor parte del ADN codifica protenas. Por ejemplo, el genoma de E. coli es aproximadamente de unas 4.6 x 106 pares de bases de longitud y contiene unos 4,000

genes, donde casi un 90% del ADN son secuenciales codificantes para protenas. El genoma de las levaduras, consiste de 12 x 106 pares de bases, posee un tamao 2.5 veces el de E. coli, pero sique siendo extremadamente compacto. Slo el 4% de los genes de Saccharomyces cerevisiae contienen intrones y, normalmente, stos slo poseen un pequeo intrn cerca del comienzo de la secuencia codificante. Aproximadamente un 70% del genoma de levaduras se emplea en secuencias codificantes de protenas, especificando un total de aproximadamente 6,000 protenas. Los genomas animales relativamente sencillos de C. elegans y Drosophila son unas 10 veces ms grandes que el genoma de levaduras, pero contienen slo 2-3 veces ms genes. Por el contrario, estos genomas animales sencillos contienen ms intrones y ms secuencias repetitivas, de modo que las secuencias codificantes de protenas corresponden slo al 25% del genoma de C. elegans y un 13% del genoma de Drosophila. Sin embargo, una gran sorpresa obtenida al descifrar la secuencia del genoma humano, fue el descubrimiento de que el genoma humano slo contiene aproximadamente de 30,000 a 40,000 genes, justo el doble de nmero de genes presente en el genoma de C. elegans o Drosophila. Parece que slo del 1 1.5% del genoma humano consiste de secuencias codificantes. Aproximadamente el 25% del genoma consiste en intrones y ms del 60% est compuesto por varios tipos de secuencias de ADN repetitivo y duplicado, donde el resto est compuesto por pseudogenes, secuencias espaciadoras no repetitivas entre genes y secuencias de exones que estn presentes en los extremos 5 y 3 de los ARNm pero que no se traducen en protenas. El aumento del tamao de los genomas de los eucariotas superiores, por lo tanto, se debe mucho ms a la presencia de grandes cantidades de secuencias repetitivas e intrones que al incremento en el nmero de genes. CROMOSOMAS Y CROMATINA Los genomas de los procariotas estn contenidos en cromosomas nicos, que normalmente son molculas de ADN circulares. Por el contrario, los genomas de los eucariotas estn compuestos por mltiples cromosomas, cada uno de los cuales contiene una molcula de ADN linear. Aunque el nmero y el tamao de los cromosomas varan considerablemente entre las especies, su estructura bsica es la misma en todos los eucariotas. El ADN de las clulas eucariotas est fuertemente unido a unas protenas bsicas pequeas (histonas) que empaquetan el ADN de manera ordenada en el ncleo de la clula. Esta caracterstica resulta primordial y se presenta en el ADN de la mayora de los eucariotas. Por ejemplo, la longitud total extendida del ADN en una clula humana es de unos 2 metros, pero este ADN debe caber en un ncleo con un dimetro de tan solo de 5 - 10 m. Cromatina El acomplejamiento entre el ADN eucaritico y las protenas histonas forman la cromatina, que contiene alrededor del doble de protena que de ADN. Las protenas principales en la cromatina son las histonas, pequeas protenas que contienen una gran proporcin de aminocidos bsicos (arginina y lisina) que facilitan la unin con la molcula de ADN cargada negativamente. Existen cinco tipos importantes de histonas; H1, H2A, H2B, H3 y H4, que resultan muy similares entre las diferentes especies eucariotas. Las histonas son tremendamente abundantes en las clulas eucariotas; su masa total resulta aproximadamente igual al ADN de la clula. Adems, la cromatina contiene aproximadamente una masa igual de una variedad de protenas cromosmicas diferentes a las histonas. Existen ms de un millar de tipos diferentes de estas protenas, que estn

implicadas en mltiples actividades, incluyendo la replicacin del ADN y la expresin gnica. De acuerdo con esta idea, la microscopia electrnica revel que las fibras de cromatina tienen una apariencia de collar de cuentas, con las cuentas separadas a intervalos de unas 200 pares de bases. Una digestin extensa de la cromatina con la nucleasa micrococal produca partculas (llamadas partculas centrales o cores del nucleosoma) que correspondan a las cuentas visibles por microscopia electrnica. Un anlisis detallado de estas partculas demostr que contienen 146 pares de bases de ADN enrolladas 1.65 veces alrededor del centro de histonas formado por dos molculas de H2A, H2B, H3 y H4 (las histonas del centro). Una molcula de la quinta histona, H1, se encuentra unida al ADN cuando entra en una partcula central o core del nucleosoma. Esto forma una subunidad de cromatina llamada cromatosoma, que est compuesto por 166 pares de bases de ADN envuelto alrededor del centro de histonas y sujeto en su lugar por H1 (una histona de enlace). El empaquetamiento del ADN con histonas produce una fibra de cromatina de aproximadamente de 10nm de dimetro y compuesta por cromatosomas separados por segmentos de enlace o linker de ADN de unas 80 pares de bases de longitud. En el microscopio electrnico, esta fibra de 10nm presenta la apariencia de un collar de cuentas que sugiere el modelo del nucleosoma. Empaquetar el ADN en una fibra de cromatina de 10nm reduce su longitud aproximadamente seis veces. La cromatina se puede condensar an ms enrollndola en fibras de 30nm, estructura que an no se ha conseguido determinar. Las interacciones con las histonas H1 parece ser que desempean un papel importante en esta etapa de la condensacin de la cromatina. En clulas en interfase (sin dividirse), la mayora de la cromatina (llamada eucromatina) se encuentra relativamente sin condensar y distribuida por todo el ncleo. Durante este periodo del ciclo celular, los genes se transcriben y el ADN se replica como preparacin para la divisin. La mayora de la eucromatina en los ncleos en interfase parece presentarse en forma de fibras de 30nm, organizadas en grandes lazos que contienen aproximadamente de 50 - 100 kb de ADN. Alrededor del 10% de la eucromatina, que contiene los genes que son transcritos activamente, se encuentra en un estado menos condensado (formacin en 10nm) lo que permite la transcripcin. Al contrario de la eucromatina, alrededor del 10% de la cromatina de la interfase (llamada heterocromatina) se encuentra en un estado muy condensado que recuerda a la cromatina de las clulas que llevan a cabo la mitosis. La heterocromatina es transcripcionalmente inactiva y contiene secuencias de ADN altamente repetitivas, como aquellas presentes en los centrmeros y telmeros. Cuando la clula entra en mitosis, sus cromosomas se condensan para poder ser distribuidos a las clulas hijas. Los lazos de fibras de cromatina de 30nm se cree que se doblan sobre s mismos para formar los cromosomas compactos de la metafase de las clulas mitticas, en las que el ADN se ha condensado cerca de 10,000 veces. Esta cromatina condensada no puede ser utilizada como molde para la sntesis de ARN, as que la transcripcin cesa durante la mitosis. Las micrografas electrnicas indican que el ADN en los cromosomas de la metafase est organizado en grandes lazos unidos a un andamio o escaln de protenas, aunque todava no se ha llegado a entender con detalle la estructura de la cromatina condensada ni el mecanismo de condensacin.

Los cromosomas de la metafase se encuentran en un estado de concentracin muy alto, tanto que su morfologa puede ser estudiada a travs del microscopio ptico. Centrmeros El centrmero es una regin especializa del cromosoma cuyo papel es asegurar la correcta distribucin de los cromosomas duplicados a las clulas hijas durante la mitosis. El ADN celular se duplica durante la interfase, resultando la formacin de dos copias de cada cromosoma antes de que comience la mitosis. Cuando la clula entra en mitosis, la condensacin de la cromatina conduce a la formacin de los cromosomas de la metafase que consisten en dos cromtidas hermanas idnticas. Estas cromtidas hermanas se mantienen unidas por el centrmero, el cual se considera como una regin cromosmica compacta. Una vez iniciada la mitosis, los microtbulos del huso mittico se adhieren al centrmero y las dos cromtidas hermanas se separan y se dirigen a los polos opuestos del huso. Al final de la mitosis, las membranas nucleares se restablecen y los cromosomas se descondensan, resultando en la formacin de los ncleos de las clulas hermanas que contienen una copia de cada cromosoma parental. Los centrmeros, por tanto, sirven como sitios de asociacin de las cromtidas hermanas y como sitios de unin para los microtbulos del huso mittico. Son secuencias especficas de ADN a las que se unen numerosas protenas de unin asociadas a los centrmeros, formando una estructura llamada cinetocoro. La unin de los microtbulos a las protenas del cinetocoro dirige la unin de los cromosomas al huso mittico. Telmeros Las secuencias situadas en los extremos de los cromosomas en eucariotas, son llamados telmeros, desempean un papel crtico en la replicacin y el mantenimiento del cromosoma. Los telmeros inicialmente se reconocieron como estructuras distintas ya que los cromosomas rotos eran altamente inestables en las clulas eucariotas, implicando la necesidad de secuencias especficas en las terminaciones cromosmicas normales. Las secuencias de ADN de los telmeros de los eucariotas son similares, presentando repeticiones de una secuencia simple de ADN que contiene grupos de residuos G en una hebra. Por ejemplo, la secuencia de las repeticiones de los telmeros en humanos y en otros mamferos es AGGGTT. Estas secuencias se repiten cientos o miles de veces, por lo que se extienden varias kilobases. Las secuencias repetidas del ADN telomrico forman bucles al final de los cromosomas adems de unir un cierto nmero de protenas que protegen los extremos del cromosoma de la degradacin. Los telmeros desempean un papel importante en la replicacin de los extremos de las molculas del ADN lineal. La ADN polimerasa es capaz de extender una cadena de ADN en crecimiento pero no puede iniciar la sntesis de una nueva cadena al final de una molcula lineal de ADN. Como consecuencia, los extremos de los cromosomas lineales no pueden ser replicados por la ADN polimerasa en condiciones normales. Este problema se ha solucionado mediante la evolucin de un mecanismo especial, que implica la actividad de la transcriptasa inversa, con el fin de replicar las secuencias de ADN telomrico. El mantenimiento de los telmeros parece ser un factor importante a la hora de determinar las expectativas de vida y la capacidad reproductiva

de las clulas, por lo que los estudios de los telmeros y de la telomerasa son prometedores al respecto de nuevos datos sobre cuestiones como el envejecimiento y el cncer. SECUENCIAS DE LOS GENOMAS COMPLETOS Algunos de los esfuerzos ms excitantes en la biologa molecular son los dirigidos actualmente hacia la obtencin y anlisis de las secuencias completas de nucletidos del genoma humano y de los genomas de diversos modelos de organismos, incluyendo a E. coli, Saccharomyces cerevisiae, Caenorhabditis elegans, Drosophila, Arabidopsis y el ratn. Los resultados de la secuenciacin de genomas completos nos han llevado ms all de la caracterizacin de genes individuales hasta una visin global de la organizacin y contenido gnico de genomas completos. En principio, este enfoque posee el potencial de identificar a todos los genes de un organismo, que por tanto, se volvern accesibles a investigaciones sobre su estructura y funcin. Sin embargo, aprender cmo interpretar una cantidad tan inmensa de datos generados por la secuenciacin de genomas completos supone nuevos retos, y ha dado lugar a una nueva rea de estudio denominada bioinformtica, que se encuentra en el interfaz entre la biologa y la informtica y est enfocada hacia el desarrollo de los mtodos computacionales necesarios para analizar y obtener informacin biolgica til, a partir de la secuencia de miles de millones de bases que componen un genoma tan grande como el humano. El genoma de Drosophila melanogaster Las ventajas de Drosophila para el anlisis gentico incluyen su genoma relativamente simple y el hecho de que puede ser mantenida y criada en el laboratorio. Adems, Drosophila aporta un instrumento especial para el anlisis gentico en los cromosomas politnicos gigantes que se encuentran en algunos tejidos como las glndulas salivales de la larva. Los cromosomas se forman en las clulas que no se dividen como consecuencia de la replicacin repetitiva de las hebras de ADN que no se pueden separar. Por tanto, cada cromosoma politnico contiene cientos de molculas de ADN idnticas alienadas en paralelo. Debido a su tamao, estos cromosomas politnicos son visibles al microscopio ptico y con tcnicas de tincin apropiadas se puede distinguir un patrn de bandas. El bandeo de los cromosomas politnicos proporciona un mayor grado de resolucin que el obtenido por los cromosomas de metafase. La complejidad de los organismos multicelulares no est simplemente relacionada con un mayor nmero de genes. Parte del incremento en la complejidad biolgica de Drosophila y C. elegans puede deberse al hecho de que sus protenas son en general ms grandes y contienen ms dominios funcionales que las protenas de levaduras.