Está en la página 1de 33
  • 240 CAPÍTULO NUEVE

ORGANIZACIÓN DEL GENOMA HUMANO

9 .1

Organización general del genoma humano

9.1.1 Generalidades del genoma humano

Genoma humano es el término que se utiliza para describir la infor­ mación genética total (contenido de DNA) de las células humanas. En realidad, comprende dos genomas: un genoma nuclear complejo con unos 30 000 genes y un genoma mitocondrial muy simple con 37 genes (fig. 9-1). El genoma nuclear proporciona el gran volumen de información genética esencial, que en su mayor parte especifica la síntesis de polipéptidos en ribosomas citoplásmicos. Las mitocondrias poseen ribosomas propios y los muy pocos ge­ nes del genoma mitocondrial que codifican polipéptidos producen mRNA que se traduce en los ribosomas mitocondriales. Sin embar­ go, el genoma mitocondrial sólo especifica una porción muy peque­ ña de las funciones mitocondriales específicas; el mayor volumen de los polipéptidos mitocondriales lo codifican genes nucleares y se sintetiza en ribosomas citoplásmicos, antes de llevarse al interior de las mitocondrias. Las comparaciones entre seres humanos y ratones demostraron que menos de 5% del genoma está conservado de forma notoria, incluido 1.5% para el DNA codificante y un porcentaje un poco mayor que comprende secuencias conservadas dentro de secuencias no traducidas, elementos reguladores, etc. (Mouse Genome Se­ quencing Consortium, 2002; Dermitzakis y cols., 2002). Casi todo el DNA codificante se emplea para elaborar mRNA y en conse­ cuencia polipéptidos, pero una minoría importante (cuando menos 5% y tal vez casi 10%) de los genes humanos especifica RNA no

codificante (es decir, no traducido) (genes RNA). En fecha recien­ te se identificó una diversidad de genes RNA nuevos, lo que obli­ gó a una revaloración de la función del RNA. Las secuencias codificantes pertenecen con frecuencia a familias de secuencias relacionadas (familias de secuencias de DNA) que pueden organizarse en grupos en uno o más cromosomas o disper­ sarse. Estas secuencias duplicadas surgieron por diversos mecanis­ mos de duplicación génica que ocurrieron en el transcurso de la evolución. La secuenciación del genoma proporcionó la primera valoración de la duplicación de todo el genoma y reveló una canti­ dad considerable de duplicación segmentaria específica de prima­ tes (como resultado de duplicaciones muy recientes se encuentran bloques de secuencias relacionados muy de cerca en diferentes cro­ mosomas o distintas regiones de un cromosoma aislado; sección 12.2.5 y fig. 12-13; véase Bailey y cois., 2002). Los mecanismos que dan lugar a genes duplicados también ori­ ginan secuencias no funcionales relacionadas con el gen, entre ellas seudogenes y fragmentos génicos (sección 9.3.6). Existen numero­ sas copias defectuosas de genes RNA diseminadas en la totalidad del genoma; asimismo, para algunos genes que codifican polipépti­ dos también se encuentran muchos genes relacionados: análisis de las secuencias terminadas de los cromosomas 21 y 22 predicen un total cercano a 20 000 genes en el genoma (Harrison y cois., 2002; Collins y cois., 2003). Al igual que en otros genomas complejos, un componente muy considerable del genoma humano está constituido por DNA no co­ dificante. Un componente valorable está organizado en repeticio­ nes tándem de cabeza a cola (->-*-> ~f), pero la mayor parte consiste en repeticiones dispersas que se originaron de transcritos de RNA

1.5%

-3%

-5% <2%

G en om a

n u c le a r

(24 mo lé cu la s de DNA lineai de d o b le cadena, 3 200 Mb; genes)

-3 0 000

Fig. 9-1. Organización del genoma humano.

 

I

I Muy conservado (codificación) Muy conservado (otros)

I

I Repeticiones basadas en transposón

d

] Heterocromatina

I

I Otros no conservados

G en o m a

m ito co n d ria l

(un DNA c irc u la r de d o b le cadena d e 16.6 kb; 37 genes)

La linea punteada en la parte media representa el tamaño relativo del genoma mitocondrial mediante la misma escala para el genoma nuclear. Obsérvese asimismo la diferencia notable entre los dos genomas en la extensión del DNA muy conservado (secuencia de codificación, secuencia reguladora, etc.) y la fracción de DNA no codificante muy repetida.

9.1

I ORGANIZACIÓN GENERAL DEL GENOMA HUMANO

2

por retrotransposición (las transcriptasas inversas celulares pueden copiar transcritos de RNA para elaborar cDNA natural que puede integrarse en cualquier parte del genoma).

9.1.2 El genoma mitocondrial consiste en un dúplex de DNA circular pequeño empacado a densidad con información genética

Estructura general y herencia del genoma mitocondrial

El genoma mitocondrial humano está definido por un tipo único de DNA circular de doble cadena cuya secuencia completa de nu- deótidos ya se estableció (Anderson y cois., 1981; véase asimismo la base de datos del genoma mitocondrial Mitomap en http://www. mitomap.org/). Tiene 16 569 pb de largo y 44% de extensión (G — C). Las dos cadenas de DNA tienen composiciones de bases di- rerentes en grado notable: la cadena pesada (H, del inglés heavy) s rica en guaninas, la cadena ligera (L, del inglés light) es abun­ dante en citosinas. Aunque el DNA mitocondrial es en especial de ¿oble cadena, una sección pequeña muestra una estructura de

DNA de cadena triple debido a la síntesis repetida de un segmen­ to corto de la cadena pesada de DNA, el DNA 7S (véase fig. 9-2 y Clayton, 1992, para una revisión general de la transcripción y re- plicación de DNA mitocondriales en animales). De manera carac­ terística, las células humanas contienen miles de copias de la molécula de DNA mitocondrial de doble cadena, pero la cifra pue­ de variar de forma considerable en diferentes tipos de células (véa­ se recuadro 9-1). Durante la formación del cigoto, el espermatozoo contribuye al óvulo con su genoma nuclear pero no con el mitocondrial. En con­ secuencia, al genoma mitocondrial del cigoto lo determina de ma­ nera exclusiva el que se encuentra de modo original en el óvulo no fecundado. Por consiguiente, el genoma mitocondrial es de heren­ cia materna-, los varones y las mujeres heredan sus mitocondrias de la madre pero los varones no las transmiten a las generaciones sub­ secuentes. Por esta razón, los genes o las variantes de DNA codifi­ cados de forma mitocondrial suministran el patrón de genealogía que se muestra en la figura 4-4. Durante la división celular mitóti- ca, las moléculas de DNA mitocondrial de la célula en división se segregan en una forma aleatoria a las dos células hijas.

Rg. 9-2. Genoma mitocondrial humano.

 

Clave:

 

0 H, 0 L, origen y dirección de la síntesis de las cadenas pesada y ligera

PH, PL, origen y dirección de la transcripción de las cadenas pesada y ligera

Genes rRNA

 
 

I

Genes tRNA

 

Genes que c o d ific a n proteínas

—•—— —i—g———----- - "

E asa D tiene una estructura de triple cadena debido a la síntesis duplicada de una tira de la cadena pesada (H, del inglés heavy). La transcripción de ¿ cadena pesada se origina a partir de dos promotores espaciados cercanos en la región del asa D (agrupados por razones de claridad como PH). _a transcripción de los promotores PH sigue la dirección dextrógira alrededor del círculo, pero en sentido levógiro del promotor PL de cadena ligera. Et ambos casos se cortan los transcritos primarios grandes a fin de generar RNA para genes individuales. Todos los genes carecen de intrones y están agrupados muy de cerca con un caso de genes superpuestos: el gen de ATP-asa 8 cubre de modo parcial al gen de ATP-asa 6 (véase fig. 9-3). Otros jsnes que codifican polipéptldos especifican siete subunldades de deshidrogenasa NADH (ND4L y ND1-ND6)', tres subunldades de oxldasa de atocromo c (C01-C03) y citocromo b (CYB).

  • 242 CAPÍTULO NUEVE

ORGANIZACIÓN DEL GENOMA HUMANO

Recuadro 9 -1 . Variación

del n úm e ro

de

c o p ia s

d e l

g e n om a

en c é lu la s hum anas

Con frecuencia, los libros de texto indican que las células de un organis­ mo muestran poca variación en su contenido de DNA y ello es sin duda cierto cuando se compara con el contenido de RNA o proteínas. No obs­ tante, puede haber diferencias notorias en el contenido de mtDNA y el de DNA nuclear en diferentes tipos de células.

► Variación del número de copias del genoma mitocondrial. Ciertas células (p. ej., células de la piel diferenciadas de forma terminal) ca­ recen de cualquier mitocondria y por consiguiente no tienen mtDNA. El número de copias de mtDNA en otras células somáticas varía pe­ ro, de manera característica, es de 1 000 a 10 000 (p. ej., los M o c i­ tos poseen alrededor de 1 000 moléculas de mtDNA). Los gametos son excepcionales: las células espermatozoos tienen unos cuantos cientos de copias de mtDNA y los oocitos tal vez 100 000, lo que constituye más de 30% del DNA del oocito.

► Variación del número de copias del genoma nuclear. Las células nucleadas (diploldes) muestran poca variación en el contenido de

DNA, pero la ploidía diferencial significa que en algunas células hay divergencias sustanciales en el contenido de DNA: nuliploidia -célu­ las que carecen en lo absoluto de DNA, tal y como se observa en mu­ chos tipos de células diferenciadas de modo terminal, como eritrocitos (que no tienen núcleo) y células de la piel diferenciadas de modo terminal (sin organelos)-; haploidia -existe la mitad del conteni­ do de DNA de las células diploides en las células óvulo y espermato­ zoo-; poliploidía -algunas células tienen de manera natural muchas copias del juego normal de cromosomas como resultado de replica- ción endomitótica (en la cual las células llevan a cabo varias rondas de duplicación de DNA pero sin ninguna división celular; p. ej., las cé­ lulas de regeneración del hígado y otros tejidos son tetraploides de manera natural y los megacariocitos gigantes de la médula ósea pue­ den contener hasta 16 veces la cantidad de DNA de células diploides), o como efecto de fusión celular sincitial (p. ej., las células de las fibras musculares se forman por fusión de múltiples células y dan lugar a células únicas con múltiples núcleos; véase fig. 3-3).

Genes mitocondriales

El genoma mitocondrial humano consiste en 37 genes. En 28 de ellos, la cadena pesada es la cadena de sentido; en los otros nueve, la cadena de sentido es la ligera (fig. 9-2). De los 37 genes, un to­ tal de 24 especifica un producto RNA maduro: 22 moléculas de tRNA mitocondrial y dos moléculas de rRNA mitocondrial; un rRNA 23S (un componente de la subunidad grande de los riboso- mas mitocondriales) y un rRNA 16S (un componente de la subu­ nidad pequeña de los ribosomas mitocondriales). Los 13 genes restantes codifican polipéptidos que se sintetizan en ribosomas mi­ tocondriales. Cada uno de los 13 polipéptidos codificados por el genoma mi­ tocondrial es una subunidad de uno de los complejos respiratorios mitocondriales, las enzimas de múltiples cadenas de la fosforila­ ción oxidativa que están encargadas de la producción de ATP. Sin embargo, existen casi 100 diferentes subunidades polipéptidas en el sistema mitocondrial de fosforilación oxidativa y por lo tanto la in­ mensa mayoría la codifican genes nucleares (véase recuadro 9-2). El genoma nuclear codifica a todas las otras proteínas mitocondriales y se traducen en ribosomas citoplásmicos antes de llevarse al inte­ rior de las mitocondrias (recuadro 9-2; fig. 1-11).

Código genético mitocondrial

El código genético mitocondrial se usa para descodificar los trans­ critos de cadenas pesada y ligera a fin de proporcionar un total de sólo 13 polipéptidos. Esta carga funcional muy pequeña permitió que el código genético mitocondrial derivara del código genético “universal” (que retienen los genes nucleares por la necesidad de conservar las funciones de los 30 000 genes). Hay 60 codones mi­ tocondriales de sentido, uno menos que en el código genético nu­ clear, y cuatro codones de detención, dos de los cuales, UAA y UAG, sirven asimismo como codones de detención en el código ge­ nético nuclear, pero los otros dos son AGA y AGG y especifican ar- ginina en el código genético nuclear (véase fig. 1-22). UGA codifica triptófano en lugar de servir como codón de detención y AUA especifica metionina no isoleucina.

El genoma mitocondrial codifica todas las moléculas de rRNA y tRNA que necesita para sintetizar proteínas, pero se basa en los genes codificantes nucleares para proporcionar todos los otros com­ ponentes (como los componentes proteínicos de ribosomas mito­ condriales, sintetasas de aminoacil-tRNA, etc.). Puesto que sólo existen 22 tipos diferentes de tRNA mitocondrial humano, las mo­ léculas de tRNA individuales deben estar disponibles para interpre­ tar varios codones distintos. Ello es posible por el bamboleo de la tercera base en la interpretación del codón. Ocho de las 22 mo­ léculas de tRNA tienen anticodones que son capaces de reconocer

familias de cuatro codones que sólo difieren en la tercera base y 14 reconocen pares de codones que son idénticos en las posiciones de las dos primeras bases y comparten una purina o una pirimidina en la tercera base. Por consiguiente, entre ellas, las 22 moléculas de tR­ NA mitocondrial pueden reconocer un total de 60 codones [(8 X

4)

+

(14

X 2)].

Además de sus diferencias en la capacidad genética y distintos códigos genéticos, los genomas mitocondrial y nuclear difieren en muchos otros aspectos de su organización y expresión (cuadro 9-1).

DNA codificante y no codificante

A diferencia de su contraparte nuclear, el genoma mitocondrial hu­ mano es muy compacto: alrededor de 93% de las secuencias de DNA representa secuencias codificantes. Todos los 37 genes mito­ condriales carecen de intrones y están empacados de forma estrecha (en promedio uno por 0.45 kb). Las secuencias codificantes de al­ gunos genes (en especial los que codifican las subunidades seis y ocho de la ATP-asa mitocondrial) muestran cierta superposición (figs. 9-2 y 9-3) y en casi todos los otros casos las secuencias codifi­ cantes de genes vecinos están contiguas o separadas por una o dos bases no codificantes. Algunos genes carecen incluso de codones de terminación; con la finalidad de superar esta deficiencia, tienen que introducirse codones UAA a nivel postranscripcional (Anderson y cois., 1981; véase la fig. 9-3). La única región importante conocida que carece de algún DNA codificante es la región de desplazamiento del asa (D). Esta es la región en que se genera una estructura de DNA de cadena triple

9.1

ORGANIZACIÓN GENERAL DEL GENOMA HUMANO

243

Recuadro 9-2. Autonomía limitada del genoma mitocondrial

----------------------------------------------------

Componente mitocondrial

Codificado por el genoma mitocondrial

Componentes del sistema de fosforilación oxidativa

13 subunidades

I Deshidrogenasa de NADH 7 subunidades

 

Reductasa de succinato de CoQ

0 subunidades

i

Complejo citocromo b-c 1

1 subunídad

V Complejo de oxidasa c de citocromo

3 subunidades

. Complejo de sintasa de ATP

2 subunidades

Componentes del aparato de síntesis de proteínas

24

Componentes rRNA

2 rRNA

Componentes tRNA

22 tRNA

Proteínas ribosómicas

Ninguna

Otras proteínas mitocondriales

Ninguna

Codificado por el genoma nuclear

>

80 subunidades

> 41 subunidades 4 subunidades 10 subunidades 10 subunidades 14 subunidades Cerca de 80 Ninguno Ninguno Cerca de 80

Todas (p. ej., polimerasas de DNA y RNA mitocondriales aunadas a muchas otras enzimas, proteínas estructurales y de transporte, etc.)

Cuadro 9 -1. Genomas nuclear y mitocondrial humanos.

Tamaño Número de diferentes moléculas de DNA '

mero

total de moléculas de DNA por célula

Proteina relacionada

\jm e ro de genes

Zensidad génlca

DNA repetido

Tfanscripción

nrones S de DNA de codificación

.so de codón : ecombinación

-terencia

Genoma nuclear

3 200 Mb

  • 23 (en células XX) o 24 (en células XY); todo lineal

  • 46 en células dlploides, pero varía según sea

la ploidia Varias clases de proteínas histona y no histona

- 3 0 000-35 000

-1 /1 0 0 kb Más de 50% del genoma, véase figura 9-1

El mayor volumen de genes se transcribe de modo individual (unidades de transcripción monocistrónicas)

Se encuentra en la mayor parte de los genes

-1.5%

Véase figura 1-22

Cuando menos una vez por cada par de meiosis homologa

Mendellana para secuencias en X y autosomas; paterna para secuencias en Y

Genoma mitocondrial

16.6 kb

Una molécula de DNA circular

Con frecuencia varios miles (pero variable; véase recuadro 9-1)

Gran parte sin proteínas

37

1/0.45 kb

Muy poco

Con transcripción de múltiples genes de cadenas pesada y ligera (unidades de transcripción policistrónicas)

No hay

-9 3% Véase figura 1-22

No es obvia

Materna de manera exclusiva

?•:: la síntesis duplicada de una pieza corta de DNA de cadena H, que se conoce como DNA 7S (véase fig. 9-2). La replicación de las hienas H y L es unidireccional y se inicia en sitios de origen espe­ je o s . En la primera, es en el asa D y sólo después de sintetizarse --i- dos tercios de la cadena H (mediante la cadena L como plan­ tilla y tras desplazar la cadena H antigua) se expone el origen para la replicación de la cadena L. Con posterioridad, prosigue la repli­

cación de la cadena L en la dirección opuesta y emplea como plan­ tilla la cadena H (fig. 9-2). El asa D contiene también el promotor predominante para la transcripción de las cadenas H y L. A dife­ rencia de la transcripción de genes nucleares, en la que casi siempre se transcriben por separado genes individuales con promotores se­ parados, la transcripción del DNA mitocondrial se inicia desde los promotores en la región del asa D y continúa en direcciones opuestas.

  • 244 CAPÍTULO NUEVE

ORGANIZACIÓN DEL GENOMA HUMANO

I--------------------ATP-asa8 -

8 366

 

8 522

8 577 9 202 9 206

 

1

53

68

M e t

 

Pro

Lis

Trp

Tre

Lis

lie

Cis

S er

Leu His Ser Leu

Pro Pro Gln

Ser

D e tención

 

)

a

t g

\

c c Á a a a t g a a c g a a a a t c t g t t c g c t t c a t t c a t t g c c c c c a c a a t c c t a g g c c t a

ACATA $

 

Glu Asn Leu

Fe

A la

Ser Fe

lie

Ala

Pro

Tre

lie

Leu

Gli

Leu

Tre

¿

M e tA s n -I

 

17

226

I-------------------- ATP-asa 6 ----------------------------------------------------------------------------------------------------►

Fig. 9-3. Los genes de las subunidades 6 y 8 de ATP-asa mitocondrial se superponen y traducen de manera parcial en diferentes marcos de lectura.

Nota: los genes superpuestos comparten una cadena en sentido común, la cadena H. Las coordenadas de la secuencia de codificación son las siguientes:

subunidad 8 de ATP-asa, 8 366-8 569; subunidad 6 de ATP-asa, 8 527-9 204. La terminal C del gen de la subunidad 6 de ATP-asa está definida por la introducción postranscripcional de un codón UAA: después de la transcripción se corta el RNA más allá de la posición 9 206 y se poliadenila y el resultado es un codón UAA en el que los dos primeros nucleótidos derivan de TA en las posiciones 9 205-9 206 y el tercer nucleótido es la primera A de la cola poli(A). Se sabe que otros genes humanos están superpuestos, pero con frecuencia se transcriben a partir de cadenas opuestas.

para las dos cadenas diferentes, alrededor del círculo a fin de gene­ rar grandes transcritos multigénicos (véase fig. 9-2). De forma sub­ secuente, se generan los RNA maduros por el corte de transcritos multigénicos.

9.1.3 El genoma nuclear consiste en 24 moléculas de DNA diferentes que corresponden a los 24 cromosomas humanos distintos

Tamaño y estructura de los cromosomas humanos

De forma característica, el núcleo de una célula humana contiene más de 99% del DNA celular (excepto algunas células especializa­ das, sobre todo el oocito; véase el recuadro 9-1). El genoma nuclear está distribuido entre 24 tipos distintos de moléculas de DNA li­ neal de doble cadena, cada una de las cuales tiene histonas y otras proteínas no histona enlazadas a ellas para conformar un cromoso­ ma. Los 24 diferentes cromosomas (22 tipos de autosomas y dos cromosomas del sexo, X e Y) pueden distinguirse con facilidad con las técnicas de bandeo cromosómico (fig. 2-15) y en gran parte se clasificaron en grupos de acuerdo con el tamaño y, en cierto grado, con la posición del centrómero (cuadro 2-3). El DNA seleccionado para secuenciación en el Proyecto del Ge­ noma Humano no fue el genoma nuclear total, sino la porción eu- cromática, que comprende casi 3 000 Mb. También existen más de

  • 200 kb de heterocromatina constitutiva condensada de manera

permanente y en regiones inactivas en sentido transcripcional, que proporcionan un tamaño total del genoma del orden de 3 200 Mb. Por consiguiente, el tamaño promedio de un cromosoma humano se aproxima a 140 Mb, pero con una variación considerable entre los cromosomas y cantidades variables de heterocromatina consti­ tutiva (cuadro 9-2). La última comprende segmentos de alrededor de 3 Mb en cada centrómero además de componentes grandes en varios cromosomas, incluidos los brazos cortos de los cromosomas acrocéntricos 13, 14, 15, 21 y 22, el brazo largo del cromosoma Y y las regiones grandes de los brazos largos de los cromosomas 1, 9 y 16 (que corresponden a constricciones cromosómicas secundarias-, véase cuadro 9-2 y fig. 2-15 para una visión gráfica).

Composición de bases del genoma nuclear humano

El esquema de las secuencias del genoma humano (International Human Cenóme Sequencing Co'nsortium, 2001; Venter y cois., 2001) sugiere un promedio de 41% de GC de la extensión del genoma para el componente de eucromatina. Sin embargo, la composición de bases varía en grado considerable entre los cromosomas, de 38% de GC para los cromosomas 4 y 13 hasta 49% en el cromosoma 19. De igual modo, varía con amplitud a lo largo de los cromoso­ mas. Por ejemplo, el contenido promedio de GC en el cromosoma 17q es de 50% en las 10.3 Mb distales pero disminuye a 38% en las 3.9 Mb adyacentes. Existen regiones de menos de 300 kb con variaciones incluso más amplias del contenido de GC, por ejemplo de 33.1 a 59.3%. Hay una correlación clara entre la composición de GC y el grado de tinción con Giemsa durante el bandeo cromosómico. Por ejem­ plo, 98% de las clonas de inserto grande que mapean las bandas G más oscuras está en regiones de 200 kb con un contenido bajo de GC (promedio de 37%), mientras que más de 80% de las clonas que ma­ pean las bandas G más claras se halla en regiones de alto contenido de GC (promedio de 45%). Sin embargo, los análisis de datos no apoyan la existencia de isócoros estrictos, que se definen como regio­ nes a gran escala de composición homogénea y se clasifican en cinco grupos, según sea el diferente porcentaje de composición de GC (In­ ternational Human Genome Sequencing Consortium, 2001). La proporción de algunas combinaciones de nucleótidos puede variar en grado considerable. Por ejemplo, al igual que otros genomas nucleares de vertebrados, el genoma nuclear humano tiene una esca­ sez notable del dinucleótido CpG (es decir, próximo a residuos de ci- tosina y guanina en la misma cadena de DNA en la dirección 5' 3'; “p” indica enlace fosfodiéster). Al tomar en cuenta la cifra promedio total de 41% de GC, las frecuencias de bases individuales son C = G = 0.205 y, por consiguiente, la frecuencia esperada del dinucleóti­ do CpG es (0.205)2 = 0.042. Sin embargo, la frecuencia de CpG ob­ servada se aproxima a la quinta parte. A pesar de la falta general de CpG, ciertas regiones pequeñas de DNA activas en sentido transcrip­ cional tienen la densidad esperada de CpG y, de manera importante, no están metiladas (islotes CpG, véase recuadro 9-3).

9.1

I ORGANIZACIÓN GENERAL DEL GENOMA HUMANO

245

Cuadro 9-2. Contenido de DNA de cromosomas humanos.

Cromosoma

Cantidad total

Cantidad de

Cromosoma

Cantidad total

Cantidad de

de 0NA (Mb)

heterocromatina (Mb)

de DNA (Mb)

heterocromatina (Mb)

  • 1 279

30

13

118

16

  • 2 251

3

14

107

16

  • 3 221

3

15

100

17

  • 4 197

3

16

104

15

  • 5 198

3

17

88

3

  • 6 176

3

18

86

3

  • 7 163

3

19

72

3

  • 8 148

3

20

66

3

  • 9 140

22

21

45

11

  • 10 143

3

22

48

13

  • 11 148

3

X

163

3

  • 12 142

3

Y

51

27

Datos resumidos del International Human Genome Sequence Consortium (2001). Al utilizar estas cifras, el tamaño del genoma humano total es de 3 289 Mb, pero se sabe que esta cifra (y las cantidades totales de cromosomas individuales) incluye algunas duplicaciones artefactuales; un valor más realista podría ser ~ 3 200 Mb.

9.1.4 El genoma humano contiene alrededor de 30 000 a 35 000 genes distribuidos de forma irregular pero las cifras son inexactas

Número de genes humanos

En la actualidad se piensa que la cifra total de genes del genoma hu­ mano oscila entre 30 000 y 35 000. Dado que con excepción de 37 de ellos todos se localizan en el genoma nuclear, esto proporciona un estimado general de 1 400 genes por cromosoma en promedio. La gran mayoría de estos genes codifica polipéptidos, pero una mi­ noría importante (cuando menos 5% y tal vez alrededor de 10%) especifica moléculas de RNA no traducidas (sección 9.2). El International Human Genome Sequencing Consortium (2001) v Venter y colaboradores (2001) estimaron 30 000 a 40 000 y 26 000 a 38 000 genes, respectivamente, aunque apoyaron las predicciones más cercanas a las cifras inferiores de estos límites. Estos cálculos fueron mucho más bajos que los anteriores basados en grupos de datos incompletos (véase sección 8.3.5), pero hay una gran incer- ridumbre acerca del número preciso de genes. En primer lugar, existen dificultades generales para identificarlos. Cuando se publicó el esquema de secuencias del genoma en el año 2001, se identifi­ caron con seguridad alrededor de 11 000 genes y mediante análisis de secuencias basados en computadora se predijeron muchos miles más. La predicción de genes que codifican polipéptidos basada en computadora suele ser muy útil, pero no siempre es segura (falso- positivos y falta de precisión en la identificación de exones genui- nos; véase Zhang, 2002). Es en especial mala la predicción de genes RNA basada en computadora; véase la sección 8.3.5.

La cifra de genes humanos comparativamente baja fue una sor­

presa. Después de todo, en el

gusano redondo de 1 mm de largo,

muy simple, Caenorhabditis elegans (que consiste sólo en 959 célu­ las somáticas y tiene un genoma de una trigésima parte del tamaño del genoma humano), se demostró con anterioridad que posee

19 099 genes que codifican polipéptidos y más de 1 000 genes RNA (consorcio de secuenciación de C. elegans, 1998). Es posible que la complejidad del genoma no siempre sea paralela a la com­

plejidad biológica (Drosophila melanogaster tiene

de manera sustan­

cial menos genes que C. elegans), pero los genomas secuenciados de invertebrados (p. ej., insectos, gusanos redondos, erizo de mar) tienden a mostrar un orden de 14 000 a 20 000 genes, en tanto que los vertebrados (seres humanos, ratón, pez soplador, etc.) se incli­ nan hacia una cifra aproximada de 30 000 a 35 000 (véase cuadro 12-4). También suele explicarse la baja cifra inesperada de genes a partir del incremento muy grande de la complejidad transcripcio- nal que se esperaría a medida que aumenta el número de genes, por ejemplo de 20 000 a 30 000 (Claverie, 2001) y la complejidad adi­ cional que cabe esperar por la frecuencia mayor de empalme (corte y unión) alternativo en genomas complejos (Maniatis y Tasic, 2002; véase sección 10.3.2).

Distribución de genes humanos

Los genes humanos no están distribuidos de manera uniforme en los cromosomas. Las regiones constitutivas de heterocromatina ca­ recen de genes pero incluso dentro de la porción eucromática del genoma puede variar de manera sustancial la densidad génica entre regiones cromosómicas y asimismo en los cromosomas completos.

  • 246 CAPÍTULO NUEVE

ORGANIZACIÓN DEL GENOMA HUMANO

Recuadro 9-3.

M e tila c ió n

d e l

D NA

e

islotes CpG

Es probable que la metilación del DNA tenga sitios biológicos diferentes. En algunas especies, como la levadura S. cerevisiae y el gusano redondo C. elegans, al parecer no ocurre en absoluto; en muchas otras tiene sitios relevantes. En bacterias, la metilación del DNA se restringe en gran parte a una proporción de residuos adenina y citosina y quizá actúa como un mecanismo de defensa del huésped: las endonucleasas de restricción de la célula huésped reconocen y cortan DNA fago invasor (no metilado) en

secuencias de tecot\oc\m\en\o especificas, peto \as mismas secuencias

en el DNA huésped están metiladas de forma especifica y por consiguien­ te protegidas de segmentación (véase recuadro 5-2).

Cuando ocurre en metazoarios (animales multicelulares), la metilación del DNA suele incluir la metilación de una proporción de residuos de citosina, con 5-metilcitosina (Cm) resultante. En D. melanogaster, la cantidad de metilación de DNA es muy baja y casi toda la 5-metilcitosina se encuen­ tra en dinucleótidos CpT (Cmpt). En otros animales, el dinucleótido CpG es un blanco común para la metilación de citosina mediante metiltransfe- rasas de citosina específica y forma CmpG (véase figura, grupo A). Los genomas de la mayor parte de los Invertebrados -aparte de Drosophila- tienen valores moderadamente altos de CmpG que se encuentra concen­ trado en dominios grandes de DNA metilado separado por dominios tam­ bién grandes de DNA no metilado (metilación en mosaico).

Los vertebrados muestran los valores más altos de 5-metilcitosina en el reino animal y en este caso la metilación está diseminada en la totalidad del genoma. Se sabe que la metilación del DNA tiene consecuencias im­ portantes para la expresión génica y permite que patrones particulares de ella se transmitan de manera estable a células hijas (sección 10.4.2). Se ha sugerido asimismo que proporciona una forma de defensa de huésped contra transposones (sección 10.4.3). Aunque la metilación está disemi­ nada en la totalidad del genoma de vertebrados, sólo un porcentaje pe­ queño de citosinas está metilado (alrededor de 3% en el DNA humano, sobre todo como CmpG con un porcentaje pequeño como CmpNpG, en el que N es cualquier nucleótido).

Desde el punto de vista químico, la 5-metilcitosina es inestable y propen­ sa a desaminación, lo que tiene como resultado timina (véase la figura, grupo A). Las otras bases también son propensas a desaminación (p. ej„ la citosina no metilada es proclive a la desaminación para formar uraci- lo). Durante periodos prolongados de la evolución disminuyó de manera gradual el número de dinucleótidos CpG en el DNA de vertebrados debi­ do a la conversión lenta pero constante de CpG en TpG (y en CpA en la cadena complementaria). Aunque la frecuencia total de CpG en el geno­ ma de vertebrados es baja, hay tiras pequeñas de DNA no metilado que se caracterizan por tener la frecuencia CpG esperada normal. Estos Islo­ tes de densidad de CpG normal (islotes CpG) son en términos compara­ tivos abundantes en GC (de manera característica más de 50% de GC) y

HN

/

c

\

C

- C H ,

 

CH

NH

T im in a

(formas de incompatibilidad con G; reconocida de manera ineficiente por el sistema de reparación del DNA)

A) La citosina en los dinucleótidos CpG es un blanco para metilación en el carbono 5 y forma 5-metilcitosina.

Esta última se desamina de forma espontánea para formar timina (T), a la que reconoce de manera insuficiente el sistema de reparación del DNA y por tanto tiende a persistir (empero, la desaminación de citosina no metilada forma uracilo, al que sí reconoce el sistema de reparación del DNA). El dinucleótido CpG de los vertebrados se sustituye de modo gradual por TpG y CpA.

se extienden cientos de nucleótídos, con frecuencia al marcar los extre­ mos 5' de genes. Cuando se filtró el esquema de la secuencia del geno­ ma humano para eliminar secuencias de DNA no codificante repetidas con número alto de copias, se identificaron alrededor de 30 000 islotes CpG (International Human Genome Sequencing Consortium, 2001).

9.2

ORGANIZACIÓN, DISTRIBUCIÓN Y FUNCIÓN DE GENES RNA HUMANOS

247

La primera información general sobre la distribución de genes en el genoma completo se obtuvo después de hibridar fracciones de islo­ tes CpG purificados del genoma a cromosomas en metafase. Con base en lo anterior, se concluyó que la densidad génica debe ser al­ ta en regiones subteloméricas y que algunos cromosomas (p. ej., 19 y 22) tienen abundancia de genes en tanto que otros (como X, 18) son escasos en ellos (fig. 8-4). Las predicciones de la densidad dife­ rencial de islotes CpG y génica se confirmaron más adelante cuan­ do se publicaron esquemas de secuencias que incluían alrededor de 90% del genoma (International Human Genome Sequencing Con- sortium, 2001). La diferencia en el porcentaje de GC entre las bandas pálidas y oscuras con Giemsa indica asimismo densidades génicas diferencia­ les porque los cromosomas (p. ej., el 19) y las regiones (como las bandas G pálidas) abundantes en GC también son comparativa­ mente abundantes en genes. Por ejemplo, el complejo de antígeno de leucocitos humanos (HLA) ricos en genes (180 genes en un tra­ mo de 4 Mb) está localizado dentro de la banda pálida 6p21.3, en tanto que una completa de 2.4 Mb de DNA que al parecer está de­ dicada casi de modo exclusivo al gen único mammoth, el gen de la distrofina, está situada dentro de una banda G oscura.

9 .2

Organización, distribución y función de genes RNA humanos

Aunque la gran mayoría de los genes humanos codifica polipépti- dos (sección 9.3), una minoría significativa especifica moléculas de RNA no codificante (esto es, no traducidas) como su producto fi­ nal y también se describen como genes RNA (Eddy, 2001; Hutten- hofer y cois., 2002; Storz, 2002; véase asimismo la base de datos de RNA no codificante en http://biobases.ibch.poznan.pl/ncRNA/). El genoma mitocondrial es excepcional porque 65% (24/37) de los genes especifica moléculas RNA maduras pero incluso en el geno­ ma nuclear tal vez haya alrededor de 3 000 genes RNA, que cons­ tituyen casi 10% del número total de genes (fig. 9-4). Es probable que los estimados actuales del número de genes RNA sean conservadores (por la dificultad para identificar genes RNA en DNA secuenciado; véase sección 8.3.5). En análisis amplios de transcritos de ratón (sección 9.2.3) y en los basados en microcon- figuraciones de transcritos de los cromosomas humanos 21 y 22 (Kapranov y cois., 2002) se interpretó que sugieren muchos más trans­ critos que los esperados por las cifras génicas previstas. Además de los genes RNA, hay muchos fragmentos de seudogenes/genes rela­ cionados, en especial en los genes RNA transcritos por la polime- rasa 111 de RNA. En común con otros genomas celulares, la mayor parte de los genes RNA conocidos está dedicada a elaborar moléculas que ayu­ dan en el proceso general de expresión génica (fig. 9-4). Algunos, de forma notable las familias rRNA y tRNA, participan en la traduc­ ción de mRNA. Muchas otras familias de RNA están relacionadas con la maduración del RNA e incluyen corte y modificación específica de bases de otras moléculas de RNA (mRNA, rRNA, tRNA y otras especies de RNA). Además, en fecha reciente se identificó un nú­ mero notorio de otros genes RNA que pertenecen a diferentes cla­ ses de RNA. Muchos tienen, o se espera que tengan, funciones reguladoras de importancia y resaltan la diversidad funcional muy considerable de las moléculas de RNA (cuadro 9-3; sección 9.2.3).

-100

-2 0 0

M

-1 7 5

175

•250

I snoRNA

H

f

snRNA

miRNA

I

I rRNA

[

I tRNA

E 3

RNA

antisentido

500

Fig. 9-4. Genes RNA humanos de acuerdo con la clase.

La mejor estimación (hacia mediados del año 2003) era de más de 3 000 genes RNA humanos distribuidos entre las diferentes clases que se muestran. Nota: a) por razones operacionales (véase texto), el esquema de las secuencias del genoma humano excluyó grupos génicos rRNA y las cifras que se proporcionan se estimaron a partir de otros datos; 6) debido a la dificultad para identificar genes RNA (véase sección 8.3.5), es posible que el número de algunas categorías de RNA pequeñas, como los miRNA, sean grandes subestimaciones; c) la cifra predicha de genes RNA antlsentido se basa en datos de Collins y colaboradores (2003) y está apoyada por análisis equivalentes en el ratón (véase FANT0M Consortium y el RIKEN Genome Exploration Research Group Phase I & II Team, 2002).

  • 9.2.1 Un total de casi 1 200 genes humanos codifican rRNA o tRNA y están organizados sobre todo en grupos génicos grandes

Genes RNA ribosómicos (rRNA)

Existen alrededor de 700 a 800 genes rRNA humanos, organizados en particular en grupos de repetición tándem y muchos seudogenes relacionados. Las familias multigénicas homogéneas que ocurren en arreglos tándem están representadas menos en el esquema de se­ cuencias del genoma humano (debido a la selección de enzimas de restricción utilizadas en la elaboración de genotecas de BAC y la de­ cisión para posponer la secuenciación de BAC con huellas digitales de baja complejidad que indican DNA de repetición tándem). Co­ mo resultado, podría suponerse el número preciso de genes rRNA a partir del esquema de secuencias del genoma humano. Además de las moléculas mitocondriales de rRNA 16S y 23S, existen cuatro tipos de tRNA citoplásmico, tres vinculados con la subunidad ribosómica grande (rRNA 28S, 5.8S y 5S) y uno con la subunidad ribosómica pequeña (rRNA 18S). De ellos, a los rRNA 28S, 5.8S y 18S los codifica una utiidad de transcripción única (véase fig. 10-2) que está organizada en cinco grupos, cada uno con 30 a 40 repeticiones tándem, localizados en los brazos cortos de los cromosomas humanos 13, 14, 15, 21 y 22. Los genes rDNA 5S ocurren asimismo en configuraciones tán­ dem, de las cuales la más grande se encuentra en los cromosomas lq4l-42, cerca del telómero. Existen 200 a 300 genes 5S verdaderos en estos arreglos pero al parecer hay muchos seudogenes dispersos. La

  • 245 CAPÍTULO NUEVE

ORGANIZACIÓN DEL GENOMA HUMANO

Cuadro 9-3. Diversidad funcional del RNA humano.

Clase de RNA

Ejemplos

Función

A) CLASES PRINCIPALES DE RNA QUE PARTICIPAN EN LA EXPRESIÓN GÉNICA GENERAL

RNA ribosómico (rRNA)

RNA de transferencia (tRNA)

RNA nuclear pequeño (snRNA)

(participa en el empalme de RNA)

RNA nucleolar pequeño (snoRNA)

(participa en la modificación y procesamiento del RNA)

16S rRNA 23S rRNA 28S, 5.8S, y 5S rRNA 18S rRNA

22 tipos de tRNA mitocondrial 49 tipos de tRNA citoplásmico

Muchos, incluidos:

U1,U2, U4 y U6 snRNA

U5snRNA

U4acat, U6acat, U11 y U12 snRNA

U7snRNA

Más de 100 tipos diferentes:

cerca de 80 C/D box snoRNA cerca de 15 H/ACA snoRNA U3y U8snoRNA

Componente de la subunldad ribosómica mitocondrial pequeña (fig. 9-2) Componente de la subunidad ribosómica mitocondrial grande (fig. 9-2) Componentes de la subunidad ribosómica citoplásmica grande (fig. 10-2) Componente de la subunidad ribosómica citoplásmica pequeña (fig. 10-2)

Enlace a codones en mRNA mitocondrial (fig. 9-2) Enlace a codones en mRNA citoplásmico (fig. 9-4)

Componentes de espliceosomas mayores Componente de espliceosomas mayores y menores Componentes de espliceosoma menor Terminación transcripcional de mRNA de histona

Metilación específica de sitio del grupo OH 2' de rRNA Modificación específica de sitio de rRNA por formación de seudouridina Procesamiento de rRNA

B) OTRAS CLASES DE RNA (véase también base de datos de RNA no codificante en http://biobases.ibch.poznan.pl/ncRNA/)

Micro-RNA

Inactivación del cromosoma X relacionado

Impronta relacionada

Cuando menos 200 clases probables

X/S7RNA

75/XRNA

Muchos, p. ej., RNAW79

Específica de sistema nervioso p. ej., RNA BC200

RNA antisentido

Otras

Tal vez alrededor de 1 500 tipos

Telomerasa de RNA

PC43RNA

PCGEMmm

Sfí/IJRNA

TTY2RNA

7SKRNA

7SLRNA

Moléculas de RNA regulador (sección 9.2.3) muy pequeñas (—22 nucleótidos)

Véase sección 10.5.6 Véase sección 10.5.6

Véase figura 10-24 para algunos ejemplos

?

p. ej., a H0XA11, MSX1, etc. (véase fig. 10-24)

Componente de telomerasa (sección 2.2.5) Antígeno 3 de cáncer de próstata Expresado en gran exceso en cáncer de próstata Coactivador específico de varios receptores de esferoides Familia específica de testículo Regulador transcripcional negativo del alargamiento de polimerasa II de RNA Componente de la partícula de reconocimiento de señal para proteínas de transporte

principal justificación para la repetición de genes rRNA citoplás- micos se basa en dosis de genes: con una cifra comparativamente grande de estos genes, la célula puede satisfacer la demanda enor­ me de ribosomas citoplásmicos necesarios para la síntesis de pro­ teínas.

Genes RNA de transferencia (tRNA)

Además de los 22 genes tRNA mitocondriales, el esquema de se­ cuencias del genoma humano publicado en 2001 reveló un total de

  • 497 genes nucleares que codifican moléculas de tRNA citoplásmi-

cas y 324 posibles seudogenes derivados de tRNA. Por consiguien­ te, al parecer, los seres humanos tienen menos genes que especifican tRNA citoplásmico que un gusano (584), pero más que la mosca

(284). En metazoarios, el número de genes tRNA no se relaciona con la complejidad del organismo, sino más bien con demandas es­ peciales para abundancia de tRNA en ciertos tejidos o etapas del desarrollo embrionario (p. ej., la rana Xenopus laevis tiene oocitos

grandes que deben estar cargados cada uno con 40 ng de tRNA; la demanda alta de tRNA se satisface al disponer de miles de genes tRNA). Los 497 genes tRNA citoplásmicos pueden agruparse en 49 fa­ milias según sean sus especificidades de anticodón. Aunque el có­ digo genético universal proporciona 61 codones de sentido diferentes que deben reconocer los anticodones en moléculas de tRNA, el bamboleo en la posición de la tercera base de los codones significa que cuando la posición de la tercera base en un codón es pirimidina (U o C), un anticodón aislado puede formar un par de bases con los dos codones alternativos. La elección del anticodón para interpretar codones humanos alternativos sigue reglas genera­ les para el tRNA citoplásmico eucariota (recuadro 9-4). Con base en ello, cabría predecir un total de 46 clases diferentes de tRNA hu­ mano pero, a pesar de la generalidad del bamboleo de la tercera ba­ se, tres pares de estos codones [AU(U/C), UA(U/C), AA(U/C)] son sensibles al parecer a dos anticodones cada uno y por consi­ guiente hay tres clases adicionales de tRNA (véase fig. 9-5). Sólo

9.2

ORGANIZACIÓN, DISTRIBUCIÓN Y FUNCIÓN DE GENES RNA HUMANOS

249

Recuadro 9-4. E sp e c ific id ad

d e

a n tico d ó n

d e l

tR N A

c ito p lá sm ico eu c a rio ta

'

. - y mSmmmmímtm

v

-

¿

"

Como en la interpretación de codones mitocondriales (sección 9.1.2), el bamboleo de la tercera base significa que no hay una correspondencia 1:1 entre los codones de mRNA citoplásmico y los anticodones tRNA que los reconocen. En este caso, mediante un anticodón aislado pueden re­ conocerse codones alternativos que difieren porque tienen una C o U en la tercera posición de bases. Las reglas de descodificación para codones de mRNA citoplásmico son las siguientes:

codones en "cajas de dos codones" (codones que terminan con ü/C que codifican un aminoácido diferente en comparación con los que terminan con A/G). En este caso, una G en la posición base 5' en el anticodón tRNA descodifica de manera característica la posición bamboleante U/C. Por lo tanto, no hay un tRNA con un anticodón &AA para correspondencia con el codón UUJ! para Fe, pero el anticodón 6AA puede reconocer codones UUU y UUC en el mRNA (véase fig.

9-5)-;.

codones no glicina en “cajas de cuatro codones" (codones en los que U, C, A y G en la posición bamboleante codifican el mismo ami­ noácido, pero no la glicina). En este caso, la posición bamboleante U/C la descodifica una inosina (I) en la posición 5' en el anticodón (la inosina se produce por modificación postranscripcional de una adenina: se sustituye el grupo amino en el carbón 6 de la adenosina

por un grupo carbonilo C=0). Por ejemplo, a los codones GUS1 y GU£ de la caja valina de cuatro codones los descodifica un tRNA con un anticodón de AAC, que sin duda se modifica en JAC. Además del pa- reamiento de bases con C y ü, la inosina también puede formar un par de bases con A (y por consiguiente el anticodón |AC puede reco­ nocer a cada uno de GUU, GU£, GUfi). A fin de evitar una posible lec­ tura traduccional errónea, en cajas de dos codones no pueden utilizarse tRNA con inosina en la base 5’ del anticodón-;

codones de glicina. Un anticodón SCC, en lugar del anticodón ICC esperado, codifica los codones GGU y GGC.

Sólo se requieren 16 anticodones para descodificar los 32 codones ter­ minales en una pirimidína. Por consiguiente, el grupo mínímo de antico­ dones es de 61 (el número de diferentes codones de sentido), menos 16 = 45. No obstante, además de un tRNA especializado lleva un anticodón al codón UGA (que en condiciones normales funciona como un codón de detención). En estados de selenio alto, esta tRNA codifica UGA sólo en un número muy pequeño de casos a fin de insertar el 21o. aminoácido, se/e- nocisteina, en un grupo selecto de selenoproteinas" (todos los cuales tienen actividades de oxidorreducción [rédox]; en mamíferos, la reducta- sa de tiorredoxina y la peroxídasa de glutatión son de las selenoproteinas que se encuentran de modo más amplio).

existe una correlación muy general del número de genes tRNA hu­ manos con la frecuencia de aminoácidos (cuadro 9-4). Aunque, al parecer, los genes tRNA están esparcidos en la tota­ lidad del genoma humano (con excepción de los cromosomas 22 y Y, se encuentran en todos los cromosomas), hay un agrupamiento notable. Más de la mitad de ellos (280 de 497) reside en el cromo­ soma 6 (que contiene 140 genes tRNA, incluidos casi todos los ti­ pos diferentes de gen tRNA, en una región de sólo 4 Mb en 6p2) o el 1 (en donde están agrupados de forma laxa muchos de los ge­ nes tRNA de Asn y Glu). Además, muchos de los otros genes tR­ NA están agrupados; por ejemplo, 18 de los 30 tRNA de Cis se hallan en una tira de 0.5 Mb del cromosoma 7.

9.2.2 Los RNA nuclear y nucieolar pequeños están codificados por familias génicas grandes esparcidas en una gran proporción

Además del rRNA y el tRNA, otras dos clases mayores de RNA participan en la ayuda de la expresión génica general: el RNA nu­ clear pequeño (snRNA) y el RNA nucieolar pequeño (snoRNA). Los codifican familias de casi 100 genes (snRNA) o un poco más (snoRNA) que, aunque diseminadas, muestran cierto agrupamien­ to de subfamilias.

Genes RNA nucleares pequeños (snRNA)

El conjunto heterogéneo de moléculas RNA nucleares pequeñas (snRNA) incluye muchas con uridina abundante y se denominan de la forma correspondiente; por ejemplo, snRNA U3 representa el tercer RNA nuclear pequeño rico en uridina por clasificar. Varios son del tipo RNA espliceosómico y se requieren para la función de los espliceosomas mayor y menor (véase cuadro 9-3) y una familia de más de 80 genes los codifica. Más de 70 de estos genes especifi­

can snRNA utilizados en el espliceosoma mayor; incluyen 44 genes identificados que especifican snRNA U6 y 16 que especifican snR­ NA U l. Algunas pruebas indican agrupamiento, sobre todo en el caso de las familias snRNA U l y U2; empero, debido a la forma en que se seleccionaron los BAC para obtener el esquema de las secuencias del genoma (véase antes), hay una representación menor en la se­ cuencias del esquema. Se sabía con anterioridad que los genes RNA U2 se localizaban en el locus RNU2, una estructura tándem de 6.1 kb unidades casi idénticas en 17q21-q22 que es muy variable en el número de unidades repetidas (de seis a más de 30 repeticiones). Los genes RNA U 1 están agrupados con alrededor de 30 copias en el locus RNU1 en lp36.1, aunque se piensa que este agrupamien­ to está organizado en forma laxa e irregular. Existe un gran número de secuencias no funcionales relacionadas (seudogenes, fragmentos génicos, etc.); por ejemplo, se han identificado 1 135 secuencias re­ lacionadas con snRNA U6 en el esquema de secuencias (Internatio­ nal Human Geno me Sequencing Consortium, 2001).

Genes RNA nucleolares pequeños (snoRNA)

Una familia grande de RNA nucleolares pequeños (snoRNA) se

usa en especial en el nucléolo

para dirigir o guiar modificaciones de

bases específicas de sitio en rRNA (Smith y Steitz, 1997; Filipo- wicz, 2000), pero también se sabe que llevan a cabo modificaciones de bases en otros RNA estables, incluido el snRNA U6. Existen dos subfamilias. La snoRNA caja C/D participa sobre todo en la guía de las metilaciones 2'-0-ribosa específicas de sitio (hay 105 a 107 va­

riedades de esta metilación en rRNA). Los genes snoRNA H/ACA intervienen sobre todo en la guía de seudouridilaciones específicas de sitio (en las que se isomeriza la uridina para formar seudouridina, la base modificada más común; para el rRNA se requieren 95 seu­ douridilaciones diferentes).

  • 250 CAPÍTULO NUEVE

ORGANIZACIÓN DEL GENOMA HUMANO

Fe

Leu

UUU

AAAO

UUC

A

G A A 1 4

UUA

~

UAA 8

UUG

~

CAA 6

Ser

UCU

UCC

7

A G A 1 0

GGAO

T ir

UAU

UAC

UCA

UGA 5

Detención

UAA

UCG

CGA 4

Detención ~

UAG

AUA 1

GUA11

UUA 0

CUAO

Cis

UGU

\

UGC

Detención ~

UGA

Trp

~

UGG

ACAO

GCA

30

UCA

0*

CCA 7

Leu

CUU

CUC

CUA

CUG

AAG 13

GAGO

UAG 2

CAG 6

Pro

CCU

CCC

CCA

CCG

AGG 11

GGGO

UGG 10

CGG 4

His

CAU

CAC

Gln

CAA

[

CAG

AUG 0

GUG 12

UUG 11

CUG 21

Arg

CGU

CGC

CGA

CGG

ACG 9

GCG 0

UCG 7

CCG 5

lie

Met

AUU

AUC

AUA

AUG

AAU 13

GAU

1

UAU 5

CAU 17

Tre

ACU

ACC

ACA

ACG

AGU 8

GGU 0

UGU 10

CGU 7

Asn

Lis

AAU

AAC

AAA

AAG

AUU

1

GUU 33

UUU 16

CUU 22

Ser

AGU

AGC

\ ACUO

GCU 7

A rg

i

AGA

AGG

UCU 5

CCU 4

Val

~

GUU

-J

AAC 20

GUC

GAC 0

GUA

~

UAC 5

L

GUG

-

CAC 19

~

GCU

y

AGC 25

Ala

GCC

GGC 0

GCA

~

UGC 10

-

GCG

-

CGC 5

Asp

"

GAU

-

GAC

AUCO

GUC 10

Glu

GAA

UUC 14

-

GAG —

CUC 8

Gli

GGU

GGC

\ ACC 0

GCC 11

GGA

UCC 5

GGG

CCC 8

Fig. 9-5. Número de genes tRNA humanos clasificados de acuerdo con el anticodón.

Los codones están unidos por líneas a los anticodones (no modificados) en el lado derecho. Las líneas unidas en forma de V enlazan codones alternativos que terminan en una U o C que pueden descodificarse por la acción de un anticodón aislado debido al bamboleo de la tercera base. El número siguiente de cada anticodón es el número de genes humanos que codifican tRNA con ese anticodón. Por consiguiente, por ejemplo, en la parte superior del lado izquierdo se observa que el codón de fenilalanina UUU no lo descodifica un anticodón AAA, ya que no hay genes tRNA que lleven ese anticodón. Las adeninas sombreadas casi con seguridad se modifican como ¡nosinas (véase recuadro 9-4). Nota: a) a pesar de la provisión de la tercera base bamboleante, los genes únicos codifican al parecer tRNA con anticodones que quizá no se esperaba que se necesitaran (AUA, AUU y GAU); b) el asterisco a continuación del anticodón UCA significa que hay un tRNA poco común que lleva este anticodón, que en ocasiones interpreta un subgrupo pequeño de codones UGA como selenocisteína en lugar de detención; véase recuadro 9-4. Modificado de International Human Genome Sequencing Consortium (2001), Nature 409, 860-921, con autorización de Nature Publishing Group.

Los snoRNA aislados especifican una, o cuando mucho dos, de estas modificaciones. Los snoRNA se encuentran con frecuencia

dentro de los intrones de otros genes y aunque al parecer casi todos los genes snoRNA son de copia única y están esparcidos, se cono­ cen algunos grupos grandes, entre ellos dos que se hallan dentro de

la unidad de transcripción grande SNURF-SNRPN tn 15q. Los

úl­

timos genes se imprentan de manera paterna, se expresan en el ce­ rebro y se considera que poseen un papel relevante en el síndrome de Prader-Willi (véase fig. 10-24 y las referencias que incluye).

9.2.3 Los micro-RNA y otros RNA reguladores nuevos son desafiantes preconcepciones sobre la extensión de la función del RNA

Los libros de texto suelen insistir en la importancia de las proteínas como puntos finales de la expresión génica por la amplia variedad

de sus funciones y su importancia en la regulación de la expresión génica. Por lo general, las moléculas de RNA se han considerado menos importantes (¡el artículo de Venter y cois., 2001, del esque­ ma de Celera de la secuencia del genoma, no presentó ningún aná­ lisis sobre genes RNA humanos!). No obstante, en años recientes, diversos descubrimientos han llevado a una revaloración radical de la función del RNA. El reconocimiento en 1982 de que algunas moléculas de RNA podrían tener una función catalítica (y en con­ secuencia actuar como una ribozima) condujo a la identificación de funciones catalíticas en varios otros tipos de RNA. Se incluyen aquí rRNA (datos recientes de cristalografía con rayos X indican que el rRNA cataliza la formación del enlace péptido, no las proteí­ nas; Nissen y cois., 2000) y asimismo snRNA (Valadkhan y Manley,

2001).

Se ha estudiado bien una diversidad de moléculas de RNA fun­ damentales, entre ellas la telomerasa de RNA (véase sección 2.2.5)

9.2

ORGANIZACIÓN, DISTRIBUCIÓN Y FUNCIÓN DE GENES RNA HUMANOS

251

Cuadro 9-4. Distribución de genes en familias génicas de tRNA citoplásmico humano de acuerdo con el aminoácido especificado.

Aminoácido

Frecuencia*

Número de genes de tRNA correspondientes

Aminoácido

Frecuencia*

Número de genes de tRNA correspondientes

Alanina

7.06%

40

Usina

5.65%

38

Arginína

5.69%

30

Metionina

2.23%

17

Aspartato

4.78%

10

Fenilalanina

3.75%

14

Asparagina

3.58%

34

Prolina

6.10%

25

Císteína

2.25%

30

Selenocísteína

<0.01%

1

Glutamina

4.63%

32

Serína

8.00%

26

Glutamato

6.93%

22

Treonina

5.31%

25

Glicina

6.62%

24

Triptófano

1.30%

7

Histidína

2.56%

12

Tirosina

2.76%

12

Isoleucína

4.43%

19

Valina

6.12%

44

Leucina

9.95%

35

•Frecuencia promedio en la extensión del proteoma humano.

y el RNA SRP (conocido asimismo como RNA 7SL) de la partícu­ la de reconocimiento de señal (el complejo de ribonucleoproteí- nas que reconoce la secuencia de señal en las proteínas destinadas a enviarse fuera de la célula para permitir el paso de proteínas a tra­ vés de la membrana celular). En fecha más reciente se identificó una interesante variedad de nuevas moléculas de RNA humano con funciones reguladoras conocidas o posibles. Éste es un proceso con­ tinuo, pero el análisis más amplio de transcritos de mamíferos hasta la fecha (del genoma de ratón) sugiere que un porcentaje conside­ rable de transcritos corresponde a RNA no codificantes (FANTOM Consortium y RIKEN Genome Exploration Research Group Pha- se I & II Team, 2002).

Micro-RNA: nuevas moléculas de RNA regulador pequeñas

Los micro-RNA (miRNA) son moléculas de RNA muy pequeñas (cerca de 22 nucleótidos de largo) que pueden funcionar como re­ guladores antisentido de otros genes (Ambros, 2001; Gottesman, 2002). Derivan de precursores más largos, unos -70 nucleótidos de largo que contienen una repetición invertida que permite la forma­ ción de horquillas de RNA de doble cadena. Un tipo de ribonuclea- sa III (específica de RNA de doble cadena), que se conoce como dicer, corta estos RNA precursores de horquillas. Las primeras de estas secuencias descritas en animales, RNA lin-4 y let-7, se identi­ ficaron como RNA temporal pequeño (stRNA) mediante análisis genéticos en C. elegans. RNA lin-4 y let-7 se regulan durante el de­ sarrollo y también controlan varios programas del desarrollo por sí mismos. Actúan como reguladores antisentido al enlazarse a se­ cuencias complementarias en la 3' UTR del mRNA de genes blan­ co, inhibir la traducción y, por consiguiente, reprimir la síntesis de las proteínas del gen blanco (fig. 9-6A). Se ha demostrado asimis­

mo que otros miRNA, por ejemplo en plantas, son reguladores del desarrollo y este hallazgo, aunado a la conservación evolucionista potente del miRNA, condujo a esperar funciones similares para los miRNA de mamíferos. Se han operado varios métodos para identificar miRNA de ma­ míferos (véase Gottesman, 2002, para un resumen) y sus resultados fueron la identificación reciente de miRNA nuevos en seres huma­ nos y ratones (Lagos-Quintana y cois., 2001, 2002; Mourelatos y cois., 2002). Para la época en que se escribió este libro (mediados del 2003), se estimaban alrededor 200 genes miRNA humanos. Aun­ que están diseminados en muchos cromosomas, las pruebas indican cierto agrupamiento, en especial un grupo cuando menos de siete genes miRNA dentro de una región de 0.8 kb en el cromosoma 13 (Mourelatos y cois., 2002). En la actualidad se llevan a cabo esfuer­ zos activos para identificar genes blanco por la probabilidad de que los miRNA de mamíferos tengan funciones reguladoras de impor­ tancia.

a«ote; se piensa que este tipo de actividad de ribonucleasa forma parte de un sistema genético de vigilancia conservado que puede degradar un mRNA especifico en respuesta a la presencia de RNA de doble cadena correspondiente al mRNA específico. Puede utilizarse en ciertos análisis experimentales, que se conocen como RNA de interferencia (¡RNA), para inactivar de forma específica genes blanco dentro de células al cortar el RNA largo de doble cadena producido por transgenes introducidos de modo artificial para crear moléculas de RNA antisentido de unos 22 nucleótidos de largo (conocidas como siRNA, RNA de interferencia corto). Las moléculas de siRNA pueden formar pares de bases con mRNA del gen endógeno que corresponde al transgén introducido y, en consecuencia, inhibir de manera específica la expresión (véase sección 20.2.6).

252

A)

B)

CAPÍTULO NUEVE

ORGANIZACIÓN DEL GENOMA HUMANO

 
 

U

U

u

A

 

u

c

C

C

G

A

C

c

c

A

I

I

G

I

 

U

G A G

 

U

I

I

T

r

r

r

i

I

I

 

I

I

I

I

A

G

G

G

C

U

G

G

G

U

C

A

c

u

c

G

 

C

U

c

c

C

u

 

U

U

G

A

G

G

G

A

G

G

U

U

G

G

U

I

I

I

I

I

I

I

I

I

i

r

t

I

I

A

U

U

C

C

c

u

u

u

A

A

C

C

A

 

u

A

G

U

 

G

U

G

CCUCGU

 

CAAGUAA

 

CCAGGAUAGGCUGU

 

I I I

l

i

l

i

l

í

I

I

I

I

I

I

I

T

i

l

l

i

l

i

I

I

í

f

I

I

I

CGC

A

GGGGCA

 

C

G

U

U

C

A

U

U

GG

U

UC

 

U

AU

CC

G

GU

 

A

lin-14 3' UTR

 
 

lin-28 3 ’ UTR

lin-42 3' UTR

daf-12 3 ’ UTR

 

lin-41 3 ’ UTR

 

------------------------------------------------------- —

----------^

 

--------------------------------

 
 

A

AUU

 

lin -4 1 5’

U U A U A C A A C C

GUU C U A C

C U C A

5'

U U A U A C A A C C

 

C U G C C U C

le t-7 3 ’

G A U A U G U U G G

G A U G

G A G U

3'

G A U A U G U U G G

G A U G G A G

U

AU

 

U

AU

G

I

lin-4

U

 

A

U

 

le t-7

 

C

C

 

C

A

 

mir-26a

 

-------------------

-

200 n t

 

= let-7

 

A

 

_

_

lm-4

 

-

U

Fig. 9-6. Los micro-RNA son RNA muy cortos (21 a 22 nucleótidos) que pueden funcionar como reguladores antisentido.

A) Estructura precursora del miRNA. Los stRNA lin-4 y let-7 de C. elegans pertenecen a la clase mIRNA y muestran una similitud importante con miRNA de mamíferos como el miRNA mir-26a humano. Las secuencias maduras de micro-RNA (miRNA) (sombreadas) derivan de un precursor con repeticiones invertidas (que forman una RNA en horquilla por enlace intramolecular de hidrógeno). El corte del RNA en horquilla se lleva a cabo por un tipo de nucleasa RN-asa III que se conoce como “dicer” (máquina cortadora). En ocasiones, dos miRNA diferentes derivan del mismo precursor. B) Regulación antisentido por los RNA lin-4 y let-7. El mRNA de genes blanco regulado por los RNA lin-4 y let-7 tiene regiones en sus 3' UTR que muestran complementaridad muy notoria con estos miRNA. El pareamiento de bases no suele ser perfecto, como se demuestra en el pareamiento de bases predicho entre el RNA let-7 y sus dos secuencias blanco en la secuencia 3' UTR lin-41. Tomado de Banerjee y Slack (2002), Bioessays 24, 119-129, reimpreso con autorización de Wiley-Liss, Inc., una subsidiaria de John Wiley & Sons, Inc.

Genes que codifican moléculas de RNA reguladoras de tamaño moderado a grande

Un número cada vez mayor de genes especifica RNA no codifican­ te de tamaño moderado a grande con funciones reguladoras cono­ cidas o posibles (muchos pueden relacionarse con moléculas de “mRNA no codificante porque son transcritos por polimerasa II de RNA y se someten a recubrimiento y poliadenilaciónb). Inclu­ yen genes que especifican RNA 7SK, un regulador transcripcional negativo del alargamiento de la polimerasa II de RNA (Yang y col., 2001); RNA SRA1 (activador del receptor de esferoides) que sir­ ve como un coactivador específico de varios receptores de esferoi­

des (Lanz y cois., 1999); y X IS T , que es central para la inactivación

del cromosoma X (sección

10.5.6).

Se conocen asimismo varios RNA antisentido reguladores, de tamaño moderado a grande, entre ellos el transcrito antisentido TSIX, que regula XIST, una variedad de transcritos antisentido que

bNota: mediante comparación, la polimerasa I de RNA transcribe los RNA 28S, 18S y 5.8S; la polimerasa III de RNA transcribe los rRNA 5S, tRNA, snoRNA y miRNA; los snRNA son una mezcla sorprendente: algunos los transcribe la polimerasa III de RNA y otros la polimerasa II de RNA.

9.3

ORGANIZACIÓN, DISTRIBUCIÓN Y FUNCIÓN DE GENES HUMANOS QUE CODIFICAN POLIPÉPTIDOS

253

regulan genes improntos (sección 10.5.5; véase fig. 10-24 para al­ gunos ejemplos) y un gran número de otros transcritos antisentido (Lehner y cois., 2002). Aunque no se conoce con precisión el núme­ ro total de estos transcritos antisentido en el genoma humano, en una revaloración reciente de los genes en el cromosoma 22 huma­ no se reconocieron 16 posibles genes RNA antisentido, lo que su­ giere que puede haber alrededor de 1 500 genes RNA antisentido en el genoma humano (Collins y cois., 2003). En apoyo de lo ante­ rior, FANTOM Consortium y el RIKEN Genome Exploration Re­ search Group Phase I & II Team (2002) predijeron en un estudio muy amplio varios cientos de RNA antisentido en el ratón median­ te las estimaciones más conservadoras.

9 .3

Organización, distribución y función de genes humanos que codifican polipéptidos

  • 9.3.1 Los genes humanos muestran una enorme variación de tamaño y organización interna

Diversidad de tamaño

En organismos simples, como las bacterias, los genes tienen un ta­ maño comparativamente similar y suelen ser muy cortos; en los

complejos es considerable la variación de tamaño de los genes, en especial en el genoma humano (fig. 9-7). El tamaño enorme de al­ gunos genes humanos significa que la transcripción puede tomar tiempo y requerir alrededor de 16 horas para el gen de distrofina de 2.4 Mb (Tennyson y cois., 1995). Aunque existe una correlación di­ recta entre los tamaños del gen y el producto, hay algunas ano­ malías notables. Por ejemplo, la apolipoproteína B tiene 4 563 aminoácidos y la codifica un gen de 45 kb, pero la proteína más grande que codifica el gen de distrofina de 2.4 Mb sólo posee 3 685 aminoácidos.

Diversidad en la organización exón-intrón

Una minoría muy pequeña de genes humanos carece de intrones (véase cuadro 9-5) y éstos poseen casi siempre un tamaño pequeño. En los que tienen intrones, se observa una correlación inversa entre el tamaño del gen y la fracción del DNA codificante (fig. 9-7). Ello no se debe a que los exones en genes grandes sean más pequeños que los de genes pequeños: el tamaño promedio del exón en genes humanos es menor de 200 pb y, aunque se conocen exones muy grandes (véase recuadro 9-5), el tamaño del exón es comparativa­ mente independiente de la longitud del gen (cuadro 9-6). Por el contrario, hay una gran variación en las longitudes de intrones y los genes grandes tienden a tener intrones muy grandes (la colágena de

A) Menos de 10 kb

0

h

+

6

tRNATir

100%

M

H isto ria H4 100%

In te rfe ro n a 100%

In su lin a 33% |

¡

'

I

i Globina¡538%

1

I

I

NiHLA

|

I

i

I

cla se I 46%

B)

Men o s de 100 kb

10 kb

—I

0

10

20

30

40

50

60

70

80

90

100 kb

A lb úm in a s é ric a 12%

■e

- —

f

Co lá g e n a a-, (II) 20%

# ■

lililí

4

FRTH 4%

i

*■■■■■■ A p o lip o p ro te ín a

i

B 33%

R e ce p to r LDL

lililí

4

!

I

!

I

11 %

i

H id ro xila sa fe n ila la n in a

de

3%

C) Más de 100

kb

0

100

---------1

200

300

400

500

600

700

800

900

1 0 0 0 1 1 0 0 1 2 0 0

1 8 001900 2400 2500

kb

1-1-------- 1-------- 1-------- 1-------- h ------1-------- ¡-------- 1-------- ¡-------- 1--------¡-----^ ----- j - -----¡----- ^ ------1--------1—

I

I

I

i ¡Factor VIII

i

i

3%¡

i

i

RTFQ 2 4%

r» I TV*

c..-1

/o

I

i

!

i

i

i

* - N

F

l

4%

I

¡

I

i

(

i

!

I

¡

I

i

(

i

!

!

I

¡

I

i

,

i

!

I

¡

I

i

,

i

!

I

¡

I

i

,

i

!

I

¡

I

,

i

!

I

¡

I

'

,

i

I

¡

I

i

,

i

!

I

I

'

i

¡

,

!

I

¡

I

1

,

i

!

I

I

1

|

i

¡

!

i

i

i

i

t

i

U tro fin a 1.4%

i

i

i

Inmunoglobulina de cadena pesada*

i

i

Inm u n o g lo b u lin a d e ca d e n a lig e ra

i

i

i

4

- ü

D

istro fin a 0.6%

k *

Fig. 9-7. Los genes humanos varían de tamaño y contenido de exones en enorme proporción.

Se muestra el contenido de exones como porcentaje de las longitudes de los genes indicados. Obsérvese la relación por lo general inversa entre la longitud del gen y el porcentaje del contenido de exones. Los asteriscos resaltan que las longitudes proporcionadas para los locus de las cadenas pesada y ligera de Ig indicadas corresponden a organizaciones de la linea germinal. (Los genes de Ig y del receptor de célula T tienen organizaciones únicas, que requieren reordenamientos somáticos específicos de célula a fin de expresarse en linfocitos B o T, respectivamente; véase sección 10.6.) RTFQ, regulador transmembranoso de la fibrosis quística; FRTH, transferasa de fosforribosilo de hipoxantina; NF1, neurofibromatosis tipo 1.

  • 254 CAPÍTULO NUEVE

ORGANIZACIÓN DEL GENOMA HUMANO

Cuadro 9-5. Ejemplos de genes humanos con secuencias de codificación ininterrumpidas.

Para listas más detalladas, véase http://exppc01.uni-muenster.de/expath/frames.htnn

Todos los 37 genes mitocondriales

Muchos genes RNA (en especial genes que codifican RNA pequeños, p. e¡„ casi todos los genes tRNA, pero también algunos RNA grandes, como RNA XIST)

Retrogenes (véase cuadro 9-11)

Interferones

Genes de histona

Muchos genes de ribonucleasa

Genes de proteina de choque por calor

Muchos receptores acoplados a proteina G

Ciertos genes con cajas HMG (p. ej., SRY, muchos genes SOX)

Varios genes de receptor de neurotransmisor y receptor de hormona, p. ej„ receptores de dopamina D1 y D5, receptor de serotonina 5-HT1B, receptor de angiotensina II tipo 1, receptor péptido formil, receptor de bradicinina B2, receptor adrenérgico 2a

tipo 7 y los genes titin son excepciones muy notables; véase cuadro 9-6). Pese a ello, la transcripción de intrones largos requiere tiem­ po y energía y la selección natural favorece intrones cortos en genes muy expresados (Castillo-Davis y cois., 2002).

Diversidad del contenido de DNA repetido

Con frecuencia, los genes tienen componentes de DNA repetido dentro de intrones no codificantes y secuencias de flanqueo, pero además se encuentran secuencias de DNA repetido de diferentes extensiones en DNA codificante. Es común la repetición tándem de secuencias microsatélites (elementos de secuencia cortos; véase sección 9.4.3) y muchas reflejan tan sólo frecuencias esperadas des­ de el punto de vista estadístico para ciertas composiciones de bases. También es muy común la repetición tándem de secuencias que co­ difican dominios proteínicos conocidos o supuestos y pueden ser ventajosas desde el punto de vista funcional en algunos casos al pro­ porcionar un blanco biológico más disponible. En ocasiones, la ho­ mología de secuencias entre las repeticiones puede ser muy alta; en otras es posible que sea muy baja (véase cuadro 9-7).

9.3.2 Algunas veces están agrupados genes similares desde el punto de vista funcional en el genoma humano, pero con mayor frecuencia están esparcidos en diferentes cromosomas

Como se comenta en la sección 9.2, algunas familias de genes RNA están agrupadas. En familias génicas que codifican polipéptidos, muchas veces se hallan genes que codifican productos idénticos, o algunos con secuencias muy relacionadas, en uno o más grupos que pueden estar diseminados en varios cromosomas. Sin embargo, en el genoma suelen estar dispersas algunas familias de genes funcio­ nales que codifican productos que sólo tienen componentes con­ servados (dominios, elementos importantes, etc.). De manera característica, los genes que codifican productos funcionales rela­ cionados que no muestran una homología de secuencia muy im­ portante están esparcidos.

Genes idénticos en sentido funcional

Se sabe que dos o más copias génicas idénticas codifican a unos cuantos polipéptidos humanos. Con frecuencia los codifican genes recién duplicados en un grupo génico, por ejemplo los genes dupli­ cados de globina alfa. Además, de modo muy ocasional algunos ge­ nes en diferentes cromosomas codifican polipéptidos idénticos. Son ejemplos los siguientes:

genes de histona. La base de datos de secuencias de histona NH- GRI incluye una lista de un total de 86 diferentes secuencias de histona distribuidas en 10 cromosomas distintos, aunque con dos grupos grandes en 6p (http://genome.nhgri.nih.gov/histo- nes/chrmap.shtml), pero algunos miembros de la subfamilia son idénticos aunque codificados por genes en diferentes cro­ mosomas;

genes de ubiquitina. La ubiquitina, de 76 aminoácidos, es una proteína muy conservada que tiene una función esencial en la degradación de proteínas y la respuesta celular de estrés. Los ge­ nes humanos de ubiquitina se encuentran en locus diferentes distribuidos en varios cromosomas. Algunos están en una serie de repeticiones de secuencias codificantes de longitud completa que se someten a cotranscripción (unidades de transcripción po- licistrónicas). Otros son monómeros (pero fusionados con genes ribosómicos de proteínas y constituyen unidades de transcrip­ ción bicistrónicas, véase Nei y cois., 2000; sección 9.3.3).

Genes similares en sentido funcional

Una gran fracción de los genes humanos es miembro de familias gé­ nicas en las que los genes individuales están relacionados muy de cer­ ca pero no son idénticos en su secuencia. En muchos de estos casos los genes están agrupados y surgieron por duplicación génica tán­ dem, como en el caso de los diferentes miembros de cada uno de los grupos de los genes de las globina a y (3 (véase fig. 9-11). Los genes que codifican productos relacionados con claridad, pero que se hallan en distintos cromosomas, suelen estar menos relacionados, como se observa en los genes de las globina a y (3. No obstante,

9.3

| ORGANIZACIÓN, DISTRIBUCIÓN Y FUNCIÓN DE GENES HUMANOS QUE CODIFICAN POLIPÉPTIDOS

| 255

Recuadro 9-5. Genoma humano y estadísticas de genes humanos

Tamaño del genoma

-3 200 Mb

Genoma nuclear

~ 3 200 Mb

Genoma mitocondrial

37

kb

Componente eucromático

~ 2 900-3 000 Mb

Heterocromatina constitutiva

>200 Mb (cuadro 9-2; fig. 2-15)

Fracción muy conservada

>100 Mb (>3%)

DNA codificante

-

5 0 Mb (-1.5% )

Otros (regulador, etc.)

-1 0 0 Mb (3%)

DNA duplicado de forma segmentaria

>150 Mb (>5%)

DNA repetido no codificante

> 50% del genoma

Repeticiones basadas en transposón

-

1 400 Mb (-43% ; véase cuadro 9-15)

Número de genes

-

3 0 000-35 000

Genoma nuclear

-

3 0 000-35 000 (sección 9.1.3)

Genoma mitocondrial

37

(sección 9.1.2)

Por cromosoma

Promedio de - 1

400; pero depende de la longitud y tipo de cromosoma (véase fig. 8-4);

  • - 6 0 por banda en una preparación cromosómica de 550 bandas

Genes gue codifican polipéptidos

  • - 3 0 000, pero gran inseguridad

Genes RNA

  • - 3 000, pero cierta inseguridad (véase fig. 9-4)

Seudogenes

-2 0 000

Densidad génica

-1 /1 0 0 kb en el genoma nuclear; 1/0.45 kb en el genoma mitocondrial

Tamaño génico (extensión genómica)

Promedio = 27 kb, pero enorme variación (véase fig. 9-7).

Distancia intergénica

Promedio = cerca de 75 kb en el genoma nuclear.

Numero de islotes CpG

  • - 3 0 000 (en secuencias del genoma filtrado para eliminar repeticiones no codificantes)

Número de exones

Promedio = 9. Por lo regular se correlaciona con la longitud del gen, pero hay una amplia variación.

Numero más grande

363 (en el gen titin)

Número más pequeño

1 (es decir, sin intrones; cuadro 9-5)

Tamaño de exón

Promedio =

122 pb para exones internos con variación de longitud comparativamente pequeña,

pero los exones 3' pueden ser más largos de forma notoria (Zhang, 1998).

Exones más grandes

Muchas kb de largo, p. ej., el exón 26 del gen apoB (APOB) es de 7.6 kb

Exones más pequeños

< 10 pb

Tamaño de intrón

Variación enorme; correlación directa potente con el tamaño génico (véase cuadro 9-6);

Intrones más grandes

Cientos de kb, p. ej„ el intrón 8 del gen WWOX humano es - 8 0 0 kb.

Intrones más pequeños

Decenas de pb

Tamaño de mRNA

Promedio alrededor de 2.6 kb, pero gran variación (¡mRNA titin tiene > 115 kb de largo!)

5' UTR

Promedio alrededor de 0.2-0.3 kb

3' UTR

Promedio alrededor de 0.77 kb pero es probable que sea una subestimación por menos información de 3' UTR largas

Tamaño del RNA no codificante

Tamaño de polipéptidos

Polipéptido más grande

Polipéptidos mas pequeños

Muy variable; de -2 1 -2 2 nucleótidos (micro-RNA) a muchos kb, p. ej., XIST (17 kb)

Promedio alrededor de 500-550 aminoácidos

Titin: 38 138 codones en el gen titin (pero variación de longitud considerable)

Decenas de aminoácidos, p. ej., varias hormonas pequeñas, etc.

en la familia génica homeobox HOX, que consiste en grupos de anos 10 genes en cada uno de cuatro cromosomas, genes indivi­ duales en diferentes cromosomas pueden estar más relacionados entre sí que respecto de los miembros del mismo grupo génico (fig. .2-9). Además de lo anterior, genes que codifican isoformas especí- r.cas de tejido relacionadas, o isozimas específicas de compartimien­ to subcelular, casi siempre se localizan en diferentes cromosomas véase cuadro 9-8).

Genes relacionados en sentido funcional

Algunos genes codifican productos que es muy posible que no ten­ gan una secuencia relacionada muy cercana, pero se relacionan con claridad desde el punto de vista funcional. Los productos pueden ser subunidades de la misma proteína o estructura macromolecular, componentes de la misma vía metabólica o del desarrollo o tal vez se requieran para enlazarse de manera específica entre sí como los

  • 256 1 CAPÍTULO NUEVE | ORGANIZACIÓN DEL GENOMA HUMANO

Cuadro 9-6. Tamaños promedio de exones e intrones en genes humanos.

Producto génico

Tamaño del gen (kb)

Número de exones

Tamaño promedio de exón (pb)

Tamaño promedio de intrón (pb)

tRNA,ír

0.1

2

50

20

Insulina

1.4

3

155

480

Globina p

1.6

3

150

490

HLA clase 1

3.5

8

187

260

Albúmina

sérica

18

14

137

1 100

Colágena tipo VII

31

118

77

190

Complemento C3

41

29

122

900

Hidroxilasa de fenilalanina

90

26

96

3 500

Factor VIII

186

26

375

7100

CFTR (fibrosis qulstlca)

250

27

227

9100

Titin

283

363

315

466

Distrofina

2 400

79

180

30 770

Cuadro 9-7. Ejemplos de DNA intragénico de codificación repetida a gran escala.

Producto génico

Tamaño de repetición

Núm. de

Homología de secuencia de nucleótidos

codificada en aminoácidos

copias

entre copias

Involucrina

10

59

Homología alta para 39 repeticiones centrales

¿Apolipoproteína? (a)

114 = repeticiones parecidas a kringle 4a

37

Homología alta; 24 de las repeticiones tienen una secuencia idéntica

Plasminógeno

~ 75-80

5

Homología baja pero dominios proteínicos conservados

 

(kringles3)

Colágena

18

57

Homología baja pero elementos de aminoácidos conservados basados en (Gli-X-Y)6

Albúmina sérica

195

3

Homología baja

Genes de proteínas ricos en prolina

16-21

5

Homología baja

Tropomiosina de cadena a

42

7

Homología baja

Inmunoglobullna de cadena e, región C

108

4

Homología baja

Distrofina

109

24

Homología baja

aUn kringle es una secuencia rica en cisterna que contiene tres puentes disulfuro internos y crea una estructura en forma de “pretzel".

ligandos y sus receptores importantes. En casi todos estos casos, los genes no están agrupados y suelen hallarse en diferentes cromoso­ mas (véase cuadro 9-8 para algunos ejemplos).

9.3.3 En ocasiones se encuentran en el genoma humano genes superpuestos, genes dentro de genes y unidades de transcripción policistrónicas

Organización génica bidireccional y genes superpuestos de modo parcial

Los genomas simples tienen densidades génicas altas (por lo gene­

ral uno por 0.5

kb,

1 kb y

2 kb en los genomas de mitocondrias

humanas, E. coli y S. cerevisiae, respectivamente) y a menudo muestran ejemplos de genes superpuestos de forma parcial. Pue­ den utilizarse diferentes marcos de lectura, algunas veces de una cadena en sentido común (véase fig. 9-3). Los genes de organismos complejos están mucho menos agrupados (sólo un gen por 100 kb en el genoma nuclear humano) y no son tan comunes los genes su­ perpuestos. Sin embargo, en ocasiones se encuentran genes veci­ nos muy cercanos, algunos con sus extremos 5 ' separados por unos cuantos cientos de nucleótidos y que se transcriben de cadenas opuestas. Esta organización génica bidireccional suele encon­ trarse, por ejemplo, en los genes de reparación de DNA y pueden proporcionar regulación común del par génico (Adachi y Lieber,

2002).

9.3

ORGANIZACIÓN, DISTRIBUCIÓN Y FUNCIÓN DE GENES HUMANOS QUE CODIFICAN POLIPÉPTIDOS

257

Cuadro 9-8. Distribución de genes que codifican productos relacionados desde el punto de vista funcional.

Genes que codifican

El mismo producto

Isoformas o isozimas de proteína específica de tejido

Isozimas en diferentes compartimientos celulares

Organización

Con frecuencia agrupados pero también pueden estar en diferentes cromosomas

En ocasiones agrupados; algunas veces no sinténicos

Por lo general no sinténica

Ejemplos

Los dos genes de globina a en 11p (fig. 9-11); genes que codifican (fig. 10-2); algunas subfamlias de histona (véase httD://aenome.nhari.nih.aov/histones/chrmaD.shtmh

rRNA

Agrupamiento de genes de amilasa pancreática y salival (1p21); no hay sintenia de genes de actina a expresados en músculo esquelético (1 p) y cardiaco (15q)

Isozimas citoplásmica (c) y mitocondrial (m) para diversas enzimas, p. ej., deshidrogenasa de aldehido (c)-9q y deshidrogenasa de aldehido (m)-12q; cinasa de timidina (c)-17q y cinasa de timidina (m)-16q

Enzimas en la misma vía metabòlica

Por lo general no sinténica

Genes de enzimas codificantes en esteroidogénesis: hidroxilasa 8q de 11 esteroides; hidroxilasa 10q de 17 esteroídes; hidroxilasa 6p de 21 esteroides

Subunidades de la misma proteína

Por lo general no sinténica

Globina a-16p y globina (3-11 p; cadena pesada de ferritina 11 q y cadena ligera de ferritina 22q

Componentes de vía de señal que interactúan

Por lo

general

no

sinténica

JAK1 -1 p; STAT1-2q

Ligando más receptor relacionado

Por lo general no sinténica

Insulina 11 p y receptor de insulina 19p; interferón p-9p; interferón p de receptor 21 q

Los genes superpuestos de form a parcial en los genomas nu­ cleares compuestos de mamíferos son raros y, cuando se presentan, suelen transcribirse a partir de dos cadenas de DNA diferentes. Se observa una agrupación génica fuerte en regiones subcromosómicas con abundancia de GC y las regiones de densidad génica en parti­ cular alta muestran con frecuencia algunos casos de genes super­ puestos. Por ejemplo, la región clase III del complejo HLA en 6p21.3 tiene una densidad génica aproximada de casi un gen por ! 5 kb y se sabe que incluye varios ejemplos de genes superpuestos fig. 9-8A).

Genes dentro de genes

Los genes RNA nucleolares pequeños (snoRNA) son poco comunes porque casi todos están localizados dentro de otros genes, a menudo algunos que codifican una protema vinculada con el ribosoma o una proteína nucleolar. Es posible que esta disposición se conservara pa­ ra permitir la producción coordinada de proteínas y componentes de RNA del ribosoma (Tycowski y cois., 1993). Además de los genes ¿noRNA, algunos otros, incluidos varios genes que codifican poli- péptidos, se hallan dentro de intrones de genes más grandes. Los eiemplos ilustrativos son el gen NF1 (neurofibromatosis tipo I; tres genes internos pequeños transcritos de la cadena opuesta; véase fig. 9-8B); el gen F8 (factor VIII de la coagulación sanguínea; dos genes internos transcritos en direcciones opuestas; véase fig. 11-20); y el gen RB1 (susceptibilidad al retinoblastoma; un gen interno transcri­ to de la cadena opuesta; véase fig. 9-19).

_ nidades de transcripción policistrónicas

unidades de transcripción policistrónicas (es decir, multigéni- son comunes en los genomas simples de bacterias y asimismo encuentran con gran frecuencia en C. elegans. El genoma mito- a »d ria l humano simple (sección 9.1.2.) y los grupos mayores del

gen rRNA (fig. 10-2) proporcionan dos ejemplos de unidades de transcripción policistrónica en el genoma humano. Además, se co­ nocen algunos ejemplos raros de unidades de transcripción bicis- trónicas que codifican polipéptidos en el genoma nuclear: la transcripción se inicia a partir de un gen y continúa a través de un gen contiguo corriente abajo para suministrar una proteína precur­ sora que se corta para proporcionar diferentes proteínas. Por lo regular se considera que las cadenas A y B de la insulina derivan de una unidad de transcripción bicistrónica (fig. 1-23), pe­ ro están relacionadas de manera estrecha desde el punto de vista fun­ cional. Sin embargo, algunas veces las unidades de transcripción bicistrónicas generan proteínas distintas desde el punto de vista fun­ cional. Por ejemplo, los genes UBA52 y UBA80 crean ubiquitina y una proteína ribosómica, S27a o L40, respectivamente. Otros genes de ubiquitina están organizados como repeticiones tándem de se­ cuencia codificante completa que forman unidades de transcripción policistrónicas (véase Nei y cois., 2000). En los genes de ubiquitina no hay intrones pero en otras unidades de transcripción bicistróni­ cas se requiere empalme (corte y unión) para enlazar transcritos de exones de un gen en los de un gen corriente abajo. La unidad de

transcripción SNURF-SNRPN proporciona un ejemplo de dos

po­

lipéptidos codificados por diferentes exones (Gray y cois., 1999), pe­ ro también se utiliza para hacer transcritos de RNA no traducidos

que se improntan de forma paterna; véase la figura 10-24.

9.3.4 Las familias génicas que codifican polipéptidos pueden clasificarse de acuerdo con el grado y extensión de la relación de la secuencia en miembros de la familia

Un gran porcentaje de genes humanos que se expresan de modo ac­ tivo, y codifican RNA no codificante y polipéptidos, es miembro de familias de secuencias de DNA que muestran una gran simili-

  • 258 CAPITOLO NUEVE

ORGANIZACIÓN DEL GENOMA HUMANO

A)

PBX2

G18

I G15

TN-X

I

I

G14

\X

/

G13

1200

1300

  • B) Exón 26

Cadena de sentido del gen NF1

5'

I

1 --------

Cadena antisentido 3 ' L del gen NF1

1C7 C4B CYP C4A G5b CKIIB \B 1 4 4 LTB nb6 21 Ps / G11
1C7
C4B
CYP
C4A
G5b
CKIIB
\B 1 4 4
LTB
nb6
21 Ps
/
G11
G11a
1kBL
MICA NOB1
NOB2
RD
G10
PERB10
\
\
I P5-6
' Bf
I
G9
2
BAT1
PERB6 \
\
\
/
DHFRPs
/ /
C2
I G9a | G8 \
MICB
\
\ \
\
|
/
/ 1
7
NOB3
PPIPs
I
I
T
I------- 1----
----1----
---- 1----
---- 1----
T
n— i
1400
1 500
1 600
1700
1800
1 900
2000
(2080)
0.9
M b: -7 0 genes
Exón 27
Intrón
26
3'
5'
OGM P
EVI2B
EVI2A
i---------1
h-
I-
H
2.2 kb
10 kb
4 kb

Fig. 9-8. Genes superpuestos y genes dentro de genes.

  • A) Genes superpuestos. Los genes en la región clase III del complejo HLA están empacados de forma estrecha y superpuestos en algunos casos.

  • B) Genes dentro de genes. El intrón 26 del gen de la neurofibromatosis tipo 1 (NF1) contiene tres genes de dos exones internos cada uno transcritos de

la cadena opuesta a la utilizada para transcribir el gen NF1. Los genes son: OGMP, glucoproteína de mielina del oligodendrocito; EVI2A y EVI2B,

homólogos humanos de genes murinos que tal vez participen en la leucemogénesis y se localicen en sitios de integración viral Bcotrópicos.

tud secuencial. Sin embargo, la extensión de la secuencia comparti­ da y la organización de los miembros de la familia pueden variar en gran proporción. Es posible que muchos miembros de la familia no sean funcionales (seudogenes y fragmentos génicos; véase más adelan­ te) y acumulen en poco tiempo diferencias de secuencias, que con­ ducen a una divergencia secuencial notable.

Familias génicas comunes

Los miembros de familias génicas comunes muestran una gran ho­ mología de secuencias en la mayor parte de la longitud del gen o, cuando menos, en el componente de DNA codificante. Los ejemplos incluyen familias del gen de histona (las histonas están muy conser­ vadas y los miembros de subfamilias son virtualmente idénticos) y las familias del gen de las globinas a y (3 (los miembros de una familia individual muestran un alto grado de similitud secuencial).

Familias génicas que codifican productos con dominios grandes y muy conservados

En algunas familias génicas hay una homología en especial notable dentro de regiones específicas de los genes muy conservadas; la si­ militud secuencial correspondiente entre la porción restante de la secuencia codificante en los diferentes genes puede ser muy baja. A menudo, estas familias codifican factores de transcripción que tie­ nen funciones importantes en el desarrollo temprano y la secuencia conservada codifica un dominio proteínico que se requiere para en­ lazarse de forma específica al DNA de genes blancos seleccionados (véase cuadro 9-9).

Familias génicas que codifican productos con secuencias típicas conservadas de aminoácidos cortos

Es posible que algunos miembros de ciertas familias génicas no se relacionen de forma evidente a nivel de las secuencias de DNA, pe­ ro no obstante codifican productos génicos que se caracterizan por una función general común y la presencia de secuencias típicas muy cortas conservadas, como la caja DEAD, la secuencia Asp-Glu-Ala- Asp (DEAD en el código de una letra de aminoácidos) o la repeti­ ción WD (triptófano-aspartato); véase la figura 9-9.

Superfamilias génicas

Los miembros de una superfamilia de genes se relacionan de mo­ do mucho más distante en términos evolucionistas que los de una familia de genes de dominio/secuencia típica común o conservada. Codifican productos relacionados desde el punto de vista funcional

en un sentido general y sólo

muestran una homología de secuencia

muy débil en un segmento grande, sin secuencias típicas de ami­ noácidos conservadas muy importantes. Por el contrario, es posible que haya algunas pruebas de características estructurales generales comunes y una función general vinculada. Los ejemplos ilustrativos son:

► la superfamilia de inmunoglobulina (fig. 9-10): una familia muy grande que incluye los genes de inmunoglobulina (Ig), ge­ nes del receptor de célula T, genes HLA y muchos otros. Los ge­ nes codifican productos divergentes en grado considerable a nivel secuencial, pero que funcionan en el sistema inmunitario y contienen dominios parecidos a inmunoglobulina (Ig);

9.3

j ORGANIZACIÓN, DISTRIBUCIÓN Y FUNCIÓN DE GENES HUMANOS QUE CODIFICAN POLIPÉPTIDOS

259

Cuadro 9-9. Ejemplos de genes humanos con elementos de secuencia típica que codifican dominios muy conservados.

Familia génica

 

Número de genes

 

Elementos de secuencia típica/dominio

 

Genes homeobox

38 genes HOX (véase fig. 12-9) más 214 genes homeobox huérfanos

Homeobox especifica un homeodominio de unos 60 aminoácidos. Se ha definido una amplia variedad de diferentes subclases

Genes

PAX

9

Box pareada codifica un dominio pareado de -1 2 8 aminoácidos; los genes PAX suelen tener además un tipo de homeodominio conocido como homeodominio tipo pareado

Genes SOX

 

18

Caja

HMG parecida a SRY que codifica un dominio de unos 69 aminoácidos

Genes

TBX

18

Caja T que codifica un dominio de unos 170 aminoácidos

 

Genes

de

dominio

en horquilla

49

El dominio en horquilla tiene -1 1 0 aminoácidos de largo

Genes

de

dominio

POU

24

El dominio POU tiene -1 5 0 aminoácidos de largo

A)

Caja DEAD

 
 

22-42

19-29

17-29

 

17-23

19-51

115-192

20-25

n h 2—

a x x g x g k t

 

PTRELA

GG

 

TPGR

DEAD

SAT

ARGXD

HRIGR — COOH

B)

6-94

23-41

Re p e tició n W D

( ----------------- G

H ------------------W D

j

)

n

= 4-16

 

Centro

Fig. 9-9. Algunas familias génicas se definen por productos génicos relacionados desde el punto de vista funcional que llevan secuencias típicas muy cortas de aminoácidos conservados.

A) Secuencias típicas en la familia caja DEAD. Esta familia génica codifica productos relacionados con los procesos celulares que incluyen la alteración de la estructura secundaria del RNA, como el inicio de traslación y empalme (corte y unión). Son obvias ocho secuencias típicas de aminoácidos muy Dien conservadas, incluida la caja DEAD (Asp-Glu-Ala-Asp). Los números se refieren a los límites de tamaño que suelen encontrarse en secuencias ntermedías de aminoácidos (véase Schmid y Linder, 1992). X, cualquier aminoácido. Véase la contraportada para el código de aminoácidos de una letra. B) Familia repetida WD. Esta familia génica codifica productos que participan en una diversidad de funciones reguladoras, como la regulación de la división celular, transcripción, señalamiento transmembranoso, modificación de mRNA, etc. Los productos génicos se caracterizan por cuatro a 16 repeticiones tándem de WD, que consisten en alrededor de 44 a 60 aminoácidos cada una y que contienen una secuencia central de longitud fija que comienza con un dipéptido GH (gii-his) y termina en el dipéptido WD (Trp-Asp) precedido por una secuencia de longitud variable (véase Smith y cois.,

1999).

► la superfamilia de globina: una familia pequeña que no sólo incluye los miembros de las familias génicas de las globinas a y (3 (fig. 9-11) que funcionan en el transporte de oxígeno y el al­ macenamiento de sangre, sino también genes equivalentes que codifican globinas musculares y cerebrales, mioglobina y neuro- globina, respectivamente (véase fig. 12-4);

► la superfamilia del receptor acoplado a proteína G: una fa­ milia muy grande y diversa de receptores que median señales in­ ducidas por ligando entre los ambientes extracelular e intracelular a través de la interacción con proteínas G intracelu- lares. Comparten una estructura común de siete segmentos transmembranales de hélice a , pero casi siempre tienen una si­ militud secuencial baja (< 40%) entre sí.

9.3.5 Los genes en familias génicas humanas pueden estar organizados en grupos pequeños o esparcidos con amplitud, o ambas cosas

Las familias génicas humanas pueden clasificarse en las que mues­ tran pruebas de agrupamiento génico cercano y las que se encuen­ tran diseminadas en varios sitios cromosómicos diferentes. Sin embargo, esta clasificación es un poco arbitraria ya que algunas fa­ milias génicas consisten en múltiples grupos de genes en diferentes sitios cromosómicos (véase cuadro 9-10) y otras, como la familia de genes de histona (http://genome.nhgri.nih.gov/histones/chr- map.shtml), pueden estar dominadas por uno o dos grupos grandes pero también tienen varios genes huérfanos esparcidos.

  • 260 CAPITULO NUEVE

ORGANIZACIÓN DEL GENOMA HUMANO

Cadena

ligera

G!

g !

C a d e n a ^ pesada

\

c°-

bQ

G v

Cadena

pesada

G\\

\

(p Qv^O

<b

<S*

/

—v

%

if .O

1

a

o

y

O

Y

s

-

s

f

C

J

8 o

r

C

^

V

i

S

I

.^ s

/

(

"

i

' S

V

I

v _ > s

S ^~ x

I

V

)

G! IO i

G! i IO i

Gl IO Gl IO

Cadena

p esada

(V s,S

M)

C -sS

C

I

I

C

t

s v _ y

Cadena

ligera

(p2M)

T4

T8

Inm u n o g lo b u lin a en la s u p e rficie c e lu la r

R e ce p to r

d e

cé lu la T

A ntígeno HLA cla se I

Antígeno HLA cla se I

Fig. 9-10. Los miembros de la superfamilia Ig son proteínas de superficie con tipos similares de estructura de dominio.

Se ilustran unos cuantos ejemplos de la superfamilia Ig grande. Muchos miembros son dímeros que consisten en dominios variables (V) extracelulares localizados en los extremos N y dominios constantes (C), situados en los extremos terminales C (membrana proximal). La cadena ligera de antígenos HLA clase I, microglobulína p2, tiene un dominio constante único y no abarca la membrana. Se vincula con la cadena pesada transmembranosa que tiene dos dominios variables y uno constante, lo que crea una estructura total similar a la de los antígenos HLA clase II.

G rupo

de

g lo b in a

a

16 p 1 3.3

Grupo

de

g lo b in a

p

11 p 1 5.5

Grupo de hormona del crecimiento 17q23

Gaipo de albúmina 4q12

ALB

 

10

  • 20 30

 

40

  • 50 60

—i—

—i—

 

^2

Vlj1 ¥«2 Val

a 2

a-!

9

- m

-

e

Gy

Ay

v|/(3

s

-m-m---------------------------------□ -

 

—I

i~

-

o

 

-

ü

O

-

i

b

— □

---------□

-

 

hGH-N

CS-L

CS-A

hGH-V

CS-B

 

AFP

ALF

 

20

40

60

80

100

120

140

Fig. 9-11. Ejemplos de familias génicas agrupadas humanas.

 

Clave

 
 

Gen

expresado

Expresado, pero esta do in cie rto

Seudogen

GC/DBP

 

160

180

Los genes en un grupo tienen una secuencia relacionada de cerca y se transcriben de manera característica a partir de la misma cadena. Es incierto el estado funcional de los genes de globina 9 y genes CS-L. Las escalas en la parte superior (grupos de globina y hormona del crecimiento) y en la inferior (grupo de albúmina) aparecen en kilobases.

9.3

ORGANIZACIÓN, DISTRIBUCIÓN Y FUNCIÓN DE GENES HUMANOS QUE CODIFICAN POLIPÉPTIDOS

261

Cuadro 9 -10 . Ejemplos

de familias multigénicas agrupadas y dispersas.

Familia

Núm. de

Organización

 

Localización(es)

copias

cromosómica(s)

A) FAMILIAS GÉNICAS AGRUPADAS

 

Familias génicas de grupo único

 

Grupo génico de hormona del crecimiento

5

Agrupado dentro de 67 kb; un seudogen convencional

17q22-24

Grupo génico

de

globina a

7

Agrupado

en - 5 0

kb (véase fig. 9-11)