Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CAPTULO NUEVE
9 .1
1.5% -3%
-5 %
<2 %
G e n o m a n u c le a r
(24 m o l c u la s d e D N A lineai
d e d o b le c a d e n a , 3 200 M b; -3 0 000
genes)
I Repeticiones basadas en
transposn
d ] Heterocromatina
I I Otros no conservados
G e n o m a m ito c o n d ria l
(un D N A c irc u la r d e d o b le c a d e n a
d e 16.6 kb; 37 genes)
C lave:
0 H, 0 L, origen y direccin
de la sntesis de las cadenas
pesada y ligera
G e n e s tR N A
G enes q u e c o d ific a n
p ro te n a s
ig ----- - "
242
CAPTULO NUEVE
R ecuadro 9 -1 . V a ria c i n d e l n m e ro d e c o p ia s d e l g e n o m a en c lu la s h u m a n a s
Con frecuencia, los libros de texto indican que las clulas de un organis
mo muestran poca variacin en su contenido de DNA y ello es sin duda
cierto cuando se compara con el contenido de RNA o protenas. No obs
tante, puede haber diferencias notorias en el contenido de mtDNA y el de
DNA nuclear en diferentes tipos de clulas.
Variacin del nmero de copias del genoma mitocondrial. Ciertas
clulas (p. ej., clulas de la piel diferenciadas de forma terminal) ca
recen de cualquier mitocondria y por consiguiente no tienen mtDNA.
El nmero de copias de mtDNA en otras clulas somticas vara pe
ro, de manera caracterstica, es de 1 000 a 10 000 (p. ej., los M o c i
tos poseen alrededor de 1 000 molculas de mtDNA). Los gametos
son excepcionales: las clulas espermatozoos tienen unos cuantos
cientos de copias de mtDNA y los oocitos tal vez 100 000, lo que
constituye ms de 30% del DNA del oocito.
Variacin del nmero de copias del genoma nuclear. Las clulas
nucleadas (diploldes) muestran poca variacin en el contenido de
Genes mitocondriales
El genoma mitocondrial humano consiste en 37 genes. En 28 de
ellos, la cadena pesada es la cadena de sentido; en los otros nueve,
la cadena de sentido es la ligera (fig. 9-2). De los 37 genes, un to
tal de 24 especifica un producto RNA maduro: 22 molculas de
tRNA mitocondrial y dos molculas de rRNA mitocondrial; un
rRNA 23S (un componente de la subunidad grande de los ribosomas mitocondriales) y un rRNA 16S (un componente de la subu
nidad pequea de los ribosomas mitocondriales). Los 13 genes
restantes codifican polipptidos que se sintetizan en ribosomas mi
tocondriales.
Cada uno de los 13 polipptidos codificados por el genoma mi
tocondrial es una subunidad de uno de los complejos respiratorios
mitocondriales, las enzimas de mltiples cadenas de la fosforila
cin oxidativa que estn encargadas de la produccin de ATP. Sin
embargo, existen casi 100 diferentes subunidades polipptidas en el
sistema mitocondrial de fosforilacin oxidativa y por lo tanto la in
mensa mayora la codifican genes nucleares (vase recuadro 9-2). El
genoma nuclear codifica a todas las otras protenas mitocondriales
y se traducen en ribosomas citoplsmicos antes de llevarse al inte
rior de las mitocondrias (recuadro 9-2; fig. 1-11).
9.1
243
13 subunidades
> 80 subunidades
I Deshidrogenasa de NADH
7 subunidades
> 41 subunidades
0 subunidades
4 subunidades
Componente mitocondrial
1 subundad
10 subunidades
3 subunidades
10 subunidades
2 subunidades
14 subunidades
24
Cerca de 80
Componentes rRNA
2 rRNA
Ninguno
Componentes tRNA
22 tRNA
Ninguno
Protenas ribosmicas
Ninguna
Cerca de 80
Ninguna
Genoma mitocondrial
Tamao
3 200 Mb
16.6 kb
Proteina relacionada
\jm e ro de genes
- 3 0 000-35 000
37
Zensidad gnlca
-1 /1 0 0 kb
1/0.45 kb
DNA repetido
Muy poco
Tfanscripcin
nrones
No hay
S de DNA de codificacin
-1 .5 %
-9 3 %
.so de codn
: ecombinacin
No es obvia
-terencia
244
CAPTULO NUEVE
8 522
53
68
P ro L is Trp Tre L is lie C is S e r Leu H is S e r Leu P ro P ro G ln S e r D e te n c i n
c c a a a tg a a c g a a a a tc tg ttc g c ttc a ttc a ttg c c c c c a c a a tc c ta g g c c ta
M e tA s n G lu A sn Leu Fe A la S e r Fe
-I
)
ACATA $
Tre
226
para las dos cadenas diferentes, alrededor del crculo a fin de gene
rar grandes transcritos multignicos (vase fig. 9-2). De forma sub
secuente, se generan los RNA maduros por el corte de transcritos
multignicos.
245
Cantidad total
de 0NA (Mb)
Cantidad de
heterocromatina (Mb)
Cromosoma
Cantidad total
de DNA (Mb)
Cantidad de
heterocromatina (Mb)
279
30
13
118
16
251
14
107
16
221
15
100
17
197
16
104
15
198
17
88
176
18
86
163
19
72
148
20
66
140
22
21
45
11
10
143
22
48
13
11
148
163
12
142
51
27
Datos resumidos del International Human Genome Sequence Consortium (2001). Al utilizar estas cifras, el tamao del genoma humano total es de 3 289 Mb, pero se sabe
que esta cifra (y las cantidades totales de cromosomas individuales) incluye algunas duplicaciones artefactuales; un valor ms realista podra ser ~ 3 200 Mb.
246
CAPTULO NUEVE
HN
/ c \
C -C H ,
CH
NH
T im in a
9.2
9 .2
Organizacin, distribucin y
funcin de genes RNA hum anos
Aunque la gran mayora de los genes humanos codifica polipptidos (seccin 9.3), una minora significativa especifica molculas de
RNA no codificante (esto es, no traducidas) como su producto fi
nal y tambin se describen como genes RNA (Eddy, 2001; Huttenhofer y cois., 2002; Storz, 2002; vase asimismo la base de datos de
RNA no codificante en http://biobases.ibch.poznan.pl/ncRNA/). El
genoma mitocondrial es excepcional porque 65% (24/37) de los
genes especifica molculas RNA maduras pero incluso en el geno
ma nuclear tal vez haya alrededor de 3 000 genes RNA, que cons
tituyen casi 10% del nmero total de genes (fig. 9-4).
Es probable que los estimados actuales del nmero de genes RNA
sean conservadores (por la dificultad para identificar genes RNA en
DNA secuenciado; vase seccin 8.3.5). En anlisis amplios de
transcritos de ratn (seccin 9.2.3) y en los basados en microconfiguraciones de transcritos de los cromosomas humanos 21 y 22
(Kapranov y cois., 2002) se interpret que sugieren muchos ms trans
critos que los esperados por las cifras gnicas previstas. Adems de
los genes RNA, hay muchos fragmentos de seudogenes/genes rela
cionados, en especial en los genes RNA transcritos por la polimerasa 111 de RNA.
En comn con otros genomas celulares, la mayor parte de los
genes RNA conocidos est dedicada a elaborar molculas que ayu
dan en el proceso general de expresin gnica (fig. 9-4). Algunos, de
forma notable las familias rRNA y tRNA, participan en la traduc
cin de mRNA. Muchas otras familias de RNA estn relacionadas
con la maduracin del RNA e incluyen corte y modificacin especfica
de bases de otras molculas de RNA (mRNA, rRNA, tRNA y otras
especies de RNA). Adems, en fecha reciente se identific un n
mero notorio de otros genes RNA que pertenecen a diferentes cla
ses de RNA. Muchos tienen, o se espera que tengan, funciones
reguladoras de importancia y resaltan la diversidad funcional muy
considerable de las molculas de RNA (cuadro 9-3; seccin 9.2.3).
-100
-2 0 0
247
I sn o R N A
H f snR N A
m iR N A
I I rR N A
[ I tR N A
-1 7 5
175
250
E 3 RNA
antisentido
500
245
CAPTULO NUEVE
Ejemplos
Funcin
16S rRNA
23S rRNA
28S, 5.8S, y 5S rRNA
18S rRNA
Muchos, incluidos:
U1,U2, U4 y U6 snRNA
U5snRNA
U4acat, U6acat, U11 y U12 snRNA
U7snRNA
B) OTRAS CLASES DE RNA (vase tambin base de datos de RNA no codificante en http://biobases.ibch.poznan.pl/ncRNA/)
Micro-RNA
X/S7RNA
75/XRNA
Impronta relacionada
RNA antisentido
Otras
Telomerasa de RNA
PC43RNA
PCGEMm m
Sf/IJRNA
TTY2RNA
7SKRNA
7SLRNA
principal justificacin para la repeticin de genes rRNA citoplsmicos se basa en dosis de genes: con una cifra comparativamente
grande de estos genes, la clula puede satisfacer la demanda enor
me de ribosomas citoplsmicos necesarios para la sntesis de pro
tenas.
9.2
249
v '- " .- y
mSmmmmmtm
250
CAPTULO NUEVE
UUU
AAAO
U CU
AG A10
UAU
AUA 1
UGU
U CC
U U A ~ U AA 8
UCA
UGA 5
Detencin U A A
UUA 0
Detencin ~
UGA
U C A 0*
U UG ~ C A A 6
UCG
CGA 4
Detencin ~ UAG
CUAO
Trp
UGG
CCA 7
C CU
A G G 11
C AU
AUG 0
C GU
ACG 9
C AC
GUG 12
CGC
GCG 0
UUC
A G AA14
T ir
C is
U AC
GU A11
UGC
S er
Leu
CUU
A A G 13
H is
Leu
CUC
CUA
GAGO
CCC
GGGO
A rg
Pro
CCA
U AG 2
UG G 10
G ln
C UG
C AG 6
C CG
CGG 4
AU U
A AU 13
AC U
AGU 8
AUC
G AU 1
AUA
UAU 5
AUG
C AU 17
Tre
GU C
G U A ~ U AC 5
L GUG -
C A C 19
A la
-
G C A 30
U UG 11
CGA
UCG 7
CAG
C U G 21
CGG
C CG 5
AAU
AUU 1
AGU
S er
ACUO
ACC
G GU 0
AAC
GU U 33
ACA
UG U 10
AAA
U UU 16
AGA
UCU 5
AC G
CGU 7
AAG
C U U 22
AGG
CCU 4
" GAU
AUCO
GG U
- G AC
G U C 10
~ GCU y A G C 25
GAC 0
C AA
Lis
~ GUU -J A A C 20
Val
A sn
lie
M et
ACAO
7 GGAO
Fe
GCC
GGC 0
GCA ~
UG C 10
GCG -
CGC 5
A sp
G lu
AGC
A rg
Gli
GG C
GCU 7
ACC 0
G C C 11
G A A U U C 14
GGA
UCC 5
- GAG C U C 8
GGG
CCC 8
Fig. 9-5. Nmero de genes tRNA humanos clasificados de acuerdo con el anticodn.
Los codones estn unidos por lneas a los anticodones (no modificados) en el lado derecho. Las lneas unidas en forma de V enlazan codones alternativos
que terminan en una U o C que pueden descodificarse por la accin de un anticodn aislado debido al bamboleo de la tercera base. El nmero siguiente
de cada anticodn es el nmero de genes humanos que codifican tRNA con ese anticodn. Por consiguiente, por ejemplo, en la parte superior del lado
izquierdo se observa que el codn de fenilalanina UUU no lo descodifica un anticodn AAA, ya que no hay genes tRNA que lleven ese anticodn. Las
adeninas sombreadas casi con seguridad se modifican como nosinas (vase recuadro 9-4). Nota: a) a pesar de la provisin de la tercera base
bamboleante, los genes nicos codifican al parecer tRNA con anticodones que quiz no se esperaba que se necesitaran (AUA, AUU y GAU); b) el
asterisco a continuacin del anticodn UCA significa que hay un tRNA poco comn que lleva este anticodn, que en ocasiones interpreta un subgrupo
pequeo de codones UGA como selenocistena en lugar de detencin; vase recuadro 9-4. Modificado de International Human Genome Sequencing
Consortium (2001), Nature 409, 860-921, con autorizacin de Nature Publishing Group.
2001 ).
9.2
251
Cuadro 9 -4 . Distribucin de genes en familias gnicas de tRNA citoplsmico humano de acuerdo con el aminocido
especificado.
Aminocido
Frecuencia*
Nmero de genes de
tRNA correspondientes
Aminocido
Alanina
7.06%
40
Usina
5.65%
38
Arginna
5.69%
30
Metionina
2.23%
17
Aspartato
4.78%
10
Fenilalanina
3.75%
14
Asparagina
3.58%
34
Prolina
6.10%
25
Cstena
2.25%
30
Selenocstena
<0.01%
Glutamina
4.63%
32
Serna
8.00%
26
Glutamato
6.93%
22
Treonina
5.31%
25
Glicina
6.62%
24
Triptfano
1.30%
Histidna
2.56%
12
Tirosina
2.76%
12
Isoleucna
4.43%
19
Valina
6.12%
44
Leucina
9.95%
35
Frecuencia*
Nmero de genes de
tRNA correspondientes
252
CAPTULO NUEVE
A)
G G
I T
G A
I I
U
G
r r
u c
u
c c
I I I
GAG U G
I I I I I
c u c
u
lin-4
A
A
G G
I I
u u u
U U
A A
G
t
C
U
le t-7
A
A
C C
G U
C A
G U G
C C U C G U
C A A G U A A
C G C
G G G G C A
G U U C A U U
III
B)
l i l i l
C C A G G A U A G G C U G U
T i
I I I I I I I
l l i l i
m ir-26 a
I I f I I I
G G U U C U A U C C G G U A
lin-14 3 ' U TR
lin-28 3 UTR
d a f-1 2 3 U TR
lin-41 3 U TR
lin -4 1 5
le t-7 3
------------------------------------------------------- ----------^
UUAUACAACC
GAUAUGUUGG
U
GUU
A
CUAC CUCA
GAUG GAGU
AU
5'
3'
_ _ --------------------------------
UUAUACAACC
GAUAUGUUGG
U
AUU
AU
------------------- - 200 n t
= le t-7
__ _
A
- lm -4
CUGCCUC
GAUGGAG
U
Fig. 9-6. Los micro-RNA son RNA muy cortos (21 a 22 nucletidos) que pueden funcionar como reguladores antisentido.
A) Estructura precursora del miRNA. Los stRNA lin-4 y let-7 de C. elegans pertenecen a la clase mIRNA y muestran una similitud importante con
miRNA de mamferos como el miRNA mir-26a humano. Las secuencias maduras de micro-RNA (miRNA) (sombreadas) derivan de un precursor con
repeticiones invertidas (que forman una RNA en horquilla por enlace intramolecular de hidrgeno). El corte del RNA en horquilla se lleva a cabo por un
tipo de nucleasa RN-asa III que se conoce como dicer (mquina cortadora). En ocasiones, dos miRNA diferentes derivan del mismo precursor.
B) Regulacin antisentido por los RNA lin-4 y let-7. El mRNA de genes blanco regulado por los RNA lin-4 y let-7 tiene regiones en sus 3' UTR que
muestran complementaridad muy notoria con estos miRNA. El pareamiento de bases no suele ser perfecto, como se demuestra en el pareamiento de
bases predicho entre el RNA let-7 y sus dos secuencias blanco en la secuencia 3 ' UTR lin-41. Tomado de Banerjee y Slack (2002), Bioessays 24,
119-129, reimpreso con autorizacin de Wiley-Liss, Inc., una subsidiaria de John Wiley & Sons, Inc.
bNota: mediante comparacin, la polimerasa I de RNA transcribe los RNA 28S, 18S y
5.8S; la polimerasa III de RNA transcribe los rRNA 5S, tRNA, snoRNA y miRNA; los
snRNA son una mezcla sorprendente: algunos los transcribe la polimerasa III de RNA
y otros la polimerasa II de RNA.
9.3
253
Organizacin, distribucin y
funcin de genes hum anos que
codifican polipptidos
9 .3
A) M e n o s d e 10 kb
0
h
B) M e n o s d e 100 kb
0
10 kb
10
20
30
M H is to ria H4 100%
In s u lin a 3 3 % |
70
60
80
90
100 kb
f C o l g e n a a-, (II) 2 0 %
In te rfe ro n a 1 0 0 %
50
A lb m in a s ric a 12%
tR N A Tir 10 0%
40
i G lo b in a 5 3 8 %
# 4 FRTH 4 %
'
* A p o lip o p ro te n a B 3 3 %
- 4
c la s e I 4 6 %
R e c e p to r L D L 11 %
H id ro x ila s a d e
fe n ila la n in a 3%
C) M s d e 100 kb
0 100 200 300 400 500 600 700 800 900 1 0 0 0 1 1 0 0 1 2 0 0
1 8 0 0 1 9 0 0 2400 2500 kb
---------1
1-1-------- 1-------- 1-------- 1-------- h ------1-------- -------- 1-------- -------- 1------------- ^ ----- j - ---------- ^ ------1--------1
I
i F actor VIII 3%
i
i
I
ii r
RTFQ
I TV* 2
c..-14 %/ o i!
*-N F l
4%
I
i(
(i
I
,i
i
I
i,
!
I
,i
i
!
,
i
',
i
I I
i, ' ,
i i
!
!
I
1, 1|
i i
!
!
I
In m u n o g lo b u lin a d e c a d e n a lig e ra k *
i i
i i
4 - D is tro fin a 0 .6 %
Fig. 9-7. Los genes humanos varan de tamao y contenido de exones en enorme proporcin.
Se muestra el contenido de exones como porcentaje de las longitudes de los genes indicados. Obsrvese la relacin por lo general inversa entre la
longitud del gen y el porcentaje del contenido de exones. Los asteriscos resaltan que las longitudes proporcionadas para los locus de las cadenas
pesada y ligera de Ig indicadas corresponden a organizaciones de la linea germinal. (Los genes de Ig y del receptor de clula T tienen organizaciones
nicas, que requieren reordenamientos somticos especficos de clula a fin de expresarse en linfocitos B o T, respectivamente; vase seccin 10.6.)
RTFQ, regulador transmembranoso de la fibrosis qustica; FRTH, transferasa de fosforribosilo de hipoxantina; NF1, neurofibromatosis tipo 1.
254
CAPTULO NUEVE
tipo 7 y los genes titin son excepciones muy notables; vase cuadro
9-6). Pese a ello, la transcripcin de intrones largos requiere tiem
po y energa y la seleccin natural favorece intrones cortos en genes
muy expresados (Castillo-Davis y cois., 2002).
9.3 | ORGANIZACIN, DISTRIBUCIN Y FUNCIN DE GENES HUMANOS QUE CODIFICAN POLIPPTIDOS | 255
-3 200 Mb
Genoma nuclear
~ 3 200 Mb
Genoma mitocondrial
37 kb
Componente eucromtico
~ 2 900-3 000 Mb
Heterocromatina constitutiva
>100 Mb (>3% )
DNA codificante
- 5 0 Mb (-1 .5 % )
- 1 0 0 Mb (3%)
>150 Mb (>5% )
> 50% del genoma
- 1 400 Mb (-4 3 % ; vase cuadro 9-15)
- 3 0 000-35 000
Genoma nuclear
Genoma mitocondrial
37 (seccin 9.1.2)
Por cromosoma
Promedio de - 1 400; pero depende de la longitud y tipo de cromosoma (vase fig. 8-4);
- 6 0 por banda en una preparacin cromosmica de 550 bandas
Genes RNA
Seudogenes
- 2 0 000
Densidad gnica
Distancia intergnica
- 3 0 000 (en secuencias del genoma filtrado para eliminar repeticiones no codificantes)
Nmero de exones
Promedio = 9. Por lo regular se correlaciona con la longitud del gen, pero hay una amplia variacin.
Numero ms grande
Nmero ms pequeo
Tamao de exn
Exones ms grandes
Exones ms pequeos
< 10 pb
Tamao de intrn
Variacin enorme; correlacin directa potente con el tamao gnico (vase cuadro 9-6);
Intrones ms grandes
Intrones ms pequeos
Decenas de pb
Tamao de mRNA
Promedio alrededor de 2.6 kb, pero gran variacin (mRNA titin tiene > 115 kb de largo!)
5' UTR
3' UTR
Promedio alrededor de 0.77 kb pero es probable que sea una subestimacin por menos informacin
de 3' UTR largas
Muy variable; de -2 1 -2 2 nucletidos (micro-RNA) a muchos kb, p. ej., XIST (17 kb)
Promedio alrededor de 500-550 aminocidos
Polipptido ms grande
Nmero de exones
Tamao promedio
de exn (pb)
Tamao promedio
de intrn (pb)
tRNA,r
0.1
50
20
Insulina
1.4
155
480
Globina p
1.6
150
490
HLA clase 1
3.5
187
260
Albmina srica
18
14
137
1 100
31
118
77
190
Complemento C3
41
29
122
900
Hidroxilasa de fenilalanina
90
26
96
3 500
Factor VIII
186
26
375
7100
250
27
227
9100
Titin
283
363
315
466
2 400
79
180
30 770
Distrofina
Tamao de repeticin
codificada en aminocidos
Nm. de
copias
Involucrina
10
59
Apolipoprotena? (a)
37
Plasmingeno
~ 75-80
Colgena
18
Albmina srica
195
Homologa baja
16-21
Homologa baja
Tropomiosina de cadena a
42
Homologa baja
108
Homologa baja
Distrofina
109
24
Homologa baja
5
57
aUn kringle es una secuencia rica en cisterna que contiene tres puentes disulfuro internos y crea una estructura en forma de pretzel".
9.3
257
Cuadro 9 -8 . Distribucin de genes que codifican productos relacionados desde el punto de vista funcional.
Genes que codifican
Organizacin
Ejemplos
El mismo producto
Los dos genes de globina a en 11p (fig. 9-11); genes que codifican rRNA
(fig. 10-2); algunas subfamlias de histona
(vase httD://aenome.nhari.nih.aov/histones/chrmaD.shtmh
Isoformas o isozimas de
protena especfica de tejido
En ocasiones agrupados;
algunas veces no sintnicos
Isozimas en diferentes
compartimientos celulares
Enzimas en la misma va
metablica
Subunidades de la misma
protena
Componentes de va de seal
que interactan
JAK1 -1 p; STAT1-2q
Ligando ms receptor
relacionado
258
CAPITOLO NUEVE
A)
C4B
PBX2
G18
CYP C4A
21 Ps / G11
G5b CKIIB
/ / C2
LTB nb6
1kBL
G11a
RD G10
' Bf I
G9
I G15 TN-X
I G14 \ X
I / G13
1C7
\B 1 4 4
PERB10 \
2
I P5-6
BAT1 PERB6 \ \ \
/ DHFRPs
MICB \
\ \ \ | / / 1 7 NOB3
I G9a | G8 \
PPIPs
1200
1300
1400
1500
1600
---I------- 1
1700
---- 1
----
---- 1
----
---- 1
---- n i
1900
1800
2000
(2080)
0.9 M b: - 7 0 g e n e s
B)
E xn 26
E xn 27
In tr n
Cadena de sentido
5' I 1 -------del gen NF1
26
3'
5'
i---------1
2.2 kb
EVI2B
h-
EVI2A
I-
10 kb
4 kb
Superfamilias gnicas
Los miembros de una superfam ilia de genes se relacionan de mo
do mucho ms distante en trminos evolucionistas que los de una
familia de genes de dominio/secuencia tpica comn o conservada.
Codifican productos relacionados desde el punto de vista funcional
en un sentido general y slo muestran una homologa de secuencia
muy dbil en un segmento grande, sin secuencias tpicas de ami
nocidos conservadas muy importantes. Por el contrario, es posible
que haya algunas pruebas de caractersticas estructurales generales
comunes y una funcin general vinculada. Los ejemplos ilustrativos
son:
la superfam ilia de inmunoglobulina (fig. 9-10): una familia
muy grande que incluye los genes de inmunoglobulina (Ig), ge
nes del receptor de clula T, genes HLA y muchos otros. Los ge
nes codifican productos divergentes en grado considerable a
nivel secuencial, pero que funcionan en el sistema inmunitario
y contienen dominios parecidos a inmunoglobulina (Ig);
9.3
259
Cuadro 9 -9 . Ejemplos de genes humanos con elementos de secuencia tpica que codifican dominios muy conservados.
Fam ilia gnica
N m ero de genes
Genes homeobox
Genes PAX
Genes SOX
18
Genes TBX
18
49
24
A)
C aja DEAD
22-42
n h 2
B)
axxgxgkt
1 9 -2 9
P TRELA
6 -9 4
17-29
GG
17 -2 3
TP G R
19-51
DEAD
11 5 -1 9 2
SAT
20-25
ARGXD
HRIG R COOH
23-41
Fig. 9-9. Algunas familias gnicas se definen por productos gnicos relacionados desde el punto de vista funcional que llevan secuencias
tpicas muy cortas de aminocidos conservados.
A) Secuencias tpicas en la familia caja DEAD. Esta familia gnica codifica productos relacionados con los procesos celulares que incluyen la alteracin
de la estructura secundaria del RNA, como el inicio de traslacin y empalme (corte y unin). Son obvias ocho secuencias tpicas de aminocidos muy
Dien conservadas, incluida la caja DEAD (Asp-Glu-Ala-Asp). Los nmeros se refieren a los lmites de tamao que suelen encontrarse en secuencias
ntermedas de aminocidos (vase Schmid y Linder, 1992). X, cualquier aminocido. Vase la contraportada para el cdigo de aminocidos de una
letra. B) Familia repetida WD. Esta familia gnica codifica productos que participan en una diversidad de funciones reguladoras, como la regulacin
de la divisin celular, transcripcin, sealamiento transmembranoso, modificacin de mRNA, etc. Los productos gnicos se caracterizan por cuatro a 16
repeticiones tndem de WD, que consisten en alrededor de 44 a 60 aminocidos cada una y que contienen una secuencia central de longitud fija que
comienza con un dipptido GH (gii-his) y termina en el dipptido WD (Trp-Asp) precedido por una secuencia de longitud variable (vase Smith y cois.,
1999).
260
CAPITULO NUEVE
C adena
lig e ra
G!
g !
Cadena^
pesada
.^ s
T4
<b
<S* / v
if .O 1
Y s - s f
a o y
Cadena
pesada
8o
C J
G! IO
i G!i IO
i
Gl IO Gl IO C
(V s,S M)
V I
g
C^S
C adena
pesada
Gv
G\\ (p Q v ^ O
cbQ
/ " 'S
( V I
S^~ x
I V
v_>s
T8
-sS
C I
In m u n o g lo b u lin a en
la s u p e rfic ie c e lu la r
I C t
Cadena
lig e ra
s v _ y (p2M)
A n tg e n o
H L A c la s e I
R e c e p to r
d e c lu la T
A n tg e n o
H L A c la s e I
Fig. 9-10. Los miembros de la superfamilia Ig son protenas de superficie con tipos similares de estructura de dominio.
Se ilustran unos cuantos ejemplos de la superfamilia Ig grande. Muchos miembros son dmeros que consisten en dominios variables (V) extracelulares
localizados en los extremos N y dominios constantes (C), situados en los extremos terminales C (membrana proximal). La cadena ligera de antgenos
HLA clase I, microglobulna p 2, tiene un dominio constante nico y no abarca la membrana. Se vincula con la cadena pesada transmembranosa que
tiene dos dominios variables y uno constante, lo que crea una estructura total similar a la de los antgenos HLA clase II.
10
30
20
40
i
^2
G ru p o de g lo b in a a 16 p 1 3.3
Vlj1 2 Val
50
a2
a-!
60
9
-m Gy
Ay
v|/(3
-m-m
G ru p o d e g lo b in a p 11 p 1 5.5
---------------------------------
hG H -N
O
C S -L
s
-
I i~
- i b
C S -A
C la ve
Gen
expresado
E xpresado,
p e ro e s ta d o
in c ie rto
S eu d o g e n
- o
--------- hG H -V
C S -B
AFP
20
40
A LF
60
80
G C /D B P
100
120
140
160
180
9.3
261
Nm. de
copias
Organizacin
Localizacin(es)
cromosmica(s)
17q22-24
16p13.3
6p21.3
5
7
-2 0
38
61
> 900
Muchos
Muchos
2
5
PAX
NF1 (neurofibromatosis tipo I)
9
> 12
> 15
Xp22; 4q22-q23
Muchos
Muchos
Muchos; sobre todo
pericentromricos
Muchos
A)
3' UTR
L a-) a 2 a 3 T M CY v V M W -
B)
-2 .2 Mb
B
H = H > B K } 0 -D 0 -{ X 1 M
/ n t a
a 2
3' UTS
\ a 2 3 TM
CY W A V W -
3' UTS
agl _ (I3 TM CY ^ v A M W -
Fig. 9-12. Las familias gnicas agrupadas contienen con frecuencia seudogenes no procesados y genes truncados o fragmentos gnicos:
ejemplo de la familia de gen HLA clase I.
A) Estructura del mRNA de una cadena pesada HLA clase I. El mRNA de longitud completa contiene una secuencia que codifica polipptidos; los
cuadros representan diferentes dominios, como sigue: L, secuencia rpida; a ,, a 2, a 3, dominios extracelulares; TM, secuencia transmembranosa; CY,
cola citoplsmica; y una secuencia no traducida 3' (3' UTS). En esencia, los tres dominios extracelulares a r a 3 los codifica un exn aislado. No se
muestra la 5' UTS muy pequea. B) Grupo gnico de la cadena pesada de HLA clase I. El grupo se localiza en 6p21.3 y comprende alrededor de
20 genes. Incluye seis genes expresados (azul), cuatro seudogenes no procesados de longitud completa ( ) y una variedad de copias gnicas
parciales (cuadros rojos, abiertos, pequeos). Algunos de estos ltimos estn truncados en el extremo 5' (p. ej., el siguiente a HLA-B), otros en el
extremo 3' (como el siguiente a HLA-F) y algunos contienen exones nicos (p. ej., el siguiente a HLA-E).
9.3
G en N F 1 17 q 1 1.2; 60 e xo n e s
l l l l l l l l ll I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I MI MIHHIHB
10b
27b
l * * l I I I I I I l |***********|
' II I I I I I I I
2q12-q13
1 4p 1 1o q 11
22p11<>q11
39-41
11
1617
l l l***l
4 f 12q11
-H+
18p11.2
21 p11 <>q11
11p14.3
13
27b
111111111111H H+h
15p11.2 (2x)
Fig. 9-13. Los seudogenes no procesados esparcidos se originan a partir del gen de NF1 perlcentromrico (neurofibromatosis tipo I).
Los exones estn representados como rectngulos verticales delgados. Para conveniencia, los intrones en el gen NF1 se representan como si tuvieran
longitudes iguales. Aunque el gen NF1 tiene 60 exones, la numeracin de los exones discurre del uno al 49 con ciertos exones vecinos a los que se
asign el mismo nmero, pero distintas letras (p. ej., exones 10a, 10b y 10c). Se encuentran copias de seudogenes muy homlogos del gen NF1 en
otras ocho o ms localizaciones del genoma, sobre todo en regiones pericentromricas. En cada caso, el seudogn slo comprende una copia de una
porcin de la longitud total del gen, con algunos exones e intrones intermedios. Son aparentes los reordenamientos de los seudogenes. Algunos
causaron delecin de exones e intrones (se muestran con asteriscos). Uno particip en una inversin de tal manera que la copia 39 del exn est
invertida en comparacin con las copias de exones contiguos. Datos proporcionados gentilmente por Nick Thomas y Meena Upadhyaya, University of
Wales College of Medicine.
264
CAPTULO NUEVE
E1
E2
H
5'
E3
3'
5'
T ra n s c rip c i n y
p ro c e s a m ie n to d e R N A
E1 E2 E3
AAAA.... A
3'
In te g ra c i n en
D N A c ro m o s o m ic o
mRNA
AAAAANn
T ra n sc rip ta s a
in v e rs a
TTTTT
5'
5'
S n te sis d e la
segunda cadena
y re p a ra c i n d e D N A
E1 E2 E3
3'
3'
cD N A
Fig. 9-14. Los seudogenes y retrogenes procesados se originan por transcripcin inversa de transcritos de RNA.
La funcin de la transcriptasa inversa podran proporcionarla las repeticiones LINE-1. El modelo de la integracin que se muestra en la figura slo es una
de varias posibilidades. En este caso, se considera la integracin como roturas tambaleantes (indicadas por flechas onduladas) en secuencias ricas en
A, pero podran recibir la asistencia de la endonucleasa LINE-1 (seccin 9.5.2). Si se incluye una secuencia abundante en A en un extremo saliente 5 ,
podra formar un hbrido con el extremo distal de poli(T) del cDNA, lo que facilita la sntesis de la segunda cadena. Debido a las roturas tambaleantes
durante la integracin, la secuencia insertada est flanqueada por repeticiones directas cortas (secuencias en cuadros). E1-E3 representan exones; R
promotor. Las copias transpuestas no llevan un promotor y por consiguiente, en condiciones normales, no se expresan y adquieren mutaciones perjudi
ciales {seudogenes procesados). Sin embargo, algunas copias procesadas de genes que codifican polipptidos son funcionales (retrogenes), tras in
tegrarse en un sitio adyacente a un promotor funcional y estar sujetas a presin de seleccin para conservar la funcin (cuadro 9-11).
Cuadro 9 - 1 1 . Ejemplos de retrogenes humanos sin intrones y su homologa parental que contiene intrones.
(para mayor informacin, vase http://exppc01 .un-muenster.de/expath/frames.htm)
Retrogen
Producto
GK2en 4q13
GK1 en Xp21.3
Cinasa de glicerol
PDHA2 en 4q22-q23
PDHA1 en Xp22
Deshidrogenasa de piruvato
PGK2 en 6p12.3
PGK en Xq13
Cinasa de fosfoglicerato
TAF1L en 9p13.3
TAF1 en Xq13.1
MYCL1 en 1p34.2
MYCL2 en Xq22-23
GLUD1 en 10q23.3
GLUD2 en Xq25
Deshidrogenasa de glutamato
SNAIL1L1 en 2q33-q37
SNAIL1 en 20q13
9.4
265
Referencia InterPro
Protenas compatibles
IPR000272
826
IPR000719
Cinasa de protena
688
IPR001909
314
IPR001806
192
IPR005821
149
IPR000387
139
IPR001254
128
1PR000379
112
IPR007114
100
1PR001993
86
IPR001664
85
IPR001128
Citocromo P-450
84
266
CAPTULO NUEVE
Referencia
InterPro
Nmero total
en el proteoma
IPR007087
28 654
IPR002126
Caderina
4131
IPR006209
3107
IPR003006
Inmunoglobulina/complejo
de histocompatibilidad mayor
2 387
IPR002048
1 885
IPR001452
Dominio SH3
1 815
IPR003961
1 812
IPR000504
1 783
IPR001356
Flomeobox
1 435
IPR002965
1 229
IPR001478
Dominio PDZ/DHR/GLGF
1 143
IPR001841
1 132
IPR001849
Parecido a plecastrina
1 061
IPR000210
Dominio BTB/P0Z
494
IPR005225
189
A)
B)
70 f
60
60-
50
*50
5T
c 40
<B
p
o 30
Q.
20
10
0
<1>
I 40
*->
g 30
o
20
Jk
i f h i I f l i [ Tu
10
i [Tu
l~li ni n-.
QlLDl f i l i l lU lll.L llH III l i l i III 1 1 miin-.
h ii m
-. i
\ \
,% > % V
<r W
s V
%
'v
V-
w
w
O.'S'
y.
%
%
% %
Fig. 9-15. Clasificacin de protenas humanas y de ratn basada en sus funciones moleculares y los procesos biolgicos en que participan.
Los trminos de ontologia gnica (0G) se agruparon en una decena de categoras situadas dentro de ontologas ms grandes de funcin molecular (A)
y proceso biolgico (B). Barras azules: protenas de ratn; barras rojas: protenas humanas. Modificado a partir de Mouse Genome Sequencing
Consortium (2002), Nature 420, 520-562, con autorizacin de Nature Publishing Group.
| S a t lite a lfo id e
* S a t lite P
| S a t lite s 2 y 3
267
C . ;)- S a t lite p
=
} rD N A
-. S a t lite P
< S a t lite s 2 y 3
^ S a t l i t e a lfo id e
satlite adicional 1
y otras repeticiones
21
Fig. 9-16. Organizacin del DNA satlite en centrmeros.
Se muestran las localizaciones de diferentes clases de DNA satlite en
los cromosomas 9 y 21 (uno de los cinco cromosomas acrocntricos
autosmicos). La ilustracin se modific a partir de Tyler-Smith y
Willard (1993) Curr. Opin. Genet. Dev. 3, 390-397, con autorizacin de
Elsevier.
Tamao de la unidad
de repeticin (pb)
Principal(es) localizacin(es)
cromosmica(s); estado transcripcional
5-171
a (DNA alfoide)
171
p (familia Sau3A)
68
25-48
Satlites 2 y 3
9-64
Familia telomrica
Familia hipervariable
9-64
12
268
9 .5
NO A U T N O M O
A U T N O M O
ORF1
O R F2(pol)
> P
I I
H n n n iB
LIN ES
269
(A )n i
6 -8 kb
(A)n
1 0 0 -3 0 0 p b
SINES
P a re c id o a re tro viru s
RTL
P
RTL
gag p o i (env)
R TL
(gag) RTL
T ra n sp o s o n e s D N A f s ile s
1.5 -3 kb
tra n s p o s a s a
6 -3 kb
P ____ ^
8 0 p b -3 kb
Cuadro 9 -1 5 . Principales clases y familias de DNA repetido dispersas en el genoma humano (excluido el cromosoma Y).
Clase
Familia
Nm. de copias
SINE
Familia Alu
~ 1 200 000
10.7
MIR
~ 450 000
2.5
MIR3
~ 85 000
0.4
Familia LINE-1
- 600 000
17.3
Familia LINE-2
- 370 000
3.3
Familia LINE-3
~ 44 000
0.3
Familias SRE
~ 240 000
4.7
MaLR
- 285 000
3.8
MER-1 (Charlie)
- 213 000
1.4
MER-2 (Tigger)
~ 68 000
1.0
Otros
~ 60 000
0.4
UNE
Elementos RTL
Transposn de DNA
Datos del International Human Genome Sequencing Consortium, 2001; Mouse Genome Sequencing Consortium, 2002.
5' UTR
A)
Elemento LINE-1
ORF1
ORF2
3' UTR
AAAAAATTTTTT-
p40
5'
B)
D m ero A lu
T ra n s c rip ta s a in ve rsa
y e n d o n u c le a s a
160
130
.3 '
AAAAAA
TTTTTT-
AAAAAA.-ll
TTTTTT-
32
9.5
rem ite la retrotransposicin de los SINE no autnomos y la crean de seudogenes y retrogenes procesados (Esnault y cois., 2000;
>?jcin 9.3.6). De las cerca de 6 000 secuencias LINE-1 de longicompleta, alrededor de 60 a 100 son capaces an de sufrir
preposicin y, en ocasiones, causan enfermedades al alterar la funn del gen despus de insertarse en una secuencia conservada importante (seccin 11.5.6).
elementos nucleares dispersos cortos (SINES) tienen alrededor de 100 a 400 pb de largo, suelen ser muy tiles para formar coonias en genomas de mamferos y dan por resultado una
diversidad de familias con un nmero de copias notorio. Algunos
>.NES humanos son especficos de primates, como la familia Alu;
:rros no estn restringidos a los primates y tambin se encuentran
en marsupiales y monotremas y se describieron como familias MIR
del ingls mammalian-wide interspersed repeat, repeticin disperen mamferos) (cuadro 9-15). Los SINES no codifican ninguna
rrotena y no son autnomos. LINES y SINES comparten secuen
22 23
18 19 20 2 1 \ 7 2 4 2 5 2 6 27
13 14 15 16
6 7 8 9 1 0 11 12,
3 4 5
271
E xones
RB1
U16
Repeticiones
Alu
5'
t -
Repeticiones
U N E -1
5 ' -|--------Repeticiones
(AW (T)n
I
'
3
|
/\
t------------------- 3'
III I
I
Js
I I
II
I III,
|
\
III
1
1
1
II
II
I I
1 1
1
1
kb -|------ 1------ 1-------1------ 1------ 1------ 1------ 1-------1------ 1------ 1------ 1------ 1------ 1------ 1------ 1-------1
0
20
40
60
80
100
120
140
160
i
180
Fig. 9-19. Localizaciones de las repeticiones Alu, LINE-1 y (A)/(T) dentro del gen de susceptibilidad al retinoblastoma humano, RB1.
El intrn 17 de 72 kb contiene un gen receptor acoplado a protena G, U16, que se transcribe de modo activo en la direccin opuesta al gen RBI. La
lnea superior (5' - 3 ') de cada par muestra los elementos de repeticin orientados en la direccin en sentido RB1\ la lnea inferior (3' - * 5) los muestra
en la orientacin antisentido. Hay 46 repeticiones Alu y 17 elementos UNE-1 (algunos agrupados de cerca se muestran con lneas divergentes), todos
localizados dentro de intrones. Slo dos de los elementos LINE-1 se aproximan a la longitud completa de 6.1 kb. Las secuencias (A)/(T) (n = 12 o
mayor) indicadas slo son las que se hallan fuera de las repeticiones dispersas. No se encontraron ejemplos de (C y(G ) para n = 12 o mayores.
Redibujado a partir de Toguchida y colaboradores (1993), Genomics 17, 535-543, con autorizacin de Elsevier.
272
CAPTULO NUEVE
de los seres humanos y los monos africanos (vase Batzer y Deininger, 2002). La repeticin Alu de longitud completa tiene alrededor
de 280 pb de largo y consiste en dos repeticiones tndem, cada una
de unos 120 pb de longitud seguida de una secuencia corta que es
abundante en residuos A en una cadena y residuos T en la cadena
complementaria. Sin embargo, existe asimetra entre las repeticio
nes tndem: una repeticin contiene una secuencia interna de 32
pb que falta en la otra (fig. 9-18B). Son comunes asimismo monmeros, que slo contienen una de las dos repeticiones tndem y
varias versiones truncadas de dmeros y monmeros, que propor
cionan un promedio de extensin del genoma de 230 pares de
bases.
Las repeticiones Alu poseen un contenido relativamente alto de
GC, aunque estn esparcidas en especial en la totalidad de las re
giones eucromticas del genoma, y se localizan de preferencia en las
bandas cromosmicas R abundantes en GC y asimismo en genes, en
contraste notable con la localizacin preferencia! de LINES en
DNA rico en AT (Korenberg y Rykowski, 1988). No obstante,
cuando se ubican dentro de genes estn, al igual que los elemen
tos LINE-1, confinadas en intrones y regiones no traducidas (fig.
9-19). A pesar de la tendencia a localizarse en DNA abundante en
GC, las repeticiones Alu de transposicin reciente muestran una pre
ferencia por DNA abundante en AT semejante a las de LINE, pe
Lecturas adicionales
H u m a n G e n o m e Nature Is s u e (15 February 2001). Nature 4 0 9
813-958 (papers are available electronically via the Nature
Genome Gateway at http://wvwv.nature.com/genomics/human/)
H u m a n G e n o m e Science Is s u e (16 February 2001). Science 29 1,
1177-1351 (papers are available electronically at http://www.
sciencemag.org/content/vol291issue5507/index.shtml/)
In te rP ro p ro te o m e a n a ly s is d a ta b a s e at http://www.ebi.ac.uk/
proteome/
M IT O M A P h u m a n m ito c h o n d ria l g e n o m e d a ta b a s e at
http://www.mitomap.org
Bibliografia
A d a c h i N , L ie b e r M R (2002) Bidirectional gene organization: a
common architectural feature of the human genome. Cell 109,
807-809.
A m b ro s V (2001) microRNAs: tiny regulators with great potential.
Cell 10 7. 823-826.
A n d e rs o n S , B a n k ie r AT, B a rre ll B G et at. (1981) Sequence and
organization of the human mitochondrial genome. Nature 2 9 0.
457-465.
B a ile y JA , G u Z , C la rk R A e f al. (2002) Recent segmental dupli
cations in the human genome. Science 2 9 7 , 1003-1007.
B a tz e r M A , D e in in g e r P L (2002) Alu repeats and human genetic
diversity. Nature Rev. Genet. 3, 370-378.
C . elegans s e q u e n c in g c o n s o rtiu m (1998) Genome sequence of
the nematode C. Elegans: a platform for investigating biology.
Science 2 8 2 , 2012-2018.
C a s tillo -D a v is C l, M e k h e d o v S L , H a rtl D L , K o o n in EV, K ond ra s h o v FA (2002) Selection for short introns in highly expres
sed genes. Nature Genet. 3 1 , 425-418.
C h o o K H , V is s e l B, N a g y A , E a rle E, K a lits ls (1991) A survey of
the genomic distribution of alpha satellite DNA on all the human