Está en la página 1de 29

Diversidad genética humana:

mutación y polimorfismo
El estudio de la variación genética y genómica es la piedra angular
conceptual de la genética en medicina y en el campo más amplio de la
genética humana. Durante el transcurso de la evolución, la afluencia
constante de nuevas variaciones de nucleótidos ha garantizado un alto grado
de diversidad e individualidad genéticas, y este tema se extiende a través de
todos los campos de la genética humana y médica. La diversidad genética
puede manifestarse como diferencias en la organización del genoma, cambios
de nucleótidos en la secuencia del genoma, variación del número de copias
de grandes segmentos de DNA genómico, alteraciones de la estructura o la
cantidad de proteínas que se encuentran en diversos tejidos, o como
cualquiera de estas modificaciones en el contexto de enfermedades clínicas.
Este capítulo es uno de los dedicados a examinar la naturaleza de las
diferencias determinadas genéticamente entre los individuos. La secuencia
del DNA nuclear de dos seres humanos no emparentados es idéntica en
alrededor del 99,5-99,9%. Sin embargo, es precisamente esa pequeña fracción
de diferencia de secuencia del DNA la responsable de la variabilidad
determinada genéticamente que es evidente tanto en la existencia diaria de
cada persona como en la medicina clínica. Muchas diferencias en la secuencia
del DNA tienen poco o ningún efecto sobre el aspecto externo, mientras que
otras son responsables directas de enfermedades. Entre esos dos extremos, se
sitúan las diferencias responsables de la variabilidad determinada
genéticamente en la anatomía, la fisiología, las intolerancias alimentarias, la
susceptibilidad a la infección, la predisposición al cáncer, las respuestas
terapéuticas y las reacciones adversas a los medicamentos y, quizá, incluso la
variabilidad en diversos rasgos de la personalidad, la aptitud deportiva y el
talento artístico.
Uno de los conceptos importantes de la genética humana y médica, y de
sus aspectos clínicos, es que las enfermedades con un componente claramente
hereditario son sólo una de las manifestaciones más evidentes y, a menudo,
más notables de las diferencias genéticas, el extremo de un continuum de
variaciones que abarca desde variantes patológicas raras que causan
enfermedades y variantes más comunes que pueden aumentar la
predisposición a éstas, hasta las variaciones más frecuentes en la población,
con una relevancia incierta respecto a las enfermedades.

117
ERRNVPHGLFRVRUJ
La naturaleza de la variación genética
Tal como se ha descrito en el capítulo 2, un segmento de DNA que ocupa una
posición o localización particulares en un cromosoma es un locus (plural
loci). Un locus puede ser grande, como un segmento de DNA que contiene
muchos genes (p. ej., el locus del complejo principal de histocompatibilidad
implicado en la respuesta del sistema inmunitario a sustancias extrañas);
puede ser un único gen, como el locus de la β-globina que se describió en el
capítulo 3; o puede ser incluso una única base en el genoma, como una
variante de un único nucleótido (v. fig. 2-6 y más adelante en este capítulo).
Las versiones alternativas de la secuencia de DNA en un locus se denominan
alelos. En lo que se refiere a muchos genes, hay un único alelo predominante
que suele estar presente en más de la mitad de los individuos de una
población y que los especialistas en genética denominan alelo natural o
común. (En el lenguaje habitual, suele denominarse alelo «normal». Sin
embargo, debido a que la variación genética es en sí misma muy «normal», la
existencia de diferentes alelos en personas «normales» es muy común. Por
tanto, debería evitarse el término «normal» para designar al alelo más
frecuente). Las otras versiones del gen son alelos variantes (o mutantes) que
se diferencian del alelo natural debido a la presencia de una mutación, es
decir, un cambio permanente en la secuencia de nucleótidos o en la
disposición del DNA. Obsérvese que los términos mutación y mutante se
refieren al DNA y no a los seres humanos portadores de alelos mutantes. Los
términos indican un cambio en la secuencia, pero no conllevan por lo demás
ninguna connotación respecto a la función o la idoneidad de dicho cambio.
La frecuencia de las diferentes variantes puede oscilar ampliamente en
diferentes poblaciones de todo el mundo, como se analizará en profundidad
en el capítulo 9. Si hay dos o más alelos relativamente frecuentes (definidos
por convención como aquellos con una frecuencia alélica > 1%) en un locus en
una población, se dice que el locus presenta polimorfismo (literalmente
«muchas formas») en esa población. La mayoría de los alelos variantes, sin
embargo, no son lo bastante frecuentes en una población para considerarlos
polimorfismos; algunos son tan raros como los que se encuentran en una sola
familia, y se denominan alelos «privados».

Concepto de mutación
En este capítulo, se empieza por analizar la naturaleza de la mutación, que
oscila desde el cambio de un solo nucleótido a alteraciones de un cromosoma
entero. Reconocer un cambio significa que tiene que haber un patrón de
referencia, comparado con el cual la variante muestra una diferencia. Como
vimos en el capítulo 2, no existe una sola persona cuya secuencia del genoma
pueda servir como un estándar de este tipo para la especie humana, por lo
que la secuencia o combinación más frecuente en una población en cualquier

118
ERRNVPHGLFRVRUJ
posición del genoma se designa arbitrariamente secuencia de referencia (v. fig.
2-6). A medida que se muestrean cada vez más genomas de individuos en
todo el mundo (y, por tanto, según se detecta cada vez mayor variación entre
los siete mil millones de genomas que componen actualmente nuestra
especie), este genoma de referencia está sometido a una evaluación y cambio
constantes. De hecho, varias colaboraciones internacionales comparten y
actualizan los datos sobre la naturaleza y frecuencia de la variación del DNA
en diferentes poblaciones en el contexto de la secuencia de referencia del
genoma humano y hacen que los datos estén disponibles a través de bases de
datos de acceso público que sirven como recursos esenciales para científicos,
médicos y otros profesionales sanitarios (tabla 4-1).

Tabla 4-1
Bases de datos útiles de información sobre la diversidad genética
humana

Descripción URL
El Proyecto Genoma humano, completado en 2003, fue una colaboración internacional http://www.genome.gov/10001772
para secuenciar y establecer el mapa del genoma de nuestra especie. El borrador de la http://genome.ucsc.edu/cgi-bin/hgGateway
secuencia del genoma se publicó en 2001, y el conjunto del genoma de referencia «casi http://www.ensembl.org/Homo_sapiens/Info/Index
completo» se publicó en 2004.
La Base de datos de polimorfismos de un único nucleótido (dbSNP) y la Base de datos http://www.ncbi.nlm.nih.gov/snp/
de variaciones estructurales (dbVar) son bases de datos de variaciones a pequeña escala http://www.ncbi.nlm.nih.gov/dbvar/
y a gran escala que incluyen variantes de un único nucleótido, microsatélites, indels y
CNV.
El proyecto 1.000 Genomas está secuenciando los genomas de un gran número de www.1000genomes.org
individuos para proporcionar un recurso exhaustivo sobre la variación genética en
nuestra especie. Todos los datos están disponibles públicamente.
La Base de datos de mutaciones de genes humanos es una recopilación exhaustiva de www.hgmd.org
mutaciones de la línea germinal asociadas o causantes de enfermedades hereditarias
humanas (en la actualidad, incluye más de 120.000 mutaciones en 4.400 genes).
La Base de datos de variantes genómicas es un catálogo revisado de la variación http://dgv.tcag.ca
estructural del genoma humano. A fecha de 2012, la base de datos contenía más de
400.000 entradas, con más de 200.000 CNV, 1.000 inversiones y 34.000 indels.
La Base de datos japonesa de polimorfismos de un único nucleótido (JSNP Database) http://snp.ims.u-tokyo.ac.jp/
publica los SNP descubiertos como parte del Proyecto Genoma del milenio.

CNV, variante del número de copias; SNP, polimorfismo de un único nucleótido.


Actualizada de Willard HF: The human genome: a window on human genetics, biology and medicine. En
Ginsburg GS, Willard HF, editores: Genomic and personalized medicine, 2.ª ed., Nueva York, 2013,
Elsevier.

Las mutaciones se clasifican a veces por el tamaño de la secuencia de DNA


alterado y, en otras ocasiones, por el efecto funcional de la mutación sobre la
expresión génica. Aunque la clasificación por tamaño es algo arbitraria,
puede ser útil conceptualmente distinguir entre las mutaciones a tres niveles
diferentes:
• Mutaciones que dejan los cromosomas intactos, pero cambian el número de
cromosomas en una célula (mutaciones cromosómicas).
• Mutaciones que modifican sólo una parte de un cromosoma y que podrían
implicar un cambio en el número de copias de un segmento
subcromosómico o una reorganización estructural que implica partes de
uno o más cromosomas (mutaciones regionales o subcromosómicas).
• Alteraciones de la secuencia de DNA, que implican la sustitución, deleción
o inserción de DNA y que oscilan desde un solo nucleótido hasta un límite

119
ERRNVPHGLFRVRUJ
fijado arbitrariamente de alrededor de 100 kb (mutaciones de genes o del
DNA).
El fundamento y las consecuencias de este tercer tipo de mutación son el
tema central de este capítulo, mientras que tanto las mutaciones
cromosómicas como regionales se describirán en detalle en los capítulos 5 y 6.
Las consecuencias funcionales de las mutaciones del DNA, incluso las que
cambian un único par de bases, pueden oscilar de ser completamente inocuas
a causar una enfermedad grave, dependiendo de la ubicación precisa, la
naturaleza y las dimensiones de la mutación. Por ejemplo, incluso una
mutación dentro de un exón codificante de un gen puede no tener ningún
efecto sobre la expresión de un gen si el cambio no modifica la secuencia
primaria de aminoácidos del producto polipeptídico; e incluso si lo hace, el
cambio resultante de la secuencia de aminoácidos codificada puede no alterar
las propiedades funcionales de la proteína. Por tanto, no todas las mutaciones
son evidentes en un individuo.

Concepto del polimorfismo genético


La secuencia de DNA de una región determinada del genoma es muy similar
en los cromosomas de muchos individuos de todo el mundo. De hecho,
cualquier segmento de DNA humano de unos 1.000 pb elegido al azar
contiene, de media, solo un par de bases diferentes entre dos cromosomas
homólogos heredados de los progenitores (suponiendo que los progenitores
no estén emparentados). Sin embargo, en todas las poblaciones humanas, se
han identificado y catalogado decenas de millones de diferencias de un único
nucleótido y más de un millón de variantes más complejas. Debido a que el
muestreo es limitado, es probable que estas cifras sean una subestimación de
la auténtica magnitud de la diversidad genética en nuestra especie. Todavía
quedan muchas poblaciones de todo el mundo por estudiar, e incluso en las
que se han estudiado, el número de individuos evaluados es demasiado
pequeño para revelar la mayoría de las variantes que tienen frecuencias
alélicas menores del 1-2%. Por tanto, a medida que se incluyan más personas
en los proyectos para descubrir variantes, seguramente se revelarán variantes
adicionales (y más raras).
El hecho de que una variante se considere un polimorfismo o no depende
por completo de si su frecuencia en una población supera el 1% de los alelos
en dicha población y no del tipo de mutación que la ha provocado, de la
longitud del segmento de genoma implicado o de si tiene un efecto
demostrable en el individuo. La localización de una variante respecto a un
gen tampoco determina si la variante es un polimorfismo. Aunque la mayoría
de polimorfismos de secuencia se localizan entre genes o en intrones y
carecen de consecuencias para el funcionamiento de cualquier gen, otros
pueden situarse en la secuencia codificante de los propios genes y causar
distintas variantes proteicas que, a su vez, pueden dar lugar a diferencias
evidentes en las poblaciones humanas. Otras están en regiones reguladoras y

120
ERRNVPHGLFRVRUJ
también pueden tener efectos importantes en la transcripción o en la
estabilidad del RNA.
Se podría pensar que las mutaciones deletéreas que provocan
enfermedades monogénicas raras probablemente sean demasiado escasas
para alcanzar la frecuencia necesaria para considerarlas polimorfismos.
Aunque es cierto que los alelos responsables de la mayoría de las
enfermedades claramente hereditarias son infrecuentes, algunos alelos que
tienen un gran impacto sobre la salud, como los alelos de genes codificantes
de enzimas que metabolizan fármacos (p. ej., la sensibilidad al abacavir en
algunas personas infectadas con el virus de la inmunodeficiencia humana
[VIH] [Caso 1] o la mutación de la drepanocitosis en poblaciones africanas y
afroamericanas (v. cap. 11) [Caso 42]), son relativamente frecuentes. Sin
embargo, estas son excepciones y, a medida que se descubren y catalogan
más y más variaciones genéticas, está claro que la inmensa mayoría de
variantes del genoma, tanto frecuentes como raras, reflejan diferencias de
secuencia del DNA carentes de relevancia conocida para la salud.
Los polimorfismos son un elemento clave para el estudio de la genética
humana y médica. La capacidad de distinguir las diferentes formas
heredadas de un gen o los distintos segmentos del genoma proporciona
instrumentos decisivos para una amplia gama de aplicaciones, tanto en la
investigación como en la práctica clínica (v. cuadro).

P olim or f ism os y va r ia ción he r e da da e n ge né tica


hum a na y m é dica
Las variantes alélicas se pueden usar como «marcadores» para el
seguimiento de la herencia del segmento correspondiente del genoma en las
familias y en las poblaciones. Estas variantes se pueden utilizar del siguiente
modo:
• Como herramientas de investigación potentes para ubicar un gen en una
región particular de un cromosoma mediante análisis de ligamiento o
asociación alélica (v. cap. 10).
• Para el diagnóstico prenatal de enfermedades genéticas y para la detección
de portadores de alelos deletéreos (v. cap. 17), así como en los bancos de
sangre y la tipificación de tejidos para transfusiones y trasplantes de
órganos.
• En las aplicaciones forenses, como pruebas de identificación para
determinar la paternidad, la identificación de los restos de víctimas de
delitos o la verificación de la concordancia entre el DNA de un sospechoso
y el del agresor (v. este capítulo).
• En los esfuerzos continuos por proporcionar una medicina personalizada
basada en la genómica (v. cap. 18), en la que se individualiza la asistencia
médica de un individuo en función de si es portador de variantes que
aumentan o disminuyen el riesgo de trastornos en la edad adulta (como
cardiopatía isquémica, cáncer y diabetes; v. cap. 8) o que influyen en la

121
ERRNVPHGLFRVRUJ
eficacia o la seguridad de determinados fármacos.

122
ERRNVPHGLFRVRUJ
Variación heredada y polimorfismo en el
DNA
La enorme cantidad de información de secuencias de DNA provenientes de
muchos miles de individuos de todo el mundo, obtenida por el Proyecto
Genoma Humano original y el estudio posterior, ha proporcionado la
información necesaria para empezar a caracterizar los tipos y frecuencias de
la variación polimórfica presente en el genoma humano y para generar
catálogos de la diversidad de la secuencia del DNA humano a escala
mundial. Los polimorfismos del DNA pueden clasificarse de acuerdo con la
variación de la secuencia del DNA entre diferentes alelos (tabla 4-2 y figs. 4-1
y 4-2).

Tabla 4-2
Variación frecuente en el genoma humano

kb, kilobases; Mb, megabases; pb, par de bases.

FIGURA 4-1 Tres polimorfismos en el DNA genómico del segmento del genoma
humano de referencia mostrado en la parte superior (v. también fig. 2-6). El

123
ERRNVPHGLFRVRUJ
polimorfismo de un único nucleótido (SNP) en la posición 8 tiene dos alelos, uno
con una T (correspondiente a la secuencia de referencia) y otro con una C. Hay
dos indels en esta región. En el indel A, el alelo 2 tiene una inserción de una G
entre las posiciones 11 y 12 en la secuencia de referencia (alelo 1). En el indel B,
el alelo 2 tiene una deleción de 2 pb de las posiciones 5 y 6 en la secuencia de
referencia.

FIGURA 4-2 Ejemplos de polimorfismo en el genoma humano mayores que


los SNP.
En el sentido de las agujas del reloj desde la parte superior derecha: el locus de
microsatélite tiene tres alelos, con 4, 5 o 6 copias de una repetición del
trinucleótido CAA. El polimorfismo de inversión tiene tres alelos correspondientes
a las dos orientaciones (indicadas por las flechas) del segmento genómico
mostrado en verde; estas inversiones pueden implicar a regiones de hasta
muchas megabases de DNA. Las variantes del número de copias implican la
deleción o duplicación de entre cientos de kilobases y una megabase de DNA
genómico. En el ejemplo mostrado, el alelo 1 contiene una única copia, mientras
que el alelo 2 contiene tres copias del segmento cromosómico que incluye los
genes F y G; otros posibles alelos con 0, 2, 4 o más copias de F y G no se
muestran. El polimorfismo de inserción de elemento móvil tiene dos alelos, uno
con inserción de un retroelemento repetido LINE de unas 6 kb y otro sin ella; la
inserción del elemento móvil modifica la distancia entre los dos genes y puede
alterar la expresión génica en la región.

Polimorfismos de un único nucleótido (SNP)


Los polimorfismos más sencillos y más frecuentes de todos son los
polimorfismos de un único nucleótido (SNP; del inglés single nucleotide
polymorphisms). Un locus caracterizado por un SNP suele tener sólo dos alelos
que corresponden a las dos bases distintas que ocupan un determinado sitio
en el genoma (v. fig. 4-1). Como se ha mencionado previamente, los SNP son
comunes y ocurren, de media, una vez cada 1.000 pb en el genoma. Sin
embargo, la distribución de los SNP es desigual en todo el genoma; se
observan muchos más SNP en las partes no codificantes del genoma, en
intrones y en secuencias que están a una cierta distancia de genes conocidos.
No obstante, también hay un número significativo de SNP que se localizan en

124
ERRNVPHGLFRVRUJ
genes y otros elementos funcionales conocidos del genoma. Para el conjunto
de genes codificantes de proteínas, hasta la fecha se han documentado más de
100.000 SNP localizados en exones. Alrededor de la mitad de ellos no
modifican la secuencia de aminoácidos prevista de la proteína codificada, por
lo que se denominan sinónimos, mientras que la otra mitad sí altera la
secuencia de aminoácidos y se denominan no sinónimos. Otros SNP
introducen o cambian un codón de terminación (v. tabla 3-1), mientras que
otros modifican un sitio de corte y empalme conocido; estos SNP son
candidatos a padecer consecuencias funcionales significativas.
El significado para la salud de la gran mayoría de los SNP se desconoce y
es objeto de continuas investigaciones. El hecho de que los SNP sean
frecuentes no implica que sean neutrales o que no ejerzan ningún efecto sobre
la salud o la longevidad. Al parecer, el efecto de los SNP frecuentes es una
modificación relativamente sutil de la susceptibilidad a la enfermedad, más
que la causa directa de una enfermedad grave.

Polimorfismos de inserción-deleción
Una segunda clase de polimorfismos son variaciones producidas por la
inserción o la deleción (in/dels, o simplemente indels) de entre 1 y hasta
alrededor de 1.000 pb, aunque se han descrito también indels mayores. Se han
descrito más de un millón de indels, y su número en el genoma de cualquier
individuo es del orden de centenares de miles. Alrededor de la mitad se
denominan «simples», porque sólo tienen dos alelos, es decir, la presencia o
ausencia del segmento insertado o delecionado (v. fig. 4-1).

Polimorfismos de microsatélites
Sin embargo, otros indels son multialélicos, debido a la inserción en tándem
de un número variable de segmentos de DNA en una localización particular,
lo que constituye lo que se denomina microsatélite. Consisten en segmentos
de DNA compuestos por unidades de 2, 3 o 4 nucleótidos, como TGTGTG,
CAACAACAA, o AAATAAATAAAT, que se repiten entre una y varias
docenas de veces en una localización particular del genoma (v. fig. 4-2). Los
distintos alelos en un polimorfismo de microsatélite se deben a los diferentes
números de unidades de nucleótidos repetidas que están presentes en
cualquier microsatélite, por lo que en ocasiones se denominan polimorfismos
cortos de repetición en tándem (STR). Un locus de microsatélite suele tener
muchos alelos (longitudes de repetición) que pueden evaluarse con rapidez
mediante procedimientos de laboratorio estándar para distinguir a diferentes
individuos y para inferir relaciones familiares (fig. 4-3). En el genoma
humano, se conocen muchas decenas de miles de loci polimórficos de
microsatélites.

125
ERRNVPHGLFRVRUJ
FIGURA 4-3 Esquema de un marcador de microsatélite hipotético en el
DNA humano.
Los alelos de diferente tamaño (numerados del 1 al 7) corresponden a fragmentos
de DNA genómico que contienen distintos números de copias de una repetición
de microsatélite, y sus longitudes relativas se determinan separándolos mediante
electroforesis en gel. El alelo más corto (alelo 1) migra hacia el fondo del gel,
mientras que el alelo más largo (alelo 7) se mantiene más cerca de la parte
superior. Izquierda, para este microsatélite multialélico, cada uno de los seis
individuos no emparentados tiene dos alelos diferentes. Derecha, en una familia,
la herencia de los alelos puede seguirse desde cada progenitor a cada uno de los
tres hijos.

Los microsatélites son un grupo de indels especialmente útiles. En la


actualidad, la detección de diferentes alelos en distintos microsatélites es el
método de elección para la determinación de la huella de DNA usada en las
pruebas de identidad. Por ejemplo, el Federal Bureau of Investigation (FBI) en
Estados Unidos utiliza actualmente la colección de alelos en 13 de estos loci
para su panel de huella de DNA. Es tan improbable que dos individuos (que
no sean gemelos monocigóticos) tengan exactamente los mismos alelos en los
13 loci, que el panel permite la comprobación definitiva acerca de si dos
muestras provienen o no del mismo individuo. La información se almacena
en el Combined DNA Index System (CODIS) del FBI, que en diciembre de
2014 incluía más de 11.548.700 perfiles de delincuentes, 1.300.000 perfiles de
arrestados y 601.600 perfiles forenses (material obtenido en el escenario del
delito). Muchos estados y el Departamento de Defensa de EE.UU. tienen
bases de datos similares de huella de DNA, al igual que unidades en otros
países.

Polimorfismos de inserción de elementos móviles


Casi la mitad del genoma humano consiste en familias de elementos
repetitivos que se encuentran dispersos por todo el genoma (v. cap. 2).
Aunque la mayoría de las copias de estas repeticiones son estacionarias,
algunas de ellas son móviles y contribuyen a la diversidad genética humana a
través del proceso de la retrotransposición, un proceso que implica la
transcripción en un RNA, la transcripción inversa a una secuencia de DNA y
la inserción (es decir, la transposición) en otro sitio del genoma, como se
comentó en el capítulo 3 en el contexto de los pseudogenes procesados. Las
dos familias más comunes de elementos móviles son las familias Alu y LINE
de repeticiones, y se han descrito casi 10.000 polimorfismos de inserción de

126
ERRNVPHGLFRVRUJ
elementos móviles en distintas poblaciones. Cada locus polimórfico consta de
dos alelos, uno con el elemento móvil insertado y otro sin él (v. fig. 4-2). Los
polimorfismos de elementos móviles se encuentran en todos los cromosomas
humanos; aunque la mayoría están en regiones del genoma donde no hay
genes, una pequeña proporción aparece dentro de los genes. Al menos 5.000
de estos loci polimórficos tienen una frecuencia de inserción superior al 10%
en diferentes poblaciones.

Variantes del número de copias


Otro tipo importante de polimorfismo humano es el de las variaciones en el
número de copias (CNV). Las CNV están relacionadas conceptualmente con
los indels y los microsatélites, pero consisten en la variación del número de
copias de segmentos más grandes del genoma, con un tamaño que oscila
desde 1.000 pb a centenares de kilobases. Las variantes mayores de 500 kb se
encuentran en el 5-10% de los individuos en la población general, mientras
que las variantes que comprenden más de 1 Mb se observan en el 1-2%. Las
CNV más largas se encuentran a veces en regiones del genoma que se
caracterizan por bloques repetidos de secuencias homólogas denominadas
duplicaciones segmentarias (o segdups). Su importancia en la mediación de
la duplicación y la deleción de los segmentos correspondientes se comenta
con más detalle en el capítulo 6, en el contexto de diversos síndromes
cromosómicos.
Las CNV más cortas en particular pueden tener sólo dos alelos (es decir, la
presencia o ausencia de un segmento), lo que es similar a las indels en este
aspecto. Las CNV más grandes tienden a tener múltiples alelos debido a la
presencia de diferentes números de copias de un segmento de DNA en
tándem (v. fig. 4-2). En lo referente a la diversidad del genoma entre
individuos, la cantidad de DNA presente en las CNV supera en gran medida
a la que difiere debido a SNP. El contenido de dos genomas humanos cualesquiera
puede variar hasta en 50-100 Mb debido a diferencias de número de copias en loci de
CNV.
En especial, el segmento variable en muchos loci de CNV puede incluir
desde un gen hasta varias docenas de genes y, por lo tanto, las CNV suelen
estar implicadas en rasgos que conllevan una alteración de la dosis génica.
Cuando una CNV es suficientemente frecuente como para ser polimórfica,
representa un fondo de variación común que debe comprenderse para
interpretar correctamente las alteraciones del número de copias observadas
en los pacientes. Al igual que sucede con todos los polimorfismos de DNA, la
importancia de diferentes alelos de CNV en la salud y la susceptibilidad a la
enfermedad es motivo de numerosas investigaciones.

Polimorfismos de inversión
Un último grupo de polimorfismos que se comentará es el de las inversiones,

127
ERRNVPHGLFRVRUJ
cuyo tamaño oscila desde unos pocos pares de bases a grandes regiones del
genoma (de hasta varias megabases) y que pueden estar presentes en dos
orientaciones posibles en los genomas de diferentes individuos (v. fig. 4-2). La
mayoría de las inversiones se caracterizan por regiones de homología de
secuencia en los extremos del segmento invertido, lo que implica un proceso
de recombinación homóloga en el origen de las inversiones. En su forma
equilibrada, las inversiones, con independencia de su orientación, no
conllevan una ganancia o pérdida de DNA, y los polimorfismos de inversión
(con dos alelos correspondientes a las dos orientaciones) pueden alcanzar
frecuencias considerables en la población general. Sin embargo, la
recombinación anómala puede dar lugar a la duplicación o deleción del DNA
situado entre las regiones de homología, asociada a trastornos clínicos que se
analizarán con más detalle en los capítulos 5 y 6.

128
ERRNVPHGLFRVRUJ
Origen y frecuencia de los diferentes tipos
de mutaciones
A lo largo del espectro de la diversidad que va de las variantes raras a los
polimorfismos más frecuentes, los diferentes tipos de mutaciones surgen en el
contexto de procesos fundamentales de la división celular como la
replicación, reparación y recombinación del DNA, así como la segregación de
cromosomas en la mitosis o la meiosis. La frecuencia de mutaciones por
locus por división celular es una medida básica del grado de propensión a
los errores de estos procesos, lo que tiene una importancia fundamental para
la biología del genoma y la evolución. Sin embargo, un aspecto más
importante para los genetistas médicos es la frecuencia de mutaciones por
locus de la enfermedad por generación, en lugar de la tasa global de
mutación en todo el genoma por división celular. Sin embargo, la medición
de las tasas de mutaciones causantes de enfermedad puede ser difícil, debido
a que muchas mutaciones causan una mortalidad embrionaria precoz antes
de que se pueda identificar la mutación en un feto o recién nacido, o porque
algunas personas con una mutación causante de enfermedad puede que sólo
manifiesten el trastorno en una etapa tardía de la vida o que nunca muestren
signos de la enfermedad. A pesar de estas limitaciones, se han hecho grandes
avances a la hora de determinar la frecuencia global (a veces denominada
carga genética) de todas las mutaciones que afectan a la especie humana.
Los principales tipos de mutaciones descritas brevemente con anterioridad
se producen con frecuencias apreciables en muchas células diferentes del
cuerpo. La práctica de la genética se centra sobre todo en la variación del
genoma heredado; sin embargo, toda esa variación tuvo que originarse como
cambios nuevos (de novo) en las células germinales. En ese momento, esa
variante sería bastante rara en la población (ocurriría una sola vez), y su
frecuencia última en la población a lo largo del tiempo depende del azar y de
los principios de la herencia y de la genética de poblaciones (v. caps. 7 y 9).
Aunque la mutación original hubiese ocurrido sólo en el DNA de las células
de la línea germinal, cualquier persona que heredase la mutación la portaría
como una mutación constitucional en todas las células del cuerpo.
Por el contrario, las mutaciones somáticas se producen en todo el cuerpo,
pero no pueden transmitirse a la siguiente generación. Dada la tasa de
mutación (v. después en esta sección), se podría predecir que, de hecho, cada
célula de un individuo tiene una versión ligeramente diferente de su genoma,
dependiendo del número de divisiones celulares que se han producido desde
la concepción hasta el momento de la adquisición de la muestra. En los
tejidos muy proliferativos, como las células epiteliales intestinales o las
células hematopoyéticas, es muy probable que esta heterogeneidad genómica
sea mayor. Sin embargo, la mayoría de estas mutaciones no suelen detectarse,
porque, en las pruebas clínicas, se suele secuenciar el DNA a partir de la

129
ERRNVPHGLFRVRUJ
muestras compuestas por muchos millones de células; en una muestra de este
tipo, la base más prevalente en cualquier posición del genoma será la que está
presente en la concepción, y las mutaciones somáticas raras serán en gran
medida invisibles y no determinadas. Sin embargo, estas mutaciones pueden
tener importancia clínica en los trastornos causados por la mutación en un
único subgrupo de células en ciertos tejidos, lo que da lugar a mosaicismo
somático (v. cap. 7).
La principal excepción a que las mutaciones somáticas suelen no detectarse
en muestras de DNA multicelular es en el cáncer, en el que la base
mutacional para el origen del cáncer y de la naturaleza clonal de la evolución
del tumor hace que ciertos cambios somáticos estén presentes en
prácticamente todas las células de un tumor. De hecho, es fácil encontrar
1.000-10.000 mutaciones somáticas (y a veces muchas más) en los genomas de
la mayoría de los cánceres de adultos, con frecuencias y patrones de mutación
específicos para los diferentes tipos de cáncer (v. cap. 15).

Mutaciones cromosómicas
Las mutaciones que producen un cambio del número de cromosomas debido
a una segregación inadecuada de éstos son unas de las más frecuentes en los
seres humanos, con una tasa de una por cada 25-50 divisiones celulares
meióticas. Esta estimación es claramente a la baja, puesto que las
consecuencias para el desarrollo de muchas de estas mutaciones pueden ser
tan graves que los fetos resultantes son abortados de manera espontánea poco
después de la concepción, sin llegar a ser detectados (v. caps. 5 y 6).

Mutaciones regionales
Las mutaciones que afectan a la estructura o a la organización regional de los
cromosomas pueden surgir de varias maneras diferentes. Las duplicaciones,
deleciones e inversiones de un segmento de un único cromosoma se deben
predominantemente a la recombinación homóloga entre segmentos de DNA
con alta homología de secuencia situados en más de un sitio en una región de
un cromosoma. Sin embargo, no todas las mutaciones estructurales se deben
a la recombinación homóloga. Otras, como las translocaciones cromosómicas
y algunas inversiones, pueden producirse en los sitios de rotura espontánea
del DNA bicatenario. Cuando se produce la rotura en dos lugares en
cualquier lugar del genoma, los dos extremos rotos se pueden unir entre sí
incluso sin ninguna homología de secuencia evidente entre ambos extremos
(proceso denominado reparación por unión de extremos no homólogos). En el
capítulo 6 se describen con detalle ejemplos de estas mutaciones.

Mutaciones génicas
Las mutaciones génicas o del DNA, incluidas las sustituciones de pares de

130
ERRNVPHGLFRVRUJ
bases, las inserciones y las deleciones (fig. 4-4), se originan mediante dos
mecanismos básicos: errores producidos durante el proceso de replicación del
DNA o mutaciones ocasionadas por un fallo en la reparación correcta del
DNA dañado. Muchas de estas mutaciones son espontáneas y se producen
durante los procesos normales (pero imperfectos) de replicación y reparación
del DNA, mientras que otras son inducidas por agentes físicos o químicos
denominados mutágenos.

FIGURA 4-4 Ejemplos de mutaciones en una porción de un gen hipotético


del que se muestran cinco codones (delimitados por las líneas de puntos).
El primer par de bases del segundo codón en la secuencia de referencia (fondo
azul) está mutado por una sustitución, deleción o inserción de base. La sustitución
de base de una G por la T en esta posición provoca un cambio de codón (fondo
verde) y, suponiendo que la cadena superior es la cadena codificante, un cambio
no sinónimo previsto de una serina a una alanina en la proteína codificada (v.
código genético en la tabla 3-1); todos los demás codones no se modifican. Tanto
la deleción como la inserción de un único par de bases provocan una mutación de
cambio del marco de lectura en el que el marco de lectura de traducción se
modifica para todos los codones subsiguientes (fondo verde), hasta que se llega a
un codón de terminación.

Errores en la replicación del DNA


El proceso de replicación del DNA (v. fig. 2-4) suele ser muy preciso; la
mayoría de los errores de replicación (p. ej., inserción de una base distinta a la

131
ERRNVPHGLFRVRUJ
complementaria que restauraría el par de bases en esa posición en la doble
hélice) se eliminan enseguida del DNA, y se corrigen por varias enzimas de
reparación del DNA, que primero reconocen qué cadena de la doble hélice
recién sintetizada contiene la base incorrecta y después la sustituyen por la
base complementaria correcta, proceso denominado corrección de errores del
DNA. La replicación del DNA debe ser un proceso muy preciso; de lo
contrario, la carga de mutaciones sería intolerable para el organismo y la
especie. La enzima DNA polimerasa duplica con exactitud ambas cadenas de
la doble hélice mediante una combinación de reglas estrictas de
emparejamiento de las bases (la A se empareja con la T, y la C con la G), pero
introduce un error cada 10 millones de pb. Una verificación adicional de los
errores de replicación corrige después más del 99,9% de los fallos en la
replicación del DNA. Por tanto, la tasa global de mutaciones debida a errores
de replicación es notablemente baja, 10–10 por división celular, lo que supone
menos de una mutación por genoma por división celular.

Reparación del daño en el DNA


Además de los errores de replicación, se calcula que entre 10.000 y 1.000.000
nucleótidos por célula humana y por día sufren daño debido a procesos
químicos espontáneos, como la depurinación, la desmetilación y la
desaminación; por reacciones con mutágenos químicos (naturales o no) del
ambiente, y por exposición a las radiaciones ionizantes o ultravioleta. Una
parte de ese daño es reparada, pero no la totalidad. Aunque el daño sea
reconocido y eliminado, es posible que el mecanismo de reparación cree
mutaciones al introducir bases equivocadas. Por tanto, al contrario de lo que
ocurre con las modificaciones del DNA relacionadas con su replicación, que
suelen subsanarse mediante el procedimiento de la corrección de errores, los
cambios de nucleótidos producidos por el daño en el DNA y su reparación
producen a menudo mutaciones permanentes.
Una mutación espontánea particularmente frecuente es la sustitución de T
por C (o A por G en la otra cadena). La explicación de esta observación se
obtiene al considerar la principal forma de modificación epigenética en el
genoma humano, la metilación del DNA, comentada en el capítulo 3. La
desaminación espontánea de la 5-metilcitosina a timidina (compare las
estructuras de la citosina y de la timina en la fig. 2-2) en el doblete CpG da
lugar a mutaciones C a T o G a A (dependiendo de la cadena de DNA en la
que se encuentre la 5-metilcitosina desaminada). Puede que estas mutaciones
espontáneas no sean reconocidas por la maquinaria de reparación del DNA y,
por tanto, queden establecidas en el genoma después del siguiente ciclo de
replicación del DNA. Más del 30% de todas las sustituciones de un único
nucleótido son de este tipo, y se producen con una tasa 25 veces superior a la
de cualquier otra mutación que afecte a un solo nucleótido. Por tanto, el
doblete CpG representa un verdadero «punto caliente» de mutación en el
genoma humano.

132
ERRNVPHGLFRVRUJ
Tasa global de mutaciones del DNA
Aunque la tasa de mutaciones del DNA en loci específicos se ha estimado
utilizando diversos métodos en los últimos 50 años, el impacto global de los
errores de replicación y reparación en la aparición de nuevas mutaciones en
todo el genoma se puede determinar en la actualidad directamente mediante
secuenciación del genoma completo de tríos formados por un hijo y ambos
progenitores, en busca de nuevas mutaciones en el hijo que no estén
presentes en la secuencia del genoma de ninguno de los progenitores. La tasa
global de nuevas mutaciones entre gametos maternos y paternos es, en
promedio, de alrededor de 1,2 × 10−8 mutaciones por par de bases por
generación. Por tanto, es probable que cada persona reciba unas 75 nuevas
mutaciones en su genoma de alguno de los progenitores. Esta tasa, sin embargo,
varía entre los diversos genes del genoma y tal vez entre las distintas
poblaciones, o incluso entre los diferentes individuos. De forma global, esta
tasa, combinada con datos de crecimiento y de dinámica de la población,
predice que debe haber un gran número de mutaciones relativamente nuevas
(y, por tanto, muy raras) en la población actual mundial de siete mil millones
de personas.
Como sería de prever, la inmensa mayoría de estas mutaciones
corresponderán a cambios de un solo nucleótido en posiciones no
codificantes del genoma y probablemente tendrán poco o ningún significado
funcional. Sin embargo, a nivel de las poblaciones, no se debe pasar por alto
el impacto colectivo potencial de estas nuevas mutaciones en genes de
importancia médica. En Estados Unidos, por ejemplo, donde hay más de 4
millones de recién nacidos vivos cada año, se producirán alrededor de 6
millones de nuevas mutaciones en secuencias codificantes; por lo tanto,
incluso para un único gen codificante de proteína de tamaño medio, se puede
prever que varios cientos de recién nacidos cada año presentarán una
mutación nueva en su secuencia codificante.
Varios estudios similares desde el punto de vista conceptual han
determinado la tasa de mutaciones en las CNV, donde la aparición de una
nueva variante en longitud depende de la recombinación, más que de los
errores en la síntesis de DNA para generar un nuevo par de bases. La tasa
medida de la formación de nuevas CNV (≈1,2 × 10−2 por locus por generación)
es varias órdenes de magnitud mayor que la de sustituciones de bases.

Tasa de mutaciones génicas causantes de enfermedad


La forma más directa de estimar la tasa de mutaciones causantes de
enfermedades por locus por generación es medir la incidencia de casos
nuevos de una enfermedad genética que no está presente en ninguno de los
progenitores y que se debe a una única mutación que causa una enfermedad
claramente reconocible en todos los recién nacidos portadores de esa
mutación. La acondroplasia es un trastorno en el que la reducción del
crecimiento óseo provoca talla baja (Caso 2) y es una de las enfermedades que
cumplen esos requisitos. En un estudio, se detectaron siete niños

133
ERRNVPHGLFRVRUJ
acondroplásicos en una serie de 242.257 nacimientos consecutivos. Los siete
tenían progenitores de estatura normal y, dado que la acondroplasia se
manifiesta siempre cuando existe una mutación, los siete casos se
consideraron mutaciones nuevas. La tasa de mutación nueva en este locus
puede calcularse como 7 mutaciones en un total de 2 × 242.257 copias del gen
relevante, o aproximadamente 1,4 × 10–5 mutaciones causantes de enfermedad
por locus por generación. Esta tasa de mutación elevada es especialmente
llamativa, porque se ha observado que casi todos los casos de acondroplasia
se deben a una mutación idéntica de G a A en la que un codón de glicina se
cambia a uno de arginina en la proteína codificada.
La tasa de mutaciones génicas que causan enfermedades se ha estimado
para algunos trastornos hereditarios, en los que se determinó la existencia de
mutaciones nuevas a través de la aparición y detección del fenotipo de la
enfermedad (tabla 4-3). Las tasas medidas varían en un rango de 1.000 veces,
de 10–4 a 10–7 mutaciones por locus por generación. La razón de esas
diferencias puede estar relacionada con algunos o con todos los siguientes
factores: el tamaño de los distintos genes, la fracción de todas las mutaciones
en ese gen que dará lugar a la enfermedad, la edad y el sexo del progenitor
que sufrió la mutación, el mecanismo de la mutación y la presencia o
ausencia de «puntos calientes» de mutación en el gen. De hecho, la tasa
elevada de la mutación específica en la acondroplasia puede explicarse, en
parte, por el hecho de que la mutación en la otra cadena es un cambio C a T
en una posición donde se produce metilación CpG y es un punto caliente
para la mutación por desaminación, como se ha descrito previamente.

Tabla 4-3
Estimaciones de las tasas de mutación para genes seleccionados de
enfermedades humanas

Enfermedad Locus (proteína) Tasa de mutación*


Acondroplasia (Caso 2) FGFR3 (receptor del factor de crecimiento fibroblástico 3) 1,4 × 10−5
Aniridia PAX6 (Pax6) 2,9-5 × 10−6
Distrofia muscular de Duchenne (Caso 14) DMD (distrofina) 3,5-10,5 × 10−5
Hemofilia A (Caso 21) F8 (factor VIII) 3,2-5,7 × 10−5
Hemofilia B (Caso 21) F9 (factor IX) 2-3 × 10−6
Neurofibromatosis, tipo 1 (Caso 34) NF1 (neurofibromina) 4-10 × 10−5
Poliquistosis renal, tipo 1 (Caso 37) PKD1 (poliquistina) 6,5-12 × 10−5
Retinoblastoma (Caso 39) RB1 (Rb1) 5-12 × 10−6

Basada en datos de Vogel F, Motulsky AG: Human genetics, 3.ª ed., Berlín, 1997, Springer-Verlag.
*
Expresada en mutaciones por locus por generación.

A pesar de este rango de tasas entre los distintos genes, la tasa media de
mutación génica es de alrededor de 10−6. Debido a que existen al menos 5.000
genes en el genoma humano en los que se sabe que las mutaciones causan
una enfermedad u otro rasgo detectable (v. cap. 7), es probable que alrededor de
1 de cada 200 personas reciba una mutación nueva en un gen asociado a una
enfermedad conocida de cualquiera de los progenitores.

134
ERRNVPHGLFRVRUJ
Diferencias en función del sexo y efecto de la
edad en las tasas de mutación
Debido a que el DNA de los espermatozoides ha pasado por muchos más
ciclos de replicación que el DNA de los óvulos (v. cap. 2), tiene más
posibilidades de que se produzcan errores; por tanto, sería previsible que
muchas mutaciones tuviesen con más frecuencia un origen paterno que
materno. De hecho, cuando se ha estudiado esto, las mutaciones nuevas
responsables de determinados trastornos (p. ej., la acondroplasia, como se
acaba de describir) suelen ser mutaciones de cambio de sentido que se
producen casi siempre en la línea germinal paterna. Además, cuanto mayor
es la edad del padre, más ciclos de replicación han precedido a las divisiones
meióticas, por lo que sería previsible que la frecuencia de mutaciones nuevas
paternas aumentase con su edad. De hecho, se ha observado una correlación
entre la edad creciente del padre y la incidencia de mutaciones génicas para
diversos trastornos (incluida la acondroplasia) y con la incidencia de
mutaciones regionales que implican CNV en los trastornos del espectro
autista (Caso 5). En otras enfermedades, sin embargo, los efectos del
progenitor de origen y de la edad sobre los espectros mutacionales no son tan
llamativos, por razones desconocidas.

135
ERRNVPHGLFRVRUJ
Tipos de mutaciones y sus consecuencias
En este apartado trataremos la naturaleza de las diferentes mutaciones y sus
efectos sobre los genes implicados. Cada tipo de mutación descrito aquí se
ilustra con uno o más ejemplos de enfermedades. En especial, la mutación
específica observada en casi todos los casos de acondroplasia es la excepción
en lugar de la regla, y las mutaciones subyacentes a una enfermedad genética
única suelen ser con más frecuencia heterogéneas en un grupo de individuos
afectados. Por tanto, los diferentes casos de un trastorno particular suelen
deberse a distintas mutaciones subyacentes (tabla 4-4). En los capítulos 11 y
12 volveremos a examinar las formas en que las mutaciones en genes
específicos de enfermedades causan estas últimas.

Tabla 4-4
Tipos de mutación en las enfermedades genéticas humanas

Sustituciones de nucleótidos
Mutaciones de cambio de sentido
La sustitución de un único nucleótido (o mutación puntual) en una secuencia
génica, como la que se observa en el ejemplo de la acondroplasia que acaba
de describirse, puede alterar el código en un triplete de bases y causar la
sustitución no sinónima de un aminoácido por otro en el producto génico (v.
el código genético en la tabla 3-1 y el ejemplo de la fig. 4-4). Esas mutaciones
se denominan mutaciones de cambio de sentido («missense» en inglés)
porque alteran el «significado» de la cadena codificante del gen al especificar

136
ERRNVPHGLFRVRUJ
un aminoácido diferente. Aunque no todas las mutaciones de cambio de
sentido provocan un cambio observable de la función de la proteína, la
proteína resultante puede no tener una función adecuada, puede ser inestable
y degradarse con rapidez, o puede que no se localice en su posición
intracelular correcta. En muchos trastornos, como la β-talasemia (caso 44), la
mayoría de las mutaciones detectadas en distintos pacientes son mutaciones
de cambio de sentido (v. cap. 11).

Mutaciones que generan una terminación prematura de la


traducción
Las mutaciones puntuales en una secuencia de DNA que causan la
sustitución del codón normal de un aminoácido por uno de los tres codones
de terminación se denominan mutaciones sin sentido («nonsense» en inglés).
Como la traducción del RNA mensajero (mRNA) cesa al alcanzar un codón
de terminación (v. cap. 3), una mutación que convierte una secuencia
codificante en un codón de terminación ocasiona que la traducción se detenga
en la secuencia codificante del mRNA. Las consecuencias de las mutaciones
que causan una terminación prematura son dos. En primer lugar, el mRNA
portador de una mutación prematura suele ser objeto de una rápida
degradación (por un proceso celular denominado degradación del mRNA
por mutación sin sentido), y eso imposibilita la traducción. En segundo
lugar, incluso cuando el mRNA es lo suficientemente estable como para ser
traducido, la proteína truncada suele ser tan inestable que es rápidamente
degradada en la célula (v. ejemplos en el cap. 12).
Mientras que algunas mutaciones puntuales crean un codón de
terminación prematuro, otras pueden destruir el codón de terminación
normal y permitir que la traducción continúe hasta alcanzar el codón de
terminación siguiente en el mRNA. Esa mutación creará una proteína
anormal con aminoácidos adicionales en su extremo carboxilo y, además,
puede alterar las funciones reguladoras ejercidas por la región 3’ no traducida
justo a partir del codón de terminación normal.

Mutaciones que afectan a la transcripción, procesamiento y


traducción del RNA
El mecanismo normal por el que se sintetizan los transcritos iniciales de RNA
y se convierten en mRNA maduro (o versiones finales de RNA no
codificante) requiere una serie de modificaciones, como la unión del factor de
transcripción, la adición de la caperuza 5’, la poliadenilación y el corte y
empalme (splicing) (v. cap. 3). Todos esos pasos en la maduración del RNA
dependen de secuencias específicas presentes en el RNA. Se han descrito dos
tipos generales de mutaciones de sitios de corte y empalme. Para que los
intrones del RNA no procesado se separen y los exones se empalmen para
dar lugar a un RNA maduro, es necesaria una secuencia específica de
nucleótidos, situada en la unión exón-intrón (sitio donador 5’) o en la unión

137
ERRNVPHGLFRVRUJ
intrón-exón (sitio aceptor 3’) o cerca de ellas. Las mutaciones que afectan a
esas bases necesarias, tanto en el sitio donador como en el aceptor, interfieren
y, a veces, impiden totalmente el proceso de corte y empalme normal del
RNA en ese sitio. Un segundo tipo de mutaciones que afectan al proceso de
corte y empalme implica una sustitución de bases del intrón que no afecta a la
secuencia misma de los sitios donadores o aceptores, sino que crea sitios
donadores o aceptores alternativos, que compiten con los sitios normales
durante el procesamiento del RNA. Por tanto, en esos casos al menos cierta
proporción del mRNA maduro puede contener secuencias de intrones que
están ensambladas de forma incorrecta. En el capítulo 11 se presentan
ejemplos de ambos tipos de mutaciones.
Para los genes codificantes de proteínas, incluso aunque se sintetice mRNA
y sea estable, las mutaciones puntuales en las regiones no traducidas 5’ y 3’
también pueden contribuir a la aparición de enfermedad al modificar la
estabilidad del mRNA o la eficacia de la traducción, lo que reduce la cantidad
de producto proteico que se sintetiza.

Deleciones, inserciones y reordenamientos


Las mutaciones también pueden producirse por inserción deleción o
reordenación de las secuencias de DNA. Algunas deleciones e inserciones
involucran sólo a unos pocos nucleótidos y, en general, se detectan más
fácilmente mediante secuenciación directa de nucleótidos de esa parte del
genoma. En otros casos, un segmento sustancial de un gen, o un gen entero,
se deleciona, invierte, duplica o transloca, lo que crea una disposición nueva
de las secuencias génicas. Dependiendo del tipo exacto de la deleción,
inserción o reordenación, se pueden usar diversos métodos para detectar la
alteración genómica.
Algunas deleciones e inserciones afectan sólo a un pequeño número de
pares de bases. Cuando este tipo de mutación se produce en una secuencia
codificante y el número de bases implicadas no es un múltiplo de tres (es
decir, no es un número entero de codones), el marco de lectura se altera
empezando en el punto de inserción o deleción. Las mutaciones resultantes se
denominan mutaciones de cambio de marco de lectura (v. fig. 4-4). Por tanto,
desde el punto de inserción o deleción, se crea una secuencia diferente de
codones, que codifica unos pocos aminoácidos incorrectos seguidos de un
codón de terminación en el marco cambiado, lo que suele dar lugar a una
proteína alterada desde el punto de vista funcional. Por el contrario, si el
número de pares de bases insertadas o delecionadas es un múltiplo de tres, no
se produce un cambio en el marco de lectura y habrá una simple inserción o
deleción de los aminoácidos correspondientes en el producto génico
traducido, por lo demás normal. Las inserciones o deleciones más grandes,
que oscilan de alrededor de 100 a más de 1.000 pb, suelen denominarse
«indels», como se ha visto previamente en el caso de los polimorfismos.
Pueden afectar a múltiples exones de un gen y causar alteraciones graves de

138
ERRNVPHGLFRVRUJ
la secuencia codificante.
Un tipo de mutación por inserción consiste en la inserción de un elemento
móvil, como los que pertenecen a la familia LINE del DNA repetitivo. Se
estima que, en cualquier individuo, alrededor de 100 copias de una subclase
particular de la familia LINE del genoma son capaces de moverse por
retrotransposición, como se comentó previamente. Este movimiento no sólo
genera diversidad genética en nuestra especie (v. fig. 4-2), sino que también
puede causar enfermedades por mutagénesis insercional. Por ejemplo, en
algunos pacientes que presentan el grave trastorno hemorrágico denominado
hemofilia A (Caso 21), se observa la presencia de secuencias LINE de varias
kilobases de longitud insertadas en un exón del gen del factor VIII, lo que
interrumpe la secuencia codificante e inactiva el gen. Las inserciones LINE en
todo el genoma también son frecuentes en el cáncer de colon, lo que refleja la
retrotransposición en las células somáticas (v. cap. 15).
Como ya se comentó en el contexto de los polimorfismos en un apartado
previo de este capítulo, las duplicaciones, deleciones e inversiones de un
segmento mayor de un solo cromosoma se deben predominantemente a la
recombinación homóloga entre segmentos de DNA con una alta homología
de secuencia (fig. 4-5). Los trastornos que surgen por estos intercambios
pueden deberse a un cambio de la dosis de productos génicos de tipo natural
cuando los segmentos homólogos se encuentran fuera de los propios genes
(v. cap. 6). De forma alternativa, estas mutaciones pueden modificar las
características de la propia proteína codificada cuando se produce la
recombinación entre diferentes genes dentro de una familia génica (v. cap. 11)
o entre los genes de diferentes cromosomas (v. cap. 15). El emparejamiento y
la recombinación anormales entre dos secuencias similares con orientación
opuesta en una única cadena de DNA provocan inversión. Por ejemplo, casi
la mitad de todos los casos de hemofilia A se deben a la recombinación que
invierte varios exones, lo que altera la estructura del gen e impide que éste
pueda codificar un producto génico normal (v. fig. 4-5).

139
ERRNVPHGLFRVRUJ
FIGURA 4-5 Secuencias homólogas invertidas, marcadas como A y B, situadas
a 500 kb de distancia en el cromosoma X, una hacia arriba del gen (upstream) del
factor VIII y la otra en un intrón entre los exones 22 y 23 del gen. El
emparejamiento intracromosómico y la recombinación dan lugar a la inversión de
los exones 1 a 22 del gen, lo que altera dicho gen y provoca una hemofilia grave.

Mutaciones dinámicas
Las mutaciones en algunos trastornos implican la amplificación de secuencias
repetidas de nucleótidos. Por ejemplo, ciertas repeticiones simples, como
(CCG)n, (CAG)n, o (CCTG)n localizadas en la porción codificante de un exón,
en una región no traducida de un exón o incluso en un intrón pueden
expandirse durante la gametogénesis, en lo que se denomina mutación
dinámica, e interferir con la expresión génica normal o la función de la
proteína. Una repetición expandida en la región codificante provocará un
producto proteico anormal, mientras que una expansión de repeticiones en
las regiones no traducidas o en los intrones de un gen puede interferir con la
transcripción, el procesamiento o la traducción del mRNA. No se conoce por
completo cómo se producen las mutaciones dinámicas; son similares desde el
punto de vista conceptual a los polimorfismos de microsatélites, pero se
expanden a una velocidad mucho mayor de lo que suele observarse en los
loci de microsatélites.
La implicación de las expansiones de repeticiones de nucleótidos simples
en la enfermedad se describe con más detalle en los capítulos 7 y 12. En las
enfermedades causadas por mutaciones dinámicas, se conocen con precisión
unos efectos marcados del progenitor de origen y parecen ser característicos
de la enfermedad específica y/o del tipo de repetición (v. cap. 12). Estas
diferencias pueden deberse a discrepancias biológicas fundamentales entre la
ovogénesis y la espermatogénesis, pero también pueden derivar de la

140
ERRNVPHGLFRVRUJ
selección contraria a gametos portadores de ciertas expansiones de
repeticiones.

141
ERRNVPHGLFRVRUJ
Variación en genomas individuales
El inventario actual más extenso de la cantidad y tipo de variación previsible
en cualquier genoma determinado proviene del análisis directo de genomas
humanos diploides individuales. La primera de tales secuencias genómicas
(de un varón) se publicó en 2007. En la actualidad, se han secuenciado
decenas de miles de genomas individuales, algunos como parte de grandes
consorcios de investigación internacionales que analizan la diversidad
genética humana en la salud y la enfermedad, y otros en el contexto de la
secuenciación clínica para determinar la base subyacente de un trastorno en
pacientes particulares.
¿Qué grado de variación genómica se detecta en estos estudios? Los
genomas humanos individuales suelen tener 5-10 millones de SNP de los que
(dependiendo en parte de la población) hasta un 25-33% son nuevos (v.
cuadro). Esto sugiere que el número de SNP descritos para nuestra especie
aún está incompleto, aunque es de suponer que la fracción de estos SNP
nuevos disminuirá a medida que se secuencien cada vez más y más genomas
de un número mayor de poblaciones.
En el seno de esta variación hay variantes con un impacto clínico conocido,
probable o sospechado. Según los estudios realizados hasta el momento, cada
genoma presenta 50-100 variantes que se han implicado previamente en
enfermedades hereditarias conocidas. Además, cada genoma presenta miles
de SNP no sinónimos en genes codificantes de proteínas distribuidos por el
genoma, algunos de los cuales podrían alterar la función proteica. Cada
genoma incluye también alrededor de 200-300 mutaciones con una probable
pérdida de función, algunas de las cuales están presentes en ambos alelos de
genes en un individuo determinado. En el contexto clínico, esta observación
tiene implicaciones importantes para la interpretación de los datos de
secuencia genómica de pacientes, en especial al intentar predecir el impacto
de las mutaciones en genes que de momento no tienen una función conocida
(v. cap. 16).
Un aspecto interesante e imprevisto de la secuenciación de genomas
individuales es que el genoma humano de referencia aún carece de
cantidades considerables de DNA no documentado y no anotado que se
descubren en todos los genomas individuales que se secuencian. Estas
secuencias «nuevas» sólo se descubren cuando se secuencian genomas
adicionales. Por tanto, la recopilación completa de todas las secuencias
genómicas humanas que debería encontrarse en nuestra población actual de
siete mil millones de personas (estimada en 20-40 Mb mayor que la secuencia
de referencia existente) aún está pendiente de dilucidarse por completo.
La diversidad genética humana es impresionante y está claro que aún
estamos en la etapa de descubrirla; es indudable que todavía deben
encontrarse millones de SNP adicionales y otras variantes, al igual que está
por ver el grado en el que cualquiera de ellas podría afectar al estatus clínico

142
ERRNVPHGLFRVRUJ
de un individuo en el contexto del bienestar y la asistencia sanitaria.

Va r ia ción de te cta da e n un ge nom a hum a no típico


Los individuos varían ampliamente en un extenso rango de funciones
biológicas, lo que está determinado en parte por la variación entre sus
genomas. Cualquier genoma individual contendrá lo siguiente:
• ≈5-10 millones de SNP (varía en función de la población).
• 25.000-50.000 variantes raras (mutaciones privadas u observadas
previamente en < 0,5% de los individuos analizados).
• ≈75 mutaciones nuevas de pares de bases no detectadas en los genomas
parentales.
• 3-7 CNV nuevas que implican a ≈500 kb de DNA.
• 200.000-500.000 indels (1-50 pb) (varía en función de la población).
• 500-1.000 deleciones de 1-45 kb, abarcando ≈200 genes.
• ≈150 indels sin variación del marco de lectura.
• ≈200-250 cambios de marco de lectura.
• 10.000-12.000 SNP sinónimos.
• 8.000-11.000 SNP no sinónimos en 4.000-5.000 genes.
• 175-500 variantes no sinónimas raras.
• 1 mutación nueva no sinónima.
• ≈100 codones de terminación prematura.
• 40-50 variantes con alteración de sitios de corte y empalme.
• 250-300 genes con variantes que probablemente causen pérdida de función.
• ≈25 genes que previsiblemente estén completamente inactivados.

Estudios de secuenciación clínicos


En el contexto de la medicina genómica, una cuestión clave es hasta qué
punto la variación de la secuencia y/o la expresión del genoma de un
individuo influye en la probabilidad de aparición de la enfermedad,
determina o indica la historia natural de ésta y/o proporciona pistas
relevantes para su tratamiento. Como se acaba de exponer, la variación del
genoma constitucional de un individuo puede tener varios efectos directos o
indirectos diferentes sobre la función génica.
La secuenciación de genomas enteros (denominada secuenciación del
genoma completo) o del subconjunto de genomas que incluyen todos los
exones codificantes conocidos (denominada secuenciación del exoma
completo) se ha introducido en varias situaciones clínicas, como se comentará
con mayor detalle en el capítulo 16. Tanto la secuenciación del exoma
completo como del genoma completo se han utilizado para detectar
mutaciones de novo (tanto mutaciones puntuales como CNV) en diversas
enfermedades de etiología compleja y/o desconocida, como, por ejemplo,
varios trastornos del neurodesarrollo o neuropsiquiátricos, como el autismo,
la esquizofrenia, la epilepsia o la discapacidad intelectual y el retraso del
desarrollo.

143
ERRNVPHGLFRVRUJ
Los estudios de secuenciación clínicos pueden dirigirse a variantes de la
línea germinal o somáticas. En el cáncer, especialmente, se han utilizado
varias estrategias para buscar mutaciones somáticas en el tejido tumoral con
el fin de identificar genes potencialmente relevantes para su progresión (v.
cap. 15).

Ge nóm ica pe r sona l y pa pe l de l consum idor


La creciente capacidad de secuenciar genomas individuales no sólo está al
alcance de los laboratorios de investigación y clínicos, sino que también está
generando una revolución social y de información entre los consumidores en
el contexto de la genómica directa al consumidor (DTC; del inglés direct-to-
consumer), en la que los análisis de los polimorfismos del genoma completo e
incluso la secuenciación de genomas enteros se ofrece directamente a los
clientes potenciales, sin pasar por los profesionales de la salud.
Todavía no está nada claro qué grado de vigilancia genómica será más útil
para la práctica clínica habitual, y es probable que esto evolucione
rápidamente en el caso de trastornos específicos, a medida que nuestro
conocimiento aumente, que se adopten guías de práctica profesional y que
reaccionen las compañías de seguros. Algunos grupos han planteado
preocupaciones considerables acerca de la privacidad y sobre la necesidad de
regular la industria. Al mismo tiempo, sin embargo, otros individuos están
dispuestos a hacer que los datos de la secuencia genómica (e incluso la
información médica) estén disponibles más o menos públicamente.
Las actitudes en esta área varían ampliamente entre los profesionales y el
público en general, en función de si se considera que conocer la secuencia del
genoma propio es una actividad fundamentalmente médica o personal. Los
críticos de los análisis DTC y los elaboradores de políticas, tanto de la
industria sanitaria como del gobierno, se centran en temas de utilidad clínica,
normas reglamentarias, supervisión médica, disponibilidad de
asesoramiento genético y privacidad. Los defensores de las pruebas DTC e
incluso los propios consumidores, por otra parte, se centran más en la
libertad de información, los derechos individuales, la conciencia social y
personal, la educación pública y el poder de decisión de los consumidores.
La disponibilidad de información del genoma individual se está
convirtiendo en una mercancía comercial y una realidad personal. En este
sentido, y sin menospreciar ni minimizar los aspectos científicos, éticos y
clínicos significativos subyacentes, lo cierto es que las secuencias del genoma
individual serán parte activa de la práctica médica para los estudiantes de
hoy en día.

144
ERRNVPHGLFRVRUJ
Impacto de las mutaciones y el
polimorfismo
Aunque los estudiantes de la genética humana verán con claridad que las
nuevas mutaciones o variantes raras en la población con un efecto deletéreo
pueden tener consecuencias clínicas, tal vez les resulte menos obvio que las
variantes polimórficas comunes pueden tener relevancia médica. Para la
proporción de la variación polimórfica que se produce en los propios genes,
tales loci se pueden estudiar mediante el análisis de la variación en las
proteínas codificadas por los diferentes alelos. Durante mucho tiempo, se ha
estimado que un solo individuo probablemente porte dos alelos distintos que
determinan polipéptidos estructuralmente diferentes en alrededor del 20% de
todos los loci codificantes de proteínas; cuando se comparan individuos de
diferentes grupos geográficos o étnicos, se ha observado que una fracción aún
mayor de proteínas presentan un polimorfismo detectable. Además, incluso
cuando el producto génico es idéntico, los niveles de expresión de ese
producto pueden ser muy diferentes entre los distintos individuos,
determinados por una combinación de variación genética y epigenética, como
se vio en el capítulo 3.
Por lo tanto, existe un grado sorprendente de individualidad bioquímica en
el seno de la especie humana en cuanto a su composición de enzimas y otros
productos génicos. Además, debido a que los productos de muchas de las
vías bioquímicas y reguladoras codificadas interactúan en redes funcionales y
fisiológicas, se puede concluir plausiblemente que cada individuo, con
independencia de su estado de salud, tiene una composición química única,
determinada genéticamente y que, por lo tanto, responde de una manera
única a las influencias ambientales, dietéticas y farmacológicas. Este concepto
de individualidad química, planteado por primera vez hace más de un siglo
por Garrod, el médico británico de gran clarividencia citado en el capítulo 1,
sigue siendo cierto hoy en día. Decidir de forma general lo que es normal (un
concepto esencial en la biología humana y en la medicina clínica) sigue
siendo en gran medida una cuestión sin resolver en lo referente al genoma
humano.
En los siguientes capítulos, se analizará este concepto en detalle, primero
en el contexto del genoma y las mutaciones cromosómicas (caps. 5 y 6) y
luego en términos de mutaciones génicas y polimorfismos que determinan la
herencia de las enfermedades genéticas (cap. 7) y que influyen en su
probabilidad en familias y poblaciones (caps. 8 y 9).

145
ERRNVPHGLFRVRUJ

También podría gustarte