Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Diversidad Genética Humana, Mutaciones y Polimorfismos
Diversidad Genética Humana, Mutaciones y Polimorfismos
mutación y polimorfismo
El estudio de la variación genética y genómica es la piedra angular
conceptual de la genética en medicina y en el campo más amplio de la
genética humana. Durante el transcurso de la evolución, la afluencia
constante de nuevas variaciones de nucleótidos ha garantizado un alto grado
de diversidad e individualidad genéticas, y este tema se extiende a través de
todos los campos de la genética humana y médica. La diversidad genética
puede manifestarse como diferencias en la organización del genoma, cambios
de nucleótidos en la secuencia del genoma, variación del número de copias
de grandes segmentos de DNA genómico, alteraciones de la estructura o la
cantidad de proteínas que se encuentran en diversos tejidos, o como
cualquiera de estas modificaciones en el contexto de enfermedades clínicas.
Este capítulo es uno de los dedicados a examinar la naturaleza de las
diferencias determinadas genéticamente entre los individuos. La secuencia
del DNA nuclear de dos seres humanos no emparentados es idéntica en
alrededor del 99,5-99,9%. Sin embargo, es precisamente esa pequeña fracción
de diferencia de secuencia del DNA la responsable de la variabilidad
determinada genéticamente que es evidente tanto en la existencia diaria de
cada persona como en la medicina clínica. Muchas diferencias en la secuencia
del DNA tienen poco o ningún efecto sobre el aspecto externo, mientras que
otras son responsables directas de enfermedades. Entre esos dos extremos, se
sitúan las diferencias responsables de la variabilidad determinada
genéticamente en la anatomía, la fisiología, las intolerancias alimentarias, la
susceptibilidad a la infección, la predisposición al cáncer, las respuestas
terapéuticas y las reacciones adversas a los medicamentos y, quizá, incluso la
variabilidad en diversos rasgos de la personalidad, la aptitud deportiva y el
talento artístico.
Uno de los conceptos importantes de la genética humana y médica, y de
sus aspectos clínicos, es que las enfermedades con un componente claramente
hereditario son sólo una de las manifestaciones más evidentes y, a menudo,
más notables de las diferencias genéticas, el extremo de un continuum de
variaciones que abarca desde variantes patológicas raras que causan
enfermedades y variantes más comunes que pueden aumentar la
predisposición a éstas, hasta las variaciones más frecuentes en la población,
con una relevancia incierta respecto a las enfermedades.
117
ERRNVPHGLFRVRUJ
La naturaleza de la variación genética
Tal como se ha descrito en el capítulo 2, un segmento de DNA que ocupa una
posición o localización particulares en un cromosoma es un locus (plural
loci). Un locus puede ser grande, como un segmento de DNA que contiene
muchos genes (p. ej., el locus del complejo principal de histocompatibilidad
implicado en la respuesta del sistema inmunitario a sustancias extrañas);
puede ser un único gen, como el locus de la β-globina que se describió en el
capítulo 3; o puede ser incluso una única base en el genoma, como una
variante de un único nucleótido (v. fig. 2-6 y más adelante en este capítulo).
Las versiones alternativas de la secuencia de DNA en un locus se denominan
alelos. En lo que se refiere a muchos genes, hay un único alelo predominante
que suele estar presente en más de la mitad de los individuos de una
población y que los especialistas en genética denominan alelo natural o
común. (En el lenguaje habitual, suele denominarse alelo «normal». Sin
embargo, debido a que la variación genética es en sí misma muy «normal», la
existencia de diferentes alelos en personas «normales» es muy común. Por
tanto, debería evitarse el término «normal» para designar al alelo más
frecuente). Las otras versiones del gen son alelos variantes (o mutantes) que
se diferencian del alelo natural debido a la presencia de una mutación, es
decir, un cambio permanente en la secuencia de nucleótidos o en la
disposición del DNA. Obsérvese que los términos mutación y mutante se
refieren al DNA y no a los seres humanos portadores de alelos mutantes. Los
términos indican un cambio en la secuencia, pero no conllevan por lo demás
ninguna connotación respecto a la función o la idoneidad de dicho cambio.
La frecuencia de las diferentes variantes puede oscilar ampliamente en
diferentes poblaciones de todo el mundo, como se analizará en profundidad
en el capítulo 9. Si hay dos o más alelos relativamente frecuentes (definidos
por convención como aquellos con una frecuencia alélica > 1%) en un locus en
una población, se dice que el locus presenta polimorfismo (literalmente
«muchas formas») en esa población. La mayoría de los alelos variantes, sin
embargo, no son lo bastante frecuentes en una población para considerarlos
polimorfismos; algunos son tan raros como los que se encuentran en una sola
familia, y se denominan alelos «privados».
Concepto de mutación
En este capítulo, se empieza por analizar la naturaleza de la mutación, que
oscila desde el cambio de un solo nucleótido a alteraciones de un cromosoma
entero. Reconocer un cambio significa que tiene que haber un patrón de
referencia, comparado con el cual la variante muestra una diferencia. Como
vimos en el capítulo 2, no existe una sola persona cuya secuencia del genoma
pueda servir como un estándar de este tipo para la especie humana, por lo
que la secuencia o combinación más frecuente en una población en cualquier
118
ERRNVPHGLFRVRUJ
posición del genoma se designa arbitrariamente secuencia de referencia (v. fig.
2-6). A medida que se muestrean cada vez más genomas de individuos en
todo el mundo (y, por tanto, según se detecta cada vez mayor variación entre
los siete mil millones de genomas que componen actualmente nuestra
especie), este genoma de referencia está sometido a una evaluación y cambio
constantes. De hecho, varias colaboraciones internacionales comparten y
actualizan los datos sobre la naturaleza y frecuencia de la variación del DNA
en diferentes poblaciones en el contexto de la secuencia de referencia del
genoma humano y hacen que los datos estén disponibles a través de bases de
datos de acceso público que sirven como recursos esenciales para científicos,
médicos y otros profesionales sanitarios (tabla 4-1).
Tabla 4-1
Bases de datos útiles de información sobre la diversidad genética
humana
Descripción URL
El Proyecto Genoma humano, completado en 2003, fue una colaboración internacional http://www.genome.gov/10001772
para secuenciar y establecer el mapa del genoma de nuestra especie. El borrador de la http://genome.ucsc.edu/cgi-bin/hgGateway
secuencia del genoma se publicó en 2001, y el conjunto del genoma de referencia «casi http://www.ensembl.org/Homo_sapiens/Info/Index
completo» se publicó en 2004.
La Base de datos de polimorfismos de un único nucleótido (dbSNP) y la Base de datos http://www.ncbi.nlm.nih.gov/snp/
de variaciones estructurales (dbVar) son bases de datos de variaciones a pequeña escala http://www.ncbi.nlm.nih.gov/dbvar/
y a gran escala que incluyen variantes de un único nucleótido, microsatélites, indels y
CNV.
El proyecto 1.000 Genomas está secuenciando los genomas de un gran número de www.1000genomes.org
individuos para proporcionar un recurso exhaustivo sobre la variación genética en
nuestra especie. Todos los datos están disponibles públicamente.
La Base de datos de mutaciones de genes humanos es una recopilación exhaustiva de www.hgmd.org
mutaciones de la línea germinal asociadas o causantes de enfermedades hereditarias
humanas (en la actualidad, incluye más de 120.000 mutaciones en 4.400 genes).
La Base de datos de variantes genómicas es un catálogo revisado de la variación http://dgv.tcag.ca
estructural del genoma humano. A fecha de 2012, la base de datos contenía más de
400.000 entradas, con más de 200.000 CNV, 1.000 inversiones y 34.000 indels.
La Base de datos japonesa de polimorfismos de un único nucleótido (JSNP Database) http://snp.ims.u-tokyo.ac.jp/
publica los SNP descubiertos como parte del Proyecto Genoma del milenio.
119
ERRNVPHGLFRVRUJ
fijado arbitrariamente de alrededor de 100 kb (mutaciones de genes o del
DNA).
El fundamento y las consecuencias de este tercer tipo de mutación son el
tema central de este capítulo, mientras que tanto las mutaciones
cromosómicas como regionales se describirán en detalle en los capítulos 5 y 6.
Las consecuencias funcionales de las mutaciones del DNA, incluso las que
cambian un único par de bases, pueden oscilar de ser completamente inocuas
a causar una enfermedad grave, dependiendo de la ubicación precisa, la
naturaleza y las dimensiones de la mutación. Por ejemplo, incluso una
mutación dentro de un exón codificante de un gen puede no tener ningún
efecto sobre la expresión de un gen si el cambio no modifica la secuencia
primaria de aminoácidos del producto polipeptídico; e incluso si lo hace, el
cambio resultante de la secuencia de aminoácidos codificada puede no alterar
las propiedades funcionales de la proteína. Por tanto, no todas las mutaciones
son evidentes en un individuo.
120
ERRNVPHGLFRVRUJ
también pueden tener efectos importantes en la transcripción o en la
estabilidad del RNA.
Se podría pensar que las mutaciones deletéreas que provocan
enfermedades monogénicas raras probablemente sean demasiado escasas
para alcanzar la frecuencia necesaria para considerarlas polimorfismos.
Aunque es cierto que los alelos responsables de la mayoría de las
enfermedades claramente hereditarias son infrecuentes, algunos alelos que
tienen un gran impacto sobre la salud, como los alelos de genes codificantes
de enzimas que metabolizan fármacos (p. ej., la sensibilidad al abacavir en
algunas personas infectadas con el virus de la inmunodeficiencia humana
[VIH] [Caso 1] o la mutación de la drepanocitosis en poblaciones africanas y
afroamericanas (v. cap. 11) [Caso 42]), son relativamente frecuentes. Sin
embargo, estas son excepciones y, a medida que se descubren y catalogan
más y más variaciones genéticas, está claro que la inmensa mayoría de
variantes del genoma, tanto frecuentes como raras, reflejan diferencias de
secuencia del DNA carentes de relevancia conocida para la salud.
Los polimorfismos son un elemento clave para el estudio de la genética
humana y médica. La capacidad de distinguir las diferentes formas
heredadas de un gen o los distintos segmentos del genoma proporciona
instrumentos decisivos para una amplia gama de aplicaciones, tanto en la
investigación como en la práctica clínica (v. cuadro).
121
ERRNVPHGLFRVRUJ
eficacia o la seguridad de determinados fármacos.
122
ERRNVPHGLFRVRUJ
Variación heredada y polimorfismo en el
DNA
La enorme cantidad de información de secuencias de DNA provenientes de
muchos miles de individuos de todo el mundo, obtenida por el Proyecto
Genoma Humano original y el estudio posterior, ha proporcionado la
información necesaria para empezar a caracterizar los tipos y frecuencias de
la variación polimórfica presente en el genoma humano y para generar
catálogos de la diversidad de la secuencia del DNA humano a escala
mundial. Los polimorfismos del DNA pueden clasificarse de acuerdo con la
variación de la secuencia del DNA entre diferentes alelos (tabla 4-2 y figs. 4-1
y 4-2).
Tabla 4-2
Variación frecuente en el genoma humano
FIGURA 4-1 Tres polimorfismos en el DNA genómico del segmento del genoma
humano de referencia mostrado en la parte superior (v. también fig. 2-6). El
123
ERRNVPHGLFRVRUJ
polimorfismo de un único nucleótido (SNP) en la posición 8 tiene dos alelos, uno
con una T (correspondiente a la secuencia de referencia) y otro con una C. Hay
dos indels en esta región. En el indel A, el alelo 2 tiene una inserción de una G
entre las posiciones 11 y 12 en la secuencia de referencia (alelo 1). En el indel B,
el alelo 2 tiene una deleción de 2 pb de las posiciones 5 y 6 en la secuencia de
referencia.
124
ERRNVPHGLFRVRUJ
genes y otros elementos funcionales conocidos del genoma. Para el conjunto
de genes codificantes de proteínas, hasta la fecha se han documentado más de
100.000 SNP localizados en exones. Alrededor de la mitad de ellos no
modifican la secuencia de aminoácidos prevista de la proteína codificada, por
lo que se denominan sinónimos, mientras que la otra mitad sí altera la
secuencia de aminoácidos y se denominan no sinónimos. Otros SNP
introducen o cambian un codón de terminación (v. tabla 3-1), mientras que
otros modifican un sitio de corte y empalme conocido; estos SNP son
candidatos a padecer consecuencias funcionales significativas.
El significado para la salud de la gran mayoría de los SNP se desconoce y
es objeto de continuas investigaciones. El hecho de que los SNP sean
frecuentes no implica que sean neutrales o que no ejerzan ningún efecto sobre
la salud o la longevidad. Al parecer, el efecto de los SNP frecuentes es una
modificación relativamente sutil de la susceptibilidad a la enfermedad, más
que la causa directa de una enfermedad grave.
Polimorfismos de inserción-deleción
Una segunda clase de polimorfismos son variaciones producidas por la
inserción o la deleción (in/dels, o simplemente indels) de entre 1 y hasta
alrededor de 1.000 pb, aunque se han descrito también indels mayores. Se han
descrito más de un millón de indels, y su número en el genoma de cualquier
individuo es del orden de centenares de miles. Alrededor de la mitad se
denominan «simples», porque sólo tienen dos alelos, es decir, la presencia o
ausencia del segmento insertado o delecionado (v. fig. 4-1).
Polimorfismos de microsatélites
Sin embargo, otros indels son multialélicos, debido a la inserción en tándem
de un número variable de segmentos de DNA en una localización particular,
lo que constituye lo que se denomina microsatélite. Consisten en segmentos
de DNA compuestos por unidades de 2, 3 o 4 nucleótidos, como TGTGTG,
CAACAACAA, o AAATAAATAAAT, que se repiten entre una y varias
docenas de veces en una localización particular del genoma (v. fig. 4-2). Los
distintos alelos en un polimorfismo de microsatélite se deben a los diferentes
números de unidades de nucleótidos repetidas que están presentes en
cualquier microsatélite, por lo que en ocasiones se denominan polimorfismos
cortos de repetición en tándem (STR). Un locus de microsatélite suele tener
muchos alelos (longitudes de repetición) que pueden evaluarse con rapidez
mediante procedimientos de laboratorio estándar para distinguir a diferentes
individuos y para inferir relaciones familiares (fig. 4-3). En el genoma
humano, se conocen muchas decenas de miles de loci polimórficos de
microsatélites.
125
ERRNVPHGLFRVRUJ
FIGURA 4-3 Esquema de un marcador de microsatélite hipotético en el
DNA humano.
Los alelos de diferente tamaño (numerados del 1 al 7) corresponden a fragmentos
de DNA genómico que contienen distintos números de copias de una repetición
de microsatélite, y sus longitudes relativas se determinan separándolos mediante
electroforesis en gel. El alelo más corto (alelo 1) migra hacia el fondo del gel,
mientras que el alelo más largo (alelo 7) se mantiene más cerca de la parte
superior. Izquierda, para este microsatélite multialélico, cada uno de los seis
individuos no emparentados tiene dos alelos diferentes. Derecha, en una familia,
la herencia de los alelos puede seguirse desde cada progenitor a cada uno de los
tres hijos.
126
ERRNVPHGLFRVRUJ
elementos móviles en distintas poblaciones. Cada locus polimórfico consta de
dos alelos, uno con el elemento móvil insertado y otro sin él (v. fig. 4-2). Los
polimorfismos de elementos móviles se encuentran en todos los cromosomas
humanos; aunque la mayoría están en regiones del genoma donde no hay
genes, una pequeña proporción aparece dentro de los genes. Al menos 5.000
de estos loci polimórficos tienen una frecuencia de inserción superior al 10%
en diferentes poblaciones.
Polimorfismos de inversión
Un último grupo de polimorfismos que se comentará es el de las inversiones,
127
ERRNVPHGLFRVRUJ
cuyo tamaño oscila desde unos pocos pares de bases a grandes regiones del
genoma (de hasta varias megabases) y que pueden estar presentes en dos
orientaciones posibles en los genomas de diferentes individuos (v. fig. 4-2). La
mayoría de las inversiones se caracterizan por regiones de homología de
secuencia en los extremos del segmento invertido, lo que implica un proceso
de recombinación homóloga en el origen de las inversiones. En su forma
equilibrada, las inversiones, con independencia de su orientación, no
conllevan una ganancia o pérdida de DNA, y los polimorfismos de inversión
(con dos alelos correspondientes a las dos orientaciones) pueden alcanzar
frecuencias considerables en la población general. Sin embargo, la
recombinación anómala puede dar lugar a la duplicación o deleción del DNA
situado entre las regiones de homología, asociada a trastornos clínicos que se
analizarán con más detalle en los capítulos 5 y 6.
128
ERRNVPHGLFRVRUJ
Origen y frecuencia de los diferentes tipos
de mutaciones
A lo largo del espectro de la diversidad que va de las variantes raras a los
polimorfismos más frecuentes, los diferentes tipos de mutaciones surgen en el
contexto de procesos fundamentales de la división celular como la
replicación, reparación y recombinación del DNA, así como la segregación de
cromosomas en la mitosis o la meiosis. La frecuencia de mutaciones por
locus por división celular es una medida básica del grado de propensión a
los errores de estos procesos, lo que tiene una importancia fundamental para
la biología del genoma y la evolución. Sin embargo, un aspecto más
importante para los genetistas médicos es la frecuencia de mutaciones por
locus de la enfermedad por generación, en lugar de la tasa global de
mutación en todo el genoma por división celular. Sin embargo, la medición
de las tasas de mutaciones causantes de enfermedad puede ser difícil, debido
a que muchas mutaciones causan una mortalidad embrionaria precoz antes
de que se pueda identificar la mutación en un feto o recién nacido, o porque
algunas personas con una mutación causante de enfermedad puede que sólo
manifiesten el trastorno en una etapa tardía de la vida o que nunca muestren
signos de la enfermedad. A pesar de estas limitaciones, se han hecho grandes
avances a la hora de determinar la frecuencia global (a veces denominada
carga genética) de todas las mutaciones que afectan a la especie humana.
Los principales tipos de mutaciones descritas brevemente con anterioridad
se producen con frecuencias apreciables en muchas células diferentes del
cuerpo. La práctica de la genética se centra sobre todo en la variación del
genoma heredado; sin embargo, toda esa variación tuvo que originarse como
cambios nuevos (de novo) en las células germinales. En ese momento, esa
variante sería bastante rara en la población (ocurriría una sola vez), y su
frecuencia última en la población a lo largo del tiempo depende del azar y de
los principios de la herencia y de la genética de poblaciones (v. caps. 7 y 9).
Aunque la mutación original hubiese ocurrido sólo en el DNA de las células
de la línea germinal, cualquier persona que heredase la mutación la portaría
como una mutación constitucional en todas las células del cuerpo.
Por el contrario, las mutaciones somáticas se producen en todo el cuerpo,
pero no pueden transmitirse a la siguiente generación. Dada la tasa de
mutación (v. después en esta sección), se podría predecir que, de hecho, cada
célula de un individuo tiene una versión ligeramente diferente de su genoma,
dependiendo del número de divisiones celulares que se han producido desde
la concepción hasta el momento de la adquisición de la muestra. En los
tejidos muy proliferativos, como las células epiteliales intestinales o las
células hematopoyéticas, es muy probable que esta heterogeneidad genómica
sea mayor. Sin embargo, la mayoría de estas mutaciones no suelen detectarse,
porque, en las pruebas clínicas, se suele secuenciar el DNA a partir de la
129
ERRNVPHGLFRVRUJ
muestras compuestas por muchos millones de células; en una muestra de este
tipo, la base más prevalente en cualquier posición del genoma será la que está
presente en la concepción, y las mutaciones somáticas raras serán en gran
medida invisibles y no determinadas. Sin embargo, estas mutaciones pueden
tener importancia clínica en los trastornos causados por la mutación en un
único subgrupo de células en ciertos tejidos, lo que da lugar a mosaicismo
somático (v. cap. 7).
La principal excepción a que las mutaciones somáticas suelen no detectarse
en muestras de DNA multicelular es en el cáncer, en el que la base
mutacional para el origen del cáncer y de la naturaleza clonal de la evolución
del tumor hace que ciertos cambios somáticos estén presentes en
prácticamente todas las células de un tumor. De hecho, es fácil encontrar
1.000-10.000 mutaciones somáticas (y a veces muchas más) en los genomas de
la mayoría de los cánceres de adultos, con frecuencias y patrones de mutación
específicos para los diferentes tipos de cáncer (v. cap. 15).
Mutaciones cromosómicas
Las mutaciones que producen un cambio del número de cromosomas debido
a una segregación inadecuada de éstos son unas de las más frecuentes en los
seres humanos, con una tasa de una por cada 25-50 divisiones celulares
meióticas. Esta estimación es claramente a la baja, puesto que las
consecuencias para el desarrollo de muchas de estas mutaciones pueden ser
tan graves que los fetos resultantes son abortados de manera espontánea poco
después de la concepción, sin llegar a ser detectados (v. caps. 5 y 6).
Mutaciones regionales
Las mutaciones que afectan a la estructura o a la organización regional de los
cromosomas pueden surgir de varias maneras diferentes. Las duplicaciones,
deleciones e inversiones de un segmento de un único cromosoma se deben
predominantemente a la recombinación homóloga entre segmentos de DNA
con alta homología de secuencia situados en más de un sitio en una región de
un cromosoma. Sin embargo, no todas las mutaciones estructurales se deben
a la recombinación homóloga. Otras, como las translocaciones cromosómicas
y algunas inversiones, pueden producirse en los sitios de rotura espontánea
del DNA bicatenario. Cuando se produce la rotura en dos lugares en
cualquier lugar del genoma, los dos extremos rotos se pueden unir entre sí
incluso sin ninguna homología de secuencia evidente entre ambos extremos
(proceso denominado reparación por unión de extremos no homólogos). En el
capítulo 6 se describen con detalle ejemplos de estas mutaciones.
Mutaciones génicas
Las mutaciones génicas o del DNA, incluidas las sustituciones de pares de
130
ERRNVPHGLFRVRUJ
bases, las inserciones y las deleciones (fig. 4-4), se originan mediante dos
mecanismos básicos: errores producidos durante el proceso de replicación del
DNA o mutaciones ocasionadas por un fallo en la reparación correcta del
DNA dañado. Muchas de estas mutaciones son espontáneas y se producen
durante los procesos normales (pero imperfectos) de replicación y reparación
del DNA, mientras que otras son inducidas por agentes físicos o químicos
denominados mutágenos.
131
ERRNVPHGLFRVRUJ
complementaria que restauraría el par de bases en esa posición en la doble
hélice) se eliminan enseguida del DNA, y se corrigen por varias enzimas de
reparación del DNA, que primero reconocen qué cadena de la doble hélice
recién sintetizada contiene la base incorrecta y después la sustituyen por la
base complementaria correcta, proceso denominado corrección de errores del
DNA. La replicación del DNA debe ser un proceso muy preciso; de lo
contrario, la carga de mutaciones sería intolerable para el organismo y la
especie. La enzima DNA polimerasa duplica con exactitud ambas cadenas de
la doble hélice mediante una combinación de reglas estrictas de
emparejamiento de las bases (la A se empareja con la T, y la C con la G), pero
introduce un error cada 10 millones de pb. Una verificación adicional de los
errores de replicación corrige después más del 99,9% de los fallos en la
replicación del DNA. Por tanto, la tasa global de mutaciones debida a errores
de replicación es notablemente baja, 10–10 por división celular, lo que supone
menos de una mutación por genoma por división celular.
132
ERRNVPHGLFRVRUJ
Tasa global de mutaciones del DNA
Aunque la tasa de mutaciones del DNA en loci específicos se ha estimado
utilizando diversos métodos en los últimos 50 años, el impacto global de los
errores de replicación y reparación en la aparición de nuevas mutaciones en
todo el genoma se puede determinar en la actualidad directamente mediante
secuenciación del genoma completo de tríos formados por un hijo y ambos
progenitores, en busca de nuevas mutaciones en el hijo que no estén
presentes en la secuencia del genoma de ninguno de los progenitores. La tasa
global de nuevas mutaciones entre gametos maternos y paternos es, en
promedio, de alrededor de 1,2 × 10−8 mutaciones por par de bases por
generación. Por tanto, es probable que cada persona reciba unas 75 nuevas
mutaciones en su genoma de alguno de los progenitores. Esta tasa, sin embargo,
varía entre los diversos genes del genoma y tal vez entre las distintas
poblaciones, o incluso entre los diferentes individuos. De forma global, esta
tasa, combinada con datos de crecimiento y de dinámica de la población,
predice que debe haber un gran número de mutaciones relativamente nuevas
(y, por tanto, muy raras) en la población actual mundial de siete mil millones
de personas.
Como sería de prever, la inmensa mayoría de estas mutaciones
corresponderán a cambios de un solo nucleótido en posiciones no
codificantes del genoma y probablemente tendrán poco o ningún significado
funcional. Sin embargo, a nivel de las poblaciones, no se debe pasar por alto
el impacto colectivo potencial de estas nuevas mutaciones en genes de
importancia médica. En Estados Unidos, por ejemplo, donde hay más de 4
millones de recién nacidos vivos cada año, se producirán alrededor de 6
millones de nuevas mutaciones en secuencias codificantes; por lo tanto,
incluso para un único gen codificante de proteína de tamaño medio, se puede
prever que varios cientos de recién nacidos cada año presentarán una
mutación nueva en su secuencia codificante.
Varios estudios similares desde el punto de vista conceptual han
determinado la tasa de mutaciones en las CNV, donde la aparición de una
nueva variante en longitud depende de la recombinación, más que de los
errores en la síntesis de DNA para generar un nuevo par de bases. La tasa
medida de la formación de nuevas CNV (≈1,2 × 10−2 por locus por generación)
es varias órdenes de magnitud mayor que la de sustituciones de bases.
133
ERRNVPHGLFRVRUJ
acondroplásicos en una serie de 242.257 nacimientos consecutivos. Los siete
tenían progenitores de estatura normal y, dado que la acondroplasia se
manifiesta siempre cuando existe una mutación, los siete casos se
consideraron mutaciones nuevas. La tasa de mutación nueva en este locus
puede calcularse como 7 mutaciones en un total de 2 × 242.257 copias del gen
relevante, o aproximadamente 1,4 × 10–5 mutaciones causantes de enfermedad
por locus por generación. Esta tasa de mutación elevada es especialmente
llamativa, porque se ha observado que casi todos los casos de acondroplasia
se deben a una mutación idéntica de G a A en la que un codón de glicina se
cambia a uno de arginina en la proteína codificada.
La tasa de mutaciones génicas que causan enfermedades se ha estimado
para algunos trastornos hereditarios, en los que se determinó la existencia de
mutaciones nuevas a través de la aparición y detección del fenotipo de la
enfermedad (tabla 4-3). Las tasas medidas varían en un rango de 1.000 veces,
de 10–4 a 10–7 mutaciones por locus por generación. La razón de esas
diferencias puede estar relacionada con algunos o con todos los siguientes
factores: el tamaño de los distintos genes, la fracción de todas las mutaciones
en ese gen que dará lugar a la enfermedad, la edad y el sexo del progenitor
que sufrió la mutación, el mecanismo de la mutación y la presencia o
ausencia de «puntos calientes» de mutación en el gen. De hecho, la tasa
elevada de la mutación específica en la acondroplasia puede explicarse, en
parte, por el hecho de que la mutación en la otra cadena es un cambio C a T
en una posición donde se produce metilación CpG y es un punto caliente
para la mutación por desaminación, como se ha descrito previamente.
Tabla 4-3
Estimaciones de las tasas de mutación para genes seleccionados de
enfermedades humanas
Basada en datos de Vogel F, Motulsky AG: Human genetics, 3.ª ed., Berlín, 1997, Springer-Verlag.
*
Expresada en mutaciones por locus por generación.
A pesar de este rango de tasas entre los distintos genes, la tasa media de
mutación génica es de alrededor de 10−6. Debido a que existen al menos 5.000
genes en el genoma humano en los que se sabe que las mutaciones causan
una enfermedad u otro rasgo detectable (v. cap. 7), es probable que alrededor de
1 de cada 200 personas reciba una mutación nueva en un gen asociado a una
enfermedad conocida de cualquiera de los progenitores.
134
ERRNVPHGLFRVRUJ
Diferencias en función del sexo y efecto de la
edad en las tasas de mutación
Debido a que el DNA de los espermatozoides ha pasado por muchos más
ciclos de replicación que el DNA de los óvulos (v. cap. 2), tiene más
posibilidades de que se produzcan errores; por tanto, sería previsible que
muchas mutaciones tuviesen con más frecuencia un origen paterno que
materno. De hecho, cuando se ha estudiado esto, las mutaciones nuevas
responsables de determinados trastornos (p. ej., la acondroplasia, como se
acaba de describir) suelen ser mutaciones de cambio de sentido que se
producen casi siempre en la línea germinal paterna. Además, cuanto mayor
es la edad del padre, más ciclos de replicación han precedido a las divisiones
meióticas, por lo que sería previsible que la frecuencia de mutaciones nuevas
paternas aumentase con su edad. De hecho, se ha observado una correlación
entre la edad creciente del padre y la incidencia de mutaciones génicas para
diversos trastornos (incluida la acondroplasia) y con la incidencia de
mutaciones regionales que implican CNV en los trastornos del espectro
autista (Caso 5). En otras enfermedades, sin embargo, los efectos del
progenitor de origen y de la edad sobre los espectros mutacionales no son tan
llamativos, por razones desconocidas.
135
ERRNVPHGLFRVRUJ
Tipos de mutaciones y sus consecuencias
En este apartado trataremos la naturaleza de las diferentes mutaciones y sus
efectos sobre los genes implicados. Cada tipo de mutación descrito aquí se
ilustra con uno o más ejemplos de enfermedades. En especial, la mutación
específica observada en casi todos los casos de acondroplasia es la excepción
en lugar de la regla, y las mutaciones subyacentes a una enfermedad genética
única suelen ser con más frecuencia heterogéneas en un grupo de individuos
afectados. Por tanto, los diferentes casos de un trastorno particular suelen
deberse a distintas mutaciones subyacentes (tabla 4-4). En los capítulos 11 y
12 volveremos a examinar las formas en que las mutaciones en genes
específicos de enfermedades causan estas últimas.
Tabla 4-4
Tipos de mutación en las enfermedades genéticas humanas
Sustituciones de nucleótidos
Mutaciones de cambio de sentido
La sustitución de un único nucleótido (o mutación puntual) en una secuencia
génica, como la que se observa en el ejemplo de la acondroplasia que acaba
de describirse, puede alterar el código en un triplete de bases y causar la
sustitución no sinónima de un aminoácido por otro en el producto génico (v.
el código genético en la tabla 3-1 y el ejemplo de la fig. 4-4). Esas mutaciones
se denominan mutaciones de cambio de sentido («missense» en inglés)
porque alteran el «significado» de la cadena codificante del gen al especificar
136
ERRNVPHGLFRVRUJ
un aminoácido diferente. Aunque no todas las mutaciones de cambio de
sentido provocan un cambio observable de la función de la proteína, la
proteína resultante puede no tener una función adecuada, puede ser inestable
y degradarse con rapidez, o puede que no se localice en su posición
intracelular correcta. En muchos trastornos, como la β-talasemia (caso 44), la
mayoría de las mutaciones detectadas en distintos pacientes son mutaciones
de cambio de sentido (v. cap. 11).
137
ERRNVPHGLFRVRUJ
intrón-exón (sitio aceptor 3’) o cerca de ellas. Las mutaciones que afectan a
esas bases necesarias, tanto en el sitio donador como en el aceptor, interfieren
y, a veces, impiden totalmente el proceso de corte y empalme normal del
RNA en ese sitio. Un segundo tipo de mutaciones que afectan al proceso de
corte y empalme implica una sustitución de bases del intrón que no afecta a la
secuencia misma de los sitios donadores o aceptores, sino que crea sitios
donadores o aceptores alternativos, que compiten con los sitios normales
durante el procesamiento del RNA. Por tanto, en esos casos al menos cierta
proporción del mRNA maduro puede contener secuencias de intrones que
están ensambladas de forma incorrecta. En el capítulo 11 se presentan
ejemplos de ambos tipos de mutaciones.
Para los genes codificantes de proteínas, incluso aunque se sintetice mRNA
y sea estable, las mutaciones puntuales en las regiones no traducidas 5’ y 3’
también pueden contribuir a la aparición de enfermedad al modificar la
estabilidad del mRNA o la eficacia de la traducción, lo que reduce la cantidad
de producto proteico que se sintetiza.
138
ERRNVPHGLFRVRUJ
la secuencia codificante.
Un tipo de mutación por inserción consiste en la inserción de un elemento
móvil, como los que pertenecen a la familia LINE del DNA repetitivo. Se
estima que, en cualquier individuo, alrededor de 100 copias de una subclase
particular de la familia LINE del genoma son capaces de moverse por
retrotransposición, como se comentó previamente. Este movimiento no sólo
genera diversidad genética en nuestra especie (v. fig. 4-2), sino que también
puede causar enfermedades por mutagénesis insercional. Por ejemplo, en
algunos pacientes que presentan el grave trastorno hemorrágico denominado
hemofilia A (Caso 21), se observa la presencia de secuencias LINE de varias
kilobases de longitud insertadas en un exón del gen del factor VIII, lo que
interrumpe la secuencia codificante e inactiva el gen. Las inserciones LINE en
todo el genoma también son frecuentes en el cáncer de colon, lo que refleja la
retrotransposición en las células somáticas (v. cap. 15).
Como ya se comentó en el contexto de los polimorfismos en un apartado
previo de este capítulo, las duplicaciones, deleciones e inversiones de un
segmento mayor de un solo cromosoma se deben predominantemente a la
recombinación homóloga entre segmentos de DNA con una alta homología
de secuencia (fig. 4-5). Los trastornos que surgen por estos intercambios
pueden deberse a un cambio de la dosis de productos génicos de tipo natural
cuando los segmentos homólogos se encuentran fuera de los propios genes
(v. cap. 6). De forma alternativa, estas mutaciones pueden modificar las
características de la propia proteína codificada cuando se produce la
recombinación entre diferentes genes dentro de una familia génica (v. cap. 11)
o entre los genes de diferentes cromosomas (v. cap. 15). El emparejamiento y
la recombinación anormales entre dos secuencias similares con orientación
opuesta en una única cadena de DNA provocan inversión. Por ejemplo, casi
la mitad de todos los casos de hemofilia A se deben a la recombinación que
invierte varios exones, lo que altera la estructura del gen e impide que éste
pueda codificar un producto génico normal (v. fig. 4-5).
139
ERRNVPHGLFRVRUJ
FIGURA 4-5 Secuencias homólogas invertidas, marcadas como A y B, situadas
a 500 kb de distancia en el cromosoma X, una hacia arriba del gen (upstream) del
factor VIII y la otra en un intrón entre los exones 22 y 23 del gen. El
emparejamiento intracromosómico y la recombinación dan lugar a la inversión de
los exones 1 a 22 del gen, lo que altera dicho gen y provoca una hemofilia grave.
Mutaciones dinámicas
Las mutaciones en algunos trastornos implican la amplificación de secuencias
repetidas de nucleótidos. Por ejemplo, ciertas repeticiones simples, como
(CCG)n, (CAG)n, o (CCTG)n localizadas en la porción codificante de un exón,
en una región no traducida de un exón o incluso en un intrón pueden
expandirse durante la gametogénesis, en lo que se denomina mutación
dinámica, e interferir con la expresión génica normal o la función de la
proteína. Una repetición expandida en la región codificante provocará un
producto proteico anormal, mientras que una expansión de repeticiones en
las regiones no traducidas o en los intrones de un gen puede interferir con la
transcripción, el procesamiento o la traducción del mRNA. No se conoce por
completo cómo se producen las mutaciones dinámicas; son similares desde el
punto de vista conceptual a los polimorfismos de microsatélites, pero se
expanden a una velocidad mucho mayor de lo que suele observarse en los
loci de microsatélites.
La implicación de las expansiones de repeticiones de nucleótidos simples
en la enfermedad se describe con más detalle en los capítulos 7 y 12. En las
enfermedades causadas por mutaciones dinámicas, se conocen con precisión
unos efectos marcados del progenitor de origen y parecen ser característicos
de la enfermedad específica y/o del tipo de repetición (v. cap. 12). Estas
diferencias pueden deberse a discrepancias biológicas fundamentales entre la
ovogénesis y la espermatogénesis, pero también pueden derivar de la
140
ERRNVPHGLFRVRUJ
selección contraria a gametos portadores de ciertas expansiones de
repeticiones.
141
ERRNVPHGLFRVRUJ
Variación en genomas individuales
El inventario actual más extenso de la cantidad y tipo de variación previsible
en cualquier genoma determinado proviene del análisis directo de genomas
humanos diploides individuales. La primera de tales secuencias genómicas
(de un varón) se publicó en 2007. En la actualidad, se han secuenciado
decenas de miles de genomas individuales, algunos como parte de grandes
consorcios de investigación internacionales que analizan la diversidad
genética humana en la salud y la enfermedad, y otros en el contexto de la
secuenciación clínica para determinar la base subyacente de un trastorno en
pacientes particulares.
¿Qué grado de variación genómica se detecta en estos estudios? Los
genomas humanos individuales suelen tener 5-10 millones de SNP de los que
(dependiendo en parte de la población) hasta un 25-33% son nuevos (v.
cuadro). Esto sugiere que el número de SNP descritos para nuestra especie
aún está incompleto, aunque es de suponer que la fracción de estos SNP
nuevos disminuirá a medida que se secuencien cada vez más y más genomas
de un número mayor de poblaciones.
En el seno de esta variación hay variantes con un impacto clínico conocido,
probable o sospechado. Según los estudios realizados hasta el momento, cada
genoma presenta 50-100 variantes que se han implicado previamente en
enfermedades hereditarias conocidas. Además, cada genoma presenta miles
de SNP no sinónimos en genes codificantes de proteínas distribuidos por el
genoma, algunos de los cuales podrían alterar la función proteica. Cada
genoma incluye también alrededor de 200-300 mutaciones con una probable
pérdida de función, algunas de las cuales están presentes en ambos alelos de
genes en un individuo determinado. En el contexto clínico, esta observación
tiene implicaciones importantes para la interpretación de los datos de
secuencia genómica de pacientes, en especial al intentar predecir el impacto
de las mutaciones en genes que de momento no tienen una función conocida
(v. cap. 16).
Un aspecto interesante e imprevisto de la secuenciación de genomas
individuales es que el genoma humano de referencia aún carece de
cantidades considerables de DNA no documentado y no anotado que se
descubren en todos los genomas individuales que se secuencian. Estas
secuencias «nuevas» sólo se descubren cuando se secuencian genomas
adicionales. Por tanto, la recopilación completa de todas las secuencias
genómicas humanas que debería encontrarse en nuestra población actual de
siete mil millones de personas (estimada en 20-40 Mb mayor que la secuencia
de referencia existente) aún está pendiente de dilucidarse por completo.
La diversidad genética humana es impresionante y está claro que aún
estamos en la etapa de descubrirla; es indudable que todavía deben
encontrarse millones de SNP adicionales y otras variantes, al igual que está
por ver el grado en el que cualquiera de ellas podría afectar al estatus clínico
142
ERRNVPHGLFRVRUJ
de un individuo en el contexto del bienestar y la asistencia sanitaria.
143
ERRNVPHGLFRVRUJ
Los estudios de secuenciación clínicos pueden dirigirse a variantes de la
línea germinal o somáticas. En el cáncer, especialmente, se han utilizado
varias estrategias para buscar mutaciones somáticas en el tejido tumoral con
el fin de identificar genes potencialmente relevantes para su progresión (v.
cap. 15).
144
ERRNVPHGLFRVRUJ
Impacto de las mutaciones y el
polimorfismo
Aunque los estudiantes de la genética humana verán con claridad que las
nuevas mutaciones o variantes raras en la población con un efecto deletéreo
pueden tener consecuencias clínicas, tal vez les resulte menos obvio que las
variantes polimórficas comunes pueden tener relevancia médica. Para la
proporción de la variación polimórfica que se produce en los propios genes,
tales loci se pueden estudiar mediante el análisis de la variación en las
proteínas codificadas por los diferentes alelos. Durante mucho tiempo, se ha
estimado que un solo individuo probablemente porte dos alelos distintos que
determinan polipéptidos estructuralmente diferentes en alrededor del 20% de
todos los loci codificantes de proteínas; cuando se comparan individuos de
diferentes grupos geográficos o étnicos, se ha observado que una fracción aún
mayor de proteínas presentan un polimorfismo detectable. Además, incluso
cuando el producto génico es idéntico, los niveles de expresión de ese
producto pueden ser muy diferentes entre los distintos individuos,
determinados por una combinación de variación genética y epigenética, como
se vio en el capítulo 3.
Por lo tanto, existe un grado sorprendente de individualidad bioquímica en
el seno de la especie humana en cuanto a su composición de enzimas y otros
productos génicos. Además, debido a que los productos de muchas de las
vías bioquímicas y reguladoras codificadas interactúan en redes funcionales y
fisiológicas, se puede concluir plausiblemente que cada individuo, con
independencia de su estado de salud, tiene una composición química única,
determinada genéticamente y que, por lo tanto, responde de una manera
única a las influencias ambientales, dietéticas y farmacológicas. Este concepto
de individualidad química, planteado por primera vez hace más de un siglo
por Garrod, el médico británico de gran clarividencia citado en el capítulo 1,
sigue siendo cierto hoy en día. Decidir de forma general lo que es normal (un
concepto esencial en la biología humana y en la medicina clínica) sigue
siendo en gran medida una cuestión sin resolver en lo referente al genoma
humano.
En los siguientes capítulos, se analizará este concepto en detalle, primero
en el contexto del genoma y las mutaciones cromosómicas (caps. 5 y 6) y
luego en términos de mutaciones génicas y polimorfismos que determinan la
herencia de las enfermedades genéticas (cap. 7) y que influyen en su
probabilidad en familias y poblaciones (caps. 8 y 9).
145
ERRNVPHGLFRVRUJ