Documentos de Académico
Documentos de Profesional
Documentos de Cultura
equilibrio y cuantificación
En el tema anterior hemos visto cómo se calcula la frecuencia alélica a partir de frecuencias
genotípicas absolutas y relativas en el caso de un locus con dos alelos. Vamos a extenderlo a un
escenario multialélico.
En el caso de un locus con muchos alelos en una población, la frecuencia alélica para cualquier
alelo (i) la calculamos a partir de frecuencias genotípicas absolutas, es decir, del número de
individuos con un determinado; o a partir de frecuencias genotípicas relativas, es decir,
proporción de individuos de cada genotipo en la muestra como:
37
TEMA 3. Variación genética poblacional II Genética evolutiva
ocurría con el modo de herencia mezclado. Las frecuencia alélicas permanecen constantes a lo
largo de sucesivas generaciones si se mantienen las siguiente asunciones:
❖ Asumimos una especie diploide con reproducción sexual y generaciones discretas. Si las
generaciones solapan, es decir, generaciones donde los nacidos en etapas diferentes se
reproducen al mismo tiempo, se puede demostrar el principio H-W pero de forma más
complicada. Por lo tanto, esta asunción no es una condición necesaria para que tenga lugar
esta constancia de la frecuencia alélica a lo largo de sucesivas generaciones.
❖ Asumimos variación en un gen autosómico con dos alelos con frecuencias iguales en
machos y hembras. Si las frecuencias alélicas difieren en machos y hembras en una
población, la aproximación al equilibrio se produce prontamente pero la demostración es
más dificultosa.
Gametos masculinos
p (A1) q (A2)
p (A1) p2 pq
Gametos femeninos
q (A2) pq q2
38
TEMA 3. Variación genética poblacional II Genética evolutiva
Por tanto vamos a tener tras una generación de unión aleatoria de gametos frecuencias
genotípicas relativas esperadas bajo panmixia: f(A1A1) = p2, f(A1A2) = 2pq y f(A2A2) = q2. A partir
de las frecuencias genotípicas relativas podemos calcular la frecuencia alélica tras una
generación de unión al azar como:
El equilibrio H-W nos indica además que las frecuencias genotípicas van a venir dadas por el
desarrollo del binomio (p + q)2:
(𝒑 + 𝒒)𝟐 = 𝒑𝟐 + 𝟐𝒑𝒒 + 𝒒𝟐
Gametos masculinos
f(A1A1) = D D2 DH DR
Gametos
f(A1A2) = H DH H2 HR
femeninos
f(A2A2) = R DR HR R2
39
TEMA 3. Variación genética poblacional II Genética evolutiva
Tras una generación de apareamiento al azar, tenemos nuevamente las frecuencia genotípicas
p2, 2pq y q2. Por lo tanto:
f(A1A1) = D´ = D2 + DH + ¼ H2 = (D + ½ H)2 = p2
f(A1A2) = H´ = DH + 2 DR + ½ H2 + HR = 2 (D + ½ H) (R + ½ H) = 2pq
f(A2A2) = R´ = ¼ H2 + HR + R2 = (R + ½ H)2 = q2
La complicación que hay en esta demostración con respecto a la anterior es que hay que tener
en cuenta la formación de parejas que corre independientemente del genotipo de los padres.
La frecuencia alélica no ha cambiado y la frecuencia genotípica se deriva del cuadrado de la suma
de las frecuencias alélicas.
40
TEMA 3. Variación genética poblacional II Genética evolutiva
Si la población está fijada para el alelo A1 significa que solamente hay individuos homocigotos
A1A1, o lo que es lo mismo, la frecuencia de alelo A1 es del 100%. A medida que aumenta q, p2
va disminuyendo y viceversa.
Lo primero que observamos es que en la población que cumple proporciones HW, observamos
que a frecuencias alélicas intermedias hay más heterocigotos que homocigotos. El máximo de
la frecuencia de heterocigotos es 0,5 que se obtiene con frecuencia alélica p = q = 0,5. Si las
frecuencias alélicas son parecidas, entonces vamos a tener más heterocigotos que homocigotos,
es la situación de máxima variación.
Otra propiedad que se observa es que si el alelo es muy frecuente, entonces está sobre todo
presente en los homocigotos. Y por el contrario, si el alelo es muy raro, prácticamente solo está
representado en heterocigosis.
Este equilibrio HW es un equilibrio que se llama dual porque afecta de manera distinta a
frecuencias alélicas y frecuencias genotípicas. Con respecto a la frecuencias alélicas, este
equilibrio no tiene memoria, es decir, si uno en un determinado momento altera las frecuencias
alélicas tras una generación de panmixia no se restituyen las antiguas frecuencias alélicas, sino
que tenemos frecuencias genotípicas esperadas (p2, 2pq y q2) pero con los nuevos valores de p
y q. Por el contrario, si por cualquier circunstancia en una generación las frecuencias genotípicas
se ven alteradas, si no se ve afectada la frecuencia alélica, entonces tras una generación de
panmixia volvemos a tener las frecuencias genotípicas p2, 2pq y q2.
41
TEMA 3. Variación genética poblacional II Genética evolutiva
Multialelismo
En el caso de múltiples alelos (por ejemplo un locus con tres alelos) la demostración es análoga
al de un locus con dos alelos.
Gametos masculinos
p (A1) p2 pq pr
Gametos
q (A2) pq q2 qr
femeninos
r (A3) pr qr r2
Las frecuencias genotípicas vienen dadas por el cuadrado de la suma de las frecuencias alélicas:
f(A1) = p´ = p2 + pq + pr = p (p + q + r) = p
Para un locus con k alelos, el número de homocigotos siempre va a ser igual al número de alelos
distintos que tenemos. Ahora bien, el número de heterocigotos viene dado por la combinación
de k alelos de dos en dos.
𝑲(𝑲 − 𝟏)
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 ℎ𝑒𝑡𝑒𝑟𝑜𝑐𝑖𝑔𝑜𝑡𝑜𝑠 =
𝟐
𝑲(𝑲 − 𝟏)
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑔𝑒𝑛𝑜𝑡𝑖𝑝𝑜𝑠 = 𝑲 +
𝟐
Si bien el número de homocigotos aumenta de forma lineal con el número de alelos, el número
de heterocigotos aumenta geométricamente.
𝟏 𝟐
𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑐𝑎𝑑𝑎 ℎ𝑒𝑡𝑒𝑟𝑜𝑐𝑖𝑔𝑜𝑡𝑜 = 𝟐 𝒙 ( )
𝒌
𝑲−𝟏
𝑀á𝑥𝑖𝑚𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 ℎ𝑒𝑡𝑒𝑟𝑜𝑐𝑖𝑔𝑜𝑡𝑜𝑠 =
𝑲
42
TEMA 3. Variación genética poblacional II Genética evolutiva
Dominancia
En una situación con dominancia y con genotipos A1A1, A1A2 y A2A2, las frecuencias alélicas no
se pueden calcular por un simple cuenteo de alelos en la población. Solamente tenemos un
fenotipo en el cual subyacen dos genotipos distintos (A1A1 y A1A2). Si embargo, si podemos hacer
una estimación de la frecuencia alélica si asumimos el principio H-W. En este caso, el fenotipo
va a ser igual a P = p2 + 2pq; Q = q2. Entonces podemos estimar de la frecuencia del mutante en
la población como:
̂ = √𝑸
𝒒
̂ =𝟏−𝒒
𝒑 ̂
𝑞̂ = √𝑄 = √0.000079 = 0.0089
𝑝̂ = 1 − 𝑞̂ = 0.9911
2𝑝̂ 𝑞̂ = 0.0176
Por lo tanto, en Galicia para el caso de la fenilcetonuria tenemos 9 alelos mutantes por cada
1000 genes. El alelo para la fenilcetonuria se encuentra fundamentalmente en los heterocigotos,
hay pocos homocigotos, porque la frecuencia de la mutación frente al alelos es muy baja.
Cuando la frecuencia de un alelo está muy baja casi siempre se encuentra fundamentalmente
en heterocigosis. La inmensa mayoría de casos fenilcetonúricos en una población panmíctica
van a tener padres que no están enfermos (portadores pero sanos). Esto se da para cualquiera
de las enfermedades raras. Hay algunas excepciones, como en el caso del albinismo en África. A
menudo hay familias donde los padres son albinos y los hijos también. Esta excepción se debe
no obstante a que la reproducción con respecto a este rasgo no es al azar.
De manera general si el valor de q está próximo a 0 (alelo muy raro), esto significa que el valor
de p es aproximadamente igual a 1. Entonces:
2𝑝𝑞 2
≅
𝑞2 𝑞
Si por ejemplo q = 0.001, esperamos que sea aproximadamente 2000 veces más probable
encontrar el alelo en un heterocigoto que en un homocigoto.
43
TEMA 3. Variación genética poblacional II Genética evolutiva
Si testamos mediante X2 ajuste a las proporciones H-W en una generación particular, si hay
panmixia y no hay selección, vamos a tener con los nuevos valores de p y q: p2, 2pq y q2; por lo
tanto no va a haber una desviación significativa de las proporciones H-W. En esta aproximación
puntual en una población, tenemos los valores de p y q estimados a partir de la muestra e
ignoramos si coinciden con los de la generación anterior o no.
Por lo tanto, con nuestro valores de frecuencias genotípicas absolutas observadas y esperadas,
calculamos X2, la cual presenta una distribución conocida. Para unos determinados grados de
libertad, vamos a ver la probabilidad de que se produzca una desviación igual o mayor atribuible
al azar bajo la hipótesis nula de ajuste a H-W correspondiente a ese valor de X2. En el caso de
un locus con dos alelos, los grados de libertad corresponden a 1, por lo que el valor de X2 para
un grado de libertad es de 3.84.
• X2 > 3.84: la probabilidad de obtener por azar una desviación mayor o igual a esa es inferior
al 5%. Rechazamos la hipótesis nula de ajuste a proporciones H-W (no hay ajuste a las
proporciones H-W). Se trataría una probabilidad muy pequeña de que una desviación como
esta fuese debido a un error de muestreo.
• X2 < 3.84: la desviación es atribuible al azar, tiene una probabilidad mayor al 5% de que sea
debido a un error de muestreo. Aceptamos la hipótesis nula de ajuste a proporciones H-W.
Los grados de libertad se calculan como: (nº de genotipos o términos del X2 – nº de alelos).
Siendo k el número de alelos también podemos calcular así:
𝒌(𝒌 + 𝟏)
𝒈. 𝒍. = − (𝒌 − 𝟏) − 𝟏
𝟐
k(k+1)/2: genotipo
k-1: frecuencias alélicas independientes que deben ser estimadas (basta con saber todas menos una)
44
TEMA 3. Variación genética poblacional II Genética evolutiva
En el estadístico chi cuadrado podemos diferenciar dos tipos de errores: errores de tipo 1 y
errores de tipo 2:
➢ Error de tipo 1 o falso positivo: se rechaza la hipótesis nula (ajuste HW) siendo verdadera.
Tenemos un valor de chi cuadrado más alto que el valor crítico, por lo que refutamos la
hipótesis, aun siendo verdadera. Por azar, puede ocurrir que tengamos ajuste HW a pesar de
que el valor de 𝑋2 sea superior a 3,84, pero eso ocurre solo un 5% de las veces (𝑋0.05).
➢ Error de tipo 2 o falso negativo: no se rechaza la hipótesis nula (ajuste HW) siendo esta falsa.
Es decir, no se rechaza el equilibrio HW cuando la población no se ajusta al modelo. En este
caso tenemos un problema de potencia estadística.
Índice f
Para cuantificar la magnitud de la desviación y en qué sentido se produce, utilizamos otro
estadístico que se conoce como índice f. Podemos introducir este índice f para ver cómo se
desvían las frecuencias fenotípicas con respecto a las esperadas.
P11 = p2 + pqf
P22 = q2 + pqf
En este estadístico, a diferencia del chi cuadrado que usamos frecuencias absolutas, podemos
usar frecuencias relativas.
➢ El índice f toma valores entre -1 y 1. El índice f vale 0 cuando los heterocigotos observados
(Ho) son los mismos que los heterocigotos esperados (He), es decir, cuando hay un ajuste
perfecto a Hardy-Weinberg.
➢ El índice f toma valores positivos cuando tenemos un déficit de heterocigotos con respecto
a lo esperado en el equilibrio. La mayor desviación se produce cuando tenemos el mayor
déficit de heterocigotos, cuando no hay ninguno, f = 1 – (0/0.5) = 1 – 0 = 1.
45
TEMA 3. Variación genética poblacional II Genética evolutiva
Por ejemplo, en el caso de un locus con dos alelos, para un grado de libertad el valor crítico de
X2 es de 3.84. Esto significa que para que sea la desviación tildada de significativa (X2 > 3.84) en
una muestra de 100 individuos, necesitamos que f = 0.2. Se muestra que el test de chi-cuadrado
es un test un poco potente a la hora de detectar desviaciones. Se precisan unas definiciones
considerables para que el test resulte estadísticamente. Esto contribuye a explicar el hecho de
que cuando uno va a hacer este tipo de análisis en poblaciones naturales, habitualmente lo que
se observa es ajuste a proporciones HW. Esto no significa que esas poblaciones no estén bajo
objeto de selección, que no haya migración o que la población no sea finita, los cuales presentan
un efecto pequeño.
Si tenemos en las poblaciones que los apareamientos entre individuos genéticamente parecidos
son más probables que lo que cabe de esperar por azar (consanguinidad sistemática), son una
fuente de desviaciones del equilibrio HW hacia un déficit de heterocigotos generalizado, esto
es, en todos los loci polimórficos del genoma. En la consanguinidad está comprometido todo el
genoma.
También la selección puede causar desviaciones hacia un exceso o un déficit, y otra causa
frecuente de déficit de heterocigotos en las poblaciones es la mezcla de poblaciones
genéticamente distintas.
46
TEMA 3. Variación genética poblacional II Genética evolutiva
Los excesos de heterocigotos significativos son menos comunes aunque la causa más habitual
es el caso de frecuencias alélicas diferentes en machos y hembras, ocurriendo frecuentemente
cuando las poblaciones son pequeñas. Esto genera f negativas.
Polimorfismo genético
Una primera aproximación de la cuantificación de la variabilidad genética es determinar el
porcentaje de loci que son polimórficos. El polimorfismo no es más que la presencia de distintas
variantes del locus en la población. En sentido estricto, podemos hablar de polimorfismo
genético aplicando dos criterios distintos, que son arbitrarios pero con diferente nivel de
exigencia:
➢ Polimorfismo según el criterio del 95%: según el criterio del 95%, decimos que un locus es
polimórfico cuando la frecuencia del alelo más común en la población no supera el 95%.
Entonces decimos que el locus es polimórfico.
➢ Polimorfismo según el criterio del 99%: es un valor menos restrictivo. El locus es calificado
de polimórfico si la frecuencia del alelo más común en la muestra no supera el 99%.
En sentido amplio, hablamos de polimorfismo si están presentes dos variantes, pero a la hora
de cuantificar la variabilidad genética de una población necesitamos que hay una cierta cantidad
de variación. Entonces, aplicamos el criterio del polimorfismo más estricto que puede ser del
95% o del 99%.
Supongamos un locus con dos alelos donde ambos alelos se encuentran en frecuencias
intermedias (0.5 cada alelo), y otro locus donde la frecuencia del alelo más común es 0.8. En las
dos poblaciones, el locus sería considerado polimórfico con el criterio más restrictivo, el del 95%,
pero lógicamente hay más variación en el locus en la primera población, donde están los alelos
en frecuencias intermedias. Esta diferencia no la habríamos aplicado este criterio puesto que
ambos loci serían polimórficos por igual en las dos poblaciones.
Otro ejemplo: podemos tener un locus donde el alelo más común no supere el 95% en dos
poblaciones, pero el número de alelos es muy distinto. En aquella población donde tenemos
más alelos segregando en el locus, va a haber más variación.
47
TEMA 3. Variación genética poblacional II Genética evolutiva
Heterocigosis esperada
La forma más rigurosa de estimar la variabilidad genética en poblaciones naturales es utilizar la
heterocigosis esperada en el equilibrio HW. En el caso de un locus con dos alelos esta
heterocigosis esperada es 2pq, y en el caso de un locus multialélico la heterocigosis esperada la
calculamos como:
48
TEMA 3. Variación genética poblacional II Genética evolutiva
En general, la heterocigosis esperada o diversidad génica suele ser inferior en vertebrados que
en invertebrados. Es decir, para un gen alozímico promedio de un invertebrado, el 12,2% de los
individuos de una población serían heterocigotos, mientras que para un locus alozímico
cualquiera en promedio, si uno analiza un vertebrado cualquiera, esperaría encontrar que el 7%
de individuos fuesen heterocigotos para ese locus.
El polimorfismo suele estar en torno al 30%, es decir, aproximadamente el 30% de los loci
alozímicos que se estudian son polimórficos.
49
TEMA 3. Variación genética poblacional II Genética evolutiva
Cuando se tuvieron en cuenta indels, las 11 versiones que se secuenciaron fueron distintas. Si
solamente se tienen en cuenta los SNPs y no los indels, aún así encontró en esas 11 versiones,
9 haplotipos únicos: 6 de ellos corresponden a una de las alozimas y los otros 3 corresponden al
otro alozima.
1 2
𝐻 = 1 − ∑ ( ) = 0.909
11
Polimorfismo nucleotídico
Cuando uno aplica el estadístico análogo a la diversidad génica, consideramos cada haplotipo
como si fuera un alelo y siempre nos encontraremos cifras muy altas, próximas a 1. Es poco
informativo a la hora de capturar diferencias en variabilidad genética entre poblaciones.
Necesitamos un estadístico que se ajuste más. Una posibilidad es utilizar lo que se conoce como
polimorfismo nucleotídico. El polimorfismo nucleotídico es el número de sitios que son
polimórficos en la secuencia (s) dividido entre el número de nucleótidos que tiene la secuencia
(m):
𝒔
𝑷𝒔 =
𝒎
El polimorfismo nucleotídico no es más que el porcentaje de sitios variables en nuestra muestra
que tenemos en la secuencia nucleotídica.
Diversidad nucleotídica
La medida más rigurosa y exacta para cuantificar la variabilidad genética de una población
utilizando datos de secuencia nucleotídica es π, lo que se conoce como diversidad nucleotídica.
La diversidad nucleotídica es la proporción media de nucleótidos diferentes entre cualquier par
de secuencias presentes en la población. Otra forma de verlo es tomando dos versiones del locus
al azar, nos fijamos en una posición nucleotídica particular y la probabilidad de que sean
diferentes, eso es lo que conocemos por π.
50