TEMA 3. Variación Genética Poblacional

Variación genética poblacional:
equilibrio y cuantificación
En el tema anterior hemos visto cómo se calcula la frecuencia alélica a partir de frecuencias
genotípicas absolutas y relativas en el caso de un locus con dos alelos. Vamos a extenderlo a un
escenario multialélico.
En el caso de un locus con muchos alelos en una población, la frecuencia alélica para cualquier
alelo (i) la calculamos a partir de frecuencias genotípicas absolutas, es decir, del número de
individuos con un determinado; o a partir de frecuencias genotípicas relativas, es decir,
proporción de individuos de cada genotipo en la muestra como:
El principio Hardy-Weinberg y la población ideal

Mendel hace una primera extrapolación a nivel poblacional de lo que ocurre en un conjunto de
familias si la transmisión de los genes tiene lugar de acuerdo con las reglas mendeliana, pero lo
hace en un paso muy particular, con plantas que se autofecundan por lo que protagonizan el
mayor grado de consanguinidad que podemos encontrar. Mendel confirmó experimentalmente
que si las plantas se autofecunda y la variación se hereda de acuerdo con esas reglas que él
estaba poniendo de manifiesto, al final lo que se pierde al cabo de unas generaciones es la
variación. Sin embargo, una situación más general sería preguntarnos si ocurre lo mismo en el
caso de que los individuos lejos de autofecundarse se apareasen al azar. El principio de Hardy-
Weinberg responde a esta cuestión.
El principio de Hardy-Weinberg postula que bajo ciertas asunciones la composición genética de

una población no cambia. De acuerdo con este principio, las frecuencias alélicas de la población
permanecen constantes generación tras generación si se cumplen ciertas asunciones. Este
estado de constancia de frecuencia alélica generación tras generación bajo ciertas asunciones
es lo que se conoce como el equilibrio Hardy-Weinberg. Es un principio importante porque
viene a demostrar que el modo de herencia mendeliano por sí solo, es decir, por el simple hecho
de que la variación esté siendo heredada de acuerdo con las leyes mendelianas, no conlleva una
pérdida de variación, no conlleva cambio en la composición genética de la población, como
37
TEMA 3. Variación genética poblacional II Genética evolutiva
ocurría con el modo de herencia mezclado. Las frecuencia alélicas permanecen constantes a lo
largo de sucesivas generaciones si se mantienen las siguiente asunciones:
❖ Asumimos una especie diploide con reproducción sexual y generaciones discretas. Si las
generaciones solapan, es decir, generaciones donde los nacidos en etapas diferentes se
reproducen al mismo tiempo, se puede demostrar el principio H-W pero de forma más
complicada. Por lo tanto, esta asunción no es una condición necesaria para que tenga lugar
esta constancia de la frecuencia alélica a lo largo de sucesivas generaciones.
❖ Asumimos variación en un gen autosómico con dos alelos con frecuencias iguales en
machos y hembras. Si las frecuencias alélicas difieren en machos y hembras en una
población, la aproximación al equilibrio se produce prontamente pero la demostración es
más dificultosa.
❖ Asumimos que la población es panmíctica (apareamiento al azar o unión aleatoria de

gametos si hablamos de un organismo con reproducción externa) y muy grande (idealmente
de tamaño infinito). Es una asunción importante porque de esta forma garantizamos que en
la práctica no haya frecuencia alélica de una generación a la siguiente por azar.
❖ Asumimos efectos despreciables de la mutación, de la selección natural o del movimiento

de individuos hacia o desde otras poblaciones. No hay efecto sobre la frecuencia alélica de
la entrada de individuos procedentes de otras poblaciones o de salidas de individuos a otras
poblaciones (no hay efecto de la migración).
Demostraciones del principio Hardy-Weinberg

La demostración del principio Hardy-Weinberg la podemos abordar de dos maneras diferentes:
para un organismo con fecundación externa con unión aleatoria de gametos, y para un
organismo con fecundación interna.
Individuos con fecundación externa

Imaginemos un organismo con fecundación externa en la que los gametos se unen al azar en la
formación de cigotos. Asumimos que se trata de un locus con dos alelos A1 y A2 con frecuencias
p y q respectivamente. También asumimos por conveniencia que los alelos A1 y A2 están en las
mismas frecuencias tanto en los machos como en las hembras. Si los gametos se unen al azar,
esto es, se unen con independencia del alelo que porten, luego el genotipo en el cigoto va a
venir dado por el producto de las frecuencias alélicas.
Gametos masculinos
p (A1) q (A2)
p (A1) p2 pq
Gametos femeninos
q (A2) pq q2
38
Por tanto vamos a tener tras una generación de unión aleatoria de gametos frecuencias
genotípicas relativas esperadas bajo panmixia: f(A1A1) = p2, f(A1A2) = 2pq y f(A2A2) = q2. A partir
de las frecuencias genotípicas relativas podemos calcular la frecuencia alélica tras una
generación de unión al azar como:
f(A1) = p´ = P11 + ½ (P12) → p2 + ½ (2pq) = p2 + pq = p (p + q) = p

Como podemos ver, la frecuencia alélica tras una generación de unión aleatoria de gametos no
cambia, sigue siendo la misma que teníamos antes de la formación de los cigotos. El mismo
razonamiento puede hacerse f(A2) = q.
El equilibrio H-W nos indica además que las frecuencias genotípicas van a venir dadas por el
desarrollo del binomio (p + q)2:
(𝒑 + 𝒒)𝟐 = 𝒑𝟐 + 𝟐𝒑𝒒 + 𝒒𝟐
Individuos con fecundación interna

Con respecto a un organismo con fecundación interna la unión de gametos está mediada por el
apareamiento. Si se trata de una población panmíctica, entonces el apareamiento ha de ser al
azar. Si es al azar, la probabilidad de que dos genotipos cualesquiera se emparejen va a ir dada
por el producto de sus correspondientes frecuencias. Las parejas se constituyen
independientemente del genotipo que lleven en el locus. Esto significa que la probabilidad de
que se unan dos genotipos cualesquiera va a venir dado por el producto de la frecuencia con
que estén esos genotipos.
Gametos masculinos
f(A1A1) = D f(A1A2) = H f(A2A2) = R
f(A1A1) = D D2 DH DR
Gametos
f(A1A2) = H DH H2 HR
femeninos
f(A2A2) = R DR HR R2
De acuerdo a esto tenemos 9 tipos de apareamientos dependiendo del genotipo de los

individuos implicados en la pareja. Estos 9 tipos de apareamientos se pueden simplificar
clasificando los apareamientos por 6 tipos de familias según el genotipo de los padres.
39
Frecuencia del Frecuencias genotípicas en la descendencia

Apareamiento
apareamiento A1A1 A1A2 A2A2
2 2
A1A1 x A1A1 D D - -
A1A1 x A1A2 2DH DH DH -
A1A1 x A2A2 2DR - 2DR -
A1A2 x A1A2 H2 1/4 H2 1/2 H2 1/4 H2
A1A2 x A2A2 2HR - HR HR
A2A2 x A2A2 R2 - - R2
𝟐 𝟏 𝟏 𝟐
𝟏 𝟏
Total (𝑫 + 𝑯) 𝟐 (𝑫 + 𝑯) (𝑹 + 𝑯) (𝑹 + 𝑯)
𝟐 𝟐 𝟐 𝟐
Tras una generación de apareamiento al azar, tenemos nuevamente las frecuencia genotípicas
p2, 2pq y q2. Por lo tanto:
f(A1A1) = D´ = D2 + DH + ¼ H2 = (D + ½ H)2 = p2
f(A1A2) = H´ = DH + 2 DR + ½ H2 + HR = 2 (D + ½ H) (R + ½ H) = 2pq
f(A2A2) = R´ = ¼ H2 + HR + R2 = (R + ½ H)2 = q2
f(A1) = p´ = P11 + ½ (P12) → p2 + ½ (2pq) = p2 + pq = p (p + q) = p
La complicación que hay en esta demostración con respecto a la anterior es que hay que tener
en cuenta la formación de parejas que corre independientemente del genotipo de los padres.
La frecuencia alélica no ha cambiado y la frecuencia genotípica se deriva del cuadrado de la suma
de las frecuencias alélicas.
Relación entre las frecuencias alélicas y

genotípicas en el equilibrio Hardy-Weinberg
La gráfica de la siguiente página nos muestra la relación entre la frecuencia genotípica y la
frecuencia alélica. En los dos ejes horizontales se encuentran representados las frecuencias de
A1 y A2; en el eje vertical se representa la frecuencia genotípica. Siempre se trabaja con
frecuencias relativas.
40
Si la población está fijada para el alelo A1 significa que solamente hay individuos homocigotos
A1A1, o lo que es lo mismo, la frecuencia de alelo A1 es del 100%. A medida que aumenta q, p2
va disminuyendo y viceversa.
Lo primero que observamos es que en la población que cumple proporciones HW, observamos
que a frecuencias alélicas intermedias hay más heterocigotos que homocigotos. El máximo de
la frecuencia de heterocigotos es 0,5 que se obtiene con frecuencia alélica p = q = 0,5. Si las
frecuencias alélicas son parecidas, entonces vamos a tener más heterocigotos que homocigotos,
es la situación de máxima variación.
Otra propiedad que se observa es que si el alelo es muy frecuente, entonces está sobre todo
presente en los homocigotos. Y por el contrario, si el alelo es muy raro, prácticamente solo está
representado en heterocigosis.
Este equilibrio HW es un equilibrio que se llama dual porque afecta de manera distinta a
frecuencias alélicas y frecuencias genotípicas. Con respecto a la frecuencias alélicas, este
equilibrio no tiene memoria, es decir, si uno en un determinado momento altera las frecuencias
alélicas tras una generación de panmixia no se restituyen las antiguas frecuencias alélicas, sino
que tenemos frecuencias genotípicas esperadas (p2, 2pq y q2) pero con los nuevos valores de p
y q. Por el contrario, si por cualquier circunstancia en una generación las frecuencias genotípicas
se ven alteradas, si no se ve afectada la frecuencia alélica, entonces tras una generación de
panmixia volvemos a tener las frecuencias genotípicas p2, 2pq y q2.
41
El equilibrio Hardy-Weinberg en los casos de

dominancia y multialelismo
Multialelismo
En el caso de múltiples alelos (por ejemplo un locus con tres alelos) la demostración es análoga
al de un locus con dos alelos.
Gametos masculinos
p (A1) q (A2) r (A3)
p (A1) p2 pq pr
Gametos
q (A2) pq q2 qr
femeninos
r (A3) pr qr r2
Las frecuencias genotípicas vienen dadas por el cuadrado de la suma de las frecuencias alélicas:
(𝒑 + 𝒒 + 𝒓)𝟐 = 𝒑𝟐 + 𝒒𝟐 + 𝒓𝟐 + 𝟐𝒑𝒒 + 𝟐𝒑𝒓 + 𝟐𝒒𝒓

En general, para cualesquiera número de alelos, la frecuencia del homocigoto esperada en el
equilibrio H-W va a ser igual a:
f(A1) = p´ = p2 + pq + pr = p (p + q + r) = p
Para un locus con k alelos, el número de homocigotos siempre va a ser igual al número de alelos
distintos que tenemos. Ahora bien, el número de heterocigotos viene dado por la combinación
de k alelos de dos en dos.
𝑲(𝑲 − 𝟏)
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 ℎ𝑒𝑡𝑒𝑟𝑜𝑐𝑖𝑔𝑜𝑡𝑜𝑠 =
𝟐
𝑲(𝑲 − 𝟏)
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑔𝑒𝑛𝑜𝑡𝑖𝑝𝑜𝑠 = 𝑲 +
𝟐
Si bien el número de homocigotos aumenta de forma lineal con el número de alelos, el número
de heterocigotos aumenta geométricamente.
En el equilibrio HW siempre vamos a tener el máximo número de heterocigotos para frecuencias

alélicas cuando dichas frecuencias alélicas son iguales. En el caso de k alelos se da cuando la
frecuencia alélica es igual a 1/K, de tal manera que los distintos heterocigotos tienen frecuencia.
𝟏 𝟐
𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑐𝑎𝑑𝑎 ℎ𝑒𝑡𝑒𝑟𝑜𝑐𝑖𝑔𝑜𝑡𝑜 = 𝟐 𝒙 ( )
𝒌
𝑲−𝟏
𝑀á𝑥𝑖𝑚𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 ℎ𝑒𝑡𝑒𝑟𝑜𝑐𝑖𝑔𝑜𝑡𝑜𝑠 =
𝑲
42
Dominancia
En una situación con dominancia y con genotipos A1A1, A1A2 y A2A2, las frecuencias alélicas no
se pueden calcular por un simple cuenteo de alelos en la población. Solamente tenemos un
fenotipo en el cual subyacen dos genotipos distintos (A1A1 y A1A2). Si embargo, si podemos hacer
una estimación de la frecuencia alélica si asumimos el principio H-W. En este caso, el fenotipo
va a ser igual a P = p2 + 2pq; Q = q2. Entonces podemos estimar de la frecuencia del mutante en
la población como:
̂ = √𝑸
𝒒
̂ =𝟏−𝒒
𝒑 ̂
Por ejemplo, en el caso de la fenilcetonuria en Galicia, su incidencia es de 1/12 600 nacimientos

= 0.000079 = Q
𝑞̂ = √𝑄 = √0.000079 = 0.0089
𝑝̂ = 1 − 𝑞̂ = 0.9911
2𝑝̂ 𝑞̂ = 0.0176
Por lo tanto, en Galicia para el caso de la fenilcetonuria tenemos 9 alelos mutantes por cada
1000 genes. El alelo para la fenilcetonuria se encuentra fundamentalmente en los heterocigotos,
hay pocos homocigotos, porque la frecuencia de la mutación frente al alelos es muy baja.
Cuando la frecuencia de un alelo está muy baja casi siempre se encuentra fundamentalmente
en heterocigosis. La inmensa mayoría de casos fenilcetonúricos en una población panmíctica
van a tener padres que no están enfermos (portadores pero sanos). Esto se da para cualquiera
de las enfermedades raras. Hay algunas excepciones, como en el caso del albinismo en África. A
menudo hay familias donde los padres son albinos y los hijos también. Esta excepción se debe
no obstante a que la reproducción con respecto a este rasgo no es al azar.
De manera general si el valor de q está próximo a 0 (alelo muy raro), esto significa que el valor
de p es aproximadamente igual a 1. Entonces:
2𝑝𝑞 2
≅
𝑞2 𝑞
Si por ejemplo q = 0.001, esperamos que sea aproximadamente 2000 veces más probable
encontrar el alelo en un heterocigoto que en un homocigoto.
La desviación de las proporciones Hardy-Weinberg

El modelo HW es muy importante porque podemos cotejar las frecuencias genotípicas que
nosotros observamos con las frecuencias genotípicas esperadas por el modelo. Haciendo esta
comparación podemos ver si hay un ajuste o no, y el grado de significación estadística. Si hay
una desviación mayor que la que cabría esperar por azar podemos presuponer que o bien no
hay panmixia o existe un efecto importante de alguno de esos factores que hemos asumido que
no están interviniendo por el modelo (especialmente la selección o la mezcla de poblaciones).
43
Estadístico chi-cuadrado (X2)

En un locus con dos alelos si tenemos las frecuencias genotípicas podemos compararlas con las
frecuencias genotípicas esperadas p2, 2pq y q2 mediante un test estadístico, el cual es
generalmente chi cuadrado (X2):
Para calcular X2 se usan frecuencias genotípicas absolutas (multiplicamos las frecuencias

genotípicas relativas por el número de la población). Calculamos p2, 2pq y q2 a partir de la
estimación de frecuencias alélicas a partir de la propia muestra. Con el test lo que testamos es
si hay un ajuste a las proporciones H-W en un determinado momento, pero no estamos
testando propiamente el equilibrio H-W, la estabilidad de las frecuencias alélicas a lo largo de
sucesivas generaciones.
Si testamos mediante X2 ajuste a las proporciones H-W en una generación particular, si hay
panmixia y no hay selección, vamos a tener con los nuevos valores de p y q: p2, 2pq y q2; por lo
tanto no va a haber una desviación significativa de las proporciones H-W. En esta aproximación
puntual en una población, tenemos los valores de p y q estimados a partir de la muestra e
ignoramos si coinciden con los de la generación anterior o no.
Por lo tanto, con nuestro valores de frecuencias genotípicas absolutas observadas y esperadas,
calculamos X2, la cual presenta una distribución conocida. Para unos determinados grados de
libertad, vamos a ver la probabilidad de que se produzca una desviación igual o mayor atribuible
al azar bajo la hipótesis nula de ajuste a H-W correspondiente a ese valor de X2. En el caso de
un locus con dos alelos, los grados de libertad corresponden a 1, por lo que el valor de X2 para
un grado de libertad es de 3.84.
• X2 > 3.84: la probabilidad de obtener por azar una desviación mayor o igual a esa es inferior
al 5%. Rechazamos la hipótesis nula de ajuste a proporciones H-W (no hay ajuste a las
proporciones H-W). Se trataría una probabilidad muy pequeña de que una desviación como
esta fuese debido a un error de muestreo.
• X2 < 3.84: la desviación es atribuible al azar, tiene una probabilidad mayor al 5% de que sea
debido a un error de muestreo. Aceptamos la hipótesis nula de ajuste a proporciones H-W.
Los grados de libertad se calculan como: (nº de genotipos o términos del X2 – nº de alelos).
Siendo k el número de alelos también podemos calcular así:
𝒌(𝒌 + 𝟏)
𝒈. 𝒍. = − (𝒌 − 𝟏) − 𝟏
𝟐
k(k+1)/2: genotipo
k-1: frecuencias alélicas independientes que deben ser estimadas (basta con saber todas menos una)
1: total de la muestra, tamaño de muestra
44
En el estadístico chi cuadrado podemos diferenciar dos tipos de errores: errores de tipo 1 y
errores de tipo 2:
➢ Error de tipo 1 o falso positivo: se rechaza la hipótesis nula (ajuste HW) siendo verdadera.
Tenemos un valor de chi cuadrado más alto que el valor crítico, por lo que refutamos la
hipótesis, aun siendo verdadera. Por azar, puede ocurrir que tengamos ajuste HW a pesar de
que el valor de 𝑋2 sea superior a 3,84, pero eso ocurre solo un 5% de las veces (𝑋0.05).
➢ Error de tipo 2 o falso negativo: no se rechaza la hipótesis nula (ajuste HW) siendo esta falsa.
Es decir, no se rechaza el equilibrio HW cuando la población no se ajusta al modelo. En este
caso tenemos un problema de potencia estadística.
Índice f
Para cuantificar la magnitud de la desviación y en qué sentido se produce, utilizamos otro
estadístico que se conoce como índice f. Podemos introducir este índice f para ver cómo se
desvían las frecuencias fenotípicas con respecto a las esperadas.
P11 = p2 + pqf
P12 = 2pq – 2pqf
P22 = q2 + pqf
En una situación multialélica nos fijamos en el heterocigotos:
En este estadístico, a diferencia del chi cuadrado que usamos frecuencias absolutas, podemos
usar frecuencias relativas.
➢ El índice f toma valores entre -1 y 1. El índice f vale 0 cuando los heterocigotos observados
(Ho) son los mismos que los heterocigotos esperados (He), es decir, cuando hay un ajuste
perfecto a Hardy-Weinberg.
➢ El índice f toma valores negativos cuando tenemos un exceso de heterocigotos observados

con respecto de los esperado en el equilibrio. Si en la muestra tenemos el máximo de
heterocigotos: f = 1 – (1/0.5) = 1 – 2 = -1
➢ El índice f toma valores positivos cuando tenemos un déficit de heterocigotos con respecto
a lo esperado en el equilibrio. La mayor desviación se produce cuando tenemos el mayor
déficit de heterocigotos, cuando no hay ninguno, f = 1 – (0/0.5) = 1 – 0 = 1.
En definitiva, mediante el test de chi cuadrado sabemos si la desviación es significativa y con el

estadístico f cuantificamos la desviación si va hacia un déficit o un exceso de heterocigotos. Estos
dos estadísticos se pueden relacionar mediante la siguiente expresión:
45
Por ejemplo, en el caso de un locus con dos alelos, para un grado de libertad el valor crítico de
X2 es de 3.84. Esto significa que para que sea la desviación tildada de significativa (X2 > 3.84) en
una muestra de 100 individuos, necesitamos que f = 0.2. Se muestra que el test de chi-cuadrado
es un test un poco potente a la hora de detectar desviaciones. Se precisan unas definiciones
considerables para que el test resulte estadísticamente. Esto contribuye a explicar el hecho de
que cuando uno va a hacer este tipo de análisis en poblaciones naturales, habitualmente lo que
se observa es ajuste a proporciones HW. Esto no significa que esas poblaciones no estén bajo
objeto de selección, que no haya migración o que la población no sea finita, los cuales presentan
un efecto pequeño.
Posibles causas de desviación de las proporciones HW

La mayoría de las veces por las cuales el test detecta desviaciones es porque la población no es
panmíctica. El test por tanto es particularmente sensible a desviaciones de la panmixia. No
obstante, las causas de desviación en el equilibrio HW pueden ser muy variadas. Cuando hay
desviación, las desviaciones más habituales son hacia un déficit de heterocigotos. Este déficit es
causado por ejemplo por una desviación de la panmixia basada en el parentesco como es la
consanguinidad.
Si tenemos en las poblaciones que los apareamientos entre individuos genéticamente parecidos
son más probables que lo que cabe de esperar por azar (consanguinidad sistemática), son una
fuente de desviaciones del equilibrio HW hacia un déficit de heterocigotos generalizado, esto
es, en todos los loci polimórficos del genoma. En la consanguinidad está comprometido todo el
genoma.
Hay otras desviaciones de la panmixia basadas en el fenotipo y entonces se habla de

apareamiento asociativo y apareamiento disociativo.
➢ El apareamiento asociativo es cuando hay apareamiento con mayor probabilidad de lo que

se espera por azar entre individuos con fenotipo parecido. En este caso los loci que afectan
al rasgo para el cual hay el sesgo en el apareamiento, solo estos manifiestan el déficit de
heterocigotos, es decir, otros loci que no afectan al rasgo no se ven afectados. Estos último
pueden mostrar proporciones acordes con la panmixia porque el apareamiento es al azar con
respecto a la variación a ese locus en concreto.
➢ El apareamiento disociativo es todo lo contrario a lo anterior. Es una desviación de la

panmixia también basada en el parentesco pero en este caso tienden a emparejarse
individuos con fenotipo distinto. Para aquellos loci que afectan al rasgo para el cual hay el
sesgo en el apareamiento, lo que se observa es un exceso de heterocigotos. Es específico de
locus.
También la selección puede causar desviaciones hacia un exceso o un déficit, y otra causa
frecuente de déficit de heterocigotos en las poblaciones es la mezcla de poblaciones
genéticamente distintas.
46
Los excesos de heterocigotos significativos son menos comunes aunque la causa más habitual
es el caso de frecuencias alélicas diferentes en machos y hembras, ocurriendo frecuentemente
cuando las poblaciones son pequeñas. Esto genera f negativas.
La cuantificación de la variabilidad genética

poblacional
Polimorfismo genético
Una primera aproximación de la cuantificación de la variabilidad genética es determinar el
porcentaje de loci que son polimórficos. El polimorfismo no es más que la presencia de distintas
variantes del locus en la población. En sentido estricto, podemos hablar de polimorfismo
genético aplicando dos criterios distintos, que son arbitrarios pero con diferente nivel de
exigencia:
➢ Polimorfismo según el criterio del 95%: según el criterio del 95%, decimos que un locus es
polimórfico cuando la frecuencia del alelo más común en la población no supera el 95%.
Entonces decimos que el locus es polimórfico.
➢ Polimorfismo según el criterio del 99%: es un valor menos restrictivo. El locus es calificado
de polimórfico si la frecuencia del alelo más común en la muestra no supera el 99%.
En sentido amplio, hablamos de polimorfismo si están presentes dos variantes, pero a la hora
de cuantificar la variabilidad genética de una población necesitamos que hay una cierta cantidad
de variación. Entonces, aplicamos el criterio del polimorfismo más estricto que puede ser del
95% o del 99%.
De acuerdo a estos criterios, el polimorfismo no es más que el porcentaje de loci polimórficos

en la muestra de loci que nosotros manejamos. Se trata de un procedimiento muy poco fino a
la hora de caracterizar las diferencias de frecuencias genéticas porque apenas tiene en cuenta
diferencias en frecuencias alélicas.
Supongamos un locus con dos alelos donde ambos alelos se encuentran en frecuencias
intermedias (0.5 cada alelo), y otro locus donde la frecuencia del alelo más común es 0.8. En las
dos poblaciones, el locus sería considerado polimórfico con el criterio más restrictivo, el del 95%,
pero lógicamente hay más variación en el locus en la primera población, donde están los alelos
en frecuencias intermedias. Esta diferencia no la habríamos aplicado este criterio puesto que
ambos loci serían polimórficos por igual en las dos poblaciones.
Otro ejemplo: podemos tener un locus donde el alelo más común no supere el 95% en dos
poblaciones, pero el número de alelos es muy distinto. En aquella población donde tenemos
más alelos segregando en el locus, va a haber más variación.
47
Número medio de alelos por locus

Otra forma de medir la variabilidad genética es tener en cuenta el número medio de alelos por
locus. Es una medida interesante porque el número de alelos por locus es muy sensible al
tamaño de muestra. En poblaciones pequeñas típicamente se ve afectado rápidamente el
número medio de alelos por locus, el efecto no es tan importante en otros estadísticos. Un
número de alelos en promedio por locus bajo es consecuencia de una población pequeña.
Heterocigosis esperada
La forma más rigurosa de estimar la variabilidad genética en poblaciones naturales es utilizar la
heterocigosis esperada en el equilibrio HW. En el caso de un locus con dos alelos esta
heterocigosis esperada es 2pq, y en el caso de un locus multialélico la heterocigosis esperada la
calculamos como:
pi: frecuencia alélica
Estamos reduciendo la diferencia a 1 de la suma de todos lo homocigotos. Para el cálculo de la

heterocigosis esperada se usan homocigotos porque a medida que aumentan el número de
alelos, lo homocigotos aumentan de forma lineal. Si embargo, el aumento de heterocigotos con
el aumento de alelos es geométrico, tenemos muchos más heterocigotos.
¿Por qué la heterocigosis esperada es preferible a la hora de cuantificar la variabilidad genética

de la población? Porque la heterocigosis esperada solo depende de las frecuencias alélicas, y
por tanto no se ve afectada por factores distintos que pueden operar en las poblaciones. Por
eso la heterocigosis esperada es la más adecuada a la hora de estimar la variabilidad genética
que la heterocigosis observada. También tenemos otra ventaja y es que en el fondo la
heterocigosis esperada la podemos interpretar como la probabilidad de que dos genes tomados
al azar en la población sean variantes distintas de un locus. De esta forma, la heterocigosis
esperada la podemos aplicar incluso en situaciones donde no tiene sentido habar de
heterocigotos, y por eso muchas veces hablamos de diversidad génica, lo que es aplicable a
bacterias u organismos haploides. La diversidad génica se interpreta en esencia como la
probabilidad de que se coja dos versiones de un locus al azar y que sean distintas. La diversidad
génica la podemos interpretar además de dos maneras distintas:
➢ Interpretada como proporción media de heterocigotos que tenemos en una población

panmíctica.
➢ Interpretada como a nivel individual. Es la proporción esperada de loci que son

heterocigotos en un individuo.
Estos dos valores generalmente coinciden, es decir, la proporción media de heterocigotos en la

población y la proporción esperada de loci heterocigotos en un individuo coinciden. No
obstante, los loci son más variables en su grado de heterocigosis de los que son los individuos
en una población. Por eso, si uno va a analizar la variabilidad genética de una población es
48
preferible que aumente el número de loci examinados a expensas de disminuir el número de

individuos por locus.
En el caso de alozimas, la diversidad génica para loci alozímicos la podemos observar en la

siguiente tabla para vertebrados e invertebrados.
En general, la heterocigosis esperada o diversidad génica suele ser inferior en vertebrados que
en invertebrados. Es decir, para un gen alozímico promedio de un invertebrado, el 12,2% de los
individuos de una población serían heterocigotos, mientras que para un locus alozímico
cualquiera en promedio, si uno analiza un vertebrado cualquiera, esperaría encontrar que el 7%
de individuos fuesen heterocigotos para ese locus.
El polimorfismo suele estar en torno al 30%, es decir, aproximadamente el 30% de los loci
alozímicos que se estudian son polimórficos.
Si uno va a analizar la variación a través de la secuencia nucleotídica encuentra mucha más

variación. Cuando manejamos datos de secuencia nucleotídica, ¿cómo podemos cuantificar la
variabilidad genética?
El primer estudio dedicado a analizar la variabilidad genética poblacional a partir de datos de

secuencia nucleotídica se estudió un locus alozímico del enzima alcohol deshidrogenasa y se
hizo concretamente en la especie Drosophila melanogaster. En el análisis alozímico de este locus
había revelado previamente la existencia de dos alozimas. Se analizaron 11 versiones de este
locus, secuenció 2721 nucleótidos y detectó 14 SNPs en la región codificadora. De estos 14 SNPs,
solo uno implicó una sustitución aminoacídica, es decir, en un cambio no sinónimo; los demás
fueron cambios sinónimos.
49
Cuando se tuvieron en cuenta indels, las 11 versiones que se secuenciaron fueron distintas. Si
solamente se tienen en cuenta los SNPs y no los indels, aún así encontró en esas 11 versiones,
9 haplotipos únicos: 6 de ellos corresponden a una de las alozimas y los otros 3 corresponden al
otro alozima.
Si ahora se aplica un estadístico análogo a la diversidad génica como es la diversidad haplotípica,

teniendo en cuenta que cada uno de las versiones secuenciadas es única, entonces la diversidad
haplotípica se calcula:
1 2
𝐻 = 1 − ∑ ( ) = 0.909
11
Polimorfismo nucleotídico
Cuando uno aplica el estadístico análogo a la diversidad génica, consideramos cada haplotipo
como si fuera un alelo y siempre nos encontraremos cifras muy altas, próximas a 1. Es poco
informativo a la hora de capturar diferencias en variabilidad genética entre poblaciones.
Necesitamos un estadístico que se ajuste más. Una posibilidad es utilizar lo que se conoce como
polimorfismo nucleotídico. El polimorfismo nucleotídico es el número de sitios que son
polimórficos en la secuencia (s) dividido entre el número de nucleótidos que tiene la secuencia
(m):
𝒔
𝑷𝒔 =
𝒎
El polimorfismo nucleotídico no es más que el porcentaje de sitios variables en nuestra muestra
que tenemos en la secuencia nucleotídica.
Diversidad nucleotídica
La medida más rigurosa y exacta para cuantificar la variabilidad genética de una población
utilizando datos de secuencia nucleotídica es π, lo que se conoce como diversidad nucleotídica.
La diversidad nucleotídica es la proporción media de nucleótidos diferentes entre cualquier par
de secuencias presentes en la población. Otra forma de verlo es tomando dos versiones del locus
al azar, nos fijamos en una posición nucleotídica particular y la probabilidad de que sean
diferentes, eso es lo que conocemos por π.
Se puede considerar la diversidad nucleotídica como una heterocigosis siendo el locus la

posición nucleotídica. Si tenemos una secuencia de m nucleótidos, podríamos calcular para
todos los SNPs la heterocigosis esperada.
El valor de π, se haya en un rango de 0.0001 – 0.01. En el caso de humanos, en una muestra de

16 loci, π es 0.00089. Una diversidad nucleotídica como esta implica que en promedio cualquiera
de nosotros tiene unos 40 nucleótidos distintos para cualquier gen. La cantidad de variación a
nivel de la secuencia nucleotídica es enorme, hay mucha variación.
50

TEMA 3. Variación Genética Poblacional

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

TEMA 3. Variación Genética Poblacional

Cargado por

Copyright:

Formatos disponibles

Variación genética poblacional:

El principio Hardy-Weinberg y la población ideal

El principio de Hardy-Weinberg postula que bajo ciertas asunciones la composición genética de

❖ Asumimos que la población es panmíctica (apareamiento al azar o unión aleatoria de

❖ Asumimos efectos despreciables de la mutación, de la selección natural o del movimiento

Demostraciones del principio Hardy-Weinberg

Individuos con fecundación externa

f(A1) = p´ = P11 + ½ (P12) → p2 + ½ (2pq) = p2 + pq = p (p + q) = p

Individuos con fecundación interna

f(A1A1) = D f(A1A2) = H f(A2A2) = R

De acuerdo a esto tenemos 9 tipos de apareamientos dependiendo del genotipo de los

Frecuencia del Frecuencias genotípicas en la descendencia

f(A1) = p´ = P11 + ½ (P12) → p2 + ½ (2pq) = p2 + pq = p (p + q) = p

Relación entre las frecuencias alélicas y

El equilibrio Hardy-Weinberg en los casos de

p (A1) q (A2) r (A3)

(𝒑 + 𝒒 + 𝒓)𝟐 = 𝒑𝟐 + 𝒒𝟐 + 𝒓𝟐 + 𝟐𝒑𝒒 + 𝟐𝒑𝒓 + 𝟐𝒒𝒓

En el equilibrio HW siempre vamos a tener el máximo número de heterocigotos para frecuencias

Por ejemplo, en el caso de la fenilcetonuria en Galicia, su incidencia es de 1/12 600 nacimientos

La desviación de las proporciones Hardy-Weinberg

Estadístico chi-cuadrado (X2)

Para calcular X2 se usan frecuencias genotípicas absolutas (multiplicamos las frecuencias

1: total de la muestra, tamaño de muestra

P12 = 2pq – 2pqf

En una situación multialélica nos fijamos en el heterocigotos:

➢ El índice f toma valores negativos cuando tenemos un exceso de heterocigotos observados

En definitiva, mediante el test de chi cuadrado sabemos si la desviación es significativa y con el

Posibles causas de desviación de las proporciones HW

Hay otras desviaciones de la panmixia basadas en el fenotipo y entonces se habla de

➢ El apareamiento asociativo es cuando hay apareamiento con mayor probabilidad de lo que

➢ El apareamiento disociativo es todo lo contrario a lo anterior. Es una desviación de la

La cuantificación de la variabilidad genética

De acuerdo a estos criterios, el polimorfismo no es más que el porcentaje de loci polimórficos

Número medio de alelos por locus

pi: frecuencia alélica

Estamos reduciendo la diferencia a 1 de la suma de todos lo homocigotos. Para el cálculo de la

¿Por qué la heterocigosis esperada es preferible a la hora de cuantificar la variabilidad genética

➢ Interpretada como proporción media de heterocigotos que tenemos en una población

➢ Interpretada como a nivel individual. Es la proporción esperada de loci que son

Estos dos valores generalmente coinciden, es decir, la proporción media de heterocigotos en la

preferible que aumente el número de loci examinados a expensas de disminuir el número de

En el caso de alozimas, la diversidad génica para loci alozímicos la podemos observar en la

Si uno va a analizar la variación a través de la secuencia nucleotídica encuentra mucha más

El primer estudio dedicado a analizar la variabilidad genética poblacional a partir de datos de

Si ahora se aplica un estadístico análogo a la diversidad génica como es la diversidad haplotípica,

Se puede considerar la diversidad nucleotídica como una heterocigosis siendo el locus la

El valor de π, se haya en un rango de 0.0001 – 0.01. En el caso de humanos, en una muestra de

También podría gustarte