Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Capítulo
Flujo génico: métodos
para estimarlo y marcadores
moleculares
49
50 Teoría
Métodos directos
Se basan en observaciones o experimentos que miden el grado de dispersión
de gametos o individuos, por ejemplo con la captura y recaptura de individuos
marcados. Puede también hacerse un análisis de parentesco para identificar
padres y después cuantificar el patrón del movimiento de genes. Los análi-
sis de parentesco nos permiten estimar la distribución de las distancias de
dispersión y examinar el movimiento de genes por polen y semilla. Existen
distintos modelos para el análisis de parentesco, pero el modelo general uti-
liza la progenie de madres conocidas para asignar la paternidad a un grupo
de donadores o padres potenciales y así cuantificar el movimiento de genes
(véanse los capítulos 5 y 6 de este libro).
En este sentido, Meagher (1986) presentó un análisis de paternidad en una
población de plantas en el que cuantificó la varianza en el éxito reproductivo
como una función de la distancia. Modificaciones subsecuentes a este método
han sido utilizadas para el estudio del movimiento de genes en poblaciones
(Devlin y Ellstrand, 1990; Roeder et al., 1989; Smouse y Meagher, 1994),
aunque la estimación directa de flujo génico que dan se basa generalmente
en uno o dos episodios reproductivos.
A raíz del uso de los métodos directos, se concluye que en la mayoría de las
especies la dispersión es muy localizada, aunque esto no quiere decir nece-
sariamente que el flujo génico en poblaciones sea muy restringido. Esto se
debe a que se subestima la frecuencia de la dispersión a larga distancia, que
puede ser difícil de detectar, no se toman las extinciones y recolonizaciones
Flujo génico 51
como una fuente de flujo génico y no se detectan eventos raros que pueden
ser importantes (Slatkin, 1985a). Asimismo, las estimaciones de flujo génico
obtenidas con este tipo de datos no pueden ser interpretadas como flujo génico
entre poblaciones, ya que miden la migración en un área determinada que no
es necesariamente una población, y en un periodo dado, por lo que no puede
ser considerado flujo génico en una escala evolutiva. De la misma manera, las
medidas directas de dispersión no necesariamente reflejan el movimiento de
genes, porque no se sabe si el migrante se reproduce exitosamente (Whitlock
y McCauley, 1999).
Sin embargo, al reflejar el flujo génico instantáneo, los métodos directos
aportan detalles, como la etapa de la historia de vida en la que la dispersión
ocurre, que nos dan una idea de las condiciones ecológicas favorables para la
dispersión. Por ello, estos métodos son apropiados para el estudio del movi-
miento de genes en una escala ecológica o fina.
Métodos indirectos
Gracias al desarrollo de técnicas y análisis moleculares, es posible estimar
el flujo génico de una manera detallada y con mayor resolución. Se basan
principalmente en observar la distribución espacial de alelos en las pobla-
ciones para hacer inferencias de los niveles o patrones de flujo génico en las
poblaciones (Slatkin, 1985a).
La mayoría de los modelos teóricos de flujo génico surgen de los conceptos
desarrollados por Sewall Wright y suponen que los organismos están formando
poblaciones discretas -modelo de islas- que se diferencian por mutación y deri-
va génica (Wright, 1943) o bien que forman poblaciones con una distribución
continua -modelos de aislamiento por distancia- en donde la probabilidad de
flujo génico disminuye al incrementarse la distancia espacial.
El modelo usado comúnmente para estimar flujo génico es el modelo de
islas infinitas (infinite islands model) de Wright (1951; figura 1). Este modelo
considera condiciones en equilibrio entre un número infinito de islas o subpo-
blaciones de igual tamaño, que intercambian migrantes entre cualquiera de
las islas con igual probabilidad, a una tasa constante. Las poblaciones pueden
ser tratadas como réplicas, y el modelo se puede caracterizar con sólo dos
parámetros: tamaño poblacional (N) y tasa de migración (m). La importancia
de la deriva génica es proporcional a 1/N, mientras que la importancia del
flujo génico es proporcional a m (Slatkin, 1985a).
52 Teoría
Bajo este modelo, de acuerdo con Wright (1969), una tasa de migración >1
en cada generación es suficiente para contrarrestar la diferenciación genética
debida a deriva génica.
Una medida similar es la propuesta por Crow y Aoki (1984), en la que
existe un número finito de islas (modelo de n-islas), en el que el equivalente
para alelos múltiples de Fst es el parámetro Gst (Nei, 1973) definido como:
Gst ≈ 1/ (4Nmα + 1)
Este modelo asume que las poblaciones están en equilibrio y que las islas
intercambian migrantes entre sí con igual probabilidad a una tasa constante.
Otro modelo relacionado con el flujo génico, como se mencionó ante-
riormente, es el de aislamiento por distancia, que examina la relación del
flujo génico entre pares de poblaciones (M, equivalente a Nm entre pares de
poblaciones) con la distancia geográfica (Slatkin, 1993). Bajo este modelo, los
valores de M se estiman a partir de valores de θ entre pares de poblaciones (que
es una medida de diferenciación entre poblaciones, Weir y Cockerham 1984)
y se aplica una regresión de log10M en log10k (k= distancia geográfica). Para
determinar si existe una relación lineal significativa entre el flujo génico y la
distancia geográfica entre poblaciones se utiliza comúnmente una prueba de
Mantel (1967), ya que los valores de M para los diferentes pares de poblaciones
no son independientes (figura 2).
Figura 2. Gráfica entre k = distancia geográfica entre pares de poblaciones
y M = flujo génico entre pares de poblaciones
2
Log M
1 2 3
Log k
54 Teoría
log10[p(1)] = alog10(Nm) + b
selección local puede aumentar la Fst (Whitlock y McCauley, 1999). Por otro
lado, Slatkin y Barton (1989) encontraron que la Fst en el modelo de islas no
es muy sensible a la selección que favorece a uno o dos alelos, sino que sólo
es importante si diferentes alelos se encuentran favorecidos en distintas lo-
calidades geográficas. El supuesto de que los alelos sean neutros o de que la
selección no esté alterando el índice puede evaluarse por el grado de consis-
tencia entre los diferentes loci a partir de los cuales se obtiene Fst. Si con cada
loci polimórfico se obtiene aproximadamente el mismo valor de Fst, es muy
probable que la selección no esté determinando el valor encontrado.
La tasa de mutación también puede afectar los patrones de diferenciación
genética entre poblaciones. En el caso del estimador Fst éste no es muy sensible
a las tasas de mutación, sólo si los tamaños poblacionales son pequeños (de
1000 o menores) y las tasas de mutación son mucho menores que las tasas de
migración (Crow y Aoki, 1984). En marcadores como microsatélites, las tasas
de mutación pueden ser muy altas, lo que puede disminuir Fst y sobreestimar
Nm (Hedrick, 1999). Para resolver este problema, Slatkin (1991) definió Fst en
términos de tiempos de coalescencia entre alelos y desarrolló el índice Rst, que
es relativamente insensible a tasas de mutación y más apropiado para loci que
mutan en forma de paso a paso (step-wise model). Sin embargo, Rst tiene una
mayor varianza que otras medidas de diferenciación entre subpoblaciones y es
muy sensible a violaciones del modelo de mutación paso a paso (Gaggiotti et al.,
1999), por lo que no es claro si en la práctica ofrece ventajas sobre Fst, incluso con
marcadores que teóricamente se ajustan al modelo de mutación paso a paso.
Otro problema en relación a la estimación de Fst , es el del equilibrio. El
tiempo en generaciones requerido para que Fst esté cerca del equilibrio es
1/[2m+1/(2N)], donde m es la tasa de migración y N es el tamaño poblacional
(Crow y Aoki, 1984). Cuando no hay flujo génico (m=0), el tiempo prome-
dio requerido para el equilibrio sería 2N. Si existieron poblaciones grandes
que estuvieron históricamente en contacto y que actualmente se encuentran
aisladas, estarían fijadas para distintos alelos en el equilibrio, pero el tiempo
requerido para aproximarse a ese equilibrio podría ser mayor a la edad de la
mayoría de estas especies. Esto también podría ocurrir si los sitios muestrea-
dos han sido recientemente colonizados y por lo tanto las poblaciones todavía
no estarían en equilibrio. En estos casos, los estimados darían estimaciones
de flujo génico diferentes de cero aún entre especies que han estado aisladas
reproductivamente durante mucho tiempo (Niegel, 2002).
El modelo de islas es una abstracción conveniente que aísla los efectos
opuestos de deriva génica y flujo génico, y aunque Fst no siempre da estima-
56 Teoría
Métodos genealógicos
La distribución de la variación genética en poblaciones está fuertemente in-
fluenciada por las fuerzas microevolutivas que están actuando, como el flujo
génico y la selección, así como por la historia filogenética de las poblaciones y las
especies (Schaal et al., 2003). Es por ello que el uso de estadísticos tradicionales
para determinar la estructura de las poblaciones, como los que se mencionaron
anteriormente, no toman en cuenta las relaciones evolutivas entre los alelos y
no permiten distinguir entre efectos históricos y procesos recurrentes.
Muchas secuencias de ADN cuentan con una alta variación molecular
neutral que puede ser utilizada para reconstruir su genealogía. En este con-
texto, el uso de secuencias para inferir procesos evolutivos en el pasado a nivel
poblacional, ha sido enriquecido por el concepto de filogeografía propuesto
por Avise (1994; véase el capítulo 14 de este libro), que examina la distribución
de la genealogía de alelos o haplotipos en un contexto geográfico, utiliza la
información histórica contenida en los genes y caracteriza la subdivisión de
poblaciones al reconocer patrones geográficos de la estructura genealógica a
lo largo del rango de distribución de una especie.
A nivel poblacional es preferible el uso de redes de haplotipos en lugar de
árboles filogenéticos, ya que la inferencia cladística de relaciones filogenéticas
Flujo génico 57
apoyen mejor los datos. Antes, estos métodos asumían una forma particular
de la distribución de las frecuencias alélicas entre poblaciones, pero más re-
cientemente se han calculado con base en modelos de coalescencia. Beerli y
Felsenstein (1999, 2001) desarrollaron un método que estima simultáneamente
los tamaños efectivos de muchas poblaciones, así como las tasas de migración
entre cada par de poblaciones. Este método puede implementarse con el
programa MIGRATE. Hay otros métodos para inferir cambios históricos en
la estructura poblacional que serán más apropiados que Fst, para estimar el
flujo génico entre poblaciones grandes que actualmente experimentan niveles
bajos de flujo génico.
Bibliografía
Avise, J.C. 1994. Molecular markers, natural history and evolution. Chapman and
Hall, NY.
———. 2000. Phylogeography: The History and Formation of Species. Harvard University
Press, Cambridge Ma.
Beerli, P. y J. Felsenstein. 1999. Maximum-likelihood estimation of migration rates
and effective population numbers in two populations using a coalescent approach.
Genetics 152:763-773.
———. 2001. Maximum likelihood estimation of a migration matrix and effective
population sizes in n subpopulations by using a coalescent approach. Proceedings
of the National Academy of Sciences USA 98:4563-4568.
Clement, M., D. Posada, K. Crandall. 2000. TCS: a computer program to estimate
gene genealogies. Molecular Ecology 9:1657-1660.
Crow, J.F. y K. Aoki. 1984. Group selection for a polygenic behavioural trait: estima-
ting the degree of population subdivision. Proceedings of the National Academy
of Sciences USA 81:607.
Devlin, B. y N.C. Ellstrand. 1990. The development and application of a refined
method for estimating gene flow from angiosperm paternity analysis. Evolution
44:248-259.
Gaggiotti, O.E., O. Lange, K. Rassmann, C. Gliddon. 1999. A comparison of two
indirect methods for estimating average levels of gene flow using microsatellite
data. Molecular Ecology 7:1513-1520.
Hedrick, P.W. 1999. Perspective: Highly variable loci and their interpretation in evo-
lution and conservation. Evolution 53:313-318.
Levin, D.A. 1981. Dispersal versus gene flow in plants. Annals of Missouri Botanical
Garden 68:233-253.
60 Teoría
Templeton, A.R. 1998. Nested clade analyses of phylogeographic data: testing hypo-
theses about gene flow and population history. Molecular Ecology 7:381-397.
———. 2004. Statistical phylogeography: methods of evaluating and minimizing
inference errors. Molecular Ecology 13:789-809.
Templeton, A.R., E. Boerwinkle, C.F. Sing. 1987. A cladistic analysis of phenotypic
associations with haplotypes inferred from restriction endonuclease mapping.
I. Basic theory and an analysis of alcohol dehydrogenase activity in Drosophila.
Genetics 117:343-351.
Templeton, A.R., E. Routman, C. Phillips. 1995. Separating population structure
from population history: a cladistic analysis of the geographical distribution of
mitochondrial DNA haplotypes in the Tiger salamander, Ambystoma tigrinum.
Genetics 140:767-782.
Whitlock, M.C. y D.E. McCauley. 1999. Indirect measures of gene flow and migration:
FST not equal to 1/(4Nm + 1). Heredity 82:117-25.
Weir, B.S. y C.C. Cockerham. 1984. Estimating F-statistics for the analysis of popu-
lation structure. Evolution 38:1358-1370.
Wright, S. 1943. Isolation by distance. Genetics 28:114-138.
———. 1951. The genetical structure of populations. Annals of Eugenics 15:323-354.
———. 1969. Evolution and Genetics of Populations, vol.2, The theory of gene frequencies.
University of Chicago Press, Chicago.
Tamaño efectivo de la población 63
Capítulo
Tamaño efectivo
de la población
El tamaño efectivo poblacional fue mencionado por primera vez por S. Wright
en su trabajo sobre deriva génica, en el que considera a éste como el factor
determinante de la tasa de decaimiento de la heterocigosis: el número de
heterocigotos en una población disminuirá a una tasa de (½N), donde N es
el tamaño poblacional (Wright, 1930).
En el proceso de deriva génica, los alelos presentes en un momento dado
en una población de individuos diploides son sólo una muestra de los alelos
presentes en la generación previa, ya que algunos de ellos no fueron transmi-
tidos a la siguiente generación únicamente por azar, y así sucesivamente hacia
el pasado (Futuyma, 1986). Con el paso del tiempo, las siguientes generaciones
presentarían cada vez menos copias de los alelos originales y cada vez los indi-
viduos se volverían más homócigos, aumentando también la probabilidad de
que sus alelos sean idénticos por descendencia (ver capítulo 6). En este proceso
gobernado por el azar, la pérdida de heterocigocis va también acompañada
de cambios en las frecuencias alélicas, ya que un alelo que por azar deje más
descendencia aumentaría su frecuencia en la población.
Puede entonces considerarse que la probabilidad de que un alelo esté
representado en la siguiente generación por i número de copias, depende
del número de copias total (2N, donde N es el tamaño de la población) de la
generación parental y las frecuencias de los alelos. Eventualmente el muestreo
azaroso de alelos de una generación a otra llevará a la fijación de una de las
63
64 Teoría
Endogamia
Un problema de los primeros índices del tamaño efectivo fue que muchos de
los parámetros eran difíciles de estimar en campo, además de que no consi-
deraban la migración, las diferencias en historias de vida de las especies o la
estructuración poblacional (ver capítulo 2). A partir de esos primeros índices
se han desarrollado muchos otros, con grados variables de complejidad, que
pueden lidiar con una o varias violaciones al modelo de población ideal. Es
muy importante considerar que la eficacia y la exactitud de estos métodos
dependen de la información disponible para las poblaciones y de la historia
natural particular de la especie que se esté trabajando.
Estructura de edades
Ne=NrL
Ne=NoLi
1 1 Nm Nm
= [ 2 + var (X mm
) +2 (
Nf
) cov(Xmm,mf ) + ( )2 var (Xmf )]+
Nf
NeA 16Nm
N
1
[ 2 + var (Xff) +2 ( N f ) cov(Xfm,ff) + ( NNf )2 var (Xfm)]
16Nf m m
68 Teoría
Ne = Nk -1
(k -1 ) + Vkk
4N - 4
Nlrs =
Svlrs
2
+2
Método de Orive
Método de Nunney
Calcula el cociente del tamaño efectivo entre el tamaño censal (Ne/N) de una
población y utiliza datos demográficos. Es necesario que la especie en cues-
tión cumpla con los supuestos de apareamiento aleatorio (panmixia), que la
sobrevivencia de machos y hembras sea independiente después de la madurez
sexual, que el éxito reproductivo tenga una distribución de Poisson y que la
proporción de adultos que intenta reproducirse sea conocida.
Ne 4r(1-r)T
=
N rAf(1+IAf ) + (1-r) Am (1 + Am) + (1 - r= Ibm + rIbf
Nv = [ 1
]
(1 + F) (sb2 ⁄Xb2) + 1
N
Ne = 2 π Vd
Métodos indirectos
Como vimos anteriormente, se pueden obtener estimados de Ne con métodos
ecológicos utilizando información demográfica. Estos estimados nos dan
como resultado el tamaño efectivo actual, en tiempo ecológico (instantáneo) y
muchas veces, de una generación a otra. Por su parte, los estimados de tamaño
efectivo con métodos genéticos son un promedio a lo largo de un periodo
de tiempo que está determinado por la tasa de mutación por generación del
locus bajo estudio (Beerli y Felsentein, 1999).
Otros métodos pueden estimar los tamaños efectivos a corto plazo al ana-
lizar los efectos de la deriva génica sobre las medidas genéticas, ya que si el
tamaño efectivo histórico de la población ha sido pequeño, se espera encontrar
más evidencia de deriva génica, mientras que si el tamaño efectivo ha sido
grande no se obtendrá mucha señal de deriva en los datos (Hedrick, 2000).
Pueden entonces compararse con diversos métodos los datos reales con lo
esperado por deriva génica para estimar el tamaño efectivo de la población.
A continuación enlistamos los más utilizados:
72 Teoría
Estimados basados en F st
2Var (pi)
FST =
1 - Gt
γ= 4Nem
γ = θiMi = 4Ne(i)mi
aT
Pasado (t=T)
af a0 Tiempo (t)
Genealogía
Presente (t=0)
Para un locus, cada una de las muestras representa un vector (a0 y aT), de
n0 y nT cromosomas con k alelos distintos. Para el número de alelos distintos
se considera el total de los observados en las muestras, donde cada una de las
muestras tiene <k alelos (k0 y kT). Se supone que las muestras son indepen-
dientes con probabilidades p(aT|nT, k, x) y p(a0|t, Ne, n0, k, x), donde Ne es el
tamaño efectivo de la población y x es la frecuencia genética paramétrica al
tiempo T. Las muestras en cada loci m también se suponen independientes
y por lo tanto, su verosimilitud general sería L (T, Ne, x1, x2, ..., xm), que se
obtiene multiplicando las probabilidades a través de todas las muestras y a
través de todos los loci (Berthier et al., 2002). También se utiliza el algoritmo
Metropolis-Hastings para integrar xi. Cabe hacer notar que este método no
funciona en presencia de migración, pero sí tiene mayor precisión que los
métodos basados en Fst (Berthier et al., 2002).
76 Teoría
^ 1 2
Ne = ∑ i (i-1)ti
2(n -1) i =2
Métodos de coalescencia
t=
ln
r [
1-
n(n - 1) ]
(2rN ln(1 - P))
1
NeA
≈
4 {
(1+F) 1 1
+ +
Nf Nm
(1-c)2 Δ Vf c2 ΔVf
Nf
+
Nm }
y para genes con herencia materna:
1 2 [1+ (1 - c)2 Δ Vf ]
≈
NeA Nf
donde ∆Vf y ∆Vm son los excesos sobre una distribución de Poisson del total de
progenie per capita para hembras y machos respectivamente; F es el coeficiente
de endogamia; Nf y Nm el número de hembras y machos; y c es la proporción
de machos en los adultos reproductivos (Laporte y Charlesworth, 2002).
Cabe hacer notar que este método, aunque basado en coalescencia, requiere
ciertos datos demográficos para estimar las probabilidades de coalescencia
y las desviaciones a la distribución de Poisson en la progenie. Sin embargo,
es bastante versátil porque permite el cálculo de la coalescencia y de tamaño
efectivo para distintos escenarios y con diferentes tipos de datos, además de
que es más adecuado que los métodos clásicos de Fst para estimar tamaños
efectivos en presencia de migración específica a un sexo (p.ej. filopatría) y de
fuerte diferenciación entre subpoblaciones (Laporte y Charlesworth, 2002).
Implicaciones evolutivas
Dado que la variación genética es la materia prima sobre la cual puede actuar
la selección natural y dar origen a adaptaciones, se ha llegado a considerar
su presencia como indicador de la buena “salud” de una población, mientras
que su ausencia limitaría la capacidad de respuesta de una población a un
medio cambiante en el corto y largo plazo (Amos y Harwood, 1998; véase
el capítulo 8 de este libro). Como se mencionó al inicio de este capítulo, el
tamaño efectivo de la población determina la tasa de pérdida de esta variación
por deriva génica, fenómeno que puede calcularse es:
Ht= H0 (1-1/2Ne)t
Aplicaciones
A pesar de la vaga definición del tamaño efectivo de una población existen
numerosas aplicaciones de este concepto en la literatura. Entre las más im-
82 Teoría
Filogeografía
Epidemiología
Conclusión
El concepto de tamaño efectivo de la población, a pesar de ser un poco vago
y a veces hasta oscuro, ha resultado muy útil en la biología, no sólo por sus
aplicaciones sino también por su papel en el desarrollo de modelos teóricos
como la coalescencia o la teoría neutral de evolución molecular, que actual-
mente constituyen la base de disciplinas como la filogeografía y la sistemática
molecular que representan nuevas formas de contestar las preguntas clásicas
de la biología evolutiva.
Es necesario el desarrollo de más y mejores métodos para calcular el ta-
maño efectivo poblacional, sobre todo que incorporen con mayor flexibilidad
las características de las especies en su estado natural, relajando los supuestos
y utilizando métodos con mayor poder estadístico que puedan lidiar con la
incertidumbre de más parámetros. Esto es aplicable principalmente a los
métodos genéticos, porque la inferencia del tamaño efectivo de la población
es indirecta y depende mucho del modelo en el cual se basa. Por otra par-
84 Teoría
Bibliografía
Amos, W. y J. Harwood. 1998. Factors affecting levels of genetic diversity in natural
populations. Phylosophical Transactions of the Royal Society of London 353:177-
186.
Antolin, M.F., B. Van Horne, M.D. Berger Jr., A. K. Holloway, J.L. Roach y R.D. Weeks
Jr. 2001. Effective population size and genetic structure of Piute ground squirrel
(Spermophilus mollis) population. Canadian Journal of Zoology 79:26-34.
Avise, J. 2000. Phylogeography. The history and formation of species. Harvard University
Press.Cambridge Mass.
Barrowclough, G.F. y R.F. Rockwell. 1993. Variance in lifetime reproductive success:
estimation based on demographic data. American Naturalist 141:281-295.
Beerli, P. y J. Felsenstein. 1999. Maximum-likelihood estimation of migration rates
and effective population numbers in two populations using a coalescent approach.
Genetics 152:763-773.
Berthier, P., M. A. Beaumont, J.M. Cornuet y G. Luikart. 2002. Likelihood-based
estimation of the effective population size using temporal changes in allele fre-
quencies: a genealogical approach. Genetics 160:741-751.
Charlesworth, B. 2001. The effect of life history and mode of inheritance on neutral
genetic variability. Genetic Research 77:153-166.
Cherry, J.L. 1998. Should we expect substitution rate to depend on population size?
Genetics 150:911-919.
Crow, J.F. y M. Kimura. 1970. An introduction to population genetic theory. Harper
& Row. Nueva York.
Cruzan, M.B. 2001. Population size and fragmentation thresholds for the maintenance
of genetic diversity in the herbaceous endemic Scutellaria montana (Lamiaceae).
Evolution 55:1569-1580.
Tamaño efectivo de la población 85