Documentos de Académico
Documentos de Profesional
Documentos de Cultura
EIMA UAGro Ext PDF
EIMA UAGro Ext PDF
observaciones de presencias
1a Escuela de Invierno en Matematicas Aplicadas
Maestra en Matematicas Aplicadas (UAGro)
Colegio de Postgraduados
Noviembre 2015
Contenido
1 Introduccion
2 Objetivos
3 Antecedentes
4 Materiales y Metodos
5 Resultados
6 Conclusiones
7 Bibliografa
Introduccion
Los Los Modelos de Distribucion de Especies (MDEs) son un tema de
investigacion central en ecologa. Permiten el estudio de la distribucion
geografica de especies de flora y fauna.
espec
sergiop@colpos.mx (COLPOS) MDEs Noviembre 2015 3 / 34
Introduccion
Introduccion
Objetivos
Componentes de un MDE
Maxent
Propuesto por Phillips et al. (2004), hace uso del principio de maxima en-
tropa.
Se desea estimar Pr (y = 1|z) mediante
f1 (z)Pr (y = 1)
Pr (y = 1|z) = (1)
f (z)
donde
f (z) fdp de las covariables en
D (o una m.a. del
background).
f1 (z) fdp de las cov., donde la
especie y = 1.
Pr (y = 1) es la prevalencia.
sergiop@colpos.mx (COLPOS) MDEs Noviembre 2015 9 / 34
Antecedentes
Maxent. . .
Maxent resuelve:
e(z)r
Pr (y = 1 | z) = (2)
1 + e(z)r
que se denomina salida logstica. donde
f1 (z)
= e(z) (z) = + h(z)
f (z)
R
constante de normalizacion que asegura f1 (z)dz = 1
Maxent minimiza la distancia entre f1 (z) y f (z), entropa relativa.
MaxBayes
Construyendo el modelo
MaxBayes
Construyendo el modelo. . .
() fdp de x
() fdp de y.
La fdp condicional (x|y = 1) es:
(y = 1|x)(x)
(x|y = 1) = (3)
(y = 1)
donde (y = 1|x) = Pr (y = 1|x)
Considerese que X es discreto, con M elementos unicos equiprobables,
1
(x) = M .
(y = 1|x)(x)
(x|y = 1) = P (4)
xX (y = 1|x)(x)
MaxBayes
Funcion de verosimilitud
(y = 1|x)
(x|y = 1) = P (5)
xX (y = 1|x)
MaxBayes
kernel a posteriori
N M (0 , V0 )
Aplicando el teorema de Bayes e ignorando los terminos que no involucre a
se tiene que:
n
Y (yi = 1|z); )
p ( | yi = 1, z)) P
i=1 xX (yi = 1|z); )
1 0 1
exp ( 0 ) V0 ( 0 ) (8)
2
IPPBayes
IPPBayes. . .
n1 presencias, wi D para i = 1, . . . , n1 .
n0 observaciones de background, wi para i = n1 + 1, . . . , n1 + n0 .
La funcion de intensidad se define como : D [0, ).
Para cualquier A D se tiene que
Z
(A) = (w)dw
A
IPPBayes. . .
funcion de log-verosimilitud
IPPBayes. . .
modelo en espacio discreto
IPPBayes
kernel a posteriori
|D| X 0
Y 0
p( | y) exp ez ez
n0
i:yi =0 i:yi =1
1 0 1
exp ( 0 ) V0 ( 0 ) (12)
2
sergiop@colpos.mx (COLPOS) MDEs Noviembre 2015 19 / 34
Materiales y Metodos
Simulacion de datos
Generacion de datos presencia-ausencia.
D, compuesta por 10, 000 celdas.
Dos covariables z1 N (0, 1) y z2 N (0, 1).
pi
log( 1p i
) = 0 + 1 z1 + 2 z2
0 = 1, 1 = 2, 2 = 2
yi Ber(1, pi ) Prevalencia de 0.38.
Implementacion MaxBayes e IPPBayes a partir de (8) y (12)
m.a. de tamanos 2000, 1000 y 100.
background, las 10000 celdas.
N M (0, V0 ), donde = (0 , 1 , 2 )0 son los parametros
asociados al intercepto y a las covariables z1 y z2 simuladas, y
5
10 0 0
V0 = 0 105 0 .
0 0 105
sergiop@colpos.mx (COLPOS) MDEs Noviembre 2015 20 / 34
Materiales y Metodos
Reserva de la biosfera
Tehuacan-Cuicatlan.
Distribucion a posteriori
MCMC
Resultados Simulacion
MaxBayes
Resultados Simulacion
IPPBayes
Figura : Distribucion potencial del genero Dalea obtenidos mediante los modelos
Maxent, MaxBayes e IPPBayes.
Algunas consideraciones. . .
Conclusiones
Conclusiones . . .
Bibliografa I
Chivers, C. (2012). MHadaptive: General Markov Chain Monte Carlo for Bayesian Inference using
adaptive Metropolis-Hastings sampling. R package version 1.1-8.
Fithian, W. and Hastie, T. (2013). Finite-sample equivalence in statistical models for presence-
only data. Annals of Applied Statistics, 7:19171939.
Gelman, A. and Rubin, D. (1992). Inference from iterative simulation using multiple sequences.
Statistical Sciencie, 7:457511.
Mendez, L., Ortiz, E., and Villasenor, J. (2004). Las Magnoliophyta endemicas de la porcion
xeroftica de la provincia florstica del Valle de Tehuacan-Cuicatlan, Mexico. Anales del Instituto
de Biologa. UNAM. Serie Botanica, 75(1):87104.
Phillips, S., Dudik, M., and Schapire, R. (2004). A Maximum Entropy Approach to Species
Distribution Modeling. Preceedings of the Twenty-Firts International Conference on Machine
Learning, pages 18.
Plummer, M., Best, N., Cowles, K., and Vines, K. (2006). CODA: Convergence Diagnosis and
Output Analysis for MCMC. R News, 6(1):711.
Royle, J., Chandle, R. B., Yackulic, C., and Nichols, J. (2012). Likelihood analysis of species
occurrence probability from presence-only data for modelling speciesdistributions. Methods in
Ecology and Evolution, 3:545554.
Warton, D. and Shepherd, L. (2010). Poisson Point Process Models solve the Pseudo-absence
problem for presence-only data in ecology. The Annals of Applied Statistics, 4:13831402.