Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Evaluando Predicciones PDF
Evaluando Predicciones PDF
Presentación por Jane Elith, con aportes deBette Loiselle, Catherine Es el modelo razonable?
Graham y Santiago Burneo
Datos para evaluación
• Datos de modelamiento
• Datos independientes
Jane Elith
Post-doctoral Research Fellow • Remuestreo
The School of Botany x Validación cruzada (cross validation)
The University of Melbourne x Bootstrap
Parkville, 3010 Estadísticas
Victoria, Australia
• Para calibración
Bette Loiselle • Para discriminación
Department of Ecology, Evolution and Systematics
• Para datos binarios (presencia / ausencia)
University of Missouri – St. Louis
1
27/02/2008
Definiciones: Común!
Datos de entrenamiento = datos para No lo haga: sin eficacia predictiva
construir el modelo y estimar los
Fielding and Bell: “cualquier aproximación al
coeficientes modelamiento ecológico tiene poco merito si
Datos de evaluación: datos para evaluar la exactitud de sus predicciones no puede ser
las predicciones o no es evaluada usando datos
independientes”
Siempre es sobre-optimista (el modelo se
ajusta a esos datos)
Para comparaciones entre métodos puede
2
27/02/2008
Estratificado
o repetido para reducir Útil
si no puede automatizar el
variacianza desarrollo del modelo
Valores comunes para k: 5 - 10
• La definición de los tamaños de muestra para PERO, nunca evalúa el modelo
el entrenamiento y la evaluación del modelo
es un aspecto clave construido con un conjunto completo
de datos – pesimista?
• Tienen que haber suficientes datos de
entrenamiento para estimar con confianza el
modelo y suficientes datos de evaluación para Otros
usos: selección de modelos
estimar la estadística de cross-validación con (GRASP)
una precisión razonable
Es
importante si las probabilidades predichas o
En algunas aplicaciones no estamos conteos necesitan estar bien
interesados en ambos aspectos, podemos
querer evaluarlos independientemente Discusión…. Umbrales presencia/ausencia
Se enfoca en datos de presencia/ausencia
3
27/02/2008
N N NN
N NN
• Errores de omisión
N
N • E
Errores de
d comisión
i ió
N NN
N N N N NNNNN NN N • difícil de determinar ausencias
N NN
NNN N • sesgos en muestreo
NN N N
Error de omisión
N • interacciones bióticas
X = presencia
• eventos históricos
N
N
4
27/02/2008
DISTRIBUCIÓN
POTENCIAL
Error de
Cotinga comisión
o
Laniisoma elegans o
71% de la extensión
de rango ocupado o
o
o o
o
o o
Error de
omisión
X = presencia
Área de Distribución
= 364,950 km2 o = ausencia
Falso positivo
+ Correcto
a b (comisión)
c d
Falso negativo
- Correcto
(omisión)
5
27/02/2008
Ardea cinerea
Grey Heron
ausencia presencia
Predicción
presencia a b
ausencia c d
Fracción de falsos negativos (1-especificidad) = b/[b+d] 0.0 0.2 0.4 0.8 1.0
0.6
6
27/02/2008
Umbral
Observado (0.41)
x
presencia ausencia
Umbral
Predicción
presencia a b (0.50) x
ausencia cc d
d
ausencia presencia
presencia
TP= a/[a+c] FP= b/[b+d]
presencia
ausencia
Verdadero positivo Correcto positivo
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
Probabilidad de predicción de ocurrencia Probabilidad de predicción de ocurrencia
Umbral
(0.41) Receiver Operating Characteristic
(ROC) curves
1 •El área bajo la curva
x (AUC) = la probabilidad de
ausencia presencia que la predicción para una
ad (TPF)
observación de presencia
sea mas grande que la
Área bajo la curva (AUC)
Sensitivida
Ejemplo…. Estadísticas:
• Coeficiente de concordancia de Kendall para
0.5: las predicciones no son mejores que al todos los métodos
azar • Entre pares de métodos:
x Rho de Spearman
x Coeficiente asimétrico de Kulczynski's
Varia de 0 a 1 x Extensión de concordancia espacial
7
27/02/2008
Patrones de incertidumbre
Caja de herramientas
Parches geográficos que pueden ser
particularmente dados al error Escoja las que sirvan para su
propósito
Proximidad de errores de predicción a
sitios conocidos de presencia Estimación basada en datos
independientes:
Patronespoco probables en las
predicciones (p.ej. Transiciones abruptas • Absolutamente independientes
entre celdas de alta probabilidad y baja • Remuestreo
probabilidad de presencia)