Está en la página 1de 2

PARCIAL 2- ESTADISTICA AVANZADA

NATALIA VANEGAS TORRES

PUNTO 1
Al realizar un modelo de regresión múltiple para este estudio, podemos notar que
los indicadores tanto de desviación estándar como media no son muy útiles en este
caso, puesto que cada especie se encuentra separada por lo cual la media será
igual a la cantidad de especies e igualmente por esta última razón la desviación
estándar no será muy eficaz en el estudio.
Al realizar gráficos como el boxplot podemos notar que no son de gran utilidad ya
que solo muestran donde se encuentra cada especie dependiendo de la variable
elegida como en el código las cuales son Area y Endemics.
Tambien realizamos un modelo ANOVA, empezando por la primera variable
Endemics hasta llegar a la última variable.

Posteriormente se realiza AIC para poder elegir cuales o cual es el mejor modelo.

Al observar los resultados obtenidos, podemos decir que los mejores modelos son
mod1(Endemics) y mod3(Endemic+Area+Elevation).
Ahora pasa saber que modelo es mejor se realiza un modelo de regresión Lm y se
observa el R^2 tanto del mod1 como del mod2, siendo estos,0.9426 y 0.9492
correspondientemente, siendo el modelo 3 el mejor.

Por lo cual podemos decir que las variables que mejor permiten explicar el número
de especies son: Endemics, Area y Elevation.
PUNTO 2
Para saber si la presencia de satélites en este caso depende de ciertas
características realizaremos un modelo lineal múltiple.
Al realizar los indicadores de media y desviación podemos ver que ambos
indicadores son mayores si se cuenta con satélites por lo cual podemos decir que
estas características son significativas
Posteriormente realizamos un ANOVA en el cual evaluaremos cada característica
tanto individuales como juntas
Al realizar el AIC podemos decir que los mejores modelos son:

PUNTO 4
Regresión gamma
Esta distribución es recomendable usarla en el análisis de variables aleatorias
con asimetría positiva
Regresión Poisson
Es utilizada para modelar el número de ocurrencias de un evento en un
determinado tiempo.
Ejemplo: El número de homicidios en una ciudad en un determinado periodo
de tiempo.
Regresión binomial negativa
Es utilizada cuando se repite un determinado evento hasta conseguir un
resultado favorable, es decir la variable dependiente Y consiste de conteos.
Regresión logística
Es utilizada para predecir el resultado de una variable categórica en función
de variables independientes o predictorias.

También podría gustarte