Documentos de Académico
Documentos de Profesional
Documentos de Cultura
de Galápagos) constituyen un archipiélago del océano Pacífico ubicado a 1000 km de la costa de Ecuador. Está conformado
por trece islas grandes con una superficie mayor a 10 km², seis islas medianas con una superficie de 1 km² a 10 km² y otros
215 islotes de tamaño pequeño, además de promontorios rocosos de pocos metros cuadrados, distribuidos alrededor de
la línea del ecuador terrestre, que conjuntamente con el Archipiélago Malayo, son los únicos archipiélagos del planeta que
tienen tierras tanto en el hemisferio norte como en el hemisferio sur.
Se analizaron varias especies de tortugas en las Islas Galápagos. Las siguientes variables fueron medidas:
Species: Número de especímenes de esa especie encontradas en la isla
Endemics El número de especies endémicas
Elevation: La altitud más alta de la isla (metros)
Nearest: La distancia de la isla más cercana (km)
Scruz: La distancia a la isla de Santa Cruz (km)
Adjacent: El área de la isla (km2)
El objetivo del estudio es ver el comportamiento cómo el número de especímenes de las tortugas es afectado por las
demás variables en estudio.
Species
positiva entre Species y
0
Endemics
40 80
Endemics
0
Area
se observa una relación línea
positiva entre Species y
1000
Elevation
Elevation
0
20 40
Nearest
0
0 100 250
Scruz
0 2000
Adjacent
Hipótesis
Valor p= 0.05
α= 0.01
Hipótesis
Valor p=0.02
α= 0.01
Supuesto de independencia
Gráfica Conclusión
si se cumple el supuesto de
4
0
-2
0 5 10 15 20 25 30
1:n
4. Aplica el método de selección hacia adelante para encontrar el mejor modelo. Escribe el modelo resultante en
cada paso. Da el modelo resultante ajustado
Modelo inicial 𝑌 = 𝛽0
Paso 1 𝑌 = 𝛽0 + 𝛽1 𝑋1
Paso 2
Paso 3
Paso 4
5. Aplica el método de eliminación hacia atrás para encontrar el mejor modelo. Escribe el modelo resultante en
cada paso. Da el modelo resultante ajustado
Modelo inicial 𝑌 = 𝛽0 + 𝛽1 𝑋1 + 𝛽2 𝑋2 + 𝛽3 𝑋3 + 𝛽4 𝑋4 + 𝛽5 𝑋5
Paso 1 𝑌 = 𝛽0 + 𝛽1 𝑋1 + 𝛽2 𝑋2 + 𝛽3 𝑋3 + 𝛽5 𝑋5
Paso 2 𝑌 = 𝛽0 + 𝛽1 𝑋1 + 𝛽3 𝑋3 + 𝛽5 𝑋5
Paso 3 𝑌 = 𝛽0 + 𝛽1 𝑋1 + 𝛽5 𝑋5
Paso 4 𝑌 = 𝛽0 + 𝛽1 𝑋1
6. Aplica el método de selección paso a paso para encontrar el mejor modelo. Escribe el modelo resultante en cada
paso. Da el modelo resultante ajustado
Modelo inicial 𝑌 = 𝛽0
Paso 1 𝑌 = 𝛽0 + 𝛽1 𝑋1
Paso 2
Paso 3
Paso 4
𝑀𝑜𝑑𝑒𝑙𝑜 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑛𝑡𝑒 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜: 𝒚̂ = 𝟐𝟏. 𝟎𝟓 + 𝟒. 𝟎𝟕𝑿𝟏
Utiliza el modelo de regresión obtenido por el método de selección paso a paso para contestar las siguientes
preguntas
7. Verifica si el modelo de regresión múltiple es significativo. Utiliza una confianza del 99%
Hipótesis
Estadístico de prueba:459.8
Intercepto Endemics
Hipótesis 𝑯𝒐: 𝜷𝟎 = 𝟎 𝑯𝒐: 𝜷𝟏 = 𝟎
𝑯𝒂: 𝜷𝟎 ≠ 𝟎 𝑯𝒂: 𝜷𝟏 ≠ 𝟎
Estadístico de
-2.96 21.44
prueba
Valor p
< 2x10-16
0.006
Conclusión Se rechaza Ho
Se rechaza Ho
10. ¿Cuánto porcentaje de los datos permite explicar el modelo de regresión obtenido?
Al 94.26 %
0
-2
Yest
Si, hay 4 datos influyentes (Isabela, San Salvador, Santa Cruz, Santa María)
####################################
# Lectura de datos
####################################
data(gala)
datos<-gala
datos
####################################################
# Realiza el diagrama de dispersion
#####################################################
plot(datos)
#############################################
# Recta de regresion
#############################################
regresion<-lm(Species~Endemics+Elevation+Nearest+Scruz+Adjacent, data=datos)
#######################################
# Analisis de residuales
######################################
#######################################
# Residuales
######################################
Yest<-fitted(regresion)
residuales<-residuals(regresion)
r.estandarizados<-rstudent(regresion)
### Homocedasticidad
#Graficas
par(mfrow=c(2,1))
plot(Yest, residuales)
plot(Yest, r.estandarizados)
abline(h=c(-3,3), col="red")
#Test de Breusch-Pagan
library(lmtest)
bptest(regresion)
### Independencia
#Grafica
n=30
plot(1:n,r.estandarizados, type="l")
abline(h=0, col="red")
### Normalidad
#Graficas
par(mfrow=c(1,2))
hist(residuales)
qqnorm(residuales)
qqline(residuales)
#Test de Shapiro-Wilk
shapiro.test(residuales)
##################################################################
##################################################################
# Metodos de seleccion
##################################################################
##################################################################
library("MASS")
#Modelo completo
mod.c<- lm(Species~Endemics+Elevation+Nearest+Scruz+Adjacent, data=datos)
###################################################
# Recta de regresion con variables seleccionadas
# por algun metodo de seleccion
################################################
regresion<-lm(Species~Endemics, data=datos)
summary(regresion)
##########################################
# Tabla ANOVA
########################################
calculos<-aov(regresion)
calculos
anova(calculos)
#####################################
# Datos atipicos
#####################################
Yest<-fitted(regresion)
r.estandarizados<-rstudent(regresion)
plot(Yest, r.estandarizados)
abline(h=c(-3,3), col="red")
#####################################
# Datos influyentes
#####################################
influence.measures(regresion)