Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Junio de 2019
Unidad 3 - Estadística inferencial
En clase anterior. . .
I Estadísitca descriptiva
I Estadística inferencial
I Definición
I Teorema del límite central
I Intervalos de confianza
Unidad 3 - Estadística inferencial
Estadística inferencial
I Se encarga de:
0.04
0.03
Densidad
0.02
Inferir
0.01
Preveer
0.00
0 50 60 100
Predecir Muestra Dist. normal
Apoyar estadísticos
I Medidas de:
I Tendencia media
Apoyar probablidades
I Dispersión
I Por medio de:
I Teorema del límite central
I Intervalos de confianza
I Medición de error
I Contraste de hipótesis
Unidad 3 - Estadística inferencial: error
O su equivalente:
Selección H0 NO embarazada H1 embarazada
No embarazada No hay error (VN) Error tipo II (β, FN)
Si embarazada Error de tipo I (α, FP) No hay error (VP)
Unidad 3 - Estadística inferencial: valor p (significancia)
60
pearson.test(datos$x)$p.value
## [1] 1.536205e-295
30
sf.test(datos$x)$p.value
0
## [1] 2.041176e-15
4 5 6
Magnitud de terremotos en Fiji desde 1964 (Richter Magnitude)
7 ¿Realmente sigue una distribución normal?
Unidad 3 - Estadística inferencial: prueba de normalidad
ad.test(datos$x)$p.value
Media
90 ## [1] 0.6699376
cvm.test(datos$x)$p.value
Frecuencia absoluta
60
## [1] 0.7038757
pearson.test(datos$x)$p.value
## [1] 0.1899551
30
sf.test(datos$x)$p.value
0
4 5 6
Magnitud de terremotos en Fiji desde 1964 (Richter Magnitude)
7 ## [1] 0.7782661
¿Realmente sigue una distribución normal?
Unidad 3 - Estadística inferencial: homocedasticidad
I Bartlett Test
I Breusch Pagan Test
I Score Test
I F Test
Unidad 3 - Estadística inferencial
Estadística inferencial
I Se encarga de:
0.04
0.03
Densidad
0.02
Inferir
0.01
Preveer
0.00
0 50 60 100
Predecir Muestra Dist. normal
Apoyar estadísticos
I Medidas de:
I Tendencia media
Apoyar probablidades
I Dispersión
I Por medio de:
I Teorema del límite central
I Intervalos de confianza
I Medición de error
I Contraste de hipótesis
Unidad 3 - Estadística inferencial: pruebas para contraste
Unidad 3 - Estadística inferencial: conjunto de prueba
airquality: daily air quality measurements in New York, May to September 1973.
36 118 8.0 72 5 2
90
12 149 12.6 74 5 3
18 313 11.5 62 5 4
NA NA 14.3 56 5 5
28 NA 14.9 66 5 6 80
Ozono
70
60
5 7
Meses
Unidad 3 - Estadística inferencial: prueba de ANOVA
I Es una prueba paramétrica.
I Permite comparar medias #Realización de ANOVA
anova=aov(Temp ~ as.factor(Month),
data = airquality,)
summary(anova)
## Df Sum Sq Mean Sq F value Pr(>F)
## as.factor(Month) 4 7061 1765.3 39.85 <2e-16 *
## Residuals 148 6557 44.3
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.'
#Análisis Post hoc
#Comparar todos los meses TukeyHSD(anova)
kable(head(airquality)) ## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
Ozone Solar.R Wind Temp Month Day ## Fit: aov(formula = Temp ~ as.factor(Month), data = a
##
41 190 7.4 67 5 1 ## $`as.factor(Month)`
36 118 8.0 72 5 2 ## diff lwr upr p adj
12 149 12.6 74 5 3 ## 6-5 13.55161290 8.84386422 18.259362 0.0000000
18 313 11.5 62 5 4 ## 7-5 18.35483871 13.68583759 23.023840 0.0000000
NA NA 14.3 56 5 5 ## 8-5 18.41935484 13.75035372 23.088356 0.0000000
28 NA 14.9 66 5 6 ## 9-5 11.35161290 6.64386422 16.059362 0.0000000
## 7-6 4.80322581 0.09547713 9.510974 0.0430674
## 8-6 4.86774194 0.15999325 9.575491 0.0388654
## 9-6 -2.20000000 -6.94617992 2.546180 0.7038121
## 8-7 0.06451613 -4.60448499 4.733517 0.9999995
## 9-7 -7.00322581 -11.71097449 -2.295477 0.0006215
## 9-8 -7.06774194 -11.77549062 -2.359993 0.0005376
Unidad 3 - Estadística inferencial: prueba de ANOVA
Tasa
##
## $`as.factor(Month)`
70
## diff lwr upr p adj
## 6-5 13.55161290 8.84386422 18.259362 0.0000000
## 7-5 18.35483871 13.68583759 23.023840 0.0000000
60
## 8-5 18.41935484 13.75035372 23.088356 0.0000000
## 9-5 11.35161290 6.64386422 16.059362 0.0000000
## 7-6 4.80322581 0.09547713 9.510974 0.0430674
5 6 7 8 9
Meses
90
1 41 190 7.4 67 5 1 80
2 36 118 8.0 72 5 2
3 12 149 12.6 74 5 3
Ozono
4 18 313 11.5 62 5 4
7 23 299 8.6 65 5 7 70
8 19 99 13.8 59 5 8
60
5 7
Meses
Unidad 3 - Estadística inferencial: prueba de KW
1 41 190 7.4 67 5 1
2 36 118 8.0 72 5 2
3 12 149 12.6 74 5 3
4 18 313 11.5 62 5 4
7 23 299 8.6 65 5 7
8 19 99 13.8 59 5 8
Unidad 3 - Estadística inferencial: prueba de KW
Tasa
posthoc.kruskal.dunn.test(Temp ~ as.factor(Month),
80 data=airquality,
p.adjust.method="holm")
Ozono
## 5 6 7 8
## 6 0.0185 - - -
70
## 7 7.4e-10 0.3028 - -
## 8 5.8e-08 0.5165 1.0000 -
60
## 9 0.0037 1.0000 0.0082 0.0462
5 6 7 8 9
Meses
Unidad 3 - Estadística inferencial: comparación
Prueba de Chi-cuadrado
I Es una prueba no paramétrica
I Estudia la relación entre dos variables
I Estudia variables cuantitativas
I Sus hipótesis son:
I H0 : Las variables en estudio son independientes.
I H1 : Las variables están relacionadas.
Unidad 3 - Estadística inferencial: prueba de Chi-cuadrado
Tabla de contingencia
Unidad 3 - Estadística inferencial: prueba de Chi-cuadrado
Tabla de contingencia
Unidad 3 - Estadística inferencial: prueba de Chi-cuadrado
Tabla de contingencia
Unidad 3 - Estadística inferencial: prueba de Chi-cuadrado
Tabla de contingencia
Unidad 3 - Estadística inferencial: prueba de Chi-cuadrado
¿Cómo se contrasta H0 ?
Se calculan las frecuencias f2 que se pueden esperar si las dos
variables fueran independientes y se compara con las frecuencias
observadas.
I Dos variables son independientes cuando el comportamiento de
una de ellas no se ve afectado por los valores que toma la otra.
I Dis variables son estadísticamnetes independientes, si se
cumple que:
ni,j ni nj
=
N NN
fi fj
feij =
N
Unidad 3 - Estadística inferencial: prueba de Chi-cuadrado
Tabla de contingencia
Unidad 3 - Estadística inferencial: prueba de Chi-cuadrado
Tabla de contingencia
Unidad 3 - Estadística inferencial: prueba de Chi-cuadrado
Donde:
I foij : frecuencia observada para la ij-ésima casilla
I feij : frecuencia esperada para la ij-ésima casilla
Si:
I La hipótesis nula es cierta χ2 sigue una distribución chi
cuadrado con (i − 1)(j − 1) grados de libertad.
I Se rechazará H0 si χ2 experimental > χ2 crítico.
Unidad 3 - Estadística inferencial: prueba de Chi-cuadrado
En nuestro ejemplo. . .
Fórmula:
X (foij − feij )2
χ2 =
ij
feij
Donde:
I foij : frecuencia observada para la ij-ésima casilla
I feij : frecuencia esperada para la ij-ésima casilla
Aplicación
En nuestro ejemplo. . .
I Los grados de libertad son:
En nuestro ejemplo. . .
#Datos #Frecuencia observada
filas=c("TMT1","TMT2","TMT3","TMT4") Resultado$observed
peor = c(7,15,10,5)
## peor igual mejor
igual= c(28,20,30,40)
## TMT1 7 28 115
mejor= c(115,85,90,115)
## TMT2 15 20 85
## TMT3 10 30 90
#Creación de tabla
## TMT4 5 40 115
tabla=data.matrix(data.frame(peor,igual,mejor))
rownames(tabla)=filas #Frecuencia esperada
Resultado$expected
#Prueba de Chi cuadrado ## peor igual mejor
Resultado = chisq.test(tabla) ## TMT1 9.910714 31.60714 108.48214
print(Resultado) ## TMT2 7.928571 25.28571 86.78571
## ## TMT3 8.589286 27.39286 94.01786
## Pearson's Chi-squared test ## TMT4 10.571429 33.71429 115.71429
##
## data: tabla
## X-squared = 13.871, df = 6, p-value = 0.03111
Unidad 3 - Estadística inferencial: prueba de Chi-cuadrado
Objetivo
Determinar si existe asociación entre la cantidad de consultas por
accidentes Infantiles (tasa de incidencia) y la época del año.