Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2022-07-06
Prubas de hipotesis
Prueba de hipotesis de una media con desviacion estandar conocida
Ejemplo 01
Una empresa exportadora de cacao afirma que sus sacos tienen un peso promedio de 22 kg. El departamento
de control de calidad realiza un muestreo de rutina, seleccionando 25 sacos las cuales arrojaron los siguientes
resultados:
Realizar una prueba de hipótesis que compruebe si la empresa exportadora está cumpliendo lo que afirma.
Considere un nivel de significancia de α = 0, 02 y una desviacion estandar poblacional σ = 0.5.
El resumen de los datos es:
x̄ = 21, 59 S = 0, 852 n = 25 α = 0, 02
Solucion usando R
Para resolver este ejercicio donde se conoce la desviacion estandar de la poblacion σ,se debe emplear la
prueba estadistica z, en el software R, se emplea la funcion z.test la cual se encuentra en la libreria PASWR.
Por tanto se debe llamar en primera instancia esta libreria, asi:
library(PASWR)
1
## Loading required package: e1071
## Loading required package: MASS
## Loading required package: lattice
## Warning: package 'lattice' was built under R version 4.1.1
como segundo paso se ingreseran los datos de la siguiente manera:
Datos_01 <- c(22.10, 22.30, 22.05, 21.95, 21.50,
22.00, 21.10, 22.35, 22.15, 21.90,
21.50, 22.40, 21.30, 21.50, 21.70,
19.25, 21.10, 22.30, 22.00, 21.50,
20.45, 19.20, 22.00, 22.05, 22.20)
prueba_01
##
## One-sample z-Test
##
## data: Datos_01
## z = -4.06, p-value = 4.907e-05
## alternative hypothesis: true mean is not equal to 22
## 98 percent confidence interval:
## 21.36137 21.82663
## sample estimates:
## mean of x
## 21.594
El valor − p = 4.9072716 × 10−5 es menor que α = 0, 05, por lo cual se rechaza a hipótesis nula H0 . Se tiene
evidencia estadistica suficiente para rechazar H0 y aceptar H1 , lo que significa que la media es diferente al
peso de 22 Kg.
Realizar una prueba de hipótesis que compruebe si la empresa exportadora está cumpliendo lo que afirma.
Considere un nivel de significancia de α = 0, 02.
2
El resumen de los datos es:
x̄ = 21, 59 S = 0, 852 n = 25 α = 0, 02
Solucion usando R
Para resolver este ejercicio donde no se conoce la desviacion estandar de la poblacion σ,se debe emplear la
prueba estadistica t, en el software R, se emplea la funcion t.test la cual se encuentra en la libreria stats, la
mima que es basica en R. Por tanto se debe llamar en primera instancia esta libreria, asi:
Como segundo paso se ingreseran los datos de la siguiente manera:
Datos_02 <- c(22.10, 22.30, 22.05, 21.95, 21.50,
22.00, 21.10, 22.35, 22.15, 21.90,
21.50, 22.40, 21.30, 21.50, 21.70,
19.25, 21.10, 22.30, 22.00, 21.50,
20.45, 19.20, 22.00, 22.05, 22.20)
prueba_02
##
## One Sample t-test
##
## data: Datos_02
## t = -2.3816, df = 24, p-value = 0.02552
## alternative hypothesis: true mean is not equal to 22
## 98 percent confidence interval:
## 21.16915 22.01885
## sample estimates:
## mean of x
## 21.594
El valor − p = 0.0255151 es mayor que α = 0, 02, por lo cual no se rechaza a hipótesis nula. no tengo
evidencia estadistica suficiente para rechazar H0 , lo que significa que la media no es diferente al peso de 22
Kg.
3
Pruebas de hipótesis de dos medias
Prueba de hipótesis de dos medias con desviaciones estándar conocidas
Ejemplo 03
Una compañía productora de café dispone de dos clases de semilla de café arábigo tipo gourmet para
exportación al mercado europeo, sin embargo se tiene la idea de que una de las variedades tiene un mayor
rendimiento de producción por hectárea. Se tomaron dos muestras y se obtuvieron los siguientes resultados:
Semilla 1 31 42 39 40 38 39 42 42 39 37 39 34
Semilla 2 43 42 41 43 42 47 40 41 42 45 45 44
Realizar una prueba de hipotesis para verificar si el rendimineto de una de las dos semillases es mejor.
Considere un nivel de significancia de 0,05. Se conocen además las desviaciones estándar de las poblaciones
las cuales son respectivamente σ1 = 2, 20 y σ2 = 2, 00.
Datos:
Solución:
Ingreso de datos
Semilla_1 <- c(31, 42, 39, 40, 38, 39, 42, 42, 39, 37, 39, 34)
Semilla_2 <- c(43, 42, 41, 43, 42, 47, 40, 41, 42, 45, 45, 44)
prueba_03
##
## Two-sample z-Test
##
## data: Semilla_1 and Semilla_2
## z = -5.1459, p-value = 1.331e-07
## alternative hypothesis: true difference in means is less than 0
## 95 percent confidence interval:
4
## -Inf -3.004901
## sample estimates:
## mean of x mean of y
## 38.50000 42.91667
El valor − p = 1.3313934 × 10−7 es menor que α = 0, 05, por lo cual se rechaza a hipótesis nula H0 . Se tiene
evidencia estadistica suficiente para rechazar H0 y aceptar H1 , lo que significa que la media del rendimiento
de la semilla 1 es menor al rendimiento de la semilla 2.
Semilla 1 31 42 39 40 38 39 42 42 39 37 39 34
Semilla 2 43 42 41 43 42 47 40 41 42 45 45 44
Realizar una prueba de hipotesis para verificar si el rendimineto de una de las dos semillases es mejor.
Considere un nivel de significancia de 0,05.No se conoce las desviaciones estandar.
Datos:
Solución:
Ingreso de datos
Semilla_1 <- c(31, 42, 39, 40, 38, 39, 42, 42, 39, 37, 39, 34)
Semilla_2 <- c(43, 42, 41, 43, 42, 47, 40, 41, 42, 45, 45, 44)
5
prueba_04 <- t.test(x = Semilla_1, y = Semilla_2, alternative = "less", mu = 0, paired = F, var.equal =
prueba_04
##
## Two Sample t-test
##
## data: Semilla_1 and Semilla_2
## t = -3.9634, df = 22, p-value = 0.0003297
## alternative hypothesis: true difference in means is less than 0
## 95 percent confidence interval:
## -Inf -2.503154
## sample estimates:
## mean of x mean of y
## 38.50000 42.91667
El valor − p = 3.2968713 × 10−4 es menor que α = 0, 05, por lo cual se rechaza a hipótesis nula H0 . Se tiene
evidencia estadistica suficiente para rechazar H0 y aceptar H1 , lo que significa que la media del rendimiento
de la semilla 1 es menor al rendimiento de la semilla 2.
Semilla 1 31 42 39 40 38 39 42 42 39 37 39 34
Semilla 2 43 42 41 43 42 47 40 41 42 45 45 44
Realizar una prueba de hipotesis para verificar si el rendimineto de una de las dos semillases es mejor.
Considere un nivel de significancia de 0,05.
Datos:
Solución:
Ingreso de datos
Semilla_1 <- c(31, 42, 39, 40, 38, 39, 42, 42, 39, 37, 39, 34)
Semilla_2 <- c(43, 42, 41, 43, 42, 47, 40, 41, 42, 45, 45, 44)
6
Prueba de hipotesis usando R
En este ejemplo se disponen las desviaciones estandar poblacionales, por lo cual se debe emplear la prueba
z.test, como se indico anteriormente que se encuentra en la libreria PASWR.
prueba_05 <- t.test(x = Semilla_1, y = Semilla_2, alternative = "less", mu = 0, paired = F, var.equal =
prueba_05
##
## Welch Two Sample t-test
##
## data: Semilla_1 and Semilla_2
## t = -3.9634, df = 18.268, p-value = 0.0004444
## alternative hypothesis: true difference in means is less than 0
## 95 percent confidence interval:
## -Inf -2.485837
## sample estimates:
## mean of x mean of y
## 38.50000 42.91667
El valor − p = 4.4443386 × 10−4 es menor que α = 0, 05, por lo cual se rechaza a hipótesis nula H0 . Se tiene
evidencia estadistica suficiente para rechazar H0 y aceptar H1 , lo que significa que la media del rendimiento
de la semilla 1 es menor al rendimiento de la semilla 2.
Vaca 1 2 3 4 5 6 7 8
Antes 8,69 7,13 7,79 7,93 7,59 7,86 9,06 9,59
Despues 7,24 7,10 7,80 7,95 7,50 7,79 9,00 9,48
Diferencia 1,45 0,03 -0,01 -0,02 0,09 0,07 0,06 0,11
¿Que conclusion puede obtener acerca de la fistulación? Utilice un nivel de significancia de 0,01?
Datos:
d¯ = 0, 2225 Sd = 0, 4981
7
Antes <- c(8.69, 7.13, 7.7, 7.93, 7.59, 7.86, 9.06, 9.59)
Despues <- c(7.24, 7.10, 7.80, 7.95, 7.50, 7.79, 9.00, 9.48)
Prueba de hipotesis
Este es un caso de prueba de hipotesis de dos mediasdependientes, por lo cual se debe emplear la prueba t de
Student, se debe considerar en t.test una prueba emparejada (paired = T).
prueba_06 <- t.test(x = Antes, y = Despues, alternative = "greater", mu = 0, paired = T, conf.level = 0.
prueba_06
##
## Paired t-test
##
## data: Antes and Despues
## t = 1.1831, df = 7, p-value = 0.1377
## alternative hypothesis: true difference in means is greater than 0
## 95 percent confidence interval:
## -0.1270461 Inf
## sample estimates:
## mean of the differences
## 0.21125
El valor − p = 0.1376989 es mayor que el nivel de significancia α = 0, 05, por lo cual no se rechaza a hipótesis
nula H0 . No se tiene evidencia estadistica suficiente para rechazar H0 , lo que significa que no existe diferencias
significativas entre el nivel de fosforo en la sangre antes de despues de la fistulacion.