Está en la página 1de 27

ESTADISTICA

Unidad 2:
Inferencia estadística
Semana 11:
Prueba de hipótesis sobre dos muestras
Desarrollado por:
Patricia Guevara V.

julio 2022
ÍNDICE

Capítulo 8. Pruebas de hipótesis sobre dos muestras________ 220

8.1. Prueba de hipótesis sobre la diferencia de medias de muestras


independientes con varianzas conocidas ______________________ 220

8.1.1. Laboratorio de R. Diferencia de medias, varianzas conocidas ______________ 222

8.2. Prueba de hipótesis sobre la diferencia de medias de muestras


independientes con varianzas desconocidas. __________________ 223

8.2.1. Prueba de hipótesis sobre la diferencia de medias de muestras independientes con

varianzas desconocidas. Caso 1: σ 1 = σ 2 ______________________________________ 223


2 2

8.2.2. Prueba de hipótesis sobre la diferencia de medias de muestras independientes con

varianzas desconocidas. Caso 2: σ 1  σ 2 _____________________________________ 225


2 2

8.2.3. Laboratorio de R. Diferencia de medias, varianzas desconocidas ___________ 226

8.3. Distribución F ________________________________________ 227

8.4. Prueba de hipótesis sobre la igualdad de varianzas _______ 228

8.4.1. Laboratorio de R. Razón de varianzas ________________________________ 231

8.5. Pruebas de hipótesis sobre la diferencia de dos proporciones


232

8.5.1. Laboratorio de R. Prueba de proporciones _____________________________ 233

8.6. Ejercicios propuestos. Pruebas para dos muestras. _______ 234

Bibliografía _____________________________________ 244

Dra. Patricia Guevara, Msc.


i
Capítulo 8. Pruebas de hipótesis sobre dos muestras

Gráfico. https://appsrentables.com/consejos-experimentos-a-b-google-play/

El objetivo de realizar pruebas de hipótesis sobre dos muestras es comparar dos grupos respecto
a un mismo parámetro. Se presentan las siguientes pruebas de hipótesis sobre dos muestras:
- Diferencia de medias para muestras independientes con varianzas conocidas
- Diferencia de medias para muestras independientes con varianzas desconocidas iguales
- Diferencia de medias para muestras independientes con varianzas desconocidas diferentes
- Razón de varianzas
- Diferencia de proporciones.

8.1. Prueba de hipótesis sobre la diferencia de medias de muestras independien-


tes con varianzas conocidas

Dra. Patricia Guevara, Msc.


220
Luego, una hipótesis sobre la diferencia de medias se verifica con los cinco pasos.

Pasos de la prueba: Bilateral


1. Hipótesis estadísticas 𝐻0 :μ1 = 𝜇2
{
𝐻1 :μ1 ≠ 𝜇2

2. Nivel de significancia  → Zα/2 = ±


3. Estadístico de prueba 𝑍0
𝑥̅1 − 𝑥̅2 − (𝜇1 − 𝜇2 )
=
𝜎12 𝜎22

𝑛1 + 𝑛2

4. Regla de decisión Ho se rechaza si


Zo > |Z/2|
Ho se rechaza si
p-valor <
p-valor = 2p(Z>|Z0 |)

Dra. Patricia Guevara, Msc.


221
Ejemplo 8.1. Ejercicio propuesto tomado de Probabilidades y Estadística aplicadas a la Ingenie-
ría, Montgomery D., Runger G., 2ª. Ed.

Solución
Variables y parámetros
X1: índice de octano en carretera para la
formulación 1
X2: índice de octano en carretera para la
formulación 2
Hipótesis a verificar:
La formulación 2 produce un índice de
octano en carretera promedio mayor al
índice de octano promedio producido por
la formulación 1.
Dicho de otra forma:
La formulación 1 produce un índice de oc-
tano en carretera promedio menor que el
índice de octano promedio producido por
la formulación 1.

8.1.1. Laboratorio de R. Diferencia de medias, varianzas conocidas


Ejercicio 1.
#library(MASS), #library(lattice), #library(e1071)
z.test(
Dra. Patricia Guevara, Msc.
222
8.2. Prueba de hipótesis sobre la diferencia de medias de muestras independien-
tes con varianzas desconocidas.

Condiciones:

A continuacion, se presentan los pasos de la hipótesis.

8.2.1. Prueba de hipótesis sobre la diferencia de medias de muestras independien-


tes con varianzas desconocidas. Caso 1: σ 12 = σ 22
Pasos Bilateral Unilat. superior Unilat. inferior
1. H 0 : μ 1 = μ 2

 H1 : μ 1  μ 2
2.  → tα/2, gl = ±

g.l= n1+n2-2
3. 𝐗̄ 𝟏 − 𝐗̄ 𝟐 − (𝛍𝟏 − 𝛍𝟐 ) (𝐧𝟏 − 𝟏)𝐬𝟏𝟐 + (𝐧𝟐 − 𝟏)𝐬𝟐𝟐
𝐓𝟎 = ; 𝐒𝐩𝟐 =
𝟏 𝟏 𝐧𝟏 + 𝐧𝟐 − 𝟐
√𝐒𝐩𝟐 ( + )
𝐧𝟏 𝐧𝟐
4.
Comparando puntos
Ho se rechaza si
To > |T/2, gl |
Comparando probabilidades
Ho se rechaza si p-valor < 
p-valor = 2p(Tgl >|T0 |

Ejemplo 8.5

Hasta el momento una maestría ha graduado dos promociones, y se conoce que durante el desa-
rrollo de la misma la calidad en los trabajos presentados refleja lo que es cada grupo. Suponiendo

Dra. Patricia Guevara, Msc.


223
que existe objetividad en la evaluación de dichos trabajos, se quiere demostrar que el segundo
grupo es igual que el primero. Para ello utilice  = 0.05 y se toma una muestra de 10 trabajos por
grupo, y se conoce que, las varianzas de ambas poblaciones son iguales. Los datos de las muestras
son los siguientes:
Grupo 1: 8.9 8.4 8.3 8.6 9.2 9.6 9.3 9.0 9.3 9.1
Grupo2: 9.2 9.6 9.7 9.4 9.5 9.0 9.2 9.7 9.4 9.3
Solución:

Ejemplo 8.6

D. Montgomery, G. Runger. Probab. & Estad Aplic. Ing. Cáp. 9, pág. 400, Edic. 2ª.

d) ¿Hay evidencia en favor de la afirmación de que la máquina 1 poduce un diámetro prome-


dio superior al diámetro promedio de la máquina 2?
Solución:

a. Comparando probabilidades: Ho se rechaza si, p-valor < 


p-valor = p(Tg.l > To) = p(T30 > 0.230) = p(T30 < -0.230)
p-valor → 0.1 < p(T30 < -0.230) < 0.5
<  =0.05 (F) → Ho se acepta: u1 ≤ u2
Dra. Patricia Guevara, Msc.
224
8.2.2. Prueba de hipótesis sobre la diferencia de medias de muestras independien-
tes con varianzas desconocidas. Caso 2: σ 12  σ 22

Pasos de la prueba: Bilateral Unilat. superior Unilat. inferior


1. Hipótesis estadísticas H 0 : μ 1 = μ 2

 H1 : μ 1  μ 2
2. Nivel de significancia  → tα/2, gl = ±
𝟐
𝒔𝟐 𝒔𝟐
( 𝟏 + 𝟐)
𝒏𝟏 𝒏𝟐
𝒈. 𝒍. = 𝟐 𝟐
𝒔𝟐 𝒔𝟐
( 𝟏) ( 𝟐)
𝒏𝟏 𝒏𝟐
+
𝒏𝟏 − 𝟏 𝒏𝟐 − 𝟏
3. Estadístico de prueba 𝑻𝟎 =
̅𝟏 −𝒙
𝒙 ̅𝟐 −(𝝁𝟏 −𝝁𝟐 )

𝒔𝟐 𝒔 𝟐
√ 𝟏+ 𝟐
𝒏𝟏 𝒏𝟐

4. Regla de decisión Ho se rechaza si


To > +T/2, gl
5. Interpretar los resultados

Ejemplo 8.8

Solucion (a)

Dra. Patricia Guevara, Msc.


225
8.2.3. Laboratorio de R. Diferencia de medias, varianzas desconocidas

Repita en R, los ejercicios realizados con fórmulas.


- La prueba de hipótesis require el uso de la función t.test, la misma que no necesita de la
instalación de paquetes.

- Se debe filtrar la variable de interés en cada grupo o factor a comparar


variable_muestra1 <- datos$variable[factor == “aributo de interés o grupo 1”]
variable_muestra2 <- datos$variable[factor == “aributo de interés o grupo 2”]

- Asumiendo que las varianzas son iguales, el código es:


t.test(x= variable_muestra1, y = variable_muestra2,
alternative = c("two.sided", "less", "greater"),
var.equal = TRUE
conf.level = 0.95)

- Asumiendo que las varianzas son diferentes, el código es:


t.test(x= variable_muestra1, y = variable_muestra2,
alternative = c("two.sided", "less", "greater"),
var.equal = FALSE,
conf.level = 0.95)

Copie los resultados en esta parte:

Dra. Patricia Guevara, Msc.


226
8.3. Distribución F

La distribución F se define como la razón entre dos variables aleatorias Ji cuadrado cada una
𝐽 /𝑔𝑙
dividida para sus grados de libertad, es decir 𝐹 = 𝐽1 /𝑔𝑙1 , las variables aleatorias Ji cuadrado son
2 2

independientes. Esta función de probabilidad no es simétrica.

La función de distribución de probabilidad F se puede hallar con la tabla de probabilidades


acumuladas para la distribución F en cola derecha, es decir:


𝑝(𝐹 > 𝑓𝛼,𝑔𝑙1,𝑔𝑙2 ) = ∫ 𝑓(𝑥)𝑑𝑥 = 𝛼
𝑓𝛼,𝑔𝑙1,𝑔𝑙2

En el caso de requerir probabilidades en cola izquierda, se hallará de la siguiente forma:

1
𝑝(𝐹 < 𝑓1−𝛼,𝑔𝑙1,𝑔𝑙2 ) = =1−𝛼
𝑓𝛼,𝑔𝑙1,𝑔𝑙2

El problema con las tablas de distribución es que su cantidad es limitada, pues se debe contar
con una tabla para cada significancia ; las tablas disponibles están hechas para significancias
0.01, 0.025, 0.05, 0.10. Esta limitación hace que el cálculo de probabilidades se reduzca a las
significancias de las tablas. En estos casos es mejor usar herramientas estadísticas u hojas de
cálculo para disponer de más opciones.

Ejemplo 8.11

a. Hallar las probabilidades en la distribución F, para los grados de libertad dados.

p(F2,5 >5.79)=0.05

p(F2,5 < 5.79)=1- 0.05 = 0.95

b. Hallar los puntos críticos en la distribución F, para los grados de libertad y significancias.

p(F10,5 >Fo)=0.05 → 4.74

1 1
p(F10,5 <Fo)=0.05 → 𝑓 = 4.74= 0.21
0.05,10,5

Dra. Patricia Guevara, Msc.


227
8.4. Prueba de hipótesis sobre la igualdad de varianzas

Condiciones:

A continuación, el proceso de prueba

Pasos de la prueba: Bilateral Unilat. superior Unilat. inferior


1. Hipótesis estad. 𝐻0 : 𝜎12 = 𝜎22
{
𝐻1 : 𝜎12 ≠ 𝜎22
2. Nivel de signific.  → fα/2, gl1, gl2 =
1- → f1-α/2, gl1, gl2 =1/fα/2, gl1, gl2
Grados de libertad: gl1=n1 -1, gl2=n2-1
3. Estad. de prueba 𝑺𝟐𝟏
𝑭𝟎 =
𝑺𝟐𝟐
4. Regla de decisión Ho se rechaza si
Fo > fα/2, gl1, gl2
Fo < f1-α/2, gl1, gl2
5. Interpretar los resultados

Dra. Patricia Guevara, Msc.


228
Ejemplo 8.12. D. Montgomery, G. Runger. Probab. & Estad Aplic. Ing. Cáp. 9, pág. 416, Edic.
2ª.

Ejemplo 8.13. D. Montgomery, G. Runger. Probab. & Estad Aplic. Ing. Cáp. 9, pág. 416, Ed. 2ª.

Dra. Patricia Guevara, Msc.


229
Nota. En el literal a realice las pruebas de normalidad y igualdad de varianzas.

Dra. Patricia Guevara, Msc.


230
8.4.1. Laboratorio de R. Razón de varianzas

Repita en R, los ejercicios realizados con fórmulas.


- Se debe filtrar la variable en cada grupo o factor a comparar
variable_muestra1 <- datos$variable[factor == “aributo de interés o grupo 1”]
variable_muestra2 <- datos$variable[factor == “aributo de interés o grupo 2”]

- La prueba de hipótesis sobre la razón de varianzas tiene el código:


var.test(variable_muestra1, variable_muestra2, conf.level = 0.95)

- El resultado obtenido puede usarse para saber el caso a aplicar en una prueba de hipótesis
sobre la diferencia de medias con varianzas conocidas.

Si resulta que las varianzas son iguales, entonces en var.equal colocar TRUE.
t.test(x= variable_muestra1, y = variable_muestra2,
alternative = c("two.sided", "less", "greater"),
var.equal = TRUE,
conf.level = 0.95)

Si resulta que las varianzas son diferentes, entonces en var.equal colocar FALSE.
t.test(x= variable_muestra1, y = variable_muestra2,
alternative = c("two.sided", "less", "greater"),
var.equal = FALSE,
conf.level = 0.95)

Dra. Patricia Guevara, Msc.


231
8.5. Pruebas de hipótesis sobre la diferencia de dos proporciones

Pasos de la prueba: Bilateral Unilateral superior Unilateral inferior


1. Hipótesis estadísticas 𝐻 :p = 𝑝2
{ 0 1
𝐻1 :p1 ≠ 𝑝2

2. Nivel de significancia  → Zα/2 = ±


3. Estadístico de prueba 𝒙 +𝒙
̂ = 𝟏 𝟐 𝒁𝟎 =
𝒑 𝟏 𝟐 ̂ −𝒑
𝒑 ̂
𝒏𝟏 +𝒏𝟐 𝟏 𝟏
̂ (1-p̂)( + )
√𝒑
; 𝒏𝟏 𝒏𝟐

También se tiene está fórmula para Zo


̂ 𝟏 −𝒑
𝒑 ̂𝟐 𝒙 𝒙
Zo = ̂ 𝟏𝒒
𝒑 ̂𝟏 𝒑 ̂ 𝟐𝒒
̂𝟐
donde 𝒑
̂𝟏 = 𝟏
𝒏
̂𝟐 = 𝟐
𝒑 𝒏
√ 𝒏 + 𝒏 𝟏 𝟐
𝟏 𝟐

4. Ho se rechaza si: Zo > Z/2

5. Interpretar los resultados

Ejemplo 8.16. Mecánica y Biotecnología, aplicando fórmulas.

Tomado del libro Probabilidades y Estadística aplicadas a la Ingeniería, 2ª. Ed. Montgomery D,
Runger G.
Solucion
1. Ho: p1 = p2
H1: p1  p2
2.  = 0.05
3. Zo

Dra. Patricia Guevara, Msc.


232
Ejemplo 8.16

8.5.1. Laboratorio de R. Prueba de proporciones

Dra. Patricia Guevara, Msc.


233
8.6. Ejercicios propuestos. Pruebas para dos muestras.

Ingenieros PAFDE
D. Montgomery, G. Runger. Probab. & Es- D. Lind, W. Marchal, S. Wathen. Estadística
tad Aplic. Ing. Cáp. 9, p, Edición 2ª. aplicada a los negocios y la economía 15th.
Ejercicios a elección de las pruebas de hi- Ejercicios a elección de las pruebas de hipó-
pótesis siguientes: tesis siguientes:
- 2 Diferencia de medias con varianzas co- - 2 Diferencia de medias con varianzas co-
nocidas nocidas
- 1 Diferencia de medias con varianzas - 1 Diferencia de medias con varianzas des-
desconocidas. Caso 1 conocidas. Caso 1
- 1 Diferencia de medias con varianzas - 1 Diferencia de medias con varianzas des-
desconocidas. Caso 2 conocidas. Caso 2
- 2 Diferencia de varianzas - 2 Diferencia de varianzas
- 2 Diferencia de proporciones - 2 Diferencia de proporciones

Escoger dos ejercicios de cada tema.

Prueba de hipótesis sobre la media con varianza poblacional conocida

Medicina
Ejercicio 2. Datos de Osteoporosis. Muestra de 286 pacientes mujeres.
Con una significancia del 4% comprobar que el peso promedio de mujeres con densidad ósea baja
(Osteopenia, Osteoporosis) es menor o igual al peso promedio de las mujeres con valores de den-
sidad Normales.

Dra. Patricia Guevara, Msc.


234
Ejercicio 3. Datos de Osteoporosis. Muestra de 286 pacientes mujeres.
Con una significancia de 0.03 probar que la edad promedio de mujeres no menopaúsicas es menor
o igual a la edad promedio de las mujeres con Menopaussia natural. Se conoce que las edades de
las mujeres tanto “no menopaúsicas” como de “menopausia natural” siguen distribuciones nor-
males con deviaciones estándar poblacionales conocidas de valores respectivos 4.5 y 3.5.

Ejercicio 4. Datos de Osteoporosis. Muestra de 286 pacientes mujeres.


Con una significancia del 3% comprobar que la edad promedio de mujeres no menopaúsicas es
menor o igual a la edad promedio de las mujeres con las otras condiciones de Menopaussia.

Dra. Patricia Guevara, Msc.


235
1. Repetir el ejercicio 1 del laboratorio, usando las fórmulas manualmente
2. Repetir el ejercicio 3 del laboratorio, usando las fórmulas manualmente

Prueba de hipótesis sobre la diferencia de medias de muestras independientes con


varianzas poblacionales conocidas.

Ejemplo 8.2. Mecánica, Biotecnología. Ejercicio propuesto tomado de Probabilidades y Esta-


dística aplicadas a la Ingeniería, Montgomery D., Runger G., 2ª. Ed.

a. Halle las concentraciones medias con cada catalizador


b. Realice una prueba unilateral sobre las concentraciones medias al nivel de significancia
del 5%.

Dra. Patricia Guevara, Msc.


236
Ejemplo 8.3. Repita el ejercicio 8.2 en R-Studio.

Dra. Patricia Guevara, Msc.


237
Ejemplo 8.4. Mecánica, Biotecnología. Ejercicio. Libro de Montgomery. 5ª. Ed., pág. 360

Dra. Patricia Guevara, Msc.


238
Prueba de hipótesis sobre la diferencia de medias de muestras independientes con
varianzas poblacionales desconocidas. Verificar primero la razón de varianzas

1991_BIOESTADÍSTICA_Wayne Daniel_Ed Limusa_4ta. Ed

Dra. Patricia Guevara, Msc.


239
Dra. Patricia Guevara, Msc.
240
Dra. Patricia Guevara, Msc.
241
Dra. Patricia Guevara, Msc.
242
Prueba de hipótesis sobre la diferencia de proporciones

Dra. Patricia Guevara, Msc.


243
Bibliografía
1. Bernard Rosner, Harvard University, Cengage Learning. Fundamentals of Biostatistics. 2010.
7th. Edition.
2. Celis de la Rosa, Vanessa Labrada. Bioestadística. Manual Moderno. 2014. 3ª. Edición.
3. Wayne Daniel. Bioestadística. Ed Limusa. 1991. 4ª. Edición.
4. Montogomery D., y Runger G., (2003). Probabilidades y Estadistica aplicadas a la Ingenieria.
Segunda Edición. Imusa.
5. Lind D., Marchal W., Wathen S., (2012). Estadística Aplicada A Los Negocios y La Economía.
Décimo quinta Edición. McGraw-Hill/Interamericana Editores
6. Patricia Guevara, Universidad de las Fuerzas Armadas ESPE. Guías de estudio y Laboratorios
Semanas 1 a la 18.

Dra. Patricia Guevara, Msc.


244

También podría gustarte