Está en la página 1de 13

Estadística Aplicada II 202301 71

Prueba de hipótesis para diferencia de medias con muestras relacionadas

Bibliografía
• Triola, M. (2013) Estadística. 11va. Edición. Pearson Educación, México, D.F. Capítulo 9, páginas 462 - 472,
487 - 493.
• Mendenhall W., Beaver R. y Beaver B. (2015). Introducción a la Probabilidad y Estadística. 14va Edición.
Cengage Learning Editores, México, D.F. Capítulo 8, páginas 307 – 310, 388 – 391.

Las muestras relacionadas son aquellas en las que los mismos individuos se miden en dos momentos diferentes
o en dos condiciones diferentes. Por ejemplo, podríamos tener una muestra de estudiantes que toman un
examen antes y después de un curso de estadística.

El objetivo de la prueba de hipótesis de muestras relacionadas es determinar si hay una diferencia significativa
entre las dos medias de la muestra.

Esta prueba se basa en dos muestras individuales medidas, como ya se dijo, en datos pareados o una muestra
evaluada en situaciones diferentes, a estos datos los llamaremos 𝑋𝑖 y 𝑌𝑖 .

Se tiene que calcular la diferencia entre cada par de datos (𝑑𝑖 ), es decir, tendremos que:

𝑑𝑖 = 𝑋𝑖 − 𝑌𝑖

Se calculan los siguientes estadísticos:

• La media de las diferencias.


∑𝑛𝑖=1 𝑑𝑖
𝑑̅ =
𝑛

• La varianza de las diferencias.


2
∑𝑛𝑖=1(𝑑𝑖 − 𝑑̅)
𝑆𝑑2 =
𝑛−1

Las posibles hipótesis son:

Unilateral izquierda

𝐻0 : 𝜇1 − 𝜇2 ≥ 𝜇0
𝐻1 : 𝜇1 − 𝜇2 < 𝜇0

Bilateral

𝐻0 : 𝜇1 − 𝜇2 = 𝜇0
𝐻1 : 𝜇1 − 𝜇2 ≠ 𝜇0

Unilateral derecha

𝐻0 : 𝜇1 − 𝜇2 ≤ 𝜇0
𝐻1 : 𝜇1 − 𝜇2 > 𝜇0
Unidad 1. Inferencia estadística 72
El estadístico de prueba es:

𝑑̅
𝑇= ~𝑡𝑛−1
𝑆𝑑
√𝑛

Este estadístico sigue la distribución t de Student con 𝑛 − 1 grados de libertad.

Las regiones críticas son:

Unilateral izquierda

𝑅𝐶 = ]−∞; −𝑡1−𝛼,𝑛−1 [

Bilateral

𝑅𝐶 = ]−∞; −𝑡1−𝛼,𝑛−1 [ ∪ ]𝑡1−𝛼,𝑛−1 ; +∞[


2 2

Unilateral derecha

𝑅𝐶 = ]−𝑡1−𝛼,𝑛−1 ; +∞[
Estadística Aplicada II 202301 73

Prueba de hipótesis de muestras emparejadas en Excel

En Excel, elija la opción Datos y luego Análisis de datos.

Aparecerá este menú.

Elija Prueba t para medias de dos muestras emparejadas.


Unidad 1. Inferencia estadística 74
Prueba de hipótesis de muestras emparejadas en Minitab

En Minitab, elija la opción Estadísticas, luego Estadísticas básicas y t pareada…

Dependiendo del problema, elija la opción adecuada.

Seleccione Opciones, escriba el nivel de confianza deseado y elija la hipótesis alterna adecuada. Haga clic en
Aceptar.
Estadística Aplicada II 202301 75
Ejemplo 15
Muestras relacionadas

Un gimnasio afirma que un nuevo programa de ejercicio reducirá la medida de la cintura de una persona en
promedio dos centímetros en un período de cinco días. Las medidas de cinturas de seis hombres que
participaron en este programa de ejercicios se registraron antes y después del período de cinco días en la
siguiente tabla:
Hombres
1 2 3 4 5 6
Medida de cintura antes 90,4 95,5 98,7 115,9 104,0 85,6
Medida de cintura después 91,7 93,9 97,4 112,8 101,3 84,0

¿La afirmación del gimnasio es válida al nivel de significación de 5%? Suponga que la distribución de las
diferencias de medidas de cintura antes y después del programa es aproximadamente normal.

Solución.
Sean X1: Medida de cintura antes (cm.)
X2: Medida de cintura después (cm.)

1. Planteo de hipótesis.
𝐻0 : 𝜇1 − 𝜇2 = 2 →𝐻0 : 𝐷 = 2
𝐻1 : 𝜇1 − 𝜇2 ≠ 2 →𝐻1 : 𝐷 ≠ 2
𝛼 = 0.05

2. Prueba estadística
𝑑̄ − 𝐷
𝑡𝑐 = ~ 𝑡(𝑛−1)
𝑆𝑑 /√𝑛

3. Supuestos.
 Las diferencias tienen distribución normal.

4. Regiones críticas. Criterios de decisión.


La hipótesis alternante define la(s) zona(s) de rechazo.

Áreas Criterios
0.025 0.025 Si -2.57  tc  2.57 No se rechaza H0
Si tc < -2.57 o tc > 2.57 Se rechaza H0
0.95

-2.57 2.57
5. Cálculos
Hombre Medida de cintura antes, Xi Medida de cintura después, Yi 𝑑𝑖 = 𝑋𝑖 − 𝑌𝑖
1 90,4 91,7 -1,3
2 95,5 93,9 1,6
3 98,7 97,4 1,3
4 115,9 112,8 3,1
5 104,0 101,3 2,7
6 85,6 84,0 1,6
Unidad 1. Inferencia estadística 76
Los estadísticos de media y desviación estándar para las diferencias resultan 𝑑̅ = 1.5, 𝑠𝑑 =1.543
Antes de la campaña 10,6 12,2 9,8 10,8 14,0 14,6 12,2 11,9 12,6 17,8
Después de la campaña 14,7 11,6 10,5 11,4 10,8 12,3 11,9 15,4 14,3 16,1

1.5 − 2
tc = = −0.794
1.543 / 6

6. Conclusión
Con 5% de nivel de significación la información recogida resulta insuficiente para contradecir lo que afirma
el gimnasio.

Ejercicios

24. Revise la infografía de muestras pareadas y responda lo siguiente.

Una empresa certificadora de la calidad del agua extrae 30 muestras del recorrido del rio Jeque para
analizar el oxígeno disuelto (OD). Se usaron dos métodos para hacer estos análisis: el método de Winkler
(MW) y el método de electrodos (ME). Se desea probar si existen diferencias entre los métodos.

a. ¿Utilizará una prueba de muestras independientes o muestras pareadas?


b. Plantee las hipótesis respectivas.

25. Revise la bibliografía de la unidad y a partir de ello, responda lo siguiente.

Para validar la prueba de hipótesis para la diferencia de medias para muestras dependientes se utiliza la
distribución t - Student.
a. Verdadero
b. Falso

26. Con el objetivo de incrementar las ventas de una conocida marca


de filtros de aire para autos, se decide realizar una gran campaña
publicitaria. Luego se recopiló una muestra aleatoria sobre las
ventas en miles de soles registradas en diez tiendas donde se
comercializa dicho filtro, antes y después de la campaña. Los
datos se muestran a continuación:

Asumiendo que el monto de ventas tiene una distribución normal, realice el análisis para indicar si fue
efectiva la campaña. Use un nivel de significación del 5%.

A continuación, se muestran los resultados usando Excel y Minitab.


Estadística Aplicada II 202301 77
Prueba t para medias de dos muestras emparejadas
Antes de la campaña Después de la campaña
Media 12.65 12.9
Varianza 5.4294 4.1289
Observaciones 10 10
Coeficiente de correlación de Pearson 0.4104
Diferencia hipotética de las medias 0
Grados de libertad 9
Estadístico t -0.3320
P(T<=t) una cola 0.3738
Valor crítico de t (una cola) 1.8331
P(T<=t) das colas 0.7475
Valor crítico de t (dos colas) 2.2622

Prueba
Hipótesis nula H₀: diferencia_μ = 0
Hipótesis alterna H₁: diferencia_μ ≠ 0

Valor T Valor p
-0.332 0.748

Dimensión de interpretación: Da significado a información Estimación: Relaciona datos e información numérica pertinente en diversos
numérica en diversos formatos en situaciones de contexto formatos, para definir una situación problemática en un contexto real.
real.

Dimensión de representación: Describe mediante Estimación: Describe la variable, su distribución, el (los) parámetro(s) y
expresiones matemáticas y/o estadísticas, situaciones de estadísticos utilizando correctamente las notaciones y representaciones
contexto real. simbólicas.

Dimensión de cálculo: Utiliza algoritmos y procedimientos Estimación: Calcule el estadístico de prueba, región(es) y valor(es) crítico(s),
estándar de la matemática y/o estadística en situaciones de p-value de la(s) prueba(s) respectivas.
contexto real.

Dimensión de análisis y argumentación: Sustenta los Estimación: Sustente el resultado de la prueba de hipótesis utilizando un
resultados y su aplicación práctica, planteando una solución. lenguaje formal estadístico y brinda alguna alternativa de respuesta a la
situación problemática.

27. El ingeniero de producción de Aceros Lima, productor mayorista de fierros de construcción ha diseñado
un nuevo método con la intención de optimizar el tiempo de entrega de los lotes pedidos de fierro de
construcción en la región central del país.

Para probar la eficacia de este nuevo método, selecciona en forma aleatoria a ocho empleados de la
sección de entregas y mide el tiempo de entrega con el método actual y luego mide el tiempo de entrega
de estos mismos empleados con el método nuevo. Los resultados en días de entrega son los siguientes:

Tiempo de entrega con método actual (1) 6 6 6 7 7 7 6 7


Tiempo de entrega con método nuevo (2) 5 6 6 7 8 8 5 4

Verifique el supuesto del ingeniero de producción y de sus conclusiones con un nivel de significación del
5%. Asuma que el tiempo de entrega de los lotes de fierros de construcción se distribuye en forma normal.

Interpretación: Determinar si el nuevo método de entrega es más eficiente que el método actual.

Representación:
µ1: Tiempo medio de entrega de los pedidos con el método actual (días)
µ2: Tiempo medio de entrega de los pedidos con el método nuevo (días)
Unidad 1. Inferencia estadística 78
x1: Tiempo de entrega del pedido con el método actual (días)
x2: Tiempo de entrega del pedido con el método nuevo (días)

Herramienta estadística: Prueba de hipótesis para la diferencia de medias con muestras relacionadas.

Paso 1. Planteamiento de las hipótesis


H0: µ1 - µ2 ≤ 0 → H1: µd ≤ 0 (El nuevo método es no más eficiente que el actual método)
H1: µ1 - µ2 > 0 → H1: µd > 0 (El nuevo método es más eficiente que el actual método)

Paso 2. Fijar el nivel de significación


α = 0.05

Cálculo:
Paso 3. Determinar y calcular el estadístico de prueba
x1: Tiempo de entrega con método actual (1) 6 6 6 7 7 7 6 7
x2: Tiempo de entrega con método nuevo (2) 5 6 6 7 8 8 5 4
d = x1 – x2 1 0 0 0 -1 -1 1 3

d̅ - μd0 0.375 - 0
n=8 d̅ = 0.375 sd = 1.3025 μd0 = 0 Tcal = sd = 1.3025 = 0.8143
√n √8

Paso 4. Establecer las regiones críticas y criterios de decisión

Análisis y Argumentación:
Paso 5. Decisión estadística
Como Tcal < Tcrítico, no se rechaza H0

Paso 6. Conclusión estadística


Al 5% de nivel de significación, la evidencia muestral no es suficiente para afirmar que el tiempo de entrega
de los pedidos es mayor con el método actual que con el método nuevo.

Por lo tanto, el método nuevo no es más eficiente que el método actual, porque no se comprobó que
con dicho método el tiempo de entrega de los pedidos es menor.
Estadística Aplicada II 202301 79

Prueba de hipótesis para diferencia de proporciones

Bibliografía

• Triola, M. (2013) Estadística. 11va. Edición. Pearson Educación, México, D.F. Capítulo 9, páginas 462 - 472,
487 - 493.
• Mendenhall W., Beaver R. y Beaver B. (2015). Introducción a la Probabilidad y Estadística. 14va Edición.
Cengage Learning Editores, México, D.F. Capítulo 8, páginas 307 – 310, 388 – 391.

La prueba de hipótesis de diferencias de proporciones es una técnica estadística que se utiliza para comparar
las proporciones de dos poblaciones o muestras. Esta prueba se utiliza comúnmente en estudios que implican
variables cualitativas, como estar de acuerdo o no con una ley, estar capacitado o no, etc.

Las posibles hipótesis son:

Unilateral izquierda

𝐻0 : 𝑝1 − 𝑝2 ≥ 𝑝0
𝐻1 : 𝑝1 − 𝑝2 < 𝑝0

Bilateral

𝐻0 : 𝑝1 − 𝑝2 = 𝑝0
𝐻1 : 𝑝1 − 𝑝2 ≠ 𝑝0

Unilateral derecha

𝐻0 : 𝑝1 − 𝑝2 ≤ 𝑝0
𝐻1 : 𝑝1 − 𝑝2 > 𝑝0

donde 𝑝0 es un valor diferente a cero y representa la diferencia de las proporciones planteada en la hipótesis
nula.

El estadístico de prueba es:

(𝑝̂1 − 𝑝̂ 2 ) − 𝑝0
𝑍=
𝑝̃(1 − 𝑝̃) 𝑝̃(1 − 𝑝̃)
√ +
𝑛1 𝑛2

donde 𝑝̂1 y 𝑝̂2 representan las proporciones muestrales respectivas.

𝑛1 𝑝̂1 + 𝑛2 𝑝̂ 2 𝑎1 + 𝑎2
𝑝̃ = =
𝑛1 + 𝑛2 𝑛1 + 𝑛2

Las posibles regiones críticas son:

Unilateral izquierda

𝑅𝐶 = ]−∞; −𝑧1−𝛼 [
Unidad 1. Inferencia estadística 80

Bilateral

𝑅𝐶 = ]−∞, −𝑧1−𝛼 [ ∪ ]𝑧1−𝛼 , +∞[


2 2

Unilateral derecha

𝑅𝐶 = ]−𝑧1−𝛼 ; +∞[

Prueba de hipótesis para diferencia de proporciones en Minitab

En Minitab, elija la opción Estadísticas, luego Estadísticas básicas y 2 Proporciones…

Dependiendo del problema, elija la opción adecuada.

Seleccione Opciones, escriba el nivel de confianza deseado y elija la hipótesis alterna adecuada. Haga clic en
Aceptar.
Estadística Aplicada II 202301 81

Ejercicios

28. A partir de lo revisado en el libro de Triola (2013, p. 487-493), responda lo siguiente.

Para validar la prueba de hipótesis para la diferencia de proporciones se utiliza la distribución normal.
a. Verdadero
b. Falso

29. Un equipo de ingenieros sostiene que la proporción de víctimas resultante de choques automovilísticos
son menores en el caso de los automóviles equipados con bolsas de aire (1) que aquellos automóviles que
no tienen bolsa de aire (2). Identifique la hipótesis alterna correcta.

c. 𝐻1 𝑝1 − 𝑝2 < 0
d. 𝐻1 𝑝1 − 𝑝2 = 0
e. 𝐻1 𝑝1 − 𝑝2 > 0

30. Suponga que tenemos dos muestras aleatorias independientes de tamaños 60 y 70, respectivamente. A
partir de estas muestras se obtienen las proporciones muestrales para cierta característica de interés,
cuyos valores son:

21
𝑝̂1 =
60

25
𝑝̂2 =
70

Se formulan las hipótesis.

𝐻0 𝑝1 = 𝑝2
𝐻1 𝑝1 ≠ 𝑝2

El nivel de significación es:

𝛼 = 0,05

Con los datos recolectados en las muestras aleatorias, se obtiene el estadístico de prueba cuyo valor
resultado es 𝑍𝑐𝑎𝑙 = −0,08.

a. Indique el tipo de prueba de hipótesis.


b. Determine el valor crítico.
c. Indique la decisión.

31. Un equipo de ingenieros químicos tiene conocimiento que el Lipitor es un


fármaco que se utiliza para controlar el colesterol. En ensayos clínicos del
Lipitor, 124 sujetos fueron tratados con el medicamento y 270 sujetos
recibieron un placebo. De los que fueron tratados con Lipitor, siete
desarrollaron infecciones. De los que recibieron un placebo, 27
desarrollaron infecciones.
Unidad 1. Inferencia estadística 82
Utilice un nivel de significancia de 0,05 para someter a prueba la afirmación de que la tasa de infecciones
para los individuos tratados con Lipitor fue menor a los que recibieron un placebo. En caso de que, la
afirmación sea cierta, el equipo de químicos recomendará usar el fármaco Lipitor.

Interpretación: Determinar si el equipo de químicos recomendará el uso del fármaco Lipitor.

Representación:
p1: Proporción de individuos que desarrollaron infecciones al ser tratados con Lipitor.
p2: Proporción de individuos que desarrollaron infecciones al ser tratados con el Placebo.
x1: Número de individuos que desarrollaron infecciones al ser tratados con Lipitor.
x2: Número de individuos que desarrollaron infecciones al ser tratados con Placebo.

Herramienta estadística: Prueba de hipótesis para diferencia de proporciones.

Paso 1. Planteamiento de las hipótesis


H0: p1 – p2 ≥ 0 (no recomendar el uso de Lipitor)
H1: p1 – p2 < 0 (sí recomendar el uso de Lipitor)

Paso 2. Fijar el nivel de significación


α = 0.05

Cálculo:
Paso 3. Determinar y calcular el estadístico de prueba
x 7 x +x 7 + 27 17
n1 = 124 x1 = 7 p̂ 1 = n1 = 124 p̅ = n1 + n2 = 124 + 270 = 197
1 1 2

7 27
x2 27 p̂ 1 - p̂ 2 -
124 270
n2 = 270 x2 = 27 p̂ 2 = = Zcal = = = -1.4296
n2 270 1 1 17 17 1 1
√p̅ (1 - p̅ )( + ) √ (1- )( + )
n1 n2 197 197 124 270

Paso 4. Establecer las regiones críticas y criterios de decisión

Análisis y Argumentación:
Paso 5. Decisión estadística
Como Zcal > Zcrítico, no se rechaza H0.

Paso 6. Conclusión estadística


Al 5% de nivel de significación, la evidencia muestral no es suficiente para afirmar que la tasa de individuos
que desarrollan infecciones es menor al ser tratados con el fármaco Lipitor que con un Placebo.

Por lo tanto, el equipo de químicos no recomendará el uso del fármaco Lipitor, porque no se comprobó
que con dicho fármaco la tasa de infecciones es menor.
Estadística Aplicada II 202301 83
32. En una prueba de calidad de dos comerciales de televisión A y B, se seleccionó una muestra al azar de 150
personas para el comercial A y 200 personas para el comercial B. La semana siguiente se llevó a cabo una
encuesta entre las personas que vieron los comerciales y se les pidió que recordaron el mensaje principal
del comercial. Se obtuvieron los siguientes resultados:

• El comercial A fue visto por 150 personas y 63 de ellos lograron recordar el mensaje principal.
• El comercial B fue visto por 200 personas y 60 de ellos lograron recordar el mensaje principal.

Use 𝛼 = 0,05 para probar la hipótesis que no hay diferencia en las proporciones que recuerdan el mensaje
principal de los dos comerciales.

También podría gustarte