Está en la página 1de 35

Inferencia acerca de dos muestras

independientes y dependientes
S - 08

UNIDAD II
Propósito

• Conoce el procedimiento estadístico


para probar hipótesis y análisis de
varianza con inferencias de dos
proporciones, de dos muestras
independientes y dependientes.
Prueba de hipótesis acerca de dos medias
muestras independientes
σ1 y σ2 desconocidas y (σ1 = σ2)   1 − 𝜇 2 𝑖𝑔𝑢𝑎𝑙 𝑎 0)
(𝜇

  ( ´𝑥1 − ´𝑥 2 ) − ( 𝜇1 − 𝜇2) ( 𝑛 1 −1 ) 𝑠21 +(𝑛 2 −1) 𝑠 22


t=  2
𝑠 𝑝=
𝑠2𝑝 𝑠 2𝑝 (𝑛¿¿ 1 −1)+(𝑛¿¿ 2 −1)¿ ¿

√ +
𝑛1 𝑛2
gl = n1 + n2 - 2

= Media poblacional  
   2
1 = Desviación estándar poblacional
n1 = Ta maño de la muestra n2
= Media muestral
= Desviación estándar muestral
Requisitos

1.1 y 2 desconocidas (Con suposición de


igualdad)
2. Dos muestras independientes
3. Ambas muestras son aleatorias simples.
4. Tamaño de la muestras grandes:
n1 > 30
n2 > 30

El Valor de P y el Valor crítico se hallan en la tabla t


Ejercicio: Prueba de hipótesis sobre la eficacia de la
humedad en infecciones respiratorias asumiendo (σ1 = σ2)

En un ensayo aleatorizado y controlado realizado con niños que padecían


infecciones respiratorias virales, 46 niños fueron tratados con bajos
niveles de humedad, mientras que otros 46 niños fueron tratados con
altos niveles de humedad. Los investigadores utilizaron la puntuación
Westley Croup para evaluar los resultados después de una hora.
El grupo con bajo nivel de humedad tuvo una puntuación media de 0,98
con una desviación estándar de 1,22 y el grupo con alto nivel de humedad
tuvo una puntuación media de 1,09 con una desviación estándar de 1,11.
Utilice un nivel de significancia de 0,05 para someter a prueba la
afirmación de que los dos grupos provienen de poblaciones con la misma
media.

¿Qué sugiere el resultado acerca del tratamiento común con humedad?


Estimación del intervalo de confianza de
µ1 - µ2: Muestras independientes
σ1 y σ2 desconocidas y (σ1 = σ2)
La estimación del intervalo de confianza de la diferencia µ1 - µ2 es:

 
𝑠2𝑝 𝑠2𝑝
E=𝑡 ∝
2 √ +
𝑛1 𝑛 2
 2
𝑠 𝑝=
( 𝑛 1 −1 ) 𝑠21 +(𝑛 2 −1) 𝑠 22
(𝑛¿¿ 1 −1)+(𝑛¿¿ 2 −1)¿ ¿

𝑥 ¿ ¿ 1 − ´𝑥 2) − 𝐸<( μ 1  –  μ
 ( ´ 2)<( ´𝑥 ¿ ¿ 1 − ´𝑥 2)+ 𝐸 ¿ ¿

gl = n1 + n2 - 2
Ejercicio: Intervalo de confianza para alquitrán
en cigarrillos (σ1 = σ2)

El contenido medio de alquitrán en una muestra aleatoria


simple de 25 cigarrillos tamaño grande sin filtro es de 21,1 mg,
con una desviación estándar de 3,2 mg. El contenido medio de
alquitrán de una muestra aleatoria simple de 25 cigarrillos de
100 mm con filtro es de 13,2 mg, con una desviación estándar
de 3,7 mg.
Construya un intervalo de confianza del 90% para la diferencia
entre el contenido medio de alquitrán de los cigarrillos
tamaño grande sin filtro y el contenido medio de alquitrán de
los cigarrillos de 100 mm con filtro.

¿El resultado sugiere que los cigarrillos de 100 mm con filtro contienen
menos alquitrán que los cigarrillos tamaño grande sin filtro?
Ejercicio: Intervalo de confianza para alquitrán
en cigarrillos (σ1 = σ2)

El contenido medio de alquitrán en una muestra aleatoria


simple de 25 cigarrillos tamaño grande sin filtro es de 21,1 mg,
con una desviación estándar de 3,2 mg. El contenido medio de
alquitrán de una muestra aleatoria simple de 25 cigarrillos de
100 mm con filtro es de 13,2 mg, con una desviación estándar
de 3,7 mg.
Utilice un nivel de significancia de 0,05 para someter a prueba
la afirmación de que los cigarrillos tamaño grande sin filtro
tienen un contenido medio de alquitrán mayor que el de los
cigarrillos de 100 mm con filtro.

¿Qué sugiere el resultado acerca de la eficacia de los filtros


de los cigarrillos?.
Ejercicio - Prueba de hipótesis para
cheques y cobros
Se reunió una muestra aleatoria simple de los centavos de
100 cheques y de 100 cobros con tarjeta de crédito. Los
centavos de los cheques tienen una media de 23,8 centavos
y una desviación estándar de 32,0 centavos. Los centavos de
los cobros con tarjeta de crédito tienen una media de 47,6
centavos y una desviación estándar de 33,5 centavos.

 Utilice un nivel de significancia de 0,05 para someter a


prueba la afirmación de que los centavos de los montos de
los cheques tienen una media que es menor que la media
de los centavos de los cobros con tarjeta de crédito. Dé
una razón que explique la diferencia.
Ejercicio -Sexo y conteo de glóbulos en la
sangre
A continuación se presentan los conteos de glóbulos blancos de
muestras aleatorias simples de hombres y mujeres.
a. Utilice un nivel de significancia de 0,01 para someter a prueba la
afirmación de que los hombres y las mujeres tienen conteos medios
diferentes de glóbulos blancos.
b. Construya un intervalo de confianza del 99% para la diferencia entre el
conteo medio de glóbulos blancos de hombres y mujeres. Con base en el
resultado, ¿parece que hay una diferencia?
Mujeres:
8.90 6.50 9.45 7.65 6.40 5.15 16.60 5.75 11.60 5.90 9.30 8.55 10.80
4.85 4.90 8.75 6.90 9.75 4.05 9.05 5.05 6.40 4.05 7.60 4.95 3.00
9.10
Hombres:
5.25 5.95 10.05 5.45 5.30 5.55 6.85 6.65 6.30 6.40 7.85 7.70 5.30
6.50 4.55 7.10 8.00 4.70 4.40 4.90 10.75 11.00 9.60
Prueba de hipótesis acerca de dos medias
muestras independientes
σ1 y σ2 Conocidas

 
( ´𝑥1 − ´𝑥 2 ) − ( 𝜇1 − 𝜇2 )
z= 𝑇  𝑎𝑏𝑙𝑎 𝐴 −2
2 2
𝜎 𝜎
√ +
1
𝑛1 𝑛 2
2

= Media poblacional  
   2
1 = Desviación estándar poblacional
n1 = Ta maño de la muestra n2
= Media muestral
= Desviación estándar muestral
Requisitos

1.1 y 2 son conocidas

2. Dos muestras independientes


3. Ambas muestras son aleatorias simples.
4. Tamaño de la muestras grandes:
n1 > 30
n2 > 30
El Valor de P y el Valor crítico se hallan en la tabla z
Estimación del intervalo de confianza de
µ1 - µ2: Muestras independientes

σ1 y σ2 Conocidas
La estimación del intervalo de confianza de la diferencia µ1 - µ2 es:

 
𝜎 21 𝜎 22
E=𝑧 ∝
2 √ +
𝑛1 𝑛 2

𝑥 ¿ ¿ 1 − ´𝑥 2) − 𝐸<( μ 1  –  μ
 ( ´ 2)<( ´𝑥 ¿ ¿ 1 − ´𝑥 2)+ 𝐸 ¿ ¿
Distribución a partir de datos
apareados (dependientes)

  ´ − 𝜇𝑑
𝑑
t=
𝑠𝑑 gl = n - 1

√𝑛

= Valor medio de las diferencias d para la población de todos los datos


   pareados
d = Diferencia individual entre los dos valores de un par de datos.
= Valor medio de las diferencias d para los datos muestrales pareados.
= Desviación estándar de las diferencias d para la muestra de datos
pareados.
n = Número de pares de datos
Requisitos

1. Los datos muestrales son dependientes.

2. Las muestras son aleatorias simples

3. Cualquiera o ambas de estas condiciones se


satisfacen: el número de datos pareados de datos
muestrales es grande (n > 30) o los pares de valores
tienen diferencias que provienen de una población
con una distribución aproximadamente normal.
El Valor de P y el Valor crítico se hallan en la tabla t
EJEMPLO: Prueba de hipótesis del supuesto aumento de
peso de estudiantes de primer año

El conjunto incluye pesos de estudiantes universitarios,


medidos en los meses de septiembre y abril de su primer año
de estudios. Utilice los datos muestrales con un nivel de
significancia de 0,05 para someter a prueba la afirmación de
que, para la población de estudiantes, el cambio medio de peso
desde septiembre hasta abril es igual a 0 kg.

Medidas del peso (kg) de estudiantes en su primer año


Peso en abril 66 52 68 69 71
Peso en setiembre 67 53 64 71 70
Método tradicional
Paso 1
 Determinar la afirmación µd = 0

Paso 2
 El opuesto de la afirmación µd ≠ 0

Paso 3
 Si µd = 0 (no contiene la igualdad, entonces es H1)

Ho: µd = 0
H1: µd ≠ 0
Método tradicional
Paso 4
 Seleccionamos  = 0,05

Paso 5
 Estimamos el valor de t en tabla. t = ±2,776 gl = n-1 = 4
Paso 6
Medidas del peso (kg) de estudiantes en su primer año
Peso en abril 66 52 68 69 71
Peso en setiembre 67 53 64 71 70
-1 -1 4 -2 1
𝑑´
 

𝑑´ =0,20
    𝑠 𝑑 =2 , 387
Método tradicional
Paso 7
 Seleccionamos  = 0,05

  ´ − 𝜇
𝑑   0,20 − 0
𝑑
t= t= =0,18 7
𝑠𝑑 2 , 387
√𝑛 √5

No se
rechaza la
hipótesis
nula
Estimación del intervalo de confianza de µd
(Muestras Dependientes)
Muestras dependientes
La estimación del intervalo de confianza de la diferencia µd es:

 
𝑠𝑑
E =𝑡 ∝ /2
√𝑛

  ´ ❑ − 𝐸 < μ d <𝑑
𝑑 ´ ❑+ 𝐸
EJEMPLO: Prueba de hipótesis del supuesto aumento de
peso de estudiantes de primer año

El conjunto incluye pesos de estudiantes universitarios,


medidos en los meses de septiembre y abril de su primer año
de estudios. Utilice los datos muestrales de con un nivel de
significancia de 0,05 para someter a prueba la afirmación de
que, para la población de estudiantes, el cambio medio de peso
desde septiembre hasta abril es igual a 0 kg.

Medidas del peso (kg) de estudiantes en su primer año


Peso en abril 66 52 68 69 71
Peso en setiembre 67 53 64 71 70
Método de intervalo de
confianza
Paso 1
 Determinar la afirmación µd = 0

Paso 2
 El opuesto de la afirmación µd ≠ 0

Paso 3
 Si µd = 0 (no contiene la igualdad, entonces es H1)

Ho: µd = 0
H1: µd ≠ 0
Método de intervalo de
confianza


  = 0,05   𝑠𝑑
E =𝑡 ∝ / 2
√𝑛
 n =5
 t α/2 = ±2,776   2, 387
 gl = n-1 = 4 𝐸=2,776 =2,963
√5

  ´
𝑑 − 𝐸 < μ d < ´ +𝐸
𝑑
❑ ❑
No se
  0 , 2− 2,963 < μ d <0,2 +2,863rechaza la
hipótesis
  − 𝟐 , 𝟖 < 𝝁 d <𝟑 , 𝟐 nula
Ejemplo - Rendimiento de automóviles

A continuación se presentan las cantidades medidas


de consumo de combustible (en millas/gal) de una
muestra de automóviles (Acura RL, Acura TSX, Audi A6,
BMW 525i). Someter a prueba la afirmación de que
los datos muestrales pareados provienen de una
población en la que la diferencia media es µd = 0.

Consumo de combustible en la ciudad 18 22 21 21


Consumo de combustible en carretera 26 31 29 29
Ejemplo - ¿El IMC cambia durante el
primer año de la universidad?
A continuación se presentan los índices de masa
corporal (IMC). Se midió el IMC de cada estudiante en
septiembre y en abril del primer año de estudios. Utilice
un nivel de significancia de 0,05 para someter a prueba
la afirmación de que el cambio medio en el IMC de todos
los estudiantes es igual a 0.
¿Parece que el IMC cambia durante el primer año de estudios?

IMC en abril 20,15 19,24 20,77 23,85 21,32


IMC en septiembre 20,68 19,48 19,59 24,57 20,96
Ejemplo - ¿El viernes 13 es de mala suerte?

Investigadores reunieron datos del número de admisiones


hospitalarias por accidentes automovilísticos; a continuación
se incluyen los resultados de los días viernes 6 del mes y del
siguiente viernes 13 del mismo mes. Utilice un nivel de
significancia de 0,05 para someter a prueba la afirmación de
que cuando el día 13 de un mes cae en viernes, el número de
admisiones hospitalarias por accidentes automovilísticos no
se ve afectado.

Viernes 6 9 6 11 11 3 5
Viernes 13 13 12 14 10 4 12
Comparación de la variación en
dos muestras (Homogeneidad)
Someter a prueba una afirmación acerca de dos
desviaciones estándar o varianzas poblacionales.

Grados de libertad del numerador = n1 - 1


Grados de libertad del denominador = n2 - 1

  = La mayor de las dos varianzas muestrales


n1 = Tamaño de la muestra que tiene la varianza más grande
= Varianza de la población de donde se obtiene la muestra con varianza más grande
Cálculo de valores F críticos

Para un valor crítico F correspondiente a un nivel de significancia


de 0,05, Utilice el área de cola derecha de 0,025 ó 0,05
 Prueba de dos colas : Utilice 0,025 en la cola derecha.
 Prueba de una cola : Utilice ∝= 0,05 en la cola derecha.

Tabla A-5
Interpretación del estadístico de
prueba F
 
Si en realidad las dos poblaciones tienen varianzas
iguales, entonces la proporción tiende a 1, puesto que
los valores de tienden a acercarse.
Pero si las dos poblaciones tienen varianzas radicalmente
diferentes, tienden a ser números muy distintos.

 Un valor de F cercano a 1 será evidencia a favor de la


conclusión de que .

 Los valores de F grandes son evidencia en contra de


Ejemplo: Comparación de la variación en
los pesos de monedas de 25 centavos
En el conjunto de datos se incluyen los pesos (en gramos) de monedas
de 25 centavos de dólar acuñadas antes de 1964, y los pesos de
monedas de 25 centavos acuñadas después de 1964. A continuación se
presentan los estadísticos muestrales. Al diseñar máquinas
expendedoras para monedas, debemos tomar en cuenta las
desviaciones estándar de las monedas de 25 centavos acuñadas antes
y después de 1964. Utilice un nivel de significancia de 0.05 para
someter a prueba la afirmación de que los pesos de las monedas de 25
centavos acuñadas antes de 1964 y los pesos de las monedas de 25
centavos acuñadas después de 1964 provienen de poblaciones con la
misma desviación estándar.
Solución

En cuanto a los valores críticos en esta prueba de dos colas, nos remitimos a
la tabla A-5 para el área de 0,025 en la cola derecha.

La varianza más grande se coloca en el numerador para el estadístico de


prueba F.
En la tabla de A-5 vemos que el valor crítico de F está entre 1,8752 y 2,0739,
que se acerca mucho más a 1,8752
Solución

SE RECHAZA Ho

Existe evidencia suficiente para sustentar el rechazo de la afirmación de que las dos
desviaciones estándar son iguales. La variación entre los pesos de las monedas de 25
centavos acuñadas después de 1964 es significativamente diferente de la variación
entre los pesos de las monedas de 25 centavos acuñadas antes de 1964
Prueba de hipótesis de varianzas iguales

Tratamiento con cinc Afirmación: Los pesos de bebés


nacidos de madres que recibieron placebos varían más que los
pesos de los bebés nacidos de madres que recibieron
suplementos de cinc.
A continuación se resumen los resultados muestrales. Someta
a prueba la afirmación enunciada y utilice un nivel de
significancia 𝞪 = 0,05 y suponga que todas las poblaciones
están distribuidas normalmente.
¿ Qué ¿ Cómo
aprendí ? aprendí ?

¿ Qué me
¿ Para qué falta
aprendí ? aprender ?

También podría gustarte