Está en la página 1de 19

ESTADISTICA INFERENCIAL

PRUEBAS DE HIPOTESIS CON DOS MUESTRAS

ESTADISTICA INFERENCIAL
AREA ESTADISITCA
DEPARTAMENTO DE CIENCIAS EXACTAS - ESPE
Semana # 10

Contenido
Título Pruebas de hipótesis con una muestra

Duración 10 horas

Información general Pruebas de hipótesis para medias tanto para distribución normal como
para t de student y para proporciones, planteamiento de las hipótesis,
establecimiento del error con el que se va a trabajar, selección del
estadístico de prueba, construcción de la regla de decisión,
determinación del valor calculado muestral , análisis, interpretación para
la toma de decisiones, cálculo del valor p.

Objetivo Desarrollar en el estudiante la habilidad de diferenciar, seleccionar,


construir y utilizar una prueba de hipótesis para la toma de decisiones y
aplicarlas en ejercicios prácticos de la administración.

Prueba de Hipótesis con dos muestras


Como se aprendió en las pruebas de hipótesis con una muestra, esta se basa en una
distribución de medias muestrales o de proporciones muestrales para la selección del
estadístico de prueba; de igual manera para la prueba de hipótesis con dos muestras,
se basa en la distribución de las diferencias de las medias muestrales (𝑥𝑥̅ 1 − 𝑥𝑥̅ 2) , o
la diferencia de las proporciones muestrales se (𝑝𝑝1 − 𝑝𝑝2), para la selección del
estadístico de prueba; este modelo permite engranar las dos muestras que se utilizan
para decidir si las medias o proporciones de dos poblaciones son iguales

Prueba de hipótesis con dos muestras independientes con


muestras grandes
Para el análisis muestral, se deben diferenciar claramente si las dos muestras son
independientes o dependiente; y si, la toma de la muestra es grande o pequeña en la
misma población o dos poblaciones diferentes; por ejemplo una compañía,
experimenta con dos diferentes tipos de pintura, para ver si se puede modificar el

1
Semana # 10

tiempo de secado de una pintura para uso residencial; cada mezcla es probada un
determinado número de veces y comparados posteriormente entre los
tiempos medios de secado de las dos muestras. Una de las muestras al parecer es
superior, ya que su tiempo medio de secado es 30 minutos menor que la otra muestra.
Pero, ¿son realmente diferentes los tiempos medios de secado de las dos pinturas, o
esa diferencia muestral es nada más que la variación aleatoria que se espera, aun
cuando las dos fórmulas presentan idénticos tiempos medios de secado?; es decir las
diferencias casuales, se deben distinguir de las diferencias reales.
La hipótesis nula puede establecer que las dos poblaciones tienen medias iguales,
cuando la diferencia de las medias es igual a cero o si esa diferencia no es igual a
cero, las medias no son iguales; para ambos casos son muestras independientes; y
el tamaño de la muestra debe ser grande. Para realizar una prueba de hipótesis con
muestras independientes y gran tamaño mayor que 30, es necesario, suponer que la
distribución de las diferencias de las medias de las muestras seguirá una distribución
normal, puesto que, si las dos distribuciones de las medias muestrales siguen la
distribución normal por separado, la distribución de sus diferencias también seguirá
la distribución normal

Dentro de este análisis muestral, en lo referente a la variabilidad (varianzas de las


diferencias) se establece que para engranar las dos muestras es necesario sumar
cada una de las varianzas de cada muestra y para realizar la prueba de hipótesis es
necesario conocer las desviaciones estándar y las muestras no deben tener ninguna
relación.
Para elaborar una prueba de hipnosis con dos muestras se sigue el mismo
procedimiento que se utilizó para las pruebas con una muestra
Procedimiento de cinco pasos: este proceso sistematiza una prueba una
hipótesis. Al llegar al quinto paso aporta una clase de evidencia “más allá de la
duda razonable”, en forma similar a un proceso judicial. El gráfico 2.1, resume los
pasos del método tradicional.

2
Semana # 10

A continuación, se analiza cada paso.

Paso 1: Plantear hipótesis

Existen dos clases de hipótesis:

 Hipótesis nula (denotada por Ho) es una declaración acerca del valor del
parámetro de la población y debe contener la condición de igualdad escrita
con los símbolos =, ≥ o ≤. En el caso de la media, la hipótesis nula se
expresa en una de las tres formas:

H0 : µ1 = µ2 H0 : µ1 ≥ µ2 H0 : µ1 ≤ µ2

 Hipótesis alternativa (denotada por H1) es la declaración que debe ser


verdad si la hipótesis nula es falsa. En el caso de la media, la hipótesis
nula se enuncia en una de las tres formas:

H1 : µ1 ≠ µ2 H1 : µ > µ2 H1 : µ < µ2

Paso 2: Seleccionar el nivel de significancia

Al probar una hipótesis nula, se llega a la conclusión de aceptarla o rechazarla.


Tales conclusiones a veces son correctas y a veces equivocadas. Hay dos tipos
de errores que se pueden cometer. En la tabla 2.1 se resumen las diferentes
posibilidades.

Tabla 2.1 Errores tipo I y tipo II

Estado real de la naturaleza

La hipótesis nula La hipótesis nula es


es verdadera falsa

Se decide Error Tipo I


Decisión rechazar la (rechazar una Decisión Correcta
hipótesis nula hipótesis nula
verdadera)

3
Semana # 10

Error Tipo II
No se rechaza la
Decisión Correcta (no rechazar una
hipótesis nula
hipótesis nula falsa)

Error tipo I: es el error de rechazar la hipótesis nula, dado que es verdadera. Se


llama nivel de significancia y se denota por la letra alfa (α). Sirve para
determinar el valor crítico del estadístico de prueba.
Error tipo II: es el error de no rechazar la hipótesis nula, dado que es falsa. Se
expresa por la letra beta (β).
Paso 3: Determinar el estadístico de prueba

La selección del estadístico de prueba, parte de una distribución muestral de


medias o proporciones muestrales cuyo comportamiento se asemeja a una
distribución de probabilidades conocida y cuya selección es en base al teorema
del límite central, como sigue
Los siguientes son los supuestos para probar una hipótesis respecto a la media
de una sola población:

 La muestra es grande (n>30), así que el teorema de límite central aplica y


se usa la distribución normal.
 Al aplicar el teorema del límite central, se puede usar la desviación
estándar de la muestra s como un estimador de la desviación estándar
poblacional σ siempre que se desconozca σ.
 Un valor p es la probabilidad de que la estadística de prueba sea más
extrema que la que se obtiene cuando la hipótesis nula es verdadera.
 Si se conoce la desviación estándar de la población, 𝜎𝜎, el estadístico de
prueba sigue la distribución normal estándar, z, y se determina por:
 Si 𝜎𝜎 no se conoce, pero el tamaño de la muestra es mayor a 30, la
desviación estándar de la muestra, s, remplaza a 𝜎𝜎 :

El estadístico de prueba para diferencias de medias es como sigue:


X1 − X 2 𝜎𝜎2 𝜎𝜎2
Z0 = 𝜎𝜎𝑥𝑥̅21 −𝑥𝑥̅2 = 𝑛𝑛1 + 𝑛𝑛2 (varianza de la diferencia)
σ 21 σ 22 1 2
+
n1 n2

Donde:

4
Semana # 10

X 1 = media de la muestra 1

X 2 = media de la muestra 2

σ 21 = varianza de la población 1
σ 2 2 = varianza de la población 2
n1 = tamaño de la muestra 1

n2 = tamaño de la muestra 2

La hipótesis nula H0 se rechaza si:


Z 0 > Zα 2 o Z 0 < −Zα 2

Donde
Z0 = Valor calculado del estadístico de prueba
Z α 2 = Valor obtenido de las tablas (valor crítico)

El estadístico de prueba para diferencias de proporciones, es como sigue: Para


realizar la prueba, suponga que la muestra es lo bastante grande para que la
distribución normal sirva como una buena aproximación a la distribución binomial. El
estadístico de prueba sigue la distribución normal estándar. El valor de z se calcula
a partir de la formula siguiente:

𝑝𝑝1 − 𝑝𝑝2
𝑍𝑍 =
𝑝𝑝𝑐𝑐 ∗ (1 − 𝑝𝑝𝑐𝑐 ) 𝑝𝑝𝑐𝑐 ∗ (1 − 𝑝𝑝𝑐𝑐 )
� +
𝑛𝑛1 𝑛𝑛2

𝑥𝑥1 + 𝑥𝑥2
𝑝𝑝𝑐𝑐 =
𝑛𝑛1 + 𝑛𝑛2

Donde:

n1 es el número de observaciones en la primera muestra.


n2 es el número de observaciones en la segunda muestra.
p1 es la proporción en la primera muestra que posee la característica.
p2 es la proporción en la segunda muestra que posee la característica.

5
Semana # 10

pc es la proporción conjunta que posee la característica en las muestras


combinadas.
X1 es el número que posee la característica en la primera muestra.
X2 es el número que posee la característica en la segunda muestra.
Paso 4: Establecer la regla de decisión

Una regla de decisión estable las condiciones con las cuales se recha la hipótesis
nula y la condiciones con las cuales no se rechaza la hipótesis nula. La región
crítica, es el conjunto de todos los valores de la estadística de prueba que harían
rechazar la hipótesis nula. El valor crítico, es el valor o valores que separan la
región crítica de los valores de la estadística de prueba que harían rechazar la
hipótesis nula.

En el gráfico 2.2, pruebas de significancia, se resume una verificación útil. Las


colas de una distribución son las regiones extremas delimitadas por los valores
críticos. En las pruebas de dos colas, el nivel de significancia α se divide
equitativamente entre las dos colas que constituyen la región crítica.
Paso 5: Conclusión

6
Semana # 10

La afirmación original a veces se convierte en hipótesis nula y otras veces se


convierte en hipótesis alternativa. El proceso requiere que se pruebe la hipótesis
nula. Para ello se compara el estadístico de prueba (calculado) con el estadístico
crítico (que se obtiene de la tabla). En este curso, se usa no rechazar la
hipótesis nula, en lugar de aceptar la hipótesis nula. Así, en la tabla 2.2 se
resumen las reglas de decisión.
Tabla 2.2 Tipo de prueba y regla de decisión

Tipo de
Regla de decisión Conclusión
Prueba

-Zcrit ≤ zcal ≤ + zcrit


Dos colas o
-tcrit ≤ tcal ≤ + tcrit
Zcal ≥ zcrit
Cola
o no rechazar la hipótesis nula
Izquierda
tcal ≥ tcrit

Zcal ≤ zcrit
Cola
o
Derecha
tcal ≤ tcrit

5.3. Prueba de hipótesis sobre la diferencia de medias de muestras


pequeñas e independientes
Los siguientes son los supuestos para probar una hipótesis respecto a la
diferencia de media de dos poblaciones:

La distribución t de student, se utiliza como el estadístico de la prueba cuando:

 La población muestreada se aproxima a la distribución normal.


 Las muestras son independientes
 No se conoce la desviación estándar de la población.
 Se supone que las desviaciones estándares son iguales
 La muestra contiene menos de 30 observaciones.

7
Semana # 10

La fórmula siguiente se emplea para agrupar las desviaciones estándares de las


muestras (desviación estándar conjunta)

(n1 − 1)S12 + (n2 − 1)S 22


Sp =
n1 + n2 − 2

Y el estadístico de prueba t0 o t simplemente, utilizado para muestras


independientes es:

X1 − X 2
t0 =
1 1
Sp +
n1 n2

Donde:

𝑠𝑠12 es la varianza de la primera muestra.


𝑠𝑠22 es la varianza de la segunda muestra.

𝑥𝑥1
��� es la media de la primera muestra.

𝑥𝑥2
��� es la media de la segunda muestra.

n1 es el número de observaciones en la primera muestra.


n2 es el número de observaciones en la segunda muestra.

Sp es el estimado conjunto de la desviación estándar de la población.

(n1+n2-2) es el grado de libertad utilizado para entrar a la tabla

Si t 0 > tα 2,n1 + n2 − 2 o si t 0 < −tα 2,n1 + n2 − 2 , rechazamos H 0 : µ1 = µ 2

8
Semana # 10

Si las muestras son independientes y con desviaciones estándares


desconocidas, pero se suponen desiguales:

Se utiliza las fórmulas del estadístico de prueba como sigue, no se debe olvidar
que se está tratando con muestras pequeñas

𝑥𝑥
���1 − ���
𝑥𝑥2
𝑡𝑡 =
𝑆𝑆12 𝑆𝑆22

𝑛𝑛1 + 𝑛𝑛2

Y el grado de libertad para ingresar a la tabla es calculado con el fin de disminuir


y ajustar el error al suponer que las desviaciones son desiguales y este valor
calculado debe redondearse hacia abajo en forma entera

2
𝑆𝑆 2 𝑆𝑆 2
� 1 + 2�
𝑛𝑛1 𝑛𝑛2
𝑔𝑔𝑔𝑔 = 2 2
𝑆𝑆 2 𝑆𝑆 2
� 1� � 2�
𝑛𝑛1 𝑛𝑛2
𝑛𝑛1 − 1 + 𝑛𝑛2 − 1

Donde:

𝑠𝑠12 es la varianza de la primera muestra.


𝑠𝑠22 es la varianza de la segunda muestra.

𝑥𝑥1
��� es la media de la primera muestra.

𝑥𝑥2
��� es la media de la segunda muestra.

n1 es el número de observaciones en la primera muestra.


n2 es el número de observaciones en la segunda muestra.

9
Semana # 10

gl es el grado de libertad utilizado para entrar a la tabla

5.4. Prueba de hipótesis sobre la diferencia de medias de muestras


pequeñas y dependientes

Para realizar una prueba de hipótesis es importante identificar si las muestras son
dependientes, es decir que las muestras están relacionadas entre si, o que dependen
una de la otra, por ejemplo, en una empresa de servicios de capacitación donde se
evalúa el grado de conocimiento antes del proceso de capacitación y luego se
compara realizando nuevamente el mismo grupo después de la evaluación para
observar el grado de aprendizajes obtenido; a estas se le llaman muestras pareadas
y que estas poseen una intervención dentro del proceso de capacitación es decir se
investiga si la media de la distribución de las diferencias en el grado de aprendizaje
es 0 y se supone que la distribución de las diferencias de la población sigue una
distribución normal.

Las hipótesis de prueba en torno a la igualdad µ1 yµ 2 pueden realizarse efectuando


una prueba t de una muestra en µ D . = 0 o (µ1-µ2) = 0 Específicamente, probar
H 0 : µ1 = µ 2 contra H 1 : µ1 ≠ µ 2 es equivalente a probar

Ho: µd = 0
H1: µd ǂ 0

Para este caso el estadístico de prueba se detalla como sigue:


𝑑𝑑̅
𝑡𝑡 =
𝑆𝑆𝑆𝑆
√𝑛𝑛

2
∑�𝑑𝑑 − 𝑑𝑑̅ �
𝑆𝑆𝑆𝑆 = �
𝑛𝑛 − 1

Donde:

𝑑𝑑̅ es la media de la diferencia entre las observaciones apareadas.

10
Semana # 10

Sd es la desviación estándar de las diferencias entre las observaciones


apareadas.
n es el número de observaciones apareadas.
gl es n -1
Ejemplo1: Se emplean dos máquinas para llenar botellas de plástico con un volumen neto
de 16 onzas. El proceso de llenado puede suponerse que es una distribución normal, con
desviaciones estándar poblacional de σ 1 = .015 y σ 2 = .018 . Ingeniería de calidad sospecha
que ambas máquinas llenan hasta el mismo volumen neto, sin importar que este volumen sea
o no de 16 onzas. Se toma una muestra aleatoria a la salida de cada máquina.

¿Piensa usted que ingeniería de calidad está en lo correcto? Utilizando α = .05 .


máquina 1 máquina 2
16.03 16.02
16.04 15.97
16.05 15.96
16.05 16.01
16.02 15.99
16.01 16.03
15.96 16.04
15.98 16.02
16.02 16.01
15.99 16

1) Se plantea la hipótesis:

H 0 : µ1 = µ 2

H 1 : µ1 ≠ µ 2
2) Se establece con que error se va a trabajar:

Error tipo I α = 0.05


3) Se selecciona el estadístico de prueba:

El problema nos entrega como dato las desviaciones estándar poblacional entonces
trabajamos con una distribución normal

X1 − X 2
Z0 =
σ 21 σ 22
+
n1 n2

11
Semana # 10

4) Se construye la regla de decisión para dos colas (bilateral)

0 475

2.5% 2.5%
Z crítico
Z crítico
-1.96 Z cal
1.96
1.34
5) Se determina el Z calculado

Calculando las medias de cada máquina obtenemos X 1 = 16.015, X 2 = 16.005 .

X1 − X 2 16.015 − 16.005
Z0 = = = 1.34
σ 21 σ 22 .015 2 .018 2
+ +
n1 n2 10 10

Z α 2 = Z.025 = 1.96

El uso de la tabla es el siguiente:


1-.025 =.975 buscando el valor de Z correspondiente a .975 encontramos Z = 1.96

Utilizando el criterio de decisión Z 0 > Z α 2 para rechazar la hipótesis nula H0, Podemos
observar que 1.34 no es mayor que 1.96. por lo cual no rechazamos H0. No existe suficiente
evidencia estadística para pensar que las medias son diferentes. Es decir que más medias
poblacionales son iguales
6) Como conclusión las máquinas están llenando con la misma media de líquido no se
debe parar la producción porque las maquinas no están desajustadas

Una organización llevo a cabo dos encuestas idénticas en 1990 y en 2000. Una de las
preguntas planteadas a las mujeres eran “¿la mayoría de los hombres son amables, atentos
y gentiles?”.

Ejemplo2:

12
Semana # 10

En 1990, de 3000 mujeres interrogadas, 2010 dijeron que si. En 2000, 1530 de las 3000
encuestas contestaron afirmativamente. Al nivel de significancia 0,05, ¿puede concluirse que
en el año 2000 las mujeres creen que los hombres son menos amables, atentos y gentiles
que en el 1990?

Datos:
1990 2000
p1= 2010/3000 = 0,67 p2= 1530/3000=0,51
n = 3000 n = 3000

1.- Planteamiento de la hipótesis

Ho: π1 ≤ π2
H1: π1 > π2
2.- Nivel de significancia

α = 0,05

3.- Valor del estadístico de prueba

Utilización de la distribución Z por tener muestras grandes

4. Formular la regla de decisión

0.45

5%

Z crítico
Z cal
1.645
12.70

5. Cálculo de resultados y tomar la decisión

13
Semana # 10

Como el valor Z es 12,70 es mayor a Z crítico que es de 1,64 se rechaza la hipotesis


nula Ho y se acepta la H1, se dice que en el año 2000 la proporción de los hombres
serán menos amables, atentos y gentiles que en el año 1990.

Ejemplo 3:
Se están investigando dos métodos para producir gasolina a partir de petróleo crudo, se
supone que los rendimientos de ambos procesos se distribuyen normalmente y las
desviaciones son desiguales. Los siguientes datos de rendimiento se han obtenido de la
planta piloto.

Proceso Rendimiento %

1 24.2 26.6 25.7 24.8 25.9 26.5

2 21.0 22.1 21.8 20.9 22.4 22.0

¿Hay alguna razón para creer que el proceso 1 tiene un rendimiento medio mayor?
1.- Planteamiento de La hipótesis:
Ho: µ1 ≤ µ2
H1: µ1 > µ2
2.- Establecer el nivel de significancia:
Se trabaja con un error tipo I α =0.05
3.- Selección del estadístico de prueba
𝑥𝑥
���1 − ���
𝑥𝑥2
𝑡𝑡 =
𝑆𝑆12 𝑆𝑆22

𝑛𝑛1 + 𝑛𝑛2

14
Semana # 10

4.- Construcción de la regla de decisión: es unilateral derecha (observe H1)

5%
t crítico t cal
1.8595 8.48

Se calcula el grado de libertad porque se tiene desviaciones estándar desiguales

0.9017 0.3760 2
� �
6 + 6
𝑔𝑔𝑔𝑔 = 2 = 8.55 ≅ 8
0.9017 0.3760 2
� � � �
6 + 6
6−1 6−1

5.- Se determina el t calculado:

Obtención de la media y la varianza para ambos procesos:

x1 = 25.62
x 2 = 21.70
S12 = .9017
S 22 = .3760
X1 − X 2 25.62 − 21.70
t0 = = = 8.48
S12 S 22 .9017 .376
+ +
n1 n2 6 6

Buscando el valor en la tabla t encontramos t.05,8 = 1,8595, mediante el criterio de rechazo


para una cola t0>t.05,8, 8.48>1.8595, por lo tanto, rechazamos la hipótesis nula, y aceptamos
la hipótesis alterna,

15
Semana # 10

5. Conclusión: el proceso 1 tiene mayor rendimiento que el proceso 2.

Ejemplo 4:
Un fabricante desea comparar el proceso de armado común para uno de sus
productos, con un método propuesto que supuestamente reduce el tiempo de
armado. Se seleccionaron ocho trabajadores de la planta de armado y se les pidió
que armaran las unidades con ambos procesos. Los siguientes son los tiempos
observados en minutos.
Trabajador Proceso actual Proceso propuesto
1 38 30
2 32 32
3 41 34
4 35 37
5 42 35
6 32 26
7 45 38
8 37 32

En α = .05 , ¿existe alguna razón para creer que el tiempo de armado para el
proceso actual es mayor que el método propuesto por más de dos minutos?
1.- Planteamiento de la hipótesis:
Ho: µ1 ≤ µ2 µ1= método común; µ2 = método propuesto
H1: µ1 > µ2

Ho: µd ≤ 0
H1: µd > 0

2.- Nivel de significancia:


α = 0.05
3.- Selección del estadístico de prueba: como son muestras dependientes (existe
intervención)

𝑑𝑑̅
𝑡𝑡 =
𝑆𝑆𝑆𝑆
√𝑛𝑛

16
Semana # 10

4.- Construcción de la regla de decisión:

5%
t crítico t cal
1.895 2.107

5.- Se determina el t calculado:

Trabajador Proceso actual Proceso propuesto Dj (Dj-D)^2


1 38 30 8 10.5625
2 32 32 0 22.5625
3 41 34 7 5.0625
4 35 37 -2 45.5625
5 42 35 7 5.0625
6 32 26 6 1.5625
7 45 38 7 5.0625
8 37 32 5 0.0625
4.75 95.5

D=
∑D j

n = 4.75

(D j − D)
2

SD =
n −1 = 3.69

D 4.75 − 2
t0 =
SD n = 3.69 8 = 2.107

17
Semana # 10

tα ,n −1 = t.05, 7 = 1.895
, debido a que 2.107 > 1.895 rechazamos H0, y aceptamos la H1
6.- Conclusión: el tiempo de armado para el proceso actual es mayor en dos minutos
que el método propuesto.

18

También podría gustarte