Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADISTICA INFERENCIAL
AREA ESTADISITCA
DEPARTAMENTO DE CIENCIAS EXACTAS - ESPE
Semana # 10
Contenido
Título Pruebas de hipótesis con una muestra
Duración 10 horas
Información general Pruebas de hipótesis para medias tanto para distribución normal como
para t de student y para proporciones, planteamiento de las hipótesis,
establecimiento del error con el que se va a trabajar, selección del
estadístico de prueba, construcción de la regla de decisión,
determinación del valor calculado muestral , análisis, interpretación para
la toma de decisiones, cálculo del valor p.
1
Semana # 10
tiempo de secado de una pintura para uso residencial; cada mezcla es probada un
determinado número de veces y comparados posteriormente entre los
tiempos medios de secado de las dos muestras. Una de las muestras al parecer es
superior, ya que su tiempo medio de secado es 30 minutos menor que la otra muestra.
Pero, ¿son realmente diferentes los tiempos medios de secado de las dos pinturas, o
esa diferencia muestral es nada más que la variación aleatoria que se espera, aun
cuando las dos fórmulas presentan idénticos tiempos medios de secado?; es decir las
diferencias casuales, se deben distinguir de las diferencias reales.
La hipótesis nula puede establecer que las dos poblaciones tienen medias iguales,
cuando la diferencia de las medias es igual a cero o si esa diferencia no es igual a
cero, las medias no son iguales; para ambos casos son muestras independientes; y
el tamaño de la muestra debe ser grande. Para realizar una prueba de hipótesis con
muestras independientes y gran tamaño mayor que 30, es necesario, suponer que la
distribución de las diferencias de las medias de las muestras seguirá una distribución
normal, puesto que, si las dos distribuciones de las medias muestrales siguen la
distribución normal por separado, la distribución de sus diferencias también seguirá
la distribución normal
2
Semana # 10
Hipótesis nula (denotada por Ho) es una declaración acerca del valor del
parámetro de la población y debe contener la condición de igualdad escrita
con los símbolos =, ≥ o ≤. En el caso de la media, la hipótesis nula se
expresa en una de las tres formas:
H0 : µ1 = µ2 H0 : µ1 ≥ µ2 H0 : µ1 ≤ µ2
H1 : µ1 ≠ µ2 H1 : µ > µ2 H1 : µ < µ2
3
Semana # 10
Error Tipo II
No se rechaza la
Decisión Correcta (no rechazar una
hipótesis nula
hipótesis nula falsa)
Donde:
4
Semana # 10
X 1 = media de la muestra 1
X 2 = media de la muestra 2
σ 21 = varianza de la población 1
σ 2 2 = varianza de la población 2
n1 = tamaño de la muestra 1
n2 = tamaño de la muestra 2
Donde
Z0 = Valor calculado del estadístico de prueba
Z α 2 = Valor obtenido de las tablas (valor crítico)
𝑝𝑝1 − 𝑝𝑝2
𝑍𝑍 =
𝑝𝑝𝑐𝑐 ∗ (1 − 𝑝𝑝𝑐𝑐 ) 𝑝𝑝𝑐𝑐 ∗ (1 − 𝑝𝑝𝑐𝑐 )
� +
𝑛𝑛1 𝑛𝑛2
𝑥𝑥1 + 𝑥𝑥2
𝑝𝑝𝑐𝑐 =
𝑛𝑛1 + 𝑛𝑛2
Donde:
5
Semana # 10
Una regla de decisión estable las condiciones con las cuales se recha la hipótesis
nula y la condiciones con las cuales no se rechaza la hipótesis nula. La región
crítica, es el conjunto de todos los valores de la estadística de prueba que harían
rechazar la hipótesis nula. El valor crítico, es el valor o valores que separan la
región crítica de los valores de la estadística de prueba que harían rechazar la
hipótesis nula.
6
Semana # 10
Tipo de
Regla de decisión Conclusión
Prueba
Zcal ≤ zcrit
Cola
o
Derecha
tcal ≤ tcrit
7
Semana # 10
X1 − X 2
t0 =
1 1
Sp +
n1 n2
Donde:
𝑥𝑥1
��� es la media de la primera muestra.
𝑥𝑥2
��� es la media de la segunda muestra.
8
Semana # 10
Se utiliza las fórmulas del estadístico de prueba como sigue, no se debe olvidar
que se está tratando con muestras pequeñas
𝑥𝑥
���1 − ���
𝑥𝑥2
𝑡𝑡 =
𝑆𝑆12 𝑆𝑆22
�
𝑛𝑛1 + 𝑛𝑛2
2
𝑆𝑆 2 𝑆𝑆 2
� 1 + 2�
𝑛𝑛1 𝑛𝑛2
𝑔𝑔𝑔𝑔 = 2 2
𝑆𝑆 2 𝑆𝑆 2
� 1� � 2�
𝑛𝑛1 𝑛𝑛2
𝑛𝑛1 − 1 + 𝑛𝑛2 − 1
Donde:
𝑥𝑥1
��� es la media de la primera muestra.
𝑥𝑥2
��� es la media de la segunda muestra.
9
Semana # 10
Para realizar una prueba de hipótesis es importante identificar si las muestras son
dependientes, es decir que las muestras están relacionadas entre si, o que dependen
una de la otra, por ejemplo, en una empresa de servicios de capacitación donde se
evalúa el grado de conocimiento antes del proceso de capacitación y luego se
compara realizando nuevamente el mismo grupo después de la evaluación para
observar el grado de aprendizajes obtenido; a estas se le llaman muestras pareadas
y que estas poseen una intervención dentro del proceso de capacitación es decir se
investiga si la media de la distribución de las diferencias en el grado de aprendizaje
es 0 y se supone que la distribución de las diferencias de la población sigue una
distribución normal.
Ho: µd = 0
H1: µd ǂ 0
2
∑�𝑑𝑑 − 𝑑𝑑̅ �
𝑆𝑆𝑆𝑆 = �
𝑛𝑛 − 1
Donde:
10
Semana # 10
1) Se plantea la hipótesis:
H 0 : µ1 = µ 2
H 1 : µ1 ≠ µ 2
2) Se establece con que error se va a trabajar:
El problema nos entrega como dato las desviaciones estándar poblacional entonces
trabajamos con una distribución normal
X1 − X 2
Z0 =
σ 21 σ 22
+
n1 n2
11
Semana # 10
0 475
2.5% 2.5%
Z crítico
Z crítico
-1.96 Z cal
1.96
1.34
5) Se determina el Z calculado
X1 − X 2 16.015 − 16.005
Z0 = = = 1.34
σ 21 σ 22 .015 2 .018 2
+ +
n1 n2 10 10
Z α 2 = Z.025 = 1.96
Utilizando el criterio de decisión Z 0 > Z α 2 para rechazar la hipótesis nula H0, Podemos
observar que 1.34 no es mayor que 1.96. por lo cual no rechazamos H0. No existe suficiente
evidencia estadística para pensar que las medias son diferentes. Es decir que más medias
poblacionales son iguales
6) Como conclusión las máquinas están llenando con la misma media de líquido no se
debe parar la producción porque las maquinas no están desajustadas
Una organización llevo a cabo dos encuestas idénticas en 1990 y en 2000. Una de las
preguntas planteadas a las mujeres eran “¿la mayoría de los hombres son amables, atentos
y gentiles?”.
Ejemplo2:
12
Semana # 10
En 1990, de 3000 mujeres interrogadas, 2010 dijeron que si. En 2000, 1530 de las 3000
encuestas contestaron afirmativamente. Al nivel de significancia 0,05, ¿puede concluirse que
en el año 2000 las mujeres creen que los hombres son menos amables, atentos y gentiles
que en el 1990?
Datos:
1990 2000
p1= 2010/3000 = 0,67 p2= 1530/3000=0,51
n = 3000 n = 3000
Ho: π1 ≤ π2
H1: π1 > π2
2.- Nivel de significancia
α = 0,05
0.45
5%
Z crítico
Z cal
1.645
12.70
13
Semana # 10
Ejemplo 3:
Se están investigando dos métodos para producir gasolina a partir de petróleo crudo, se
supone que los rendimientos de ambos procesos se distribuyen normalmente y las
desviaciones son desiguales. Los siguientes datos de rendimiento se han obtenido de la
planta piloto.
Proceso Rendimiento %
¿Hay alguna razón para creer que el proceso 1 tiene un rendimiento medio mayor?
1.- Planteamiento de La hipótesis:
Ho: µ1 ≤ µ2
H1: µ1 > µ2
2.- Establecer el nivel de significancia:
Se trabaja con un error tipo I α =0.05
3.- Selección del estadístico de prueba
𝑥𝑥
���1 − ���
𝑥𝑥2
𝑡𝑡 =
𝑆𝑆12 𝑆𝑆22
�
𝑛𝑛1 + 𝑛𝑛2
14
Semana # 10
5%
t crítico t cal
1.8595 8.48
0.9017 0.3760 2
� �
6 + 6
𝑔𝑔𝑔𝑔 = 2 = 8.55 ≅ 8
0.9017 0.3760 2
� � � �
6 + 6
6−1 6−1
x1 = 25.62
x 2 = 21.70
S12 = .9017
S 22 = .3760
X1 − X 2 25.62 − 21.70
t0 = = = 8.48
S12 S 22 .9017 .376
+ +
n1 n2 6 6
15
Semana # 10
Ejemplo 4:
Un fabricante desea comparar el proceso de armado común para uno de sus
productos, con un método propuesto que supuestamente reduce el tiempo de
armado. Se seleccionaron ocho trabajadores de la planta de armado y se les pidió
que armaran las unidades con ambos procesos. Los siguientes son los tiempos
observados en minutos.
Trabajador Proceso actual Proceso propuesto
1 38 30
2 32 32
3 41 34
4 35 37
5 42 35
6 32 26
7 45 38
8 37 32
En α = .05 , ¿existe alguna razón para creer que el tiempo de armado para el
proceso actual es mayor que el método propuesto por más de dos minutos?
1.- Planteamiento de la hipótesis:
Ho: µ1 ≤ µ2 µ1= método común; µ2 = método propuesto
H1: µ1 > µ2
Ho: µd ≤ 0
H1: µd > 0
𝑑𝑑̅
𝑡𝑡 =
𝑆𝑆𝑆𝑆
√𝑛𝑛
16
Semana # 10
5%
t crítico t cal
1.895 2.107
D=
∑D j
n = 4.75
(D j − D)
2
SD =
n −1 = 3.69
D 4.75 − 2
t0 =
SD n = 3.69 8 = 2.107
17
Semana # 10
tα ,n −1 = t.05, 7 = 1.895
, debido a que 2.107 > 1.895 rechazamos H0, y aceptamos la H1
6.- Conclusión: el tiempo de armado para el proceso actual es mayor en dos minutos
que el método propuesto.
18