Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tema 10
Tema 10
Estadstica II
Prof. Andrs Sandoval H
Estadstica II
4. COMPROBACIN DE HIPTESIS
- El promedio de kilmetros que dura una llanta radial Tiger Pow con banda
de acero es de ms de 96,500.
- Una familia tpica mexicana vive en el mismo domicilio durante ms 16.5
aos.
- El salario inicial promedio para los egresados de las carreras de contadura
en Mxico es de $38,000 pesos al ao.
- Advil elimina los dolores de cabeza en menos de 20 minutos.
Una vez que se ha establecido una hiptesis, se utilizan los datos para verificar
que tan razonable es dicha afirmacin. Un ejemplo puede ser el siguiente: En el
sistema legal de Mxico, una persona es inocente hasta que se demuestre lo
contrario. Un juez parte de la hiptesis de que una persona que es acusada de un
crimen es inocente y sujeta esta hiptesis a comprobacin, revisando la evidencia
y oyendo testimonios hasta llegar a un veredicto.
1
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
Identificar y
Paso 4 Formular la calcular la Paso 3
regla de estadstica de
decisin prueba
No rechazar
No rechazar
H0
H 0
Paso 5 Tomar una Rechazar H
Rechazar H0
decisin 0
yy
Aceptar H
Aceptar H1
1
2
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
Hiptesis nula: Una afirmacin que establece que no hay diferencia significativa
entre el valor de un parmetro de la poblacin y el valor de un parmetro de la
muestra.
En el ejemplo del kilometraje que dura una llanta Tiger Pow, la hiptesis nula sera
que el nmero medio de kilmetros que recorre una llanta con banda de acero no
es distinto a 96,500. Esto se escribira as:
H0: = 96,500
Es muy importante decir que si no se rechaza la hiptesis nula con base en los
datos de la muestra, eso no quiere decir que la hiptesis nula sea verdadera,
nicamente significa que no fue posible rechazar la hiptesis nula con base en lo
datos disponibles. Por lo tanto, la hipesis nula no se puede aceptar.
Para demostrar sin lugar a dudas que la hiptesis nula es verdadera sera
necesario conocer el parmetro de la poblacin; es decir, se tendra que practicar
un censo para conocer el parmetro de la poblacin sobre el que se est haciendo
una afirmacin. Por lo regular esto no es posible, por ello la alternativa consiste en
tomar una muestra.
Tambin es preciso enfatizar que generalmente una hiptesis nula comienza con o
contiene la siguiente afirmacin: No existe diferencia significativa entre...
H0: La duracin promedio de las llantas radiales Tiger Pow con banda de acero no
tiene diferencia significativa con 96,500 kilmetros.
3
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
H0: = 15 aos
H1: 15 aos
Para ilustrar como se puede rechazar una hiptesis nula cuando es verdadera
pondremos el siguiente ejemplo: Supn que la poltica de aceptacin de
4
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
Supn, sin embargo, que las cuatro tarjetas seleccionadas en la muestra eran las
nicas defectuosas en todo el embarque de 4,000. Entonces slo el 0.1% estaba
defectuoso. En ese caso menos del 6% del embarque estaba por debajo de la
norma y el rechazo del embarque fue un error.
La empresa cometera un error de tipo II si, sin saberlo, recibiera un embarque que
contuviera el 15% de artculos defectuosos, y no obstante, lo aceptara. Cmo
podra ocurrir esto?
El siguiente cuadro resume las decisiones que el investigador puede tomar y las
consecuencias posibles de stas.
5
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
Investigador
No rechaza Rechaza
Hiptesis nula
H0 H0
H0 es verdad Decisin correcta Error de tipo I
H0 es falso Error de tipo II Decisin correcta
Donde:
X = media de la muestra
= media de la poblacin
n = tamao de la muestra
z = valor estndar
6
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
Regla de decisin: Es una afirmacin de las condiciones bajo las que se rechaza
la hiptesis nula y bajo las que no se rechaza.
El rea o regin de rechazo define la ubicacin de todos aquellos valores que son
tan grandes o tan pequeos que la probabilidad de que ocurran bajo una hiptesis
nula verdadera es bastante remota.
f) El valor 1.65, que es el valor crtico, separa las regiones en las que se
rechaza y no se rechaza la hiptesis nula.
Valor crtico: Punto de divisin entre la regin en que se rechaza la hiptesis nula y
la regin en que no se rechaza.
7
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
Distribucin de muestreo para la estadstica z, prueba de una cola a la derecha, nivel de sig. 0.05
En caso de que el valor calculado de z hubiera sido menor a 1.65, por ejemplo
0.71, la hiptesis nula no se habra rechazado. Se razonara entonces que un
valor tan pequeo no podra atribuirse a la casualidad, es decir, a la variacin de
muestreo.
Como puedes observar slo es posible tomar una de dos decisiones: ya sea
rechazar o no la hiptesis nula
8
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
En la grfica anterior se indica que se aplica una prueba de una cola. Por lo que la
regin de rechazo es solo una: la cola derecha de la distribucin, sin embargo es
tambin posible que la zona de rechazo se ubique en la cola derecha. Para
ilustrarlo pondremos el siguiente ejemplo.
H0: El peso promedio de los cereales Rice & Grapes es igual o menor a 453
gramos.
H1: El peso promedio de los cereales Rice & Grapes es mayor a 453 gramos.
9
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
Regin de No rechazar
rechazo H0
0
Escala de z
1.65
valor crtico
H0: El ingreso medio de las mujeres es menor o igual al ingreso medio de los
hombres.
10
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
H1: El ingreso medio de los hombres es mayor que el ingreso medio de las
mujeres.
Por lo tanto, una prueba de dos colas ser aquella en la que la hiptesis
alternativa no establece una direccin, como:
H0: No hay diferencia entre el ingreso medio de las mujeres y el de los hombres.
H1: Existe una diferencia entre el ingreso medio de las mujeres y el de los
hombres.
La siguiente grfica ilustra las dos reas de rechazo y los valores crticos. Observa
que el rea total de la distribucin es de 1.000, que se encuentra por 0.95 + 0.025
+ 0.025.
Regin de Regin de
No rechazar
rechazo rechazo
H0
0.025 0.025
0.95
1.65 +1.65
valor crtico valor crtico Escala de z
11
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
Los registros muestran que en la planta de Len, durante las 50 semanas hbiles
del ao anterior se produjo un promedio de 203.5 escritorios.
Paso 1
Paso 2
Paso 3
12
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
z = 1.55
Paso 4
La regla de decisin se formula hallando los valores crticos de z con base en las
tablas del porcentaje de rea bajo la curva normal (tablas de z). Como se trata de
una prueba de dos colas, la mitad de 0.01, es decir 0.005, est en cada cola. Por
lo tanto, el rea en la que no se rechaza la hiptesis nula, entre los dos valores
crticos, es 0.99.
Las tablas del porcentaje del rea bajo la curva se basan en una mitad del rea
bajo la curva, o 0.5000. Luego, 0.500 0.005 es 0.4950, de modo que 0.4950 es
el rea entre 0 y el valor crtico. Localiza 0.4950 en el cuerpo de la tabla. EL valor
ms prximo es 0.4951.
Paso 5
De acuerdo con el clculo del valor z que se hizo en el paso 3 y con la regla de
decisin formulada en el paso anterior, se llega a la conclusin de que la media de
la poblacin no es diferente de 200.
13
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
0.5000 0.5000
0.01 0.01
= = 0.005 = = 0.005
2 2 2 2
0.4950 0.4950
-2.58 0 +2.58
regin de regin de
H0 no se rechaza
rechazo rechazo
valor crtico valor crtico Escala de z
Para ilustrar una prueba de una cola, se cambiar la pregunta. Supn que el
Director de Produccin lo que quiere saber es si hubo un aumento en el nmero
de unidades ensambladas.
En otras palabras, se puede concluir que, con base en las mejoras en los
mtodos de produccin y en la contratacin de nuevo personal, el nmero medio
de escritorios ensamblados en las ltimas 50 semanas fue mayor a 200?
14
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
Debido a que interesan preguntas diferentes, las hiptesis tambin son diferentes.
En smbolos quedara de la siguiente manera:
Ejercicio
Respuesta inciso a)
Paso 1
15
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
Paso 2
Paso 3
z = -2.69
Paso 4
La regla de decisin se formula hallando los valores crticos de z con base en las
tablas del porcentaje de rea bajo la curva normal (tablas de z). Como se trata de
una prueba de dos colas, la mitad de 0.05, es decir 0.025, est en cada cola. Por
lo tanto, el rea en la que no se rechaza la hiptesis nula, entre los dos valores
crticos, es 0.95.
Las tablas del porcentaje del rea bajo la curva se basan en una mitad del rea
bajo la curva, o 0.5000. Luego, 0.500 0.025 es 0.4750, de modo que 0.4750 es
el rea entre 0 y el valor crtico. Localiza 0.4750 en el cuerpo de la tabla.
Paso 5
16
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
De acuerdo con el clculo del valor z que se hizo en el paso 3 y con la regla de
decisin formulada en el paso anterior, se llega a la conclusin de que la media de
la poblacin es diferente de 68.
Otra forma de decirlo es que el consumo medio de refrescos de cola para los
estudiantes universitarios es diferente de 68 litros.
Respuesta inciso b)
Paso 1
Paso 2
= 0.05
Paso 3
Paso 4
Paso 5
17
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
De acuerdo con el clculo del valor z que se hizo en el paso 3 y con la regla de
decisin formulada en el paso anterior, se llega a la conclusin de que el consumo
medio de refresco de cola es menor de 68 litros.
Esto debido a que z = -2.69 cae en la regin de rechazo y por lo tanto se cuenta
con elementos para rechazar la hiptesis nula (que dice que la media de
produccin de la poblacin es mayor o igual a 68 litros de refresco de cola).
Otra forma de decirlo es que el consumo medio de refrescos de cola para los
estudiantes universitarios es menor de 68 litros.
18
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
Donde:
z = valor estndar
Ejercicio
Se pide a cada uno de los pacientes del Hospital ABC que evalen el servicio
recibido en el momento de su alta. Hace poco, hubo algunas quejas de que los
mdicos y enfermeras residentes del rea de ciruga responden con demasiada
lentitud a los llamados de los pacientes de la tercera edad. De hecho, se afirma
que los dems pacientes reciben un servicio ms rpido. El Dr. Jos Luis Cuevas,
Director General del Hospital, pidi al departamento de aseguramiento de calidad
que investigara a respecto. Luego de hacer un estudio, el departamento report la
siguiente informacin basada en muestras de ambos tipos de pacientes:
Desviacin estndar
Tipo de Paciente Media de la muestra Tamao de la muestra
de la muestra
De la tercera edad 5.50 minutos 0.40 minutos 50
Otros 5.30 minutos 0.30 minutos 100
19
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
Paso 1
H0: 1 2
H1: 1 > 2
Paso 2
= 0.01
Paso 3
5.5 5.3
z=
.402 .302
+
50 100
z = 0.2 / 0.064
z = 3.13
Paso 4
Paso 5
Debido a que el valor calculado de z (3.13) es mayor que el valor crtico (2.33), se
rechaza la hiptesis nula y se acepta la de investigacin. Es decir, que con base
en la informacin de las muestras se puede concluir que el tiempo que los
doctores y enfermeras del Hospital ABC tardan en atender a los pacientes de la
tercera edad es mayor al que tardan en atender a lo dems pacientes.
20
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
Las pruebas de hiptesis que hemos visto hasta el momento se han referido
nicamente a la media. Aunque, como podrs suponer, tambin se pueden hacer
pruebas de hiptesis respecto de proporciones. Algunos ejemplos de situaciones
en las que se puede aplicar este tipo de pruebas pueden ser los siguientes:
n = tamao de la muestra
P = proporcin de la poblacin
Ejercicio
21
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
Solucin
Paso 1
H0: P 0.80
Paso 2
= 0.05
Paso 3
z es la estadstica apropiada
Donde:
p = proporcin de la muestra
P = proporcin de la poblacin
n = tamao de la muestra
p
= error estndar de la proporcin de la poblacin
22
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
z = -0.280
Paso 4
Paso 5
Dicho de otro modo, la evidencia apoya la afirmacin de que la candidata del PRD
ganar las prximas elecciones.
Nota que en los ejemplos anteriores, y en todos los que se desea comparar
proporciones, cada artculo de la muestra puede clasificarse como xito o
23
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
En este caso tambin, dado que las muestras deben ser mayores a 30 y tener una
distribucin normal, se utiliza el estadstico de la distribucin normal estndar, y el
valor de z se calcula por la siguiente frmula:
Donde:
z = valor estndar
Donde:
24
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
Ejercicio
Hace poco, Avn desarroll un nuevo perfume que pretende comercializar bajo el
nombre de Belinda. Varias pruebas comparativas indican que Belinda tiene un
alto potencial de mercado. Para planear su estrategia de mercado, el
departamento de ventas de Avn desea saber si habr diferencias en el xito que
tenga el perfume entre las mujeres jvenes o maduras. Para ello se toman dos
muestras independientes, una de mujeres jvenes y otras de mujeres maduras. Se
usar una prueba en la que se pedir a cada una de las mujeres de la muestra
oler varios perfumes, entre los que se encuentra Belinda, y que indiquen cul es
el que les gusta ms.
Proporcin de las
Prefirieron
Tipo de mujeres Prefirieron otro TOTAL que prefirieron
Belinda
Belinda
Jvenes 20 80 100 0.20
Maduras 100 100 200 0.50
Paso 1
H0: p1 = p2
H1: p1 p2
Paso 2
= 0.05
Paso 3
z = -0.30 / 0.06
z = -5.00
25
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
Paso 4
Paso 5
Debido a que el valor calculado de z (-5.00) no cae entre los valores crticos (-1.96
y +1.96), se rechaza la hiptesis nula y se acepta la de investigacin. Es decir, que
con base en la informacin de las muestras se puede concluir que la proporcin de
mujeres jvenes que prefieren el perfume Belinda es distinta a la proporcin de
mujeres maduras.
26
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
Supn que se quiere comparar la media de la muestra con una media poblacional
supuesta, y que el nmero de observaciones de la muestra es menor a 30. Supn
tambin, que es posible afirmar que la poblacin tiene una distribucin aproximada
a la normal, pero que si desviacin estndar no se conoce.
Ejercicio
Paso 1
27
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
Paso 2
= 0.01
Paso 3
Donde:
X = media de la muestra
= media de la poblacin
n = tamao de la muestra
Paso 4
28
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
Paso 5
Dado que el valor calculado de t (-1.530) est a la derecha del valor crtico (-
2.485); es decir, no est en la regin de rechazo, no se tienen elementos para
rechazar la hiptesis nula.
29
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
Donde:
Donde:
Ejercicio
John Dere Mxico Es una empresa que, entre otras cosas, fabrica y ensambla
podadoras industriales que se embarcan a todos los pases de Amrica Latina. Se
han propuesto dos procedimientos para montar el motor sobre la estructura de las
podadoras. La pregunta es: existe alguna diferencia en el tiempo medio de cada
procedimiento para montar los motores sobre las estructuras de las podadoras?
30
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
Procedimiento 1 Procedimiento 2
(minutos) (minutos)
2 3
4 7
9 5
3 8
2 4
3
Paso 1
H0: 1 = 2
H1: 1 2
Paso 2
= 0.10
Paso 3
Procedimiento 1 Procedimiento 2
X1 X12 X2 X22
2 4 3 9
4 16 7 49
9 81 5 25
3 9 8 64
2 4 4 16
20 114 3 9
30 172
31
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
s1 = 2.9155
s2 = 2.0976
X1 = 20 / 5 = 4
X2 = 30 / 6 = 5
sp2 = 6.22222
c) Determinar t
t = 0.622
32
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
Paso 4
As los valores crticos de t para gl = 9, para una prueba de dos colas y con nivel
de sognificancia 0.10, son +1.833 y 1.833.
Paso 5
Dicho de otro modo, la evidencia de las muestras indica que no hay elementos
suficientes para decir que existe una diferencia entre los tiempos de ensamblado
de los motores dependiendo del procedimiento que se use.
Sin embargo, existen situaciones en las que las muestras no son independientes;
es decir, las muestras estn relacionadas o son dependientes. Un ejemplo de esto
puede ser el siguiente:
Imagina que Hipotecaria Bancomer contrata a dos firmas de bienes races para
que hagan una valoracin de las propiedades sobre las que presta dinero (BAITA y
HIR CASA), se supondra que ambas firmas haran valoraciones semejantes. Para
comprobarlo, Hipotecaria Bancomer selecciona 10 casas al azar y pide tanto a
BAITA como a HIR CASA que hagan una valuacin. Para cada casa habr un par
de valuaciones; es decir, cada casa tendr un valor estimado por BAITA y otro por
33
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
HIR CASA. Los valores estimados dependen de o estn relacionados con la casa
seleccionada. Esto tambin se conoce como muestra en pares.
La muestra se construye a partir de las diferencias entre los valores calculados por
BAITA y por HIR CASA para cada propiedad. Si las dos firmas reportan valores
semejantes, algunas veces BAITA estar ms alta y otras veces ser HIR CASA.
Sin embargo, se espera que la media de la distribucin de las diferencias sea
cero. En caso contrario, si una de las firmas constantemente reporta valores ms
altos, la media ser diferente de cero.
34
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
Ejercicio
Los resultados de las valuaciones en miles de dlares de las dos compaas son
los siguientes:
Con un nivel de significancia de 0.05, puede decirse que existe una diferencia
entre la media de los valores calculados de las propiedades?
Paso 1
H0: d = 0
H1: d 0
Paso 2
= 0.05
Paso 3
35
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
d = 4.60
sd = 4.402
36
Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H
c) Determinar t
t = 3.305
Paso 4
As los valores crticos de t para gl = 9, para una prueba de dos colas y con nivel
de sognificancia 0.05, son +2.262 y 2.262.
Paso 5
37