Está en la página 1de 52

I.T.S.O.E.

H
unidad 3
ESTADISTICA
INFERENCIAL 1
AIME FALCON

PRUEBA DE
HIPTESIS
OBJETIVO: Determinar la validez de
supuestos poblacionales a partir del
mtodo de prueba de hiptesis para
una, dos, tres o ms poblaciones.

CONCEPTOS BSICOS
La prueba de hiptesis comienza con una
suposicin, denominada hiptesis, que hacemos
entorno a un parmetro de la poblacin. Reunimos
datos mustrales, producimos estadsticos de la
muestra y con esta informacin decidimos la
probabilidad de que el parmetro supuesto de la
poblacin sea correcto. Por ejemplo, suponemos
cierto valor de una media de la poblacin. Para
verificar la validez de la suposicin, obtenemos los
datos mustrales y determinamos la diferencia
entre el valor supuesto y el valor real de la media
muestral. A continuacin juzgamos si la diferencia
es significativa. Cuanto menos sea la diferencia,
mayores probabilidades habr de que sea correcto
el valor supuesto de la media. Y a una diferencia
ms amplia corresponder una probabilidad
menor.
No podemos aceptar ni rechazar una hiptesis
referente a un parmetro de la poblacin por mera
intuicin. Por el contrario, necesitamos aprender a
decidir con objetividad, basndonos en la
informacin de la muestra, si aceptamos o
rechazamos un presentimiento.

a) Hiptesis
Se debe formular el supuesto valor del parmetro de la
poblacin antes de empezar el muestreo. La suposicin que
se desea probar, se denomina hiptesis nula y se representa
por H0. Si se rechaza la hiptesis nula, la conclusin que
debemos aceptar se llama hiptesis alternativa y se
simboliza por H1.
Supongamos que se quiere probar la hiptesis de que el
promedio de calificacin de los alumnos de cierta Universidad
es de 8.5, entonces:
H0 : = 8.5 Establece que la media de la poblacin es igual a 8.5

La hiptesis alternativa se puede interpretar de tres maneras:


H1 : 8.5 Establece que la media de la poblacin no es igual a 8.5.
H1 : 8.5 Establece que la media de la poblacin es mayor que 8.5.
H1 : 8.5 Establece que la media de la poblacin es menor que 8.5.

La prueba de hiptesis tiene como finalidad emitir un juicio


sobre la diferencia que existe entre el valor calculado del
estadstico muestral y el parmetro supuesto de la poblacin.
No consiste en poner en duda el valor calculado del
estadstico muestral.
Despus de formular las hiptesis nula y alternativa, se debe
decidir el criterio que se va a aplicar para aceptar o rechazar
la primera.

b) Nivel de significancia
Supongamos que la media de
calificaciones del ejemplo anterior
de 8.5, se expresa con un nivel de
confianza del 95%, entonces el
nivel de significancia ser de 0.05,
es decir:
= 1 0.95
Entonces: = 0.05 Que representa
el nivel de significancia.
Se puede comprender mejor
observando
la
grfica
siguiente:

El nivel de significancia est repartido en


las zonas de rechazo, 0.025 + 0.025 =
0.05, significa que existe una diferencia
significativa entre el estadstico de la
muestra y el supuesto parmetro de la
poblacin, es decir, que si esto se
demuestra, se rechaza la hiptesis nula
H0 de que el promedio de la poblacin
sea de 8.5 y se acepta la hiptesis
alternativa H1.
Entonces se concluira que el promedio
de las calificaciones de la poblacin, no
es de 8.5, puede ser diferente, mayor o
menor de 8.5.
El nivel de significancia representa la
zona de rechazo de la hiptesis nula y
el nivel de confianza de la zona de
aceptacin.

c) Seleccin de un nivel de
significancia
No hay un nivel de significancia
que sea oficial o universal con el
cual probar las hiptesis. Pero la
eleccin del criterio mnimo de
una probabilidad aceptable, o
nivel de significancia, es asimismo
el riesgo que se corre de rechazar
una hiptesis nula aunque sea
verdadera. Cuando ms alto sea
el nivel de significancia que
utilizamos al probar una hiptesis,
mayores probabilidades habr de
rechazar una hiptesis nula que
sea verdadera.

d) Errores de tipo I y II
Si se rechaza una hiptesis nula que sea verdadera
es un error de tipo I, y su probabilidad se
representa con . Si se acepta una hiptesis nula
que sea falsa se llama error de tipo II, y su
probabilidad se representa con . La probabilidad
de cometer uno de estos errores se reduce si se
aumenta la probabilidad de incurrir en otro tipo de
error. A fin de conseguir una baja, habremos de
conformarnos con una alta. Para sortear esto en
situaciones personales y profesionales, los
encargados de tomar decisiones eligen el nivel
apropiado de significancia examinando los costos
o castigos que conllevan a ambos tipos de error.
Por ejemplo: supngase que el cometer un error de
tipo I implica el tiempo y el trabajo de reelaborar
un lote de sustancias qumicas que debera haber
sido aceptado. En cambio, el incurrir en un error
de tipo II significa correr el riesgo de que se
envenene un grupo entero de usuarios de la
sustancia. La gerencia de esta compaa preferira
el error de tipo I al de tipo II y, en consecuencia,
establecera niveles muy elevados de significancia
en sus pruebas para conseguir bajas.

e) Pasos para seleccionar la


distribucin correcta
1.- Se define el nivel de significancia a
usar.
2.- Determinar la distribucin adecuada
de probabilidad: puede ser la
distribucin normal o la distribucin
t. Las reglas para elegir la
distribucin apropiada al efectuar
pruebas de las medias son:
a. Si la muestra tomada es mayor de
30
(muestras
grandes),
debe
elegirse la distribucin normal (Z).
b. Si la muestra tomada es igual o
menor que 30 (muestras pequeas),
debe elegirse la distribucin t.

PRUEBA DE HIPTESIS DE LAS


MEDIAS DE MUESTRAS
GRANDES

Realizaremos
algunos
ejemplos, en diferentes
condiciones cuando se
conocen
las
desviaciones estndar
de la poblacin.

a) Prueba de dos extremos


para las medias
Es cuando el nivel de significancia (zona de
rechazo) abarca los dos extremos o colas
de la campana de Gauss.

Ejemplo 1.El fabricante de una llanta especial para


camiones afirma que la duracin media
de la parte rodante de agarre es de
60,000 mi. La desviacin estndar de
los millajes es de 5,000 mi. Una
empresa de transportes compr 48
llantas y hall que la duracin media
para sus vehculos fue de 59,500 mi.
Es la experiencia distinta de la
expresada por el fabricante al nivel de
significacin de 0.05?
= 60,000 mi
= 5,000 mi
Datos: n = 48 llantas
= 59,500 mi
= 0.05

Solucin:
Las hiptesis se expresan de la siguiente manera:
H0 : = 60,000 mi
La duracin de las llantas es
de 60,000 millas
H1 : 60,000 mi
La duracin de las llantas es
distinta a 60,000 millas
Primero, vamos a calcular el error estndar de la media
y para ello emplearemos la expresin del error
estndar:

x
n

Sustituyendo valores en ella, se tiene:

5,000
48

5,000
6.9282

x 721.69 mi

En el siguiente paso vamos a obtener el valor de Z y


para ello vamos a apoyarnos en la grfica siguiente:

Recurrimos a las tablas de la distribucin


normal y en ellas localizamos 0.475, que se
x= 1.96
ubica en un valor de Z
En el tercer paso, vamos a determinar los
lmites superior e inferior de confianza para el
intervalo de la media poblacional ya que se
trata de una prueba de dos extremos. Para
ello aplicaremos la expresin siguiente:

Lc H 0 Zx

Sustituyendo valores en ella, se tiene:


Lc = 60,000 1.96 (721.69)
Ls = 60,000 + 1,414.51 Ls = 61,414.51 millas.
Li = 60,000 1,414.51 Li = 58,585.49 millas
Entonces la media de la poblacin flucta entre
58,585.49 y 61,414.51 millas en un nivel de
confianza del 95%.

Regresemos a la grfica anterior para ubicar los


lmites de confianza y la media muestral. Con
ello analizaremos si se acepta la hiptesis nula
adems de verificar si es verdadera o falsa.

La media muestral se ubica dentro de la zona


de aceptacin, por lo que podemos decir
que la hiptesis nula es verdadera, pero
vamos a verificar est aseveracin por
medio de la expresin siguiente:

x
Z
x

59,500 60,000
Z
721.69
Z 0.693 __
X

Entonces la media muestral se ubica en -0.693 x y


se confirma que cae en la zona de aceptacin.
Concluimos que la duracin media de las
llantas es muy cercana a la que afirma el
fabricante de 60,000 millas, con un nivel de
significancia de 0.05.

b) Prueba de un extremo para


las medias
En este caso, el nivel de significancia (zona de
rechazo) slo abarca un extremo o cola de la
campana de Gauss.

Ejemplo 2.Una cadena de restaurantes afirma que el


tiempo medio de espera de clientes por
atender est distribuido normalmente
con una media de 3 minutos y una
desviacin estndar de 1 minuto. Su
departamento de aseguramiento de la
calidad hall en una muestra de 50
clientes en un cierto establecimiento que
el tiempo medio de espera era de 2.75
minutos. Al nivel de significacin de 0.05,
Es dicho tiempo menor de 3 minutos?
= 3 minutos.
= 1minutos.
x
Datos:
n = 50 clientes.
= 2.75 minutos.
= 0.05

Representemos estos datos en la campana de


Gauss:

Las hiptesis son:


Ho : = 3 El tiempo promedio de espera es de 3 minutos.
H1 : 3 El tiempo promedio de espera es menor de 3 minutos.

Primero calculemos el error estndar de la media:

1
x
50

1
x
7.07

x 0.1414

Ahora determinemos el valor de Z, ya que tenemos una


muestra mayor de 30:
Como = 0.05 y es una prueba de hiptesis para un
extremo, en este caso, el extremo izquierdo, entonces,
el nivel de significancia est contenido en este
extremo, por lo que el nivel de confianza es 0.5 0.05
= 0.45 .
Buscando en las tablas de la distribucin normal 0.45,
x
encontramos que: Z= 1.64
El lmite izquierdo del intervalo de confianza ser:
Li = 3 1.64 (0.1414)
Li = 3 0.2319
Li = 2.768
Grficamente esto se representa as:

La media muestral 2.75, se localiza en la


zona de rechazo, por lo que se puede
establecer que se rechaza la hiptesis
nula y se acepta la alternativa.
Comprobemos con :

2.75 3
Z
0.1414

x
Z
x
0.25
Z
0.1414

Como podemos observar 1.77 est localizado


ms hacia la izquierda del lmite de
confianza 1.64.
Podemos concluir que el tiempo medio de
espera de clientes por atender en este
establecimiento es menor de 3 minutos.

Z 1.77 x

Ahora realizaremos un ejemplo cuando se


desconoce la desviacin estndar de la
poblacin.

Ejemplo 3.Una
cadena
grande
de
tiendas
de
autoservicio, expide su propia tarjeta de
crdito. El gerente de crdito desea
averiguar si el saldo insoluto medio
mensuales mayor que 400 dlares. El nivel
de significacin se fija en 0.05. Una revisin
aleatoria de 172 saldos insolutos revel que
la media muestral 407 dlares y la
desviacin estndar de la muestra es 38
dlares. Debera concluir ese funcionario
de la media poblacional es mayor que 400
dlares, o es razonable suponer que la
diferencia de 7 dlares (obtenida de 407400 = 7) se debe al azar?
= 400 dlares.
n =172 saldos insolutos.
Datos:
= 407 dlares.
s=
= 38 dlares (desviacin
estndar estimada).
= 0.05

Las hiptesis son:


Ho : = 400 dlares.
H1 : 400 dlares.
Debido a que la hiptesis alternativa nos
indica un sentido a la derecha de la
media, debemos aplicar una prueba de
una cola. Veamos la grfica:

Si calculamos el error estndar estimados, tenemos que:

x
n

38
x
172

38
13.115

x 2.897

Si leemos en las tablas de la distribucin


normal 0.45, encontramos que: Z = 1.64 x
Determinando el lmite superior del intervalo
de confianza, se tiene:
Ls = 400 + 1.64 (2.897)
Ls = 404.75 dlares.
Grficamente esto ocurre:

x
Z
x

Comprobando con:

407 400
2.897

7
2.897

Z 2.416 x

Con esto comprobamos que el valor de la


media muestral, cae dentro de la zona de
rechazo, por lo que se rechaza la
hiptesis nula y se acepta la alternativa.
Con esto el gerente de crdito debe
concluir que el saldo insoluto medio
mensuales es mayor que 400 dlares.

PRUEBAS DE HIPOTESIS DE
LAS MEDIAS DE MUESTRAS
PEQUEAS.

a) Prueba de dos extremos


para medias
Mediante
el
siguiente
ejemplo
explicaremos el razonamiento a seguir
para demostrar una prueba de hiptesis
de dos extremos con una muestra menor
a
30,
en
donde
aplicaremos
la
distribucin t.

Ejemplo 1.Un especialista en personal que labora en una


gran corporacin, est reclutando un vasto
nmero de empleados para un trabajo en el
extranjero. Durante la realizacin de pruebas,
la gerencia pregunta cmo marchan las cosas
y el especialista contesta: Bien, creo que la
puntuacin promedio en el test de actitudes
ser 90. Cuando la gerencia revisa 20 de los
resultados de la prueba, averigua que la
puntuacin media es 84 y la desviacin
estndar de esta puntuacin es 11. Si la
gerencia quiere probar la hiptesis del
especialista en personal en el nivel de
significancia
de
0.10,
cul
ser
el
procedimiento a que recurra?
x = 90
n = 20
Datos:
= 84
s = = 11
= 0.10

Las hiptesis son:


Ho: = 90
H1 : 90
El error estndar estimado de la media ser:

x
n

11
x
20

11
x
4.472

x 2.46

En la tabla t de Student se localiza = 0.10 y gl = 20 1, o sea


gl = 19 y se encuentra que: t = 1.729
x
Con estos datos ya podemos determinar los limites superior e
inferior del intervalo de confianza, mediante la expresin:

Lc tx
Lc = 90 1.729 (2.46)
Li = 90 1.729 (2.46)

Ls = 90 + 4.246
Li = 90 4.246

Grficamente esto sucede:

Ls = 94.25
Li = 85.75

Como la media muestral cae en la zona de rechazo,


entonces se rechaza la hiptesis nula y se acepta la
hiptesis alternativa.
Concluimos que la gerencia tiene suficientes
evidencias para demostrar que el especialista
est equivocado, que la puntuacin media no es
90.

b) Prueba de un extremo para


medias
Para este caso, ya sabemos que el nivel de
significancia (zona de rechazo) slo abarca un
extremo o cola de la campana de Gauss.

Ejemplo 2.Una persona tom una muestra aleatoria


de 7 casas en un suburbio muy elegante
de una gran ciudad y encontr que el
valor promedio estimado del mercado
era de $560,000, con una desviacin
estndar de $49,000. Pruebe la
hiptesis de que, para todas las casas
del rea, el valor medio estimado es de
$600,000, contra la alternativa de que
sea menor que $600,000. Use el nivel
de significancia de 0.05.
n = 7 casas
= $560,000
x
Datos:
s=
= $49,000

$600,000
=
= 0.05

Las hiptesis son:


Ho : = $600,000
H1 : $600,000
Calculando el error estimado de la muestra, se tiene que:

x
n

49,000
x
7

49,000
x
2.646

x $18,518.52

Sabemos que el nivel de significancia es de 0.05, para una


cola, por lo que se supone, que si fuera una prueba para
dos colas, cada una tendra 0.05, es decir, el nivel de
significancia = 0.10. Por lo tanto 0.10 es el valor que
debemos localizar en la tabla correspondiente de la
distribucin t de Student, con 6 grados de libertad (7 1).
Encontramos entonces que t = 1.943 x
Con estos datos, ya podemos determinar el lmite inferior del
intervalo de confianza en donde se encuentra la
verdadera media de la poblacin.

Li t x
Li = 600,000 1.943 (18,518.52)
En la campana de Gauss:

Li = $564,018.52

Como la media muestral cae la zona de


rechazo, entonces se rechaza la hiptesis
nula y se acepta la hiptesis alternativa.
Comprobando lo anterior, se tiene que:

560,000 600,000
18,518.52

40,000
18,518.52

Z 2.16x

Podemos concluir que el valor medio estimado


del valor de todas las casas es menor de
$600,000.

PRUEBA DE HIPOTESIS PARA


PROPORCIONES
a) Prueba de dos extremos para proporciones.
La prueba de hiptesis para proporciones, tiene
algunas variantes en la demostracin de las
hiptesis respecto a la prueba de hiptesis de
medias, variantes que se irn explicando
conforme se vayan aplicando.

Ejemplo 1.Una compaa que est evaluando la promovibilidad


de sus empleados; es decir, est determinando la
proporcin de aquellos cuya habilidad, preparacin y
experiencia en la supervisin los clasifica para un
ascenso a niveles superiores de la jerarqua. El
director de recursos humanos le dice al presidente
que el 80%,o sea el 0.8, de los empleados son
promovibles. El presidente crea un comit especial
para valorar la promovibilidad de todo el personal. El
comit realiza entrevistas en profundidad con 150
empleados y en su juicio se da cuenta que slo el
70% de la muestra llena los requisitos de la
promocin. El presidente quiere probar, en un nivel
de significancia de 0.05, la hiptesis de que 0.8 de
los empleados pueden ser promovidos.
p = 0.8
q = 0.2
Datos:
n = 150
p = 0.7
q = 0.3
= 0.05

Las hiptesis son:


Ho : p = 0.8
80% de los empleados
son promovibles.
H1 : p 0.8
La proporcin de empleados
promovibles no es 80%.
Primero calculamos el error estndar de la
proporcin, mediante la siguiente expresin:

p H 0 qH 0
n

Sustituyendo valores:

(.8)(.2)
150

0.0010666

p 0.0327

En este caso, la compaa quiere saber si la


verdadera proporcin es mayor o menor que la
supuesta proporcin. Por consiguiente, es
apropiada una prueba de dos extremos para
una proporcin. El nivel de significancia
corresponde a las dos regiones sombreadas,
cada una de las cuales contiene 0.025 del
rea. La regin de aceptacin de 0.95 se ilustra
como dos reas de 0.475 cada una. Puesto que
la muestra es mayor que 30, podemos recurrir
la distribucin normal. Basndonos en la tabla
de sta distribucin, podemos calcular que el
valor correspondiente de Z para 0.475 del rea
bajo la curva es 1.96 . Por tanto, los limites de
la regin de aceptacin son:

Lc = PH0 Z
Lc = 0.8 1.96(0.0327)
Ls = 0.8 + 0.06409
Ls = 0.8641
Li = 0.8 0.06409
Li = 0.7359
Vindolo en la campana de Gauss:

p
La probabilidad
de la muestra
=
0.7, se localiza en la zona de
rechazo, por lo que se rechaza la
hiptesis nula y se acepta la
alternativa. Vamos a demostrarlo:

0.7 0.8
0.0327

0.1
0.0327

Z 3.058 p

Podemos concluir que existe una


diferencia significativa entre la supuesta
proporcin de empleados promovibles
comunicada por el director de recursos
humanos y la observada en la muestra,
la proporcin de toda la compaa no es
del 80%.

b) Prueba de un extremo para


proporciones
Ejemplo 2.- Un artculo reciente en el peridico
Reforma report que un empleado est
disponible slo para que uno de tres egresados
universitarios con grado. Las principales razones
aportadas
fueron
que
existe
una
sobreabundancia de graduados de universidad y
una economa dbil. Suponga que una encuesta
con 200 graduados recientes de la institucin de
usted, revela que 80 estudiantes tenan empleo.
Al nivel de significancia de 0.02, se puede
concluir que una proporcin mayor de
estudiantes egresados tienen trabajo?
p = 0.8
q = 0.2
Datos:
n = 150
p = 0.7
q = 0.3
= 0.05

Las hiptesis son:


Ho : p = 0.3333
H1 : p 0.3333
Calcularemos primero
proporcin:

el

error

estndar

de

la

pHo qHo
n

Sustituyendo valores:

(0.3333) (0.6667)
200

0.2222
200

p .0011 p 0.0333

En este caso, se quiere saber si la verdadera


proporcin es mayor que la supuesta proporcin.
Por consiguiente, es apropiada una prueba de un
extremo para una proporcin. El nivel de
significancia corresponde a la regin derecha de
rechazo. La regin de aceptacin de 0.98 se
ilustra como un rea de 0.5 y otra de 0.48 como la
muestra es mayor de 30, podemos recurrir a la
distribucin normal. Basndonos en la tabla de de
esta distribucin el valor correspondiente de Z,
para 0.48 del rea bajo la curva es 2.05, por
tanto, el lmite de la regin de aceptacin es:
Ls =p0.3333 + 2.05 (0.0333)
Ls = 0.3333 +
0.068265
Ls = 0.4016
Como
= 0.4, y es menor que 0.4016, se localiza
en la zona de aceptacin, entonces, se acepta la
hiptesis nula.
Demostrando lo anterior se tiene:

0.4 0.3333
Z
0.0333

0.0667
Z
0.0333

En la campana de Gauss:

p p
p

Z 2.003p

Concluimos que no es mayor la proporcin de


estudiantes egresados que tienen trabajo.

C) Prueba de hiptesis para


proporciones de muestras
pequeas.
Si usamos la distribucin t para una prueba hiptesis
para proporciones en muestras pequeas, de dos
colas, seguimos el mismo procedimiento que se utiliz
en la prueba para medias de muestras pequeas.
Lo mismo sucede si se trata de una prueba de un
extremo, recordando que, para obtener el valor
apropiado de t en un nivel de significancia de 0.05 con
10 grados de libertad, buscaremos en la tabla de la
distribucin t bajo la columna 0.10, frente al rengln
10 grados de libertad. Esto es verdad porque la
columna 0.10 del rea bajo la curva contenida en
ambos extremos combinados; por ello tambin
representa 0.05 del rea bajo la curva contenida
en cada uno de los extremos. Por esta razn en
lugar de buscar en la columna 0.05, se busca
0.10.

También podría gustarte