Está en la página 1de 51

PRUEBA DE

HIPTESIS
OBJETIVO: Determinar la validez de
supuestos poblacionales a partir del mtodo
de prueba de hiptesis para una, dos, tres o
ms poblaciones.
CONCEPTOS BSICOS
La prueba de hiptesis comienza con una suposicin, denominada hiptesis, que
hacemos entorno a un parmetro de la poblacin. Reunimos datos mustrales,
producimos estadsticos de la muestra y con esta informacin decidimos la
probabilidad de que el parmetro supuesto de la poblacin sea correcto. Por
ejemplo, suponemos cierto valor de una media de la poblacin. Para verificar la
validez de la suposicin, obtenemos los datos mustrales y determinamos la
diferencia entre el valor supuesto y el valor real de la media muestral. A
continuacin juzgamos si la diferencia es significativa. Cuanto menos sea la
diferencia, mayores probabilidades habr de que sea correcto el valor supuesto
de la media. Y a una diferencia ms amplia corresponder una probabilidad
menor.
No podemos aceptar ni rechazar una hiptesis referente a un parmetro de la
poblacin por mera intuicin. Por el contrario, necesitamos aprender a decidir
con objetividad, basndonos en la informacin de la muestra, si aceptamos o
rechazamos un presentimiento.
a) Hiptesis
Se debe formular el supuesto valor del parmetro de la poblacin antes de empezar el
muestreo. La suposicin que se desea probar, se denomina hiptesis nula y se
representa por H
0
. Si se rechaza la hiptesis nula, la conclusin que debemos aceptar se
llama hiptesis alternativa y se simboliza por H
1
.
Supongamos que se quiere probar la hiptesis de que el promedio de calificacin de los
alumnos de cierta Universidad es de 8.5, entonces:

H
0
: = 8.5 Establece que la media de la poblacin es igual a 8.5

La hiptesis alternativa se puede interpretar de tres maneras:
H
1
: = 8.5 Establece que la media de la poblacin no es igual a 8.5.
H
1
: > 8.5 Establece que la media de la poblacin es mayor que 8.5.
H
1
: < 8.5 Establece que la media de la poblacin es menor que 8.5.

La prueba de hiptesis tiene como finalidad emitir un juicio sobre la diferencia que existe
entre el valor calculado del estadstico muestral y el parmetro supuesto de la poblacin.
No consiste en poner en duda el valor calculado del estadstico muestral.
Despus de formular las hiptesis nula y alternativa, se debe decidir el criterio que se va a
aplicar para aceptar o rechazar la primera.
b) Nivel de significancia
Supongamos que la media de calificaciones del ejemplo
anterior de 8.5, se expresa con un nivel de confianza del
95%, entonces el nivel de significancia ser de 0.05, es
decir:
o = 1 0.95
Entonces: o = 0.05 Que representa el nivel de significancia.
Se puede comprender mejor observando la grfica
siguiente:
El nivel de significancia est repartido en las zonas de
rechazo, 0.025 + 0.025 = 0.05, significa que existe una
diferencia significativa entre el estadstico de la muestra y el
supuesto parmetro de la poblacin, es decir, que si esto se
demuestra, se rechaza la hiptesis nula H
0
de que el
promedio de la poblacin sea de 8.5 y se acepta la hiptesis
alternativa H
1
.
Entonces se concluira que el promedio de las calificaciones de
la poblacin, no es de 8.5, puede se diferente, mayor o
menor de 8.5.
El nivel de significancia representa la zona de rechazo de la
hiptesis nula y el nivel de confianza la zona de aceptacin.
c) Seleccin de un nivel de
significancia
No hay un nivel de significancia que sea oficial o
universal con el cual probar las hiptesis. Pero la
eleccin del criterio mnimo de una probabilidad
aceptable, o nivel de significancia, es asimismo el
riesgo que se corre de rechazar una hiptesis nula
aunque sea verdadera.
Cuando ms alto sea el nivel de significancia que
utilizamos al probar una hiptesis, mayores
probabilidades habr de rechazar una hiptesis nula
que sea verdadera.
d) Errores de tipo I y II
Si se rechaza una hiptesis nula que sea verdadera es un error de tipo I, y su
probabilidad se representa con o. Si se acepta una hiptesis nula que sea falsa
se llama error de tipo II, y su probabilidad se representa con |. La probabilidad
de cometer uno de estos errores se reduce si se aumenta la probabilidad de
incurrir en otro tipo de error. A fin de conseguir una | baja, habremos de
conformarnos con una o alta. Para sortear esto en situaciones personales y
profesionales, los encargados de tomar decisiones eligen el nivel apropiado de
significancia examinando los costos o castigos que conllevan a ambos tipos de
error.
Por ejemplo: supngase que el cometer un error de tipo I implica el tiempo y el
trabajo de reelaborar un lote de sustancias qumicas que debera haber sido
aceptado. En cambio, el incurrir en un error de tipo II significa correr el riesgo de
que se envenene un grupo entero de usuarios de la sustancia. La gerencia de
esta compaa preferira el error de tipo I al de tipo II y, en consecuencia,
establecera niveles muy elevados de significancia en sus pruebas para
conseguir | bajas.
e) Pasos para seleccionar la distribucin
correcta
1.- Se define el nivel de significancia a usar.
2.-Determinar la distribucin adecuada de probabilidad: puede
ser la distribucin normal o la distribucin t. Las reglas
para elegir la distribucin apropiada al efectuar pruebas
de las medias son:
a. Si la muestra tomada es mayor de 30 (muestras
grandes), debe elegirse la distribucin normal (Z).
b. Si la muestra tomada es igual o menor que 30 (muestras
pequeas), debe elegirse la distribucin t.
PRUEBA DE HIPTESIS DE LAS MEDIAS DE
MUESTRAS GRANDES
Realizaremos algunos ejemplos, en
diferentes condiciones cuando se
conocen las desviaciones estndar
de la poblacin.
a) Prueba de dos extremos para las medias
Es cuando el nivel de significancia (zona de
rechazo) abarca los dos extremos o colas de
la campana de Gauss.
Ejemplo 1.-
El fabricante de una llanta especial para camiones afirma
que la duracin media de la parte rodante de agarre es de
60,000 mi. La desviacin estndar de los millajes es de
5,000 mi. Una empresa de transportes compr 48 llantas y
hall que la duracin media para sus vehculos fue de
59,500 mi. Es la experiencia distinta de la expresada por
el fabricante al nivel de significacin de 0.05?
= 60,000 mi
o = 5,000 mi
Datos: n = 48 llantas
= 59,500 mi
o = 0.05
x
Solucin:
Las hiptesis se expresan de la siguiente manera:

H
0
: = 60,000 mi La duracin de las llantas es de 60,000 millas
H
1
: = 60,000 mi La duracin de las llantas es distinta a 60,000 millas

Primero, vamos a calcular el error estndar de la media y para ello emplearemos
la expresin del error estndar:
n
x
o
o =
Sustituyendo valores en ella, se tiene:
mi x x x 69 . 721
9282 . 6
000 , 5
48
000 , 5
= = = o o o
En el siguiente paso vamos a obtener el valor de Z y
para ello vamos a apoyarnos en la grfica siguiente:
Recurrimos a las tablas de la distribucin normal y en ellas localizamos
0.475, que se ubica en un valor de Z = 1.96
En el tercer paso, vamos a determinar los lmites superior e inferior de
confianza para el intervalo de la media poblacional ya que se trata de
una prueba de dos extremos. Para ello aplicaremos la expresin
siguiente:
x o
Sustituyendo valores en ella, se tiene:

Lc = 60,000 1.96 (721.69)
Ls = 60,000 + 1,414.51 Ls = 61,414.51 millas.
Li = 60,000 1,414.51 Li = 58,585.49 millas

Entonces la media de la poblacin flucta entre 58,585.49 y 61,414.51
millas en un nivel de confianza del 95%.
x Z Lc
H
o =
0
Regresemos a la grfica anterior para ubicar los lmites de confianza y
la media muestral. Con ello analizaremos si se acepta la hiptesis
nula adems de verificar si es verdadera o falsa.
La media muestral se ubica dentro de la zona de aceptacin, por lo que
podemos decir que la hiptesis nula es verdadera, pero vamos a
verificar est aseveracin por medio de la expresin siguiente:
x
x
Z
o

=
__
693 . 0
69 . 721
000 , 60 500 , 59
X
Z
Z
o =

=
Entonces la media muestral se ubica en -0.693 y se confirma
que cae en la zona de aceptacin.
Concluimos que la duracin media de las llantas es muy
cercana a la que afirma el fabricante de 60,000 millas, con
un nivel de significancia de 0.05.
x o
b) Prueba de un extremo para las
medias
En este caso, el nivel de significancia (zona
de rechazo) slo abarca un extremo o cola
de la campana de Gauss.
Ejemplo 2.-
Una cadena de restaurantes afirma que el tiempo medio de espera
de clientes por atender est distribuido normalmente con una
media de 3 minutos y una desviacin estndar de 1 minuto. Su
departamento de aseguramiento de la calidad hall en una
muestra de 50 clientes en un cierto establecimiento que el
tiempo medio de espera era de 2.75 minutos. Al nivel de
significacin de 0.05, Es dicho tiempo menor de 3 minutos?
= 3 minutos.
o = 1minutos.
Datos: n = 50 clientes.
= 2.75 minutos.
o = 0.05
x
Representemos estos datos en la campana de Gauss:
Las hiptesis son:

Ho : = 3 El tiempo promedio de espera es de 3 minutos.

H1 : < 3 El tiempo promedio de espera es menor de 3 minutos.
Primero calculemos el error estndar de la media:
Ahora determinemos el valor de Z, ya que tenemos una muestra mayor de
30:
Como o = 0.05 y es una prueba de hiptesis para un extremo, en este
caso, el extremo izquierdo, entonces, el nivel de significancia est
contenido en este extremo, por lo que el nivel de confianza es 0.5
0.05 = 0.45 .
Buscando en las tablas de la distribucin normal 0.45, encontramos que:
Z= 1.64
El lmite izquierdo del intervalo de confianza ser:

Li = 3 1.64 (0.1414)
Li = 3 0.2319
Li = 2.768

Grficamente esto se representa as:
1414 . 0
07 . 7
1
50
1
= = = x x x o o o
x o
La media muestral 2.75, se localiza en la zona de rechazo,
por lo que se puede establecer que se rechaza la
hiptesis nula y se acepta la alternativa.
Comprobemos con :
x
x
Z
o

=
x Z Z Z o 77 . 1
1414 . 0
25 . 0
1414 . 0
3 75 . 2
=

=
Como podemos observar 1.77 est localizado ms hacia la
izquierda del lmite de confianza 1.64.
Podemos concluir que el tiempo medio de espera de
clientes por atender en este establecimiento es
menor de 3 minutos.
Ahora realizaremos un ejemplo
cuando se desconoce la
desviacin estndar de la
poblacin.
Ejemplo 3.-
Una cadena grande de tiendas de autoservicio, expide su propia tarjeta
de crdito. El gerente de crdito desea averiguar si el saldo insoluto
medio mensuales mayor que 400 dlares. El nivel de significacin
se fija en 0.05. Una revisin aleatoria de 172 saldos insolutos revel
que la media muestral 407 dlares y la desviacin estndar de la
muestra es 38 dlares. Debera concluir ese funcionario de la
media poblacional es mayor que 400 dlares, o es razonable
suponer que la diferencia de 7 dlares (obtenida de 407- 400 = 7)
se debe al azar?
= 400 dlares.
n = 172 saldos insolutos.
Datos: = 407 dlares.
s = = 38 dlares (desviacin estndar estimada).
o = 0.05
x
o

Las hiptesis son:


Ho : = 400 dlares.
H1 : > 400 dlares.
Debido a que la hiptesis alternativa nos
indica un sentido a la derecha de la
media, debemos aplicar una prueba de
una cola. Veamos la grfica:
Si calculamos el error estndar estimados, tenemos que:
n
x
o
o

=
897 . 2

115 . 13
38

172
38

= = = x x x o o o
Si leemos en las tablas de la distribucin normal 0.45,
encontramos que: Z = 1.64
Determinando el lmite superior del intervalo de confianza,
se tiene:
Ls = 400 + 1.64 (2.897)
Ls = 404.75 dlares.
Grficamente esto ocurre:
x o

Comprobando con:
x
x
Z
o

=
x Z Z Z o

416 . 2
897 . 2
7
897 . 2
400 407
= =

=
Con esto comprobamos que el valor de la
media muestral, cae dentro de la zona de
rechazo, por lo que se rechaza la
hiptesis nula y se acepta la alternativa.
Con esto el gerente de crdito debe
concluir que el saldo insoluto medio
mensuales es mayor que 400 dlares.
PRUEBAS DE HIPOTESIS DE LAS
MEDIAS DE MUESTRAS
PEQUEAS.
a) Prueba de dos extremos para
medias
Mediante el siguiente ejemplo explicaremos
el razonamiento a seguir para demostrar
una prueba de hiptesis de dos extremos
con una muestra menor a 30, en donde
aplicaremos la distribucin t.
Ejemplo 1.-
Un especialista en personal que labora en una gran corporacin, est
reclutando un vasto nmero de empleados para un trabajo en el extranjero.
Durante la realizacin de pruebas, la gerencia pregunta cmo marchan las
cosas y el especialista contesta: Bien, creo que la puntuacin promedio en
el test de actitudes ser 90. Cuando la gerencia revisa 20 de los resultados
de la prueba, averigua que la puntuacin media es 84 y la desviacin
estndar de esta puntuacin es 11. Si la gerencia quiere probar la hiptesis
del especialista en personal en el nivel de significancia de 0.10, cul ser el
procedimiento a que recurra?
= 90
n = 20
Datos: = 84
s = = 11
o = 0.10
x
Las hiptesis son:
H
o
: = 90
H
1
: = 90
El error estndar estimado de la media ser:
46 . 2

472 . 4
11

20
11

= = = = x x x
n
x o o o
o
o
En la tabla t de Student se localiza o = 0.10 y gl = 20 1, o
sea gl = 19 y se encuentra que: t = 1.729
Con estos datos ya podemos determinar los limites superior
e inferior del intervalo de confianza, mediante la
expresin:
x o

x t Lc o

=
Lc = 90 1.729 (2.46) Ls = 90 + 4.246 Ls = 94.25
Li = 90 1.729 (2.46) Li = 90 4.246 Li = 85.75
Grficamente esto sucede:
Como la media muestral cae en la zona de rechazo, entonces se rechaza
la hiptesis nula y se acepta la hiptesis alternativa.
Concluimos que la gerencia tiene suficientes evidencias para
demostrar que el especialista est equivocado, que la puntuacin
media no es 90.
b) Prueba de un extremo para
medias
Para este caso, ya sabemos que
el nivel de significancia (zona de
rechazo) slo abarca un
extremo o cola de la campana
de Gauss.
Ejemplo 2.-
Una persona tom una muestra aleatoria de 7 casas en un
suburbio muy elegante de una gran ciudad y encontr
que el valor promedio estimado del mercado era de
$560,000, con una desviacin estndar de $49,000.
Pruebe la hiptesis de que, para todas las casas del
rea, el valor medio estimado es de $600,000, contra la
alternativa de que sea menor que $600,000. Use el nivel
de significancia de 0.05.
n = 7 casas
= $560,000
Datos: s = = $49,000
= $600,000
o = 0.05
x
o

Las hiptesis son:


H
o
: = $600,000
H
1
: < $600,000
Calculando el error estimado de la muestra, se tiene que:
52 . 518 , 18 $

646 . 2
000 , 49

7
000 , 49

= = = = x x x
n
x o o o
o
o
Sabemos que el nivel de significancia es de 0.05, para una
cola, por lo que se supone, que si fuera una prueba para
dos colas, cada una tendra 0.05, es decir, el nivel de
significancia o = 0.10. Por lo tanto 0.10 es el valor que
debemos localizar en la tabla correspondiente de la
distribucin t de Student, con 6 grados de libertad (7 1).
Encontramos entonces que t = 1.943
Con estos datos, ya podemos determinar el lmite inferior del
intervalo de confianza en donde se encuentra la
verdadera media de la poblacin.
x o

x t Li o

=
Li = 600,000 1.943 (18,518.52) Li = $564,018.52

En la campana de Gauss:
Como la media muestral cae la zona de rechazo,
entonces se rechaza la hiptesis nula y se acepta
la hiptesis alternativa.
Comprobando lo anterior, se tiene que:
Podemos concluir que el valor medio estimado
del valor de todas las casas es menor de
$600,000.
x Z Z Z o 16 . 2
52 . 518 , 18
000 , 40
52 . 518 , 18
000 , 600 000 , 560
=

=
PRUEBA DE HIPOTESIS PARA
PROPORCIONES
a) Prueba de dos extremos para
proporciones.
La prueba de hiptesis para proporciones,
tiene algunas variantes en la
demostracin de las hiptesis respecto a
la prueba de hiptesis de medias,
variantes que se irn explicando conforme
se vayan aplicando.
Ejemplo 1.-
Una compaa que est evaluando la promovibilidad de sus empleados;
es decir, est determinando la proporcin de aquellos cuya habilidad,
preparacin y experiencia en la supervisin los clasifica para un
ascenso a niveles superiores de la jerarqua. El director de recursos
humanos le dice al presidente que el 80%,o sea el 0.8, de los
empleados son promovibles. El presidente crea un comit especial
para valorar la promovibilidad de todo el personal. El comit realiza
entrevistas en profundidad con 150 empleados y en su juicio se da
cuenta que slo el 70% de la muestra llena los requisitos de la
promocin. El presidente quiere probar, en un nivel de significancia de
0.05, la hiptesis de que 0.8 de los empleados pueden ser
promovidos.
p = 0.8
q = 0.2
Datos: n = 150
= 0.7
= 0.3
o = 0.05
p
q
Las hiptesis son:
H
o
: p = 0.8 80% de los empleados son promovibles.
H
1
: p = 0.8 La proporcin de empleados promovibles no
es 80%.
Primero calculamos el error estndar de la proporcin, mediante
la siguiente expresin:
n
q p
H H 0 0
= o
Sustituyendo valores:
0327 . 0 0010666 . 0
150
) 2 )(. 8 (.
= = = p p p o o o
En este caso, la compaa quiere saber si la verdadera proporcin es
mayor o menor que la supuesta proporcin. Por consiguiente, es
apropiada una prueba de dos extremos para una proporcin. El nivel
de significancia corresponde a las dos regiones sombreadas, cada
una de las cuales contiene 0.025 del rea. La regin de aceptacin
de 0.95 se ilustra como dos reas de 0.475 cada una. Puesto que la
muestra es mayor que 30, podemos recurrir la distribucin normal.
Basndonos en la tabla de sta distribucin, podemos calcular que el
valor correspondiente de Z para 0.475 del rea bajo la curva es 1.96
. Por tanto, los limites de la regin de aceptacin son:
Lc = PH0 Z
Lc = 0.8 1.96(0.0327)
Ls = 0.8 + 0.06409 Ls = 0.8641
Li = 0.8 0.06409 Li = 0.7359

Vindolo en la campana de Gauss:
o
La probabilidad de la muestra = 0.7, se localiza
en la zona de rechazo, por lo que se rechaza
la hiptesis nula y se acepta la alternativa.
Vamos a demostrarlo:
p
p Z Z Z o 058 . 3
0327 . 0
1 . 0
0327 . 0
8 . 0 7 . 0
=

=
Podemos concluir que existe una diferencia
significativa entre la supuesta proporcin de
empleados promovibles comunicada por el
director de recursos humanos y la observada en
la muestra, la proporcin de toda la compaa no
es del 80%.
b) Prueba de un extremo para
proporciones
Ejemplo 2.- Un artculo reciente en el peridico Reforma report que
un empleado est disponible slo para que uno de tres egresados
universitarios con grado. Las principales razones aportadas fueron
que existe una sobreabundancia de graduados de universidad y
una economa dbil. Suponga que una encuesta con 200
graduados recientes de la institucin de usted, revela que 80
estudiantes tenan empleo. Al nivel de significancia de 0.02, se
puede concluir que una proporcin mayor de estudiantes
egresados tienen trabajo?
p = 0.8
q = 0.2
Datos: n = 150
= 0.7
= 0.3
o = 0.05
p
q
Las hiptesis son:
H
o
: p = 0.3333
H
1
: p > 0.3333
Calcularemos primero el error estndar de la proporcin:
n
q p
p
Ho Ho
= o
Sustituyendo valores:
0333 . 0 0011 .
200
2222 . 0
200
) 6667 . 0 ( ) 3333 . 0 (
= = = = p p p p o o o o
En este caso, se quiere saber si la verdadera proporcin es mayor que la supuesta
proporcin. Por consiguiente, es apropiada una prueba de un extremo para una
proporcin. El nivel de significancia corresponde a la regin derecha de rechazo.
La regin de aceptacin de 0.98 se ilustra como un rea de 0.5 y otra de 0.48
como la muestra es mayor de 30, podemos recurrir a la distribucin normal.
Basndonos en la tabla de de esta distribucin el valor correspondiente de Z,
para 0.48 del rea bajo la curva es 2.05, por tanto, el lmite de la regin de
aceptacin es:
Ls = 0.3333 + 2.05 (0.0333) Ls = 0.3333 + 0.068265 Ls = 0.4016
Como = 0.4, y es menor que 0.4016, se localiza en la zona de aceptacin,
entonces, se acepta la hiptesis nula.
Demostrando lo anterior se tiene:
p
p
p p
Z
o

=
p Z Z Z o 003 . 2
0333 . 0
0667 . 0
0333 . 0
3333 . 0 4 . 0
= =

=
En la campana de Gauss:
Concluimos que no es mayor la proporcin de
estudiantes egresados que tienen trabajo.
C) Prueba de hiptesis para proporciones de
muestras pequeas.
Si usamos la distribucin t para una prueba hiptesis para proporciones
en muestras pequeas, de dos colas, seguimos el mismo
procedimiento que se utiliz en la prueba para medias de muestras
pequeas.
Lo mismo sucede si se trata de una prueba de un extremo, recordando
que, para obtener el valor apropiado de t en un nivel de significancia
de 0.05 con 10 grados de libertad, buscaremos en la tabla de la
distribucin t bajo la columna 0.10, frente al rengln 10 grados de
libertad. Esto es verdad porque la columna 0.10 del rea bajo la
curva contenida en ambos extremos combinados; por ello
tambin representa 0.05 del rea bajo la curva contenida en cada
uno de los extremos. Por esta razn en lugar de buscar en la
columna 0.05, se busca 0.10.

También podría gustarte