Está en la página 1de 40

Pruebas de hiptesis para

una muestra

Ref:
Apuntes de Estadstica, Mtra Leticia de la Torre
Instituto Tecnolgico de Chiuhuahua

Las secciones anteriores han mostrado cmo puede estimarse un parmetro


de una poblacin a partir de los datos contenidos en una muestra. Puede
encontrarse ya sea un slo nmero (estimador puntual) o un intervalo de
valores posibles (intervalo de confianza).
Sin embargo, muchos problemas de ingeniera, ciencia, y administracin,
requieren que se tome una decisin entre aceptar o rechazar una
proposicin sobre algn parmetro de la poblacin.
Esta proposicin recibe el nombre de hiptesis.
tesis Este es uno de los
aspectos ms tiles de la inferencia estadstica, puesto que muchos tipos de
problemas de toma de decisiones, pruebas o experimentos en el mundo de
la ingeniera, pueden formularse como problemas de prueba de
hiptesis.
tesis

Una hiptesis estadstica es una proposicin o supuesto


sobre los parmetros de una o ms poblaciones.
Empecemos con un ejemplo, suponga que se tiene inters en la rapidez de
combustin de un agente propulsor slido utilizado en los sistemas de salida
de emergencia para la tripulacin de aeronaves. El inters se centra sobre la
rapidez de combustin promedio. De manera especfica, el inters recae en
decir si la rapidez de combustin promedio es o no 50 cm/s. Esto puede
expresarse de manera formal como dos alternativas o hiptesis:
Ho; = 50 cm/s La rapidez promedio s es de 50 cm/s
H1; 50 cm/s La rapidez promedio no es de 50 cm/s
La proposicin Ho; = 50 cm/s se conoce como hiptesis nula (PENSAR:
NO HAY DIFERENCIA) , mientras que la proposicin H1; 50 cm/s, recibe
el nombre de hiptesis alternativa (PENSAR: S HAY DIFERENCIA).

Ahora bien, se podra considerar slo una direccin en el caso en la


hiptesis alternativa o sea que la hiptesis alternativa especifique valores de
que pueden ser mayores o menores que 50 cm/s, esto tambin se conoce
como hiptesis alternativa de una cola o unilateral.
unilateral En algunas situaciones,
lo que se desea es formular una hiptesis alternativa unilateral, como en los
casos:
Ho; = 50 cm/s
H1; > 50 cm/s
o
Ho; = 50 cm/s
H1; < 50 cm/s

Es importante recordar que las hiptesis siempre son proposiciones


sobre la poblacin o distribucin bajo estudio, no proposiciones
sobre la muestra.
muestra
Por lo general, el valor del parmetro de la poblacin especificado en la
hiptesis nula se determina en una de tres maneras diferentes:
1. Puede ser resultado de la experiencia pasada o del conocimiento del
proceso, entonces el objetivo de la prueba de hiptesis usualmente es
determinar si ha cambiado el valor del parmetro.
2.

Puede obtenerse a partir de alguna teora o modelo que se relaciona


con el proceso bajo estudio. En este caso, el objetivo de la prueba de
hiptesis es verificar la teora o modelo.

3. Cuando el valor del parmetro proviene de consideraciones externas


tales como las especificaciones de diseo o ingeniera, o de
obligaciones contractuales. En esta situacin, el objetivo usual de la
prueba de hiptesis es probar el cumplimiento de las especificaciones.

Un procedimiento que conduce a una decisin sobre una hiptesis en


particular recibe el nombre de prueba de hiptesis.
tesis Los procedimientos
de prueba de hiptesis dependen del empleo de la informacin contenida en
la muestra aleatoria de la poblacin de inters.
Si esta informacin es consistente con la hiptesis, se concluye que sta es
verdadera; sin embargo si esta informacin es inconsistente con la
hiptesis, se concluye que esta es falsa.
Debe hacerse hincapi en que la verdad o falsedad de una hiptesis en
particular nunca puede conocerse con certidumbre, a menos que pueda
examinarse a toda la poblacin.
Usualmente esto es imposible en muchas situaciones prcticas. Por tanto, es
necesario desarrollar un procedimiento de prueba de hiptesis teniendo en
cuenta la probabilidad de llegar a una conclusin equivocada.

La hiptesis nula,
nula representada por Ho,
Ho es la afirmacin sobre una o ms
caractersticas de poblaciones que al inicio se supone cierta (es decir, la
creencia a priori).
La hiptesis alternativa,
alternativa representada por H1, es la afirmacin
contradictoria a Ho, y sta generalmente es la hiptesis a investigar.
investigar
La hiptesis nula se rechaza en favor de la hiptesis alternativa, slo si la
evidencia muestral sugiere que Ho es falsa. Si la muestra no contradice
decididamente a Ho, se contina creyendo en la validez de la hiptesis
nula. Entonces, las dos conclusiones posibles de un anlisis por prueba de
hiptesis son:

Rechazar Ho
o
No rechazar Ho.

Prueba de una Hiptesis


Para ilustrar los conceptos generales, considere el problema anterior de la
rapidez de combustin. La hiptesis nula podra ser que la rapidez promedio
de combustin es 50 cm/s, mientras que la hiptesis alternativa es que sta
no es igual a 50 cm/s. Esto es, como se mencion al principio, lo que se
desea probar es:
Ho; = 50 cm/s
H1; 50 cm/s
Supngase que se realiza una prueba sobre una muestra de 10
especmenes, y que se observa cual es la rapidez de combustin promedio
muestral. La media muestral es un estimador de la media verdadera de la
poblacin. Un valor de la media muestral x que est prximo al valor
hipottico = 50 cm/s es una evidencia de que el verdadero valor de la
media es realmente 50 cm/s; esto es, que apoya la hiptesis nula Ho. Por
otra parte, una media muestral muy diferente de 50 cm/s constituye una
evidencia que apoya la hiptesis alternativa H1. Por tanto, en este caso, la
media muestral es el estadstico de prueba.

La media muestral puede tomar muchos valores diferentes. Supngase que


si 48.5 x 51.5, entonces no se rechaza la hiptesis nula Ho; = 50
cm/s, y que si x < 48.5 x >51.5, entonces se acepta la hiptesis
alternativa H1; 50 cm/s.
Los valores de x que son menores que 48.5 o mayores que 51.5
constituyen la regin crtica de la prueba, mientras que todos los valores
que estn en el intervalo 48.5 x 51.5 forman la regin de
aceptacin de la hiptesis nula. Las fronteras entre las regiones crtica y
de aceptacin reciben el nombre de valores crticos.
ticos
La costumbre es establecer conclusiones con respecto a la hiptesis nula
Ho. Por tanto, se rechaza Ho en favor de H1 si el estadstico de prueba cae
en la regin crtica, de lo contrario, no se rechaza Ho.
Puedes ver la similitud
de esto con los
intervalos de confianza?

Este procedimiento de decisin puede conducir a una de dos conclusiones


errneas. Por ejemplo, es posible que el valor verdadero de la rapidez
promedio de combustin del agente propulsor sea igual a 50 cm/s. Sin
embargo, para todos los especmenes bajo prueba, bien puede observarse
un valor del estadstico de prueba x que cae en la regin crtica. En este
caso, la hiptesis nula Ho ser rechazada en favor de la alternativa H1
cuando, de hecho, Ho en realidad es verdadera.
Este tipo de conclusin equivocada se conoce como error tipo I.

El error tipo I se define


como el rechazo de la
hiptesis nula Ho cuando
sta es verdadera.

Para probar si cometemos un error del tipo I consideramos un nivel de


significancia que nos ayuda a determinar la probabilidad de cometer
este tipo de error.
A este nivel se denomina con la letra .
Si tuviramos un nivel de confianza del 95% (0.95) entonces el nivel de
significancia sera del 5% (0.05).
Nivel de confianza = (1- )
Anlogamente si se tiene un nivel de confianza del 90% entonces el nivel de
significancia sera del 10%.

Ahora supngase que la verdadera rapidez promedio de combustin es


diferente de 50 cm/s, aunque la media muestral x cae por error de
muestreo dentro de la regin de aceptacin.
En este caso se acepta Ho cuando sta es falsa.
Este tipo de conclusin recibe el nombre de error tipo II.
II
A la probabilidad de tener un error de tipo II se denomina con la
letra .

El error tipo II se define


como la aceptacin de la
hiptesis nula
cuando sta es falsa.

Tipos de Pruebas de Hiptesis


Como mencionamos antes, se pueden presentar dos tipos de pruebas de
hiptesis que son:
1.

De dos colas, o bilateral.


Ho; = 50
H1; 50

2.

De una cola, o uniilateral.


Ho; = 50
Este ltimo puede ser de cola derecha o izquierda.

H1; > 50

H1; < 50

El tipo de prueba depende de lo que se necesite probar.


1. De una cola derecha.
El investigador desea comprobar la hiptesis de un valor mayor en el
parmetro que el de la hiptesis nula, en este caso el nivel de
significancia se carga todo hacia el lado derecho, para definir las
regiones de aceptacin y de rechazo.
Prueba de hiptesis:
Ho; Dato x
H1; Dato > x
Regin de aceptacin
de Ho

Regin de rechazo
de Ho =

2. De una cola izquierda:


El investigador desea comprobar la hiptesis de que el parmetro sea
menor que el de la hiptesis nula, en este caso el nivel de significancia
se carga todo hacia el lado izquierdo, para definir las regiones de
aceptacin y de rechazo.
Prueba de hiptesis:
Ho; Parmetro x
H1; Parmetro < x

Regin de rechazo
de Ho=

Regin de aceptacin
de Ho

De dos colas:
El investigador desea comprobar la hiptesis de un cambio en el parmetro,
es decir, no importa si es mayor o menor y lo que se busca es si hay
diferencia con el valor planteado. El nivel de significancia se divide en
dos y existen dos regiones de rechazo.
Prueba de hiptesis:
Ho; Parmetro = x
H1; Parmetro x

Regin de rechazo
de Ho= /2

Regin de aceptacin
de Ho

Regin de rechazo
de Ho= /2

Una Regla para Rechazar H0

Seleciona la probabilidad de error tipo I:

(nivel de significancia).
Encuentra el valor estadstico crtico correspondiente (z en
la tabla de la distribucin normal estndar o t en la
distribucin t de student).
Calcula el valor del estadstico para la muestra
Si Z o t cae en el rango crtico z ,t entonces, rechaza H0

EJEMPLOS.
1. Una muestra aleatoria de 100 muertes registradas en Estados Unidos el
ao pasado muestra una vida promedio de 71.8 aos. Suponga una
desviacin estndar poblacional de 8.9 aos. Queremos probar si la
vida media hoy en da es mayor a 70 aos con base en esa muestra. La
muestra parecera indicar que es as pero Cul es la probabilidad de
que la media de la muestra no refleje la verdadera media de la
poblacin?
Utilizar un nivel de significancia de 0.05.

Solucin:

Se trata de una distribucin muestral de medias con desviacin estndar


conocida.
1.Datos:

=70 aos
s = 8.9 aos
x = 71.8 aos
n = 100
= 0.05

2. Establecemos la hiptesis
Distribution Plot
Normal, Mean=0, StDev=1

Ho; = 70 aos.
H1; > 70 aos.

0.4

3. Nivel de significancia
= 0.05, z = 1.645
4. Regla de decisin:
Si z 1.645 no se rechaza Ho.
Si z > 1.645 se rechaza Ho.

Density

0.3

0.2

0.1
0.05
0.0

0
X

1.64

5. Clculos:

6. Decisin y justificacin.
Como 2.02 >1.645 se rechaza Ho y se concluye con un nivel de significancia
del 0.05 que la vida media hoy en da es mayor que 70 aos.

2. Una empresa elctrica fabrica bateras de celular que tienen una duracin
que se distribuye de forma aproximadamente normal con una media de
800 horas y una desviacin estndar de 40 horas. Si una muestra
aleatoria de 30 bateras tiene una duracin promedio de 788 horas,
muestran los datos suficiente evidencia para decir que la duracin
media no es 800? Utilice un nivel de significancia del 0.04.

Solucin:

1. Se trata de una distribucin muestral de medias con desviacin estndar


poblacional conocida. Por lo tanto usamos la distribucin normal.
2. Datos:
=800 horas
s = 40 horas
x = 788 horas
n = 30
= 0.04

3. Prueba de hiptesis.
Como a la empresa no le preocupa si la duracin es igual o mayor a su
propuesta, entonces las hiptesis a plantear son:
Ho; 800 horas
H1; < 800 horas
4. Nivel de significancia
a = 0.04, za = -1.75

Distribution Plot
Normal, Mean=0, StDev=1
0.4

Density

0.3

0.2

0.1

0.04
0.0

-1.75

0
z

Distribution Plot
Normal, Mean=0, StDev=1
0.4

0.3
Density

5. Regla de decisin:
Si z -1.75 no se rechaza Ho.
Si z < -1.75 se rechaza Ho.

0.2

0.1

0.04

6. Clculos:

0.0

-1.75

0
z

7. Decisin y justificacin
Como -1.643 -1.75 por lo tanto, no se rechaza Ho y se concluye con un
nivel de significancia del 0.04 que la duracin media de las bateras no
ha cambiado.

Muestras pequeas

Para el caso de muestras pequeas (n <


30), el procedimiento a seguir es similar al
anterior, con la diferencia que empleamos
la distribucin t de student

Ejemplos:
1. El Instituto Elctrico Edison publica cifras del nmero anual de
Kilowatt-hora que gastan varios aparatos elctrodomsticos. Se afirma
que una aspiradora gasta un promedio de 46 kilowatt-hora al ao. Si una
muestra aleatoria de 12 hogares que se incluye en un estudio indica que
las aspiradoras gastan un promedio de 42 kilowatt-hora al ao con una
desviacin estndar de 11.9 kilowatt-hora, esto sugiere con un nivel de
significancia de 0.05 que las aspiradoras gastan, en promedio, menos de
46 kilowatt-hora anualmente? Suponga que la poblacin de kilowatt-hora
es normal.
Solucin:
1. Datos:

= 46 kilowatt-hora
s= 11.9 kilowatt-hora

= 42 kilowatt-hora

n = 12
= 0.05

2. Prueba de hiptesis

Ho; = 46 kilowatt-hora
Distribution Plot

H1; < 46 kilowatt-hora

tc para 0.95 ( = 0.05)


con 11 grados de libertad

0.4

0.3
Density

3. Valores crticos

T, df=11

0.2

0.1

0.05
0.0

4. Regla de decisin:
Si t -1.796 No se rechaza Ho
Si t < -1.796 Se rechaza Ho

-1.796

0
X

5. Clculo del valor t para los datos


Distribution Plot
T, df=11
0.4

Density

0.3

0.2

0.1

0.05
0.0

-1.796

0
X

42 46
x
=
= 1.16
t=
11.9
s
12
n
6. Decisin y justificacin :
Como 1.16 > -1.796, por lo tanto no se rechaza Ho y se concluye con un
nivel de significancia del 0.05 que el nmero promedio de kilowatt-hora
que gastan al ao las aspiradoras no es significativamente menor que 46.

Nivel de significancia
Cul es el mximo de probabilidad de error tipo
I () que estaramos dispuestos a aceptar?

Regin de rechazo
de Ho=

Pruebas de Hiptesis en general


Si es conocida y los datos son normales, aplicamos el Teorema

del Lmite Central y dependiendo de lo que se desea probar:

H0 : = 0
H0 : = 0
H0 : = 0

Se compara

Ha: < 0 una cola izquierda


Ha: > 0 una cola derecha
Ha: 0 dos colas

z=

x 0

con z/2 z

Si es desconocida (la desviacin estndar de la poblacin), pero

tenemos datos distribudos de forma normal y n 30.


Usamos la prueba t con la desviacin estndar de la muestra:

x 0
t=
s
n

y se compara con /2

Recordando que:
La estadstica de la prueba

t tiene una distribucin t de

student con n-1 grados de libertad.

Cuando n > 30, se puede usar la tabla de la distribucin normal

en vez de la t.

Valor p de la prueba
Es la probabilidad de observar un valor extremo de la estadstica a

prueba si se supone que la hiptesis nula es cierta.

Si H0 es cierta, y la alternativa es Ha: < 0 Cul es la probabilidad de

observar

z < -2.41?

El rea desde z = -2.41 hacia el extremo


nos da un valor de
0.00798 por lo que
ese es el valor de p.
0.4

Distribution Plot
Normal, Mean=0, StDev=1

Density

0.3

0.2

0.1

0.00798
0.0

-2.41

0
X

Ejemplo de empleo del valor p.


El rea color amarillo sera
el valor p para una t = - 2.41,
puede verse que es menor al
rea azul que es la regin
crtica. Eso implica que un
valor de t = - 2.41 rechaza la
hiptesis nula.

-t.05 = -1.7293

P(t<-1.7293) = .05

-2.41

-1.7293

Si t < -1.7293 se rechaza


H0 al nivel del 5% de
significancia.
Pero tambin se puede
comparar el valor de p
directamente con el de
(= 0.05).
0.05)
Si p es menor que se
rechaza H0 al nivel del
5% de significancia.

Ms ejercicios de Pruebas de Hiptesis.

1. Una muestra aleatoria de 64 bolsas de hojuelas de maz pesan, en


promedio 5.23 onzas con una desviacin estndar de 0.24 onzas. El
fabricante quiere poner en la etiqueta que el peso promedio es de 5.5
onzas. Probar la hiptesis de que 5.5 onzas contra la hiptesis
alternativa, < 5.5 onzas con un nivel de significancia de 0.05.

Solucin.

Se trata de una distribucin muestral de medias con desviacin estndar


desconocida, pero como el tamao de muestra es mayor a 30 se puede
tomar la desviacin muestral como un estimador puntual para la
poblacional.
Datos:
Datos
= 5.5 onzas
s= 0.24 onzas
x = 5.23 onzas
n = 64
= 0.05

Prueba de hiptesis
Ho; 5.5 onzas
H1; < 5.5 onzas

Regla de decisin:

Si Z -1.645 No se rechaza Ho
Si Z < -1.645 Se rechaza Ho

Clculos

x 5.23 5.5
z=
=
= 9
s
0.24
n
64

Justificacin y decisin:

Como 9 < -1.645 por lo tanto se rechaza Ho y se concluye con un nivel de


significancia del 0.05 que las bolsas de hojuelas de maz pesan en promedio
menos de 5.5 onzas.
2. Un constructor afirma que se instalan calefactores en 70% de todas las
casas que se construyen hoy en da en la ciudad de Richmond. Estara de
acuerdo con esta afirmacin si una investigacin de casas nuevas en esta
ciudad muestra que 8 de 15 tienen instaladas calefactores ? Utilizar un
nivel de significancia de 0.10.

Solucin.

Se trata de una distribucin muestral de proporciones y una prueba de dos


colas.

Datos:

P= 0.70
p = 8/15 = 0.5333
n = 15
= 0.10

Como nP 5 y n(1-P)
casi 5, 30 podemos
usar la z

Prueba de hiptesis
Ho; P = 0.70
H1; P 0.70

t= -1.7613

t=1.7613

Regla de Decisin:

Si 1.7613 t 1.7613 No se rechaza Ho


Si Z < -1.7613 si Z > 1.7613 Se rechaza Ho

Clculos:

t=

p P
P (1 P )
n

0.533 0.70
(0.70)(0.30)
15

= 1.41

Decisin y justificacin:
Como 1.7613 -1.41 1.7613 No se rechaza Ho y se concluye con un
nivel de significancia de 0.10 que la afirmacin del constructor es cierta.

3. Una lata de 12 onzas de refresco se disea para que contenga una


cantidad ligeramente mayor que 12 onzas, de tal manera que si excede este
volmen no hay problemas. Sin embargo, un volmen menor a 12 onzas
ocasiona que los consumidores demanden al fabricante. En el proceso
normal de produccin, el fabricante supone que es igual o mayor a 12
onzas. Suponiendo que se prueba una muestra de 45 latas y se encuentra
un volmen promedio de 10.5 onzas con una desviacin estndar de 2
onzas, establecer si se puede afirmar con un nivel de significancia de 0.01
que el fabricante est en lo correcto.

Solucin
Se trata de una distribucin de medias con n > 30.

Datos:

= 12
x =10.5
s=2
n = 45
= 0.01

Prueba de hiptesis
Ho; 12 onzas
H1; < 12 onzas
=0.01
Z=-2.326

Regla de decisin:

Si Z -2.326 No se rechaza Ho
Si Z < -2.326 Se rechaza Ho

Clculos:

x 10.5 12.0
z=
=
= 5.03
s
2
n
45

Justificacin y decisin:

Como 5.03 < - 2.326 por lo tanto se rechaza Ho y se concluye con un nivel
de significancia del 0.01 que no se pude afirma que las latas tengan un
volumen de 12 onzas en promedio.

4. Resolver el problema anterior considerando un nivel de significancia de


0.05.

Solucin
Mismos datos excepto = 0.05
Mismas hiptesis
Mismos clculos
Encontramos que el valor crtico de Z es ahora Z = -1.649, por lo que el
resultado anterior no se altera ya que 5.03 < - 1.649, por lo tanto la
Ho tambin se rechaza a un nivel de significancia de 0.05

También podría gustarte