Está en la página 1de 24

Pruebas de Hiptesis

P de la prueba
Prueba de hiptesis para la diferencia de medias
Tamao de la muestra






Prueba de hiptesis sobre la media, varianza
conocida
Si se desea probar la Hiptesis:
H
0
: u = u
0
H
1
: u s u
0
Se puede usar el estadstico de prueba Z
siguiente



el cual tiene una distribucin Normal con media
cero y varianza 1 (si se cumplen las suposiciones
del teorema del lmite central)
N /

X
Z
0
__

=
Prueba de hiptesis sobre la media, varianza
conocida
Entonces, para una a dada podemos establecer las siguientes
regiones de aceptacin y crtica:
-z
o/2
z
o/2
Z
o/2 o/2
Regin de aceptacin regin crtica regin crtica
Conclusiones:
Rechazar H
0
si: z < -z
a/2
o z > z
a/2

No rechazar H
0
si: - z
a/2
s z s z
a/2
Prueba de hiptesis sobre la media, varianza
conocida
Ejemplo: Se ilustrarn los pasos del procedimiento general
para el ejemplo del combustible slido para sistemas de
escape de aeronaves. En este caso se conoce s=2 cm/seg, se
desea probar si la media m es de 50 cm/seg. Se selecciona una
muestra aleatoria de tamao n=25, obteniendo x=51.3 cm/seg.
Se especifica un nivel de significancia a=0.05 A qu
conclusiones se debe llegar?
1) El parmetro de inters es m (rapidez
promedio de combustin)
H
0
: m = 50 cm/seg
H
1
: m = 50 cm/seg
2) a = 0.05
3) La estadstica de prueba es

4) Rechazar H
0
si z>1.96 o si z<-1.96

clculos

5) Conclusin como z = 3.25 > 1.96, se rechaza
H
0
: m = 50 cm/seg con un nivel de significancia
a = 0.05
Es decir, Se concluye que en base a una muestra de
25 mediciones la rapidez promedio de combustin es
diferente de 50 cm/seg, de hecho, existe evidencia
fuerte de que sta es mayor.
N /

X
Z
0
__

=
25 . 3
25 2/
50 3 . 51
Z =

=
Valores P
Una manera de notificar los resultados de una prueba de
hiptesis es establecer si la hiptesis nula fue o no rechazada
con un nivel especificado a de significancia
Una alternativa es especificar el nivel de significancia a ms
pequeo que conduce al rechazo de la hiptesis nula. A este se
le llama el Valor P
Este valor P slo depende de la muestra tomada, es decir, para
una muestra y un estadstico calculado se puede obtener su
valor P y comparar con un a especificado. Entonces, si P<a, H
0

se rechaza.
En el caso de la distribucin normal para la prueba sobre la
media es fcil calcular el valor P. Si z
0
fue el valor calculado
del estadstico de prueba, entonces:
Donde F(z) = P(Zsz) (Funcin de distribucin normal N(0,1))
Para el ejemplo z
0
= 3.25, entonces P=2(1- u(3.25))=0.0012. Es
decir, H
0
ser rechazada con cualquier nivel de significancia a >
0.0012
p=
2 [ 1- u (|z
0
|) ]
Prueba de dos colas: H
0
:u=u
0
,
H
1
:u = u
0
1- u (z
0
)
Prueba de cola superior: H
0
:u=u
0
,
H
1
:u > u
0

u(z
0
)
Prueba de cola inferior: H
0
:u=u
0
,
H
1
:u < u
0

Errores Tipo I y Tipo II
El procedimiento anterior puede llevarnos a una de dos
conclusiones errneas:
Error Tipo I.- Se rechaza H
0
cuando sta es verdadera
En el ejemplo se cometer un error de tipo I cuando m=50, pero x
para la muestra considerada cae en la regin crtica
Y se cometer un error de tipo II cuando m = 50 pero x para la
muestra considerada cae en la regin de aceptacin
Error Tipo II.- Se acepta H
0
cuando sta es falsa
Condicin real
Decisin
H
0
verdadera H
0
falsa
Rechazar H
0
Error Tipo I ok
Aceptar H
0
ok Error Tipo II
Error Tipo I
A la probabilidad de cometer un error de Tipo I se denota por a, y se le llama el
nivel o tamao de significancia de la prueba es decir
a = P(error Tipo I)= P(rechazar H
0
| H
0
es verdadera)
Ejemplo: Calcular a para el ejemplo de la rapidez de combustin
para una muestra de n=10 datos, suponiendo que la desviacin
estndar de la rapidez de combustin es s=2.5 cm/seg.
Solucin: en este caso a = P( x caiga en la regin crtica | m=50), es decir:
a = P( x < 48.5) + P( x > 51.5)
Recordando que La distribucin de x es Normal con media m=50 y desviacin
estndar s/\n =0.79, estandarizando:
a = P(z<-1.898)+1-P(z<1.898)=0.288+ 0.288 = 0.0576

Esto significa que el 5.76% de las muestras de tamao 10
conducirn al rechazo de la Hiptesis H
0
: m=50 cm/seg,
cuando sta es verdadera.


_
Error Tipo I
Es claro que a se puede reducir de dos maneras:
- Aumentando la regin de aceptacin
- Aumentando el tamao de la muestra
Ejemplo: recalcular a del ejemplo anterior para
a) los nuevos lmites de la regin de aceptacin 48 y 52.
b) Para n=16 con los lmites originales
c) con ambas modificaciones
Solucin:
a) o = P(z<-2.53)+1-P(z<2.53)=0.0057+1-0.9943=0.0114
b) o /\n =0.625 )[48.5 ,51.5]
o = P(z<-2.4)+1-P(z<2.4)= 0.0082+1-0.9918= 0.0164
c)[48 ,52] y o /\n =0.625
o = P(z<-3.2)+1-P(z<3.2)
= 0.0007+1-0.9993 = 0.0014

Error tipo II
Para evaluar un experimento de prueba de hiptesis tambin se
requiere calcular la probabilidad del error de Tipo II, denotada
por |, es decir

| = P(error Tipo II) = P(aceptar H
0
| H
0
es falsa)
Sin embargo, no es posible calcular b si no se tiene una
hiptesis alternativa especfica, es decir, un valor particular del
parmetro bajo prueba en lugar de un rango de valores
Por ejemplo, supongamos que es importante rechazar H
0
si la
rapidez promedio de combustin m es mayor que 52 cm/seg o
menor que 48 cm/seg. Dada la simetra slo se requiere
evaluar la probabilidad de aceptar H
0
: m=50 cuando el valor
verdadero es m=52.
Error tipo II
45 46 47 48 49 50 51 52 53 54 55
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
H0:
=50
H1:
=52
De acuerdo a la figura: | = P(48.5 s x s 51.5 | =52)
Sea o/\n =0.79 y aplicando propiedad
| = P(z<-0.63)-P(z<-4.43)= 0.2676- 0= 0.2643
Error tipo II
La probabilidad de obtener un error de tipo II aumenta muy
rpido a medida que el valor verdadero tiende al valor
hipottico, por ejemplo, si suponemos que =50.5, y
recalculamos |, obtenemos
Para [48.5 ,51.5]; =50.5; o/\n =0.79 y aplicando
propiedad
|= P(48.5 s x s 51.5 | =50.5)
= P(z<1.27)-P(z<-2.53) = 0.8980-0.0057= 0.8923

--| tambin depende del tamao de la muestra, por ejemplo, si
n=16 obtenemos en el ejemplo cuando =52: o=0.625, por
lo tanto para [48.5 ,51.5 y aplicando propiedad
|= P(48.5 s x s 51.5 | =52)
= P(z<-0.8)-P(z<-5.6) =0.211-0=0.211
Es decir, | disminuye cuando n aumenta, excepto si el valor
real de est muy cerca del hipottico
Conclusiones Fuerte y Dbil
Como uno puede elegir los valores crticos del intervalo de
aceptacin uno controla el valor de a. Uno puede entonces
controlar la probabilidad de rechazar de manera errnea H
0
.
Es por eso que el rechazo de H
0
siempre se considera como una
Conclusin Fuerte. (los datos aportan fuerte evidencia de que H
0

es falsa)

La decisin de aceptar H
0
se considera una Conclusin Dbil, a
menos que se sepa que | es considerablemente pequeo.
Por esto en lugar de decir se acepta H
0
se prefiere decir
incapaz de rechazar H
0
, es decir, no se ha encontrado evidencia
suficiente para rechazar H
0
. O sea, no quiere decir que exista gran
evidencia de que H
0
sea cierta sino que no hay gran evidencia de
que sea falsa.

Error Tipo II y tamao de la muestra
Consideremos la hiptesis bilateral H
0
:=
0
, H
1
: =
0.
Si H
0
es falsa y la media verdadera es =
0
+ o (con o>0).
El estadstico de prueba

se puede escribir como
Es decir, Si H
1
es verdadera Z tiene distribucin Normal con
media y varianza 1.
Por lo tanto, el error Tipo 1 (|) se puede calcular
como
n /

X
Z
0
__

n
n /
) (
X
Z
0
__
+
+
=

n
|
|
.
|

\
|
+ ~

n
z
/2

Y si definimos | = u(-z
|
), obtenemos

) z (z
n
/2
+
~
Error Tipo II y tamao de la muestra
Para el ejemplo del combustible slido. Si al analista le
interesa disear la prueba de hiptesis de manera que si el
valor verdadero de es 51 cm/seg se rechace H
0
con una
probabilidad alta (por ejemplo 90%) y con el mismo valor
anterior de o=0.05
En este caso o=1, o=2, o=0.05 por lo tanto,

N= 4*(norminv(0.025) + norminv(0.1))^2 ~ 42
Observacin: Debe tenerse cuidado cuando se interpretan
los resultados basados en una muestra muy grande, ya que
es muy probable que se detecte cualquier alejamiento
(muy pequeo) respecto al valor hipottico
o
Esta
diferencia podra no tener ninguna importancia prctica
pero conducir al rechazo de H
0
Prueba de hiptesis sobre la igualdad de dos
medias (varianzas conocidas)
Se tienen dos poblaciones de inters. La primera con media
1
y
varianza o
1
2
conocidas y la segunda con media
2
y varianza
o
2
2
conocidas. Interesa saber si las dos medias son iguales. Se
plantean las hiptesis
H
0
:
1
=
2
H
1
:
1
=
2
Por lo tanto el siguiente estadstico de prueba
Es N(0,1) si H
0
es verdadera.

Por lo tanto se rechazar H
0
si z
0
>z
o/2
o z<z
-o/2


Suposiciones: Las dos poblaciones son normales o se cumplen las
condiciones del teorema del lmite central. Entonces el estadstico X
1
-
X
2
es una variable Normal con media
1
-
2
y varianza o
1
2
/n
1
+
o
2
2/
/n
2
2
2
2
1
2
1
2
___
1
___
n

X X
Z
+

=
Ejemplo: Un diseador quiere reducir el tiempo de secado de una
pintura. Se prueban dos frmulas de pintura. La frmula 1 es la
normal y la frmula 2 posee un ingrediente secante que se espera
reduzca el tiempo de secado. Se sabe que el tiempo de secado
tiene una desviacin estndar de 8 min y que sta no se afecta con
la adicin del nuevo ingrediente. Se pintan 10 especmenes con la
frmula 1, y 10 con la frmula 2, obtenindose tiempos promedio
de secado de x
1
=121 min, y x
2
=112 min. respectivamente. A
qu conclusin se llega sobre la eficacia del nuevo ingrediente
utilizando o=0.05.?

Cantidad de inters:
1
-
2
1) H
0
:
1
=
2

H
1
:
1
>
2
(se busca evidencia fuerte que indique que el
tiempo de secado promedio de la muestra 2 es menor)
_
_
2) o=0.05
3) El estadstico de prueba es

4) H
0
se rechazar si z>z
0.05
= 1.645

Sustituyendo los datos, obtenemos
z=(121-112)/(12.8)
1/2
=2.52
5) Conclusin: Puesto que z = 2.52 > 1.645 se rechaza H
0
con
un nivel de significancia o=0.05 concluyndose el nuevo
ingrediente s disminuye el tiempo de secado.

Alternativamente puede calcularse un valor
P =1-u(2.52) = 0.0059, es decir, se rechazar H
0
para cualquier
nivel de significancia o>0.0059
2
2
2
1
2
1
2
___
1
___
n

/ )
X X
( Z + =
Identificacin Causa - Efecto
En el ejemplo anterior se supone que fueron asignados de manera
aleatoria 10 especmenes a una frmula (tratamiento) y 10
especmenes a la otra luego se aplic la pintura en un orden
aleatorio a cada especmen hasta pintar los 20. Este es un
Experimento Completamente Aleatorizado.

En un estudio estadstico sobre la incidencia del cncer pulmonar
entre personas que fuman normalmente se hace un seguimiento en
el tiempo de los individuos a prueba. Este es un Experimento
Observacional
En este caso no se puede asignar de manera aleatoria un tratamiento u otro
(fumar o no fumar) a una porcin de los individuos. Por otro lado, el hbito de
fumar no es el nico factor que influye en el desarrollo de cncer pulmonar.
Prueba de Hiptesis sobre la media, varianza desconocida
Si la poblacin tiene una distribucin Normal con media m y
varianza s
2
desconocidas pudiera utilizarse el estadstico S
2
y el
procedimiento descrito anteriormente para varianza conocida (esto
es vlido para N grande), pero si la muestra es pequea,
tendremos que usar el estadstico siguiente,


el cual tiene una distribucin t con n-1 grados de libertad,

As, para la prueba de Hiptesis bilateral
H
0
: =
0

H
1
: =
0
Se rechazar H
0
si t>t
o/2,n-1
o si t<t
-o/2,n-1

n S/

X
T
0
__

=
Ejercicio: Los siguientes son datos de pruebas de resistencia a la
adhesin, los siguientes datos presentan la carga (en Mpa) a la
cual 22 especmenes fallaron









Sugieren los datos que la carga promedio de falla es mayor que
10Mpa? Supngase que la carga de falla tiene una distribucin
Normal y utilice o=0.05. Desarrolle los pasos del
procedimiento general y encuentre un valor P para la prueba.

19.8 18.5 17.6 16.7 15.8 15.4
14.1 13.6 11.9 11.4 11.4 8.8
7.5 15.4 15.4 19.5 14.9 12.7
11.9 11.4 10.1 7.9
Valor P de una prueba t
El valor P es el ms pequeo nivel de significancia para el que H
0

debe rechazarse, esto es el rea de la cola (de la curva de densidad
de probabilidad) que est ms all del valor del estadstico (en este
caso t) o el doble de esta rea en pruebas bilaterales.

Seleccin del Tamao de la Muestra
En todas las pruebas de hiptesis estadsticas se puede calcular el tamao de la
muestra (n) adecuada en funcin de la magnitud del error de tipo I que se
permite. E: error admisible o mayor error permitido
Z: valor normal estndar correspondiente al nivel de confianza deseado.
S: desviacin estndar dela muestra

2
.
|
.
|

\
|
=
E
S z
n
Hallando el tamao de muestra
Ejemplo1.Un estudiante de administracin desea
determinar la cantidad media que ganan al mes los
miembros de los consejos ciudadanos de las grandes
ciudades. El error al calcular la media debe ser inferior a
$100 con un nivel de confianza del 95%.El estudiante
encontr un informe del departamento de trabajo en el que
la desviacin estndar es de $1000.Cul es el tamao de
la muestra que se requiere?

Ejemplo2 .Un grupo consumidor desea estimar la media
del cargo de electricidad por familia en julio con un error
de $5 usando un nivel de confianza del 99%. La desviacin
estndar es estimada de estudios similares la cual es $2000
Qu tan grande debe ser la muestra?

También podría gustarte