Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PRUEBAS DE HIPTESIS
En vez de estimar el valor de un parmetro, a veces se debe decidir si una
afirmacin relativa a un parmetro es verdadera o falsa. Vale decir, probar una hiptesis
relativa a un parmetro.
Ejemplo I: Un fabricante de pintura de secado rpido afirma que el tiempo de secado de
la misma es de 20 min. El comprador disea el siguiente experimento: pinta 36 tableros
y decide rechazar el producto si el promedio de tiempo de secado de los mismos supera
los 20.75 min. Si por experiencia =2.4 min, se pregunta cul es la probabilidad de
rechazar la partida an perteneciendo a una poblacin con media de 20 min.
La probabilidad de que el promedio de las muestras exceda 20.75 min a causa
del azar se calcula del siguiente modo:
20.75 20
0.4
1.875
con esta abscisa, se calcula la probabilidad (rea hacia la derecha), resultando 0.0304.
Grficamente:
Este grfico est hecho sobre valores reales, no normalizados. Para los clculo se
usan estos ltimos cuando se trabaja con tablas.
Entonces, la probabilidad de rechazar errneamente la hiptesis =20 min es de
aproximadamente 0.03, o bien 3%.
Supngase ahora que la media real del tiempo de secado es =21 min. Luego, la
probabilidad de obtener una media muestral menor o igual que 20.75 (y por lo tanto
equivocarse en la aceptacin) est dada por:
______________________________________________________________________
Ctedra Estadstica Aplicada II
Universidad de Mendoza
Universidad de Mendoza
______________________________________________________________________
Ctedra Estadstica Aplicada II
Universidad de Mendoza
4 Clculos:
1570 1600
120
2.5
100
5- Dado que 2.5 < -z0.025 se Rechaza la Hiptesis Nula, luego la duracin media de los
tubos es significativamente menor que 1600 horas. Como se puede apreciar en el
siguiente grfico, la media muestral cae fuera de la zona de aceptacin:
Ejemplo II: Una empresa de transportes desconfa de la afirmacin de que la vida til
promedio de ciertos neumticos es al menos de 28000. Para verificar se colocan 40
neumticos en camiones y se obtiene una vida til promedio de 27463 con una s=1348.
Qu se puede concluir con ese dato si la probabilidad de Error Tipo I es a lo sumo
0.01?.
______________________________________________________________________
Ctedra Estadstica Aplicada II
Universidad de Mendoza
1
23-
x
z
s
adems: z = 2.33
4 Clculos:
27463 28000
1348
2.52
40
5- Dado que 2.52 < -z0.01 se Rechaza la Hiptesis Nula, luego la vida til de los
neumticos es significativamente menor que 28000. Como se puede apreciar en el
siguiente grfico, la media muestral cae fuera de la zona de aceptacin:
x
t
s
______________________________________________________________________
Ctedra Estadstica Aplicada II
Universidad de Mendoza
1070 1120
125
1.131
5- Dado que 1.131 > -t0.05 se Acepta la Hiptesis Nula, luego la vida til de los
neumticos es significativamente igual a 1120 horas. Como se puede apreciar en el
siguiente grfico, la media muestral cae dentro de la zona de aceptacin:
______________________________________________________________________
Ctedra Estadstica Aplicada II
Universidad de Mendoza
y as siguiendo.
As se puede construir una tabla como la siguiente
Valor de
Valor de z
19.50
19.75
20.00
20.25
20.50
20.75
21.00
21.25
21.50
21.75
22.00
3.125
2.5
1.875
1.25
0.625
0
-0.625
-1.25
-1.875
-2.5
-3.125
Probabilidad de
Aceptar la Ho
L(
0.999
0.99
0.97
0.89
0.73
0.50
0.27
0.11
0.03
0.01
0.001
Universidad de Mendoza
Si la hiptesis alterna fuese la contraria ( < o, cola izquierda) con los datos
o = 20 , = 2.4, n=36, y la lnea divisoria de criterio en = 19.25, se verifica:
para =19.50
19.50 19.75
0.4
0.625
0.73
y as siguiendo.
Esto lleva a la siguiente tabla:
Valor de
Valor de z
18.50
18.75
19.00
19.25
19.50
19.75
20.00
20.25
20.50
-1.875
-1.25
-0.625
0
0.625
1.25
1.875
2.5
3.125
Probabilidad de
Aceptar la Ho
L(
0.03
0.11
0.27
0.5
0.73
0.89
0.97
0.99
0.999
______________________________________________________________________
Ctedra Estadstica Aplicada II
Universidad de Mendoza
Se puede apreciar que los mismos son la imagen del espejo uno de otro.
ANALISIS PARA DOS COLAS
Si la hiptesis alterna fuese <> o, bilateral, o de dos colas, con los
datos o = 20 , = 2.4, n=36, y las lnea divisorias del criterio entre = 19.25 min y
= 20.75 min, se verifica:
19.25 19
20.75 19
para =19
z1
0.625
z2
4.375
0.4
0.4
L
0.27
Valor de
Valor de z
18.50
18.75
19.00
19.25
19.50
1.875
1.25
0.625
0
-0.625
Probabilidad de
Aceptar la Ho
L(
0.03
0.11
0.27
0.5
0.73
______________________________________________________________________
Ctedra Estadstica Aplicada II
Universidad de Mendoza
19.75
20.00
20.25
20.50
20.75
21.00
21.25
21.50
-1.25
-1.875
-0.625
0
0.625
1.25
1.875
1.875
0.89
0.97
0.73
0.5
0.27
0.11
0.03
Valor de
Valor de z
18.50
18.75
19.00
19.25
19.50
19.75
20.00
20.25
20.50
-1.875
-1.25
-0.625
0
0.625
1.25
1.875
2.5
3.125
Probabilidad de
Aceptar la Ho
L(
0.03
0.11
0.27
0.5
0.73
0.89
0.97
0.99
0.999
y as siguiendo.
Esto lleva a la siguiente tabla:
______________________________________________________________________
Ctedra Estadstica Aplicada II
10
Universidad de Mendoza
Se puede apreciar que los mismos son la imagen del espejo uno de otro.
Si la hiptesis alterna fuese <> o, bilateral, o de dos colas, con los datos o =
20 , = 2.4, n=36, y las lnea divisorias del criterio entre = 19.25 min y
= 20.75 min, se verifica:
para =19.00
19.25 19
0.4
0.625
0.27
Valor de
Valor de z1
Valor de z2
18.50
18.75
19.00
19.25
19.50
19.75
20.00
20.25
1.875
1.25
0.625
0
-0.625
-1.25
-1.875
-2.5
5.625
5
4.375
3.75
3.125
2.5
1.875
1.25
Probabilidad de
Aceptar la Ho
L(
0.03
0.106
0.27
0.5
0.733
0.88
0.939
0.88
______________________________________________________________________
Ctedra Estadstica Aplicada II
11
Universidad de Mendoza
20.50
20.75
21.00
21.25
21.50
-3.125
-3.75
-4.375
-5
-5.625
0.625
0
-0.625
-1.25
-1.875
0.733
0.5
0.27
0.106
0.03
z1
19.25 19
0.4
0.625
z2
20.75 19
0.4
4.375
0.27
y as siguiendo.
Esto lleva a la siguiente tabla:
Valor de
Valor de z
19.50
19.75
20.00
20.25
20.50
20.75
21.00
21.25
21.50
21.75
22.00
3.683
2.946
2.21
1.473
0.737
0
-0.737
-1.473
-2.21
-2.946
-3.683
Probabilidad de
Aceptar la Ho
L(
1
0.998
0.986
0.93
0.769
0.50
0.231
0.07
0.014
0.0016
0
______________________________________________________________________
Ctedra Estadstica Aplicada II
12
Universidad de Mendoza
x 0
z
resulta:
z ( d) 1.65 d n
Finalmente, el error tipo II es:
______________________________________________________________________
Ctedra Estadstica Aplicada II
13
Universidad de Mendoza
1.65d n
( d n)
0.5
1
2
exp 0.5 x dx
______________________________________________________________________
Ctedra Estadstica Aplicada II
14
Universidad de Mendoza
Para pruebas de cola izquierda, los grficos son la "imagen del espejo" de los
anteriores, con lo cual (para generalizar) se usa como abscisa el valor absoluto de d,
sirviendo entonces el juego de curvas para ambas pruebas.
Para pruebas de dos colas:
Se puede verificar que el error tipo II, en este caso, sigue la siguiente funcin
(considerando como siempre =0.05 y por lo tanto /2=0.025, con z=1.96):
1.96d n
( d n)
1
2
1.96d n
2
exp 0.5 x dx
1
2
dx
exp 0.5 x
En la literatura, se han hecho grficos para calcular mediante ellos el error tipo II
para distintos valores de d, usando el tamao muestral (n) como parmetro y con valores
de nivel de significancia de 0.01 y 0.05, para muestras de una cola y de dos colas.
El siguiente segmento de programa en Matlab permite el mismo clculo que el
que se hara con los grficos.
______________________________________________________________________
Ctedra Estadstica Aplicada II
15
Universidad de Mendoza
function beta=error_II(cola,alfa,mu0,mu,sigma,n)
% Esta funcion permite calcular el Error de Tipo II para un
% un nivel de significacion dado, en prueba de una o dos colas.
% Entradas: cola, 1 (una cola) 2 (2 colas)
%
alfa, 0.05 o 0.01, nivel de significacion
%
mu0, real, media de la hipotesis nula
%
mu, real, media para la que se quiere calcular
%
el Error tipo II
%
sigma, real, desviacion estandar
%
n, entero, tamao de la muestra
% Salida: beta, real, Error tipo II correspondiente.
% Expresion de la funcion densidad normal
F=inline('1/sqrt(2*pi)*exp(-0.5*x.^2)');
% Calculo de d
d=abs(mu-mu0)/sigma;
% Calculo del Error tipo II
if cola==1,
if alfa==0.05,z_alfa=1.645;
beta=0.5+quadl(F,0,z_alfa-d*sqrt(n))
end
if alfa==0.01,z_alfa=2.326;
beta=0.5+quadl(F,0,z_alfa-d*sqrt(n))
end
end
if cola==2,
if alfa==0.05,z_alfa=1.96;
beta=quadl(F,0,z_alfa-d*sqrt(n))-quadl(F,0,-z_alfa-d*sqrt(n))
end
if alfa==0.01,z_alfa=2.576;
beta=quadl(F,0,z_alfa-d*sqrt(n))-quadl(F,0,-z_alfa-d*sqrt(n))
end
end
beta =
0.3873
______________________________________________________________________
Ctedra Estadstica Aplicada II
16
Universidad de Mendoza
donde
es la desviacin estndar de la distribucin muestral de la diferencia
entre las medias muestrales.
Si las distribuciones de dos variables aleatorias independientes tienen las medias
1 y 2 y las varianzas 12 y 22, entonces la distribucin de su suma (o diferencia) tiene
la media 1 + 2 (o 1 - 2) y la varianza 12 + 22.
Se sabe que:
es decir:
luego:
______________________________________________________________________
Ctedra Estadstica Aplicada II
17
Universidad de Mendoza
este estadstico es an vlido para muestras grandes (n1 y n2 mayores que 30)
sustituyendo 1 y 2 por s1 y s2.
Las regiones crticas para probar la hiptesis nula 1-2= son para poblaciones
normales con 1 y 2 conocidas o grandes muestras.
Hiptesis
Alterna
1-2<
1-2>
1-2<>
Se rechaza la Hiptesis
Nula si:
z < -z
z>z
z < -z
z > z
4 Clculos:
5- Dado que 2.65 > z0.05 se Rechaza la Hiptesis Nula, por lo tanto se acepta la
Hiptesis Alternativa, esto es se refrenda la afirmacin 12 > 0.050. Vale decir, la
aleacin reduce significativamente en ms de 0.050 ohms la resistencia del conductor
Ejemplo II: La estatura media de 50 estudiantes de un colegio que tomaban parte en las
pruebas atlticas fue de 1.70 mts con desviacin estndar de 0.0625 mts, mientras que
50 estudiantes que no mostraban inters en tal participacin tenan una estatura media
______________________________________________________________________
Ctedra Estadstica Aplicada II
18
Universidad de Mendoza
de 1.687 mts con desviacin estndar de 0.07 mts. Ensayar la hiptesis de que los
estudiantes que participan en pruebas atlticas son ms altos que los otros, con un nivel
de significancia de 0.05.
1
267-
4 Clculos:
z
1.70 1.687
2
0.0625
50
0.98
2
0.007
50
5- Dado que 0.98 < z0.05 se Acepta la Hiptesis Nula 12 = 0. Vale decir, los
estudiantes que participan en pruebas atlticas no son significativamente ms altos que
los otros
Si se deben correr riesgos de Error Tipo II, en los cuales las probabilidades
dependen de las diferencias alternas reales 12 , se pueden usar las curvas
caracterstica de operacin con :
d
1 2 2 2
0 0.02
2
( 0.0625) ( 0.07)
0.213
2
se obtiene:
______________________________________________________________________
Ctedra Estadstica Aplicada II
19
Universidad de Mendoza
ans =
0.5549
Luego el valor del Error tipo II para este caso es =0.5549.
Si n1 es distinto de n2 , el valor de n que se debe utilizar (el grfico o el
algoritmo) se calcula como:
1 2 2 2
1 2 2 2
n1
n2
Cuando n1 , n2 o ambos son pequeos y se desconocen las varianzas de las
poblaciones, se puede fundamentar la hiptesis nula 1-2 = en un estadstico
adecuado t, con tal de suponer a ambas poblaciones normales con 1= 2 (=). En estas
condiciones:
con 2 estimado por ponderacin de las sumas de los cuadrados con respecto a las
media muestrales:
n1 2 n2 2
x1i x1
x2i x2
i 1
i 1
n1 1 s12 n2 1 s22
n1 n2 2
n1 n2 2
x1 x2
n1 1 s12 n2 1 s22
n1 n2 n1 n2 2
n1 n2
con = n1+ n2 -2 .
Ejemplo: En una estacin agrcola se deseaba ensayar el efecto de un determinado
fertilizante sobre la produccin de trigo. Para ello se eligieron 24 parcelas de terreno de
igual superficie; la mitad de ellas fueron tratadas con el fertilizante y la otra mitad no
(grupo control). Todas las dems condiciones fueron las mismas. La media de trigo
conseguida fue de 0.264 m3 con una desviacin estndar de 0.02 m3, mientras que la
media en las parcelas tratadas fue de 0.28 m3 con una desviacin estndar de 0.022 m3.
Puede decirse que hay un incremento significativo en la produccin de trigo por el
empleo del fertilizante al nivel de significacin del 5%?
______________________________________________________________________
Ctedra Estadstica Aplicada II
20
Universidad de Mendoza
23-
x1 x2
n1 1 s12 n2 1 s22
n1 n2 n1 n2 2
n1 n2
4 Clculos:
[ ( 0.28 0.264) 0]
( 12 1) 0.022 ( 12 1) ( 0.02)
1212( 12 12 2)
12 12
1.849
5- Dado que 1.849 > t0.05 (t = 1.717) se Rechaza la Hiptesis Nula 12 = 0. Vale
decir, hay un incremento significativo en la produccin de trigo por el empleo del
fertilizante.
Al aplicar la prueba t-bimuestral se deben vigilar que las muestras sean
independientes. Por ejemplo, no puede utilizarse cuando se trabaja con datos de antes y
despus, para ese caso se utiliza la diferencia de los datos apareados (con su signo).
Ejemplo: Los siguientes datos son las horas-hombre que se pierden semanalmente en
promedio por accidentes en 10 plantas industriales antes y despus de implantar un
cierto programa de seguridad:
45 y 36
57 y 51
73 y 60
83 y 77
46 y 44
34 y 29
124 y 119
26 y 24
33 y 35
17 y 11
x
s
n
9 13 2 5 2 6 6 5 2 6
10
5.2
______________________________________________________________________
Ctedra Estadstica Aplicada II
21
Universidad de Mendoza
92 132 22 52 22 62 62 52 22 62 10 5.22
9
5.2 0
4.077
4.077
4.033
10
5- Dado que 4.033 > t0.05 (t = 1.833) se Rechaza la Hiptesis Nula = 0. Vale decir,
el sistema de seguridad es eficaz.
Esta prueba t se conoce como Prueba t para Muestras Apareadas.
______________________________________________________________________
Ctedra Estadstica Aplicada II
22