Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PRUEBA DE HIPÓTESIS:
DEFINICIÓN ERROR DE TIPO I Y II
TIPO DE PRUEBAS DE HIPÓTESIS
PRUEBAS DE NORMALIDAD.
PRUEBAS DE HIPOTESIS
Introducción.
El objetivo es dar algunos métodos que se usan para tomar decisiones sobre
poblaciones, a partir de los resultados de una muestra aleatoria escogida de esa
población. Para llegar a tomar decisiones estadísticas se debe partir de
afirmaciones o conjeturas con respecto a la población en el que estamos
interesados. Tales suposiciones, pueden ser verdaderas o no. Una conjetura hecha
sobre una población o sobre sus parámetros deberá ser sometida a comprobación
experimental con el propósito de saber si los resultados de una muestra
aleatoria extraída de esa población, contradicen o no tal conjetura.
1 Hipótesis estadísticas.
Definición. Se denomina hipótesis estadística a cualquier afirmación o conjetura
que se hace acerca de la distribución de una o más poblaciones.
La afirmación o conjetura puede referirse bien a la forma o tipo de distribución
de probabilidad de la población o bien referirse al valor o valores de uno o más
parámetros de la distribución conocida su forma. En las aplicaciones básicas, se
asume dada la forma de la distribución de la población. En este caso, las hipótesis
estadísticas consisten en suponer que los parámetros, que definen a la población,
toman determinados valores numéricos.
Por ejemplo, son hipótesis estadísticas :
1. La longitud media de un tipo de objetos es 10 centímetros.
2. La proporción de objetos defectuosos producidos por cierto proceso nunca es
superior al 8%.
3. La varianza de la longitud de cierto tipo de objetos es 0.25 cm2..
4. Son iguales las medias de dos tipos de mediciones independientes X e Y que se
distribuyen normalmente con varianza común 2 .
Hipótesis simple y compuesta.
Definición. Se denomina hipótesis simple a cualquier hipótesis estadística que
especifica completamente la distribución de la población, es decir, especifica la
forma de la distribución y el valor de su(s) parámetro(s).
Si una hipótesis no especifica completamente la distribución de la población se
dice que es una hipótesis compuesta.
Por ejemplo, la hipótesis que establece que el ingreso mensual promedio de
los empleados de cierta ciudad es $500, suponiendo que los ingresos mensuales
Sesión N° 11 Curso: Estadística aplicada
esta razón, algunos autores plantean la hipótesis nula H 0 : = 0 aun para los
casos 2) y 3) del ejemplo anterior .
La aceptación de una hipótesis significa que los datos de la muestra no
proporcionan evidencia suficiente para refutarla. El rechazo significa que los datos
de la muestra lo refutan.
Tabla 10-1
Decisión H 0 verdadera H 0 falsa
Sesión N° 11 Curso: Estadística aplicada
Por ejemplo, supongamos que se tiene una población normal N, 9 con
varianza conocida 2 9 y que se trata de probar o docimar la hipótesis nula
H 0 : 70 contra H 1 : 70 .
Dado que X es un buen estimador de utilizaremos esta estadística para
determinar la región crítica y la regla de decisión de esta prueba. Puesto que
estamos interesados en la discriminación entre 70 y valores de 70
parece razonable que debamos rechazar H 0 si X 70 es muy grande, esto es
si X K , siendo K un valor crítico que vamos a determinar.
Si se supone verdadera la hipótesis H 0 : 70 , entonces, la distribución de la
media X es normal con media 70 y desviación estándar 3 .
En consecuencia la distribución de
X 70
Z
3/ n
es normal N(0,1).
Para una muestra aleatoria de tamaño n 40 y la probabilidad de error tipo I,
0.5 se tiene (ver figura 1).
X 70 K 70 K 70
0.05 P P Z .
3 40 3 40 0.474
X
Z
n
cuya distribución es exacta o aproximadamente normal estándar N(0,1), según sea
la población normal o no
R.C. {Z z1 }
donde, a1 0 z1 ( n)
Sesión N° 11 Curso: Estadística aplicada
Región de aceptación: RA { X a1 }.
Regla de decisión es: Si x es un valor de X obtenido a partir de una muestra
aleatoria de tamaño n, se rechazará H 0 con un riesgo si x R.C. (o si
x R.A. ).
No se rechazará H 0 en caso contrario (figura 10.4).
EJEMPLO 1.
Un determinado proceso de empaquetar un producto está controlado, si el peso
medio del producto empaquetado es 400 gramos. Si en una muestra aleatoria de
100 paquetes del producto se ha encontrado que el peso medio es de 395 gramos,
¿Se podría concluir que el proceso está fuera de control al nivel de significación
5%?. Suponga que el peso de los productos empaquetados se distribuye
normalmente con desviación estándar de 20 gramos.
SOLUCION.
Sea X la variable aleatoria definida como el peso de los paquetes del producto.
Se supone que la distribución de X es N, (20)2.
1. Hipótesis: H 0 : = 400 (el proceso está controlado).
H 1 : 400 (el proceso está fuera de control).
2. Nivel de significación: = 0.05.
3. Estadística: Población normal con varianza conocida, la estadística es
X
Z
n
cuya distribución es normal N(0,1).
4. Región crítica: Si se supone verdadera la hipótesis nula H 0 , para 0.5 y la
alternativa bilateral, en la distribución de Z ( X 400) (20 / 100 ) , se
encuentra el valor crítico:
z1 2 z 0.975 1.96
x 0 395 400
zk 2.5.
n 2
x 0
o, si z1 2 z1 2
n
Esto es, no se rechazará H 0 : 0 si
x R. A. [ 0 z1 2 , 0 z1 2
]
n n
o equivalentemente si 0 se encuentra dentro del intervalo de confianza (I.C.) del
(1 ) 100% para :
0 I .C. [ x z1 2 , x z1 2 ]
n n
Por tanto, se rechazará H 0 con riesgo si,
Sesión N° 11 Curso: Estadística aplicada
x R.A. o si 0 I.C
Por ejemplo, en el ejemplo 10.1, para 0.05 se tiene:
I .C. x z1 2 , x z1 2 [391.08, 398.92]
n n
R. A. 0 z1 2 , 0 z1 2 [396.08, 403.92].
n n
b) P P[ Z z k ] (cola a la derecha).
c) P P[ Z z k ] (cola a la izquierda).
EJEMPLO 11.2.
Al estudiar si conviene tener o no una sucursal en la ciudad de Tarapoto, la
gerencia de una gran tienda comercial de Lima, establece el siguiente criterio para
tomar una decisión: Abrir la sucursal sólo si el ingreso promedio familiar
mensual en dicha ciudad es no menos de $500 y no abrirla en caso contrario. Si
una muestra aleatoria de 100 ingresos familiares de esa ciudad ha dado una media
de $480.
a) ¿Cuál es la decisión a tomar al nivel de significación del 5%?.
b) ¿Con qué probabilidad la prueba anterior detecta la diferencia igual a $30 en el
promedio de ingresos y por debajo de lo que se indica en la hipótesis nula?.
c) Calcular la potencia de la prueba si el ingreso promedio realmente es $464.
Suponga que la distribución de los ingresos tiene una desviación estándar
igual a $80.
SOLUCION.
Sea X la variable aleatoria que representa los ingresos familiares mensuales de
los pobladores de Tarapoto.
a) 1. Hipótesis: H 0 : = 500 (ó H 0 : 500 ) (se abre la sucursal).
H 1 : < 500 (no se abre la sucursal).
2. Nivel de significación: 0.05.
3. Estadística: Población no normal, n 100 , 80 , por teorema central del
límite la estadística apropiada es:
X
Z
n
cuya distribución es aproximadamente normal N(0,1).
4. Región crítica: Si se supone verdadera la hipótesis nula H 0 para 0.5 y
la alternativa unilateral cola a la izquierda, en la distribución de
Z ( X 500) (80 / 100 ) , se encuentra el valor crítico
z z 0.05 1.645 .
486.84 470
P[ X 486.84 / 470] P Z P[Z 2.11] 0.9826
80 100
SOLUCION.
X K 0 K 0
P X K 0 P 0
P Z
n n n
de donde resulta (por ser menos del 50% del área total y z z1 )
K 0
z1 , K 0 z1 (1)
n n
De igual manera,
= P[error tipo II] = P[aceptar H 0 / H 0 : 0 es falsa]
= P[aceptar H 0 / H 1 : 1 es verdadera]
X 1 K 1 K 1
P[ X K / 1 ] P P Z
n n n
de donde resulta,
K 1
z1 , K 1 z1 (2)
n n
z1 z1 2 2
n .
0 1 2
NOTA.
Si la prueba unilateral es de cola a la derecha, esto es si se prueba:
Sesión N° 11 Curso: Estadística aplicada
H 0 : 0 contra H 1 : 1 , donde 0 1
el tamaño n de la muestra requerida es también:
z1 z1 2 2
n .
0 1 2
Si la prueba es bilateral, esto es, si se prueba: H 0 : 0 contra
H 1 : 1 , 0 1 , el tamaño n de la muestra requerida es
z1 2 z1 2 2
n .
0 1 2
EJEMPLO 4.
El gerente de ventas de una compañía afirma que sus vendedores venden en
promedio diariamente $1500. Diseñe una prueba para esta hipótesis si se quiere que
el riesgo sea 1.5% de rechazar la afirmación cuando realmente es verdadera y el
riesgo sea de 0.75% de aceptar la afirmación cuando realmente es $1523 el
promedio de las ventas diarias. Suponga que la distribución de las ventas es normal
con una desviación estándar de $50
SOLUCION.
Sean las hipótesis: H 0 : 1500 y H 1 : 1523.
Si se supone verdadera la hipótesis nula H 0 : 1500 , entonces la
X 1500
distribución de Z es normal N(0,1).
50 n
Luego, para 0.015 P[Error tipo I], en esta distribución se tiene:
0.015 = P[rechazar H 0 / H 0 : 1500 es verdadera]
K 1500
0.015 P X K 1500 P Z
50 n
K 1500 2.17 50
de donde resulta: 2.17, K 1500
50 n n
También, si se supone verdadera la hipótesis alternativa H 1 : 1523 ,
X 1500
entonces, la distribución de Z es normal N(0,1).
50 n
Sesión N° 11 Curso: Estadística aplicada
K 1523
0.0075 P X K 1523 P Z
50 n
K 1523 2.43 50
2.43, K 1523 .
50 n n
2.17 50 2.43 50
Luego de: K 1500 y de K 1523 , se obtiene:
n n
n 10 , n 100
Con el valor de n 100 , se obtiene el crítico de la prueba: K 1510.85.
Si x es un valor de media de la muestra de n 100 casos, se rechazará la hipótesis
nula H 0 si x 1510.85 . En caso contrario, no se debe rechazar H 0 .
A) Población no normal
Si la población no tiene distribución normal y si la varianza es desconocida, para
probar hipótesis acerca de la media , sólo si, el tamaño de la muestra es grande
( n 30 ), se suele utilizar la estadística:
X 0
Z
n
cuya distribución es aproximadamente N(0,1). La desviación estándar se estima
puntualmente por s .
Luego, las regiones críticas de la pruebas de H 0 : 0 contra cualquiera de las
tres alternativas H1 : 0 ó H 1 : 0 ó H1 : 0 son las mismas
(aproximadamente) de la sección 2.
Sesión N° 11 Curso: Estadística aplicada
B) Población normal
Si la población tiene distribución normal N (, 2 ) , donde y 2 son
parámetros desconocidas, para n 2 la estadística de la prueba acerca de la media
es:
X
T
Sˆ n
cuya distribución es t-Student con n 1 grados de libertad.
Si se supone verdadera la hipótesis nula: H 0 : 0 , la estadística especificada
por esta hipótesis es entonces, ahora:
X 0
T
Sˆ n
EJEMPLO 5.
Las cajas de cierto tipo de cereal procesadas por una fábrica deben tener un
contenido promedio de 160 gramos. Por una queja ante el defensor del consumidor
de que tales cajas de cereal tienen menos contenido, un inspector tomó una muestra
aleatoria de 10 cajas encontrando los siguientes pesos de cereal en gramos:
157, 157, 163, 158, 161, 159, 162, 159, 158, 156
¿Es razonable que el inspector multe al fabricante?. Utilice un nivel de significación
del 5% y suponga que los contenidos tienen distribución normal.
SOLUCION.
Sea X la variable aleatoria que representa los pesos de las cajas del cereal. Se
supone que la distribución X es normal con media y varianza 2 desconocidas.
1) Hipótesis: H 0 : µ 160 (No multa al fabricante)
H 1 : 160 (Multa al fabricante)
2. Nivel de significación 0.05
Sesión N° 11 Curso: Estadística aplicada
EJEMPLO 6.
Un fabricante produce un cable de alambre de cierto tipo, que tiene una
resistencia a la ruptura no mayor de 300 kg.. Se descubre un proceso nuevo y más
barato que desea emplearse, siempre que el cable así producido tenga una
resistencia media a la ruptura mayor de 300 kg.. Si una muestra aleatoria de 36
cables producidos con el nuevo proceso ha dado una media 304.5 kg. y una
desviación estándar s =15 kg. ¿Debería el fabricante adoptar el nuevo proceso,
si está dispuesto a asumir un error tipo I del 5%?.
Suponga que la distribución de la resistencia a la ruptura es:
a) Normal, b) Desconocida no normal.
SOLUCION.
Sea X la resistencia a la ruptura.
Se debe probar la hipótesis nula H 0 : 300 contra H 1 : 300 al nivel de
significación del 5% y a partir de una muestra de tamaño: n 36 .
Sesión N° 11 Curso: Estadística aplicada
X 300
T ~ t (35)
sˆ n
Para 0.05 y una prueba unilateral de cola a la derecha, en la distribución
t (35) se encuentra el valor crítico: t 0.950 , 35 1.69 .
Luego, la región crítica es: RC {T 1.69}
De los datos de la muestra, se tiene:
n 36, x 304.5, sˆ 15, error estándar: ŝ n 2.5
X 300
Z
sˆ n
que se distribuye aproximadamente normal N(0,1).
Para el nivel de significación = 0.05 y para una prueba unilateral de
cola a la derecha, en la distribución de Z se encuentra: z1 z 0.95 1.645.
Luego, la región crítica es:
RC {Z 1,645} .
De la muestra aleatoria resulta:
x 300 304.5 300
zk 1.8.
sˆ n 2.5
Ya que z k 1.8 R.C., debemos rechazar H 0 y concluir que conviene
adoptar el nuevo proceso.