Está en la página 1de 30

Análisis de Unidad 5: Estimación

Objetivos de aprendizaje
Después de un cuidadoso estudio de este capítulo, debería ser capaz de hacer lo siguiente:
1. Construir los intervalos de confidence en la media de una distribución normal, usando la normal
distribución o el método de distribución t

2. Construya los intervalos de confidence sobre la varianza y la desviación estándar de una distribución
normal
3. Construya los intervalos de confidence en una proporción de la población
4. Utilice un método general para construir un intervalo aproximado de confidence en un parámetro

5. Construir intervalos de predicción para una futura observación


6. Construir un intervalo de tolerancia para una población normal
7. Explique los tres tipos de estimaciones de intervalos: confidence intervalos, intervalos de predicción
y tolerancia intervalos

Estimación por Intervalo


Intervalos de confianza para la varianza.
A veces se necesitan intervalos de confianza sobre la variación de la población o la desviación es-
tándar. Cuando la población se modela mediante una distribución normal, son aplicables las pruebas
e intervalos descritos en esta sección. El siguiente resultado proporciona la base para construir estos
intervalos de confianza.

Definición 1. INTERVALO DE CONFIANZA PARA LA VARIANZA


Si s2 representa la varianza de una muestra aleatoria de tamaño n tomada de una población normal de
media de varianza σ 2 , un intervalo de confianza para σ 2 está dado por:

(n − 1)s2 (n − 1)s2
2 ≤ σ2 ≤
χα/2 χ21−α/2

Donde χ2α/2 y χ21−α/2 son los valores χ2 con n − 1 grados de libertad que dejan a la derecha áreas de α/2
y 1 − α/2 respectivamente.

Ejercicio 1. Sea S 2 es la varianza de una variable aleatoria de tamaño n de N (µ, σ 2 ). Usando el hecho que
(n − 1)S 2 /σ 2 es χ2 (n − 1) , note que la probabilidad
 
(n − 1)S 2
P a≤ b =1−α
σ2

donde a = χ21−α/2 (n − 1) y b = χ2α/2 (n − 1). Reescriba la ecuación para obtener la inecuación


 
(n − 1)S 2 (n − 1)S 2
P ≤σ ≤
2
=1−α
b a

X
13
a. Si n = 13 y 12S 2 = (xi − x̄)2 = 128.41, mostrar que [6.11, 24.57] es un intervalo de confianza para la
i=1
varianza (σ 2 ) con un 90 % de confianza.

b. Realizar la gráfica de la situación anterior, utilizando geogebra.

1
Ejercicio 2. La desviación estándar de los tiempos de vida de una muestra de 200 bombillas de luz eléctrica
es de 100 horas. Encuentre los intervalos de confianza del 95 % y 99 % para la desviación estándar de todas
las bombillas eléctricas.
Ejercicio 3. El dueño de una empresa empacadora de productos alimenticios necesita comprar una nueva
máquina para verificar el peso de las bolsas que empaca, para determinar si le compra la máquina a
cierto proveedor toma una muestra aleatoria de 20 bolsas de 1 kg de peso y realiza las mediciones. La
desviación estándar establecida para el peso de las bolsas es de 0.02. A partir de esta muestra ¿Debe
adquirir la máquina? Utilice I.C del 90 % y considere que los pesos de las bolsas se distribuyen normal.

0.95 1.02 1.02 0.97 1.03 0.97 1.01 1.00 1.02 0.98
0.98 1.01 1.00 0.99 1.01 0.98 1.02 1.04 1.03 0.99

Intervalos de confianza para la proporción binomial.


Definición 2. INTERVALO DE CONFIANZA PARA LA PROPORCIÓN
Si pb representa la proporción de éxito de una muestra aleatoria de tamaño n tomada de una población
binomial con proporción de éxito p, un intervalo de confianza del (1 − α)100 % para p es:
r r
pbqb pbqb
pb − zα/2 ≤ p ≤ pb + zα/2
n n

Siempre que nbp ≥ 5 y nbq ≥ 5.


Donde zα/2 es el valor z que deja a la derecha un área de α/2.

Definición 3. ERROR MUESTRAL AL ESTIMAR LA PROPORCIÓN


El error muestralqen el caso de la proporción
q está dado por: ϵ = |b
p − p| , a partir del intervalo de confianza
bqb bqb
p − zα/2
para P (b p
n ≤ p ≤ pb + zα/2 p
n) se llega a que:
r r
pbqb pbqb
−zα/2 ≤ pb − p ≤ zα/2
n n
o equivalentemente: r
pbqb
|b
p − p| ≤ zα/2
n
q
Esto quiere decir que el máximo error que se puede cometer al estimar p es zα/2 pbnqb de aquí se tiene
que el tamaño de muestra óptimo para estimar p, a partir de una confiabilidad de (1 − α)100 % y una
precisión e es:
2
zα/2 pbqb
n=
e2
Surge el inconveniente que para determinar el tamaño de muestra se necesita de pb, que es un valor
obtenido a partir de una muestra. Este problema se puede superar de dos formas:

1. Tomando una muestra inicial o piloto de tamaño n1 y a partir de ella estimar pb.
2. Tomar el máximo tamaño de muestra, esto ocurre cuando pbqb, es máximo, es decir en pb = qb = 1/2,
se tiene entonces que:
2
zα/2
nmáx =
4e2
Ejercicio 4. De estudios pasados se sabe que en la zona rural del departamento A el 18 % de los niños
entre 8 y 12 años no asisten a la escuela. Se realizá un nuevo estudio y se encontró que de 200 niños, 30
en esas edades no asisten a la escuela.

1. ¿Se puede decir que el porcentaje de niños que no asisten a la escuela disminuyá? Halle un I.C del
95 % para p y responda la pregunta.

2
2. ¿Cuál es el error muestral cometido en la parte a.?
3. ¿Qué tamaño de muestra se necesita para reducir el error muestral anterior a la mitad, considere el
valor de pb anterior ?.
4. ¿Qué tamaño de muestra máximo se necesita para reducir el error muestral anterior a la mitad?.

Intervalos de confianza para la diferencia en medias.


Definición 4. INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS: CASO I Y II.
Parámetro: µ1 − µ2 , Estimador: X 1 − X 2 .

Bajo los supuestos de poblaciones normales y varianzas poblacionales conocidas se utiliza la estadística:

(X 1 − X 2 ) − (µ1 − µ2 )
Z= q 2 .
σ1 σ22
n1 + n2

Se parte de que:
P (a ≤ X 1 − X 2 ≤ b) = 1 − α
y se llega a:
 s s 
σ12 σ2 σ12 σ22 
P X 1 − X 2 ) − Zα/2 + 2 ≤ µ1 − µ2 ≤ (X 1 − X 2 ) + Zα/2 + =1−α
n1 n2 n1 n2

Luego se tiene que: si x1 y x2 son las medias de muestras aleatorias independientes de tamaños n1 y
n2 tomadas de poblaciones normales con varianzas conocidas σ12 y σ22 , respectivamente, un intervalo de
confianza del (1 − α)100 % para µ1 − µ2 está dado por:
s s
σ12 σ22 σ12 σ2
(x1 − x2 ) − Zα/2 + ≤ µ1 − µ2 ≤ (x1 − x2 ) + Zα/2 + 2
n1 n2 n1 n2

donde Za/2 es el valor Z que deja a la derecha un área de α/2.

3
Definición 5. INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS: CASO III.
Parámetro: µ1 − µ2 , Estimador: X 1 − X 2 .

Bajo los supuestos de poblaciones normales, varianzas desconocidas pero iguales se utiliza la estadística:

(X 1 − X 2 ) − (µ1 − µ2 )
T = r   ,
2 1 1
Sp n1 + n2

que tiene una distribución t con n1 + n2 − 2 grados de libertad.


Se parte de:
P (a ≤ X 1 − X 2 ≤ b) = 1 − α
y se llega a:
s   s  !
1 1 1 1
P (X 1 − X 2 ) − tα/2 Sp2 + ≤ µ1 − µ2 ≤ (X 1 − X 2 ) + tα/2 Sp2 + =1−α
n1 n2 n1 n2

Si x1 y x2 son las medias de muestras aleatorias independientes de tamaños n1 y n2 tomadas de pobla-


ciones normales con varianzas desconocidas pero iguales, un intervalo de confianza del (1−α)100 % para
µ1 − µ2 está dado por:
s   s  
1 1 1 1
(x1 −x2 ) − t α sp
2 + ≤ µ1 −µ2 ≤ (x1 −x2 ) + t α s2p +
2 n1 n2 2 n1 n2

donde
(n1 − 1)s21 + (n2 − 1)s22
s2p =
n1 + n2 − 2
es la estimación de varianza común para las poblaciones y tα/2 es el valor t con n1 + n2 − 2 grados de
libertad que deja a la derecha un área de α/2.

4
Definición 6. INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS: CASO IV.
Parámetro: µ1 − µ2 , Estimador: X 1 − X 2 .

Bajo los supuestos de poblaciones normales, varianzas desconocidas y diferentes se utiliza la estadística:
T = (X 1 −X
r2
)−(µ1 −µ2 )
2 2
, que tiene una distribución t con ν grados de libertad.
S1 S
n1 + n2
2
Se parte de:
P (a ≤ X 1 − X 2 ≤ b) = 1 − α
y se llega a:
 s s 
S12 S2 S12 S22 
P (X 1 − X 2 ) − tα/2 + 2 ≤ µ1 − µ2 ≤ (X 1 − X 2 ) + tα/2 + =1−α
n1 n2 n1 n2

Luego se tiene que:


Si x1 y x2 son las medias de muestras aleatorias independientes de tamaños n1 y n2 tomadas de pobla-
ciones normales con varianzas desconocidas y diferentes un intervalo de confianza del (1 − α)100 % para
µ1 − µ2 está dado por:
s s
S12 S22 S12 S2
(x1 − x2 ) − tα/2 + ≤ µ1 − µ2 ≤ (x1 − x2 ) + tα/2 + 2
n1 n2 n1 n2

Donde tα/2 es el valor t con ν grados de libertad que deja a la derecha un área de α/2.
 2
S12 S22
n1 + n2
ν=  2 2  2
2
S1 S2
n1 n2

n1 −1 + n2 −1

Definición 7. INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS: CASO V.


Parámetro: µ1 − µ2 , Estimador: X 1 − X 2 .

Bajo el supuesto de muestras aleatorias dependientes se utiliza la estadística:

(X 1 − X 2 ) − (µ1 − µ2 ) D − µD
T = Sd
= Sd
,
√ √
n n

que tiene una distribución t con n − 1 grados de libertad, siempre que las diferencias entre valores co-
rrespondientes estén normalmente distribuidas.
Se parte de:
P (a ≤ X 1 − X 2 ≤ b) = 1 − α
y se llega a:  
Sd Sd
P D − tα/2 √ ≤ µ1 − µ2 ≤ D + tα/2 √ =1−α
n n
Luego se tiene que:
Si d y sd son la media y la desviación estándar, respectivamente de las diferencias distribuidas normal-
mente de n pares aleatorios de mediciones, un intervalo de confianza del (1 − α)100 % para µD = µ1 − µ2
está dado por:
Sd Sd
d − tα/2 √ ≤ µ1 − µ2 ≤ d + tα/2 √
n n
donde tα/2 es el valor t con n − 1 grados de libertad que deja a la derecha un área de α/2.

Ejercicio 5. Supongamos que los resultados de un examen estandarizado de matemáticas tomado por
estudiantes de escuelas secundarias grandes y pequeñas son N (µX , σ 2 ) y N (µY , σ 2 ), respectivamente,
donde σ 2 es desconocida. Si una muestra aleatoria de n = 9 estudiantes de las grandes escuelas se-
cundarias produjera x̄ = 81.31, s2x = 60.76 y una muestra aleatoria de tamaño m = 15 de las escuales

5
pequeñas produjo ȳ = 78.61, s2y = 48.24, entonces, determine el intervalo de confianza del 95 % para
µX − µY .
Ejercicio 6. Un estudio publicado en Chemosphere reporta los niveles de la dioxina TCDD en 20 veteranos
de Vietnam de Massachusetts, quienes posiblemente estuvieron expuestos al agente naranja. En la tabla
siguiente se presentan los niveles de tcdd en plasma y tejido adiposo. Calcule un intervalo de confianza
del 95 % para µ1 − µ2 , donde µ1 y µ2 representen las medias verdaderas de los niveles de TCDD en plasma
y en tejido adiposo, respectivamente. Suponga que la distribución de las diferencias es casi normal.

Ejercicio 7. Un investigador quiere comparar la media de la presión arterial de dos grupos de pacien-
tes. La información de una muestra aleatoria se resume en la tabla. Calcular un intervalo de confianza
aproximado del 95 % para la diferencia de medias en la presión arterial.

No Presión arterial Des. muestral


Obs. media (mmHg) (mmHg)
Grupo 1 68 88 4.5
Grupo 2 43 79 4.2

Nota 1. Cuando se calcula el intervalo de confianza para µ1 − µ2 se obtiene una expresión de la forma
a ≤ µ1 − µ2 ≤ b

1. Si a > 0 y b > 0 se puede asegurar con una confianza del (1 − α)100 % que µ1 > µ2

2. Si a < 0 y b < 0 se puede asegurar con una confianza del (1 − α)100 % que µ1 < µ2
3. Si a y b tienen signo diferentes, el cero está dentro del intervalo, es decir que es probable que µ1 −µ2 =
0 se dice entonces que las medias son estadísticamente iguales.
También es posible a partir del intervalo de confianza determinar si existe una diferencia específica
entre µ1 y µ2 .

6
Intervalos de confianza para el cociente de dos varianzas.
Definición 8. INTERVALO DE CONFIANZA PARA EL COCIENTE DE VARIANZAS.
σ12 S2
Parámetro: 2 , Estimador: 12 .
σ2 S2
σ22 S12
Bajo el supuesto de poblaciones normales se utiliza la estadística: F = , que tiene una distribución
σ12 S22
f con ν1 = n1 − 1 grados de libertad en el numerador y ν2 = n2 − 1 grados de libertad en el denominador.
Se parte de:  
S12
P a≤ 2 ≤b =1−α
S2
y se llega a:  
S12 1 σ2 S2
P 2 ≤ 12 ≤ 12 fν2 ,ν1 ,α/2 =1−α
S2 fν1 ,ν2 ,α/2 σ2 S2
Luego se tiene que:

Si s21 y s22 son las varianzas de muestras aleatorias independientes de tamaños n1 y n2 respectivamente
σ2
tomadas de poblaciones normales, entonces un intervalo de confianza del (1−α)100 % para 12 está dado
σ2
por:
s21 1 σ2 s2
2 ≤ 12 ≤ 12 fν2 ,ν1 ,α/2
s2 fν1 ,ν2 ,α/2 σ2 s2
Donde fν1 ,ν2 ,α/2 es el valor f con ν1 = n1 − 1 grados de libertad en el numerador y ν2 = n2 − 1 grados de
libertad en el denominador que deja a la derecha un área de α/2 y fν2 ,ν1 ,α/2 es el valor f con ν2 = n2 − 1
grados de libertad en el numerador y ν1 = n1 − 1 grados de libertad en el denominador que deja a la
derecha un área de α/2

σ12
Nota 2. Cuando se calcula el intervalo de confianza para se obtiene una expresión de la forma
σ22
σ12
a≤ ≤b
σ22
1. Si a > 1 y b > 1 se puede asegurar con una confianza del (1 − α)100 % que σ12 > σ22
2. Si a < 1 y b < 1 se puede asegurar con una confianza del (1 − α)100 % que σ12 < σ22
σ12
3. Si el uno está dentro del intervalo, es decir que es probable que = 1 o equivalentemente σ12 = σ22
σ22
(las varianzas son estadísticamente iguales)

Intervalos de confianza para la diferencia de proporciones.


Definición 9. INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES.
Parámetro: p1 − p2 , Estimador: pb1 − pb2 .

Si pb1 y pb2 son las proporciones de éxito de muestras aleatorias de tamaños n1 y n2 respectivamente, y
qb1 = 1 − pb1 , qb2 = 1 − pb2 , un intervalo de confianza del (1 − α)100 % para p1 − p2 está dado por:
s s
pb1 qb1 pb2 qb2 pb1 qb1 pb2 qb2
p1 − pb2 ) − za/2
(b + ≤ p1 − p2 ≤ (b
p1 − pb2 ) + za/2 +
n1 n2 n1 n2

siempre que: n1 pb1 ≥ 5, n1 qb1 ≥ 5, n2 pb2 ≥ 5 y n2 qb2 ≥ 5


donde Zα/2 es el valor Z que deja a la derecha un área de α/2.

7
Ejercicio 8. En una muestra aleatoria de 400 adultos y 600 adolescentes que veían un programa de tele-
visión determinado, 100 adultos y 300 adolescentes indicaron que les gustaba. Construir el intervalo de
confianza del 95 % y 99 % para la diferencia en las proporciones de todos los adultos y todos los adoles-
centes que veían el programa y les gustó.
Ejercicio 9.

Nota 3. Cuando se calcula el intervalo de confianza para p1 − p2 se obtiene una expresión de la forma
a ≤ p1 − p2 ≤ b

1. Si a > 0 y b > 0 se puede asegurar con una confianza del (1 − α)100 % que p1 > p2
2. Si a < 0 y b < 0 se puede asegurar con una confianza del (1 − α)100 % que p1 < p2
3. Si a y b tienen signo diferentes, el cero está dentro del intervalo, es decir que es probable que p1 −p2 =
0 o equivalentemente p1 = p2 (Las proporciones son estadísticamente iguales)
También es posible a partir del intervalo de confianza determinar si existe una diferencia específica
entre p1 y p2 .

Ejercicio 10. Una agencia estatal tiene la responsabilidad de vigilar la calidad del agua para la cría de
peces con fines comerciales. Esta agencia se encuentra interesada en comparar la variación y los conte-
nidos promedio de cierta sustancia tóxica en dos estuarios cuyas aguas se encuentran contaminadas por
desperdicios industriales provenientes de una zona industrial cercana. En el primer estuario se seleccio-
nan 11 muestras y en el segundo 8 muestras, las cuales se enviaron al laboratorio para su análisis, Las
mediciones en partes por millón se resumen en la tabla siguiente. Los contenidos de sustancia tóxica se
distribuyen en forma normal.

Estuario 1 10 10 12 13 9 8 12 12 10 8 14
Estuario 2 11 8 9 7 10 8 8 10

1. ¿Son igualmente variables los contenidos de sustancia tóxica en los dos estuarios? Utilice I.C del
98 %.
2. ¿Son iguales los contenidos promedios de la sustancia tóxica en los dos estuarios? Utilice I.C del
98 %.

Ejercicio 11. Se desea determinar si cierto método de enseñanza para niños con capacidades especiales
mejora su capacidad de razonamiento. Se le realiza una prueba a un grupo de estos niños antes de aplicar
el método y un mes después de aplicado. Los resultados de las pruebas se resumen en la tabla. Considere
que las diferencias están distribuidas en forma normal y determine si el nuevo método es efectivo. Utilice
un intervalo de confianza del 96 %.

Antes 9 7 6 7 5 5 7 6 5 4 5 6 7 9 8
Después 8 9 7 5 6 7 7 8 7 7 5 8 6 9 9

Ejercicio 12. En un estudio reciente que abarcá 25 años, se investigá la posible protección que proporciona
la ingestión de una forma de vitamina A llamada caroteno contra el desarrollo del cáncer pulmonar. Se
encontró que de 488 hombres que habían ingerido una baja cantidad de esta sustancia durante este
tiempo, 14 desarrollaron cáncer pulmonar, pero en un grupo de 450 en el que el consumo de caroteno era
mayor 10 personas desarrollaron cáncer. ¿Puede concluirse que la ingestión de caroteno reduce el riesgo
de desarrollar cáncer pulmonar en los hombres? Utilice intervalos de confianza del 90 %.

8
Análisis de Unidad 6: Prueba de Hipótesis
Objetivos de investigación

Después de un cuidadoso estudio de este capítulo, debería ser capaz de hacer lo siguiente:
Problemas de toma de decisiones en ingeniería de estructuras como pruebas de hipótesis

Probar las hipótesis sobre la media de una distribución normal utilizando un procedimiento de
prueba Z o una prueba T.
Hipótesis de prueba sobre la varianza o la desviación estándar de una distribución normal
Hipótesis de prueba sobre una proporción de la población

Usar el enfoque del valor P para tomar decisiones en las pruebas de hipótesis
Calcular la potencia y la probabilidad de error de tipo II, y tomar decisiones de selección del tamaño
de la muestra para las pruebas de medios, variaciones y proporciones
Explicar y utilizar la relación entre los intervalos de confidence y las pruebas de hipótesis

Usa la prueba de bondad del chi-cuadrado de fit para comprobar las suposiciones de distribución
Utilice las pruebas de la tabla de contingencia

Introducción
Las secciones anteriores han mostrado cómo puede estimarse un parámetro a partir de los datos
contenidos en una muestra. Puede encontrarse ya sea un sólo número (estimador puntual) o un inter-
valo de valores posibles (intervalo de confianza). Sin embargo, muchos problemas de ingeniería, ciencia,
y administración, requieren que se tome una decisión entre aceptar o rechazar una proposición sobre
algún parámetro. Esta proposición recibe el nombre de hipótesis. Este es uno de los aspectos más útiles
de la inferencia estadística, puesto que muchos tipos de problemas de toma de decisiones, pruebas o
experimentos en el mundo de la ingeniería, pueden formularse como problemas de prueba de hipótesis.
Por ejemplo:
Un investigador médico puede decidir con base en evidencia experimental si beber café incrementa
el riesgo de cáncer en los seres humanos.

Un ingeniero quizá tenga que decidir con base en datos muestrales si hay una diferencia entre la
precisión de un tipo de medidor y la de otro.
Un sociólogo desee reunir los datos apropiados que le permitan decidir si el tipo de sangre y el
color de ojos de un individuo son variables independientes

9
En esté capítulo utilizaremos la información muestral para probar la validez de una afirmación, con-
jetura o hipótesis acerca del valor del parámetro de la población.

Prueba de Hipótesis
Definición 10. HIPÓTESIS ESTADÍSTICA
Una hipótesis estadística es una afirmación o conjetura que se que se realiza con respecto a una o más
poblaciones, puede estar relacionada con parámetros o características de la población.

Ejemplo 1.
1. El porcentaje de artículos defectuosos en una línea de ensamble es del 5 % (Parámetro p : proporción)
2. Un fabricante afirma que la resistencia promedio a la tensión de un hilo A es igual a la resistencia
promedio a la tensión de un hilo B (Parámetro µ1 − µ2 : diferencia de medias)

3. El tiempo de falla de un equipo eléctrico se distribuye exponencialmente con una media de 10 años
(Característica: tipo de distribución)

10
Definición 11. PRUEBA DE HIPÓTESIS
Una prueba de hipótesis es el procedimiento basado en la evidencia muestral y en teoría de probabilidad
que se emplea para determinar si la hipótesis es un enunciado razonable.

11
PROCEDIMIENTO DE CINCO PASOS PARA PROBAR UNA HIPÓTESIS

PASO 2 PASO 3 PASO 4 PASO 5


PASO 1
Seleccionar un Identificar el valor Formular una Tomar una
Plantear las
nivel de estadístico de regla de muestra y llegar a
hipótesis
significancia prueba decisión una decisión

Rechazar 𝐻0
No rechazar 𝐻0 Y
Aceptar 𝐻1

Paso 1: Plantear las hipótesis


En ésta se plantean dos hipótesis:

Hipótesis Nula: Se denota por H0 . Es una firmación que consiste en negar toda diferencia entre 2
poblaciones, entre dos parámetros o entre el valor verdadero de algún parámetro y su valor hipo-
tético.
Hipótesis Alternativa: (H1 o Ha )se establece como el “el complemento” de la hipótesis nula y re-
presenta la conclusión cuando H0 se rechaza.

1. El planteamiento de éstas hipótesis es fundamental para dar la conclusión adecuada al problema.


2. Es importante recordar que las hipótesis siempre son proposiciones sobre la población o distribu-
ción bajo estudio, no proposiciones sobre la muestra.

RESULTADOS EN UNA PRUEBA DE HIPÓTESIS


Nunca se sabe con certeza sobre la veracidad o falsedad de una hipótesis, sólo si se examina toda la
población, lo cual es impráctico o imposible. Se toma una muestra aleatoria de la población de interés y
se usa para proporcionar evidencias que confirmen o NO la hipótesis. Una prueba de hipótesis siempre
conduce a uno de dos resultados posibles:

1. Rechazar H0 : Indica que la muestra refuta H0 , pero, hay una probabilidad muy pequeña de obtener
ésta información de la muestra aún cuando H0 sea verdadera.
2. No rechazar H0 : Indica que la muestra apoya H0 , por lo cual, no hay suficientes razones para recha-
zarla. Existe una probabilidad pequeña de obtener ésta información de la muestra aún cuando H0
sea falsa.
Tipos de pruebas:

A. Pruebas unilaterales o de una cola:

12
   
H0 : θ ≤ θ 0 H0 : θ = θ0

H1 : θ > θ 0 H1 : θ > θ0
   
H0 : θ ≥ θ 0 H0 : θ = θ0

H1 : θ < θ 0 H1 : θ < θ0

B. Prueba bilateral o de dos colas:


 
H0 : θ = θ 0
H1 : θ ̸= θ0

En pruebas relacionadas con parámetros la hipótesis nula es el complemento lógico de la hipótesis


alternativa. H0 siempre llevará el signo de igualdad. Para establecer H1 se tendrá en cuenta si se realiza
una afirmación o pregunta que:

A. a) Indique una dirección compuesta (≤ o ≥) H0 se planteará con la dirección compuesta y H1 se


establecerá en dirección contraria.
b) Indique una dirección (< o >) H1 se establecerá en la misma dirección y H0 se establecerá en
dirección contraria.
B. No indique dirección H0 se establecerá con el signo = y H1 se establecerá con el signo ̸=.

Ejemplo 2.

1. El porcentaje de artículos defectuosos en una línea de ensamble es cuando mucho del 5 %.


H0 : p ≤ 0.05
H1 : p > 0.05

2. El porcentaje de artículos defectuosos en una línea de ensamble es menor del 5 %.


H0 : p ≥ 0.05
H1 : p < 0.05

3. El porcentaje de artículos defectuosos en una línea de ensamble es igual al 5 %.


H0 : p = 0.05
H1 : p ̸= 0.05

IMPORTANCIA DEL PLANTEAMIENTO


Si no se plantean bien las hipótesis nula y alternativa se puede realizar la prueba y concluir equivo-
cadamente.

Ejemplo 3. El porcentaje de artículos defectuosos en una línea de ensamble es cuando mucho del 5 %.

1. Mal planteada
H0 : p ≥ 0.05 H1 : p < 0.05

a) Si se rechaza H0 , se considera válida H1 , la afirmación es válida.


b) Si no se rechaza H0 , la afirmación es válida

2. Bien planteada
H0 : p ≤ 0.05 H1 : p > 0.05

a) Si se rechaza H0 la afirmación no es válida.


b) Si no se rechaza H0 la afirmación es válida

Ejemplo 4. Suponga que se tiene interés en la rapidez de combustión de un agente propulsor sólido
utilizado en los sistemas de salida de emergencia para la tripulación de aeronaves. El interés se centra
sobre la rapidez de combustión promedio. De manera específica, el interés recae en decir si la rapidez de
combustión promedio es o no 50 cm/s. Esto puede expresarse de manera formal como

13
H0 : µ = 50cm/s
H1 : µ ̸= 50cm/s

Luego realizamos una muestra de 10 elementos y miramos su rapidez promedio. Entonces tenemos el
estimador X̄ del parámetro µ.

Paso 2: Seleccionar un nivel de significancia.


Definición 12. ERRORES EN LAS PRUEBAS DE HIPÓTESIS
Error tipo I : Rechazar H0 dado que H0 es verdadera.
Error tipo II : No rechazar H0 dado que H0 es falsa.

Rechazar H0 No rechazar H0
H0 es verdadera Error tipo I Decisión correcta
H0 es falsa Decisión correcta Error tipo II

El error tipo I se define como el rechazo de la hipótesis nula H0 cuando ésta es verdadera. También
es conocido como α ó nivel de significancia.

α = P (Error tipo I)

El error tipo II ó error β se define como la aceptación de la hipótesis nula cuando ésta es falsa.

β = P (Error tipo II)

Potencia de la prueba es 1 − β es decir la probabilidad de rechazar Ho dado que Ho es falsa.


El nivel de confianza o confiabilidad es el complemento del nivel de significancia.

Al momento de diseñar un experimento para probar una hipótesis es necesario establecer α y β lo


más pequeños posibles y determinar el tamaño de muestra apropiado.

Ejemplo 5. Se cree que un nuevo tratamiento ofrece buenos resultados


H0 : El nuevo tratamiento no tiene efecto
H1 : El nuevo tratamiento es útil

14
Rechazar H0 No rechazar H0
H0 es verdadera Error tipo I Decisión correcta
El tratamiento no tiene El tratamiento no tiene
efecto, pero se decide que si. efecto y así se
α = P (Error de tipo I) decide
H0 es falsa Decisión correcta Error tipo II
El tratamiento tiene efecto El tratamiento si tiene efecto
y el experimento lo confirma pero no lo percibimos
β = P (Error tipo II)

Ejemplo 6. Considere la hipótesis nula de que el peso promedio de estudiantes hombres en cierta uni-
versidad es de 68 kilogramos, contra la hipótesis alternativa de que es diferente a 68. Es decir, deseamos
probar
H0 :µ = 68
H1 : µ ̸= 68

Una región crítica para el estadístico de prueba se puede elegir de manera arbitraria como los dos
intervalos x̄ < 67 y x̄ > 69. Veamos cual es la probabilidad de cometer errores tipo I y II. Supongamos que
la desviación estandar de la población de pesos es σ = 3.6. Nuestro estadístico de decisión, que se basa
en una muestra aleatoria de tamaño n = 36, será X̄, el estimador más eficaz de µ.
La probabilidad de cometer un error tipo I, o el nivel de significancia de nuestra prueba, es igual a la suma
de las áreas sombreadas en cada cola de la distribución en la figura

Esto nos lleva a α = 0.095.

Ahora supongamos que ampliamos el tamaño de la muestra n = 64. Para determinar la probabilidad
de cometer un error de tipo II, Consideraremos evaluar la hipótesis alternativa H1 : µ = 70. Cuando
ocurriría un error de tipo II?

15
La probabilidad de cometer un error tipo II aumenta rápidamente cuando el valor verdadero de µ se apro-
xima al valor hipotético pero no es igual a éste.

Supongamos que nuestra hipótesis H1 es µ = 68.5, la probabilidad de cometer un error de tipo II, con
n = 64 seria:

16
Paso 3: Identificar el valor estadístico de prueba
SELECCIONAR Y CALCULAR LA ESTADÍSTICA DE PRUEBA
Media.
Varianza.
Proporción.

Diferencia de medias
Cociente entre varianzas.
Diferencia entre proporciones.

Paso 4: Formular la regla de decisión


FORMAS DE TOMAR LA DECISIÓN

1. Estableciendo la región crítica o de rechazo, esta depende de:

a. Distribución a utilizar.
b. Hipótesis alternativa H1 .
c. Nivel de significancia α.

Si H1 : θ > θ0 la región crítica o de rechazo es a la derecha del punto crítico (Valor que deja a la
derecha un área de α)
Si H1 : θ < θ0 la región crítica o de rechazo es a la izquierda del punto crítico (Valor que deja a la
izquierda un área de α)
Si H1 : θ ̸= θ0 la región crítica o de rechazo es en las dos colas, los puntos críticos son los valores
que dejan en las colas áreas de α/2

Decisión: Si el valor de la estadística cae en la región de rechazo, se rechaza H0 en favor de H1 . De lo


contrario no se rechaza H0 .
2. Calculando el valor P que depende de:

a. Distribución a utilizar.
b. Hipótesis alternativa H1 .
c. Valor de la estadística de prueba.

El valor P es el mínimo nivel de significancia para el cual el valor de la estadística de prueba es signifi-
cativo, se calcula como la probabilidad de encontrar un valor más extremo que el valor de la estadística
de prueba.

Si valor P < α se rechaza H0 en favor de H1 .


Si valor P > α no se rechaza H0 .
Si valor P es muy pequeño se rechaza H0 a cualquier nivel de significancia. (menor de 0.001).
Si valor P es muy grande no se rechaza Ho a cualquier nivel de significancia. (mayor de 0.1).

17
Paso 5: Tomar una muestra y llegar a una decisión.
PROCEDIMIENTO PARA REALIZAR UNA PRUEBA DE HIPÓTESIS
1. Establecer H0 y H1 .
2. Elegir un nivel de significancia α.

3. Seleccionar la estadística de prueba adecuada, ésta depende del parámetro y las condiciones del
problema.
4. Calcular el valor de la estadística de prueba, éste depende de los valores en la muestra y el valor
puntual del parámetro establecido en H0 .

5. Tomar la decisión (Rechazar H0 o No rechazar H0 ).


6. Establecer las conclusiones científicas y/o de ingeniería.

Tema 1. PRUEBAS PARA UNA SOLA MEDIA (VARIANZA CONOCIDA)


Considere primero la hipótesis
H0 : µ = µ0
H1 : µ ̸= µ0
x̄ − µ x̄ − µ
z= √ > zα/2 o z= √ < −zα/2
σ/ n σ/ n
Si −zα/2 < z < zα/2 , no se rechaza H0 . El rechazo de H0 , desde luego, implica la acepatación de la hipó-
tesis H1 : µ ̸= µ0 . Con esta definición de la región crítica debería quedar claro que habrá α probabilidades
de rechazar H0 (al caer en la región crítica) cuando, en realidad, µ = µ0 .

Ejemplo 7. Una muestra aleatoria de 100 muertes registradas en Colombia el año pasado reveló una vida
promedio de 71.8 años. Si se supone una desviación estándar de la población de 8.9 años, ¿esto parece
indicar que la vida media actual es mayor que 70 años? Utilice un nivel de significancia de 0.05.

Solución:
1. H0 : µ = 70 años
2. H1 : µ > 70 años
3. α = 0.05

18
x̄ − µ0
4. Región crítica: z > 1.645, donde z = √ .
σ/ n
71.8 − 70
5. Cálculos: x̄ = 71.8 años, σ = 8.9 años, en consecuencia, z = √ = 2.02
8.9/ 100
6. Decisión: rechazar H0 y concluir que la vida media actual es mayor que 70 años.
El valor P que corresponde a z = 2.02 es dado por:

P = P (Z > 2.02) = 0.0217

Como resultado, la evidencia a favor de H1 es incluso más firme que la sugerida por un nivel de signifi-
cancia de 0.05.

Ejemplo 8. Se afirma que un automóvil se maneja en promedio más de 20000 km por año. Para probar
tal afirmación, se pide a una muestra de 100 propietarios de automóviles que lleven un registro de los
kilómetros que recorran. ¿Estará usted de acuerdo con esta afirmación si la muestra aleatoria dio un re-
corrido promedio de 23500 km y una desviación estándar de 3900 km? Utilice un nivel de significancia de
0.05.

Solución:

1. H0 : µ = 20.000 kilómetros
2. H1 : µ > 20.000 kilómetros
3. α = 0.05
x̄ − µ0
4. Región crítica: z > 1.645, donde z = √ .
σ/ n
5. Cálculos: x̄ = 23.500 kilómetros, σ = 3.900 kilometros, en consecuencia,
x̄ − µ0 23.500 − 20.000
z= √ = √ = 8.97
σ/ n 3.900/ 100
.
6. Decisión: rechazar H0 y concluir que µ > 20.000 kilómetros.

El valor P que corresponde a z = 8.97 es dado por:

P = P (Z > 8.97) ≈ 0

Como resultado, la evidencia a favor de H1 es incluso más firme que la sugerida por un nivel de signifi-
cancia de 0.05.

19
Ejemplo 9. De acuerdo con un estudio sobre un régimen alimenticio, la ingesta elevada de sodio se re-
laciona con úlceras, cáncer estomacal y migrañas. El requerimiento humano de sal es de tan sólo 220
miligramos diarios, el cual se rebasa en la mayoría de las porciones individuales de cereales listos para
comerse. Si una muestra aleatoria de 20 porciones similares de cierto cereal tiene un contenido medio
de 244 miligramos de sodio y una desviación estándar de 24.5 miligramos, ¿esto sugiere, a un nivel de
significancia de 0.05, que el contenido promedio de sodio para porciones individuales de ese cereal es
mayor que 220 miligramos? Suponga que la distribución de contenidos de sodio es normal.
Solución:

Ejemplo 10. Un fabricante afirma que la resistencia promedio a la tensión del hilo A excede a la resis-
tencia a la tensión promedio del hilo B en al menos 12 kilogramos, cada una con desviación estándar de
6.28 kilogramos y 5.61 kilogramos, respetivamente. Para probar esta afirmación se pusieron a prueba 50

20
pedazos de cada tipo de hilo en condiciones similares. El hilo tipo A tuvo una resistencia promedio a la
tensión de 86.7 kilogramos; mientras que el hilo tipo B tuvo una resistencia promedio a la tensión de 77.8
kilogramos. Pruebe la afirmación del fabricante usando un nivel de significancia de 0.05.

Solución:

1. H0 : µA − µB = 12 kg.
2. H1 : µA − µB > 12 kg.
3. α = 0.05
x̄A − x̄B − (µA − µB )
4. Región crítica: z > 1.645, donde z = s .
2 2
σA σB
+
nA nB

5. Cálculos: x̄A = 86.7 kg, x̄B = 77.8 kg, σA = 6.28 kg y σB = 5.61 kg con nA = nB = 50, en consecuencia,

x̄A − x̄B − (µA − µB ) (86.7 − 77.8) − 12


z= s =r = −2.6
σA2 2
σB (6.28)2 (5.61)2
+ +
nA nB 50 50
.
6. Decisión: No rechazamos H0 y concluya que la resistencia a la tensión promedio del hilo A no excede
la resistencia a la tensión promedio del hilo B en 12 kilogramos.
7. El valor P que corresponde a z = −2.6 es dado por:

P = P (Z > −2.6) = 0.995

Ejemplo 11. Los siguientes datos representan los tiempos de duración de películas producidas por 2 em-
presas cinematográficas:

Empresa Tiempo(min)
1 102 86 98 109 92
2 81 165 97 134 92 87 114

Pruebe la hipótesis de que la duración promedio de las películas producidas por la empresa 2 excede
al tiempo promedio de duración de las que produce la empresa 1 en 10 minutos, contra la alternativa
unilateral de que la diferencia es de menos de 10 minutos. Utilice un nivel de significancia de 0.1 y suponga
que las distribuciones de la duración son aproximadamente normales con varianzas iguales.
Solución:

21
Tema 2. PRUEBA DE HIPÓTESIS PARA PROPORCIÓN CON MUESTRAS PEQUEÑAS
Si se van a realizar pruebas relacionadas con proporciones donde la muestra sea pequeña (por lo menos
una de las condiciones npo ≥ 5 y nqo ≥, no se cumpla, po es el valor puntual de p establecido en Ho ) en
esta caso no es posible utilizar la distribución normal, la estadística que se utiliza es la variable aleatoria
binomial X : número de éxitos en n ensayos y probabilidad de éxito po . Su distribución de probabilidad
será:  
n
p(x) = pxo qon−x x = 0, . . . , n
x
Como X es una variable discreta la decisión no se puede tomar en términos de región crítica, solo es
posible utilizar el valor P, el cual se calcula de la siguiente forma:

H0 : p ≥ p0
1. Si: Valor P = P (X ≤ x cuando p = p0 )
H1 : p < p0

H0 : p ≤ p0
2. Si: Valor P = P (X ≥ x cuando p = p0 )
H1 : p > p0

H0 : p = p0
3. Si:
H1 : p ̸= p0

a) Valor P = 2P (X ≤ x cuando p = p0 ) si x ≤ np0


b) Valor P = 2P (X > x cuando p = p0 ) si x > np0

Prueba de una proporción (muestras pequeñas)

1. H0 : p = p0 .
2. Una de las alternativas H1 : p < p0 , p > p0 o p ̸= p0 .
3. Elegir un nivel de significancia igual a α.
4. Estadístico de prueba: variable binomial X con p = p0 .

5. Cálculo: obtener x, el número de éxitos, y calcular el valor P adecuado.


6. Decisión: sacar las conclusiones apropiadas con base en el valor P .

Ejemplo 12. Un experto en mercadotecnia de una empresa fabricante de pasta considera que más del 40 %
de los amantes de la pasta prefieren la lasagna. Si 9 de 20 amantes de la pasta eligen la lasagna sobre
otras pastas, ¿qué se puede concluir acerca de la afirmación del experto? Utilice un nivel de significancia
de 0.05.
Solución.
1. H0 : p = 0.4

2. H1 : p > 0.4
3. α = 0.05
4. Estadístico de prueba: X las personas que eligen lasaña. Variable binomial. p = 0.4 y n = 20.

5. Cálculos: x = 9 y np0 = (20)(0.4) = 8. Por lo tanto, el valor P calculado es:

X
20
P = P (X ≥ 9 cuando p = 0.4) = b(x; 20, 0.4) = 0.4044 > 0.1
x=9

6. Decisión: No rechazamos H0 a cualquier nivel de significancia !. Concluimos que a lo más del 40 %


de loas amantes a la pasta eligen lasagna.

22
Ejemplo 13. Se considera que un medicamento que se prescribe comúnmente para aliviar la tensión ner-
viosa tiene una eficacia de tan sólo 60 %. Los resultados experimentales de un nuevo fármaco adminis-
trado a una muestra aleatoria de 100 adultos que padecían tensión nerviosa revelaron que 70 de ellos
sintieron alivio. ¿Esta evidencia es suficiente para concluir que el nuevo medicamento es mejor que el que
se prescribe comúnmente? Utilice un nivel de significancia de 0.05

Solución.
1. H0 : p = 0.6
2. H1 : p > 0.6
3. α = 0.05
p̂ − p
4. Región crítica: z > 1.645, donde z = r .
(p0 )(q0 )
n
5. Cálculos: x = 70, n = 100, p̂ = 70/100 = 0.7 y

p̂ − p 0.7 − 0.6
z=r =r = 2.04
(p0 )(q0 ) (0.6)(0.4)
n 100
donde P = P (Z > 2.04) = 0.0207 < α
6. Decisión: Rechazamos H0 y concluimos que el nuevo fármaco es mejor.

Tema 3. PRUEBA DE HIPÓTESIS PARA DIFERENCIA DE PROPORCIONES


A. Caso I: Diferencia de proporciones.
Si:
H0 : p 1 − p 2 ≥ 0 H0 : p1 − p2 ≤ 0 H0 : p1 − p2 = 0
H0 : p 1 − p 2 < 0 H0 : p1 − p2 > 0 H0 : p1 − p2 ̸= 0
Es posible estimar p con:
x1 + x2
pb =
n1 + n2

El valor de la estadística será:


(bp1 − pb2 )
z=r  
pbqb n11 + n12

En este caso las condiciones se transforman en n1 pb ≥ 5, n1 qb ≥ 5, n2 pb ≥ 5 y n2 qb ≥ 5


B. Caso II: Diferencia de proporciones
Si:

H0 : p1 − p2 ≥ p0 H0 : p1 − p2 ≤ p0 H0 : p1 − p2 = p0
H1 : p1 − p2 < p0 H1 : p 1 − p 2 > p 0 H1 : p1 − p2 ̸= p0

Se toman las estimaciones para p1 y p2 .


El valor de la estadística será:
p1 − pb2 ) − p0
(b
z=r
pb1 qb1 pb2 qb2
+
n1 n2

En este caso las condiciones se transforman en n1 pb1 ≥ 5, n1 qb1 ≥ 5, n2 pb2 ≥ 5, n2 qb2 ≥ 5

23
Ejemplo 14. Una comunidad urbana quiere demostrar que la incidencia de cáncer de mama es mayor en
su localidad que en una área rural vecina. (Se encontró que los niveles de PCB son más altos en el suelo de
la comunidad urbana). Se descubre que en la comunidad urbana 20 de 200 mujeres adultas tienen cáncer
de mama y que en la comunidad rural 10 de 150 mujeres adultas lo tienen, ¿podría concluir, con un nivel
de significancia de 0.05, que el cáncer de mama prevalece más en la comunidad urbana?

Solución. Sean pu y pr las proporciones verdaderas de los porcentajes de mujeres enfermas con cáncer
de mama de la comunidad urbana y la comunidad rural, respectivamente.

1. H0 : pu = pr

2. H1 : pu > pr
3. α = 0.05
(bpu −bpr )
4. Región crítica: z > 1.645, donde z = q .
pbqb( n1u + n1r )

5. Cálculos:
xu 20 xr 10
pbu = = = 0.1 pbr = = = 0.066
nu 200 nr 150
xu + xr 20 + 10 (20/200) − (10/150)
pb = = = 0.0857 y z = r = 1.1
nu + nr 200 + 150 1 1
(0.085714)(0.914286)( + )
200 150

6. Decisión: No podemos rechazar H0 y concluimos que no se puede demostrar que el cáncer de seno
sea más frecuente en la comunidad urbana que en la comunidad rural.

Tema 4. PRUEBA DE HIPÓTESIS PARA VARIANZA


El estadístico de prueba para comparar dos hipótesis, digamos

H0 : σ 2 ≥ σ02 H0 : σ 2 ≤ σ02 H0 : σ 2 = σ02


H1 : σ 2 < σ02 H1 : σ 2 > σ02 H1 : σ 2 ̸= σ02
está dado por
(n − 1)s2
χ2 = ,
σ02
donde
H0 H1 Región crítica
σ 2 = σ02 σ2 ≠ σ12 χ2 < χ21−α/2 o χ2 > χ2α/2
σ 2 = σ02 σ < σ12
2
χ2 < χ21−α/2
σ 2 = σ02 σ 2 > σ12 χ2 > χ2α/2

Ejemplo 15. Se dice que una máquina despachadora de refrescos está fuera de control si la varianza de
los contenidos excede 1.15. Si una muestra aleatoria de 25 bebidas de esta máquina tiene una varianza
de 1.75, ¿esto indica, con un nivel de significancia de 0.05, que la máquina esta fuera de control? Suponga
que los contenidos se distribuyen normalmente.
Solución.

24
1. H0 : σ 2 = 1.15
2. H1 : σ 2 > 1.15

3. α = 0.05
(n − 1)s2
4. Región crítica: χ2 > 36.415, donde χ2 =
σ2
5. Cálculos: s2 = 1.75, n = 25, en consecuencia,

(n − 1)s2 (25 − 1)(1.75)


χ2 = = = 36.52
σ2 1.15

6. Decisión: rechazar H0 ; existe suficiente evidencia para


concluir, con un nivel de significancia de α = 0.05 que La
máquina de refrescos está fuera de control.

7. El valor P que corresponde a χ2 = 36.52 es dado por:

P = P (χ2 > 36.52) = 0.0488 < α = 0.05

Ejemplo 16. Un fabricante de baterías para automóvil afirma que la duración de sus baterías se distribuye
de forma aproximadamente normal con una desviación estándar igual a 0.9 años. Si una muestra aleatoria
de 10 de tales baterías tiene una desviación estándar de 1.2 años, ¿considera que σ > 0.9 años?. Utilice un
nivel de significancia de 0.05.
Solución.
1. H0 : σ 2 = 0.81
2. H1 : σ 2 > 0.81

3. α = 0.05
(n − 1)s2
4. Región crítica: χ2 > 16.919, donde χ2 = .
σ2
5. Cálculos: s2 = 1.44, n = 10, en consecuencia,

(n − 1)s2 (10 − 1)(1.44)


χ2 = 2
= = 16.0
σ 0.81
.
6. Decisión: No rechazar H0 ; puesto que existe χ2 = 16 cae en la regió de aceptación. Se concluye que
no hay suficiente evidencia para dudar, con un nivel de significancia de α = 0.05 que la desviación
estándar es de 0.9 años..

7. El valor P que corresponde a χ2 = 16 es dado por:

P = P (χ2 > 16) = 0.0669 > α = 0.05

25
Tema 5. PRUEBA DE HIPÓTESIS PARA EL COCIENTE DE VARIANZAS
El estadístico de prueba para comparar dos hipótesis, digamos

H0 : σ12 ≥ σ22 H0 : σ12 ≤ σ22 H0 : σ12 = σ22


H1 : σ12 < σ22 H1 : σ12 > σ22 H1 : σ12 ̸= σ22
está dado por
S12
F = ,
S22
donde
H0 H1 Región crítica
σ12 = σ22 ̸ σ22
σ12 = F < F1−α (ν1 , ν2 ) o F > Fα (ν1 , ν2 )
σ12 = σ22 σ1 < σ22
2
F < F1−α (ν1 , ν2 )
σ12 = σ22 σ12 > σ22 F > Fα (ν1 , ν2 )

Ejemplo 17. Se realiza un estudio para comparar el tiempo que les toma a hombres y mujeres ensamblar
cierto producto. La experiencia indica que la distribución del tiempo tanto para hombres como para muje-
res es aproximadamente es normal, pero que la varianza del tiempo para las mujeres es menor que para
los hombres. Una muestra aleatoria de los tiempos de 11 hombres y 14 mujeres produce los siguientes
datos:
Hombres Mujeres
n1 = 11 n2 = 14
s1 = 6.1 s2 = 5.3
Pruebe la hipótesis de que σ12 = σ22 contra la alternativa de que σ12 > σ22 . Utilice un nivel de significancia
de α = 0.05.
Solución. 1. H0 : σ12 = σ22
2. H1 : σ12 > σ22
3. α = 0.05
4. Región crítica: observamos que f0.05 (10, 13) = 2.671. Por lo tanto se rechaza la hipótesis nula cuando
f > 2.671, donde f = s21 /s22 con ν1 = 10 y ν2 = 13 grados de libertad.
5. Cálculos: s21 = 6.1, s22 = 5.3, por ende
(6.1)2
f= = 1.33
(5.3)2
en consecuencia, f0.05 (10, 13) = 2.671 > 1.33 = f .
6. Decisión: Fallamos en rechazar la hipótesis nula con un nivel de significancia de 0.05. Se concluye
que, la variabilidad del tiempo para ensamblar el producto no es significativamente mayor para los
hombres.
El valor P que corresponde a f = 1.33 es dado por:
P = P (f > 1.33) = 0.3095 > α = 0.05

26
Evaluación de errores
Recordemos:
Error de Tipo I: Rechazar H0 cuando H0 es verdadera.

P (Error de Tipo I) = α

Error de Tipo II: No rechazar H0 cuando H0 es falsa.

P (Error de Tipo II) = P (No rechazar H0 / H0 es falsa)


Observamos que la probabilidad de cometer un Error de tipo II, depende en gran medida de µ, σ, n
y α.
Potencia de la prueba: Rechazar H0 cuando H0 es falsa.

Potencia = P (Rechazar H0 / H0 es falsa)


= 1 − P (No rechazar H0 / H0 es falsa)
=1−β
= P (No cometer error de tipo II)

Observamos que la potencia de la prueba depende también de µ, σ, n y α.


Ejemplo 18. Supongamos que tomamos una muestra de 16 valores de una población que tiene distribución
normal, donde σ = 8 pero no conocemos a µ. Realizamos la prueba:

H0 : µ = 75
H1 : µ ̸= 75

con un nivel de significancia de α = 0.05.

¿Cuál es la potencia de la prueba si la hipótesis nula es incorrecta y la media poblaciona es en


realidad 76?
X̄ − µ0
Es en realidad el estadístico de prueba Z = √ apropiado para está prueba?
σ/ n
Para qué valores de Z, rechazamos H0 ?

Solución.
H0 : µ = 75
̸ 75
H1 : µ =

27
Rechazamos H0 si:

Z ≤ −1.96 o 1.96 ≤ Z
X̄ − 75 X̄ − 75
√ ≤ −1.96 o 1.96 ≤ √
8/ 16 8/ 16
X̄ ≤ 71.08 o 78.92 ≤ X̄

Ahora, si µ = 76, ¿cuál es la potencia de la prueba?

H0 : µ = 75
H1 : µ ̸= 75

Potencia = P (Rechazar H0 / H0 = 76)


Veamos un animación.
Ejercicio 13. Una máquina se ajusta de manera que la cantidad servida está distribuida aproximadamente
normal, con media de 200 ml y una desviación estándar de 15 ml. La máquina se verifica periódicamente
tomando una muestra de 9 bebidas y calculando el contenido promedio. Si x cae en el intervalo 191 < x
< 209 se considera que la máquina opera de forma satisfactoria, de otro modo se concluye que µ ̸= 200.

1. Encuentre la probabilidad de cometer error tipo I, suponiendo que µ = 200 ml.


2. Encuentre la probabilidad de cometer error tipo II cuando µ = 215 ml

Propiedad 1.
El tamaño de la región crítica y por lo tanto la probabilidad de cometer un error tipo I siempre se puede
reducir al ajustar el o los valores críticos.

Propiedad 2.
Los errores tipo I y tipo II están relacionados. Una disminución en la probabilidad de uno tiene como
resultado un incremento en la probabilidad del otro.
Para el ejercicio anterior con una región de no rechazo dada por 191 < x < 209 se encontró que
α = 0.072 y β = 0.115.

28
Si la región de no rechazo se considera ahora como 190 < x < 210 se tiene:
α = P (X < 190) + P (X > 210)
   
190 − 200 210 − 200
=P Z< √ +P Z > √
15/ 9 15/ 9
= P (Z < −2) + P (Z > 2) = 0.046
β = P (190 < X < 210|µ = 215)
 
190 − 215 210 − 215
=P √ <Z< √
15/ 9 15/ 9
= P (−5 < Z < −1) = 0.1586

Propiedad 3.
Un aumento en el tamaño de muestra n reducirá a α y β de forma simultáneas.
Si se toma una muestra de tamaño 25 se tiene:

α = P (X < 191) + P (X > 209)


   
191 − 200 209 − 200
=P Z< √ +P Z > √
15/ 25 15/ 25
= P (Z < −3) + P (Z > 3) = 0.0027
 
191 − 215 209 − 215
β = P (191 < X < 209|µ = 215) = P √ <Z< √
15/ 25 15/ 25
= P (−8 < Z < −2) = 0.023

Propiedad 4.
Si la hipótesis nula es falsa, β es un máximo cuando el valor real de un parámetro se aproxima al valor
hipotético. Cuando más grande sea la distancia entre el valor real y el valor hipotético, β será menor.

 
191 − 205 209 − 205
β = P (191 < X < 209|µ = 205) = P √ <Z< √
15/ 9 15/ 9
= P (−2.8 < Z < −0.8) = 0.788
 
191 − 210 209 − 210
β = P (191 < X < 209|µ = 210) = P √ <Z< √
15/ 9 15/ 9
= P (−3.8 < Z < −0.2) = 0.421
 
191 − 215 209 − 215
β = P (191 < X < 209|µ = 215) = P √ <Z< √
15/ 9 15/ 9
= P (−4.8 < Z < −1.2) = 0.115

Tamaño de la muestra. Consideremos un procedimiento de prueba de hipótesis para la


media poblacional, suponiendo que la población es normal con varianza conocida y la
hipótesis nula H0 : µ = µ0 . Entonces, el tamaño de la muestra n, para el cual una prueba
de nivel α también tiene β = β(µ′ ) en el valor lternativo µ′ , es:


 (Z + Zβ )2 σ 2
 α/2
 Prueba de dos cola
(µ0 − µ′ )2
n=

 (Zα + Zβ )2 σ 2

 Prueba de una colas
(µ0 − µ′ )2

Ejercicio 14. Suponga que necesitamos contrastar la hipótesis H0 : µ = 68 centímetros contra H1 : µ > 68
para las estaturas de niños de una determinada edad fija, con el uso de un nivel de significancia de 0.05 y

29
sabiendo que la desviación poblacional es 5. Encuentre el tamaño muestral que se requiere s ila potencia
de nuestra prueba debe ser 0.95 cuando la media real es 69 centímetros
Solución. Como α = β = 0.05, tenemos Zα = Zβ = 1.645. Y como µ0 = 68, para la alternativa µ′ = 69,
tenemos
(1.6425 + 1.645)2 (25)
n= = 270.6
(68 − 69)2
Por tanto, se requiere 271 observaciones si la prueba debe rechazar la hipótesis nula 95 % de las veces
cuando, de hecho, µ es tan grande como 69 kilogramos.
Ejercicio 15. Una tintorería afirma que un nuevo removedor de manchas quitará más de 70 % de las man-
chas en las que se aplique. Para verificar esta afirmación, el removedor de manchas se utilizará sobre 12
manchas que se eligieron aleatoriamente. Si menos de 9 de las manchas se eliminan no se rechazará la
hipótesis nula que p ≤ 0.7; en cualquier otro caso se concluirá que p > 0.7.
1. Evalúe α, suponiendo que p = 0.7.
2. Evalúe β, para una alternativa de p = 0.9.
Ejercicio 16. Repita el ejercicio anterior si se tratan 100 manchas y la región crítica se define como x > 75
donde x es el número de manchas que se eliminan.

Planteamiento de hipótesis
Ejercicio 17. Una socióloga se interesa en la eficacia de un curso de entrenamiento diseñado para lograr
que más conductores utilicen los cinturones de seguridad en los automóviles.
1. ¿Qué hipótesis prueba ella si comete un error tipo I al concluir de manera errónea que el curso de
entrenamiento no es eficaz?
2. ¿Qué hipótesis prueba ella si comete un error tipo II al concluir de manera errónea que el curso de
entrenamiento no es eficaz?
Ejercicio 18. Una empresa de material eléctrico fabrica bombillas que tienen una duración que se distri-
buye de forma aproximadamente normal con una media de 800 h y una desviación estándar de 40 h.
1. Pruebe la hipótesis que µ = 800 contra la alternativa que µ ̸= 800, si en una muestra aleatoria de 30
bombillas se encontró una duración promedio de 788 h. Utilice un nivel de significancia de 0.1
2. Construya el intervalo de confianza del 90 % para µ a partir de la información de la muestra.
Ejercicio 19. Se afirma que un automóvil se maneja en promedio más de 20000 km por año. Para probar
tal afirmación, se pide a una muestra de 100 propietarios de automóviles que lleven un registro de los
kilómetros que recorran. ¿Estaría usted de acuerdo con esta afirmación si la muestra aleatoria dio un
recorrido promedio de 23500 km y una desviación estándar de 3900 km. Utilice un nivel de significancia
de 0.05. (Responda la pregunta a partir de intervalos de confianza)
Ejercicio 20 (Relacionado con la media.). Se afirma que un automóvil se maneja en promedio más de
20000 km por año. Para probar tal afirmación, se pide a una muestra de 100 propietarios de automóviles
que lleven un registro de los kilómetros que recorran. ¿Estaría usted de acuerdo con esta afirmación si la
muestra aleatoria dio un recorrido promedio de 23500 km y una desviación estándar de 3900 km?. Utilice
un nivel de significancia de 0.05.
Ejercicio 21 (Relacionado con la varianza.). Se dice que una máquina despachadora de refrescos está fuera
de control si la varianza de los contenidos excede 1.15. Si una muestra aleatoria de 25 bebidas de esta
máquina tiene una varianza de 1.75 ¿Esto indica con un nivel de significancia de 0.05 que la máquina está
fuera de control? Suponga que los contenidos se distribuyen normalmente.
Ejercicio 22 (Relacionado con la proporción con muestras grandes.). Se considera un nuevo dispositivo
de radar para cierto sistema de misiles de defensa. El sistema se verifica experimentando con aeronaves
reales, en las cuales se simula una situación de muerte o no muerte. Si en 300 pruebas ocurren 200 muertes,
rechace o no con un nivel de significancia de 0.04 la afirmación de que la probabilidad de una muerte con
el sistema nuevo es por lo menos 0.7, la probabilidad del sistema existente.

30

También podría gustarte