Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Vilalta Alonso 1
Bibliografía:
1. Walpole, R.; Myers, R.; Myers S. (2008). Probabilidad y Estadística para Ingenieros.
Parte I, capítulo 10, pp. 290-313, 330-332 y 336-340. Sexta Edición, Editorial Félix
Varela, La Habana, Cuba.
Introducción.
Con esta clase se comienza el estudio del otro gran método de la estadística inferencial:
las pruebas (o dócimas) de hipótesis.
Una prueba o dócima de hipótesis es aquella que utilizamos cuando deseamos decidir
si una armación relativa a alguna característica de la población que nos es
desconocida (un parámetro, la propia distribución u otra) es verdadera o falsa.
Algunas situaciones que ejemplican lo anterior son:
¾Podemos considerar que el peso promedio de todas las bolsas llenas ha cambiado?
Estas, y muchas otras preguntas de corte similar, pueden ser respondidas mediante la
solución de problemas de pruebas de hipótesis, algunas de las cuales formarán parte de
los contenidos de esta asignatura.
Una hipótesis estadística es una armación o conjetura acerca de una o más poblacio-
nes con el n de ponerlas a prueba. Se van a plantear dos hipótesis:
H0 : hipótesis nula
H1 : hipótesis alternativa
1. La realidad desconocida.
¾Podemos considerar que el peso promedio de todas las bolsas llenas ha cambiado?
Si conociéramos el verdadero valor del peso medio de todas las bolsas (µ) no estaríamos
ante una conjetura que tendría que ponerse a prueba, es decir, no estaríamos ante un
problema de prueba de hipótesis.
• H0 es cierta
• H0 es falsa
2. La decisión tomada.
Para tomar la decisión hay que evaluar un criterio de decisión, como se puede ver en la
gura 1. Este criterio de decisión es lo que se conoce como región crítica. Pero sobre esto
se volverá después.
Antes vamos comentar algo muy importante: la relación entre las posibles decisiones y el
error en unas pruebas de hipótesis. Para esto observemos lo planteado en la tabla 1:
Como puede verse, cada decisión tiene un posible error asociado. Si se rechaza H0 pudiera
cometerse el error de tipo I, si realmente esta hipótesis fuera cierta. Si por el contrario la
decisión es no rechazar H0 , entonces pudiera cometerse el error tipo II, lo que ocurriría si
la hipótesis nula es falsa.
Esto implica que solo tendremos que preocuparnos por uno de los dos posibles errores,
dependiendo de la decisión que se tome.
Obviamente, nunca podremos saber si nuestra decisión es correcta o ha sido errónea, por-
que la realidad es desconocida.
Por lo tanto, para saber cuán riesgosa es la decisión que tomamos a cada posible error se
asocia su probabilidad de ocurrencia.
Con todos estos elementos estamos en condiciones de comenzar el estudio de las pruebas
de hipótesis para diferentes parámetros: media, varianza y desviación típica y proporción.
• Las hipótesis son excluyentes, lo que implica que nunca la decisión práctica asociada a
ambas hipótesis podrá coincidir.
Dr. C. Ing. José A. Vilalta Alonso 5
A este tipo de pruebas donde en la hipótesis alternativa H1 se ponen los signos < o > se
les llama pruebas unilaterales o de una sola cola.
Ejemplo 2: En una línea de producción se envasa cemento en bolsas que deben pesar
como promedio 1 kg. La dirección de la planta decide revisar esto pues se sospecha que
la máquina llenadora se ha desajustado, modicando el peso promedio.
H0 : µ = 1 la máquina no se ha desajustado
H1 : µ 6= 1 la máquina se ha desajustado
A este tipo de pruebas donde en la hipótesis alternativa H1 se pone el signo 6= se les llama
pruebas bilaterales o de dos colas.
Obviamente este tipo de pruebas para la media poblacional µ usará como estadígrafo base
la media muestral X̄ , sobre cuya base se construirán los estadígrafos de pruebas que se
presentarán más adelante.
H0 : µ = 5
H1 : µ > 5
Esto signica que se tomará una muestra, se calculará la media muestral (X̄ ) y se com-
parará con el valor 5,2. Si resulta ser mayor, la decisión será rechazar la hipótesis nula
H0 . En caso contrario la decisión será no rechazar la hipótesis nula H0 . Esta situación se
representa en la gura 2.
Dr. C. Ing. José A. Vilalta Alonso 6
Observe también la región crítica (RC), es el conjunto de valores de X̄ que son mayores
que 5,2 (X̄ > 5, 2), a los que corresponde el área sombreada, que como sabemos representa
una probabilidad.
Ahora analicemos el área sombreada. ¾Qué representa? Observen que representa la pro-
babilidad de rechazar la hipótesis nula H0 (el área en cuestión está asociada a la región
crítica), siendo realmente H0 cierta (µ = 5).
Los valores de α utilizados con más frecuencia son 0,05; 0,01 y 0,1.
p = P (X̄ > 5, 3)
Note que el valor p, que está representado por el área bajo la curva a la derecha del valor
5,3, es una probabilidad más pequeña que α. Por lo que siempre que el estadígrafo X̄ (o
el estadígrafo que se esté utilizando) esté en la región crítica el valor p será menor que α.
Y en ese caso la decisión será rechazar H0 .
Dr. C. Ing. José A. Vilalta Alonso 8
Pero qué pasará si, por ejemplo, X̄ = 5, 1. La decisión será no rechazar la hipótesis nula
H0 . Y el valor p será:
p = P (X̄ > 5, 1)
Note que el valor p, que está representado por el área bajo la curva a la derecha del valor
5,1, es una probabilidad más grande que α. Por lo que siempre que el estadígrafo X̄ (o el
estadígrafo que se esté utilizando) no esté en la región crítica el valor p será mayor que
α. Y en ese caso la decisión será no rechazar H0 .
Resumiendo:
Por lo tanto, como ya se dijo, α es un valor único y que será jado por el decisor.
Y µ1 es cualquier valor que pertenezca a la hipótesis alternativa. Por lo tanto, como tam-
bién se dijo anteriormente, es una función, que podrá ser calculada para todos los valores
de µ1 que sean de interés.
1. X∼N o n ≥ 30
2. σ2 conocida o n ≥ 30
3. se toma una muestra aleatoria
En este caso el estadígrafo de prueba que se utilizará, calculado sobre la base de la media
muestral es:
X̄ − µ0
Z= √ (1)
σ/ n
Las regiones críticas asociadas a los posibles planteamientos de las hipótesis, así como la
forma de calcular el valor p, quedarían como:
Ahora bien, siempre que solo se je el valor del nivel de signicación α, cualquier tamaño
de muestra lo va a satisfacer. Si la decisión es rechazar H0 no habrá problemas, pues el
Dr. C. Ing. José A. Vilalta Alonso 10
riesgo asociado a la decisión será α, que ha sido jado tan pequeño como queramos.
Pero en ocasiones se desea jar, además del valor de α, también el de β. ¾Cómo garan-
tizar simultáneamente ambos riesgos?
Será necesario calcular un tamaño de muestra mínimos que garantice la satisfacción de
ambos riesgos. Este tamaño de muestra se calcula como:
(Zβ + ZD )2 σ 2
n= (2)
(µ1 − µ0 )2
Donde:
Todos estos resultados pueden ser obtenidos con la utilización de Minitab. Para ello debe
seguirse la secuencia:
5 4 2 5 4 4 5 5 5 4
X ∼ N (µ; σ = 1)
n = 10 X̄ = 4, 3 α = 0, 05
Z < −Z0,05
Z < −1, 64
X̄ − µ0 4, 3 − 5
Z= √ = √ = −2, 21 (3)
σ/ n 1/ 10
RC: −2, 21 < −1, 64 Como se cumple la región crítica hay evidencias para rechazar la
hipótesis nula H0 con un nivel de signicación del 5 % y decidir que las modicaciones
han sido efectivas.
Al ser este valor menor que el nivel de signicación 0,05 la decisión sería rechazar la hi-
pótesis nula H0 .
Z < −Z0,01
Z < −2, 33
RC:−2, 21 > −2, 33 Como no se cumple la región crítica no hay evidencias para rechazar
la hipótesis nula H0 con un nivel de signicación del 1 % y se decide que las modicaciones
no han sido efectivas, ya que no han logrado disminuir el tiempo promedio de entrega.
Ese mismo resultado se hubiera obtenido comparando el valor p (0,013) con α (0,01).
1. X∼N
2. σ2 desconocida y n < 30
En este caso el estadígrafo de prueba que se utilizará, calculado sobre la base de la media
muestral es:
X̄ − µ0
t= √ (4)
S/ n
A continuación se presentan las hipótesis, con sus respectivas regiones críticas y los valores
p.
Para usar Minitab se procede de la misma forma, solo que en este caso:
Ejemplo 4: La longitud de las barras cortadas por cierta máquina sigue una distribu-
ción normal. Históricamente su media ha sido de 170 cm. Se sospecha que la máquina
se ha desajustado y la longitud promedio se ha incrementado. Para vericarlo se toma
una muestra aleatoria de 16 barras en la que se obtuvo una media igual a 173 cm y una
desviación típica de 4,5 cm. Dé respuesta a la problemática planteada con un nivel de
signicación del 5 %.
X∼N
n = 16 X̄ = 173 S = 4, 5 α = 0, 05
Dr. C. Ing. José A. Vilalta Alonso 14
RC: Z > Zα
Z > Z0,05
Z > 1, 64
X̄ − µ0 173 − 170
t= √ = √ = 2, 67 (5)
S/ n 4, 5/ 16
RC: 2, 67 > 1, 64 Como se cumple la región crítica hay evidencias para rechazar la hipóte-
sis nula H0 con un nivel de signicación del 5 % y decidir que la máquina se ha desajustado
Si usamos el valor p:
(Si se busca en la tabla de la distribución t se observará que es un valor entre 0,01 y 0,005.)
La gura 7 muestra la salida obtenida con Minitab, utilizando la opción de datos resumi-
dos, como se comentó en clases anteriores.
En el caso que nos ocupa solo basta recordar que el estadígrafo base que se utilizará será la
2 2
varianza muestral (S ) y la distribución asociada a este estadígrafo es la chi cuadrado (χ ).
Puede agregarse que el planteamiento de las hipótesis puede ser lo mismo para la varianza
2
poblacional σ que para la desviación típica poblacional σ , y que la solución del problema
Dr. C. Ing. José A. Vilalta Alonso 15
es de una única manera, con independencia de si las hipótesis se plantean para un pará-
metro o para otro.
S 2 (n − 1)
χ2 = (6)
σ02
Donde, como en los casos anteriores, el valor χ2c representa el valor de estadígrafo χ2 cal-
culado.
Ejemplo 5: El peso de las bolsas que se envasan en una línea de llenado se ha comportado
históricamente como una variable normal, con media 1 kg y desviación típica de 0,01 kg.
Dr. C. Ing. José A. Vilalta Alonso 16
Se sospecha que las causas de variabilidad que afectan el proceso se han modicado y que
la varianza del peso se ha modicado. Para vericarlo se toma una muestra aleatoria de
10 sacos, a los que se les registra el peso, obteniéndose una peso medio de 1,0052 kg y una
desviación típica de 0.0202 kg. Decida si la sospecha tiene fundamento usando un nivel
de signicación del 10 %.
X ∼ N (µ = 1; σ = 0, 01)
Ahora se calculará el estadígrafo χ2 y se comparará con los límites críticos 19,919 y 3,325.
Si se cumple una de las dos desigualdades se rechazará hipótesis nula.
S 2 (n − 1) 0, 02022 (9)
χ2 = = = 36, 72 (7)
σ02 0, 0001
RC: 36, 72 > 16, 919 Como se cumple la región crítica hay evidencias para rechazar la
hipótesis nula H0 con un nivel de signicación del 10 % y decidir que las causas de varia-
bilidad presentes en el proceso se han modicado.
Usando el valor p, y teniendo en cuenta que la decisión se tomó al estar el estadígrafo por
encima del límite crítico:
Si se cumple que np0 > 5 y que n(1 − p0 ) > 5 puede usarse la distribución normal. Esto
es bastante fácil de lograr, a menos que el valor p0 esté muy cerca de cero o de uno.
X − np0
Z=p (8)
np0 (1 − p0 )
Donde:
p̂ − p0
Z=q (9)
p0 −(1−p0 )
n
Siendo: p̂ = X/n
Para usar Minitab en la solución de este tipo de problemas se debe usar la siguiente se-
cuencia:
Stat >Basic Statistics >1 Proportion. . . y en Options debe aclararse que se usará la
aproximación Normal.
Ejemplo 6: Los directivos de una empresa arma que más del 20 porciento de sus clien-
tes ya usan el nuevo dispositivo electrónico que ha puesto a la venta. ¾Existe razón para
dudar de esta armación si en una muestra aleatoria de 1000 clientes se encuentra que
215 usan el nuevo dispositivo? Utilice un nivel de signicación de 0,01.
El éxito, en este problema, es que los clientes usen el nuevo dispositivo. Además, se cum-
plen las condiciones de aproximación normal.
n = 1000 X = 215 α = 0, 01
RC: Z > Zα
Z > Z0,01
Z > 2, 33
RC: 1, 19 < 2, 33
Como no se cumple la región crítica no hay evidencias para rechazar la hipótesis nula H0 ,
al nivel de signicación de 0,01. Por lo tanto hay razón para dudar de la armación de
los directivos de la empresa.
Dr. C. Ing. José A. Vilalta Alonso 19
Usando el valor p:
Ejercicio 1: Para los ejemplos del 3 al 6 diga, de acuerdo a la decisión tomada en cada
uno, qué tipo de error se pudiera cometer. Justique su respuesta.