Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Capitulo 7 - Contrastes o Test de Hipotesis
Capitulo 7 - Contrastes o Test de Hipotesis
CAPÍTULO 7
7.4 ERRORES
7.4.1 Errores tipo I y tipo II
7.4.2 Probabilidades de los errores de tipo I y de tipo II
Página 1 de 13
UNLP-Facultad de Ingeniería Cátedra: Estadística
INFERENCIA ESTADÍSTICA
Por ejemplo:
a) Hace algunos años la media de estatura de los hombres argentinos adultos era de 170 cm. y la
desviación estándar de 9 cm. Pasado el tiempo un muestreo realizado a 36 adultos da una media de
172 cm. ¿Puede afirmarse que esa diferencia de 2 cm.es debida al azar o realmente la estatura
media ha aumentado?
b) Supongamos que, respecto de la ley de casamiento entre personas del mismo sexo, existente en
algunos países, el 82 % de los argentinos está en contra. Pasado el tiempo una encuesta realizada a
400 argentinos indica que el porcentaje de ciudadanos argentinos en contra ha descendido al 40 %
¿ Ha cambiado la opinión pública o los resultados se deben al azar?
Los métodos de decisión estadística están ligados a los de estimación de parámetros mediante intervalos
de confianza, aunque aparecerán también nuevos conceptos.
Estudiaremos por el momento, solo los contrastes paramétricos, por tanto supondremos conocida f(x; ),
siendo un parámetro desconocido que toma valores dentro del espacio paramétrico ; el cual contiene
al menos dos puntos y hablaremos por tanto de hipótesis paramétricas.
Página 2 de 13
UNLP-Facultad de Ingeniería Cátedra: Estadística
Hipótesis nula Es la hipótesis que se formula y se quiere por tanto contrastar, la indicaremos H0. Esta
hipótesis debe expresar o incluir la condición de “no cambio”, de allí el nombre de hipótesis nula.
Hipótesis alternativa Es cualquier otra hipótesis diferente a la formulada y que sea contraria a H0, la
indicaremos H1.
Comentarios
a) Por lo general, el valor del parámetro de la población especificado en la hipótesis nula se
determina de alguna de estas tres formas diferentes:
I. Como resultado de la experiencia pasada o del conocimiento del proceso, entonces el
objetivo de la prueba de hipótesis usualmente es determinar si ha cambiado el valor del
parámetro.
II. Puede obtenerse a partir de alguna teoría o modelo que se relaciona con el proceso en
estudio. En este caso, el objetivo de la prueba de hipótesis es verificar la teoría o modelo.
III. Cuando el valor del parámetro proviene de consideraciones externas, por ejemplo
especificaciones de diseño o ingeniería, o de obligaciones contractuales. En esta situación,
el objetivo usual de la prueba de hipótesis es probar el cumplimiento de las
especificaciones.
b) La hipótesis nula debe ser la hipótesis que el experimentador asume como correcta; en otros
términos, la aceptación de H0 no implica que ésta sea correcta o que haya sido probada, sino
que los datos no han proporcionado evidencia suficiente como para refutarla.
Una vez establecidas las hipótesis H0 y H1, debemos tomar una decisión basada en las evidencias que
señalan los datos de la muestra, con respecto a cual de las dos hipótesis aceptamos.
Esta decisión se toma de acuerdo con un estadístico de prueba.
Un estadístico de prueba es una función de los datos muestrales y del valor del parámetro especificado
por la hipótesis nula, con distribución conocida cuando H0 es cierta, que nos proporciona un número en
base a las observaciones de la muestra, y que nos indicará si H0 debe ser rechazada o aceptada.
La región de rechazo también llamada región crítica, es un conjunto de valores distintos a los anteriores;
si el estadístico de prueba toma un valor que esté dentro de esta región, la hipótesis H0 se rechaza.
Él o los valores críticos el aquél o aquellos números que separan la región de aceptación de la de rechazo.
Por ejemplo, si decidimos,
Página 3 de 13
UNLP-Facultad de Ingeniería Cátedra: Estadística
ACEPTACIÓN RECHAZO
9,5 = valor critico
Prueba de una cola a la derecha: en este caso el investigador desea comprobar la hipótesis de un
aumento en el parámetro .
H0: 0
H1: > 0
= 0
Fig.1
= 0
Fig.2
Pruebas bilaterales o de dos colas: se producen cuando la región de rechazo está localizada
en ambos extremos. el investigador desea comprobar la hipótesis de un cambio en el parámetro.
El nivel de significación se divide en dos y la región de rechazo es la unión de dos intervalos
de la recta.
Página 4 de 13
UNLP-Facultad de Ingeniería Cátedra: Estadística
Ejemplo
H0: = 0
H1: 0
= 0
Fig.3
7.4 ERRORES
La decisión que se tome a favor de una u otra hipótesis estará fundamentada en la discrepancia observada
entre la hipótesis nula y la información suministrada por una única muestra de tamaño n, por tanto
resulta obvio que tal decisión tendrá un margen de error.
Las cuatro posibles situaciones a que puede dar lugar un contraste de hipótesis se esquematizan en la tabla
siguiente:
Se debe tener en cuenta que sólo se puede cometer uno de los dos tipos de error y, en la mayoría de las
situaciones, se desea controlar la probabilidad de cometer un error de tipo I.
Observación importante
La verdad o falsedad de una hipótesis en particular, nunca puede conocerse con certidumbre, a menos
que pueda examinarse toda la población. Por tanto es necesario desarrollar un procedimiento de prueba de
hipótesis teniendo en cuenta la probabilidad de llegar a una conclusión equivocada. (Recordar que
siempre decimos que aceptar H0 no significa que sea verdadera, sino que no hay suficiente evidencia
muestral para rechazarla)
Página 5 de 13
UNLP-Facultad de Ingeniería Cátedra: Estadística
1- se llama potencia del test, dado que es la capacidad que tiene el test de reconocer correctamente que
la hipótesis nula es falsa, y por tanto se debe rechazar H0.
siempre será aceptable que el test tenga una potencia grande (cercana a uno), o lo que es lo mismo, un
valor pequeño de , cuando H0 es falsa.
La relación entre y según la decisión de aceptar o rechazar la hipótesis nula H0, viene dada en la
Tabla 2, que representa el mismo problema de decisión de la Tabla 1, con la única diferencia que aquí
identificamos la probabilidad asociada a cada una de las cuatro celdas de la tabla.
Notar que,
a) La suma de las probabilidades de cada columna es igual a 1, ya que los sucesos con los que están
asociados son complementarios.
b) La suma de y no tiene que ser necesariamente igual a 1, ya que estas probabilidades no son
complementarias. Así, si se cambia el valor de en determinada cantidad, no tiene porqué
producirse el mismo cambio en y viceversa. Sin embargo y son dependientes entre si y
también son dependientes del tamaño muestral n.
d) El tamaño de la región crítica, y por tanto la probabilidad de cometer un error tipo I, siempre se
puede reducir al ajustar él o los valores críticos.
e) Si la hipótesis nula es falsa, es un máximo cuando el valor real del parámetro se aproxima al
hipotético (el que establece H0). Cuanto más grande sea la distancia entre el valor real y el valor
hipotético, menor será .
Página 6 de 13
UNLP-Facultad de Ingeniería Cátedra: Estadística
Página 7 de 13
UNLP-Facultad de Ingeniería Cátedra: Estadística
X - µ0
Si la hipótesis nula H0: = 0 es verdadera, E ( X ) 0 , entonces Z 0 = ≈N(0, 1)
σ
n
Para hallar una región crítica con un nivel de confianza 1-, puede usarse la proposición probabilística:
X - µ0
P[-z α/2 ≤ ≤z α/2 ] = 1 - α
σ
n
La regla de decisión será:
Aunque es más fácil entender la región crítica en términos del estadístico de prueba Z0 que en términos
de X , escribiremos la misma región crítica en términos del promedio calculado x .
De esta forma podemos escribir el proceso de decisión como sigue:
si x ≥b ó x ≤a ⇒ se rechaza H 0 donde:
σ σ
a = µ 0 - z α/2 y b = µ 0 + z α/2
n n
Para un nivel de significación , los valores críticos de la variable aleatoria Z y X se indican en la Fig.
4.
Página 8 de 13
UNLP-Facultad de Ingeniería Cátedra: Estadística
7.6.2 Ejemplos
a) Una muestra aleatoria de 100 muertes registradas en el país, en el 2006, muestra una vida
promedio de 71,8 años. Suponiendo una desviación estándar poblacional de 8,9 años, ¿parece
indicar esto, que la vida media hoy en día es mayor que 70 años? Tomar = 0,05.
Solución
I. Se trata de una distribución muestral de medias con conocida.
II. Datos
= 70 años
= 8,9 años
x = 71,8 años
n = 100
= 0,05
Página 9 de 13
UNLP-Facultad de Ingeniería Cátedra: Estadística
Si queremos resolver el ejercicio, tomando la decisión en base al estadístico real, es decir en base a la
media muestral X , operamos como sigue:
x -µ z.σ (1,645).(8,9)
z= ⇒ x=µ+ = 70 + = 71,46
σ n 10
n
b) Una empresa eléctrica fabrica elementos con una duración que se distribuye en forma
aproximadamente normal con una media de 800 horas y una desviación estándar de 40 horas. Si
una muestra aleatoria de 30 de tales elementos tiene una duración promedio de 788 horas
¿muestran los datos suficiente evidencia para decir que la duración media ha cambiado? tomar
= 0,04.
Solución
I. Se trata de una distribución muestral de medias con desviación estándar conocida.
II. Datos
= 800 horas
= 40 horas
x = 788 horas
n=30
= 0,04
Página 10 de 13
UNLP-Facultad de Ingeniería Cátedra: Estadística
Regla de decisión
si 785,02 x 814,98 no se rechaza H0.
si x < 785,02 ó x >814,98 se rechaza H0.
c) Una muestra aleatoria de 64 bolsas de un material plástico pesan, en promedio 174,316 gramos con
una desviación estándar (muestral) de 8 gramos. Probar la hipótesis de que = 183,315 gramos
contra la hipótesis alternativa < 183,315 gramos. Tomar =0,05.
Solución
I. Se trata de una distribución muestral de medias con desviación estándar poblacional
desconocida, pero como el tamaño de muestra es mayor que 30 se puede tomar la desviación
muestral como un estimador puntual para la población.
II. Datos
= 183,315
s=8
x = 174,316
n = 64
= 0,05
V. Cálculos
x - µ 174,316 - 183,315
z= = = -9
σ 8
n 64
VI. Justificación y decisión
-9 < -1,645 se rechaza H0
Se concluiye con un nivel de significación del 0,05 que las bolsas de ese material pesan en
promedio menos de 183,315 gramos.
Esto es común en todo lo que se vende envasado, los fabricantes aseguran que las latas,
botellas, etc. tienen en promedio un peso superior al que realmente tienen.
Página 11 de 13
UNLP-Facultad de Ingeniería Cátedra: Estadística
La probabilidad del valor observado del estadístico de prueba o algún otro valor hasta
más contradictorio a la hipótesis nula, mide (de cierta forma) el peso de la evidencia a
favor del rechazo de H0. Algunos de los que realizan los experimentos informan que los
resultados de la prueba son significativos (rechazaríamos H0) a un nivel de significación
del 5 % pero no al nivel del 1 %.
Al valor mínimo de para el cual los resultados de la prueba son significativos desde el
punto de vista de la estadística, suele llamarse valor p o nivel de significación
observado.
Podemos dar la siguiente definición:
Página 12 de 13
UNLP-Facultad de Ingeniería Cátedra: Estadística
X -µ
El estadístico de prueba es: T = que como sabemos tiene distribución t de
S
n
Student con (n-1) grados de libertad.
La forma de realizar los test es idéntica a los que usan como estadístico de prueba a Z.
Asi, si el test es bilateral:
H0: = 0 vs H1: 0
x - µ0
calculando: t 0 =
S
n
La región crítica será:
t0 t/2, n-1 ó t0 - t/2, n-1
como vemos es una región crítica de dos colas. (Recordar que la distribución t es
simétrica respecto del cero).
Si H1: > 0 entonces se rechaza H0 cuando t0 > t, n-1
Si H1: < 0 entonces se rechaza H0 cuando t0 < - t, n-1
Página 13 de 13