Está en la página 1de 70

Estadística Aplicada y Computacional

EA-100
Capítulo 6
Test de Hipótesis

Alberto Coronado Matutti

Facultad de Ingeniería Mecánica


Universidad Nacional de Ingeniería
1. Introducción

2
1. Introducción
 Un método para formular inferencias acerca
de una población consiste en producir
intervalos de confianza para los parámetros
en cuestión.
 Pero frecuentemente estamos solo
interesados en verificar una suposición, o
hipótesis, concerniente a un parámetro, y
no en su localización, ni en la longitud del
intervalo de confianza.

3
1. Introducción
 Por ejemplo, considere que un componente
electrónico es garantizado para durar al
menos 200 horas.
 En ese caso, podríamos estar interesados
en chequear la hipótesis de que la media es
al menos 200 o que es menor a 200 horas.
 Un intervalo de confianza en si no seria de
gran interés, aún cuando provee el
mecanismo para testar la hipótesis.

4
1. Introducción
 El test de hipótesis es una consecuencia
natural del método científico.
 Primero observamos la naturaleza, luego
formulamos una teoría, para finalmente
testar la teoría usando observaciones.
 El test de hipótesis requiere una decisión
cuando la muestra observada es
comparada con la teoría.

5
1. Introducción
 ¿Como decidimos si la muestra corrobora la
hipótesis?
 ¿Cuando debemos rechazar la hipótesis y
cuando no?
 ¿Cual es la probabilidad de que tomemos una
mala decisión?
 ¿Que función dependiente de las observaciones
debemos emplear en el proceso de toma de
decisiones?
 Las respuestas a estas preguntas recaen en el
estudio del test de hipótesis.
6
2. Terminología

7
2. Terminología
 Suponga una muestra aleatoria de tamaño
n tomada de una población con media
desconocida .
 Es razonable usar la media de la muestra
como una estimativa de la media
poblacional, con información adicional
provista por la varianza de la población o
por su estimador .

8
2. Terminología
 Una hipótesis es una afirmación acerca de
un parámetro de la población.
 Existen 2 tipos de hipótesis: nula y
alternativa.
 La hipótesis nula usualmente
representa el procedimiento operacional
estándar de un sistema o especificaciones
conocidas. Inicialmente este estado se
asume como verdadero.

9
2. Terminología
 La hipótesis alternativa ( , también
conocida por H1) es la afirmación alternativa
propuesta y es también denominada como
la hipótesis de investigación.
 La hipótesis alternativa especifica los
valores de los parámetros que representan
un cambio importante respecto al
procedimiento operacional estándar o
especificaciones conocidas. Es una
contradicción a la hipótesis nula.
10
2. Terminología
 ¿Como decidimos qué afirmación es la
verdadera?
 Observaciones serán recolectadas para
determinar si los datos confirman una u
otra.
 Un estadístico de prueba (test statistic,
TS) es una función de datos muestrales en
los que nos basamos para rechazar o no .

11
2. Terminología
 La región de rechazo, RR (o región
crítica) es el conjunto de valores del
estadístico de prueba que producen el
rechazo de la hipótesis nula.
 El valor crítico (critical value, CV) es la
frontera entre la región de rechazo y la
región de aceptación.

12
2. Terminología: ej. 1
 La profundidad aceptable de un proceso de
taladrado es 2”.
 Una pequeña variación en la profundidad
de los agujeros es aceptable, pero medias
muy grandes o muy pequeñas no son
aceptables.
 Identifique los parámetros y el par de
hipótesis que son de interés.

13
2. Terminología: ej. 1
 Aquí estamos interesados en hacer una
inferencia acerca de la media de la
profundidad de los agujeros taladrados .
 Podemos hipotetizar que , por
tanto, .
 La región de rechazo
estará en ambas colas
de la distribución.
 Este test se denomina
test de dos colas.
14
2. Terminología: ej. 2
 Se sabe que un proceso de manufactura
produce 1% de piezas defectuosas.
 Recientemente fueron realizados algunos
cambios estructurales en el proceso de
fabricación.
 Cualquier reducción en el porcentaje de
defectos es bienvenido, sin embargo,
cualquier incremento es indeseable.
 Identifique el parámetro de interés y
formule las hipótesis a ser testadas.
15
2. Terminología: ej. 2
 Aquí estamos interesados en la proporción
p de defectos en un proceso de
manufactura.
 Ya que los valores deseables de p están
debajo de 1%, , por tanto,
vvvvvv .
 Si la región de rechazo
está a la derecha se
denomina test de cola
superior (o derecha).
16
2. Terminología: ej. 3
 Una máquina corta varillas con diámetro
medio de 5 mm y varianza 0.5 mm2.
 Se realizan ciertos ajustes en el proceso
para mejorar la precisión del proceso de
corte.
 ¿Cual es el parámetro de interés y cuales
las hipótesis a ser testadas para verificar
que los ajustes han reducido la variación en
los diámetros?

17
2. Terminología: ej. 3
 En este caso estamos interesados en ,
que es la varianza de los diámetros de las
varillas cortadas.
 Podríamos asumir que la hipótesis nula
corresponde a la situación en la que no se
presenta una mejora , por
tanto, .
 Un test como este se deno-
mina test de cola inferior
(o izquierda).
18
2. Errores
 El valor real del parámetro es desconocido
y la decisión de no rechazar (o rechazar)
es basada en un estadístico de prueba.
 Por tanto, habrán 2 tipos de errores en el
proceso de decisión:

Error tipo I: rechazar cuando es


verdadera.
Error tipo II: no rechazar cuando es
falsa.
19
2. Errores
 Las posibles decisiones y errores serán:

 Usualmente se denota la probabilidad de


errores de tipo I por y la probabilidad de
errores de tipo II por .
 La probabilidad de errores de tipo I también
se denomina nivel de significancia o
tamaño de la región de rechazo.
20
2. Errores
 Para un test de una cola versus
vbvbv , rechazaremos si .
 Entonces:

 Además:

21
2. Errores
 Considerando una muestra grande para
estimar la media (la distribución muestral
de será aprox. normal), podemos
visualizar y .

 Si es el verdadero valor de bajo y


es un valor alternativo de interés:
22
2. Errores
 El área a la derecha de K, bajo la normal
centrada en , es . Siendo la chance de
rechazar , cuando es el valor real de .
 El área a la izquierda de K, bajo la normal
centrada en , es . Siendo la chance de
no rechazar , cuando es el valor real
de .

23
2. Errores
 Para una muestra de tamaño fijo, no
podemos disminuir la probabilidad de
ambos errores.
 Si disminuimos , se incrementa y
viceversa.
 El valor de K se puede determinar
especificando y usando propiedades de la
distribución normal:

24
2. Errores: ej. 5
 Los errores del tipo I y II para el ej. 1 serán:
 Tipo I: Concluir que la media de las
profundidades taladradas no es aceptable,
cuando si lo es.
 Tipo II: Concluir que la media de las
profundidades taladradas es aceptable,
cuando no lo es.

25
2. Errores: ej. 6
 Los errores del tipo I y II para el ej. 2 serán:
 Tipo I: Concluir que el proceso produce más
errores de lo deseado, cuando los errores
están en un nivel aceptable.
 Tipo II: Concluir que el proceso produce
errores aceptables, cuando en realidad se
requieren ajustes.

26
2. Errores: ej. 7
 Los errores del tipo I y II para el ej. 3 serán:
 Tipo I: Concluir que los ajustes realizados al
proceso son efectivos en reducir la
variación, cuando no han habido cambios.
 Tipo II: Concluir que los ajustes realizados
han fallado, cuando en si han tenido efecto
positivo.

27
3. Muestra simple

28
3.1 Test para la media -
distribución genérica
 Una de las situaciones más comunes y
simples en el test de hipótesis surge
cuando el tamaño de la muestra es grande.
 Suponga la afirmación de que toma el
valor específico y deseamos testar la
validez de la hipótesis.
 Si no está en el intervalo ,
entonces:

29
3.1 Test para la media -
distribución genérica
 Es decir:

 Asumiendo una muestra de tamaño grande,


tal que tiene una distribución aprox.
normal, el valor hipotetizado de será
rechazado si:

30
3.1 Test para la media -
distribución genérica
 Mientras se denominó coeficiente
de confianza en problemas de estimación,
será llamado nivel de significancia en
problemas de test de hipótesis.

31
3.1 Test para la media -
distribución genérica: ej. 1
 La profundidad deseada de agujeros
taladrados es 2”.
 Podríamos hipotetizar que la media es
efectivamente 2”.
 Para verificar la hipótesis tomamos una
muestra de 100 agujeros taladrados, cuya
media es 2.005”, con desviación estándar
0.03”.
 Para , puede ser rechazada la
hipótesis?
32
3.1 Test para la media -
distribución genérica: ej. 1
 La hipótesis es rechazada si:

 Para n grande, la desviación estándar de la


muestra S puede sustituir la desviación
estándar desconocida de la población :

 Al ser el valor observado menor a 1.96, no


rechazaremos la hipótesis. Además, el
intervalo de confianza del 95% es
33
3.1 Test para la media -
distribución genérica
 Observe que no rechazar la hipótesis de
que no es lo mismo que aceptar la
hipótesis de que .
 Cuando no rechazamos la hipótesis de ,
queremos decir que 2 es un valor plausible,
pero que también hay otros valores
plausibles para .
 Es decir, no podemos concluir que es
igual a 2, solamente.

34
3.1 Test para la media -
distribución genérica
 Al testar,
consideramos solo el intervalo de confianza
de una cola para .
 Si es mayor que un límite de confianza
superior para , entonces rechazamos:

 El límite superior para es .

35
3.1 Test para la media -
distribución genérica
 Rechazaremos en favor de cuando
mmmm , o equivalentemente,
cuando:

 La correspondiente región de rechazo para


mmmm , es dada por:

36
3.1 Test para la media -
distribución genérica: ej. 2
 El departamento de calidad de una
empresa afirma que el número promedio de
llamadas de reclamos es no mayor a 15 por
semana.
 Para testar la afirmación, se recabaron
aleatoriamente datos de 36 semanas, con
los resultados y .
 ¿Los resultados confirman o contradicen la
afirmación al 5% de nivel de significancia?

37
3.1 Test para la media -
distribución genérica: ej. 2
 La hipótesis a ser testada es:

 Usamos el estadístico de prueba:


 Rechazaremos para
 Sustituyendo por :

38
3.1 Test para la media -
distribución genérica: ej. 2
 Es decir, la media muestral observada es 4
desviaciones estándar más grande que el
valor hipotetizado
 En este caso tene-
mos suficiente evi-
dencia para rechazar
la hipótesis, es decir,
el número promedio
de llamadas excede-
rá 15.
39
3.1 Test para la media -
valor p
 El test de hipótesis presentado requiere
especificar un nivel de significancia , hallar
vv (o en tests de una cola), calcular el
valor de Z y rechazar si .
 En este proceso es determinado mas o
menos arbitrariamente, con un valor igual a
0.05 usado muy comúnmente.
 Una alternativa a especificar es hallar el
nivel de significancia más pequeño para el
cual el valor observado producirá el rechazo
de .
40
3.1 Test para la media -
valor p
 Este valor es conocido como valor p del
test, o nivel de significancia observado.
 Rechazaremos para valores p pequeños,
pero para valores grandes, digamos
mayores a 0.05, habrá poca evidencia para
rechazar .
 El valor p será la probabilidad de observar
un estadístico de prueba tan extremo como
el valor calculado de la muestra, si es
verdadera.
41
3.1 Test para la media -
valor p: ej. 3
 Halle el valor p para los datos del ej. 2.

 Los datos corresponden a , el valor


observado para el estadístico de prueba
correspondiente a
 El menor nivel de significancia que resultará
en el rechazo de corresponde a , el
área de la curva a la derecha de 4.
 El valor p correspondiente es 0.0000317, el
cual es mucho menor que 0.05.
42
3.1 Test para la media -
valor p: ej. 4
 Halle el valor p para los datos del ej. 1.

 Los datos resultaron en


 Al ser un test
de doble cola:

 Este valor es
mayor a 0.05,
por tanto, no
será rechazada.
43
3.1 Test para la media -
distribución genérica
 En general, seguiremos los siguientes 4 pasos
para resolver problemas de test de hipótesis:

 Identificar las hipótesis nula y alternativa a ser


testadas, definiendo los parámetros de interés.
 Identificar un procedimiento de test apropiado
y verificar las condiciones.
 Hallar el valor del estadístico de prueba y el
valor p correspondiente.
 Usar el abordaje de la región de rechazo o del
valor p para tomar una decisión.
44
3.1 Test para la media -
distribución genérica: ej. 5
 Un fabricante de baterías cree que la vida
media de sus productos excede 2.0 (en
cientos de horas).
 Se presentan los
resultados de una
muestra aleatoria
de 50 ítems.
 Al 5% se justifica
la afirmación del
fabricante?

45
3.1 Test para la media -
distribución genérica: ej. 5
 La hipótesis a ser testada es:

 Ya que la muestra es grande, usaremos un


test z aproximado para la media.
 En la muestra, y s son:
 Ya que:
 Es decir, si , entonces no
es un evento raro.
 No podremos rechazar y concluiremos
que la muestra no confirma la afirmación
del fabricante. 46
3.1 Test para la media -
distribución genérica: ej. 6
 En una planta de generación de potencia, la
presión en cierta línea de vapor se supone
debe mantener una media de 100 psi durante
un periodo de 4 horas.
 Si la media de la presión excede los 103 psi,
durante 4 horas, podrían presentarse serias
complicaciones.
 Durante un periodo de 4 horas se tomaron 30
medidas aleatorias, para testar:

 Si es 0.01 y , halle la probabilidad


del error del tipo II.
47
3.1 Test para la media -
distribución genérica: ej. 6
 Para testar
rechazaremos si:

 O si:

 Si la verdadera media es 103, entonces:

 Que es menor a 4%, por tanto, puede


continuarse operando si es menor a 101.7. 48
3.1 Test para la media -
distribución genérica

49
3.2 Test para la media -
distribución normal
 Cuando las muestras son muy pequeñas, el
Teorema del Límite Central no dará una
buena aproximación para .
 Cuando la población es al menos
aproximadamente normal,
tendrá una distribución t con (n-1) grados
de libertad.
 Por tanto, el estadístico de prueba será:

50
3.2 Test para la media -
distribución normal: ej. 7
 Una corporación está en el proceso de
determinar el presupuesto anual para una
planta nueva.
 Para ello asume que el costo semanal
promedio de reparaciones es .
 Para verificar esta afirmación, se obtienen
datos de plantas similares de 10 semanas.
 Ello resulta en y .
Considerando ¿La muestra indicaría
que $1200 no es buena suposición?
51
3.2 Test para la media -
distribución normal: ej. 7
 Desearemos testar:

 El valor del estadístico de prueba será:

 Para 9 grados de libertad, de tablas:

 Al ser mayor al valor crítico,


rechazaremos la hipótesis nula.

52
3.2 Test para la media -
distribución normal: ej. 7
 De manera similar, si usamos el abordaje del
valor p, el área encima de , será
igual a 0.0147. El doble de este valor será
0.0294, que es menor a 0.05.

http://www.stat.tamu.edu/~west/applets/tdemo.html 53
3.2 Test para la media -
distribución normal

54
3.4 Test para la varianza -
distribución normal
 Generalmente, la varianza de la población
será desconocida.
 Frecuentemente desearemos testar una
hipótesis acerca del valor de .
 Para ello, podemos usar el estadístico
presentado en la estimación de intervalos
de confianza para , donde:

tendrá una distribución chi-cuadrado.


55
3.4 Test para la varianza -
distribución normal: ej. 8
 Un componente de motor producido por
una compañía debe tener un diámetro
cuya varianza no debe ser mayor a
0.0002”.
 Una muestra aleatoria de 10 partes dio una
varianza de 0.0003.
 Asumiendo normalidad y usando ,
¿hay suficiente evidencia para refutar la
afirmación de la compañía?

56
3.4 Test para la varianza -
distribución normal: ej. 8
 En este caso testaremos:

 Para y 9 grados de libertad,


tendremos:

 Así la región de rechazo corresponderá a:

 El estadístico observado será:

57
3.4 Test para la varianza -
distribución normal: ej. 8
 Ya que , no
rechazaremos la hipótesis nula.

58
3.4 Test para la varianza -
distribución normal

59
3.5 Test para dif. entre medias -
distribución genérica
 Considerando muestras grandes, el
estimador tendrá
aproximadamente una distribución normal.
 Por tanto, para testar ,
podemos usar el estadístico:

 Si y son desconocidos, podremos


estimarlos haciendo uso de y .
60
3.5 Test para dif. entre medias -
distribución genérica: ej. 9
 Fue realizado un estudio para comparar el
tiempo que toma a hombres y mujeres
realizar cierta tarea en una línea de
ensamblaje.
 Muestras aleatorias de tiempos en
segundos de 50 hombres y 50 mujeres
fueron recolectadas.
 Usando 5% de nivel de
significancia, ¿dichos
datos tienen evidencia
de haber diferencia?
61
3.5 Test para dif. entre medias -
distribución genérica: ej. 9
 Desearemos testar:

 De tablas, encontramos .
 El valor del estadístico de prueba será:

 Debido a que , deberemos


rechazar la hipótesis nula, es decir, habrá
una diferencia significativa entre los tiempos.
62
3.5 Test para dif. entre medias -
distribución genérica: ej. 9
 De manera similar, el valor p correspondiente
será , lo cual significa
que, si ambas medias fuesen iguales, sería muy
poco probable observar la diferencia obtenida
en las muestras.

63
3.5 Test para dif. entre medias -
distribución genérica

64
3.6 Test para dif. entre medias -
distribución normal
 Debido a razones financieras, técnicas,
limitaciones de tiempo, etc. muchas veces no
será posible contar con grandes muestras.
 Si ambas poblaciones parecen tener
distribuciones normales con varianzas iguales,
usaremos el estadístico de prueba:

 Donde T tendrá una distribución t con (n1+n2-


2) grados de libertad.
65
3.6 Test para dif. entre medias -
distribución normal : ej. 10
 El diseñador de una máquina cortadora
afirma que esta es más rápida que la
máquina actualmente usada.
 Fueron tomadas 9 muestras para cada
máquina de los tiempos requeridos en
segundos.

 Al 5% de nivel de significancia ¿puede la


afirmación del diseñador ser sustentada?
66
3.6 Test para dif. entre medias -
distribución normal : ej. 10
 En este caso testaremos:

 Donde corresponde a la máquina actual


y a la nueva máquina.
 El estadístico de prueba será:

67
3.6 Test para dif. entre medias -
distribución normal : ej. 10
 De tablas, para 16 grados de libertad,
obtenemos =1.746. Al ser este valor
mayor a 1.65, nos encontraremos en la
región de no rechazo:

68
3.6 Test para dif. entre medias -
distribución normal

69
3.6 Test para dif. entre medias -
distribución normal

70