Está en la página 1de 53

Unidad IV: Pruebas de Hipótesis

Conceptos Básicos

• Supóngase que se tiene interés en el tiempo promedio necesario para


terminar una unidad de línea de armado. Bajo operaciones estándares, el
objetivo es tener un tiempo promedio de armado por unidad de 10
minutos. El gerente de la planta decide continuar con el proceso a menos
que se encuentre una evidencia sustancial de que el tiempo promedio no
es de 10 minutos. La evidencia estará en una muestra de tamaño n
obtenida de la distribución de interés para el tiempo de armado de la
unidad. ¿Cómo debe decidirse si es proceso continúa en operación?
Pruebas de hipótesis para media
(poblacional)

• El primer paso para el análisis de una prueba de hipótesis es definir la


hipótesis, para ello se tienen los siguientes casos:

1. 𝐻0 : 𝜇 = 𝜇0 vs 𝐻1 : 𝜇 ≠ 𝜇0 (Prueba de dos colas)


2. 𝐻0 : 𝜇 = 𝜇0 vs 𝐻1 : 𝜇 < 𝜇0 (Prueba de una cola)
3. 𝐻0 : 𝜇 ≥ 𝜇0 vs 𝐻1 : 𝜇 < 𝜇0 (Prueba de una cola)
4. 𝐻0 : 𝜇 = 𝜇0 vs 𝐻1 : 𝜇 > 𝜇0 (Prueba de una cola)
5. 𝐻0 : 𝜇 ≤ 𝜇0 vs 𝐻1 : 𝜇 > 𝜇0 (Prueba de una cola)

• Donde 𝐻0 se conoce como la hipótesis nula y 𝐻1 se conoce como


hipótesis alternativa. Por otro lado 𝜇0 es un valor de una constante que es
conocido.
Pruebas de hipótesis para media
(poblacional)

• En base a la muestra se calcula un valor que se llama Estadístico de prueba y


se compara con un valor fijo dado que se llama valor crítico (se obtiene de
alguna tabla de probabilidad)

• Sea Z el estadístico de prueba y sea c el valor crítico.

• Regla de decisión

• Para el caso 1: Se rechaza 𝐻0 si 𝑧 > 𝑐óz < −𝑐


• Para el caso 2 y 3: Se rechaza 𝐻0 si 𝑧 < −𝑐
• Para el caso 4 y 5: Se rechaza 𝐻0 si 𝑧 > 𝑐

• La desigualdad de la regla de decisión siempre dependerá de la hipótesis


alternativa (𝐻1 )
Pruebas de hipótesis para media
(poblacional)

• Hay cuatro situaciones posibles con respecto a una prueba de hipótesis:


𝐻0 𝑒𝑠 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎 𝐻0 𝑒𝑠 𝑓𝑎𝑙𝑠𝑎

No se Rechaza 𝐻0
(𝑠𝑒 𝑑𝑒𝑐𝑖𝑑𝑒 𝑞𝑢𝑒 𝑒𝑠 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎) Correcta Error Tipo II

Rechazo
𝐻0 (𝑠𝑒 𝑑𝑒𝑐𝑖𝑑𝑒 𝑞𝑢𝑒 𝑒𝑠 𝑓𝑎𝑙𝑠𝑎) Error Tipo I Correcta
Pruebas de hipótesis para media
(poblacional)

• Las probabilidades de error tipo I y error tipo II están dadas por:

• 𝑃 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝐻0 𝑒𝑠 𝑐𝑖𝑒𝑟𝑡𝑎 = 𝛼

• 𝑃 𝑛𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝐻0 𝑒𝑠 𝑓𝑎𝑙𝑠𝑎 = 𝛽

• Definición: el nivel de significación de la prueba, es la máxima


probabilidad de error tipo I, por lo general 𝛼 = 0,05
Pruebas de hipótesis para media
(poblacional)

• Ejemplo

• Control de calidad de los dulces M&M


• De una bolsa que contiene 465 dulces se saca una muestra al azar de 13 y
se pesan, se desea probar que tienen una media de 0,8535 gr, los
resultados de la muestra fue un promedio de 0,8635 y una desviación
estándar de 0,0576gr. La idea del productor es que los clientes estén
recibiendo más de lo indica el etiquetado (396,9). Haga una prueba de
hipótesis con un nivel de significación del 5%. Suponga que los datos
provienen de una distribución normal.

• Calcule el error tipo I. Según la significancia ¿Cuál es la conclusión?


Definiciones

• P-valor
• El p-valor se define como el cálculo de la probabilidad de error tipo I. Si el
p-valor es menor a la significancia 𝛼 propuesta por el investigador, se
puede decir que hay evidencia estadísticamente significativa para rechazar
𝐻0 .

• Calculo p-valor

• Si 𝐻1 ≠ 𝜃 el p-valor se calcula: 2𝑃(𝑄 < 𝐸𝑝 ) si 𝐸𝑝 es negativo


• Si 𝐻1 ≠ 𝜃 el p-valor se calcula: 2 1 − 𝑃(𝑄 < 𝐸𝑝 ) si 𝐸𝑝 es positivo
• Si 𝐻1 < 𝜃 el p-valor se calcula: 𝑃(𝑄 < 𝐸𝑝 )
• Si 𝐻1 > 𝜃 el p-valor se calcula: 1 − 𝑃(𝑄 < 𝐸𝑝 )
Definiciones

• Función potencia

• La función 𝑃 𝜃 = 1 − 𝛽(𝜃) recibe el nombre de función de potencia y


representa la probabilidad de rechazar la hipótesis nula cuando es falsa; es
decir, cuando el valor del parámetro 𝐻1 es cierto.
Ejemplo

• Suponga que los rendimientos de caña de azúcar, fertilizada con nitrógeno, en toneladas de
caña por hectárea, tiene distribución normal N(100,100) . Un investigador cree que con un
nivel diferente de nitrógeno, el rendimiento promedio sobrepasará las 100 ton/ha. Se toma
una muestra de 25 parcelas a las que se les ha aplicado el nuevo tratamiento. Se registran sus
rendimientos, estableciéndose que su promedio muestral es 105 ton/ha.
• a) Encuentre la máxima probabilidad de error tipo l (p-valor).
• b) Encuentre la probabilidad de error tipo ll, bajo la alternativa µ = 105 ton / ha
• c) Calcule la potencia de la dócima si µ = 110 ton / ha

• Solución: a) 0.0062 b) 0.5 c) 0.9938


Ejercicios

• Por investigaciones anteriores se sabe que el peso medio de los pollos de dos meses es de 4.5 Kg.
con una desviación estándar de 0.8 Kg. Se ensaya un nuevo tipo de alimentación con un grupo de
49 pollos, y se encuentra que su peso promedio es de 5.2 Kg. ¿Ha existido aumento real en el peso
de los pollos? Use  = 0.05

• Un investigador agrícola creía que el número medio de acres que los hacendados de un
determinado lugar dedicaban a cierto cultivo era inferior a 6. El investigador encuestó a 25
hacendados de ese lugar sobre el número de acres que sembraban. La media y la desviación
estándar obtenida es 5 y 1,5 acres respectivamente. Con un nivel de significación de 0,05 ¿Sirven
estos datos de apoyo a la opinión del investigador?

• Un gerente de ventas desea estudiar el consumo de ciertos tipos de jaleas. Para esto, se encuestó a
250 personas seleccionadas al azar, en 8 supermercados, de entre las que adquirían de ese
producto. Se encontró que 145 preferían el sabor a melón. ¿Entregan los datos evidencia de que
hay preferencia por el consumo de jalea con sabor a melón? use  = 0.05 y suponga que la industria
produce sólo dos sabores de jalea.

• En una zona donde se cultiva remolacha de azúcar, se registra la producción de una muestra de 25
parcelas, en toneladas por acre, obteniéndose una varianza de 420. Por experiencias anteriores se
sabe que la varianza histórica es de 280. ¿Qué conclusión puede obtenerse respecto de la varianza
actual de la producción de remolacha en esa zona? Use = 0,05.
Resumen Estadísticos de pruebas
Regla de decisión
Dócimas de hipótesis para diferencia
de dos medias

• Sean x1 , x2 ,..., xn y y1 , y2 ,..., yn muestras aleatorias provenientes de dos


distribuciones normales con medias  x y  y y varianzas  x2 y  y2
respectivamente. Suponga que se desea probar la hipótesis nula:

H0 : x   y  0
• En donde  0 es una cantidad que toma valores positivos o cero y la cual
representa la diferencia entre propuesta entre los dos valores
desconocidos de las medias.
Estadísticos de pruebas
Dócimas de hipótesis para diferencia
de dos medias (Muestras independientes)

• Nota: el tercer estadístico de prueba t ~ t (n1  n2  2)


Regla de decisión
Ejercicios

• Se desea comparar dos granjas de crianza de pavos, para esto se toma una
muestra de 10 animales en la primera y de 20 en la segunda. En la primera
granja, el peso medio de los pavos es de 14,35 kg. con una desviación
estándar de 2,5kg, mientras que en la otra granja el peso medio es de
19kg. con una desviación estándar de 2,8 kg. ¿Es posible afirmar que el
peso medio verdadero de los pavos en ambas granjas no es el mismo?
Suponga que las varianzas de las dos poblaciones son iguales.
Dócimas de hipótesis para diferencia
de dos medias (Datos pareados)

• Tenemos muestras pareadas o correlacionadas cuando sabemos de


antemano que una observación está relacionada con la otra. Pueden ser
observaciones tomadas al mismo tiempo, diseño pareado 1, o medidas
tomadas en un mismo sujeto o unidad en dos oportunidades o tiempo
distintos (diseño pareado 2).
• El número de observaciones es el número de pares, es decir,
𝑥1 , 𝑦1 , … , (𝑥𝑛 , 𝑦𝑛 ).

• En este caso interesa probar la hipótesis:


• 𝐻0 : 𝜇𝐷 = 𝛿0
Dócimas de hipótesis para diferencia
de dos medias (Datos pareados)

• Definiciones:

• 𝒅𝒊 = 𝑥𝑖 − 𝑦𝑖
𝑛
𝑖=1 𝑑𝑖
• 𝑑=
𝑛
• Estadístico de prueba:
Ejemplo

• Se cree que un programa nuevo de seguridad industrial reduce los


accidentes del trabajo. Los siguientes datos corresponden a horas de
trabajo semanales perdidas por accidentes antes y después de la
aplicación del programa:

Planta 1 2 3 4 5 6

Antes 12 29 16 37 28 15

Ahora 10 28 17 35 25 16
Dócimas para el cuociente
de varianzas

• Sean𝑥1 , … , 𝑥𝑛𝑥 y 𝑦1 , … , 𝑦𝑛𝑦 dos muestras aleatorias de dos distribuciones


normales independientes con desconocidas 𝜇𝑥 y 𝜇𝑦 y varianzas
desconocidas 2 y 2 . Considere la siguiente hipótesis nula:
x y

H 0 :  x2   y2
• Las estadísticas de interés son las varianzas muestrales S 2 y S 2 . En clases
x y
anteriores vimos que (n x 1) S x2 y (n y  1) S y2 .
 x2  y2
• Son dos variables aleatorias independientes chi.cuadradas con 𝑛𝑥 − 1 y
𝑛𝑦 − 1 respectivamente
Dócimas para el cuociente
de varianzas

S x2
 x2
F 2
~ F (nx  1, n y  1)
S y
 y2

• Dada la hipótesis nula la estadística F se reduce a:

S x2
F  2 ~ F (nx  1, n y  1)
Sy
Dócimas para el cuociente
de varianzas

• Ejemplo:

• En un estudio para medir el modo cómo la contaminación ambiental


afecta a la fauna, se tomó una muestra elegida al azar de 10 pelícanos
jóvenes y se les midió la cantidad de DDT (en partes por millón)
encontrados en tejidos cerebrales, con los siguientes resultados. Se desea
saber si la variabilidad en los dos grupos es la misma.  = 0.05

Jóvenes Polluelos

Tamaño de muestra 10 13

Promedio 0.041 0.026

Desviación Estándar 0.017 0.006


Dócimas para diferencia de proporciones

𝐻0 : 𝑃𝑥 − 𝑃𝑦 = 𝛿0
• 𝑝1 = 𝑥 𝑛1
• 𝑝2 = 𝑦 𝑛2

• Estadístico de prueba:
𝑝𝑥 −𝑝𝑦 −𝛿𝑜
• 𝑧=
𝑝𝑥 (1−𝑝𝑥 ) 𝑝𝑦 (1−𝑝𝑦 )
+
𝑛𝑥 𝑛𝑦

• Condición es que 𝑛1 y 𝑛2 sean tamaños muestrales grandes.


Dócimas para diferencia de proporciones

• En un estudio de los hábitos de fumador para personas zurdas y derechas,


una muestra de 400 zurdos reveló que 190 de ellos fuman y en una
muestra aleatoria de 800 derechos, 300 de estos fuman. Existe evidencia
para decir que los zurdos fuman en mayor proporción que los derechos.
Prueba de bondad de ajuste

• Prueba Chi-cuadrado

• Una prueba de bondad de ajuste se emplea para decidir cuándo un


conjunto de datos se apega a una distribución dada.

• 𝐻0 : 𝐹 𝑥 = 𝐹0 (𝑥)

• Considere una muestra aleatoria de tamaño n de la distribución de una


variable aleatoria X dividida en k clases exhaustivas y mutuamente
excluyentes y 𝑁𝑖 el número de observaciones de cada clase.
Prueba de bondad de ajuste

• Estadístico de prueba:
𝑘 𝑁𝑖 −𝑒𝑖 2
• 𝜒2 = 𝑖=1 𝑒𝑖
• Donde 𝑒𝑖 es el valor esperado de la clase i.

• Se Rechaza 𝐻0 si 𝜒 2 >𝜒 21−𝛼 (𝑘 − 1)


Prueba de bondad de ajuste

• Se ha tomado una muestra aleatoria de 40 baterías y se ha registrado su


duración en años. Estos resultados se los ha agrupado en 7 clases en el
siguiente cuadro.

• Verificar con 5% de significancia que la duración en años de las baterías


producidas por este fabricante tiene duración distribuida normalmente
con media 3.5 y desviación estándar 0.7 .
Tablas de Contingencias:
Prueba de independencia

• El interés de este tipo de pruebas es comprobar si existe independencia


entre dos variables categóricas.

• 𝐻0 : 𝐿𝑎𝑠 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑐𝑎𝑡𝑒𝑔ó𝑟𝑖𝑐𝑎𝑠 𝑎𝑐𝑡𝑢𝑎𝑛 𝑑𝑒 𝑚𝑎𝑛𝑒𝑟𝑎 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒.

• 𝐻1 : 𝐿𝑎𝑠 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑐𝑎𝑡𝑒𝑔ó𝑟𝑖𝑐𝑎𝑠 𝑎𝑐𝑡𝑢𝑎𝑛 𝑑𝑒 𝑚𝑎𝑛𝑒𝑟𝑎 𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒.

• Estadístico de prueba:
2
𝑟 𝑐 𝑁𝑖𝑗 −𝑒𝑖𝑗
• 𝜒2 = 𝑖=1 𝑗=1 𝑒𝑖𝑗

• Se rechaza 𝐻0 si 𝜒 2 >𝜒 21−𝛼 (𝑟 − 1)(𝑐 − 1)


Tablas de Contingencias:
Prueba de independencia

• Es de interés comprobar si existe una relación en que un persona fume y


su sexo.
Diseño de experimentos

• Para cualquier fenómeno en el que existe la incertidumbre, el


procedimiento apropiado para investigarlo es experimentar con él, de
manera que pueda identificarse la característica de interés.

• Por ejemplo: Suponga que tenemos 4 dietas diferentes que queremos


comparar. Las dietas están etiquetadas A,B,C y D. Estamos interesados en
estudiar si las dietas afectan la tasa de coagulación en conejos. La tasa de
coagulación es el tiempo en segundos que tarda una cortada en dejar de
sangrar.

• El elemento más importante de un experimento es la formulación del


problema a resolver.
Diseño de experimentos

• Una vez planteado el problema a resolver, es necesario identificar la variable a


medir o también conocida como variable respuesta y el factor o los factores
que pueden influenciar sobre la variabilidad de la variable en estudio.

• El factor puede ser definido como una variable independiente o predictora.

• Un nivel o tratamiento del factor es un valor o condición de éste bajo el cual se


observará la respuesta medible.

• La unidad experimental se define como el objeto (persona, animal, cosa, etc)


que es capaz de producir una medición de la variable respuesta después de
aplicar un tratamiento dado.

• Error experimental se define como los factores externos que pueden


influenciar a la variable respuesta.
Diseño de experimentos

• Diseño completamente aleatorizado

• El tipo de experimento más sencillo es aquel que compara el efecto de


𝑘 ≥ 2 niveles de un solo factor, sobre alguna variable respuesta. Los
niveles del factor son tratamientos y estos se aplican en forma aleatoria a
un conjunto virtualmente homogéneo de unidades experimentales.

• 𝑯𝒐 : 𝝁𝟏 = 𝝁𝟐 = ⋯ = 𝝁𝒌
• 𝑯𝟏: 𝑨𝒍 𝒎𝒆𝒏𝒐𝒔 𝒖𝒏 𝒑𝒂𝒓 𝒅𝒆 𝒎𝒆𝒅𝒊𝒂𝒔 𝒔𝒐𝒏 𝒅𝒊𝒇𝒆𝒓𝒆𝒏𝒕𝒆𝒔
Diseño de experimentos

• Modelo de diseño de un factor:

• Se propone el siguiente modelo de diseño de experimento:

𝑌𝑖𝑗 = 𝜇 + 𝜏𝑗 + 𝜀𝑖𝑗 𝑖 = 1, … , 𝑛𝑖 𝑗 = 1, … , 𝑘
• 𝑌𝑖𝑗 : es la variable respuesta.
• 𝜇: es la media general
• 𝜏𝑗 : es la media del tratamiento j.

𝐻0 : 𝜏𝑗 = 0
Diseño de experimentos

• Análisis exploratorio de los datos:


Diseño de experimentos

• Análisis de varianza (ANOVA).


• Sean 𝜇1, 𝜇2 , … , 𝜇𝑘 las medias de las 𝑘 poblaciones y 𝜇 la media de todas
las poblaciones. Se define el efecto 𝜏𝑗 del j - ésimo tratamiento como la
desviación de la j-ésima población media 𝜇𝑗 con respecto a la media
global.

𝜏𝑗 = 𝜇𝑗 − 𝜇𝑗 = 1, … , 𝑘

• También se puede definir el error como:

• 𝜀𝑖𝑗 = 𝑌𝑖𝑗 − 𝜇𝑗 𝑗 = 1, … , 𝑘
𝑖 = 1, … , 𝑛𝑗
Diseño de experimentos

La región de rechazo está dada por: 𝐹 > 𝐹((𝑡 − 1, 𝑛 − 𝑡), 1 − 𝛼))

SS se refiere a las sumas de cuadrados


Diseño de experimentos

• Descomposición de sumas de cuadrados (SS):

• SStotal: sumas de cuadrados total


SSt: sumas de cuadrado de trtamientos
• Sse: sumas de cuadrado del error
Diseño de experimentos

• Una manera más rápida de calcular las sumas de cuadrado es la siguiente.

𝑛 𝑘 2 𝑦.. 2
• 𝑆𝐶𝑇 = 𝑖=1 𝑗=1 𝑦𝑖𝑗 −
𝑛
1 𝑘 2 𝑦.. 2
• 𝑆𝐶𝑇𝑟 = 𝑗=1 𝑦.𝑗 −
𝑛𝑗 𝑛
• 𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝑇𝑟
Diseño de experimentos

• Ejemplo:
Diseño de experimentos
Diseño de experimentos
Diseño de experimentos
Diseño de experimentos
Diseño de experimentos
Diseño de experimentos

• Comparaciones de pares de medias de tratamientos

• Prueba de Tukey

• Suponga que después de un análisis de varianza en el que se ha rechazado


la hipótesis nula, quieren probarse todas las comparaciones de medias por
pares, es decir:

• 𝐻0 : 𝜇𝑖 = 𝜇𝑗
𝐻1 : 𝜇𝑖 ≠ 𝜇𝑗
Diseño de experimentos

• Tukey propone la siguiente regla para rechazar 𝐻0


𝑐𝑚𝑒
• 𝑇 = 𝑞𝛼(𝑡,𝑛−𝑡) tamaño de muestra iguales
𝑛

𝑞𝛼(𝑡,𝑛−𝑡) 1 1
• 𝑇= 𝑐𝑚𝑒 + tamaño de muestra desiguales
2 𝑛𝑖 𝑛𝑗

• Se rechaza 𝐻0 si: 𝑦𝑖. − 𝑦𝑗. > 𝑇

• La tabla de la distribución de 𝑞 se encuentra en el apéndice VIII del libro


Diseño y Análisis de Experimentos Montgomery
Diseño de experimentos
Diseño en Bloques completos Aleatorizados

• Básicamente un diseño en bloques completos y aleatorizados es un conjunto de


diseños aleatorizados.

• Sin embargo cada diseño tiene una unidad experimental en cada grupo (bloque).

• Un diseño en bloque se utiliza cuando las unidades experimentales no son


homogéneas, pero si lo son dentro del bloque.

• Ejemplos de bloques: distintas zonas de un terreno o distintas parcelas, distintos


colegios, distintas poblaciones de una ciudad, etc.
Diseño en Bloques completos Aleatorizados

• Suponga que tenemos 6 tratamientos y se desea tener 4 muestras por


tratamiento.

Bloque 1 Bloque 2 Bloque 3 Bloque 4


T4 T3 T4 T6 T4 T3 T1 T2
T1 T5 T2 T5 T5 T2 T3 T5
T6 T2 T3 T1 T1 T6 T6 T4
Diseño en Bloques completos Aleatorizados

𝑦𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝛽𝑗 + 𝜀𝑖𝑗

• Donde 𝑖 = 1, … , 𝑡
• 𝑗 = 1, … , 𝑏

• La hipótesis se interés siempre será 𝐻0 : 𝜏𝑖 = 0


Diseño en Bloques completos Aleatorizados

• Tabla ANOVA

FV GL SC CM F

Bloque 𝑏−1 𝑦.𝑗 2 𝑦.. 2 𝑆𝐶𝐵


− 𝑏−1
𝑡 𝑛
Tratamiento 𝑡−1 𝑦.𝑖 2 𝑦.. 2 𝑆𝐶𝑇𝑟 𝐶𝑀𝑇𝑟
− 𝑡−1 𝐶𝑀𝐸
𝑏 𝑛

Error (𝑡 − 1)(𝑏 − 1) 𝑆𝐶𝑇 − (𝑆𝐶𝑇𝑟 + 𝑆𝐶𝐵) 𝑆𝐶𝐸


(𝑡 − 1)(𝑏 − 1)
Total 𝑛−1 𝑦 2
..
𝑦𝑖𝑗 2 −
𝑛
Diseño en Bloques completos Aleatorizados

También podría gustarte