Está en la página 1de 27

PRUEBA DE HIPÓTESIS PARA k-ÉSIMAS MEDIAS

POBLACIONALES – ANOVA

ESTADÍSTICA II
Plan de clases
• Organizador previo
• Caso práctico
Inicio • Logro esperado

• Prueba de hipótesis para la igualdad de medias para k-ésimas poblaciones


independientes con el método del Análisis de Varianza (ANOVA)
Construcción • Verificación de los supuestos en un análisis de varianzas.

• Síntesis
• Retroalimentación
Cierre • Metacognición
• Actividad de aprendizaje
DISEÑO DE EXPERIMENTOS DE UN FACTOR

Definiciones básicas en un diseño de experimentos de un factor

Supuestos en un diseño de experimento de un factor


Prueba de hipótesis para k-ésimas medias poblacionales
Comparaciones por pares de Tukey
Caso práctico
El gerente general de la Asociación Nacional de Comerciantes en
Automóviles (ANCA) quiere comparar el comportamiento del gasto de
gasolina de distintas marcas de autos, para ello obtuvo una muestra
aleatoria de 24 de sus distintos modelos, registrando el gasto en soles
del consumo de gasolina en la siguiente tabla:

Toyota Kia Nissan Susuki


50 32 36 50
53 35 40 46
48 33 38 49
55 35 42 42
47 38 38 40
En este caso, ¿se sigue trabajando con dos
42 40 45 40 poblaciones?; ¿los elementos de cada grupo
son los mismos o diferentes?, ¿qué datos se
Con un nivel de significación de 0.05, ¿se puede afirmar que el gasto presentan para cada grupo?, ¿se conoce algún
promedio en consumo de gasolina es el mismo para las distintas resultado de la población?
marcas de autos?
Logros esperados

 Realiza la prueba de hipótesis para comparar las medias en k-ésimas


poblaciones independientes en la resolución de problemas
contextualizados, aplicando criterios estadísticos así como software
estadístico, para luego interpretar los resultados obtenidos.
 Verifica los supuestos en un análisis de varianza, en la resolución de
problemas contextualizados, aplicando criterios estadísticos así como
software estadístico, para luego interpretar los resultados obtenidos.
Conceptos básicos
Factor
Es una variable independiente que afecta los resultados del experimento, un factor
puede tener varios niveles. En un experimento se puede evaluar uno o más factores.
Niveles del factor
Los niveles de un factor son los tipos o grados específicos del factor que se tendrán en
cuenta en la realización del experimento.
Unidad experimental
Es el elemento al cual se le aplica un tratamiento. Un conjunto de unidades
experimentales se le denomina material experimental.
Variable respuesta
Es la característica que se desea evaluar como resultado de la aplicación de los
tratamientos.
Conceptos básicos
Error experimental
Es la medida de la variación, existente entre dos o más unidades experimentales que han recibido la
aplicación de un mismo tratamiento.
Se distinguen dos fuentes principales de errores experimentales en los diseños de experimentos. La
primera es la variabilidad inherente al material experimental (unidad experimental) al cual se aplican los
tratamientos. La segunda fuente de variabilidad es la falta de uniformidad en la conducción física del
experimento; es decir, la deficiencia en poder uniformizar la técnica experimental (variabilidad debida a los
tratamientos)

Análisis de varianza (ANOVA)


Es una de las técnicas más utilizadas en los análisis de los datos de los diseños experimentales que se usan
para comprobar si existen diferencias significativas entre los promedios de los tratamientos.
Representación simbólica de los datos
1 2 … i … k Grupos a comparar
Y11 Y21 … Yi1 … Yk1
Y12 Y22 … Yi2 … Yk2
Valores de la variable
… … … … respuesta
Y1j Y2j … Yij … Ykj
Y1n1 Y2n2 … Yini … Yknk
Totales de los grupos Ti. T1. T2. … Ti. … Tk. T.. Total general
Tamaño de muestra de ni. n1. n2. … ni. … nk. n.. Tamaño de muestra
los grupos

Además se calculan las siguientes sumatorias:


ni n
k ni
Ti.2 T1.2 T2.2 Tk2.
 y
j 1 i 1
2
ij  y  y   y  . y
2
11
2
21
2
ik
2
nk 
i 1 ni .
 
n1. n2.
 ........ 
nk .
T ..  T
i 1
i.  T1.  T2.  .....  Tk .
Análisis de varianza en el diseño completamente
aleatorio
i. Formulación de hipótesis
H0: 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘
H1: Al menos un 𝜇𝑖 ≠ 𝜇𝑗
ii. Nivel de significación: ∝ (0.01,0.05,0.10, 𝑒𝑡𝑐)
iii. Estadístico de prueba:
Donde:
SCF: Suma de cuadrados del factor.
SCE: Suma de cuadrados del error.
SCT: Suma de cuadrados del total.

CMF: Cuadrado medio del factor. k = # de grupos


CME: Cuadrado medio del error. n: Muestra total

iv. Región crítica: F(k – 1, n – k, 𝛂)


v. Decisión y conclusión: Si: Fc > F(k – 1, n – k; α) → Se rechaza H0 y se acepta H1.
Supuestos en el Análisis de Varianza
Para realizar el análisis de varianza se deben cumplir los siguientes
supuestos:
 El valor esperado de cada variable aleatoria residual es cero.
 Las variables aleatorias residuales son mutuamente
independientes;
 Las variables aleatorias residuales tienen la misma varianza
 La variable aleatoria residual se distribuye normalmente.
Prueba de Normalidad de los errores con el
estadístico de Anderson Darling
Se utiliza esta prueba para verificar que los errores sigan una distribución normal.

Hipótesis Nula (H0) Hipótesis Alterna (H1)


Los errores siguen una distribución Los errores no sigue una distribución
normal. normal.

Nivel de significación:   0.01, 0.05, 0.10, etc 

Estadístico de prueba: AD (reporte minitab)

Decisión: Si p – valor > α, no se rechaza H0


Si p – valor < α, se rechaza H0 y se acepta H1.
Prueba de Homogeneidad de varianzas de los
errores usando el estadístico de prueba de Bartlett
Esta prueba se utiliza para verificar si las varianzas de los errores son homogéneas en los k
niveles del factor. Si se demuestra que las varianzas de los errores son iguales en las k
muestras independientes, se llama homogeneidad de varianzas.
i. Planteamiento de hipótesis:
H0: Existe homogeneidad de varianzas de los errores
H1: No existe homogeneidad de varianzas de los errores

ii. Nivel de significancia:   0.01, 0.05, 0.10, etc 

iii. Estadístico de prueba: Bartlett (resultado obtenido por minitab)

iv. Decisión: Se rechaza H0 si p – valor < α, caso contrario no se rechaza H0.


Ejercicio resuelto
El gerente general de la Asociación Nacional de
Comerciantes en Automóviles (ANCA) quiere
comparar el comportamiento del gasto de gasolina de
distintas marcas de autos, para ello obtuvo una
muestra aleatoria de 24 de sus distintos modelos,
registrando el gasto en soles del consumo de gasolina
en la siguiente tabla:
Toyota Kia Nissan Susuki
50 32 36 50
53 35 40 46
48 33 38 49
55 35 42 42
47 38 38 40
42 40 45 40
Tests
Test
Además, con minitab se obtuvo los siguientes Method Statistic P-Value
resultados: Bartlett 1.27 0.736
Ejercicio resuelto
a) Defina el factor, los niveles del factor, la variable respuesta y la unidad
experimental.
b) Verifique si se cumplen los supuestos en un análisis de varianzas. Use un α = 0.05.
c) Con un nivel de significación de 0.05, ¿se puede afirmar que el gasto promedio en
consumo de gasolina es el mismo para las distintas marcas de autos?

Solución:
a) Identificación:
Factor : Marca de automóvil
Niveles del factor : Toyota, Kia, Nissan y Susuki (k = 4)
Variable respuesta : Gasto en consumo de gasolina
Unidad experimental : Un automóvil
Ejercicio resuelto
Supuesto de normalidad de los errores con la prueba de Anderson Darling.
i. Planteamiento de las hipótesis:
H0: Los errores siguen una
distribución normal.
H1: Los errores no siguen una
distribución normal.
ii. Nivel de significación: α = 0.05
iii. Estadístico de prueba: AD = 0.341
iv. Decisión: Como p_valor = 0.466 > α =
0.05, no se rechaza H0. Al 5% de
significancia, se puede afirmar que los
errores siguen una distribución normal.
Ejercicio resuelto
Supuesto de homogeneidad de las varianzas de los errores con la prueba de Bartlett.
i. Planteamiento de hipótesis:
H0: Existe homogeneidad de varianzas de
los errores.
H1: No existe homogeneidad de varianzas
de los errores.
ii. Nivel de significancia: α = 0.05
iii. Estadístico de prueba: Bartlett = 1.27
iv. Decisión: Como p_valor = 0.736 > α =
0.05 , no se rechaza H0. Con un 5% de
Tests
significancia, se puede afirmar que Test
existe homogeneidad de varianzas de los Method Statistic P-Value
errores. Bartlett 1.27 0.736
Ejercicio resuelto
i. Formulación de hipótesis
H0: 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4 (El gasto promedio en consumo en gasolina es el mismo en las 4 marcas de
automóviles)
H1: Al menos un 𝜇𝑖 ≠ 𝜇𝑗 (El gasto promedio en consumo en gasolina es diferente en al menos una marca de
automóvil)
ii. Nivel de significación: ∝= 0.05
iii. Estadístico de prueba: Toyota Kia Nissan Susuki
Además: 50 32 36 50

k ni 53 35 40 46
 y
j 1 i 1
2
ij  502  532   402  43772 48 33 38 49
55 35 42 42
ni 2 2 2 2 2
T 295 213 239 267
 i.

i 1 ni .

6

6

6

6
47 38 38 40
42 40 45 40
ni
Ti.2

i 1 ni .
 43467.333 T i. 295 213 239 267 T.. = 1014
ni. 6 6 6 6 n.. = 24
Ejercicio resuelto
Construyendo la tabla ANOVA: 10142 10142
SCT  43772   930.5 SCF  43467.333   625.83
24 24

SCE  930.5  625.83  304.67


Tabla ANOVA
Fuente de
GL SC CM Fcal
Variación
Factor k–1=3 625.83 625.83/3 = 208.61 208.61/15.23 =
Error n – k = 20 304.67 304.67/20 = 15.23 13.69
Total n – 1 = 23 930.5 ---- -----

iv. Decisión: Como Fcal = 13.69 > FT = 3.10, se rechaza H0 y se acepta H1.
Valor crítico: FT = Fk-1,n-k,α = F3,20,0,05 = 3.10

v. Conclusión: Con un nivel de significancia del 0.05, existe evidencia estadística para afirmar que el gasto
promedio en consumo en gasolina es diferente en al menos una marca de automóvil.
Ejercicio resuelto
El jefe de producción de una fábrica desea determinar si las cuatro máquinas que tiene utilizan el mismo
tiempo promedio en la fabricación de un artículo. Para esto selecciona muestras aleatorias de cada
máquina de tamaños n1 = 6, n2 = 4, n3 = 4 y n4 = 6 respectivamente, midiendo el tiempo que utilizan en la
fabricación de un artículo. Debido a un descuido de su ayudante la información obtenida se perdió
parcialmente, encontrándose sola la siguiente tabla incompleta:
Fuente de Grados de Suma de Cuadrados
F
variación libertad cuadrados medios

Factor 152.62

Error

TOTAL 542.92

Con esta información, plantee las hipótesis adecuadas y diga cuál será la conclusión del jefe de producción,
interpretando adecuadamente sus resultados. Use  = 0.05.
Ejercicio resuelto
i. Formulación de hipótesis
H0: 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4 (las cuatro máquinas utilizan el mismo tiempo promedio en la fabricación de un artículo)
H1: Al menos un 𝜇𝑖 ≠ 𝜇𝑗 (en al menos una de las cuatro máquinas no utilizan el mismo tiempo promedio en la
fabricación de un artículo)
ii. Nivel de significación: ∝= 0.05
iii. Estadístico de prueba:
Completando la Tabla ANOVA: Fuente de Grados de
Suma de cuadrados Cuadrados medios Fcal
k = 4 y n = 20 variación libertad
SCF = CMF x (k-1) =
Factor k–1=3 CMF = 152.62
152.62x3 = 457.86 CMF/CME =
SCE = SCT – SCF = 152.62/5.32 =
CME = SCE/(n – k) 28.69
Error n – k = 16 542.92 – 457.86 =
= 85.06/16 = 5.32
85.06
TOTAL n – 1 = 19 SCT = 542.92

iv. Decisión: Como Fcal = 28.69 > FT = 3.24, se rechaza H0 y se acepta H1.
Valor crítico: FT = F3, 16, 𝟎. 𝟎𝟓 = 3.24
iv. Conclusión: Con un nivel de significancia del 0.05, existe evidencia estadística para afirmar que en al menos una de las
cuatro máquinas no utilizan el mismo tiempo promedio en la fabricación de un artículo.
Síntesis
Definir en un problema contextualizado: Factor (número de grupos),
Unidad experimental (tamaño de la muestra) y Variable respuesta.

Se verifica los supuestos: Normalidad de los errores con la prueba de


Anderson Darling, Homogeneidad de las varianzas de los errores con
Diseño de experimento con la prueba de Bartlett.
un factor: Análisis de
varianzas (ANOVA)
-En la prueba de hipótesis, se contrasta la igualdad de las medias
poblacionales en los k grupos independientes.
-El estadístico de prueba de aproxima a F- Fisher.
-El valor crítico presenta los grados de libertad: k – 1 y n – k.
-La prueba es significativa (se rechaza H0 y se acepta H1), si:
Fcal > F(k – 1; n – k; α)
Retroalimentación
 ¿Cuáles son las condiciones para realizar un diseño
experimental con un factor?

 ¿Cuál es el propósito de contrastar la igualdad de k medias


poblacionales?
Metacognición
 ¿Qué dificultades has tenido para entender el tema?

 ¿En qué problemas de tu especialidad puedes utilizar lo


aprendido?

 ¿Qué te falto para alcanzar un aprendizaje optimo?


Actividad de aprendizaje
1. Los miembros de un equipo ciclista se dividen al azar en tres grupos que entrenan con métodos
diferentes. El primer grupo realiza largos recorridos a ritmo pausado, el segundo grupo realiza series
cortas de alta intensidad y el tercero trabaja en el gimnasio con pesas y se ejercita en el pedaleo de alta
frecuencia. Después de un mes de entrenamiento se realiza un test de rendimiento consistente en un
recorrido cronometrado de nueve km. Los tiempos empleados fueron los siguientes:

Método 1 15 16 14 15 17
Método 2 14 13 15 16 14
Método 3 13 12 11 14 11

Además, con minitab se obtuvo los siguientes resultados:


Tests
Test
Method Statistic P-Value
Bartlett 0.09 0.957
a) Defina el factor, los niveles del factor, la variable respuesta y la unidad
experimental.
b) Verifique si se cumplen los supuestos en un análisis de varianzas. Use un α = 0.025.
c) A un nivel de significación del 2.5%, ¿se puede considerar que los tres métodos
producen resultados equivalentes?
Actividad de aprendizaje
2. Existen cuatro estaciones de radio. Cada estación toca música rock durante cierto
número de minutos por hora y se desea determinar si el promedio que cada estación
toca esta música, por hora, es el mismo. Para esto se tomó muestras de 10 horas de
cada estación y se encontró los siguientes tiempos promedios en los cuales se toca
música rock (en minutos).

Además, se sabe que: SCT = 650.75 (suma de cuadrados del total). Aplique la técnica
estadística adecuada y haga un análisis al respecto. Use un α = 0.05.
Referencias Bibliográficas

1. Anderson, S. (2010) Estadística para Administración y Economía. Cengage


Learning 8va. Edición. México.

2. Montesinos, L., Llanos, K., Cerna, E., Pajuelo, S. y Coaquira, F. (2017)


Estadística Descriptiva e Inferencial. Fondo Editorial USIL 1° Edición. Lima,
Perú.

También podría gustarte