Está en la página 1de 9

ANOVA

DEFINICIONES

INTRODUCCIÓN
PRUEBA ANOVA

ESTADÍSTICA
DEPARTAMENTO DE CIENCIAS EXACTAS - ESPE
CLASE Nro. 13.1

CONTENIDO

Título Prueba ANOVA.

Duración 90 minutos

Información general Principales características de la prueba ANOVA.

Objetivo Efectuar la prueba ANOVA para comparar varias medias


muestrales.

11
CLASE Nro. 13.1

Tabla ANOVA
Tabla ANOVA
Fuente de variación Suma de cuadrado Grados de libertad Media cuadrática F
Tratamientos SST k-1 SST/(k - 1) = MST MST/MSE
Error SSE n-k SSE/(n - k) = MSE
Total SS total n-1

El proceso se inicia al determinar SST total: la suma de las diferencias elevadas al cuadrado
entre cada observación y la media global. La fórmula para determinar SS total es:
SS total = ∑(𝑥𝑥 − 𝑥𝑥̅𝐺𝐺 )2
Donde:
X es cada observación de la muestra
𝑥𝑥̅𝐺𝐺 es la media global o total

se determina SSE o la suma de los errores elevados al cuadrado: la suma de las diferencias
elevadas al cuadrado entre cada observación y su respectiva media de tratamiento. La fórmula
para encontrar SSE es:
∑(𝑥𝑥 − 𝑥𝑥̅𝐶𝐶 )2
Donde:
𝑥𝑥̅𝐶𝐶 es la media muestral del tratamiento c.
Por último, se determina SST, la suma de los cuadrados debida a los tratamientos, con la
resta
SST = SS total - SSE

Ejemplo: Hay diferencia entre los tratamientos: Use el nivel de significancia de 0.01.
A B C D
94 75 70 68
90 68 73 70
85 77 76 72
80 83 78 65
88 80 74
68 65
65

11
CLASE Nro. 13.1

A B C D Total
94 75 70 68
90 68 73 70
85 77 76 72
80 83 78 65
88 80 74
68 65
65
Total
columna 349 391 510 414 1664
n 4 5 7 6 22
Media 87,25 78,2 72,86 69 75,64

1664
𝑥𝑥̅𝐺𝐺 = = 75,64
22
SST
A B C D Total
337,2 0,405
31,77 58,31
206,3 58,31
6,95 31,77
87,68 1,860,132 13,22
19,04 54,22
5,587 113,1
152,9
19,04 2,678
58,31 113,1
113,1
650,3 267,7 234,9 332,2 1485,09

SSE
A B C D Total
45,56 10,24
8,163 1
7,563 1040,02 1
5,063 1,449,878 9
52,56 23,04
26,45 16
96,04
51,02 25
23,59 16
61,73
110,8 234,8 180,9 68 594,41
SST= SS total - SSE = 1485.09 - 594.41 = 890.68

Tabla ANOVA
Fuente de variación Suma de cuadrado Grados de libertad Media cuadrática F
Tratamientos 890,68 4- 1=3 SST/(k - 1) = MST = 296,90 MST/MSE = 8,99
Error 594,41 22 - 4 = 18 SSE/(n - k) = MSE = 33,02
Total 1485,09 22 - 1 =21

11
CLASE Nro. 13.1

El valor calculado de F es 8.99, mayor que el valor crítico de 5.09, por lo que la hipótesis nula
se rechaza. La conclusión es que no todas las medias poblacionales son iguales.

Tratamiento e inferencia sobre pares de medias


Suponga que realiza el procedimiento ANOVA y toma la decisión de rechazar la hipótesis
nula. Esto permite concluir que no todas las medias de tratamiento son iguales. Algunas veces
esta conclusión sería satisfactoria, pero otras se desea conocer cuáles medias de tratamiento
difieren. En esta clase se indicará la prueba para saber cuáles medias de tratamiento difieren.
La distribución t, sirve como base de esta prueba. Recuerde que una de las suposiciones de
ANOVA es que las varianzas poblacionales de todos los tratamientos son las mismas. Este
valor común de la población es el error medio cuadrático, o MSE, y se determina mediante
SSE/[n – k]. Un intervalo de confianza de la diferencia entre dos poblaciones se obtiene
mediante:
Intervalo de confianza de la diferencia entre las medias de tratamiento

11
CLASE Nro. 13.1

1 1
(𝑥𝑥̅1 − 𝑥𝑥̅2 ) ± 𝑡𝑡�𝑀𝑀𝑀𝑀𝑀𝑀 � + �
𝑛𝑛1 𝑛𝑛2

donde:
es la media de la primera muestra.
es la media de la segunda muestra.
t se obtiene de la tabla. Los grados de libertad son iguales a n – k. (n número total de
muestras) prueba de dos colas
MSE es el error medio cuadrático que se obtuvo de la tabla ANOVA SSE/[n - k].
n1 es el número de observaciones en la primera muestra.
n2 es el número de observaciones en la segunda muestra.

¿Cómo se decide si hay una diferencia entre las medias de tratamiento? Si el intervalo de
confianza incluye cero, no existe diferencia entre ellas. Por ejemplo, si el punto extremo
izquierdo del intervalo de confianza tiene signo negativo y el punto extremo derecho tiene
signo positivo, el intervalo incluye cero, y las dos medias no difieren.
Intervalo de confianza α=0.05

Entre A y D

Análisis de la varianza de dos vías

El director de WARTA, Warren Area Transit Authority, considera ampliar el servicio de


autobuses del suburbio de Starbrick al distrito comercial central de Warren. Se consideran
cuatro rutas de Starbrick al centro de Warren: 1) por la carretera 6, 2) por el West End, 3) por
Hickory Street Bridge, y 4) por la ruta 59. El director realizó varias pruebas para determinar si
había una diferencia entre los tiempos de recorrido medios por las cuatro rutas. Como habrá
muchos conductores distintos, la prueba se diseñó para que cada conductor manejara a lo
largo de todas ellas. A continuación, se presenta el tiempo del recorrido, en minutos, de cada
combinación conductor-ruta.

11
CLASE Nro. 13.1

Tiempo de recorrido de Starbrick a Warren (minutos)


Conductor Carretera 6 West End Hickory St. Ruta 69
Deans 18 17 21 22
Snaverly 16 23 23 22
Ormson 21 21 26 22
Zollaco 23 22 29 25
Fitbeck 25 24 28 28
A un nivel de significancia de 0.05, ¿hay alguna diferencia entre los tiempos de recorrido
medios a lo largo de las cuatro rutas?

H0: µ1 = µ2 = µ3 = µ4
H1: No todas las medias de tratamiento son iguales.
k= tratamientos
Los grados de libertad del numerador son k – 1 = 4 - 1 = 3
Los grados de libertad del denominador n - k = 20 - 4 = 16

VARIABLE DE BLOQUEO Una segunda variable de tratamiento que, cuando se incluye en


el análisis ANOVA, tendrá el efecto de reducir el término SSE. Suma de Cuadrados del Error
Suma de cuadrados de bloqueo

Tiempo de recorrido de Starbrick a Warren (minutos)


Suma de los Media de los
Conductor Carretera 6 West End Hickory St. Ruta 69 conductores conductores
Deans 18 17 21 22 78 19,5
Snaverly 16 23 23 22 84 21
Ormson 21 21 26 22 90 22,5
Zollaco 23 22 29 25 99 24,75
Fitbeck 25 24 28 28 105 26,25

Promedio total 22,8

11
CLASE Nro. 13.1

SUMA DE ERRORES CUADRÁTICOS, DOS VÍAS SSE = SS total - SST – SSB


Tabla ANOVA
Fuente de variación Suma de cuadrado Grados de libertad Media cuadrática F
Tratamientos SST k-1 SST/(k - 1) = MST MST/MSE
Bloques SSB b -1 SSB/(b -1) = MSB MSB/MSE
Error SSE (k -1)(b - 1) SSE/(k -1)(b -1) = MSE
Total SS total n -1

SSE = SS total - SST - SSB = 229.2 - 72.8 - 119.7 = 36.7

Tabla ANOVA
Fuente de variación Suma de cuadrado Grados de libertad Media cuadrática F
Tratamientos 72,8 3 24,27 7,93
Bloques 119,7 4 29,93 9,78
Error 36,7 12 3,06
Total 229,2 19

Este último caso, cuando los bloques son lo bastante importantes para considerarse un
segundo factor, se conoce como un experimento de dos factores. En muchos casos, la
decisión no es clara. En este ejemplo lo importante es la diferencia entre los tiempos de
recorrido de los diversos conductores, por lo que se realizará la prueba de hipótesis. Los dos
conjuntos de hipótesis son:
tratamientos = columnas

bloques = filas

Primero se pondrá a prueba la hipótesis respecto de las medias de tratamiento. Hay 3 grados
de libertad en el numerador y 12 grados de libertad en el denominador. Con el nivel de
significancia de 0.05, el valor crítico de F es 3.49

La hipótesis nula se rechaza y se acepta la hipótesis alternativa. Se concluye que el tiempo


de recorrido medio no es el mismo para todas las rutas.

En segundo se prueba si el tiempo de recorrido es el mismo para los diversos conductores.


Los grados de libertad en el numerador para los bloques son: 4. Los grados de libertad para
el denominador son los mismos que antes: 12. Con el nivel de significancia de 0.05, el valor
crítico de F es 3.26.

11
CLASE Nro. 13.1

Se rechaza la hipótesis nula y se acepta la hipótesis alternativa. El tiempo medio no es el


mismo para los conductores.

REFERENCIAS BIBLIOGRÁFICAS

1. Anderson, D. Sweeney, D. y Williams, T. (2009). Estadística para Administración y


Economía. CENGAGE Learning Editores, SA. 10ma Ed.
2. Lind, D. Marchall, W. y Wathen, S. (2008). Estadística Aplicada a los Negocios y la
Economía. Mc Graw Hill. 13va Ed.
3. Montgomery, D. Runger, G. (2010). Probabilidad y Estadística aplicadas a la Ingeniería.
Mc Graw Hill. 5ta Ed.
4. Walpole, R. Myers, R. Myers, S. (2007). Probabilidad y Estadística para Ingeniería.
Pearson. 8va Ed.
5. Wackerly, D. Mendenhall, W. Scheaffer, R. (2010). Estadística matemática con
aplicaciones. CENGAGE. 7ma Ed.
6. Canovos, G. (1998). Probabilidad y Estadística Aplicaciones y Métodos. Mc Graw Hill.
1ra Ed.

11

También podría gustarte