Está en la página 1de 50

ESTADISTICA APLICADA

Pruebas Paramétricas: ANOVA

SEMESTRE 2022-I
1 Análisis de Varianza “ANOVA”

2 ANOVA a una Vía

Temas a
3 ANOVA a dos Vías
Desarrollar

4 Como funciona el ANOVA

5 Aplicaciones ANOVA a Una y Dos Vías


Logro de la Sesión
La técnica de análisis de varianza (ANOVA) también conocida como análisis factorial
y desarrollada por Fisher en 1930, constituye la herramienta básica para el estudio del
efecto de uno o más factores (cada uno con dos o más niveles) sobre la media de una
variable continua.

El análisis de varianza (ANOVA) de una vía se utiliza para determinar si existen


diferencias estadísticamente significativas entre las medias de tres o más grupos. En
este caso utilizaremos grupos independientes (no relacionados) por lo que lo
llamaremos ANOVA de un factor entre-grupos.

ANOVA es un nombre genérico y se usa para una variedad inmensa de modelos de


comparación de medias, también conocido como diseño de experimentos. Por ahora
sólo hablaremos del ANOVA simple, de un factor, o de una vía (one way ANOVA),
que se refiere a la comparación de medias de dos o más tratamientos.
ESTADÍSTICA APLICADA
ANÁLISIS DE VARIANZA
ANÁLISIS DE VARIANZA

Es una técnica que se utiliza para decidir si las medias de dos o más poblaciones son
iguales. La prueba se basa en una muestra única, obtenida a partir de cada población.
El análisis de varianza puede servir para determinar si las diferencias entre las medias
muestrales revelan las verdaderas diferencias entre los valores medios de cada una de
las poblaciones, o si las diferencias entre los valores medios de la muestra son más
indicativas de una variabilidad de muestreo.

Si el valor estadístico de prueba (análisis de varianza) nos impulsa a aceptar la


hipótesis nula, se concluiría que las diferencias observadas entre las medias de las
muestras se deben a la variación casual en el muestreo (y por tanto, que los valores
medios de población son iguales). Si se rechaza la hipótesis nula, se concluiría que
las diferencias entre los valores medios de la muestra son demasiado grandes como
para deberse únicamente a la casualidad (y por ello, no todas las medias de población
son iguales).
Los datos para el análisis de varianza se obtienen tomando una muestra de cada
población y calculando la media muestral y la variancia en el caso de cada muestra.

Supuestos
Existen tres supuestos básicos que se deben satisfacer antes de que se pueda utilizar
el análisis de variancia.
1) Las muestras deben ser de tipo aleatorio independiente.
2) Las muestras deben ser obtenidas a partir de poblaciones normales.
3) Las poblaciones deben tener variancias iguales

𝟐 𝟐
Es decir: 𝝈𝟏 = 𝝈𝟐
𝟐 = 𝝈 𝟐
𝟑 = ………….… = 𝝈𝒌
Análisis de Varianza (ANOVA)
ANOVA a una vía
• Como y por que funciona ANOVA

ANOVA esta diseñada específicamente para probar si dos o mas poblaciones tienen la
misma media. Aun cuando el propósito del ANOVA es hacer pruebas para hallar las
diferencias en las medias poblacionales, implica un examen de las varianzas muestrales,
de allí el termino Análisis de Varianza.

El procedimiento se utiliza para determinar si cuando se aplica un “tratamiento” en


particular a una poblacion, este tendrá un impacto significativo en su media.

Modelos de Efectos Fijos: En el cual se seleccionan tratamientos específicos o se fijan


antes del estudio.

Modelos de Efectos Aleatorios: En el cual los niveles (tratamientos) utilizados en el


estudio se seleccionan aleatoriamente de una poblacion de niveles posibles.
Para la aplicación del ANOVA son importantes tres suposiciones:
1.- Todas las poblaciones involucradas son normales.
2.- Todas las poblaciones tienen la misma varianza.
3.- Las muestras se seleccionan independientemente.
Si el numero de tratamientos se designa como “c” el conjunto de hipótesis de prueba es:

H0: Todas las medias poblacionales son iguales


HA: No todas las medias poblacionales son iguales

H0: H0: H0:


H A: H A: H A:
• Como y por que funciona ANOVA
Tabla de Tratamientos 𝒓

Media del tratamiento ∑ 𝒙 𝒊𝒋


∀ : 𝒋=𝒌
𝒊=𝟏
T1 T2 T3 Tk 𝒙 𝒋=
𝒏𝒋

x11 x12 x13 x1k


𝑥11 + 𝑥 21 +… .+ 𝑥 𝑟 1
𝑟

∑ 𝑥 𝑖𝑗
¿ ∀ : 𝑗=1
x21 x22 x23 x2k 𝑥1 =
𝑖 =1

𝑛1 𝑛1

x31 x32 x33 x3k ∑


𝑟
𝑥𝑖𝑗 𝑥12 + 𝑥22 +… .+ 𝑥 𝑟 2
𝑖 =1 ¿ ∀ : 𝑗=2
𝑥 2=
𝑛2 𝑛2
: : :
xr1 xr2 xr3 xrk
: : :
x.1 x.2 x.3 x.k ∑
𝑟

𝑖 =1
𝑥𝑖𝑗
¿
𝑥1 𝑘 + 𝑥 2𝑘 + … .+ 𝑥𝑟𝑘
∀ : 𝑗=𝑘
𝑥 𝑘=
𝑛𝑐 𝑛𝑘
𝒓 𝒌

Gran Media ∑∑ 𝒙 𝒊𝒋
𝒊=𝟏 𝒋 =𝟏
´ =
𝒙
𝒏

𝑥 11 + 𝑥 1 2+ … .+ 𝑥 1𝑘 + 𝑥 21 + 𝑥 22 +… .+ 𝑥 2 𝑘+ … … ..+ 𝑥 𝑟 1 + 𝑥𝑟 2 +… .+ 𝑥 𝑟 𝑘
´=
𝑥
𝑛
Media del tratamiento:
Gran Media
𝑟 𝑘
Suma de Cuadrados Totales 𝑆 𝐶𝑇 =∑ ∑ ( 𝑥 𝑖𝑗 − 𝑥´ )2
𝑖=1 𝑗=1
++…………
…………+
𝑘
Suma de Cuadrados de los Tratamientos 𝑆 𝐶𝑇 𝑅= ∑ 𝑟 𝑗 ( 𝑥 𝑗 − 𝑥 )
´ 2
Numero de elementos de fila :
𝐽=1

++………………..+ ∀ : 𝑗=1 , 2 ,3 , … … … … , 𝑘
𝑟 𝑘
Suma de Cuadrados del Error 𝑆 𝐶 𝐸=∑ ∑ ( 𝑥 𝑖𝑗 − 𝑥 𝑗 ) 2
𝑖=1 𝑗=1

++…

…………+
ANOVA
SUMA DE GRADOS DE CUADRADOS F
FUENTE DE VARIABILIDAD
CUADRADOS LIBERTAD MEDIOS (FORMULA)
ENTRE MUESTRAS
(Tratamientos) SCTR k-1
DENTRO DE MUESTRAS
(Error) SCE n–k
VARIACION TOTAL SCT n–1

𝐹 𝛼 −(𝑘 −1 )(𝑛− 𝑘)= 𝐸𝑠𝑡𝑎𝑑𝑖𝑠𝑡𝑖𝑐𝑜 𝑑𝑒 𝑇𝑎𝑏𝑙𝑎


Suma de Cuadrados SCT = SCTR + SCE
Grados de Libertad (n -1) = (k – 1) + (n – k)
𝒓 𝒌
Suma de Cuadrados Totales 𝑺 𝑪𝑻 =∑ ∑ ( 𝒙 𝒊𝒋 − 𝒙´ )𝟐
𝒊=𝟏 𝒋 =𝟏
𝒌
𝑺 𝑪𝑻 𝑹= ∑ 𝒓 𝒋 ( 𝒙 𝒋 − 𝒙´ )
𝟐
Suma de Cuadrados de los Tratamientos
𝑱 =𝟏
𝒓 𝒌

Suma de Cuadrados del Error 𝑺 𝑪 𝑬=∑ ∑ ( 𝒙 𝒊𝒋 − 𝒙 𝒋 )𝟐


𝒊=𝟏 𝒋 =𝟏
ANÁLISIS DE VARIANZA

ANOVA A UNA VÍA


El vicepresidente de mercadeo de SCOTIAN NATIONAL BANK, se encuentra analizando los
esfuerzos promocionales para atraer nuevos depositantes, en el que se incluyen algunos
juegos y premios en cuatro sucursales del banco. El esta convencido de que diferentes tipos
de premios atraerían a diferentes grupos de ingresos. Las personas de un nivel de ingreso
prefieren los regalos, mientras que los de otros grupos de ingresos pueden sentirse mas
atraídos por viajes gratuitos a sitios favoritos para pasar vacaciones, Se decide determinar
si existe una diferencia en el nivel promedio de depósitos entre las cuatro sucursales. Si se
halla alguna diferencia, se ofrecerá una diversidad de premios promocionales.

SUCURSALES
DEPOSITO
1 2 3 4
1 5,1 1,9 3,6 1,3
2 4,9 1,9 4,2 1,5
3 5,6 2,1 4,5 0,9
4 4,8 2,4 4,8 1,0
5 3,8 2,1 3,9 1,9
6 5,1 3,1 4,1 1,5
7 4,8 2,5 5,1 2,1
Cálculo de la Media del tratamiento
Media del tratamiento Media del tratamiento Sucursal 1
5 ,1+ 4 ,9 +5 , 6+ 4 ,8 +3 , 8+ 5 , 1+ 4 , 8

𝑟
𝑥1 = =4 , 87
𝑖 =1
𝑥 𝑖𝑗
∀ : 𝑗=1 , 2 ,.. 𝑘 7
𝑥 𝑗=
𝑛

Media del tratamiento Sucursal 2


DEPOSIT SUCURSA (k) 1, 9+ 1 ,9 +2 ,1+ 2 , 4+ 2 ,1+ 3 , 1+ 2 ,5
𝑥 2= =2 , 29
O
(r) 1 2 L
3 4 7
1 5,1 1,9 3,6 1,3
Media del tratamiento Sucursal 3
2 4,9 1,9 4,2 1,5 3 , 6+ 4 ,2+ 4 ,5 + 4 , 8+ 3 , 9+ 4 , 1+5 , 1
𝑥 3= =4 , 31
3 5,6 2,1 4,5 0,9 7
4 4,8 2,4 4,8 1,0
Media del tratamiento Sucursal 4
5 3,8 2,1 3,9 1,9 1 , 3+1 , 5+ 0 , 9+1 , 0+1 , 9+1 , 5+ 2, 1
3,1
𝑥4= =1 , 46
6 5,1 4,1 1,5 7
7 4,8 2,5 5,1 2,1

MEDIAS 4,87 2,29 4,31 1,46


Cálculo de la Gran Media
DEPOSIT SUCURSA (k)
O
(r) L
1 2 3 4
Gran Media 1 5,1 1,9 3,6 1,3
𝑟 𝑘

∑∑ 𝑥𝑖𝑗 2 4,9 1,9 4,2 1,5


𝑖=1 𝑗 =1
´ =
𝑥
𝑛 3 5,6 2,1 4,5 0,9
4 4,8 2,4 4,8 1,0
5 3,8 2,1 3,9 1,9
6 5,1 3,1 4,1 1,5
7 4,8 2,5 5,1 2,1

𝟓 , 𝟏+𝟏 ,𝟗 +𝟑 ,𝟔 +𝟏 ,𝟑 +𝟒 , 𝟗+𝟏 , 𝟗+… … … … …+𝟏 , 𝟓+𝟒 ,𝟖+ 𝟐 ,𝟓+ 𝟓 ,𝟏+ 𝟐 ,𝟏 𝟗𝟎 , 𝟓


´
𝒙= =
𝟐𝟖 𝟐𝟖
´
𝒙=𝟑 , 𝟐𝟑
Planteamiento de la Hipótesis
H0:
HA: No todas las medias son iguales

Suma de Cuadrados Totales (SCT)


DEPOSITO SUCURSAL (k)
Suma de Cuadrados Totales (r) 4
1 2 3
𝑟 𝑘 1 (5,1-3,23)2 (1,9-3,23)2 (3,6-3,23)2 (1,3-3,23)2

𝑆 𝐶𝑇 =∑ ∑ ( 𝑥 𝑖𝑗 − 𝑥´ )2 2 (4,9-3,23)2 (1,9-3,23)2 (4,2-3,23)2 (1,5-3,23)2


𝑖=1 𝑗=1 3 (5,6-3,23)2 (2,1-3,23)2 (4,5-3,23)2 (0,9-3,23)2

4 (4,8-3,23)2 (2,4-3,23)2 (4,8-3,23)2 (1,0-3,23)2


Gran Media ´
𝒙=𝟑 , 𝟐𝟑 5 (3,8-3,23)2 (2,1-3,23)2 (3,9-3,23)2 (1,9-3,23)2

6 (5,1-3,23)2 (3,1-3,23)2 (4,1-3,23)2 (1,5-3,23)2

7 (4,8-3,23)2 (2,5-3,23)2 (5,1-3,23)2 (2,1-3,23)2

𝑺 𝑪𝑻 =𝟔𝟏.𝟎𝟎
Suma de Cuadrados de Tratamiento

Suma de Cuadrados de los Tratamientos


𝑐
𝑆 𝐶𝑇 𝑅= ∑ 𝑟 𝑗 ( 𝑥 𝑗 − 𝑥´ )2
𝐽=1

´
𝒙=𝟑 , 𝟐𝟑 Gran Media

DEPOSIT SUCURSA (k)


O
(r) L
1 2 3 4

MEDIAS 4,87 2,29 4,31 1,46

𝑺𝑪𝑻𝑹=𝟕 ( 𝟒,𝟖𝟕− 𝟑,𝟐𝟑 ) 𝟐+𝟕 ( 𝟐,𝟐𝟗− 𝟑,𝟐𝟑 ) 𝟐+𝟕 ( 𝟒 ,𝟑𝟏− 𝟑,𝟐𝟑 ) 𝟐+𝟕 (𝟏,𝟒𝟔−𝟑,𝟐𝟑 ) 𝟐
𝑺𝑪𝑻𝑹=𝟓𝟓,𝟑𝟑
Suma de Cuadrados de Error (SCE)
SUCURSAL
Suma de Cuadrados de Error
𝑟 𝑘 1 2 3 4

𝑆 𝐶 𝐸=∑ ∑ ( 𝑥 𝑖𝑗 − 𝑥 𝑗 ) 2
MEDIAS 4,87 2,29 4,31 1,46
𝑖=1 𝑗=1

DEPOSITO SUCURSAL (k)


(r) 1 2 3 4
1 (5,1-4,87)2 (1,9-2,29)2 (3,6-4,31)2 (1,3-1,46)2

2 (4,9-4,87)2 (1,9-2,29)2 (4,2-4,31)2 (1,5-1,46)2

3 (5,6-4,87)2 (2,1-2,29)2 (4,5-4,31)2 (0,9-1,46)2

4 (4,8-4,87)2 (2,4-2,29)2 (4,8-4,31)2 (1,0-1,46)2

5 (3,8-4,87)2 (2,1-2,29)2 (3,9-4,31)2 (1,9-1,46)2

6 (5,1-4,87)2 (3,1-2,29)2 (4,1-4,31)2 (1,5-1,46)2

7 (4,8-4,87)2 (2,5-2,29)2 (5,1-4,31)2 (2,1-1,46)2 𝑺 𝑪 𝑬=𝟓,𝟔𝟕


Grados de Libertad
Grados de Libertad del Numerador (k – 1) n = 28 Numero de Datos
k= 4 Columnas
Grados de Libertad del Denominador (n – k) = k(r-1)
r=7 Filas
Suma de Cuadrados GlSCT = GlSCTR + GlSCE
Grados de Libertad (n -1) = (k – 1) + (n – k) (28 -1) = (4 – 1) + (28 – 4)

(n -1) = (k – 1) + k(r – 1) (28 -1) = (4 – 1) + 4(7 – 1)


𝑟 𝑘
Suma de Cuadrados Totales 𝑆 𝐶𝑇 =∑ ∑ ( 𝑥 𝑖𝑗 − 𝑥 ) 𝑺 𝑪𝑻 =𝟔𝟏.𝟎𝟎
´ 2

𝑖=1 𝑗=1
𝑐
Suma de Cuadrados de los Tratamientos 𝑆 𝐶𝑇 𝑅= ∑ 𝑟 𝑗 ( 𝑥 𝑗 − 𝑥´ )2 𝑺𝑪𝑻𝑹=𝟓𝟓,𝟑𝟑
𝐽=1
𝑟 𝑘
Suma de Cuadrados del Error 𝑆 𝐶 𝐸=∑ ∑ ( 𝑥 𝑖𝑗 − 𝑥 𝑗 ) 2 𝑺 𝑪 𝑬=𝟓 , 𝟔𝟕
𝑖=1 𝑗=1
Tabla de Análisis de Varianza - ANOVA
FUENTE DE SUMA DE GRADOS DE CUADRADOS F
VARIABILIDAD CUADRADOS LIBERTAD MEDIOS (FORMULA)
ENTRE MUESTRAS
(Tratamientos) 55,33 4-1
DENTRO DE MUESTRAS
(Error) 5,67 28 – 4 78,14
VARIACION TOTAL 61,00 28 – 1

Prueba F de Fischer (formula)

Suma d Cuadrados de Tratamientos 𝑆𝐶𝑇𝑅=18,44


Suma de Cuadrados de Error 𝑆 𝐶𝐸=0,236
𝟏𝟖 , 𝟒𝟒
𝑭 𝒑𝒓𝒖𝒆𝒃𝒂= =𝟕𝟖 , 𝟏𝟒
𝟎 , 𝟐𝟑𝟔
Prueba F de Fischer (tabla) Grados de Libertad Numerador: k - 1 = 4 – 1 = 3
Denominador: k(r – 1) = 4(7 – 1) = 24
(n – k) = 28 - 4 = 24
Nivel de Significación = 1%

𝑭 𝜶− (𝒌 −𝟏 ) −𝒌(𝒏 −𝟏 )=¿
𝑭 𝟎, 𝟎𝟏− 𝟑− 𝟐𝟒 =𝟒. 𝟕𝟐
Como 78,14 es mayor que = 4.72; HO no se acepta, por lo tanto existen diferencias reales entre las
medias.
ANÁLISIS DE VARIANZA

ANOVA A DOS VÍA


Análisis de Varianza (ANOVA)
ANOVA a dos vías
• Como y por que funciona
Con el análisis de varianzas a dos vías, la suma de cuadrados total (SCT) se divide en
tres partes: la suma d cuadrados del tratamiento (SCTR) , la suma de cuadrados de
bloques (SCBL) y la suma de cuadrados del error (SCE), por lo tanto:

SCT = SCTR + SCBL + SCE

La Suma de Cuadrados Total (SCT) y la Suma de Cuadrados del Tratamiento (SCTR)


se calculan de la misma forma que en el análisis de varianza a una sola vía. Sin embargo
la Suma de Cuadrados del Error (SCE) se subdivide en una medida para la Suma de
Cuadrados del Error (SCE) y Suma de Cuadrados del Bloque (SCBL), en donde:
𝑟𝑐
𝑆 𝐶 𝐵𝐿=∑ 𝑟 𝑖 ( 𝑥𝑖 − 𝑥´ )2
𝑖=1
Tabla de Tratamientos
T1 T2 T2 Suma de Cuadrados Totales
x11 x12 x13 x1 . 𝑟 𝑐

x21 x22 x23 x2 . 𝑆 𝐶𝑇 =∑ ∑ ( 𝑥 𝑖𝑗 − 𝑥´ )2


𝑖=1 𝑗=1
x31 x32 x33 x3 .
Suma de Cuadrados de los Tratamientos
x41 x42 x43 x4 .
𝑐
x51 x52 x53 x5 .
𝑆 𝐶𝑇 𝑅= ∑ 𝑟 𝑗 ( 𝑥 𝑗 − 𝑥´ )2
𝐽=1
x.1 x.2 x.3
Suma de Cuadrados de Bloques
𝑟

Media del tratamiento ∑ 𝑥𝒊 𝑗 𝑐


∀ : 𝑗=1 , 2 ,.. 𝑐
𝑆 𝐶 𝐵𝐿= ∑ 𝑘𝑖 ( 𝑥 𝑖 − 𝑥´ ) 2
𝑥 𝑗 = 𝑖 =1
𝑛𝑖
𝑘

Media de Bloque ∑ 𝑥𝑖 𝒋 ∀ : 𝑖=1 ,2 , .. 𝑐 𝐽 =1


𝑗 =1
𝑥𝑖 =
𝑛 𝑗
Suma de Cuadrados Error
𝑟 𝑐

Gran Media ∑∑ 𝑥𝑖𝑗


´ =
𝑥 𝑖=1 𝑗 =1
SCE = SCT - SCTR - SCBL
𝑛𝑖𝑗
• Como y por que funciona la tabla ANOVA

GRADOS
FUENTE DE SUMA DE F
DE CUADRADOS MEDIOS
VARIABILIDAD CUADRADOS (FORMULA)
LIBERTAD
ENTRE MUESTRAS
(Tratamientos) SCTR k-1
ENTRE BLOQUES SCBL r–1
DENTRO DE MUESTRAS
(Error) SCE (r-1) (k-1)

VARIACION TOTAL SCT n–1

Suma de Cuadrados SCE = SCT - SCTR - SCBL


Grados de Libertad (r -1) (k – 1) = (n – 1) - (k – 1) - (r –1)
EJERCICIOS DE
ANÁLISIS DE VARIANZA
ANOVA A DOS VÍA
 ANOVA A DOS VIAS
(Diseño aleatorizado en bloques)
Una emisión reciente de la revista FORTUNE describió los esfuerzos realizados por una
importante empresa de electrónica para desarrollar un sistema en el cual se les daba a
los empleados la oportunidad de evaluar el desempeño de sus supervisores y de algún
personal administrativo. Se seleccionaron aleatoriamente cinco empleados y se les pide
evaluar a cuatro de sus gerentes sobre una escala de 10 a 50. Los resultados, junto con
las medias aparecen en la siguiente tabla:

Gerente
Empleado
1 2 3 4
1 31 35 46 38
2 29 32 45 36
3 13 17 35 20
4 28 38 52 39
5 14 20 40 20
Es decir que se desea saber si existe diferencias en las clasificaciones promedio de los cuatro
gerentes.
H o : µ 1 = µ2 = µ3 = µ4
H1 : No todas las medias de las filas son iguales
La Media de cada tratamiento () de todas las observaciones del experimento: =

La Media de cada bloque () de todas las observaciones del experimento: =

Gerentes
Trabajadores 1 2 3 4 =

1 31 35 46 38 37.50
2 29 32 45 36 35.50
3 13 17 35 20 21.25
4 28 38 52 39 39.25
5 14 20 40 20 23.50
= 23.0 28.4 43.6 30.6 31.4

La Gran Media () de todas las observaciones del experimento: =


Suma de Cuadrados Total
Suma de Cuadrados Total (SCT) es simplemente la variación de las observaciones alrededor de la
gran media.
Gerentes
1 2 3 4
Trabajadores

1
𝑥𝑖𝑗
31 35 46 38
2 29 32 45 36
3 13 17 35 20
4 28 38 52 39
5 14 20 40 20 = 31.4

Suma de Cuadrados Total


𝑟 𝑠 0.16 12.96 213.16 43.56
𝑆𝐶𝑇 =∑ ∑ ( 𝑥 𝑖𝑗 − 𝑋´ )
2
5.76 0.36 184.96 21.16
𝑖=1 𝑗=1
338.56 207.36 12.96 129.96
11.56 43.56 424.36 57.76
302.76 129.96 73.96 129.96 2 344.8
Suma de Cuadrados de los Tratamientos
Suma de Cuadrados de los Tratamientos (SCTR) refleja la variación en las medias de la columna
alrededor de la gran media.
Gerentes
Trabajadores 1 2 3 4
1 31 35 46 38
2 29 32 45 36
𝑥𝑗
3 13 17 35 20
4 28 38 52 39
5 14 20 40 20
= 23.0 28.4 43.6 30.6 = 31.4

Suma de Cuadrados de los Tratamientos

5
𝑆𝐶𝑇𝑅=∑ 𝑟 𝑗 ( 𝑥 𝑗 − 𝑋´ )
2
352.8 45 744.2 3.2 1 145.2
Suma de Cuadrados de los Bloques
Suma de Cuadrados de los Bloques (SCBL) refleja la variación en las medias de la filas alrededor
de la gran media.

Gerentes
Trabajadores 1 2 3 4 =

1 31 35 46 38 37.50
𝑥𝑖
2 29 32 45 36 35.50
3 13 17 35 20 21.25
4 28 38 52 39 39.25
5 14 20 40 20 23.50 = 31.4

Suma de Cuadrados de los Bloques

4
𝑆𝐶𝐵𝐿=∑ 𝑐 𝑖 ( 𝑥 𝑖 − 𝑋´ )
2
148.84 67.24 412.09 246.49 249.64 1 124.3
Como: SCT = 2 344.8 Siendo: SCE = SCT - SCTR - SCBL
SCTR = 1 145.2
SCBL = 1 124.3 Se tiene que: 75.3 = 2 344.8 - 1 145.2 - 1 124.3

n : es el conjunto de datos u observaciones n = 20


c : es el numero de medias de columnas o numero de tratamientos k = 4
r : es el numero de medias de filas o numero de bloques r = 5
De los Grados de Libertad
(gl):• Grados de libertad de la Suma de Cuadrados Totales (gl SCT ): glSCT = n - 1
•Grados de libertad de la Suma de Cuadrados de los Tratamientos (gl SCTR ): glSCTR = k - 1
• Grados de libertad de la Suma de Cuadrados de los Bloques (gl SCBL ): glSCBL = r - 1
• Grados de libertad de Error (gl SCE): glSCE = (k-1)*(r – 1)

glSCT = n – 1 = 20 – 1 = 19 glSCT = 19
glSCTR = k – 1 = 4 – 1 = 3 glSCTR = 3
glSCBL = r–1 = 5–1=4 glSCBL = 4

Siendo: glSCE = glSCT - glSCTR - glSCBL


Se tiene que: 12 = 19 - 3 - 4
Cuadrados Medios (CM):
2
𝑠 =
∑ ( 𝑥𝑖𝑗 − 𝑥 ) 2

Se parte de la formula de la Varianza Muestral:


𝑛 −1
Después de obtener la suma de cuadrados cada una se divide entre sus correspondientes
grados de libertad, produciendo un cuadrado medio. Es decir si se divide una Suma de
Cuadrados entre sus correspondientes Grados de Libertad, se obtiene el Cuadrado Medio:

Como: SCT = 2 344.8 n = 20 glSCE = 12


k = 4
SCTR = 1 145.2 glSCTR = 3
r = 5
SCBL = 1 124.3 glSCBL = 4

𝑆𝐶𝐸 𝟕𝟓 .𝟑
Cuadrado Medio Error: 𝐶𝑀𝐸 =
𝑔𝑙 𝑆𝐶𝐸
𝑪𝑴𝑬=
( 𝟓 −𝟏 ) ∗(𝟒 −𝟏)
=𝟔 . 𝟐𝟕𝟓

𝑆𝐶𝑇𝑅 𝟏𝟏𝟒𝟓 .𝟐
Cuadrado Medio del Tratamiento: 𝐶𝑀𝑇𝑅= 𝑪𝑴𝑻𝑹= =𝟑𝟖𝟏 . 𝟕𝟑
𝑔𝑙 𝑆𝐶𝑇𝑅 𝟒 −𝟏

𝑆𝐶𝐵𝐿 𝟏 𝟏𝟐𝟒 .𝟑
Cuadrado Medio del Bloque: 𝐶𝑀𝐵𝐿=
𝑔𝑙 𝑆𝐶𝐵𝐿
𝑪𝑴𝑩𝑳=
𝟓 −𝟏
=𝟐𝟖𝟏 . 𝟎𝟕𝟓

Estos tres cuadrados medios están fundamentalmente basados en la formula de la varianza


muestral. Esto significa que se trata de sumas de cuadrados divididos entre sus
correspondientes grados de libertad y como tales vienen a ser varianzas.
Es la razón de los dos últimos cuadrados medios CMTR y CME, que se utilizan como base del
análisis de varianza para probar la hipótesis respecto a la igualdad de las medias. Esta razón
se ajusta a la distribución F y se expresa como:

Razón F para una prueba de medias de Tratamientos: 𝑭 = 𝑪𝑴 𝑻𝑹


𝑪𝑴𝑬
Siendo: 𝟑𝟖𝟏 . 𝟕𝟑
𝑪𝑴𝑬 =𝟔 . 𝟐𝟕𝟓
𝑭=
𝟔 . 𝟐𝟕𝟓 𝑭 =𝟔𝟎.𝟖𝟑

Razón F para una prueba de medias de Bloques: 𝑪𝑴𝑩𝑳


𝑭=
𝑪𝑴𝑬
Siendo: 𝟐𝟖𝟏 . 𝟎𝟕𝟓
𝑪𝑴𝑬 =𝟔 . 𝟐𝟕𝟓
𝑭= 𝑭 =𝟒𝟒.𝟕𝟗
𝟔 .𝟐𝟕𝟓

Los Cuadrados Medios de Tratamientos (CMTR) mide la variación entre tratamientos. Si los tratamientos
tienen efectos diferentes los CMTR lo reflejara a través de su incremento. Entonces la razón F en si misma
se incrementara. Por tanto, si la razón F se vuelve “significativamente” grande porque CMTR excede a
CME por una cantidad grande, se reconoce que los efectos del tratamiento probablemente existen. Es
probable que tratamientos diferentes tengan efectos diferentes en las medias de sus poblaciones
respectivas, y podría rechazarse la hipótesis nula, la cual indica que las medias de los tratamientos son
iguales.
TABLA DE ANALISIS DE VARIANZA GENERALIZADA
Suma de Grados de
FUENTE DE VARIACION Cuadrados Medios Valor F
Cuadrados Libertad
Entre Muestras (Tratamientos) SCTR k-1 CMTR = SCTR / k - 1 𝑪𝑴𝑻𝑹
𝑭=
𝑪𝑴𝑬
Entre Bloques SCBL r-1 CMBL = SCBL / r - 1 𝑭=
𝑪𝑴𝑩𝑳
𝑪𝑴𝑬
Dentro de Muestras (Error) SCE (k – 1)*(r-1) CME = SCE / n - 1
Variación Total SCT n–1

TABLA DE ANALISIS DE VARIANZA GENERALIZADA


Suma de Grados de
FUENTE DE VARIACION Cuadrados Medios Valor F
Cuadrados Libertad
Entre Muestras (Tratamientos) 1145.2 4–1 =3 CMTR = 381.733 F= 60.79

Entre Bloques 1124.3 5–1 =4 CMBL =281.075 F = 44.76

Dentro de Muestras (Error) 75.3 (4 – 1)*(5-1)= 12 CME = 6.275


Variación Total 2344.8 20 – 1 = 19

Ho : µ1= µ2= µ3 = µ4
H1 : No todas las medias de las filas son iguales
Prueba F de Fischer (tabla)
• Grados de libertad de la Suma de Cuadrados Totales (gl SCT ): glSCT = n - 1 = 20 – 1 = 19
• Grados de libertad de la Suma de Cuadrados de los Tratamientos (gl SCTR ): glSCTR = k - 1 =4–1=3
• Grados de libertad de la Suma de Cuadrados de los Bloques (gl SCBL ): glSCBL = r - 1 = 5–1=4

𝑭 𝜶− (𝒌 −𝟏 ) −(𝒓 − 𝟏)(𝒌 −𝟏 )=¿𝑭 𝟎, 𝟎𝟏− 𝟑− 𝟏𝟐 =𝟓.𝟗𝟓 60,79


𝑭 𝜶− (𝒓 − 𝟏) −(𝒓 −𝟏)(𝒌− 𝟏)¿ ¿=¿𝑭 𝟎, 𝟎𝟏− 𝟒 −𝟏𝟐 =𝟓. 𝟒𝟏 44,76

Como es mayor que = 5.95; HO no se acepta, por lo tanto existen diferencias reales entre las medias.
Conclusiones
Anova: Permite estudiar la asociación entre una variable cuantitativa y una variable
cualitativa de más de dos categorías, siempre que la cuantitativa siga una
distribución normal. Con el análisis de varianza comprobamos si existen diferencias
estadísticamente significativas entre más de dos grupos. Comprobamos si las
diversas muestras podemos considerarlas muestras aleatorias de la misma población.
Es el método apropiado cuando tenemos más de dos grupos en el mismo
planteamiento.

Test de Fisher: El test exacto de Fisher permite analizar si dos variables dicotómicas
están asociadas cuando la muestra a estudiar es demasiado pequeña (N<20), y no se
cumplen las condiciones necesarias para que la aplicación de la Chi sea adecuada.
Los valores esperados de al menos el 80% de las celdas en una tabla de contingencia
sean mayores de 5.
Origen de la t de Student: A finales del siglo XIX. En Dublín la fábrica Guinness
era la cervecería más grande del mundo: la Guinness se consumía en Irlanda y Gran
Bretaña y comenzaba a exportarse por todo el mundo a los dueños les preocupaba la
calidad de su producto fueron pioneros en establecer controles de calidad Contratan
al estadístico William Sealy Gosset (compañero de F. N) Con el objetivo de
optimizar el producto ya que analizar toda la producción es muy caro… y extraen
muestras y trata de establecer conclusiones para toda la producción.

Curva normal: la curva normal es un modelo matemático basado en Teorema del


Límite Central y Ley de los Grandes Números. Permite comparar valores mediante
el uso de unas tablas ya establecidas y para ello hay que: Tipificar los valores
(“normalizarlos”) y Compararlos con los resultados de las tablas ya establecidas.
Tareas en el aula virtual
Una organización encargada de proveer desayunos escolares, ha solicitado la siguiente investigación de su
mercado interno. Esta interesada en compara los gastos resultantes de elaborar desayuno muy usual, según
el tipo de batería de cocina utilizado. Los gastos son de dos tipos: Tecnologia y energía “X 1” asi como de
insumos y condimentos “X2”. Se realizaron cinco pruebas con cada tipo de batería obteniéndose los
siguientes resultados:
BATERIAS
Pruebas A B C
X1 X2 X1 X2 X1 X2
1 32 48 28 46 31 43
2 30 45 26 39 30 42
3 31 45 30 45 32 44
4 33 47 28 47 30 44
5 29 44 29 48 27 41

Algunas baterías aconsejan la utilización de cantidades mas pequeñas de insumos y condimentos, ya que
los materiales utilizados y el diseño de la batería pueden hacer variar el tiempo necesario de cocción. Los
datos esta en unidades monetarias (u.m.).
Los gastos: Tecnologia y energía “X1” asi
como de insumos y condimentos “X2”.
BATERIAS
Tecnología y Energía “X1”
Pruebas A B C
Pruebas A B C
X1 X2 X1 X2 X1 X2 1 32 28 31
1 32 48 28 46 31 43 2 30 26 30
2 30 45 26 39 30 42
3 31 30 32
3 31 45 30 45 32 44
4 33 28 30
4 33 47 28 47 30 44
5 29 44 29 48 27 41 5 29 29 27

Gastos Totales “X” Insumos y Condimentos “X2”

Pruebas A B C Pruebas A B C
1 80 74 74 1 48 46 43
2 75 75 72 2 45 39 42
3 76 75 76 3 45 45 44
4 80 75 74 4 47 47 44
5 73 77 68 5 44 48 41
Utilizando un análisis ANOVA ¿Qué puede inferirse a partir de los datos recabados?
TECNOLOGIA Y ENERGÍA “X1”

Pruebas A B C
1 32 28 31
2 30 26 30
3 31 30 32
4 33 28 30
5 29 29 27

1.- Calculo de las medias aritméticas de los TRATAMIENTOS (baterías): Tecnologia y energía “X 1”
Media Aritmética 32+30 +31+33 +29 155
𝒏 𝑥 𝐴= = =31

𝒊 =𝟏
𝑿𝒊 5 5
𝒙𝑻=
𝒏 28+26 +30+ 28+29 141
𝑥𝐵= = =28 ,2
5 5
31+30+ 32+ 30+27 150
𝑥 𝐶= = =30
5 5
2.- Calculo de las Varianza Muestral de los TRATAMIENTOS (baterías): Tecnologia y energía “X 1”
𝑛

∑ ( 𝑋 ¿ ¿ 𝑖 − 𝑥 )2
Varianza Muestral 𝑆 2𝑇 = 𝑖 =1 ¿
𝑛−1

2 2 2 2 2
2 (32 −31) +(3 0 −31) +( 3 1− 31) +(3 3 − 31) +(29 −31) 10
𝑆 𝐴= = =2 , 5
5 −1 4
2 2 2 2 2
2 (28 − 28 , 2 ) +( 26 −28 ,2 ) +(3 0− 28 , 2 ) +(28 −28 ,2 ) +(29 −28 ,2 ) 8 , 8
𝑆 𝐵= = =2 , 2
5 −1 4
2 2 2 2 2
(31 − 30) +(3 0 −3 0) +(3 2 −3 0) +(3 0 −3 0) +(27 − 3 0) 10
2
𝑆 𝐶= = =3 , 5
5 −1 4
Tomando en cuenta los cálculos de las varianzas se evidencia que la Batería B es la que presenta
menos varianza, por lo que para el uso de tecnología y gasto de energía “X1”, es la mas
conveniente.
Estimación Interna de Varianza
𝟐 𝟐
𝑺𝟏 + 𝑺𝟐 + 𝑺𝟑+ … .+ 𝑺𝒌
𝟐 𝟐
𝟐 𝟐 ,𝟓+ 𝟐 ,𝟐+ 𝟑 ,𝟓 𝟖 , 𝟐
𝟐
𝑺 𝑾= 𝑺 𝑾 = = =𝟐 , 𝟕𝟑𝟑
𝒌 𝟑 𝟑
2 2
Estimación Intermediante de Varianzas 𝑆 𝑥 =𝑛 ∗ 𝑆 𝑥

Media de las Medias Aritméticas (Gran Media) ∑ 𝒙𝒊


𝒊=𝟏
´ =
𝒙
𝒌

𝟑𝟏+𝟐𝟖 ,𝟐+ 𝟑𝟎 𝟖𝟗 , 𝟐
´
𝒙= = =𝟐𝟗 , 𝟕𝟑𝟑
𝟑 𝟑
𝑘

Varianza de las Medias Aritméticas ∑ ( 𝑥𝑖− 𝑥


´ )2
𝑖 =1
𝑆2
𝑥=
𝑘− 1
𝟐 𝟐 𝟐
( 𝟑𝟏 −𝟐𝟗 ,𝟕𝟑𝟑 ) + ( 𝟐𝟖 ,𝟐 − 𝟐𝟗 ,𝟕𝟑𝟑 ) + ( 𝟑𝟎 −𝟐𝟗 ,𝟕𝟑𝟑 ) 𝟒 ,𝟎𝟐𝟔
𝑺𝟐𝒙 = = =𝟐 , 𝟎𝟏𝟑
𝟑 −𝟏 𝟐

𝟐 𝟐
Estimación Intermediante de Varianzas 𝑺 𝒙 =𝒏 ∗ 𝑺 𝒙
𝟐
𝑺 𝒙 =𝟐 , 𝟎𝟏𝟑
= 10,065
𝒏=𝟓
Planteamiento de Hipótesis HO: Todas las proporciones de la poblacion son iguales.
HA: No todas las proporciones de la poblacion son iguales.

Prueba F de Fischer (formula)

Estimación Interna de Varianza 𝑆 2𝑊 =2,733


2
Estimación Intermediante de Varianzas 𝑆 𝑥 =10,065
𝟏𝟎, 𝟎𝟔𝟓
𝑭 𝒑𝒓𝒖𝒆𝒃𝒂= =𝟑 ,𝟔𝟖
𝟐 ,𝟕𝟑𝟑
Prueba F de Fischer (tabla) Grados de Libertad Numerador: k - 1 = 3 – 1 = 2
Denominador: k(n – 1) = 3(5 – 1) = 12
Nivel de Significación = 1%
𝑭 𝜶− (𝒌 −𝟏 ) −𝒌(𝒏 −𝟏 )=¿
𝑭 𝟎, 𝟎𝟏− 𝟐− 𝟏𝟐 =𝟔,𝟗𝟑
Como es menor que ; HO se acepta, por lo tanto no existen diferencias reales entre las baterías.
𝑭 𝜶− (𝒌 −𝟏 ) −𝒌(𝒓 − 𝟏)=¿
𝑭 𝟎, 𝟎𝟏− 𝟐− 𝟏𝟐 =𝟔.𝟗𝟑
Como 3,68 es menor que = 6.93; HO no se rechazo, por lo tanto no existen diferencias reales entre
las medias.
Fuentes Bibliográficas
Ronald E. Walpole y Raymond H. Myers Probabilidad y Estadística para ingeniería y
ciencias,
Anderson D., Sweeney D., Williams T. Estadística para la administración y economía.
Décima edición. Cengage Learning. 2008
Berenson M., Levine D., Krehbiel T. Estadística para administración. Segunda edición.
Prentice Hall. 2000
Devore J. Probabilidad y Estadística para ingeniería y ciencias. Séptima edición. Cengage
Learning. 2008
Johnson R. Probabilidad y Estadística para ingenieros. Octava edición. Pearson. 2012
MUCHAS GRACIAS

También podría gustarte