Está en la página 1de 8

Análisis de la varianza

El análisis de la varianza (o Anova: Analysis of variance) es un método para comparar tres o


más medias. Se desea medir el efecto del factor en estudio (variable independiente de
naturaleza cualitativa o cuantitativa) sobre la variable respuesta (variable dependiente de
naturaleza cuantitativa).

En un diseño completamente al azar (DCA) los tratamientos se asignan aleatoriamente a las


unidades experimentales.

Hay k poblaciones (k tratamientos) y se seleccionan k muestras aleatorias independientes, una


de cada población.

Esta técnica estadística permite descomponer la variabilidad total de los resultados de un


experimento en sus distintas fuentes (tratamientos, error experimental), con la finalidad de
compararlas e identificar su importancia relativa en la explicación de la variación total.

Variabilidad entre grupos Variabilidad dentro de los grupos

Mide el efecto de los tratamientos Mide la variabilidad del error experimental

Tabla del ANOVA o ANVA


Fuente de
Grados de libertad Suma de cuadrados Cuadrado medio Fc
variación
SMTR
Tratamientos k −1 SCTR CMTR=
k−1 CMTR
SCE CME
Error n−k SCE=SCT−SCTR CME=
n •−k

Total n−1 SCT

La prueba para k medias o el análisis de varianza se basa en la descomposición de la variación


total de los datos con respecto a la media global ( SCT ) en dos partes:

ni ni
k
2 y 2..
k
2
SCT =∑ ∑ ( y ij −ý ) =∑ ∑ y − ij
i=1 j=1 i=1 j=1 n.

Variación dentro de las muestras o variación intragrupos que denotaremos como SCTR.

k
2
k
y2i . y 2..
SCTR=∑ ni ( ý i− ý ) =∑ −
i=1 i=1 ni n.
Variación entre muestras o variación intergrupos que denotaremos como SCE.

k ni
SCE=SCT−SCTR=∑ ∑ ( y ij − ý i )2
i=1 j=1

donde:

SCT : Suma de cuadrados del total


SCTR: Suma de cuadrados de los tratamientos
SCE: Suma de cuadrados del error
ni : Tamaño de muestra del i -ésimo tratamiento
n: Tamaño de muestra total n=n1 +n2 +⋯ +nk
k: Número de tratamientos
Y i: Total de la i -ésima muestra Y =Y 1+Y 2+ ⋯+Y k

Asumiendo el cumplimiento de los supuestos antes mencionados, y que en realidad no hay


diferencia entre los tratamientos, la cantidad Fc del cuadro de análisis de varianza seguiría una
distribución F con los grados de libertad del tratamiento y con los grados de libertad del error.

Entonces, se puede utilizar esta distribución para evaluar la hipótesis nula de que no hay
diferencias entre las medias de los tratamientos.

ANVA (DCA)
Hipótesis estadística

1. Formular las hipótesis.

H0 : μ1=μ 2=…=μ k
H 1 : Al menosuna μi es diferente a losdemás

H 0 El factor en estudio no afecta a la variable respuesta.

H 1 El factor en estudio sí afecta a la variable respuesta.

2. Fijar el nivel de significación: α

3. Calcular el estadístico de prueba.

CMTR
F c=
CME
4. Establecer la región crítica.

El valor crítico es: F critico=F ;gl tratamiento ; glerror =F ;k−1 ;n−k

5. Aplicar los criterios de decisión.

El valor crítico es:

F critico=F ;gl tratamiento ; glerror =F ;k−1 ;n−k

Para tomar una decisión seguimos la siguiente regla:

Si F c ≤ F critico , no se rechaza H 0
Si F c > F critico , sí se rechaza H 0

6. Realizar la conclusión.
Ejemplo 1
La gerente de mercadeo de un banco planea poner en marcha cierto tipo de promociones para
atraer nuevos clientes en cuatro sucursales del banco. Ella está convencida que diferentes
tipos de promociones atraerán a personas de diferentes grupos de ingreso, por lo que, de
haber diferencias entre los ingresos medios de los clientes de cada sucursal, se optará por un
programa de promociones distinto para cada una.

Considere a los montos de los depósitos, en miles de soles, como una medida representativa
de los ingresos de los clientes. Se presentan datos para una muestra de siete depósitos de cada
sucursal ¿Debe la gerente optar por un programa de promociones distinto para cada sucursal?
Evalúe esta posibilidad con un nivel de significación del 5%.

Depósito Sucursal 1 Sucursal 2 Sucursal 3 Sucursal 4


1 Y11 = 5,3 Y21 = 3,3 Y31 = 3,6 Y41 = 4,3
2 Y12 = 2,6 Y22 = 4,6 Y32 = 2,8 Y42 = 2,5
3 Y13 = 3,6 Y23= 2,1 Y33 = 4,5 Y43 = 1,8
4 Y14 = 3,8 Y24 = 3,5 Y34 = 3,8 Y44 = 3,0
5 Y15 = 2,7 Y25 = 5,0 Y35 = 1,9 Y45 = 3,9
6 Y16 = 5,1 Y26 = 2,8 Y36 = 4,1 Y46 = 3,5
7 Y17 = 4,2 Y27 = 2,5 Y37 = 5,1 Y47 = 4,1
Total, Yi. Y1. = 27,3 Y2. = 23,8 Y 3. = 25,8 Y 4. = 23,1
ni n1 = 7 n2 = 7 n3 = 7 n4= 7

Y ..=100
n .=28

Solución

Variable respuesta El monto del depósito, en miles de soles

Factor SUCURSAL DE BANCARIA

Tratamientos Sucursal 1, Sucursal 2, Sucursal 3, Sucursal 4

Unidad experimental Un depósito bancario

¿Debe la gerente optar por un programa de promociones distinto para cada sucursal? Evalúe
esta posibilidad con un nivel de significación del 5%.

EMPLEAREMOS EL DCA
1. Formular las hipótesis.

H 0 : μ 1=μ2=μ3=μ 4
H1 : ¿

H 0 La sucursal del banco no afecta a El monto del depósito, en miles de soles.

H 1 La sucursal del banco SI afecta a El monto del depósito, en miles de soles. (se optará por un
programa de promociones distinto para cada una)

2. Establecer el nivel de significación: ¿ 0,05

3. Calcular el valor del estadístico de prueba.


Los cálculos para obtener las sumas de cuadrados son:

k=4 7 2

y 2..
TC= =
( ∑ ∑ y ij
i=1 j=1
) =
( 27,3+23,8+25,8+23,1 )2 1002
= =357,1429
k=4
n 7+7+ 7+7 28
∑ ni
i=1

La suma de cuadrados total es:

k=4
y 2..
7
S CT=∑ ∑ y − =( 5,32 +2,62 +…+ 4,12 )−357,1429=27,0171
2
ij
i=1 j=1 n.

La suma de cuadrados de los tratamientos es:

k=4
y 2i . y 2.. 27,3 2 23,8 2 25,8 2 23,1 2
SCTR=∑
i=1 ni n.
− =
7( +
7
+
7
+
7 )
−357,1429=1,568

La suma de cuadrados de los errores es:

SCE=SCT−SCTR=27,0171−1,568=25,4486
La tabla del análisis de varianza:

Fuente de Grados de libertad Suma de Cuadrados


Fcalculado
variación cuadrados medio
FC
FV GL SC CM
1,569 0,523
Tratamientos k −1=4−1=3 SCTR=1,569 CMTR= FC =
=0,523 =0,49
3 1,060
25,449
Error n−k =28−4=24 SCE=25,449 CME= =1,060
24
Total n−1=28−1=27 SCT=27,017

El valor del estadístico de prueba es:


F calculado=0,49

4. Establecer la región crítica.

Esta es una prueba unilateral izquierda.

El valor crítico es:

F critico=F ;gl tratamientos ;gl error =F ¿ ¿

F critico=F ¿¿

v1
α
v2 1 2 3 4 5 6 7 8 9 10
       
0.050 24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30 2.25
0.025   5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78 2.70 2.64
0.010   7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26 3.17
0.005   9.55 6.66 5.52 4.89 4.49 4.20 3.99 3.83 3.69 3.59

5. Aplicar los criterios de decisión.


no se rechaza H . 0

6. Realizar la conclusión.

A un nivel de significación del 5%, NO RH0, es decir NO existe suficiente evidencia estadística
para afirmar que se optará por un programa de promociones distinto para cada una

A VS B
A VS C
A VS D
B VS C
B VS D
C VS D

También podría gustarte