Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Introduccin
Hasta ahora se ha visto el modelo de anlisis de la varianza con un factor que es una
variable cualitativa cuyas categoras sirven para clasificar las medidas de otra variable
cuantitativa en grupos cuyas medias se desea comparar. As, podremos comparar el peso
medio de aves agrupndolas por especies, la variable de clasificacin o factor es la
especie y la variable dependiente es el peso.
En el tema actual se ampliar el modelo para incluir dos factores en lugar de uno solo.
Por ejemplo, cuando se pretenda comparar el peso medio de aves agrupndolas por
especie y por sexo.
La inclusin de un factor ms no es trivial, el problema de la comparacin de las medias
de grupos inducidos por dos factores cua litativos no se resuelve por la simple
ampliacin del modelo de un factor a uno ms, pues es posible que ambos factores sean
fijos (Modelo I), ambos aleatorios (Modelo II) o uno fijo y otro aleatorio (Modelo III),
pero adems es posible que ambos factores acten de modo independiente o que la
accin combinada de ambos factores potencie o inhiba la accin de cada uno por
separado, en este segundo caso diremos que existe interaccin, por lo que podremos
hablar de modelo con o sin interaccin. Tambin es posib le que el diseo sea
equilibrado (todos los grupos son representados con un nmero igual de medidas) o que
no lo sea. Una ltima posibilidad es que todas las categoras de un factor puedan ser
combinadas con todas las del otro factor, entonces hablaremos de un diseo cruzado,
(que en el caso de incluir interaccin se denomina modelo factorial), o que las
categoras de uno de los factores solamente puedan aparecer para determinados niveles
del otro, en este caso decimos que el primer nivel est jerarquizado en el segundo o que
el diseo es jerarquizado. En resumen, un anlisis de la varianza de dos factores puede
ser:
Segn el tipo de factores
De factores fijos
De factores aleatorios
Mixto
Con interaccin
Sin interaccin
ABij = 0 .
Sea cual sea el carcter de los factores, se considera que los trminos ij son todos
variables aleatorias Normales e incorreladas, de media cero y varianza 2 igual para
todos los grupos.
El contraste de anlisis de la varianza se plantea como:
H0 : todos los Ai , los Bj y los ABij son cero.
H1 : alguno de ellos no es cero.
La hiptesis nula supone que si todos los efectos de todos los niveles de los factores son
nulos, todas las medias de todos los grupos considerados son iguales entre s e iguales a
la media general y no hay interaccin.
Para resolver el contraste se toma una muestra aleatoria de cada una de las
combinaciones de categoras de los factores considerados, si el diseo es equilibrado
todas estas muestras son de igual tamao n, por lo tanto, como se dijo al principio, si A
tiene t niveles, B tiene r niveles y si el diseo es cruzado tendremos tr clases en total, si
adems es equilibrado, con n observaciones en cada clase, el nmero total de
observaciones es N = trn = n
Finalmente, se estima el modelo con las observaciones obtenidas y sus correspondientes
medias:
xijk = x + ai + b j + abij + eijk , siendo:
x ijk la k-sima (k toma valores entre 1 y n) observacin correspondiente al nivel i- simo
(i entre 1 y t) del factor A y el j-simo (j entre 1 y r) nivel del factor B.
x es la media de todos los datos considerados como una sola muestra.
ai = xi x la estimacin del efecto del nivel i- simo del factor A, con xi la media
de todos los datos incluidos dentro del nivel i-simo del factor (rn datos).
bi = x j x la estimacin del efecto del nivel j-simo del factor B, con x j la media
de todos los datos incluidos dentro del nivel j-simo del factor (tn datos).
abij = xij xi x j + x , con xij la media de todos los datos medidos para la
combinacin ij de los niveles de los factores.
eijk = x ijk x ij los residuos o diferencias de cada observacin a la media de los datos
correspondientes a la combinacin ij de los factores.
Pasando al primer miembro el trmino x , elevando al cuadrado y sumando, teniendo
en cuenta que todos los dobles productos se anulan al sumar, queda:
( xijk x )
= ( xi x ) + ( x j x ) + ( xij xi x j + x ) + ( xijk x )
2
Ai2
SCA
E(MCA) = E
= 2 + rn i
t 1
t 1
Bi2
SCB
j
E(MCB) = E
= 2 + tn
r 1
r 1
ABij2
SCAB
2
i
E(MCAB) = E
= + n
( t 1) ( r 1)
( t 1)( r 1)
SCE
E(MCE) = E
= 2
N tr
Por lo tanto, si es cierto H0 , todas las medias de cuadrados estiman la misma cantidad,
la varianza de comn 2 , mientras que si alguno de los niveles de algn factor o la
interaccin no son nulos, su media de cuadrados ser mayor que la media de cuadrados
del error, el contraste, que se resuelve de modo unilateral, termina por comparar el
cociente entre cada media de cuadrados y la media de cuadrados del error con el cuantil
correspondiente de la distribucin F de Snedecor con los grados de libertad respectivos
del numerador y del denominador. Se resume todo en una tabla como la siguiente:
Fuente de Grados
variacin de
libertad
Factor A
t-1
Factor B
rt-1
Interaccin (t-1)(r-1)
AB
Error
N-tr
Suma de cuadrados
SCA =
SCB =
Media
de Esperanza M. C.
cuadrados
2
1
x
2
x
i N
rn i
SCA
t 1
+ rn
2
x
SCB
r 1
+ tn
1
x2 j N
tn i
2
x
1
SCAB = xij2 SCA SCB
n ij
N
2
SCE = xijk
ijk
1
xij2
n ij
SCAB
( t 1) ( r 1) 2 + n
SCE
N tr
Ai2
i
t 1
B 2j
j
r 1
ABij2
i
( t 1 )(r 1 )
Fexp
SCA
SCE
SCB
SCE
SCAB
SCE
En las frmulas de la anterior tabla, las equis cuyos subndices han sido sustituidos por puntos indican la suma de todo los valores de la variable
dependiente correspondientes a los subndices sustituidos. Los sumatorios con ms de un subndice indican dobles o triples sumatorios para todos
los posibles valores de los subndices.
t 1
SCB
2
2
2
E(MCB) = E
= + n AB + tn B
r
SCAB
2
2
E(MCAB) = E
= + n AB
( t 1) ( r 1)
SCE
E(MCE) = E
= 2
N tr
Por tanto, si hay interaccin pero los factores de modo individual no tienen influencia,
las medias de cuadrados de los factores son mayores que la media de cuadrados del
error, pero sern aproximadamente iguales que la media de cuadrados de la interaccin.
Si la interaccin no afecta, su media de cuadrados ser parecida a la media de cuadrados
del error. As, para realizar el contraste sobre los factores, se calculan los cocientes de
sus medias de cuadrados entre la media de cuadrados de la interaccin y se comparan
con una F de Snedecor con los grados de libertad correspondientes, mientras que para
realizar el contraste sobre la interaccin se divide su media de cuadrados entre la del
error y se compara con la adecuada F de Snedecor.
Anlisis de la varianza de dos factores cruzados. Modelo mixto equilibrado.
Sin prdida de generalidad, supondremos que el factor A es el fijo, mientras que el B es
aleatorio.
Ahora, los efectos de A son constantes de suma nula, mientras que los de B y la
interaccin son variables aleatorias de media cero y varianzas respectivas B2 y 2AB ,
igual para todos los niveles. Por su parte, el error es una variable aleatoria Normal,
independiente de las anteriores, de media cero y varianza 2 igual para todas las
combinaciones de niveles.
El contraste se plantear:
H0 : Los Ai son todos nulos. Las varianzas del factor B y de la interaccin, tambin.
H1 : Alguna de ellas no lo es.
Se resuelve planteando un modelo igual que el que ya visto, con idntica
descomposicin en suma de cuadrados y grados de libertad, pero nuevamente, las
esperanzas de las medias de cuadrados son distintas, ahora son:
Ai2
SCA
2
2
i
E(MCA) = E
= + n AB + rn t 1
t
SCB
= 2 + tn 2
E(MCB) = E
B
r 1
SCAB
2
2
E(MCAB) = E
= + n AB
( t 1) ( r 1)
SCE
2
E(MCE) = E
=
N
tr
Ahora, la media de cuadrados del factor fijo A se comparar con la media de cuadrados
de la interaccin, mientras que la media de cuadrados del factor aleatorio y la de la
interaccin se han de comparar con la media de cuadrados del error.
La tabla siguiente resume todos los casos:
Factor B
rt-1
Interaccin
AB
(t-1)(r-1)
Error
N-tr
Suma de cuadrados
SCA =
SCB =
Media
de
cuadrados
2
x
1
2
x
i N
rn i
SCA
t 1
2
x
x
1
SCAB = xij2 SCA SCB
n ij
N
ijk
1
xij2
n ij
+ rn
2
SCAB
( t 1 )(r 1 )
SCE
N tr
Aleatorio
Ai2
i
t 1
SCB
r 1
1
x2j N
tn i
2
SCE = xijk
Fijo
+ tn
2
+n
2
B 2j
r 1
ABij2
i
( t 1 )(r 1 )
2
+ n 2AB
+ rn 2A
Fexp
Mixto (A es Fijo)
+ n
2
2
AB
+ rn
Ai2
2 + n 2AB + tn B2
2 + tn B2
2
2 + n AB
2
2 + n AB
t 1
Fijo
Aleatorio
SCA
SCE
SCA
SCAB
SCB
SCE
SCB
SCAB
SCAB
SCE
SCAB
SCE
Mixto
SCA
SCAB
SCB
SCE
SCAB
SCE