Está en la página 1de 8

Anlisis de la varianza con dos factores.

Introduccin
Hasta ahora se ha visto el modelo de anlisis de la varianza con un factor que es una
variable cualitativa cuyas categoras sirven para clasificar las medidas de otra variable
cuantitativa en grupos cuyas medias se desea comparar. As, podremos comparar el peso
medio de aves agrupndolas por especies, la variable de clasificacin o factor es la
especie y la variable dependiente es el peso.
En el tema actual se ampliar el modelo para incluir dos factores en lugar de uno solo.
Por ejemplo, cuando se pretenda comparar el peso medio de aves agrupndolas por
especie y por sexo.
La inclusin de un factor ms no es trivial, el problema de la comparacin de las medias
de grupos inducidos por dos factores cua litativos no se resuelve por la simple
ampliacin del modelo de un factor a uno ms, pues es posible que ambos factores sean
fijos (Modelo I), ambos aleatorios (Modelo II) o uno fijo y otro aleatorio (Modelo III),
pero adems es posible que ambos factores acten de modo independiente o que la
accin combinada de ambos factores potencie o inhiba la accin de cada uno por
separado, en este segundo caso diremos que existe interaccin, por lo que podremos
hablar de modelo con o sin interaccin. Tambin es posib le que el diseo sea
equilibrado (todos los grupos son representados con un nmero igual de medidas) o que
no lo sea. Una ltima posibilidad es que todas las categoras de un factor puedan ser
combinadas con todas las del otro factor, entonces hablaremos de un diseo cruzado,
(que en el caso de incluir interaccin se denomina modelo factorial), o que las
categoras de uno de los factores solamente puedan aparecer para determinados niveles
del otro, en este caso decimos que el primer nivel est jerarquizado en el segundo o que
el diseo es jerarquizado. En resumen, un anlisis de la varianza de dos factores puede
ser:
Segn el tipo de factores

De factores fijos
De factores aleatorios
Mixto

Segn la interferencia entre los factores

Con interaccin
Sin interaccin

Segn el nmero de observaciones en Equilibrado


cada categora
No equilibrado
Segn las posibles combinaciones de Cruzado
niveles de ambos factores
Jerarquizado
Por supuesto, cada una de estas clasificaciones se puede combinar con cualquiera de las
otras, as podremos encontrar, por ejemplo, un anlisis de la varianza de dos factores
fijos, con interaccin, equilibrado y cruzado.
En el caso del diseo jerarquizado no es posible determinar (al menos por los mtodos
convencionales) el efecto de la interaccin de ambos factores.

Modelo de anlisis de la varianza con dos factores.


En lo que sigue y salvo que se indique lo contrario, trataremos siempre con modelos
equilibrados.
Sean dos factores, que denominaremos A, con t niveles y B, con r niveles, si el diseo
es cruzado tendremos tr clases en total, si adems es equilibrado, con n observaciones
en cada clase, el nmero total de observaciones es N = trn.
El modelo de anlisis de la varianza con dos factores sin interaccin se puede escribir
como:
X ij = + Ai + Bj + ij
Donde Xij es una variable aleatoria que representa al conjunto de valores posibles de la
variable dependiente correspondiente al nivel i-simo del factor A y al nivel j-simo del
factor B, es la media general, Ai es el efecto aditivo que sobre esa media produce el
nivel i- simo del factor A, Bj el correspondiente al nivel j-simo del factor B y ij es el
error o residuo del modelo.
Los distintos elementos que componen el modelo se definen como:
Ai = i , siendo i la media poblacional del nivel i-simo del factor A, sin
considerar el factor B.
B j = j siendo j la media poblacional del nivel j-simo del factor B, sin
considerar el factor A.
ij = X ij i j +
En el caso de que se considere la interaccin, el modelo se formula como:
X ijk = + Ai + B j + ABij + ij
Donde ABij es el efecto de la combinacin del nivel i- simo del factor A con el j-simo
del factor B no contemplado por dichos niveles individualmente. En este caso, si
definimos ij = + Ai+ Bj+ ABij como la media total correspondiente a los niveles isimo de A y j-simo de B, el modelo se puede expresar como:
X ijk = ij + ij , con lo que el residuo es
ij = X ij ij , y la interaccin:
ABij = Xij Ai Bj ij = ij i j +
Vemos que el modelo sin interaccin est incluido en el modelo con interaccin, sin
ms que considerar en este ltimo caso que ABij es cero, por ello, en lo que sigue se
considera siempre modelo con interaccin, procediendo a anular dicho trmino en el
caso de que no lo haya.

Anlisis de la varianza de dos factores fijos cruzados.


Cuando los factores son fijos, los distintos niveles de cada uno de ellos son todos los
posibles (o todos los que interesa estudiar), en ese caso cada uno de los trminos Ai Bj
ABij son constantes, verificndose adems que Ai= 0, Bj =0, ABij = 0 y que

ABij = 0 .

Sea cual sea el carcter de los factores, se considera que los trminos ij son todos
variables aleatorias Normales e incorreladas, de media cero y varianza 2 igual para
todos los grupos.
El contraste de anlisis de la varianza se plantea como:
H0 : todos los Ai , los Bj y los ABij son cero.
H1 : alguno de ellos no es cero.
La hiptesis nula supone que si todos los efectos de todos los niveles de los factores son
nulos, todas las medias de todos los grupos considerados son iguales entre s e iguales a
la media general y no hay interaccin.
Para resolver el contraste se toma una muestra aleatoria de cada una de las
combinaciones de categoras de los factores considerados, si el diseo es equilibrado
todas estas muestras son de igual tamao n, por lo tanto, como se dijo al principio, si A
tiene t niveles, B tiene r niveles y si el diseo es cruzado tendremos tr clases en total, si
adems es equilibrado, con n observaciones en cada clase, el nmero total de
observaciones es N = trn = n
Finalmente, se estima el modelo con las observaciones obtenidas y sus correspondientes
medias:
xijk = x + ai + b j + abij + eijk , siendo:
x ijk la k-sima (k toma valores entre 1 y n) observacin correspondiente al nivel i- simo
(i entre 1 y t) del factor A y el j-simo (j entre 1 y r) nivel del factor B.
x es la media de todos los datos considerados como una sola muestra.
ai = xi x la estimacin del efecto del nivel i- simo del factor A, con xi la media
de todos los datos incluidos dentro del nivel i-simo del factor (rn datos).
bi = x j x la estimacin del efecto del nivel j-simo del factor B, con x j la media
de todos los datos incluidos dentro del nivel j-simo del factor (tn datos).
abij = xij xi x j + x , con xij la media de todos los datos medidos para la
combinacin ij de los niveles de los factores.
eijk = x ijk x ij los residuos o diferencias de cada observacin a la media de los datos
correspondientes a la combinacin ij de los factores.
Pasando al primer miembro el trmino x , elevando al cuadrado y sumando, teniendo
en cuenta que todos los dobles productos se anulan al sumar, queda:

( xijk x )

= ( xi x ) + ( x j x ) + ( xij xi x j + x ) + ( xijk x )
2

Que es la expresin para dos factores del teorema de descomposicin de la varianza.


Los grados de libertad de cada uno de los sumandos son:
N-1 = trn-1 para la suma de cuadrados total
t-1 para la suma de cuadrados de A
r-1 para la suma de cuadrados de B
(t-1)(r-1) para la suma de cuadrados de la interaccin.
N-tr = tr(n-1) para la suma de cuadrados del error.
Abreviadamente, este teorema se expresa:
SC = SCA + SCB + SCAB + SCE
Adems cada uno de los trminos es una variable aleatoria Chi cuadrado con sus
respectivos grados de libertad e independientes entre s.
El paso siguiente es determinar la media de cuadrados, dividiendo cada suma de
cuadrados entre sus correspondientes grados de libertad. La esperanza matemtica de
cada una de las medias de cuadrados son las siguientes.

Ai2

SCA
E(MCA) = E
= 2 + rn i

t 1
t 1
Bi2

SCB
j
E(MCB) = E
= 2 + tn

r 1
r 1

ABij2
SCAB
2
i
E(MCAB) = E
= + n
( t 1) ( r 1)
( t 1)( r 1)
SCE
E(MCE) = E
= 2

N tr
Por lo tanto, si es cierto H0 , todas las medias de cuadrados estiman la misma cantidad,
la varianza de comn 2 , mientras que si alguno de los niveles de algn factor o la
interaccin no son nulos, su media de cuadrados ser mayor que la media de cuadrados
del error, el contraste, que se resuelve de modo unilateral, termina por comparar el
cociente entre cada media de cuadrados y la media de cuadrados del error con el cuantil
correspondiente de la distribucin F de Snedecor con los grados de libertad respectivos
del numerador y del denominador. Se resume todo en una tabla como la siguiente:

Fuente de Grados
variacin de
libertad
Factor A
t-1

Factor B

rt-1

Interaccin (t-1)(r-1)
AB
Error

N-tr

Suma de cuadrados

SCA =
SCB =

Media
de Esperanza M. C.
cuadrados

2
1
x
2
x

i N
rn i

SCA
t 1

+ rn

2
x

SCB
r 1

+ tn

1
x2 j N
tn i

2
x

1
SCAB = xij2 SCA SCB
n ij
N
2
SCE = xijk

ijk

1
xij2

n ij

SCAB
( t 1) ( r 1) 2 + n
SCE
N tr

Ai2
i

t 1
B 2j
j

r 1

ABij2
i

( t 1 )(r 1 )

Fexp

SCA
SCE
SCB
SCE
SCAB
SCE

En las frmulas de la anterior tabla, las equis cuyos subndices han sido sustituidos por puntos indican la suma de todo los valores de la variable
dependiente correspondientes a los subndices sustituidos. Los sumatorios con ms de un subndice indican dobles o triples sumatorios para todos
los posibles valores de los subndices.

Anlisis de la varianza de dos factores aleatorios con interaccin. Diseo cruzado y


equilibrado.
En este caso, los niveles de los factores A y B, y por tanto los de su interaccin son una
muestra aleatoria de todos los niveles posibles de ambos factores, que se consideran
infinitos. En este caso, los efectos producidos por dichos niveles son variables aleatorias
Normales, independientes, de media cero y varianzas respectivas 2A , B2 , 2AB , igual
para todos los niveles. Por su parte, el error es una variable aleatoria Normal,
independiente de las anteriores, de media cero y varianza 2 igual para todas las
combinaciones de niveles.
El contraste a realizar es:
H0 : Las varianzas de los factores y la interaccin son nulas.
H1 : Alguna de ellas no lo es.
La hiptesis nula supone que todos los factores son constantes y no inducen variabilidad
en la variable dependiente, por lo que las medias de todas las combinaciones de factores
han de ser iguales.
el planteamiento del modelo es idntico al de dos factores fijos, y la descomposic in en
sumas de cuadrados tambin, pero la esperanza de las media de cuadrados ya no son
iguales, por lo que las F experimentales no se calculan del mismo modo. Los resultados
son los siguientes:
SCA
E(MCA) = E
= 2 + n 2AB + rn 2A

t 1
SCB
2
2
2
E(MCB) = E
= + n AB + tn B
r

SCAB
2
2
E(MCAB) = E
= + n AB
( t 1) ( r 1)
SCE
E(MCE) = E
= 2

N tr
Por tanto, si hay interaccin pero los factores de modo individual no tienen influencia,
las medias de cuadrados de los factores son mayores que la media de cuadrados del
error, pero sern aproximadamente iguales que la media de cuadrados de la interaccin.
Si la interaccin no afecta, su media de cuadrados ser parecida a la media de cuadrados
del error. As, para realizar el contraste sobre los factores, se calculan los cocientes de
sus medias de cuadrados entre la media de cuadrados de la interaccin y se comparan
con una F de Snedecor con los grados de libertad correspondientes, mientras que para
realizar el contraste sobre la interaccin se divide su media de cuadrados entre la del
error y se compara con la adecuada F de Snedecor.
Anlisis de la varianza de dos factores cruzados. Modelo mixto equilibrado.
Sin prdida de generalidad, supondremos que el factor A es el fijo, mientras que el B es
aleatorio.

Ahora, los efectos de A son constantes de suma nula, mientras que los de B y la
interaccin son variables aleatorias de media cero y varianzas respectivas B2 y 2AB ,
igual para todos los niveles. Por su parte, el error es una variable aleatoria Normal,
independiente de las anteriores, de media cero y varianza 2 igual para todas las
combinaciones de niveles.
El contraste se plantear:
H0 : Los Ai son todos nulos. Las varianzas del factor B y de la interaccin, tambin.
H1 : Alguna de ellas no lo es.
Se resuelve planteando un modelo igual que el que ya visto, con idntica
descomposicin en suma de cuadrados y grados de libertad, pero nuevamente, las
esperanzas de las medias de cuadrados son distintas, ahora son:

Ai2

SCA
2
2
i
E(MCA) = E
= + n AB + rn t 1
t

SCB
= 2 + tn 2
E(MCB) = E
B

r 1
SCAB
2
2
E(MCAB) = E
= + n AB
( t 1) ( r 1)
SCE
2
E(MCE) = E
=
N

tr

Ahora, la media de cuadrados del factor fijo A se comparar con la media de cuadrados
de la interaccin, mientras que la media de cuadrados del factor aleatorio y la de la
interaccin se han de comparar con la media de cuadrados del error.
La tabla siguiente resume todos los casos:

Esperanza Media de Cuadrados


Fuente
de Grados
variacin
de
libertad
Factor A
t-1

Factor B

rt-1

Interaccin
AB

(t-1)(r-1)

Error

N-tr

Suma de cuadrados

SCA =

SCB =

Media
de
cuadrados

2
x
1
2
x

i N
rn i

SCA
t 1

2
x

x
1
SCAB = xij2 SCA SCB
n ij
N

ijk

1
xij2
n ij

+ rn
2

SCAB
( t 1 )(r 1 )
SCE
N tr

Aleatorio

Ai2
i

t 1

SCB
r 1

1
x2j N
tn i

2
SCE = xijk

Fijo

+ tn
2

+n
2

B 2j

r 1
ABij2
i

( t 1 )(r 1 )
2

+ n 2AB

+ rn 2A

Fexp

Mixto (A es Fijo)

+ n
2

2
AB

+ rn

Ai2

2 + n 2AB + tn B2

2 + tn B2

2
2 + n AB

2
2 + n AB

t 1

Fijo

Aleatorio

SCA
SCE

SCA
SCAB

SCB
SCE

SCB
SCAB

SCAB
SCE

SCAB
SCE

Mixto
SCA
SCAB
SCB
SCE
SCAB
SCE

También podría gustarte