Está en la página 1de 13

Anlisis de la varianza.

a
Tcnica de dependencia. e Objetivo: detectar el efecto de ciertas variables explicativas de tipo cualitativo (FACTORES) sobre una o varias variables dependientes cuantitativas (RESPUESTA).

Ejemplo tipo: Para analizar el posible efecto del tipo de fertilizante (A,B,C) sobre cierto cultivo se hicieron pruebas sobre 72 parcelas y se recogi informacin sobre la cosecha (rendimientos en Kg). o o Parcela 1 2 . . . . . . 72 Tipo de fertilizante A A B C . . .

Se quiere saber si el rendimiento medio es el mismo en las parcelas fertilizadas con A,B,C. Factor: Fertilizante. Respuesta: Kg de cosecha. Podemos pensar que las parcelas no son idnticas y decidimos controlar el distinto grado e de humedad en cada parcela, considerando 4 niveles de humedad.

En este caso la variable respuesta sigue siendo el rendimiento (Kg de cosecha) y los factores: el fertilizante (A,B,C) y el nivel de humedad (1,2,3,4). A Humedad 1 Humedad 2 Humedad 3 Humedad 4 La hiptesis que contrastamos en el anlisis de la varianza es una hiptesis de o a o igualdad de medias; pero el procedimiento se basa en la descomposicin de la vario anza. B C

Anlisis de la varianza con 1 factor. a


Modelo matemtico. a Tenemos una v.a. X observada en los distintos niveles de una variable cualitativa o factor. La distribucin de X es: o en la modalidad 1 con n1 observaciones X1 N (1 , 2 ) en la modalidad 2 con n2 observaciones X2 N (2 , 2 ) . . . . . . . . . . . . . . .

en la modalidad k con nk observaciones Xk N (k , 2 ) Datos: 1 X11 X21 . . . . . . Xn1 1 X.1 2 X12 X22 . . . . . . Xn2 2 X.2 i X1i X2i Xji . . . Xni i X.i k X1k X2k Xjk . . . Xnj k X.k

Tratamos de contrastar la hiptesis: o Ho: 1 = 2 = = k

n=

k i=1 ni

X.i =

ni j=1

Xji

ni

X=

ni j=1

k i=1

Xji

Xji X = (Xji X.i ) + (X.i X)

k i=1

ni j=1 (Xji

X)2 =

k i=1

ni j=1 (Xji

X.i )2 +

k i=1

ni j=1 (X.i

X)2

SST = SSW + SSB SCT = SCD + SCE Suma Cuadrados Total= Suma Cuadrados Dentro de Grupos+Suma Cuadrados Entre Grupos.

Cuanto mayor sea

SCE SCD

ms tendencia habr a rechazar la igualdad de medias. a a

SCT 2

SCD 2

SCE 2

2 = 2 + 2 n1 nk k1

SCE/k1 SCD/nk

2 /k1 k1 2 /nk nk

Fk1,nk

Cuanto menor sea el cociente, ms veros a mil es la hiptesis de igualdad de medias. o

Tabla de ANOVA.

Variacin o Entre grupos Dentro grupos Total

g.l. k-1 n-k n-1

Suma cuadrados SCE SCD SCT

Cuadrados Medios SCE/k 1 SCD/n k

F
SCE/k1 SCD/nk

Una vez que hemos rechazado la igualdad de medias, nos preguntamos si todas las medias son distintas entre si o si es posible aceptar hiptesis parciales. o

Contrastes tipo Sche. e Ho: L =


k i=1 Ci i

= 0 con

k i=1 Ci

=0

Ello nos permite contrastar hiptesis del tipo: o

Ho: i = j Ho: i =
j +k 2

Para ello construimos L = C1 X.1 + C2 X.2 + + Ck X.k


2 Como cada X.i N (i , i ) n

E(L) = C1 1 + C2 2 + + Ck k
2 2 2 2 2 2 V ar(L) = C1 n1 + C2 n2 + + Ck nk

Como 2 es desconocido se aproxima por

SCD nk

Se puede comprobar que el I.C. para L es:

L+

(k 1)Fk1,nk

SCD nk

2 Ci k i=1 ( ni )

Si 0 I.C. Aceptamos la Hiptesis nula: L = 0, o Si 0 I.C. Rechazamos la Hiptesis nula: / o

Ci i = 0

Ci i = 0

Anlisis de la varianza con 2 factores. a


Una observacin por casilla. o Factor A k niveles. Factor B k niveles. nmero de observaciones n = kk u

A B 1 2 . . . j . . . k

1 X11 X21 . . . Xj1 . . . Xk 1 X.1

2 X12 X22 . . . Xj2 . . . Xk 2 X.2

. . . . . .

i X1i X2i . . . Xji . . . Xk i X.i

. . . . . .

k X1k X2k . . . Xjk . . . Xkk X.k X1. X2. . . . Xj. . . . Xk .

X=

k j=1

k i=1

Xji

= media

total.

(Xji X) = (Xji X.i Xj. + X) + (X.i X) + (Xj. X)


k j=1 k j=1 k i=1 (Xji k i=1 (Xj.

X)2 = X)2

k j=1

k i=1 (Xji

X.i Xj. + X)2 +

k j=1

k i=1 (X.i

X)2 +

SCT = SCD + SCEA + SCEB


SCT 2

2 n1 7

SCEA 2

2 k1 2 1 k 2 (k1)(k 1) A : 1 = 2 = = k

SCEB 2

SCDSCR 2

Ho : F ACT OR
SCEA /k1 SCD/(k1)(k 1)

Fk1,(k1)(k 1) B : 1 = 2 = = k Fk 1,(k1)(k 1)

Ho : F ACT OR
SCEB /k 1 SCD/(k1)(k 1)

r observaciones por casilla.

A B 1 2 . . . j . . . k

1 X111 , X211 , Xr11

2 X112 , X212 , X312 , Xr12

k X1. X2. . . . Xj. . . . Xk .

Xhji

X.1

X.2

X.i

X.k

Xhji donde i=modalidad del factor A : i = 1, ..., k. j=modalidad del factor B : j = 1, ..., k . h=nmero de observacin en la casilla: h = 1, ..., r. u o nmero de observaciones n = rkk u X=media total. X.ji =
r h=1

Xhji

Xhji X = (Xhji X.ji ) + (X.ji X) X)2 = X.ji )2 + X)2

i (Xhji

i (Xhji

i (X.ji

(SCT ) = (SCD) + (SC()) 9

(X.ji X) = (X.i X) + (Xj. X) + (X.ji (X.i X) (Xj. X) X) = (X.i X) + (Xj. X) + (X.ji X.i Xj. + X) X))2 = SCEA + SCEB + SCEAB

SC() =

i ((X.ji

Procedimiento de clculo abreviado: a

SCT =

i (Xhji

X)2 =

2 i Xhji

rkk X 2

SCD = SCR =por diferencia

SCEA = rk

k i=1 (X.i

X)2

SCEB = rk

k j=1 (Xj.

X)2

SCEAB = r
k j=1

2 i (X.ji X.i Xj. + X) X)2 SCEA SCEB

2 i (X.ji X) SCEA SCEB

k i=1 (X.ji

SCT 2

2 1 rkk 2 (k1) 2 1) (k 2 (k1)(k 1)

SCEA 2

SCEB 2

SCEAB 2

SCD 2

2 (r1) kk 10

Xhji varia por: estar en i estar en j combinacin ij o por 2 , varianza no explicada. Hiptesis: o Efecto A; Ho : 1 = 2 = = k ;
SCEA /k1 SCD/kk (r1)

Fk1,kk (r1)

Efecto B; Ho : 1 = 2 = = k ;
SCEB /k 1 SCD/kk (r1)

Fk 1,kk (r1)

Efecto interaccin; Ho : 1 = 2 = = k ; o
SCEAB /(k1)(k 1) SCD/kk (r1)

F(k1)(k 1),kk (r1) con = ji (.i ) (j. )

11

Anlisis de la varianza con varias variables dependientes. a


Xvector de variables dependientes. F factor con k niveles. X= X1 X2 . . . Xp X en nivel 1 X en nivel 2 X en nivel k X Np (1 , ) X Np (2 , ) X N (k , )

Hiptesis nula: 1 = 2 = = k o (El vector de medias de (X1 , . . . , Xp ) es el mismo en todos los niveles del factor). Contrastamos la igualdad no de medias sino de vectores de medias. SCPC. TSCPC de todas las observaciones. (X1 X1 )2 (X1 X1 )(X2 X2 ) (X1 X1 )(Xp Xp )2

Sin distincin de grupo de pertenencia. o |T | SCT D1 SCP Cen G1 D2 SCP Cen G2 . . . . . . . . . Dk SCP Cen Gk

D = D1 + + Dk |D| SCD 12

|D| |T |

|D| |T |

Si es grande tenderemos a Aceptar la igualdad de vectores de medias. Si es pequeo tenderemos a Rechazar la igualdad de vectores de medias n =
|D| |T |

p,N K,K1

RELACION ENTRE a,b,c y F.

1a,b,1 a,b,1 11,b,c 1,b,c 1

= =

a ba+1 Fa,ba+1 c b Fc,b

a,b,2 =
a,b,2

a ba+1 F2a,2(ba+1)

2,b,c =
2,b,c

c b1 F2c,2(b1)

Donde a representa el nmero de variables dependientes. u b es igual al tamao total de la muestra menos el nmero de niveles del factor. n u c es el nmero de niveles del factor menos uno. u

Cuanto ms pequeo es (tendemos a rechazar) mayor es F. Cuanto mayor es F tendemos a n a rechazar (como siempre). 13

También podría gustarte