Está en la página 1de 37

Analyse de la variance : ANOVA un facteur

Sir Ronald Fischer 1890-1962

Thmes
Le modle linaire gnral Les postulats de base La logique de lanalyse de la variance Exemples Les tests post-hocs La taille deffet

Le modle gnral linaire


Xij = + Ej + eij
Exemple: la taille moyenne des hommes est 68 et la taille moyenne des femmes est 65 La taille dun homme sera donc: 66.5 + 1.5 + e et la taille dune femme: 66.5 - 1.5 + e
Xij - la valeur observe pour le sujet i du groupe j - la grande moyenne Ej - linfluence du traitement sur le groupe j (Ej = j - ) eij - lerreur ou les rsidus selon les postulats - sont distribus de manire normale avec une moyenne de = 0 et un cart-type de W.

Rpartition des variances


xij = + Ej + eij avec : X Ej :

X

eij : xij  X j Donc:

xij ! X  X j  X  xij  X j

Les sommes des carrs

ij

X
ij

! X
2 2 j

X
j

 x
2

ij

 Xj
ij

x
x

X

! X
! n X
j

X

 x
2

 X j

ij

X

 X  x ij  X j

SCtotal ! SCeffect  SCerreur

Les postulats de base


1. Le modle gnral sapplique aux donnes 2. Les valeurs sont distribues normalement dans la population 3. Les chantillons ont des variances homognes 4. Les chantillons sont indpendants

La logique de lANOVA
chantillon Population Moyenne A B C D Variance W I2 W I2 W I2 W I2

a b c d

A B C D

La logique de lANOVA (suite)


Les variances des diffrents chantillons sont donc gales et elles sont gales la variance de la population Wp. W1 = W2 = ... = Wij = Wp avec W1 = s1 =
xi1  X1
n1  1
2

Nous pouvons donc estimer la variance de la population partir de la moyenne des variances des chantillons ou bien:

ij

 X

NJ

Selon le thorme des limites centrales: la distribution dchantillonnage a une moyenne de et une variance de W2 /n
si lhypothse nulle est vraie il suit donc que: 2  X j  X  ! W 2 ! W 2p 2 E s x ! E  x  n J 1  

pour lestim de Wp 2 il faut multiplier par n

n j Xj  X

J 1

Exemple
Afin de tester lhypothse que la consommation de cafine facilite lapprentissage trois groupes dtudiants se prparent un examen: le groupe 1 boit une tasse, le groupe 2 boit 2 tasses et le groupe 3 boit 3 tasses de caf. Voici leurs scores lexamen:
Groupe 1 50 42 53 45 55 m = 49 Groupe 2 48 47 65 59 51 m = 56 Groupe 3 57 59 48 46 45 m = 51

Exemple suite
70 60

50

40

30 0 1 2 Groupe 3 4

Sommes des carrs moyens


Intra-groupe:

ij

 X j

NJ

50  49 2  42  49 2  ...  46  51 2  45  51 2 !
15  3 ! 1 49  ...  25  36 468 ! ! 39 12 12

x ij  X j
NJ

Inter-groupe:
n Xj  X

J 1

! 5 49  52  5 56  52  5 51 52
2 2

31

5 9  16  1 ! 65 2

Calcul de F

SCMint er 65 F! ! ! 1.667 SCMint ra 39

Valeur critique pour 2,12 df et E = .05 -> 3.89

Exemple 2
Groupe 1 47 53 49 50 46 m = 49 Groupe 2 55 54 58 61 52 m = 56 Groupe 3 54 50 51 51 49 m = 51

Suite
65 60

55

50

45

40

35

30 0 1 2 Groupe 3 4

Sommes des carrs moyens


Intra-groupe:

ij

 X j

NJ

! !

47  49 2  53  49 2  ...  51  51 2  49  51 2
15  3 4  16  ...  0  4 94 ! ! 7.83 12 12

x ij  X j
NJ

Inter-groupe:
n Xj  X

J 1

! 5 49  52  5 56  52  5 51 52
2 2

31

5 9  16  1 ! 65 2

Calcul de F

SCMint er 65 F! ! ! 8.3 SCMint ra 7.83

Valeur critique pour 2,12 df et E = .05 -> 3.89

Tableau ANOVA
Source Intergroup Intragroup Total SC 130 94 224 df 2 12 14 SCM 65 7.84 F 8.3 p .005

Rsum
La variance intra-groupe (la somme moyenne des carts carrs entre chaque observation et la moyenne du groupe) est un estim de la variance de la population. Quand lhypothse nulle est vraie - et seulement dans ce cas - la variance inter-groupe (la somme moyenne des carts carrs entre chaque moyenne de groupe et la grande moyenne) est, selon le thorme des limites centrales, aussi un estim de la variance de la population Quand il y a un effet de traitement, donc quand lhypothse nulle est fausse, la variance inter-groupe est plus large que la variance intragroupe Lanalyse de la variance consiste calculer le rapport entre la variance inter-groupe et la variance intra-groupe et de comparer le rsultat avec une distribution dchantillonnage connue: la distribution F.

Les tests post-hocs

Erreurs
Erreur (ou E) par comparaison - le niveau E choisi pour une seule comparaison de moyennes Erreur par famille - le nombre moyen des erreurs faites par famille de comparaisons E e 1- (1-E)c e CE Exemple: E = .01 et C = 5

E = .049 ou approx. .05

Contraste
Dfinition: Une comparaison de J moyennes telle que la diffrence entre deux des J moyennes ou la diffrence entre une moyenne et la moyenne de deux autres moyennes
=!c1Q1c2Q2cjQj!7cjQj

Excursion - Orthogonalit
Une comparaison est orthogonale si: 7 (c1jc2j)/nj= 0 Exemple: jth moyenne 1 2 3 4 C 1: 1 -1 0 0 C2: 1 0 -1 0 C3: 0 0 1 -1 1 vs 2: 7 c1jc2j =(1)(1) + (-1)(0) + (0)(-1) + (0)(0) = 1 1 vs 3: 7 c1jc2j =(1)(0) + (-1)(0) + (0)(1) + (0)(-1) = 0

    

Tukeys-HSD
HSD ! q k ,df ,E SCMintra n

(John Tukey, 1915-2000)

1: 49 3: 51 2: 56

1 49 -

3 51 2 -

2 56 7 5 -

7.83 HSD ! 3.77 ! 4.72 5

La taille deffet

Taille de leffet
La corrlation entre la VI et la VD (r) Le pourcentage de la variance de la VD expliqu par la VI (r2) La diffrence entre deux moyennes en units dcart-type (d)

Taille deffet: eta2 et omega2


F y dfeffet SCeffet L ! ! F y dfeffet  dferreur SCtotal
2

SStreat  k  1 MSerreur [ ! SStotal  MSerreur


2

L2 f ! 2 1L
Tre a tm e n t O u tcom e Alive Tre a tm ent Con trol 66 34 100 D ead 34 66 100 100 100

Les tailles

Puissance
La probabilit de trouver un effet de taille x dans un chantillon de taille N en utilisant un test statistique avec un E donn.
0.09 0.08 0.07

0.06

0.05

0.04

Fcrit = 2.58

0.03

0.02

0.01

0 0 2 4 6 8 Value of F 10 12 14 16 18

Les erreurs

Taille deffet et beta

Variance et beta

Calcul de puissance

Calcul de puissance

http://members.aol.com/johnp71/ javastat.html#Power

También podría gustarte