Está en la página 1de 10

Statistik fr Psychologen

5
Einfaktorielle Varianzanalyse

Hans-Rdiger Pfister, Gerd Meier

Experimentelles Design
AV: Fehler

Randomisierung

UV: Musik-Typ

Control

Pop

leise /
laut

UV: Lautstrke

Rock

leise /
laut

Jazz

leise /
laut

Classic

leise /
laut

t1
UV: Zeitpunkt

t2

Hans-Rdiger Pfister, Gerd Meier

Fragestellungen

Beeinflusst die UV (Unabhngige Variable, Faktor, Treatment, Bedingung)


die AV (Abhngige Variable, Response) kausal?
Welche Faktorstufen (treatment levels) sind kausal wirksam?
Existiert ein Trend? (Ordnung ber geordnete Faktorstufen)
Interaktion: Gibt es eine spezifische Wechselwirkung zwischen zwei (oder
mehreren) Faktoren hinsichtlich ihres Effekts auf die AV?
Wie stark ist der kausale Effekt?
Wie gro ist die Wahrscheinlichkeit eines Fehlers 1. Art und 2. Art?

Hans-Rdiger Pfister, Gerd Meier

Beispiel
7
6
error rate

5
4
3
2
1
0
Kontrolle

Popmusik

Klassik

Schlager

Music

error rate

5
4
normal

leise

2
1
0
Kontrolle

mit Musik
Music

Hans-Rdiger Pfister, Gerd Meier

Das Grundmodell der Varianzanalyse


(ANOVA: Analysis Of Variance)

AV: Abhngige Variable


e

AV

UV1

UV2

UV: Unabhngige Variable


e: Fehler (Stichprobenfehler,
Messfehler, andere
interindividuelle Unterschiede,
weitere unbekannte Faktoren)

Hans-Rdiger Pfister, Gerd Meier

Das Grundmodell

X ij = + ( j ) + eij = + j + eij
Xij:

Beobachtung: Messwert einer Person i in Bedingung j

Populationsmittelwert (grand mean) ber alle Bedingungen

j:

Populationsmittelwert in Bedingung j

eij:

Fehler: Abweichung der Person i in Bedingung j vom Mittelwert der


Bedingung j (Xij- j)

j:

Effekt (treatment effect): Abweichung des Mittelwerts in Bedingung j


vom grand mean (j- )

Hans-Rdiger Pfister, Gerd Meier

Visualisierung

eij

(eij)

(Xij)

Xij

Hans-Rdiger Pfister, Gerd Meier

Dekomponierung der Quadratsummen


X ij = + j + eij
X ij = x + ( x j x ) + ( xij x j )
X ij x = ( x j x ) + ( xij x j )
( X ij x ) 2 = (( x j x ) + ( xij x j )) 2

( X
i

x ) 2 = ( x j x ) 2 + ( xij x j ) 2

( X
i

ij

i
ij

x ) 2 =n ( x j x ) 2 + ( xij x j ) 2

SStotal
df = N-1

SStreat
df = k-1

SSerror
df = k(n-1)

Hans-Rdiger Pfister, Gerd Meier

Fehler
Fehler e:
der konkrete Messwert auf der abhngigen Variable einer Person wird durch eine
Vielzahl von Faktoren ko-determiniert, die zusammengefasst den Fehlerterm e
bilden.
die Fehlervarianz (d.h. die Unterschiede zwischen Personen, die nicht durch die
systematischen experimentellen Faktoren erklrt werden knnen =
Zufallsfluktuationen) in der Population wird bezeichnet durch 2e.
die Fehlervarianz in der Stichprobe in Bedingung j wird als Differenz zwischen dem
Bedingungsmittelwert und den Beobachtungen berechnet werden: eij = xij - j, und
dient als Schtzer der Populationsvarianz.
Annahmen fr Inferenzstatistische Tests:
Varianzhomogenitt: 21 = 22 = ... 2j = ... 2e
Normalverteilung: N(0, 2e)
Unabhngigkeit: Fehler sind ber die Bedingung nicht korreliert (->
Randomisierung)

Hans-Rdiger Pfister, Gerd Meier

Treatment
Treatment :
Falls ein Treatment j einen kausalen Effekt auf die AV hat,
wird der Wert der AV um eine Konstante j erhht oder
vermindert (treatment effect, causal effect).
Der Treatment Effekt bezeichnet die relative Abweichung in
Bedingung j vom grand mean: j = j - .
Der Treatment Effekt ist mit dem Fehler e unkorreliert.
In einem balancierten Design sind die Treatments
untereinander unabhngig (nicht korreliert).

Hans-Rdiger Pfister, Gerd Meier

Ein Gedankenexperiment
Gleiche Population,
kein Fehler

Gleiche Population,
mit Fehler

4 Treatments

X-Wert

Unterschiedliche Populationen,
kein Fehler

Unterschiedliche
Populationen, mit Fehler

aus Oestermeyer, Barquero, Pltzner (in Vorb.). Anschauliche Varianzanalyse.

Hans-Rdiger Pfister, Gerd Meier

Beispiel: Howell (p. 321, Table 11.1)

number words recalled

20

15

10

counting

rhyming

adjective

imagery

intentional

experimental condition

Hans-Rdiger Pfister, Gerd Meier

Statistische Hypothesen
Nullhypothese H0:
Die Stichproben unter allen k Treatments stammen aus der gleichen Population: die
Populationsmittelwerte sind fr alle Stichproben identisch

H0: 1 = 2 = ... = j ... = k


Alternativhypothese H1:
Die Stichproben unter allen K Treatments stammen nicht alle aus der gleichen
Population: Es existiert mindestens ein Stichprobenpaar mit unterschiedlichen
Populationsmittelwerten

H1: ij: i j

Hans-Rdiger Pfister, Gerd Meier

Mean Squares (MS)


Die Mean Squares (MS, Varianzschtzung) erhlt man, indem man die Sum of Squares
(SS, Summe der Abweichungsquadrate) durch die jeweiligen Freiheitsgrade df
dividiert (N = kn: Gesamtstichprobe; n: Stichprobengre einer Bedingung; K: Anzahl
Bedingungen):

SStotal
N 1
SS error
MS error =
K (n 1)
SS
MStreatment = treatment
K 1
MStotal =

Whrend sich die Quadratsummen (SS) additiv verhalten (Total = Treatment + Error),
verhalten sich die Mean Squares (MS) nicht additiv!

Hans-Rdiger Pfister, Gerd Meier

Die Logik des Signifikanztest in der ANOVA


(A) Schtzung der Populationsvarianz durch MSerror (Mean
Square Error, MSwithin):
Da die Varianz innerhalb jeder Bedingung (treatment) durch den
Treatment Effekt nicht verndert wird (j ist konstant), kann die
Populationsvarianz durch die gepoolte (gemittelte) Varianz der K
Stichproben geschtzt werden. Diese Schtzung ist unabhngig
von der Wahrheit bzw. Falschheit von H0 oder H1.

s 2j

j =1

=
2
e

= MS error

(B) Schtzung der Populationsvarianz durch MStreatment


(Mean Square Treatment, MSbetween):
Angenommen H0 sei wahr. Dann folgt, dass alle Stichproben
(Treatment level) aus der gleichen Population stammen, und dass
deshalb ihre Mittelwerte nach dem zentralen Grenzwerttheorem
normal verteilt sind mit Varianz /n (vgl. Standardfehler des
Mittelwerts).
Dies gilt aber nur unter der H0!!

s =
2
x

e2

n
e2 = n sx2 = MStreat

Hans-Rdiger Pfister, Gerd Meier

MStreatment und MSerror


MSerror ist ein erwartungstreuer Schtzer fr die Fehlervarianz (d.h. die Populationsvarianz),
unabhngig von der Wahrheit von H0 oder H1:

E ( MS error ) = e2
MS error =

SS error
= e2
df error

MStreat ist ein erwartungstreuer Schtzer fr die Fehlervarianz nur dann, wenn H0 wahr ist. Andernfalls
(H0 ist falsch) ist 2 > 0, und dann schtzt MStreat die Summe aus Fehler- und Treatmentvarianz:

E ( MS treat ) = e2 + n 2
MStreat =

SStreat
e2
df treat

Hans-Rdiger Pfister, Gerd Meier

F-Verteilung und F-Test


(i)

Angenommen H0 sei wahr: Dann ist E(MSerror) = E(MStreat), da beide Terme unabhngige und
erwartungstreue Schtzer von 2e sind. Das Verhltnis beider Schtzer hat dann einen
Erwartungswert = 1.

(ii) Angenommen H1 sei wahr: Dann ist E(MSerror) < E(MStreat), da MStreat ein Schtzer fr die
Fehlervarianz plus Treatmentvarianz ist. Das Verhltnis der beiden Schtzer hat dann einen
Erwartungswert > 1.
Die F-Verteilung: Das Verhltnis zweier unabhngiger Schtzungen der Populationsvarianz folgt der
sogenannten F-Verteilung mit K-1 (Zhler) und K(n-1) (Nenner) Freiheitsgraden:

density(F)
0.7

Fdftreat =k 1; df error =k ( n 1)

MStreat
=
MSerror

0.6
0.5
0.4
0.3
0.2
0.1
1

Hans-Rdiger Pfister, Gerd Meier

Die F-Verteilung
Dichtefunktion

Verteilungsfunktion
df = 6,50
1.0

0.7

0.6
0.8

Probability F < x (df:3,16)

Density (df:3,16)

0.5

0.4

0.3

0.6

0.4

0.2
0.2

0.1

0.0

0.0
0

F-value

F-value

Beispiel: F=5%;df=3,16 = 3.239

Hans-Rdiger Pfister, Gerd Meier

Beispiel: Howell (p. 321, Table 11.1)


> how11.1.aov <- aov(RECALL ~ CONDITIO, data=how11.1)
> summary(how11.1.aov)
Df Sum Sq Mean Sq F value
CONDITIO

4 351.52

87.88

Residuals

45 435.30

9.67

Pr(>F)

9.0848 0.00001815 ***

number words recalled

20

15

10

counting

rhyming

adjective

imagery

intentional

experimental condition

Hans-Rdiger Pfister, Gerd Meier

10