Está en la página 1de 20

Stat 2

Ismétlés
ANOVA
Egyszempontos
Ismételt
Kevert elrendezés
Többszempontos
Interakciók
Carl William Sealy Ronald A.
Pearson Gosset Fisher

1910 1908 1890


Varianciaanalízis
A variancianalízis logikája
• ANOVA - analysis of variance
• Az ANOVA ugyanazt célozza meg, mint a t
teszt: állapítsuk meg, hogy az adatainkban
szereplő átlagos különbségek elég magasak,
ahhoz, hogy ne pusztán a véletlen és
normálisnak tekinthető variancia
következményei legyenek. Más szavakkal, a
normálisan is előforduló különbségeket
szeretnénk megkülönböztetni a manipulációk,
kezelések nyomán létrejött különbségektől.
A variancianalízis logikája

• Az ANOVA abban más, mint a t teszt, hogy két


vagy több átlagot is képes összevetni, nem csak
kettőt, mint a t teszt.
• Az ANOVA alkalmazásával nem csak időt
spórolunk, hanem az Első fajú hiba lehetőségét
is lecsökkentjük. Mit jelent ez?
A variancianalízis logikája

• Ha több átlagot szeretnénk t teszttel összevetni


akkor sok t tesztet kell lefuttatni, mert a t teszt
csak két átlagot tud kezelni egyszerre.
• Bár mindegyik t tesztet egy adott α-szint (az első
fajú hiba rizikója) mellett végezzük, az α-szintek
összeadódnak és végül egy igen magas
összkísérleti α-szinttel nézhetünk szembe.
A variancianalízis logikája
• Az ANOVA megengedi, hogy a különbségeket
egyetlen hipotézis teszttel vizsgáljuk, melynek
csupán egy α-szintje van és ezzel az első fajú
hiba veszélyét ellenőrzés alatt tarthatjuk,
akármennyi átlagot is vetünk össze.
• Az első ANOVA típus, amivel megismerkedünk
a független mintás, egyszempontos ANOVA.
• SPSS: One-way ANOVA
A variancianalízis menete

• Az ANOVA teszt statisztikája az F-próba, ami két


variancia hányadosaként van definiálva. Az ANOVA
kontextusában a minta varianciáját az MS (mean
square) rövidítéssel jelölt számmal fejezzük ki.

• Az F-próba általános képletében a számlálóban


szereplő MSbetween (minták közötti) variancia méri a
minták átlagai közötti különbséget. A nevezőben
szereplő MSwithin (mintákon belüli) variancia méri azokat
a különbségeket, amelyek beavatkozás, kezelés,
manipuláció nélkül is jelentkeznek a mintában.
A variancianalízis menete
• Az F próba tehát valójában erősen hasonlít a
független mintás t teszt felépítésére.

kapott átlagkülönbségek (manipulációval) MS between


F = ────────────────────────────────────── = ───────
véletlen okozta különbségek (manipuláció nélkül) MSwithin
A variancianalízis menete
• Ha az F-próba eredménye nagy szám, az
azt jelzi, hogy a kapott átlagok különbsége
magasabb, mint amire akkor
számíthatnánk, ha a manipulációnak nem
lett volna hatása.
• Mindkét fajta varianciához az MS értékeket
a következőképpen számoljuk ki:
SS
Minta varianciája = MS = ──
df
A variancianalízis menete

Logikailag, az átlagok közötti különbségek hátterében


két forrás lehet:
1. A manipuláció hatása: Ha a manipulációk különféle
hatást gyakorolnak a mintára akkor az úgy jelentkezhet,
hogy a minták átlaga eltérő lesz.
2. Normális fluktuáció (standard hiba): Még ha nincs is
jelentős hatása a manipulációnak, akkor sem számítun
arra, hogy nem lesz a mintaátlagok között eltérés. Amit
a t tesztek esetében standard hibának hívtunk az itt is
jelen van.
A variancianalízis menete
• Ha tehát figyelembe vesszük a variancia
ezen két forrását akkor az F próba
szerkezetét a következőképpen is
leírhatjuk:

manipulációs hatás + véletlen/hiba


F = ──────────────────────
véletlen/hiba
A variancianalízis menete

• Amikor a null hipotézis igaz és nincs jelentős


manipulációs hatás akkor az F-próba
eredménye egyensúlyban lesz.
• Ha a manipulációs hatás szinte nulla, akkor a
számlálóban is meg a nevezőben is csak a
standard hiba szerepel.
• Ebben az esetben az F próba eredménye közel
lesz az 1-hez. Tehát, ha 1-hez közeli értéket
kapunk, akkor kijelenthetjük, hogy nem volt
szignifikáns manipulációs hatás.
A variancianalízis menete

• Ha azonban nagy számot kapunk eredményül az F


próbában, akkor biztosan jelentős volt a
manipulációs hatás. Ilyenkor elvethetjük a null
hipotézist és kijelenthetjük, hogy a vizsgált átlagok
között statisztikailag szignifikáns különbséget
mértünk.
• Ahhoz, hogy pontosan meghatározhassuk, hogy egy
F próba szignifikáns különbségeket produkált,
hagyományosan ki kell választani egy α-szintet,
kiszámolni a szabdságfokokat mind a számláló,
mind a nevező esetében és egy F táblázatban ki kell
keresni a próbánkhoz tartozó kritikus értéket.
ANOVA és a post hoc tesztek
• Az ANOVA null hipotézise azt állítja, hogy nincsenek
jelentős, fontos különbségek az összehasonlított
csoportok átlagai között.
H0: μ1 = μ2 = μ3 = . . .
• Amikor ezt a null hipotézis elutasítjuk, akkor azt
mondjuk ki, hogy vannak fontos, döntéshozási
szempontból jelentős különbségek az átlagok között.
• Csakhogy az ANOVA F próbája mindössze annyit
jelent, hogy a különbségek léteznek, azt már nem
mondja meg hogy melyik átlagok és milyen irányban
különböznek.
ANOVA és a post hoc tesztek
• Ha több, mint két csoportunk van, vagy több
mint két manipulációnk, akkor nem elégszünk
meg az F próba ítéletével. Ilyenkor kísérő
teszteket kell végrehajtani, amelyeket páronkénti
vagy post hoc tesztnek hívunk.
• Ilyen például a Tukey’s HSD, amit az SPSS-be
is beépítettek.
• Ezek a tesztek tipikusan páronként hasonlítják
össze a viszgált átlagokat, hogy a különbségek
iránya és mértéke kiderüljön.

También podría gustarte