Ismétlés ANOVA Egyszempontos Ismételt Kevert elrendezés Többszempontos Interakciók Carl William Sealy Ronald A. Pearson Gosset Fisher
1910 1908 1890
Varianciaanalízis A variancianalízis logikája • ANOVA - analysis of variance • Az ANOVA ugyanazt célozza meg, mint a t teszt: állapítsuk meg, hogy az adatainkban szereplő átlagos különbségek elég magasak, ahhoz, hogy ne pusztán a véletlen és normálisnak tekinthető variancia következményei legyenek. Más szavakkal, a normálisan is előforduló különbségeket szeretnénk megkülönböztetni a manipulációk, kezelések nyomán létrejött különbségektől. A variancianalízis logikája
• Az ANOVA abban más, mint a t teszt, hogy két
vagy több átlagot is képes összevetni, nem csak kettőt, mint a t teszt. • Az ANOVA alkalmazásával nem csak időt spórolunk, hanem az Első fajú hiba lehetőségét is lecsökkentjük. Mit jelent ez? A variancianalízis logikája
• Ha több átlagot szeretnénk t teszttel összevetni
akkor sok t tesztet kell lefuttatni, mert a t teszt csak két átlagot tud kezelni egyszerre. • Bár mindegyik t tesztet egy adott α-szint (az első fajú hiba rizikója) mellett végezzük, az α-szintek összeadódnak és végül egy igen magas összkísérleti α-szinttel nézhetünk szembe. A variancianalízis logikája • Az ANOVA megengedi, hogy a különbségeket egyetlen hipotézis teszttel vizsgáljuk, melynek csupán egy α-szintje van és ezzel az első fajú hiba veszélyét ellenőrzés alatt tarthatjuk, akármennyi átlagot is vetünk össze. • Az első ANOVA típus, amivel megismerkedünk a független mintás, egyszempontos ANOVA. • SPSS: One-way ANOVA A variancianalízis menete
• Az ANOVA teszt statisztikája az F-próba, ami két
variancia hányadosaként van definiálva. Az ANOVA kontextusában a minta varianciáját az MS (mean square) rövidítéssel jelölt számmal fejezzük ki.
• Az F-próba általános képletében a számlálóban
szereplő MSbetween (minták közötti) variancia méri a minták átlagai közötti különbséget. A nevezőben szereplő MSwithin (mintákon belüli) variancia méri azokat a különbségeket, amelyek beavatkozás, kezelés, manipuláció nélkül is jelentkeznek a mintában. A variancianalízis menete • Az F próba tehát valójában erősen hasonlít a független mintás t teszt felépítésére.
kapott átlagkülönbségek (manipulációval) MS between
F = ────────────────────────────────────── = ─────── véletlen okozta különbségek (manipuláció nélkül) MSwithin A variancianalízis menete • Ha az F-próba eredménye nagy szám, az azt jelzi, hogy a kapott átlagok különbsége magasabb, mint amire akkor számíthatnánk, ha a manipulációnak nem lett volna hatása. • Mindkét fajta varianciához az MS értékeket a következőképpen számoljuk ki: SS Minta varianciája = MS = ── df A variancianalízis menete
Logikailag, az átlagok közötti különbségek hátterében
két forrás lehet: 1. A manipuláció hatása: Ha a manipulációk különféle hatást gyakorolnak a mintára akkor az úgy jelentkezhet, hogy a minták átlaga eltérő lesz. 2. Normális fluktuáció (standard hiba): Még ha nincs is jelentős hatása a manipulációnak, akkor sem számítun arra, hogy nem lesz a mintaátlagok között eltérés. Amit a t tesztek esetében standard hibának hívtunk az itt is jelen van. A variancianalízis menete • Ha tehát figyelembe vesszük a variancia ezen két forrását akkor az F próba szerkezetét a következőképpen is leírhatjuk:
manipulációs hatás + véletlen/hiba
F = ────────────────────── véletlen/hiba A variancianalízis menete
• Amikor a null hipotézis igaz és nincs jelentős
manipulációs hatás akkor az F-próba eredménye egyensúlyban lesz. • Ha a manipulációs hatás szinte nulla, akkor a számlálóban is meg a nevezőben is csak a standard hiba szerepel. • Ebben az esetben az F próba eredménye közel lesz az 1-hez. Tehát, ha 1-hez közeli értéket kapunk, akkor kijelenthetjük, hogy nem volt szignifikáns manipulációs hatás. A variancianalízis menete
• Ha azonban nagy számot kapunk eredményül az F
próbában, akkor biztosan jelentős volt a manipulációs hatás. Ilyenkor elvethetjük a null hipotézist és kijelenthetjük, hogy a vizsgált átlagok között statisztikailag szignifikáns különbséget mértünk. • Ahhoz, hogy pontosan meghatározhassuk, hogy egy F próba szignifikáns különbségeket produkált, hagyományosan ki kell választani egy α-szintet, kiszámolni a szabdságfokokat mind a számláló, mind a nevező esetében és egy F táblázatban ki kell keresni a próbánkhoz tartozó kritikus értéket. ANOVA és a post hoc tesztek • Az ANOVA null hipotézise azt állítja, hogy nincsenek jelentős, fontos különbségek az összehasonlított csoportok átlagai között. H0: μ1 = μ2 = μ3 = . . . • Amikor ezt a null hipotézis elutasítjuk, akkor azt mondjuk ki, hogy vannak fontos, döntéshozási szempontból jelentős különbségek az átlagok között. • Csakhogy az ANOVA F próbája mindössze annyit jelent, hogy a különbségek léteznek, azt már nem mondja meg hogy melyik átlagok és milyen irányban különböznek. ANOVA és a post hoc tesztek • Ha több, mint két csoportunk van, vagy több mint két manipulációnk, akkor nem elégszünk meg az F próba ítéletével. Ilyenkor kísérő teszteket kell végrehajtani, amelyeket páronkénti vagy post hoc tesztnek hívunk. • Ilyen például a Tukey’s HSD, amit az SPSS-be is beépítettek. • Ezek a tesztek tipikusan páronként hasonlítják össze a viszgált átlagokat, hogy a különbségek iránya és mértéke kiderüljön.