Está en la página 1de 5

Biochemia Medica

The journal of
Croatian Society of Medical Biochemistry and Laboratory
Medicine

Home About the Journal Editorial board Indexed in Journal metrics For authors For reviewers Online submission

Home
Online content

Search content Analiza statistike snage testa u znanstvenom istraivanju


Odabrane teme iz biostatistike
Contact
Mary L. McHugh. Analiza statistike snage testa u znanstvenom istraivanju. Biochemia Medica 2008;18(3):263-74.
Useful links
Fakultet sestrinstva, Sveuilite Indianapolisa, Indianapolis, Indiana, SAD

*Adresa za dopisivanje: mchughm@uindy.edu

Saetak
Statistika snaga testa je mjera vjerojatnosti da e istraiva u uzorku nai statistiku znaajnost, ako uinak postoji u cijelokupnoj
populaciji. Snaga testa je funkcija ovisna o tri primarna i jednom sekundarnom imbeniku: veliini uzorka, veliini uinka, razini
znaajnosti i snazi koritenog statistikog testa. Najei razlog provoenja analize snage testa jest odreivanje veliine uzorka
Follow us on Facebook potrebnog za odreeno istraivanje. No, analiza snage testa moe se izraunati i nakon zavretka istraivanja kako bi se odredilo
je li nedovoljna snaga bila razlog statistiki neznaajnog uinka. Openito, ne preporua se post hoc analiza snage testa; ona bi se
trebala provesti prije poetka istraivanja. Njom se istrauje utjecaj veliine uinka, znaajnosti, veliine uzorka i snage statistikih
testova.
Kljune rijei: snaga testa, znaajnost, veliina uinka, veliina uzorka, statistika snaga testa

Pristiglo: 1. srpnja 2008. Prihvaeno: 6. kolovoza 2008.

Uvod
Snaga testa je vrlo vaan koncept za istraivae, budui da je ona stup na koji se naslanjaju postignua statistike znaajnosti.
Statistika znaajnost je imbenik istraivanja koji istraivai rabe kako bi odredili je li intervencija promijenila rezultat. To se ne
moe postii testom nedovoljne snage. S druge strane, iznimno jaka snaga testa moe utjecati na istraivaa da pridoda mnogo
vee znaenje statistikom rezultatu nego to to opravdava klinika situacija. Svrha ovoga lanka jest dati pregled temelja
statistike snage testa te informacije o tome kako se ona rabi u svrhu poveanja vjerojatnosti dobivanja pouzdanih informacija iz
istraivanja.

Znaenje snage testa


U kontekstu istraivanja, snaga se odnosi na vjerojatnost da e istraiva nai znaajan rezultat (uinak) u uzorku ako takav uinak
postoji u populaciji koju ispituje (1). Uporabom nul-hipoteze istraiva postavlja pitanje o znaajnom rezultatu. Nul-hipoteza uvijek
iznosi hipotezu da ne postoji razlika izmeu eksperimentalne i kontrolne skupine za varijable koje se ispituju. Nul-hipoteza je ono
to sve inferencijske statistike testiraju.
Vrijednosti koje snaga moe podnijeti seu od 0,0 do 1,0. Te se vrijednosti ne mogu tumaiti izravno. Meutim, vjerojatnost
pogreke tipa II. rauna se kao 1 snaga. Stoga vrijedi da, to je vea snaga, to je vjerojatnije da e se otkriti znaajan uinak.
Kada je snaga manja, nije vjerojatno da e istraiva nai uinak i time odbaciti nul-hipotezu, ak i kada postoji stvarna razlika
izmeu eksperimentalne i kontrolne skupine. Uinak koji istraiva eli nai jest alternativna hipoteza to zapravo predstavlja
hipotezu istraivanja. To se obino izraava ovim rijeima: Postoji razlika izmeu eksperimentalne i kontrolne skupine. Opisana
na drugi nain, snaga je vjerojatnost da e lana nul-hipoteza (odnosno, postoji uinak u cjelokupnoj populaciji) biti odbaena (vidi
tablicu 1.). Kada se odbaci nul-hipoteza, prihvaa se ona alternativna. Neizravno to znai da je snaga kljuni imbenik sposobnosti
istraivaa da izvue toan zakljuak iz podataka koje mu daje uzorak.

Tablica 1. Pogreke tipa I. i II.

Problemi sa snagom mogu dovesti do razliitih pogreaka u tumaenju statistikih rezultata. Mogu navesti istraivaa na zakljuak
da eksperimentalno lijeenje nije poluilo uinak, a taj uinak zapravo postoji u populaciji. Mogu ga navesti na netoan zakljuak
kako postoji znaajan uinak, koji doista i postoji, no toliko je malen da je beznaajan. Stoga je vano da svaki istraiva shvati
znaenje snage testa i imbenika koji utjeu na statistiku snagu testa, kako bi statistiki zakljuci bili toniji i pouzdaniji.

Temelji statistike snage testa


Statistika snaga testa je funkcija ovisna o tri imbenika (vidi sliku 1.) i jednom dodatnom imbeniku. Primarni su imbenici veliina
uinka i uzorka te razina znaajnosti koja se rabi u istraivanju. Sekundarni imbenik je snaga primijenjenih statistikih testova.
Kada su poznata bilo koja dva primarna imbenika iz njih se moe izraunati trei. A kada su poznata sva tri primarna imbenika
moe se izraunati snaga statistikog rezultata. Jednako vano je da se, kad su poznati snaga i samo jedan primarni imbenik
veliina uinka, moe izraunati veliina uzorka potrebna za postizanje statistike znaajnosti.

Slika 1. Tri komponente snage testa.

Veliina uzorka
Prvi imbenik i imbenik koji je pod najizravnijom kontrolom istraivaa jest veliina uzorka. Veliina uzorka je zapravo jedini
imbenik koji istraiva zaista moe kontrolirati. Ona vrlo izravno i snano utjee na statistiku snagu testa u svakom istraivanju.
Jednostavno reeno, to je vei uzorak, to je vea statistika snaga. Suprotno tome, kada je uzorak malen, statistika snaga je
slaba. To je logiki istinito jer znamo da bi istraiva, kad bi mogao ispitati itavu, cjelokupnu populaciju, imao potpunu mo nai
bilo koji uinak koji postoji u populaciji za mjerene varijable. Zapravo bi tada inferencijska statistika bila nepotrebna. Inferencijska
statistika dozvoljava istraivau da iz uzorka izvede zakljuak (procijeni) o veliini uinka u populaciji. Kad bi se ispitivala cijela
populacija, ne bi bilo potrebno procjenjivati uinak, budui da bi njegova veliina bila odmah poznata. Drugim rijeima, ako
istraiva ispituje cjelokupnu populaciju, snaga statistikog testa je 100%, jer je tada svaki uinak otkriven.
Nadalje, ako istraiva ispituje cjelokupnu populaciju nema opasnosti da uzorak bude slaba procjena populacije. Iako uzorkovanje
nije tema ovoga lanka, vano je naglasiti da je inferencijska statistika tona u onolikoj mjeri u kojoj uzorak predstavlja populaciju.
Stoga, niti jedna teorija koja podupire istraivanje uzorka ne vrijedi ako istraiva sakupi pristran uzorak (odnosno uzorak koji ne
predstavlja populaciju). Kod istraivanja koje rabi cjelokupnu populaciju ne postoji opasnost od nereprezentativnog rezultata.
Obrnuto, dobro je poznato da su vrlo mali uzorci nepouzdani procjenjivai nekog populacijskog parametra. Niti jedan savjestan
istraiva nee niti pokuati predvidjeti djelovanje novog lijeka na milijunsku populaciju uzimajui samo jednu osobu kao uzorak.
Visoka vjerojatnost pogrenog zakljuka ako je N = 1 je toliko dobro poznata da je postala klie. Veliina uzorka od 5 ispitanika bi
isto tako bila loa za testiranje djelovanja novog lijeka. Taj je uzorak premalen da bi mogao predstavljati iroku populaciju. Zapravo,
esto rabljeno nepisano pravilo u istraivanjima kae kako se uzorci manji od 30 ispitanika smatraju malima i da bi se trebali rabiti
samo u probnim istraivanjima.
Tada se namee pitanje: Koja je veliina uzorka potrebna istraivau kako bi otkrio uinak ako dotini postoji u populaciji? Tipini
nain pronalaska odgovora na to pitanje zove se analiza statistike snage testa (engl. power analysis) i ukljuuje izvoenje
matematikih izrauna kako bi se odredilo koja je veliina uzorka potrebna za otkrivanje uinka odreene veliine. Kako bi
izraunao potrebnu veliinu uzorka istraiva mora znati veliinu uinka. Treba takoer naglasiti da ponekad istraiva otkrije kako
umjerena veliina uinka nije statistiki vana. U tom se sluaju moe provesti analiza statistike snage, ako je problem statistike
znaajnosti bio nedovoljno snaan zbog nedostatne veliine uzorka.
Postoje razni programi dostupni na internetu koji pomau istraivau brzo odrediti veliinu uzorka. Jedan od najkorisnijih moe se
nai na mrenoj stranici Sveuilita u Iowi: http://www.stat.uiowa.edu/rlenth/Power/index.html (2). Korisnik prepoznaje statistiki
test koji rabi, unosi podatke o veliini uinka i program e izraunati potrebnu veliinu uzorka te odreenu razinu statistike snage.
Na primjer, pretpostavimo da istraiva planira provesti istraivanje na dva sluajno odabrana uzorka od kojih je jedan bio na
eksperimentalnom lijeenju, a drugi nije. Tipini test za ispitivanje razlika izmeu skupina je t-test. Poetna stranica nudi izbornik s
razliitim statistikim testovima. Kad korisnik dvostrukim pritiskom na lijevu tipku mia odabere jedan od tih testova, na zaslonu se
pojavi grafiko korisniko suelje (engl. graphical user interface, GUI) s kalkulatorom (slika 2.). Treba obratiti pozornost na to da je
na slici 2. veliina uinka 0,50, ali je snaga tek 0,41. Te razine rezultiraju potrebnom veliinom uzorka od samo 25 ispitanika u
svakoj skupini (ukupno N = 50). Meutim, ta je snaga preslaba za istraivanje, pa je na slici 3. snaga postavljena na 0,80, tako da
se miem klikne i povue alatna traka u odjeljku Power. Zanimljivo je da je veliina uzorka po skupini potrebna za pronalaenje
uinka veliine 0,50 i snage 0,80 narasla na N = 63. Pretpostavimo kako istraiva eli snagu od 0,80, ali sumnja da e veliina
uinka biti samo 0,35. Slika 4. pokazuje da je veliina uzorka potrebna za pronalaenje tog uinka porasla na 129 ispitanika po
skupini. Na taj nain istraiva moe rabiti internet stranicu Sveuilita u Iowi u odreivanju veliine uzorka koji e biti potreban za
postizanje znaajnosti za odreenu veliinu uinka i razinu snage. Upute za uporabu kalkulatora snage mogu se nai na mrenoj
stranici: http://hschealth.uchsc.edu/son/pdf3/PowerCalculatorsHowTo.pdf. Druga stranica s dodatnim izraunima snage i veliine
uzorka mogu se nai na internet stranicama Sveuilita Harvard: http://hedwig.mgh.harvard.edu/sample_size/size.html.

Slika 2. Kalkulator snage testa s internet stranica Sveuilita u Iowi t-test kalkulator.
Slika 3. Potrebna veliina uzorka kada je snaga poveana na 0,80.

Slika 4. Promjena veliine uzorka zbog veliine uinka.

Veliina uinka
Veliina uinka predstavlja veliinu razlike izmeu lijeene i nelijeene skupine u istraivanju, odnosno predstavlja magnitudu
uinka lijeenja (3). Istraivai provode eksperimentalna istraivanja kako bi testirali veliinu uinka. Odnsno, tipino je da
istraivai tee otkriti ima li lijeenje uinak kod eksperimentalnih ispitanika, i ako je tako, koju veliinu uinka je ono proizvelo?
Ljudi esto misle na korelaciju kada govore o veliini uinka. To je normalna pojava budui da su korelacije mjere veliine uinka.
Meutim, statistiki testovi za ispitivanje razlika kao to su t-test i ANOVA takoer imaju svoju veliinu uinka. Zapravo, mjera
veliine uinka za t-test je point-biserijski koeficijent korelacije, a za ANOVU Eta-square statistika.
Svi statistiki testovi koji se upotrebljavaju za mjerenje uinka lijeenja dakle, itava inferencijska statistika imaju odgovarajuu
mjeru za veliinu uinka. Niti jedan istraiva ne bi trebao objavljivati znaajnost, a da pritom ne objavi i veliinu uinka. Iako
sofisticiran i statistikim znanjima i vjetinama potkovan itatelj moe iz veliine uzorka i razine znaajnosti sam procijeniti veliinu
uinka, nema potrebe da on sam izvodi izraune. Odgovornost je istraivaa pruiti itatelju podatke potrebne za ispravno
vrednovanje istraivanja.
Kao to je prethodno spomenuto, podatak o razini znaajnosti i veliini uzorka moe navesti itatelja na krivi zakljuak. To je zbog
toga to e vrlo velik uzorak, dakle 1000 ili vie ispitanika, dati znaajan rezultat ak i za vrlo mali uinak. Pogledajmo to to znai
na primjeru izvjetavanja o znaajnoj korelaciji izmeu primjene nekog biljnog pripravka i kraeg tijeka neke poznate bolesti,
recimo obine prehlade. itatelji bi iz znaajnog rezultata mogli pretpostaviti da e im se stanje znatno bre poboljati ako samo taj
biljni pripravak uzmu u trenutku kada im zapone prehlada. Meutim, da je uzorak bio 2500 ispitanika i da je trajanje prehlade u
skupini koja je dobila tu biljku kao lijek bilo samo 5 minuta dulje, taj bi rezultat bio statistiki znaajan dok kliniki ne bi bio
znaajan. Bitno je da istraiva razumije kako e ekstremno visoka razina snage dati statistiki znaajne rezultate, ak i za krajnje
male uzorke.
Postoji bitna razlika izmeu statistike i klinike znaajnosti. Za prosjenu italaku publiku ova vrst razlike moe izgledati vrlo
sloena. Meutim, istraivai bi trebali biti svjesni injenice da veliki uzorci vrlo dobro poluuju pouzdane rezultate, no oni takoer
daju znaajne rezultate za gotovo sve veliine uinka. Kada su lijekovi, biljni pripravci i ostala kemijski aktivna sredstva predmet
ispitivanja, bitno je ne uzimati u obzir samo statistiku znaajnost. Veliina uinka se takoer mora uzeti u obzir. Jako mali uinci
(oni od 0,30 ili manje) trebali bi se uzeti u obzir s oprezom. Oni bi se prije mogli smatrati sluajnim nego pouzdanim uincima u
irokoj populaciji. Oni kazuju kako je lijeenje izazvalo mali uinak na zavisnoj varijabli. Ta bi se veliina uinka trebala kvadrirati
kako bi se ocijenio postotak varijance u zavisnoj varijabli koji je proizvela nezavisna varijabla. Stoga, uinak veliine 0,30 znai da
je lijeenje objasnilo samo 9% razlike u zavisnoj varijabli; 91% uinka na zavisnoj varijabli nije objanjeno nezavisnom varijablom.
Stoga se moe zakljuiti kako je uinak lijeenja bio premalen da bi se ljudima preporuilo da odvoje novac za lijeenje naroito
stoga to e ta terapija (lijek ili biljni pripravak) gotovo sigurno imati i neeljene nuspojave kod nekih ljudi. Rizik od nuspojava nije
vrijedan male mogue koristi.
U sluaju da istraiva moda ne zna koliki uinak treba oekivati od lijeenja, kako onda moe rabiti izraune za odreivanje
potrebne veliine uzorka? Postoje dva naina na koja istraiva moe odrediti veliinu uinka: prijanja istraivanja i minimalna
veliina uinka od interesa.
Ako su provedena prethodna istraivanja, njihova veliina uinka moe posluiti istraivau kao najbolja procjena veliine uinka
kojim bi lijeenje moglo rezultirati. Kad su takva istraivanja dostupna, njihova bi se veliina uinka trebala uzeti u obzir. Meutim,
uobiajenija je situacija da ne postoje prethodna istraivanja za izvorno istraivanje ili se ta prethodna istraivanja previe razlikuju
od onog izvornog. Mogue je da su prethodna istraivanja bila provedena na ivotinjskim vrstama razliitima od onih koje
predloeno istraivanje planira rabiti.
Za minimalnu veliinu uinka nema prihvaenog standarda. Ona moe varirati ovisno o situacijama. Na primjer, ako postoji ozbiljna
bolest bez uinkovite terapije, minimalna veliina uinka moe biti relativno mala. Ako novi lijek uzrokuje samo 10% poboljanja u
rezultatima, to bi moglo biti korisno za bolesnike. Kako bi se postiglo tih 10% veliina uinka mora biti 0,32, a to znai da se 32%
promjene u zavisnoj varijabli moe pripisati lijeenju. Meutim, ako postoji prihvaeno lijeenje s poznatim uinkom, minimalna
veliina uinka bi trebala, u veini sluajeva, biti vea za jednu cijelu veliinu uinka od uinka poznatog lijeenja. Na primjer, ako
poznato lijeenje pokae uinak veliine 0,45, novi lijek bi morao imati uinak od barem 0,55. Ili moda veliina uinka novog lijeka
iznosi samo 0,45, ali on ima znatno manje nuspojava (ili su manje ozbiljne). Kao to se moe vidjeti, odabir minimalne veliine
uinka je rezultat istraivaeva poznavanja srodnih istraivanja i njegove dobre procjene.
U klinikim istraivanjima istraiva odreuje najmanju veliinu uinka koja bi bila kliniki vana. Ako su rezultati zbog velikog
uzorka statistiki znaajni, a kliniki uinak u ljudskoj populaciji beznaajan, tada rezultati nisu kliniki znaajni. To je drugaiji
standard od standarda za statistiku znaajnost.
Kao primjer uzmimo da medicinski istraiva prouava sepsu koja nije uzrokovana na meticilin rezistentnim zlatnim stafilokokom
(engl. non-MRSA). Standardni lijek koji je u upotrebi ima stopu preivljenja od 60%. Novi lijek nudi stopu preivljenja od 62% u
uzorku od 2204 ispitanika. Veliine uinka su 0,77 za standardni i 0,79 za novi lijek (iznosi su zaokrueni). Openito, novi e lijek
biti puno skuplji. Je li 2% poboljanja rezultata vrijedno milijuna dolara godinje vie za trokove lijeenja? Ako trokovi lijeenja
ostanu isti, jesu li nuspojave drugaije? Koju bi veliinu uinka istraiva zahtijevao u ovom tipu istraivanja lijeka, ako se dogodi
da ili trokovi novog lijeka budu puno vii ili ako novi lijek ima neugodne ili opasne nuspojave? Ovo su pitanja koja istraiva mora
uzeti u obzir kada odabire minimalnu veliinu uinka.
Kada jednom odredi potrebnu veliinu uinka, istraiva ju jednostavno unese u kalkulator s minimalnom veliinom uinka i
kalkulator odredi veliinu uzorka potrebnu za odreivanje veliine uinka. Ako uinak postoji, ali je manji od minimalne veliine
uinka za istraivanje, nee postii znaajnost. Ako postoji uinak veliinom isti ili vei od minimalnog uinka od interesa, rezultat
e biti znaajan. Na taj nain istraiva moe planirati probno istraivanje koje nee samo pomagati preliminarnim testiranjem
instrumenata i postupaka prikupljanja podataka, nego e isto tako poboljati vjerojatnost isplativosti provoenja glavnog
istraivanja.

Razina znaajnosti
Razina znaajnosti istraivanja, takoer zvana i P-razinom, obino se postavlja znanstvenom konvencijom. Na primjer, u veini
drutveno znanstvenih istraivanja razina znaajnosti trebala bi biti 0,50 ili manja. U nekim istraivanjima lijekova P-razina mora biti
nia od 0,50 zbog nadzornih dravnih propisa za djelotvornost i sigurnost. Znaajnost predstavlja vjerojatnost pojave pogreke tipa
I. To znai kako postoji vjerojatnost da e istraiva krivo tvrditi kako je postigao znaajan uinak kad u populaciji nije bilo uinka
(vidi tablicu 1.).
S vrlo malim uzorkom, ili uzorkom koji je slabo zastupljen u populaciji, uvijek je visoka vjerojatnost da nee biti uinka ili suprotno,
da bilo koji uinak pronaen u uzorku nee biti prisutan u cjelokupnoj populaciji. Stoga, kada se provode probna istraivanja s
malim uzorkom, uobiajeno je da istraiva postavi razinu znaajnosti vie nego obino kako bi nadoknadio mali uzorak. Zato kada
je konvencionalna razina znaajnosti P < 0,50, u probnom bi se istraivanju mogla rabiti P-razina od 0,10 ili ak 0,20. Svrha vie
razine znaajnosti u probnom istraivanju jest izbjegavanje odbacivanja onoga to bi inae moglo biti obeavajui ishod
istraivanja temeljem probnog istraivanja u kojem nije naen uinak lijeenja. Zbog trenutne sklonosti urednika da objavljuju
lanke o probnim istraivanjima, itatelji bi uvijek trebali imati na umu injenicu da se istraivanja koja o uinaku izvjetavaju na
razini P < 0,10 ili vioj ne bi trebala primjenjivati na bolesnikoj populaciji, ili bi se na ljudskoj populaciji trebala primjenjivati uz
najvii nadzor i oprez. Kod takvih je istraivanja vjerojatno da se uinci naeni u uzorku jako razlikuju od onih u populaciji.
Takoer treba naglasiti, da kada istraiva objavi lanak o probnom istraivanju uz primjenu poveane -razine, veliina uzorka
moe biti dosta manja kako bi se sauvala znaajnost na istoj razini statistike snage i veliine uinka. Na slici 5. se vidi da je kod
snage 0,80 i veliine uinka od 0,35, potreban uzorak od samo 74 ispitanika u svakoj skupini kako bi se sauvala znaajnost kad
je P-razina postavljena na 0,20. S P-razinom od 0,05 u istom je istraivanju potrebno 129 ispitanika u svakoj skupini kako bi se
postigla znaajnost (vidi sliku 4.).
Manje je vjerojatno da e se otkriti pogreka tipa II. nego ona tipa I. Razlog tome je to to kada se dogodi pogreka tipa II., izvodi
se zakljuak da uinak ne postoji. Stoga se smjer istraivanja moe napustiti. S pogrekom tipa I. vrlo je vjerojatno da e drugi
istraivai testirati uinak o kojem se izvjetavalo. Kada velik broj njih ne uspije dobiti uinak, priznat e se orginalna pogreka tipa
I. Dakle, vjerojatnost pogreke tipa I. jednaka je razini znaajnosti istraivanja. Nakon toga dolazi vjerojatnost pogreke tipa II. Ta
se vjerojatnost rauna kao 1-. Budui da se statistika snaga vrlo esto postavlja na 0,80, uobiajena vjerojatnost pogreke tipa II.
je 10,80 ili 0,20. Dakle, dok je uobiajena vjerojatnost pogreke tipa I. 5%, tipina vjerojatnost pogreke tipa II. je 20%.

Slika 5. Promjena veliine uzorka zbog promijene u znaajnosti

Statistiki testovi
Sekundarni imbenik koji utjee na statistiku snagu je statistiki test koji se rabi. Svaki test ima svoju razinu snage. Parametrijski
testovi su sami po sebi jai od neparametrijskih, no to vrijedi samo ako se ispravno provode. Neparametrijski testovi su sami po
sebi manje snani od parametrijskih, no to vrijedi samo ako podaci i metoda istraivanja primijenjeni za dobivanje podataka
podupiru upotrebu parametrijskih testova.
Parametrijski testovi povezani su s nizom pretpostavka o podacima. Kada se te pretpostavke prekre, parametrijski testovi postaju
nestabilni te mogu dati rezultate koji navode na krivi trag. Pretpostavke parametrijskih testova sadravaju najee slijedee:
intervalna ili odnosna (omjerna) razina mjerenja barem zavisne varijable, sluajno rasporeivanje ispitanika u skupine, sluajno
uzorkovanje ciljne populacije, jednake varijance meu skupinama za zavisnu varijablu i ostale sline pretpostavke. Te se
pretpostavke temelje na injenici da se parametrijski testovi obino zasnivaju na metodi najmanjih kvadrata (linearna regresija),
koja rabi srednju vrijednost kao temelj za raunanje. U sluaju kada srednja vrijednost nije prikladna mjera centralne tendencije
podataka, treba posegnuti za neparametrijskim testovima (ili testovima neovisnim o distribuciji podataka) za testiranje hipoteza.
Neparametrijski testovi obino rabe medijan ili raspon podataka kao temelj svojih kalkulacija. Oni stoga imaju puno manje
pretpostavaka nego parametrijski testovi.
Kada istraiva neprikladno upotrebljava parametrijske testove kako bi ispitao podatke koji nisu prilagoeni parametrijskoj statistici,
tada se snaga rezultata dovodi u pitanje. Autorica je osobno vidjela niz sluajeva u kojima parametrijski testovi primijenjeni na
podacima koji se odnose na skupu s ordinalnim varijablama (engl. ordinal data) nisu uspjeli nai znaajan uinak, za razliku od
neparametrijskih koji su ga pronali. Mogue je takoer i suprotno. Ispravno primijenjen parametrijski test, budui da je snaniji,
pronaao je znaajan uinak lijeenja koje analogni neparametrijski test nije pronaao. Kako bi snaga u istraivanju bila
primjerena, bitno je da istraiva rabi statistike testove sukladno podacima za testiranje hipoteze.

Zakljuak
Snaga je primarno funkcija veliine uzorka, veliine uinka i razine znaajnosti (engl. alpha-level, p-level) i sekundarno
primijenjenog statistikog testa za ispitivanje razlika izmeu uzoraka. imbenik kojim istraivai najspremnije i najlake barataju
jest veliina uzorka. Primarna funkcija analize snage testa jest odreivanje veliine uzorka potrebne za postizanje statistike
znaajnosti u istraivanju. Meutim, snaga se rabi i u probnim istraivanjima, kako bi se utvrdili uinci lijeenja koji su preslabi da bi
bili vrijedni istraivanja te da se odrede idealne razine znaajnosti koje e se primijeniti u glavnom istraivanju. Postoji niz
kalkulacija analize snage koje su dostupne na internetu i uporaba istih moe biti korisna pomo istraivaima u planiranju
istraivanja. Trebalo bi im ui u naviku utvrditi potrebnu veliinu uzorka prije poetka istraivanja. Moe se naii na niz problema
kod tumaenja rezultata ispitivanja ako istraiva ne shvati statistiku snagu te nain na koji se ona postie. To ukljuuje i krivo
tumaenje razultata zbog ili vrlo niske ili vrlo visoke snage te zbog neprikladnog odabira statistikog testa za testiranje hipoteze.
Meutim, kada je snaga odgovarajua i kada se ispravno rabe statistiki testovi, tada se vjerojatnost ispravnog zakljuka znatno
poveava.

Literatura
1. Cohen J, Statistical Power Analysis for the Behavioral Sciences. 2nd ed. Hillsdale, New Jersey: Lawrence Erlebaum Associates;
1998.
2. Lenth RV. Java Applets for Power and Sample Size Computer software; 2006 Downloaded on June 10, 2008, from
http://www.stat.uiowa.edu/rlenth/Power/index.html
3. Becker L, Effect size. Downloaded on June 3 from http:web.uccs.edu/lbecker/Psy590/es.htm.

Related Articles Top Accessed Articles (within last 30 days)

Opis i tumaenje metodolokih i statistikih tehnika u meta-


analizama 1. The odds ratio: calculation, usage, and interpretation
Uloga statistikog recenzenta u biomedicinskim znanstvenim 2. Standard error: meaning and interpretation
asopisima 3. Sperm morphology assessment according to WHO and strict
Statistiki testovi procjene rizika criteria: method comparison and intra-laboratory variability
Medicina temeljena na dokazima - Koji ustroj istraivanja daje 4. Interferences in quantitative immunochemical methods
najbolji odgovor na moje pitanje? 5. What we need to know when calculating the coefficient of
Analiza statistike snage testa u znanstvenom istraivanju correlation?
Odabir i tumaenje dijagnostikih pretraga 6. Comparing groups for statistical differences: how to choose
Interval pouzdanosti the right statistical test?
Testiranje statistikih hipoteza i neke zamke 7. A model for results comparison on two different biochemistry
Standardna pogreka: znaenje i interpretacija analyzers in laboratory accredited according to the ISO
Klinika procjena medicinskih pretraga: jo je dug put pred nama 15189
8. Application of biological variation a review
9. to treba znati kada izraunavamo koeficijent korelacije?
10. Automatizirani laboratorijski nalazi odreivanja brzine
glomerularne filtracije: jesu li dobri za zdravlje bolesnika i
njihove lijenike?

Copyright (c) 2010 Croatian Society of Medical Biochemistry and Laboratory Medicine.
This work is licensed under a Creative Commons Attribution 4.0 International License

Designed by Dalmario.

También podría gustarte