Está en la página 1de 41

Literatra

STATISTIKA
IR
JOS TAIKYMAI

V.ekanaviius, G.Murauskas
V. ekanaviius, G. Murauskas

Pastaba:

iuolaikin statistika tai mokslas


apie informacijos
 rinkim,
 sisteminim,
 analizavim,
 interpretavim.

mogus, kuris nesustodamas skrupulingai


visk vis skaiiuoja ir skaiiuoja ir dar
klasifikuoja ir klasifikuoja nra statistikas.
(greiiau jau serga izofrenija).
statistika, tai ne tik ir ne tiek duomen
sisteminimas, kiek tam tikr hipotezi
tikrinimas.
tai ir bus ms pagrindin duona
(divsis).
V. ekanaviius, G. Murauskas

Statistika ir jos taikymai I, II

V. ekanaviius, G. Murauskas

Trys statistikos dalys:

Pagrindiniai statistikos terminai

Duomen rinkimas

Populiacija - objekt, kuri savybs tiriamos, aib.


Imtis - tai populiacijos dalis, kuri naudojama
statistiniame tyrime.

Apraomoji statistika, nagrinjanti


duomen sisteminimo metodus.

Parametras - populiacijos charakteristika


(apibendrinantis matas).

Statistins ivados analizs ir


interpretavimo metodai.
V. ekanaviius, G. Murauskas

Statistika - imties charakteristika


(apibendrinantis matas).
5

V. ekanaviius, G. Murauskas

Kodl reikia statistikos (mokslo)?

Populiacija

 Tiriamos didels populiacijos.


 Surinkti informacij apie vis populiacij
labai brangu ir ilgai trunka.
 Nemanoma ivardinti vis populiacijos
element (pvz., bedarbi , valdinink,
narkoman populiacijos vis laik kinta).

Imtis
V. ekanaviius, G. Murauskas

Kokia turi bti imtis?

V. ekanaviius, G. Murauskas

Kintamojo svoka

 Imtys turi bti reprezentatyvios.


 Imtis reprezentatyvi, jei ji teisingai atspindi
tiriamo poymio galim reikmi
populiacijoje proporcijas.
 Toliau laikoma, kad imtis paprastoji
atsitiktin grintin imtis.
 Kai populiacija didel - daniausiai nra
didelio skirtumo tarp grintins
irnegrintins imi.
V. ekanaviius, G. Murauskas

 Populiacijos, kartu ir imties,


elementus vienija tiriamasis poymis.
 Matuodami poym, gauname tam
tikr dyd, kuris kinta kartu su imties
nariais.
 is dydis vadinamas kintamuoju.

Matuojam
pasirinkt poym!

V. ekanaviius, G. Murauskas

10

Matavim skals yra skaii


(arba simboli) priskyrimo objektams ar
vykiams metodai.

Parenkama
Matuojama

Matavim skals:
Pavadinim
Rang
Interval - Santyki
Populiacija

Imtis
V. ekanaviius, G. Murauskas

Duomenys
11

V. ekanaviius, G. Murauskas

12

Pavadinim skal

Pavadinim skal

 Duomen aib, gauta naudojant i skal,


susideda i vard, antrai ar kategorij.
- Nomen lotynikai vardas.
 Objektus galima tik klasifikuoti, t.y. priskirti
vienai ar kitai grupei.
 Kiekvienas objektas priskiriamas vienai ir
 tik vienai grupei.
 ioje skalje aritmetins operacijos neturi
prasms.
V. ekanaviius, G. Murauskas

Tautyb: Lietuvis, rusas, lenkas . . .


Ekonomins
veiklos
klasifikavimas:
gamybiniai, prekybiniai, finansiniai verslai
Pato indeksas: 2005,1011,

Optimistai

13

Neapsisprend

V. ekanaviius, G. Murauskas

14

Rang skal

Rang skal

 mokymosi lygis: vidurinis,auktasis,


 mokslo vardai: daktaras, hab. daktaras,
 varybose uimtoji vieta: 1,10,

 i skal naudojama tada, kai statistikas


gali nustatyti objekt tiriamo poymio,
savybs skirtumus ir pagal tai juos
irikiuoti eil.

 Nuomon apie sutuoktin:

 Objektus galima ne tik skirstyti klases,


bet ir jas sutvarkyti.

V. ekanaviius, G. Murauskas

Pesimistai

Nekenia

15

Kenia

Ignoruoja

Mgsta

Myli

V. ekanaviius, G. Murauskas

16

Interval-santyki skal

Interval-santyki skal

 Celsijaus ir Fahrenheito temperatr skals.

 Matavimams naudojant i skal, objektus


galima ne tik klasifikuoti, tvarkyti, bet ir
kiekybikai vertinti skirtumus tarp klasi.
 Nulinis takas interval skalje yra laisvai
parenkamas ir nereikia tiriamos savybs
nebuvimo.

-Nulis laipsni pasirenkamas laisvai.


 -Nulis nereikia ilumos ar alio nebuvim.

 Kalendorinis laikas.
prie 4000m

Biblin pradia

Krikionybs pradia
VII a.

V. ekanaviius, G. Murauskas

17

V. ekanaviius, G. Murauskas

Islamo pradia
18

Skaiiuojant statistik danai:


ranginis kintamasis su 4 ir maiau
skirting rang- traktuojamas, kaip
nominalus.
ranginis kintamasis su 5 rangais
traktuojamas, kaip intervalinis (jam
skaiiuojamas vidurkis ir pan.)

V. ekanaviius, G. Murauskas

Apraomoji statistika

19

 Apraomoji statistika leidia koncentruotai


urayti informacij, esani dideliuose
duomen masyvuose.
 Todl ji gali bti naudojama ir visos
populiacijos duomenims apdoroti.

Reikm

x1

Santykinis
danis

Sukauptasis
santykinis
danis

xk

f1/n f2/n

...
...

f1/n (f1+f2)/n

...

(f1+f2 +
...+fk)/n

21

x2

fk/n

V. ekanaviius, G. Murauskas

Duomen grupavimas
Duomen
grupavimas

22

Intervalini dani lentel

Nustatoma:
 Grupavimo interval skaiius.
 Grupavimo interval plotis.
 Interval kratiniai takai.

Palyginkime
Darb.sk.
[30,35)
[25,30)
[20,25)
[15, 20)
[10,15)
[5,10)

Grupavimo interval ilgiai vienodi,


intervalai nesikerta, kiekviena kintamojo
reikm patenka tik vien interval.
V. ekanaviius, G. Murauskas

20

Dani lentels

Apraomoji statistika tai duomen sisteminimo ir grafinio


vaizdavimo metodai

V. ekanaviius, G. Murauskas

V. ekanaviius, G. Murauskas

Danis
1
4
6
9
3
2
= 25

23

Intervalin

Skaiius
30
29
25
20
19
18
17
15
14
13
5

V. ekanaviius, G. Murauskas

Danis
1
1
3
6
1
2
1
5
2
1
2

Paprastoji

24

10

Grupuot duomen grafinis


vaizdavimas

 Grupuotiems duomenims daniausiai


braioma histograma,
 t.y. empirins grupuot duomen tankio
funkcijos grafikas.

Count

0
[5,10)

[10,15)

[15,20)

[20,25)

[25,30)

[30,35)

VAR00002
Cases weighted by VAR00003

V. ekanaviius, G. Murauskas

25

Vidurkis
Vidurkis

V. ekanaviius, G. Murauskas

26

Pavyzdys

Imties vidurkis (imties didumas n)

Dviej firm programuotoj atlyginimas:


I : 1000;2000;3000;5000;9000 Lt
II: 4000;4000;4000;4000;4000 Lt

x + x 2 + ... + x n
x = 1
n
Populiacijos vidurkis (populiacijos didumas N)

Atlyginim vidurkis 4000 Lt.


Taiau matome, kad I firmoje yra ir dideli
ir ma atlyginim, II visi vienodi.

x 1 + x 2 + ... + x N
N
V. ekanaviius, G. Murauskas

27

Dispersijos

Imties dispersija

(x1 x) + (x2 x) +...(xn x)


=
n -1
1 2 2
n
(x1 + x2 +...+ x2n )
(x)2
n -1
n -1
2

s2 =

V. ekanaviius, G. Murauskas

V. ekanaviius, G. Murauskas

29

28

savybs

 Jos privalumas yra tas, kad atsivelgiama


visus duomenis ir pateikiamas vidutinis
skirtum nuo vidurkio kvadratas.
 Dispersija visuomet neneigiama.
 Dispersija lygi nuliui tik tuo atveju, kai visi
stebjimai lygs.

V. ekanaviius, G. Murauskas

30

Standartinio nuokrypio savybs

Standartinis nuokrypis

s=

Standartinis nuokrypis matuojamas

s2

= 2

tokiais paiais vienetais kaip ir


patys duomenys.
J lengviau interpretuoti ir lyginti su
duomenimis nei dispersij.

Imties

Populiacijos

V. ekanaviius, G. Murauskas

V. ekanaviius, G. Murauskas

31

Pavyzdys

Normalioji kreiv


Imtis: 1000,2000,3000,5000,9000 Lt
Vidurkis 4000 Lt
Dispersija 9750000 Lt2
Std = 3122,4989... Lt

Empirikai nustatyta, kad daugelis


histogram yra panaios funkcijos

x ,s


V. ekanaviius, G. Murauskas

32

33

1
2 s 2

exp

(x - x ) 2
2s 2

grafik.
V. ekanaviius, G. Murauskas

34

Normalioji kreiv ir histograma

Koreliacija

V. ekanaviius, G. Murauskas

35

Koreliacijos koeficiento savybs

Tiesin priklausomyb

Koreliacijos koeficientas yra skaiius tarp 1 ir 1:

1 (X, Y) 1

Kuo tiesin priklausomyb stipresn, tuo


koreliacija toliau nuo nulio.

V. ekanaviius, G. Murauskas

37

38

Koreliacija

Vertinimas i akies

V. ekanaviius, G. Murauskas

| r | < 0.3 korelicija labai silpna


0.3 < | r | < 0.5 silpna koreliacija
0.5 < | r | < 0.7 vidutin koreliacija
0.7 < | r | < 0.9 stipri koreliacija
0.9 < | r | =< 1 labai stipri koreliacija

V. ekanaviius, G. Murauskas

39

V. ekanaviius, G. Murauskas

40

Koreliacijos koeficiento savybs


Jeigu (X,Y) > 0, tai didesnius X atitiks
didesni Y), jeigu (X,Y) < 0, tai
didesnius X atitiks maesni Y.
Koreliacijos koeficientas nematuoja
netiesins priklausomybs.

V. ekanaviius, G. Murauskas

Statistins ivados

41

V. ekanaviius, G. Murauskas

42

Tyrimo schema

Statistins ivados
Tikslas, ityrus imtis, padaryti ivad
apie vis populiacija.
 Daniausiai vertiname kakoki skaitin
charateristik:


 Vidutin

Tyrimo hipotez

reikm (vidurk)

Statistin hipotez

 Proporcij
 Reikmi

isibarstym (dispersij)
priklausomyb (koreliacij)

Imties tyrimas

 Kintamj

Jas vadinsime paramterais.


Ivada
43

44

Statistin hipotez

Tyrimo hipotez

 Statistin hipotez - tai teiginys apie


populiacijos parametr (parametrus).
 Statistin hipotez niekada nra teiginys apie
imties statistik.

Tai yra tai, k tyrjas tikisi. Pavyzdiui,


1. Kompanijoje diskriminuojami vyresnio
amiaus darbuotojai.
2. Jaunimo gaujose vaikinai vidutinikai
vyresni, nei merginos.
3. Nusikaltim skaiius priklauso nuo policijos
patruli skaiiaus.
Tyrimo hipotezse formuluojamos moni
(kartais teisinink) kalba, be matematikos.

 Statistin hipotez ir tyrimo hipotez skirtingi dalykai.


 Statistin hipotez nerodoma - ji priimama
arba atmetama, atsivelgiant imties
duomenis.
 Statistin hipotez tik dalis statistinio tyrimo.
45

Statistin parametrin hipotez


sudaro du alternatyvs teiginiai

46

Statistins hipotezs pavyzdiai:

 Nulin hipotez H0 . Daniausiai tai


teiginys, kad jokio parametr skirtumo
nra.

H 0 : = 180

H1 : 180

 Alternatyvioji hipotez (alternatyva) H1 .


Tai teiginys, kad parametrai skiriasi.

H 0 : 180

H1 : > 180
47

dvipus alternatyva

vienpus alternatyva

48

Grieta nelygyb raoma tik


alternatyvoje H1

Pavyzdys
Tyrimo hipotez: Firma diskriminuoja vyresnio
amiaus darbuotojus.
Duomenys: Tarkime, kad vyresni nei 60m
darbuotojai sudaro a dal vis darbuotoj.
Takime p yra vyresenij dalis tarp
atleistj.
Statistin hipotez:

Nordami tai pabrti raysime

H 0 : = 180

H 1 : > 180

: 180

H 1 : > 180

o ne H 0

H0: p=a
H1: p>a
49

Pavyzdys

50

Klaid klasifikacija
Kadangi imtis yra atisitktin, tai neivengiamai
galima padaryti tokias klaidas
Pirmos ries klaida. Atmetame H0 , o ji
teisinga.
Antros ries klaida. Priimame H0 , o ji
klaidinga.

Tyrimo hipotez: Nusikaltim skaiius


priklauso nuo policijos patruli skaiiaus.
Duomenys: Tarkime, kad inome kiek naktimis
budjo policijos patruli ir kiek nusikaltim
vykdyta gatvse.
Statistin hipotez:

H0: = 0
H1: < 0

Primena galimai klaidingus teismo (bent jau


prisiekusij) sprendimus.
51

Pavyzdys
= mot

52

Reikmingumo lygmuo

H 0 : vyr

H 1 : vyr > mot

 Nemanoma abiej ri klaidas

padaryti labai maomis.


 Daniausiai fiksuojama pirmos ries
klaidos tikimyb, kuri vadinama
kriterijaus reikmingumo lygmeniu .
 Kaip taisykl = 0.05.
 Tai reikia, kad jei jau skelbsime apie
statistikai reikming skirtum, tai
garantija bus nemaesn u 95 %.

(gaujose vyresni vyrai)

I ries klaida - nusprsti, kad vidutinikai


vyresni vyrai, nors i tikrj taip nra.
II ries klaida - nusprsti, kad vyrai nra
vyresni, nors i tikrj jie vyresni.
53

54

Kaip nusprendiama ar atmesti H0

Kriterijaus galia

 Surandame statistikos reikmi srit (kritin


srit), kur esant teisingai nulinei hipotezei
neturtume pakliti.
 Jei imties statistika patenka kritin srtit nulin hipotez H0 atmetame.
 Kritin sritis naudojama, kai hipotezs
tikrinamos, skaiiuojant rankomis.
 Kai hipotezs tikrinamos statistiniais
paketais, lengviau sprsti pagal
p-reikm.

 Tikimyb nepadaryti antros ries klaidos


vadinama kriterijaus galia :

 P ( atmesti neteising H0 ) =
 Kriterijaus galia i anksto nefiksuojama.
 Galingesnis tas kriterijus, kurio didesnis.

V.ekanaviius, G.Murauskas

55

P-reikm

56

Tegul reikmingumo lygmuo lygus , o


p-reikm lygi p . Tuomet:

 p - reikm yra tikimyb atmesti teising H0


suskaiiuota konkretiems duomenims.
 Reikmingumo lygmuo teorinis trokimas
prie analizuojant duomenis.
(pasiadjimas, kad sprendimo klaidos
tikimyb bus nedidesn u 5%).
 P-reikm: tikimyb velti klaid konkretiems
duomenims.
 Gerai, kai p-reikm maa (maesn u
reikmingumo lygmen).

 H0 atmetame, jeigu

p<

 H0 neatmetame, jeigu

57

Pastabos:

V.ekanaviius, G.Murauskas

58

Statistini ivad formulavimas


Jei atmetame nulin hipotez H0 , tai
sakome, kad imties statistika
statistikai reikmingai skiriasi nuo
spjamo populiacijos parametro.

Ir kritin sritis ir p-reikm skaiiuojami


konkreios imties konkretiems
duomenims.
p-reikm priklauso ir nuo imties didumo!
reikmingumo lygmuo pasirenkamas
nepriklausomai nuo imties.

V.ekanaviius, G.Murauskas

V.ekanaviius, G.Murauskas

Statistikai reikmingas skirtumas


tereikia, kad maai tiktina, jog H0
teisinga.
59

V.ekanaviius, G.Murauskas

60

10

Nota bene

Parametrinio kriterijaus sudarymo ir


taikymo etapai:

Neatmesta nulin hipotez tereikia, kad


turimi imties duomenys jai neprietarauja.
Galbt tiesiog duomen per maai, kad
nulin hipotez galima bt atmesti.

 Udavinio formulavimas.
 Tikimybinio modelio parinkimas.
 Statistins hipotezs uraymas.
 Kriterijaus taikymas.
 Ivad formulavimas.

Statistikai reikmingas skirtumas ir tyrimo


prasme reikmingas skirtumas ne tas pat.
Statistikai reikmingu gali bti pripaintas ir
labai maas skirtumas vien todl, kad
duomen labai daug.
V.ekanaviius, G.Murauskas

61

V.ekanaviius, G.Murauskas

62

Duomenys
Hipotez apie vidurkio
lygyb skaiiui

Stjudento t-testas vienai imiai

V.ekanaviius, G.Murauskas

Viena intervalini duomen imtis


(x1,x2,,xn) gauta matuojant normalj
atsitiktin dyd

X~N(,
, 2 )

dispersija 2 neinoma.

63

V.ekanaviius, G.Murauskas

Statistin ivada
su p - reikme

Statistin hipotez:

: = a

: a

64

H0 atmetame (vidurkis stat. reikmingai


skiriasi nuo a , jei

p<

H0 neatmetame (vidurkis stat. reikm.


nesiskiria nuo a), jei

(hipotez formuluojama populiacijai)


V.ekanaviius, G.Murauskas

ia
65

- reikmingumo lygmuo
V.ekanaviius, G.Murauskas

66

11

Pavyzdys

Statistin hipotez:

krepinio sirgalius igr 1.1; 2; 3; 0; 0.5;


1; 5; 4; 2; 1.5; 0.5 l alaus.
 ar vidutinis igerto alaus kiekis stat.
reikmingai skiriasi nuo 1 l?
 taigi, bandome atsiriboti nuo
pasiteisinim, kad ia jau taip ijo, o tai
apskritai tai ...


V.ekanaviius, G.Murauskas

67

: =1

: > 1

V.ekanaviius, G.Murauskas

68

Dvi imtys, gautos matuojant


nepriklausomus kintamuosius.
 Imi didumai gali skirtis.
 vienaip t-kriterijus taikomas, kai
dispersijos lygios ir kitaip, kai ne.
 aptarsime abudu atvejus.


Stjudento t kriterijus,
taikomas nepriklausomoms
imtims

69

Duomenys





Statistin hipotez:

Dvi intervalini duomen imtys


(x1,x2,,xn) ir (y1,y2,,ym) gautos
matuojant du nepriklausomus
normaliuosius atsitiktinius dydius
X~N(
X, 2 )

70

H0: x = y
H1: x = y

ir

Y ~N(
Y, 2 ) , Vidurkiai X , Y ir
dispersija 2 neinomi.
71

(hipotez formuluojama populiacijoms)

72

12

Pavyzdys

Statistins ivados
su p - reikme

keli magistrai ir keli fuksai balais vertino


idj egzamino paym leisti suinoti tik
paiam laikaniam studentui.
 magistrai: 7,6,5,8,9,10,9,8,7,6
 fukseliai: 5,6,7,6,5,4,8,2,5,6
 Ar apklaust magistr ir fuks nuomons
skiriasi statistikai reikmingai?
 (t.y. ar galima laikyti, kad vis magistr ir
vis fuks nuomons skiriasi)


H0 atmetame (vidurkiai stat. reikmingai


skiriasi) , jei

p<

H0 neatmetame (vidurkiai stat. reikm.


nesiskiria), jei

p >=

ia

- reikmingumo lygmuo
73

74

Statistin hipotez:

Stjudento t kriterijus,
taikomas priklausomoms
imtims
(porinis t testas)

H0: M = F (vertina vienodai)


H1: M = F (vertina
nevienodai)
(hipotez formuluojama populiacijoms)
75

76

Tiriame:
Dvi imtys, gautos matuojant
priklausomus kintamuosius.
 Imi didumai vienodi.
 Galima sivaizduoti, kad kiekvienam
respondentui turime matavim
poras (x,y).
 Danai duomenys gaunami dukart
imatavus t pat respondent.

Ar dieta buvo efektyvi.


Ar knygas respondentai skaito trumpiau,
nei iri TV.
Ar student IQ met pradioje buvo
didesnis, nei pabaigoje.
Ar vyresnieji vaikai labiau link prisiimti
atsakomyb, nei j broliai ar seserys.

Visais atvejais dukart matuojame


tuos paius respondentus.
77

78

13

Duomenys





Statistin hipotez:

Intervalini duomen poros (x1,y1),


(x2,y2),, (xn,yn) gautos matuojant du
priklausomus normaliuosius atsitiktinius
dydius
X~N(
X, X2 )

H0: x = y
H1: x = y

ir

Y ~ N(
Y, Y2 ) , Vidurkiai X , Y ir
dispersijos X2 , Y2 neinomi.

(hipotez formuluojama populiacijoms)


79

80

Statistins ivados
su p - reikme

Hipotez apie koreliacijos


koeficiento lygyb nuliui

H0 atmetame (vidurkiai stat. reikmingai


skiriasi) , jei

p<

H0 neatmetame (vidurkiai stat. reikm.


nesiskiria), jei

Ar du kintamieji koreliuoja

p >=

ia

- reikmingumo lygmuo
81

V. ekanaviius, G. Murauskas

Duomenys

Pavyzdiai
Ar studentai tuo geriau mokosi, kuo
daugiau turi pinig?
Ar geresniais balais stoj, geriau ir po
to mokosi?
Ar IQ ir igeriamo alkoholio kiekis
susijs?




Visais atvejais skaiiuojame ar


kintamieji koreliuoja.
V. ekanaviius, G. Murauskas

82

83

Intervalini duomen poros (x1,y1),


(x2,y2),, (xn,yn) gautos matuojant du
priklausomus normaliuosius atsitiktinius
dydius
X~N(
X, X2 )

ir

Y ~ N(
Y, Y , Vidurkiai X , Y ir
dispersijos X2 , Y2 neinomi.
2)

V. ekanaviius, G. Murauskas

84

14

Statistin hipotez:

Statistin hipotez:

H 0 : = 0

H 1 : 0

H 0 : nekoreliuoja

H1 : koreliuoja

V. ekanaviius, G. Murauskas

85

V. ekanaviius, G. Murauskas

Statistin ivada
su p - reikme

86

ANOVA

H0 atmetame (kintamieji stat. reikmingai


koreliuoja, jei

Vienfaktorin
dispersin analiz

p<

H0 neatmetame (kintamieji stat. reikm.


nekoreliuoja), jei

ia

ANalysis Of VAriance

- reikmingumo lygmuo
V. ekanaviius, G. Murauskas

87

V. ekanaviius, G. Murauskas

88

PAVYZDIAI

ANOVA yra t kriterijaus


apibendrinimas keletui
nepriklausom imi.

Jei dispersijos lygios, dviems imtims


ANOVA ir t kriterijus duoda t pat
atsakym.
V. ekanaviius, G. Murauskas

89

ar lietuviai, latviai ir karelai tiek pat


laiko naro internete,
ar priklauso klaid skaiius nuo
igerto vyno ries,
ar vis kurs studentai vienodai
intelektuals,
ar vidutinikai vienodai garsiai rkia
L. Ryto ir K. algirio sirgaliai.
V. ekanaviius, G. Murauskas

90

15

Kodl neutenka t testo?

iek tiek termin ...

Nes iauga tikimyb bent kart rasti neesam


skirtum!!!

Matuojame keli grupi respondentus

Lyginame keturias grupes t testu:


Vienas t-testas (
= 0.05)  I ries klaida = 5.0% (1-0.95)
Du t-testai

 bent viena I ries klaida = 9.8% (1-0.952)

I grup

Trys t-testai  bent viena I ries klaida = 14.3% (1-0.953)


...
ei t-testai  bent viena I ries klaida = 26.5% (1-0.956)

V. ekanaviius, G. Murauskas

91

V. ekanaviius, G. Murauskas

92

Kintamieji:
Normals
Lygi dispersij
Nepriklausomi

tai, pagal k skirstome grupes nepriklausomas kintamasis arba


faktorius (tautyb, vyno ris,
kursas). Faktorius - kategorinis.
93

V. ekanaviius, G. Murauskas

94

Statistin ivada
su p - reikme

Statistin hipotez:

H0: 1 = 2 == k

H0 atmetame (ne visi vidurkiai lygs), jei

p<

H1: ne visi vidurkiai


lygs

H0 neatmetame (visi vidurkiai stat. reikm.


nesiskiria), jei

ia
V. ekanaviius, G. Murauskas

III grup

ANOVA prielaidos

tai, k matuojame - priklausomas


kintamasis ( laikas internete, klaid
skaiius, IQ,). Priklausomas
kintamasis - intervalinis.

V. ekanaviius, G. Murauskas

I I grup

95

- reikmingumo lygmuo
V. ekanaviius, G. Murauskas

96

16

ANOVA lentel
Kvadrat suma
Grupi 64
Vidin 84.00
Visa
148

Source Sum of Squares


Between
SSB
Within
SSW
Total
SST

Pavyzdys

LL
2
12

Dispersijos v. F
32
4.5
7

df
k-1
N-k
N-1

Mean square
MSB
MSW

p
< .05

F
F

p
p

V. ekanaviius, G. Murauskas

Vienoje firmoje 2 brigados m dirbti


grojant skirtingai muzikai: klasikai ir pop.
Treioji grup - kontrolin.
Duomenys:
1 grup: 760, 722, 695, .
2 grup: 691, 653, 681, .
3 grup: 723, 747, 771, .

97

V. ekanaviius, G. Murauskas

ANOVA skirtumus rado,


kas toliau ?????

Pavyzdys
H0: 1 = 2 = 3
H1: ne visi lygs
Kvadrat suma
Grupi
39016,4
Vidin
10617
Visa
49633,4

LL Dispersijos v. F
2
19508,2
49,6
27
393,2

Toliau : POST HOC testai.


Tikslas: Nustatyti kuri grupi
vidurkiai skiriasi statistikai
reikmingai.

p
< .05

V. ekanaviius, G. Murauskas

99

V. ekanaviius, G. Murauskas

100

Post hoc : Stebuklai su


vidurkiais

Keletas termin

Post hoc : Stebuklai su vidurkiais

POST HOC testai taikomi PO Anovos.


Padeda rasti besiskirianias grupes.

Gali:

Aprioriniai testai taikomi VIETOJE


Anovos.

V. ekanaviius, G. Murauskas

98

101

stat. reikm. nesiskirti nuo

stat. reikm. nesiskirti nuo

stat. reikm. skirtis nuo

V. ekanaviius, G. Murauskas

102

17

Statistin ivada
su p - reikme

Daniausiai taikomi post hoc testai:


LSD testas (nerekomenduojame).
Bonferroni testas - liberalus, danai
ras skirtumus.
Tukey HSD testas - konservatyvus,
labai nelinks vidurki skirtumus
pripainti stat.reikmingais.
Dar yra Scheffe ir DAUG kit.

Vidurkiai stat. reikmingai skiriasi, jei

p <
Vidurkiai stat. reikmingai, nesiskiria, jei

ia
V. ekanaviius, G. Murauskas

103

- reikmingumo lygmuo
V. ekanaviius, G. Murauskas

104

Blokuot duomen
dispersin analiz

Pavyzdyje apie muzik ir darb:


Bonferroni:
Skiriasi: klasika ir tyla, pop ir tyla.
Nesiskiria: klasika ir pop.

Repeated measures ANOVA

V. ekanaviius, G. Murauskas

105

106

PAVYZDIAI

Blokuot duom. ANOVA


yra porinio t kriterijaus
apibendrinimas keletui
priklausom imi.

kraujospdis matuojamas po
mnesio, po pusmeio ir po met.
Iekoma skirtum.

stebime studento IQ kitim


pereinant i kurso kurs.

Neparametrinis analogas - Friedman


testas.
V.ekanaviius, G.Murauskas

V.ekanaviius, G.Murauskas

107

ta pati iuri vertina kelias grauoles.


V.ekanaviius, G.Murauskas

108

18

iek tiek termin ...

Blokuotieji duomenys

tai, k matuojame - priklausomas


kintamasis ( rezultatas, vertinimas).
Priklausomas kintamasis intervalinis.

1 slyg. 2 slyg. 3 slyg.


1 blokas
2 blokas

duomenis sudaro blokai daniausiai kelis kartus pamatuoto


respondento rezultat vektorius.
V.ekanaviius, G.Murauskas

3 blokas

109

110

Lygios skirtum dispersijos

Blokins ANOVA prielaidos

1 skirtumas

Kintamieji:
Normals
Lygi dispersij
Kintamj skirtum dispersijos lygios
(sferikumo prielaida)

V.ekanaviius, G.Murauskas

V.ekanaviius, G.Murauskas

1
matavi
mas

111

Statistin hipotez:

2 skirtumas

2
matavi
mas

3
matavi
mas

V.ekanaviius, G.Murauskas

112

Pavyzdiui:

H0: visi vidurkiai lygs

H0: visos grauols vidutinikai


vertinamos vienodai

H1: ne visi vidurkiai lygs

H1: ne visos vertinamos vienodai

V.ekanaviius, G.Murauskas

113

V.ekanaviius, G.Murauskas

114

19

Statistin ivada
su p - reikme

POST HOC testai

Vidurkiai stat. reikmingai skiriasi, jei

Taikomi ir interpretuojami, kaip ir


vienfaktorinje ANOVA.

p <
Vidurkiai stat. reikmingai, nesiskiria, jei

ia

- reikmingumo lygmuo
V.ekanaviius, G.Murauskas

DANI LENTELS

115

V.ekanaviius, G.Murauskas

116

ia pateikiami kriterijai pritaikomi tik


duomen aibms uraytoms dani
lentelmis.
Praktikai aptariamas tik vienas -

(chi-kvadrato)
kriterijus ir jo modifikacijos.

V. ekanaviius, G. Murauskas

V. ekanaviius, G. Murauskas

Kokie bna kvadratai

Suderinamumo kriterijus
(goodness of fit)

suderinamumo kriterijus yra

Hipotezs apie proporcijos lygyb


skaiiui apibendrinimas.
CHI SQUARE
V. ekanaviius, G. Murauskas

V. ekanaviius, G. Murauskas

20

Suderinamumo kriterijus
diskreiajam skirstiniui
Pavyzdys. 60 atsitiktinai parinkt irov
atsak klausim, kokia televizija geriausia.
Atsakymai:

TV kanalas

II III IV

Pasirinko

8 10

Jei visi 6 kanalai bt vienodai populiars,


kiekvien kanal rinktsi kas etas
respondentas.
1
Taigi, pirm kanal rinktsi
60 = 10
6
respondent, ir antr 10 ir t.t.

TV

II

III IV V

Pasirinko

10 12 12 13

VI

12 12 13

Ar remiantis iais duomenimis galima sakyti,


kad populiacijoje vis kanal reitingai yra
vienodi?

suderinamumo kriterijus

Duomenys. Viena kategorin imtis.


Pagal vien poym visi n imties
respondent suskirstomi k kategorij.
kiekvienoje kategorijoje bent 5 resp.
spjame, kokia dalis populiacijos
paklius pirm kategorij, kuri antrj ir
t.t
V. ekanaviius, G. Murauskas

suderinamumo kriterijus

Statistin hipotez:
H0 : Spjimas teisingas.
H1 : Spjimas neteisingas.

stebime

Turi rinktis 10 10 10 10 10 10
tikims
Reikt tikrinti ar labai (t.y. ar statistikai
reikmingai) skiriasi 5 nuo 10; 8 nuo 10 ir t.t.

V. ekanaviius, G. Murauskas

VI

V. ekanaviius, G. Murauskas

suderinamumo kriterijus

Statistin hipotez galima urayti


vairiai. Pvz.
H0 : I TV kanal rinksis 1/6 populiacijios,
II TV kanal rinksis 1/6 populiacijos,...
H0 : TV kanal irov santykis
1:1:1:1:1:1
arba 10:10:10:10:10:10
V. ekanaviius, G. Murauskas

Kriterijaus statistika
inome o m
- kiek imties
respondent pateko m-t kategorij;
suskaiiuojame, kiek imtyje turt bti
toki respondent, jei nulin hipotez
(spjamas santykis) bt teisingas:

e m = n p 0m
V. ekanaviius, G. Murauskas

V. ekanaviius, G. Murauskas

21

Statistin ivada
su
p - reikme

Pavyzdiai

H0 atmetame (duomenys spjamos proporcijos


stat. reikmingai nepatvirtina, jei

p<

H0 neatmetame (duomenys spjamai proporcijai


stat. reikm. neprietarauja), jei

- reikmingumo lygmuo

ia

1.
2.
3.
4.
5.
6.

Tikriname brokuot gamini procent.


Tikriname ar avarijos daniau vyksta
penktadieniais, nei kitomis savaits dienomis.
Ar sportinink kraujo parametrai skiriasi nuo
populiacijos kraujo parametr.
Ar reikia keisti pakuoi proporcijas.
Ar duomenys turi Puasono skirstin.
Ar duomenys turi Normalj skirstin.

V. ekanaviius, G. Murauskas

V. ekanaviius, G. Murauskas

kriterijus. Poymi
nepriklausomumo tikrinimas

Porini dani lentels


sex Respondent's Sex * life Is Life Exciting or Dull Crosstabulation

1 Male

2 Female

Total

Count
% within sex
Respondent's Sex
% within life Is Life
Exciting or Dull
Count
% within sex
Respondent's Sex
% within life Is Life
Exciting or Dull
Count
% within sex
Respondent's Sex
% within life Is Life
Exciting or Dull

life Is Life Exciting or Dull


1 Exciting 2 Routine
3 Dull
213
200
12

Total
425

50,1%

47,1%

2,8%

100,0%

49,1%

39,6%

29,3%

43,4%

221

305

29

555

39,8%

55,0%

5,2%

100,0%

50,9%

60,4%

70,7%

56,6%

434

505

41

980

44,3%

51,5%

4,2%

100,0%

100,0%

100,0%

100,0%

100,0%

213 i 434 sudaro 49.1%, 221 50.9%


V. ekanaviius, G. Murauskas

Duomenys





Du kategoriniai kintamieji.
inome kiekvieno repondento abiej
kintamj reikmes.
Kategorij gali bti keletas.
Pvz. Lytis (vyr., mot.); Tikyba (katal.,
protest., islamas) ir pan.
V. ekanaviius, G. Murauskas

Danai reikia nusprsti ar du


kategoriniai kintamieji yra
nepriklausomi (priklausomi):
Ar nusikalstamumo lygis priklauso nuo
bedarbysts lygio?
Ar usienio politika priklauso nuo to,
kokia partija yra valdioje?
Ar perkamo automobilio spalva
priklauso nuo perkaniojo lyties?
V. ekanaviius, G. Murauskas

Statistin hipotez:
H0 : poymiai nepriklausomi
H1 : poymiai priklausomi

V. ekanaviius, G. Murauskas

22

Statistin ivada
su p - reikme
H0 atmetame (poymiai stat. reikmingai
priklausomi), jei

p<

H0 neatmetame (poymiai stat. reikm.


nepriklausomi), jei

ia

- reikmingumo lygmuo
V. ekanaviius, G. Murauskas

homogenikumo kriterijus.
Pavyzdiai.

ar rko vienodas vis tikyb atstov


procentas;
ar vyrai ir moterys turi panaius rinkim
prioritetus;
ar vyrai sudaro tok pat psichologijos ir
filologijos student procent.

V. ekanaviius, G. Murauskas

Statistin ivada
su p - reikme
H0 atmetame (populiacijos stat.
reikmingai skiriasi), jei

p<

H0 neatmetame (populiacijos stat. reikm.


nesiskiria), jei

ia

- reikmingumo lygmuo
V. ekanaviius, G. Murauskas

kriterijus. Poymi
homogenikumo tikrinimas

Kadangi vis tiek lyginamos procentins


sudtys, tai galima hipotezes formuluoti
ir procent terminais:
vienas poymis stebimas keliose
populiacijose;
tikriname, ar visose populiacijose
poymis vienodai pasiskirsts;
skaiiuojama, kaip ir nepriklausomumo
atveju
V. ekanaviius, G. Murauskas

Statistin hipotez:
H0 : pagal tiriam poym
populiacijos nesiskiria.
H1 : populiacijos skiriasi.

V. ekanaviius, G. Murauskas

Pastabos
2 kriterijus labai jautrus duomen
skaiiui.
negali bti daug pustui kategorij.
(nedaugiau 25%)
taikomas ir ranginiams duomenims, jei
rang maiau, nei 5.
nenusako prieastingumo.
V. ekanaviius, G. Murauskas

23

Tiesin regresija - toks modelis,


kai vien (priklausom)
kintamj takoja vienas arba
keletas (nepriklausom)
kintamj.

Tiesin regresija

V.ekanaviius, G.Murauskas

139

V.ekanaviius, G.Murauskas

PAVYZDIAI

PAVYZDIAI

ar poegzamininis dirglumas
priklauso nuo gauto paymio, nuo
egzamino trukms ir nuo ko labiau,
kaip antikvarins keramikos kaina
priklauso nuo jos senumo ir aukciono
dalyvi skaiiaus,
ar diplomo paymi vidurkis ir
komunikabilumas gali padti
prognozuoti bsim atlyginim.
V.ekanaviius, G.Murauskas

141

imatavome IQ pirmame kurse. Ar


galima prognozuoti koks bus
studento diplomo paymi vidurkis?
kiek padids pelnas, padidinus
reklamos ilaidas 10 000 Lt?
kok vidutin valstybinio egzamino
bal galima prognozuoti mokiniui per
baigiamj kontrolin surinkusiam 87
tk.?
V.ekanaviius, G.Murauskas

142

Pavyzdys:

Kodl neutenka koreliacijos?

Koreliacija tarp ilaid reklamai ir


pajam yra 0,99.
Taigi, priklausomyb labai stipri.
Taigi, didjant reklamos ilaidoms,
bendrosios pajamos didja.
Ar naudinga firmai padidinti ilaidas
reklamai?
Atrodyt, kad taip!

Koreliacija nustato ar stipri yra


kintamj priklausomyb.
Koreliacija nustato, tiesiogin ta
priklausomyb ar atvirktin.
Koreliacija neleidia daryti
prognozi.
V.ekanaviius, G.Murauskas

140

143

V.ekanaviius, G.Murauskas

144

24

Gali bti taip...

Taiau, kartais koreliacijos


koeficiento negana!!!

1 Lt reklamai atnea kelis Lt pajam.


Valio!!!
Pelnas padids!

pajamos

- Ne, negaliu patikti, - atsak Alisa.


- Negali? - ujausdama paklaus
Karalien. - Dar kart pamgink:
giliai kvpk ir usimerk.
L.Kerolis

ilaidos reklamai
V.ekanaviius, G.Murauskas

145

Bet gali bti ir taip...

V.ekanaviius, G.Murauskas

146

Regresija tinka prognozms.

1 Lt reklamai atnea kelis centus pajam.

Pavyzdiai:
nustatyti gio ir svorio priklausomyb,
rodyti mediagos kancerogenin
poveik,
nustatyti nusikaltim skaiiaus ir
gyventoj tankumo priklausomyb.

pajamos

Vaje!!!
Pelnas sumas!

ilaidos reklamai
V.ekanaviius, G.Murauskas

147

Duomenys

148

MODELIS

Y = 0 + 1X 1 + ... + n X n + e

(X11,, X21,, X31,,, Xk1,, Y1) , .,


(X1n,, X2n,, X3n,,, Xkn,, Yn) .
tai, k prognozuosime priklausomas kintamasis ( Y , kaina)
pagal k - nepriklausomi kintamieji
(regresoriai) ( X-ai , metai, dalyvi
skaiius).
V.ekanaviius, G.Murauskas

V.ekanaviius, G.Murauskas

149

Y priklauso nuo stebim X- ir nuo


dar kakoki nestebim dalyk e.
e atsitiktinis dydis (normalus) su 0
vidurkiu ir neinoma dispersija.
V.ekanaviius, G.Murauskas

150

25

Visi kintamieji intervaliniai*.

Modelis grafikai

* iskyrus pseudokintamuosius .
X-ai vienas kito neveikia,
X-ai veikia Y-.
vieno X-o per kitus neireiki.

X1

V.ekanaviius, G.Murauskas

151

Parametr vertinimas

V.ekanaviius, G.Murauskas

152

em = ym - y(x1m, x2m,... xkm)

y(x) = a + b1x1 + ... + bkxk

= ym - (a + b1x1m + + bkxkm)
Liekamosios paklaidos suskaiiuojamos
visiems duomenims

bt kiek galima ariau vis stebim ym


153

V.ekanaviius, G.Murauskas

154

Kai yra vienas kintamasis

Maiausi kvadrat metodas:


Parametrai a ir b1,...bk parenkami
taip, kad bendroji paklaid
suma

SSE = e12 + e 22 + ... + e 2n

Surandame a ir b, tokius, kad ties

y(x) = a + bx
(regresijos ties) bt kiek galima ariau
vis sklaidos diagramos tak.

bt maiausia.
V.ekanaviius, G.Murauskas

X3

Liekamoji paklaida

Surandame a ir b1, b2,... bk tokius, kad


regresijos funkcijos reikms

V.ekanaviius, G.Murauskas

X2

155

V.ekanaviius, G.Murauskas

156

26

Atstumas tarp (xm,ym) ir tiess

Gauta lygtis y(x) gali bti taikoma


prognozms.

y(x) = a + b1x1 + ... + bkxk


bk parodo, kiek padids y , jei xk
padids vienetu.

V.ekanaviius, G.Murauskas

157

kaina = 1000+
4*Metai+ 200*Dalyviai

Prognozuojama tik, jei regresijos


modelis duomenims tinka.

Jei dalyviai 2, o puodas 300 m.


senumo, tai prognozuojame, kad jis
kainuos 1000+4*300+200*2=2600 Lt.
kiekvienas naujas dalyvis pabrangina
prek 200Lt.
159

Modelio suderinamumas su
duomenimis

Prognoz daroma tik tokiems x, kurie


neioka u nagrinjam x- srities.
Prognoz tuo tikslesn, kuo x ariau
vis stebt xm vidurki.
V.ekanaviius, G.Murauskas

160

Liekamj paklaid analiz

Ar tinka regresija nustatome analizuodami


Liekamsias paklaidas,
Determinacijos koeficient,
ANOVA lentel,
t-testus,
Multikolinearum.
V.ekanaviius, G.Murauskas

158

Prognozavimas

Pvz., keramikos aukcione kaina:

V.ekanaviius, G.Murauskas

V.ekanaviius, G.Murauskas

161

Kaip ir paprastojoje regresijoje liekamj


paklaid em analiz reikia:
a) iskiri nustatym;
b) sklaidos diagram analiz.

V.ekanaviius, G.Murauskas

162

27

Kenksminga iskirtis:

Iskirtys yra dviej tip:


isiskirianios Xm reikms,
isiskirianios ym reikms.
Gali kenkti prognozs tikslumui.

V.ekanaviius, G.Murauskas

163

Nekenksminga iskirtis:

V.ekanaviius, G.Murauskas

164

Iskiri atsiradimo prieastys:


Daniausiai - duomen vedimo klaida.
Paalinio kintamojo taka (pvz. metin
visaliaudin vent).
inant iskirties atsiradimo prieastis,
danai t stebjim galima paalinti.
Negalima stebjimo alinti tik todl, kad
jis iskirtis!!!

V.ekanaviius, G.Murauskas

165

V.ekanaviius, G.Murauskas

Determinacijos koeficientas

Yra keli iskiri nustatymo bdai


Mes naudosime Kuko mat Dm :

R2 =

Jis skaiiuojamas kiekvienam duomeniui


(t.y. kiekvienai porai (xm,,ym)).

R =
2

Stebjimas yra iskirtis, jei Dm >1.

166

SSR
SST

variacija paaikinama modelio


visa variacija

V.ekanaviius, G.Murauskas

167

V.ekanaviius, G.Murauskas

168

28

Kuo R2 ariau 1, tuo modelis geresnis.


Maiau u 0,20 - nelabai gerai

Daugialyps koreliacijos koeficientas

Jeigu stebjim yra nedaug, o x- daug,


tai R2 yra didelis, nors regresijos
modelis gali visai netikti.
Todl, tuo atveju geriau naudoti
koreguot R2

2
adj

n -1
= 1
(1 - R 2 )
n - k -1
V.ekanaviius, G.Murauskas

R=

Parodo, kaip Y priklauso nuo vis X-.


Neparodo ar visi X-ai reikalingi.

169

V.ekanaviius, G.Murauskas

170

Statistins ivados
su p- reikme:

ANOVA lentel:
Tikrina hipotez:

H0 atmetame (tiesin regresija galbt


tinka), jei

H0: visi bm = 0
H1: ne visi bm = 0.

p<

Kitais odiais:

H0 neatmetame (tiesin regresija netinka),


jei

H0: y nuo x- nepriklauso


H1: y nuo x- priklauso.

p >=

Tik neinome nuo kuri x-.


V.ekanaviius, G.Murauskas

R2

ia

171

- reikmingumo lygmuo
V.ekanaviius, G.Murauskas

172

Statistins ivados
su p- reikme:

t-testai koeficientams bm
Iekome nesvarbi x-.
Tikrina hipotez:

H0 atmetame (kintamasis modeliui tinka),


jei

H0: bm = 0
H1: bm = 0

p<

Jei nulins hipotezs neatmetame-tai


kintamasis tartinas (modelyje
galbt nereikalingas).

H0 neatmetame (kintamasis tartinas), jei

p >=
ia

V.ekanaviius, G.Murauskas

173

- reikmingumo lygmuo
V.ekanaviius, G.Murauskas

174

29

Multikolinearumas

K daryti su tartinais
kintamaisiais?
pakartojame regresijos model be
tartino kintamojo.
jei R2 reikm nedaug sumajo,
kintamj i modelio paaliname,
jei R2 reikm daug sumajo, kintamj
modelyje paliekame.

V.ekanaviius, G.Murauskas

175

V.ekanaviius, G.Murauskas

X3
177

Pavyzdys: Gauname
R2 =

0.799, ANOVA p-reikm 0.


Gauname regresijos lygt
LITERACY = -39 +
+ 4.39 * LIFEXPF - 2.94 * LIFEXPM
Taigi, valstybs kur moterys ilgiau gyvena
- ratingesns (daugiklis + 4.39 ).
O valstybs, kur vyrai ilgiau gyvena maiau ratingos (daugiklis - 2.94).
V.ekanaviius, G.Murauskas

176

Failas World95, kintamieji :


LITERACY (rating moni
procentas).
LIFEXPF (vidutin moter gyvenimo
trukm).
LIFEXPM (vidutin vyr gyvenimo
trukm).
Tirsime ar valstybs ratingum takoja
vyr ir mot. gyvenimo trukms.

X2

V.ekanaviius, G.Murauskas

Pavyzdys

Multikolinearumas

X1

Tai situacija, kai tarp x- yra stipriai


koreliuojani.
Tada informacija apie vien x- atsispindi
kituose ir is x-as modelyje nelabai
reikalingas.
Modelyje gali atsirasti keist priklausomybi.
Modelio prognozs tampa nestabilios
(papildomas stebjimas gali labai pakeisti
regresijos funkcij).

179

V.ekanaviius, G.Murauskas

178

Pavyzdys: Ivada
moterims skaityti sveika (ratingose
valstybse ilgiau gyvena),
o vyrams skaityti nesveika (ratingose
valstybse trumpiau gyvena).
Ivada neteisinga! Aiku, kad
isivysiusiose valstybse (taigi ir
ratingose) ir vyrai ir moterys gyvena
ilgai.
V.ekanaviius, G.Murauskas

180

30

Jeigu prognozuotume ratingum


tik pagal vien kintamj, gautume:
LITERACY = -50 +1.9 * LIFEXPM
ir
LITERACY = -52 + 1.8 * LIFEXPF.
Viskas tvarkoje! Priklausomyb teisinga.

V.ekanaviius, G.Murauskas

181

Kaip nustatyti multikolinearum:

183

Pvz., manome, kad buto ploto ir kainos


priklausomyb dviejuose rajonuose yra
madaug vienoda, tik yra rajono antkainis.

V.ekanaviius, G.Murauskas

182

Pseudokintamieji

V.ekanaviius, G.Murauskas

184

Pseudokintamj kodavimas:
Jei kintamasis dvireikmis, jo reikmes
koduojame 0 ir 1.
Jei kintamasis trireikmis, tai traukiame
du pseudokintamuosius- abu gyja tik
dvi reikmes 0 ir 1.
pvz. 0 ir 0 atitiks pirm rajon, 0 ir 1
atitiks antr rajon, o 1 ir 0 - trei.
pseudokintamj vienu maiau, nei
reikmi - nenaudojame 1 ir 1.

V.ekanaviius, G.Murauskas

Koreliacija tarp LIFEXPM ir


LIFEXPF yra 0.98!
Turime kintamj multikolinearum.
Moralas: daug x- nebtinai gerai.
Tai k daryti?
Paalinti vien kintamj, arba imti
abiej vidurk.

Nors iaip visi X-ai turi bti intervaliniai,


kartais model traukiamas ir kategorinis
kintamasis.
Taip daroma, jei maoka duomen ir
manome, kad visoms kategorijoms
regresijos funkcija skiriasi tik per
konstant.
Kintamasis vadinamas pseudokintamuoju ir
specialiai koduojamas.

Tikriname ar dispersijos majimo


daugiklis (VIF) nra didelis.
Blogai, kai VIF>4.
Pavyzdyje VIF>28.
Kartais VIF bna ir maesnis, bet
regresijos lygtis atrodo keistai.
Patarimas: Pasiskaiiuoti ir atskir
x- bei y koreliacijas.
V.ekanaviius, G.Murauskas

Abu kintamieji stipriai koreliuoja:

185

V.ekanaviius, G.Murauskas

186

31

Pseudokintamj naudojimas

Standartinis tyrimas:

Regresijos funkcij konkreiai


kategorijai gaunama i bendrosios
funkcijos staius pseudokintamojo
reikm.
Pvz.Kaina= 20+1.2 * plotas+ 5 * pseudo
bus Kaina=25+ 1.2 * plotas, vienam
rajonui ir
Kaina=20+ 1.2 * plotas, kitam rajonui.

R2 , ANOVA, t-testai, VIF ir grafikai


pads nustatyti reikalingus X-us.
R parodys, kaip Y priklauso nuo vis
X- ikart.
B-koeficientai pads sudaryti regresijos
funkcij.
Beta-koeficientai pads nustatyti, kurie
kintamieji svarbesni.

V.ekanaviius, G.Murauskas

187

V.ekanaviius, G.Murauskas

188

Pastabos:
Kai priklausomyb netiesin danai
naudojamos transformacijos (pvz. X2
paymime nauju kintamuoju X-u).
Yra ir specialus regresijos metodas ingsnin regresija (step-wise), kai
kintamieji traukiami funkcijos lygt po
vien, atsisakant maai taking.

V.ekanaviius, G.Murauskas

189

Neparametriniai kriterijai

dar vadinami ranginiais kriterijais;


nereikalauja kintamj normalumo;
tinka maoms imtims;
maiau galingi, nei parametriniai;
lygina skirstinius, todl kiek sunkiau
interpretuojami (pvz. nebus ivad apie
vidurkius).
2 kriterijus irgi neparametrinis;

Tipika dvipus hipotez


H0 : X ir Y skirstiniai nesiskiria
H1 : X ir Y skirstiniai skiriasi
Pvz.:
H0 : psichologai ir sociologai vienodai
gerai ilaiko statistik.
H1 : nevienodai

32

Tipika vienpus hipotez

Rangavimas
priskiriame imties elementui jo didum
atitinkani viet - rang.

H0 : X ir Y skirstiniai nesiskiria
H1 : X skirstinys links gyti maesnes
reikmes u Y.

Imtis 13 17 20 21 90
Eil.Nr . 1X 2 3Y 4 5
Rangas 1 2 3 4 5

Rangavimas

Rangavimas

kai imties elementai sutampa, jie gauna


vienod rang.
Imtis
13 17
17
21 90
Eil . Nr .
1
2
3
4
5
Rangas
1
2 .5 2 .5
4
5

kai imties elementai sutampa, jie gauna


vienod rang.
Imtis
13 17 17 17 90
Eil . Nr .
1
2
3
4
5
Rangas
1
3
3
3
5
vis rang suma lygi
1+2++n=n(n+1)/2.

2+3
= 2 .5
2

Mann-Whitney kriterijus
1. Stjudento t kriterijaus
nepriklausomoms imtims analogas;
2. bet nelygina vidurki;
3. lygina skirstinius;
4. kuris kintamasis links bti didesniu
parodo didesnis vidutinis rangas.

Mann - Whitney kriterijus

V. ekanaviius, G. Murauskas

197

V. ekanaviius, G. Murauskas

198

33

Duomenys

Statistin hipotez:

dvi nepriklausomos imtys, gautos


matuojant intervalinius arba
ranginius kintamuosius.
imi didumai gali skirtis.
skirting ranginio kintamojo reikmi
turi bti bent 5.

1.

2.
3.

V. ekanaviius, G. Murauskas

H0 : kintamj skirstiniai nesiskiria


H1 : kintamj skirstiniai skiriasi.

199

Kriterijaus idja:

V. ekanaviius, G. Murauskas

200

Kriterijaus idja:

Visas lyginam kintamj reikmes


suraome vien variacin eilut.
Suranguojame t eilut.
Lyginame kiekvienos imties element
vidutinius rangus.
Didesnis rangas- 'kintamasis links
bti didesniu'.

X: 12,14; Y: 3,15,20
Y X X Y Y
3 12 14 15 20
1 2 3 4 5
Vidutiniai rangai:
2+3
1+ 4 + 5
X:
= 2.5, Y :
= 3.33
2
3
Y 'link bti didesniais' u X.

V. ekanaviius, G. Murauskas

201

Statistin ivada
su p - reikme

p<

H0 neatmetame (kintamj skirstiniai stat.


reikm. nesiskiria), jei

- reikmingumo lygmuo
V. ekanaviius, G. Murauskas

202

Pavyzdys

H0 atmetame (kintamj skirstiniai stat.


reikmingai skiriasi), jei

ia

V. ekanaviius, G. Murauskas

203

Ar vyresni, nei 40 m. juodaodiai ir


baltieji vienodai palankiai vertina
klasikin muzik?
rangini kintamj reikms: 1-labai
palankiai, 2-palankiai,.,5-labai
nepalankiai.
Tarkime, kad reikmingumo lygmuo yra
0,05.
V. ekanaviius, G. Murauskas

204

34

Wilcoxon kriterijus
1.

Wilcoxon

kriterijus

2.
3.
4.

V. ekanaviius, G. Murauskas

205

Duomenys
1.

2.
3.

4.

207

Kriterijaus idja:

206

H0 : kintamj skirstiniai nesiskiria


H1 : kintamj skirstiniai skiriasi.

V. ekanaviius, G. Murauskas

208

Kriterijaus idja:
(12,13), (20,30), (5,3), (4,2), (15,17),
(25,30).
Skirtumai: -1, -10, 2, 2, -2, -5.
Moduliai:1(-), 2(-), 2(+),2(+),5(-),10(-).
Rangai: 1(-), 3(-), 3(+), 3(+), 5(-), 6(-).
Vidutiniai rangai: (+): 3, (-): 3.75

Suskaiiuojame reikmi
skirtumus kiekvienai porai.
Suranguojame skirtum
modulius.
Lyginame vidutinius teigiam ir
neigiam skirtum rangus.
V. ekanaviius, G. Murauskas

V. ekanaviius, G. Murauskas

Statistin hipotez:

dvi priklausomos imtys, gautos


matuojant intervalinius arba ranginius
kintamuosius.
imi didumai vienodi
daniausiai stebime tuos pat
respondentus dukart;
skirting ranginio kintamojo reikmi
turi bti bent 5.
V. ekanaviius, G. Murauskas

Stjudento t kriterijaus porinms


(priklausomoms) imtims analogas;
bet nelygina vidurki;
lygina skirstinius;
kuris kintamasis links bti didesniu
parodo didesnis vidutinis kintamj
skirtumo rangas.

209

V. ekanaviius, G. Murauskas

210

35

Statistin ivada
su p - reikme

Pavyzdys
Ar vyresni, nei 50 m. respondentai
vienodai palankiai vertina klasikin
muzik ir diaz?
rangini kintamj reikms: 1-labai
palankiai, 2-palankiai,.,5-labai
nepalankiai.
Tarkime, kad reikmingumo lygmuo yra
0,05.

H0 atmetame (kintamj skirstiniai stat.


reikmingai skiriasi), jei

p<

H0 neatmetame (kintamj skirstiniai stat.


reikm. nesiskiria), jei

ia

- reikmingumo lygmuo
V. ekanaviius, G. Murauskas

211

V. ekanaviius, G. Murauskas

212

Spearmano kriterijus
1.
2.

Spearman koreliacija

3.

4.

V. ekanaviius, G. Murauskas

213

Duomenys
1.

2.
3.

V. ekanaviius, G. Murauskas

214

Statistin hipotez:

porin imtis, gauta matuojant


intervalinius arba ranginius
kintamuosius.
galima naudoti ir imi rangus.
skirting ranginio kintamojo reikmi
turi bti bent 5.

V. ekanaviius, G. Murauskas

Pearsono koreliacijos analogas.


Interpretuojamas visikai
analogikai;
skaiiuoja Pearsono koreliacij tarp
imi rang;
tai leidia naudoti ir specialiu atveju,
kai duomenys jau suranguoti.

H0 : kintamieji nekoreliuoja.
H1 : kintamieji koreliuoja.

215

V. ekanaviius, G. Murauskas

216

36

Statistin ivada
su p - reikme

Pavyzdys
Ar vyresni, nei 50 m. respondentai,
palankiau vertinantys miuziklus,
palankiau vertina ir klasikin muzik?
rangini kintamj reikms: 1-labai
palankiai, 2-palankiai,.,5-labai
nepalankiai.
Tarkime, kad reikmingumo lygmuo yra
0,05.

H0 atmetame (kintamieji stat. reikmingai


koreliuoja), jei

p<

H0 neatmetame (kintamieji stat. reikm.


nekoreliuoja), jei

ia

- reikmingumo lygmuo
V. ekanaviius, G. Murauskas

217

V. ekanaviius, G. Murauskas

SPSS

Spearman specialus atvejis

Correlations

Spearman's rho

CLASSICL

Correlation Coefficient

CLASSICL
Classical
Music
1.000

Sig. (2-tailed)
MUSICAL
S

218

MUSICALS
Broadway
Musicals
.399**

1.

.000

504

Correlation Coefficient

.399**

Sig. (2-tailed)

.000

489

499

489
1.000

**. Correlation is significant at the .01 level (2-tailed).

2.
3.
4.

Kiekviena i dviej mokytoj surikiavo


mokinius pagal gabumus.
Pirma: A, B, C, D, E, F, G, H, I,J, K, L.
Antra: B, C, A, D, H,E, F, G, K, I,J, L.
Ar mokytoj nuomons koreliuoja?

Stat. reikmingai koreliuoja. Palankiau vertinantys


miuziklus, palankiau vertins ir klasik.
V. ekanaviius, G. Murauskas

219

V. ekanaviius, G. Murauskas

220

SPSS
Statistin hipotez:

Pirma: A,B,C,D,E,F,
G,H,I,J,K,L
Antra: B, C, A,D,
H,E, F,G,K,I,J,L.

H0 : nuomons nekoreliuoja.
H1 : nuomons koreliuoja.

is stulpelis
nebtinas

V. ekanaviius, G. Murauskas

221

V. ekanaviius, G. Murauskas

222

37

SPSS
Correlations

Spearman's rho

MOKYT1

Correlation Coefficient

MOKYT1
1.000

Sig. (2-tailed)
N
MOKYT2

MOKYT2
.916**

.
12

12

Correlation Coefficient

.916**

Sig. (2-tailed)

.000

12

12

Kruskal - Wallis kriterijus

.000
1.000

**. Correlation is significant at the .01 level (2-tailed).

nuomons labai stipriai teigiamai koreliuoja


V. ekanaviius, G. Murauskas

223

V. ekanaviius, G. Murauskas

Kruskal-Wallis kriterijus
1.

2.
3.

4.
5.

Duomenys

Mann-Whitney kriterijaus apibendrinimas


keletui (2 ir daugiau) imi.
Interpretuojamas visikai analogikai;
vidutinis rangas rodo didesnius imi
balus.
nepasako, kurie kintamieji skiriasi.
yra ANOVA neparametrinis analogas.

V. ekanaviius, G. Murauskas

224

1.

2.

keletas nepriklausom intervalini


arba rangini imi.
skirting ranginio kintamojo reikmi
turi bti bent 5.

225

V. ekanaviius, G. Murauskas

226

Statistin ivada
su p - reikme

Statistin hipotez:

H0 atmetame (kakurie skirstiniai stat.


reikmingai skiriasi), jei

H0 : visi skirstiniai nesiskiria


H1 : kakurie skirstiniai skiriasi.

p<

H0 neatmetame (visi skirstiniai stat.


reikm. nesiskiria), jei

ia
V. ekanaviius, G. Murauskas

227

- reikmingumo lygmuo
V. ekanaviius, G. Murauskas

228

38

Pavyzdys
Ar tarp prasimokiusi nemaiau 13m.
respondent vis rasi atstovai
vienodai vertina rap?
rangini kintamj reikms: 1-labai
palankiai, 2-palankiai,.,5-labai
nepalankiai.
Tarkime, kad reikmingumo lygmuo yra
0,05.
V. ekanaviius, G. Murauskas

Friedman kriterijus

229

V. ekanaviius, G. Murauskas

Friedmano kriterijus
1.

2.

3.

4.
5.

Rang interpretacija

Wilcoxon kriterijaus apibendrinimas


keletui (2 ir daugiau) imi.
jei imtys 2, Wilcoxono kriterijus
geriau.
interpretacija paprastesn u
Wilcoxon
nepasako, kurie kintamieji skiriasi.
yra Repeated measures
neparametrinis analogas
V. ekanaviius, G. Murauskas

1.

2.

3.

231

Duomenys
1.

2.

3.

Tarkime respondentas para trims


aktoriams paymius: aktoriui A - 10,
aktoriui B - 6, aktoriui C - 8.
Paymiai ranguojami. Aktori gauti
rangai: aktoriaus A - 3, aktoriaus B -1
, aktoriaus C - 2.
vidutiniai rangai atspindi t pat.

V. ekanaviius, G. Murauskas

232

Statistin hipotez:

keletas imi, gaut matuojant


priklausomus intervalinius arba
ranginius kintamuosius.
skirting ranginio kintamojo reikmi
turi bti bent 5.
galima kiekvieno respondento
atsakymus suranguoti ir inaudoti
tuos rangus.
V. ekanaviius, G. Murauskas

230

H0 : vis kintamj skirstiniai


nesiskiria.
H1 : kakuri kintamj skirstiniai
skiriasi.

233

V. ekanaviius, G. Murauskas

234

39

Statistin ivada
su p - reikme

Pavyzdys
Ar prasimok daugiau nei 15 m.
respondentai, vienodai palankiai
vertina miuziklus, klasik ir bigbendus?
rangini kintamj reikms: 1-labai
palankiai, 2-palankiai,.,5-labai
nepalankiai.
Tarkime, kad reikmingumo lygmuo yra
0,05.

H0 atmetame (kakurie skirstiniai stat.


reikmingai skiriasi), jei

p<

H0 neatmetame (visi skirstiniai stat.


reikm. nesiskiria), jei

ia

- reikmingumo lygmuo
V. ekanaviius, G. Murauskas

235

V. ekanaviius, G. Murauskas

SPSS

SPSS
Test

Ranks

CLASSICL Classical Music

236

Mean Rank
1.87

2.05

df

2.08

Asymp. Sig.

MUSICALS Broadway
Musicals
BIGBAND Bigband Music

p-reikm

Statisticsa
343

Chi-Square

14.286
2
.001

a. Friedman Test

palankiausiai vertinta (kodavimas!) klasika

ne visi stiliai vienodai populiars


V. ekanaviius, G. Murauskas

237

V. ekanaviius, G. Murauskas

SPSS

Friedman spec. atvejis

Penki ekspertai vertino al A,B ir C.


Pirmas: B, C, A (t.y. geriausias B,)
Antras: B, C, A
Treias: A arba C, B
Ketvirtas: A, B,C
Penktas: B, A,C
Ar visos alaus rys vienodai
populiarios?
V. ekanaviius, G. Murauskas

238

rangai!

is stulpelis
nebtinas
239

rys

V. ekanaviius, G. Murauskas

240

40

SPSS

SPSS
Test Statisticsa

Ranks

Mean Rank
2.10

1.60

2.30

1.368

df

Asymp. Sig.

.504

a. Friedman Test

populiariausias B alus
V. ekanaviius, G. Murauskas

Chi-Square

vertinim skirtumai stat. nereikmingi


241

V. ekanaviius, G. Murauskas

242

41

También podría gustarte