Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Model - pojednostavljena slika realnosti Model slui da se na adekvatan nain kvantificiraju sloeni ekonomski fenomeni i relacije izmeu njih Pretpostavke koje moraju biti zadovoljene kako bismo mogli modelizirati vezu izmeu varijabli: Modeliziranje moemo vriti ukoliko postoji zavisnost izmeu varijabli Funkcionalna versus stohastika meuzavisnost Mogu se modelizirati jedino kvantitativne varijable, jer je u tom sluaju mogue kompletirati oblak (dijagram) rasipanja, raunati mjere centralne tendencije i disperzije Regresioni model - model koji kvantificira oblik meuzavisnosti izmeu dvije ili vie varijabli
Veza postoji
y y y
a y
x y
x y
Veza ne postoji
Pitanje
Rjeenje Prvi korak je da identificiramo zavisnu i nezavisnu varijablu: Nezavisna varijabla je broj dana pohaanja nastave Zavisna varijabla je ocjena Potom kreiramo dijagram rasipanja da sagledamo vezu izmeu posmatranih varijabli. Rjeenje, cont.
Dijagram rasipanja
1,1 1 0,9 0,8 a 0,7 n e j 0,6 0,5 c 0,4 o 0,3 0,2 0,1 0 0 10 20 30 dani pohaanja nastave 40
Rjeenje, cont. Na bazi dijagrama rasipanja zakljuujemo sljedee: Postoji meuzavisnost Smjer veze je direktan (vie dana pohaanja nastave via ocjena) Veza se moe ocijenti linearnim regresionim modelom
Kovarijansa
Tumaenje kovarijanse Kovarijansa je pozitivna ako oblak rasipanja ima generalno rastuu tendenciju. Kada X i Y variraju u istom smjeru, kovarijansa je pozitivna. Kovarijansa je negativna kada oblak rasipanja ima generalno opadajuu tendenciju. Kada X i Y variraju u suprotnom smjeru, kovarijansa je negativna. Kovarijansa je jednaka ili priblino jednaka nuli ako oblak rasipanja nije ni rastui ni opadajui ili ukoliko je pola opadajui, a pola rastui. Ako nema ni rastue ni opadajue generalne tendencije, kovarijansa je jednaka nuli.
Pitanje U jednom regionu pratili smo varijable broj industrijskih postrojenja i broj oboljelih od astme po gradovima. Kovarijansa ove dvije varijable iznosi 34,6. Veza izmeu ove dvije varijable je: a) multipla b) direktna c) indirektna d) jaka
Meutim, ukoliko su X i Y nezavisne varijable kovarijansa je jednala nuli (Cov(X, Y)=0). U tom sluaju varijansu za zbir i razliku statistikih varijabli moemo izraziti sljedeim relacijama: Var(X+Y)=VarX + Var Y
Var(X-Y)=VarX + Var Y
Regresioni model
Kvantificira ili matematski formalizira vezu izmeu zavisne i niza nezavisnih varijabli oblik veze Opti oblik regresionog modela glasi:
gdje je:
Yi = f ( X 1i , X 2i,.., X ji ,.., X ki ) + ei
Yi - zavisna promjenljiva, Xj - nezavisne promjenljive i ei - sluajno odstupanje.
Prezentirani model naziva se model viestruke ili multiple regresije ili viedimenzionalni regresioni model.
Yi = f ( X i ) + ei
yi = a + b xi + ei , i = 1,2,...,n.
gdje su parametri a i b parametri linearne veze koje je potrebno ocijeniti.
yi =
( a + b xi )
yi -funkcionalni dio modela
ei
stohastiki dio modela
Funkcionalni dio modela odnosi se na varijabilitet zavisne varijable nastao pod uticajem varijabiliteta nezavisne varijable i predstavljen je lineranom vezom Stohastiki dio modela (rezidualno odstupanje) odnosi se na varijabilitet zavisne varijable nastao pod uticajem varijabiliteta varijabli ili faktora koji nisu ukljueni u regresioni model
yi = yi +ei ei = yi yi ei = yi ( a + b xi )
yi
y e i= ( y i - y i )
y i = a + b xi
yi
xi
xi == a 0 yi
Parametar b je matematski nagib prave koja predstavlja jednostavni linearni regresioni model, to jeste pokazuje za koliko e se jedinica promijeniti zavisna varijabla ukoliko se nezavisna varijabla povea za jednu svoju jedinicu:
x = 1 y = b
Primjer 1, cont. Vezu izmeu analiziranih varijabli ocijeniti odgovarajuim regresionim modelom.
1,1 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 0 5 10 15 20 25 30 35 40
a n e j c o
Na osnovu dijagrama rasipanja za ovaj primjer zakljuili smo da je adekvatno konstruisati linearni regresioni model, te ocjenjujemo parametre jednostavne linearne regresije.
Rjeenje
Rjeenje, cont.
b=
n x y x y n x 2 ( x )
2
Ocjena e porasti za 0,0166 ako se broj dana pohaanja nastave povea za 1. (direktna veza)
a = y bx =
Student koji ima 0 skor za pohaanje nastave e prema modelu imati ocjenu 0,4097. Regresioni model glasi:
yi = 0, 4097 + 0, 0166 xi
Pitanje 1. Izmeu koliine proizvodnje kao nezavisne varijable i trokova proizvodnje kao zavisne varijable utvrena je regresiona veza oblika:
y i = 1,3 x i + 10
Vrijednost 10 u ovoj funkcionalnoj vezi predstavlja: a) trokove po jedinici proizvoda b) ukupne trokove c) dobit po jedinici proizvoda d) fiksne trokove Pitanje 2.
Pratili smo uticaj broja agenata osiguranja na broj prodanih polica osiguranja i dobijena je regresiona veza Ukoliko se broj agenata povea za 1, broj prodanih polica e se: a) poveati za 1 b) smanjiti za 2 c) poveati za 2 d) poveati za 8
yi = 2 xi + 8
Prim 2 jer
Istraivanje da li postoji veza izmeu godina starosti polovnog automobila tipa C i njegove tekue prodajne cijene za 8 polovnih automobila dalo je sljedee rezultate:
Starost auta u godinama Cijena u $000 1 2 3 4 5 6 7 8 15 13 12 10 9 7 6 4
Primjer 2, cont. Konstruisati oblak rasipanja. Komentar. Konstruisati odgovarajui regresioni model. Objasniti parametre.
Rjeenje
U Excelu biramo opciju Chart Wizard i u okviru nje Scatterplot:
Rjeenje, cont.
Ovakav oblak rasipanja ukazuje na postojanje indirektne veze izmeu analiziranih varijabli.
R n , c t. je e je on
Kod odreivanja param etara a i b koristiem Excelove o statistike funkcije:
yi = 16375,14 1523,81 xi
to znai da: Ako kupujemo novo auto analiziranog tipa C njegova oekivana cijena je $16 375,14 Ako starost auta poraste za jednu godinu oekujemo da e cijena tog auta da se smanji za $1 523,81 (indirektna veza)
Pokazatelji reprezentativnosti ili kvaliteta regresionog modela kvantificiraju stepen meuzavisnosti i izraavaju direktno ili indirektno odstupanje vrijednosti zavisne varijable ocijenjenih regresionim modelom od orginalnih vrijednosti zavisne varijable. Pokazatelji reprezentativnosti regresionog modela su: 1. koeficijent determinacije, 2. koeficijent korelacije, 3. standardna greka i 4. koeficijent varijacije regresionog modela.
Dekompozicija varijanse
Dekompozicija varijanse, cont. Dekompozicija varijanse za orginalni podatak o vrijednosti zavisne varijable matematski se moe matematski izraziti kao:
yi = y + ( yi y ) +( yi yi )
gdje: je orginalna vrijednost zavisne varijable iz niza podataka dobijenih istraivanjem je procjenjena ili predviena vrijednost zavisne varijable na bazi regresionog modela
yi yi
y=y
( yi ) = y( + yi yi) y y () i
O dstupanje orginalnih podataka za zavisnu varijablu od prosjeka zavisne varijable O dstupanje podataka ocjenjenihregresionim m odelomza zavisnu varijablu od prosjeka zavisne varijable ovo je dio koji ukazuje na m euzavisnost izm eu zavisne i nezavisne varijable
Odstupanje podataka ocjenjenihregresionim m odelomza zavisnu varijablu od orginalnih vrijednosti zavisne varijable ovo je dio koji ukazuje na uticaj drugih faktora koje regresioni m odel nije ukljuio na zavisnu varijablu .
D k moi i av rj ne c n. e o p zcj ai a s , o t
A ok a rir m o ao s p n i s m a oih d b e o k v d a o v d tu a ja u ir m , o i m s m k a r tak jes z ro e u e v da o u b jiv :
( y = ) 2 yi
Ukupan varijabilitet sum kvadrata a odstupanja orginalnih vrijednosti zavisne varijable od njenog prosjeka
yi (+ y
( yi yi) )
2
Objanjeni varijabilitet - sum kvadrata a odstupanja u okviru regresionogm odela ovo je dio varijabilitetazavisne varijable koji se m oe predvidjeti na osnovu poznavanja vrijednosti nezavisne varijable
Neobjanjeni varijabilitet sum kvadrata odstupanja a koja nije objanjena regresionimm odelom
( y = ( y
i i
) y = 2 1 ) y
2
i ( yi y i ( y y
2 2
) )
P k z jed v rija ilite z v n v rija lek ji jeo ja n nre re io im o a u io a b ta a is e a b o b je g s n m d lo k zu a n z v n v rija leb m d la o e m ro tic j e a is e a b iz o e . R la n m ra iz v s u% e tiv a je , ra a a e . M u e v d o ti izin rv la o e z ti rije n s te a 0 do+ (ili 0 -1 0 ) . 1 0% V v d o t o o k e ije tau a u d jev p p rc o ja n n u e a rije n s v g o fic n k z je a e a ro o ija b je e u u n j v rija s i d jeo a ra i m d l p u d n i re re e ta n k p o a n i a d b n o e o z a iji p z n tiv iji.
Koeficijent korelacije
Mjeri jainu i smjer povezanosti dvije pojave za koje poznajemo empirijske vrijednosti kvantitatinih varijabli.
r= r =
2
( y i y ) 2 ( y i y ) 2
Neimenovani broj. Kao i kod koeficijenta determinacije sa kojim je u funkcionalnoj vezi, vea vrijednost ovog koeficijenta ukazuje da je vea proporcija objanjene u ukupnoj varijansi i da je odabrani model pouzdaniji i reprezentativniji.
r=
Cov( X , Y ) = X Y
(x
(x
i
x )( yi y )
x )2
( y
y )2
Vrijednost koeficijenta linearne korelacije se nalazi izmeu -1 i 1. Vea vrijednost koeficijenta ukazuje na postojanje vee linearne povezanosti izmeu promjenjljivih X i Y. Manja vrijednost r ne mora uvijek znaiti da je slaba korelacija jer se moe raditi o pogrenoj primjeni koeficijenta linearne korelacije za mjerenje jaine veze pojava koje nisu u linearnom odnosu. Tumaenje: Za vrijednosti: -1 < r < 0 korelacija je negativna (stohastika). Za vrijednosti: 0 < r < 1 korelacije je pozitivna (stohastika). Za vrijednosti 1 i 1, radi se o perfektnoj negativnoj odnosno pozitivnoj korelaciji, to jeste o funkcionalnoj vezi.
Napomena: ako je mogue uvjek je bolje prvo testirati hipotezu H0: r=0, a tek onda komentarisati koeficijent korelacije. Standardna greka ocjene Prema vrijednosti neobjanjenog varijabiliteta za regresioni model odreujemo standardnu greku ocjene:
Standardna greka ocjene, cont. Mjeri kvalitet i reprezentativnost ocijenjenog regresionog modela i pokazuje prosjeno odstupanje empirijskih vrijednosti zavisne varijable Y od podataka ocijenjenih regresionim modelom. Apsolutna mjera disperzije oko regresije jer se izraava u istim jedinicama mjere kao zavisna varijabla. Vea vrijednost ovog pokazatelja ukazuje da je vea proporcija neobjanjene u ukupnoj varijansi i da je odabrani model manje pouzdan i manje reprezentativan i obratno. Koeficijent varijacije regresionog modela Relativni pokazatelj kvaliteta regresionog modela Jednak je odnosu standardne greke ocijenjenog regresionog modela i aritmetike sredine zavisne varijable Y:
kVy =
y
y
100
Vea vrijednost ovog pokazatelja ukazuje da je vea proporcija neobjanjene u ukupnoj varijansi i da je odabrani model manje pouzdan i manje reprezentativan i obratno.
Koeficijent varijacije regresionog modela, cont. Na osnovu vrijednosti ovog koeficijenta moemo procijeniti preciznost i kvalitet ocjene na sljedei nain: Ako je Ako je Ako je Ako je u intervalu 7%<kv 10%, ocjena je relativno dosta dobra u intervalu 4%< kv 7%, ocjena je dobra u intervalu 1%< kv 4%, ocjena je vrlo dobra kv 1%, ocjena je odlina.
Predvianje Regresioni model dobijen MNK metodom koristimo za predvianje vrijednosti zavisne varijable na osnovu poznate vrijednosti nezavisne varijable. to je: Vii koeficijent determinacije i korelacije Nia standardna greka procjene Nii koeficijent varijacije regresionog modela to je predvianje pouzdanije i obratno. Predvianje, cont. Predvianje na osnovu regresionog modela moe biti: 1. Interpolacija ako se dato X (vrijednost nezavisne varijable) nalazi u rangu vrijednosti nezavisne varijable na osnovu kojih je izveden regresioni model za predvianje 2. Ekstrapolacija ako se dato X (vrijednost nezavisne varijable) ne nalazi u rangu vrijednosti nezavisne varijable na osnovu kojih je izveden regresioni model za predvianje Interpolacija daje pouzdanije procjene od ekstrapolacije.
Primjer 1, cont.
Primjer 2, cont. Da se prisjetimo, u ovom primjeru smo pratili vezu izmeu godina starosti polovnog automobila tipa C i njegove tekue prodajne cijene.
Analizirati kvalitet (reprezentativnost) regresionog modela kojim je ocjenjena veza izmeu godina starosti polovnog automobila tipa C i njegove tekue prodajne cijene. Koliku cijenu oekujemo kod automobila starog 10 godina?
Rjeenje, cont.
se koristi ako imamo pojave za koje su podaci dati u obliku modaliteta rang varijable:
= 1
6 di 2 n3 n
di = rx ,i ry ,i
Primjer 3 Dva umjetnika su ocjenjivala est umjetnikih dijela sa ocjenama u obliku rangova 1 (najbolji) do 6 (najloiji). U tabeli su prezentirane njihove ocjene: Umjetnik Umjetnik 1 Umjetnik 2 o djelo A B C D E F 6 5 1 3 4 2 5 6 2 1 3 4
R enje je
Imamo rangove za dvije varijable te izraunavamo razliku rangova:
Umjetniko djelo A B C D E F sum Umjetnik 1
rx
Umjetnik 2 ry 5 6 2 1 3 4
d 1 -1 -1 2 1 -2
d2
1 1 1 4 1 4 12
6 5 1 3 4 2
= 1
6d2 n n
3
= 1
6 12 = 0, 66 63 6
Ovo ukazuje na relativno visoko direktno slaganje (66%) miljenja dva umjetnika.
Primjer 4
x2
4 9 16 25 36 90
xy
100 219 356 550 768 1993
y2
2500 5329 7921 12100 16384 44234
b) L inearni m odel jednos tavne reg ije potrebni elem res enti
1 X = N
2 X =
20 x i= 5= 4 i =1
Y =
1 N
y =
i =1 i
450 = 90 5
1 N
x
2 i i =1
1 X=
2 90= 4 5
2 Y =
1 N
y Y =
i =1 2 i 2
1 44234 90 2= 5
746,8
C XY =
1 N
x y
i =1
i i
1 X Y = 1993 4 90 38,6 = 5
2 X
38,6 = 2
19,3
povea porasti za 1.000 kom za 19 .300 KM .
a =Y b X
= 90 19,3 4 12,8 =
Ukoliko se ne proizvodi tj. obim proizvodnje je jednak 0, tada su trokovi proizvodnje 12 .800 KM (fiksni trokovi).
yi =1 ,8 1 ,3 i 2+ x 9
c) Koeficijent determinacije
r2 =
99,76% promjena trokova izraenih varijansom duguje se uticaju obima proizvodnje. d) Predvianje
C XY 2 2 X Y2
Zavisna varijabla Y je izraena kao funkcija K nezavisnih varijabli i sluajnog lana e. Ako je funkcionalni dio modela definisan linearnom funkcijom model moemo definisati generalni model viestruke linearne regresije za n vrijednosti sljedeim izrazom
2 Y ;1, 2 ,.., K
( yi y ) 2 = , 0 RY2;1, 2 ,..,K 1 2 ( yi y )
ry1.2 =
ry1 ry 2 r12
2 (1 ry21 )(1 r12 )
ry 2.1 =
Pokazuje jainu i smjer veze zavisne varijable Y i j-te nezavisne varijable uz nepromijenjen uticaj preostalih (K-1) varijabli. Vrijednost ovog koeficijenta se kree u granicama: (-1,1).
ili makar jedna nezavisna varijabla ukljuena u model je znaajna to jeste signifikantno utie na zavisnu varijablu Analiza varijanse ANOVA, Excel U prvoj koloni su informacije o odgovarajuem broju stepeni slobode:
SS regresion = SSobjanjeno = ( yi y ) 2
MS =
regresion
= df
SS regresion
regresion
SS objanjeno SS ukupno
k 1
p-
MS residual =
SS = total df total
=0,05 1 sm tram m del znaajnim (najm nje jedna H Ak je, p < o a o o a o nzv n d e a is ih v rija li u lju e ih um d l je z a a a to je te u e n z v n a b k n oe n jn s ti a a is u v rija lu ). a b