multe domenii cum ar fi: Medicina, Marketing, Arheologie, Meteorologie etc. Aceasta analiza ajuta la perfectionarea in multe domenii. Analiza discriminant este o metoda ce face parte din grupa metodelor explicative de analiz a datelor. Ea utilizeaz o variabil de explicat (Y) i mai multe variabile explicative (X1, X2,,Xp) cantitative sau binare. Analiza are ca principal avantaj ca nu lucreaza cu elemente medii, generatoare de erori. Tehnica de baza a analizei este estimarea pozitiei unui element fata de o linie care separa cel mai bine doua clase de populatii distincte. n analiza discriminant se disting dou aspecte: a) descriptiv: se caut combinaiile liniare de variabile care permit mprirea cel mai bine posibil n cele k categorii i dau o reprezentare grafic (ca n analizafactorial), care ine seama cel mai bine de aceast mprire. b) decizional: un nou individ apare, pentru care se cunosc valorile predictorilor. Cu ajutorul metodei se pot: - face estimatii asupra apartenentei unor elemente la una sau mai multe categorii; - se poate testa daca grupurile dintr-un esantion apar intr-o singura populatie sau in mai multe. Scop identificarea functiilor (variabilelor latente) care permit predictia apartenentei de grup. Este utila : pentru a defini profilul unei tipologii (clasificari) functie de un set de variabile cantitative, regrupate in factori; pentru a permite atribuirea unor noi cazuri la o clasificare predeterminata careia i pot fi asociate functii de discriminare. Principiile pe baza carora functioneaza metoda sunt o combinatie ntre ANOVA , regresie multipla si factoriala. Algoritmul asociat analizei discriminante are ca secvente esentiale: calcularea coeficientilor pentru functiile de clasificare (discriminare); pentru fiecare caz se calculeaza un scor de clasificare corespunzator fiecarei functii de discriminare; cazul se atribuie grupei pentru care scorul de clasificare este maxim; comparatia intre clasificarile corecte (teoretic plasate n aceeasi clasa n care cazul a fost empiric identificat) si cele incorecte indica relevanta variabilelor de discriminare. n concluzie analiza discriminant are trei obiective, respectiv: S determine variabilele explicative care contribuie cel mai mult la diferenierea claselor definite de variabila de explicat, astfel se identific ponderea influenei variabilelor explicative n variaia variabilei de explicat construind mai multe combinaii liniare, alegnd- o pe cea mai bun. De exemplu, o societate productoare, are informaii privind distribuitorii si, care sunt mprii n 3 grupe in funcie de cantitatea pe care o cumpr lunar, astfel: 1-cumpr in cantiti mici, 2-cumpr in cantiti medii, 3- cumpr in cantiti mari. Se impune identificarea variabilelor ce conduc la aceast difereniere, cum ar fi cifra de afaceri, mrimea forei de vnzare, numr de ani de activitate n acest domeniu etc. S se construiasc un spaiu discriminant . n cazul analizei discriminante simpl (Y are dou stri) se determin o ax discriminant Z care explic apartenena unei uniti la o clas sau alta. n cazul analizei discriminante multipl se determin mai multe combinaii liniare independente (axe discriminante) de variabile explicative i trebuie analizat spaiu determinat de acele axe care separ cel mai bine unitile studiate, in clasele determinate de strile variabilei Y. n exemplul prezentat vom avea dou funcii discriminante, dar trebuie s le cutm pe acelea care repartizeaz ct mai exact unitatile distribuitoare n cele 3 grupe. Aprecierea calitii discriminrii se realizeaz cu ajutorul scorului discriminant (acesta trebuie s fie ct mai aproape de 1). S repartizeze la o clas existent unitile ce nu au fost clasate. Respectiv, cunoscnd nivelul variabilelor explicative i utiliznd funciile discriminante vor fi repartizate noile uniti in clasele deja formate. Aceast se poate realiza prin dou procedee: unul determinist, care repartizeaz unitatea la clasa pentru care distana la centroid este cea mai mic i unul probabilist, unde se calculeaz probabiliti de apartenen la diferite clase, unitatea se aloc la clasa care are probabilitatea cea mai mare. Analiza Discriminanta
Este utilizata pentru a prezice daca un
angajat este sau nu fumator Variabilele predictor: Varsta Numarul de zile in care a absentat in anul precedent Conceptul de sine Anxietate Atitudinea anti-fumat la locul de munca Pasii: Grupurile difera foarte mult intre ele din punct de vedere al caracteristicilor studiate. Variabilele independente exercita o influenta semnificativa asupra celei dependente In acest caz log deterninat sunt similari. Nr max de functii = nr de stari var dep 1 => o Modelul explica singura functie 64,32% din informatie.
Indica o semnificatie ridicata a
35,6% proportia functiei. variabilelor totale neexplicate. Arata contributia unica a fiecarui predictor si furnizeaza informatii asupra importantei relative a fiecarei variabile.
Conceptul de sine cel mai
puternic, urmat de anxietate. Nefumatorii au o medie de 1,125, in timp ce fumatorii au o medie de -1,598. Arata faptul ca 91,8% din respondenti au fost clasati corect in cele doua grupe de fumatori si nefumatori. Nefumatorii au fost prezisi cu mai multa acuratete (92,6%) decat fumatorii (90,6%). Histograma: Concluzii: Diferentele semnificative ale mediilor au fost observate pentru toti predictorii; In timp ce log determinants au fost similari, Boxs M indica faptul ca ipoteza nula a fost respinsa, dar avand in vedere ca avem o baza de date mare, aceasta problema nu este tocmai importanta; Functia discriminanta arata o asociere semnificativa intre grupe si toti predictorii, varianta intre grupe fiind de 64,32%. Cu toate ca tabelul: structure matrix ne prezinta doar 2 predictori ca fiind importanti conceptul de sine (0.76) si anxietatea (-0.527), 91,8% din totalul respondentilor au fost corect clasificati. Va multumim!!!