Está en la página 1de 6

Curs nr.

3 i 4 MARKETING

PRELUCRAREA PRIMAR A DATELOR


1.

Coninutul prelucrrii datelor statistice

Datele statistice nregistrate, printr-o modalitate de observare total sau parial, sunt utile n
procesul de cunoatere i pregtire a deciziilor numai dac sunt supuse unor operaiuni de prelucrare.
Prelucrarea, ca etap a cercetrii statistice, cuprinde operaii de rafinare sau transformare cu ajutorul crora
se realizeaz trecerea de la datele individuale la indicatorii derivai, sintetici, care reflect esena din
manifestarea fenomenelor.
Pentru desprinderea aspectelor eseniale i stabile din manifestarea fenomenelor analizate datele statistice
sistematizate trebuie s fie supuse unor operaii de prelucrare. Prelucrarea datelor statistice nregistrate poate fi
primar sau secundar.
Prelucrarea primar cuprinde operaii de clasificri, de grupri, de comparri, de prezentare
sub form de tabele, grafice sau serii statistice. Prin efectuarea acestor operaii se realizeaz sintetizarea
datelor individuale la nivelul grupelor sau claselor, se calculeaz indicatori absolui i/sau relativi, se
prezint sintezele efectuate prin tabele, grafice sau serii statistice. Rezultatele operaiilor de prelucrare
primar sunt elementele de intrare pentru prelucrarea secundar n urma creia se estimeaz valori
tipice, omogenitatea i asimetria distribuiilor, intensitatea legturilor dintre fenomenul analizat i factorii
si de influen etc.

2. Metode de structurare a colectivitilor statistice n funcie de una sau mai


multe caracteristici
Principalele metode sunt clasificarea i gruparea. Obiectivul principal al acestora l
reprezint formarea de clase sau grupe de uniti omogene, din colectivitatea investigat. Prin grup
sau clas omogen nelegem acea grup sau clas n care sunt incluse acele uniti din colectivitate
la care valorile individuale ale caracteristicii urmrit prezint variaii minime, explicate prin
influena factorilor ntmpltori.

2.1. Clasificarea statistic


Clasificarea presupune operaii complexe de sistematizare a unui ansamblu de uniti sau
noiuni, pe baza caracteristicilor lor comune, n clase de uniti, a claselor de uniti n clase de clase
de uniti .a.m.d., cu scopul ca fiecare clas astfel obinut s ocupe un loc precis i stabil ntr-o
structur sau ierarhie. n cadrul operaiei de clasificare se disting obiectele (unitile) de clasificat;
criteriul (criteriile) dup care se efectueaz clasificarea; clasele rezultate din operaii de clasificare.
Clasificarea, ca operaie de sistematizare, se aplic variabilelor calitative, rezultatul
constituindu-l seria de distribuie de frecvene homograd, cum este urmtoarea:
Clasa

Numrul de uniti statistice

x1
x2

n1
n2

xi

ni

xr

nr

Curs nr. 3 i 4 MARKETING

2
r

n ni

TOTAL COLECTIVITATE

i 1

De exemplu, cumprtorii dintr-un magazin au fost rugai s spun cartierul n care locuiesc;
n urma sistematizrii s-a obinut urmtoarea serie de distribuie de frecvene:
Cartierul

Numrul de cumprtori

Dorobani
Militari
Drumul Taberei
Cotroceni
Altele
TOTAL

n *i %

30
80
70
20
150
350

8,5
22,9
20,0
5,7
42,9
100

Alturi de frecvenele absolute, care indic numrul total de uniti statistice cu valoarea
variabilei situat ntr-un interval, vom putea calcula i frecvene relative, adic proporia din
n
n
numrul total de uniti: n *i % i 100 sau n *i i , n care n *i % 100% sau n *i 1 .
n
n

2.2. Gruparea datelor statistice


Pentru VARIABILELE ATRIBUTIVE
Gruparea, ca operaie de sistematizare, se aplic variabilelor cantitative, rezultatul
constituindu-l seria de distribuie de frecvene heterograd.
a) n funcie de numrul de caracteristici, ntlnim:
- grupri simple, n funcie de o caracteristic;
- grupri combinate, n funcie de dou sau mai multe caracteristici.
b) n funcie de variaia caracteristicii urmrite avem:
- gruparea pe variante, n cazul variabilelor discrete sau n cazul n care caracteristica
urmrit prezint un numr redus de variante. Ea presupune stabilirea variantelor n care
vom grupa datele i numrarea unitilor la care se nregistreaz aceeai variant a
caracteristicii. Prin urmare, se obine o serie de distribuie de frecvene heterograd de
forma:
Clasa

Numrul de uniti statistice

x1

n1

x2

n2

xi

ni

xr

nr

De exemplu, a finalul lanului de asamblare a aspiratoarelor se preleveaz un


eantion de 20 aparate. n urma controlului tehnic de calitate s-a constatat numrul de
piese care prezint o defeciune, la fiecare aparat prelevat. Datele nregistrate sunt
urmtoarele:
Numrul de piese care prezint o defeciune minor
1
0
2
0

Curs nr. 3 i 4 MARKETING

1
2
0
0
0
1
3
0
2
1
0
0
n urma gruprii datelor pe variante se obine distribuia de frecvene absolute.
Distribuia aparatelor dup numrul pieselor defecte
Numrul de piese defecte
0
1
2
3
Total

Numr de aparate (ni)


10
6
3
1
20

n *i %

50
30
15
5
100

n cazul seriilor heterograde, cum este i aceasta, se pot calcula frecvenele absolute
cumulate. Acestea pot fi cresctoare sau descresctoare i reprezint numrul unitilor
statistice care au valoarea variabilei mai mic sau eventual egal cu limita superioar a
i

grupei: Fci n k .
k 1

Numrul de piese defecte


0
1
2
3
Total
-

Numr de aparate
10
6
3
1
20

n *i %

50
30
15
5
100

Fci
10
16
19
20
-

Fci
20
10
4
3
1

gruparea pe intervale de variaie, n cazul variabilelor continue sau n cazul n care


caracteristica urmrit prezint o plaj larg de valori posibile. Gruparea datelor pe
intervale de variaie se utilizeaz atunci cnd caracteristica numeric urmrit prezint
un numr mare de valori individuale.
Pentru structurarea colectivitii, pentru evidenierea grupelor (straturilor) tipice din
colectivitate, se pot forma grupri pe intervale egale de variaie sau pe intervale
neegale. Gruparea datelor pe intervale de variaie necesit stabilirea numrului de
grupe i a mrimii intervalelor.
A = xmax - xmin
h

A
, n care r reprezint numrul de grupe.
r

Pentru determinarea numrului de grupe, se ine seama de faptul c numrul acestora


trebuie s fie cuprins ntre 5 i 15 sau se utilizeaz relaia lui Sturges.
h

A
1 3,322 lg n

Dup determinarea mrimii intervalelor de variaie este necesar s se determine


limitele inferioare i superioare ale intervalelor de grupare. Stabilirea limitelor se
poate face astfel: limita superioar a fiecrui interval s se preia ca limit inferioar a
intervalului urmtor, obinndu-se astfel intervale cu limit repetabil sau limitele
inferioare i superioare ale intervalelor de grupare distincte, difereniate printr-o
unitate.
Centrul de interval reprezint valoarea situat la jumtatea distanei dintre limitele
intervalului i este considerat reprezentativ pentru datele din interiorul intervalului.

Curs nr. 3 i 4 MARKETING

Frecvenele relative cumulate (cresctor sau descresctor) reprezint procentul


unitilor statistice care au valoarea variabilei mai mic sau cel mult egal cu limita
superioar a grupei.

Pentru VARIABILELE DE TIMP


Prin sistematizarea acestora, se obine o serie cronologic (dinamic sau de timp), care are
forma urmtoare:
Uniti de timp (momente sau intervale)
1
2

Valori ale variabilei studiate


y1

y2

yt

yn

Pentru VARIABILELE DE SPAIU


Prin sistematizarea acestora, se obine o serie teritorial, care are forma urmtoare:
Uniti teritoriale/administrative
A
B

Valori ale variabilei studiate


yA
yB

yI

3. Metode de prezentare a datelor statistice


3.1.

Tabele statistice

Una dintre cele mai adecvate modaliti de prezentare a datelor statistice o reprezint forma
tabelar, deoarece ea permite caracterizarea structurii colectivitii (populaiei) investigate, a
legturilor dintre grupele sale tipice etc. i este elaborat pentru sistematizarea datelor n vederea
prelucrrii i obinerii indicatorilor sintetici i pentru prezentarea rezultatelor prelucrrii primare i
secundare.
n funcie de scopul analizei i al prelucrrii, n teoria i practica statistic, se elaboreaz i
se utilizeaz o multitudine de tabele statistice.
1. tabele simple, descriptive. Acestea sunt elaborate pentru prezentarea indicatorilor statistici ai
unitilor complexe investigate, ordonai din punct de vedere cronologic, teritorial sau organizatoric;
2. tabele utilizate n prelucrare. Acestea sunt instrumente intermediare utilizate pentru
parcurgerea unor algoritmi de calcul;
3. tabele de prezentare a datelor statistice structurate pe grupe/clase de variaie;
4. tabele de contingen. Acestea sunt tabele cu dubl intrare.
5. tabele statistice de prezentare a valorilor funciilor biometrice sau a repartiiilor statistice
teoretice.
Tabelele statistice, indiferent de tipul lor, de modalitatea lor de elaborare (manual sau
automat), conin una sau mai multe serii.

Curs nr. 3 i 4 MARKETING

3.2.

Serii statistice

Seria statistic, ca rezultat al sistematizrii, definete corespondena dintre dou iruri de


date statistice n care primul reprezint variaia caracteristicii urmrite, iar al doilea ir cuprinde
frecvenele de apariie a variantelor caracteristicii.
n funcie de natura caracteristicilor urmrite, seriile statistice sunt clasificate n:
1. Serii de repartiie (de distribuie), elaborate atunci cnd caracteristica urmrit este numeric
(cantitativ).
2. Seriile cronologice (de timp sau dinamice), care prezint evoluia n timp a unui fenomen sau
descrie un anumit proces. Acestea pot fi de flux (de intervale) sau de stoc (de momente).
3. Seriile teritoriale (sau de spaiu), care prezint variaia teritorial a caracteristicii analizate. n
aceste serii valorile caracteristicii se refer la unitile teritoriale din care fac parte. n mod
frecvent aceste serii se obin dup criterii administrativ-teritoriale, ceea ce nseamn c n cadrul
acestora spaiul este variabil, iar timpul i structura organizatoric sunt considerate fixe.
4. Seriile descriptive (sau enumerative), care se prezint sub form de liste a unitilor dup o
anumit caracteristic.

3.3.

Grafica datelor statistice

Graficele statistice se utilizeaz n scopul vizualizrii mrimii i variaiei independente


i/sau interdependente a datelor, trebuie s ilustreze proporiile care se formeaz ntre diferitele
uniti/grupe/colectiviti/fenomene, tendina de evoluie a unor fenomene sau legturile dintre
diferite procese social-economice.
Uzual, n practica statistic graficele sunt trasate n sistemul de coordonare rectangulare
(ortogonale), adic n raport i proporional cu dou axe perpendiculare. Pe axa OX se vor fixa
variantele sau intervalele de variaie ale caracteristicii independente, momentele sau intervalele de
timp, iar pe axa OY se vor fixa frecvenele, valorile caracteristicii a crei evoluie este urmrit,
valorile sau intervalele de variaie ale caracteristicii dependente. Pentru a respecta proporiile din
date este necesar ca pe cele dou axe punctele s fie fixate la scar. n afar de acest sistem, mai
exist i grafice reprezentate n sistem de coordonate polare. n cazul lor, un punct M este localizat
prin distana r i unghiul , acest sistem fiind utilizat n special n cazul seriilor cronologice.
y

yi

xi
Reprezentare n coordonate
rectangulare

x
Reprezentare n coordonate polare

Curs nr. 3 i 4 MARKETING

Histograma se construiete prin ridicarea unor dreptunghiuri, fiecare dreptunghi fiind de


lime egal cu mrime intervalului de grupare i de nlime egal cu numrul msurtorilor care se
ncadreaz n intervalul respectiv. El se traseaz n cazul seriilor de distribuie de frecvene
heterograde, cazul datelor continue.
Poligonul frecvenelor cumulate ilustreaz grafic frecvenele marcate n relaie cu centrele
de interval i reprezint o alt modalitate de descriere a datelor continue.
Poligonul frecvenelor se construiete pentru a studia normalitatea unei distribuii,
sugernd dac aceasta se apropie sau nu de repartiia normal, frecvent ntlnit n cazul
fenomenelor social-economice cu caracter de mas i vizualizeaz densitile repartiiilor. El se
traseaz n cazul seriilor de distribuie de frecvene heterograde, cazul datelor discrete, prin
ridicarea din centrul fiecrui interval xi a unei linii punctate pn n dreptul frecvenei, unde se
marcheaz un punct. Unind apoi aceste puncte prin linii drepte se obine o linie frnt.
Diagrama prin coloane i benzi este utilizat pentru ilustrarea nivelului, dinamicii sau
structurii unor indicatori ce caracterizeaz o anumit colectivitate statistic sau pentru comparaii
ntre diferite colectiviti. Coloanele sau benzile sunt proporionale cu nivelul indicatorilor
reprezentai. Se utilizeaz la reprezentarea seriilor de distribuie de frecvene homograde i la cea a
seriilor teritoriale.
Diagrama de structur este utilizat pentru a vizualiza ponderile/structura unei
colectiviti. Se utilizeaz la reprezentarea seriilor de distribuie de frecvene homograde i
heterograde. Uzual, se reprezint printr-un cerc complet este 100% sau totalul colectivitii, iar
mrimea fiecrei felii n parte este proporional cu frecvena relativ a categoriei.
Corelorgrama (diagrama de mprtiere sau graficul norului de puncte) se utilizeaz n
cazul seriilor de distribuie bidimensionale. n acest caz, fiecare unitate statistic este reprezentat
printr-un punct de coordonate xi i yi. graficele de acest fel pot indica existena sau inexistena ntre
cele dou variabile studiate, precum i sensul acestora.
Cronograma (historiograma) se folosete pentru reprezentarea grafic a seriilor dinamice.
Pe axa ordonatelor se construiete scara de mrime a indicatorilor seriei dinamice, iar pe abscis se
va reprezenta scara timpului (de regul ani calendaristici). n fapt, cronograma va reprezenta o
curb care va oglindi tendina evoluiei fenomenului social-economic studiat (funcia de trend).
Diagrama polar (radial) este utilizat n situaiile n care seria de timp prezint variaii
sezoniere (de exemplu, pentru reprezentarea temperaturilor medii lunare la o staie meteorologic).
Diagrama prin figuri geometrice de suprafa sau volum utilizeaz figuri geometrice.
Suprafeele sau volumul corpurilor geometrice trebuie s fie proporionale cu volumul fenomenului
ce urmeaz a fi prezentat, iar repartizarea pe grupe se reflect n repartizarea ariei pe sectoare,
proporional cu greutatea specific a fiecrei grupe. Se utilizeaz la reprezentarea seriilor teritoriale.
Cartogramele i cartodiagramele sunt reprezentri grafice care evideniaz variaia
fenomenelor social-economice n profil teritorial, astfel nct pe harta administrativa-teritorial se
haureaz/coloreaz diferit spaiul subunitilor teritoriale, n funcie de intensitatea de manifestare
a fenomenelor. Se utilizeaz la reprezentarea seriilor teritoriale.

También podría gustarte