Está en la página 1de 49

Captulo 5

Medidas Descritivas

5.1 - Introduo
Conforme foi visto no captulo 3, ao se
analisar uma distribuio de freqncias,
deve-se observar caractersticas como a
tendncia central, a disperso, e a forma
da distribuio dos dados.
Estas caractersticas podem ser descritas
por parmetros denominados medidas
descritivas de uma populao ou amostra
de dados.

5.2. MEDIDAS DE TENDNCIA


CENTRAL
Refere-se concentrao dos dados de
uma amostra ou populao em torno de
um valor intermedirio.
As principais medidas de tendncia
central so a mdia aritmtica, a mediana
e a moda.

5.2.1. MDIA ARITMTICA


SIMPLES
A mdia aritmtica ou simplesmente mdia de
uma varivel quantitativa pode ser simples ou
ponderada.
definida como o quociente da diviso da soma
dos dados da amostra (populao) pelo
tamanho da amostra (populao).
Se x1, x2, ..., xN constituem a populao de
dados de uma varivel quantitativa X, a mdia
aritmtica simples desta populao :

Se x1, x2, ..., xN


constituem a populao
de dados de uma varivel
quantitativa X, a mdia
aritmtica simples desta
populao :

No caso de uma amostra


de n dados de uma
varivel quantitativa X, a
mdia aritmtica :

xi

i
=
1
=

x=

xi

5.2.1.2. MDIA ARITMTICA


PONDERADA
Em algumas situaes, ao se determinar a
mdia, atribui-se uma importncia maior ou
menor a determinada observao.
A importncia de um valor determinada por
um fator denominado peso ou ponderao.
Neste caso, a mdia aritmtica definida como
o quociente da diviso da soma dos produtos
das observaes pelos respectivos pesos, pela
soma dos pesos, sendo denominada mdia
aritmtica ponderada.

Assim, se x1, x2, ..., xN,


constituem a populao de N
dados de uma varivel
quantitativa X, sendo
atribudos a este dados os
pesos p1, p2, ..., pN, , a mdia
aritmtica ponderada desta
populao
Por outro lado, se x1, x2, ...,
xn, constituem uma amostra
de n dados de uma varivel
quantitativa X, sendo
atribudos a este dados os
pesos p1, p2, ..., pn, , a mdia
aritmtica ponderada desta
amostra

x i pi

p = i =1
N
pi
i =1
n

x i pi

x p = i =1
n
pi
i =1

5.2.2. MEDIANA
A mediana de N dados da populao de uma
varivel quantitativa o valor que se localiza no
centro do conjunto de dados quando estes so
dispostos em ordem crescente.
Conseqentemente, metade ou 50% dos dados
esto abaixo da mediana e a metade ou os
50% restantes esto acima da mesma.
Se N mpar, a mediana o valor que ocupa a
posio (N+1)/2; se N par, a mediana e, por
conveno, a mdia aritmtica entre o valor de
posio N/2 e o de posio (N/2)+1.

5.2.3. MODA
Denomina-se moda o dado mais frequente da
populao ou de uma amostra de dados de uma
varivel quantitativa.
A moda pode no existir e se existir, pode no
ser nica. Assim sendo, uma distribuio de
dados pode ser amodal quando no tem moda,
unimodal quando tem moda nica, bimodal
quando tem duas modas e, em geral
multimodal, se tiver vrias modas.

5.2.4. PERCENTIS

O percentil de ordem k de n dados de uma varivel quantitativa


dispostos em ordem crescente um valor tal k/100 ou k % destes
n dados esto abaixo e 1k/100 ou 100k% restantes esto acima
do referido valor.
Se k = 50, o percentil de ordem correspondente a mediana;
se k = 25, 50 e 75, os percentis com as ordens correspondentes
so denominados 1.quartil, 2. quartil e 3. quartil,
respectivamente; se k = 10, 20, 30, ..., 90, os percentis de ordem
correspondentes so denominados 1. decil, 2. decil, 3. decil, ...,
9. decil, respectivamente.
O ksimo percentil de uma populao de N dados quando estes
esto dispostos em ordem crescente o valor de posio
k(N+1)/100. No caso de uma amostra de n dados, o ksimo
percentil da amostra o valor de posio k(n + 1)/100.

5.2.5. MEDIDAS DE TENDNCIA


CENTRAL DE DADOS AGRUPADOS

Mdia aritmtica

Mediana

l o limite inferior da classe mediana


F(ant) a frequencia acumulada da
classe anterior a classe mediana
f frequencia da classe mediana
h amplitude da classe medana

xi f i

x
fi

kn

F (ant ) h

~
100

X l
f

Moda

l o limite inferior da (s) classe (s) de


maior freqncia (classe modal),
h a amplitude da classe (s) modal (is),
fm a freqncia da classe modal,
fa a freqncia da classe adjacente
anterior
fp a freqncia da classe adjacente
posterior.

fm - fa
mo = + h
2 fm - f a - fp

5.2.6. EMPREGO DAS MEDIDAS DE


TENDNCIA CENTRAL
A mdia a medida mais utilizada devido as
suas propriedades aritmticas.
Porm esta medida fortemente influenciada
por valores discrepantes e neste caso utiliza-se
a mediana.
A moda pouco utilizada.
Porm, se a freqncia do valor que mais
ocorre acentuadamente maior que as dos
demais valores, a moda pode ser utilizada como
medida de tendncia central.

5.3. MEDIDAS DE DISPERSO


Estas medidas indicam o grau de
disperso dos dados de uma populao
ou amostra de uma varivel quantitativa
em torno de uma medida de tendncia
central.
A disperso pode ser absoluta ou relativa

5.3.1. MEDIDAS DE DISPERSO


ABSOLUTAS

5.3.1.1. Varincia
Se x1, x2, ..., xn constituem a
populao com mdia de N dados
de uma varivel quantitativa X, a
varincia desta populao
onde xi (i = 1, 2, ..., N) so os
desvios dos dados em relao
mdia da populao. A varincia a
mdia dos quadrados dos desvios em
relao mdia aritmtica.
A frmula acima pode ser modificada,
considerando-se que

Esta frmula alm de ser mais prtica,


fornece um resultado mais exato do
que a frmula original porque evita os
arredondamentos quando o valor da
mdia apresenta casas decimais.

2
(
x

)
i

2 i 1
N

( xi )

i 1

i 1

xi2

2 i 1
N

N
xi2 2

xi N 2

i 1

xi

i 1
N2

Por outro lado, se x1, x2, ...,


xn constituem uma amostra de
n dados de uma varivel
quantitativa X, a varincia
desta amostra
A razo do divisor n 1 em
lugar de n ser explicada
futuramente em estudos mais
avanados.
Modificando-se a frmula
acima como no caso da
varincia de uma populao e
omitindo-se os ndices dos
somatrios tem-se que

2
(
x

x
)
i

s 2 i 1

n 1

xi2

n 1

xi

n(n 1)

Propriedades
da Varincia
Somando-se (ou subtraindo-se) a cada
elemento de um conjunto de valores uma
constante arbitrria, a varincia no se
altera
Multiplicando-se (ou dividindo-se) cada
elemento de um conjunto de valores por
um valor constante, a varincia fica
multiplicada (ou dividida) pelo quadrado
da constante

5.3.1.2. Desvio padro

Sendo a varincia expressa


em termos do quadrado da
unidade de medida da varivel
em estudo, define-se uma
medida de disperso que a
raiz quadrada da varincia.
Esta medida denominada
desvio ou afastamento padro
que, ao contrrio da varincia,
expressa a disperso em
termos da unidade de medida
da varivel, sendo portanto
mais fcil de ser interpretada.

( xi )

2
xi

n 1

xi 2

n( n 1)

Propriedades do Desvio Padro


Somando-se (ou subtraindo-se) a cada
elemento de um conjunto de valores uma
constante arbitrria, o desvio padro no
se altera
Multiplicando-se (ou dividindo-se) cada
elemento de um conjunto de valores por
um valor constante, desvio padro fica
multiplicado (ou dividido) pela constante

5.3.2. Dados Agrupados


nc

x
i 1

fi

nc

x f

i 1

s2

2
x
i fi

n 1

xi f i 2
n( n 1)

onde xi e fi (i = 1, 2, ..., nc) so,


respectivamente, o ponto mdio e a freqncia
da i-sima classe e N = (populao) ou n =
(amostra).

5.3.1.3. Amplitude total ou Range (R)


A amplitude total ou amplitude de variao dos
dados de populao ou de uma amostra de uma
varivel quantitativa definida como a diferena
a entre os valores extremos.
uma medida pouco utilizada porque no
detecta a disperso dos valores intermedirios.
Se os dados estiverem agrupados em classes
numa tabela de distribuio de freqncias, a
amplitude total dada pela diferena entre o
limite inferior da primeira classe e o limite
superior da ltima classe.

Exemplo
Exemplo: Sejam as seguintes amostras A
e B:
A= {5, 6, 7, 8, 25}
B= {5, 8, 11, 19, 25}
Ambas as amostras apresentam Range
(R): R = 25 - 5 = 20 .Porm, em B h uma
maior variabilidade, que a amplitude total
no deixa clara.

5.3.1.2. Desvio semiinterquartlico

Mede a disperso em torno da


mediana, definido como a
Q1 - me Q3 - me me - Q1 + Q3 - me
Q =

mdia das diferenas


2
2
absolutas entre os quartis
extremos (1. e 3.) e a
mediana,
simplificando, tem-se
finalmente que
O desvio semi-interquartlico
mede a disperso dos dados
3
1
entre Q1 e Q3desprezando a
disperso dos dados abaixo
de Q1 e acima de Q3.

Q Q
Q
2

5.3.1.4. Desvio mdio


desvio mdio definido como a mdia
aritmtica dos desvios.

xi

DM
N

xi x

DM
n

5.3.2. MEDIDAS DE DISPERSO


RELATIVA

Comparar as disperses de dois ou mais conjuntos de valores de


diferentes variveis.
Se as varivel em estudo so medidas em diferentes unidades de
medida ou mesmo que as unidades de medidas sejam as mesmas,
os valores apresentam diferentes ordens de grandeza. Neste caso
deve-se utilizar as medidas de disperso relativa que so
adimensionais

CV 100%

s
CV 100%
x

Exemplo: Sejam os resultados das


medidas das estaturas e dos pesos de um
mesmo grupo de indivduos.

5.4. MEDIDAS DE ASSIMETRIA E


DE CURTOSE
Estes parmetros fornecem informaes sobre
a forma como se distribuem os valores
observados de uma varivel.
A medida de assimetria indica se h mais
valores abaixo ou acima da mdia de uma
populao ou de uma amostra.
A medida de curtose indica se os valores
intermedirios de uma amostra ou populao
so dispersos ou concentrados.

5.4.1. DEFINIO DE ASSIMETRIA


8
7

freqncia

6
5
4
3
2
1
0
11

13

15

17

valores

Figura 5.1. Distribuio simtrica

Freqncia

Freqncia

19

4
3

4
3

0
11

13

15

Valores

17

19

Figura 5.2. Distribuio assimtrica positiva

11

13

15
Valores

17

19

Figura 5.3. Distribuio assimtrica negativa

5.4.2. COEFICIENTE DE
ASSIMETRIA
Um coeficiente de assimetria indica o grau da
assimetria de uma distribuio de dados. Um
dos coeficientes de assimetria mais utilizados :

3( x ~
x)
As
s
x mdia
~
x mediana

0,15 As 1 assimetria moderada


As 1 assimetria forte

5.4.3. CONCEITO DE CURTOSE

Figura 5.4a. Distribuio leptocrtica

Figura 5.4b. Distribuio mesocrtica

Figura 5.4c. Distribuio platicrtica

5.4.4. COEFICIENTE DE CURTOSE


Q3 Q1
C
2( P90 P10 )
Q3 - 3 quartil
Q1 - 1 quartil
P90 - 90 percentil
P10 - 10 percentil
C 0,263 - curva mesocrtica
C 0,263 - curva leptocrtica
C 0,263 - curva platicrtica

5.5. ANLISE DE DADOS A PARTIR


DAS ESTATSTICAS DE ORDEM

As caractersticas de uma distribuio so em geral descritas informando os


valores da mdia e do desvio padro e, algumas vezes do coeficiente de
assimetria.
Porm a mdia e o desvio padro so fortemente influenciados pela
presena de valores discrepantes.
Para contornar esta dificuldade, John Tukey (1977) props descrever as
caractersticas de uma distribuio atravs das estatsticas de ordem que
so, a mediana, os quartis ou juntas e os extremos, apresentados no
esquema a seguir.

~
x
J
E

Ei

~
x

Q1

Q3

Es

onde n o nmero de observaes,

~
a mediana, J as juntas (1 quartil e 3 quartil) e
x E os
extremos (o menor valor observado, E e o maior valor observado, E
i

As caractersticas da distribuio da populao pode ser analisada a partir


do diagrama de Tukey (boxplot em ingls), devido a sua configurao.
A diferena DI = Q3 Q1 denominada desvio interquartlico e pode ser
empregada como medida de disperso.
Este diagrama indica as seguintes caractersticas: a) tendncia central:
dada pela posio da mediana na escala de medida da varivel; b)
disperso: medida pelo valor de DI; c) assimetria: indicada a partir da
comparao das diferenas Q1 e Q3 .
Todos os valores observados inferiores a e superiores a so discrepantes
(outliers).
Os valores a e b so o menor valor observado no discrepante e o maior
valor observado no discrepante, respectivamente.

Ei

Q1

~
x

Q3
DI

Es

Medidas de Posio Relativa


As medidas de posio relativa nos
permitem determinar o quo um valor em
particular est afastado da mdia. As
principais so:
Escore Padronizado,
Regra de Chebyshev e a
Regra Emprica.

Escore Padronizado (z-score)

Exemplo
Em um exame final de Estatstica, o grau mdio
de um grupo de 150 estudantes foi 78 e o
desvio padro, 8.0. Em Contabilidade,
entretanto, o grau mdio final do grupo foi 73 e
o desvio padro, 7.6.
Um estudante obteve os graus 90 em Estatstica
e 85 em Contabilidade. Em qual dos exames ele
obteve melhor desempenho?

Regra de Chebyshev

Exemplo
O Controle se qualidade de uma empresa
recebeu um lote de 1000 peas com a medida
principal apresentando mdia igual a 50 e
desvio padro igual a 2. O gerente do controle
de qualidade deseja determinar o nmero de
peas que se encontram nos seguintes
intervalos:
a. 47 a 53
b. 45 a 55
c. 44 a 56

Regra Emprica

Usada somente quando o conjunto de dados


normalmente distribudo. Para dados que tm
uma distribuio de freqncia descrita pela
curva normal:
Aproximadamente 68% das observaes esto
dentro de 1 desvio padro da mdia.
Aproximadamente 95% das observaes esto
dentro de 2 desvios padro da mdia.
Aproximadamente 99,7 % das observaes esto
dentro de 3 desvios padro da mdia.

Exemplo
Suponha que um conjunto de dados tenha
distribuio normal com mdia igual a 30
e desvio padro, 5. Use a Regra emprica
para determinar a porcentagem de dados
que se encontram dentro de cada um dos
seguintes intervalos.
a. 20 a 40
b. 15 a 45
c. 25 a 35

También podría gustarte