Está en la página 1de 21

Universidade de So Paulo

Disciplina: Climatologia I ACA 0226

Introduo Estatstica Aplicada Climatologia


Parte I Estatstica Descritiva
Projeto PAE
Bolsista: Michelle S. Reboita

So Paulo, 2005.

Sumrio
1
2

Introduo..........................................................................3
Sobre a Estatstica................................................................3
2.1
Um Pouco da Histria da Estatstica...........................................................................3
2.2
Definio............................................................................................................................ 3
2.3
Conceitos Importantes................................................................................................... 3
Populao:................................................................................................................................... 3
Amostra:.................................................................................................................................... 4
3 Distribuio de Freqncias.......................................................4
3.1
Metodologia para a Elaborao de uma Distribuio de Freqncias..................5
4 Medidas de Posio ou Tendncia Central........................................7
4.1
Mdia.................................................................................................................................. 8
4.2
Mediana.............................................................................................................................. 9
4.3
Moda................................................................................................................................... 9
4.4
Ponto Mdio..................................................................................................................... 10
5 Medidas de Disperso ou de Variabilidade......................................10
5.1
Amplitude Total.............................................................................................................. 11
5.2
Desvio-Padro.................................................................................................................. 11
5.3
Varincia........................................................................................................................... 14
6 Assimetria.........................................................................14
7 Curtose.............................................................................15
8 Separatrizes.......................................................................16
9 Referncias........................................................................20
10 Exerccio...........................................................................20

Projeto PAE Bolsista: Michelle S. Reboita

3
1

Introduo

Os mtodos e tcnicas estatsticas so utilizados em Climatologia basicamente


para analisar o tempo passado com o objetivo de inferir sobre o provvel
comportamento futuro de alguma varivel.
A aplicao de tcnicas estatsticas a dados meteorolgicos tem a vantagem de
compactar o enorme volume de dados, medidos, por exemplo, em uma estao, em uma
simples tabela ou uma equao, capaz de sumariar todas as informaes de modo a
facilitar as inferncias sobre os dados (Assis et al, 1996).
2

Sobre a Estatstica

2.1 Um Pouco da Histria da Estatstica


Conforme descrito em Silva (1998), a estatstica uma cincia que surgiu na
Antigidade e se desenvolveu paralelamente prpria civilizao humana. H mais de
3.000 anos a.C., os antigos egpcios deixaram dados estatsticos sobre seus povos
gravados em monumentos histricos daquela poca, principalmente nas famosas
pirmides. Alm deles, os chineses realizaram um censo demogrfico no ano 2.275 a.C.
e, bem mais tarde, os romanos no ano 556 a.C., tambm realizaram trabalho bastante
semelhante.
Nessas pocas, os censos concentravam-se basicamente no levantamento do
nmero de habitantes, nascimentos, bitos e foras guerreiras, pois seus objetivos
eram voltados a fornecer dados confiveis aos ento governantes.
Na era Crist, principalmente no primeiro milnio, houve tambm diversos
censos demogrficos, notadamente em Israel e alguns pases do ocidente.
Entretanto, a partir do sculo XVI, a estatstica comeou a ganhar importncia,
passando a ser estudada por matemticos e filsofos e, conseqentemente, foi
introduzida nos currculos das universidades.
2.2 Definio
A estatstica uma coleo de mtodos para planejar experimentos, obter
dados e organiza-los, resumi-los, analis-los, interpret-los e deles extrair concluses
(Triola, 1998).
2.3 Conceitos Importantes
Na estatstica os termos populao e amostra so muito utilizados, portanto
necessrio conhecer seus significados.

Projeto PAE Bolsista: Michelle S. Reboita

4
Populao: uma coleo completa de todos os elementos a serem estudados. Ex:
conhecer a altura de todos os habitantes do Brasil.
Amostra: uma sub-coleo de elementos extrados de uma populao. Ex: conhecer a
altura de um conjunto de habitantes do Brasil.
Quando o estudo trata de dados meteorolgicos, temos em mos uma amostra,
pois no conhecemos a populao, devido no haver o registro contnuo dos dados
desde a origem do planeta.
importante determinar se um conjunto de dados se trata de uma amostra ou
de uma populao, pois a metodologia de anlise muitas vezes diferente e, tambm,
as concluses a que devemos chegar. Quando trabalhamos com amostras, os
resultados obtidos nos clculos estatsticos so utilizados para fazer inferncias
(generalizaes) sobre a populao. Vejamos um exemplo: selecionamos os dados
horrios de temperatura do ar do vero de 2004 medidos numa cidade X, com isto
teremos uma amostra. Calculamos a mdia aritmtica deste conjunto e a partir do
resultado obtido podemos inferir que a mdia da temperatura daquela cidade no vero
(no caso todos os veres - populao) corresponde quele determinado valor.
3

Distribuio de Freqncias

Quando estamos trabalhando com estatstica, normalmente, precisamos manipular


grande quantidade de dados. Entretanto, estes devem ser organizados de tal forma a
facilitar o trabalho do investigador do fenmeno. Se possumos um conjunto de dados,
por exemplo, de temperaturas mdias dirias da estao do IAG (localizada em gua
Funda, So Paulo) do ms de dezembro de 2004, devemos disp-los de forma que
consigamos extrair de maneira fcil informaes como: maior e menor temperatura,
quantos dias tiveram temperaturas acima ou abaixo de um determinado valor, etc.
Para tanto, elaborado uma distribuio de freqncias.
A distribuio de freqncias uma tabela que relaciona categorias ou classes
de valores, juntamente com contagens ou freqncias do nmero de valores que se
enquadram em cada categoria (Triola, 1998). A distribuio de freqncias pode ser
representada atravs de um histograma, que um grfico cujas bases so os limites
das classes e as alturas so as freqncias.
Abaixo temos uma distribuio de freqncias (tabela 1) juntamente com um
histograma (figura 1) da temperatura mdia diria do ms de dezembro de 2004 da
estao do IAG. Na tabela o smbolo
indica que o limite de classe inclui o valor da
esquerda e exclui o da direita.

Projeto PAE Bolsista: Michelle S. Reboita

Tabela
1.
Distribuio
de
Intervalos
de
Classe
Freqncias
freqncias da temperatura mdia
16.1 diria
17.8
3
do ms de dezembro
de 2004
17.8 da estao
19.5 do IAG. 8
19.5
21.2
7
21.2
22.9
8
22.9
24.6
4
24.6
26.3
1

Figura 1. Histograma de freqncias.


3.1 Metodologia para a Elaborao de uma Distribuio de Freqncias
De posse de um conjunto de dados, neste caso, de dados de temperatura mdia
diria do ms de dezembro de 2004 da estao do IAG (tabela 2), devemos seguir
alguns passos para a construo de uma distribuio de freqncias.
Tabela 2. Dados de temperatura mdia diria do ms de dezembro de 2004 da
estao do IAG.
Dia

Temperatura (C)

Dia

Temperatura (C)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

18,9
18,7
18,4
23,2
22,3
22
22,4
23
20,9
18,3
17,5
18
19,1
18,9
20

17
18
19
20
21
22
23
24
25
26
27
28
29
30
31

21,5
20,8
22,4
23,7
18,3
16,1
17,2
19,8
22,6
21,2
21,2
20,1
21,4
22,2
23,2

Projeto PAE Bolsista: Michelle S. Reboita

6
16

25,1

Passo 1: Ordenar os elementos dos dados brutos em ordem crescente, indicando a


freqncia absoluta de cada elemento.
Dados brutos: dados que ainda no foram numericamente organizados. So as
observaes.
Freqncia absoluta: nmero de vezes que um valor aparece num conjunto de
dados.
Tabela 3. Dados brutos dispostos em ordem crescente com as respectivas
freqncias.
Temperatura

Freqncias

16,1
17,2
17,5
18
18,3
18,4
18,7
18,9
19,1
19,8
20
20,1
20,8
20,9
21,2
21,4
21,5
22
22,2
22,3
22,4
22,6
23
23,2
23,7
25,1

1
1
1
1
2
1
1
2
1
1
1
1
1
1
2
1
1
1
1
1
2
1
1
2
1
1

Projeto PAE Bolsista: Michelle S. Reboita

7
Passo 2: Determinar o nmero de intervalos de classe (K). O nmero de intervalos de
classe obtido pela regra de Sturges (Crespo, 1997):
K = 1+3,3 (log10 n)

(1)

onde n o nmero total de elementos do conjunto de dados.


K = 1+3,3 (log10 31)
K = 1+3,3 (1,49)
K = 5,9 6
Portanto, a distribuio de freqncias ser constituda de 6 intervalos de
classe.
Passo 3: Determinar a amplitude dos intervalos de classe (h):

imx

ximn 1
k

(2)

onde K o nmero de intervalos de classe e x imx e ximn so respectivamente o maior e


o menor valor do conjunto de dados.

25,1 16,1 1
6
h 1,7

Aps a obteno da amplitude dos intervalos de classe (passo 3), basta


organizar os dados conforme a distribuio de freqncias apresentada na tabela 1.
Para tanto, se pega o menor valor do conjunto de dados e soma-se a amplitude dos
intervalos de classe. Ento, o primeiro intervalo da distribuio de freqncias vai do
menor valor do conjunto at a soma deste com o valor da amplitude dos intervalos de
classe. Aps verifica-se quantos elementos (freqncias) encontram-se neste
intervalo. Este procedimento feito tantas vezes conforme indica o clculo do nmero
de intervalos de classe. Tambm pode ser elaborado o histograma da distribuio de
freqncias (figura 1).
4

Medidas de Posio ou Tendncia Central

Normalmente, quando estamos estudando um fenmeno, seja ele de qualquer


natureza, basicamente impossvel manipularmos todos os elementos da seqncia de
dados, a no ser que a quantidade seja pequena. Entretanto, importante sabermos
onde os valores da seqncia se concentram, facilitando assim a anlise. A estatstica,
por sua vez, fornece medidas que podem caracterizar o comportamento dos elementos
Projeto PAE Bolsista: Michelle S. Reboita

8
de uma srie. Essas medidas so chamadas de medidas de posio ou de tendncia
central, que na prtica, possibilitam determinar um valor compreendido entre o menor
e o maior valor da srie numrica, ou seja, o valor localizado no centro ou no meio de
um conjunto de dados.
H diferentes maneiras de definir o centro de um conjunto de dados, assim, h
diferentes definies de medidas de tendncia central como: mdia, mediana, moda e
ponto mdio.
4.1 Mdia
Mdia Aritmtica: a mdia aritmtica de um conjunto de dados o valor obtido
somando-se todos os elementos do conjunto e dividindo-se a soma pelo nmero total
de elementos. Observe:
x

xi
n

(3)

onde x a mdia aritmtica, xi os dados do conjunto amostral e n o nmero de


valores.
A mdia aritmtica calculada para os dados fornecidos na tabela 1 corresponde
a:
x

18,9 18,7 ... 22,2 23,2


31
x 20,590 C

Observao: quando ao invs de x , que denota a mdia aritmtica de uma


amostra, temos significa que a mdia aritmtica de uma populao.
A mdia aritmtica depende de todos os valores da srie e qualquer alterao
de um deles altera seu valor. Esta medida influenciada por valores extremos,
podendo, em alguns casos, no representar a srie. Alm da mdia aritmtica, h a
mdia harmnica, geomtrica e quadrtica.
Mdia Harmnica: costuma ser usada como medida de tendncia central para
conjuntos de dados que consistem em taxas de variao, como por exemplo
velocidades. Obtm-se a mdia harmnica dividindo-se o nmero n de valores pela
soma dos inversos de todos os valores. Portanto, expressa como (Triola, 1998):
x

Para os dados da tabela 1, temos a mdia harmnica igual a:


Projeto PAE Bolsista: Michelle S. Reboita

(4)

9
x

31

1
1
1
1

...

18,9 18,7
22,2 23,2
x 20,360 C

Mdia Geomtrica: usada na administrao e na economia para achar taxas mdias


de variao, de crescimento, ou razes mdias. Dados n valores (todos positivos), a
mdia aritmtica a raiz n ma do seu produto (Triola, 1998). Por exemplo, determina-se
a mdia geomtrica de 2, 4, 10 multiplicando-se os trs valores o que d 80, e
tomando-se a raiz cbica do resultado (porque h trs valores). O resultado 4,3.
Desta forma para os dados da tabela 1, temos:
x

31

18,9 * 18,7 * ... * 22,2 * 23,2


x 20, 480 C

Mdia Quadrtica: utilizada em geral em experimentos fsicos. Em sistemas de


distribuio de energia, por exemplo, as tenses e correntes so em geral dadas em
termos de sua mdia quadrtica. Obtm-se a mdia quadrtica de um conjunto de
valores elevando-se cada um ao quadrado, somando-se os resultados, dividindo-se o
total pelo nmero n de valores e tomando-se a raiz quadrada do resultado (Triola,
1998). Por exemplo, a mdia quadrtica de 2, 4, 10 6,3. Agora calculando-se para os
dados da tabela 1, temos:
x

x
n

2
i

(5)

(18,9)2 (18,7)2 ... (22,2)2 (23,2)2


31
x 20,710 C

4.2 Mediana
A mediana o elemento que ocupa a posio central de uma srie de dados. Para
encontr-la os dados devem estar dispostos em ordem crescente ou decrescente. Se a
srie tiver um nmero mpar de dados o valor que estiver ocupando o meio da srie
ser a mediana. Se tiver um nmero par de dados deve-se extrair a mdia aritmtica
dos dois valores centrais, uma vez que, o valor correspondente a mediana acha-se
entre eles.
A mediana dos dados fornecidos na tabela 1 corresponde a 20,9C.
Projeto PAE Bolsista: Michelle S. Reboita

10
4.3 Moda
A moda o valor que ocorre com maior freqncia em uma srie de dados. Pode
ser identificada apenas observando-se a srie nos casos de dados no agrupados.
Quando a srie possuir dois valores com a mesma freqncia mxima, cada um deles
uma moda, e o conjunto diz-se bimodal. Se mais de dois valores ocorrerem com a
mesma freqncia mxima, o conjunto multimodal. Quando nenhum valor repetido,
o conjunto no tem moda.
A srie de dados fornecida na tabela 1 multimodal, pois cinco valores (18,3;
18,9; 21,2; 22,4 e 23,2) aparecem com a mesma freqncia mxima.
4.4 Ponto Mdio
O ponto mdio o valor que est a meio caminho entre o maior e o menor valor
da srie de dados. Para obt-lo, somamos esses valores extremos e dividimos o
resultado por 2, como na expresso a seguir (Triola, 1998):
PM

maior valor menor valor


2

(6)

O ponto mdio dos dados da tabela 1 :


PM

16,1 25,1
2

PM = 20,6 C
5

Medidas de Disperso ou de Variabilidade

Vimos anteriormente que um conjunto de valores pode ser convenientemente


sintetizado, por meio de procedimentos matemticos, em poucos valores
representativos mdia, mediana e moda. Tais valores podem servir de comparao
para dar a posio de qualquer elemento do conjunto.
No o bastante dar uma das medidas de posio para caracterizar
perfeitamente um conjunto de valores, pois, mesmo sabendo, por exemplo, que a
temperatura mdia de duas cidades a mesma, e igual a 24C, ainda assim somos
levados a pensar a respeito do clima dessas cidades. Em uma delas a temperatura
poder variar entre limites de muito calor e de muito frio e, haver, ainda, uma
temperatura mdia de 24C. A outra poder ter uma variao pequena de
temperatura, mas mantendo uma mdia de 24C.
Vemos, ento, que a mdia ainda que considerada como um nmero que tem a
faculdade de representar uma srie de valores no pode, por si mesma, destacar o
Projeto PAE Bolsista: Michelle S. Reboita

11
grau de homogeneidade ou heterogeneidade que existe entre os valores que compem
um conjunto.
Consideremos os seguintes conjuntos de valores das variveis x, y e z:
X: 70, 70, 70, 70, 70
Y: 68, 69, 70, 71, 72
Z: 5, 15, 50, 120, 160
Calculando a mdia aritmtica de cada um desses conjuntos, obtemos:

350
70
n
5
yi 350 70
y
n
5
zi 350 70
z
n
5
x

Vemos, ento, que os trs conjuntos apresentam a mesma mdia aritmtica: 70.
Entretanto, fcil notar que o conjunto x mais homogneo que os conjuntos y
e z, j que todos os valores so iguais a mdia.
O conjunto y, por sua vez, mais homogneo que o conjunto z, pois h menor
diversificao entre cada um de seus valores e a mdia representativa.
Chamando de disperso ou de variabilidade a maior ou menor diversificao dos
valores de uma varivel em torno de um valor de tendncia central tomado como ponto
de comparao, podemos dizer que o conjunto x apresenta disperso ou variabilidade
nula e que o conjunto y apresenta uma distribuio ou variabilidade menor que o
conjunto z.
Portanto, para qualificar os valores de uma dada varivel, ressaltando a maior ou
menor disperso ou variabilidade entre esses valores e a sua medida de posio, a
Estatstica recorre s medidas de disperso ou de variabilidade. Dessas medidas,
sero descritas a amplitude total, o desvio-padro e a varincia.
5.1 Amplitude Total
A amplitude total de um conjunto de dados a diferena entre o maior e o menor
valor deste. Para calcul-la, basta subtrair o menor valor do maior.
AT xmx xmn

(7)

Quanto maior a amplitude total de um conjunto de dados, maior a disperso ou


variabilidade dos valores.
A amplitude total observada nos dados da tabela 1 :
AT = 25,1 16,1 = 9 C
Projeto PAE Bolsista: Michelle S. Reboita

12

5.2 Desvio-Padro
A amplitude total uma medida instvel, pois se deixa influenciar pelos valores
extremos, que so, na sua maioria, devidos ao acaso.
O desvio-padro e a varincia so medidas que fogem a essa falha, pois levam
em considerao a totalidade dos valores da varivel em estudo, o que faz delas
ndices de variabilidade bastante estveis e, por isso mesmo, os mais geralmente
empregados. Assim, pode-se definir o desvio-padro como uma medida da magnitude
do espalhamento ou disperso dos dados em relao mdia da srie.
A expresso para o clculo do desvio-padro amostral (s) :
s

xi x 2

(8)

n 1

onde xi cada elemento do conjunto de dados, x a mdia do conjunto e n o


nmero total de elementos deste.
J para o desvio-padro populacional () a expresso :

xi 2

(9)

onde xi cada elemento da populao, e N so respectivamente a mdia e o nmero


total de elementos da populao.
Observa-se que para a populao x substitudo por e n-1 por N.
Em geral, a finalidade do clculo de uma estatstica amostral (como a mdia, o
desvio-padro ou a varincia) estimar o parmetro populacional correspondente. Se
extrairmos muitas amostras de uma populao que tem mdia m, calcularmos as mdias
amostrais x e se tomarmos as mdias de todas as estimativas de m, veremos que essa
mdia fica muito prxima de m. Entretanto, se calculssemos a varincia de cada
amostra pela frmula:

x x

e tomssemos a mdia de todas essas supostas estimativas de 2, provavelmente


obteramos uma mdia inferior a 2. Teoricamente, mostra-se que podemos compensar
essa desvantagem dividindo por n-1 em vez de n na frmula de s 2.
Projeto PAE Bolsista: Michelle S. Reboita

13
Uma regra que auxilia na interpretao do valor de um desvio-padro a regra
emprica, aplicvel somente a conjuntos de dados aproximadamente em forma de sino,
conforme a figura 2. Essa figura mostra como a mdia e o desvio-padro esto
relacionados com a proporo dos dados que se enquadram em determinados limites.
Assim que, com uma distribuio em forma de sino, temos 95% dos seus valores a
menos de dois desvios-padro da mdia. A regra emprica costuma a ser designada
abreviadamente como a regra 68-95-99.
A regra 68-95-99 diz que:
a. cerca de 68% dos valores esto a menos de 1 desvio-padro a contar da mdia;
b. cerca de 95% dos valores esto a menos de 2 desvios-padro a contar da mdia;
c. cerca de 99,7% dos valores esto a menos de 3 desvios-padro a contar da mdia.

Figura 2. Relao entre o desvio-padro e a curva normal.


Na figura abaixo foi plotada a mdia (20,6 C), a mdia acrescida de mais um
desvio-padro e a mdia descontada de um desvio-padro da srie de dados de
temperatura mdia diria do ms de dezembro de 2004 da estao do IAG, com o
objetivo de mostrar que uma grande porcentagem (cerca de 68%) dos dados ficam
entre
os
limites
da mdia
somada
e diminuda
de um
desviopadro.

Projeto PAE Bolsista: Michelle S. Reboita

14

Figura 3. Temperatura mdia diria do ms de dezembro de 2004 da estao do IAG


(So Paulo), juntamente com a mdia da srie e a mdia acrescida e diminuda de um
desvio-padro. Os dados em anlise possuem desvio-padro igual a 2.2.
5.3 Varincia
A varincia uma medida estatstica da disperso dos dados em torno da mdia de
um conjunto de dados. obtida quando no extramos a raiz quadrada do desviopadro. A varincia amostral definida como:
s2

x x

n 1

(10)

j a varincia populacional :
i

(11)

A varincia obtida atravs dos dados da tabela 1 4,86 C.


A varincia tambm denominada de segundo momento, sendo:
m2

xi x
n

(12)

Assimetria

A assimetria o grau de deformao de uma curva de freqncias. Uma


distribuio de freqncia simtrica, ou seja, que apresenta um grfico cuja as duas
caudas possuem a mesma configurao (figura 4 a), quando a mdia, a mediana e a
moda da srie forem iguais. A distribuio de freqncia tambm pode ser
assimtrica positiva (figura 4 b) e assimtrica negativa (figura 4 c), a primeira possui
uma cauda mais alongada direita e ocorre quando a mdia da srie for maior que a
Projeto PAE Bolsista: Michelle S. Reboita

15
moda e a segunda apresenta uma cauda mais alongada esquerda e ocorre quando
mdia da srie for menor que a moda.
a)

b)

c)

Figura
4. Representao
esquemtica da assimetria.
A assimetria pode ser obtida pelo coeficiente de assimetria (A) que uma
medida adimensional, observe:
A

x Mo
s

(13)

onde Mo a moda da srie.


Desde que a moda de difcil estimativa, o coeficiente de assimetria obtido,
com boa aproximao, pela seguinte relao: x Mo = 3( x Me), onde Me a
mediana. Assim:
A

3 x Me
s

(14)

Mas, a medida de assimetria mais utilizada dada pelo terceiro momento (m 3)


centrado na mdia, ou seja:
m3
A 3
s

(15)

onde:
xi x
m3
n

(16)

sendo xi cada elemento do conjunto de dados, x a mdia e n o nmero de elementos


do conjunto (Assis, 1996).
Projeto PAE Bolsista: Michelle S. Reboita

16
A distribuio ser simtrica quando A = 0, se A for maior que zero a
assimetria positiva e se A for menor que zero a assimetria negativa.
Utilizando a expresso 15 para calcular o coeficiente de assimetria dos dados
fornecidos na tabela 1, obtemos A = -0,08 que corresponde a uma assimetria negativa,
ou seja, a distribuio possui cauda mais alongada a esquerda. Entretanto, se
fossemos apenas observar a figura 1 no conseguiramos extrair esta informao
facilmente devido a forma do histograma.
7

Curtose

A curtose o grau de achatamento de uma distribuio em relao a uma


distribuio padro, denominada curva normal.
A distribuio que apresenta uma curva de freqncias mais fechada que a
normal, denominada leptocrtica (figura 5 a). Quando a curva de freqncia mais
aberta que a normal recebe o nome de platicrtica (figura 5 b) e a curva normal
denominada de mesocrtica (figura 5 c).
a)

b)

c)

Figura 5. Representao esquemtica da curtose.


A curtose (C) definida pelo quarto momento (m 4) dividido pelo o desvio-padro
da srie elevado a quarta potncia ( s 4 ):

m4
s4

(17)

onde o quarto momento dado por:

m4

xi x 4
n

onde xi cada elemento do conjunto de dados, x a mdia e n o nmero de elementos


da srie (Assis, 1996).

Projeto PAE Bolsista: Michelle S. Reboita

17
A curtose denominada mesocrtica quando C=3, neste caso, tem-se uma curva
normal. Se C>3, a curva de freqncia mais fechada que a curva normal, ou seja
possui um pico e recebe a denominao de leptocrtica. Se C<3, a curva de freqncia
mais achatada que a curva normal, sendo chamada de platicrtica.
A curtose calculada para os dados da tabela 1 foi C = 2,2, portanto C<3 e a curva
de freqncia mais achatada que a curva normal.
8

Separatrizes

A mediana caracteriza uma srie de valores devido sua posio central. No


entanto, ela apresenta uma outra caracterstica, to importante quanto a primeira: ela
separa a srie em dois grupos que apresentam o mesmo nmero de valores. Assim,
alm das medidas de posio mencionadas h outras que, consideradas
individualmente, no so medidas de tendncia central, mas esto ligadas mediana
relativamente sua segunda caracterstica, j que se baseiam na sua posio na srie.
Essa medidas denominadas de quantis ou fractis, so juntamente com a mediana,
conhecidas pelo nome genrico de separatrizes.
O quantil, por sua vez, o nome genrico para outras medidas, como as que
dividem o conjunto de dados em 4, 10 ou 100 partes, por exemplo. Estas so
denominadas de quartil, decil e percentil, respectivamente.
Os trs quartis Q1, Q2 e Q3 dividem o conjunto dos dados em quatro
subconjuntos de tal forma que 25% dos elementos situam-se abaixo do Q 1; 25% entre
Q1 e Q2; 25% entre Q2 e Q3 e 25% acima de Q3, sendo que Q2 corresponde a mediana.
Os decis dividem o conjunto de dados em 10 partes iguais. Os nove decis D 1, D2,
D3,..., D9 so tais que 10% dos elementos situam-se abaixo de D 1, 10% entre D1 e D2 e
assim por diante. A mediana o quinto decil.
Os percentis dividem o conjunto dos dados ordenados em 100 partes iguais. A
mediana o qinquagsimo percentil.
Procedimento para obteno dos quantis (Xavier et al., 2002):
1. dispor os dados em ordem crescente;
2. colocar um nmero de ordem para cada valor (i=1, ..., i=N);
3. para cada valor determinar a ordem quantlica: P i=i/(N+1), onde N o nmero de
elementos da srie;
4. finalmente, para calcular o quatil Q(P) para uma ordem quantlica P i qualquer, seguese:
a) se P coincidir com algum Pi j obtido, ento: Q(P)=Q(Pi)=yi
b) se P no coincidir, haver um ndice i tal que P i<P<Pi+1, onde Q(P) ser obtido por
interpolao, onde: Q(P)=yi+{[P-Pi]/[Pi+1-Pi]}*[yi+1-yi]
Exemplo 1: Extrado de Xavier et al. (2002).
Projeto PAE Bolsista: Michelle S. Reboita

18

Considere os dados:
104 5 43 123 58 63 12 71 32
com N=9 observaes. Determine o quartil inferior Q(0,25) e o superior Q(0,75) e o
primeiro tercil Q(0,333):
i
y
Pi=i/(N+1)

1
5
1/10
0,10

2
12
2/10
0,20

3
32
3/10
0,30

4
43
4/10
0,40

5
58
5/10
0,50

6
63
6/10
0,60

7
71
7/10
0,70

8
104
8/10
0,80

9
123
9/10
0,90

O esquema considerado acima faz atribuir a cada valor de y i a ordem quantlica


dada pela expresso:
Pi=i/(N+1) onde i = 1, 2, ..., N
No caso, as ordens quantlicas obtidas foram 0,10 = 10%; 0,20 = 20%; 0,30 =
30%; 0,40 = 40%; 0,50 = 50%; 0,60 = 60%; 0,70 = 70%; 0,80 = 80% e 0,90 = 90%.
Segue-se que os yi correspondentes sero os decis, entre os quais est a mediana que
corresponde ordem quantlica P = 0,50 = 50%.
Como faremos para calcular o quartil inferior Q(0,25) e o quartil superior
Q(0,75)?
Q(0,25) o quantil que corresponde ordem quantlica P = 0,25, portanto,
equidistante dos decis correspondentes as ordens quantlicas 0,20 e 0,30. Assim:
Q(0,25)=[Q(0,20)+Q(0,30)]=(12+32)/2=22
Q(0,75)=[Q(0,70)+Q(0,80)]=(71+104)/2=87,5
O primeiro tercil est entre 30% e 40%, cujos quantis respectivos so 32 e 43,
portanto:
Q(P)=yi+{[P-Pi]/[Pi+1-Pi]}*[yi+1-yi]
Q(33,3%)=32+{[33,3-30]/40,0-30,0]}*[43-32]
=32+(3,3/10,0)*11
=32+0,33*11
=35,63
Exemplo 2: Extrado de Assis et al. (1996).
Projeto PAE Bolsista: Michelle S. Reboita

19
Dada a tabela:

Tabela 4: Totais anuais de chuva de Pelotas, RS, ordenados em forma crescente.


i

Pi=i/(N+1)

Yi

Pi=i/(N+1)

Yi

Pi=i/(N+1)

Yi

Pi=i/(N+1)

Yi

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

0,010
0,020
0,030
0,040
0,050
0,059
0,069
0,079
0,089
0,099
0,109
0,119
0,129
0,139
0,149
0,158
0,168
0,178
0,188
0,198
0,208
0,218
0,228
0,238
0,248

680
689
832
856
857
864
885
890
890
919
923
926
931
952
973
982
998
1004
1011
1040
1048
1049
1054
1066
1090

26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50

0,257
0,267
0,277
0,287
0,297
0,307
0,317
0,327
0,337
0,347
0,356
0,366
0,376
0,386
0,396
0,406
0,416
0,426
0,436
0,446
0,455
0,465
0,475
0,485
0,495

1099
1110
1112
1114
1137
1138
1144
1153
1160
1166
1178
1179
1191
1198
1212
1220
1225
1232
1237
1255
1258
1265
1270
1271
1297

51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75

0,505
0,515
0,525
0,535
0,545
0,554
0,564
0,574
0,584
0,594
0,604
0,614
0,624
0,634
0,644
0,653
0,663
0,673
0,683
0,693
0,703
0,713
0,723
0,733
0,743

1298
1300
1305
1307
1311
1320
1321
1323
1326
1330
1331
1334
1342
1344
1350
1352
1355
1360
1361
1372
1373
1377
1390
1423
1435

76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100

0,752
0,762
0,772
0,782
0,792
0,802
0,812
0,822
0,832
0,842
0,851
0,861
0,871
0,881
0,891
0,901
0,911
0,921
0,931
0,941
0,950
0,960
0,970
0,980
0,990

1443
1455
1496
1501
1510
1510
1535
1539
1543
1555
1582
1605
1654
1656
1694
1695
1718
1724
1746
1778
1780
1815
1945
1995
2338

Projeto PAE Bolsista: Michelle S. Reboita

20
Para se encontrar os quartis divide-se o N+1 por 4; para os decis divide-se N+1
por 10 e para os percentis divide-se o N+1 por 100.
Na tabela acima, o primeiro quartil o valor da srie ordenada cuja posio
(N+1)/4 = 101/4 = 25,25 que corresponde a um valor de chuva entre 1.090 e 1.099 mm;
a mediana, o segundo quartil, encontrada por 2(N+1)/4 = 202/4 = 50,5, ou seja, o
valor de chuva correspondente a 1.298 mm; o terceiro quartil o 75 valor da srie
ordenada, ou seja, 3(N+1)/4 = 75,75, sendo o valor de chuva entre 1.443 e 1.455 mm.
O primeiro decil corresponde a (N+1)/100 = 101/100 = 1,01, que corresponde a
um valor de chuva compreendido entre 680 e 689 mm. Por interpolao linear obtmse o valor exato do primeiro decil multiplicando-se 0,01 pela diferena entre os
valores da dcima e nona observao e somando-se esse resultado ao valor da nona
observao. Assim:
680+0,01(689-680) = 680,1 mm

Referncias

ASSIS, F. N., et al, 1996. Aplicaes de Estatstica Climatologia . Ed. Universitria,


UFPEL, Pelotas, RS.
CRESPO, A. A., 1997. Estatstica Fcil. 15 Ed., Saraiva, So Paulo, SP.
SILVA, N. P., 1998. Estatstica Auto-Explicativa. Ed. rica, So Paulo, SP.
TRIOLA, M. F., 1998. Introduo Estatstica. 7 Ed., LTC, Rio de Janeiro, RJ.
XAVIER, T. M. B. S., SILVA, J. F. e REBELLO, E. R. G., 2002. A Tcnica dos Quantis.
Thesaurus, Braslia.
10 Exerccio
Dada a srie de temperatura mdia diria do ms de dezembro de 2000 da estao
meteorolgica situada na cidade do Rio Grande, RS, faa:
1. a distribuio e o histograma de freqncias;
2. calcule as medidas de tendncia central;
3. calcule as medidas de disperso;
4. calcule o coeficiente de assimetria e curtose e
5. compare os resultados obtidos com este conjunto de dados com os da estao do
IAG.

Projeto PAE Bolsista: Michelle S. Reboita

21
Dia
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

Temperatura do Ar (C)
18.76
20.5
21.06
20.66
18.56
22.28
25.38
25.9
25.86
20.52
23.8
24.72
25.5
23.22
23.12

16

17.84

Dia
17
18
19
20
21
22
23
24
25
26
27
26
29
30
31

Temperatura do Ar (C)
19.64
22.74
20.02
18.86
21.02
22.34
21.26
21.32
25.42
28.94
22.04
21.92
23.06
21.36
20.94

Projeto PAE Bolsista: Michelle S. Reboita

También podría gustarte