Está en la página 1de 7

PAULO VIEIRA NETO

Estatística Descritiva: Distribuição de


Freqüências
Estatística Básica - Distribuição de Freqüências - Paulo Vieira Neto 2

São Paulo, Fevereiro/2003

Distribuição de Freqüências:

Antes de trabalharmos com distribuição de freqüências, vamos fazer uma revisão,


trabalhando com uma série estatística, e conhecermos algumas medidas estatísticas,
tais como: medidas de posição e medidas de variabilidade ou dispersão. Vamos ao
seguinte exercício:

Exemplo-1: A produção de leite da Fazenda Santa Teresa, durante 7 dias, em (1.000


Litros), está representada na tabela abaixo:
Tabela 1 - Produção de leite da Fazenda Santa Teresa
Durante a 2ª semana do mês de abril de 199X

Seg. Ter. Qua. Qui. Sex. Sab. Dom.


8 7 8 9 8 6 10
Fonte: Fazenda Santa Teresa

Pede-se:
a) O tipo da variável; b) classificar a série estatística; c) Rol; d)
Produção Mínima;
e) Produção Máxima; f) Produção Média; g)
Produção modal; h) Produção mediana;
i) Amplitude total; j) Desvios; k) Desvio médio; l) Variância;
m) Desvio padrão; n) Relatório do trabalho.

a) Para resolvermos a questão a, vamos revisar os conceitos de Variáveis:


VARIÁVEL: convencionalmente, é o conjunto de resultados possíveis de um fenômeno.
Qualitativa: quando os valores forem expressos por atributos: sexo (masculino -
feminino), cor da pele (branca, parda, amarela), Cabelo (Curto, Longo), Chuva (Leve,
Moderada e Forte) etc.
Quantitativa: quando os valores forem expressos em números (salários dos operários,
altura dos alunos de uma classe de aula, quilômetros rodados por um veículo etc.).
VARIÁVEIS

Nominal (Sexo, Cor dos olhos....)


Qualitativa
Ordinal (Grau de Instrução, 1º, 2º e 3º grau; Classe Social, Classe A, B ou C)

Contínua (Peso, Idade, Altura....)


Quantitativa
Discreta (Número de Filhos, Nº de gols em uma partida de Futebol, Nº de carros...)

Solução da questão a: Trata-se de variável quantitativa discreta.


b) Para resolvermos a questão b, vamos revisar os conceitos sobre séries estatísticas:
Chamamos de série estatística, toda tabela que apresenta uma distribuição de uma
amostra ou população em função do tempo, do local e espécie.
• Temporal: o fenômeno é estudado em uma determinada faixa de tempo. É conhecida
como (Séries temporais, cronológicas, evolutivas, históricas ou marchas).1

1 Este assunto está também em: PEREIRA e TANAKA (1990:40-42)


Estatística Básica - Distribuição de Freqüências - Paulo Vieira Neto 3
• Espacial: o fenômeno é estudado em uma ou mais região. É conhecida como Séries
geográficas, espaciais, territoriais ou de localização.
• Quanto à Categoria: o fenômeno é estudado, o tempo e o espaço são fixos, a
categoria varia. É conhecida como Séries categóricas ou específicas.

Solução da questão b: Trata-se de uma série estatística cronológica.


c) Questão c, ROL: organizar os dados, numericamente, em ordem crescente ou decrescente.
Solução da questão c: 6, 7, 8, 8, 8, 9, 10.

Medidas de Posição: Questões: d, e, f, g, h [Mínimo, Máximo, Média, Mediana e Moda, são


medidas de posição]

Questão d: Mínimo: 6, 7, 8, 8, 8, 9, 10. .o Mínimo: 6

Questão e: Máximo: 6, 7, 8, 8, 8, 9, 10. . o Máximo: 10

Questão f: O que entendemos por média aritmética? - É um valor representativo de uma


amostra ou população. Para seu cálculo procedemos da seguinte forma:
Somamos todos os valores do 1º até o último e em seguida dividimos o valor encontrado pelo
número de elementos somados.

x1 +x2 +x3 +... +xn ∑ xi


x = =i=
1

n n
Vamos utilizar uma fórmula mais simples: Vamos adotar a notação para Média como Me.

Solução da questão f:

∑x 6 + 7 + 8 + 8 + 8 + 9 + 10 56
Me(x) = → Me(x) = → Me(x) = ⇒ Me(x) = 8
n 7 7

[ Veremos também: Média Geométrica e Média Harmônica. ]

Questão g: Moda ou Modo (Mo): é o valor (ou atributo) que ocorre com maior
freqüência.

Solução da questão g: o valor que mais ocorre, [mais aparece] é o 8, ocorre 3 vezes.
Questão h: Mediana (Md) ou valor mediano: colocado uma série de valores ordenados. A
mediana é o elemento de ordem [ n, nº ] que ocupa a posição central da distribuição/amostra.
Isto é, divide a amostra em duas partes iguais.
Para n impar: para n par
 n   n + 1
n +1  + 
Md =  2  2 
2 Md =
2

Solução da questão h: n = 7;
Dados ordenados: 6, 7, 8, 8, 8, 9, 10. → Md(x) = (7+1)/2 → Md(x) = 8/2 = 4º
elemento = 8.

Medidas de Dispersão ou variabilidade: São medidas que medem o grau de dispersão


[Variabilidade] de uma amostra/distribuição.
Analisando as situações abaixo:
Seja X, a venda de gasolina no posto KDA, em mil litros, durante 4 dias.
Amplitude Total - AT = Xmax - Xmin
a) 7, 7, 7, 7 - Média: 7 - AT = 7 - 7: 0; - Desvio Padrão: 0,00 - não têm dispersão;
b) 6, 8, 5, 9 - Média: 7 - AT = 9 - 5: 4; - Desvio Padrão: 1,83 - têm dispersão;
Estatística Básica - Distribuição de Freqüências - Paulo Vieira Neto 4
c) 3, 11, 4, 10 - Média: 7 - AT = 11 - 4: 7; - Desvio Padrão: 4,08 - têm dispersão maior que as anteriores;
d) 1, 13, 1, 13 - Média: 7 - AT = 13 - 1: 12; - Desvio Padrão: 6,93 - têm a maior dispersão.
[Obs.: a média aritmética é a mesma para as 4 séries estatísticas]

O que se pode concluir das 4 situações acima?  [ Veremos em sala de aula ].


Vamos calcular as dispersões, em relação à média aritmética, para a situação b? – Que
conclusão chegastes?
Vamos começar com os desvios [di], um a um, de cada valor da amostra. Calculamos o desvio
da seguinte forma:
a) Calculamos a média aritmética;
b) Em relação à a média aritmética, calculamos um a um [Xi - Me], o somatório ∑di = 0; [A soma
dos desvios tem que ser Zero]
X - Me = di | di | (X - Me)2
6 - 7 -1 | -1 | 1
8 - 7 1 | 1| 1
5 - 7 -2 | -2 | 4
9 - 7 2 | 2| 4
∑ 0 6 10

Como podemos observar, a soma dos desvios [ ∑di ] é Zero. Para calcularmos a média dos desvios
precisamos evitar que a soma dos mesmos seja zero. Para que isto ocorra, trabalhamos com os
valores absolutos colocando cada um dos desvios em módulo | di |, trabalhamos com os valores
positivos. [No Excel a função é =ABS(X)]. Agora vamos calcular a média dos desvios ou Desvio
médio [DM].

Σ di 6
Desvio Médio ⇒ DM = → = 1,5
n 4
Bem, para a nossa análise estas medidas não suficientes. Vamos calcular a Variância e Desvio
Padrão.
O cálculo da variância da amostra:
Σ(X − X) 2  Var =
10
 Var =
10
= 3,3333
Var =
n −1 4 −1 3

O desvio padrão é a raiz quadrada da variância.


Desvio Padrão = Variância  DP = 3,3333 =1,8257
DP = 1,8257

1. Distribuição de Freqüências:
A tabela de distribuição de freqüências, é uma série estatística, onde os dados encontram-se dispostos em categorias ou
classes juntamente com suas freqüências correspondentes, em dados ordenados em linhas e colunas. As distribuições de
freqüências podem ser divididas em dois tipos:
1.1. Variável discreta - Tipo A
Como já foi visto, as variáveis discretas geralmente assumem valores inteiros. Exemplo: Número de filhos de um casal,
número de livros da biblioteca da Faculdade.
Seja X: Número de erros por páginas encontrados na Monografia do Sr. Y, apresentada em jun.199X.
Número de erros por página da monografia
Apresentada em jun./199X
Número de Erros (Xi) Nº de páginas (Fi)
1 20
2 15
3 17
4 13
5 11
6 9
Total 85

Xi: identifica as classes em que o evento se subdivide;


Fi: freqüência absoluta, isto é, corresponde ao número de vezes que cada classe ocorre;
n: soma de todas Fi = total de elementos observados na população.
Dada a seguinte distribuição:
Estatística Básica - Distribuição de Freqüências - Paulo Vieira Neto 5
Distribuiição de Freqüências - Variável Tipo-A [Variável Discreta]
Seja X: nº de salário mínimo ganho por trabalhador

i Xi Fi Fac Fad Xi*Fi Fr FrC FrC F% F%C F%D Xi2Fi


1 4 20 20 85 80 0,2353 0,2353 1,0000 23,529 23,529 100,000 320
2 5 15 35 65 75 0,1765 0,4118 0,8235 17,647 41,176 76,471 375
3 6 17 52 50 102 0,2000 0,6118 0,6235 20,000 61,176 58,824 612
4 7 13 65 33 91 0,1529 0,7647 0,4706 15,294 76,471 38,824 637
5 8 11 76 20 88 0,1294 0,8941 0,3412 12,941 89,412 23,529 704
6 9 9 85 9 81 0,1059 1,0000 0,2353 10,588 100,000 10,588 729
∑ 85 517 1,0000 100,000 3377
Pede-se:
a) FaC: Freqüência Acumulada Crescente; b) FaD: Freqüência Acumulada Decrescente;
c) Fr: Freqüência Relativa; d) FrC: Freqüência Relativa Crescente;
e) FrD: Freqüência Relativa Decrescente; f) F%: Freqüência Percentual;
g) F%C: Freqüência Percentual Crescente; h) F%D: Freqüência Percentual Decrescente.
i) Média aritmética; j) Moda; k) Mediana.

1. DISTRIBUIÇÃO DE FREQÜÊNCIAS - Variável contínua [Tipo B]


Exercício: A produção de leite de 40 vacas, no dia 03/08/90, [em litros] foi a seguinte:

dados 15, 12, 8, 8, 15, 18, 13, 20, 15, 4, 9, 13, 15, 14, 13, 15, 20, 12, 7, 6
brutos 21, 10, 9, 15, 12, 7, 6, 17, 15, 11, 4, 5, 8, 5, 8, 7, 8, 15, 6, 7

Colocar em ROL (ROL = ordenar os dados em ordem crescente ou decrescente)


4, 4, 5, 5, 5, 6, 6, 6, 7, 7, 7, 7, 8, 8, 8, 8, 9, 9, 10, 10 ,12
12, 12, 13, 13, 13, 14, 15, 15, 15, 15, 15, 15, 15, 15, 17, 18, 20, 20, 21

Construir a distribuição de freqüências com "h = amplitude de classe" h = 4, começando por 4, com intervalo de classe
fechado esquerda. ( | ).

Distribuição de Freqüências - Variável Tipo-B [Variável Contínua]


i Classes Fi Xi Fac Fad Xi*Fi Fr FrC FrD F% F%C F%D Xi2Fi
1 4 ┣ 8 12 6 12 40 72 0,300 0,300 1,000 30,000 30,000 100,000 432
2 8 ┣ 12 8 10 20 28 80 0,200 0,500 0,700 20,000 50,000 70,000 800
3 12 ┣ 16 15 14 35 20 210 0,375 0,875 0,500 37,500 87,500 50,000 2940
4 16 ┣ 20 2 18 37 5 36 0,050 0,925 0,125 5,000 92,500 12,500 648
5 20 ┣ 24 3 22 40 3 66 0,075 1,000 0,075 7,500 100,000 7,500 1452
∑ 40 464 1,000 100,000 6272

∑Xi * Fi 464
n = 40  Média Aritmética ⇒ X = → = 11,6
ΣFi = n 40
DETERMINE:
a) Amplitude Total: Ls - Li "da distribuição" AT=24-4 = 20; b) Amplitude Amostral: Ls - Li "da amostra"
AT=21-4 = 17
c) O limite superior da 3ª classe = 16; d) Li da 2ª classe = 8;
e) A Amplitude (h) da 4 classe = 4; f) A freqüência acumulada (Fac) da 3ª
classe =35
g) A freq. acum decresc. (Fad) da 2ª classe = 28 h) A porcentagem de vacas que produziram
menos que 16 litros = 87,5%
i) o nº de elementos da amostra = 40 (N = 40) j) Quantas classes Têm a distribuição? = 5
(i = 5)
k) Observe diretamente a amostra. Qual classe modal? 3ª. l) A freqüência relativa da 4ª classe
= 0,05
m) A freq. percentual (Fr * 100) da 2ª classe = 20% n) O PM (Ponto Médio) da 3ª classe = 14.

2. DISTRIBUIÇÃO DE FREQÜÊNCIAS
1. Introdução:
A estatística pode ser dividida em duas partes:
a) Estatística Descritiva - consiste em:
Estatística Básica - Distribuição de Freqüências - Paulo Vieira Neto 6
• Coleta de dados; • Organização de dados; • Construção de tabelas;
• Construção de gráficos; • Cálculo de medidas que permitem uma melhor avaliação dos dados.
b) Probabilidade: Ferramenta matemática que deduz a partir de um modelo as propriedades de um fenômeno aleatório
c) Inferência Estatística2: Conjunto de instrumentos que permitem obter conclusões para o todo (população), a partir
de valores obtidos na parte (amostra). O estudo da distribuição de freqüências representa a própria estatística
descritiva. Assunto, que em nosso curso, daremos grande atenção.
2.Conceitos preliminares
2.1. População: conjunto de pessoas ou elementos (seres vivos ou não) que apresentam pelo menos uma característica
em comum.
2.2. Amostra: qualquer subconjunto da população.
2.3. Variável discreta: Assume apenas determinados valores em um certo intervalo, exemplo:
número de defeitos de um carro; número de pessoas que trabalham numa mesma família;
número de desempregados no Estado de São Paulo.
2.4. Variável contínua: Pode assumir qualquer valor dentro de um certo intervalo. Exemplo: peso de um conjunto de
crianças do nordeste; altura de um conjunto de crianças do sudeste; porcentagem de desempregados em relação ao
total da PEA (população economicamente ativa).
3. Conceitos relacionados à construção das tabelas de freqüências.
3.1. a) Amplitude Amostral: ( AA ) é o maior valor da amostra menos o menor valor da amostra → AA = Xmax - X
min. Nossa primeira medida de dispersão; é a "mais grosseira", só nos mostra os extremos da amostra. Ocuparemos
do assunto quando avançarmos nossos estudos.

b) Amplitude Total: ( AT ) é o maior valor da distribuição menos o menor valor da distribuição → AT = Xmax - Xmin.
3.2. Amplitude de classe ou intervalo de classe (h)
h = Ls - Li, onde: Ls: limite superior da classe;
Li: limite inferior da classe.
3.3. Ponto médio: o ponto médio de cada classe (Xi) é definido como:

Li + Ls
Xi =
2
3.4. Limite de classe (intervalo aberto e fechado)
3 || 5 (incluem todos os valores, inclusive 3 e 5)
3 | 5 (de 3,000... 01, exclui o 3, e inclui o 5)
3 |5 (inclui 3 e exclui o 5)
3 5 (excluem todos os valores, inclusive 3 e 5)

4. Freqüência absoluta: (Fi) é o número de vezes que cada classe (ou cada valor de Xi na variável direta) aparece no
total de dados.
4.1. Freqüência acumulada: (Fa) é a soma das freqüências até a classe considerada.
4.2. Freqüência relativa: (Fr) é a relação entre a Fi de cada classe e o total de observações.
4.3. Freqüência relativa acumulada: (Fra) idem freqüência acumulada (Fa).

Dados brutos: àqueles que não foram numericamente organizados (tabela primitiva).
Rol: é o arranjo dos dados brutos em ordem de grandeza crescente ou decrescente.

Com estas informações podemos "fazer um ensaio" em analisar a nossa tabela, distribuição de freqüências,
variável contínua. Vamos analisar a 3ª classe da distribuição, i = 3. As notas que referem esta classe
variam de 4,0 inclusive até 5,99999, não incluindo 6,0, pois está fechada à esquerda. Podemos observar
que 10 alunos, (Fi: freqüência absoluta = 10) tiram notas entre 4,0 inclusive e 6,0 exclusive, isto é, exclui a
nota 6,0. Se estivéssemos interessados em saber quantos alunos tiraram notas < 6, "até 5,9999", é muito
fácil, é só fazer a soma 5 + 8 + 10 = 18, o conceito é o mesmo que vimos na variável discreta. Fica mais
fácil fazer a leitura na coluna da Fac: freqüência acumulada crescente. Mas, o coordenador da pesquisa
está interessado em saber quantos3 alunos tiraram notas ≥ 4, é só fazer a soma das Fi das 3ª, 4ª e 5ª
classes, 10, 14 e 3, respectivamente, igual a 27. Resposta, objetiva e imediata. Porém, se observarmos a 3ª
classe, temos uma coluna de Fad: freqüência acumulada decrescente. (3ª classe: Fad = 27). Agora estou
interessado em saber a porcentagem de alunos que tiraram notas entre 4,0 até 5,9999. Em nossa 3ª classe
existem 2 colunas que nos dá esta resposta; a Fr: freqüência relativa, "pegamos" a Fi e dividimos pelo total
de elementos da distribuição Fi = 10 e n = 40, portanto 10/40 = 0,25. Se eu multiplicar a Fr x 100, teremos
a F% (freqüência percentual) = 25%. Para calcularmos a média aritmética vamos precisar do Ponto Médio
(Xi) de todas as classes. (Li + Ls)/2, exemplo: da 2ª classe o Xi é Li: limite inferior = 2 mais o Ls limite
superior, da classe, = 4. (4 + 2 = 6, 6/2 = 3). Logo, Xi = 3 vezes Fi = 8 é igual a 24. A somatória ou o
somatório4 de Xi x Fi divido pelo total de elementos da distribuição nos dá a média aritmética (Média
ponderada)5 3. Para a análise de nossa tabela, ficaremos, a princípio, por aqui. Veremos mais adiante as
outras medidas de tendência central: média, mediana e moda. As Separatrizes: a mediana, divide a
amostra em duas partes iguais, os quartis, os decis e os percentis. E, ainda as medidas de dispersão. Já

2 Ver REIS GATTÁS, Reny. Elementos de probabilidade e inferência. Atlas, São Paulo.
3 Quanto, quantificar. Veja GIL, Antônio Carlos. Técnicas de pesquisa em economia. São Paulo, Atlas, 1988. pp. 28-29.
4 ANDRADE MARTINS, Gilberto & DONAIRE, Denis. Princípios de Estatística. São Paulo, Atlas, Atlas, 1981. pp. 37-40.
5 Daremos maior atenção ao estudo das médias. Média aritmética simples, média ponderada, média geométrica, média harmônica.
Estatística Básica - Distribuição de Freqüências - Paulo Vieira Neto 7
conhecemos uma, a AT = Amplitude Total (mesmo conceito da AA = Amplitude Amostral, AA é da amostra
a outra, AT é da distribuição). Outras medidas de dispersão são os desvios.
Terminada nossa tabela, analisada e chegamos a algumas conclusões, vamos apresentá-la ao nosso
"chefe", acontece que o mesmo é muito ocupado e tem pouco tempo para nos atender. Uma solução é
mostrar uma "fotografia" de nosso trabalho para ele e nossos recursos é a estatística gráfica. Para
apresentar uma representação gráfica de uma distribuição de freqüências tipo B, podemos usar um
histograma ou um polígono de freqüências.6

Bibliografia utilizada

ALLEN, R. G. D. Estatística para Economistas. Rio de Janeiro : Zahar, 1979.


BOTTER, D.A. , PAULA, G.A., LEITE, J.G. e CORDANI, L.K. Noções de Estatística. São Paulo : IME/USP, 1996.
BUSSAB, Wilton O. & MORENTTIN, Pedro A. Estatística básica. São Paulo : Atual, s/d.
CRESPO, Antônio Arnot. Estatística fácil. São Paulo : Saraiva, 1998.
FERREIRA, Wilson & TANAKA, Osvaldo K. Elementos de Estatística. São Paulo : McGraw-Hill, s/d.
FONSECA, Jairo Simon da & MARTINS, Gilberto de Andrade. Curso de estatística. São Paulo : Atlas, 1996.
GATTÁS, Reny Reis. Elementos de probabilidade e inferência. São Paulo : Atlas, 1978.
LAPPONI, Juan Carlos. Estatística usando o Excel. São Paulo : Lapponi Treinamento, 2000.
LEVIN, Jack. Estatística aplicada a ciências humanas. São Paulo: Harbra, s/d.
OLIVEIRA, Francisco Estevam Martins de. Estatística e Probabilidade. 2. ed. São Paulo : Atlas, 1999.
MAGALHÃES, Marcos Nascimento e LIMA, Antônio Carlos Pedroso de. Noções de probabilidade e estatística. São Paulo :
IME/USP, 2001.
MARTINS, Gilberto de Andrade & DONAIRE, Denis. Princípios de estatística. São Paulo : Atlas, 1993.
MARTINS, Gilberto de Andrade. Estatística Geral e Aplicada. São Paulo : Atlas, 2001.
MORETTIN, Luiz Gonzaga. Estatística básica - probabilidade. São Paulo : Makron Books, 1999. 2 v.
NAZARETH, Helenalda. Curso básico de estatística. São Paulo : Ática, 1987.
OLIVEIRA, Francisco Estevam Martins de. Estatística e Probabilidade. 2. ed. São Paulo : Atlas, 1999.
SILVA NETO, Lauro Araújo. Opções: do tradicional ao exótico. 2. ed. São Paulo : Atlas, 1996.
SPIEGEL, Murray Ralph. Estatística. 2. ed. São Paulo : McGraw-Hill, 1995.
__________________. Probabilidade e Estatística. São Paulo : Pearson, 2004.
SPINELLI, Walter & SOUZA QUEIROZ, Maria Helena. Introdução à estatística. São Paulo : Ática, 1990.
TIBONI, Conceição Gentil Rebelo. Estatística básica para o curso de Turismo. São Paulo : Atlas, 2002.
TOLEDO, Geraldo Luciano & OVALLE, Ivo Isidoro. Estatística básica. São Paulo : Atlas, s/d.
UNIVERSIDADE DE SÃO PAULO – USP “IME - Instituto de Matemática e Estatística”. MAE-116, Noções de Estatística,
[Obtido em 15 dez. 2004]. Disponível em http://www.ime.usp.br/~mae116
VIEIRA, Sonia & HOFFMANN, Rodolfo. Elementos de estatística. São Paulo : Atlas, 1988.
______, Sonia & Wada Ronaldo. Estatística: introdução ilustrada. 2. ed. São Paulo : Atlas, 1992

6 Ver LEVIN, op. cit. pp. 35-40.

También podría gustarte