Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTATSTICA
DESCRITIVA
Foz do Iguau
Fevereiro/2015
Sumrio
1 Introduo.....................................................................................................................2
2 Variveis Estatsticas .................................................................................................... 3
2.1 Sequncia de exerccios n 1 ......................................................................................................... 4
Introduo
A estatstica uma cincia formada por vrios mtodos aplicados a vrios ramos do
conhecimento humano para a obteno e utilizao de informaes que possibilitam a tomada
de deciso em determinada situao prtica.
A estatstica descritiva uma funo (mdia, moda, mediana, desvio padro, coeficiente
de variao, etc.), cujo valor numrico descreve, por si s, determinada caracterstica de um
conjunto de dados, reduzindo-o a propores mais facilmente interpretveis. Em um sentido
mais amplo, a estatstica descritiva pode ser interpretada como a observao de fenmenos de
mesma natureza, coleta de dados numricos referentes a esses fenmenos, organizao,
classificao e apresentao desses dados por meio de grficos e tabelas.
Pode-se dizer que toda a cincia que manipula dados experimentais necessita da
estatstica como mtodo de anlise, para que o pesquisador possa tirar concluses que
tenham validade cientfica.
Geralmente surge a seguinte pergunta: Porque utilizar os mtodos estatsticos? A
questo colocada no se refere falta de informao, mas sim como utilizar a informao
disponvel para tomar melhores decises. a partir dessa perspectiva que se deve avaliar
porque um profissional deve conhecer a estatstica. Dentre as razes para aprender estatstica,
o profissional precisa:
Saber como tirar concluses a partir de grandes populaes com base somente na
informao obtida de amostras.
2 Variveis Estatsticas
As caractersticas que descrevem a populao so chamadas variveis, e um valor
observado com relao a uma varivel chamado dado ou observao.
Varivel Caracterstica pela qual se deseja que a populao seja descrita, ou por meio da qual,
decises acerca da populao so tomadas. Por exemplo: altura de alunos, comprimento
peas, preferncia do eleitor, etc.
Dado Observao ou realizao referente a uma varivel. Por exemplo, retirou-se uma pea da
linha de produo e o comprimento anotado foi de 5cm . Isto um dado.
nominais
qualitativas
ordinais
Tipos de variveis
discretas
quantitati vas
contnuas
As variveis qualitativas esto associadas a uma caracterstica que denota qualidade ou
atributo, sendo que as qualitativas nominais no seguem uma ordem pr-definida. Alguns
exemplos de variveis qualitativas nominais so: cor dos olhos dos operrios de certa indstria
(azuis, castanhos, verdes, etc), desempenho dos operrios (timo, bom, regular, pssimo, etc),
qualidade de produtos (defeituosos, perfeitos, recuperveis, etc). J, as qualitativas ordinais
seguem uma determinada ordem. Um exemplo clssico desse tipo de varivel o grau de
escolaridade (1o grau, 2o grau, 3o grau, etc).
As variveis quantitativas esto associadas a valores numricos, podendo ser discretas ou
contnuas. Uma varivel dita discreta quando o nmero de valores for finito ou infinito
enumervel. So exemplos de variveis discretas: nmero de peas produzidas por certa
indstria, nmero de defeitos encontrados em seus produtos, nmero de dias que choveu em
certa localidade durante o ms de maro, etc. A varivel contnua aquela que pode, ao
menos teoricamente, assumir qualquer valor entre dois valores possveis dessa varivel.
Alguns exemplos de variveis contnuas so: comprimentos de parafusos fabricados por certa
mquina, tempos gastos pelos operrios para realizar certa tarefa, resistncia ruptura dos
cabos produzidos por certa companhia, etc. Costuma-se dizer, de uma maneira geral, que as
variveis discretas esto associadas s contagens e as variveis contnuas s medies
(metros, kg, minutos, etc).
04 Classificar cada uma das seguintes variveis (qualitativa nominal, qualitativa ordinal,
quantitativa discreta ou contnua):
3 Representao tabular
Quando um conjunto de observaes de certo fenmeno no est devidamente
organizado, so chamados de dados brutos, fornecendo poucas informaes de interesse ao
pesquisador.
Dados brutos uma listagem dos dados originais, apresentada de forma desordenada.
Rol uma listagem na qual os valores observados esto dispostos em ordem crescente, ou
decrescente
Distribuio de frequncia Consiste em uma funo que associa os valores que uma varivel
assume com suas respectivas frequncias de ocorrncia.
absoluta ( f )
simples
relativa( fr)
Frequncia
absoluta ( fa)
acumulada
relativa( far)
Geralmente uma tabela formada pelos seguinte componentes: Ttulo, Cabealho,
coluna indicadora, Corpo, Linha de totais e Rodap. Conforme a Figura 1.1
O ttulo deve conter as informaes relativas ao contedo da tabela, a(s) varive(is)
dispostas, podendo ainda conter o local de coleta dos dados, e quando foi realizado o estudo.
O cabealho especifica as variveis e a frequncia (ou outra caracterstica) correspondente aos
seus valores.
O corpo representado por uma srie de colunas e subcolunas, dentro das quais so
colocados os dados agrupados. No rodap so colocadas a legenda e todas as observaes
que venham a esclarecer a interpretao da tabela. De um modo geral a tambm disposta a
fonte dos dados (entidade que fornece), embora em alguns casos ela seja colocada no ttulo.
Segundo as regras da ABNT, as laterais da tabela no devem ser fechadas e no deve haver
traos horizontais separando as linhas interiores da tabela.
Exemplo
Dados brutos
5
6
4
8
1
3
5
6
4
4
2
4
6
4
5
1
5
4
4
4
4
3
2
3
6
5
6
3
0
2
5
7
0
1
5
6
7
5
3
6
7
5
6
2
4
4
5
3
4
3
0
0
1
1
1
2
2
2
2
3
3
3
3
3
3
3
4
4
4
4
4
4
4
4
4
4
4
4
5
5
5
5
5
5
5
5
5
5
6
6
6
6
6
6
6
6
7
7
7
8
Rol
Tabela 1.1 Nmero de componentes eletrnicos defeituosos em cada lote de 500 componentes
Nmero de
Nmero
Componentes defeituosos de lotes (f)
0
2
1
3
2
4
3
7
4
12
5
10
6
8
7
3
8
1
Total
50
Fonte: dados fictcios
Porcentagem
fr(%)
(2/50)*100 = 4
(3/50)*100 = 6
(4/50)*100 = 8
(7/50)*100 = 14
(12/50)*100 = 24
(10/50)*100 = 20
(8/50)*100 = 16
(3/50)*100 = 6
(1/50)*100 = 2
100
Nmero
de lotes (fa)
2
5
9
16
28
38
46
49
50
Porcentagem
Acumulada far(%)
4
10
18
32
56
76
92
98
100
Exemplo
Suponha que a empresa A, a fim de realizar torneios internos, resolveu realizar uma
pesquisa sobre a preferncia esportiva de seus funcionrios, resultando a Tabela 1.2.
Nmero de
Funcionrios (f)
Futebol
Vlei
Basquete
Handebol
TOTAL
Fonte: dados fictcios
40
32
24
8
104
Porcentagem
fr(%)
Nmero de
funcionrios
fa
(40/104)*100 = 38,46 0 + 40 = 40
(32/104)*100 = 30,77 40+ 32 = 72
(24/104)*100 = 23,08 72 + 24 =96
(8/104)*100 = 7,69
96 + 8 = 104
100
Porcentagem
far(%)
0 + 38,46 = 38,46
38.46 + 30,77 = 69,23
60,23 + 23,08 = 92,31
92,31 + 7,69 = 100,00
Percebe-se que a preferncia esportiva de maior frequncia foi o futebol com 40 de 104
funcionrios, o equivalente a 38,46. Nota-se que o vlei foi o segundo esporte preferido, com
32 funcionrios, o equivalente a 30,77%. Observa-se, ainda, que, o futebol e o vlei somaram
juntas 72 funcionrios, o equivalente a 69,23% do total, ou seja, a maioria. O basquete vem em
terceiro, com 96% da preferncia.
comum, no entanto, a necessidade de apresentar, numa s tabela, mais do que uma
caracterstica em estudo. Assim, torna-se necessrio o uso de tabelas de dupla entrada. A
Tabela 1.3, por exemplo, mostra a preferncia esportiva dos funcionrios da empresa A,
levando em conta varivel sexo.
14
58,3
10
Handebol
25,0
Total
58
46
41,7
75,0
24
8
104
Exemplo
10
130,00
105,00
120,00
111,50
99,00
116,00
82,50
107,50
125,00
100,00
107,50
120,00
143,00
115,00
135,00
130,00
135,00
127,50
90,50
104,50
136,50
100,00
145,00
125,00
104,50
101,50
102,50
101,50
134,50
158,50
110,00
102,50
90,50
107,50
124,00
121,50
135,00
102,00
119,50
115,50
125,50
117,50
107,50
140,00
121,00
107,50
113,00
93,00
103,50
82,50
101,50
104,50
110,00
119,50
125,00
135,00
90,50
101,50
105,00
111,50
120,00
125,50
135,00
90,50
102,00
107,50
113,00
120,00
127,50
136,50
93,00
102,50
107,50
115,00
121,00
130,00
140,00
99,00
102,50
107,50
115,50
121,50
130,00
143,00
100,00
103,50
107,50
116,00
124,00
134,50
145,00
100,00
104,50
107,50
117,50
125,00
135,00
158,50
c) Calcular o nmero de classes (k). Alguns autores propem que se utilize a frmula de
Sturges, expressada por:
K = 1 + 3,3*log(n)
11
76
= 10,85714285714 C = 10,86
7
Limite superior da ltima classe = 82,5 +10,86 * 7 = 158,52 > 158,5 (mximo valor
observado). Ok, ento as classes da tabela j podem ser construdas.
I : indica incluso na classe do valor situado sua esquerda e excluso do valor situado
sua direita.
I : indica excluso na classe do valor situado sua esquerda e incluso do valor situado
sua direita.
II : indica incluso na classe dos valores situados a sua esquerda e direita.
12
Nota-se que a ltima classe 147,66 I 158,52 j inclui o maior valor observado (158,50),
ento no preciso construir mais classes. O passo seguinte o de retornar aos dados
ordenados (ROL) e fazer a contagem dos valores includos em cada classe. Nesses dados
percebe-se que os quatro primeiros valores (82.50; 90,50; 90,50 e 93) esto dentro da classe
82,50 I 93,36. Portanto, a frequncia desta categoria 4. As frequncias de todas as classes
esto na tabela 1.4.
no de peas
4
9
12
12
8
3
1
49
Frequncia
acumulada
4
13
25
37
45
48
49
Porcentagem
8,2
18,4
24,5
24,5
16,3
6,1
2,0
Porcentagem
acumulada
8,2
26,5
51,0
75,5
91,8
98,0
100,0
13
2
2
1
5
5
2
2
2
3
2
2
5
4
5
2
2
5
1
2
5
3
3
2
2
4
3
2
6
2
5
3
1
2
2
3
4
2
2
4
5
3
2
3
2
2
3
4
5
1
3
3
3
3
2
5
1
5
3
4
5
2
2
5
2
3
4
4
2
2
4
3
2
2
1
4
2
3
5
3
3
03. O tempo necessrio para realizar certa operao industrial foi cronometrado (em
segundos), sendo feitas 40 determinaes
45
37
39
48
51
40
53
49
39
41
45
43
45
34
45
35
41
57
38
46
46
58
57
36
58
35
31
59
44
57
45
44
38
43
33
56
47
48
44
49
14
4 Representao grfica
A apresentao de dados tambm pode ser feita mediante grficos.
Nmero de
Nmero
Componentes defeituosos de lotes (f)
0
2
1
3
2
4
3
7
4
12
5
10
6
8
7
3
8
1
Total
50
A varivel nmero de componentes defeituosos quantitativa discreta e possui apenas
9 valores individuais, portanto o grfico de pontos o mais adequado pra apresentar os dados.
15
N de lotes
14
12
10
8
6
4
2
0
0
N de componentes defeituosos
Nmero de
Nmero
Componentes defeituosos de lotes (fa)
0
2
1
5
2
9
3
16
4
28
5
38
6
46
7
49
8
50
16
4.3 Histograma
O histograma de frequncias uma representao grfica formada por retngulos
justapostos, de base igual amplitude do intervalo de classe (C) e altura igual frequncia
simples absoluta(f) ou frequncia relativa fr (%). Esse tipo de grfico pode ser utilizado no caso
de variveis quantitativas contnuas. Na tabela 1.5 tem-se um exemplo de varivel quantitativa
contnua.
Tabela 1.4 Vida til, em horas, de ferramentas de corte em um processo industrial
Classes
(Horas)
0,0I 24,9
No de Ferram.
Porcentagem
Frequncia
acumulada
Porcentagem
acumulada
2
4
12
30
18
4
70
2,86
5,71
17,14
42,86
25,71
5,71
100
2
6
18
48
66
70
2,857143
8,571429
25,71429
68,57143
94,28571
100
24,9I 49,8
49,8I 74,7
74,7I 99,6
99,6I 124,5
124,5I 149,4
TOTAL
17
Figura 1.4 Histograma de frequncias
Percebe-se que a faixa de tempo durao de maior frequncia foi superior ou igual a
74,7 e inferior a 99,6 horas, com 30 ferramentas de um total de 70. Ocorreram 18 ferramentas,
sendo esta a segunda maior frequncia, com tempo maior ou igual a 99,6 e menor que 124,5
horas de durao. Ocorreram apenas duas ferramentas, sendo esta a menor frequncia, com
tempo de durao menor a 24,9 horas. O pesquisador dever verificar qual o tempo mnimo
exigido para esse tipo de ferramenta para concluir se o resultado est bom, ou no.
18
0,3
0,2
0,1
0,0
-3
-2
-1
0
X
Olhando para o polgono de frequncias (figura 1.5), nota-se que ele tem
aproximadamente a forma da distribuio normal (figura 1.6). Essa informao pode servir, por
exemplo, para o pesquisador decidir em aplicar o intervalo de confiana da mdia ou realizar o
teste de hiptese da mdia, utilizando a distribuio normal ou a distribuio aproximadamente
normal (distribuio t de student), as quais sero estudadas no decorrer do curso.
19
O grfico dever ter uma linha zero claramente definida e uma escala de valores
ininterrupta, caso contrrio, a leitura e a interpretao do grfico podero ficar
distorcidas.
Preferncia
Futebol
Vlei
Basquete
Handebol
TOTAL
Porcentagem
38,5
30,8
23,1
7,7
100
20
Preferncia
esportiva
Futebol
Masculino
N de
Porcentagem
funcionrios
30
75,0%
Feminino
N de
funcionrios
10
Vlei
12
37,5%
20
Basquete
14
58,3%
10
Handebol
25,0%
Porcentagem
25,0%
62,5%
41,7%
75,0%
Total
40
32
24
8
21
Tabela 1.6 Produo Agrcola do estado em
toneladas (t) no ano X.
Produtos Quantidade ( t ) Porcentagem
Caf
400 000
55,56
Acar
200 000
27,78
Milho
100 000
13,89
Feijo
20 000
2,78
Total
720 000
100
Fonte: Dados fictcios
Clculo do setor Correspondente ao caf
720 000 3600
400 000 xo
x
20 000 360
10o
720 000
22
23
Tabela 1.7 Vendas de tratores de
esteira empresa Z
1994-2001
Ano
Nmero de tratores
vendidos
1994
1995
1996
1997
1998
1999
2000
2001
200
350
400
500
550
600
600
700
24
Joo
Atnio
Fernando
Total
Janeiro
1
4
10
15
Fevereiro
2
5
12
18
Maro
2
8
11
21
.
Fonte: Dados fictcios
Figura 1.12 - Nmero de vendas de carros novos de passeio, realizadas
por 3 funcionrios do da concessionria A.
25
Porcentagem
45,9
25,9
15,1
10,6
2,1
0,2
0,2
0,1
0,1
Ano
N de hotis
N de Pousadas
2008
111
16
2009
112
19
2010
110
23
2011
112
37
2012
115
47
2013
109
38
26
Frequncia
acumulada (fa)
4
13
25
37
45
48
49
Porcentagem
fr(%)
8,2
18,4
24,5
24,5
16,3
6,1
2,0
Porcentagem
acumulada (far (%))
8,2
26,5
51,0
75,5
91,8
98,0
100,0
xi
x x xn i 1
x 1 2
n
n
27
xi
i 1
Portanto, a mdia aritmtica dos salrios ou o salrio mdio dos contnuos desse escritrio,
de 800 reais, sendo considerado um valor baixo.
A mdia aritmtica ser considerada ponderada quando os valores do conjunto tiverem
pesos diferentes. Obtm-se a mdia aritmtica ponderada de um conjunto de valores x 1, x2, . .
., xn, dividindo o produto entre esses valores e seus respectivos pesos, pela soma total dos
pesos, isto ,
xi pi
x p x p xn pn i 1
x 1 1 2 2
n
p1 p2 pn
pi
i 1
Assim, por exemplo, um professor pode realizar uma prova e um trabalho bimestralmente,
atribuindo a cada um, os pesos 3 e 7. Se um aluno tiver recebido as notas 8 e 6, nesta ordem,
sua mdia ponderada ser
xipi
x i12
pi
8 . 3 6 .7
66
6,6
37
10
i1
Portanto, a mdia ou nota bimestral do aluno, foi 6,6 pontos. Se este aluno for da
UNIOESTE, o mesmo ter que se recuperar no prximo bimestre.
Genericamente, se os valores x1, x2, . . ., xk, ocorrem f1, f2, . . ., fk, vezes,
respectivamente, a mdia aritmtica ser calculada por:
28
x1 f1 x2 f 2 xk f k
f1 f 2 f k
xi f i x i f i
i 1
k
fi
i 1
i 1
Nmero de
defeitos
0
1
2
3
4
1
2
3
4
5
xi fi
i 1
k
f
i 1
x f
i 1
5
f
i 1
0 . 12 1 . 8 2 . 7 3 . 1 4 . 2 33
1 defeitos
12 8 7 1 2
30
Portanto, o nmero mdio de defeitos por pea produzida, foi 1. O ideal seria que essa
mdia fosse zero ou bem prxima de zero. Se os dados da tabela forem observados mais
atentamente, notar-se- que, 12 peas no apresentaram defeito o equivalente a 40% do total,
consequentemente, 60% apresentaram pelo menos um defeito. As causas dessa porcentagem
alta de peas defeituosas devero ser investigadas, afim de que esse quadro venha a
melhorar. Ser que a mquina est com defeito? Ser que o operador est sonolento ou mal
treinado? Ser que a matria prima de baixa qualidade? Enfim, devem ser apuradas as
possveis causas, e elimin-las, afim de que o problema seja solucionado.
Quando os dados so agrupados em classes e no se dispe dos valores originais,
possvel calcular a mdia aritmtica por meio dos valores centrais das classes, utilizando a
expresso anterior.
k
xi f i
i 1
k
fi
i 1
xi f i
i 1
29
Classes
Comprimento (mm)
82,50 I 93,36
93,36 I 104,22
104,22 I 115,08
115,08 I 125,94
125,94 I 136,80
136,80 I 147,66
147,66 I 158,52
TOTAL
no de peas
(f)
4
9
12
12
8
3
1
49
xi
(82,50 + 93,36)/2 =
(93,36 + 104,22) /2 =
(104,22 + 115,08) /2 =
(115,08 + 125,94) /2 =
(125,94 + 136,80) /2 =
(136,80 + 147,66) /2 =
(147,66 + 158,52) /2 =
87,93
98,79
109,65
120,51
131,37
142,23
153,09
xi f i
x
i 1
7
fi
i 1
Portanto, o comprimento mdio das pecas produzidas pela indstria de 114,97 mm.
Portanto, a produo est sob controle, uma vez eu este valor est entre o intervalo
especificado.
5.2 Mediana
A mediana (Md) outra medida de tendncia central, e pode ser definida como o valor
que divide um conjunto de dados numricos, de tal forma que metade, ou 50% dos itens sejam
maiores ou iguais a este valor, e a outra metade ou os outros 50% dos valores sejam menores
ou iguais ao mesmo.
30
E md
n 1
2
Soluo:
E md
n 1
7 1
E md
E md 4
2
2
Isto significa que a mediana est na quarta posio. Observa-se no conjunto ordenado
X = {2, 3, 6, 12, 15, 23, 30} que, na quarta posio encontra- se o valor 12. Portanto, a Medina
Md = 12.
Percebe-se, portanto, que metade ou 50% dos valores deste conjunto de dados so
menores do que 12 e a outra metade, ou 50% dos valores, so maiores do que o mesmo.
Soluo:
31
Ordenando os dados tem-se X = {3, 6, 9, 12 ,14, 15, 17, 20}. A mdia aritmtica entre os
dois elementos centrais deste conjunto a mediana. Logo,
Md
12 14
Md 13
2
A mdia pode no ser a medida de tendncia central mais adequada para representar
um conjunto de valores quando houver valores discrepantes (valores muito maiores ou muito
menores dos demais), pois a mesma afetada por valores extremos. Para ilustrar este fato,
suponha o seguinte conjunto de dados:
10
12
15
do quais obtm-se
5 7 15
9,5
6
Md =
8 10
9,0
2
10
12
150
32
mediano, da mesma forma que o caso de dados no tabulados. Porm, deve ser levado em
conta a coluna de frequncia absoluta acumulada (fa) .
N de defeitos
por pea (x)
0
1
2
3
TOTAL
Frequncia
acumulada
2
6
13
15
E md
n 1
15 1
E md
E md 8
2
2
Md = 2 defeitos
Isto significa que metade, ou 50% das peas, teve o nmero de defeitos menor ou igual
a 2, e a outra metade, ou 50o%, teve nmero de defeitos maior ou igual a 2.
33
Exemplo
jogadores
da
escola
de
Futebol
Paulistinha.
Idades
14
15
16
TOTAL
Fonte: Fogo (2000)
Frequncia (fi)
(no de Jogadores)
5
13
10
28
Frequncia
acumulada
5
18
28
E md
n
28
E md
E md 14
2
2
Md
15 15
15
2
Portanto, isto significa que metade ou 50% dos alunos tm idade menor ou igual a 15 e
a outra metade, ou 50%, tm idade maior ou igual a 15.
34
Em que:
Li o limite inferior da classe que contm a mediana;
C a amplitude do intervalo de classe, ou seja, a diferena entre os limites superior (Ls) e
inferior (Li) de qualquer classe ( C = Ls -Li);
Emd o elemento mediano. Tratando-se de dados tabulados e agrupados em classes, o
elemento mediano, independentemente de o nmero de observaes ser par ou mpar, ser
sempre:
Emd
n
;
2
Exemplo:
A Lgica Transistor-Transistor (Transistor-Transistor Logic ou simplesmente TTL)
uma classe de circuitos digitais construdos de transistores de juno bipolar (BJT), e
resistores. chamada lgica transistor-transistor porque ocorrem as funes porta lgica e de
amplificao pelos transistores (em contraste com a RTL e a DTL). Isso notvel por ser uma
famlia difundida de circuitos integrados (CI), usada por muitas aplicaes como computadores,
controle industrial, eletrnica de consumo, sintetizadores etc. Por causa do grande uso desta
famlia lgica, sinais de entrada e sada de equipamentos eletrnicos pode ser chamada
entrada ou sada "TTL", significantemente compatvel com os nveis de tenso usados. Estes
circuitos tm como principal caracterstica a utilizao de sinais de 5 volts para nveis lgicos
altos. Seus circuitos integrados so constitudos basicamente de transstores, o que os torna
pouco sensveis eletricidade esttica. Objetivando realizar o controle da tenso de entrada de
94 exemplares desse tipo de circuito, foi construda a seguinte tabela:
35
Frequncia
Frequncia
acumulada
2
15
30
33
10
3
1
94
2
17
47
80
90
93
94
1,5 I 2,0
2,0 I 2,5
2,5 I 3,0
3,0 I 3,5
3,5 I 4,0
4,0 I 4,5
4,5 I 5,0
TOTAL
Fonte: Dados fictcios
Emd
n
94
Emd
Emd 47
2
2
faant = 17
fmd = 30
Logo, a mediana :
E faant
47 17
Md 2,5 0,5 .
Md Li c md
Md 3 v
fmd
30
Portanto, dos 94 circuitos, metade, ou 47, apresentaram tenso maior ou igual a 1,5 e
inferior a 3 volts, ou os outros 47, tiveram tenso maior ou igual a 3 e inferior a 5 volts.
Portanto, todos os circuitos apresentaram sinais de tenso abaixo de 5 volts. Isso no bom,
pois estes circuitos tm como principal caracterstica a utilizao de sinais de 5 volts para
nveis lgicos altos.
36
X = {4, 5, 5, 6, 6, 6, 7, 7, 8, 8}
Y = {4, 4, 5, 5, 6, 6,}
Z = {1,2, 2, 2, 3, 3, 3, 4, 5, 5, 6, 6}
N de defeitos
por pea (x)
0
1
2
3
N de peas (f)
2
4
7
2
37
Portanto, a moda Mo = 2 leses, ou seja, houve maior frequncia de peas com dois
defeitos.
fmo fan t
Mo Li C .
em que:
Li o limite inferior da classe modal;
C a amplitude do intervalo de classe, ou seja, a diferena entre os limites superior (Ls) e
inferior (Li) de qualquer classe ( C = Ls -Li);
fmo a frequncia absoluta simples da classe modal;
fant a frequncia absoluta simples da classe anterior classe modal;
fpost a frequncia absoluta simples da classe posterior classe modal.
Exemplo
Tenso
(em volts)
1,5 I 2,0
2,0 I 2,5
2,5 I 3,0
3,0 I 3,5
3,5 I 4,0
4,0 I 4,5
4,5 I 5,0
Frequncia
2
15
30
33
10
3
1
fmo fan t
Mo Li c .
33 30
1,5
3
Mo 3 0,5 .
Mo 3 0,5 . Mo 3
26
26
2 . 33 (30 10)
M o 3,06 v
38
Isto significa que as tenses de entrada dos circuitos analisados, esto se concentrando
em torno de 3,06 volts, uma vez que este valor pertence classe de maior frequncia.
61,5
61,3
61,3
60,4
59,4
59,7
60,7
60,2
59,2
5,3
5,0
9,5
10,1
5,8
6,2
5,9
7,2
10
12,2
8,5
4,7
11,2
7,3
6,4
03. O nmero de acidentes de trabalho, por ms, foi anotado durante 24 meses, num canteiro de obras,
composto por 50 operrios. Os resultados esto na tabela a seguir:
Tabela 1.5.1 Distribuio de frequncias do
nmero de acidentes por ms num
canteiro de obras
Nmero de acidentes (x) Nmero de meses (f)
0
5
1
10
2
4
3
3
4
2
Total
24
Fonte: Dados fictcios
39
6 Medidas Separatrizes
Existem trs tipos de medidas separatrizes, so elas: Os quartis, que dividem um
conjunto de dados em quatro partes iguais, os decis que dividem em dez e os percentis que
dividem em cem partes. Neste curso vamos nos ater apenas aos quartis
6.1 Quartis(Q)
Os quartis so medidas separatrizes que, simultaneamente, dividem um grupo de
dados em quatro partes iguais.
Individualmente, cada quartil ou junta Q, assim como a mediana, divide o conjunto de
dados em duas partes. O primeiro quartil ou junta (Q 1) o valor que deixa um quarto (25%) dos
valores abaixo ou igual a ele e trs quartos (75%), igual ou acima.
O segundo quartil (Q2) um valor que deixa metade (50%) dos dados abaixo ou igual
e a outra metade acima ou igual ao mesmo. Assim, o segundo quartil (Q2) uma media de
tendncia central, pois coincide com a mediana (Q2 = Md).
O terceiro quartil ou junta (Q3) um valor que deixa trs quartos (75%) dos valores
observados restantes abaixo ou igual ao mesmo e um quarto ou 25% igual ou superior.
40
E Qi
i (n 1)
, com i = 1, 2, 3
4
3. Se o a valor de EQi for um nmero inteiro, o quartil Qi ser igual ao valor do conjunto de
dados que estiver exatamente nesta posio
4. Se o valor de EQi no for um nmero inteiro e estiver na metade das posies anterior e
posterior, o quartil ser a mdia dos valores do conjunto de dados que estiverem nas
posies anterior e posterior a EQi.
5. Se o valor de EQi no for um nmero inteiro e nem estiver na metade de duas outras
posies, o resultado desta dever seguir as regras de arredondamento para um nmero
inteiro mais prximo, o qual dar a posio anterior ou posterior ao E Qi. Selecione o valor
numrico que estiver nesta nova posio.
Exemplo
10,3
4,9
8,9
11,7
6,3
7,7
6,3
7,7
8,9
10,3
11,7
Dados ordenados
4,9
Clculo dos quartis:
E Q1
1 (6 1)
1,75 2a posio ordenada
4
41
Aps ordenar os dados, o elemento que ficou na segunda posio foi 6,3. Logo, o primeiro
quartil
Q1 = 6,3 mm
Portanto, 25% das peas apresentaram dimetro menor que 6,3mm, e 75%
apresentaram dimetro maior que este valor.
Suponha que se queira achar a porcentagem correta de valores abaixo de 6,3. Verificase no conjunto de dados que, h apenas um valor inferior a este de um total de seis valores.
Portanto a porcentagem correta de valores abaixo de 6,3 ser (1/6) 100 17% (arredondado).
Portanto ocorre um erro, pois 25% dos valores deveriam estar abaixo de 6,3 e no 17%.. O
leitor dever levar em conta que, nesse exemplo, o tamanho da amostra de apenas seis
elementos. medida em que aumentado o tamanho da amostra, o erro diminui.
E Q2
2 (6 1)
3,5 a posio ordenada
4
J que este valor est na mesma distncia das posies 3 e 4, o valor segundo quartil ser
dado pela mdia aritmtica valores que esto nessa duas ltimas posies, no conjunto de
dados ordenados. Assim, o segundo quartil
Q2
7,7 8,9
2
8,3 mm
Portanto, 50% das peas apresentaram dimetro menor que 8,3mm, e 50%
apresentaram dimetro maior que este valor.
E Q3
3 (6 1)
5,25 5 a posio ordenada
4
Q3 = 10,3 mm
Portanto, 75% das peas apresentaram dimetro menor que 10,3mm, e 25%
apresentaram dimetro maior que este valor.
42
in
,
EQi
4
i = 1, 2, 3
em que:
i indica o nmero do quartil a ser calculado.
n o nmero de observaes do conjunto de dados ou frequncia total.
em que:
Li o limite inferior da classe em que contem o quartil que est sendo calculado;
C a amplitude do intervalo de classe, ou seja, a diferena entre os limites superior (Ls) e
inferior (Li) de qualquer classe ( C = Ls -Li);
faant a frequncia acumulada at a classe anterior classe do quartil em questo;
fQi a frequncia da classe do quartil que est sendo calculado..
Tabela
1.12
Distribuio
de
frequncias
das
Nmero de
Funcionrios (f)
5
10
30
40
10
5
100
Fa
5
15
45
85
95
100
E Qi
in
4
E Q1
1.x100
4
25
43
faant = 15
fQ1 = 30
f
30
Q1
Portanto, 25% dos funcionrios dessa empresa apresentaram estatura menor ou igual a
1,63m, e 75% apresentaram estaturas maiores ou iguais a este valor.
E md
n
100
E md
E md 50
2
2
E faant
Q 2 Md Li c. md
fmd
50 45
Q 2 1,70 0,1 .
Q 2 1,71 m
40
Portanto, 50% dos funcionrios dessa empresa apresentaram estatura menor ou igual a
1,71m, e 50% apresentaram estaturas maiores ou iguais a este valor.
EQi
3 x 100
i n
EQ3
75
4
4
44
E f
Q3 l c. Q 3 ant
f Q1
75 45
Q3 1,70 0,10 .
Q3 1,78 m
40
Portanto, 75% dos funcionrios dessa empresa apresentaram estatura igual ou inferior a
1,78m, e 25% apresentaram estatura igual ou superior a esse valor.
61,5
61,3
61,3
60,4
59,4
59,7
60,7
60,2
59,2
5,3
5,0
9,5
10,1
5,8
6,2
5,9
7,2
10
12,2
8,5
4,7
11,2
7,3
6,4
45
7 Medidas de disperso
As medidas de posio, como visto, do uma idia de todo o conjunto, atravs de um
valor nico. Porm, elas so insuficientes para descrever mais detalhadamente o
comportamento da variao de todo o conjunto, como ser visto a seguir.
Considere os tempos, de trs mquinas semelhantes, para executar certa operao
industrial. Foram tomados os tempos (em segundos) de 5 operaes para cada mquina,
fornecendo os seguintes resultados:
Mquina A:
10,
10,
10,
10,
10
Mquina B:
11,
10,
9,
11,
Mquina C:
3,
4,
5,
20,
18
x A x B xC 10 s,
Ou seja, o tempo para executar a operao o mesmo para as trs mquinas. Mas,
observando mais detalhadamente os trs grupos obtidos, pode-se notar que se distribuem
diferentemente em relao mdia (10 s), como mostra o esquema a seguir:
Para uma anlise quantitativa dessa maior ou menor variao (ou disperso) do conjunto
de valores em torno do valor mdio, deve-se estudar as medidas de disperso. As principais
46
so: A varincia, o desvio padro, desvio interquarti, amplitude, desvio mdio, coeficiente de
variao.
( xi )2
i 1
fi(xi )2
i 1
47
s2
(x
i 1
x )2
n 1
s2
fi ( x
i 1
x)2
n 1
s s2
Mquina C:
3,
4,
5,
20,
18
( xi
s 2 i 1
S2
10)2
5 1
Portanto, a mdia dos quadrados dos desvios em relao mdia, cujo valor 10
segundos, 68,5 segundos2, no que se refere aos tempos de 5 operaes da mquina C.
O desvio padro :
48
Mquina A:
10,
10,
10,
10,
10
Mquina B:
11,
10,
9,
11,
Mquina C:
3,
4,
5,
20,
18
O quadro a seguir mostra os resultados das varincias e dos desvios padro das mquinas A,
B e C.
Mquina
A
B
C
( x i x )2
N 1
i 1
n 1
N1 2
S
N
Observa-se pela expresso anterior que, quando o tamanho da populao finita muito
49
Para ilustrar o aspecto de que se vrias amostras forem coletadas nessa populao
finita, ento o valor mdio de 2 ser 2 , considere um exemplo hipottico, de uma
populao com N = 7 elementos, dados a seguir:
10
12
2 4 12
(2 7,1429)2 (12 7,1429)2
7,1429 e 2
10,9796
7
7
Amostra No
Elementos
S2
{2, 4, 5, 8, 9, 10}
6,3333
9,8667
8,4571
{2, 4, 5, 8, 9, 12}
6,6667
13,4667
11,5429
6,8333
14,5667
12,4857
7,0000
15,2000
13,0286
7,5000
14,3000
12,2571
7,6667
13,0667
11,2000
8,0000
9,2000
7,8857
Mdia
7,1429
12,8095
10,9796
x igual ao de , ou seja,
mdia( x) 7,1429 .
Quanto aos estimadores da varincia populacional, o nico cujo valor mdio resultou
igual a 2 foi o de , isto ,
2
mdia ( 2 ) 2 10,9796
Exemplo
Suponha que de uma populao finita de 50 funcionrios de uma empresa, foram
escolhidos 15 indivduos, aleatoriamente, e verificado o nmero de dias que cada um chegou
atrasado ao servio, em um ms. Os resultados (hipotticos) so dados a seguir
50
15
10
12
12
16
20
18
18
19
21
12
14
15
13
12
Soluo:
227
15,13
15
Como a populao finita (N = 50), a varincia e o o desvio padro amostrais podem ser
calculados por:
n
(x
N 1
i 1
x )2
n 1
N 1 2
S
N
50 . 14 11,32
50
15 1
Portanto, o desvio quadrtico mdio dos valores individuais, em relao a mdia, cujo
valor de 15,13 dias, foi de 11,32 dias2
Logo, o valor do desvio padro :
Portanto, o desvio dos valores individuais, em relao a mdia, cujo valor de15,13 dias,
foi em mdia igual a 3,36 dias.
xi x
Dm
i 1
n
n
xi Md
Dm
i 1
51
xi x
i 1
Mquina C:
3,
4,
5,
20,
18
Tem-se:
xi x
Dm
i 1
3 10 4 10 18 10
5
7 6 5 10 8
7,2 minutos
5
Conclui-se que a mdia dos valores absolutos dos desvios tomados em relao a
mdia, foi de 7,2 minutos
xi Md
Dm
i 1
3 5 4 5 18 5
5
6,2 minutos
Conclui-se que a mdia dos valores absolutos dos desvios tomados em relao a
mediana, foi de 6,2 minutos. Isto confirma a segunda propriedade de desvio mdio, pois 6,2 <
7,2.
52
At = xmx - xmin
Mquina A:
At = 10 - 10 = 0s
Mquina B:
At = 11 - 9 = 2s
Mquina C:
At = 20 - 3 = 17s
53
Para ilustrar o fato de que o desvio padro afetado pelos extremos, enquanto que o
intervalo interquartil no se altera, suponha o seguinte conjunto de dados
5 7 15
9,5
6
10
12
15
E Q1
1 (6 1)
1,75 2a posio ordenada Q1 = 7
4
E Q3
3 (6 1)
5,25 5 a posio ordenada Q3 = 12
4
10
12
150
cv
s
x
54
cv
s
.100
x
mdia
xi x
i 1
Exemplo:
Supondo que um parafuso do tipo 1 tem mdia x1 30 cm de comprimento e desvio
padro s1 = 3 cm, enquanto que ao parafuso do tipo 2 tem mdia x 2 80 cm e desvio padro
s2 = 4 cm. Nota-se que em termos absolutos, a disperso do parafuso do tipo 1 menor que a
do tipo 2, pois, s1 < s2. No entanto, as mdias de comprimentos dos dois tipos de parafusos so
muito diferentes. Neste caso no, comparar as disperses dos comprimentos dos dois tipos de
parafusos pelos desvios padro no parece ser o melhor procedimento. Ento, mais til
comparar as variabilidades dos comprimentos em relao mdia, ou seja, em termos
relativos, o parafuso do tipo 1 possui coeficiente de variao
55
cv1
s
3
.100 100 10%
x
30
cv 2
s
4
.100 100 5%
x
80
a3
m3
s3
m3
(x i x) 3
i 1
56
m3
f i (x i x) 3
i 1
em que:
k o nmero total de categorias;
xi o valor individual de cada categoria se os dados no estiverem distribudos em classes, ou
o ponto mdio de cada classe, xi = (Ls + Li)/2, se os dados forem apresentados em classes
Sendo a3 = 0, tem-se uma distribuio simtrica. Quando ocorre a3 0, a distribuio
alongada esquerda, sendo assimtrica esquerda ou assimtrica negativa; para a 3 > 0, a
distribuio alongada direita, sendo denominada de assimtrica direita ou assimtrica
positiva, como mostra Figura 1.12.Tambm observa-se o seguinte aspecto na figura 1.12
Distribuio simtrica x Md Mo
Distribuio assimtrica negativa x Md Mo
Mo Md x
x Md Mo
x Md Mo
Mo Md x
Figura 1.12 Distribuio simtrica (a3 = 0), assimtrica negativa (a3 < 0) e
assimtrica positiva (a3 > 0)
Outra medida que pode ser utilizada para avaliar o grau de assimetria o chamado
coeficiente de assimetria de Pearson o qual pode ser dado por:
( x Mo)
s
Algumas vezes o conjunto de dados contm mais de uma moda, ou no a possui. Nesse caso
poder usada a seguinte expresso:
A
3 ( x Md )
s
57
( x Mo ) 3 ( x Md)
Assim,
( x Mo) 3 ( x Md)
s
s
Apenas quando a distribuio for simtrica essas expresses sero equivalentes, pois
essas relaes so aproximadas.
8.2 Curtose
A curtose definida como o grau de achatamento de uma distribuio de dados,
considerado usualmente em relao disrtibuio normal (distribuio terica que ser objeto
de estudo na seo 10.2). Com relao ao achatamento, a distribuio normal dita
mesocrtica. As distribuies mais achatadas so ditas platicrticas, enquanto que as mais
afiladas so ditas leptocrticas, como mostra a figura 1.13.
Normal
Leptocrtica
Platicrtica
A principal medida de curtose dada pelo coeficiente momento de curtose (a4), sendo
definida pelo quociente entre o quarto momento centrado na mdia (m 4)e o desvio padro
elevado Quarta potncia (s4), ou seja,
a4
m4
s4
58
m4
( xi x ) 4
i 1
m4
fi ( x i x ) 4
i 1
em que:
k o nmero total de categorias ou classes;
xi o valor individual de cada categoria se os dados no estiverem distribudos em classes, ou
o ponto mdio de cada classe, xi = (Ls + Li)/2, se os dados forem apresentados em classes
O coeficiente do momento de curtose uma medida adimensional de curtose, sendo
a4 = 3 para a distribuio normal, a4< 3 para a distribuio platicrtica e a 4 > 3 para distribuio
leptocrtica.
Na prtica s faz sentido calcular a curtose para as distribuies simtricas ou pelo
menos aproximadamente simtrica.
Exemplos:
Suponha que tenha sido Realizada uma experincia a fim de examinar o efeito da idade
sobre o nmero de batidas do corao, quando o funcionrio submetido a certo tipo de
atividade. Foram sorteados 10 funcionrios na faixa etria de 20 a 39 anos. Cada um andou
sobre uma pista fixa (comandada pelo movimento dos ps) durante 12 minutos, numa
intensidade predeterminada. O aumento das batidas do corao de cada pessoa, ou seja, a
diferena entre os totais antes e depois do exerccio, foi anotado para cada um dos
funcionrios, obtendo-se os resultados a seguir em batidas por minuto. Sabendo que a mdia
de 27,5 batimentos/minuto e o desvio padro de 4,9 batimentos/minuto, e a mediana 27,5
batimentos/minuto calcule a assimetria e o grau de achatamento da distribuio dos dados.
24
27
33
31
21
28
24
34
21
32
( x i x )3
m3
i 1
m3
59
m3
60
m 3 6
10
6
( xi x )
logo,
a3 - 0,05
a3
i 1
4,9 3
n
n
3 ( x Md)
3 (27,5 27,5)
= A
0
s
4,9
(x i x) 4
m4
i 1
m4
10
m4
10
10
m4
7130,625
m4 713,0625
10
logo, a4
m4
s
a4
713,0625
4,9 4
=1,2369
Classes
(peso em kg)
1,5 I 2,0
2,0 I 2,5
2,5 I 3,0
3,0 I 3,5
3,5 I 4,0
fi
xi = (Li +Ls)/2
2
5
10
4
2
m3
f i ( x i x )3
i 1
60
m3
0,25
m3 0,01
23
m3
m3
Logo, a 3
a3
s3
0,01
0,523
a 3 0,07
fi ( x i x ) 4
i 1
m4
m4
m4
m4
m4
4,57
m4 0,20
23
Logo, a4
m4
s
0,20
0,52 4
a 4 2,7
Conclui-se, portanto, que a curva de distribuio de frequncias dos pesos em kg, dos
23 pacotes desse produto, aproximadamente normal, pois a 4 2,7 3.
1 Suponha que tenha sido cronometrado o tempo que operrios levam para realizar
determinada tarefa em certa indstria, conforme os dados abaixo.
45
37
39
48
51
40
61
n de peas defeituosas
0
1
2
3
4
n de lotes(f)
2
3
10
5
3
Frequncias
4
5
8
7
3
3