Está en la página 1de 62

Universidade Estadual do Oeste do Paran

Campus de Foz do Iguau


Centro de Engenharias e Cincias Exatas

ESTATSTICA
DESCRITIVA

Carlos dos Santos

Foz do Iguau
Fevereiro/2015

Sumrio
1 Introduo.....................................................................................................................2
2 Variveis Estatsticas .................................................................................................... 3
2.1 Sequncia de exerccios n 1 ......................................................................................................... 4

3 Representao tabular .................................................................................................. 5


3.1 Tabelas de frequncias de dados no agrupados em classes .......................................................... 6
3.2 Tabelas de frequncias de variveis qualitativas ............................................................................ 8
3.3 Tabelas de frequncias de dados agrupados em classes ................................................................. 9
3.4 Sequncia de exerccios n 2 ........................................................................................................ 12

4 Representao Grfica ............................................................................................... 14


4.1 Grfico de pontos ......................................................................................................................... 14
4.2 Grfico de frequncias acumuladas ............................................................................................ 15
4.3 Histograma .................................................................................................................................. 16
4.4 Polgono de frequncias ............................................................................................................... 17
4.5 Polgono de frequncias acumuladas ........................................................................................... 18
4.6 Grfico de Barras ......................................................................................................................... 19
4.7 Grfico de setores ........................................................................................................................ 20
4.8 Grfico de linhas .......................................................................................................................... 22
4.9 Sequncia de exerccios n 3 ........................................................................................................ 24

5 Medidas de tendncia central ..................................................................................... 26


5.1 Mdia Aritmtica ......................................................................................................................... 26
5.2 Mediana ....................................................................................................................................... 29
5.2.1 Determinao da mediana de dados brutos ......................................................................... 29
5.2.2 Determinao da mediana de dados tabulados no-agrupados em classes .......................... 31
5.2.3 Determinao da mediana de dados tabulados e agrupados em classes .............................. 34
5.3 Moda (Mo) ................................................................................................................................... 36
5.3.1 Determinao da moda de valores no tabulados ............................................................... 36
5.3.2 Determinao da moda de valores tabulados e no agrupados em classes .......................... 36
5.3.3 Determinao da moda de valores tabulados e agrupados em classes.................................37
5.3.4 Sequncia de exerccios n 4 ............................................................................................... 38

6 Medidas Separatrizes .................................................................................................. 39


6.1 Quartis(Q) .................................................................................................................................... 39
6.1.1 Determinao de quartis de dados brutos ............................................................................ 40
6.1.2 Determinao de quartis de dados tabulados ....................................................................... 42

7 Medidas de disperso .................................................................................................. 45


7.1 Varincia e desvio padro ............................................................................................................ 46
7.2 Desvio mdio (Dm) ...................................................................................................................... 50
7.3 Amplitude total ou Intervalo total ................................................................................................ 52
7.4 Intervalo Interquartil .................................................................................................................... 52
7.5. Coeficiente de variao ............................................................................................................... 53

8. Medidas de Assimetria e Curtose .............................................................................. 55


8.1 Medidas de Assimetria ................................................................................................................. 55
8.2 Curtose ......................................................................................................................................... 57
8.3 Sequncia de exerccios n 5 ........................................................................................................ 60

Introduo
A estatstica uma cincia formada por vrios mtodos aplicados a vrios ramos do
conhecimento humano para a obteno e utilizao de informaes que possibilitam a tomada
de deciso em determinada situao prtica.
A estatstica descritiva uma funo (mdia, moda, mediana, desvio padro, coeficiente
de variao, etc.), cujo valor numrico descreve, por si s, determinada caracterstica de um
conjunto de dados, reduzindo-o a propores mais facilmente interpretveis. Em um sentido
mais amplo, a estatstica descritiva pode ser interpretada como a observao de fenmenos de
mesma natureza, coleta de dados numricos referentes a esses fenmenos, organizao,
classificao e apresentao desses dados por meio de grficos e tabelas.
Pode-se dizer que toda a cincia que manipula dados experimentais necessita da
estatstica como mtodo de anlise, para que o pesquisador possa tirar concluses que
tenham validade cientfica.
Geralmente surge a seguinte pergunta: Porque utilizar os mtodos estatsticos? A
questo colocada no se refere falta de informao, mas sim como utilizar a informao
disponvel para tomar melhores decises. a partir dessa perspectiva que se deve avaliar
porque um profissional deve conhecer a estatstica. Dentre as razes para aprender estatstica,
o profissional precisa:

Aprender como apresentar e descrever informaes de forma adequada.

Saber como tirar concluses a partir de grandes populaes com base somente na
informao obtida de amostras.

Saber como melhorar os processos de produo ou prestao de servios.

Saber como obter previses confiveis a partir de variveis de interesse.

Na rea de engenharia, a aplicao da estatstica muito vasta, estando presente


principalmente, na anlise de propriedades de materiais e no estudo do controle estatstico de
qualidade industrial, onde as tcnicas de controle tm evoludo e proporcionado resultados
importantes.
Os profissionais da rea de informtica avaliam dados de desempenho de novos
sistemas, por meio de mtodos estatsticos. Os programadores executam uma bateria
completa de testes e fazem os ajustes necessrios em quaisquer programas criados antes de
apresent-los para o cliente. Vrios testes so realizados pelo programador em diferentes
fases de desenvolvimento para verificar problemas de desempenho e de outros problemas. O
teste ajuda a eliminar falhas e impede que programas deixem de funcionar no futuro.

A evoluo das tcnicas de gesto, nos campos da economia e administrao uma


realidade devido a, tambm, utilizao de mtodos estatsticos, os quais auxiliam na tomada

de deciso. Enfim, todas as reas do conhecimento humano podem e devem utilizar a


estatstica como ferramenta auxiliadora na descrio e tomada de deciso.
Neste curso sero desenvolvidos os seguintes tpicos de estatstica; Estatstica
descritiva, probabilidade, amostragem e inferncia estatstica.
O estudo de amostragem possibilitar o conhecimento das principais tcnicas de
obteno de amostras bem como suas aplicaes.
O estudo de probabilidades ser necessrio para que possam ser desenvolvidos os
principais mtodos de inferncia estatstica.
A inferncia estatstica vai possibilitar a tomada de deciso acerca de populaes
(conjunto de elementos que tm pelo menos uma caracterstica de interesse em comum)
partindo de amostras (subconjuntos representativos da populao).
Por exemplo, suponha um processo produtivo onde um conjunto de 36 peas foi
inspecionado. Nesse caso, as 36 peas retiradas da produo representam uma amostra da
populao de todas as peas produzidas, de maneira que somente com a aplicao dos
mtodos de inferncia estatstica ser possvel responder a determinadas perguntas como: o
comprimento mdio das peas produzidas menor do que 5 cm? O nmero de peas
observadas suficiente para obter concluses acerca da populao?
Inicialmente no nos preocuparemos em diferenciar se um conjunto de observaes
corresponde a uma amostra ou populao, j que essa distino ser necessria a partir do
estudo de amostragem.

2 Variveis Estatsticas
As caractersticas que descrevem a populao so chamadas variveis, e um valor
observado com relao a uma varivel chamado dado ou observao.

Varivel Caracterstica pela qual se deseja que a populao seja descrita, ou por meio da qual,
decises acerca da populao so tomadas. Por exemplo: altura de alunos, comprimento
peas, preferncia do eleitor, etc.

Dado Observao ou realizao referente a uma varivel. Por exemplo, retirou-se uma pea da
linha de produo e o comprimento anotado foi de 5cm . Isto um dado.

Na descrio ou anlise de um conjunto de dados estatsticos, possvel associar certos


tipos de variveis, pois o tratamento matemtico exigido e o mtodo estatstico empregado
dependero do tipo de varivel em estudo. Podem ser considerados dois tipos de variveis, as
qualitativas e as quantitativas. As qualitativas podem ser nominais ou ordinais, enquanto que
as quantitativas podem ser discretas ou contnuas, como mostra o esquema a seguir:

nominais
qualitativas
ordinais

Tipos de variveis

discretas
quantitati vas

contnuas
As variveis qualitativas esto associadas a uma caracterstica que denota qualidade ou
atributo, sendo que as qualitativas nominais no seguem uma ordem pr-definida. Alguns
exemplos de variveis qualitativas nominais so: cor dos olhos dos operrios de certa indstria
(azuis, castanhos, verdes, etc), desempenho dos operrios (timo, bom, regular, pssimo, etc),
qualidade de produtos (defeituosos, perfeitos, recuperveis, etc). J, as qualitativas ordinais
seguem uma determinada ordem. Um exemplo clssico desse tipo de varivel o grau de
escolaridade (1o grau, 2o grau, 3o grau, etc).
As variveis quantitativas esto associadas a valores numricos, podendo ser discretas ou
contnuas. Uma varivel dita discreta quando o nmero de valores for finito ou infinito
enumervel. So exemplos de variveis discretas: nmero de peas produzidas por certa
indstria, nmero de defeitos encontrados em seus produtos, nmero de dias que choveu em
certa localidade durante o ms de maro, etc. A varivel contnua aquela que pode, ao
menos teoricamente, assumir qualquer valor entre dois valores possveis dessa varivel.
Alguns exemplos de variveis contnuas so: comprimentos de parafusos fabricados por certa
mquina, tempos gastos pelos operrios para realizar certa tarefa, resistncia ruptura dos
cabos produzidos por certa companhia, etc. Costuma-se dizer, de uma maneira geral, que as
variveis discretas esto associadas s contagens e as variveis contnuas s medies
(metros, kg, minutos, etc).

2.1 Sequncia de exerccios n 1


01 D a definio de estatstica

02 D a definio de Estatstica descritiva

03. Como a estatstica usada na sua rea de formao?

04 Classificar cada uma das seguintes variveis (qualitativa nominal, qualitativa ordinal,
quantitativa discreta ou contnua):

a) Populao: Vlvulas fabricadas por certa indstria


Varivel: nmero de vlvulas defeituosas em cada lote de 100 vlvulas.
b) Populao: cabos fabricados por certa companhia;

Varivel: nmero de cabos defeituosos am cada lote de 100 cabos


c) Populao: Cursos de matemtica de nvel superior
Varivel: colocao no ltimo provo do MEC.
d) Populao: Televiso de certa marca
Varivel: opinio dos compradores acerca da qualidade
e) Populao: Cultivar de Milho A
Varivel: nmero de espigas produzidas por planta
Varivel: altura da planta
f) Populao: Bois da raa Nelore
Varivel: Peso de abate

3 Representao tabular
Quando um conjunto de observaes de certo fenmeno no est devidamente
organizado, so chamados de dados brutos, fornecendo poucas informaes de interesse ao
pesquisador.

Dados brutos uma listagem dos dados originais, apresentada de forma desordenada.

A primeira forma de organiza-los a de ordena-los, construindo o chamado Rol.

Rol uma listagem na qual os valores observados esto dispostos em ordem crescente, ou
decrescente

Apesar de o rol propiciar ao analista, mais informaes, com menos esforo de


visualizao que os dados originais, no se sabe de imediato, quantos elementos ocorrem em
cada categoria, exigindo para isso uma contagem. Esse problema se agrava com o aumento do
nmero de observaes, pois a consulta teria que ser feita diretamente lista. Portanto, foi
idealizada a distribuio de frequncias, as quais associam os valores da varivel estudada,
com as respectivas frequncias.

Frequncia Medida que quantifica a ocorrncia de valores de uma varivel

Distribuio de frequncia Consiste em uma funo que associa os valores que uma varivel
assume com suas respectivas frequncias de ocorrncia.

Assim, a representao tabular consiste em dispor a distribuio de frequncias das


categorias ou valores da varivel em tabelas.
Uma tabela pode apresentar e caracterizar os seguintes tipos de frequncias:

absoluta ( f )
simples
relativa( fr)

Frequncia

absoluta ( fa)
acumulada

relativa( far)
Geralmente uma tabela formada pelos seguinte componentes: Ttulo, Cabealho,
coluna indicadora, Corpo, Linha de totais e Rodap. Conforme a Figura 1.1
O ttulo deve conter as informaes relativas ao contedo da tabela, a(s) varive(is)
dispostas, podendo ainda conter o local de coleta dos dados, e quando foi realizado o estudo.
O cabealho especifica as variveis e a frequncia (ou outra caracterstica) correspondente aos
seus valores.
O corpo representado por uma srie de colunas e subcolunas, dentro das quais so
colocados os dados agrupados. No rodap so colocadas a legenda e todas as observaes
que venham a esclarecer a interpretao da tabela. De um modo geral a tambm disposta a
fonte dos dados (entidade que fornece), embora em alguns casos ela seja colocada no ttulo.
Segundo as regras da ABNT, as laterais da tabela no devem ser fechadas e no deve haver
traos horizontais separando as linhas interiores da tabela.

Figura 1.1 - Componentes de uma tabela


Mais detalhes sobre normas tabelas devero norma NBR 14724:2011 subitem 5.9, que por
sua vez, remete as Normas de Apresentao Tabular do Instituto Brasileiro de Geografia e
Estatstica IBGE (1993), as quais podem ser encontradas no seguinte site:
http://biblioteca.ibge.gov.br/visualizacao/livros/liv23907.pdf

3.1 Tabelas de frequncias de dados no agrupados em classes


Classes so intervalos numricos que representam os valores de uma varivel

Nas tabelas com dados no-agrupados em classes, os valores so individuais da


primeira coluna so individuais. Esse tipo de tabela utilizado quando a varivel em estudo
quantitativa discreta e possui no mximo dez valores individuais.

Exemplo

Considere a varivel discreta X, representando o nmero de componentes eletrnicos


defeituosos em cada lote 500 componentes produzidos. Foram inspecionados 50 lotes,
fornecendo os seguintes valores para X:

Dados brutos

5
6
4
8
1

3
5
6
4
4

2
4
6
4
5

1
5
4
4
4

4
3
2
3
6

5
6
3
0
2

5
7
0
1
5

6
7
5
3
6

7
5
6
2
4

4
5
3
4
3

0
0
1
1
1

2
2
2
2
3

3
3
3
3
3

3
4
4
4
4

4
4
4
4
4

4
4
4
5
5

5
5
5
5
5

5
5
5
6
6

6
6
6
6
6

6
7
7
7
8

Rol

Tabela 1.1 Nmero de componentes eletrnicos defeituosos em cada lote de 500 componentes
Nmero de
Nmero
Componentes defeituosos de lotes (f)
0
2
1
3
2
4
3
7
4
12
5
10
6
8
7
3
8
1
Total
50
Fonte: dados fictcios

Porcentagem
fr(%)
(2/50)*100 = 4
(3/50)*100 = 6
(4/50)*100 = 8
(7/50)*100 = 14
(12/50)*100 = 24
(10/50)*100 = 20
(8/50)*100 = 16
(3/50)*100 = 6
(1/50)*100 = 2
100

Nmero
de lotes (fa)
2
5
9
16
28
38
46
49
50

Porcentagem
Acumulada far(%)
4
10
18
32
56
76
92
98
100

Observa-se que apenas 2 lotes no apresentaram componentes defeituosos,


representando, 4% do total de lotes inspecionados; o nmero de componentes eletrnicos
defeituosos mais frequente foi o de 4 componentes, ocorrendo em 12 lotes, o equivalente a
24% dos lotes; ocorreu o nmero de 5 componentes defeituosos em 10 lotes, o equivalente a
20% dos 50 lotes, sendo o segundo predominante.

Ocorreram 28 lotes, o equivalente a 56% do total de lotes inspecionados, com 4


componentes defeituosos ou menos.

3.2 Tabelas de frequncias de variveis qualitativas


As tabelas de variveis qualitativas podem ser de entrada simples, de dupla entrada, e
de mltipla entrada. A cada entrada corresponde uma linha (ou coluna) de totais. Nesse tipo de
tabela, as categorias devem ser organizadas, de forma que haja uma ordem decrescente de
frequncias.

Exemplo

Suponha que a empresa A, a fim de realizar torneios internos, resolveu realizar uma
pesquisa sobre a preferncia esportiva de seus funcionrios, resultando a Tabela 1.2.

Tabela 1.2 - Preferncia esportiva dos Funcionrios da empresa A.


Preferncia

Nmero de
Funcionrios (f)

Futebol
Vlei
Basquete
Handebol
TOTAL
Fonte: dados fictcios

40
32
24
8
104

Porcentagem
fr(%)

Nmero de
funcionrios
fa
(40/104)*100 = 38,46 0 + 40 = 40
(32/104)*100 = 30,77 40+ 32 = 72
(24/104)*100 = 23,08 72 + 24 =96
(8/104)*100 = 7,69
96 + 8 = 104
100

Porcentagem
far(%)
0 + 38,46 = 38,46
38.46 + 30,77 = 69,23
60,23 + 23,08 = 92,31
92,31 + 7,69 = 100,00

Percebe-se que a preferncia esportiva de maior frequncia foi o futebol com 40 de 104
funcionrios, o equivalente a 38,46. Nota-se que o vlei foi o segundo esporte preferido, com
32 funcionrios, o equivalente a 30,77%. Observa-se, ainda, que, o futebol e o vlei somaram
juntas 72 funcionrios, o equivalente a 69,23% do total, ou seja, a maioria. O basquete vem em
terceiro, com 96% da preferncia.
comum, no entanto, a necessidade de apresentar, numa s tabela, mais do que uma
caracterstica em estudo. Assim, torna-se necessrio o uso de tabelas de dupla entrada. A
Tabela 1.3, por exemplo, mostra a preferncia esportiva dos funcionrios da empresa A,
levando em conta varivel sexo.

Tabela 1.3 - Preferncia esportiva dos funcionrios da empresa A, segundo o sexo.


Masculino
Feminino
Preferncia
Total
N de
N de
esportiva
Porcentagem
Porcentagem
funcionrios
funcionrios
Futebol
30
75,0
10
25,0
40
Vlei
12
37,5
20
62,5
32
Basquete

14

58,3

10

Handebol

25,0

Total

58

46

41,7
75,0

24
8
104

Fonte: Dados Fictcios


Percebe-se que o nmero total de homens diferente do nmero de mulheres,
portanto no possvel fazer uma comparao entre homens e mulheres diretamente pela
frequncia Absoluta. Por outro lado, esta comparao pode ser feita por meio das
porcentagens. Percebe-se, portanto, que dos funcionrios que preferem futebol, 75% so
homens e 25% so mulheres. Daqueles funcionrios que preferem o vlei, 37,5% so do sexo
masculino e 62,5% so do sexo feminino. No basquete, 58,3% so homens e 41,7% so
mulheres. No handebol, o nmero de funcionrios insuficiente. Portanto, possvel organizar
um torneio de futebol masculino ou misto, um torneio de vlei feminino ou misto e um torneio
de basquete misto.

3.3 Tabelas de frequncias de dados agrupados em classes


Os dados tabulados e agrupados em classes so utilizados quando a varivel em estudo
quantitativa contnua ou, quando discreta, mas o nmero de valores individuais maior do
que 10. Neste ltimo caso, o procedimento de agrupar dados individuais, em classes, visa
evitar certos inconvenientes, tais como:
-

Grande extenso da tabela, dificultando tanto quanto os dados brutos, a leitura e a


interpretao dos resultados;

Aparecimento de diversos valores da varivel com frequncia nula.

Exemplo

Suponha que um fabricante de autopeas, a fim de realizar o controle de qualidade,


mediu o comprimento em milmetros de um determinado tipo pea, cujos dados so
apresentados a seguir:

10

130,00

105,00

120,00

111,50

99,00

116,00

82,50

107,50

125,00

100,00

107,50

120,00

143,00

115,00

135,00

130,00

135,00

127,50

90,50

104,50

136,50

100,00

145,00

125,00

104,50

101,50

102,50

101,50

134,50

158,50

110,00

102,50

90,50

107,50

124,00

121,50

135,00

102,00

119,50

115,50

125,50

117,50

107,50

140,00

121,00

107,50

113,00

93,00

103,50

a) O primeiro passo o de ordenar a lista de dados brutos (Rol)

82,50

101,50

104,50

110,00

119,50

125,00

135,00

90,50

101,50

105,00

111,50

120,00

125,50

135,00

90,50

102,00

107,50

113,00

120,00

127,50

136,50

93,00

102,50

107,50

115,00

121,00

130,00

140,00

99,00

102,50

107,50

115,50

121,50

130,00

143,00

100,00

103,50

107,50

116,00

124,00

134,50

145,00

100,00

104,50

107,50

117,50

125,00

135,00

158,50

b) Encontrar a amplitude total do conjunto de valores observados, a qual dada por:


At = Maior valor observado Menor valor observado
At = 158,50 82,50 = 76

c) Calcular o nmero de classes (k). Alguns autores propem que se utilize a frmula de
Sturges, expressada por:

K = 1 + 3,3*log(n)

em que n o nmero total de observaes. O nmero k de classes geralmente ter casas


decimais, portanto, convm arredond-lo para um nmero inteiro, usando as regras de
arredondamento, de forma que a ltima classe inclua o maior valor observado. Apesar de
realizar este procedimento, podem ocorrer alguns casos em que o maior valor observado no
venha a ser includo na ltima classe. Ento, faz-se necessrio arredondar tambm a amplitude
C do intervalo de classe. Assim, para o exemplo dado tem-se
K = 1 + 3,3 x log 49 k = 6,577... k = 7

Portanto, a tabela dever ter sete classes ou intervalos.

11

d) Determinar a amplitude do intervalo de classe, dada pela frmula a seguir:

No exemplo dado tem-se C =

76
= 10,85714285714 C = 10,86
7

Nesse exemplo no foi preciso aumentar a amplitude do intervalo de classe. Geralmente


surge a seguinte pergunta: Quando se sabe que preciso aumentar a amplitude C? preciso
fazer seguinte clculo:

Limite superior da ltima classe = menor valor +C.K

Limite superior da ltima classe = 82,5 +10,86 * 7 = 158,52 > 158,5 (mximo valor
observado). Ok, ento as classes da tabela j podem ser construdas.

No exemplo dado, se fossem construdas as k =7 classes e a ltima dessas no


inclusse o maior valor observado (158,5), o leitor deveria retornar amplitude C e arredond-la
para mais. Nesse caso teramos C = 10,87. Caso o problema persistisse, o processo deveria
ser repetido. Logo, a nova amplitude de classe seria C = 10,86.

e) Determinar os limites de classes. Muitos autores adotam os seguintes smbolos:

I : indica incluso na classe do valor situado sua esquerda e excluso do valor situado
sua direita.
I : indica excluso na classe do valor situado sua esquerda e incluso do valor situado
sua direita.
II : indica incluso na classe dos valores situados a sua esquerda e direita.

Adotaremos aqui, o procedimento de somar o menor valor observado amplitude C. O


resultado desta soma ser somado novamente amplitude C, e assim sucessivamente, at
que sejam criadas todas as classes necessrias. Neste exemplo, C = 10,86, e o menor valor o
82,50, ento,
Para 82,50 + 10,86 = 93,36

Tem-se 82,50 I 93,36

Para 93,36 + 10,86 =104,22

tem-se 93,36 I 104,22

Para 104,22 + 10,86 =115,08

tem-se 104,22 I 115,08

Para 115,08 + 10,86 =125,94

tem-se 115,08 I 125,94

Para 125,94 + 10,86 =136,80

tem-se 125,94 I 136,80

12

Para 136,80 + 10,86 =147,66

tem-se 136,80 I 147,66

Para 147,66 + 10,86 =158,52

tem-se 147,66 I 158,52

Nota-se que a ltima classe 147,66 I 158,52 j inclui o maior valor observado (158,50),
ento no preciso construir mais classes. O passo seguinte o de retornar aos dados
ordenados (ROL) e fazer a contagem dos valores includos em cada classe. Nesses dados
percebe-se que os quatro primeiros valores (82.50; 90,50; 90,50 e 93) esto dentro da classe
82,50 I 93,36. Portanto, a frequncia desta categoria 4. As frequncias de todas as classes
esto na tabela 1.4.

TABELA 1.4 - Comprimento em milmetros de auto-peas do tipo A


Classes
Comprimento (mm)
82,50 I 93,36
93,36 I 104,22
104,22 I 115,08
115,08 I 125,94
125,94 I 136,80
136,80 I 147,66
147,66 I 158,52
TOTAL
Fonte: Dados fictcios

no de peas
4
9
12
12
8
3
1
49

Frequncia
acumulada
4
13
25
37
45
48
49

Porcentagem
8,2
18,4
24,5
24,5
16,3
6,1
2,0

Porcentagem
acumulada
8,2
26,5
51,0
75,5
91,8
98,0
100,0

Nota-se que, das 49 peas observadas, 12 o equivalente 24,5% apresentaram


comprimento maior ou igual a 104,22 e menor do que 115,08mm. Outras 12 apresentaram
comprimento maior ou igual a 115,08 e menor do que 125,94mm. Ento, estas foram as duas
classes com maior frequncia. Se forem somadas as frequncias dessas duas categorias
haver 24 peas, ou seja, quase metade das 49 peas observadas. No cruzamento da terceira
coluna da tabela com a linha da classe 115,08 I 125,94 ocorreu o nmero 37, isto significa
que 37 peas, o equivalente 75,5% das 49 inspecionadas apresentaram comprimento igual ou
superior a 85, 5 e inferior a 125,94 mm. A partir dessas informaes o fabricante poder saber
se os resultados esto dentro das especificaes, ou no.

3.4 Sequncia de exerccios n 2


01 Foi feita uma pesquisa com uma amostra de 80 alunos de instituies de ensino superior.
Uma das variveis em estudo foi o nmero de pessoas na famlia. O resultado foi o seguinte:

13

2
2
1
5
5
2
2
2

3
2
2
5
4
5
2
2

5
1
2
5
3
3
2
2

4
3
2
6
2
5
3
1

2
2
3
4
2
2
4
5

3
2
3
2
2
3
4
5

1
3
3
3
3
2
5
1

5
3
4
5
2
2
5
2

3
4
4
2
2
4
3
2

2
1
4
2
3
5
3
3

a) Qual a varivel em estudo e de que tipo ela ?


b) Qual o tipo de tabela mais adequado para os dados? Justifique a sua reposta.
c) Construa a tabela com todos os tipos de frequncias.
d) Interprete os principais resultados da tabela.

02 Foram inspecionadas 50 peas produzidas por uma mquina. A e a classificao foi a


seguinte: P = perfeita, R = recupervel e D = defeituosa. O resultado foi o seguinte:

a) Qual a varivel em estudo e de que tipo ela ?


b) Qual o tipo de tabela mais adequado para os dados? Justifique a sua reposta.
c) Construa a tabela com todos os tipos de frequncias.
d) Interprete os principais resultados da tabela.

03. O tempo necessrio para realizar certa operao industrial foi cronometrado (em
segundos), sendo feitas 40 determinaes

45

37

39

48

51

40

53

49

39

41

45

43

45

34

45

35

41

57

38

46

46

58

57

36

58

35

31

59

44

57

45

44

38

43

33

56

47

48

44

49

14

a) Qual a varivel em estudo e de que tipo ela ?


b) Qual o tipo de tabela mais adequado para os dados? Justifique a sua reposta.
c) Construa a tabela com todos os tipos de frequncias.
d) Interprete os principais resultados da tabela.

4 Representao grfica
A apresentao de dados tambm pode ser feita mediante grficos.

Grfico: Diagrama ou figura para ilustrao de fenmenos ou tendncias, no qual existem


escalas definidas

As tabelas de frequncia tm utilidade como instrumento de anlise e de apresentao


de dados estatsticos. A apresentao grfica um complemento das tabelas e possui uma
vantagem adicional de propiciar a visualizao mais rpida do comportamento da caracterstica
que est sendo estudada, bem como sua variao.
Neste curso sero apresentados os principais tipos de grficos, so eles: Grficos de
pontos, de frequncias acumuladas, histograma, polgono de frequncias, polgono de
frequncias acumuladas, grficos de barras simples, grfico de barras compostas (horizontais e
verticais), grfico de setores e grficos de linhas (simples e compostas).

4.1 Grfico de pontos


Esse tipo de grfico pode ser utilizado quando a varivel em estudo discreta e possui
no mximo dez valores individuais. Retornando ao exemplo dos componentes eletrnicos
defeituosospor lote, tem-se:

Nmero de
Nmero
Componentes defeituosos de lotes (f)
0
2
1
3
2
4
3
7
4
12
5
10
6
8
7
3
8
1
Total
50
A varivel nmero de componentes defeituosos quantitativa discreta e possui apenas
9 valores individuais, portanto o grfico de pontos o mais adequado pra apresentar os dados.

15

N de lotes

Componentes eletrnicos defefeituosos

14
12
10
8
6
4
2
0
0

N de componentes defeituosos

Fonte: Dados fictcios


Figura 1.2 - Nmero de componentes eletrnicos defeituosos
em cada lote de 500 unidades.
Percebe-se de imediato na Figura 1.2, sem verificar nmeros, que as frequncias
crescem at o valor 4 e depois decrescem e, que o nmero de componentes eletrnicos
defeituosos mais frequente foi 4, e o segundo predominante foi o de 5 unidades, por lote de
500 peas.

4.2 Grfico de frequncias acumuladas


Esse tipo de grfico tambm utilizado para apresentar o comportamento de variveis
quantitativas discretas com no mximo dez valores individuais, porm, o mesmo representa as
frequncias acumuladas absolutas (fa) ou acumuladas relativas (far). No exemplo dos
componentes eletrnicos tem-se:

Nmero de
Nmero
Componentes defeituosos de lotes (fa)
0
2
1
5
2
9
3
16
4
28
5
38
6
46
7
49
8
50

16

Figura 1.3 Frequncia acumulada de componentes


eletrnicos defeituosos.

4.3 Histograma
O histograma de frequncias uma representao grfica formada por retngulos
justapostos, de base igual amplitude do intervalo de classe (C) e altura igual frequncia
simples absoluta(f) ou frequncia relativa fr (%). Esse tipo de grfico pode ser utilizado no caso
de variveis quantitativas contnuas. Na tabela 1.5 tem-se um exemplo de varivel quantitativa
contnua.
Tabela 1.4 Vida til, em horas, de ferramentas de corte em um processo industrial
Classes
(Horas)
0,0I 24,9

No de Ferram.

Porcentagem

Frequncia
acumulada

Porcentagem
acumulada

2
4
12
30
18
4
70

2,86
5,71
17,14
42,86
25,71
5,71
100

2
6
18
48
66
70

2,857143
8,571429
25,71429
68,57143
94,28571
100

24,9I 49,8
49,8I 74,7
74,7I 99,6
99,6I 124,5
124,5I 149,4
TOTAL

Fonte: Dados fictcios


Os dados das duas primeiras colunas da tabela acima esto representados na Figura 1.4

Fonte: Dados fictcios

17
Figura 1.4 Histograma de frequncias
Percebe-se que a faixa de tempo durao de maior frequncia foi superior ou igual a
74,7 e inferior a 99,6 horas, com 30 ferramentas de um total de 70. Ocorreram 18 ferramentas,
sendo esta a segunda maior frequncia, com tempo maior ou igual a 99,6 e menor que 124,5
horas de durao. Ocorreram apenas duas ferramentas, sendo esta a menor frequncia, com
tempo de durao menor a 24,9 horas. O pesquisador dever verificar qual o tempo mnimo
exigido para esse tipo de ferramenta para concluir se o resultado est bom, ou no.

4.4 Polgono de frequncias


O polgono de frequncias obtido pelo ligamento dos pontos mdios dos retngulos
formados no histograma, por meio de uma linha. A rea entre o eixo das abscissas e esta linha
formar um polgono.
Esse tipo de grfico auxiliar na avaliao de uma importante distribuio de
probabilidade, a chamada distribuio normal, a qual ser mostrada em sees posteriores.
O polgono de frequncias construdo com o auxlio do histograma apresentado
anteriormente est apresentado na Figura 1.5.

Fonte: Dados fictcios


Figura 1.5 Polgono de frequncias

O Polgono de frequncias serve para estudar se a formada distribuio de frequncias se


aproxima da distribuio normal, mostrada na figura 1.6.

18

Grfico da distribuo normal


0,4

0,3

0,2

0,1

0,0

-3

-2

-1

0
X

Figura 1.6 Distribuio normal

Olhando para o polgono de frequncias (figura 1.5), nota-se que ele tem
aproximadamente a forma da distribuio normal (figura 1.6). Essa informao pode servir, por
exemplo, para o pesquisador decidir em aplicar o intervalo de confiana da mdia ou realizar o
teste de hiptese da mdia, utilizando a distribuio normal ou a distribuio aproximadamente
normal (distribuio t de student), as quais sero estudadas no decorrer do curso.

4.5 Polgono de frequncias acumuladas


Assim como o grfico anterior, o polgono de frequncias cumuladas tambm utilizado
para a representao e descrio de variveis quantitativas contnuas. Porm, agora os
retngulos representam frequncias acumuladas ao invs de frequncias simples.

Fonte: Dados fictcios


Figura 1.7 - Polgono de frequncias acumuladas

19

4.6 Grfico de Barras


Os grficos de Barras simples tm por finalidade comparar categorias de uma varivel,
por meio de retngulos de larguras iguais e alturas proporcionais s frequncias de cada
categoria. Cada barra representa uma categoria.
Na construo de um grfico de Barras devem ser seguidas algumas normas:

As barras devem ter as mesmas larguras.;

As barras devem ser separadas pelo mesmo espao;

O grfico dever ter uma linha zero claramente definida e uma escala de valores
ininterrupta, caso contrrio, a leitura e a interpretao do grfico podero ficar
distorcidas.

O grfico em barras verticais simples o mais adequado para comparar categorias de


uma varivel qualitativa, como mostra a Figura 1.8.

Preferncia
Futebol
Vlei
Basquete
Handebol
TOTAL

Porcentagem
38,5
30,8
23,1
7,7
100

Fonte: Dados fictcios


Figura 1.8 Preferncia esportiva de funcionrios da empresa A.

possvel comparar duas categorias ou mais de uma varivel qualitativa, dentro de


uma categoria de outra varivel qualitativa, por meio de um grfico de barras compostas.
Retornemos ao exemplo da preferncia esportiva, segundo o sexo.

20

Preferncia
esportiva
Futebol

Masculino
N de
Porcentagem
funcionrios
30
75,0%

Feminino
N de
funcionrios
10

Vlei

12

37,5%

20

Basquete

14

58,3%

10

Handebol

25,0%

Porcentagem

25,0%
62,5%
41,7%
75,0%

Total
40
32
24
8

Fonte: Dados fictcios


Figura 1.9 Preferncia esportiva, segundo o sexo, de funcionrios da empresa A.

A interpretao do grfico a mesma da tabela.

4.7 Grfico de setores


O grficos de setores ou setograma, usado para representar valores absolutos ou
porcentagens de variveis qualitativas.
A construo desse tipo de grfico, manualmente, pode ser feita com o auxlio de um
transferidor. Faz-se a marcao dos ngulos correspondentes s quantidades, partindo de um
ponto qualquer da circunferncia e seguindo o sentido dos ponteiros do relgio. No transferidor,
360o equivale frequncia total absoluta. O grau equivalente a quantidade de cada categoria
ser calculado por regra de trs simples, como mostra o exemplo a seguir:

21
Tabela 1.6 Produo Agrcola do estado em
toneladas (t) no ano X.
Produtos Quantidade ( t ) Porcentagem
Caf
400 000
55,56
Acar
200 000
27,78
Milho
100 000
13,89
Feijo
20 000
2,78
Total
720 000
100
Fonte: Dados fictcios
Clculo do setor Correspondente ao caf
720 000 3600
400 000 xo
x

400 000 360


200 o
720 000

Clculo do setor Correspondente ao acar


720 000 3600
200 000 xo

200 000 360


100o
720 000

Clculo do setor Correspondente ao milho


720 000 3600
100 000 xo

100 000 360


50 o
720 000

Clculo do setor Correspondente ao feijo


720 000 3600
20 000 xo

20 000 360
10o
720 000

Resta agora, a construo do grfico. Com o auxlio do transferidor, faz-se a marcao


dos ngulos correspondentes s quantidades, partindo de um ponto qualquer da circunferncia
e seguindo o sentido dos ponteiros do relgio.

22

Fonte: Dados fictcios


Figura 1.10 - Produo Agrcola do estado em toneladas (t) no ano X.
Na figura 1.10 percebe-se de imediato que, a produo maior do estado no ano X foi a
do caf com 55,8% da produo total. A segunda maior produo foi a do acar com 27,8%, a
terceira foi a do milho com 13,9% e a quarta foi a do feijo com 2,8%.

4.8 Grfico de linhas


O grficos de linhas tm sido utilizados para a representao de caractersticas
cronolgicas (quando um dos fatores for o tempo), isto porque quando for medida a mesma
caracterstica durante um grande nmero de perodos de tempo, a representao dos valores
atravs de barras pode conduzir a uma excessiva concentrao de dados. Como as
quantidades so indicadas pelas alturas das barras, estas podem ser substitudas por uma
linha que siga os movimentos de suas partes superiores.
Para construir o grfico de linhas, basta marcar os pontos correspondentes aos valores
observados em cada perodo e uni-los por meio de um trao contnuo. A ttulo de ilustrao,
suponha que se queira representar o nmero de vendas de tratores de esteira produzidos pela
empresa Z, no de perodo de 1994 a 2001, como mostra a Tabela 1.7.

23
Tabela 1.7 Vendas de tratores de
esteira empresa Z
1994-2001
Ano

Nmero de tratores
vendidos

1994
1995
1996
1997
1998
1999
2000
2001

200
350
400
500
550
600
600
700

Fonte: Dados fictcios


Os dados da tabela 1.7 podem ser expostos num grfico em linha, como mostra a figura 1.10.

Fonte: Dados fictcios


Figura 1.11 - Vendas de tratores de esteira empresa Z 1994-2001

No grfico apresentado nota-se que o nmero de vendas de tratores de esteira pela


empresa Z, aumentou em quase todos os anos, em relao ao ano anterior, sendo que o maior
aumento registrado foi do ano de 1994 para 1995, com aumento de 150 unidades. Apenas de
1999 a 2000, o nmero de vendas manteve-se estvel, com 600 vendas em cada ano. Levando
em conta o primeiro e o ltimo ano (1994 e 2001), o nmero de vendas aumentou de 200 para
700 vendas anuais. Isso mostra que houve um desenvolvimento da empresa, no perodo, no
que se refere produo.
As linhas so particularmente mais eficientes que as colunas quando existem intensas
flutuaes das quantidades da caracterstica que est sendo estudada, ou quando h
necessidade de se representar a mesma caracterstica advinda de origens diferentes Por
exemplo, suponha que se queira comparar o nmero de vendas de carros novos de passeio,
realizadas por 3 funcionrios da concessionria A, durante o primeiro trimestre.

24

Tabela 1.8 - Nmero de vendas de carros novos de


passeio, realizadas por 3 funcionrios do
da concessionria A.

Joo
Atnio
Fernando
Total

Janeiro
1
4
10
15

Fevereiro
2
5
12
18

Maro
2
8
11
21

Fonte: Dados fictcios

.
Fonte: Dados fictcios
Figura 1.12 - Nmero de vendas de carros novos de passeio, realizadas
por 3 funcionrios do da concessionria A.

No grfico apresentado, observa-se que o Fernando teve 10 vendas em janeiro, 12 em


fevereiro e 11 em Maro, tendo um bom desempenho. O nmero de vendas do Atnio sempre
cresceu de um ms para o outro, iniciando com 4 unidades em janeiro, 5 em fevereiro e 8 em
maro. J, as vendas do Joo foram de 1 carro em janeiro, 2 em fevereiro e 2 em maro, tendo
um desempenho ruim e merece ateno.

4.9 Sequncia de exerccios n 3


01 Considere a estatstica de utilizao de browser para acesso internet em determinado
ms.

25

Tabela 1.8 - Estatstica web browser de determinado ms.


Browser

Porcentagem
45,9
25,9
15,1
10,6
2,1
0,2
0,2
0,1
0,1

Fonte: http://www.forumcommunity.net/?act=browser&l=5, acessado em 11/02/2015

a) Qual a varivel em estudo e de que tipo ela ?


b) Qual o tipo de grfico mais adequado para apresentar os dados? Justifique a sua reposta.
c) Construa o grfico.
d) Interprete os principais resultados do grfico.

02 Os dados da tabela a seguir so referentes ao nmero de estabelecimentos em Foz do


Iguau, por ano.

Ano
N de hotis
N de Pousadas

2008
111
16

2009
112
19

2010
110
23

2011
112
37

2012
115
47

2013
109
38

Fonte: Secretaria municipal de Turismo


a) Qual o tipo de grfico mais adequado para apresentar os dados? Justifique a sua reposta.
b) Construa o grfico.
c) Interprete os principais resultados do grfico.

26

03 A tabela a seguir referente distribuio de frequncias de comprimentos, em milmetros,


de auto peas fabricadas por uma indstria.

TABELA 1.4 - Comprimento em milmetros de auto-peas do tipo A


Classes
no de peas
Comprimento (mm)
(f)
4
82,50 I 93,36
9
93,36 I 104,22
12
104,22 I 115,08
12
115,08 I 125,94
8
125,94 I 136,80
3
136,80 I 147,66
1
147,66 I 158,52
TOTAL
49
Fonte: Dados fictcios

Frequncia
acumulada (fa)
4
13
25
37
45
48
49

Porcentagem
fr(%)
8,2
18,4
24,5
24,5
16,3
6,1
2,0

Porcentagem
acumulada (far (%))
8,2
26,5
51,0
75,5
91,8
98,0
100,0

a) Qual a varivel em estudo e de que tipo ela ?


b) Qual o tipo de grfico mais adequado para apresentar os dados? Justifique a sua reposta.
c) Construa o grfico.
d) Interprete os principais resultados do grfico.

5 Medidas de tendncia central


Foi visto em sees anteriores que, por meio de uma distribuio de frequncias, se
estabelece um sistema de classificao que descreve o padro da variao de um determinado
fenmeno. Todavia, somente com a distribuio de frequncias no possvel resumir certas
caractersticas importantes em estudo. Devido a isto so utilizadas as medidas de tendncia
central (mdia, moda, mediana, etc) que resumem o comportamento da varivel em estudo,
atravs do ponto em torno do qual os dados se distribuem.

5.1 Mdia Aritmtica


A medida de tendncia central mais utilizada para descrever resumidamente uma
distribuio de frequncias a mdia, ou mais propriamente, a mdia aritmtica x . A mdia
aritmtica pode ser simples ou ponderada como veremos a seguir. Obtm-se a mdia
aritmtica simples de um conjunto de valores x1, x2, . . ., xn, pelo quociente entre a soma
desses valores e o nmero total de valores observados ( n ), ou seja:

xi

x x xn i 1
x 1 2

n
n

27

em que: xi o i-simo valor observado da varivel em estudo;


Por exemplo, suponha que em um escritrio de consultoria ha cinco contnuos, cujos
salrios so os seguintes, em reais,
800, 780, 820, 810 e 790,

logo, a mdia ser dada por,

xi
i 1

800 780 820 810 790


800
5

Portanto, a mdia aritmtica dos salrios ou o salrio mdio dos contnuos desse escritrio,
de 800 reais, sendo considerado um valor baixo.
A mdia aritmtica ser considerada ponderada quando os valores do conjunto tiverem
pesos diferentes. Obtm-se a mdia aritmtica ponderada de um conjunto de valores x 1, x2, . .
., xn, dividindo o produto entre esses valores e seus respectivos pesos, pela soma total dos
pesos, isto ,

xi pi

x p x p xn pn i 1
x 1 1 2 2
n
p1 p2 pn

pi
i 1

Assim, por exemplo, um professor pode realizar uma prova e um trabalho bimestralmente,
atribuindo a cada um, os pesos 3 e 7. Se um aluno tiver recebido as notas 8 e 6, nesta ordem,
sua mdia ponderada ser

xipi

x i12

pi

8 . 3 6 .7
66

6,6
37
10

i1

Portanto, a mdia ou nota bimestral do aluno, foi 6,6 pontos. Se este aluno for da
UNIOESTE, o mesmo ter que se recuperar no prximo bimestre.
Genericamente, se os valores x1, x2, . . ., xk, ocorrem f1, f2, . . ., fk, vezes,
respectivamente, a mdia aritmtica ser calculada por:

28

x1 f1 x2 f 2 xk f k

f1 f 2 f k

xi f i x i f i
i 1
k

fi

i 1

i 1

em que n o nmero total de observaes ou a soma total das frequncias, e k o nmero


total de classes ou valores individuais.

A ttulo de ilustrao, considere os dados da Tabela 1.8


Tabela 1.8 Distribuio de frequncias do nmero de defeitos por pea de certa indstria
i

Nmero de
defeitos
0
1
2
3
4

1
2
3
4
5

Nmero de peas (f)


12
8
7
1
2

Logo, a mdia ser,

xi fi
i 1
k

f
i 1

x f
i 1
5

f
i 1

0 . 12 1 . 8 2 . 7 3 . 1 4 . 2 33

1 defeitos
12 8 7 1 2
30

Portanto, o nmero mdio de defeitos por pea produzida, foi 1. O ideal seria que essa
mdia fosse zero ou bem prxima de zero. Se os dados da tabela forem observados mais
atentamente, notar-se- que, 12 peas no apresentaram defeito o equivalente a 40% do total,
consequentemente, 60% apresentaram pelo menos um defeito. As causas dessa porcentagem
alta de peas defeituosas devero ser investigadas, afim de que esse quadro venha a
melhorar. Ser que a mquina est com defeito? Ser que o operador est sonolento ou mal
treinado? Ser que a matria prima de baixa qualidade? Enfim, devem ser apuradas as
possveis causas, e elimin-las, afim de que o problema seja solucionado.
Quando os dados so agrupados em classes e no se dispe dos valores originais,
possvel calcular a mdia aritmtica por meio dos valores centrais das classes, utilizando a
expresso anterior.
k

xi f i

i 1
k

fi
i 1

xi f i
i 1

29

em que: xi = (Li + Ls)/2, sendo Ls o limite superior da classe e Li o limite inferior.


Retorne aos dados da tabela 1.4. Suponha que o comprimento mdio das peas no pode ser
menor que 82,5mm, nem maior que 148mm.

Classes
Comprimento (mm)
82,50 I 93,36
93,36 I 104,22
104,22 I 115,08
115,08 I 125,94
125,94 I 136,80
136,80 I 147,66
147,66 I 158,52
TOTAL

no de peas
(f)
4
9
12
12
8
3
1
49

xi
(82,50 + 93,36)/2 =
(93,36 + 104,22) /2 =
(104,22 + 115,08) /2 =
(115,08 + 125,94) /2 =
(125,94 + 136,80) /2 =
(136,80 + 147,66) /2 =
(147,66 + 158,52) /2 =

87,93
98,79
109,65
120,51
131,37
142,23
153,09

xi f i
x

i 1
7

fi
i 1

(87,93x 4 98,79x9 109,65x12 153,09x1)


114,97 mm
4 9 12 12 8 3 1

Portanto, o comprimento mdio das pecas produzidas pela indstria de 114,97 mm.
Portanto, a produo est sob controle, uma vez eu este valor est entre o intervalo
especificado.

5.2 Mediana
A mediana (Md) outra medida de tendncia central, e pode ser definida como o valor
que divide um conjunto de dados numricos, de tal forma que metade, ou 50% dos itens sejam
maiores ou iguais a este valor, e a outra metade ou os outros 50% dos valores sejam menores
ou iguais ao mesmo.

5.2.1 Determinao da mediana de dados brutos


A determinao da mediana de valores no-tabulados feita a partir de dados
ordenados. Existem dois casos a considerar: O primeiro, quando o nmero de observaes
impar e o segundo quando o nmero de observaes par.

30

5.2.1.1 O nmero de observaes impar


Neste caso, preciso achar o elemento mediano, o qual indica em que posio est a
mediana, pela seguinte frmula:

E md

n 1
2

em que n o nmero total de observaes.

Exemplo: Calcular a mediana do conjunto X = {12, 3, 6, 30, 2, 15, 23,}

Soluo:

O primeiro passo ordenar os dados. Desta forma temos:

X = {2, 3, 6, 12, 15, 23, 30}.

O segundo passo calcular o elemento mediano.

E md

n 1
7 1
E md
E md 4
2
2

Isto significa que a mediana est na quarta posio. Observa-se no conjunto ordenado
X = {2, 3, 6, 12, 15, 23, 30} que, na quarta posio encontra- se o valor 12. Portanto, a Medina
Md = 12.
Percebe-se, portanto, que metade ou 50% dos valores deste conjunto de dados so
menores do que 12 e a outra metade, ou 50% dos valores, so maiores do que o mesmo.

5.2.1.2 O nmero de observaes par


Quando o nmero de observaes de dados brutos par, o procedimento para calcular a
mediana diferente do caso anterior, isto , a mediana igual mdia aritmtica entre os dois
valores centrais do conjunto ordenado.

Exemplo: Seja o conjunto X = {6, 9, 20,12, 3, 14, 15, 17}.

Soluo:

31

Ordenando os dados tem-se X = {3, 6, 9, 12 ,14, 15, 17, 20}. A mdia aritmtica entre os
dois elementos centrais deste conjunto a mediana. Logo,

Md

12 14
Md 13
2

Portanto, metade ou 50% dos valores restantes observados neste conjunto so


menores do que 13 e a outra metade maior.

A mdia pode no ser a medida de tendncia central mais adequada para representar
um conjunto de valores quando houver valores discrepantes (valores muito maiores ou muito
menores dos demais), pois a mesma afetada por valores extremos. Para ilustrar este fato,
suponha o seguinte conjunto de dados:

10

12

15

do quais obtm-se

5 7 15
9,5
6

Md =

8 10
9,0
2

Suponha agora, que o valor 15 seja trocado por 150.

A mdia alterada para

10

12

150

x 32 , enquanto que a mediana no se altera, ou seja, Md = 9,0.

Considere por exemplo, em que pretende-se verificar o nmero mdio dirio de


freqentadores da cantina da UNIOESTE-FOZ, afim de dimensionar a quantidade de estoque
de produtos durante o perodo de um ms. Suponha que numa data verificou-se um nmero
muito acima do normal, pois nesta houve o Encontro Paranaense dos Estudantes de
Matemtica (EPREM). Seguramente o nmero de frequentadores nesse dia elevar muito o
valor da mdia, o qual no estar representando o nmero mdio de freqentadores em dias
normais. Conseqentemente, o administrador da cantina teria que gastar muito mais do que
gastaria normalmente, cometendo um erro operacional.

5.2.2 Determinao da mediana de dados tabulados no-agrupados em


classes
Quando os dados j estiverem tabulados e no-agrupados em classes, tambm deve ser
verificado se o nmero total de valores observados par ou impar e calcular o elemento

32

mediano, da mesma forma que o caso de dados no tabulados. Porm, deve ser levado em
conta a coluna de frequncia absoluta acumulada (fa) .

5.2.2.1 O nmero de observaes mpar


Tabela 1.9 Nmero de defeitos por pea.
No de Peas
(f)
2
4
7
2
15

N de defeitos
por pea (x)
0
1
2
3
TOTAL

Frequncia
acumulada
2
6
13
15

Observa-se que o nmero total de observaes impar (n = 15), ento, calcula-se o


elemento mediano da seguinte forma:

E md

n 1
15 1
E md
E md 8
2
2

Deve-se, portanto, percorrer a coluna de frequncias acumuladas at achar um valor


maior ou igual a 8.
Na coluna de frequncias acumuladas verifica-se que, para o nmero de defeitos igual
a zero existem duas peas. Portanto, a mediana no poder ser zero, uma vez que a mediana
equivale oitava observao. A frequncia acumulada seguinte at o valor 1, 6, que por ser
inferior a E md 8 indica que o nmero 1 no pode ser a mediana. J, a frequncia acumulada
at o nmero de defeitos igual a 2, 13, ou seja, superior a 8. Portanto, a mediana ser:

Md = 2 defeitos

Isto significa que metade, ou 50% das peas, teve o nmero de defeitos menor ou igual
a 2, e a outra metade, ou 50o%, teve nmero de defeitos maior ou igual a 2.

33

5.2.2.2 O nmero de observaes par

Exemplo

TABALEA 1.10. Distribuio das idades em anos completos


dos

jogadores

da

escola

de

Futebol

Paulistinha.
Idades
14
15
16
TOTAL
Fonte: Fogo (2000)

Frequncia (fi)
(no de Jogadores)
5
13
10
28

Frequncia
acumulada
5
18
28

Observa-se que o nmero total de observaes par, ou seja, n = 28. Portanto, a


mediana a mdia aritmtica entre os dois valores centrais, como visto no caso de dados no
tabulados. O elemento mediano o que d a posio do primeiro valor central. Este
calculado da seguinte forma:

E md

n
28
E md
E md 14
2
2

Deve-se, portanto, percorrer a coluna de frequncias acumuladas at achar um valor


maior ou igual a Emd = 14.
Na coluna de frequncias acumuladas verifica-se que para a idade igual a 14, existem
5 jogadores. Portanto, o primeiro valor central no pode ser 14, uma vez que o primeiro valor
central equivale ao 14o valor observado e no ao 5o
J a frequncia acumulada at a idade igual a 15 anos, inclusive, 18, ou seja, maior
que Emd = 14. Portanto, o primeiro valor central 15.
O segundo valor central equivale quele que estiver na posio logo aps do
primeiro. O primeiro valor central est na 14a posio, portanto o segundo est na 15a.
Observando a coluna de frequncias acumuladas percebe-se que o 15o valor observado
tambm 15. Portanto, a mediana dada por

Md

15 15
15
2

Portanto, isto significa que metade ou 50% dos alunos tm idade menor ou igual a 15 e
a outra metade, ou 50%, tm idade maior ou igual a 15.

34

5.2.3 Determinao da mediana de dados tabulados e agrupados em


classes
Quando os dados da tabela estiverem agrupados em classes utiliza-se a seguinte
expresso para calcular a mediana:
Emd faan t
Md Li C
fmd

Em que:
Li o limite inferior da classe que contm a mediana;
C a amplitude do intervalo de classe, ou seja, a diferena entre os limites superior (Ls) e
inferior (Li) de qualquer classe ( C = Ls -Li);
Emd o elemento mediano. Tratando-se de dados tabulados e agrupados em classes, o
elemento mediano, independentemente de o nmero de observaes ser par ou mpar, ser
sempre:

Emd

n
;
2

faant a frequncia acumulada absoluta at a classe anterior classe da mediana;


fmd a frequncia simples absoluta da classe da mediana.

Exemplo:
A Lgica Transistor-Transistor (Transistor-Transistor Logic ou simplesmente TTL)
uma classe de circuitos digitais construdos de transistores de juno bipolar (BJT), e
resistores. chamada lgica transistor-transistor porque ocorrem as funes porta lgica e de
amplificao pelos transistores (em contraste com a RTL e a DTL). Isso notvel por ser uma
famlia difundida de circuitos integrados (CI), usada por muitas aplicaes como computadores,
controle industrial, eletrnica de consumo, sintetizadores etc. Por causa do grande uso desta
famlia lgica, sinais de entrada e sada de equipamentos eletrnicos pode ser chamada
entrada ou sada "TTL", significantemente compatvel com os nveis de tenso usados. Estes
circuitos tm como principal caracterstica a utilizao de sinais de 5 volts para nveis lgicos
altos. Seus circuitos integrados so constitudos basicamente de transstores, o que os torna
pouco sensveis eletricidade esttica. Objetivando realizar o controle da tenso de entrada de
94 exemplares desse tipo de circuito, foi construda a seguinte tabela:

35

Tabela 1.11 Distribuio de frequncias da tenso


de entrada de circuitos TTL.
Tenso
(em volts)

Frequncia

Frequncia
acumulada

2
15
30
33
10
3
1
94

2
17
47
80
90
93
94

1,5 I 2,0
2,0 I 2,5
2,5 I 3,0
3,0 I 3,5
3,5 I 4,0
4,0 I 4,5
4,5 I 5,0
TOTAL
Fonte: Dados fictcios

Emd

n
94
Emd
Emd 47
2
2

Deve-se, portanto, percorrer a coluna de frequncias acumuladas at achar um valor


maior ou igual a 47.
Percebe-se que a frequncia acumulada at a classe 2,5 I 3,0 47, ento esta a
classe da mediana.
A amplitude do intervalo de classe : C = Ls -Li = 3,0 2,5 = 0,5. Poderamos calcular a
amplitude de qualquer classe, uma vez que o valor de C sempre ser o mesmo
A frequncia acumulada at a classe anterior (2,0 I 2,5) classe da mediana :

faant = 17

A frequncia simples da classe (2,5 I 3,0) da mediana :

fmd = 30

Logo, a mediana :

E faant
47 17
Md 2,5 0,5 .
Md Li c md
Md 3 v
fmd
30

Portanto, dos 94 circuitos, metade, ou 47, apresentaram tenso maior ou igual a 1,5 e
inferior a 3 volts, ou os outros 47, tiveram tenso maior ou igual a 3 e inferior a 5 volts.
Portanto, todos os circuitos apresentaram sinais de tenso abaixo de 5 volts. Isso no bom,
pois estes circuitos tm como principal caracterstica a utilizao de sinais de 5 volts para
nveis lgicos altos.

36

5.3 Moda (Mo)


A moda (Mo) outra medida de tendncia central. Genericamente, a moda pode ser
definida como o valor de maior frequncia (predominante) de um conjunto de dados. Quando
os valores de um conjunto de dados ocorrem com a mesma frequncia, o mesmo chamado
de amodal. Por outro lado, podem ocorrer conjuntos com mais de uma moda.

5.3.1 Determinao da moda de valores no tabulados


Exemplo: considere o seguinte conjunto numrico

X = {4, 5, 5, 6, 6, 6, 7, 7, 8, 8}

O valor 6 o mais frequente (3 ocorrncias). Portanto, a moda Mo = 6.

Y = {4, 4, 5, 5, 6, 6,}

O conjunto Y amodal, ou seja, todos os valores ocorrem duas vezes.

Z = {1,2, 2, 2, 3, 3, 3, 4, 5, 5, 6, 6}

As modas do conjunto Z so Mo1 = 2 e Mo2 = 3. Trata-se de um conjunto Bimodal, ou


seja, os valores 2 e 3 ocorrem com maior frequncia (3 vezes)

5.3.2 Determinao da moda de valores tabulados e no agrupados em


classes
Quando os valores de dados tabulados so individuais, a determinao da moda
imediata, bastando verificar na tabela o valor de maior frequncia.

Exemplo: Considere o exemplo do nmero de leses em atletas aps uma maratona

N de defeitos
por pea (x)
0
1
2
3

N de peas (f)
2
4
7
2

37

Portanto, a moda Mo = 2 leses, ou seja, houve maior frequncia de peas com dois
defeitos.

5.3.3 Determinao da moda de valores tabulados e agrupados em


classes
Tratando-se de uma tabela de frequncias com valores tabulados e agrupados em
classes, o procedimento no imediato, sendo disponveis alguns mtodos de clculo. Aqui
mostraremos o mtodo de Czuber que leva em considerao as frequncias das classes
adjacentes e da classe modal, ou seja:

fmo fan t
Mo Li C .

2fmo (fan t fpost )

em que:
Li o limite inferior da classe modal;
C a amplitude do intervalo de classe, ou seja, a diferena entre os limites superior (Ls) e
inferior (Li) de qualquer classe ( C = Ls -Li);
fmo a frequncia absoluta simples da classe modal;
fant a frequncia absoluta simples da classe anterior classe modal;
fpost a frequncia absoluta simples da classe posterior classe modal.

Exemplo

Retornando ao exemplo da tenso de entrada de circuitos TTL, em volts, tem-se:

Tenso
(em volts)
1,5 I 2,0
2,0 I 2,5
2,5 I 3,0
3,0 I 3,5
3,5 I 4,0
4,0 I 4,5
4,5 I 5,0

Frequncia
2
15
30
33
10
3
1

A classe de maior frequncia 3,0 I 3,5 e C = Ls Li = 3,5 3,0 = 0,5 logo:

fmo fan t
Mo Li c .

2fmo ( fan t fpost )

33 30
1,5
3
Mo 3 0,5 .
Mo 3 0,5 . Mo 3
26
26
2 . 33 (30 10)

M o 3,06 v

38

Isto significa que as tenses de entrada dos circuitos analisados, esto se concentrando
em torno de 3,06 volts, uma vez que este valor pertence classe de maior frequncia.

1.5.4 Sequncia de exerccios n 4


01. Na empresa de pr moldados S/A foi realizada a inspeo diria das alturas, em milmetros,
de pavers (blocos de concreto para pavimentao). Para que no haja grandes variaes,
resultando no maior consumo de concreto e menor. Foi realizada no dia 19 de abril de 2005
essa inspeo, tendo o seguinte resultado:
60,0

61,5

61,3

61,3

60,4

59,4

59,7

60,7

60,2

59,2

a) Calcular mdia e interpretar o resultado. Resposta: 60,37


b) Calcular mediana e interpretar o resultado. Resposta: 60,3
c) Calcular moda e interpretar o resultado. Resposta: 61,3
02. A faculdade de engenharia e cincia aplicada da Universidade do Arizona tem um sistema
VAX de computadores. Os tempos, em segundos, para quinze tarefas consecutivas foram
registradas, sendo mostrados abaixo:

5,3

5,0

9,5

10,1

5,8

6,2

5,9

7,2

10

12,2

8,5

4,7

11,2

7,3

6,4

a) Calcular mdia e interpretar o resultado. Resposta: 7,6867


b) Calcular mediana e interpretar o resultado. Resposta: 7,2
c) Calcular moda e interpretar o resultado. Resposta: conjunto amodal

03. O nmero de acidentes de trabalho, por ms, foi anotado durante 24 meses, num canteiro de obras,
composto por 50 operrios. Os resultados esto na tabela a seguir:
Tabela 1.5.1 Distribuio de frequncias do
nmero de acidentes por ms num
canteiro de obras
Nmero de acidentes (x) Nmero de meses (f)
0
5
1
10
2
4
3
3
4
2
Total
24
Fonte: Dados fictcios

39

a) Calcular mdia e interpretar o resultado. Resposta: 1,4583


b) Calcular mediana e interpretar o resultado. Resposta: 2
c) Calcular moda e interpretar o resultado. Resposta: 1

04. A fora de remoo para um conector medida em um teste de laboratrio. Dados de 40


corpos de prova so mostrados a seguir:
Tabela 1.5.1 Distribuio de frequncias do
nmero de acidentes por ms
num canteiro de obras
Fora de remoo N de corpos de prova
6
170 I190
12
190 I210
8
210 I230
11
230 I250
3
250 I270
Total
40
Fonte: Montgomery, Runger e Rubely (2001)
a) Calcular mdia e interpretar o resultado. Resposta: 216,5
b) Calcular mediana e interpretar o resultado. Resposta: 215
c) Calcular moda e interpretar o resultado. Resposta: 202

6 Medidas Separatrizes
Existem trs tipos de medidas separatrizes, so elas: Os quartis, que dividem um
conjunto de dados em quatro partes iguais, os decis que dividem em dez e os percentis que
dividem em cem partes. Neste curso vamos nos ater apenas aos quartis

6.1 Quartis(Q)
Os quartis so medidas separatrizes que, simultaneamente, dividem um grupo de
dados em quatro partes iguais.
Individualmente, cada quartil ou junta Q, assim como a mediana, divide o conjunto de
dados em duas partes. O primeiro quartil ou junta (Q 1) o valor que deixa um quarto (25%) dos
valores abaixo ou igual a ele e trs quartos (75%), igual ou acima.
O segundo quartil (Q2) um valor que deixa metade (50%) dos dados abaixo ou igual
e a outra metade acima ou igual ao mesmo. Assim, o segundo quartil (Q2) uma media de
tendncia central, pois coincide com a mediana (Q2 = Md).
O terceiro quartil ou junta (Q3) um valor que deixa trs quartos (75%) dos valores
observados restantes abaixo ou igual ao mesmo e um quarto ou 25% igual ou superior.

40

6.1.1 Determinao de quartis de dados brutos


As seguir sero mostradas algumas regras teis para o clculo dos quartis de dados
brutos:

1. Os dados devem estar dispostos em ordem crescente.


2. Calcula-se a ordem posio do quartil por meio da expresso

E Qi

i (n 1)
, com i = 1, 2, 3
4

em que: i indica o nmero do quartil a ser calculado, e n o nmero de observaes do


conjunto de dados.

3. Se o a valor de EQi for um nmero inteiro, o quartil Qi ser igual ao valor do conjunto de
dados que estiver exatamente nesta posio
4. Se o valor de EQi no for um nmero inteiro e estiver na metade das posies anterior e
posterior, o quartil ser a mdia dos valores do conjunto de dados que estiverem nas
posies anterior e posterior a EQi.
5. Se o valor de EQi no for um nmero inteiro e nem estiver na metade de duas outras
posies, o resultado desta dever seguir as regras de arredondamento para um nmero
inteiro mais prximo, o qual dar a posio anterior ou posterior ao E Qi. Selecione o valor
numrico que estiver nesta nova posio.

Exemplo

Suponha que foram medidos os dimetros, em milmetros, de determinado tipo pea. O


analista disps de uma amostra de 6 peas com os seguintes resultados:

10,3

4,9

8,9

11,7

6,3

7,7

6,3

7,7

8,9

10,3

11,7

Dados ordenados

4,9
Clculo dos quartis:

Posio do primeiro quartil

E Q1

1 (6 1)
1,75 2a posio ordenada
4

41

Aps ordenar os dados, o elemento que ficou na segunda posio foi 6,3. Logo, o primeiro
quartil

Q1 = 6,3 mm

Portanto, 25% das peas apresentaram dimetro menor que 6,3mm, e 75%
apresentaram dimetro maior que este valor.
Suponha que se queira achar a porcentagem correta de valores abaixo de 6,3. Verificase no conjunto de dados que, h apenas um valor inferior a este de um total de seis valores.
Portanto a porcentagem correta de valores abaixo de 6,3 ser (1/6) 100 17% (arredondado).
Portanto ocorre um erro, pois 25% dos valores deveriam estar abaixo de 6,3 e no 17%.. O
leitor dever levar em conta que, nesse exemplo, o tamanho da amostra de apenas seis
elementos. medida em que aumentado o tamanho da amostra, o erro diminui.

Posio do segundo quartil

E Q2

2 (6 1)
3,5 a posio ordenada
4

J que este valor est na mesma distncia das posies 3 e 4, o valor segundo quartil ser
dado pela mdia aritmtica valores que esto nessa duas ltimas posies, no conjunto de
dados ordenados. Assim, o segundo quartil

Q2

7,7 8,9
2

8,3 mm

Portanto, 50% das peas apresentaram dimetro menor que 8,3mm, e 50%
apresentaram dimetro maior que este valor.

Posio do terceiro quartil

E Q3

3 (6 1)
5,25 5 a posio ordenada
4

Na quinta posio ordenada encontra-se o valor 10,3. O Logo, o terceiro quartil

Q3 = 10,3 mm

Portanto, 75% das peas apresentaram dimetro menor que 10,3mm, e 25%
apresentaram dimetro maior que este valor.

42

6.1.2 Determinao de quartis de dados tabulados


Se ao analista no dispor dos dados brutos, possvel calcular os quartis por meio de
tabelas com uma aproximao razovel. Neste caso, a posio do quartil ser dada por:

in
,
EQi
4

i = 1, 2, 3

em que:
i indica o nmero do quartil a ser calculado.
n o nmero de observaes do conjunto de dados ou frequncia total.

O valor do quartil a ser calculado pode ser dado por:


E Qi fa an t
Qi Li c.
fQi

em que:
Li o limite inferior da classe em que contem o quartil que est sendo calculado;
C a amplitude do intervalo de classe, ou seja, a diferena entre os limites superior (Ls) e
inferior (Li) de qualquer classe ( C = Ls -Li);
faant a frequncia acumulada at a classe anterior classe do quartil em questo;
fQi a frequncia da classe do quartil que est sendo calculado..

A ttulo de ilustrao, suponha a distribuio de frequncias das estaturas de 100


funcionrios de certa empresa, como mostra a tabela 1.12.

Tabela

1.12

Distribuio

de

frequncias

das

estaturas de 100 funcionrios de certa


empresa
Estaturas
(em metros)
1,40 I 1,50
1,50 I 1,60
1,60 I 1,70
1,70 I 1,80
1,80 I 1,90
1,90 I 2,00
TOTAL

Nmero de
Funcionrios (f)
5
10
30
40
10
5
100

Fa
5
15
45
85
95
100

O elemento que indica a posio do primeiro quartil

E Qi

in
4

E Q1

1.x100
4

25

43

Deve-se, portanto, percorrer a coluna de frequncias acumuladas (fa) at achar um


valor maior ou igual a 25 para obter a classe do primeiro quartil.
Percebe-se que a frequncia acumulada at a classe 1,60 I 1,70 45 > 25, ento
esta a classe do primeiro quartil

A amplitude do intervalo de classe :

C = Ls - Li = 1,60 - 1,70 = 0,10

A frequncia acumulada at a classe anterior (1,50 I 1,60) classe do primeiro


quartil

faant = 15

A frequncia simples da classe do primeiro quartil (1,60 I 1,70) .

fQ1 = 30

Logo, o valor do primeiro quartil :


E faant
Q 1,60 0,10 25 15 Q 1,63 m
Q1 Li c Q1
1
1

f
30
Q1

Portanto, 25% dos funcionrios dessa empresa apresentaram estatura menor ou igual a
1,63m, e 75% apresentaram estaturas maiores ou iguais a este valor.

Clculo do segundo quartil ou mediana

E md

n
100
E md
E md 50
2
2

E faant
Q 2 Md Li c. md
fmd

50 45
Q 2 1,70 0,1 .
Q 2 1,71 m
40

Portanto, 50% dos funcionrios dessa empresa apresentaram estatura menor ou igual a
1,71m, e 50% apresentaram estaturas maiores ou iguais a este valor.

Clculo do terceiro quartil

EQi

3 x 100
i n
EQ3
75
4
4

44

E f
Q3 l c. Q 3 ant
f Q1

75 45
Q3 1,70 0,10 .
Q3 1,78 m

40

Portanto, 75% dos funcionrios dessa empresa apresentaram estatura igual ou inferior a
1,78m, e 25% apresentaram estatura igual ou superior a esse valor.

6.2 Sequncia de exerccios n5


01. Na empresa de pr moldados S/A foi realizada a inspeo diria das alturas, em milmetros,
de pavers (blocos de concreto para pavimentao). Para que no haja grandes variaes,
resultando no maior consumo de concreto e menor. Foi realizada no dia 19 de abril de 2005
essa inspeo, tendo o seguinte resultado:
60,0

61,5

61,3

61,3

60,4

59,4

59,7

60,7

60,2

59,2

a) Calcular primeiro quartil e interpretar o resultado. Resposta: 59,7


b) Calcular segundo quartil e interpretar o resultado. Resposta: 60,3
c) Calcular terceiro quartil e interpretar o resultado. Resposta: 61,3
02. A faculdade de engenharia e cincia aplicada da Universidade do Arizona tem um sistema
VAX de computadores. Os tempos, em segundos, para quinze tarefas consecutivas foram
registradas, sendo mostrados abaixo:

5,3

5,0

9,5

10,1

5,8

6,2

5,9

7,2

10

12,2

8,5

4,7

11,2

7,3

6,4

a) Calcular primeiro quartil e interpretar o resultado. Resposta: 5,8


b) Calcular segundo quartil e interpretar o resultado. Resposta: 7,2
c) Calcular terceiro quartil e interpretar o resultado. Resposta: 10

04. A fora de remoo para um conector medida em um teste de laboratrio. Dados de 40


corpos de prova so mostrados a seguir:
Tabela 1.5.1 Distribuio de frequncias do
nmero de acidentes por ms
num canteiro de obras
Fora de remoo N de corpos de prova
6
170 I190
12
190 I210
8
210 I230
11
230 I250
3
250 I270
Total
40
Fonte: Montgomery, Runger e Rubely (2001)

45

a) Calcular primeiro quartil e interpretar o resultado. Resposta: 196,6667


b) Calcular segundo quartil e interpretar o resultado. Resposta: 215
c) Calcular terceiro quartil e interpretar o resultado. Resposta: 237,2727

7 Medidas de disperso
As medidas de posio, como visto, do uma idia de todo o conjunto, atravs de um
valor nico. Porm, elas so insuficientes para descrever mais detalhadamente o
comportamento da variao de todo o conjunto, como ser visto a seguir.
Considere os tempos, de trs mquinas semelhantes, para executar certa operao
industrial. Foram tomados os tempos (em segundos) de 5 operaes para cada mquina,
fornecendo os seguintes resultados:

Mquina A:

10,

10,

10,

10,

10

Mquina B:

11,

10,

9,

11,

Mquina C:

3,

4,

5,

20,

18

Calculando a mdia aritmtica para cada mquina, obtm-se

x A x B xC 10 s,
Ou seja, o tempo para executar a operao o mesmo para as trs mquinas. Mas,
observando mais detalhadamente os trs grupos obtidos, pode-se notar que se distribuem
diferentemente em relao mdia (10 s), como mostra o esquema a seguir:

Figura 1.14 Variao dos tempos medidos nas mquinas A, B e C.

Para uma anlise quantitativa dessa maior ou menor variao (ou disperso) do conjunto
de valores em torno do valor mdio, deve-se estudar as medidas de disperso. As principais

46

so: A varincia, o desvio padro, desvio interquarti, amplitude, desvio mdio, coeficiente de
variao.

7.1 Varincia e desvio padro


Na figura 1.14 nota-se que, quanto mais os valores esto afastados da mdia, maior
disperso ou variao entre os dados. A varincia e o desvio padro so medidas de
disperso baseadas nos desvios em relao mdia.
Devido a isso, foi idealizada a mdia dos quadrados dos desvios, dos valores
observados, em relao mdia aritmtica, a chamada varincia. Assim, a varincia de uma
populao finita, simbolizada por , dada por:
2

( xi )2
i 1

para dados no tabulados

fi(xi )2
i 1

para dados tabulados

Sendo que, N o nmero total de observaes da populao; a mdia aritmtica dos


valores observados da populao e xi um valor observado qualquer dessa populao.
Percebe-se que denominador da expresso apresentada nunca ser negativo, uma vez que os
valores dos quadrados dos desvios, ( xi ) 2 , so sempre positivos.
O desvio padro de uma populao finita, simbolizado por , definido como a raiz
quadrada positiva da varincia:

Na maioria dos casos, no possvel observar todos os elementos de uma populao.


Devido a isso so calculados a varincia e o desvio padro amostrais
Quando no se conhece a varincia populacional 2 e a populao de onde
coletada a amostra, infinita, utiliza-se a varincia amostral S2

47

s2

(x

i 1

x )2

n 1

para dados no tabulados

s2

fi ( x

i 1

x)2

n 1

para dados tabulados

Em que: n o tamanho da amostra ou nmero de valores observados; x a mdia aritmtica


da amostra e fi a freqncia simples absoluta de um determinado valor xi da tabela.
A razo para se utilizar n - 1 como denominador, no lugar de N a de que, se infinitas
amostras ao acaso forem coletadas nessa populao infinita, a mdia aritmtica da varivel S2
ser 2. Assim, pode-se dizer que S2 um estimador no tendencioso de 2 para populaes
infinitas.
Nessa caso, o desvio padro ser

s s2

No exemplo anterior, se considerarmos todas as operaes industriais, do mesmo tipo,


que foram e ainda sero realizadas na mquina C, ter-se- uma populao infinita de
operaes. Dessa forma, pode ser utilizada a varincia s 2 o desvio padro "s" para medir a
variao ou disperso desse conjunto de dados.

Mquina C:

3,

4,

5,

20,

18

Com os dados no esto tabulados a varincia ser

( xi

s 2 i 1

S2

10)2

5 1

(3 10)2 ( 4 10)2 (5 10)2 (20 10)2 (18 10)2


68,5 segundos2
4

Portanto, a mdia dos quadrados dos desvios em relao mdia, cujo valor 10
segundos, 68,5 segundos2, no que se refere aos tempos de 5 operaes da mquina C.
O desvio padro :

48

S 68,5 8,3 segundos


Portanto, a mdia dos desvios em relao mdia, cujo valor 10 segundos,
8 segundos, no que se refere aos tempos de 5 operaes da mquina C
Retornemos aos tempos das operaes das mquinas A, B e C.

Mquina A:

10,

10,

10,

10,

10

Mquina B:

11,

10,

9,

11,

Mquina C:

3,

4,

5,

20,

18

O quadro a seguir mostra os resultados das varincias e dos desvios padro das mquinas A,
B e C.

Mquina
A
B
C

Varincia Desv. Pad


0
0
1
1
68,5
8

Percebe-se, na mquina A que, no h diferena entre os valores observados (sempre


10 s), devido a isso a varincia e o desvio padro so nulos. Na mquina B, houve uma
pequena diferena entre os valores observados, por isso, a varincia e o desvio padro foram
um pouco maiores (1s). Na Mquina C, houve maior diferena entre os valores observados,
assim, a varincia e o desvio padro foram maiores que os anteriores, ou seja, 68,5 segundos2
e 8s.
Se a amostra tiver sido coletada de uma populao finita, ento a varincia amostral ser
representada por:

( x i x )2

N 1
i 1

n 1

N1 2
S
N

Observa-se pela expresso anterior que, quando o tamanho da populao finita muito

2 ou de S2 praticamente conduzem ao mesmo resultado.


alto, o uso de
Novamente, a razo do uso da expresso acima para a varincia amostral a de que, se
vrias amostras forem coletadas nessa populao finita, ento o valor mdio de 2 ser 2.
Neste caso o desvio padro ser dado por:

49

Para ilustrar o aspecto de que se vrias amostras forem coletadas nessa populao
finita, ento o valor mdio de 2 ser 2 , considere um exemplo hipottico, de uma
populao com N = 7 elementos, dados a seguir:

10

12

Tem-se assim, que a mdia e a varincia populacionais so, respectivamente:

2 4 12
(2 7,1429)2 (12 7,1429)2
7,1429 e 2
10,9796
7
7

Sejam, ainda, as amostras aleatrias simples de 6 elementos, extradas sem reposio


dessa populao. O nmero possvel de amostras diferentes dado por C 7,6 = 7. Como elas
so aleatrias todas ocorrem com igual probabilidade. Assim, extraindo infinitas amostras, cada
uma dessas 7 possveis aparecero com igual frequncia. A tabela a seguir apresenta as
possveis amostras de serem coletadas com n = 6 elementos de uma populao com N = 7
elementos.

Amostra No

Elementos

S2

{2, 4, 5, 8, 9, 10}

6,3333

9,8667

8,4571

{2, 4, 5, 8, 9, 12}

6,6667

13,4667

11,5429

{2, 4, 5, 8, 10, 12}

6,8333

14,5667

12,4857

{2, 4, 5, 9, 10, 12}

7,0000

15,2000

13,0286

{2, 4, 8, 9, 10, 12}

7,5000

14,3000

12,2571

{2, 5, 8, 9, 10, 12}

7,6667

13,0667

11,2000

{4, 5, 8, 9, 10, 12}

8,0000

9,2000

7,8857

Mdia

7,1429

12,8095

10,9796

Observa-se que o valor mdio de

x igual ao de , ou seja,

mdia( x) 7,1429 .
Quanto aos estimadores da varincia populacional, o nico cujo valor mdio resultou
igual a 2 foi o de , isto ,
2

mdia ( 2 ) 2 10,9796

Exemplo
Suponha que de uma populao finita de 50 funcionrios de uma empresa, foram
escolhidos 15 indivduos, aleatoriamente, e verificado o nmero de dias que cada um chegou
atrasado ao servio, em um ms. Os resultados (hipotticos) so dados a seguir

50

15
10
12
12
16

20
18
18
19
21

12
14
15
13
12

Soluo:

227
15,13
15

Como a populao finita (N = 50), a varincia e o o desvio padro amostrais podem ser
calculados por:
n

(x
N 1
i 1

x )2

n 1

N 1 2
S
N

50 1 (15 15,13 )2 (12 15,13 )2 49 161,73


(dias)2

50 . 14 11,32
50
15 1

Portanto, o desvio quadrtico mdio dos valores individuais, em relao a mdia, cujo
valor de 15,13 dias, foi de 11,32 dias2
Logo, o valor do desvio padro :

11,32 3,36 dias

Portanto, o desvio dos valores individuais, em relao a mdia, cujo valor de15,13 dias,
foi em mdia igual a 3,36 dias.

7.2 Desvio mdio (Dm)


O desvio mdio, uma medida que expressa a mdia dos desvios (em valor absoluto)
dos valores observados tomados em relao mdia aritmtica ou em relao mediana, ou
seja

xi x
Dm

i 1

n
n

xi Md
Dm

i 1

51

Propriedades do desvio mdio


1. O desvio mdio leva em considerao todos os valores de um conjunto de dados.
n

2. A soma dos desvios , em mdulo, em torno da mediana,

x i Md , menor que qualquer


i 1

outra soma dos desvios em mdulo, inclusive em torno da mdia aritmtica,

xi x
i 1

Consequentemente, o desvio mdio mnimo quando calculado levando-se em conta a


mediana..
3. O desvio mdio uma medida de disperso eficaz, porm, no to utilizado quanto o
desvio padro, pois este se encaixa melhor a varias aplicaes da teria de probabilidades e
Inferncia Estatstica, tpicos tratados mais adiante. Alm disso o desvio mdio no
considera os desvios negativos, uma vez que o mdulo os trata como se fossem todos
positivos.

Exemplo: Retornemos ao exemplo dos tempos das operaes da mquina C

Mquina C:

3,

4,

5,

20,

18

Tem-se:

x 2,375 e Md = 5 (elemento central do conjunto ordenado), assim,


n

xi x
Dm

i 1

3 10 4 10 18 10
5

7 6 5 10 8
7,2 minutos
5

Conclui-se que a mdia dos valores absolutos dos desvios tomados em relao a
mdia, foi de 7,2 minutos

xi Md
Dm

i 1

3 5 4 5 18 5
5

6,2 minutos

Conclui-se que a mdia dos valores absolutos dos desvios tomados em relao a
mediana, foi de 6,2 minutos. Isto confirma a segunda propriedade de desvio mdio, pois 6,2 <
7,2.

52

7.3 Amplitude total ou Intervalo total


Outra medida de disperso a amplitude ou amplitude total de um conjunto de valores
x1, x2, . . .,xn, a qual definida pela diferena entre o maior valor observado (x mx) e o menor
valor observado (xmin) do conjunto, ou seja,

At = xmx - xmin

Para exemplo das mquinas resulta

Mquina A:

At = 10 - 10 = 0s

Mquina B:

At = 11 - 9 = 2s

Mquina C:

At = 20 - 3 = 17s

Suponha que outra mquina D fornea os seguintes resultados:

Suponha que outra mquina D fornea os seguintes resultados

10, 10, 10, 3, 20,


nesse caso,
At = 20 - 3 = 17s

Nota-se que as mquinas C e D apresentam a mesma amplitude, apesar dos conjuntos


de valores serem bem diferentes. Desta forma, verifica-se que a amplitude tem o grande
inconveniente de depender somente de valores extremos do conjunto, desprezando os valores
intermedirios. Assim, a amplitude no pode fornecer uma ideia precisa quanto disperso.

7.4 Intervalo Interquartil


Uma medida de disperso alternativa que pode ser utilizada o intervalo interquartil , o
qual dado pela diferena entre o terceiro e o primeiro quartis, ou seja:
dQ = Q3 Q1
O desvio padro pode no ser uma medida adequada para representar um conjunto de
valores quando houver valores discrepantes (muito acima ou muito abaixo dos demais valores),
pois, afetado pelos extremos.
Exemplo:

53

Para ilustrar o fato de que o desvio padro afetado pelos extremos, enquanto que o
intervalo interquartil no se altera, suponha o seguinte conjunto de dados

5 7 15
9,5
6

10

12

15

(5 9,5) 2 (7 9,5) 2 (15 9,5) 2


3,62
6 1

Assim, o intervalo Interquartil ser

E Q1

1 (6 1)
1,75 2a posio ordenada Q1 = 7
4

E Q3

3 (6 1)
5,25 5 a posio ordenada Q3 = 12
4

Assim, o desvio interquartil ser


dQ = Q3 Q1.= 12 - 7 = 5

Isto significa que a diferena entre o segundo e o quinto elemento, 5.


Suponha que o valor 15 seja alterado para 150:

10

12

150

Obtm-se, ento, S = 57,86 e dQ = 5, ou seja, dQ no se altera.

7.5. Coeficiente de variao


O coeficiente de variao (cv) uma medida admensional de disperso. A vantagem em
se usar esta medida sua facilidade de interpretao, uma vez que a mesma varia de 0 a 1, ou
de 0 a 100%. Devido a isto pode-se dizer que o coeficiente de variao uma medida pura,
pois no possui unidade de medida como as anteriores. Aqui utilizaremos o coeficiente de
variao de Pearson dado pelo quociente entre o desvio padro (s) e a mdia amostral ( x ).

cv

s
x

O coeficiente de variao pode ser expresso em porcentagem, sendo uma medida


relativa de disperso em relao ao valor mdio, ou seja,

54

cv

s
.100
x

Segundo Fonseca e Martins(1996), diz-se que a distribuio possui pequena


variabilidade (disperso) quando o CV der at 10%; mdia disperso quando estiver acima de
10% at 20%; e grande disperso quando superar 20%, ou seja,
Baixa disperso: CV 10%
Mdia disperso: 10% < CV 20%
Alta disperso: CV > 20%

Alguns analistas consideram:

Baixa disperso: CV 15%


Mdia disperso: 15% < CV < 30%
Alta disperso: CV 30%

O coeficiente de variao particularmente til quando so comparadas As variabilidades de


dois ou mais conjuntos de dados que so expressos em diferentes unidades de medida.
Deve-se utilizar o coeficiente de variao, tambm, quando deseja-se comparar as
disperses de 2 conjuntos de dados com unidades de medida iguais, porm com mdias muito
diferentes de tal modo que, a comparao direta desvios padro no muito til, uma vez que
essa medida de variao leva em conta a soma dos quadrados dos desvios em relao
n

mdia

xi x

i 1

Exemplo:
Supondo que um parafuso do tipo 1 tem mdia x1 30 cm de comprimento e desvio
padro s1 = 3 cm, enquanto que ao parafuso do tipo 2 tem mdia x 2 80 cm e desvio padro
s2 = 4 cm. Nota-se que em termos absolutos, a disperso do parafuso do tipo 1 menor que a
do tipo 2, pois, s1 < s2. No entanto, as mdias de comprimentos dos dois tipos de parafusos so
muito diferentes. Neste caso no, comparar as disperses dos comprimentos dos dois tipos de
parafusos pelos desvios padro no parece ser o melhor procedimento. Ento, mais til
comparar as variabilidades dos comprimentos em relao mdia, ou seja, em termos
relativos, o parafuso do tipo 1 possui coeficiente de variao

55

cv1

s
3
.100 100 10%
x
30

cv 2

s
4
.100 100 5%
x
80

enquanto que o do tipo 2

Assim, o cv1> cv2, ou seja, a disperso em relao mdia dos comprimentos de


parafusos do tipo 1 maior que a dos parafusos do tipo 2. Percebe-se, ainda, que tanto cv1
como cv2 possuem valores baixos, segundo Martins e Fonseca (1996), pois, cv 1 = 10% e cv2 =
5% <10%

8. Medidas de Assimetria e Curtose


As distribuies de freqncias no diferem apenas quanto s medidas de posio e de
disperso, mas tambm quanto sua forma, ou seja, deve-se levar em conta o grau de
deformao ou de assimetria e o grau. de achatamento ou afilamento da curva de freqncias
ou do histograma.

8.1 Medidas de Assimetria


A assimetria definida como o grau de desvio, ou afastamento da simetria, de uma
distribuio. Quantitativamente, o grau de desvio pode ser determinado pela medida
denominada de coeficiente momento de assimetria ( a3 ) dado pela seguinte expresso:

a3

m3
s3

em que s3 o desvio padro amostral elevado ao cubo; m 3 o terceiro momento centrado na


mdia de um conjunto de n valores observados x1, x2,. . . , xn., definido para dados brutos por:

m3

(x i x) 3
i 1

em que n o nmero total de observaes e x a mdia aritmtica.


Se os dados forem tabulados, as frequncias das categorias (f i), sero inseridas na
frmula anterior, ou seja:

56

m3

f i (x i x) 3
i 1

em que:
k o nmero total de categorias;
xi o valor individual de cada categoria se os dados no estiverem distribudos em classes, ou
o ponto mdio de cada classe, xi = (Ls + Li)/2, se os dados forem apresentados em classes
Sendo a3 = 0, tem-se uma distribuio simtrica. Quando ocorre a3 0, a distribuio
alongada esquerda, sendo assimtrica esquerda ou assimtrica negativa; para a 3 > 0, a
distribuio alongada direita, sendo denominada de assimtrica direita ou assimtrica
positiva, como mostra Figura 1.12.Tambm observa-se o seguinte aspecto na figura 1.12
Distribuio simtrica x Md Mo
Distribuio assimtrica negativa x Md Mo

Mo Md x

Distribuio assimtrica positiva

x Md Mo

x Md Mo

Mo Md x

Figura 1.12 Distribuio simtrica (a3 = 0), assimtrica negativa (a3 < 0) e
assimtrica positiva (a3 > 0)

Outra medida que pode ser utilizada para avaliar o grau de assimetria o chamado
coeficiente de assimetria de Pearson o qual pode ser dado por:

( x Mo)
s

Algumas vezes o conjunto de dados contm mais de uma moda, ou no a possui. Nesse caso
poder usada a seguinte expresso:
A

3 ( x Md )
s

A segunda expresso obtida pela relao emprica entre a mdia a e a moda,


proposta por Pearson, ou seja,

57

( x Mo ) 3 ( x Md)

Assim,
( x Mo) 3 ( x Md)

s
s

Apenas quando a distribuio for simtrica essas expresses sero equivalentes, pois
essas relaes so aproximadas.

8.2 Curtose
A curtose definida como o grau de achatamento de uma distribuio de dados,
considerado usualmente em relao disrtibuio normal (distribuio terica que ser objeto
de estudo na seo 10.2). Com relao ao achatamento, a distribuio normal dita
mesocrtica. As distribuies mais achatadas so ditas platicrticas, enquanto que as mais
afiladas so ditas leptocrticas, como mostra a figura 1.13.

Normal

Leptocrtica

Platicrtica

Figura 1.13 - Distribuies Normal, Leptocrtica e Platicrtica

A principal medida de curtose dada pelo coeficiente momento de curtose (a4), sendo
definida pelo quociente entre o quarto momento centrado na mdia (m 4)e o desvio padro
elevado Quarta potncia (s4), ou seja,

a4

m4
s4

em que m4 o quarto momento centrado na mdia, cuja expresso dada por:

58

m4

( xi x ) 4
i 1

Caso tenham-se dados tabulados, m 4 expresso da seguinte forma:

m4

fi ( x i x ) 4
i 1

em que:
k o nmero total de categorias ou classes;
xi o valor individual de cada categoria se os dados no estiverem distribudos em classes, ou
o ponto mdio de cada classe, xi = (Ls + Li)/2, se os dados forem apresentados em classes
O coeficiente do momento de curtose uma medida adimensional de curtose, sendo
a4 = 3 para a distribuio normal, a4< 3 para a distribuio platicrtica e a 4 > 3 para distribuio
leptocrtica.
Na prtica s faz sentido calcular a curtose para as distribuies simtricas ou pelo
menos aproximadamente simtrica.

Exemplos:

Suponha que tenha sido Realizada uma experincia a fim de examinar o efeito da idade
sobre o nmero de batidas do corao, quando o funcionrio submetido a certo tipo de
atividade. Foram sorteados 10 funcionrios na faixa etria de 20 a 39 anos. Cada um andou
sobre uma pista fixa (comandada pelo movimento dos ps) durante 12 minutos, numa
intensidade predeterminada. O aumento das batidas do corao de cada pessoa, ou seja, a
diferena entre os totais antes e depois do exerccio, foi anotado para cada um dos
funcionrios, obtendo-se os resultados a seguir em batidas por minuto. Sabendo que a mdia
de 27,5 batimentos/minuto e o desvio padro de 4,9 batimentos/minuto, e a mediana 27,5
batimentos/minuto calcule a assimetria e o grau de achatamento da distribuio dos dados.

24

27

33

31

21

28

24

34

21

32

Clculo do coeficiente do momento de assimetria

( x i x )3
m3

i 1

m3

(27 27,5) 3 (33 27,5) 3 . . . (32 27,5) 3


6
10

59

m3

60
m 3 6
10

6
( xi x )
logo,
a3 - 0,05
a3
i 1
4,9 3
n
n

Clculo do coeficiente de assimetria de pearson

3 ( x Md)
3 (27,5 27,5)
= A
0
s
4,9

Clculo do coeficiente de curtose


n

(x i x) 4
m4

i 1

m4

(27 27,5) 4 (33 27,5) 4 . . . (32 27,5) 4

10

m4

(3.5) 4 (-0,5)4 . . . (4,5)4


150,0625 0,0625 . . .. 410,0625
m4

10
10

m4

7130,625
m4 713,0625
10

logo, a4

m4
s

a4

713,0625
4,9 4

=1,2369

Conclui-se portanto que, a curva de distribuio de frequncias dos batimentos cardacos


por minuto, de funcionrios da faixa etria de 20 a 39 anos simtrica, pois A 3 = 0
e a 3 -0,05 0 ; e platicrtica (achatada em relao distribuio normal), pois a4 = 1,2369 < 3.
Os dados da tabela 1.13 referem-se ao peso em kg de 23 pacotes de um certo produto,
cuja mdia foi de 2,73 kg e desvio padro de 0,52 kg.

TABELA 1.13 Peso em kg de 23 pacotes de um certo produto

Classes
(peso em kg)
1,5 I 2,0
2,0 I 2,5
2,5 I 3,0
3,0 I 3,5
3,5 I 4,0

fi

xi = (Li +Ls)/2

2
5
10
4
2

(1,5 + 2,0)/2 =1,75


(2,0 + 2,5)/2 = 2,25
2,75
3,25
3,75

Clculo do coeficiente de Assimetria

m3

f i ( x i x )3
i 1

60

2 . (1,75 2,73)3 5 . (2,25 2,73)3 . . . 2 . (3,75 2,73)3


23

m3

2 . (-0,98)3 5 . (-0,48)3 . . . 2 . (1,02)3


23
2 . (0,94) 5 . ( 0,11) . . . 2 (1,06)
1,88 0,55 . . . 2,12
m3
m3
23
23
m3

0,25
m3 0,01
23

m3

m3

Logo, a 3

a3

s3

0,01
0,523

a 3 0,07

Conclui-se, portanto, que a curva de distribuio de frequncias dos pesos dos 23


pacotes desse produto, simtrica, pois a3 = 0,07 0

Clculo do coeficiente de Curtose

fi ( x i x ) 4
i 1

m4

m4

2 . (1,75 2,73)4 5 . (2,25 2,73)4 . . . 2 . (3,75 2,73)4


23

m4

2 . (-0,98)4 5 . (-0,48)4 . . . 2 . (1,02)4


23

m4

2 . (0,92) 5 . (0,05) . . . 2 (1,09)


1,83 0,26 . . . 2,18
m4
23
23

m4

4,57
m4 0,20
23

Logo, a4

m4
s

0,20
0,52 4

a 4 2,7

Conclui-se, portanto, que a curva de distribuio de frequncias dos pesos em kg, dos
23 pacotes desse produto, aproximadamente normal, pois a 4 2,7 3.

8.3 Sequncia de exerccios n 5

1 Suponha que tenha sido cronometrado o tempo que operrios levam para realizar
determinada tarefa em certa indstria, conforme os dados abaixo.
45

37

39

48

51

40

61

a) Calcule a mdia aritmtica, a mediana, a moda, o 1 quartil e o 3 quartil


Respostas: x 43,3333 ; Md = 42,5; Q1 = 39; Q3 = 48;

b) Calcule a varincia, o desvio padro, o desvio mdio, o coeficiente de variao, o desvio


interquartil, a assimetria e a curtose. interprete todos os resultados.
Respostas: S2 = 30,667, S = 5,5377; Dm = 4,6667; CV = 12,78%, dQ = 9; a3 = 0,18 e a4 =
1,07
2 Suponha que de cada lote de 500 peas foram foi anotado o nmero de peas defeituosas.
Aps este procedimento foi construda seguinte tabela de frequncias:

n de peas defeituosas
0
1
2
3
4

n de lotes(f)
2
3
10
5
3

a) calcule a mdia, a mediana, a moda, o desvio padro, coeficiente de variao e Interprete


todos os resultados. Respostas: x 2,17 , Md = 2; Mo = 2; S = 1,11 e CV = 51,15%
3 Suponha que foram medidos os comprimentos milmetros de 30 parafusos do tipo A. O
comprimento mdio foi de 19,28 mm e o desvio padro de 0,15 mm. A distribuio de
frequncias foi a seguinte:
Classes
(comprimento em mm)
19,0 I 19,1
19,1 I 19,2
19,2 I 19,3
19,3 I 19,4
19,4 I 19,5
19,5 I 19,6

Frequncias
4
5
8
7
3
3

a) Calcule a mdia aritmtica, a mediana, a moda, o 1 quartil e o 3 quartil


Respostas: x 19,28 ; Mo = 19,275; Md =19,30; Q1 = 19,170; Q3 =19,3786

b) Calcule a varincia, o desvio padro, o desvio mdio, o coeficiente de variao, o desvio


interquartil, a assimetria e a curtose. interprete todos os resultados.
Respostas: S2 = 0,0222; S = 0,1489; Dm = 0,1207; CV = 0,7723%, dQ = 0,2086; a3 = 0,1648
e a4 = 2,1185

También podría gustarte