Está en la página 1de 238

METOD

OLO
GIAS
QUA
NTIT
ATIV
AS

1
ndex

Introduo 3
Conceitos Fundamentais 4
Medidas de Localizao 59
Estatstica Descritiva 69
Distribuies de Probabilidade Inferncia Estatstica 122
Amostragem 125
Mtodos Quantitativos
Regresso Simples 145
Regresso Mltipla 148
Regresso No-Linear 150
Variveis Dummies 151
Utilizao do Excel em estatstica 153
Distribuies de Probabilidade Inferncia Estatstica 154
Aplicaes Prticas 172
Anlise de dados em Auditoria (exerccio) 202
Glossrio 222
Bibliografia 235

2
Introduo

INTRODUO
A estatstica descritiva anlise exploratria de dados pretende isolar as
estructuras e padres mais relevantes e estveis patenteados pelo conjunto de
dados objectos do estudo.
A estatstica indutiva anlise confirmatria de dados pretende avaliar,
nomeadamente, atravs da recolha e anlise de novas observaes, a
reprodutividade ou permanncia das estruturas e padres detectados.

A anlise de dados, fortalecida pela quantidade e variedade dos dados


disponveis e pelo poder de computao acessvel, que no se pode dissociar
das grandes capacidade grficas, contribui para estabelecer uma maior ligao
entre os aspectos descritivos e inferncias da estatstica.
Os dados estatsticos resultam de experincias ou inquritos conduzidos sobre
um conjunto restrito a amostra e as concluses procuram alargar-se a um
conjunto mais vasto a populao.

3
Conceitos Fundamentais

CONCEITOS FUNDAMENTAIS E DEFINIES


A estatstica trabalha com dados, os quais podem ser obtidos por meio de uma
populao ou de uma amostra, definida como:

Populao: conjunto de elementos que tem pelo menos uma caracterstica em


comum.
Esta caracterstica deve delimitar correctamente quais so os elementos da
populao que podem ser animados ou inanimados.

Amostra: subconjunto de elementos de uma populao. Este subconjunto


deve ter dimenso menor que o da populao e os seus elementos devem ser
representativos da populao.

4
Conceitos Fundamentais

CONCEITOS FUNDAMENTAIS E DEFINIES


A seleco dos elementos que iro compor a amostra pode ser feita de vrias
maneiras e ir depender do conhecimento que se tem da populao e da
quantidade de recursos disponveis. A estatstica inferencial a rea que trata
e apresenta a metodologia de amostragem.

Tratando-se de conjuntos-subconjuntos, estes podem ser:


Finitos: possuem um nmero limitado de elementos.
Infinitos: possuem um nmero ilimitado de elementos.

5
Conceitos Fundamentais

CONCEITOS FUNDAMENTAIS E DEFINIES


Aps a determinao dos elementos pergunta-se: o que fazer com estes?
Pode-se medi-los, observ-los, cont-los, surgindo um conjunto de respostas
que receber a denominao de varivel.

Varivel: a caracterstica que vai ser observada, medida ou contada nos


elementos da populao ou da amostra e que pode variar, ou seja, assumir um
valor diferente de elemento para elemento.

No basta identificar a varivel a ser trabalhada, necessrio fazer-se


distino entre os tipos de variveis:
Varivel qualitativa: uma varivel que assume como possveis valores,
atributos ou qualidades. Tambm so denominadas variveis categricas.
Varivel quantitativa: uma varivel que assume como possveis valores,
nmeros.
6
Conceitos Fundamentais

CONCEITOS FUNDAMENTAIS E DEFINIES


Cada uma dessas variveis pode ser sub-classificada em:
Varivel qualitativa nominal: uma varivel que assume como possveis
valores, atributos ou qualidades e estes no apresentam uma ordem natural de
ocorrncia.
Exemplo 01: meios de informao utilizados pelos alunos da disciplina
Inferncia Estatstica do curso de Estatstica da UEM: televiso, revista,
internet, jornal.

Varivel qualitativa ordinal: uma varivel que assume como possveis


valores atributos ou qualidades e estes apresentam uma ordem natural de
ocorrncia.
Exemplo 02: estado civil dos alunos da disciplina Inferncia Estatstica do
curso de Estatstica da UEM: solteiro, casado, separado.

7
Conceitos Fundamentais

CONCEITOS FUNDAMENTAIS E DEFINIES


Varivel quantitativa discreta: uma varivel que assume como possveis
valores nmeros, em geral inteiros, formando um conjunto finito ou
enumervel.
Exemplo 03: nmero de reprovaes, por disciplina, dos alunos da disciplina
Inferncia Estatstica do curso de Estatstica da UEM: 0, 1, 2, .....

Varivel quantitativa contnua: uma varivel que assume como possveis


valores nmeros, em intervalos da recta real e, em geral, resultantes de
mensuraes.
Exemplo 04: peso (quilogramas) dos alunos da disciplina Inferncia Estatstica
do curso de Estatstica da UEM: 58, 59, 63.....

8
Conceitos Fundamentais

TABELA
Com o objectivo de levantar dados, para exemplificar a maioria das tcnicas
apresentadas, no dia 21/03/2005, um questionrio foi aplicado aos alunos do
2 ano do curso de Estatstica da Universidade Estadual de Maring (UEM)
matriculados na disciplina Inferncia Estatstica.

As variveis que compem o questionrio so:


Sexo: com categorias (1) se masculino e (2) se feminino
Id: idade em anos
Altura: altura em metros e centmetros
Peso: peso em quilos
Est.Civil: estado civil com categorias (1) se solteiro, (2) se casado e (3) se
separado
Nir.: nmero de irmos

9
Conceitos Fundamentais

TABELA
Transp.: meio de transporte mais utilizado com categorias (1) de coletivo e (2)
se prprio
Procedncia: municpio de procedncia com categorias (1) se Maring, (2) se
outro municpio do Paran e (3) se de outro Estado
Trabalho: relao do trabalho com o curso com categorias (1) no trabalho, (2)
completamente relacionado, (3) parcialmente relacionado e (4) no relacionado
Inform: meio de informao mais utilizado com categorias (1) se TV, (2) jornal,
(3) rdio, (4) revista e (5) internet
Disc.: nmero de disciplinas reprovadas no 1 ano da UEM.
Para se trabalhar estes dados so necessrios, em primeiro lugar, tabul-los e
apresent- los na forma em que foram coletados (dados brutos) como na
Tabela 01. Em geral, a 1 coluna da tabela deve conter a identificao do
respondente.

10
Conceitos Fundamentais

11
Conceitos Fundamentais

TABELA
De acordo com Magalhes (2000), pode-se observar que a Tabela 01, tabela
de dados brutos, contm muita informao, porm pode no ser muito rpido e
prctico obter estas informaes. Por exemplo, no imediato afirmar que
existem mais homens que mulheres.

Neste sentido, pode-se construir outra tabela para cada uma das variveis que
resumir as informaes ali contidas.

Segundo o mesmo autor, observa-se tambm que, ao usar programas


informticos para facilitar/agilizar a digitao do banco de dados, s variveis
qualitativas associam-se valores numricos e nem por isso a varivel deixa de
ser qualitativa. Cabe ao bom senso lembrar da natureza da varivel.

12
Conceitos Fundamentais

TABELA
Embora um certo volume de informao seja perdido quando os dados so
resumidos, um grande volume pode tambm ser ganho. Uma tabela talvez
seja o meio mais simples de se resumir um conjunto de observaes (Pagano,
2004). Deve ser usada quando importante a apresentao dos valores
(Medronho, 2003), e sua leitura depende de quem a l.

Todas as variveis podem ser resumidas atravs de uma tabela, mas a


construo diferenciada dependendo do tipo de varivel.

Denomina-se Tabela Simples, tabela que resume os dados de uma nica


varivel qualitativa e Distribuio de Freqncias, ao resumo de uma nica
varivel quantitativa.

13
Conceitos Fundamentais

ELEMENTOS DA TABELA
Toda tabela deve ser simples, clara, objectiva e auto-explicativa. Segundo
Milone (2004), os elementos fundamentais da tabela so: ttulo, cabealho,
coluna indicadora e corpo.

O ttulo aponta o fenmeno, poca e local de ocorrncia;


O cabealho explica o contedo das colunas;
A coluna indicadora detalha as linhas;
O corpo mostra os dados.

Complementarmente, tem-se: fonte, notas e chamadas. A fonte cita o


informante (caracterizando a confiabilidade dos dados); as notas esclarecem o
contedo e indicam a metodologia adoptada na obteno ou elaborao da
informao; as chamadas clarificam pontos especficos da tabela.

14
Conceitos Fundamentais

15
Conceitos Fundamentais

ELEMENTOS DA TABELA
Destaca-se que as tabelas devem ser numeradas por ordem crescente ou
conforme aparecem no texto, como o caso de trabalhos cientficos; as bordas
superiores e inferiores devem ser fechadas com traos horizontais, enquanto
que as da esquerda e direita no, podendo ou no ser fechadas por traos
verticais a separao das colunas no corpo da tabela. conveniente tambm
que o nmero de casas decimais seja padronizado.

TABELA SIMPLES
Uma tabela simples contm as diferentes categorias observadas de uma
varivel qualitativa e as suas respectivas contagens, denominadas freqncias
absolutas. A contagem refere-se ao nmero de ocorrncias de cada categoria
e realizada utilizando-se, por exemplo, a Tabela 01 ou o banco de dados.

16
Conceitos Fundamentais

17
Conceitos Fundamentais

comum e til na interpretao de tabelas a incluso de uma coluna


contendo as freqncias relativas e/ou relativas em percentual. A freqncia
relativa obtida dividindo-se a freqncia absoluta de cada categoria da
varivel pelo nmero total de observaes (nmero de elementos da amostra
ou da populao). Multiplicando-se este resultado por 100, obtm se a
freqncia relativa em percentual. Assim, a Tabela 5 torna-se:
18
Conceitos Fundamentais

Segundo Barbetta et al. (2004), as freqncias relativas em percentual so


teis ao se comparar tabelas ou pesquisas diferentes. Por exemplo,
quando amostras (ou populaes) tm nmeros de elementos diferentes, a
comparao atravs das freqncias absolutas pode resultar em
afirmaes errneas, enquanto que, pelas freqncias relativas em
percentual no, pois os percentuais totais so os mesmos.

19
Conceitos Fundamentais

20
Conceitos Fundamentais

DISTRIBUIO DE FREQUNCIA
Como j mencionado no incio deste captulo, dependendo do volume de
dados, torna-se difcil ou impracticvel tirar concluses a respeito do
comportamento das variveis e, em particular, de variveis quantitativas.

Pode-se, no entanto, colocar os dados brutos de cada uma das variveis


quantitativas numa ordem crescente ou decrescente, denominado rol. A
visualizao de algum padro ou comportamento continua sendo de difcil
observao ou at mesmo cansativa, mas torna-se rpido, identificar maiores e
menores valores ou concentraes de valores, no caso de variveis
quantitativas. Estes nmeros (menor e maior valor observado) servem de
ponto de partida para a construo de tabelas para estas variveis.

Vale destacar que para as variveis qualitativas, pode-se tambm construir um


rol em ordem temporal ou alfabtica, por exemplo.

21
Conceitos Fundamentais

DISTRIBUIO DE FREQUNCIA
a diferena entre o menor e maior valor observado da varivel X,
denominada amplitude total (AT = xmax xmin), que definir a construo de
uma distribuio de frequncia pontual ou em classes.
O ideal que uma distribuio de frequncia resuma os dados num nmero de
linhas que varie de 5 a 10.

Distribuio de frequncia pontual sem perda de informao


A construo de uma distribuio de frequncia pontual equivalente
construo de uma tabela simples, onde se listam os diferentes valores
observados da varivel, com suas frequncias absolutas, denotadas por Fi,
onde o ndice i corresponde ao nmero de linhas da tabela, como mostrado
na Tabela 7.

22
Conceitos Fundamentais

Observa-se que esta varivel foi resumida em 5 linhas. Assim, i = 1,...,5, e,


portanto, tem-se 5 valores para as frequncias absolutas. A frequncia
absoluta da segunda linha, F2 = 6, por exemplo, indica que seis alunos tm
um irmo, enquanto apenas um afirmou ter seis irmos. A soma de todas as
frequncias absolutas deve ser igual ao nmero total de observaes da
varivel, neste caso, 22. A segunda coluna desta tabela uma coluna
opcional em distribuies de frequncias.
Ainda, como colunas complementares em uma distribuio de frequncias e
considerando i, a ordem da linha na tabela, tem-se:
23
Conceitos Fundamentais

24
Conceitos Fundamentais

25
Conceitos Fundamentais

26
Conceitos Fundamentais

Segundo Milone (2004), tratando-se das frequncias relativas em percentuais,


os arredondamentos tornam-se necessrios e devem ser feitos de maneira
convencional. Neste tipo de aproximao opta-se sempre pelo menor erro.

Por exemplo, se for necessrio aproximar o nmero 0,483 para a ordem do


centsimo, erra-se menos subtraindo 0,003 que adicionando 0,007 ao valor
0,483, portanto a aproximao correta 0,48.

Se a aproximao for do nmero 0,4853 para a ordem do centsimo, ento o


erro menor ser para a adio de 0,0047 e no para a subtrao de 0,0053, e
a aproximao adequada 0,49.

J no caso do nmero 0,485, o tamanho do erro de aproximao o mesmo


que se obtm quando feita para mais ou para menos (0,005), e neste caso,
cabe ao pesquisador decidir qual aproximao mais conveniente.

27
Conceitos Fundamentais

A soma de todas as frequncias relativas percentuais deve ser igual a 100.

Entretanto, quando so feitas aproximaes, tal facto pode no ocorrer.

Para o caso em que for menor que 100, soma-se uma unidade ao dgito de
interesse das maiores frequncias relativas at que a soma seja 100.

Se for maior que 100, deve-se subtrair uma unidade das maiores frequncias
relativas.

Agora, se ocorrem empates ou se as maiores frequncias forem nmeros


inteiros, conveniente trabalhar com as outras frequncias.

O importante que a distribuio dos dados no seja alterada.

28
Conceitos Fundamentais

Distribuio de frequncia em classes com perda de informao


A distribuio de frequncias em classes apropriada para apresentar dados
quantitativos contnuos ou discretos com um nmero elevado de possveis
valores (Medronho, 2003). necessrio dividir os dados em intervalos ou
faixas de valores que so denominadas classes. Uma classe uma linha da
distribuio de frequncias. O menor valor da classe denominado limite
inferior (li) e o maior valor da classe denominado limite superior (Li). O
intervalo ou classe pode ser representado das seguintes maneiras:
a) li |____ Li, onde o limite inferior da classe includo na contagem da
frequncia absoluta mas o superior no;
b) li ____| Li, onde o limite superior da classe includo na contagem mas o
inferior no;
c) li |____| Li, onde tanto o limite inferior quanto o superior so includos na
contagem;
d) li ____ Li, onde os limites no fazem parte da contagem.

29
Conceitos Fundamentais

Pode-se escolher qualquer uma destas opes sendo o importante tornar claro
no texto ou na tabela qual que est a ser usada.
Se houver muitos intervalos, o resumo no constituir grande melhoria com
relao aos dados brutos. Se houver muito poucos, um grande volume de
informao se perder. Embora no seja necessrio, os intervalos so
frequentemente construdos de modo que todos tenham larguras iguais, o que
facilita as comparaes entre as classes. (Pagano, 2004).
Milone (2004) apresenta os seguintes critrios para a determinao do nmero
de intervalos, denotado por k:
1. Raiz quadrada: k = n
2. Log (Sturges): k =1+ 3,3log n
3. ln (Milone): k = 1+ 2 ln n
4. k =1 +10d AT ,
onde n o nmero de elementos da amostra, AT a amplitude total dos dados
e d o nmero de decimais dos seus elementos.
30
Conceitos Fundamentais

Deve-se lembrar que sendo k o nmero de classes, o resultado obtido por


cada um dos critrios deve ser o nmero inteiro mais prximo ao obtido.

Milone (2004) acrescenta ainda que, adoptando o princpio de que os


agrupamentos devem ter no mnimo cinco e no mximo 20 classes, o critrio
da raz valido para 25 n 400, o do log para 16 n 572.237 e o do ln para
20 n 36.315.

Por outro lado, o pesquisador pode definir o nmero de classes baseando-se


na sua experincia.
Determinado o nmero de classes da distribuio de frequncias, o prximo
passo determinar a amplitude de cada classe, h, que por uma questo de
bom senso, deveria ser um nmero com a mesma preciso dos dados.

A amplitude de classe, h, definida por:


31
Conceitos Fundamentais

e assim todas as classes tero a mesma amplitude, o que permitir a


construo de grficos e clculo de medidas descritivas.
No caso de uma distribuio de frequncia contnua, ou em classes, uma
outra coluna pode ser acrescentada tabela. a coluna dos pontos
mdios, denotada por xi e definida como a mdia dos limites da classe:

Estes valores so utilizados na construo de grfico e na obteno de


medidas descritivas com o auxlio de calculadoras.
Exemplo 07. Considere a varivel idade dos alunos da Tabela 01. A
Tabela 09 apresenta a distribuio de frequncia adequada.
32
Conceitos Fundamentais

33
Conceitos Fundamentais

Pode-se observar que a tabela possui 13 linhas e que muitas delas,


seguidas, apresentam frequncia igual a 1, o que mostra que o resumo
da idade no apresenta uma distribuio satisfatria dos dados.
Segundo Montgomery (2003), ao passar dos dados brutos, que o
mesmo que os dados apresentados numa distribuio de frequncias
pontual, para uma distribuio de frequncia em classes, algumas
informaes so perdidas, pois no se tem mais as observaes
individuais. Por outro lado, essa perda pequena quando comparada ao
ganho de conciso e de facilidade de interpretao da distribuio de
frequncia.
Assim, para a idade, tem-se:

e, a distribuio de frequncia dada na Tabela 10.


34
Conceitos Fundamentais

Nota-se que cada um dos valores observados deve pertencer a uma e


somente uma classe.
usual que o limite inferior da primeira classe seja igual ao menor valor
observado e que o maior valor pertena ltima classe. Quando o limite
superior da ltima classe coincidir com o maior valor observado mais
apropriado fechar este intervalo, contando o elemento nesta classe, do
que abrir uma nova classe contendo apenas uma frequncia absoluta.
35
Conceitos Fundamentais

Por outro lado, se o maior valor observado for inferior ao limite superior da
classe, no h problema, pois fixamos todas as classes com a mesma
amplitude.

Nada impede que se construa uma tabela com amplitude de classes desiguais.
Isto depender do objetivo do pesquisador. O que se recomenda, o cuidado
na interpretao da tabela. O primeiro passo calcular as amplitudes das
classes (i) e apresent-las numa coluna.

Em seguida, calculam-se as densidades de frequncias de cada classe,


dividindo-se Fi por i, para conhecer a concentrao por unidade da varivel.
Pode-se, tambm, calcular as densidades das propores para se conhecer o
percentual de concentrao em cada classe (fi / i).

36
Conceitos Fundamentais

Exemplo 08. Considere os dados do exemplo 07. A distribuio de


frequncias com intervalos de classes desiguais apresentada na
Tabela 11.

37
Conceitos Fundamentais

Uma outra forma de construir uma distribuio de frequncias com


amplitudes de classes desiguais a que se apresenta na Tabela 12,
onde a ltima classe no apresenta limite superior especificado. Isto
poderia, tambm, ocorrer na primeira classe, mas agora com o limite
inferior no especificado.

Com este tipo de distribuio podem ocorrer dificuldades na


construo de grficos e no clculo da mdia, por exemplo.
38
Conceitos Fundamentais

GRFICOS
Todo grfico, na verso final deve primar pela simplicidade, clareza e
veracidade nas informaes. Para atingir tal objectivo, a construo de um
grfico exige muito trabalho e cuidados.

Segundo Silva (apud WALLGREN, 1996), a escolha da representao grfica


e, consequentemente, a escolha do tipo de grfico mais adequado para
representar um conjunto de dados, deve ser feita com base nas respostas a
questes como:
- Um grfico realmente a melhor opo?
- Qual o pblico-alvo?
- Qual o objectivo do grfico?
- Que tipo de grfico deve ser usado?
- Como que o grfico deve ser apresentado?
- Que dimenso deve ter o grfico?
39
Conceitos Fundamentais

GRFICOS
- Dever ser usado apenas um grfico?
- A qual meio tcnico se deve recorrer?

Ao incluir um grfico num trabalho, a sua identificao deve aparecer na parte


inferior, precedido pela palavra Grfico, seguida do seu nmero de ordem de
ocorrncia no texto (algarismos arbicos), do seu respectivo ttulo e/ou legenda
explicativa de maneira breve e clara (dispensando a leitura do texto) e da fonte
de onde se extraram os dados. Uma regra bsica para a elaborao
adequada do ttulo de qualquer grfico, verificar se o mesmo responde a trs
exigncias: o qu, onde e quando.

Quando um grfico for inserido num texto, recomenda-se que este seja
destacado, tanto do texto que o precede, como do texto imediatamente
subsequente, atravs de trs espaos simples.

40
Conceitos Fundamentais

GRFICOS
Existem diversos tipos de grficos. Porm, neste trabalho sero destacados
aqueles de maior interesse pedaggico na representao das variveis
qualitativas e quantitativas.

GRFICOS PARA VARIVEIS QUALITATIVAS


Grfico de barras
um grfico formado por retngulos horizontais de larguras iguais, onde cada
um deles representa a intensidade de uma modalidade ou atributo.
recomendvel que cada coluna conserve uma distncia entre si de
aproximadamente 2/3 da largura da base de cada barra, evidenciando deste
modo, a no continuidade na sequncia dos dados.
O objetivo deste grfico de comparar grandezas e recomendvel para
variveis cujas categorias tenham designaes extensas.
41
Conceitos Fundamentais

42
Conceitos Fundamentais

Grfico de colunas
o grfico mais utilizado para representar variveis qualitativas. Difere do
grfico de barras por serem seus retngulos dispostos verticalmente ao eixo
das abscissas sendo mais indicado quando as designaes das categorias
so breves. Tambm para este tipo de grfico deve ser preservada a
distncia entre cada retngulo de, aproximadamente, 2/3 da largura da base
de cada coluna. O n de colunas/barras do grfico no deve ser superior a
12.

43
Conceitos Fundamentais

Ao se descrever simultaneamente duas ou mais categorias para uma


varivel, conveniente fazer uso dos grficos de barras ou colunas
justapostas (ou sobrepostas), chamados de grficos comparativos. De
acordo com as normas contidas em Grficos (UFPR, 2001), este tipo de
grfico s deve ser utilizado quando apresentar at trs elementos para
uma srie de no mximo quatro valores.

44
Conceitos Fundamentais

Grfico de sectores
Tipo de grfico onde a varivel em estudo projectada num crculo, de
raio arbitrrio, dividido em sectores com reas proporcionais s
frequncias das suas categorias. So indicados quando se deseja
comparar cada valor da srie com o total. Recomenda-se o seu uso para
o caso em que o nmero de categorias no elevado, bem como, no
obedecem a alguma ordem especfica.
A Figura 05 mostra um grfico de sectores para a varivel municpio de
procedncia que constam na Tabela 01. O procedimento para o clculo
do ngulo correspondente a cada categoria feito por meio de simples
propores: 360 que corresponde a um crculo completo est para o
total de alunos entrevistados, 22, assim como x est para o total de
alunos que pertencem categoria desejada. Por exemplo, os 54% de
alunos que residem no municpio de Maring corresponder a um ngulo
x resultante da expresso abaixo, cujo valor aproximadamente 196.

45
Conceitos Fundamentais

46
Conceitos Fundamentais

Grfico de linhas
A sua aplicao mais indicada para representaes de sries temporais
sendo, por tal razo, conhecidos tambm como grficos de sries
cronolgicas. A sua construo feita colocando-se no eixo vertical (y) a
mensurao da varivel em estudo e na abscissa (x), as unidades da
varivel numa ordem crescente. Este tipo de grfico permite representar
sries longas, o que auxilia a detectar as suas flutuaes, tanto quanto,
analisar tendncias. Tambm podem ser representadas vrias sries num
mesmo grfico.

47
Conceitos Fundamentais

GRFICOS PARA VARIVEIS QUANTITATIVAS DISCRETAS


Grfico de bastes
Este grfico formado por segmentos de rectas perpendiculares ao eixo
horizontal (eixo da varivel), cujo comprimento corresponde frequncia
absoluta ou relativa de cada elemento da distribuio. As suas
coordenadas no podem ser unidas porque a leitura do grfico deve tornar
claro que no h continuidade entre os valores individuais assumidos pela
varivel em estudo.

48
Conceitos Fundamentais

Grfico da frequncia acumulada


A Figura 08 mostra o grfico para frequncia acumulada de uma varivel
quantitativa discreta. Na abscissa so alocados os valores assumidos pela
varivel nmero de irmos e no eixo das ordenadas as suas frequncias
acumuladas.
Observa-se que a leitura do grfico exige alguns cuidados bsicos: caso o
valor da varivel esteja ou no includo, a sua frequncia acumulada difere.

Se for de interesse saber quantos alunos tem dois ou menos irmos (inclui-se
dois irmo), a frequncia acumulada de 19 alunos.

Caso se queira apenas saber quantos alunos tm menos de dois irmos


(portanto o nmero dois no est incluso), a sua frequncia acumulada de 7
alunos.

49
Conceitos Fundamentais

50
Conceitos Fundamentais

GRFICOS PARA VARIVEIS QUANTITATIVAS CONTNUAS


Histograma
um grfico de colunas justapostas que representa uma distribuio de
frequncia para dados contnuos ou uma varivel discreta quando esta
apresentar muitos valores distintos.
No eixo horizontal so dispostos os limites das classes segundo as quais os
dados foram agrupados enquanto que o eixo vertical corresponde s
frequncias absolutas ou relativas das mesmas.
Quando os dados so distribudos em classes de mesma amplitude, Figura 09
(a), todas as colunas apresentam bases iguais com alturas variando em funo
das suas frequncias absolutas ou relativas. Neste caso, tem-se que a rea de
cada retngulo depende apenas da sua altura enquanto que no caso de dados
agrupados em classes de dimenses diferentes, como mostra a Figura 9 (b), a
rea de cada coluna j no mais proporcional sua altura.

51
Conceitos Fundamentais

52
Conceitos Fundamentais

Polgono de frequncia
um grfico de linha cuja construo feita unindo-se os pontos de
coordenadas de abscissas correspondentes aos pontos mdios de cada classe
e as ordenadas, s frequncias absolutas ou relativas dessas mesmas
classes.

O polgono de frequncia um grfico que deve ser fechado no eixo das


abscissas. Ento, para finalizar sua elaborao, deve-se acrescentar
distribuio, uma classe esquerda e outra direita, ambas com freqncias
zero. Tal procedimento permite que a rea sob a linha de frequncias seja igual
rea do histograma.

Uma das vantagens da aplicao de polgonos de frequncias que, por


serem grficos de linhas, permitem a comparao entre dois ou mais conjuntos
de dados atravs da sobre-posio dos mesmos.

53
Conceitos Fundamentais

54
Conceitos Fundamentais

Grfico da frequncia acumulada ou Ogiva


um grfico que permite descrever dados quantitativos por meio da frequncia
acumulada.
A ogiva um grfico de linha que une os pontos cujas abscissas so os limites
superiores das classes, e, ordenadas as suas respectivas frequncias
acumuladas. Convm observar-se que o ponto inicial desse grfico o limite
inferior do primeiro intervalo, com frequncia acumulada zero, pois no existe
qualquer valor inferior a este.
Quando os dados contidos em cada classe so distribudos uniformemente,
pode-se estimar, a partir da ogiva, o nmero de elementos pertencentes a
qualquer uma das classes que compe a distribuio de frequncia dos dados
e a quantidade ou percentagem de elementos que esto abaixo de certo valor
pertencente ao conjunto de dados.
Pela Figura 11, nota-se que no existem alunos com idade inferior a 18 anos
enquanto que abaixo de 34 anos existem vinte alunos.

55
Conceitos Fundamentais

56
Conceitos Fundamentais

MEDIDAS DESCRITIVAS
Uma outra maneira de se resumir os dados de uma varivel
quantitativa, alm de tabelas e grficos, apresent-los na forma de
valores numricos, denominados medidas descritivas. Estas medidas,
se calculadas a partir de dados populacionais, so denominadas
parmetros e se calculadas a partir de dados amostrais so
denominadas estimadores ou estatsticas.
As medidas descritivas auxiliam a anlise do comportamento dos
dados. Tais dados so provenientes de uma populao ou de uma
amostra, o que exige uma notao especfica para cada caso, conforme
mostra o Quadro 01.

57
Conceitos Fundamentais

Classificam-se as medidas descritivas como: medidas posio (tendncia


central e separatrizes), medidas de disperso, de assimetria e de curtose.

MEDIDAS DE TENDNCIA CENTRAL


As medidas de tendncia central so assim denominadas por indicarem um
ponto em torno do qual se concentram os dados. Este ponto tende a ser o
centro da distribuio dos dados. Reis (1998), afirma que:
o valor a escolher depende das caractersticas dos dados. Por exemplo, num
estudo agrcola sobre a produo de trigo por hectare de terra arvel podemos
estar interessados em conhecer o valor mais elevado da produtividade do solo
agrcola das vrias exploraes analisadas. Num outro estudo sobre os
resultados de uma turma de estudantes universitrios talvez seja mais
interessante conhecer o resultado mdio obtido por 50% dos estudantes. Num
outro estudo sobre os rendimentos per capita dos pases da CEE, a
comparao entre pases ser facilitada se calcularmos os rendimentos
mdios de cada pas.
58
Medidas de Localizao

59
Medidas de Localizao

60
Medidas de Localizao

61
Medidas de Localizao

62
Medidas de Localizao

63
Medidas de Localizao

64
Medidas de Localizao

65
Medidas de Localizao

66
Medidas de Localizao

67
Medidas de Localizao

68
Estatstica Descritiva - Exemplos

Mdia aritmtica
A mdia aritmtica (X) a soma de todos os valores observados da
varivel dividida pelo nmero total de observaes.

Sob uma viso geomtrica a mdia de uma distribuio o centro de


gravidade, representa o ponto de equilbrio de um conjunto de dados.
a medida de tendncia central mais utilizada para representar a
massa de dados.

Seja (x1, ..., xn) um conjunto de dados. A mdia dada por:

69
Estatstica Descritiva - Exemplos

para dados populacionais ou amostrais, respectivamente. Caso os


dados estejam apresentados segundo uma distribuio de frequncia,
tem-se:

Observe que no caso de dados agrupados a mdia obtida a partir de


uma ponderao, onde os pesos so as frequncias absolutas de cada
classe e xi o ponto mdio da classe i.
Citam-se a seguir, algumas propriedades da mdia aritmtica:
1. a mdia um valor calculado facilmente e depende de todas as
observaes;
2. nica num conjunto de dados e nem sempre tem existncia real, ou
seja, nem sempre igual a um determinado valor observado;

70
Estatstica Descritiva - Exemplos

3. a mdia afectada por valores extremos observados;


4. por depender de todos os valores observados, qualquer
modificao nos dados far com que a mdia fique alterada. Isto
quer dizer que somando-se, subtraindo-se, multiplicando-se ou
dividindo-se uma constante a cada valor observado, a mdia ficar
acrescida, diminuda, multiplicada ou dividida desse valor.
5. a soma da diferena de cada valor observado em relao mdia
zero, ou seja, a soma dos desvios zero.

A propriedade 5, de extrema importncia para a definio de


varincia, uma medida de disperso a ser definida posteriormente.

71
Estatstica Descritiva - Exemplos

Destaca-se, ainda, que a propriedade 3, quando se observam no


conjunto dados discrepantes, faz da mdia uma medida no
apropriada para representar os dados.
Neste caso, no existe uma regra prctica para a escolha de uma
outra medida. O ideal , a partir da experincia do pesquisador,
decidir pela moda ou mediana. Para ilustrar, considere o nmero de
filhos, por famlia, para um grupo de 8 famlias: 0, 1, 1, 2, 2, 2, 3, 4.
Neste caso, a mdia x =1,875 filhos por famlia.
Entretanto, incluindo ao grupo uma nova famlia com 10 filhos, a
mdia passa a ser x = 2,788, o que eleva em 48,16% o nmero
mdio de filhos por famlia.
Assim, ao observar a mdia, pode-se pensar que a maior parte das
famlias deste grupo tem trs filhos quando, na verdade, apenas uma
tem trs filhos.

72
Estatstica Descritiva - Exemplos

73
Estatstica Descritiva - Exemplos

Exemplo 09: Considerando a idade dos alunos da disciplina Inferncia


Estatstica do curso de Estatstica da Universidade Estadual de Maring,
a idade mdia

Assim, a idade mdia dos alunos da disciplina Inferncia Estatstica do


curso de Estatstica da Universidade Estadual de Maring 23,5 anos.
No entanto, ao considerar os dados agrupados como na Tabela 10, a mdia
:

Nota-se que esta diferena ocorre devido ao fato de se utilizar os dados


sem o conhecimento de seus valores individuais. Neste caso, tornou-se
necessrio represent-los pelos pontos mdios das suas respectivas
classes resultando numa certa perda de informao.
74
Estatstica Descritiva - Exemplos

Moda
A moda (Mo) o valor que apresenta a maior frequncia da varivel entre
os valores observados. Para o caso de valores individuais, a moda pode ser
determinada imediatamente observando-se o rol ou a frequncia absoluta
dos dados. Por outro lado, tratando-se de uma distribuio de frequncia de
valores agrupados em classes, numa primeira fase, necessrio identificar
a classe modal, aquela que apresenta a maior frequncia, e a seguir a
moda calculada aplicando-se a frmula:

i a ordem da classe modal;


li o limite inferior da classe modal;
h a amplitude da classe modal;
Fi a frequncia absoluta da classe modal;
Fi1 a frequncia absoluta da classe anterior classe modal;
Fi+1 a frequncia absoluta da classe posterior classe modal.
75
Estatstica Descritiva - Exemplos

relevante salientar, que um conjunto de dados pode apresentar todos seus


elementos com a mesma frequncia absoluta, e neste caso, no existir um
valor modal, o que significa que a distribuio ser classificada como amodal.

Pode ocorrer, tambm, casos em que a sequncia de observaes apresente


vrios elementos com frequncia igual, implicando uma distribuio plurimodal.

O uso da moda mais indicado quando se deseja obter, rapidamente, uma


medida de tendncia central.
Um outro aspecto que favorece a utilizao da moda que seu valor no
afectado pelos valores extremos do conjunto de dados analisado.

76
Estatstica Descritiva - Exemplos

Exemplo 10: A moda da idade dos alunos da disciplina Inferncia


Estatstica do curso de Estatstica da UEM, determinada pontualmente,
Mo= 20 anos. Isto significa que a idade mais frequente entre estes
alunos de 20 anos.
Ao considerar a distribuio apresentada na Tabela 10, a moda

A interpretao anloga determinada pontualmente.

77
Estatstica Descritiva - Exemplos

Mediana
A mediana (Md) o valor que ocupa a posio central da srie de
observaes de uma varivel, em rol, dividindo o conjunto em duas
partes iguais, ou seja, a quantidade de valores inferiores mediana
igual quantidade de valores superiores mesma.

Exemplo 11: Retomando o exemplo do nmero de filhos por famlias,


verifica-se que:
Para o caso de oito famlias, n=8, a mediana determinada como a se
segue:

78
Estatstica Descritiva - Exemplos

Quando se acrescenta ao grupo uma outra famlia com 10 filhos o


tamanho da amostra passa a ser n=9. Neste caso, a mediana :

Observe que nos dois casos, por coincidncia, a mediana manteve-se


a mesma, Md=2, significando que 50% das famlias possuem menos
de 2 filhos ou 50% possuem mais de 2 filhos.
Mostra-se assim, que a mediana no influenciada por valores
extremos.
Este procedimento pode tornar-se inadequado quando o conjunto de
dados for composto por muitos elementos. Os passos a seguir indicam
uma forma para o clculo da mediana, independentemente do tamanho
da amostra.

79
Estatstica Descritiva - Exemplos

Ordenar as observaes em ordem crescente ou decrescente (rol).


Calcular a posio, p, que a mediana ocupa no conjunto de dados:

Obter a mediana pela equao

onde Ip a parte inteira de p e Fp a parte fracionria (ou


decimal).

Exemplo 12: Considere o rol da idade dos alunos da disciplina


Inferncia Estatstica do curso de Estatstica da UEM:
18, 18, 19, 20, 20, 20, 20, 20, 20, 21, 21, 22, 23, 24, 25, 25, 25, 26,
29, 30, 35, 37

80
Estatstica Descritiva - Exemplos

A posio p da mediana

Assim,

logo, 50% dos alunos tm idade inferior a 21,5 anos.

Para os dados em distribuio de frequncias em classes, tem-se:

onde: indica a posio central da srie;

i a ordem da classe que contm o menor valor de Fai , tal que

a frequncia acumulada da classe anterior da mediana.

81
Estatstica Descritiva - Exemplos

Exemplo 13: Ao considerar a distribuio apresentada na Tabela 10,


a mediana

A idade mediana 22 anos, ou seja, 50% dos alunos que cursam a


disciplina Inferncia Estatstica do curso de Estatstica da UEM tm
idade inferior ou igual a 22 anos.

82
Estatstica Descritiva - Exemplos

83
Estatstica Descritiva - Exemplos

MEDIDAS SEPARATRIZES
Estas medidas so valores que ocupam posies no conjunto de dados,
em rol, dividindo-o em partes iguais e podem ser:

Quartil: Os quartis dividem o conjunto de dados em quatro partes


iguais.

84
Estatstica Descritiva - Exemplos

Decil: Os decis dividem o conjunto de dados em dez partes iguais.

85
Estatstica Descritiva - Exemplos

Percentil: Os percentis dividem o conjunto de dados em cem partes


iguais. A seguir so apresentados alguns dos percentis mais usados:

86
Estatstica Descritiva - Exemplos

Para os dados em rol, o clculo das medidas separatrizes a


mesma que a da mediana, a saber:

onde Ip a parte inteira de p e Fp a parte fracionria (ou decimal).


Para os dados em distribuio de frequncias em classes, o
clculo das medidas separatrizes a mesma que a da mediana, a
saber:

87
Estatstica Descritiva - Exemplos

88
Estatstica Descritiva - Exemplos

Exemplo 14: Considerando o rol do exemplo 12, o terceiro quartil e o


quadragsimo percentil so: Terceiro quartil: p = 0,75(22 +1) =17,25 e

Assim, pode-se afirmar que 75% dos alunos que frequentam a


disciplina Inferncia Estatstica do curso de Estatstica da UEM, tm
idade inferior ou igual a 25,25 anos.
Quadragsimo percentil: p = 0,40(22 +1) = 9,2 e

Logo, 40% dos alunos que frequentam a disciplina Inferncia


Estatstica do curso de Estatstica da UEM, tm idade inferior ou
igual a 20,2 anos.
89
Estatstica Descritiva - Exemplos

90
Estatstica Descritiva - Exemplos

Conclui-se, que 25% dos alunos que frequentam a disciplina


Inferncia Estatstica do curso de Estatstica da UEM tm idade
inferior ou igual a 20 anos, 75% tm idade inferior a 25,67, 70% tm
idade inferior a 22,8 e 90% tm idade inferior a 33,2 anos.

91
Estatstica Descritiva - Exemplos

MEDIDAS DE DISPERSO
De acordo com Toledo (1985), fenmenos que envolvem anlises estatsticas
caracterizam-se pelas suas semelhanas e variabilidades. As medidas de
disperso auxiliam as medidas de tendncia central a descrever o conjunto de
dados adequadamente. Indicam se os dados esto, ou no, prximos uns dos
outros.
Desta forma, no h sentido calcular a mdia de um conjunto onde no h
variao dos seus elementos.
Existe ausncia de disperso e a medida de disperso igual a zero.
Por outro lado, aumentando-se a disperso, o valor da medida aumenta e se a
variao for muito grande, a mdia no ser uma medida de tendncia central
representativa.

Torna-se necessrio uma medida de tendncia central e uma medida de


disperso para descrever um conjunto de dados.

92
Estatstica Descritiva - Exemplos

MEDIDAS DE DISPERSO
As quatro medidas de disperso que sero definidas a seguir so:

amplitude total,

amplitude interquartlica,

desvio padro e varincia.

Com excepo da primeira, todas tm como ponto de referncia a mdia.

93
Estatstica Descritiva - Exemplos

Amplitude Total
A amplitude total de um conjunto de dados a diferena entre o
maior e o menor valor observado. A medida de disperso no levar
em considerao os valores intermedirios perdendo a informao
de como os dados esto distribudos e/ou concentrados.

Exemplo 16: A amplitude total da idade dos alunos que frequentam


a disciplina Inferncia Estatstica do curso de Estatstica da UEM

isto , as idades dos alunos diferem em 19 anos.

94
Estatstica Descritiva - Exemplos

Amplitude Interquartlica
A amplitude interquartlica a diferena entre o terceiro e o primeiro
quartil. Esta medida mais estvel que a amplitude total por no
considerar os valores mais extremos. Esta medida abrange 50% dos
dados e til para detectar valores discrepantes.

Por outro lado, a amplitude semi-interquartlica definida como a


mdia aritmtica da diferena entre a mediana e os quartis:

95
Estatstica Descritiva - Exemplos

Exemplo 17: A amplitude interquartlica da idade dos alunos que frequentam a


disciplina Inferncia Estatstica do curso de Estatstica da UEM considerando-
se a Tabela 10 :
dq = 25,67 20 = 5,67 anos
A amplitude entre o terceiro e primeiro quartil, que envolve 50% (centrais) dos
alunos, de 5,67 anos.

Exemplo 18: Do exemplo 17, obtm-se a amplitude semi-interquartlica da


idade dos alunos que frequentam a disciplina Inferncia Estatstica do curso de
Estatstica da UEM:
dqm=2,84 anos.
Observa-se que a distncia entre a mediana e o quartil 1 (22-20) 2. Como 2
< 2,84, isto indica que h uma concentrao de dados esquerda da
mediana., e que os dados localizados direita da mediana so mais dispersos.

96
Estatstica Descritiva - Exemplos

Desvio-mdio
A diferena entre cada valor observado e a mdia denominado desvio e
dado por (xi ) se o conjunto de dados populacional, ou por (xi x)
se os dados so amostrais.
Ao somar todos os desvios, ou seja, ao somar todas as diferenas de
cada valor observado em relao a mdia, o resultado igual a zero
(propriedade 5 da mdia). Isto significa que esta medida no mede a
variabilidade dos dados. Para resolver este problema, pode-se
desconsiderar o sinal da diferena, considerando-as em mdulo e a
mdia destas diferenas em mdulo denominada desvio mdio:

97
Estatstica Descritiva - Exemplos

para dados populacionais ou amostrais, respectivamente. Caso os dados


estejam apresentados segundo uma distribuio de frequncia, tem-se:

98
Estatstica Descritiva - Exemplos

Varincia e desvio padro


Enquanto no h nada conceptualmente errado em se considerar o
desvio mdio, segundo Pagano (2004), esta medida no tem certas
propriedades importantes e no muito utilizada. O mais comum
considerar o quadrado dos desvios em relao mdia e ento
calcular a mdia.

Obtm-se, assim a varincia que definida por:

99
Estatstica Descritiva - Exemplos

se os dados so populacionais ou amostrais, respectivamente. Caso


os dados estejam apresentados segundo uma distribuio de
freqncia, tem-se:

Entretanto, ao calcular a varincia observa-se que o resultado ser


dado em unidades quadrticas, o que dificulta a sua interpretao.
O problema resolvido extraindo-se a raiz quadrada da varincia,
definindo-se, assim, o desvio padro:

100
Estatstica Descritiva - Exemplos

se os dados so populacionais ou amostrais e, se estiverem em


distribuio de frequncias:

importante destacar que se duas populaes apresentam a


mesma mdia, mas os desvios padro no so iguais, isto no
significa que as populaes tm o mesmo comportamento.

101
Estatstica Descritiva - Exemplos

Exemplo 19: Considere trs alunos cujas notas em uma disciplina esto
apresentadas na Tabela 13.

Observa-se que as mdias das notas dos trs alunos so iguais, porm, seus
desvios em torno da mdia so diferentes. Isto quer dizer que seus
desempenhos so diferentes.
O aluno A constante em seu desempenho, o segundo vai progredindo aos
poucos e o terceiro diminui abruptamente seu desempenho.

Em outras palavras, apesar dos trs alunos terem o mesmo desempenho


mdio, a variabilidade difere.

102
Estatstica Descritiva - Exemplos

103
Estatstica Descritiva - Exemplos

Como demonstrado no exemplo, geralmente, o desvio padro


maior ou igual ao desvio mdio, e isto devido ao facto de que para o
clculo do desvio-padro cada desvio em torno da mdia elevado
ao quadrado, aumentando desproporcionalmente o peso dos
valores extremos.

Exemplo 20: Retomando a idade dos alunos apresentada na Tabela


10, temos:

104
Estatstica Descritiva - Exemplos

Coeficiente de Variao
O coeficiente de variao uma medida de disperso relativa
definida como a razo entre o desvio padro e a mdia:

se os dados so populacionais ou amostrais.

A partir do coeficiente de variao pode-se avaliar a homogeneidade


do conjunto de dados e, consequentemente, se a mdia uma boa
medida para representar estes dados. utilizado, tambm, para
comparar conjuntos com unidades de medidas distintas.
Uma desvantagem do coeficiente de variao que ele deixa de ser
til quando a mdia est prxima de zero. Uma mdia muito prxima
de zero pode inflacionar o CV.
105
Estatstica Descritiva - Exemplos

Um coeficiente de variao superior a 50% sugere alta disperso o


que indica heterogeneidade dos dados. Quanto maior for este valor,
menos representativa ser a mdia. Neste caso, opta-se pela
mediana ou moda, no existindo uma regra prtica para a escolha de
uma destas medidas. O pesquisador, com sua experincia, que
dever decidir por uma ou outra. Por outro lado, quanto mais prximo
de zero, mais homogneo o conjunto de dados e mais
representativa ser a sua mdia.
Exemplo 21: Para idades apresentadas na Tabela 10, temos:

Como CV<50%, pode-se afirmar que a mdia uma medida


descritiva representativa para a varivel idade dos alunos da
disciplina Inferncia Estatstica do curso de Estatstica da
Universidade Estadual de Maring do ano de 2002.
106
Estatstica Descritiva - Exemplos

Medidas de Assimetria
A medida de assimetria um indicador da forma da distribuio dos
dados. Ao construir uma distribuio de freqncias e/ou um
histograma, est-se procurando, tambm, identificar visualmente, a
forma da distribuio dos dados que ou no confirmada pelo
coeficiente de assimetria de Pearson (As) definido como:

para dados populacionais e amostrais, respectivamente.

Uma distribuio classificada como:


simtrica se mdia = mediana = moda ou As = 0;

107
Estatstica Descritiva - Exemplos

assimtrica negativa se mdia mediana moda ou As < 0. O


lado mais longo do polgono de freqncia (cauda da distribuio)
est esquerda do centro.

assimtrica positiva se moda mediana mdia ou As > 0. O


lado mais longo do polgono de frequncia est direita do centro.

108
Estatstica Descritiva - Exemplos

Exemplo 22: A distribuio das idades apresentadas na Tabela


10 classificada como assimtrica positiva, pois:

109
Estatstica Descritiva - Exemplos

Medidas de Curtose
A medida de curtose o grau de achatamento da distribuio, um
indicador da forma desta distribuio. definido como:

A curtose ou achatamento mais uma medida com a finalidade de


complementar a caracterizao da disperso em uma distribuio. Esta
medida quantifica a concentrao ou disperso dos valores de um
conjunto de dados em relao s medidas de tendncia central numa
distribuio de frequncias.
Uma distribuio classificada quanto ao grau de achatamento como:
Leptocrtica: quando a distribuio apresenta uma curva de frequncia
bastante fechada, com os dados fortemente concentrados em torno do
seu centro, K < 0,263.
110
Estatstica Descritiva - Exemplos

Mesocrtica: quando os dados esto razoavelmente concentrados


em torno do seu centro, K= 0,263
Platicrtica: quando a distribuio apresenta uma curva de
frequncia mais aberta, com os dados fracamente concentrados em
torno do seu centro, K > 0,263.

111
Estatstica Descritiva - Exemplos

Exemplo 23: Em relao ao grau de achatamento, a distribuio das


idades apresentadas na Tabela 10 classificada como leptocrtica,
pois:

112
Estatstica Descritiva - Exemplos

BOX PLOT OU DESENHO ESQUEMTICO


O grfico Box Plot (ou desenho esquemtico) uma anlise grfica que utiliza
cinco medidas estatsticas: valor mnimo, valor mximo, mediana, primeiro e
terceiro quartil da varivel quantitativa. Este conjunto de medidas oferece a
idia da posio, disperso, assimetria, caudas e dados discrepantes. A
posio central dada pela mediana e a disperso pelo desvio interquartlico
dq= Q3 - Q2. As posies relativas de Q1 , Q2 e Q3 do uma noo da
assimetria da distribuio.
Os comprimentos das caudas so dados pelas linhas que vo do rectngulo
aos valores atpicos.
Segundo Triola (2004), um outlier ou ponto discrepante um valor que se
localiza distante de quase todos os outros pontos da distribuio. A distncia a
partir da qual considera-se um valor como discrepante aquela que supera
1,5dq. De maneira geral, so considerados outliers todos os valores inferiores
Li= Q1-1,5dq ou os superiores a Ls=Q3+1,5dq.

113
Estatstica Descritiva - Exemplos

Exemplo 24:A construo do grfico Box Plot pode ser


exemplificada tomando-se a varivel idade da Tabela 01.

A sua elaborao segue os seguintes passos:

Ordenar os dados em sequncia crescente.

114
Estatstica Descritiva - Exemplos

Determinar as cinco medidas.

115
Estatstica Descritiva - Exemplos

116
Estatstica Descritiva - Exemplos

Construir uma caixa (rectangular) estendendo-se de Q1 a Q3, e trace


uma linha na caixa no valor da mediana.

117
Estatstica Descritiva - Exemplos

Traar uma linha paralela recta, com uma das extremidades


alinhada ao limite inferior Li e a outra no centro do lado do
rectngulo correspondente ao primeiro quartil. Trace uma outra
linha paralela recta, com uma extremidade no centro do lado do
rectngulo correspondente ao terceiro quartil e a outra alinhada
com o limite mximo Ls .

118
Estatstica Descritiva - Exemplos

Identificar os pontos discrepantes

119
Estatstica Descritiva - Exemplos

No conjunto de dados no existe aluno com idade inferior a 11,375, ou seja,


no h aluno com idade considerada discrepante inferiormente. Entretanto,
existem dois indivduos cujas idades so superiores a 34,375, pontos estes
considerados discrepantes neste conjunto de dados: as idades 35 e 37. Estes
pontos so identificados no diagrama de caixas por meio de um asterisco na
direco das linhas traadas nos item v.
Note-se que no intervalo interquartlico (dentro do rectngulo) existem 50% dos
dados, dos quais, 25% esto entre a linha da mediana e a linha do primeiro
quartil e os outros 25% esto entre a linha da mediana e a linha do terceiro
quartil. Cada linha da cauda mais os valores discrepantes contm os 25%
restantes da distribuio. A Figura 17 mostra que a distribuio das idades dos
alunos apresenta assimetria positiva, ou seja, dispersam-se para os valores
maiores.
O grfico Box Plot pode ser utilizado para fazer comparaes entre vrias
distribuies. Essa comparao feita atravs de vrios desenhos
esquemticos numa mesma figura.
120
Estatstica Descritiva - Exemplos

Na Figura 18 apresentado o grfico para a varivel idade


classificada segundo o sexo do aluno. Nota-se que para o sexo
feminino, no valores discrepantes e a distribuio apresenta
assimetria positiva, com idade mediana inferior ao do sexo
masculino.

121
Distribuies de Probabilidade
Inferncia Estatstica

Prova de Bernoulli
Considere uma experincia aleatria na qual se observa a realizao
ou no realizao de determinado acontecimento A, de probabilidade
P(A) = p. A realizao de A diz-se sucesso; a realizao do
complementar A, que tem probabilidade P(A) = 1 - p = q, diz-se um
insucesso. A esta experincia damos o nome de prova de Bernoulli.
Se a varivel aleatria X designa o nmero de sucessos numa prova
de Bernoulli (ex: nmero de caras obtido no lanamento de uma
moeda; nmero de peas defeituosas de entre uma escolhida ao
acaso de um lote), apresenta a seguinte funo massa de
probabilidade:

da qual se diz apresentar uma distribuio Binomial.

122
Distribuies de Probabilidade
Inferncia Estatstica

Para se familiarizar com


esta distribuio, abra o
ficheiro Bernoulli.xls,
premindo uma das setas da
barra de deslocamento
cinzenta, faa variar o valor
da P(sucesso) e verifique a
alterao da distribuio de
frequncias.

123
Distribuies de Probabilidade
Inferncia Estatstica

Distribuio Binomial
Consideremos uma sucesso de n provas de Bernoulli. varivel
aleatria X, que representa o nmero de sucessos nas n provas (ex:
nmero de caras observadas em 20 lanamentos de uma moeda
equilibrada) chama-se varivel aleatria com distribuio Binomial de
parmetros n e p, e escreve-se simbolicamente X ~ b(n; p). Apresenta
a seguinte funo massa de probabilidade:

Sucesso de provas de Bernoulli: Sequncia


de experincias aleatrias em que em cada
prova o acontecimento de interesse sucesso
ou insucesso, a probabilidade de sucesso p
constante de prova para prova e os resultados
das provas so independentes uns dos outros.
124
Populao / Amostra

Populao x Amostra

Populao - conjunto dos elementos que se deseja


estudar

Amostra - subconjunto da populao.

125
Populao / Amostra

Pesquisa tipo levantamento

POPULAO
Conjunto de elementos com pelo menos uma caracterstica em comum
observvel.

Caracterstica X observvel: X1 X2 X3 ...

126
Populao / Amostra

Amostragem e Inferncia estatstica

O raciocnio indutivo da inferncia estatstica

127
Populao / Amostra

Pesquisa eleitoral

128
Populao / Amostra

Populao
Finita - Alunos do mestrado, funcionrios da Petrogal, eleitores, etc.
Infinita - Barris de petrleo produzidos por um poo, nascimentos em uma
cidade, produo de uma mquina, etc.

Populao e Amostra
Censo: Estudo atravs do exame de todos os elementos da populao.
Amostragem: Estudo por meio do exame de uma amostra.

129
Populao / Amostra

Por que fazer amostragem ao invs de censo?


Economia
Menor tempo
Maior qualidade nos dados levantados
Populao infinita.
Mais fcil, com resultados satisfatrios.

Quando fazer censo?


Populao pequena (tamanho da amostra grande em relao ao da
populao).
Quando se exige o resultado exato.
Quando j se dispe dos dados da populao.

130
Populao / Amostra

Tamanho da amostra (n) e tamanho da populao (N)

131
Populao / Amostra

Tamanho da amostra (n) e tamanho da populao (N)

IMPORTANTE: forma de seleo

132
Amostragem

Amostragem
A amostra deve ser representativa!

133
Amostragem

Tcnicas de Amostragem
Amostragem probabilstica (aleatria)
A probabilidade de um elemento da populao ser
escolhido conhecida.

Amostragem no probabilstica (no aleatria)


No se conhece a probabilidade de um elemento da
populao ser escolhido para participar da amostra.

134
Amostragem

Amostragem Probabilstica
Amostragem aleatria simples
Amostragem sistemtica
Amostragem estratificada

135
Amostragem

Amostragem Aleatria Simples


Faz-se uma lista da populao e sorteiam-se os elementos que faro parte
da amostra.
Pode-se utilizar uma tabela de nmeros aleatrios.
Cada subconjunto da populao com o mesmo n de elementos tem a
mesma chance de ser includo na amostra.

136
Amostragem

Amostragem Sistemtica
Os elementos da populao apresentam-se ordenados e so retirados
periodicamente (de cada k elementos, um escolhido)

Vantagem: facilidade
Problema: possibilidade de haver ciclos de variao

137
Amostragem

Amostragem Estratificada
Usada quando a populao divide-se em subpopulaes (estratos)
razoavelmente homogneos.
A amostragem estratificada consiste em se especificar quantos itens da
amostra sero retirados de cada estrato.
A seleo em cada estrato deve ser aleatria

Ilustrao de uma amostragem estratificada proporcional.


138
Amostragem

Amostragem Estratificada
Exemplos
Populao em homens e mulheres ou em faixas etrias;
Pesquisas eleitorais
regio;

cidades pequenas e grandes;


urbano e rural.
sexo;
faixa etria;
faixa de renda;

139
Amostragem

Tamanho de Amostra
Parmetro: caracterstica da populao.
Estatstica: caracterstica descritiva de elementos de uma amostra.
Estimativa: valor acusado por uma estatstica que estima o valor de um
parmetro populacional.
ERRO AMOSTRAL: diferena entre o valor que a estatstica pode acusar e o
verdadeiro valor do parmetro que se deseja estimar.
ERRO AMOSTRAL TOLERVEL: quanto um pesquisador admite errar na
avaliao dos parmetros de interesse numa populao.
Exemplo, o resultado de uma pesquisa eleitoral:
Candidato A = 20%, com 2% de erro amostral (18% - 22%)

140
Amostragem

Frmula para clculo do tamanho da amostra

141
Amostragem

Exemplo clculo do tamanho da amostra


N = 200 famlias
E0 = erro amostral tolervel = 4% (E0 = 0,04)
n0 = 1/(0,04)2 = 625 famlias
n (tamanho amostra corrigido) = 200x625/200+625 = 125000/825 = 152 famlias

E se a populao fosse de 200.000 famlias?


n = (200.000)x625/(200.000 +625) = 623 famlias

Observe=se que se N muito grande, no necessrio considerar o tamanho


exato N da populao. Nesse caso, o clculo da primeira aproximao j
suficiente para o clculo.

142
Amostragem

Tamanho da amostra ...


Observe que: N = 200 famlias, E0 = 4%
n = 152 famlias 76% da populao
Observe que: N = 200.000 famlias, E0 = 4%
n = 623 famlias 0,3% da populao

Logo, errneo pensar n que o tamanho da amostra deve ser tomado como um
percentual do tamanho da populao para ser representativa

143
Amostragem

Exerccios Tamanho da amostra ...


Numa pesquisa para uma eleio presidencial, qual deve ser o tamanho de uma
amostra aleatria simples, se se deseja garantir um erro amostral no superior a
2% ?
n = n0 = 1/(0,02)2 = 1/0,0004 = 2500 eleitores

Numa empresa com 1000 funcionrios, deseja-se estimar a percentagem dos


favorveis a certo treinamento. Qual deve ser o tamanho da amostra aleatria
simples que garanta um erro amostral no superior a 5%?
N = 1000 empregados
E0 = erro amostral tolervel = 5% (E0 = 0,05)
n0 = 1/(0,05)2 = 400 empregados
n = 1000x400/(1000+400) = 286 empregados

144
Mtodos Quantitativos
Regresso Simples

A REGRESSO SIMPLES
A regresso uma tcnica que envolve a anlise de dados amostrais para obter
informaes se duas ou mais variveis so relacionadas e qual a natureza desse
relacionamento. utilizada principalmente com o propsito de previso.
Consiste em determinar uma funo matemtica que visa descrever o comportamento
de determinada varivel dependente, com base nos valores de uma ou mais variveis
independentes. Assim, procura-se identificar a equao da reta que melhor se ajusta aos
dados observados.

De modo geral, no modelo de regresso linear simples, a relao entre duas variveis, X
e Y, pode ser satisfatoriamente definida pela equao:
Y = + . X, sendo
Y = varivel dependente;
X = varivel independente ou explicativa;
= coeficiente linear ou intercepto da reta; e
= coeficiente angular ou declividade da reta.

145
Mtodos Quantitativos
Regresso Simples

A REGRESSO SIMPLES

No trabalho desenvolvido a partir de uma amostra da populao, iremos obter a


equao:
Y = a + b . X + U, sendo
Y = varivel dependente;
X = varivel independente ou explicativa;
A = estimativa de ;
B = estimativa de ; e
U = erro aleatrio na populao.

(u) o resduo; diferena entre o estimado (ponto na reta de regresso) e o observado.


Pode ser interpretado como a soma de duas componentes: erro de mensurao de Y e a
variabilidade inerente ou variao independente, incontrolvel de outros fatores.

146
Mtodos Quantitativos
Regresso Simples

REGRESSO SIMPLES
Um exemplo clssico de estudo de regresso tem como varivel independente a
utilizao de fertilizantes e como varivel dependente a produtividade do solo (safra do
trigo).
O mtodo dos mnimos quadrados o mtodo mais utilizado para a estimativa dos
coeficientes de regresso.

Depois de calculados os coeficientes, deve-se sempre investigar a validade e a


significncia estatstica dos resultados. Isso porque em geral existem inmeras outras
variveis externas no consideradas no modelo (que uma simplificao da realidade) e
que influenciam o comportamento de Y.
Assim, sempre preciso verificar se o modelo linear obtido realmente significativo.
Para tanto, devem ser estabelecidos intervalos de confiana e efetuados testes de
hipteses.
Uma observao relevante a de que, para efetuar predies no se deve utilizar
valores da varivel independente x que extrapolem o intervalo de valores utilizados no
modelo de regresso.

147
Mtodos Quantitativos
Regresso Mltipla

REGRESSO MLTIPLA
A Regresso Mltipla uma extenso do modelo de Regresso Linear para n variveis
independentes. a tcnica adequada quando desejamos pesquisar o efeito simultneo
de vrios fatores sobre Y, a varivel dependente. A regresso mltipla reduz a
tendenciosidade que se verificaria no caso de uma regresso simples que no levasse
em conta fatores importantes.
Assim, considera-se, a princpio, a existncia de uma relao linear entre cada uma das
variveis explicativas e a varivel dependente.

O Modelo de Regresso Linear Mltipla para k variveis expresso pela seguinte


equao:

Yi = 1 + 1X1 + 2X2 + ... + kXk


Onde: = intercepto de Y;
i = coeficientes angulares.

148
Mtodos Quantitativos
Regresso Mltipla

REGRESSO MLTIPLA

No trabalho desenvolvido a partir de uma amostra da populao, iremos obter a


equao:
Yi = A1 + B1X1 + B2X2 + ... + BkXk + U
Onde:
A = estimativas de ;
Bi = estimativas de i;
U = erro aleatrio em Y para a observao i.

Assim, pode-se interpretar o coeficiente Bi como o efeito marginal de Xi sobre Y.

No exemplo citado, a segunda varivel independente cuja influncia seria investigada


sobre a produtividade do solo poderia ser o ndice pluviomtrico.

149
Mtodos Quantitativos
Regresso No-Linear

REGRESSO NO-LINEAR
Nesse caso, a varivel independente assume formas mais complexas, tais como:

Agora, o efeito marginal de X no apenas o coeficiente .

Mediante transformaes, busca-se chegar a uma equao linear, devendo ser


verificado se as hipteses do modelo de regresso linear so satisfeitas. Como exemplo,
a equao y = a.xb , pode ser linearizada para:
ln y = ln a + b.ln x

Contudo, deve se tomar cuidado porque nesse caso o clculo do coeficiente a estar
expresso em logaritmo, devendo calcular-se o antilogaritmo. Outro cuidado garantir
que as hipteses do modelo de regresso linear sejam verificadas.

150
Mtodos Quantitativos
Variveis Dummies

VARIVEIS DUMMIES
As variveis dummies so variveis qualitativas artificiais, introduzidas no modelo, com
valores binrios, para levar em considerao fenmenos como: alteraes na poltica
econmica, greves etc. As variveis qualitativas assinalam a presena ou ausncia de
um atributo ou evento, assumindo os valores 0 ou 1, sendo 0 o cenrio de referncia.

Um exemplo clssico a introduo, no modelo que associa renda nacional e consumo,


de uma varivel dummy para incorporar as variaes relativas a perodos de guerra,
como 1939-1945.

Assim, D = 1, se (t = 1339 ... 1945) e D = 0 , em caso contrrio.

Toda varivel dummy pode ser incorporada ao modelo sob 3 formas: aditiva,
multiplicativa e mista.

151
Mtodos Quantitativos
Variveis Dummies

VARIVEIS DUMMIES
Aditiva: Se o evento ocorrer, a alterao ocorrer somente no intercepto, modificando a.
Multiplicativa: Se o evento ocorrer, a alterao afetar somente a sua declividade,
modificando b.
Mista: Nesse caso, ocorrendo o evento, a alterao afetar os valores de a e b.

No exemplo mencionado, a equao ficaria:


Yi = 1 + 1 X1 + 2D

Quando D = 0, a equao retoma sua forma original, pois no h variao a ser


considerada.

Verifica-se que a incluso de D cria um deslocamento na linha da regresso para algumas


observaes como resultado de algum fator qualitativo. O efeito grfico de linhas
paralelas, sendo que a que representa D = 1 b unidades maior que a que representa D =
0.
Pode-se utilizar mais de uma varivel dummy. 152
UTILIZAO DO EXCEL EM
ESTATISTICA

153
Distribuies de Probabilidade
Inferncia Estatstica

Para calcular os valores da funo de


probabilidade, ou da funo de
distribuio - P(X< = x) = F(X),
podemos recorrer directamente s
funes do Excel
Desloque o apontador para uma clula
sua escolha, no menu
Inserir [Insert], seleccione Funo
[Function] e proceda conforme
indicado nas imagens.

154
Distribuies de Probabilidade
Inferncia Estatstica

Alternativamente, poder digitar directamente o comando


DISTRBINOM [BINOMDIST] em qualquer clula.
DISTRBINOM(nmero de sucessos-x;nmero de provas-n;
probabilidade de sucesso-p;0 ou 1)
0 ou Falso fornece o valor da funo de probabilidade.
1 ou Verdadeiro fornece o valor da funo de distribuio.

155
Distribuies de Probabilidade
Inferncia Estatstica

O ficheiro Binomial.xls permite visualizar a funo de probabilidade


da distribuio Binomial, at 20 provas, fazendo variar o valor da
probabilidade de sucesso. Para o efeito basta premir uma das
setas das correspondentes barras de deslocamento.

156
Distribuies de Probabilidade
Inferncia Estatstica

O ficheiro Binomial negativa.xls permite visualizar a funo de


probabilidade da distribuio Binomial negativa, at 10 sucessos,
fazendo variar o valor da probabilidade de sucesso. Para o efeito
basta premir uma das setas das barras de deslocamento.

157
Distribuies de Probabilidade
Inferncia Estatstica

Distribuio Normal
Nos exemplos anteriores consideramos que a varivel aleatria (v.
a.) era discreta, isto , s podia assumir um nmero finito ou infinito
numervel de valores distintos. No entanto, quando na Estatstica se
classificaram as variveis, viu-se que estas tambm podiam ser de
tipo contnuo.
A distribuio Normal uma das mais importantes, seno a mais
importante distribuio contnua. Uma varivel aleatria X, com
funo densidade de probabilidade (f.d.p.):

diz-se que tem distribuio Normal, com parmetros m e s (ou s2) e


escreve-se simbolicamente X~N(m,s2), sendo que m e s2
representam respectivamente o valor mdio e a varincia da varivel.
158
Distribuies de Probabilidade
Inferncia Estatstica

Abra o ficheiro 3 Normais.xls. Observe a forma caracterstica (forma


de sino) da curva da funo de densidade de probabilidade e,
alterando os valores nas clulas a azul, veja como o valor mdio e o
desvio padro afectam a forma da curva.

159
Distribuies de Probabilidade
Inferncia Estatstica

O Excel apresenta vrias funes relacionadas com a distribuio


normal.
Qualquer das funes poder ser acedida atravs do menu Inserir
[Insert] seleccionando Funo [Function] (tal como foi descrito
para as distribuies anteriores).

160
Distribuies de Probabilidade
Inferncia Estatstica

Clculo da funo densidade de probabilidade


Para calcular os valores da funo densidade de
probabilidade - f(x)- ou da funo de distribuio
P(X<=x) - (esta ltima de maior utilidade)

161
Distribuies de Probabilidade
Inferncia Estatstica

Alternativamente digitando directamente os comandos:


DIST.NORM [NORMDIST].
DIST.NORM(valor da varivel aleatria x;valor mdio-m;desvio
padro-s;0 ou 1)
0 ou Falso fornece o valor da funo densidade de probabilidade.
1 ou Verdadeiro fornece o valor da funo de distribuio.

162
Distribuies de Probabilidade
Inferncia Estatstica

Clculo do valor da v. a. X com uma dada probabilidade


Para calcular o valor da varivel aleatria X que apresenta uma
dada probabilidade de ocorrerem valores iguais ou inferiores (ou,
de forma complementar, de ocorrerem valores superiores).

163
Distribuies de Probabilidade
Inferncia Estatstica

Alternativamente digitando directamente os comandos:


INV.NORM [NORMINV].
INV.NORM(valor da probabilidade-P(X<=x);valor mdio-m;desvio
padro-s)
Recorrendo funo descrita, poder completar a seguinte tabela

164
Distribuies de Probabilidade
Inferncia Estatstica

Estandardizao ou normalizao da v. a. X
Se a varivel aleatria X for Normal de parmetros m e
s2, comum proceder sua estandardizao, ou
normalizao. Normaliza-se o valor x, subtraindo-lhe o
seu valor mdio e dividindo a diferena pelo valor do
desvio padro, obtendo-se uma varivel aleatria
estandardizada ou normalizada Z~N(0,1) (z = (x-m)/s).
Os valores normalizados do uma indicao de quantos
desvios padro o valor se afasta do valor mdio.

165
Distribuies de Probabilidade
Inferncia Estatstica

Alternativamente digitando directamente os comandos:


NORMALIZAR [STANDARDIZE].
NORMALIZAR (valor da varivel aleatria x;valor mdio-m;desvio
padro-s)

166
Distribuies de Probabilidade
Inferncia Estatstica
Z

Clculo da f.d.p. da varivel aleatria normalizada Z


Se pretender calcular o valor da funo de distribuio da varivel
aleatria normalizada Z.

Alternativamente digitando directamente os


comandos:
DIST.NORMP [NORMSDIST].
DIST.NORMP(valor da varivel aleatria
normalizada z)

167
Distribuies de Probabilidade
Inferncia Estatstica

Clculo do valor da v. a. Z com uma dada probabilidade


Para calcular o valor da varivel aleatria normalizada Z que apresenta
uma dada probabilidade de ocorrerem valores iguais ou inferiores (ou,
de forma complementar, de ocorrerem valores superiores).

Alternativamente digitando directamente os


comandos:
INV.NORMP [NORMSINV]
INV.NORMP (valor da probabilidade- P(Z<=z))

168
Distribuies de Probabilidade
Inferncia Estatstica

Novos aplicativos para a Normal


Para partir aventura da distribuio normal, abra o ficheiro Normal.xls, onde
poder encontrar duas folhas de clculo:
Probabilidade de um intervalo e,
rea inferior e valor z.

Ambas as folhas permitem a introduo do valor mdio e do desvio padro,


digitando directamente nas clulas indicadas.

169
Distribuies de Probabilidade
Inferncia Estatstica

Na primeira folha, poder clicar nas setas das barras de deslocamento,


fazendo alterar os valores dos limites superior e inferior da varivel
aleatria. Ao faz-lo, altera-se a rea a sombreado, e o seu valor
aparece representado numa das clulas (valor correspondente
P(xinferior = X = xsuperior)).

170
Distribuies de Probabilidade
Inferncia Estatstica

Na segunda folha poder clicar nas setas da barra de deslocamento, o


qual far deslocar a rea sombreada, para a esquerda e para a direita,
respectivamente. indicado o valor da rea sombreada (valor
correspondente P(X = x)), bem como o valor normalizado de x o
valor z.

171
APLICAES PRTICAS

172
Aplicaes Prcticas

INTRODUO
Pretende-se avaliar a percepo da populao relativamente s
condies de vida antes e aps o 25-04-74.
12 perguntas relativas a condies que consideramos importantes para
a avaliao das condies de vida antes e aps o 25-04-74.
Por cada questo, demos a escolher as seguintes
opes: Melhor, Pior, Igual, No sabe ou No Responde
Aps a recolha de dados, os mesmos foram confrontados com
indicadores existentes do INE que estavam directamente relacionados
com a pergunta efectuada.
A recolha de dados foi feita por meio de inqurito presencial.

173
Aplicaes Prcticas

INTRODUO
Foram efectuados inquritos a 50 pessoas, que tivessem mais do que
18 anos, em Abril de 1974
Esta recolha foi efectuada no segundo semestre de 2009.
Para este trabalho pretende-se efectuar anlises sobre os dados
recolhidos aplicando a matria aprendida nesta disciplina.

174
Aplicaes Prcticas

DADOS DA ANLISE

PERGUNTAS PARA ENTREVISTA


Idade: _____
Local de nascimento:_________________
Local de residncia (Litoral/Interior):______________________
Sexo:____________
Grau Acadmico:________________________________
Considera que hoje se est melhor relativamente as seguintes reas:

175
Aplicaes Prcticas

DADOS DA ANLISE

Questo Melhor Pior Igual No sabe/No responde


Acesso a Habitao
Acesso a Educao
Justia
Saude
Emprego
Igualdade de gneros
Proteco Social
Acesso a Cultura
Transportes
Acesso a Informao
Gesto dos bens pelo estado

De uma forma global, considera


que vive melhor agora ou antes
do 25 de Abril.

176
Aplicaes Prcticas

DICIONRIO DE DADOS
Dicionrio, para o inqurito:
Respostas aos questionrios
1 NS/NR
2 Pior
3 Igual
4 Melhor
Zona Geogrfica de nascimento:
1 Litoral
2 Interior
Zona Geogrfica onde vive actualmente:
1 Litoral
2 Interior

177
Aplicaes Prcticas

DICIONRIO DE DADOS

Sexo:
1 Masculino
2 Feminino
Nvel Acadmico:
1 No sabe ler nem escrever
4 4 Classe
9 9 Ano
12 12 Ano
13 Licenciatura ou superior

178
Aplicaes Prcticas

DADOS EM ROLL

179
Aplicaes Prcticas

DADOS EM ROLL

Com estes dados apresentados em rol, fizemos o seu agrupamento. Para


calcular o numero de classes a utilizar utilizamos a seguinte formula:

2k >=n 2k >= 50; k=6

Assim, foram definidas 6 classes. Para calcular a amplitude das classes


utilizamos a seguinte formula:

AC= AT/k = 87- 54 / 6 = 5,5 em que AC = Amplitude da classe; AT = Amplitude


total da amostra e k corresponde ao nmero de classes, anteriormente obtida.

180
Aplicaes Prcticas

DADOS AGRUPADOS
Assim, criamos a seguinte tabela de frequncias:

Tabela de Frequncias

181
Aplicaes Prcticas

DADOS AGRUPADOS
Como parmetros mdios so apresentados a mediana, moda e mdia.
Antes de apresentar os clculos das medidas de posio, apresentamos a
legenda das abreviaturas:

fa Frequncia da classe
Fa Frequncia acumulada.
xm = Ponto mdio da classe = (valor inferior da classe + valor superior da classe)/ 2
Bl = Numero inferior da classe em anlise.
N = Elementos da amostra.
Fb = Acumulado de frequncia da classe anterior.
fc = Frequncia da classe em anlise.
i = Amplitude da classe em anlise.
d1 = Diferena entre a frequncia da classe em anlise e a frequncia da classe anterior.
d2= Diferena entre a frequncia da classe em anlise e a frequncia da classe seguinte.

182
Aplicaes Prcticas

MEDIDAS DE POSIO
Para calcular a:

Mediana
Frmula = Bl+ ((n/2 Fb)/fc)x i
1 Calcular n/2 para encontrar a classe da mediana
50/2 = 25; a classe modal que contem a frequncia acumulada 25 a de 59,5
a 65 anos.
Ento,
Me=59,5+((50/2-16)/11)x 5,5=64

Com a mediana, podemos afirmar que 50% da amostra tem menos de 64


anos e 50% tem mais.

183
Aplicaes Prcticas

MEDIDAS DE POSIO
Para calcular a:
Moda
Formula = Bl+ (d1/(d1+d2))x i
Classe modal = classe com mais frequncia, neste caso a classe 54 a 59,5
Mo =54+(16/(16+0))x 5,5=59,5
Com a moda podemos afirmar que 59,5 anos a idade com mais
frequncia nesta amostra.

Media
Formula =
Media = 3222,5/50 = 64,45
Diz que a mdia da idade da amostra de 64 Anos

184
Aplicaes Prcticas

MEDIDAS DE POSIO

So ainda apresentados o quartil, decil e percentil.

Quartis Divide a amostra em 4 partes

Calcular Q3 - Formula = Bl+ ((3n/4 Fb)/fc)x i


1 Calcular n para encontrar a classe do quartil
3n/4 = 3x50/4 = 37,5
=65+((37,5-27)/14)x5,5 = 69,13

Significa que 75% da amostra tem idade inferior a 69 anos e 25% da


amostra tem idade superior a 69 anos.

185
Aplicaes Prcticas

MEDIDAS DE POSIO

Decis Divide a amostra em 10 partes

Calcular D2 - Formula = Bl+ ((2n/10 Fb)/fc)x i


1 Calcular n para encontrar a classe do decil
2n/10 = 2x50/10 = 10
=54+((10-0)/16)x5,5 = 57,43

Significa que 80% da amostra tem mais que 57 anos e 20% da amostra
tem idade inferior a 57 anos.

186
Aplicaes Prcticas

MEDIDAS DE POSIO

Percentil Divide a amostra em 100 partes

Calcular P10-Formula=Bl+((10n/100Fb)/fc)x i
1 Calcular n para encontrar a classe do percentil
10n/100 = 10x50/100 = 5
=54+((5-0)/16)x5,5 = 55,72

Significa que 10% da amostra tem menos que 55 anos e 90% da amostra
tem idade superior.

187
Aplicaes Prcticas

ANLISE DA AMOSTRA
Relativamente amostra, elaboramos uma anlise sua constituio e
conclumos o seguinte:
Nr. %
Sexo
Feminino 23 46
Masculino 27 54
Local Nascimento:
Interior 22 44
Litoral 28 56
Local Residncia:
Interior 19 38
Litoral 31 62

188
Aplicaes Prcticas

ANLISE DA AMOSTRA
Quanto ao local de nascimento e local de residncia actual, verifica-se uma
relao de mais pessoas a residir no litoral do que pessoas que tenham
nascido no litoral, sendo uma realidade comprovada pelos dados que revelam
uma migrao da populao do interior para o litoral.
Quanto ao nvel acadmico, verifica-se na tabela abaixo que a amostra contm
42% de populao com nvel acadmico igual ou superior ao 12 ano, no
correspondendo realidade da populao portuguesa.

Nvel Acadmico Nr. %


1 3 6
4 13 26
9 13 26
12 15 30
13 6 12

189
Aplicaes Prcticas

EM RESUMO
Dados da amostra:
Sexo: 50 indivduos, 23 do sexo feminino que representa 46% da constituio
da amostra e 27 do sexo masculino que representa 54% da amostra.
Local de nascimento: 22 indivduos nasceram no interior e representam 44%
da amostra, 28 nasceram no litoral e representam 56 % da amostra.
Local de residncia actual: do interior correspondem 19 indivduos que
representam 38% da amostra, habitantes do litoral so 31 indivduos e
representam 62% da amostra
Nvel acadmico: 3 indivduos no sabem ler nem escrever e representam 6%
dos inquiridos, 13 indivduos tem a 4 classe e representam 26% dos inquiridos,
13 indivduos tem o 9 ano e representam 26% dos inquiridos, 15 indivduos
tem o 12 ano e representam 30% da amostra e 6 indivduos tem um curso
superior e representam 12% da amostra.

190
Aplicaes Prcticas

COMPARAO DOS DADOS AGRUPADOS / NO AGRUPADOS

Aps os clculos efectuados anteriormente relativamente as classes da


amostra, efectuamos o clculo dos elementos no agrupados utilizando o
Excel, e obtivemos a tabela seguinte, em que os dados No agrupados foram
obtidos com o Excel, os agrupados resultaram dos clculos anteriores.

191
Aplicaes Prcticas

192
Aplicaes Prcticas

Na anlise dos dados no agrupados, comparando-os com os agrupados,


podemos verificar algumas diferenas.
Nos dados no agrupados relativamente idade da amostra a mdia de 64
anos enquanto nos agrupados de 64,45, a mediana idntica nas duas
situaes, na moda verifica-se uma diferena significativa, mas facilmente
visvel na anlise dos dados.
Nos dados agrupados a idade mais frequente 68 anos, mas quando os
dados agrupados, verifica-se que a classe com mais frequncia a dos 54 aos
59,5.

Aps esta anlise, efectuamos, de novo com o Excel, a correlao entre todos
os parmetros do inqurito.

193
Aplicaes Prcticas

CORRELAO DOS DADOS COM TODAS AS PERGUNTAS

194
Aplicaes Prcticas

Obtida a tabela, para uma melhor analise, formatamos a tabela com cores
de forma a podermos avaliar a correlao entre os vrios parmetros.
Assim formatamos a azul os dados com valores superiores a -0,35 e
inferiores a 0,35. Assim ficaram a branco os dados que apresentavam uma
correlao superior.

Aps anlise de todas as correlaes significativas, verificamos que as


mais significativas em termos de relevncia material para analise eram as
da idade com a pergunta 12 (P12) e as do nvel acadmico, novamente
com a pergunta P12. Verificamos tambm a correlao entre a P1 e a P12

Analisando a relao entre a idade e a resposta a pergunta 12, criamos a


seguinte tabela:

Tabela de relao entre idade e P12.


195
Aplicaes Prcticas

196
Aplicaes Prcticas

Como podemos verificar nesta correlao de dados entre a idade e a pergunta


doze, relativamente ao nvel de vida, quanto mais jovem o inquirido maior
a sua tendncia para ter a percepo de que o nvel de vida melhor aps do
que antes do 25 de Abril de 1974.

De seguida, verificamos a relao entre o nvel acadmico e a pergunta 12


Verifica-se a seguinte distribuio das respostas a pergunta 12 por nvel
acadmico:

N.Academico ns/nr Pior Igual Melhor


1 1 2
4 5 1 8
9 2 10
12 15
13 6

197
Aplicaes Prcticas

Para auxiliar a nossa anlise, elaboramos um grfico que demonstra o peso de


cada nvel de resposta com o nvel acadmico.

198
Aplicaes Prcticas

Com este grfico conseguimos visualizar a tendncia para que a percepo de


um melhor nvel de vida aps o 25 de Abril est bastante ligado ao nvel
acadmico superior da amostra.
Constata-se que 42% da amostra que acha que se vive melhor actualmente,
tem o 12 ano ou superior.
Verifica-se tambm que 82% da amostra considera que se vive melhor
actualmente do que antes de 25-04-1974.

Relativamente a anlise entre a P1 e a P12, construmos a seguinte tabela:

199
Aplicaes Prcticas

CONCLUSES

Perante os dados expostos, pode-se verificar que a populao mais


esclarecida (maior nvel acadmico) a que tem viso mais positiva do
nvel de vida aps o 25-4-1974. Estas pessoas podem ter esta percepo
por, atravs do seu melhor nvel de instruo, terem conseguido alcanar
melhores condies de vida.

Verificamos tambm que quanto mais novos os elementos da amostra,


tambm consideram que se vive melhor actualmente, esta percepo pode
ser explicada pelo facto de que quando ocorreu a revoluo, estas
pessoas, pela sua juventude, estivessem mais esclarecidas quando a
direitos humanos e outros valores mais democrticos, que na altura eram
mais valorizados por essa populao jovem.
.

200
Aplicaes Prcticas

CONCLUSES

Por ltimo, verificamos uma grande dependncia entre as condies de


acesso a habitao e as condies de vida de uma forma geral. A resposta
a esta pergunta P1 era a que estava mais correlacionada com a P12
ocorrendo uma correlao directa entre elas com valores muito elevados.

201
Anlise de Dados em Auditoria - Exerccio

ANLI
SE
DE
DAD
OS
EM
AUDI
TORI
A
(EXER 202

CCI
Anlise de Dados em Auditoria - Exerccio
Objetivo e mbito do Trabalho

Objetivo e mbito do Trabalho


O Objetivo do nosso trabalho assenta em testar o processamento de salrios
relativo ao ms de Fevereiro de 2013, no que respeita coerncia da
informao constante na Base de Dados da rea de RH, com a validao do
processamento salarial e as regras de compliance do sector e da legislao
geral aplicvel.

- Para este efeito, vamos suportar os nossos testes com base numa amostra
selecionada considerando critrios estatsticos.
- Ms de referncia Fevereiro 2013.

203
Anlise de Dados em Auditoria - Exerccio
Caracterizao e Descrio da Populao

Caracterizao e Descrio da Populao


Caracterizao Geral
Empresa a operar no sector dos Transportes rodovirios de passageiros
Com 171 colaboradores
Remuneraes compostas pelo Vencimento Base e outras rubricas variveis
do complexo remuneratrio.
Processamento Salarial, com base em Folhas de Ponto mensais, com
clculos apurados de tempos de trabalho e outras rubricas variveis do
complexo remuneratrio (horas extras, ajudas de custos, subsdios de
refeio, agente nico, etc.)

204
Anlise de Dados em Auditoria - Exerccio
Caracterizao e Descrio da Populao

Parametrizao dos cdigos de novas rubricas so gerados no sistema RH.


Colaboradores divididos em 5 categorias profissionais (Administrativos,
Comercial, Mecnicos, Motorista TC e Motorista TP)

205
Anlise de Dados em Auditoria - Exerccio
Caracterizao e Descrio da Populao

Idade, Antiguidade e Remuneraes

206
Anlise de Dados em Auditoria - Exerccio
Caracterizao e Descrio da Populao

1 rubrica de vencimento base


30 rubricas de remunerao varivel

O modelo (em anexo excel):

207
Anlise de Dados em Auditoria - Exerccio
Metodologia

Metodologia
Estratificao dos Dados

208
Anlise de Dados em Auditoria - Exerccio
Metodologia

209
Anlise de Dados em Auditoria - Exerccio
Metodologia

210
Anlise de Dados em Auditoria - Exerccio
Metodologia

Distribuio da Probabilidade
Assimetria da Distribuio
Considerando:
a categoria profissional mais representativa Motoristas TC (tempos
completos);
na faixa etria mais representativa 45 50 anos;
Foi-se avaliar a probabilidade da empresa estar a pagar acima do sector.

Mdia do Sector: 825 ;


Mdia do conglomerado: 994 ;
Desvio- Padro: 152 ;
Mediana: 1.015 ;

211
Anlise de Dados em Auditoria - Exerccio
Metodologia

Distribuio da Probabilidade
Recentragem
No intuito de tornar desnecessria a utilizao da equao estatstica e na
impossibilidade de se elaborar uma infinita tabela de probabilidades, a nossa
varivel aleatria (X=825), ser normalizada convertendo-a na varivel aleatria
normal padronizada (Z), cuja mdia 0 e Desvio-Padro 1.

Assim, apurmos que Z = -1,1184, pelo que a probabilidade do vencimento desta


categoria profissional ser superior mdia do sector igual a 86,65%.

212
Anlise de Dados em Auditoria - Exerccio
Metodologia

Constituio da Amostra

213
Anlise de Dados em Auditoria - Exerccio
Metodologia

Estratificao de Dados

214
Anlise de Dados em Auditoria - Exerccio
Metodologia

Constituio da Amostra
Atendendo distribuio dos colaboradores por classes, proporcionalmente
teramos o seguinte:

Observao: uma vez que estamos que a trabalhar com pessoas, existe a
necessidade de utilizarmos nmeros inteiros, facto que justifica a diferena entre
o valor calculado estatisticamente (134) e o valor apurado na tabela.

215
Anlise de Dados em Auditoria - Exerccio
Metodologia

Constituio da Amostra

216
Anlise de Dados em Auditoria - Exerccio
Avaliao da Amostra

Avaliao da Amostra
Determinado o n de elementos a analisar, avanamos para a realizao de
testes de Compliance e Substantivos, selecionmos aleatoriamente 137
colaboradores, considerando a informao constante do calculo da amostra.

Com vista a testar a conformidade do processamento, efetumos:


- Testes de Compliance
- Testes Substantivos

217
Anlise de Dados em Auditoria - Exerccio
Avaliao da Amostra

Regras de Compliance / Tempos de Trabalho

218
Anlise de Dados em Auditoria Exerccio
Avaliao da Amostra

Testes Substantivos
Sobre a mesma amostra, efetuamos igualmente testes substantivos:
a) Verificao da existncia do trabalhador;
b) Reclculo das remuneraes variveis (diuturnidades, ajudas de custo,
subsdios de refeio estrangeiro;
c) Comparao da informao dos funcionrios para feitos de retenes de IRS
com a informao real (integridade);
d) Comparao dos mapas de horas trabalhadas com os valores processados;
e) Comparao dos valores processados no ficheiros com os recibos de
vencimento dos colaboradores;
f) Reclculo das retenes de IRS e SS efetuadas;

219
Anlise de Dados em Auditoria - Exerccio
Avaliao da Amostra

Inconformidades
Aps realizados os testes substantivos atendendo ao check-list e compliance,
apurmos inconformidades no processamento salarial de 10 colaboradores.
Trabalhando sobre a seguinte amostra, foram apuradas as seguintes
inconformidades:
a) N12 Expedidor. Erro do valor de IRS. Pela ficha do trabalhador em apreo,
apurou-se que est considerado como casado 2 titulares com 2 filhos quando no
processamento est considerado 1 titular com 2 filhos;
b) Todos. Subsdio de desgaste de fardamento. Nenhum caso est devidamente
parametrizado para incidir IRS;
c) N 44 Valor errado no n de dias processados no subsdio de refeio;
d) N 50 No prpaie regista ausncia entre dias 1 e 15 de Fevereiro, quando
inadvertidamente o operador efetuou uma alterao posterior aps o
processamento. Correo deve ser feita no ms de Maro;

220
Anlise de Dados em Auditoria - Exerccio
Avaliao da Amostra

Inconformidades
e) Custo Hora extra dos Motoristas TPs no est correto;
f) N 54- no foi atribudo ao Motorista o valor de 1 Pequeno Almoo, no Prpaie,
quando pela Folha de Ponto se apurou esse direito no dia 12 fevereiro;
g) N 89 Ao motorista 89 foi atribudo um abono de Subsidio Deslocao ao
estrangeiro Inter de 60, quando deveria ter sido de 65 uma vez que pela folha
de servio essa viagem foi Alemanha;
h) N 154- Foram atribudos 4 dias de subsidio de refeio (4 x 6,06 = 24,24),
quando se apurou que num desses 4 dias o colaborador frequentou uma ao
de formao com mais 6 colegas (Nota de Despesas paga pelo n34);
i) N 54- Este motorista est com 6 diuturnidades (6x 13,36) = 80,16, quando
apenas tem direito a 5 diuturnidades pela sua antiguidade.

221
Glossrio

GLOSS
RIO

222
Glossrio

223
Glossrio

224
Glossrio

225
Glossrio

226
Glossrio

227
Glossrio

228
Glossrio

229
Glossrio

230
Glossrio

231
Glossrio

232
Glossrio

233
Glossrio

234
Bibliografia

BIBLIO
GRA
FIA

235
Bibliografia

BERNSTEIN, Peter. Against the Gods: the remarkable story of risk. Nova Iorque : John
Wiley & Sons, 1996.
COCHRAN, William. Sampling Techniques. 3 ed. Nova Iorque : John Wiley & Sons,
1977. (Wiley Series in Probability and Mathematical Statistics).
LEVINE, David M.; BERENSON, Mark L.; STEPHAN, David. Statistics for Managers
Using Microsoft Excel. New Jersey : Prentice Hall, 1997.
MCGILL, John J. Statistics for Managers Using Microsoft Excel: Microsoft PowerPoint
slides. New Jersey : Prentice Hall, 1997. (Meio Magntico.)
NEWBOLD, Paul. Statistics for Business and Economics. 4 ed. New Jersey : Prentice
Hall, 1995.

236
SPIEGEL,
Murray R. Bibliografia
Estatstica. So
Paulo :
McGraw-Hill,
1976
STEVENSON,
William.
Estatstica
Aplicada
Administrao.
So Paulo :
Harbra, 1986.
TOLEDO,
Geraldo L.;
OVALLE, Ivo I.
Estatstica
Bsica. 2 ed.
So Paulo :
Atlas, 1985.
ANDERSON, R.
J.;
TEITLEBAUM, 237
A. Dollar Unit
Sampling. CA
GENERAL
Accounting Bibliografia
Office. Using
Statistical
Sampling.
Washington,
1992.
. Survey
Sampling and
Measurement.
Nova Iorque :
Academic
Press, 1978, p.
3-11.
LANPHIER, C.
Michael;
BAILAR,
Barbara A. A
Survey of
Surveys: some
sampling frame
problems. In:
NAMBOODIRI,
N. Krishnan 238
(Org.). Survey

También podría gustarte