Documentos de Académico
Documentos de Profesional
Documentos de Cultura
OLO
GIAS
QUA
NTIT
ATIV
AS
1
ndex
Introduo 3
Conceitos Fundamentais 4
Medidas de Localizao 59
Estatstica Descritiva 69
Distribuies de Probabilidade Inferncia Estatstica 122
Amostragem 125
Mtodos Quantitativos
Regresso Simples 145
Regresso Mltipla 148
Regresso No-Linear 150
Variveis Dummies 151
Utilizao do Excel em estatstica 153
Distribuies de Probabilidade Inferncia Estatstica 154
Aplicaes Prticas 172
Anlise de dados em Auditoria (exerccio) 202
Glossrio 222
Bibliografia 235
2
Introduo
INTRODUO
A estatstica descritiva anlise exploratria de dados pretende isolar as
estructuras e padres mais relevantes e estveis patenteados pelo conjunto de
dados objectos do estudo.
A estatstica indutiva anlise confirmatria de dados pretende avaliar,
nomeadamente, atravs da recolha e anlise de novas observaes, a
reprodutividade ou permanncia das estruturas e padres detectados.
3
Conceitos Fundamentais
4
Conceitos Fundamentais
5
Conceitos Fundamentais
7
Conceitos Fundamentais
8
Conceitos Fundamentais
TABELA
Com o objectivo de levantar dados, para exemplificar a maioria das tcnicas
apresentadas, no dia 21/03/2005, um questionrio foi aplicado aos alunos do
2 ano do curso de Estatstica da Universidade Estadual de Maring (UEM)
matriculados na disciplina Inferncia Estatstica.
9
Conceitos Fundamentais
TABELA
Transp.: meio de transporte mais utilizado com categorias (1) de coletivo e (2)
se prprio
Procedncia: municpio de procedncia com categorias (1) se Maring, (2) se
outro municpio do Paran e (3) se de outro Estado
Trabalho: relao do trabalho com o curso com categorias (1) no trabalho, (2)
completamente relacionado, (3) parcialmente relacionado e (4) no relacionado
Inform: meio de informao mais utilizado com categorias (1) se TV, (2) jornal,
(3) rdio, (4) revista e (5) internet
Disc.: nmero de disciplinas reprovadas no 1 ano da UEM.
Para se trabalhar estes dados so necessrios, em primeiro lugar, tabul-los e
apresent- los na forma em que foram coletados (dados brutos) como na
Tabela 01. Em geral, a 1 coluna da tabela deve conter a identificao do
respondente.
10
Conceitos Fundamentais
11
Conceitos Fundamentais
TABELA
De acordo com Magalhes (2000), pode-se observar que a Tabela 01, tabela
de dados brutos, contm muita informao, porm pode no ser muito rpido e
prctico obter estas informaes. Por exemplo, no imediato afirmar que
existem mais homens que mulheres.
Neste sentido, pode-se construir outra tabela para cada uma das variveis que
resumir as informaes ali contidas.
12
Conceitos Fundamentais
TABELA
Embora um certo volume de informao seja perdido quando os dados so
resumidos, um grande volume pode tambm ser ganho. Uma tabela talvez
seja o meio mais simples de se resumir um conjunto de observaes (Pagano,
2004). Deve ser usada quando importante a apresentao dos valores
(Medronho, 2003), e sua leitura depende de quem a l.
13
Conceitos Fundamentais
ELEMENTOS DA TABELA
Toda tabela deve ser simples, clara, objectiva e auto-explicativa. Segundo
Milone (2004), os elementos fundamentais da tabela so: ttulo, cabealho,
coluna indicadora e corpo.
14
Conceitos Fundamentais
15
Conceitos Fundamentais
ELEMENTOS DA TABELA
Destaca-se que as tabelas devem ser numeradas por ordem crescente ou
conforme aparecem no texto, como o caso de trabalhos cientficos; as bordas
superiores e inferiores devem ser fechadas com traos horizontais, enquanto
que as da esquerda e direita no, podendo ou no ser fechadas por traos
verticais a separao das colunas no corpo da tabela. conveniente tambm
que o nmero de casas decimais seja padronizado.
TABELA SIMPLES
Uma tabela simples contm as diferentes categorias observadas de uma
varivel qualitativa e as suas respectivas contagens, denominadas freqncias
absolutas. A contagem refere-se ao nmero de ocorrncias de cada categoria
e realizada utilizando-se, por exemplo, a Tabela 01 ou o banco de dados.
16
Conceitos Fundamentais
17
Conceitos Fundamentais
19
Conceitos Fundamentais
20
Conceitos Fundamentais
DISTRIBUIO DE FREQUNCIA
Como j mencionado no incio deste captulo, dependendo do volume de
dados, torna-se difcil ou impracticvel tirar concluses a respeito do
comportamento das variveis e, em particular, de variveis quantitativas.
21
Conceitos Fundamentais
DISTRIBUIO DE FREQUNCIA
a diferena entre o menor e maior valor observado da varivel X,
denominada amplitude total (AT = xmax xmin), que definir a construo de
uma distribuio de frequncia pontual ou em classes.
O ideal que uma distribuio de frequncia resuma os dados num nmero de
linhas que varie de 5 a 10.
22
Conceitos Fundamentais
24
Conceitos Fundamentais
25
Conceitos Fundamentais
26
Conceitos Fundamentais
27
Conceitos Fundamentais
Para o caso em que for menor que 100, soma-se uma unidade ao dgito de
interesse das maiores frequncias relativas at que a soma seja 100.
Se for maior que 100, deve-se subtrair uma unidade das maiores frequncias
relativas.
28
Conceitos Fundamentais
29
Conceitos Fundamentais
Pode-se escolher qualquer uma destas opes sendo o importante tornar claro
no texto ou na tabela qual que est a ser usada.
Se houver muitos intervalos, o resumo no constituir grande melhoria com
relao aos dados brutos. Se houver muito poucos, um grande volume de
informao se perder. Embora no seja necessrio, os intervalos so
frequentemente construdos de modo que todos tenham larguras iguais, o que
facilita as comparaes entre as classes. (Pagano, 2004).
Milone (2004) apresenta os seguintes critrios para a determinao do nmero
de intervalos, denotado por k:
1. Raiz quadrada: k = n
2. Log (Sturges): k =1+ 3,3log n
3. ln (Milone): k = 1+ 2 ln n
4. k =1 +10d AT ,
onde n o nmero de elementos da amostra, AT a amplitude total dos dados
e d o nmero de decimais dos seus elementos.
30
Conceitos Fundamentais
33
Conceitos Fundamentais
Por outro lado, se o maior valor observado for inferior ao limite superior da
classe, no h problema, pois fixamos todas as classes com a mesma
amplitude.
Nada impede que se construa uma tabela com amplitude de classes desiguais.
Isto depender do objetivo do pesquisador. O que se recomenda, o cuidado
na interpretao da tabela. O primeiro passo calcular as amplitudes das
classes (i) e apresent-las numa coluna.
36
Conceitos Fundamentais
37
Conceitos Fundamentais
GRFICOS
Todo grfico, na verso final deve primar pela simplicidade, clareza e
veracidade nas informaes. Para atingir tal objectivo, a construo de um
grfico exige muito trabalho e cuidados.
GRFICOS
- Dever ser usado apenas um grfico?
- A qual meio tcnico se deve recorrer?
Quando um grfico for inserido num texto, recomenda-se que este seja
destacado, tanto do texto que o precede, como do texto imediatamente
subsequente, atravs de trs espaos simples.
40
Conceitos Fundamentais
GRFICOS
Existem diversos tipos de grficos. Porm, neste trabalho sero destacados
aqueles de maior interesse pedaggico na representao das variveis
qualitativas e quantitativas.
42
Conceitos Fundamentais
Grfico de colunas
o grfico mais utilizado para representar variveis qualitativas. Difere do
grfico de barras por serem seus retngulos dispostos verticalmente ao eixo
das abscissas sendo mais indicado quando as designaes das categorias
so breves. Tambm para este tipo de grfico deve ser preservada a
distncia entre cada retngulo de, aproximadamente, 2/3 da largura da base
de cada coluna. O n de colunas/barras do grfico no deve ser superior a
12.
43
Conceitos Fundamentais
44
Conceitos Fundamentais
Grfico de sectores
Tipo de grfico onde a varivel em estudo projectada num crculo, de
raio arbitrrio, dividido em sectores com reas proporcionais s
frequncias das suas categorias. So indicados quando se deseja
comparar cada valor da srie com o total. Recomenda-se o seu uso para
o caso em que o nmero de categorias no elevado, bem como, no
obedecem a alguma ordem especfica.
A Figura 05 mostra um grfico de sectores para a varivel municpio de
procedncia que constam na Tabela 01. O procedimento para o clculo
do ngulo correspondente a cada categoria feito por meio de simples
propores: 360 que corresponde a um crculo completo est para o
total de alunos entrevistados, 22, assim como x est para o total de
alunos que pertencem categoria desejada. Por exemplo, os 54% de
alunos que residem no municpio de Maring corresponder a um ngulo
x resultante da expresso abaixo, cujo valor aproximadamente 196.
45
Conceitos Fundamentais
46
Conceitos Fundamentais
Grfico de linhas
A sua aplicao mais indicada para representaes de sries temporais
sendo, por tal razo, conhecidos tambm como grficos de sries
cronolgicas. A sua construo feita colocando-se no eixo vertical (y) a
mensurao da varivel em estudo e na abscissa (x), as unidades da
varivel numa ordem crescente. Este tipo de grfico permite representar
sries longas, o que auxilia a detectar as suas flutuaes, tanto quanto,
analisar tendncias. Tambm podem ser representadas vrias sries num
mesmo grfico.
47
Conceitos Fundamentais
48
Conceitos Fundamentais
Se for de interesse saber quantos alunos tem dois ou menos irmos (inclui-se
dois irmo), a frequncia acumulada de 19 alunos.
49
Conceitos Fundamentais
50
Conceitos Fundamentais
51
Conceitos Fundamentais
52
Conceitos Fundamentais
Polgono de frequncia
um grfico de linha cuja construo feita unindo-se os pontos de
coordenadas de abscissas correspondentes aos pontos mdios de cada classe
e as ordenadas, s frequncias absolutas ou relativas dessas mesmas
classes.
53
Conceitos Fundamentais
54
Conceitos Fundamentais
55
Conceitos Fundamentais
56
Conceitos Fundamentais
MEDIDAS DESCRITIVAS
Uma outra maneira de se resumir os dados de uma varivel
quantitativa, alm de tabelas e grficos, apresent-los na forma de
valores numricos, denominados medidas descritivas. Estas medidas,
se calculadas a partir de dados populacionais, so denominadas
parmetros e se calculadas a partir de dados amostrais so
denominadas estimadores ou estatsticas.
As medidas descritivas auxiliam a anlise do comportamento dos
dados. Tais dados so provenientes de uma populao ou de uma
amostra, o que exige uma notao especfica para cada caso, conforme
mostra o Quadro 01.
57
Conceitos Fundamentais
59
Medidas de Localizao
60
Medidas de Localizao
61
Medidas de Localizao
62
Medidas de Localizao
63
Medidas de Localizao
64
Medidas de Localizao
65
Medidas de Localizao
66
Medidas de Localizao
67
Medidas de Localizao
68
Estatstica Descritiva - Exemplos
Mdia aritmtica
A mdia aritmtica (X) a soma de todos os valores observados da
varivel dividida pelo nmero total de observaes.
69
Estatstica Descritiva - Exemplos
70
Estatstica Descritiva - Exemplos
71
Estatstica Descritiva - Exemplos
72
Estatstica Descritiva - Exemplos
73
Estatstica Descritiva - Exemplos
Moda
A moda (Mo) o valor que apresenta a maior frequncia da varivel entre
os valores observados. Para o caso de valores individuais, a moda pode ser
determinada imediatamente observando-se o rol ou a frequncia absoluta
dos dados. Por outro lado, tratando-se de uma distribuio de frequncia de
valores agrupados em classes, numa primeira fase, necessrio identificar
a classe modal, aquela que apresenta a maior frequncia, e a seguir a
moda calculada aplicando-se a frmula:
76
Estatstica Descritiva - Exemplos
77
Estatstica Descritiva - Exemplos
Mediana
A mediana (Md) o valor que ocupa a posio central da srie de
observaes de uma varivel, em rol, dividindo o conjunto em duas
partes iguais, ou seja, a quantidade de valores inferiores mediana
igual quantidade de valores superiores mesma.
78
Estatstica Descritiva - Exemplos
79
Estatstica Descritiva - Exemplos
80
Estatstica Descritiva - Exemplos
A posio p da mediana
Assim,
81
Estatstica Descritiva - Exemplos
82
Estatstica Descritiva - Exemplos
83
Estatstica Descritiva - Exemplos
MEDIDAS SEPARATRIZES
Estas medidas so valores que ocupam posies no conjunto de dados,
em rol, dividindo-o em partes iguais e podem ser:
84
Estatstica Descritiva - Exemplos
85
Estatstica Descritiva - Exemplos
86
Estatstica Descritiva - Exemplos
87
Estatstica Descritiva - Exemplos
88
Estatstica Descritiva - Exemplos
90
Estatstica Descritiva - Exemplos
91
Estatstica Descritiva - Exemplos
MEDIDAS DE DISPERSO
De acordo com Toledo (1985), fenmenos que envolvem anlises estatsticas
caracterizam-se pelas suas semelhanas e variabilidades. As medidas de
disperso auxiliam as medidas de tendncia central a descrever o conjunto de
dados adequadamente. Indicam se os dados esto, ou no, prximos uns dos
outros.
Desta forma, no h sentido calcular a mdia de um conjunto onde no h
variao dos seus elementos.
Existe ausncia de disperso e a medida de disperso igual a zero.
Por outro lado, aumentando-se a disperso, o valor da medida aumenta e se a
variao for muito grande, a mdia no ser uma medida de tendncia central
representativa.
92
Estatstica Descritiva - Exemplos
MEDIDAS DE DISPERSO
As quatro medidas de disperso que sero definidas a seguir so:
amplitude total,
amplitude interquartlica,
93
Estatstica Descritiva - Exemplos
Amplitude Total
A amplitude total de um conjunto de dados a diferena entre o
maior e o menor valor observado. A medida de disperso no levar
em considerao os valores intermedirios perdendo a informao
de como os dados esto distribudos e/ou concentrados.
94
Estatstica Descritiva - Exemplos
Amplitude Interquartlica
A amplitude interquartlica a diferena entre o terceiro e o primeiro
quartil. Esta medida mais estvel que a amplitude total por no
considerar os valores mais extremos. Esta medida abrange 50% dos
dados e til para detectar valores discrepantes.
95
Estatstica Descritiva - Exemplos
96
Estatstica Descritiva - Exemplos
Desvio-mdio
A diferena entre cada valor observado e a mdia denominado desvio e
dado por (xi ) se o conjunto de dados populacional, ou por (xi x)
se os dados so amostrais.
Ao somar todos os desvios, ou seja, ao somar todas as diferenas de
cada valor observado em relao a mdia, o resultado igual a zero
(propriedade 5 da mdia). Isto significa que esta medida no mede a
variabilidade dos dados. Para resolver este problema, pode-se
desconsiderar o sinal da diferena, considerando-as em mdulo e a
mdia destas diferenas em mdulo denominada desvio mdio:
97
Estatstica Descritiva - Exemplos
98
Estatstica Descritiva - Exemplos
99
Estatstica Descritiva - Exemplos
100
Estatstica Descritiva - Exemplos
101
Estatstica Descritiva - Exemplos
Exemplo 19: Considere trs alunos cujas notas em uma disciplina esto
apresentadas na Tabela 13.
Observa-se que as mdias das notas dos trs alunos so iguais, porm, seus
desvios em torno da mdia so diferentes. Isto quer dizer que seus
desempenhos so diferentes.
O aluno A constante em seu desempenho, o segundo vai progredindo aos
poucos e o terceiro diminui abruptamente seu desempenho.
102
Estatstica Descritiva - Exemplos
103
Estatstica Descritiva - Exemplos
104
Estatstica Descritiva - Exemplos
Coeficiente de Variao
O coeficiente de variao uma medida de disperso relativa
definida como a razo entre o desvio padro e a mdia:
Medidas de Assimetria
A medida de assimetria um indicador da forma da distribuio dos
dados. Ao construir uma distribuio de freqncias e/ou um
histograma, est-se procurando, tambm, identificar visualmente, a
forma da distribuio dos dados que ou no confirmada pelo
coeficiente de assimetria de Pearson (As) definido como:
107
Estatstica Descritiva - Exemplos
108
Estatstica Descritiva - Exemplos
109
Estatstica Descritiva - Exemplos
Medidas de Curtose
A medida de curtose o grau de achatamento da distribuio, um
indicador da forma desta distribuio. definido como:
111
Estatstica Descritiva - Exemplos
112
Estatstica Descritiva - Exemplos
113
Estatstica Descritiva - Exemplos
114
Estatstica Descritiva - Exemplos
115
Estatstica Descritiva - Exemplos
116
Estatstica Descritiva - Exemplos
117
Estatstica Descritiva - Exemplos
118
Estatstica Descritiva - Exemplos
119
Estatstica Descritiva - Exemplos
121
Distribuies de Probabilidade
Inferncia Estatstica
Prova de Bernoulli
Considere uma experincia aleatria na qual se observa a realizao
ou no realizao de determinado acontecimento A, de probabilidade
P(A) = p. A realizao de A diz-se sucesso; a realizao do
complementar A, que tem probabilidade P(A) = 1 - p = q, diz-se um
insucesso. A esta experincia damos o nome de prova de Bernoulli.
Se a varivel aleatria X designa o nmero de sucessos numa prova
de Bernoulli (ex: nmero de caras obtido no lanamento de uma
moeda; nmero de peas defeituosas de entre uma escolhida ao
acaso de um lote), apresenta a seguinte funo massa de
probabilidade:
122
Distribuies de Probabilidade
Inferncia Estatstica
123
Distribuies de Probabilidade
Inferncia Estatstica
Distribuio Binomial
Consideremos uma sucesso de n provas de Bernoulli. varivel
aleatria X, que representa o nmero de sucessos nas n provas (ex:
nmero de caras observadas em 20 lanamentos de uma moeda
equilibrada) chama-se varivel aleatria com distribuio Binomial de
parmetros n e p, e escreve-se simbolicamente X ~ b(n; p). Apresenta
a seguinte funo massa de probabilidade:
Populao x Amostra
125
Populao / Amostra
POPULAO
Conjunto de elementos com pelo menos uma caracterstica em comum
observvel.
126
Populao / Amostra
127
Populao / Amostra
Pesquisa eleitoral
128
Populao / Amostra
Populao
Finita - Alunos do mestrado, funcionrios da Petrogal, eleitores, etc.
Infinita - Barris de petrleo produzidos por um poo, nascimentos em uma
cidade, produo de uma mquina, etc.
Populao e Amostra
Censo: Estudo atravs do exame de todos os elementos da populao.
Amostragem: Estudo por meio do exame de uma amostra.
129
Populao / Amostra
130
Populao / Amostra
131
Populao / Amostra
132
Amostragem
Amostragem
A amostra deve ser representativa!
133
Amostragem
Tcnicas de Amostragem
Amostragem probabilstica (aleatria)
A probabilidade de um elemento da populao ser
escolhido conhecida.
134
Amostragem
Amostragem Probabilstica
Amostragem aleatria simples
Amostragem sistemtica
Amostragem estratificada
135
Amostragem
136
Amostragem
Amostragem Sistemtica
Os elementos da populao apresentam-se ordenados e so retirados
periodicamente (de cada k elementos, um escolhido)
Vantagem: facilidade
Problema: possibilidade de haver ciclos de variao
137
Amostragem
Amostragem Estratificada
Usada quando a populao divide-se em subpopulaes (estratos)
razoavelmente homogneos.
A amostragem estratificada consiste em se especificar quantos itens da
amostra sero retirados de cada estrato.
A seleo em cada estrato deve ser aleatria
Amostragem Estratificada
Exemplos
Populao em homens e mulheres ou em faixas etrias;
Pesquisas eleitorais
regio;
139
Amostragem
Tamanho de Amostra
Parmetro: caracterstica da populao.
Estatstica: caracterstica descritiva de elementos de uma amostra.
Estimativa: valor acusado por uma estatstica que estima o valor de um
parmetro populacional.
ERRO AMOSTRAL: diferena entre o valor que a estatstica pode acusar e o
verdadeiro valor do parmetro que se deseja estimar.
ERRO AMOSTRAL TOLERVEL: quanto um pesquisador admite errar na
avaliao dos parmetros de interesse numa populao.
Exemplo, o resultado de uma pesquisa eleitoral:
Candidato A = 20%, com 2% de erro amostral (18% - 22%)
140
Amostragem
141
Amostragem
142
Amostragem
Logo, errneo pensar n que o tamanho da amostra deve ser tomado como um
percentual do tamanho da populao para ser representativa
143
Amostragem
144
Mtodos Quantitativos
Regresso Simples
A REGRESSO SIMPLES
A regresso uma tcnica que envolve a anlise de dados amostrais para obter
informaes se duas ou mais variveis so relacionadas e qual a natureza desse
relacionamento. utilizada principalmente com o propsito de previso.
Consiste em determinar uma funo matemtica que visa descrever o comportamento
de determinada varivel dependente, com base nos valores de uma ou mais variveis
independentes. Assim, procura-se identificar a equao da reta que melhor se ajusta aos
dados observados.
De modo geral, no modelo de regresso linear simples, a relao entre duas variveis, X
e Y, pode ser satisfatoriamente definida pela equao:
Y = + . X, sendo
Y = varivel dependente;
X = varivel independente ou explicativa;
= coeficiente linear ou intercepto da reta; e
= coeficiente angular ou declividade da reta.
145
Mtodos Quantitativos
Regresso Simples
A REGRESSO SIMPLES
146
Mtodos Quantitativos
Regresso Simples
REGRESSO SIMPLES
Um exemplo clssico de estudo de regresso tem como varivel independente a
utilizao de fertilizantes e como varivel dependente a produtividade do solo (safra do
trigo).
O mtodo dos mnimos quadrados o mtodo mais utilizado para a estimativa dos
coeficientes de regresso.
147
Mtodos Quantitativos
Regresso Mltipla
REGRESSO MLTIPLA
A Regresso Mltipla uma extenso do modelo de Regresso Linear para n variveis
independentes. a tcnica adequada quando desejamos pesquisar o efeito simultneo
de vrios fatores sobre Y, a varivel dependente. A regresso mltipla reduz a
tendenciosidade que se verificaria no caso de uma regresso simples que no levasse
em conta fatores importantes.
Assim, considera-se, a princpio, a existncia de uma relao linear entre cada uma das
variveis explicativas e a varivel dependente.
148
Mtodos Quantitativos
Regresso Mltipla
REGRESSO MLTIPLA
149
Mtodos Quantitativos
Regresso No-Linear
REGRESSO NO-LINEAR
Nesse caso, a varivel independente assume formas mais complexas, tais como:
Contudo, deve se tomar cuidado porque nesse caso o clculo do coeficiente a estar
expresso em logaritmo, devendo calcular-se o antilogaritmo. Outro cuidado garantir
que as hipteses do modelo de regresso linear sejam verificadas.
150
Mtodos Quantitativos
Variveis Dummies
VARIVEIS DUMMIES
As variveis dummies so variveis qualitativas artificiais, introduzidas no modelo, com
valores binrios, para levar em considerao fenmenos como: alteraes na poltica
econmica, greves etc. As variveis qualitativas assinalam a presena ou ausncia de
um atributo ou evento, assumindo os valores 0 ou 1, sendo 0 o cenrio de referncia.
Toda varivel dummy pode ser incorporada ao modelo sob 3 formas: aditiva,
multiplicativa e mista.
151
Mtodos Quantitativos
Variveis Dummies
VARIVEIS DUMMIES
Aditiva: Se o evento ocorrer, a alterao ocorrer somente no intercepto, modificando a.
Multiplicativa: Se o evento ocorrer, a alterao afetar somente a sua declividade,
modificando b.
Mista: Nesse caso, ocorrendo o evento, a alterao afetar os valores de a e b.
153
Distribuies de Probabilidade
Inferncia Estatstica
154
Distribuies de Probabilidade
Inferncia Estatstica
155
Distribuies de Probabilidade
Inferncia Estatstica
156
Distribuies de Probabilidade
Inferncia Estatstica
157
Distribuies de Probabilidade
Inferncia Estatstica
Distribuio Normal
Nos exemplos anteriores consideramos que a varivel aleatria (v.
a.) era discreta, isto , s podia assumir um nmero finito ou infinito
numervel de valores distintos. No entanto, quando na Estatstica se
classificaram as variveis, viu-se que estas tambm podiam ser de
tipo contnuo.
A distribuio Normal uma das mais importantes, seno a mais
importante distribuio contnua. Uma varivel aleatria X, com
funo densidade de probabilidade (f.d.p.):
159
Distribuies de Probabilidade
Inferncia Estatstica
160
Distribuies de Probabilidade
Inferncia Estatstica
161
Distribuies de Probabilidade
Inferncia Estatstica
162
Distribuies de Probabilidade
Inferncia Estatstica
163
Distribuies de Probabilidade
Inferncia Estatstica
164
Distribuies de Probabilidade
Inferncia Estatstica
Estandardizao ou normalizao da v. a. X
Se a varivel aleatria X for Normal de parmetros m e
s2, comum proceder sua estandardizao, ou
normalizao. Normaliza-se o valor x, subtraindo-lhe o
seu valor mdio e dividindo a diferena pelo valor do
desvio padro, obtendo-se uma varivel aleatria
estandardizada ou normalizada Z~N(0,1) (z = (x-m)/s).
Os valores normalizados do uma indicao de quantos
desvios padro o valor se afasta do valor mdio.
165
Distribuies de Probabilidade
Inferncia Estatstica
166
Distribuies de Probabilidade
Inferncia Estatstica
Z
167
Distribuies de Probabilidade
Inferncia Estatstica
168
Distribuies de Probabilidade
Inferncia Estatstica
169
Distribuies de Probabilidade
Inferncia Estatstica
170
Distribuies de Probabilidade
Inferncia Estatstica
171
APLICAES PRTICAS
172
Aplicaes Prcticas
INTRODUO
Pretende-se avaliar a percepo da populao relativamente s
condies de vida antes e aps o 25-04-74.
12 perguntas relativas a condies que consideramos importantes para
a avaliao das condies de vida antes e aps o 25-04-74.
Por cada questo, demos a escolher as seguintes
opes: Melhor, Pior, Igual, No sabe ou No Responde
Aps a recolha de dados, os mesmos foram confrontados com
indicadores existentes do INE que estavam directamente relacionados
com a pergunta efectuada.
A recolha de dados foi feita por meio de inqurito presencial.
173
Aplicaes Prcticas
INTRODUO
Foram efectuados inquritos a 50 pessoas, que tivessem mais do que
18 anos, em Abril de 1974
Esta recolha foi efectuada no segundo semestre de 2009.
Para este trabalho pretende-se efectuar anlises sobre os dados
recolhidos aplicando a matria aprendida nesta disciplina.
174
Aplicaes Prcticas
DADOS DA ANLISE
175
Aplicaes Prcticas
DADOS DA ANLISE
176
Aplicaes Prcticas
DICIONRIO DE DADOS
Dicionrio, para o inqurito:
Respostas aos questionrios
1 NS/NR
2 Pior
3 Igual
4 Melhor
Zona Geogrfica de nascimento:
1 Litoral
2 Interior
Zona Geogrfica onde vive actualmente:
1 Litoral
2 Interior
177
Aplicaes Prcticas
DICIONRIO DE DADOS
Sexo:
1 Masculino
2 Feminino
Nvel Acadmico:
1 No sabe ler nem escrever
4 4 Classe
9 9 Ano
12 12 Ano
13 Licenciatura ou superior
178
Aplicaes Prcticas
DADOS EM ROLL
179
Aplicaes Prcticas
DADOS EM ROLL
180
Aplicaes Prcticas
DADOS AGRUPADOS
Assim, criamos a seguinte tabela de frequncias:
Tabela de Frequncias
181
Aplicaes Prcticas
DADOS AGRUPADOS
Como parmetros mdios so apresentados a mediana, moda e mdia.
Antes de apresentar os clculos das medidas de posio, apresentamos a
legenda das abreviaturas:
fa Frequncia da classe
Fa Frequncia acumulada.
xm = Ponto mdio da classe = (valor inferior da classe + valor superior da classe)/ 2
Bl = Numero inferior da classe em anlise.
N = Elementos da amostra.
Fb = Acumulado de frequncia da classe anterior.
fc = Frequncia da classe em anlise.
i = Amplitude da classe em anlise.
d1 = Diferena entre a frequncia da classe em anlise e a frequncia da classe anterior.
d2= Diferena entre a frequncia da classe em anlise e a frequncia da classe seguinte.
182
Aplicaes Prcticas
MEDIDAS DE POSIO
Para calcular a:
Mediana
Frmula = Bl+ ((n/2 Fb)/fc)x i
1 Calcular n/2 para encontrar a classe da mediana
50/2 = 25; a classe modal que contem a frequncia acumulada 25 a de 59,5
a 65 anos.
Ento,
Me=59,5+((50/2-16)/11)x 5,5=64
183
Aplicaes Prcticas
MEDIDAS DE POSIO
Para calcular a:
Moda
Formula = Bl+ (d1/(d1+d2))x i
Classe modal = classe com mais frequncia, neste caso a classe 54 a 59,5
Mo =54+(16/(16+0))x 5,5=59,5
Com a moda podemos afirmar que 59,5 anos a idade com mais
frequncia nesta amostra.
Media
Formula =
Media = 3222,5/50 = 64,45
Diz que a mdia da idade da amostra de 64 Anos
184
Aplicaes Prcticas
MEDIDAS DE POSIO
185
Aplicaes Prcticas
MEDIDAS DE POSIO
Significa que 80% da amostra tem mais que 57 anos e 20% da amostra
tem idade inferior a 57 anos.
186
Aplicaes Prcticas
MEDIDAS DE POSIO
Calcular P10-Formula=Bl+((10n/100Fb)/fc)x i
1 Calcular n para encontrar a classe do percentil
10n/100 = 10x50/100 = 5
=54+((5-0)/16)x5,5 = 55,72
Significa que 10% da amostra tem menos que 55 anos e 90% da amostra
tem idade superior.
187
Aplicaes Prcticas
ANLISE DA AMOSTRA
Relativamente amostra, elaboramos uma anlise sua constituio e
conclumos o seguinte:
Nr. %
Sexo
Feminino 23 46
Masculino 27 54
Local Nascimento:
Interior 22 44
Litoral 28 56
Local Residncia:
Interior 19 38
Litoral 31 62
188
Aplicaes Prcticas
ANLISE DA AMOSTRA
Quanto ao local de nascimento e local de residncia actual, verifica-se uma
relao de mais pessoas a residir no litoral do que pessoas que tenham
nascido no litoral, sendo uma realidade comprovada pelos dados que revelam
uma migrao da populao do interior para o litoral.
Quanto ao nvel acadmico, verifica-se na tabela abaixo que a amostra contm
42% de populao com nvel acadmico igual ou superior ao 12 ano, no
correspondendo realidade da populao portuguesa.
189
Aplicaes Prcticas
EM RESUMO
Dados da amostra:
Sexo: 50 indivduos, 23 do sexo feminino que representa 46% da constituio
da amostra e 27 do sexo masculino que representa 54% da amostra.
Local de nascimento: 22 indivduos nasceram no interior e representam 44%
da amostra, 28 nasceram no litoral e representam 56 % da amostra.
Local de residncia actual: do interior correspondem 19 indivduos que
representam 38% da amostra, habitantes do litoral so 31 indivduos e
representam 62% da amostra
Nvel acadmico: 3 indivduos no sabem ler nem escrever e representam 6%
dos inquiridos, 13 indivduos tem a 4 classe e representam 26% dos inquiridos,
13 indivduos tem o 9 ano e representam 26% dos inquiridos, 15 indivduos
tem o 12 ano e representam 30% da amostra e 6 indivduos tem um curso
superior e representam 12% da amostra.
190
Aplicaes Prcticas
191
Aplicaes Prcticas
192
Aplicaes Prcticas
Aps esta anlise, efectuamos, de novo com o Excel, a correlao entre todos
os parmetros do inqurito.
193
Aplicaes Prcticas
194
Aplicaes Prcticas
Obtida a tabela, para uma melhor analise, formatamos a tabela com cores
de forma a podermos avaliar a correlao entre os vrios parmetros.
Assim formatamos a azul os dados com valores superiores a -0,35 e
inferiores a 0,35. Assim ficaram a branco os dados que apresentavam uma
correlao superior.
196
Aplicaes Prcticas
197
Aplicaes Prcticas
198
Aplicaes Prcticas
199
Aplicaes Prcticas
CONCLUSES
200
Aplicaes Prcticas
CONCLUSES
201
Anlise de Dados em Auditoria - Exerccio
ANLI
SE
DE
DAD
OS
EM
AUDI
TORI
A
(EXER 202
CCI
Anlise de Dados em Auditoria - Exerccio
Objetivo e mbito do Trabalho
- Para este efeito, vamos suportar os nossos testes com base numa amostra
selecionada considerando critrios estatsticos.
- Ms de referncia Fevereiro 2013.
203
Anlise de Dados em Auditoria - Exerccio
Caracterizao e Descrio da Populao
204
Anlise de Dados em Auditoria - Exerccio
Caracterizao e Descrio da Populao
205
Anlise de Dados em Auditoria - Exerccio
Caracterizao e Descrio da Populao
206
Anlise de Dados em Auditoria - Exerccio
Caracterizao e Descrio da Populao
207
Anlise de Dados em Auditoria - Exerccio
Metodologia
Metodologia
Estratificao dos Dados
208
Anlise de Dados em Auditoria - Exerccio
Metodologia
209
Anlise de Dados em Auditoria - Exerccio
Metodologia
210
Anlise de Dados em Auditoria - Exerccio
Metodologia
Distribuio da Probabilidade
Assimetria da Distribuio
Considerando:
a categoria profissional mais representativa Motoristas TC (tempos
completos);
na faixa etria mais representativa 45 50 anos;
Foi-se avaliar a probabilidade da empresa estar a pagar acima do sector.
211
Anlise de Dados em Auditoria - Exerccio
Metodologia
Distribuio da Probabilidade
Recentragem
No intuito de tornar desnecessria a utilizao da equao estatstica e na
impossibilidade de se elaborar uma infinita tabela de probabilidades, a nossa
varivel aleatria (X=825), ser normalizada convertendo-a na varivel aleatria
normal padronizada (Z), cuja mdia 0 e Desvio-Padro 1.
212
Anlise de Dados em Auditoria - Exerccio
Metodologia
Constituio da Amostra
213
Anlise de Dados em Auditoria - Exerccio
Metodologia
Estratificao de Dados
214
Anlise de Dados em Auditoria - Exerccio
Metodologia
Constituio da Amostra
Atendendo distribuio dos colaboradores por classes, proporcionalmente
teramos o seguinte:
Observao: uma vez que estamos que a trabalhar com pessoas, existe a
necessidade de utilizarmos nmeros inteiros, facto que justifica a diferena entre
o valor calculado estatisticamente (134) e o valor apurado na tabela.
215
Anlise de Dados em Auditoria - Exerccio
Metodologia
Constituio da Amostra
216
Anlise de Dados em Auditoria - Exerccio
Avaliao da Amostra
Avaliao da Amostra
Determinado o n de elementos a analisar, avanamos para a realizao de
testes de Compliance e Substantivos, selecionmos aleatoriamente 137
colaboradores, considerando a informao constante do calculo da amostra.
217
Anlise de Dados em Auditoria - Exerccio
Avaliao da Amostra
218
Anlise de Dados em Auditoria Exerccio
Avaliao da Amostra
Testes Substantivos
Sobre a mesma amostra, efetuamos igualmente testes substantivos:
a) Verificao da existncia do trabalhador;
b) Reclculo das remuneraes variveis (diuturnidades, ajudas de custo,
subsdios de refeio estrangeiro;
c) Comparao da informao dos funcionrios para feitos de retenes de IRS
com a informao real (integridade);
d) Comparao dos mapas de horas trabalhadas com os valores processados;
e) Comparao dos valores processados no ficheiros com os recibos de
vencimento dos colaboradores;
f) Reclculo das retenes de IRS e SS efetuadas;
219
Anlise de Dados em Auditoria - Exerccio
Avaliao da Amostra
Inconformidades
Aps realizados os testes substantivos atendendo ao check-list e compliance,
apurmos inconformidades no processamento salarial de 10 colaboradores.
Trabalhando sobre a seguinte amostra, foram apuradas as seguintes
inconformidades:
a) N12 Expedidor. Erro do valor de IRS. Pela ficha do trabalhador em apreo,
apurou-se que est considerado como casado 2 titulares com 2 filhos quando no
processamento est considerado 1 titular com 2 filhos;
b) Todos. Subsdio de desgaste de fardamento. Nenhum caso est devidamente
parametrizado para incidir IRS;
c) N 44 Valor errado no n de dias processados no subsdio de refeio;
d) N 50 No prpaie regista ausncia entre dias 1 e 15 de Fevereiro, quando
inadvertidamente o operador efetuou uma alterao posterior aps o
processamento. Correo deve ser feita no ms de Maro;
220
Anlise de Dados em Auditoria - Exerccio
Avaliao da Amostra
Inconformidades
e) Custo Hora extra dos Motoristas TPs no est correto;
f) N 54- no foi atribudo ao Motorista o valor de 1 Pequeno Almoo, no Prpaie,
quando pela Folha de Ponto se apurou esse direito no dia 12 fevereiro;
g) N 89 Ao motorista 89 foi atribudo um abono de Subsidio Deslocao ao
estrangeiro Inter de 60, quando deveria ter sido de 65 uma vez que pela folha
de servio essa viagem foi Alemanha;
h) N 154- Foram atribudos 4 dias de subsidio de refeio (4 x 6,06 = 24,24),
quando se apurou que num desses 4 dias o colaborador frequentou uma ao
de formao com mais 6 colegas (Nota de Despesas paga pelo n34);
i) N 54- Este motorista est com 6 diuturnidades (6x 13,36) = 80,16, quando
apenas tem direito a 5 diuturnidades pela sua antiguidade.
221
Glossrio
GLOSS
RIO
222
Glossrio
223
Glossrio
224
Glossrio
225
Glossrio
226
Glossrio
227
Glossrio
228
Glossrio
229
Glossrio
230
Glossrio
231
Glossrio
232
Glossrio
233
Glossrio
234
Bibliografia
BIBLIO
GRA
FIA
235
Bibliografia
BERNSTEIN, Peter. Against the Gods: the remarkable story of risk. Nova Iorque : John
Wiley & Sons, 1996.
COCHRAN, William. Sampling Techniques. 3 ed. Nova Iorque : John Wiley & Sons,
1977. (Wiley Series in Probability and Mathematical Statistics).
LEVINE, David M.; BERENSON, Mark L.; STEPHAN, David. Statistics for Managers
Using Microsoft Excel. New Jersey : Prentice Hall, 1997.
MCGILL, John J. Statistics for Managers Using Microsoft Excel: Microsoft PowerPoint
slides. New Jersey : Prentice Hall, 1997. (Meio Magntico.)
NEWBOLD, Paul. Statistics for Business and Economics. 4 ed. New Jersey : Prentice
Hall, 1995.
236
SPIEGEL,
Murray R. Bibliografia
Estatstica. So
Paulo :
McGraw-Hill,
1976
STEVENSON,
William.
Estatstica
Aplicada
Administrao.
So Paulo :
Harbra, 1986.
TOLEDO,
Geraldo L.;
OVALLE, Ivo I.
Estatstica
Bsica. 2 ed.
So Paulo :
Atlas, 1985.
ANDERSON, R.
J.;
TEITLEBAUM, 237
A. Dollar Unit
Sampling. CA
GENERAL
Accounting Bibliografia
Office. Using
Statistical
Sampling.
Washington,
1992.
. Survey
Sampling and
Measurement.
Nova Iorque :
Academic
Press, 1978, p.
3-11.
LANPHIER, C.
Michael;
BAILAR,
Barbara A. A
Survey of
Surveys: some
sampling frame
problems. In:
NAMBOODIRI,
N. Krishnan 238
(Org.). Survey