Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTATÍSTICA BÁSICA Aulas planejadas para ministração, em três encontros, da teoria e realização de exercícios tanto de
Conforme o edital n.º 1/2009 – DPRF, de 12 de agosto de 2009 aprendizagem, quanto das provas da FUNRIO. FEDERAL
Programação FORTIUM
NOÇÕES DE ESTATÍSTICA:
1. Descrição e análise de dados;
2. Leitura e Interpretação de tabelas e gráficos apresentados em diferentes linguagens e representações;
3. Cálculo de Médias e Análise de Desvios de um conjunto de dados;
3. Freqüência Relativa.
contínuos) são muito grandes para se usar o cálculo tradicional pode se Multiplicando-se ou dividindo-se todos os valores de uma variável por
usar o método simplificado de cálculo que consiste nos seguintes passos: uma constante (c), a média do conjunto fica multiplicada ou dividida por essa
constante:
4ª propriedade
Calcula-se um novo ponto de referência definido como:
A média das médias é a média global de 2 ou mais grupos.
x j − x0 x1 = 10 n1 = 15
uj = x2 = 18 n2 = 23
h
onde Então: (x1 . n1 ) + (x2 . n2 ) + ... + (xk . nk )
xj – valor das ocorrências (caso discreto) ou ponto médio xG = ---------------------------------------------------
(caso contínuo); n1 + n2 + .... + nk
x0 – valor constante escolhido arbitrariamente entre as ocorrências (caso
discreto) ou pontos médios (caso contínuo). A idéia é escolhê-lo o mais (10 . 15 ) + (18 . 23 )
próximo possível dos valores centrais; xG = -------------------------------- = 14,84
h – diferença entre duas ocorrências consecutivas (caso discreto) ou dois 15 + 23
pontos médios consecutivos (caso contínuo). 5ª propriedade
A soma dos quadrados dos afastamentos contados a partir da média aritmética é
Calcula-se média para os novos valores de referência (uj) calculados;
um mínimo.
Calcula-se a média procurada utilizando a seguinte expressão:
X = hu + x0 Idades ( xi ) di = (xi – x) ∑ di2 = ∑ (xi – x)2
2 d1 = 2 – 6 = -4 (– 4)2 = 16
4 d2 = 4 – 6 = -2 (– 2)2 = 4
Exemplo: Dada a tabela de freqüências abaixo calcule a média
6 d3 = 6 – 6 = 0 ( 0)2 = 0
8 d4 = 8 – 6 = +2 ( +2)2 = 4
10 d5 = 10 – 6 = +4 ( +4)2 = 16
Classes Fj Ponto uj ∑ 0 40
médio
20 |----- 22 2 21 -1 De modo que: ∑ (xi – x)2 = 40 sendo este valor o menor possível. Isso significa
22 |----- 24 5 23 0 que, se tomássemos outro valor que não a média (x), o resultado dessa operação
24 |----- 26 4 25 1 seria maior que o obtido.
26 |----- 28 1 27 2
6ª propriedade
A média aritmética é atraída pelos valores extremos.
Para este exemplo temos: x0 = 23, h = 2
Assim Considere os valores originais:
− 1x 2 + 0 x5 + 1x 4 + 1x 2 xi : 2, 4, 6, 8, 10 → x = 6
u= = 0,4
10
Se o primeiro valor xi for alterado para 0:
xi : 0, 4, 6, 8, 10 → x = 5,6
X = 0,4 x 2 + 23 = 23,80
Se o último valor xi for alterado para 12:
1.3. Média Harmônica xi : 2, 4, 6, 8, 12 → x = 6,4
A média harmônica é definida como
n 2. Mediana (Md)
Mh =
Fj A mediana é a medida estatística que deixa 50% dos valores abaixo de si e
∑ xj
50% acima. Temos dois processos para achar a mediana: um para dados
não agrupados e outro para dados agrupados.
1.4. Média Geométrica
A média geométrica é definida como 2.1. Mediana para dados desagrupados.
Número ímpar de valores
F Quando tivermos dados não agrupados e o número de observações for
Mh = n
∏ xj j ímpar seguimos o seguinte processo.
1.5. Relação entre as médias
Ordenamos os dados em ordem crescente,
Mh ≤ Mg ≤ X n + 1
Calculamos o termo de ordem º ,
2
Propriedades das médias A mediana será o valor colocado nessa posição.
1ª propriedade Exemplo: 1, 5, 2, 3, 4, 7, 5, 8, 1
A soma algébrica dos desvios em relação à média é zero (nula).
∑ di = ∑ (xi - x ) = 0
Ordenando os dados: 1, 1, 2, 3, 4, 5, 5, 7, 8
onde: di são as distâncias ou afastamentos da média.
O termo que queremos tem ordem [(9+1)/2]º = 5º
2ª propriedade Logo Md = 4
Somando-se ou subtraindo-se uma constante (c) a todos os valores de
uma variável, a média do conjunto fica aumentada ou diminuída dessa constante Número par de valores
3ª propriedade
Quando tivermos dados não agrupados e o número de observações for par
seguimos o seguinte processo:
Quando tivermos dados agrupados discretos procedemos da mesma forma Grupo 2 - 4,0 ; 5,0 ; 8,0 ; 7,0 ; 1,0.
dos dados desagrupados, utilizando entretanto recursos provindos da
tabela de freqüências. Se calcularmos a média dos dois grupos vemos que ambos
apresentam a mesma média aritmética, 5,0, mas também vemos
Exemplo: Suponha a seguinte tabela de freqüências claramente que o conjunto de dados provêm de grupos cujos resultados
são bem diferentes.
Ocorrências Fj FAc A diferença entre um grupo e outro se encontra num fato que a
0 2 2 média, assim como qualquer outra medida de posição não pode perceber: a
2 3 5 variabilidade dos dados.
3 5 10 Para caracterizar essas diferenças os estatísticos criaram as
4 4 14 medidas de dispersão, das quais vamos estudar:
Amplitude Total;
Observe que o nº de observações é par (14). Neste caso como no caso Desvio médio;
anterior calcula-se o temo de ordem (n/2)º, que nesse caso é 7º e o Variância;
próximo 8º. A diferença aqui é que para procurar os termos utilizamos a Desvio Padrão;
tabela de freqüências acumuladas utilizando a seguinte regra: a primeira Coeficiente de Variação
vez que a freqüência acumulada dos dados for maior do que a ordem
procurada aquele é o valor naquela ordem. Assim o 5º elemento é 2 (Fac
2+ 3 1. Amplitude Total (AT)
= 5) e o 6º é 3. Neste caso a mediana será Md = = 2,5
2
Se tivermos dados contínuos utilizamos o seguinte processo Ë uma medida muito simples, sendo definida como a diferença entre o
Calculamos o termo de ordem (n/2)º maior e o menor valor das observações, ou seja
Definimos em que classe está a mediana;
Calcula-se a mediana com a fórmula AT = máx - mín
Md = l +
( ( n 2 ) + F )h
ACA
Exemplo: Suponha que temos o seguinte conjunto de dados 1; 2,5; 3; 1; 7;
2; 5. Para esse caso a amplitude total é dada por
FX~
onde AT = máx - mín
l – limite inferior da classe onde está a mediana ;
n – número de observações AT = 7 - 1 = 6
FACA – FAC da classe anterior
OBS - Essa medida tem aplicações muito limitadas pois só capta o que
FX~ - Freqüência Absoluta da classe em que está a mediana acontece com os valores extremos, sendo completamente insensível aos
h – Amplitude de Classe valores intermediários.
Exemplo: Considere a seguinte tabela de freqüências para dados contínuos 2. Desvio Médio (DM)
n - número de observações;
1 (∑ x j Fj )2
S2 =
n− 1
∑ x 2j F j − n
Exemplo: Suponha que temos a seguinte tabela de freqüêcias
Classes Fj
0 |---- 2 1 Exemplo: Retornemos ao exemplo anterior criando mais uma vez colunas
2 |---- 4 3 auxiliares
4 |---- 6 2
6 |---- 8 1 Classes Fj xj xjFj xj2 xj2Fj
0 |----- 2 1 1 1 1 1
Para facilitar a aplicação da expressão do desvio médio, vamos criar 2 |----- 4 3 3 9 9 27
algumas colunas auxiliares na nossa tabela de freqüências, de modo que 4 |----- 6 2 5 10 25 50
nossa nova tabela é dada por: 6 |----- 8 1 7 7 49 49
Totais 7 27 127
Ponto
Classes Fj Médio xjFj |xj - X | |xj - X |Fj Logo
xj
0 |---- 2 1 1 1 2,86 2,86
S2 =
1
127 −
( 27 ) 2 = 3,8
2 |---- 4 3 3 9 0,86 2,58
6 7
4 |---- 6 2 5 10 1,14 2,28
6 |---- 8 1 7 7 3,14 3,14
Totais 7 27 10,86
Algumas propriedades da Variância
As colunas auxiliares são, na verdade, organização do processo aritmético
de cálculo da medida. Observe que para montar a 5ª coluna precisamos (a) Variância de dados constantes é zero;
saber quanto vale a média aritmética. Para tanto podemos usar as colunas (b) Suponha que temos um conjunto de dados tais que a sua variância é
4 e 2 para calcular. Nesse caso temos dada por S2. Suponha que por algum motivo os dados sejam
multiplicados por uma constante c. Assim a variância do conjunto de
27 dados multiplicado pela constante é dada por c2S2.
X= = 3,86
7 (c) Suponha que temos um conjunto de dados cuja variância seja S2.
Assim Suponha que por algum motivo multiplica-se os dados por uma
constante "a" e soma-se ao resultado uma outra constante "b". A nova
10.86 variância dos dados, depois de feitas as operações será a2S2.
DM = = 1.55 .
7
Cálculo simplificado da variância.
3. Variância (S2)
Assim como no caso da média também no caso da variância
existe um processo simplificado de cálculo. Como no caso da média
Outra medida de dispersão em torno da média é a variância que é definida também dividiremos em 3 etapas:
como
• Define-se a seguinte transformação nos dados
S2 =
1
n− 1
( 2
∑ x j − X Fj )
x j − x0
zj =
n
onde
onde
xj - é a j-ésima possível ocorrência (caso discreto) ou o ponto médio da j-
xj - observações originais (no caso de dados desagrupados ou agrupados
ésima classe (caso contínuo);
discretos) ou ponto médio das classes (caso contínuo);
Fj - Freqüência Absoluta da j-ésima ocorrência possível (caso discreto) ou
x0 - constante arbitrária escolhida convenientemente;
da j-ésima classe (caso contínuo);
h - Distancia entre as observações (caso discreto) ou amplitude de classe
X - Média aritmética da amostra; (caso contínuo)
Exemplo: Seja a seguinte tabela de freqüências O desvio padrão é definido tão somente como a raiz quadrada positiva
da variância.
Fj xj
S = S2
8 3
9 6 5. Coeficiente de Variação (CV)
10 4 É uma medida relativa de dispersão. Utilizada para fazer comparação da
11 2 dispersão de duas séries distintas em torno de suas respectivas médias.
Vamos assumir a seguinte transformação Define-se como
S
x j − 10 CV =
zj = X
1 Exemplo: Considere que tenhamos duas séries. A primeira com média 4 e
Neste caso acrescentando uma coluna para os valores transformados desvio padrão 1.5 e outra com média 3 e desvio padrão 1.3. Neste caso
teríamos temos os seguintes CV's:
xj
Fj z j 1. 5
CV1 = = 0.375
8 3 -2 4
9 6 -1 1.3
10 4 0 CV2 = = 0.43
3
11 2 1
Logo, conclui-se que a primeira série tem uma dispersão relativa em
• O próximo passo consiste em calcular a variância dos dados torno da média maior que a segunda.
transformados Em geral CV maior ou igual a 50% é considerado alto, sendo a média
pouco representativa. Valores menores que 50% implicam CV baixo e a
S z2 =
1
n− 1
(
∑ z j − Z Fj
2
) média é tão mais representativa quanto menor for o valor do CV.
1 (
∑ z j Fj )2 MACETES DO VANDECO
=
n− 1
∑ z 2j F j − n (As 6 informações de ouro da Estatística)
Para a MÉDIA, MEDIANA ou MODA
Assim para o nosso exemplo acrescentamos as colunas auxiliares, em I) Quando multiplicamos ou dividimos todos os valores de uma variável (X)
relação a z para o cálculo da variância: por uma constante (k), a sua MÉDIA, MEDIANA ou MODA fica multiplicada ou
dividida pela constante.
II) Quando somamos ou subtraímos uma constante (k) a todos os valores de
xj Fj zj zjFj zj 2 zj2Fj uma variável (X), a sua MÉDIA, MEDIANA ou MODA fica acrescida ou
8 3 -2 -6 4 12 diminuída dessa constante.
9 6 -1 -6 1 6
10 4 0 0 0 0 Para a VARIÂNCIA:
11 2 1 2 1 2 III) Quando multiplicamos ou dividimos todos os valores de uma variável (X)
Totais 15 -10 20 por uma constante (k), a sua VARIÂNCIA fica multiplicada ou dividida pelo
Logo QUADRADO da constante.
1 100 IV) Quando somamos ou subtraímos uma constante (k) a todos os valores de
S z2 = 20 − = 0.95
14 15
uma variável (X), a sua VARIÂNCIA fica INALTERADA, pois a variância de uma
constante é igual a zero.
• O terceiro passo consiste em calcular propriamente a variância dos Para o DESVIO PADRÃO:
dados originais. Para tanto aplica-se a propriedade (c) da variância V) Quando multiplicamos ou dividimos todos os valores de uma variável (X)
pois observe-se que a transformação utilizada pode ser escrita como por uma constante (k), o seu DESVIO PADRÃO fica multiplicado ou dividido
sendo pela constante.
S 2 = h 2 S z2
Logo para o nosso caso temos EXERCÍCIOS
1. Em uma amostra, realizada para se obter informação sobre a distribuição
salarial de homens e mulheres, encontrou-se que o salário médio vale R$ 1.200,00.
S 2 = 1x0,95 = 0,95 O salário médio observado para os homens foi de R$ 1.300,00 e para as mulheres
foi de R$ 1.100,00. Assinale a opção correta.
4. Desvio Padrão (S) a) O número de homens na amostra é igual ao de mulheres.
Pelo fato de a Variância ser uma medida que utiliza o quadrado dos b) O número de homens na amostra é o dobro do de mulheres.
desvios em relação à média, sentiu-se a necessidade de uma medida que c) O número de homens na amostra é o triplo do de mulheres.
utilizasse a mesma unidade dos dados. Esta medida é chamada desvio d) O número de mulheres é o dobro do número de homens.
padrão. e) O número de mulheres é o quádruplo do número de homens.
2. O salário-hora de cinco funcionários de uma companhia, são: 2. A média aritmética de um grupo de 120 pessoas é de 40 anos. Se a média
R$ 75,00; R$ 90,00; R$ 83,00; R$ 142,00 e R$88,00 aritmética das mulheres é de 35 anos e dos homens é de 50 anos, qual o número
Determine: de pessoas de cada sexo, no grupo?
a. a média dos salários-hora; R$ 96,00 (∑ ih + ∑ im)/120 = 40 .: ∑ ih/h = 50 .: ∑ im/m = 35 .: h + m = 120 → 80 mulheres
b. o salário-hora mediano. R$ 88,00 e 40 homens
3. Colocar em ordem de grandeza crescente a média aritmética, a média 13. Sabe-se que a média aritmética de 5 números inteiros distintos, estritamente
geométrica e a média harmônica dos números 6 e 12. positivos, é 16. O maior valor que um desses inteiros pode assumir é: positivo
Resposta: M.H = 8; M.G = 8,4 e M.A = 9 a) 16 b) 20 c) 10 d) 70 x e) 100
14. Num país, a população feminina é 51% do total. A idade média da população
4. Considerando a distribuição abaixo: feminina é 38 anos e da masculina é 36. Então, a idade média da população, em
anos, é: positivo
xi 3 4 5 6 7 8 a) 37,02 x b) 37,00 c) 37,20 d) 36,60 e) 37,05
fi 4 8 11 10 8 3
15. Numa população, a razão do número de mulheres para o de homens é de 11
Calcule: para 10. A idade média das mulheres é 34 e a idade média dos homens é 32.
a) a média; 5,4 Então, a idade média da população é aproximadamente: positivo
b) a mediana; 5 a) 32,9 b) 32,95 c) 33,00 d) 33,05 x e) 33,10
c) a moda. 5
16. Numa classe de uma faculdade existem alunos de ambos os sexos.
5. Em uma classe de 50 alunos, as notas obtidas formaram a seguinte distribuição: Numa prova, as médias aritméticas das notas dos homens e das mulheres foram
respectivamente iguais a 6,2 e 7,0. A média aritmética das notas de toda a classe
NOTAS 2 3 4 5 6 7 8 9 10 foi igual a 6,5. A maior parte dos estudantes dessa classe é composta de meninos
Nº DE ALUNOS 1 3 6 10 13 8 5 3 1 ou de meninas? Justifique sua resposta, calculando a porcentagem de alunos do
sexo masculino.
Determine:
a) a nota média; 5,9 17. Você fez dois trabalhos num semestre e obteve as notas 8,5 e 5,5. Qual deve
b) a nota mediana; 6 ser a nota que você deve tirar no 3º trabalho para que a média dos três seja 7: 7
c) a nota modal. 6
18. Numa empresa, vinte operários têm salário de R$ 4.000,00 mensais; dez
operários têm salário de R$ 3.000,00 mensais e trinta têm salário de R$ 2.000,00
6. Determine a média aritmética de: mensais. Qual é o salário médio desses operários: X = 2.833,33
a.
VALORES 50 60 80 90 19.Numa grande empresa, em três setores pesquisados num determinado dia,
QUANTIDADES 8 5 4 3 foram constatadas faltas de funcionários, assim distribuídos:
R: 64,5 * 4% no setor administrativo;
* 8% no setor de produção;
b. * 12% no setor comercial.
xi 50 58 66 Calcule a média de faltas desse dia, considerando que, no setor de produção, há
200 funcionários, o setor administrativo tem 50 funcionários e o setor comercial
fi 20 50 30
tem 75 funcionários. X = (16 + 2 + 9) / 325 = 8,3%
R: 58,8
20. Um carro, numa viagem, andou 5 horas a 60 km por hora. Determine a
7. Um ourives fez uma liga fundindo 200 g de ouro 14 k (quilates) com 100 g de
velocidade horária média nessas 8 horas de viagem. 76,25 km/h
ouro 16 k. O número que dá a melhor aproximação em quilates de ouro obtido é:
positivo
21. A média aritmética entre 50 números é igual a 38. Dois números são retirados:
a) 14,5 k b) 14,6 k c) 14,7 k x d) 15,0 k e) 15,5 k
o número 55 e o 21. Calcule a média aritmética dos números que restaram. 38
8. Num concurso de vestibular para dois cursos A e B, compareceram 500 EXERCÍCIOS SOBRE DESVIOS
candidatos para o curso A e 100 candidatos para o curso B. Na prova de 1) Calcule o desvio padrão dos conjuntos de dados:
Matemática, a média aritmética geral, considerando os dois cursos, foi 4,0. Mas, a. 1, 3, 5, 9
considerando apenas os candidatos ao curso A, a média cai para 3,8. A média dos b. 20, 14, 15, 19, 21, 22, 20
candidatos ao curso B, na prova de Matemática, foi: positivo c. 17,9; 22,5; 13,3; 16,8; 15,4; 14,2
a) 4,2 b) 5,0 x c) 5,2 d) 6,0 e) 6,2 d. 20, 14, 15, 19, 21, 22, 20
a. 2,96 b. 2,81 c. 3,016 d. 7,04
9. Seja M a média aritmética de 15 números quaisquer. Subtraindo-se 10 unidades
de cada um desses números, obtêm-se 15 novos números, cuja média aritmética 2) Sabendo que um conjunto de dados apresenta para média aritmética e para
é: desvio padrão, respectivamente, 18,3 e 1,47, calcule o coeficiente de variação.
a) M – 15 b) M + 150 c) M – 10 x d) M + 10 e) 10 M positivo 8,03%
3) Em um exame final de Matemática, o grau médio de um grupo de 150 alunos foi
10. Considere um grupo formado por cinco amigos com idade de 13, 13, 14, 14 e 7,8 e o desvio padrão, 0,80. Em Estatística, entretanto, o grau médio final foi 7,3 e
15 anos. O que acontece com a média de idade desse grupo, se um sexto amigo o desvio padrão, 0,76. Em que disciplina foi maior a dispersão? Estatística
com 16 anos juntar-se ao grupo? positivo 4) Medidas as estaturas de 1.017 indivíduos, obtivemos X = 162,2 cm e s = 8,01 cm.
a) Permanece a mesma b) Diminui 1 ano c) Aumenta 12 anos O peso médio desses mesmos indivíduos é 52 kg, com um desvio padrão de 2,3 kg.
d) Aumenta mais de 1 ano e) Aumenta menos de 1 ano x Esses indivíduos apresentam maior variabilidade em estatura ou em peso?
estatura
11. A média aritmética dos números pares de dois algarismos é: positivo 5) Um grupo de 85 moças tem estatura média de 160,6 cm, com um desvio padrão
a) 50 b) 51 c) 52 d) 53 e) 54 x igual 5,97 cm. Outro grupo de 125 moças tem uma estatura média de 161,9 cm,
sendo o desvio padrão igual a 6,01 cm. Qual é o coeficiente de variação de cada 15) Para votar, cinco eleitores demoraram, respectivamente, 3 min 38 s, 3 min 18
um dos grupos? Qual o grupo mais homogêneo? s, 2 min 46 s, 2 min 57 s e 3 min 26 s. Qual foi a média do tempo de votação (em
3,72% e 3,71%, respectivamente; o segundo grupo minutos e segundos) desses eleitores?
6) Um grupo de 100 estudantes tem uma estatura média de 163,8 cm, com um
coeficiente de variação de 3,3%. Qual o desvio padrão desse grupo? 5,41 16) Dois atiradores x e y obtiveram numa série de 20 tiros, num alvo da forma
7) Uma distribuição apresenta as seguintes estatísticas: s = 1,5 e CV = 2,9%. indicada na figura, os seguintes resultados:
Determine a média da distribuição. 51,7
8) Considere as notas de três alunos em Matemática nos quatro bimestres de um
mesmo ano. O professor de Matemática escolherá um deles para representar a
turma numa competição de Matemática, o que tiver a melhor regularidade. Qual
deles será escolhido?
1º Bim 2º Bim 3º Bim 4º Bim Média
Resultado
Atirador
9 Considere as idades dos alunos de 3 grupos A, B e C: 50 30 20 10 0
Grupo A 15 anos 15 anos 15 anos 15 anos 15 anos x 4 6 5 4 1
Grupo B 18 anos 14 anos 13 anos 13 anos 17 anos y 6 3 5 3 3
Grupo C 16 anos 15 anos 13 anos 16 anos 15 anos
a) Qual é a média de pontos por tiro de cada um dos atiradores?
Então: b) Compare os desvios padrão de cada uma das séries de tiros e decida qual é o
a) obtenha a média de idade de cada grupo; atirador com desempenho mais regular.
b) calcule a variância de cada grupo;
c) calcule o desvio padrão de cada grupo. 17) Um professor, após verificar que toda a classe obteve nota baixa, eliminou as
questões que não foram respondidas pelos alunos. Com isso, as notas de todos os
10) Numa competição de salto triplo, três atletas disputavam apenas uma vaga alunos foram aumentadas de 3 pontos. Então:
para uma olimpíada entre faculdades de uma cidade. Cada atleta fez 4 tentativas
A) a média aritmética ficou alterada, assim como a mediana.
obtendo os seguintes resultados:
B) apenas a média aritmética ficou alterada.
Atleta I 16,50 m 15,81 m 16,42 m 16,12 m C) apenas a mediana ficou alterada.
Atleta II 13,90 m 17,01 m 16,82 m 15,10 m D) não houve alteração nem na média nem na mediana.
Atleta III 15,70 m 16,02 m 16,95 m 17,00 m E) nada podemos afirmar sem conhecer o número total de alunos.