Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. Introdução
1.1. Evolução do papel da Estatística
A palavra Estatística provém da palavra latina, Status, que significa Estado. Foi no Estado onde
teve a sua origem, onde era utilizado para denominar levantamentos de dados, cuja finalidade era
orienta-lo no processo de tomada de decisões.
Ao longo da Idade Média e até ao século XVIII a Estatística foi puramente descritiva, onde foi
usada pelos governos nos processos de censos, com o objectivo de conhecer seus habitantes, sua
condição socioeconómica, sua cultura, religião, etc. Foi também utilizado para determinar o valor
dos impostos a cobrar os cidadãos, para determinar a estratégia de uma nova batalha em guerras
que se caracterizavam por uma sucessão de batalhas, pois era fundamental aos comandantes, saber
de quantos homens, armas, cavalos, etc, dispunham após a última batalha.
Estatística é uma ciência exacta que visa fornecer subsídios ao analista para colectar, organizar,
resumir, analisar e apresentar dados. A estatística fornece-nos as técnicas para extrair informação
1
de dados, na medida em que nos dão informação útil sobre o problema em estudo, sendo assim, é
objectivo da Estatística extrair informação dos dados para obter uma melhor compreensão das
situações que representam.
Quando se aborda um problema que envolve métodos estatísticos, estes devem ser utilizados
mesmo antes da recolha dos dados, isto é, deve-se planificar a experiência que vai permitir recolher
os dados, de modo que, posteriormente, se possa extrair o máximo de informação relevante para o
problema em estudo.
População é o conjunto de elementos com pelo menos uma característica comum e de interesse.
Amostra: é um subconjunto da população. A amostra é considerada representativa quando
apresenta as principais características da população de origem, por isso, é estudada com o propósito
tirar conclusões válidas sobre a essa população.
Imparcialidade – Todos os elementos devem ter a mesma oportunidade de fazer parte da amostra
2
Representatividade – Deve conter em proporção as principais características que a população
possui, qualitativa e quantitativamente.
Tamanho – A amostra deve ser suficientemente grande de modo que as suas características se
aproximem tanto quanto possível das características da população.
Parâmetros: são valores singulares que existem na população e que servem para caracterizá-la.
para definirmos um parâmetro devemos examinar toda a população. Os parâmetros, normalmente,
são representados por letras do alfabeto grego (exemplo: media - ; desvio padrão - ).
Chama-se unidade estatística a cada um dos elementos que compõem a população. Cada estudo
estatístico é feito para atingir um certo objectivo. Dependendo do objectivo do estudo, observa-se
cada unidade estatística em relação a um atributo ou atributos determinados. Os atributos
observados podem ser qualitativos ou quantitativos
Um atributo é qualitativo, quando as modalidades não são numéricas ou não são passíveis de
medição, mas podem ser apenas constatadas; uma variável estatística é qualitativa quando se
classifica em diversas modalidades ou categorias e quantitativa quando tem uma modalidade com
intensidades diferentes, ou seja é quantitativa quando for passível de medição. De um modo geral,
os atributos observados quando são qualitativos revestem-se em várias modalidades, e quando são
quantitativos apresentam uma modalidade com diferentes intensidades ou valores.
Variáveis estatísticas - como conceito o termo “variável” é um substantivo que representa classes
de objectos, por exemplo: sexo, grau de escolaridade, renda mensal, participação política, etc.
Evidentemente existem variáveis fáceis de identificar suas modalidades como sexo, mas existem
outras mais complexas como participação política. Uma variável estatística pode ser contínua ou
discreta.
Variável estatística discreta - Quando só pode tomar valores isolados num certo intervalo finito
ou finito.
Ex. X1; X2; X3;...Xn
Exemplo: O número de crianças numa família, número de blocos utilizados na construção de uma
casa, número de viaturas na cidade de Maputo.
3
Variável estatística contínua – Quando pode tomar qualquer valor dentro de um intervalo finito
ou infinito. Ou dado um intervalo a;b com a b, existe um valor x tal que x a, e x b, isto é a
x b. Exemplo, altura de uma pessoa, distância entre dois pontos.
ESCALAS DE MEDIDA
Conforme a natureza dos atributos, existem quatro escalas principais usadas para medi-los.
a) Escalas Nominais - são aquelas que separam os atributos em categorias diferentes onde não
existe uma ordenação em termos de hierarquia. Na utilização destas escalas é preciso que se
obedeçam as seguintes condições:
A divisão deve ser coerente de acordo com um único critério;
b) Escalas Ordinais – baseiam-se numa classificação hierárquica. Através desta escala os atributos
são colocados em determinada ordem conforme o critério adoptado. Exemplo: nível académico,
classe social, etc.
d) Escalas de Razão - a escala de razão são também uma escala de intervalos adoptando um zero
absoluto, pelo que, admitem as quatro operações. Por exemplo, saldo da conta bancária, idade,
peso, etc.
Os dados necessários para a análise estatística podem ser obtidos através de um CENSO (pesquisa
de toda a população), ou através de uma AMOSTRA (subconjunto finito) da população.
Importância da Estatística
A estatística, ou método estatístico, como é denominada algumas vezes, desempenha um papel
crescente e importante em quase todas as pesquisas humanas. Lidando anteriormente apenas com
os negócios de Estado, a influência da estatística estendeu-se agora à Agricultura, Biologia,
Comércio, Química, Comunicações, Economia, Educação, Electrónica, Medicina, Física, Ciências
Políticas, Psicologia, Sociologia e outros numerosos campos da ciência e engenharia onde é usada
no auxílio de tomada de decisões, com o mínimo de erro possível e maior eficiência.
4
A definição de estatística não é única, pelo que será apresentada uma, em forma de resumo de entre
as mais comuns na literatura:
Estatística é uma parte da Matemática que fornece um conjunto de técnicas ou métodos para a
colecta, a organização, a apresentação, a análise e a interpretação de dados quantitativos,
viabilizando a utilização dos mesmos dados na tomada de decisões, com mínimo grau de incerteza.
Por exemplo, o Estado através do Ministério da Agricultura, conduz um censo para apurar o
número de indivíduos que desenvolvem a actividade agrícola, quais os produtos cultivados, em que
áreas o são, qual o resultado da colheita, o que foi vendido, que pestes afectaram a produção, etc.
Estas estatísticas informam ao Ministério para além de várias outras coisas, como é que está a
desenvolver o sector da Agricultura, em quanto irá contribuir a Agricultura para o PIB Nacional e
ajuda na prevenção de possíveis pestes nas colheitas seguintes. A análise dos dados colhidos é
muito importante para se fazer um planeamento adequado.
5
Estatística. A apresentação gráfica dos dados numéricos constitui uma apresentação geométrica
permitindo uma visão rápida e clara do fenómeno.
6º - Análise e interpretação dos dados : A última fase do trabalho estatístico é a mais importante e
delicada. Está ligada essencialmente ao cálculo de medidas e coeficientes, cuja finalidade principal
é descrever o fenómeno (estatística descritiva). Na estatística indutiva a interpretação dos dados se
fundamentam na teoria da probabilidade.
Fenómeno estatístico: é qualquer evento que se pretenda analisar, cujo estudo seja possível a
aplicação do método estatístico.
População (N) é o conjunto, finito ou infinito, de todos os elementos, indivíduos ou objectos que
apresentam em comum pelo menos uma característica definida, cujo comportamento interessa
analisar. A população é estudada em termos de observações de características nos indivíduos
(animados ou inanimados) que sejam relevantes para o estudo, e não em termos de pessoas ou
objecto em si. Por isso, em qualquer estudo estatístico é importante definir bem as características
de interesses dos elementos de uma população para que seja delimitado os elementos que
pertencem à população e os que não pertencem.
Exemplo de população: Estudar o nº de filhos tidos, o tipo de moradia, condições de trabalho,
tempo de trabalho, estado civil, etc., dos docentes da universidade São Tomás.
População: Todos docentes (de tempo inteiro ou parcial) de uma Universidade.
6
A população (Universo) pode ser dividida em finita e infinita.
População Finita: apresenta um número limitado de observações, que é passível de contagem.
Exemplo, Idade dos funcionários do banco XYZ, População: Todos funcionários do banco XYZ.
População Infinita: apresenta um número ilimitado de observações que é impossível de contar e
geralmente esta associada a processos. Exemplo, satisfação dos clientes do supermercado ABC,
população: Todos clientes do supermercado ABC.
Censo: é uma colecta exaustiva de dados relativos a todos os elementos de uma população.
Amostra (n): é um subconjunto da população e deve ser finita. A amostra deve ser seleccionada
seguindo certas regras e deve ser representativa, de modo que ela represente todas as características
da população como se fosse uma fotografia desta.
Exemplo: estudo da satisfação dos estudantes da USTM em relação a qualidade das aulas.
População: todos estudantes da USTM
Amostra: estudantes do 2º ano do curso de Gestão
Dado estatístico: é qualquer característica que possa ser observada ou medida de alguma maneira,
aplicando os métodos estatísticos. As matérias-primas da estatística são os dados observáveis, isto
é, o que é recolhido e preparado para produzir algum resultado.
Variável é uma propriedade dos elementos da população que se pretende conhecer. Pode assumir
qualquer modalidade1 de um conjunto de elementos, o qual denota-se por domínio da variável ou
categoria. Os símbolos utilizados para representar as variáveis são as letras maiúsculas do alfabeto,
tais como X, Y, Z,
Variáveis quantitativas são as que têm por modalidades quantidades numéricas com as quais
podemos fazer operações aritméticas, sendo classificadas em discretas e contínuas
Variáveis quantitativas discretas são as que podem assumir somente valores inteiros, inclusive
zero, num conjunto de valores, isto é, não admitem uma modalidade intermediária entre duas
quaisquer de suas modalidades.
Exemplo: o número de estudantes numa sala de aulas.
Variáveis quantitativas contínuas são aquelas que podem assumir um valor dentro de um intervalo
de valores. É gerada pelo processo de medição.
Exemplo: a temperatura numa cidade.
1
Modalidade é toda manifestação possível de uma variável, isto é, várias hipóteses de respostas, ou
diferentes variações ou valores que uma variável pode assumir.
7
Variáveis qualitativas ou atributos são as observações (dados estatísticos) que apresentam um
carácter qualitativo, não podendo ser medidas em termos numéricos
Atributos Dicotómicos são aqueles que admitem uma subdivisão em apenas duas classes.
Exemplo: quando classificamos os estudantes quanto ao sexo, só podemos ter duas respostas
possíveis: masculino e feminino.
Atributos Múltiplos são aqueles que admitem uma subdivisão em mais de duas classes
Exemplo: quando classificamos os estudantes quanto ao estado civil, podemos ter mais de duas
respostas possíveis: solteiro; casado; divorciado e viúvo
Escalas Nominais – são aquelas que separam os atributos em categorias diferentes não forçando
uma ordenação em termo de hierarquia.
Exemplo: Profissão (1. Contabilista, 2. Informático, 3.Camponês, etc.)
Escalas Ordinais – baseiam-se numa classificação hierárquica. Através desta escala os atributos são
colocados em determinada ordem conforme um critério escolhido.
Exemplo: Cargo numa empresa (1.Presidente, 2.Vice-presidente, 3.administrador, etc.)
Escalas de Razão - são um caso especial das escalas ordinais, as quais são também nominais
hierárquicas. Assim a escala de razão é também uma escala de intervalo dotada de zero absoluto.
Tem essa designação porque a razão dos números da escala é igual a razão que descreve o grau em
que duas pessoas ou objetos possuem um atributo
Exemplo: uma pessoa com peso de100 Kg e uma outra com 50 Kg a razão é 2 : 1
Distribuição de Frequências
Introdução
8
Ao colectar os dados referentes ao fenómeno objecto de estudo, normalmente o analista se defronta
com valores que se repetem algumas ou muitas vezes, sugerindo sua apresentação através de
tabelas, onde somente apareçam valores distintos uns aos outros. Essa providência favorece
evidentemente uma análise e interpretação mais rápida da natureza e comportamento do fenómeno
observado.
Um dos objectivos da Estatística Descritiva quando se trabalha com grandes quantidades de dados
é obter uma significativa redução dos mesmos dados, para facilitar a sua análise.
Para que se possa organizar os dados em frequência é necessário que eles estejam na sua forma
bruta.
Dados brutos – são os dados originais, que ainda não se encontram prontos para análise, por não
estarem numericamente organizados. (Também são conhecidos como Tabela Primitiva).
Exemplo 1: Considere o conjunto dos pesos (em kg) dos 20 estudantes, tirado de uma lista
alfabética da base de dados do Registo Académico
45, 41, 42, 41, 42 43, 44, 41, 50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51
9
Frequência simples acumulada de uma classe ( ): é o total das frequências de todos os valores
inferiores ao limite superior do intervalo de uma determinada classe.
Frequência relativa acumulada de uma classe ( ): é a frequência acumulada da classe, dividida
pela frequência total da distribuição.
observados:
k: é o extremo superior do intervalo de valores do índice i.
fi,:é o número de observações de um valor
n: é o número total de valores observados.
Exemplo 3: Considerando o exemplo anterior, sobre o peso dos 20 estudantes, a tabela de
distribuição de frequência será:
Frequências
1 41 3
2 42 2
3 43 1
4 44 1
Tabela1. Exemplo 5 45 1 da distribuição de frequência
de uma variável não 6 46 2 agrupada em classe
7 50 2
Distribuição de 8 51 1 frequências de dados
agrupados em classe 9 52 1
Quando a variável 10 54 1 objecto do estudo é contínua,
é sempre 11 57 1 conveniente agrupar os
valores observados 12 58 2 em classes. Se por outro lado,
13 60 2
Soma --------- 20 10
a variável é discreta e o número de valores representativos dessa variável é muito grande,
recomenda-se o agrupamento dos dados em classes.
Neste último caso, o procedimento visa evitar certos inconvenientes, como:
Grande extensão da tabela, dificultando, tanto quanto os dados brutos, a leitura e a interpretação
dos resultados apurados;
Aparecimento de diversos valores da variável com frequência nula;
Dificuldade de visualização do comportamento do fenómeno como um todo.
Usando os dados do exemplo 1, abaixo a distribuição dos mesmos em classes
Classes
Frequências
1 41 |------ 45 7
2 45 |------ 49 3
3 49 |------ 53 4
4 53 |------ 57 1
5 57 |------ 61 5
Total 20
Limites da classe: são extremos de cada classe. O menor número é o limite inferior de classe
e o maior número, o limite superior de classe .
Deste modo, o intervalo de classe quanto a sua natureza pode ser aberto, fechado ou misto.
Intervalos abertos – os limites da classe (inferior e superior) não pertencem a ela. Exemplo de
notação: 49 --- 53
Intervalos mistos – um dos limites pertence à classe, e o outro, não. Exemplo de notação: 49 |-----
53 ou 49 ----|53.
11
Não existe regra fixa para se determinar o número de classes (k). Contudo, neste material são
apresentadas algumas:
Regra 1: Por questões de ordem prática e estética sugere-se utilizar de 5 a 20 classes;
Regra 2: o uso da fórmula de Sturges, que nos dá o número de classe em função do número de
valores da variável: onde n é o número de itens que compõe a amostra
Amplitude Total ou “Range” (At) é a diferença entre o maior e o menor número do rol. A
amplitude total pode ser denotada por:
Exemplo 5: o maior peso dos 20 estudantes é de 60 kg e o menor peso é de 41 kg, a amplitude total
será de 19 kg porque ( 60 kg - 41 kg= 19 kg).
Amplitude do intervalo de classe (c): é o valor que representa a quantidade de números que se
encontram entre o limite inferior e limite superior de uma classe, e é constante em todas as classes
de uma mesma distribuição de frequências.
Ponto Médio de classe (PM): é o valor que se encontra no meio dos limites de cada classe
12
C T C T C T C T C T
1 104 9 122 17 129 25 144 33 183
2 108 10 142 18 138 26 151 34 138
3 138 11 106 19 122 27 146 35 115
4 101 12 201 20 161 28 82 36 179
5 163 13 169 21 167 29 137 37 142
6 141 14 120 22 189 30 132 38 111
7 90 15 210 23 132 31 172 39 140
8 154 16 98 24 127 32 87 40 136
13
Sexto passo: Determinar os intervalos de classes:
69.2|---94.8
94.8|---120.4
120.4|---146.0
146.0|---171.6
171.6|---197.2
197.2|---222.8
Medidas de Posição
Medidas de Tendência Central
Medidas de variabilidade
Medidas de Posição
14
As medidas de posição, mais concretamente as de Tendência Central ou promédias são assim
denominados pelo facto de haver uma tendência de os dados observados se agruparem em torno
dos valores centrais.
Dentro do grupo das medidas de tendência central temos a média, a moda, a mediana, que são
as 3 medidas de tendência central mais usadas para resumir o conjunto de valores
representativos do fenômeno que se deseja estudar e serão as abordadas ao longo da ficha.
3.1. Média
É a medida de tendência central mais usada para descrever resumidamente uma
distribuição de frequências. Esta medida dá-nos a informação de qual é o valor que
representa o ponto de equilíbrio de determinado conjunto de dados.
Apesar da existência de vários tipos de média como a aritmética, harmônica,
geométrica, quadrática e outros, nesta ficha iremos abordar somente como se calcula
e interpreta o valor da média aritmética.
(1)
15
Exemplo 1: Num escritório de advogacia há cinco advogados estagiários auferindo
um salário de USD 820, 810, 790, 800 e 780 cada um deles.
O salário médio mensal dos advogados estagiários, de acordo com a definição, será
de:
Nota: A média aritmética simples será calculada sempre que os dados aparecerem
na forma de dados brutos.
16
c. Média aritmética para dados agrupados em uma distribuição de frequência de
valores simples
Quando os dados estiverem agrupados numa distribuição de frequência de valores
simples, a média aritmética será o quociente entre o produto de cada valor do
conjunto de dados pela sua frequência e o número total de observações.
onde (3)
Nº Nº de
de estudantes
irmãs
1 0 3 0
2 1 9 9
3 2 9 18
4 3 3 9
Total 24 36
17
A fórmula será igual a fórmula 3 apresentada:
I Classe PM de xi (C)
1 69.2|---94.8 82 3 246
2 94.8|---120.4 107.6 8 860.8
3 120.4|---146.0 133.2 16 2131.2
4 146.0|---171.6 158.8 7 1111.6
5 171.6|---197.2 184.4 4 737.6
6 197.2|---222.8 210 2 420
Total ------- 40 5507.2
18
Características da Média Aritmética
1. É muito influenciada pelos valores extremos da distribuição
2. Localiza-se em geral na classe de maior frequência
3. É única para um conjunto de dados
3.2. Moda
Símbolo: Mo ou
A Moda é uma medida de tendência central que nos dá a informação acerca do
valor que ocorre com maior frequência em um conjunto de dados. Quanto a
classificação da moda, um conjunto de dados pode apresentar uma distribuição:
Unimodal ou modal – quando possui um único valor de maior frequência
Exemplo 5: no seguinte conjunto de dados 3, 7, 8, 8, 11 possuimos somente um
valor que com maior frquência, que é o valor 8. Estamos perante uma distribuição
modal com Mo=8
Bimodal – quando possui dois valores com o maior e igual número de frequência
Exemplo 6: no seguinte conjunto de dados 3, 3, 7, 8, 8, 11 possuimos 2 valores com
igual valor de frequência que são o 3 e 8. Estamos perante uma distribuição bimodal
com Mo= 3 e 8
19
Para este tipo de distribuição, a identificação da moda e feita pela observação do
elemento que apresenta maior frequência.
Exemplo 8: tomando os dados do exemplo 3, verificamos que estamos perante um
conjunto de dados que possue dois valores com igual e o maior número de
frequências, isto é, fi=9 então Mo=1 e 2. Estamos perante uma distribuição bimodal.
Interpretação: verifica-se que há maior frequência de estudantes com 1 e 2 irmãs.
Onde:
lmo – limite inferior da classe modal (é a classe que apresenta a maior frequência)
fpost – frequência absoluta simples posterior à classe modal
fant - frequência absoluta simples anterior à classe modal
c – amplitude do intervalo de classe
3.3. Mediana
Símbolo: Md ou
A Mediana é o valor real que separa os dados em ROL em duas partes , deixando à
sua esquerda o mesmo número de elementos que à sua direita, isto é, é o valor que
divide a distribuição de dados de tal modo que 50% dos dados sejam superiores à
mediana e 50% sejam inferiores. Por isso é também chamada de separatriz.
20
A moda pode ser verificada em variáveis quantitativas (contínuas e discretas) e
variáveis qualitativas ordinais.
O Nº de observações é impar
Quando o número total de observaçoes é ímpar, o valor mediano é o que se
posição, Md=800
Interpretação: 50% dos advogados estagiários do escritório de advogados auferem
um salário até 800 usd e os outros 50% auferem um salário acima de 800usd
i.
O Nº de observações é par
Para este caso são encontradas duas posições no rol de dados, atravês das
convencionada como sendo a média aritmética dos valores que ocupam essas
posições centrais.
Exemplo 11: Suponha que foi contratado mais um advogado estagiário para o
escritório de advogados, aumentando para 6 os advogados estagiários e que este
último aufere um salário de 700usd. Determine a mediana do conjunto de salários
dos estágiários.
21
j. Cálculo da Mediana de dados agrupados em uma distribuição de frequências por
valores simples
Nº de Nº de
irmãs estudantes
1 0 3 3
2 1 9 12
3 2 9 21
4 3 3 24
Total 24 36
22
2. Identificar a classe que contém o valor da mediana atravês da coluna
de frequência acumulada
3. Aplicar a fórmula
Onde:
– limite inferior da classe mediana
n – número total de observações
– frequência acumulada da classe anterior à classe mediana
– frequência absoluta simples da classe mediana
c – amplitude de itnervalo de classe
I Classe (C)
1 69.2|---94.8 3 3
2 94.8|---120.4 8 11
3 120.4|---146.0 16 27
4 146.0|---171.6 7 34
5 171.6|---197.2 4 38
6 197.2|---222.8 2 40
Total ------- 40
23
Interpretação: 50% dos inqueridos falariam acima de 134.8 minutos por mês e os
restantes 50% falariam até 134.8 minutos
Md=Q2=P50
Q1=P25
Q3=P75
3.4.1. Quartis ( )
Os quartis dividem a distribuição de um conjunto de dados em 4 partes iguais,
sendo que existem 3 quartis:
O divide os dados em duas partes, sendo que 25% dos valores encontram-se
abaixo dele e 75% acima dele.
O divide os dados em duas partes iguais, pois coincide com a Mediana. Neste
caso, 50% dos valores encontram-se abaixo dele e 50% acima dele.
O divide os dados em duas partes, sendo que 75% dos valores encontram-se
abaixo dele e 25% acima dele.
24
(1)
Onde:
– Limite inferior da classe quartílica
n – Número total de observações
– Frequência acumulada da classe anterior à classe quartílica
– Frequência absoluta simples da classe quartílica
c – amplitude de intervalo de classe quartílica
i Classe (C)
1 69.2|---94.8 3 3
2 94.8|---120.4 8 11
3 120.4|---146.0 16 27
4 146.0|---171.6 7 34
5 171.6|---197.2 4 38
6 197.2|---222.8 2 40
Total ------- 40
1.
3.
Interpretação: 25% dos entrevistados iriam falar menos que 154.53 minutos
durante um mês, ou, 75% dos entrevistados iriam falar mais que 154.53 minutos
durante um mês.
25
Diagrama de extremos e quartis (Boxplot)
26
Q3 é representado por um rectângulo (caixa) com a mediana indicada por uma barra.
Considera-se seguidamente duas linhas que unem os lados dos rectângulos com os
chamados valores adjacentes, que definiremos a seguir.
3.4.2. Decis ( )
Os decis dividem a distribuição de um conjunto de dados em 10 partes iguais,
sendo que existem 9 decis.
(2)
Onde:
– Limite inferior da classe do decil
n – Número total de observações
– Frequência acumulada da classe anterior à classe do decil
– Frequência absoluta simples da classe do decil
c – amplitude de intervalo da classe do decil
1.
27
3.
Interpretação: 70% dos entrevistados iriam falar menos que 147.6 minutos
durante um mês, ou, 30% dos entrevistados iriam falar mais que 147.6 minutos
durante um mês.
3.4.3. Percentis ( )
Os percentis dividem a distribuição de um conjunto de dados em 100 partes
iguais, sendo que existem 99 centis:
(3)
Onde:
– Limite inferior da classe do percentil
n – Número total de observações
– Frequência acumulada da classe anterior à classe do percentil
– Frequência absoluta simples da classe do percentil
c – amplitude de intervalo da classe percentil
1.
3.
28
Interpretação: 30% dos entrevistados iriam falar menos que 123.6 minutos
durante um mês, ou, 70% dos entrevistados iriam falar mais que 123.6 minutos
durante um mês.
Md=Q2=P50
Q1=P25
Q3=P75
4. Introdução
Por causa de situações como as descritas acima, torna-se necessário visualizar como
os dados estão dispersos. Para tal, iremos fazer uso das chamadas medidas de
dispersão.
29
As medidas de dispersão podem ser absolutas e relativas. A presente ficha irá
debruçar-se sobre o modo de cálculo e interpretação da Variância e Desvio padrão
(medidas de dispersão absolutas) e Coeficiente de variação (medida de dispersão
relativa) que são as mais comuns.
4.1. Variância
(1) (2)
(3) (4)
30
Como a variância é calculada a partir dos quadrados dos desvios, ela é um número que
apresenta a unidade elevada ao quadrado em relação à variável que não está elevada ao
quadrado; isto se torna um inconveniente em termos de interpretação do resultado. Por
isso, definiu-se uma nova medida com mais utilidade e interpretação prática, o desvio-
padrão.
É definido como sendo a raiz quadrada da média aritmética dos quadrados dos
desvios em relação a média aritmética de um conjunto de números, isto é, é somar
cada diferença do valor do conjunto de dados pela média, elevada ao quadrado, e
dividi-la pelo número total de observações, isto é, o desvio padrão é a raiz quadrada da
variância.
(3)
(4)
Observação:
Quando se trabalha com uma amostra e não com uma população, como acontece na
grande maioria das situações relacionadas com a inferência estatística, ou então
quando o número de observações não é grande , o denominador das
expressões (5) e (6) será igual a (n-1), desvio padrão, e não (n) para obter uma melhor
estimativa do parâmetro da população e o símbolo do desvio padrão será representado
por s e não .
(5) (6)
31
Resolução:
Consumo Nº de usuários
2
Resultado obtido no cálculo da média para dados brutos, na aula teórica 4
32
145|--- 2 155 310 75.5 5700.25 11400.5
165
80 6360 80780
Como foi dito, a variância e o desvio padrão são medidas de dispersão absolutas, deste
modo só podem ser utilizadas para comparar a variabilidade de dois ou mais conjuntos
de dados quando estes apresentarem a mesma média, mesmo número de observações e
estiverem expressos nas mesmas unidades.
(7)
Muitas vezes a fórmula é expressa em percentagem:
(8)
33
Exemplo de uma aplicação do coeficiente de variação:
Considere uma distribuição com média/valor médio igual a 40 e um desvio padrão
igual a 4. Considere agora uma outra distribuição com média/valor médio igual a 5 e
um desvio padrão igual a 4.
Repare-se que o desvio padrão na segunda distribuição tem um peso muito mais
significativo do que na primeira, isto é, a dispersão na 2ª distribuição tem maior efeito
que na 1ª, e no entanto, este é igual em ambas. Ao se determinar o coeficiente de
variação é possível saber de que forma o desvio padrão está para a/o média/valor
médio.
Dispersão baixa:
Dispersão média:
Dispersão alta:
Sexo masculino:
Sexo feminino:
Interpretação: Podemos concluir que o salário médio das mulheres apresenta maior
dispersão relativa (maior variabilidade) em relação a média dos salários, em relação ao
salário médio dos homens, podendo atingir uma dispersão de até 40%.
Quanto a dispersão podemos afirmar que ambos os sexos possuem uma dispersão alta
em relação aos seus valores médios, pois, os seus CV´s estão acima de 30%.
Grupo Médias das notas (de 0-10) Desvio padrão das notas
A 6 2
34
B 6.2 1.5
Observando estes dados, podemos constatar que as notas são expressas na mesma
unidade de medida, e suas médias são quase iguais ou muito próximas. Neste caso é
válido comparar os valores de s, não se obtendo informação adicional significativa
com o uso do CV. Por isso, não há necessidade de muito esforço de raciocínio para
concluir que o grupo B apresentou menos dispersão em relação ao grupo A, tanto em
termos absolutos como relativos.
35