Está en la página 1de 56

Estatstica Descritiva

(aula 2)
Curso de Farmcia
Prof. Hemlio Fernandes

1
Estatstica
Tcnicas de amostragem
Populao Amostra
Caractersticas

Anlise
descritiva

Concluses Inferncia
sobre as estatstica Informaes contidas
caractersticas nos dados
da populao
2
Amostragem
Associada a coleta de dados, a tecnologia da amostragem
desenvolveu um conjunto de tcnicas para obteno de
amostras representativas da populao de interesse

Exemplos de utilizao:
Pesquisa de mercado, pesquisa de opinio pblica,
ensaios de medicamentos e em praticamente todo
experimento.

3
Estatstica Descritiva
Etapa inicial da anlise utilizada para descrever,
organizar e resumir os dados coletados.

A disponibilidade de uma grande quantidade de


dados e de mtodos computacionais muito
eficientes revigorou esta rea da Estatstica.

4
Probabilidade

A teoria das probabilidades nos permite


modelar fenmenos aleatrios, ou seja,
aqueles em que est presente a incerteza.
uma ferramenta fundamental para
inferncia estatstica.

5
Inferncia Estatstica

Um conjunto de tcnicas baseadas


em probabilidade, que a partir de
dados amostrais nos permite tirar
concluses sobre a populao de
interesse.

6
Estatstica Descritiva

O que fazer com as observaes


que coletamos?

Primeira Etapa:
Resumo dos dados de variveis de
interesse = Estatstica descritiva
7
Varivel:
Qualquer caracterstica associada a uma populao.

Classificao das variveis quanto a natureza:

NOMINAL sexo, cor dos olhos


QUALITATIVA
ORDINAL classe social, grau de instruo

CONTNUA peso, altura, salrio, idade


QUANTITATIVA
DISCRETA nmero de filhos, nmero de carros
8
Tipos de Variveis

Dependente ou varivel resposta


Independente ou explicativa

9
Variveis Explicativas e
Variveis Resposta.
Entre os objetivos da estatstica est o de
provar se existe ou no relao entre
duas ou mais variveis e formular algum
modelo matemtico para explicar esta
relao.
Variveis Variveis
Explicativas Resposta

10
Suponha que desejssemos realizar uma
investigao sobre a ocorrncia de anemia
numa comunidade: seria interessante poder
estimar a concentrao de hemoglobina no
sangue pela medida do hematcrito

11
Varivel Dependente
a varivel que mede o fenmeno que
se estuda e que se quer explicar;
ex.: asma, que poderia ser medida
categoricamente (nominal: presente ou
ausente; ordinal: asma leve, moderada
ou grave) ou continuamente (alguma
mtrica da funo respiratria).

12
Varivel independente
uma varivel que se considera
candidata a explicar a varivel
dependente; ex.: alergia, que poderia
ser medida categoricamente (nominal:
a caro, a leite de vaca, etc.; ordinal: a
1 alrgeno, a 2 alrgenos, etc.) ou
continuamente (dosagens sricas de
anticorpos).
13
Tipos de variveis
independentes
de Interesse : So aquelas cuja associao
com a varivel dependente constituem o
principal objetivo de um estudo.
de Controle : Usada em um experimento
para garantir representatividade de estratos
da populao na amostra.
de Confuso : uma varivel cujo efeito
distorce a relao entre variveis
dependente e independentes, podendo levar
a concluses errneas, tais como no se
detectar associaes existentes ou detectar
associaes que no existem.
14
Representao dos dados
de variveis qualitativas
em tabelas e grficos

15
O grfico estatstico uma forma de
apresentao dos dados estatsticos, cujo
objetivo o de produzir, no investigador ou
no pblico em geral, uma impresso rpida e
viva do fenmeno em estudo, j que os
grficos falam mais rpidos que as tabelas.

16
REQUISITOS FUNDAMENTAIS

a) Simplicidade
b) Clareza
c) Veracidade

OBS: Os ttulos de tabelas(ou Quadros) e


grficos devem responder 3 perguntas:
O que o dado? Quando foi observado?
Onde foi observado?
17
Os dados podem ser resumidos
construindo-se uma tabela de
distribuio de freqncias, que
quantifica a freqncia das distintas
categorias.

18
Exemplo: Suponha que uma pesquisa foi realizada
com 1124 indivduos. A distribuio dos
indivduos segundo a varivel sexo do chefe
familiar apresenta na tabela a seguir.

Tabela 1: Distribuio dos indivduos pesquisados segundo sexo do chefe familiar


SEXO Frequncia Frequncia (%)
Masculino 737 65,57
Feminino 387 34,43
TOTAL 1124 100

Fonte: Dados Hipotticos

19
Exemplo: Suponha que uma pesquisa foi realizada
com 200 alunos da UFPB. A distribuio dos
alunos, segundo curso apresentada pela tabela a
seguir.

Tabela 2: Distribuio dos alunos pesquisados segundo curso


CURSO Frequncia Frequncia (%)
Farmcia 40 20,0
Estatstica 15 7,5
Histria 22 11,0
Arquivologia 30 15,0
Fisioterapia 30 15,0
Pedagogia 23 11,5
Nutrio 40 20,0
TOTAL 200 100,00
Fonte: Dados Hipotticos 20
Exemplo: O HEMOCENTRO de Joo Pessoa sempre
possui interesse em verificar a distribuio dos tipos de
sangue que esto disponveis para doao.
Tabela 3: Distribuio dos registros de doao, segundo tipo sanguneo

TIPO Frequncia Frequncia (%)


A- 35 6,7
A+ 60 11,4
AB- 90 17,2
AB+ 100 19,0
B+ 25 4,8
B- 70 13,3
O+ 85 16,2
O- 60 11,4
TOTAL 525 100,00

Fonte: Dados Hipotticos

21
Exemplo: Considere uma pesquisa em que so pesquisadas
1126 em Joo Pessoa. A distribuio dos pesquisados
segundo etnia apresentada na tabela a seguir.
Tabela 4: Distribuio dos registros de doao, segundo etnia

ETNIA Frequncia Frequncia (%)


Branca 456 40,5
Parda 531 47,2
Negra 127 11,3
Outra 12 1,1
TOTAL 1126 100,0

Fonte: Dados Hipotticos

22
Grfico de setores

Um crculo dividido em tantos setores


quantas forem as categorias da varivel.
A rea de cada setor proporcional
freqncia da categoria

23
Grfico 1- Distribuio da amostra por sexo do
provedor da famlia.

24
Grfico 2- Distribuio dos alunos da UFPB
segundo curso

25
Grfico 3- Distribuio dos registros do
HEMOCENTRO segundo tipo sanguneo

26
Grfico 4 - Distribuio dos indivduos
pesquisados segundo etnia em Joo Pessoa.

27
Como fazer um grfico de setores?
Resposta: Regra de trs simples.
Passo 1: Associe o total da tabela ao valor
total da medida, em graus de uma
circunferncia (360).
Passo 2: O tamanho de cada fatia do
grfico uma medida x, obtida da seguinte
forma para cada categoria da tabela:
TOTAL DA TABELA 360
CATEGORIA x 28
Exemplo: Para os dados da tabela 1, por
exemplo, temos que:
737 360
Categoria masculino: x 236
1124

387 360
Categoria feminino: x 124
1124

29
Grfico de barras (ou colunas)

Sobre um eixo, so representados


retngulos, um para cada categoria da
varivel. A altura do retngulo
proporcional freqncia da categoria

30
Grfico 5- Distribuio da amostra por sexo do
provedor da famlia.
70,00%
65,57%

60,00%

50,00%

40,00%
34,43% Masculino
30,00% Feminino

20,00%

10,00%

0,00%
Masculino Feminino

31
Grfico 6- Distribuio dos alunos da UFPB
segundo curso

32
Grfico 7 - Distribuio dos registros do
HEMOCENTRO segundo tipo sanguneo

120

100

80

60

40

20

A- A+ AB- AB+ B+ B- O+ O-
33
Grfico 8 - Distribuio dos indivduos
pesquisados segundo etnia em Joo Pessoa.

Outra

Negra
Branca
Parda
Negra
Parda Outra

Branca

0,0% 5,0% 10,0% 15,0% 20,0% 25,0% 30,0% 35,0% 40,0% 45,0% 50,0%

34
Como fazer um grfico de barras?

Passo 1: Indique as categorias em um dos


eixos do grfico (X ou Y);
Passo 2: Crie retngulos para cada
categoria. Cada retngulo ter tamanho igual
ao valor da categoria na tabela. Se preferir,
voc pode fazer este mesmo procedimento
utilizando os percentuais das categorias.

35
Podemos tambm construir tabelas de freqncias
conjuntas (tabelas de contingncia), relacionando duas
variveis qualitativas.
Exemplo 1: H indcios de associao entre Sexo e raa do
provedor da famlia?

Qual o significado dos valores desta tabela?


Como concluir? 36
Verificar associao atravs da:
- porcentagem segundo as colunas, ou
- porcentagem segundo as linhas?

Qual o significado dos valores desta tabela?


Como concluir?
37
Grfico 9- Distribuio da amostra segundo raa
e sexo do provedor da famlia. Joo Pessoa, 2007.

500
431
450

400

350 321 Branca


300 Parda
250 Preta
208
200 Outra
150
91
100
25 36
50
7
5
0
Masculino Feminino

38
Grfico 10 - Distribuio da amostra segundo raa e
sexo do provedor da famlia. Joo Pessoa, 2007.

500 431
450
400
321
350
300 208
250 masculino
200 feminino
150 91
100 25
36 5
50 7
0
branca parda preta outra

39
Variveis Quantitativas

MEDIDAS DE POSIO:
Mnimo, Mximo, Moda, Mdia, Mediana, Percentis

MEDIDAS DE DISPERSO:
Amplitude, Varincia, Desvio Padro, Coeficiente
de Variao.

40
Medidas de Posio
Mximo (max): a maior observao
Mnimo (min): a menor observao
Moda (mo): o valor (ou atributo) que
ocorre com maior freqncia.

Dados: 4, 5, 4, 6, 5, 8, 4
max = 8 min = 4 mo = 4

41
Mdia:
n

x1 x2 x3 ... xn x i
x i 1

n n

Dados: 2, 5, 3, 7, 8
25378
x 5
5
42
Mediana:
A mediana o valor da varivel que
ocupa a posio central de um
conjunto de n dados ordenados.

Posio da mediana: n+1


2

43
Exemplos:

Dados: 2, 6, 3, 7, 8 n = 5 (mpar)
Dados ordenados: 2 3 6 7 8 5+1 = 3 Md=6
2
Posio da Mediana

Dados: 4, 8, 2, 1, 9, 6 n = 6 (par)
Dados ordenados: 1 2 4 6 8 9 6+1 = 3,5
2
Md
Md = (4 + 6) / 2 = 5

44
Percentis:
O percentil de ordem p 100 (0 < p < 1), em um
conjunto de dados de tamanho n, o valor da varivel
que ocupa a posio p (n + 1) do conjunto de dados
ordenados.

Casos particulares:
percentil 50 = mediana ou segundo quartil (Md)
percentil 25 = primeiro quartil (Q1)
percentil 75 = terceiro quartil (Q3)
percentil 10 = primeiro decil
45
Dados: 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7 n=10

Posio de Md: 0,5(n+1)= 0,511= 5,5 Md = (3 + 3,1)/2 = 3,05


Posio de Q1: 0,25 (11) = 2,75 Q1=( 2+2,1)/2=2,05
Posio de Q3: 0,75 (11) = 8,25 Q3=(3,7+6,1)/2=4,9
Md = 3,05 Q1 = 2,05 Q3 = 4,9

Dados: 0,9 1,0 1,7 2,9 3,1 5,3 5,5 12,2 12,9 14,0 33,6
n=11
Md = 5,3 Q1 = 1,7 Q3 = 12,9
46
Exemplo 2: Considere as notas de um teste de 3 grupos de alunos

Grupo 1: 3,4,5,6,7 Grupo 2: 1, 3, 5, 7, 9 Grupo 3: 5,5,5,5,5

* * * * *
G1

* * * * *
G2
*
*
*
*
G3 *

0 5 10
_ _ _
Temos: x1 = x2 = x3 = 5 e md1= md2= md3 = 5
47
Medidas de Disperso
Finalidade: encontrar um valor que resuma a
variabilidade de um conjunto de dados
Amplitude (A):
A = mx - min
Para os grupos anteriores, temos:
Grupo 1, A = 4
Grupo 2, A = 8
Grupo 3, A = 0
48
Varincia:
( x x ) 2
( x x ) 2
... ( x x ) 2 n (x x ) 2
Varincia s 2 1 2 n i
n 1 i 1
n 1

Desvio padro:

Desvio Padro s Varincia

49
Clculo para os grupos:

G1: s2 =(3-5)2+(4-5)2+ (5-5)2+ (6-5)2+ (7-5)2


4
s2 = 10/4= 2,5 s = 1,58

G2: s2 = 10 s = 3,16

G3: s2 = 0 s = 0
50
Frmula alternativa:
n
Xi
2
nX
2

2 i 1
S
( n 1)

Em G1: Xi2 = 9 + 16 + 25 + 36 +49 = 135


S2 = 135 - 5(5)2 = 2,5
4
51
Como fazer os clculos sem
dificuldade?
Resposta: Basta lembrar das tabelas a seguir:

52
Esta construo permite a compreenso adequada
das frmulas. A grande maioria das frmulas so
escritas em funes de somas. 53
Coeficiente de Variao (CV)
- uma medida de disperso relativa
- elimina o efeito da magnitude dos dados
- exprime a variabilidade em relao mdia

s
CV 100%
x

54
Exemplo 3:
Altura e peso de alunos

Desvio Coef. de
Mdia
Padro Variao

Altura 1,143m 0,063m 5,5%


Peso 50 kg 6kg 12%

Concluso: Os alunos so, aproximadamente,


duas vezes mais dispersos quanto ao peso do que
quanto altura.
55
Exemplo 4:
Altura (em cm) de uma amostra de recm-
nascidos e de uma amostra de adolescentes
Desvio Coef. de
Mdia
padro variao

Recm-nascidos 50 6 12%
Adolescentes 160 16 10%

Concluso: Em relao s mdias, as alturas dos


adolescentes e dos recm-nascidos apresentam
variabilidade quase iguais. 56

También podría gustarte