Está en la página 1de 352

Universidade Federal de Santa Catarina

Centro Tecnolgico
o
Departamento de Informtica e Estat
a
stica

ESTAT
ISTICA BASICA APLICADA AS CIENCIAS

AGRONOMICAS E BIOLOGICAS
Com Noes de Experimentao
co
ca

Prof. Paulo Jos Ogliari, Dr.


e
Prof. Dalton Francisco de Andrade, PhD.

Este material consiste numa experincia para


e
preparao de um livro que possa ser utica
lizado nos cursos de graduao em Engenca
haria Agronmica e Cincias Biolgicas, e por
o
e
o
prossionais nessas reas que necessitam de
a
conhecimentos em Estat
stica Bsica.
a

FLORIANOPOLIS
Santa Catarina - Brasil
Julho - 2003

Sumrio
a
1 Introduo Geral
ca
1.1 A Cincia Estat
e
stica na Pesquisa Agronmica e Biolgica
o
o
1.1.1 Forma de coleta dos dados . . . . . . . . . . . . . .
1.1.2 Erro Experimental ou Res
duo . . . . . . . . . . . .
1.1.3 Anlise Exploratria de Dados . . . . . . . . . . . .
a
o
1.1.4 Inferncia Estat
e
stica . . . . . . . . . . . . . . . . .
1.1.5 Teoria da Probabilidade e seus Modelos . . . . . . .
1.2 A Estat
stica e o Mtodo Cient
e
co . . . . . . . . . . . . .
1.3 Aspectos do Planejamento Estat
stico de um Experimento
1.3.1 Experimentos com um Fator e mais de um Fator . .
1.3.2 Tratamento Controle . . . . . . . . . . . . . . . . .
1.3.3 Variveis e Covariveis . . . . . . . . . . . . . . . .
a
a
1.3.4 Repetio e Casualizao . . . . . . . . . . . . . . .
ca
ca
1.4 Exerc
cios Propostos . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

2 Anlise Exploratria de Dados


a
o
2.1 Organizaao, Resumo e Representaao de Dados . . . . . . . . . . . . . . . .
c
c
2.1.1 Introduao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
c
2.1.2 Classicaao das Variveis Selecionadas para o Estudo . . . . . . . .
c
a
2.1.3 Distribuioes de Freqncias. Representao em Tabelas e Grcos .
c
ue
ca
a
2.1.3.1 Distribuioes de Freqncias de Variveis Qualitativas. Repc
ue
a
resentao em Tabelas . . . . . . . . . . . . . . . . . . . . .
ca
2.1.3.2 Representaes Grcas de Variveis Qualitativas . . . . . .
co
a
a
2.1.3.3 Exerc
cios Propostos . . . . . . . . . . . . . . . . . . . . . .
2.1.3.4 Tabelas de Contingncia . . . . . . . . . . . . . . . . . . . .
e
2.1.3.5 Exerc
cios Propostos . . . . . . . . . . . . . . . . . . . . . .
2.1.3.6 Coeciente de Contingncia de Pearson . . . . . . . . . . . .
e
2.1.3.7 Exerc
cios Propostos . . . . . . . . . . . . . . . . . . . . . .
2.1.3.8 Distribuioes de Freqncias de Variveis Quantitativas: Dic
ue
a
agrama de Pontos, Grco de Colunas e Histograma . . . .
a
2.1.3.9 Exerc
cios Propostos . . . . . . . . . . . . . . . . . . . . . .

5
5
5
6
7
8
11
13
19
20
21
22
22
23
25
25
25
26
29
29
35
38
42
47
48
53
53
65

2.2

2.1.3.10 Ramo-e-Folhas . . . . . . . . . . . . . . . . . . . . . . . . . 66
2.1.3.11 Exerc
cios Propostos . . . . . . . . . . . . . . . . . . . . . . 70
Algumas Medidas Associadas ` Variveis Quantitativas . . . . . . . . . . . . 72
a
a
2.2.1 Medidas de Tendncia Central . . . . . . . . . . . . . . . . . . . . . . 72
e
2.2.2 Medidas de Disperso . . . . . . . . . . . . . . . . . . . . . . . . . . 80
a
2.2.2.1 Exerc
cios Propostos . . . . . . . . . . . . . . . . . . . . . . 88
2.2.3 O Uso da Mediana e dos Quartis na Interpretaao de um Conjunto de
c
Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
2.2.4 Desenho Esquemtico (em ingls leia-se Box Plot) . . . . . . . . . . . 93
a
e
2.2.4.1 Exerc
cios Propostos . . . . . . . . . . . . . . . . . . . . . . 97
2.2.5 Coeciente de Correlaao . . . . . . . . . . . . . . . . . . . . . . . . . 98
c
2.2.5.1 Exerc
cios propostos . . . . . . . . . . . . . . . . . . . . . . 103
2.2.6 Ajuste da Equaao de uma Reta . . . . . . . . . . . . . . . . . . . . . 105
c
2.2.6.1 Exerc
cios propostos . . . . . . . . . . . . . . . . . . . . . . 110

3 Modelos de Probabilidades para Experimentos


3.1 Introduao . . . . . . . . . . . . . . . . . . . . .
c
3.2 Conceitos Fundamentais . . . . . . . . . . . . .
3.3 Operaoes com Eventos . . . . . . . . . . . . . .
c
3.4 A Probabilidade de Um Evento . . . . . . . . .
3.5 Conceito de Probabilidade . . . . . . . . . . . .
3.6 A Regra da Adiao . . . . . . . . . . . . . . . .
c
3.7 Probabilidade Condicional e Independncia . . .
e
3.8 Teorema de Bayes . . . . . . . . . . . . . . . . .
3.9 Exerc
cios Propostos . . . . . . . . . . . . . . .

Simples
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

112
112
116
120
123
124
126
128
132
137

4 Modelos de Probabilidades para Variveis Aleatrias Discretas


a
o
142
4.1 Introduao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
c
4.2 O Conceito de Varivel Aleatria Discreta e Funao de Probabilidade . . . . 143
a
o
c
4.3 O Valor Esperado de Uma Varivel Aleatria Discreta. Varincia. Propriedades145
a
o
a
4.4 Alguns Modelos Probabil
sticos para Variveis Aleatrias Discretas . . . . . 154
a
o
4.5 Distribuiao de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
c
4.6 A Distribuiao Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
c
4.7 Distribuiao de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
c
4.8 Exerc
cios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173

5 Modelos de Probabilidades para Variveis Aleatrias Cont


a
o
nuas
5.1 Introduao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
c
5.2 O Valor Esperado de Uma Varivel Aleatria Cont
a
o
nua . . . . . . . . . . .
5.3 A Distribuiao Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
c
5.3.1 Introduao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
c
5.3.2 A Distribuio Normal Padro . . . . . . . . . . . . . . . . . . . . .
ca
a
5.3.3 O Uso da Tabela da Distribuio Normal Padro . . . . . . . . . .
ca
a
5.3.4 A Distribuio Normal como Aproximaao da Distribuiao Binomial
ca
c
c
5.3.5 Exerc
cios propostos . . . . . . . . . . . . . . . . . . . . . . . . . .
6 Introduo ` Inferncia Estat
ca a
e
stica
6.1 Introduao . . . . . . . . . . . . . . . . . . . . . . . .
c
6.2 Estat
sticas e Parmetros . . . . . . . . . . . . . . . .
a
6.3 Como Selecionar Uma Amostra . . . . . . . . . . . .
6.4 Amostragem Casual Simples . . . . . . . . . . . . . .
6.4.1 Obtenao de Uma Amostra Aleatria Simples
c
o
6.5 Distribuioes Amostrais . . . . . . . . . . . . . . . .
c
6.5.1 Distribuiao Amostral da Proporao . . . . .
c
c
6.5.2 Distribuiao Amostral da Mdia . . . . . . . .
c
e
6.6 Exerc
cios Propostos . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

7 Avaliao dos Parmetros


ca
a
7.1 Introduao . . . . . . . . . . . . . . . . . . . . . . . . . . .
c
7.2 Propriedades dos Estimadores . . . . . . . . . . . . . . . .
7.3 Mtodos para Encontrar Estimadores . . . . . . . . . . . .
e
7.4 Estimativas Pontuais e Intervalares . . . . . . . . . . . . .
7.4.1 Intervalo de Conana para a Mdia da Populao
c
e
ca
7.4.2 Intervalo de Conana para Uma Proporo . . . .
c
ca
7.4.3 Erro de Estimaao ou de Amostragem . . . . . . .
c
7.4.4 Determinaao do Tamanho da Amostra . . . . . . .
c
7.5 Exerc
cios Propostos . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

183
183
187
189
189
193
195
199
203

.
.
.
.
.
.
.
.
.

209
209
212
213
215
217
219
220
228
236

.
.
.
.
.
.
.
.
.

238
238
238
241
243
247
252
254
256
264

8 Testes de Hipteses Sobre os Parmetros


o
a
268
8.1 Introduao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268
c
8.2 Testes de Hipteses Unilaterais e Bilaterais . . . . . . . . . . . . . . . . . . . 275
o
8.3 Erros Tipo I e Tipo II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275

8.4

8.5

8.6

Testes de Mdias Populacionais . . . . . . . . . . . . . . . . . . . . . . . . .


e
8.4.1 Teste de Uma Mdia Populacional Quando a Varincia Populacional
e
a
for Desconhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4.2 Teste de Duas Mdias Populacionais com Varincias Populacionais Dee
a
sconhecidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Teste Para Proporoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
c
8.5.1 Teste Para Uma Proporo Populacional . . . . . . . . . . . . . . . .
ca
8.5.2 Teste de Duas ou Mais Propores (Teste de Qui-Quadrado) . . . . .
co
Exerc
cios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

277
278
283
297
297
300
305

Bibliograa

314

Apndice 1: Tabela da distribuio binomial


e
ca

316

Apndice 2: Tabela da distribuio de Poisson


e
ca

326

Apndice 3: Tabela da distribuio normal padro


e
ca
a

328

Apndice 4: Tabela da distribuio t de Student


e
ca

330

Apndice 5: Tabela da distribuio de Qui-Quadrado


e
ca

332

Apndice 6: Tabela da distribuio F


e
ca

334

Apndice 7: Tabela de n meros aleatrios


e
u
o

337

Respostas de Alguns dos Exerc


cios

339

1
1.1

Introduo Geral
ca
A Cincia Estat
e
stica na Pesquisa Agronmica e Biolgica
o
o

A estat
stica uma cincia que se preocupa com o planejamento de uma pesquisa, envole
e
vendo desde a forma de coleta das observaoes, obtidas em experimentos ou levantamentos,
c
at a maneira como ser feita a organizao, a descriao, o resumo dos dados, e a avaliaao
e
a
ca
c
c
e armaao sobre caracter
c
sticas de interesse do pesquisador.
As anlises estat
a
sticas dependem da forma de como os dados so coletados, e o planejaa
mento estat
stico da pesquisa indica o esquema sob o qual os dados sero obtidos. Portanto,
a
o planejamento da pesquisa e a anlise estat
a
stica dos dados obtidos esto intimamente
a
ligados.
Planejamento da pesquisa Anlise estat
a
stica
Dessa forma, o pesquisador deve possuir um razovel conhecimento de estat
a
stica para

desenvolver suas pesquisas, ou, ento, consultar um estat


a
stico para auxili-lo. E importante
a
frisar que esta consulta deve ser feita antes do in da pesquisa, ainda durante a fase de
cio
elaboraao do projeto.
c
1.1.1

Forma de coleta dos dados

Em alguns casos, como por exemplo, na descriao de novas espcies orestais, os dados
c
e
so obtidos atravs da simples observao de como o fenmeno acontece na natureza. Neste
a
e
ca
o
caso, no so feitas alteraoes no fenmeno em estudo. Outro exemplo, o estudo sobre os
a a
c
o
e
efeitos da poluiao ambiental de uma regio sobre animais roedores de determinada espcie.
c
a
e
Neste caso, um certo nmero de animais (amostra), capturados na regio estudada, ser analu
a
a
isado contando o nmero de microncleos existentes a cada cinco mil clulas (caracter
u
u
e
stica
estudada).
Levantamento: observa-se o fenmeno na natureza
o
Por outro lado, em muitas outras situaes, as observaes precisam ser geradas e so
co
co
a
feitas comumente sob condioes controladas pelo pesquisador, e os fatos, eventos ou fenmenos
c
o

a serem estudados so forados a sofrer variaoes sistemticas, mediante a aplicao de


a
c
c
a
ca
tratamentos. Na experimentaao, entende-se por tratamento, as variaes de um fator a
c
co
ser estudado. Um exemplo disto, seria analisar a produao de milho mediante a aplicao
c
ca
de diferentes doses de nitrognio. As diferentes doses de nitrognio constituiriam os tratae
e
mentos. Os outros fatores, como por exemplo, diferenas na fertilidade e umidade do solo,
c
existncia de pragas e ervas daninhas, que podero inuir nos resultados obtidos (produo
e
a
ca
nal de milho), so minimizados, tanto quanto poss
a
vel, do ponto de vista prtico. Neste
a
caso temos ento um experimento. A funao do experimento determinar as relaes de
a
c
e
co
causa e efeito, como por exemplo, vericar como as doses de nitrognio (causa) inuenciam
e
na produao de milho (efeito).
c
Experimento: causa efeito

1.1.2

Erro Experimental ou Res


duo

Quando instala-se um experimento, desejamose vericar o efeito de diferentes tratamentos, sendo que, os demais efeitos, que no os de tratamentos, devem ser controlados ao
a
mximo do ponto de vista prtico. Portanto, as pulverizaoes com produtos qu
a
a
c
micos, as
capinas, as mensuraoes, etc. devem ser feitas de modo o mais homogneo poss em todo
c
e
vel
o experimento. Da mesma forma, a disponibilidade de gua, a temperatura, a umidade e
a
as sementes utilizadas, devem ser as mais similares poss
veis. Acontece que, na prtica, por
a
maiores que sejam os esforos dos pesquisadores para homogeneizar todos esses efeitos, isto
c
no poss
a e
vel, sempre levando ` ocorrncia de variaoes casuais ou aleatrias. Isto pode ser
a
e
c
o
vericado quando, ao repetir o experimento, sob condies as mais prximas poss
co
o
veis do
experimento anterior, obtemos resultados diferentes. Essas variaoes so chamadas de erro
c
a

experimental ou simplesmente erro. E bom chamar a atenao que apesar do termo erro,
c
isto no signica que o experimento foi mal feito. Muitos preferem o termo res
a
duo para
caracterizar essas variaes aleatrias. Vale a pena ressaltar que essas variaoes tambm
co
o
c
e
ocorrem para dados obtidos atravs de levantamentos.
e
Finney (1952) diz que o propsito da cincia estat
o
e
stica fornecer uma base objetiva para
e
a anlise de problemas nos quais os dados esto sujeitos a variao do acaso. Por maiores que
a
a
ca
sejam os conhecimentos de um pesquisador sobre, por exemplo, nutriao e siologia animal,
c
ele jamais ser capaz de predizer com exatido qual vai ser o peso de um su criado
a
a
no
sob determinadas condioes. Existe um grande nmero de causas que fazem este resultado
c
u

variar, como, por exemplo, variaoes genticas, de temperatura ambiental, umidade, doenas,
c
e
c
etc. Assim, quando o elemento acaso est presente em um problema, diculdades reais so
a
a
introduzidas. Observe que estamos interessados em estudar os fenmenos ditos aleatrios,
o
o
isto , aqueles em que o elemento do acaso est presente.
e
a

E importante ressaltar que quase tudo que fazemos no nosso cotidiano so fenmenos
a
o
aleatrios e, portanto, apresentam uma chance de ocorrncia devido ao acaso. Assim sendo,
o
e
seria desejvel determinar qual a sua probabilidade de ocorrncia. Para tal nalidade
a
e
e
precisamos estabelecer o modelo probabil
stico adequado.
Fenmeno aleatrio Modelo probabil
o
o
stico
A seguir, vamos apresentar duas partes importantes da estat
stica, quais sejam: anlise
a
exploratria de dados e inferncia estatstica.
o
e

1.1.3

Anlise Exploratria de Dados


a
o

Todo o trabalho de anlise estat


a
stica inicia com a anlise exploratria de dados. Em
a
o
muitos casos, com uma boa anlise exploratria de dados, atende-se aos objetivos da pesquisa
a
o
(principalmente em alguns estudos realizados atravs de levantamentos), enquanto em outros,
e
ela serve como uma primeira aproximaao da anlise nal.
c
a
O conceito de estat
stica, como poder ser visto ainda neste cap
a
tulo, bastante amplo
e
e engloba a noao usual que as pessoas tm do que seja estat
c
e
stica. Esse conceito usual
logo relaciona a estat
stica com tabelas, grcos, taxas,
a
ndices, nos quais os dados obtidos
so representados. Assim, ouvimos falar da produtividade mdia do milho no Estado de
a
e
Santa Catarina,
ndice pluviomtrico mensal, anual,
e
ndice da inao, taxa de desemprego,
ca
estat
sticas da sade pblica, estat
u
u
sticas da loteria, do aumento da produao de ma em
c
ca
Santa Catarina, etc. Essa parte, utilizado para descrever fatos, , de forma bastante aproe
priada, apresentado nos livros como anlise exploratria de dados. Ela se preocupa com
a
o
a organizaao, apresentaao, simplicaao e descriao (e no explicao) dos dados. Este
c
c
c
c
a
ca
enfoque de anlise exploratria de dados foi introduzido por Tukey (1971), no seu livro:
a
o
Exploratory Data Analysis. A anlise exploratria de dados utiliza-se muito de tcnicas
a
o
e
visuais e procura vislumbrar alguma regularidade quase sempre presente num conjunto de
dados, podendo sugerir modelos que possam ser utilizados na inferncia estat
e
stica.
Exemplo. Foi feito um experimento para estudar a durao, em dias, do quinto estdio
ca
a
ninfal de Triatoma klugi com alimentao em galo. Os resultados so apresentados na tabela
ca
a

Tabela 1.1: Valores da duraao em dias do quinto estdio ninfal de Triatoma klugi com
c
a
alimentao em galo, MIP, UFSC, Florianpolis, SC, 2001.
ca
o
26 37 39 40 41 42 42
43 44 45 45 45 45 45
47 48 48 48 48 48 49
49 49 51 51 51 52 53
53 53 56 57 60 62 62
13
12

Nmero de observaes

11
10
9
8
7
6
5
4
3
2
1
0

26

31

36

41

47

52

57

62

Durao do quinto estdio ninfal em dias

Figura 1.1: Histograma da duraao, em dias, do quinto estdio ninfal de Triatoma klugi
c
a
1.1. Esses resultados foram representados atravs de um histograma dado na gura 1.1.
e
Duas interpretaoes so: 1) um valor para representar os dados igual a 48 dias; 2) observac a
e
se no histograma uma cauda mais longa em direo aos valores menores, assim, diz-se que
ca
a distribuio levemente assimtrica ` esquerda, ou seja, existe uma concentraao maior
ca e
e
a
c
de valores em torno e acima do valor representativo. A anlise exploratria de dados ser
a
o
a
estudada na seao 2.
c
1.1.4

Inferncia Estat
e
stica

H ainda todo um campo bastante amplo da cincia estat


a
e
stica que se refere ` anlise e
a a
` interpretao do conjunto total de dados, observando-se somente uma parte deles. Essa
a
ca

parte, conhecida como Estat


e
stica Indutiva ou Inferencial e normalmente escapa a noao
c
corrente da grande maioria das pessoas.
Para deixar mais clara a nalidade da estat
stica inferencial, necessrio fazer a apree
a
sentao de dois conceitos fundamentais, que so: Populao e Amostra.
ca
a
ca
Uma populao consiste de todos os valores poss
ca
veis de uma caracter
stica desejvel.
a
Os valores que compem uma populaao, podem ser diferentes entre si, e a mesma pode
o
c
apresentar um tamanho innito. Na experimentao a deniao de populaao conceitual.
ca
c
c e
So exemplos de populaes: todos os valores poss
a
co
veis da produao de milho em kg/ha
c
de uma cultivar; todos os pesos ao nascer de coelhos da raa gigante; todos os valores de
c
dimetro altura do peito de uma espcie do manguezal do Itacorubi; todos os valores de
a
e
microncleos por cinco mil clulas examinadas de roedores de uma determinada regio.
u
e
a
Amostra uma parte (subconjunto) da populao. Exemplos: os pesos ao nascer de
e
ca
coelhos de uma ninhada pode ser uma amostra de uma populaao innita; uma amostra
c
ser formada por 100 pesos de pacotes de caf selecionados; 50 valores de microncleos
a
e
u
por cinco mil clulas examinadas de peixes do gnero bagre selecionados; cinco valores de
e
e
produao de milho da dose 1 de nitrognio, cada um tomado num canteiro de 5 2 m2 , etc.
c
e
intuitivo que, quanto maior a amostra, mais precisas e conveis devero ser as inE
a
a
ferncias realizadas sobre a populao. Levando esse racioc
e
ca
nio ao extremo, concluiremos
que os resultados mais exatos seriam obtidos pelo exame completo de toda a populaao, ao
c
qual se costuma denominar de Censo ou Recenseamento. Porm, a utilizaao de amostras
e
c
pode ser feita de tal maneira que se obtenham resultados conveis, em termos prticos, de
a
a
forma equivalente ou at mesmo superiores aos que seriam conseguidos atravs do censo. Na
e
e
experimentao biolgica e agronmica, geralmente no temos acesso a toda a populaao,
ca
o
o
a
c
portanto, somos obrigados a trabalhar com amostras, por exemplo, no podemos conhecer
a
todos os valores poss
veis de produo de milho em kg/ha de uma cultivar; no podemos
ca
a
determinar todos os comprimentos de baleias de uma rea de proteao. O fato que no
a
c
e
a e
necessrio examinar toda a populaao para se chegar `s concluses desejadas. Desde que o
a
c
a
o
tamanho da amostra seja convenientemente determinado, e que a mesma seja representativa
da populao, ou seja, possua as mesmas caracter
ca
sticas bsicas da populao no que diz
a
ca
respeito as variveis que deseja-se pesquisar, inferencias sucientemente precisas e conveis
a
a
podem ser realizadas.
Como exemplo, podemos citar o experimento que tem como objetivo vericar o comportamento da produao de milho sob o efeito de diferentes doses de nitrognio. As doses foram
c
e
denidas pelo pesquisador. Nesse caso, geralmente, a cultivar de milho escolhida para participar do experimento a cultivar mais plantada na regio. Os resultados so apresentados
e
a
a

Tabela 1.2: Produao de milho em kg/ha, submetidos ` diferentes doses de nitrognio, no


c
a
e
Oeste Catarinense, 1993.
Tratamentos
Repetioes
c
Total Mdia
e
I
II
III
IV
V
Dose 1
Dose 2
Dose 3
Dose 4
Controle

3200
4150
4380
4000
2850

1980 2220
2330 3700
2830 3420
2630 3150
1780 2100

2850 2100 12350


4050 2500 16730
3900 3080 17610
3780 2670 16230
2900 2010 11640

2470
3346
3522
3246
2328

na tabela 1.2. Para cada dose de nitrognio so plantados 5 canteiros de terra de 20m2 cada,
e
a
portanto, o tamanho da amostra para cada dose de nitrognio 5,ou seja, foram feitas 5
e
e
repetioes dos tratamentos. Para cada amostra existe uma correspondente populao; cada
c
ca
populaao formada por todos os valores poss
c e
veis de produao em kg/ha para a dose corc
respondente. Aps realizada a anlise estat
o
a
stica e a interpretao dos resultados a partir de
ca
um modelo que relacione a produo com as doses de nitrognio, ser indicada qual(is) a(s)
ca
e
a
melhor(es) dose(s) de nitrognio para a cultura do milho.
e
A estat
stica inferencial, dada a sua grande importncia, apresenta um grande nmero
a
u

de mtodos de anlise. Seriam necessrios vrios cursos de estat


e
a
a
a
stica para estud-los. E
a
bom deixar claro que para se executar uma anlise estat
a
stica, por mais sosticada que seja
o mtodo utilizado, deve-se, primeiramente, proceder ` anlise exploratria dos dados.
e
a a
o
Como j foi comentado anteriormente, uma caracter
a
stica dos experimentos biolgicos e
o
agronmicos, que os seus resultados tendem a variar de repetiao para repetio, ou, de
o
e
c
ca
outra forma, toda vez que se repetir o experimento, sob condioes bastante semelhantes, os
c
seus resultados no so os mesmos. Esta variabilidade nos resultados do experimento deixa
a a
o pesquisador com dvidas quanto ao(s) melhor(es) tratamento(s). Neste caso, os mtodos
u
e
estat
sticos iro auxili-lo.
a
a
Para ilustrar esta variao vamos considerar os resultados da tabela 1.2 relativos `s
ca
a
produoes de milho, em kg/ha, de cinco tratamentos, incluindo o controle (dose 0). O
c
objetivo do experimento comparar os cinco tratamentos com ralaao ` produao. Mais
e
c a
c
especicamente pode-se estabelecer dois objetivos para o experimento, quais sejam: 1o )
testar a hiptese de que no existem diferenas entre os tratamentos; 2o ) estimar a diferena
o
a
c
c
de produao entre dois tratamentos.
c
Todos os experimentos so conduzidos com estes dois objetivos: testar hipteses e estimar
a
o
as diferenas dos efeitos de tratamentos.
c

10

Com respeito ao teste de hiptese de que no h diferena entre as mdias da dose 3 e


o
a a
c
e
o controle, por exemplo, observa-se uma diferena entre as duas mdias de 3522-2328=1194
c
e
kg/ha, que uma diferena bem considervel para a cultura do milho. Vericando-se os
e
c
a
dados, observa-se que a produao da dose 3, na repetiao II, foi inferior ` produao do
c
c
a
c
controle nas repetioes I e IV. Isto indica que tem-se que levar em consideraao ` variabilidade
c
c a
dos dados ao se executar um teste de hiptese. Mais especicamente, vamos considerar a
o
variabilidade da estat
stica de interesse, neste exemplo, a mdia amostral. Devido a esta
e
variabilidade, os dados nunca concordam exatamente com a hiptese, e o problema decidir
o
e
se a diferena vericada devida ao efeito do tratamento ou se devida a variabilidade do
c
e
e
acaso. Isto conhecido como teste de signicncia. Essencialmente, um teste de signicncia
e
a
a
uma regra de deciso, com base nos resultados de um experimento, se deve-se rejeitar ou
e
a
no rejeitar a hiptese. Esta tcnica capacita o pesquisador a testar as suas hipteses sobre
a
o
e
o
a ao dos tratamentos, com a garantia de que a probabilidade de rejeitar a hiptese quando
ca
o
ela verdadeira pequena.
e
e
Com respeito a estimao da diferena de produao entre a dose 3 e o controle, descritica
c
c
vamente podemos dizer que para este experimento foi de 1194 kg/ha em favor da dose 3.
Mas esta uma medida que tem pouca importncia, pois se o experimento fosse repetido
e
a

para obter outras cinco repetioes, essa diferena poderia se modicar. E mais importante
c
c
pensar do seguinte modo. Suponha que seja praticvel repetir o experimento continuamente,
a
isto , aumentar o nmero de repetioes indenidamente. A diferena mdia das produoes
e
u
c
c
e
c
entre as duas doses provavelmente ir estabilizar num determinado valor. Este valor pode
a
ser considerado como sendo a diferena verdadeira entre as duas doses. Ento o problema de
c
a
resumir os dados pode ser colocado desta outra forma: o que pode-se dizer sobre a diferena
c
verdadeira entre a dose 3 e o controle? Esses so problemas de inferncia que sero tratados
a
e
a
neste curso nas sees 6, 7 e 8.
co
1.1.5

Teoria da Probabilidade e seus Modelos

Vimos que o objetivo da estat


stica indutiva ou inferencial tirar concluses sobre pope
o
ulaes com base nos resultados observados em amostras extra
co
das dessas populaes. Como
co
vamos trabalhar com uma amostra, o processo indutivo no pode ser exato. Ao se fazer ina
ferncias sobre a populaao, portanto, estamos sempre sujeitos a cometer erros, isto , o
e
c
e
pesquisador no pode fazer armativas com 100% de certeza. Isto, porm, no deve dea
e
a
sesperanar o pesquisador, pois a estat
c
stica indutiva ir dizer at que ponto pode-se estar
a
e
errando, isto , qual a probabilidade de erro. Por exemplo, pode-se armar com 95% de
e
e

11

conana que a diferena mdia de produao, em kg/ha de milho, entre a dose 3 e o controle,
c
c
e
c
da cultivar A est entre 694 e 1589 kg/ha. Ento poss determinar limites dentro dos
a
a e
vel
quais a verdadeira diferena deve encontrar-se, com um certo grau de certeza, dada por uma
c
probabilidade, xada pelo pesquisador. Esses intervalos so conhecidos em estat
a
stica como
intervalos de conana. A espinha dorsal da inferncia estat
c
e
stica a teoria da probabilidade,
e
com seus modelos probabil
sticos, a qual deve necessariamente fazer parte de um curso de
estat
stica.
O que um modelo no sentido geral da palavra? Modelo uma verso simplicada de
e
e
a
algum evento, fenmeno, acontecimento da vida real. Exemplos: um globo uma verso
o
e
a
simplicada do planeta terra; uma maquete de um prdio, um layout (distribuiao interna),
e
c
etc.
Um dos propsitos da cincia descrever e fazer previses de eventos do mundo real, do
o
e
e
o
mundo no qual ns vivemos. Uma maneira pela qual isto feito, construindo-se modelos
o
e
e
matemticos (que so expresses matemticas) que adequadamente descrevem os fenmenos
a
a
o
a
o
do mundo real. Exemplo: desejamos fazer um estudo sobre a distribuio de uma espcie
ca
e
vegetal num habitat. Vamos supor que a distribuio dessa espcie no habitat aleatria,
ca
e
e
o
casual, sendo assim, essa distribuio se ajustar ao que conhecido como modelo de Poisson.
ca
a
e
Outro exemplo: suponhamos que 10 vacas de mesma idade e raa so tratadas com uma
c a
determinada rao A para aumentar a produo de leite (total da lactao). Admitimos que
ca
ca
ca
a probabilidade de aumento de produao na lactaao de = 0, 65. Ento podemos estar
c
c e
a
interessados em saber qual a probabilidade de exatamente 8 vacas aumentarem a produao
e
c
na lactaao. Nesse caso o modelo a ser usado o binomial. Estes modelos sero estudados
c
e
a
na seao 4.
c
Na construao de um modelo deve-se simplicar as coisas e certos pormenores devem ser
c
desprezados, claro que estes pormenores no devem ter importncia para o entendimento
e
a
a
do fenmeno em estudo. A resoluo do problema matemtico pode estar correta e, mesmo
o
ca
a
assim, estar em grande discordncia com os dados observados, simplesmente por que as
a
hipteses bsicas feitas no so conrmadas. Por isso, muito importante deduzir certas
o
a
a a
e
conseqncias do modelo e, a seguir, comparar esses resultados previstos pelo modelo com
ue

dados reais (observados). E a validao do modelo.


ca
Para se desenvolver um curso bsico completo de estat
a
stica, deve-se abordar os pontos
ilustrados na gura 1.2. A ordem de apresentaao dos pontos seria: 1) anlise exploratria
c
a
o
dos dados; 2) probabilidades; 3) obtenao das amostras atravs de levantamentos ou experc
e
imentos; 4) inferncia estat
e
stica e 5) outros tpicos.
o
Como tpicos especiais em um curso pode-se citar: planejamento e anlise de experimeno
a

12

Amostragem

Anlise exploratria de dados

Teoria de probabilidades

Inferncia estatstica

Tpicos especiais

Figura 1.2: Esquema geral de um curso de estat


stica bsica
a
tos, anlise de regresso e correlao.
a
a
ca

1.2

A Estat
stica e o Mtodo Cient
e
co

Nesta seao pretende-se mostrar como a estat


c
stica pode ajudar o pesquisador a resolver
os problemas por ele identicados e colocados como sendo realmente importantes. Esta
exposiao ser feita atravs de dois exemplos que foram desenvolvidos por um rgo de
c
a
e
o a
pesquisa do governo do Estado de Santa Catarina (EPAGRI S.A.) e pelo Centro de Cincias
e
Biolgicas da Universidade Federal de Santa Catarina (CCB/UFSC), respectivamente.
o
Quando se faz uma pesquisa cient
ca o procedimento geral formular hipteses e teste
o
a
las. Inicialmente essas hipteses so formuladas em termos cient
o
a
cos, dentro da rea de esa
tudo (hiptese cient
o
ca)1 , e em seguida devem ser expressas em termos estat
sticos (hiptese
o

estat
stica). E claro que deve haver uma correspondncia perfeita entre estas duas hipteses.
e
o
Por exemplo, no caso do experimento de aplicaao de diferentes doses de nitrognio podec
e
mos formular a seguinte hiptese cient
o
ca: poss aumentar a produao de milho (kg/ha)
e
vel
c
atravs da aplicao de nitrognio. E a seguinte hiptese estat
e
ca
e
o
stica: existe diferenas enc
1

Hiptese cient
o
ca: Dado um problema bem denido, identicado, vamos imaginar uma explicao para
ca
algum aspecto do problema que nos tenha despertado interesse. Essa a hiptese, e deve ser coerente com
e
o
as observaes importantes j feitas, aliada aos conhecimentos tericos que o pesquisador possue sobre o
co
a
o
assunto.

13

tre as mdias verdadeiras de produo de milho quando submetido a diferentes doses de


e
ca
nitrognio. Para testar uma hiptese estat
e
o
stica, preciso um conjunto de observaoes, isto
e
c
, preciso coletar dados, valores a respeito do fato que estamos estudando, por exemplo,
e e
ns precisamos de dados sobre a produao de milho para as diferentes doses de nitrognio,
o
c
e
para que possamos testar a hiptese acima formulada. Como estamos tratando de expero
imentao, vamos obter nossas observaoes, nossos dados, atravs de um experimento, ou
ca
c
e
seja, as observaoes sero feitas sob condioes controladas, os fatos ou fenmenos a serem
c
a
c
o
estudados so planejados a sofrer variaes sistemticas, mediante a aplicao de tratamena
co
a
ca
tos. Por exemplo, a produo de milho sofre variaoes devido a aplicao de diferentes doses
ca
c
ca
de nitrognio. Os efeitos dos outros fatores, que no as doses de nitrognio, so minimizados
e
a
e
a
tanto quanto poss
vel, por exemplo, o efeito de diferenas de fertilidade do solo, ataque de
c
pragas e doenas, invasoras, sombreamento, etc. A hiptese acima formulada vai ser testada
c
o
por meio de uma anlise estat
a
stica. Esta, por sua vez, depende de como foi instalado o
experimento, ou seja, de como as observaes foram obtidas. Com isso podemos vericar
co
a grande importncia de um bom planejamento inicial do experimento, esta fase inclusive
a
chamada de planejamento estat
e
stico do experimento. Planejamento de experimento e
anlise estat
a
stica so feitos em seqncia e esto intimamente ligados. Por delineamento
a
ue
a
estat
stico de experimento, entendemos o processo de planejamento do experimento de tal
forma que os dados obtidos possam ser analizados atravs de mtodos estat
e
e
sticos, resultando
em concluses vlidas e objetivas (Montgomery, 2001). Podemos resumir isto que foi dito,
o
a
por meio da representaao grca da circularidade do mtodo cient
c
a
e
co (Peres e Saldiva,
1982), apresentada na gura 1.3.
Para xar melhor a idia de pesquisa cient
e
ca estatisticamente planejada, vamos atravs
e
de dois projetos de pesquisa, seguir as principais etapas do mtodo cient
e
co.
Projeto 1: Recuperao de Ervais Nativos Atravs da Decepa
ca
e
1) Identicao do problema. Inicia-se uma pesquisa cient
ca
ca com a denio do probca
lema, juntamente com a formulaao dos objetivos e hipteses. No planejamento do experic
o
mento, importante a participao de especialistas de diversas reas, pois quanto maior o
e
ca
a
conhecimento adquirido, melhor o entendimento sobre o fenmeno em estudo e, isto, facilio
tar a soluo nal do problema.
a
ca
Os ervais explorados para a produo de erva-mate so na grande maioria plantas nativas.
ca
a
Dada a grande demanda por erva-mate, as erveiras foram exploradas, isto , extra sua
e
da
massa foliar, atravs de mtodos inadequados; esta falta de manejo implicou na extino de
e
e
ca
espcies e outras esto em vias de extino, ento, os ervais nativos caram em sua quase
e
a
ca
a

14

(2)
Observaes
ou dados
Planejamento estatstico
do experimento

Anlise estatstica

(1)
Formulao de
hipteses

(3)
Verificao das
hipteses formuladas

(4)
Desenvolvimento
da teoria

Figura 1.3: Circularidade do mtodo cient


e
co
totalidade comprometidos. Buscando recuperar os ervais nativos, ir aplicar-se a tcnica da
a
e
decepa total das erveiras em diferentes n
veis de altura.
2) Objetivo geral. Determinar o efeito da decepa em plantas adultas e danicadas de
erveiras.
3) Objetivos especcos:

c
Vericar a capacidade e comprimento de brotaao;
estudar a produao de massa verde;
c
vericar a sobrevivncia das erveiras decepadas.
e
a
4) Formulao da hiptese cientca. E vivel a recuperao de ervais nativos e improca
o

ca
dutivos atravs da prtica da decepa.
e
a
5) Escolha dos fatores que devem ser inclu
dos no estudo e seus correspondentes n
veis
(tratamentos). O pesquisador deve escolher os fatores a serem estudos, a faixa na qual esses
fatores sero variados, e os n
a
veis espec
cos utilizados no experimento. Neste projeto o
fator, tambm conhecido como varivel independente, a decepa, e as alturas em que ser
e
a
e
a
realizada a mesma so os tratamentos (n
a
veis do fator). Foram utilizadas quatro alturas
de decepa (4 tratamentos), quais sejam: tratamento 1 - altura de decepa a 0,00 m do solo;
tratamento 2 - altura de decepa a 0,30 m do solo; tratamento 3 - altura de decepa a 0,60 m

15

do solo; tratamento 4 - altura de decepa a 0,90 m do solo. Este um experimento com um


e
fator.
6) Escolha da unidade experimental. As unidades experimentais so as que recebem
a
os tratamentos e devem ser as mais homogneas poss
e
veis, para que quando submetidas a
tratamentos diferentes, seus efeitos sejam facilmente detectados. Portanto, elas devem ser
orientadas no sentido de minimizar o erro experimental. As unidades experimentais pode ser
um animal, um conjunto de animais, uma pessoa, cinco mil clulas, uma planta, um conjunto
e
de plantas, um vaso, um frango, cinco reas de 5 cm2 em um frango, um tubo de ensaio,
a
etc. Nesse experimento, a unidade experimental formada por 8 plantas de erva-mate de
e
dimetros bem prximos. Ento, o tratamento 1 ser aplicado a 8 plantas de erva-mate,
a
o
a
a
o tratamento 2 a outras 8 plantas, e assim por diante, at o quarto tratamento. Embora
e
tenhamos 8 medidas da varivel resposta em cada unidade experimental, esses resultados
a
no so repeties independentes. Na realidade, s temos um resultado independente para
a a
co
o
cada tratamento, a mdia das oito rvores para cada varivel resposta em estudo.
e
a
a
A heterogeneidade das unidades experimentais que determina os diferentes planos exe
perimentais.
7) Escolha das variveis que sero medidas nas unidades experimentais. Denominama
a
se de variveis as caracter
a
sticas que sero mensuradas, avaliadas pelos pesquisadores nas
a
unidades experimentais. As variveis so pr-estabelecidas pelo pesquisador e devem medir
a
a
e
diretamente os tratamentos de acordo com os objetivos do trabalho. Algumas variveis
a
medidas nesse experimento foram: percentagem de brotao, nmero de brotos, comprimento
ca
u
dos brotos, produo de massa verde para a indstria e sobrevivncia das erveiras decepadas.
ca
u
e
O importante que os dados devem ser objetivos, precisos e verdadeiros, isto o m
e
e
nimo
que se espera de algum que ir publicar um trabalho de pesquisa.
e
a
8) Determinao das regras e procedimentos pelos quais os tratamentos so atribu
ca
a
dos
a
`s unidades experimentais: delineamentos experimentais. Trata-se de normas de designar
os tratamentos `s unidades experimentais e que denem os delineamentos experimentais.
a

A estat
stica bastante rica em planos (delineamentos) experimentais. E nesse item que a
e
estat
stica participa fortemente do planejamento da pesquisa, ou seja, a sua contribuiao
c e
bastante grande, de tal forma que pode-se chamar esta etapa de planejamento estat
stico do

experimento. Veja gura 1.3. E importante na fase de planejamento da pesquisa, escolher


adequadamente o delineamento, pois, caso contrrio, pode-se ter muita diculdade na anlise
a
a
estat
stica e, at mesmo, invalidar os resultados do experimento.
e
Neste experimento, os tratamentos foram atribu
dos `s unidades experimentais da seguinte
a
forma. Primeiramente foram formados cinco blocos, onde cada bloco constitu de 4
e
do

16

unidades experimentais (pois temos 4 tratamentos); como cada unidade experimental tem
8 plantas, ento, um bloco tem 32 plantas. Os blocos esto controlando as diferenas de
a
a
c
dimetros entre as plantas, assim, o bloco I formado por 32 plantas com dimetros entre
a
e
a
10 e 13 cm (exclusive); o bloco II formado por 32 plantas com dimetros entre 13 e 16 cm
e
a
(exclusive); o bloco III formado por 32 plantas com dimetros entre 16 e 19 cm (exclusive);
e
a
o bloco IV formado por 32 plantas com dimetros entre 19 e 22 cm (exclusive) e o bloco V
e
a
formado por 32 plantas com dimetros superiores a 22 cm. Portanto, cada tratamento ser
e
a
a
repetido 5 vezes, uma em cada bloco. Dentro de cada bloco houve o sorteio (aleatorizaao)
c
de qual unidade receber o tratamento 1, qual receber o tratamento 2, e assim por diante.
a
a
Este delineamento experimental denominado de blocos completos ao acaso.
e
9) Coleta dos dados. Aqui so feitas as medidas das variveis estabelecidas pelo pesquisador.
a
a
As variveis, logicamente, devem avaliar diretamente os efeitos dos tratamentos de acordo
a
com objetivos do experimento. Tambm podem ser coletadas variveis complementares, que
e
a
sero uteis para explicar o comportamento dos tratamentos.
a
10) Anlise estat
a
stica dos resultados. O objetivo da anlise estat
a
stica vericar as
e
hipteses formuladas no in da pesquisa cient
o
cio
ca. Por exemplo, comparar as mdias de
e
produao de massa foliar obtidas com cada uma das alturas de decepa, ou, estabelecer uma
c
relao funcional entre a produo de massa foliar e a altura de decepa das plantas.
ca
ca
Existem excelentes softwares estat
sticos para realizar as anlises. A anlise de res
a
a
duos
uma importante tcnica para vericar, por exemplo, se o modelo adequado.
e
e
e
11) Relatrio nal (publicao). Apresentar tabelas e grcos de forma a mostrar os
o
ca
a
efeitos esperados, comparar os resultados obtidos com os objetivos do experimento para
vericar se as questes propostas foram respondidas. Apresentar medidas de preciso das
o
a
estimativas. Se poss
vel, fazer referncias a outras pesquisas similares e uma avaliaao de
e
c
todas as etapas com sugestes para poss
o
veis alteraoes em pesquisas futuras.
c
A experimentaao uma importante fase do processo de aprendizagem, onde ns formuc e
o
lamos hipteses, realizamos o experimento para pesquisar sobre essas hipteses e, de acordo
o
o
com os resultados, formulamos novas hipteses, e assim sucessivamente. Isto sugere que a
o
experimentao iterativa.
ca e
Projeto 2 - Anlise de Alguns Aspectos da Dinmica de Populaes de Duas
a
a
co
Amostras de Biomphalaria tenagophila Submetidas a Diferentes Concentraoes de
c
Matria Orgnica no Meio.
e
a
1) Identicao do problema. A importncia do genro Biomphalaria no contexto da
ca
a
e
sade pblica brasileira deve-se ao fato de que dentre as 19 espcies que constituem este
u
u
e

17

genro, dez delas so encontradas no Brasil, sendo que trs so hospedeiras intermedirias
e
a
e a
a
do Schistosoma mansoni, causador da esquistossomose mansoni, um dos mais importantes
problemas de sade pblica em muitos pa tropicais e subtropicais. Sua ocorrncia acenu
u
ses
e
e
tuada entre populaes carentes de alguns pa subdesenvolvidos. Segundo a Organizaao
co
ses
c
Mundial da Sade, so estimados 200 milhes de pessoas como tendo sido contaminadas
u
a
o
pelo S. mansoni, enquanto, outros 500 a 600 milhes correm o risco de contra
o
-la. As trs
e
espcies hospedeiras so: B. straminea; B. glabrata e B. tenagophila.
e
a
No Brasil, estima-se em 5,5 milhes de pessoas infectadas, isto parece ser uma subestio
mativa, pois o Instituto de Medicina Tropical (IMT), da Faculdade de Medicina da USP,
estimou em 10 milhes o nmero de pessoas infectadas.
o
u
Em Santa Catarina, o primeiro foco de transmisso ocorreu em So Francisco do Sul,
a
a
atravs da B. tenagophila. Hoje, tem-se registro de B. tenagophila em 26 munic
e
pios do
nordeste do Estado.
Na Ilha de Santa Catarina, pesquisadores obtiveram registros de B. tenagophila, B.
oligoza e Drepanotrema sp, em 8 pontos estratgicos.
e
Em consequncia da alta endemicidade da esquistossomose no pa a distribuiao dos
e
s,
c
planorb
deos vem sofrendo constantes investigaes, sendo que especial atenao tem sido
co
c
dada, ainda, ao controle da expanso das espcies vetoras, apesar que a rea ocupada por
a
e
a
cada uma das espcies vetoras do S. mansoni, est aumentando.
e
a
O genro Biomphalaria apresenta uma grande tolerncia a diferentes condies ecolgicas,
e
a
co
o
isto permitiu sua ampla distribuiao geogrca. Muitos autores analisaram o comportamento
c
a
reprodutivo e crescimento em funo de uma srie de variveis, sendo que os efeitos de
ca
e
a
temperatura, tipo ou ausncia de alimentaao, inuncia do fotoperiodismo e densidade
e
c
e
populacional so alguns que receberam maior ateno.
a
ca
As condies do meio exigidas pelas biomfalrias para colonizar um ambiente, so:
co
a
a
riquezas de microora e matria orgnica, pouca turbidez, boa insolao, pH em torno de
e
a
ca
6 a 8, teor de NaCl abaixo de 3 por 1000 e temperatura mdia entre 20 C e 25 C. Cabe
e
aqui ressaltar, todavia, que as bionfalrias suportam modicaes considerveis nas caraca
co
a
ter
sticas f
sicas, qu
micas e biolgicas de seus ambientes, podendo, inclusive, utizar-se da
o
estivaao como uma estratgia para suportar a adversidade do meio.
c
e
Sabendo-se que os representantes do gnero Biomphalaria so constantementes encone
a
trados em grande variedades de colees de gua doce, paradas ou pouco correntes, natural
co
a
ou articialmente alagadas, que um unico espcime capaz de produzir, por autofecundao,

e
e
ca
uma populao de numerosos indiv
ca
duos e que B. tenagophila est em provvel extenso em
a
a
a
Santa Catarina, torna-se importante estudar os fatores biticos e abiticos que interferem
o
o

18

na biologia, distribuiao e adaptaao aos ambientes por eles explorados. Assim sendo, o
c
c
objetivo do presente trabalho avaliar crescimento, desempenho reprodutivo, sobrevivncia
e
e
e fecundidade de duas amostras de B. tenagophila, considerando-se diferentes condies do
co
meio.
2) Objetivo geral. Determinar o efeito de diferentes condioes do meio (poluiao) sobre a
c
c
biologia de B. tenagophila.
3) Objetivos espec
cos:
Vericar (estudar) o crescimento de B. tenagophila.
Estudar o desempenho reprodutivo da espcie.
e
4) Hiptese cientca. Num meio com poluio, o desenvolvimento biolgico da espcie
o

ca
o
e
prejudicado.
e
5) Escolha do fator que deve ser inclu no estudo e seus correspondentes n
do
veis. Nesse
projeto, o fator em estudo poluio, tambm chamado de varivel independente, os difere
ca
e
a
entes n
veis de poluiao so os tratamentos. Nesse trabalho foram utilizados dois tratamentos,
c a
quais sejam: 1) Sem poluiao (com troca de gua) e 2) com poluiao (completa a gua).
c
a
c
a
6) Escolha da unidade experimental. Nesse experimento a unidade experimental um
e
caramujo. Cada unidade experimental formada por um copo de vidro (mini-aqurio), com
e
a
60 ml de gua deionizada, contendo um caramujo.
a
7) Escolha das variveis que sero medidas nas unidades experimentais. Algumas variveis
a
a
a
avaliadas neste experimento foram: dimetro em trs diferentes tempos (nascimento, na 1a
a
e
desova e no nal do experimento); idade na 1a desova; nmero de ovos desenvolvidos; nmero
u
u
de ovos viveis; nmero de ovos inviveis; nmero total de ovos.
a
u
a
u
8) Determinao das regras e procedimentos pelos quais os tratamentos so atribu
ca
a
dos `s
a
unidades experimentais. Nesse experimento a amostra total foi composta por 51 caramujos
(i.. 51 unidades experimentais). Atravs de um processo aleatrio foram escolhidos 23
e
e
o
caramujos para receberem o tratamento T e 28 caramujos para receberem o tratamento C.
A regra de estabelecer os tratamentos `s unidades experimentais foi completamente ao acaso.
a
9) Coleta de dados; Anlise estatstica dos dados e Relatrio nal. Idem ao que foi
a

o
comentado para o projeto 1.

1.3

Aspectos do Planejamento Estat


stico de um Experimento

19

9
8

Textura

7
6
5
4

Dose 1
Dose 2

Dose 3
Dose 4

2
0,5

1,0

1,5

2,0

2,5

3,0

3,5

4,0

4,5

5,0

5,5

Dose 5

Doses de leite de vaca

Figura 1.4: Efeito da interao entre doses de leite de vaca e doses de coagulante
ca
1.3.1

Experimentos com um Fator e mais de um Fator

Nos projetos 1 e 2, vimos dois experimentos com apenas 1 fator. No projeto 1 o fator
a decepa e, no projeto 2 a poluio. Em muitos caso, temos experimentos com mais de
e
e
ca
um fator. Considere um experimento com cinco (5) doses de leite de vaca e cinco (5) doses
de coagulante. Aqui temos 2 fatores em estudo, doses de leite e coagulante, com 5 n
veis

cada um, caracterizando um . E interessante salientar que a escolha dos fatores e seus n
veis
incumbncia do pesquisador. Nos experimentos fatoriais poss estudar-se a interao
e
e
e
vel
ca
que existe entre os fatores, isto , como o comportamento dos n
e
e
veis de um fator dentro
dos n
veis do outro fator. A gura 1.4 ilustra o efeito da interaao entre os fatores leite de
c
vaca e coagulante.
Os fatores podem ser quantitativos ou qualitativos. A temperatura de um forno, os n
veis
de nitrognio e de fsforo so exemplos de fatores quantitativos, enquanto que, fabricantes
e
o
a
de drogas, diferentes locais e meios de cultura so fatores qualitativos.
a

E importante para o planejamento e a anlise estat


a
stica distinguirmos as seguintes
situaes:
co
a) um pesquisador deseja conduzir um experimento para vericar o efeito do starter
Lactobacillus plantarum em salame tipo italiano sobre o tempo de maturaao dos mesmos.
c

20

Para essa nalidade utilizou 3 concentraoes do starter, quais sejam: 2, 5 10 ; 5, 0 105


c
5
e 10, 0 10 clulas viveis/grama de massa. Ele deseja saber se h diferenas entre as 3
e
a
a
c
concentraes. Portanto, nesse experimento, temos um fator (starter) de efeito xo, isto , as
co
e
concentraes foram denidas pelo pesquisador, ou seja, no foi feita uma escolha aleatria
co
a
o
dos n
veis, assim, as concluses desse experimento se referem apenas as concentraoes utio
c
lizadas no experimento.
b) um tecnologista quer comparar a qualidade de po fabricado por diferentes padarias
a
da cidade de Florianpolis. Neste caso, as padarias so os tratamentos. Ele deseja que seus
o
a
resultados sejam vlidos para todas as padarias de Florianpolis, ento, em lugar de escolher
a
o
a
intencionalmente algumas padarias que pretende compar-las, dever sorte-las a partir de
a
a
a
algum procedimento que garanta a aleatoriedade, como por exemplo, a tabela de nmero
u
aleatrios, dada no apndice 7, assim, o pesquisador estar fazendo um experimento onde
o
e
a
o fator dito aleatrio. Para saber se um efeito aleatrio, verique se os tratamentos em
e
o
e
o
comparao representam uma amostra aleatria de uma populaao. Se os tratamentos no
ca
o
c
a
so uma amostra aleatria, o efeito xo.
a
o
e
Sobre as concluses pode-se dizer: 1) os fatores so xos: neste caso, os resultados
o
a
(concluses) so vlidos apenas para os n
o
a a
veis do fator que esto presentes no experimento
a
e 2) os fatores so aleatrios: as concluses so vlidas para a populaao de n
a
o
o
a a
c
veis.
Os tratamentos so selecionados pelo pesquisador e deve ser feita de acordo com os
a
objetivos do trabalho. Um bom conhecimento do material experimental e alguma idia
e
sobre os efeitos dos tratamentos so muito uteis para dar mais objetividade aos trabalhos.
a

As concluses de um experimento dependem de como os dados foram coletados. No


o
projeto 1 estudou-se 4 alturas de decepas e procurou-se controlar a idade das plantas por
meio da blocagem, isto , foram agrupadas as rvores com idades prximas). Caso no
e
a
o
a
tivesse sido feito esse controle, o pesquisador no saberia dizer se as diferenas mdias da
a
c
e
varivel resposta seriam devido `s alturas de decepas ou da idade das rvores. Esse fato
a
a
a
e
conhecido como confundimento de fatores e a varivel idade conhecida como varivel de
a
e
a
perturbao (em ingls: nuisance variable).
ca
e
1.3.2

Tratamento Controle

E necessrio quando no se conhece a ecincia dos tratamentos em estudo, ou quando


a
a
e
a ecincia dos tratamentos conhecida mas no consistente em todas as condioes. Nem
e
e
a e
c
todos os experimentos necessitam do tratamento controle. Exemplo: alta presso em tema

21

peratura ambiente (25 C) e o experimento foi feito a 2 C (frango cr). O que ? O tratau
e
mento controle consiste em se realizar todos os procedimentos que so feitos nas unidades
a
experimentais usadas para os outros tratamentos, exceto a aplicaao do efeito em estudo.
c
Exemplo: num estudo sobre aditivos em alimentos, um tratamento pode consistir de uma
porao de um vegetal contendo um aditivo particular que servido a um degustador. O
c
e
tratamento controle consistiria de uma porao do mesmo vegetal servido ao degustador, na
c

mesma situao experimental, exceto que no seria utilizado o aditivo no alimento. E funca
a
damental que o tratamento controle seja conduzido nas mesmas condioes experimentais dos
c
outros tratamentos.
1.3.3

Variveis e Covariveis
a
a

O que pode constituir problema, as vezes, a forma como a varivel medida, pois disso
e
a e
depende a preciso das observaoes e o tipo de anlise a ser executada. Exemplo: se os
a
c
a
valores da varivel sabor de um alimento dada numa escala de 1 a 10, pode-se aumentar a
a
e
preciso e facilitar a anlise, utilizando-se como observao, a mdia de 3 valores da mesma
a
a
ca
e
unidade experimental.
Quando temos uma varivel que inuencia as variveis dependentes, chama-se a mesma
a
a
de covarivel. Exemplos: 1) se o tempo necessrio para executar um experimento 30 dias,
a
a
e
e se a temperatura do ambiente tem inuncia na varivel dependente (resposta), ento, a
e
a
a
temperatura deve ser mantida constante. Se isso no for poss
a
vel, ento, deve-se medir a
a
temperatura para cada unidade experimental; 2) num experimento para comparar 4 meios
de cultura em frangos congelados onde a varivel dependente a populaao de Staphilococus
a
e
c
aureus, cada frango apresenta uma populaao inicial de Staphilococus diferente, neste caso,
c
a populaao inicial de Staphilococus a covarivel; 3) Num experimento para estudar a
c
e
a
produao de 10 variedades de soja, o nmero de sementes que germinam nos canteiros
c
u
e
a covarivel. Estas variveis entram na anlise como covariveis e, observe que elas no
a
a
a
a
a
podem ser controladas pelo pesquisador. Este fato que as diferencia de uma varivel de
e
a
perturbaao (nuisance variable).
c
1.3.4

Repetio e Casualizao
ca
ca

Para que a metodologia estat


stica possa ser aplicada aos resultados de um experimento,
e
necessrio obedecer a dois princ
a
pios bsicos da experimentaao, o da repetio e da aleatora
c
ca

22

izao dos tratamentos. Um terceiro princ


ca
pio, o controle local, pode ou no ocorrer num
a
experimento.
A Repetio consiste, como o prprio nome indica, em repetir o mesmo tratamento vrias
ca
o
a
vezes. O uso de repeties dos tratamentos necessrio para podermos calcular a variabilico
e
a
dade e, com isso, executar os testes estat
sticos e, tambm, para fazer estimaao intervalar
e
c
dos efeitos dos tratamentos. De um modo geral, quanto maior o nmero de repetioes, mais
u
c
precisas vo ser as nossas estimativas. Na prtica, o nmero de repetioes vai depender
a
a
u
c
muito dos recursos e material experimental dispon
vel. O clculo do tamanho da amostra
a
e
um dos principais itens do planejamento de um experimento e, a sua determinaao, no
c
a e
trivial, e exige que se tenha algum conhecimento sobre a variabilidade dos dados, a preciso
a
e conana desejadas nos resultados. Ento, as principais nalidades do uso de repeties
c
a
co
so: 1) dar uma estimativa do erro experimental; 2) aumentar a preciso de um experimento,
a
a
reduzindo o desvio padro das mdias dos tratamentos e 3) estimaao e testes de hipteses.
a
e
c
o
O que caracteriza uma repetiao que ela deve gerar um resultado independente.
c e
A aleatorizao ou casualizao consiste no sorteio dos tratamentos `s unidades experca
ca
a
imentais por um processo bem denido, xo; necessria para termos certeza de que um
e
a
tratamento no seja beneciado ou prejudicado por alguma causa conhecida ou desconhecida,
a
tais como: intensidade de luz, constituio gentica, temperatura, umidade, ventilao, etc.
ca
e
ca
tambm fundamental para atender a suposiao de que os dados so oriundos de uma
E
e
c
a
amostra aleatria. Os mtodos estat
o
e
sticos requerem que as observaoes (ou os erros), sec
jam variveis aleatrias independentemente distribu
a
o
das. A casualizao faz com que esta
ca
suposiao seja vlida. O princ
c
a
pio da casualizao uma das principais contribuioes dos
ca e
c
estat
sticos ` cincia experimental, principalmente Ronald A. Fisher (1890 - 1962). S a
a e
o
casualizao garante que unidades com caracter
ca
sticas diferentes tenham igual probabilidade
de serem designadas para os diferentes tratamentos. Com a casualizaao, obtemos estimatic
vas no tendenciosas das mdias dos tratamentos e das diferenas entre as mdias; obtemos
a
e
c
e
uma estimativa no tendenciosa do erro experimental. Certas restrioes podem ser inclu
a
c
das
na casualizao (controle local), para levar em considerao alguma(s) fonte(s) de variaao
ca
ca
c
do material experimental. O delineamento em blocos completos ao acaso apresenta uma
restrio.
ca

1.4

Exerc
cios Propostos

1 - Planeje um experimento para comparar a produao de cinco variedades de milho.


c

23

2 - Planeje um experimento para testar o efeito da adubao nitrogenada (5 n


ca
veis), sobre
a produao de milho.
c
3 - Planeje um experimento na sua rea de pesquisa.
a
Para a resoluao desses exerc
c
cios, entende-se que um experimento est planejado quando
a
esto denidas:
a
1. enunciado do problema com formulaao do(s) objetivo(s) e da(s) hiptese(s);
c
o
3. escolha do(s) fator(es) que deve(m) ser inclu
do(s) no estudo;
3. as variveis respostas ou dependentes em anlise e a forma como sero medidas;
a
a
a
4. a unidade experimental;
5. os tratamentos em comparaao e decidir o nmero de unidades experimentais a serem
c
u
associadas a cada tratamento. Faa uma descriao dos mesmos;
c
c
6. a forma (maneira) como os tratamentos sero designados `s unidades experimentais;
a
a
7. bibliograa.

24

2
2.1
2.1.1

Anlise Exploratria de Dados


a
o
Organizao, Resumo e Representao de Dados
ca
ca
Introduo
ca

Como j comentamos anteriormente, a parte da Estat


a
stica que trata da organizao,
ca
apresentao, resumo e descrio dos dados conhecida como Anlise Exploratria de Dados.
ca
ca
e
a
o
Esta parte, geralmente limitava-se a construo de alguns tipos de grcos (linhas, colunas
ca
a
e setores) e ao clculo de algumas medidas de tendncia central e de variabilidade, como,
a
e
por exemplo, a mdia e a varincia. Atualmente, foram desenvolvidas muitas outras tcnicas
e
a
e
(Tukey, 1971), principalmente visuais, atravs das quais procura-se estudar a regularidade
e
presente nos dados. Esta anlise permite que o pesquisador adquire um bom conhecimento
a
e senso cr
tico sobre os seus dados observados.
Neste cap
tulo, atravs da Anlise Exploratria de Dados, procuraremos tirar o mximo
e
a
o
a
de informaoes de um conjunto de dados, ou seja, fazer todas as interpretaes necessrias
c
co
a
para responder aos objetivos de uma pesquisa.
Quando estamos trabalhando com um conjunto de dados, bastante provvel que o
e
a
mesmo apresente algum tipo de regularidade, ou seja, um padro de variao. Devido a esta
a
ca
regularidade presente nos dados poss ajustar-se um modelo. Este um dos principais
e
vel
e
objetivos da anlise exploratria de dados, isto , procurar estabelecer um modelo para um
a
o
e
conjunto de dados, o qual possa ser utilizado na anlise estat
a
stica inferencial. Exemplo do
que seja um modelo no aspecto geral: vamos vericar o tipo de relacionamento entre a taxa
de crescimento de uma pastagem cultivada no Planalto Catarinense e a temperatura do solo
a 10 cm de profundidade no per
odo de junho a novembro. A gura 2.1 mostra a distribuiao
c
dos pontos entre essas duas variveis. De modo visual, podemos vericar que existe uma
a
relao linear entre a temperatura do solo e a taxa de crescimento, desse modo, podemos
ca
traar uma reta a olhmetro, o mais prximo poss de todos os pontos, que ser o nosso
c
o
o
vel
a
modelo. Evidentemente que os pontos no caem sobre a reta (pode ocorrer para alguns). A
a
diferena entre os dados e o modelo chamada de erro. Explicao sobre o termo do erro
c
e
ca
foi dado na seo 1.1.2.
ca
Chama-se de modelo a parte da variabilidade dos dados que explicada pelo mesmo e
e
erro a parte da variabilidade dos dados no explicada pelo modelo. A gura 2.2 ilustra os
a
Dados, a parte do modelo e a parte do erro para uma observao. Os dois componentes
ca
so igualmente importantes. O estudo denominado de Anlise de Res
a
a
duos, nos fornece

25

Taxa de crescimento (kg/hadia)

38
34
30
26
22
18
14
10

10

12

14

16

18

20

22

Temperatura do solo - graus centgrados

Figura 2.1: Relaao entre temperatura do solo a 10 cm de profundidade e taxa de crescimento


c
de uma pastagem de inverno no Planalto Catarinense
informao se a parte do modelo adequada ou no para representar os dados, dentre outros
ca
e
a
aspectos importantes da anlise de dados.
a
2.1.2

Classicao das Variveis Selecionadas para o Estudo


ca
a

Um pesquisador quando est realizando um determinado experimento ou levantamento,


a
necessita avaliar certas caracter
sticas nas plantas, nos animais, instrumentos, pessoas, etc.
Por exemplo, registrar o dimetro altura de peito (DAP) de Avicenias do manguezal do
a
Itacorubi, a produo de milho por hectare, a resistncia ao ataque de pragas do feijo,
ca
e
a
fazer a contagem do nmero de vagens por planta, nmero de gros por vagem, etc. Estas
u
u
a
caracter
sticas chamam-se variveis, porque originam valores que tendem a variar quando se
a
fazem medidas sucessivas, por exemplo, vamos supor que plantemos quatro reas de 30m2 de
a
um h
brido de milho, com certeza vamos obter quatro valores diferentes de produao nessas
c
reas (unidades) experimentais.
a
Um pesquisador deve aprender a identicar quatro tipos de variveis, que sero descritas
a
a
atravs de um exemplo.
e
Exemplo. Um pesquisador instalou um experimento para avaliao do comportamento
ca
de h
bridos de milho, para isso, tomou algumas medidas agronmcias que esto apresentadas
o
a
na tabela 2.1
Muitas variveis, tais como, tipo de gro e resistncia ` ferrugem, apresentam como
a
a
e
a
resultado uma qualidade ou atributo, e outras variveis, tais como, rendimento mdio, ciclo
a
e

26

Tabela 2.1: Resultados de um experimento de competiao de h


c
bridos de milho para a regio
a
preferencial I com altitudes abaixo de 800m - safra:1987/1988
H
bridos

Ciclo

Altura planta

Altura espiga

(kg/ha)

(dias)

(cm)

(cm)

6388

65

242

103

dentado

6166

65

258

134

semi-dentado

6047

65

240

104

semi-dentado

5889

66

243

108

semi-dentado

5823

69

257

128

dentado

ms

5513

68

241

108

semi-dentado

5202

64

235

108

dentado

5172

68

240

103

dentado

5166

69

253

123

dentado

ms

10

4975

70

250

117

semi-dentado

ms

11

4778

70

242

114

dentado

mr

12

4680

66

245

111

semi-duro

ms

13

4660

69

239

110

semi-duro

mr

14

5403

73

264

138

dentado

ms

15

5117

76

282

149

dentado

mr

16

5063

72

274

151

dentado

17

4993

71

279

134

semi-dentado

18

4980

72

274

140

dentado

ms

19

4770

73

244

140

dentado

20

4685

71

265

139

semi-duro

mr

21

4614

73

248

110

semi-dentado

22

4552

73

265

128

semi-dentado

23

3973

74

261

124

semi-dentado

mr

24

4550

71

259

129

semi-duro

25

5056

64

252

104

semi-duro

mr

26

4500

70

271

109

dentado

ms

27

4760

68

243

137

semi-duro

28

5110

66

252

141

semi-dentado

ms

29

4960

70

262

120

dentado

ms

30

4769

73

260

118

dentado

31

4849

74

250

119

semi-dentado

32
1

Rendimento mdio
e

Tipo gro
a

5230

71

255

138

semi-duro

(escala)

r=resistente; mr=moderadamente resistente; ms=m. suscept


vel; s=suscept
vel
27

Ferrugem

E
D

Figura 2.2: Os componentes de um modelo


da cultura, apresentam como resultado medidas ou contagens. As variveis do primeiro
a
tipo so chamadas de variveis qualitativas e as do segundo tipo so chamadas de variveis
a
a
a
a
quantitativas.
Dentre as variveis qualitativas podemos distinguir dois tipos:
a
a
a
veis
variveis qualitativas ordinais: para estas variveis existe uma ordem nos poss
resultados da mesma. No exemplo, temos a resistncia ` ferrugem, dada numa escala.
e
a
o
o
Outro exemplo podem ser, 1 grau , 2 grau, superior.
variveis qualitativas nominais: para estas variveis no existe uma ordenao nos
a
a
a
ca
resultados. No exemplo, temos o tipo de gro como varivel desse tipo. Outros exa
a
emplos, podem ser: germina/no germina, os cursos da UFSC (Agronomia, Cincias
a
e
Biolgicas, etc.), a cr da or de soja.
o
o
Dentre as variveis quantitativas tambm podemos distinguir dois tipos:
a
e
variveis quantitativas discretas: estas variveis s podem assumir certos valores, em
a
a
o

geral nmeros inteiros e normalmente so resultantes de contagens. E poss formar


u
a
vel
uma lista (nita ou innita) dos valores. No exemplo, a varivel ciclo da cultura
a
discreta. Outros exemplos, podem ser: nmero de dias da emergncia ` orao,
e
u
e
a
ca
nmero de vagens por planta, nmero de gros por vagem.
u
u
a
variveis quantitativas contnuas: estas variveis assumem todos os valores poss
a

a
veis
dentro de um determinado intervalo. Esta variveis, dependendo da preciso utia
a
lizada na mediao, so capazes de diferenciar animais, plantas para valores muito pec a

28

quenos. So variveis cujos resultados geralmente so fracionrios. No exemplo, temos


a
a
a
a
a varivel rendimento mdio de gros de milho, altura da planta, altura de espiga.
a
e
a
A distino entre variveis cont
ca
a
nuas e discretas muitas vezes articial, pois depende da
e
aproximao (preciso) utilizada. Por exemplo, idade uma varivel de medida de tempo,
ca
a
e
a
portanto, por deniao, uma varivel aleatria cont
c e
a
o
nua, porm, em muitos casos ela
e
e
medida em anos completos (discretizao da varivel), o que a torna uma varivel discreta.
ca
a
a
Sero tratadas como variveis cont
a
a
nuas todas as que, pelo menos em teoria, possam assumir
qualquer valor dentro de um intervalo.
Para cada tipo de varivel existem tcnicas mais apropriadas para resumir as informaoes;
a
e
c
entretanto, vamos vericar que tcnicas usadas num caso podem ser adaptadas para outros,
e
pois poss transformar variveis quantitativas em qualitativas e vice-versa. Por exemplo,
e
vel
a
sexo: 1 masculino e 0 feminino; rendimento: colocar em categorias, por exemplo, baixa,
mdia e alta produao. O estudo de probablidades tambm apresenta os seus modelos de
e
c
e
acordo com cada tipo de varivel. Estes modelos sero estudados nas seoes 3, 4 e 5.
a
a
c
2.1.3

Distribuies de Freqncias. Representao em Tabelas e Grcos


co
ue
ca
a

Feita a coleta dos dados, atravs de censos, de levantamentos por amostragem (Survey,
e
em ingls), ou de experimentos, os mesmos apresentam-se, geralmente, de maneira desore
ganizada, ainda sem valor informativo sobre o fenmeno em estudo, portanto, os mesmos
o
devem ser organizados e resumidos, para possibilitarem a obteno de informaoes uteis para
ca
c
o trabalho de pesquisa.
O estudo das distribuies de freqncias nos permite conhecer a forma, a maneira como
co
ue
os valores de uma varivel se comporta, isto , poss ter uma boa idia global dos valores,
a
e e
vel
e
ou seja, da distribuiao. Uma distribuiao de freqncias pode ser representada em forma
c
c
ue
de tabela ou grco.
a
2.1.3.1 Distribuies de Freqncias de Variveis Qualitativas. Representao
co
ue
a
ca
em Tabelas
Feita a coleta dos dados relativa `s variveis denidas no in
a
a
cio da pesquisa, o investigador tem interesse, agora, em conhecer o comportamento dessas variveis considerando
a
os elementos pesquisados, por exemplo, conhecer a distribuiao da varivel resistncia `
c
a
e
a
ferrugem pesquisada em 32 h
bridos de milho, na regio de Chapec, SC.
a
o

29

Este estudo pode ser feito atravs da construo de distribuioes de freqncias, chamandoe
ca
c
ue
se de frequncia, por exemplo, o nmero de h
e
u
bridos para a categoria S, MS, MR, e R,
respectivamente. Chama-se, portanto, distribuio de freqncias, a correspondncia entre
ca
ue
e
categorias ou valores poss
veis de uma varivel e as respectivas freqncias. Inicialmente
a
ue
vamos representar as distribuioes de freqncias em tabelas.
c
ue
Alguns aspectos importantes devem ser levados em considerao na construao de uma
ca
c
tabela, quais sejam:
tulo completo; as trs questes que devem ser respondidas
e
o
1. Toda tabela deve conter um t
num t
tulo so: o qu se est estudando? onde foi feito o estudo? e quando?. O t
a
e
a
tulo
deve ser colocado na parte superior da tabela.
2. Se os dados no so prprios deve-se indicar a fonte dos mesmos. Ela vai na parte
a a
o
inferior da tabela.
3. As notas e chamadas so utilizadas para fazer esclarecimentos de ordem geral e esa
pec
cas, respectivamente. Ambas so numeradas, geralmente em algarismos arbicos,
a
a
pode-se, ainda, utilizar letras minsculas ou s
u
mbolos, como por exemplo, asterisco.
Tambm so colocadas na parte inferior da tabela.
e
a
4. Os totais e subtotais devem ser bem destacados.
e
u
5. De preferncia usar o mesmo nmero de casas decimais para os algarismos.
6. No devem ser fechadas lateralmente.
a
7. Quando algum valor da tabela nulo pela prpria natureza do fenmeno em estudo,
e
o
o
deve-se utilizar o h
fen (-) para substitu
-lo. Quando no se tem informao sobre
a
ca
algum valor deve-se colocar trs pontos (...). Se existe dvida sobre a exatido da
e
u
a
informaao deve-se usar ponto de interrogao (?). Se algum valor for omitido para
c
ca
evitar individualizao, deve-se usar a letra x. O s
ca
mbolo de pargrafo () utilizado
a
e
para reticar uma informao publicada anteriormente.
ca
Exemplo. A tabela 2.1 apresenta os dados sobre resistncia ` ferrugem de 32 h
e
a
bridos
de milho (coluna 7). A distribuio de freqncias para essa varivel apresentada na tabela
ca
ue
a e
2.2, cuja construao passamos a discutir.
c
Na tabela 2.2, a primeira coluna mostra todas as categorias da varivel resistncia `
a
e
a
ferrugem. Na segunda coluna temos as freqncias absolutas, resultantes da contagem de
ue

30

Tabela 2.2: Distribuiao de freqncias da resistncia ` ferrugem de 32 h


c
ue
e
a
bridos de milho
recomendados para a regio preferencial I com altitudes abaixo de 800m, 1987/88
a
Resistncia ` Freqncia absoluta Freqncia relativa Porcentagem % acumulada
e
a
ue
ue
ferrugem
de satisfeito
R
MR
MS
S

10
6
9
7

0,313
0,188
0,281
0,219

31,250
18,750
28,125
21,875

TOTAL

32

1,000

31,250
50,000
-

100,000

quantas observaes se identicam com cada categoria. A notao para as freqncias abco
ca
ue
solutas ni , assim temos, n1 = 10, n2 = 6, n3 = 9, n4 = 7. A terceira coluna apresenta
e
uma medida relativa de cada freqncia, obtida da diviso de cada freqncia absoluta pelo
ue
a
ue
nmero total de observaoes, resultando nas propores ou freqncias relativas (fi = ni /n).
u
c
co
ue
Por exemplo, a freqncia relativa da categoria R calculada por: f1 = 10 32 = 0, 3125.
ue
e
Multiplicando por 100 as freqncias relativas, temos as percentagens de ocorrncias de cada
ue
e
resultado observado (coluna 4). A ultima coluna da tabela apresenta a porcentagem acumu
lada, dada pela porcentagem da respectiva coluna adicionada da(s) anterior(es) ` ela. Por
a
exemplo, os 50% da categoria MR o resultado da adio de 18,75% e 31,25%. Observa-se
e
ca
na tabela 2.2 que temos praticamente 50% de h
bridos resistentes e 50% de suscept
veis.
Deixamos as categorias MS e S com traos pois no tem sentido prtico o clculo das porc
a
a
a
centagens acumuladas neste caso, ou seja, no tem sentido armarmos que 100% dos h
a
bridos
so suscept
a
veis.
Essas medidas relativas so particularmente importantes na comparaao entre distribuioes
a
c
c
de freqncias, como veremos a seguir em distribuies bidimensionais, isto , quando temos
ue
co
e
duas variveis em estudo. Quando temos mais do que duas variveis o racioc o mesmo.
a
a
nio e

Tabelas Bidimensionais
A tabela 2.3 mostra trs distribuioes de freqncias, uma para cada regio preferencial.
e
c
ue
a
Dizemos que esta tabela bidimensional, pois apresenta a distribuiao de duas variveis,
e
c
a
quais sejam: 1) resistncia ` ferrugem e 2) regio.
e
a
a
Como os totais marginais da tabela 2.3 so diferentes, e isto diculta a interpretao,
a
ca
interessante trabalhar com porcentagens, tornando, assim, os resultados comparveis. As
e
a

31

Tabela 2.3: Distribuiao de freqncias da resistncia ` ferrugem de h


c
ue
e
a
bridos de milho,
segundo as regies preferenciais
o
Resistncia `
e
a
Regies
o
TOTAL
ferrugem
Chapec Campos Novos Iara
o
c
R
MR
MS
S

10
6
9
7

3
12
3
1

12
2
3
2

25
20
15
10

TOTAL

32

19

19

70

Tabela 2.4: Distribuiao das porcentagens da resistncia ` ferrugem de h


c
e
a
bridos de milho,
para as regies preferenciais (Pers colunas)
o
Resistncia `
e
a
Regies
o
TOTAL
ferrugem
Chapec Campos Novos Iara
o
c
R
MR
MS
S

31,2
18,8
28,1
21,9

15,8
63,2
15,8
5,2

63,2
10,5
15,8
10,5

35,8
28,6
21,4
14,3

TOTAL

100,0

100,0

100,0

100,0

porcentagens podem ser calculadas de trs formas: 1) xando-se os totais de linhas em 100%;
e
2) xando-se os totais de colunas em 100% e 3) xando-se o total geral em 100%. Isto vai
de acordo com o objetivo da pesquisa, uma delas ser a mais adequada.
a
Na tabela 2.4 xamos os totais de colunas em 100%. Este tipo de distribuiao serve para
c
comparar a distribuiao das regies conforme a resistncia ` ferrugem, ou seja, para uma
c
o
e
a
dada regio podemos analisar a varivel resistncia ` ferrugem. Com respeito a essa tabela,
a
a
e
a
observamos que em Campos Novos a porcentagem de h
bridos moderadamente resistentes
e
bem superior `s outras duas regies, 63,2% em Campos Novos contra 18,8% em Chapec e
a
o
o
10,5% em Iara. Por outro lado, vemos que Iara apresenta a maior porcentagem de h
c
c
bridos
resistentes ` ferrugem (63,2%), bem superior ` Chapec (31,2%) e Campos Novos (15,8%).
a
a
o
Percebe-se que em Chapec a distribuiao mais homognea nas categorias da resistncia.
o
c e
e
e

32

Tabela 2.5: Distribuiao das porcentagens da resistncia ` ferrugem de h


c
e
a
bridos de milho
(Pers linhas)
Resistncia `
e
a
Regies
o
TOTAL
ferrugem
Chapec Campos Novos Iara
o
c
R
MR
MS
S

40,0
30,0
60,0
70,0

12,0
60,0
20,0
10,0

48,0
10,0
20,0
20,0

100,0
100,0
100,0
100,0

TOTAL

45,7

27,1

27,1

100,0

Tabela 2.6: Distribuiao conjunta das porcentagens em relaao ao total geral


c
c
Resistncia `
e
a
Regies
o
TOTAL
ferrugem
Chapec Campos Novos Iara
o
c
R
MR
MS
S

14,3
8,6
12,9
10,0

4,3
17,1
4,3
1,4

17,1
2,9
4,3
2,8

35,7
28,6
21,4
14,3

TOTAL

45,7

27,1

27,1

100,0

De outra forma, se desejamos saber, por exemplo, para os h


bridos resistentes, qual a
distribuio por regio, devemos xar os totais de linhas (Pers linhas). Os resultados
ca
a
so dados na tabela 2.5. Em Campos Novos observamos uma baix
a
ssima porcentagem de
h
bridos resistentes ` ferrugem (12%); Chapec e Iara apresentam praticamente a mesma
a
o
c
porcentagem, 40% e 48%, respectivamente. Para a categoria MR, Campos Novos se destaca
com 60%. Dos MS e S, Chapec se destaca com 60% e 70%, respectivamente.
o
Na tabela 2.6, expressamos as porcentagens em relao ao total geral. Observamos
ca
que Campos Novos apresenta a maior porcentagem de h
bridos moderadamente resistentes
(17,1%). Iara apresenta a maior porcentagem de h
c
bridos resistentes (17,1%), seguido de
Chapec com 14,3%.
o
Exerc
cio resolvido
1. Um estudo sobre o tempo de vida de duas amostras de Biomphalaria straminea

33

Tabela 2.7: Nmero de indiv


u
duos classicados segundo o tempo de vida, em dias, e condio
ca
a que as populaoes foram submetidas
c
Tempo de vida
Condio
ca
Total
em dias
Agrupadas Isoladas
58 a 179

180 a 300

19

25

301 a 422

36

24

60

Total

45

49

94

(Amostra A: indiv
duos agrupados numa bacia e Amostra I: indiv
duos isolados em copos
de vidro), produziu os resultados da tabela 2.7:
a) Dos indiv
duos que tiveram tempo de vida entre 58 e 179 dias, qual a porcentagem
deles para a condio Agrupados? e Isolados?
ca
b) Qual a porcentagem de indiv
duos para tempo de vida entre 180 e 300 dias e condiao
c
Isolados?
c) Dos indiv
duos submetidos ` condio de Agrupados, qual a porcentagem de indiv
a
ca
duos
teve tempo de vida entre 301 e 422?
Observou-se 9 indiv
duos com tempo de vida entre 58 e 179 dias, portanto, as porcentagens so dadas por: 3/9=33,33% e 6/9=66,67%, respectivamente. A resposta do item b)
a
: 19/94=0,2021=20,21%. Observou-se um total de 45 indiv
e
duos submetidos a condio
ca
de Agrupados, portanto, a porcentagem dos que tem tempo de vida entre 301 e 422 :
e
36/45=0,80=80%.

34

2.1.3.2

Representaes Grcas de Variveis Qualitativas


co
a
a

As representaes grcas de tabelas de distribuies de freqncias permitem uma boa


co
a
co
ue
visualizao da distribuio da varivel. Podemos ter uma rpida e concisa visualizaao da
ca
ca
a
a
c
variabilidade da varivel. A utilizao de grcos para ilustrar os resultados de uma pesquisa
a
ca
a
sempre recomendvel. A construao de grcos depende muito da habilidade art
e
a
c
a
stica de
cada um. No objetivo deste livro entrar em detalhes sobre a construo de grcos e,
a e
ca
a
sim, somente comentar sobre alguns pontos que devem ser respeitados.
1. Os grcos devem ser claros, simples, atrair a ateno e inspirar conana.
a
ca
c
2. Servem para realar certos aspectos importantes de uma pesquisa.
c
3. O tamanho deve ser adequado ` sua publicao em revistas, peridicos, cartazes, livros,
a
ca
o
etc.
tulo completo e deve ser colocado na parte inferior do grco.
a
4. Sempre devem ter um t
5. Devem ser constru
dos numa escala que no desgure os fatos ou as relaes que se
a
co
deseja destacar.
6. Devem ser mais largos do que altos.
7. Deve-se sempre especicar (dar nome) e graduar (criar escala) os eixos.
8. Quando os dados no so prprios deve-se citar a fonte. Esta deve ser colocada na
a a
o
parte inferior do grco.
a
9. Pode-se usar notas para esclarecimentos gerais.
Nesta seao veremos os grcos de barras, colunas, setores e linhas, que so particularc
a
a
mente importantes na representao de dados categorizados. Mostraremos os tipos padres
ca
o
de grcos. Os programas estat
a
sticos como o Statistica, Statgraphics, Minitab, SPSS, SAS
e, tambm, planilhas eletrnicas como o Excel, fornecem uma gama enorme de grcos.
e
o
a
Os grcos de barras tem por nalidade comparar grandezas, por meio de retngulos de
a
a
igual largura, dispostos horizontalmente, e com alturas proporcionais as grandezas. Deve-se

deixar uma distncia entre os retngulos. E usado quando as inscrioes a serem colocadas
a
a
c
sob os retngulos forem muito extensas. Sempre que poss ordenar as barras em ordem
a
vel
decrescente. A gura 2.3 mostra o grco de barras da distribuio da tabela 2.2.
a
ca

35

Resistncia ferrugem

ms

mr

10

11

Nmero de hbridos

Figura 2.3: Distribuiao de freqncias da resistncia ` ferrugem de h


c
ue
e
a
bridos de milho, para
a regio preferencial I, 1987/88
a
Para efetuar uma anlise comparativa de vrias distribuies, podemos construir um
a
a
co
grco de barras mltiplo. A gura 2.4 mostra o grco de barras mltiplo da distribuio
a
u
a
u
ca
do tipo de gro e da resistncia ` ferrugem, cujos dados esto na tabela 2.1. Observe a
a
e
a
a
necessidade de construao de uma legenda.
c
Quando os retngulos so colocados na posiao vertical, temos os grcos de colunas.
a
a
c
a
A nalidade desse tipo de grco a mesma dos grcos de barras, isto , servem para
a
e
a
e
comparar grandezas. Eles devem ser preferidos aos grcos de barras quando as legendas a
a
se inscreverem sob os retngulos forem pequenas. Na gura 2.5 temos o grco de colunas
a
a
para tipo de gro (os dados esto na tabela 2.1, coluna 6).
a
a
O grco de setores consiste em dividir a rea total de um c
a
a
rculo em subreas (setores)
a

proporcionais `s freqncias. E um grco ideal para representar dados de porcentagens. O


a
ue
a
nmero de setores deve ser adequado. Considerando o tipo de gro dentado da tabela 2.1,
u
a
temos as seguintes porcentagens, 42,9%, 35,7%, 14,3% e 7,1%, para as categorias, moderadamente suscept
vel, resistentes, moderadamente resistentes e suscept
vel, respectivamente,
cujo grco dado na gura 2.6.
a
e

36

Resistentes
Semi-duro

Susceptvel

Tipo de gro

M. susceptvel
M. resistente
Semi-dentado

Dentado

Nmero de hbridos

Nmero de observaes

Figura 2.4: Distribuio das freqncias do tipo de gro e resistncia ` ferrugem de h


ca
ue
a
e
a
bridos
de milho, para a regio I, 1987/88
a

15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0

Dentado

Semi-dentado

Semi-duro

Tipo de gro

Figura 2.5: Distribuiao das freqncias dos tipos de gro para 32 h


c
ue
a
bridos de milho, para a
regio I, 1987/88
a

37

mod. resistentes, 14,3 %

resistentes, 35,7 %

mod. susceptvel, 42,9 %


susceptvel, 7,1 %

Resistncia ferrugem

Figura 2.6: Distribuiao das proporoes (%) da resistncia ` ferrugem, para o tipo de gro
c
c
e
a
a
dentado, para a regio I, 1987/88
a
Os grcos de linhas so adequados para dados ordenados ao longo do tempo (sries
a
a
e
temporais) e servem para comparar distribuioes. Na gura 2.7, apresentamos o grco de
c
a
linhas da varivel acidez em cido ltico (%) de 4 tratamentos, denominados aqui por PA,
a
a
a
PB, PC e C.
Exerc
cio resolvido
1. Um pesquisador est procurando vericar se existe associao entre hbito de crescia
ca
a
mento (3=indeterminado trepador e 4=indeterminado prostrado) e porte (Tr=trepador,
EB=ereto na base e Pr=prostrado) na cultura do feijo de vagem. Para esse m foi cona
duzido um experimento na UFSC, safra 1991/92, cujos resultados esto na tabela 2.8.
a
a) Construa a distribuiao de frequncia conjunta para as variveis hbito de crescimento e
c
e
a
a
porte. Resposta tabela 2.9.
b) Faa um grco para a distribuio de freqncia conjunta do item a). Resposta gura
c
a
ca
ue
2.8.
2.1.3.3 Exerc
cios Propostos
1. Um pesquisador est procurando vericar se existe associaao entre local (1= Rio
a
c
vermelho; 2= Costa da lagoa) e nmero de abortos para crianas do sexo feminino. Para
u
c
esse m foi feito um levantamento, cujos resultados esto apresentados na tabela 2.10 (Obs:
a
A unidade de amostragem uma fam
e
lia):
a) Construa a distribuiao de freqncias conjunta para as variveis local e nmero de
c
ue
a
u
abortos.
b) Faa um grco para a distribuio de freqncias conjunta do item a).
c
a
ca
ue

38

0,76

Acidez em cido ltico (%)

0,72
0,68
0,64
0,60
C

0,56

PC
PB

0,52

PA
0,48

14

21

28

Tempo em dias

Figura 2.7: Comportamento da varivel acidez em cido ltico (%) nos diversos tratamentos
a
a
a
durante a maturaao de salame tipo italiano,UFSC, 1992
c

Tabela 2.8: Hbito e porte para 50 materiais de feijo de vagem.


a
a
H P H P H P H P H P
4
4
3
4
4
4
3
3
4
4

Tr
EB
Pr
Tr
Tr
Tr
Pr
EB
Tr
Tr

4
4
3
3
3
3
4
4
4
4

Tr
Tr
Pr
Pr
Pr
EB
EB
EB
Tr
Tr

4
4
3
4
4
4
4
4
3
4

39

Tr
Tr
Tr
Tr
Tr
Tr
Tr
Tr
Pr
Tr

4
4
4
3
4
3
4
3
4
4

Pr
Tr
Pr
Pr
Tr
Pr
Pr
Pr
Tr
Tr

4
3
3
3
4
4
4
4
3
4

Tr
Pr
Pr
Pr
Tr
Tr
Tr
Tr
Pr
Tr

Tabela 2.9: Distribuio conjunta do hbito de crescimento e porte na cultura do feijo de


ca
a
a
vagem, UFSC, 1991/92
Porte
Hbito de crescimento
a
Total
3
4
Trepador
Ereto na base
Prostrado

1 6,3%
2 12,5%
13 81,3%

28 82,4%
3 8,8%
3 8,8%

29 58,0%
5 10,0%
16 32,0%

Total

16 100,0%

34 100,0%

50 100,0%

Figura 2.8: Grco da distribuio conjunta do item a).


a
ca

40

Tabela 2.10: Resultados de um estudo sobre locais e ocorrncia de aborto


e
Local Aborto Local Aborto Local Aborto Local Aborto Local Aborto
2
2
2
2
2
2
2
2
2
2
2
2
2
2

0
0
1
0
0
0
0
2
2
0
1
1
0
0

2
2
2
2
2
2
2
2
2
2
2
2
2
2

0
1
1
1
1
1
0
0
0
0
0
0
0
0

2
2
2
2
2
2
2
2
2
2
1
1
1
1

0
0
1
1
2
0
0
0
0
1
0
0
0
1

1
1
1
1
1
1
1
1
1
1
1
1
1
1

1
1
1
0
2
1
0
0
0
0
0
0
0
0

1
1
1
1
1
1
1
1
1

0
0
0
0
0
0
0
0
0

2. Um economista agr
cola est estudando os fatores que afetam a adoo de uma nova
a
ca
variedade de arroz altamente produtiva. Os resultados obtidos esto na tabela 2.11.
a
a) Faa um grco para tabela 2.11, mostrando o comportamento da adoao segundo a
c
a
c
situao de posse da terra (perl linha). Faa a interpretao dos resultados.
ca
c
ca
3. Foi conduzido um experimento com o objetivo de avaliar o poder germinativo de
duas cultivares de cebola: A) Bola Precoce-EMPASC 352 e B) Norte 14. Foram utilizadas
para o teste de germinaao, 4 repetioes de 100 sementes, totalizando 400 sementes para
c
c
cada cultivar. A varivel de estudo o nmero de sementes que germinam. Os resultados
a
e
u
Tabela 2.11: Distribuio conjunta de freqncias
ca
ue
Posse
Adoo
ca
Total
Adota No adota
a
Proprietrio
a
Vrios arendatrios
a
a

Unico arendatrio
a

102
42
5

26
10
2

128
52
7

Total

149

38

187

41

Tabela 2.12: Germinaao de sementes para duas cultivares de cebola.


c
Germinaao
c
Cultivares
Germinaram No germinaram Total
a
Bola Precoce
Norte 14

392
381

8
19

400
400

Total

773

27

800

Tabela 2.13: Distribuiao conjunta das variveis local e peso de mexilhes


c
a
o
Local
Peso
Total
[7;20) [20;33) [33;46)
Mangue
Sambaqui

21
1

12
14

2
19

35
34

Total

22

26

21

69

obtidos esto na tabela 2.12. Faa um grco mostrando o comportamento das cultivares
a
c
a
com relaao ` germinao das sementes. Faa a interpretaao dos resultados.
c a
ca
c
c
4. A tabela 2.13 representa a distribuiao conjunta das variveis local de coleta e peso
c
a
de mexilhes. Faa um grco para representar a distribuio conjunta. Obtenha uma
o
c
a
ca
concluso relevante.
a
2.1.3.4 Tabelas de Contingncia
e

E muito freqnte nas Cincias Biolgicas o interesse em vericar se duas variveis qualiue
e
o
a
tativas apresentam-se associadas, isto , se o conhecimento de uma varivel ajuda a entender
e
a
uma outra varivel. Construindo uma distribuiao de freqncia conjunta das duas variveis,
a
c
ue
a
ou seja, uma tabela de contingncia, podemos satisfazer de forma exploratria esse objetivo.
e
o
Vamos vericar que a simples construo da distribuiao conjunta das freqncias ser um
ca
c
ue
a
poderoso instrumento para ajudar na compreenso dos dados. Como veremos, as tabelas
a
constru
das na seo anterior, so chamadas de tabelas de contingncia e sero agora introca
a
e
a
duzidas formalmente.
Para se construir uma tabela de contingncia, deve-se observar conjuntamente as duas
e
variveis nos elementos em estudo. Por exemplo, vamos observar para cada aluno, o grau
a
de satisfaao com o curso e o preparo dos professores. Se desejamos descrever a varivel
c
a
grau de satisfao com o curso, sabendo-se que a mesma tem associao com o preparo dos
ca
ca

42

Tabela 2.14: Distribuiao conjunta de freqncias das variveis A e B, observados em n


c
ue
a
elementos
B
A

B1

B2

...

Br

TOTAIS

A1
A2
.
As

n11
n21
.
ns1

n12
n22
.
ns2

...
...
...
...

n1r
n2r
.
nsr

n1.
n2.
.
ns.

TOTAIS

n.1 =

s
i=1

ni1

n.2 =

s
i=1

ni2

... n.r =

s
i=1

nir

n.. =

s
i=1

r
j=1

nij

professores, ca mais fcil compreender a primeira varivel.


a
a
Vamos considerar que a varivel A tenha s categorias, A1 , A2 , ..., As e a varivel B tenha
a
a
r categorias, B1 , B2 , ..., Br . Por exemplo, a varivel grau de satisfao com o curso tem 5
a
ca
categorias, quais sejam: 1 - muito bom; 2 - bom; 3 - mdio; 4 - baixo e 5 - muito baixo.
e
A varivel preparo dos professores tambm tem 5 categorias, no caso, idnticas ` primeira
a
e
e
a
varivel.
a
Se observarmos as duas variveis, A e B, em um grupo de n elementos, objetos ou pessoas,
a
teremos uma classicaao como a indicada na tabela 2.14, a qual chamada de tabela de
c
e
contingncia.
e
Na tabela 2.14, n11 representa o nmero de elementos classicados na categoria A1 e B1
u
simultaneamente, em outras palavras, a freqncia observada de elementos que pertencem
e
ue
a categoria A1 e B1 simultaneamente. Os valores ni. = r nij , n.j = s nij e n.. =
j=1
i=1
s
r
i=1
j=1 nij representam os totais de linhas, colunas e o total geral, respectivamente.
Exemplo. Na tabela 2.15 apresenta-se a distribuio conjunta da resistncia ` ferrugem e
ca
e
a
tipo de gro para os 32 h
a
bridos de milho.
Cada casela d a frequncia observada de h
a
e
bridos que pertencem a categoria Ai e Bj ,
i = 1, 2, 3 e j = 1, 2, 3, 4, simultaneamente. Assim, observamos na casela (1;1), 5 h
bridos
resistentes ` ferrugem e com o tipo de gro dentado, e assim por diante.
a
a
Observem que os totais de colunas nos fornece a distribuio de freqncias da varivel
ca
ue
a
resistncia ` ferrugem, enquanto os totais de linhas nos do a distribuiao de freqncias
e
a
a
c
ue
da varivel tipo de gro. Tecnicamente estas distribuies so chamadas de distribuies
a
a
co
a
co
marginais, ento, temos a distribuio marginal da varivel resistncia ` ferrugem (totais de
a
ca
a
e
a

43

Tabela 2.15: Distribuiao conjunta das freqncias das variveis resistncia ` ferrugem e
c
ue
a
e
a
tipo de gro para 32 h
a
bridos de milho, 1987/88.
Tipo de gro Resistncia ` ferrugem1 Totais
a
e
a
R MR MS
S
Dentado
Semi-dentado
Semi-duro

5
4
1

2
1
3

6
2
1

1
4
2

14
11
7

Total
10
6
9
7
32
R = resistente; MR = moderadamente resistente; MS = moderadamente suscept
vel; S =
suscept
vel.

Tabela 2.16: Distribuio conjunta das percentagens das variveis resistncia ` ferrugem e
ca
a
e
a
tipo de gro para 32 h
a
bridos de milho, 1987/88.
Tipo de gro Resistncia ` ferrugem1 Totais
a
e
a
R
MR MS
S
Dentado
Semi-dentado
Semi-duro

35,7
36,4
14,3

14,3
9,1
42,8

42,9
18,2
14,3

7,1
36,4
28,6

100,0
100,0
100,0

Total
31,2 18,8 28,1 21,9 100,0
R = resistente; MR = moderadamente resistente; MS = moderadamente suscept
vel; S =
suscept
vel.

colunas) e a distribuiao marginal do tipo de gro (totais de linhas), enquanto que a tabela
c
a
toda representa a distribuio conjunta das duas variveis.
ca
a
Como os totais marginais da tabela 2.15 so diferentes, torna-se dif fazer alguma
a
cil
interpretao. Para facilitar, podemos incluir as freqncias relativas, em porcentagem,
ca
ue
que podem ser calculadas em relaao aos totais de linhas, colunas ou em relaao ao total
c
c
geral. Os totais (linhas, colunas ou geral) em porcentagens so comparveis, pois reduz-se
a
a
as freqncias a um mesmo total.
ue
A tabela 2.16 apresenta as porcentagens calculadas em relaao aos totais de linhas. Sendo
c
assim, vamos estudar a distribuiao da resistncia ` ferrugem para cada um dos diferentes
c
e
a
tipos de gros (os pers so as linhas).
a
a
Interpretao: observa-se, para os h
ca
bridos selecionados, um indicativo de associao
ca

44

entre a resistncia ` ferrugem e o tipo de gro, pois, enquanto o tipo de gro semi-duro apree
a
a
a
senta a menor porcentagem de resistncia ` ferrugem (14,3%), o tipo de gro semi-dentado
e
a
a
apresenta a menor porcentagem de moderadamente resistentes (9,1%) e o tipo de gro dena
tado apresenta a menor porcentagem de h
bridos suscet
veis ` ferrugem (7,1%). Podemos
a
vericar esta associao de outra forma. Observamos na amostra selecionada que 31,2%
ca
dos h
bridos so resistentes (R) ` ferrugem. Ora, se no existe associao (dependncia)
a
a
a
ca
e
entre as variveis, esperar
a
amos esta mesma porcentagem (31,2%) para todos os 3 tipos
de gros. Observamos, na amostra de h
a
bridos, uma porcentagem de 35,7% para dentado,
36,4% para semi-dentado e 14,3% para semi-duro, este ultimo resultado bastante abaixo dos

31,2% esperados. Isto nos leva a acreditar que realmente existe associaao entre a resistncia
c
e
` ferrugem e o tipo de gro dos h
a
a
bridos de milho amostrados.
Exerc
cios resolvidos
1. Para os dados da tabela 2.8 podemos considerar que o hbito est associado com o
a
a
porte? justique.
Sim, pois vericamos que para o hbito de crescimento 3, 81,3% dos materiais apresentam
a
porte prostrado. Por outro lado, para hbito 4, 82,4% dos materiais apresentam porte
a
trepador. Procure entender esta associaao atravs do grco da gura 2.8
c
e
a
2. Os dados da tabela de contingncia 2.17 tem por objetivo analisar a segregaao
e
c
dos dados de uma prognie de uma espcie X segregando para dois fatores: precocidade e
e
e
virescncia (tipo de decincia de clorola). Sabe-se que a precocidade recessiva em relao
e
e
e
ca
` ciclo tardio e controlada, neste caso, por um par de genes. O tipo virescente tambm
a
e
e e
recessivo em relaao ao normal e controlado por um par de genes.
c
a) Fixe os totais de colunas em 100%. Resposta tabela 2.17.
b) Faa um grco para a tabela, vericando a distribuiao da precocidade segundo a
c
a
c
virescncia (perl coluna). Resposta gura 2.9.
e
c) Os dois pares de genes so herdados independentemente ou h evidncia de associao?
a
a
e
ca
justique com apresentao de valores. Existe uma associaao fraca entre as variveis, pois
ca
c
a
para virescncia normal observa-se que 77,11% apresentam precocidade tardia. Observa-se
e
quase a mesma porcentagem (75,83%) para virescente e tardio. Portanto, no houve uma
a
mudana razovel quando mudamos de n de virescncia, indicando associao fraca.
c
a
vel
e
ca
3. A tabela de contingncia 2.18 refere-se ao nmero de pssaros de uma particular
e
u
a
espcie, classicados de acordo com duas variveis qualitativas, que so: 1 ) local da oresta
e
a
a
e 2 ) estaao do ano. Os pssaros foram observados alimentando-se de acordo com as duas
c
a
variveis. Um pesquisador levantou a hiptese (no in do trabalho), de que os pssaros
a
o
cio
a
alimentam-se nestes 3 locais da oresta nas mesmas propores na primavera e no outono.
co

45

Tabela 2.17: Segregao de dois caracteres numa prognie da espcie X


ca
e
e
Precocidade
Virescncia
e
Total
Normal
Virescente
Tardio
Precoce
Total

3470 77,11%
1030 22,89%

910 75,83%
290 24,17%

4380 76,84%
1320 23,16%

4500 100,00% 1200 bivariada


Distribuio 100,00%

5700 100,00%

Figura 2.9: Distribuio da precocidade segundo a virescncia


ca
e
Tabela 2.18: Distribuiao conjunta das variveis local e estao
c
a
ca
Estaao
c
Local da Floresta
Total

do ano
Arvores
Arbusto
Cho
a
Primavera
Outono

30 50,8%
13 21,3%

20 33,9%
22 36,1%

9 15,3%
26 42,6%

59 100,0%
61 100,0%

Total

43 35,8%

42 35,0%

35 29,2%

120 100,0%

46

60

50

50

40

40

30

30

20

20

10

porcentagens

60

10

rvores Arbustos

Cho

Primavera

rvores Arbustos

Cho

Outono

Figura 2.10: Associaao entre local e estaao


c
c
Em outras palavras, o pesquisador formulou a hiptese de que no existe associaao entre
o
a
c
as duas variveis. Voc aceita ou rejeita a hiptese formulada pelo pesquisador? justique.
a
e
o
Resposta: rejeitamos a hiptese formulada. Na primavera 50,8% dos pssaros alimentam-se
o
a
nas rvores, enquanto que no outono, o comportamento muda, isto , a maior porcentagem
a
e
(42,6%) alimentam-se no cho. Faa um grco de barras mltiplo para representar os dados
a
c
a
u
da tabela acima e visualizar esta associaao. Resposta na gura 2.10.
c
2.1.3.5 Exerc
cios Propostos
1. Um economista est estudando os fatores que afetam a adoao de uma nova variedade
a
c
de arroz altamente produtiva. Ele deseja saber se a adoao afetada pela situaao de posse
c e
c
da terra. Os resultados obtidos numa amostra de 187 agricultores esto organizados na
a
tabela de contingncia 2.11. O que o economista pode concluir?
e
2. Um estudo realizado a m de avaliar a ecincia de uma nova vacina antigripal, a
e
e
qual foi administrada aos membros de uma pequena comunidade. A vacina foi administrada
em duas doses, ao longo de duas semanas. Algumas pessoas tomaram as duas doses, outras
tomaram apenas a 1a dose e outras no tomaram qualquer dose. A tabela 2.19 mostra
a
os resultados obtidos para um total de 1000 habitantes dessa comunidade. Esses dados
apresentam uma evidncia suciente para garantir que tal vacina foi bem sucedida, reduzindo
e
o nmero de casos de gripe nessa comunidade? Em outras palavras, verique se existe
u
associaao nesta tabela. Justique com valores de proporoes obtidas xando-se os totais de
c
c
linhas em 100%.
3. Utilizando os dados da tabela 2.19, responda:
a) faa um grco para a distribuiao conjunta das porcentagens obtidas no exerc 2;
c
a
c
cio

47

Tabela 2.19: Distribuiao conjunta das variveis


c
a
Estado
Vacinaao
c
Total
de sade
u
No-vacinados Uma dose Duas doses
a
Gripados
No-gripados
a

24
289

9
100

13
565

46
954

Total

313

109

578

1000

b) calcule a proporao de no-vacinados entre os indiv


c
a
duos no-gripados;
a
c) calcule a proporao de no-gripados e que usaram duas doses de vacina.
c
a
4. De acordo com os dados da tabela 2.10, podemos dizer que a ocorrncia de aborto
e
est associada com o local? Justique.
a
5. Com os dados da tabela 2.12, verique se existe dependncia (associaao) entre as
e
c
cultivares e a germinaao de sementes. Justique.
c
6. Para os resultados da tabela 2.13 voc concluiria que o peso est associado com o
e
a
local? Justique com os dados de percentagens.
7. Faa um grco para a tabela 2.16 e observe a associaao existente entre o tipo de
c
a
c
gro e a resistncia ` ferreugem.
a
e
a
2.1.3.6 Coeciente de Contingncia de Pearson
e
Vamos agora pensar que estamos interessados em obter uma medida estat
stica que indique se existe ou no relaao entre duas variveis e qual a magnitude desta, isto , a grandeza
a
c
a
e
da associaao. Aqui, desejamos fazer um estudo da associao ou dependncia entre duas
c
ca
e
variveis categorizadas. No caso de estarmos trabalhando com variveis quantitativas, estas
a
a
podem ser transformadas em variveis categorizadas. Exemplo de categorizaao de uma
a
c
varivel quantitativa: seja a varivel rendimento de uma variedade transformada em trs
a
a
e
categorias:< 1500 kg/ha (rendimento baixo), 1500 e 3000 (rendimento normal) e > 3000
(rendimento alto).
Uma medida de associao que pode ser utilizada nesse caso o coeciente de contingncia
ca
e
e
de Pearson, representado pela letra C . Podemos atravs deste coeciente, por exemplo,
e
vericar a grandeza da associao entre o local da oresta onde os pssaros se alimentam e a
ca
a
estao do ano, veja tabela 2.18. Outro exemplo, vericar a magnitude da associaao entre
ca
c
a adoao de tecnologia e a situaao de posse da terra, veja a tabela 2.11.
c
c
Antes de passarmos ao estudo detalhado do clculo do coeciente de contingncia de
a
e
Pearson, vamos, sem muitos detalhes, citar e indicar os clculos de outras duas estat
a
sticas

48

para o estudo de associaao.


c
A primeira delas o coeciente de associaao de Yule, para tabelas 2 2, dado por:
e
c
Q=

(f11 f22 f12 f21 )


,
(f11 f22 + f12 f21 )

que varia de -1 a 1, onde, f11 representa a freqncia de ocorrncia da categoria 1 da varivel


ue
e
a
A e a categoria 1 da varivel B, e assim para os demais termos. Por exemplo, para a tabela
a
2.17 temos:
(3470.290 910.1030)
69000
Q=
=
= 0, 04.
(3470.290 + 910.1030)
1943600
Concluimos que existe uma associao muito fraca entre as duas variveis, pois o valor de Q
ca
a
prximo de zero.
e o
Um outro coeciente o de Cramr, para tabelas l c (l = nmero de linhas e c =
e
e
u
nmero de colunas da tabela), dado por:
u
V =

2 /n(min(l 1, c 1)),

que varia de 0 (zero) a 1;onde min(l 1, c 1) o m


e
nimo entre o nmero de linhas(l) menos
u
1 e o nmero de colunas(1) menos 1; n o total geral de freqncias da tabela; a estat
u
e
ue
stica
2
, leia-se Qui-Quadrado, ser mostrada em detalhes ainda nesta subseao. Para os dados
a
c
da tabela 2.18, temos V = 0, 3541. De acordo com este coeciente, a associao entre as
ca
duas variveis moderada para fraca.
a
e
Como foi dito inicialmente, a construao da distribuio conjunta das freqncias, nos
c
ca
ue
ajuda bastante na interpretao dos resultados. Na tabela 2.18, temos a distribuiao conjunta
ca
c
de freqncias das variveis local da oresta e estao do ano. Observe que para facilitar a
ue
a
ca
interpretao dos resultados, os totais de linhas foram xadas em 100%. A interpretaao j
ca
c a
foi feita anteriormente e o resultado foi um indicativo de associao entre o local da oresta
ca
e a estaao do ano. Vamos, agora, utilizar este exemplo para mostrar todos os passos no
c
clculo do coeciente de contingncia de Pearson.
a
e

Independncia de Variveis
e
a
Quando se constroi uma distribuio conjunta de freqncias, um dos principais objetivos,
ca
ue
procurar estabelecer a associaao existente entre as variveis, isto , desejamos conhecer o
e
c
a
e
grau de dependncia entre as variveis, pois conhecendo o grau de dependncia entre elas,
e
a
e
podemos prever o melhor resultado de uma varivel sabendo-se o resultado da outra. Por
a
exemplo, se desejamos saber o local da oresta onde os pssaros se alimentam, se nos tivermos
a
informao sobre a estao do ano, vamos ter condioes de estimar com maior preciso o
ca
ca
c
a

49

local onde os pssaros se alimentam, pois existe uma dependncia entre o local da oresta e
a
e
a estaao do ano.
c
A dependncia no no sentido de que uma determina a outra. Por exemplo, num estudo
e
a e
para vericar se existe associaao entre a satisfaao com o emprego e os salrios percebidos,
c
c
a
no signica que melhorando as condioes de trabalho (satisfaao), vai melhorar os salrios.
a
c
c
a
Em primeiro lugar, observamos que, independentemente da estao do ano, 35,8% dos
ca
pssaros se alimentam nas rvores, 35% nos arbustos e 29,2% no cho.
a
a
a
Ora, se existe independncia entre o local da oresta e a estaao do ano, esperamos estas
e
c
mesmas porcentagens para cada categoria da estaao do ano. Comparando-se as frequncias,
c
e
podemos interpretar que existe dependncia entre as variveis.
e
a
Quando existe dependncia entre as variveis interessante conhecer a magnitude dessa
e
a
e
associaao, ou seja, conhecer se a associaao fraca, moderada ou forte. Portanto, imporc
c e
e
tante termos uma medida de associao entre variveis categorizadas.
ca
a

Medida de Associao Entre Duas Variveis Categorizadas


ca
a
Trataremos do coeciente de contingncia de Pearson, representado pela letra C , que
e
descreve num unico nmero a dependncia entre duas variveis.

u
e
a
Teoricamente este valor varia entre 0 (zero) e 1 (um), 0 C 1, sendo nulo quando as
variveis so independentes. Quando existe uma associaao perfeita entre as duas variveis,
a
a
c
a
o coeciente de contingncia de Pearson vale 1.
e
Para o clculo do coeciente necessrio, em primeiro lugar, calcularmos uma outra
a
e
a
estat
stica, chamada de Qui-Quadrado, e representada pela letra grega elevada a potncia
e
2
2. Ento, passamos de imediato ao clculo do , atravs do exemplo da tabela 2.18.
a
a
e
Na hiptese de independncia, esperamos para local da oresta rvores e estao primavo
e
a
ca
era, 590, 358 = 21, 122 pssaros; para local da oresta rvores e estao outono, esperamos
a
a
ca
61 0, 358 = 21, 838 pssaros, e assim para todas as caselas restantes da tabela. Um modo
a
prtico de se encontrar as freqncias esperadas sob a hiptese de independncia, dado por:
a
ue
o
e
e
f e11 =

59 43
n1. n.1
=
= 21, 141.
n..
120

A notaao f e11 indica a freqncia esperada para a estao primavera (linha 1) e local rvores
c
ue
ca
a
(coluna 1). Se o leitor no est lembrado desses
a
a
ndices, veja novamente a tabela 2.14.
Para a casela 21, isto , estao outono (linha 2) e local rvores (coluna 1), temos:
e
ca
a
f e21 =

61 43
n2. n.1
=
= 21, 858.
n..
120

50

Tabela 2.20: Frequncias observadas e esperadas sob a hiptese de independncia


e
o
e
Estaao
c
Local da Floresta
Total

do ano
Arvores Arbusto
Cho
a
Primavera
Outono

30 21,14
13 21,86

20 20,65
22 21,35

9 17,21
26 17,79

59
61

43

42

35

120

Total

Tabela 2.21: Desvios entre as frequncias observadas e esperadas, no caso de independncia


e
e
das variveis
a
Estaao
c
Local da Floresta

do ano
a
Arvores Arbusto Cho
Primavera
Outono

8,86
-8,86

-0,65
0,65

-8,21
8,21

A diferena vericada na segunda casa decimal entre os dois procedimentos de clculo


c
a
e
devido ` aproximaes. Fazemos a mesma operao para as demais caselas. Todas as
a
co
ca
freqncias observadas e esperadas sob a hiptese de independncia, esto demonstradas
ue
o
e
a
na tabela 2.20. Encontre esses valores. Observando-se a tabela 2.20 podemos vericar as
discrepncias existentes entre os valores observados e esperados caso as variveis fossem
a
a
independentes. Na tabela 2.21, apresentamos os desvios entre os valores observados e os
esperados. A estat
stica Qui-Quadrado (2 ), que uma medida de afastamento global da
e
hiptese de independncia, isto , quanto maior o valor do 2 , maior ser o grau de associao
o
e
e
a
ca
entre as duas variveis, calculado atravs da seguinte expresso:
a
e
e
a
lc
2

=
i=1

(oi ei )2
ei

(2.1)

onde, oi a freqncia observada da i-sima casela; ei a freqncia esperada da i-sima


e
ue
e
e
ue
e
casela; l o nmero de linhas e c o nmero de colunas. Para o exemplo, temos:
e
u
e
u
8, 862 0, 652 8, 212 8, 862 0, 652
8, 212
+
+
+
+
+
21, 14
20, 65
17, 21
21, 86
21, 35 17, 79
= 3, 7133 + 0, 0205 + 3, 9166 + 3, 5910 + 0, 0198 + 3, 7889

2 =

= 15, 0501.
a
E fcil perceber que se 2 = 0, as duas variveis so independentes e que se 2 > 0 indica
a
a

51

associaao das variveis. O valor de Qui-Quadrado no possui um limite superior, pois varia
c
a
a
de 0 (zero) a + ( mais innito). Na seao 8.5.2 iremos fazer o teste de qui-quadrado, que
c
e
um teste conrmatrio, no sentido de poder armar se existe ou no associao signicativa
o
a
ca
(estatisticamente comprovada) entre as variveis.
a
Descritivamente, Karl Pearson props o chamado coeciente de contingncia, represeno
e
tado pela letra C, denido por:
2
C=
,
(2.2)
2 + n
onde n o nmero total de observaoes. Para o exemplo em estudo temos:
e
u
c
15, 0501
= 0, 3338,
15, 0501 + 120

C=

indicando que existe associaao, porm podemos dizer que a associao fraca.
c
e
ca e
Quando existe uma associaao perfeita, esse coeciente no atinge o valor 1, por isso, foi
c
a
sugerido uma correao, a qual consiste em calcular,
c
C =

C
(t 1)/t

(2.3)

onde t o m
e
nimo entre o nmero de colunas e o nmero de linhas da tabela de contingncia.
u
u
e
Para o exemplo, onde t = 2, temos:
0, 3338

C =

(2 1)/2

= 0, 4721.

Agora, temos uma associaao moderada entre as variveis. Devemos considerar as variveis
c
a
a
como moderadamente associadas.
Exerc
cio resolvido
1. Para os dados da tabela 2.9, obter o coeciente de contingncia de Pearson e interpree
tar.
O valor de qui-quadrado :
e
2 = 7, 3877 + 3, 4766 + 0, 1000 + 0, 0470 + 12, 1278 + 5, 7072 = 28, 8464.
O valor do coeciente de conngncia :
e
e
C=

28, 8464
= 0, 6049.
28, 8464 + 50

Portanto, com a correao temos:


c
C =

0, 6049
1/2

= 0, 8554.

Concluso: existe forte associaao entre hbito e porte.


a
c
a

52

2.1.3.7 Exerc
cios Propostos
1. Com os dados da tabela 2.10, calcule o coeciente de contigncia de Pearson e conclua.
e
2. Com os dados da tabela 2.8, calcule o coeciente de contigncia de Pearson e conclua.
e
3. Com os dados da tabela 2.12, calcule o coeciente de contingncia de Pearson e
e
interprete.
4. Calcule o coeciente de contingncia de Pearson e o de Cramr para os dados da
e
e
tabela 2.13. Faa a interpretaao.
c
c
2.1.3.8 Distribuies de Freqncias de Variveis Quantitativas: Diagrama de
co
ue
a
Pontos, Grco de Colunas e Histograma
a
Inicialmente faremos uma breve introduao sobre o estudo de distribuioes de frequncias
c
c
e
para variveis aleatrias quantitativas e, aps, discutiremos as tcnicas para este estudo.
a
o
o
e
Quando a varivel em estudo quantitativa, discreta ou cont
a
e
nua, as principais caracter
sticas a serem observadas numa distribuiao de frequncias so:
c
e
a

o
1. valor tpico ou representativo, que como o prprio nome indica, corresponde a escolha
de um unico valor para representar todo o conjunto de valores;

2. assimetria, por exemplo, no estudo da distribuiao da renda (em nmero de salrios


c
u
a
m
nimos) das fam
lias brasileiras, a grande maioria das fam
lias apresentam baixo
rendimento familiar, enquanto que uma minoria apresenta altos rendimentos, isto
provoca uma cauda longa ` direita da distribuiao, tornando-a assimtrica, veja gura
a
c
e
2.36;

3. disperso, uma medida da concentrao dos dados em torno do valor t


a e
ca
pico. E
necessrio ter um valor referncia para poder compar-lo;
a
e
a
4. valores discrepantes ou outliers, so valores muito pouco provveis de ocorrerem
a
a

na distribuio, algumas vezes so valores que se distanciam demais dos outros. E


ca
a
importante realizar um estudo para saber a razo da ocorrncia desses valores, pode-se
a
e
citar 3 principais causas: 1) erro de transcriao de dados; 2) algum fato importante
c
ocorreu durante o trabalho e 3) o valor verdadeiro e deve ser considerado como tal;
e
5. formao de subgrupos, por exemplo, ao estudar-se a distribuiao das alturas dos
ca
c
alunos, pode-se chegar a concluso que existem dois grupos, formados de acordo com
a
o sexo.

53

No caso do estudo de distribuies de frequncias de variveis quantitativas podemos


co
e
a
estabelecer duas situaes, quais sejam:
co
1 ) a varivel cont
a
e
nua, nesse caso, necessrio a criaao de classes de ocorrncias,
e
a
c
e
pois no existem ou so poucos os valores que se repetem. Observaao: quando temos
a
a
c
poucos valores, isto , o nosso conjunto de valores no grande, em torno de 25, a
e
a e
distribuiao pode ser representada por meio de um diagrama de pontos, ou seja, cada
c
observaao corresponde a um ponto na reta dos reais. Esta tcnica ser mostrada em
c
e
a
seguida.
2 ) a varivel discreta, nesse caso, temos duas situaes: a) quando temos poucos
a
e
co
resultados diferentes da varivel, fazemos a contagem dos dados para cada valor da
a
varivel. Exemplos, o nmero de plantas sadias de mandioca colhidas na rea util da
a
u
a

2
parcela (rea de 19,44 m ) varia no intervalo de 23 a 27 plantas (5 valores diferentes),
a
nmero de gros por vagem de soja. Nesse caso diz-se que no h perda de informaao
u
a
a a
c
e as distribuioes de frequncias so feitas de forma idntica `s variveis qualitativas
c
e
a
e
a
a
(categorizadas). Tambm pode-se fazer o diagrama de pontos; b) quando temos muitos
e
valores diferentes da varivel procedemos de forma idntica ao de varivel cont
a
e
a
nua,
isto , vamos criar faixas de ocorrncia. Por exemplo, ciclo da cultura de 150 gentipos
e
e
o
de feijo.
a
Passamos, agora, ao estudo da construao das distribuies de frequncias para variveis
c
co
e
a
aleatrias quantitativas. Os mtodos abordados so: Diagrama de Pontos, Dados Agrupados
o
e
a
em Classes e Ramo-e-Folhas.

Diagrama de Pontos
Quando temos poucas observaes de uma varivel em estudo (at aproximadamente 25),
co
a
e
a distribuiao pode ser representada por um diagrama de pontos, isto , cada observaao
c
e
c

corresponde a um ponto na reta dos nmeros reais. E poss representar duas ou mais disu
vel
tribuies no mesmo diagrama, para isso basta identicar cada distribuiao por um s
co
c
mbolo
diferente (criar uma legenda). A gura 2.11 ilustra esse diagrama com os pesos ao nascer de
24 bezerros machos das raas Charoleza e Gir, em kg. Os dados para as duas raas so:
c
c
a
Charoleza
Gir

47
40

45 37
43 44

41 46
46 48

Interpretao do diagrama de pontos:


ca

54

47 34
51 54

25 40 45
55 56 57

48 40
55 54

Charoleza
Gir

20

25

30

35

40

45

50

55

60

Peso ao nascer, em kg.

Figura 2.11: Distribuiao de freqncias do peso ao nascer de bezerros da raa Charoleza e


c
ue
c
Gir (kg)
c
a
Observamos que os pesos ao nascer de bezerros da raa Charoleza so menos dispersos
(esto mais prximos) do que a raa Gir. Portanto, os bezerros da raa Charoleza so
a
o
c
c
a
mais homogneos quanto ao peso ao nascer.
e
Ambas as distribuioes so assimtricas ` esquerda, pois temos poucos valores e mais
c
a
e
a
espalhados no lado esquerdo das distribuioes, isso gera uma cauda mais longa ` esc
a
querda.
c
a
Os valores representativos para as raas Charoleza e Gir so, 42 kg e 53 Kg, respectivamente. Estes valores dividem as distribuioes aproximadamente ao meio, por exemplo,
c
existem 6 pontos abaixo de 42 e 6 pontos acima de 42.
c
a
c
O valor 25 kg, na raa Charoleza, est bem afastado do restante da distribuiao, assim,
podemos consider-lo como um valor discrepante.
a
No observamos formaao de subgrupos em nenhuma das distribuies (raas).
a
c
co
c
Exerc
cio resolvido
1. Para comparar o ganho mdio de peso, GMP, em gramas por dia, de porcos submetidos
e
a duas dietas diferentes, D1 e D2 , foi conduzido um experimento com 20 porcos. Dez porcos

55

Dieta 2

Dieta 1

550

570

590

610

630

650

670

690

710

730

750

770

790

810

830

Ganho de peso

Figura 2.12: Diagrama de pontos para duas dietas de porcos


foram submetidos a cada uma das dietas. Os resultados para esse experimento foram:
Dieta 1
635
780
660
610
710

Dieta 2

820
670
580
700
570

675
570
590
590
590

600
610
560
630
570

Construir um diagrama de pontos para vericar se existe evidncia de diferenas entre os


e
c
dois tratamentos (dietas). O diagrama de pontos dado na gura 2.12. Conclua para as
e
duas dietas quanto ` disperso, assimetria, valores representativos e discrepantes.
a
a
A dieta 1 apresenta maior disperso do que a dieta 2. A dieta 2 apresenta assimetria `
a
a
direita (tem uma cauda mais longa para a direita), enquanto que a dieta 2 aproximadamente
e
simtrica. Os valores representativos so 715 e 590, para as dietas 1 e 2, respectivamente.
e
a
O valor 675, na dieta 2, est mais afastado da distribuiao dos demais valores. Os dados
a
c
indicam que a dieta 1 superior a dieta 2. Para fazermos uma armaao sobre a diferena
e
c
c
entre duas mdias devemos realizar um teste de hipteses, que ser tratado no cap
e
o
a
tulo 8.
Exerc
cios propostos
1. Os dados da tabela 2.22 correspondem ` varivel nmero de brotos por explante de
a
a
u
abacaxi avaliada em dois meios de cultura (dois tratamentos). Construir um diagrama de
pontos e comparar os dois meios de cultura quanto `:
a
a) disperso;
a
b) assimetria;
c) valores representativos;

56

Tabela 2.22: Nmero de brotos por explante de abacaxi


u
Meio 1 47 35 23 21 23 26 18
30 22 36 22 21 19
Meio 2

13
18

11 15
22 22

24 20
20 17

20 19
25

Tabela 2.23: Distribuio de frequncias e proporoes (em %) do nmero de plantas sadias


ca
e
c
u
de mandioca, Chapec, SC, 1984
o
Nmero de plantas Frequncia Proporo Porcentagem Porcentagem acumulada
u
e
ca
23
24
25
26
27
TOTAL

1
3
4
8
14
30

0,0333
0,1000
0,1333
0,2667
0,4667
1,0000

3,33
10,00
13,33
26,67
46,67
100,00

3,33
13,33
26,67
46,67
100,00

d) valores discrepantes;
e) formaao de subgrupos.
c

Distribuio de Freqncias de Variveis Discretas Sem Perda


ca
ue
a
de Informao
ca
A construao de distribuioes de freqncias de variveis discretas, quando os diferentes
c
c
ue
a
valores observados da varivel no so muitos, feita de forma idntica `s variveis qualia
a a
e
e
a
a
tativas (categorizadas). Vamos fazer a contagem para cada valor observado da varivel em
a
estudo. Como exemplo, vamos estudar a distribuiao do nmero de plantas sadias de manc
u
dioca colhidas na rea util da parcela. As freqncias e porcentagens so dadas na tabela
a

ue
a
2.23. Na primeira coluna da tabela temos os valores observados da varivel, quais sejam: 23,
a
24, 25, 26 e 27.

Representao Grca de Variveis Discretas Sem Perda de


ca
a
a
Informao
ca
Nesse caso, podemos citar os grcos de ordenadas e os grcos de colunas. A seguir
a
a
apresentamos os dois tipos de grcos (guras 2.13 e 2.14).
a
Observamos que 47% das unidades experimentais (parcelas) deram como resultado 27
plantas sadias (total de plantas/unidade); somente 3% das unidades apresentaram como

57

58
Figura 2.14: Grco de colunas do nmero de plantas sadias de mandioca, Chapec, SC,
a
u
o
1984
N de plantas colhidas sadias
28

3,33%

13,33%

10,00%

26,67%

46,67%

N de parcelas

27

26

25

24

23

15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0
22

Figura 2.13: Diagrama de ordenadas do nmero de plantas sadias de mandioca


u
Nmero de plantas sadias colhidas na rea til
0
22

23

24

25

26

27

28

2
4

Freqncias

6
8
10
12
14
16

Tabela 2.24: Rendimentos mdios, em kg/ha, de 32 h


e
bridos de milho, regio Oeste, 1987/88
a
3973 4660 4770 4980 5117 5403 6166
4500 4680 4778 4993 5166 5513 6388
4550 4685 4849 5056 5172 5823
4552 4760 4960 5063 5202 5889
4614 4769 4975 5110 5230 6047
resultado 23 plantas sadias. A distribuio assimtrica ` esquerda (cauda longa para o
ca e
e
a
lado esquerdo da distribuiao). Um valor representativo seria o 27. No observamos valores
c
a
discrepantes. No faremos uma concluso para a disperso pois no temos duas ou mais
a
a
a
a
distribuies para comparao.
co
ca
Exerc
cio proposto
1. Deseja-se estudar o comportamento da varivel nmero de ovos inviveis de Bioma
u
a
phalaria taenagophila (caramujo) em ambiente polu
do. Para isso tomou-se uma amostra de
23 caramujos, obtendo-se os seguintes resultados:
9 11
4 7

10 0
1 11

4 4 5
10 3 14

12 4
3 2

1 2
28 4

Faa uma representaao grca para os dados (grco de ordenadas ou de colunas). Faa a
c
c
a
a
c
interpretao do grco.
ca
a

Dados Agrupados em Classes


Quando temos muitas observaoes de uma varivel quantitativa em estudo (acima de 25),
c
a
recomendvel a formaao de intervalos de valores, isto , construir classes de ocorrncias.
e
a
c
e
e
Por exemplo, uma classe pode ser de 8 a 16 cm de comprimento de camaro. Quanto
a
ao nmero de classes que deve ser usado, existe alguma recomendaao. Este nmero no
u
c
u
a
poder ser muito grande (maior que 15) e nem muito pequeno (menor que 5). Mas tambm
a
e
no h um rigor muito grande quanto ao nmero de classes a ser usado. Pode-se deixar
a a
u
como compromisso do pesquisador decidir sobre o nmero de classes a ser usado. Ningum
u
e
melhor do que a pessoa que conhece o fenmeno em estudo para decidir sobre a melhor
o
representao da distribuiao. Sempre que for poss
ca
c
vel, recomenda-se utilizar classes com a
mesma amplitude.
Os dados da tabela 2.24 referem-se aos rendimentos mdios, em kg/ha, de 32 h
e
bridos
de milho recomendados para a regio Oeste Catarinense. Vamos considerar estes dados
a
para ilustrar a construao da distribuiao de freqncias em classes. As classes podem ser
c
c
ue

59

Tabela 2.25: Distribuio de freqncias de 32 h


ca
ue
bridos de milho recomendados para o Oeste
Catarinense, 1987/88
Rendimento

Freqncia
ue

Freqncia
ue

Freqncia
ue

Freq. rel.

mdio
e

absoluta

acumulada

relativa

Porcentagem

acumulada

Porcentagem
acumulada

3973

4456

0,0313

0,0313

3,13

3,13

4456

4939

12

13

0,3750

0,4063

37,50

40,63

4939

5422

13

26

0,4063

0,8126

40,63

81,26

5422

5905

29

0,0937

0,9063

9,37

90,63

5905

6388

32

0,0937

1,0000

9,37

100,00

TOTAL

32

1,0000

100,00

denidas de acordo com resultados lgicos da varivel, por exemplo, denir 5 classes com
o
a
amplitudes de 500 kg. Outra forma decidirmos pelo nmero de classes a ser utilizado e,
e
u
a seguir, fazer a diviso da amplitude total dos dados pelo nmero de classes, sendo que,
a
u
o resultado encontrado ser a amplitude de cada classe. Por exemplo, amplitude total dos
a
dados da tabela 2.24
e
= 6388 3973 = 2415 kg/ha. Se desejamos ter 5 classes, isso
implica que a amplitude de cada classe ser igual a i = 2415/5 = 483 kg/ha. Veja a
a
primeira coluna da tabela 2.25. Nesta tabela temos a distribuio de freqncias completa
ca
ue
da varivel em estudo.
a
A freqncia absoluta ou simplesmente freqncia de classe (segunda coluna da tabela),
ue
ue
representada por ni , o nmero indicativo da quantidade de valores, indiv
e
u
duos, itens,
elementos, etc. pertencentes a essa classe. A freqncia absoluta acumulada de uma classe
ue
a soma da freqncia dessa classe com as freqncias das classes anteriores (coluna 3). A
e
ue
ue
freqncia relativa ou proporo, representada por fi , denida pelo quociente da freqncia
ue
ca
e
ue
absoluta da classe e o nmero total de observaes, ou seja, fi = ni /n, onde n = 32 (coluna 4).
u
co
Tambm temos a freqncia relativa acumulada, calculada da mesma forma que a freqncia
e
ue
ue
absoluta acumulada (coluna 5). A porcentagem (coluna 6) a forma que a maioria das
e
pessoas entendem, mais expl
e
cito, tem maior xito, e simplesmente a multiplicaao das
e
e
c
proporoes por 100, isto , 100fi . Da mesma forma podemos ter as freqncias percentuais
c
e
ue
acumuladas (coluna 7).
A representao grca dessas distribuies recebe um nome especial, histogramas, e
ca
a
co
e

mostrado na gura 2.15. E um grco de colunas justapostas em que a altura de cada coluna
a
representa a freqncia absoluta ou porcentagem de ocorrncias da classe. Este grco, como
ue
e
a
a maioria dos demais deste livro, foi feito no programa Statistica.

60

14

40,63%

Freqncia absoluta

13
12
11

37,5%

10
9
8
7
6
5
4
3
2

9,37%

9,37%

3,13%

1
0

<= 4456

(4456;4939]

(4939;5422]

(5422;5905]

> 5905

Rendimento mdio (kg/ha)

Figura 2.15: Histograma dos rendimentos mdios, em kg/ha, de 32 h


e
bridos recomendados
para o Oeste Catarinense, 1987/88
Uma representaao grca alternativa ao histograma o pol
c
a
e
gono de freqncias, e o seu
ue
uso particularmente importante quando deseja-se comparar duas ou mais distribuioes,
e
c
pois poss representar-se diversas distribuies no mesmo grco. Para construir um
e
vel
co
a
pol
gono de freqncias basta colocar num grco os pares (ni ; si ), e un
ue
a
-los com uma linha,
onde si corresponde ao ponto mdio da isima classe. Por exemplo, o ponto mdio da
e
e
e
primeira classe, s1 , igual a (4456+3973)/2=4214,5, portanto, o par (n1 ; s1 ) dado por
e
e
(1; 4214, 5). Usar o mesmo procedimento para os 4 pares restantes. Esse grco para a
a
varivel rendimento de gros de h
a
a
bridos de milho mostrado na gura 2.16.
e
Interpretao. A interpretaao pode ser feita atravs da tabela de distribuio de
ca
c
e
ca
freqncias, histograma ou do pol
ue
gono de freqncias. A maioria dos h
ue
bridos (78%), apresentam uma produao entre 4456 e 5422 kg/ha. Um valor representativo para esses dados
c
seria 5000 kg/ha. Temos aproximadamente 50% dos valores abaixo de 5000 kg/ha, conseqentemente, 50% acima deste valor. Existe uma tendncia dos dados se concentrarem
u
e
prximo ao valor representativo e, a medida que se afastam do valor t
o
pico, a concentraao
c
diminui. A distribuiao dos dados apresenta uma pequena assimetria ` direita, pois a cauda `
c
a
a
direita um pouco mais longa. Desconsiderando o valor 3973 kg/ha, a amplitude de variaao
e
c
dos valores est dentro do esperado, vai de 4500 a 6388 kg/ha, isto , a disperso dos valores
a
e
a
no muito grande. Seria bom vericar por que um h
a e
brido produziu razoavelmente menos
que os demais. No se observa formao de subgrupos.
a
ca
Comentrios:
a
e
1 Limites indeterminados ou classes abertas. E at comum aparecer tabelas de distribuioes
c

61

14
37,5%

40,63%

Freqncia absoluta

12
10
8
6
9,37%

4
2
0

9,37%

3,3%

4214,5

4697,5

5180,5

5663,5

6146,5

Figura 2.16: Pol


gono de freqncias dos rendimentos mdios, em kg/ha, de 32 h
ue
e
bridos
recomendados para o Oeste Catarinense, 1987/88
de freqncias em que a 1a classe e/ou a ultima, apresentam o limite inferior e/ou
ue

superior indenidos. Deve-se, sempre que poss


vel, evitar esse tipo de limites, pois
diculta no trabalho descritivo dos dados, principalmente no que diz respeito ao clculo
a
de estat
sticas.
a
2 Amplitudes de classes desiguais. As amplitudes de classes nem sempre so iguais para
todas as classes da mesma distribuiao de freqncia. As vezes isto ocorre pela prpria
c
ue
o
natureza da pesquisa. Por exemplo, deseja-se discrimar melhor os baixos salrios; ou
a
as idades menores da primeira relaao sexual de jovens. Neste caso, necessrio tomar
c
e
a
alguns cuidados com a anlise e construao do histograma. Deve-se utilizar no eixo
a
c
das ordenadas as densidades de freqncias. Densidade, no sentido geral, indica a
ue
concentraao por unidade da varivel, assim, as densidades de freqncias em cada
c
a
ue
classe so obtidas dividindo-se as freqncias absolutas pelas amplitudes de classe,
a
ue
isto , di = ni / i , onde i a amplitude da i-sima classe. De modo anlogo,
e
e
e
a
pode-se calcular as densidades de freqncias relativas, dadas por di = fi / i . Este
ue
procedimento garante que a rea total do histograma seja igual a 1. No poss
a
a e
vel
fazer-se uma interpretaao de um valor espec
c
co da densidade de proporo, pois como
ca
o nome indica, s poss vericar o comportamento dentro de um intervalo ou no
oe
vel
geral.
3 O nmero de classes estabelecido para a distribuio de freqncias bastante subjetivo,
u
ca
ue
e
pois trata-se de uma anlise exploratria de dados. Ento, o nmero de classes deve
a
o
a
u

62

Tabela 2.26: Altura


1,00 1,18 1,21 1,27
1,01 1,19 1,25 1,30
1,08 1,19 1,26 1,31
1,11 1,20 1,27 1,34

de brotos de
1,34 1,37
1,35 1,37
1,36 1,39
1,36 1,41

explantes de
1,43 1,47
1,43 1,47
1,44 1,49
1,46 1,50

abacaxi
1,52 1,68
1,57 1,73
1,61 1,77
1,62

Tabela 2.27: Distribuiao de freqncias da varivel altura de brotos de explantes de abacaxi.


c
ue
a
Altura
Freqncia absoluta Freqncia relativa Percentagem
ue
ue
1,00 1,13
1,13 1,26
1,26 1,39
1,39 1,52
1,52 1,65
1,65 1,78
Total

39

1,0000

100,00

ser o suciente para nos dar uma boa idia do fenmeno, deve por em evidncia a
e
o
e
regularidade do fenmeno. Assim, vale a pena salientar, que a deciso sobre o nmero
o
a
u
de classes cabe ao pesquisador.
Exerc
cios resolvidos
1. Os dados da tabela 2.26 foram obtidos de um experimento desenvolvido para avaliar o
comportamento In Vitro de abacaxi (Ananas comosus) cv. Primavera e refere-se a varivel
a
altura dos brotos de explantes, em cm. (dados ordenados crescentemente).
a) Preencha a tabela de distribuio de freqncias 2.27.
ca
ue
b) Construa um histograma.
c) Faa algumas interpretaes relevantes.
c
co
d) Pode-se dizer que esta amostra oriunda de uma populao com distribuiao normal?
e
ca
c
Justique. Observao: leia mais adiante o tpico O modelo normal.
ca
o
As freqncias absolutas, relativas e percentagens para as 6 classes so dadas por: 4, 6,
ue
a
12, 10, 4, 3, 0,1026, 0,1538, 0,3077, 0,2564, 0,1026, 0,0769, 10,26, 15,38, 30,77, 25,64, 10,26
e 7,69, respectivamente. O histograma dado na gura 2.17. A distribuiao aproximadae
c e
mente simtrica. Um valor representativo do conjunto de dados 1,36. No observa-se valor
e
e
a
discrepante. Pode-se dizer que a varivel altura de explantes de abacaxi segue aproximadaa
mente uma distribuiao normal.
c

63

16

Nmero de explantes

14
Esperado sob
Modelo Normal

12
10
8
6
4
2
0
0,782

0,934

1,086

1,238

1,390

1,542

1,694

1,846

Altura de explantes (cm)

Figura 2.17: Histograma da altura de explantes de abacaxi

Tabela 2.28: Area foliar espec


ca de Cecropia glazioui
Borda da mata
Mata fechada
0,2145
0,2540
0,2592
0,2891
0,2971
0,3013
0,3279

0,3458
0,3482
0,3487
0,3490
0,3547
0,3574
0,3648

0,3796
0,3815
0,3874
0,3924
0,3931
0,3971
0,4015

0,4125
0,4142
0,4182
0,4326
0,4358
0,4573
0,4582

0,4657
0,4670
0,4823
0,4862
0,4921
0,5010
0,5231

0,5521
0,5841
0,6284
0,6357
0,6489
0,6570
0,6704

0,6780
0,6842
0,6898
0,6945
0,6950
0,6970
0,7125

0,7126
0,7154
0,7179
0,7256
0,7321
0,7783
0,7884

0,7894
0,7912
0,8023
0,8046
0,8451
0,8467
0,8468

0,8564
0,8654
0,8665
0,9214
0,9421
0,9573
0,9689

2. Os dados da tabela 2.28 so relativos a resposta ` variaao de luz no crescimento das


a
a
c
plantas, medido atravs da rea foliar espec
e
a
ca aps 60 dias, da espcie Cecropia glazioui,
o
e
em amostras situadas em borda de mata e mata fechada, com intensidade de luz mdia
e
de 10,6% e 0,87%, respectivamente. A espcie C. glazioui uma planta pioneira, helita,
e
e
o
pereniflia, seletiva higrla, ocorrendo preferencialmente em capoeiras e capoeires de dero
o
o
rubadas recentes.
Compare as duas amostras atravs do pol
e
gono de freqncias mltiplo. Por pol
ue
u
gono de
freqncias mltiplo, entende-se que no mesmo grco (plano cartesiano), vamos representar
ue
u
a
as duas amostras (borda da mata e mata fechada), por duas linhas poligonais fechadas. O
pol
gono de freqncias mltiplo dado na gura 2.18.
ue
u
e
Observa-se que o crescimento foi maior na mata fechada do que na borda da mata, com
valores representativos de 0,70 e 0,40, respectivamente. A disperso dos dados maior na
a
e

64

10
Borda Mata
Mata Fechada

7
6
5
4
3
2

> ,927

(,885;,927]

(,843;,885]

(,801;,843]

(,759;,801]

(,717;,759]

(,676;,717]

(,634;,676]

(,55;,592]

(,592;,634]

(,508;,55]

(,466;,508]

(,424;,466]

(,34;,382]

(,382;,424]

(,298;,34]

<= ,256

1
(,256;,298]

Freqncias absolutas

rea foliar especfica

Figura 2.18: Pol


gono de freqncias mltiplo da rea foliar espec
ue
u
a
ca de C. glazioui

25,60
25,90
25,90

27,75
28,30
29,05

Tabela 2.29:
29,95 32,20
31,25 32,20
31,70 33,75

Biometria total de Macrobrachium potiuna


33,90 34,75 35,20 36,00 37,10 39,20
33,95 34,80 35,55 36,70 38,90 39,55
34,75 35,10 35,65 37,05 39,10 40,45

41,75
42,80
43,95

44,05
45,20
46,74

mata fechada. A distribuiao mais simtrica na amostra da borda da mata, com os dados
c e
e
concentrando-se mais na parte central.
2.1.3.9 Exerc
cios Propostos
1. Os dados da tabela 2.29 referem-se a biometria total, em mm, do Macrobrachium
potiuna (Mller, 1880) da fam Palaemonidae. Obs. os dados encontram-se ordenados.
u
lia
a) Construa a tabela de distribuio de freqncias com 6 classes para os dados.
ca
ue
b) Construa o histograma.
c) Indique um valor representativo para os dados; comente sobre a assimetria; esta amostra
oriunda de uma populao com distribuio aproximadamente normal? justique.
e
ca
ca
2. Dispe-se de uma relaao de 36 produoes em kg/ha de milho do munic de Chapec
o
c
c
pio
o
e uma relaao de 36 produoes, tambm em kg/ha, do munic de Campos Novos. A tabela
c
c
e
pio
de distribuiao de freqncias dada em 2.30. Construa o pol
c
ue
e
gono de freqncias mltiplo.
ue
u
Com base no pol
gono de frequncia mltiplo, discuta e compare as duas distribuies
u e
u
co
quanto as principais caracter
sticas.

O Modelo Normal

65

Tabela 2.30: Distribuio de frequncias do rendimento de milho para Chapec e Campos


ca
e
o
Novos
Rendimento Chapec Freq. absoluta Rendimento Campos Novos Freq. absoluta
o
4200
4552
4904
5256
5608
5960
6312

4552
4904
5256
5608
5960
6312
6664

Total

1
3
5
8
8
6
5

6613
7095
7577
8059
8541
9023
9505

36

7095
7577
8059
8541
9023
9505
9987

1
2
4
13
7
7
2
36

Uma distribuiao de freqncias muito importante em estat


c
ue
stica, aquela onde os dados
e
tendem a se concentrarem simetricamente em torno de um valor central, ou seja, os dados
esto em maior quantidade em torno do ponto mdio e, a medida que se afasta desse ponto,
a
e
a concentraao diminui; isso ocorre da mesma forma nos dois lados da distribuiao. Essa
c
c
distribuio conhecida como a distribuio normal ou Gaussiana, devido a Karl Gauss
ca e
ca
(1777-1855), e a sua forma terica dada na gura 2.19. Esse modelo ser estudado com
o
e
a
detalhes no cap
tulo 5.
A distribuiao dos rendimentos mdios, em kg/ha, dos h
c
e
bridos de milho, a princ
pio,
no d para dizer que os dados seguem um modelo normal, veja gura 2.20. Se o tamanho
a a
da amostra fosse maior, ter
amos uma melhor aproximao.
ca
2.1.3.10

Ramo-e-Folhas

Tanto os histogramas, como os demais tipos de grcos vistos anteriormente, do uma boa
a
a
idia da forma da distribuiao da varivel em estudo, isto , do comportamento dos dados.
e
c
a
e
Um outro modo de representao de um conjunto de valores, com o objetivo de se ter uma
ca
idia geral dos dados, o ramo-e-folhas. Uma vantagem do ramo-e-folhas sobre o histograma
e
e
que no primeiro no h perda de informao dos dados, pois trabalha-se com todos os dados
e
a a
ca

originais. E poss
vel, tambm, atravs do ramo-e-folhas obter-se algumas outras informaoes
e
e
c
mais gerais sobre os dados, o que ser mostrado atravs de um exemplo. O ramo-e-folhas
a
e
e
util quando o conjunto de dados no muito numeroso, pois, caso contrrio, a interpretaao

a e
a
c

66

Frequncias tericas

0,60

0,45

0,30

0,15

0,00
-3,50

-1,75

0,00

1,75

3,50

Valores padronizados

Figura 2.19: A representao grca do modelo Normal ou Gaussiano


ca
a

16

Freqncia absoluta

14
12
10
8
6
4
2
0
3068

3672

4275

4879

5483

6087

6690

Rendimento mdio de milho

Figura 2.20: Comparao da distribuiao dos rendimentos de gros de h


ca
c
a
bridos de milho e o
modelo normal

67

3
4
5
6

973
500 550 552 614 660 680 685 760 769 770 778 849 960 975 980 993
056 063 110 117 166 172 202 230 403 513 823 889
047 166 388

Unidade 1,0
3|973 = 3973

Figura 2.21: Ramo-e-folhas do rendimento mdio, em kg/ha, de 32 h


e
bridos de milho
*
3
3o
4*
4o
5*
5o
6*

973
500
056
513
047

550
063
823
166

552 614 660 680 685 760 769 770 778 849 960 975 980 993
110 117 166 172 202 230 403
889
388

Unidade 1,0
3o|973=3973

Figura 2.22: Ramo-e-folhas do rendimento mdio, em kg/ha, de 32 h


e
bridos de milho
torna-se dif
cil.
Exemplo (com discusso sobre a construo do ramo-e-folhas). Nas guras 2.21,
a
ca
2.22 e 2.23 temos os ramos-e-folhas da varivel rendimento de gros de h
a
a
bridos de milho.
A idia bsica para construir um ramo-e-folhas dividir cada observao em duas partes; a
e
a
e
ca
primeira parte, que ser denominada de ramo, colocada ` esquerda de uma linha vertical;
a
e
a
a segunda parte, que sero denominadas de folhas, colocada ` direita dessa linha vertical.
a
e
a
O critrio de diviso da observao deciso do pesquisador. Ele vai procurar um ramo-ee
a
ca e
a
folhas que represente bem o fenmeno biolgico/agronmico. Assim, para os rendimentos de
o
o
o
h
bridos de milho, considerando, por exemplo, o valor 3.973, o 3 (parte do milhar) o ramo
e
e 973 (centena) a folha, fazemos esta mesma diviso para todos os demais valores.
e
a
Na gura 2.21 temos apenas 4 ramos (fazendo analogia com o nmero de classes do
u
histograma que dever ser entre 5 e 15), ou seja, reduziu-se muito os dados. Para aumentar
a
o nmero de ramos podemos subdivid
u
-los em duas partes, garantindo que os ramos sejam
equiprovveis, isto , tenham a mesma chance de receber uma observao, assim, os ramos
a
e
ca
com o s
mbolo * recebem valores de 000 a 499 e os ramos com o s
mbolo recebem valores
de 500 a 999. Esse ramo-e-folhas mostrado na gura 2.22.
e
Podemos ainda subdividir os ramos em 5 partes, da seguinte forma: os ramos com o
s
mbolo recebem valores na faixa 000 a 199; ramos com o s
mbolo recebem valores na
faixa 200 a 399; ramos com o s
mbolo recebem valores na faixa 400 a 599; ramos com o
s
mbolo recebem valores na faixa 600 a 799 e ramos com o s
mbolo recebem valores na

68

3
4*
4
4
4
4
5*
5
5
5
5
6*
6
6

973

500 550 552


614 660 680 685 760 769 770 778
849 960 975 980 993
056 063 110 117 166 172
202 230
403 513

823 889
047 166
388

Unidade 1,0
3 |973 = 3973 kg/ha

Figura 2.23: Ramo-e-folhas do rendimento mdio, em kg/ha, de 32 h


e
bridos de milho
faixa 800 a 999. Este ramo-e-folhas dado na gura 2.23.
e
Interpretao: No primeiro ramo-e-folhas no observa-se que o valor 3973 esta distante
ca
a
da distribuio dos demais valores, isso indica que o ramo-e-folhas com apenas quatro ramos
ca
no adequado. O segundo ramo-e-folhas nos indica claramente a existncia de um h
a e
e
brido
(3.973) com produao abaixo dos demais. Observamos que existe uma queda brusca no lado
c
esquerdo e uma queda mais suave no lado direito, portanto, a distribuio assimtrica `
ca e
e
a
direita. Esta distribuio parece no seguir o modelo normal. Os valores esto bastante conca
a
a
centrados na faixa entre 4500 e 5400 kg/ha. Um valor t
pico para representar este conjunto
de dados 5000 kg/ha. No ramo-e-folhas da gura 2.23 observa-se 5 h
e
bridos com altos
rendimentos e cujos valores se distanciam dos demais. Se o interesse encontrar h
e
bridos
com alta produtividade esses cinco so os de maior interesse no estudo. O h
a
brido com baixa
produao tornou-se mais evidente, o que tambm desejvel. Observaao: A escolha do
c
e e
a
c
nmero de ramos equivalente a escolha do nmero de classes no histograma.
u
e
u
Exerc
cios resolvidos
1. Os dados da tabela 2.31 referem-se a uma avaliaao da formao de calos, mais
c
ca
especicamente, da altura de calos em cm, aps um per
o
odo de 30 dias in vitro para os
explantes de procedncia do cerrado da espcie Mandevilla velutina. Obs. importante que
e
e
e
os calos no se desenvolvam, pois quanto menor eles forem, maior ser o desenvolvimento
a
a

69

Tabela 2.31: Altura de


0,00 0,00 0,00
0,00 0,00 0,00
0,34 0,34 0,38
0,43 0,45 0,50
0,61 0,64 0,66

calos, em cm,
0,00 0,00
0,00 0,00
0,38 0,39
0,54 0,56
0,80 0,81

de Mandevilla velutina
0,00 0,00 0,00
0,00 0,00 0,20
0,42 0,42 0,42
0,57 0,60 0,61

0o

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

2 3 3 3 3 3

4 4 4 4 4 5 5 5 5

00|0 = 0,0

6 6 6 6 6

0q

8 8

unidade: 0,10

Figura 2.24: Ramo-e-folhas da altura de calos


das plantas.
a) Construa um ramo-e-folhas com cinco ramos. Resposta: veja gura 2.24
b) Faa algumas concluses a respeito dos dados. Podemos concluir que a distribuiao
c
o
c e
assimtrica ` direita; um valor representativo do conjunto de dados 0,38 cm; no apresenta
e
a
e
a
outliers; a grande maioria (80,1% ) dos valores est na faixa de 0,0 a 0,57; no apresenta
a
a
subgrupos. 2.24.
2. Os dados da tabela 2.32 referem-se aos pesos da carne de mexilhes do manquezal.
o
Construa um ramo-e-folhas para os dados. Resposta: veja gura 2.25. Observe nesta gura
que houve uma quebra nos ramos. A partir da quebra, cada valor um mltiplo de
e
u
o
10, isto , 10, 20 e 30. No ramo 1 vo os valores na faixa de 10 at 14,99 e, no ramo 1
e
a
e
vo os valores na faixa de 15 at 19,99. E assim para os demais ramos. Esta construao
a
e
c
do ramo-e-folhas foi necessria pois, se no tivssemos feito esta quebra no ramo, ter
a
a
e
amos
muitos ramos, o que tornaria muito dif a interpretao.
cil
ca
2.1.3.11 Exerc
cios Propostos
1. Os dados da tabela 2.33 correspondem a varivel altura de plantas, medida em cm,
a
para dois tratamentos. O tratamento 1 o controle (testemunha), isto , no foi feita
e
e a
a inoculaao do rizbio nas plantas. O tratamento 2 corresponde ` aplicaao do rizbio
c
o
a
c
o
nas plantas. A m de comparar os dois tratamentos faa um ramo-e-folhas para cada um
c

70

Tabela 2.32: Dados


9,49
12,92
17,64
20,01
25,67

de peso
9,54
13,04
18,17
21,60
26,79

da carne, em gramas,
9,53 11,13 11,76
14,05 14,88 16,22
18,53 19,17 19,65
21,99 22,74 23,71
27,20 30,20 30,85

de mexilhes do manguezal
o
12,69 12,92
16,38 16,92
19,80 19,81
25,14 25,34
33,97 36,35

9o

49

54

1o

101 176 269 292 292 304 405 488

622 638 692 764 814 853 914 965 980 981

2o

001 160 199 274 371

514 534 567 679 720

90|49 = 9,49

3o

020 085 397

10|101=11,01

635

unidade: 0,01

53

Figura 2.25: Ramo-e-folhas do peso da carne de mexilhes do manguezal


o

71

Tabela 2.33: Altura de plantas para dois tratamentos


Controle
25 29 29 30 31 31 32 32 33 33
35 36 36 37 37 38 38 40 41 43
Com rizbio 34 36
o
44 45

39 39
45 46

40 41
46 47

41 41
47 49

42 44
49 51

dos tratamentos. Quais os valores para representar os dois tratamentos? Qual dos dois
tratamentos apresenta maior disperso? Comente sobre a assimetria das distribuies. Tm
a
co
e
valores discrepantes? Pode-se dizer que estas duas amostras so oriundas de duas populaoes
a
c
com distribuiao pelo menos aproximadamente normal? justique?
c
2. Faa um ramos-e-folhas da varivel durao do primeiro estdio ninfal de Triatoma
c
a
ca
a
klugi, em dias, alimentadas em galo, cujos valores so:
a
21 21

21 22

22 22

22

23 23

23 23

23 25

26

28 28

28 30

30 33

35

35 36

39 39

40 40

42

42 45

46 46

48 50

59

a) Qual o valor representativo do conjunto de valores?


b) Comente sobre a assimetria da distribuio.
ca
c) Pode-se considerar algum(ns) valor(es) como sendo discrepante(s)?

2.2
2.2.1

Algumas Medidas Associadas ` Variveis Quantitativas


a
a
Medidas de Tendncia Central
e

Procuramos at aqui interpretar um conjunto de dados atravs do estudo de distribuiao


e
e
c
de freqncias, diagrama de pontos e do ramo-e-folhas, o que j foi um grande avano no
ue
a
c
sentido de conhecer o comportamento da(s) varivel(is) em estudo. Porm, um conjunto
a
e
de dados pode reduzir-se a uma ou apenas algumas medidas numricas que representam
e
todo o conjunto original dos dados. Estas medidas so de muito mais fcil compreenso
a
a
a
do que os dados originais, esta uma grande virtude da estat
e
stica, isto , reduzir um
e
conjunto de dados em apenas algumas medidas facilmente compreens
veis. Por exemplo,
para conhecer o rendimento t
pico de h
bridos de milho, podemos calcular a mdia ou a
e

mediana dos resultados da varivel. E importante chamar a ateno desde j, que sempre
a
ca
a

72

que for apresentada uma medida de tendncia central necessrio apresentar tambm uma
e
e
a
e
medida de variabilidade, disperso, que sero tratadas na prxima seao.
a
a
o
c
O objetivo dessa seao apresentar as principais medidas de tendncia central, as quais
c e
e
so assim chamadas devido ao fato dos dados naturalmente tenderem a se concentrar em
a
torno desses valores centrais. As trs medidas de tendncia central mais utilizadas para
e
e
resumir um conjunto de dados so:
a
A mdia aritmtica
e
e
A mediana
A moda
Estas medidas aplicam-se para dados isolados, como tambm para dados organizados
e
numa distribuiao de freqncias em classes, sendo assim, ser mostrado o procedimento de
c
ue
a
clculo dessas medidas para os dois casos, quais sejam: 1) dados isolados e 2) agrupados em
a
classes.
A mdia aritmtica a idia que ocorre a grande maioria das pessoas quando se fala
e
e
e
e
em mdia; como ela possui certas propriedades importantes, ela a medida de posiao mais
e
e
c
utilizada. Contudo, ela pode nos levar a erros de interpretao, assim, a mediana pode
ca
ser a medida mais recomendada em muitas situaoes. Ainda nesta seo indicaremos estas
c
ca
situaes.
co
A mdia aritmtica (M e), a soma dos valores numricos de uma varivel dividida pelo
e
e
e
e
a
nmero deles. Por exemplo, considere os pesos ao nascer, em kg, de 10 bezerros da raa
u
c
Charoleza:
47 51

45 50 50

52 46

49 53

51

Assim, a mdia, ser:


e
a
Me =

47 + 51 + 45 + 50 + 50 + 52 + 46 + 49 + 53 + 51
= 49, 4kg.
10

Genericamente, a M e, quando todos os valores so diferentes uns dos outros, dada por:
a
e
x1 + x2 + ... + xn
1
M e(X) =
=
n
n

xi

(2.4)

i=1

onde n o nmero de dados da amostra e X uma varivel em estudo, por exemplo, peso
e
u
e
a
ao nascer. A letra grega , leia-se sigma (maiscula), como pode ser visto na equao 2.4,
u
ca
representa um somatrio, isto , uma soma de valores.
o
e

73

Agora, quando temos um conjunto de n valores de uma varivel X, dos quais n1 so


a
a
iguais a x1 , n2 so iguais a x2 ,...., nk so iguais a xk , ento, a mdia aritmtica de X dada
a
a
a
e
e
e
por:
k
k
n i xi
ni xi
n1 x1 + n2 x2 + ... + nk xk
M e(X) =
= i=1
= i=1
(2.5)
k
n1 + n2 + ... + nk
n
ni
i=1
onde k o nmero de valores diferentes da varivel em estudo. Se fi = ni /n representa a
e
u
a
freqncia relativa da observaao xi , ento, M e pode ser escrita da seguinte maneira:
ue
c
a
k

M e(X) =

f i xi .
i=1

Exemplo. Para os dados dos pesos ao nascer de bezerros da raa Charoleza, com k = 8
c
valores diferentes, temos:
(1 45) + (1 46) + (1 47) + (1 49) + (2 50) + (2 51) + (1 52) + (1 53)
(1 + 1 + 1 + 1 + 2 + 2 + 1 + 1)
= (0, 10 45) + (0, 10 46) + (0, 10 47) + (0, 10 49) + (0, 20 50) +

M e(X) =

+ (0, 20 51) + (0, 10 52) + (0, 10 53)


= 49, 4kg.
Exerc
cio. Os valores da varivel peso ao nascer de uma amostra de 10 bezerros da raa
a
c
Gir foram:
51 40

46 48 54

56 44

43 55

57

Encontre a mdia aritmtica da amostra dos pesos ao nascer de bezerros da raa Gir.
e
e
c
O diagrama de pontos para as duas raas dado na gura 2.26. Percebe-se que os dois
c e
conjuntos de dados so bastante diferentes, entretanto, apresentam a mesma mdia, ento,
a
e
a

a mdia aritmtica, por si s, tem muito pouco valor cient


e
e
o
co. E preciso alguma medida de
variabilidade para acompanhar a mdia. Isto ser visto na prxima seao.
e
a
o
c
A principal restriao ao uso da mdia aritmtica que a mesma muito sens a valores
c
e
e
e
e
vel
excessivamente altos ou baixos (valores discrepantes ou outliers). Ela uma medida base
tante adequada quando os dados apresentam pelo menos aproximadamente uma distribuiao
c
normal. Quando a distribuio assimtrica deve-se utilizar preferencialmente a mediana.
ca e
e
No caso em que os dados esto agrupados em classes de ocorrncias, a expresso da mdia
a
e
a
e
aritmtica dada por:
e
e
k
k
ni si
M e = i=1
=
fi si
n
i=1

74

Mdias

38

42

46

50

54

58

62

Charoleza
Gir

Pesos ao nascer

Figura 2.26: Diagrama de pontos para peso ao nascer das raas Charoleza e Gir
c
onde ni , fi e si so a freqncia absoluta, freqncia relativa e o ponto mdio da i-sima
a
ue
ue
e
e
classe, respectivamente, e k o nmero de classes do histograma.
e
u
Exemplo. Para a distribuio de freqncias da tabela 2.25, que diz respeito aos
ca
ue
rendimentos, em kg/ha, de h
bridos de milho, a mdia aritmtica tem como resultado,
e
e
M e(X) = 5105, 031kg. Vamos ao clculo.
a
M e(X) = 0, 0313(4214, 5) + 0, 3750(4697, 5) + 0, 4063(5180, 5) + 0, 0937(5663, 5) + 0, 0937(6146, 5)
= 5105, 031 kg

Observao: em termos computacionais, os programas estat


ca
sticos calculam a mdia facile
mente, sem a necessidade de formar as classes.
Acontece, muitas vezes, que determinados valores de um conjunto de dados so mais
a
importantes que os demais, ou seja, tem pesos diferentes, merecendo assim um tratamento
especial.
Exemplo. Os tubrculos de batatas sementes so classicados, para efeito de comerciale
a
izao, em quatro tipos de tamanhos (dimetros), a saber:
ca
a
Tipo I - maior que 50 mm at 60 mm inclusive (50 a 60];
e
Tipo II - maior que 40 mm at 50 mm inclusive (40 a 50];
e
Tipo III - maior que 28 mm at 40 mm inclusive (28 a 40];
e
Tipo IV - de 23 mm at 28 mm inclusive [23 a 28].
e
As batatas sementes so comercializadas em caixas de 30 kg. Um agricultor produziu 500
a
caixas em um hectare (10.000 m2 ), assim distribu
das:

75

100 caixas do tipo I preo: 1500 u.m./cx;


c
180 caixas do tipo II preo: 3500 u.m./cx;
c
c
140 caixas do tipo III preo: 3000 u.m./cx;
80 caixas do tipo IV preo: 1600 u.m./cx.
c
Qual o preo mdio, por caixa, obtido pelo agricultor? Podemos usar a expresso 2.5 para
c
e
a
obter esse valor. Temos que a varivel X o preo da caixa de batata semente, portanto,
a
e
c
x1 o preo da caixa do tipo I, e assim por diante; ni o nmero de caixas produzidas por
e
c
e
u
cada tipo, i = 1, 2, 3, 4. Vamos ao clculo.
a
M e(X) =
=

4
i=1 ni xi
4
i=1 ni

(100 1500) + (180 3500) + (140 3000) + (80 1600)


100 + 180 + 140 + 80

1328000
= 2656, 00 u.m.
500

Propriedades da Mdia Aritmtica


e
e
A mdia aritmtica possui algumas propriedades importantes, dentre as quais vamos
e
e
discutir duas. Antes de apresent-las vamos ver o que signica um desvio ou res
a
duo de um
dado em relaao a sua mdia. Esse desvio calculado como:
c
e
e
di = xi x.

Assim, existem desvios positivos, negativos e nulos. Para os dados de pesos ao nascer de
bezerros da raa Charoleza, temos:
c
d1 =45-49,4=-4,4 d2 =46-49,4=-3,4 d3 =47-49,4=-2,4 d4 =49-49,4=-0,4 d5 =50-49,4=0,6
d6 =50-49,4=0,6 d7 =51-49,4=1,6 d8 =51-49,4=1,6 d9 =52-49,4=2,6 d10 =53-49,4=3,6
A primeira propriedade que a soma dos desvios calculados em relao a mdia aritmtica
e
ca
e
e
do conjunto de dados nula:
e
n

di = 0.

(xi x) =

i=1

i=1

No exemplo: -4,4-3,4-2,4-0,4+0,6+0,6+1,6+1,6+2,6+3,6=0.
A segunda propriedade que a soma dos quadrados dos desvios em relao a mdia
e
ca
e
e
um m
nimo. Formalmente, temos:
n

n
2

d2 = m
nimo.
i

(xi x) =

i=1

i=1

76

Posio da Md:5,5

38

42

46

50

54

58

62

Pesos ao nascer

Figura 2.27: Diagrama de pontos para peso ao nascer da raa Charoleza - clculo da mediana
c
a
Veremos a utilizao dessas propriedades quando tratarmos do estudo de medidas de
ca
disperso.
a
Uma segunda medida de tendncia central a mediana. A mediana divide um conjunto
e
e
de dados ao meio, onde 50% dos valores se posicionam abaixo da mediana, e 50% dos valores
se posicionam acima da mediana, portanto, a mediana, uma medida baseada na ordenaao
e
c
dos dados (rank, em ingls).
e
Denio: a mediana de um conjunto de valores, o valor M d que ocupa a posio
ca
e
ca
(n + 1)/2, quando os dados esto ordenados crescentemente. Se (n + 1)/2 for fracionrio,
a
a
toma-se como mediana, a mdia dos dois valores de posioes mais prximas a (n + 1)/2.
e
c
o
Exemplo. Vamos calcular a mediana dos pesos ao nascer de bezerros, em kg, da raa
c
Charoleza. Atravs do diagrama de pontos da gura 2.27, podemos observar que a dise
tribuio de freqncias apresenta uma assimetria ` esquerda, nesse caso recomendvel o
ca
ue
a
e
a
uso da mediana em preferncia ` mdia. A posio da mediana dada por: i = (10 + 1)/2 =
e
a e
ca
e
5, 5. Na gura 2.27 est indicada esta posiao. Como a posiao um nmero fracionrio, a
a
c
c e
u
a
c
a
mediana ser a mdia aritmtica entre os valores que ocupam a 5a e a 6a posiao, ento,
a
e
e
M d = (50 + 50)/2 = 50 kg.
Uma medida estreitamente relacionada com a mediana so os quartis. Embora no
a
a
sejam medidas de tendncia central, sero aqui tratadas devido a semelhana com o clculo
e
a
c
a
da mediana. Os quartis dividem um conjunto de dados em 4 partes iguais, do seguinte
modo: aproximadamente 25% dos dados sero inferiores ao primeiro quartil (Q1 ), ou seja,
a
25% dos dados esto localizados em posiao inferior ao primeiro quartil; 50% dos dados
a
c
ocupam posiao inferior ao segundo quartil (M d), que a mediana, e aproximadamente 75%
c
e
dos dados ocupam posio inferior ao terceiro quartil (Q3 ), portanto, 25% dos valores esto
ca
a
localizados em posio superior ao terceiro quartil.
ca
Denio: dado um conjunto de dados ordenados, podemos obter, de forma aproximada,
ca

77

Q3

Q1
Md

38

42

46

50

54

58

62

Pesos ao nascer

Figura 2.28: Diagrama de pontos para peso ao nascer da raa Charoleza - 1 e 3 quartis
c
o primeiro quartil, (Q1 ), como sendo a mediana dos valores de posies menores ou iguais
co
` posiao da mediana. A mediana dos valores de posioes maiores ou iguais ` posiao da
a
c
c
a
c
mediana corresponde ao terceiro quartil, (Q3 ).
Exemplo. Vamos calcular o Q1 e o Q3 para os dados de pesos ao nascer, em kg, de
bezerros da raa Charoleza. A posiao do elemento primeiro quartil : i = (n + 1)/2 =
c
c
e
(5 + 1)/2 = 3, logo Q1 = 47Kg. O valor de n igual a 5 pois temos cinco valores em
e
posiao menor ou igual ` posiao da mediana. A posiao do elemento terceiro quartil :
c
a
c
c
e
i = (n + 1)/2 = (5 + 1)/2 = 3, logo Q3 = 51Kg. Na gura 2.28 esto indicados o 1 e o 3
a
quartil, juntamente com a mediana.
O clculo da mediana e dos quartis para um histograma sero feitos por meio de argua
a
mentos geomtricos, atravs da proporcionalidade existente entre rea e base de retngulos.
e
e
a
a
Geometricamente, a mediana o valor da abcissa que determina uma linha vertical que
e
divide o histograma em duas partes de reas iguais, ento, 50% da rea do histograma est
a
a
a
a

abaixo da mediana e 50% da rea est acima da mediana. Da mesma forma, o 1 quartil o
a
a
e
valor da abcissa que determina uma linha vertical que divide o histograma em duas partes
de reas diferentes, ou seja, 25% da rea est abaixo do 1 quartil e 75% da rea est acima
a
a
a
a
a
do 1 quartil. O terceiro quartil o valor da abcissa que determina uma linha vertical que
e
divide o histograma em duas partes de reas diferentes, ou seja, 75% da rea est abaixo do
a
a
a
3 quartil e 25% da rea est acima do 3 quartil.
a
a
Exemplo. Vamos encontrar os valores da mediana e dos quartis para a varivel rendia
mento de gros, em kg/ha, de h
a
bridos de milho. O histograma dado na gura 2.15. A
e
classe mediana aquela cuja porcentagem acumulada , de pelo menos, 50%, ento, no exeme
e
a
plo, a mediana um valor que encontra-se na terceira classe, cujos limites inferior e superior
e
so: 4939 e 5422, respectivamente. Agora, vamos usar a regra da proporcionalidade, que
a
e

78

dada por:

5422 4939
M d 4939
=
.
40, 6
9, 4

No lado esquerdo do sinal de igualdade, temos o limite superior (5422) subtra do limite
do
inferior (4939) da classe mediana, dividido pela porcentagem de observaoes desta classe
c
(40,6). No lado direito do sinal de igualdade, temos um outro retngulo cuja rea vale 9,4%,
a
a
obtida da seguinte forma: somando-se as reas das classes anteriores ` classe mediana, temos
a
a
3,13+37,50=40,63%, assim, 50,0-40,6=9,4%; a base deste novo retngulo M d 4939,
a
e
cujo valor M d estamos interessados em determinar.
Obtemos o valor da mediana fazendo-se:
M d = 11, 8276(9, 4) + 4939 = 5050, 828 kg.
O clculo dos quartis feito de maneira anloga ao clculo da mediana. A classe que
a
e
a
a

contm o 1 quartil aquela cuja porcentagem acumulada de pelo menos 25%, no exemplo,
e
e
e

a
o 1 quartil encontra-se na segunda classe, cujos limites inferior e superior so: 4456 e
4939, respectivamente; a porcentagem de observaoes nesta classe de 37,5%. Pela regra da
c
e
proporcionalidade encontramos:
4939 4456
Q1 4456
=
Q1 = 4738, 072 kg.
37, 5
21, 9
O valor 21,9 obtido fazendo-se 25,0-3,1.
e
A classe que contm o 3 quartil aquela cuja percentagem acumulada seja de pelo
e
e
menos 75%, no exemplo, a terceira classe, cujo limite inferior, superior e porcentagem de
e
observaoes valem: 4939, 5422 e 40,6, respectivamente. Aplicando a regra obtemos:
c
5422 4939
Q3 4939
=
Q3 = 5348, 241 kg.
40, 6
34, 4
Na gura 2.29 apresentamos o histograma da varivel rendimento de gros, em kg/ha,
a
a
acompanhado dos quartis.
Finalmente, temos a moda (Mo), denida com o valor que ocorre com maior freqncia
ue
num conjunto de dados. Pela prpria denio percebe-se que a moda pode no existir, pois
o
ca
a
pode no existir um valor mais freqnte que os demais, ou existindo, pode no ser a unica,
a
ue
a

assim temos sries amodal, unimodal, bimodal, trimodal, etc.


e
Exemplo. Para os dados de pesos ao nascer de bezerros da raa charoleza temos duas
c
modas: Mo1 = 50 e Mo2 = 51, portanto, a srie bimodal. No caso do histograma, devemos
e e
encontrar a classe modal, isto , a classe que apresenta a mais alta freqncia. A moda
e
ue
e

79

14

40,63%

13

37,5%

12

Freqncia absoluta

11
10
9
8
7
6
5
4

9,37%

9,37%

3
2

3,13%

1
0

Q1=4738 Md=5051Q3=5348
Rendimento mdio (kg/ha)

Figura 2.29: Representao geomtrica da mediana, do primeiro quartil e do terceiro quartil


ca
e
por deniao o ponto mdio dessa classe. A utilidade da moda ocorre quando num conjunto
c
e
de dados, um, dois, ou um grupo de valores, ocorrem com muito maior freqncia do que
ue
outros.
2.2.2

Medidas de Disperso
a

Quando apresentamos uma medida de tendncia central para representar um conjunto


e
de dados, necessrio que esta medida seja acompanhada de um outra medida que resuma
e
a
a variabilidade dos dados, ou seja, a disperso dos dados. Na gura 2.26 esto representados
a
a
os pesos ao nascer das raas Charoleza e Gir, duas raas leiteiras. Observa-se que as duas
c
c
distribuies tm a mesma mdia amostral, porm, os valores para a raa Gir esto bem mais
co e
e
e
c
a
esparramados (dispersos) do que os valores da raa Charoleza. Dizemos que a variabilidade
c
na raa Gir maior do que na raa Charoleza. Enm, os dois conjuntos de dados so
c
e
c
a
bastante diferentes, apesar de apresentarem a mesma mdia amostral. Com isso, ca claro
e
que so necessrios, pelo menos dois tipos de medidas para descrever razoavelmente bem um
a
a
conjunto de dados. Uma medida de disperso quantica a magnitude da variabilidade dos
a
dados. Vamos apresentar as seguintes medidas de disperso:
a
a
Varincia
Desvio padro
a
Coeciente de variao
ca

80

Xi

5,4

5,4

5,8

6,4

6,4

6,6

6,6

6,8

6,8

7,0

7,3

7,3

7,5

8,2

8,8

8,8

6,94 6,94 6,94 6,94 6,94 6,94 6,94 6,94 6,94 6,94 6,94 6,94 6,94 6,94 6,94 6,94
x
( x i x ) -1,54 -1,54 -1,14 -0,54 -0,54 -0,34 -0,34 -0,14 -0,14 0,06 0,36 0,36 0,56 1,26 1,86 1,86

( x i x ) 2 2,37 2,37 1,30 0,29 0,29 0,12 0,12 0,02 0,02 0,00 0,13 0,13 0,31 1,59 3,46 3,46

Figura 2.30: Clculo da varincia do dimetro da roseta foliar de bromlias expostas ao sol
a
a
a
e
Desvio interquart
lico
Para os mtodos estat
e
sticos, as medidas de disperso so de fundamental importncia,
a a
a
pois a necessidade do uso da estat
stica devida a existncia de variabilidade nos dados
e
e
observados.
Para a varincia e o desvio padro, o princ bsico analisar os desvios das observaes
a
a
pio a
e
co
em relaao ` mdia. Em cada caso, o valor zero para a varincia ou desvio padro, indica
c a e
a
a
ausncia de variaao; a variao vai aumentando ` medida que aumenta o valor da medida
e
c
ca
a
de disperso.
a
A varincia uma medida de disperso que nos fornece uma idia da variabilidade dos
a
e
a
e
dados em torno da mdia. Ela o quociente entre a soma dos quadrados dos desvios dos
e
e
dados observados, tomados em relaao a sua mdia aritmtica e o nmero de dados (n)
c
e
e
u
2

menos 1. E representada por s quando os dados so oriundos de uma amostra e por 2 ,


a
leia-se sigma ao quadrado, quando os dados representam a populaao. Vamos ilustrar os
c
passos para o clculo da varincia atravs de um exemplo.
a
a
e
Exemplo. Vamos calcular a varincia para os dados de uma amostra de tamanho,
a
n = 16, do dimetro (em cm) da roseta foliar de bromlias expostas ao sol. Os dados
a
e
amostrais obtidos foram:
5,4 5,4
6,8 7,0

5,8 6,4
7,3 7,3

6,4 6,6
7,5 8,2

6,6
8,8

6,8
8,8

Os passos para o clculo da varincia so dados na gura 2.30. Precisamos do valor da


a
a
a
mdia aritmtica dos dados; no exemplo vale x = 6, 94. Aps so calculados os desvios dos
e
e
o a
dados em relao ` mdia, (xi x); em seguida estes desvios so elevados ao quadrado,
ca a e
a
(xi x)2 . Finalmente, aplicamos a expresso da varincia amostral que dada por:
a
a
e
s2 =

n
i=1 (xi

x)2

.
n1

No exemplo, com base nos resultados de 2.30, temos:


s2 =

15, 98
= 1, 065 cm2 .
15

81

(2.6)

Foi tambm selecionada uma outra amostra de 16 valores de dimetros da roseta foliar
e
a
de bromlias em ambiente de sombra. Os resultados foram:
e
13,4
15,4

13,7
15,7

14,4 14,6
16,2 16,4

14,6
16,7

14,8 15,2
17,5 17,8

15,2
17,8

Para esses dados o valor da varincia s2 = 1, 893 cm2 . Obtenha esse valor. A concluso
a
e
a
que podemos tirar que, para a varivel dimetro, as bromlias em ambiente de sombra so
e
a
a
e
a
mais heterogneas (apresentam maior variabilidade) do que as expostas ao sol.
e
Para os dados de peso ao nascer de bezerros, obtemos s2 = 6, 92 kg 2 e s2 = 36, 48 kg 2 ,
CH
G
para as raas Charoleza e Gir, respectivamente. Portanto, a raa Gir muito mais hetc
c
e
erognea do que a raa Charoleza, para peso no nascimento.
e
c
A varincia apresenta um inconveniente de ordem prtica, pois como ela expressa
a
a
e
em unidades ao quadrado, isto causa problemas de interpretaao. Uma outra medida de
c
variabilidade, calculada atravs da varincia, o desvio padro da amostra (s). Na prtica o
e
a
e
a
a
desvio padro preferido em relao a varincia, pois ele expresso na mesma unidade dos
a e
ca
a
e
dados originais. O desvio padro nada mais do que a ra quadrada da varincia, logo:
a
e
z
a
s=

s2 .

(2.7)

Exemplo. Para os dados amostrais do dimetro da roseta foliar de bromlias, em cm,


a
e
expostas ao sol e em ambiente de sombra, os valores do desvio padro so, sSol = 1, 032 cm
a a
e sSombra = 1, 376 cm, respectivamente. O desvio padro uma medida relativa, assim, s
a e
o
faz sentido armar que um desvio grande (ou pequeno) comparativamente ` outro. Nesse
e
a
exemplo, o desvio padro para expostas ao sol menor do que para ambiente de sombra.
a
e
Podemos dizer que, para expostas ao sol, a disperso dos valores em torno da mdia , em
a
e
e
mdia igual a 1,032 cm e, para ambiente de sombra, a disperso dos valores em torno da
e
a
mdia , em mdia igual a 1,376 cm.
e
e
e
Existe uma expresso mais geral para o clculo da varincia e desvio padro dada por:
a
a
a
a
s2 =

k
i=1 (xi

x)2 ni

,
n1

(2.8)

onde k o nmero de valores diferentes de xi ; ni a frequncia de ocorrncia do i-simo


e
u
e
e
e
e
valor. Para os dados de dimetro de roseta expostas ao sol, tambm podemos calcular a
a
e
varincia usando 2.8.
a
s2 =

(2 2, 37) + (1 1, 30) + (2 0, 29) + (2 0, 12) + ... + (2 3, 46)


= 1, 065 cm2 .
16 1

82

Em algumas situaes, como por exemplo, quando a populaao no muito grande,


co
c a e
e
prefer realizar o censo, isto , obter as informaes sobre todos os elementos, plantas,
vel
e
co
pessoas etc. que constituem esta populaao. Nesse caso temos a varincia populacional,
c
a
2
representada por , leia-se sigma ao quadrado, e calculada atravs da expresso:
e
e
a
2 =

N
i=1 (xi

)2

(2.9)

onde = N xi /N , a mdia obtida com todos os dados da populaao, N o tamanho da


e
e
c
e
i=1
populaao, isto , o nmero total de dados. Da mesma forma, o desvio padro populacional
c
e
u
a
obtido atravs da ra quadrada da varincia e representado por . Num estudo sobre a
e
e
z
a
e
consanguinidade na comunidade da Costa da Lagoa da Conceio foram levantados os dados
ca
de todos os moradores (populao).
ca
O coeciente de variao utilizado quando temos interesse em comparar variabilidades
ca e
em situaoes onde as mdias so muito diferentes ou as unidades de medida so diferentes.
c
e
a
a
Nesse caso, utilizamos o coeciente de variaao pois uma medida relativa percentual da
c
e
variabilidade dos dados em torno da mdia, isto ,
e
e
CV (%) =

s
100.
x

(2.10)

E uma medida de disperso relativa porque estabelece uma relaao entre o desvio padro
a
c
a
e a mdia. Sendo uma medida independente da unidade da varivel util para se estudar
e
a
e
comparativamente duas ou mais distribuies.
co
Exemplo. Os dois conjuntos de dados abaixo referem-se ao comprimento do corpo e
peso de fmeas de Penaeus paulensis (Crustacea, Decapoda, Penaidae), respectivamente,
e
obtidos nas despescas dos viveiros do Centro de Cincias Agrrias da Universidade Federal
e
a
de Santa Catarina. O comprimento do corpo dado em mm, enquanto que o peso dado
e
e
em g.
27
30
0,14
0,18

26 26
30 33

0,16
0,23

25 25
33 33

0,14 0,12
0,28 0,28

0,12
0,32

25 25
35 35

23 23
35 36

0,12 0,11
0,31 0,33

0,09
0,36

0,07
0,33

A mdia e o desvio padro para cada uma das amostras so: xC = 29, 1667 mm, yP =
e
a
a

0, 2050 g, sC = 4, 6305 mm e sP = 0, 0984 g. Assim, os coecientes de variaao valem:


c
cvC =

4,6305
29,1667

100 = 15, 88% cvP =

83

0,0984
0,2050

100 = 48, 00%.

Portanto, a variabilidade na varivel peso muito maior do que na varivel comprimento. A


a
e
a
variabilidade mais signicativa para peso. Observe que pelos valores dos desvios padres
e
o
a concluso seria diferente.
a
O coeciente de variao bastante utilizado em dinmica de populaes vegetais ou
ca e
a
co
animais. Outra aplicaao importante do coeciente de variao na estat
c
ca e
stica experimental,
pois ele indica a preciso do experimento, ou seja, a capacidade de realizarmos novamente
a
o experimento, sob as mesmas condioes, e produzir resultados semelhantes. Quais so os
c
a
valores de C.V. aceitveis na experimentaao? Em ensaios agr
a
c
colas de campo, para culturas
anuais como soja, milho e feijo e varivel rendimento de gros, temos a seguinte orientao:
a
a
a
ca
C.V. 10%
10% < C.V. 20%
20% < C.V. 30%
C.V. > 30%

baixo

mdio
e

alto
muito alto

Os valores dos coecientes de variaao dependem do tipo de pesquisa e varivel em estudo,


c
a
sendo assim, no existe um orientao geral, cada caso um caso.
a
ac
e
Para dados agrupados em classes (histograma), podemos calcular a varincia atravs das
a
e
seguintes expresses:
o
s2 =

k
i=1 (si

x)2 ni

n1

para dados amostrais

(2.11)

k
i=1 (si

)2 ni
para dados populacionais
(2.12)
N
onde: k o nmero de classes; si o ponto mdio da i-sima classe; ni o nmero de dados
e
u
e
e
e
e
u
observados na i-sima classe e N o tamanho da populaao. A unica alteraao das frmulas
e
e
c

c
o
anteriores a substituiao dos valores originais, xi , pelos pontos mdios, si .
e
c
e
Exemplo. para a distribuio de frequncias da tabela 2.24, que diz respeito aos rendica
e
mentos, em kg/ha, de h
bridos de milho, o valor da varincia dado por:
a
e
2

1
{[(4214, 5 5105, 0)2 1] + [(4697, 5 5105, 0)2 12] + [(5180, 5 5105, 0)2 13]
32 1
+ [(5663, 5 5105, 0)2 3] + [(6146, 5 5105, 0)2 3]}

s2 =

s2 = 227409, 74 (kg/ha)2 .
O desvio padro vale:
a

s = s2 = 476, 87 kg/ha.
Da mesma forma que a mdia aritmtica, a varincia uma medida de disperso, que
e
e
a
e
a
representa bem a realidade, quando os dados apresentam pelo menos aproximadamente uma

84

distribuio normal. Para distribuioes assimtricas, uma medida da variabilidade dada


ca
c
e
e
pelo desvio interquartlico, calculada por:

Q3 Q1 .
Exemplo. Para os valores de rendimento de gros, em kg/ha, de h
a
bridos de milho, o
valor do desvio interquart
lico 5348,2-4738,1=610,1. Temos que 50% dos valores encontrame
se no intervalo de 4738,1 a 5348,2.

A Mdia e o Desvio Padro Sob um Modelo Normal


e
a
Um caso importante acontece quando os dados numa distribuiao de freqncias, apc
ue
resentam o histograma com a forma de sino, esta distribuio comumunte chamada de
ca e
distribuio normal ou Gaussiana (Karl F. Gauss). Nessa distribuio sempre temos:
ca
ca
1. 68% dos dados esto compreendidos entre a mdia mais ou menos um desvio padro
a
e
a
( 1; + 1).
2. 95,4% dos dados esto compreendidos entre a mdia mais ou menos dois desvios padres
a
e
o
( 2; + 2).
3. 99,7% dos dados esto compreendidos entre a mdia mais ou menos trs desvios padres
a
e
e
o
( 3; + 3).
Esses resultados podem ser visualizados na gura 2.31.
Nos trabalhos cient
cos, bastante comum e aconselhvel, a representao dos dados
e
a
ca
na forma x s ou x(s). Isso indica, que sob normalidade dos dados, 68% dos dados esto

a
entre a mdia mais 1 desvio padro e a mdia menos 1 desvio padro. O responsvel pelos
e
a
e
a
a
dados (Agrnomo, Bilogo), deve avaliar se estes intervalos so amplos (pouco precisos), ou
o
o
a
no (precisos), para o fenmeno real em estudo.
a
o
Vimos a importncia de se identicar as observaoes discrepantes num conjunto de dados.
a
c
Numa distribuio aproximadamente normal, algum(ns) valor(es) maior(es) que x + 3s, ou,
ca

menor(es) que x 3s, so considerados valores discrepantes ou outliers. Para a amostra de

a
peso de fmeas de Penaeus paulensis encontramos x = 0, 2050 e s = 0, 0984. Temos que
e
x + 3s = 0, 2050 + 3(0, 0984) = 0, 5000 e x 3s = 0, 2050 3(0, 0984) = 0, 0902. Como na
amostra estudada no temos nem um valor acima de 0,50 conclu
a
mos, por este critrio, que
e
no existe valor discrepante.
a

Uma Regra Emp


rica para a Disperso
a

85

68%
95,5%

-3,50

-1,75

0,00

1,75

3,50

-3,50

(a) Aproximadamente 68% dos dados


esto entre
a

-1,75

0,00

1,75

3,50

(b) Aproximadamente 95,4% dos dados


esto entre 2
a

99,7%

-3,50

-1,75

0,00

1,75

3,50

(c) Aproximadamente 99,7% dos dados


esto entre 3
a

Figura 2.31: Distribuio dos dados, sob o modelo normal, de acordo com e .
ca

86

Existe uma regra emp


rica determinada por um matemtico russo chamado Tchebyshe,
a
que diz o seguinte: dado um nmero k > 1, e uma amostra de n observaoes, y1 , y2 , ..., yn
u
c
e
1
certo que pelo menos 1 k2 dessas observaes pertencero ao intervalo x ks e x + ks.
co
a

Esta regra importante, principalmente quando no se conhece a distribuiao dos dados.


e
a
c
Exemplo. O objetivo estudar o nmero de insetos de determinada espcie por rvore
e
u
e
a
de Pinus elliotti. Uma amostra de tamanho n = 16 rvores foi realizada e os resultados
a
foram:
0 2 5 1 6 3 3 2
4 0 7

8 4 5

6 3

A mdia e o desvio padro valem x = 3, 6875 e s = 2, 3866, respectivamente. Para k = 2


e
a

temos que pelo menos 75% das observaoes encontram-se no intervalo [0;8]. Vericando-se
c
os dados da amostra encontramos 100% das observaes nesse intervalo.
co
Exerc
cio resolvido
1. Utilizando os dados da tabela 2.33, calcule a mdia, a varincia, o desvio padro e o
e
a
a
coeciente de variaao para cada um dos tratamentos.
c
Sem rizbio
o
34,35
20,45
4,52
13,16%

20
i=1

x=

xi /20
s =
x)2 /(20 1)

s = s2
s
CV (%) = x .100

20
i=1 (xi

Com rizbio
o
43,3
19,91
4,46
10,30%

Utilizando a mdia e o desvio padro, como voc descreveria os dados do tratamento 1 e


e
a
e
do tratamento 2? ainda utilizando a mdia e o desvio padro, verique se existem dados
e
a
suspeitos e discrepantes, para o tratamento 1 e 2. Indique os clculos.
a
Descrio
ca
x 1s

Suspeitos
x 2s

Discrepantes
x 3s

Sem rizbio
o

34, 35 4, 52
[29,83;38,87]

34, 35 2(4, 52) 34, 35 3(4, 52)


[25,31;43,39]
[20,78;47,92]

Com rizbio
o

43, 3 4, 46
[38,84;47,76]

43, 3 2(4, 46)


[34,38;52,22]

43, 3 3(4, 46)


[29,92;56,68]

No tratamento 1 vericamos que o valor 25 suspeito, porm, no considerado dise


e
a e
crepante; no tratamento 2 vericamos que o valor 34 suspeito, porm, no discrepante.
e
e
a e
Calcule a mediana e os quartis para cada um dos tratamentos. Aplicando as denioes
c

87

Tabela 2.34: Distribuiao de frequncia da varivel altura de calos em cm, num per
c
e
a
odo de
30 dias in vitro da espcie Mandevilla velutina
e
Altura de calos Ponto mdio (si ) Frequncia absoluta (ni )
e
e
0,00
0,14
0,28
0,42
0,56
0,70

0,14
0,28
0,42
0,56
0,70
0,84

0,07
0,21
0,35
0,49
0,63
0,77

15
1
5
8
7
2

Total

38

encontramos:
Q1
Sem rizbio
o
Com rizbio
o

Md

Q3

31
40,5

34
44

37,5
46,5

2.2.2.1 Exerc
cios Propostos
1. A tabela de distribuio de frequncias 2.34 foi constru a partir dos dados da tabela
ca
e
da
2.31. Observe que a distribuio assimtrica. Calcular a mdia, varincia, desvio padro,
ca e
e
e
a
a
mediana e quartis da distribuio. Considere o conjunto 1 formado pela mdia e varincia,
ca
e
a
e o conjunto 2 formado pela mediana e quartis. Qual dos dois conjuntos voc recomendaria
e
para essa distribuiao?
c

88

Tabela 2.35: Produo de cana-de-aucar em t/ha


ca
c
Variedade 1 Variedade 2
65
68
75
76
77

78
80
80
82
86

88
89
90
91
92

93
95
96
97
97

99

Tabela 2.36: Peso de mexilhes em dois locais


o
Sambaqui
Manguezal
30,61
28,89
32,21
24,25
25,63

42,88
36,22
28,86
22,56
22,92

27,94
41,45
42,59
15,25
33,29

25,34
25,67
17,64
33,97
11,13

9,49
16,92
12,91
14,05
14,88

19,17
21,60
20,01
19,81
16,22

2. Para se estudar o comportamento de duas variedades de cana-de-aucar, realizou-se


c
um experimento onde foram obtidos os resultados descritos na tabela 2.35. Para decidir se
a produo mdia das duas variedades de cana-de-aucar so semelhantes ou no, adotou-se
ca
e
c
a
a
o seguinte teste:
x1 x2

t=
s

1
n1

1
n2

onde s =

(n1 1)s2 + (n2 1)s2


1
2
(n1 + n2 2)

(2.13)

Caso |t| < 2 as produes mdias so semelhantes, caso contrrio so diferentes. Qual a
co
e
a
a
a
e
sua concluso?
a
3. Na tabela 2.36 temos os resultados da varivel peso de carne, em gramas, de mexilhes
a
o
do Sambaqui e do Manguezal. a) calcule a mdia e a mediana para cada um dos locais. Onde
e
houve maior crescimento?
b) Calcule o Q1 e o Q3 para cada um dos locais. Explique o signicado destes nmeros.
u
c) Compare os dois locais quanto a homogeneidade (calcule uma medida de disperso e
a
conclua).
d) Calcule o coeciente de variao para cada local e interprete. A concluso a mesma do
ca
a e
item c? Qual das duas concluses a denitiva?.
o e
4. A tabela 2.37 apresenta uma amostra de valores de peso de mexilho do Sambaqui.
a
a) Construa o histograma. A distribuiao apresenta a forma do modelo normal? Justique.
c

89

Tabela 2.37: Distribuio de frequncias para peso de mexilhes da localidade de Sambaqui


ca
e
o
Peso
Frequncias Porcentagens
e
8 < peso 11
11 < peso 14
14 < peso 17
17 < peso 20
20 < peso 23
23 < peso 26
26 < peso 29
29 < peso 32
32 < peso 35
35 < peso 38

3
6
5
7
4
4
2
2
1
1

8,57
17,14
14,29
20,00
11,43
11,43
5,71
5,71
2,86
2,86

b) Localize a classe que contm o percentil de ordem 90 (P90 ). Interprete este valor.
e
c) Acima de que peso encontram-se 85% dos mexilhes (Calcule o P15 )?
o
2.2.3

O Uso da Mediana e dos Quartis na Interpretao de um Conjunto de


ca
Dados

O objetivo do uso da mediana e dos quartis obter informaoes sobre a forma, o valor
e
c
representativo, a disperso e os valores discrepantes da distribuiao dos dados observados.
a
c
Atravs destas estat
e
sticas poss obter-se todas as informaes relevantes de uma dise
vel
co
tribuio.
ca
Sabemos que a mdia e o desvio padro so afetados, de forma exagerada, por valores
e
a a
extremos (valores altos ou baixos), portanto no so medidas indicadas para distribuies
a a
co
assimtricas, pois no representam bem a realidade dos fatos. Alm disso, somente com a
e
a
e
mdia e o desvio padro no temos idia da forma como os dados se distribuem. A sugesto
e
a a
e
a
fazer uso das seguintes medidas:
e
i) Mediana.
ii) Os valores extremos (inferior e superior) do conjunto de dados.
iii) O 1 e 3 quartis.
Obtemos, ento, o que se denomina na literatura por esquema dos cinco nmeros ou esquema
a
u
extremos-e-quartis.

90

Tabela 2.38: Dados de crescimento do pseudobulbo de Laelia purpurata, Florianpolis, SC.


o
Luz Direta 1,6 1,6 1,9 1,9 2,1 2,1 2,1 2,1 2,1 2,4 2,5 2,5
2,7 3,4 3,4 3,7 3,9 4,2 4,8 6,3 6,5 7,2 8,8 9,4 9,5
Luz Indireta

1,4
6,3

1,9
6,5

2,8 3,1
6,7 6,7

3,5 3,5
6,8 6,9

3,6 3,9
8,1 8,6

4,3 4,5
10,4 12,7

4,6
16,3

4,8
16,8 16,9

Tabela 2.39: Clculo dos quartis e extremos para dados de crescimento do pseudobulbo de
a
Laelia purpurata
Md Q1 Q3 Ei Es Q1 1, 5(Q3 Q1 ) Q3 + 1, 5(Q3 Q1 )
Luz direta

2,7

2,1 4,8

1,6

9,5

-1,95

8,85

Luz indireta

6,3

3,6 8,1

1,4 16,9

-3,15

14,85

Exemplo: Foram tomadas duas amostras de tamanhos igual a 25, de crescimento do


pseudobulbo de Laelia purpurata, sob duas condioes de luminosidade (com luz direta e com
c
luz indireta). Os dados brutos esto apresentados na tabela 2.38. Os resultados dos clculos
a
a
da mediana e quartis so apresentados na tabela 2.39. Nesta tabela, as duas ultimas colunas
a

representam um critrio para identicar a presena de valores discrepantes, o qual passamos


e
c
a descrever.

Valores Discrepantes (em ingls: Outliers)


e
Com o uso dos quartis tambm poss vericar (detectar) se um ou mais valores da
e e
vel
distribuio dos dados so considerados valores discrepantes. Se algum valor for menor do
ca
a
que Q1 1, 5(Q3 Q1 ), ou maior do que Q3 + 1, 5(Q3 Q1 ), ento, esse valor considerado
a
e
outlier. Num conjunto de dados pode existir mais do que um valor discrepante. No exemplo,
esses limites so dados por: -1,95 e 8,85, para luz direta e, -3,15 e 14,85, para luz indireta,
a
respectivamente. Portanto, observa-se na tabela 2.38, que os valores 9,4 e 9,5 so consideraa
dos outliers para luz direta, e que os valores 16,3, 16,8 e 16,9, so considerados outliers para
a
luz indireta.
Uma justicativa para utilizarmos o valor 1,5 nas expresses anteriores (deixaremos a
o
prova para a seo 5.3.2), que a rea entre a curva normal e os pontos limites Q1
ca
e
a
1, 5(Q3 Q1 ) e Q3 + 1, 5(Q3 Q1 ) igual a 99,3%. Portanto, estamos considerando 0,7%
e

91

Valores discrepantes

99,3%

Valores discrepantes

Figura 2.32: Area (99,3%) entre os pontos limites na distribuiao normal. A rea no
c
a
a
achurada corresponde aos outliers

50% dos
dados

Q1 Mediana Q3

Ei

Es

Figura 2.33: Forma da distribuiao normal.


c
dos valores da distribuiao normal como sendo valores discrepantes ou outliers. A ilustraao
c
c
dada na gura 2.32.
e
Como vamos utilizar esses resultados para estudar a forma de uma distribuiao de dados?
c
Para uma distribuiao simtrica, em forma de sino, a chamada distribuiao normal, temos a
c
e
c
gura 2.33. Olhando-se para a gura 2.33, esperamos intuitivamente que:
1. (M d Ei ) (Es M d), ou seja, a disperso inferior aproximadamente igual a
a
e
=
disperso superior;
a
2. (M d Q1 ) (Q3 M d);
=
3. (Q1 Ei ) (Es Q3 );
=
4. As distncias entre a mediana e os quartis sejam menores do que as distncias entre os
a
a

92

18

Comprimento do pseudobulbo

16
14
12
10
8
6
4
2
0

Luz direta

Luz indireta

No Outlier Max
No Outlier Min
75%
25%
Mediana
Outliers

Condio

Figura 2.34: Desenho esquemtico para comprimento de pseudobulbos de Laelia purpurata


a
para luz direta e indireta.
extremos e os quartis, ou seja, (M d Q1 ) e (Q3 M d) sejam menores do que (Q1 Ei )
e (Es Q3 ).
2.2.4

Desenho Esquemtico (em ingls leia-se Box Plot)


a
e

As informaes obtidas na seao anterior podem ser representadas gracamente num


co
c
desenho esquemtico, como ilustrado na gura 2.34. Os programas estat
a
sticos de l
ngua
inglesa trazem esta gura com o nome de box-plot. A seguir faremos comentrios sobre a
a
construo e interpretao do desenho esquemtico da gura 2.34.
ca
ca
a
O primeiro passao constru
e
rmos o eixo e a escala para a varivel resposta; no exemplo,
a
para a varivel comprimento do pseudobulbo, foi feita uma escala de 0 a 18 cm, com intervalos
a
de 2 cm. O desenho esquemtico fornece uma medida de posio central dos dados atravs
a
ca
e
da mediana. As medianas valem 2,7 cm e 6,3 cm, para luz direta e indireta, respectivamente,
indicando que o crescimento de pseudobulbos maior para luz indireta. Observe, na legenda
e
da gura 2.34, que as medianas esto representadas por quadradinhos vazios dentro das
a
caixas (retngulos). O desenho esquemtico, tambm, d uma idia da disperso, ou
a
a
e
a
e
a
contrariamente, da concentraao dos valores, atravs do intervalo interquart
c
e
lico (Q3 Q1 ).
Os desvios interquart
licos valem 2,7 cm e 4,5 cm, para luz direta e indireta, respectivamente,
indicando que o crescimento de pseudobulbos mais disperso para luz indireta. Observe,
e
na legenda da gura, que o desvio interquart
lico contm 50% das observaes, na faixa de
e
co

93

Extremos-e-quartis e a disperso de uma distribuio


a
ca

Ei

Q1

Md

Q3

Es

Ei

(a) Menor disperso do que 2.35(b)


a

Q1

Md

Q3

Es

(b) Maior disperso do que 2.35(a)


a

Figura 2.35: Em distribuies dispersas os valores dos quartis e extremos cam mais afastaco
dos da mediana
25% (Q1 ) a 75% (Q3 ) e representado gracamente por uma caixa. Os comprimentos
e
das caudas so dados pelas linhas cont
a
nuas que vo da caixa (retngulo) aos valores mais
a
a
afastados que no sejam outliers. Observe na tabela 2.39 que os extremos superiores cam
a
iguais a 8,8 e 12,7, para luz direta e indireta, respectivamente, ou seja, os extremos inferiores
e superiores so os menores e os maiores valores da distribuiao, desde que no sejam outliers.
a
c
a
Os outliers esto representados por pequenos c
a
rculos vazios e observa-se na gura 2.34 a
presena dos mesmos em ambos os ambientes. No se observa valores discrepantes para os
c
a
valores inferiores das distribuioes.
c
Nas guras 2.35 e 2.36 temos o comportamento dos quartis e mediana quanto a disperso
a
e a assimetria. As posioes relativas dos Q1 , Q3 e M d do uma idia da assimetria da
c
a
e
distribuio. No nosso exemplo, a distribuio com luz direta mais assimtrica do que com
ca
ca
e
e
luz indireta. Observe na gura 2.37 como ca o desenho esquemtico para uma distribuio
a
ca
normal. Podemos ver claramente que a amostra para luz direta no originria de uma
a e
a
populaao com distribuiao normal; mesma concluso para luz indireta.
c
c
a
Exerc
cios resolvidos
1. Construir o desenho esquemtico para a varivel rendimento de gros em kg/ha da
a
a
a
tabela 2.1. Os valores da mediana e dos quartis foram calculados considerando os dados
individualmente, isto , no so agrupados em classes e aparecem na legenda da gura
e a a
2.38. Encontre estes valores. Este desenho esquemtico foi feito no programa Statistica.
a
Obtenha informaoes relevantes sobre a varivel em estudo. Voc saberia fazer esta gura
c
a
e
na mo? O rendimento mdio 4986,5 kg/ha. O desvio interquart
a
e
e
lico vale 493,5 kg/ha.

94

Extremos-e-quartis e a assimetria de uma distribuio


ca

E1

Q1

Md

Q3

E1

Es

Q1

(a) Assimetria ` direita


a

Md

Q3

Es

(b) Assimetria ` esquerda


a

Figura 2.36: Em distribuioes assimtricas a distncia entre a Md e Q1 ou Ei diferente da


c
e
a
e
distncia entre Md e Q3 ou Es
a

Ei

Q1

Md

Q3

Es

Figura 2.37: Desenho esquemtico para uma distribuio normal.


a
ca

95

Box Plot
6600
6200
5800
5400
5000
4600

Non-Outlier Max = 58
Non-Outlier Min = 45

4200

75% = 5216
25% = 4722,5
Median = 4986,5

3800

Outliers

RENDIMENTO

Figura 2.38: Desenho esquemtico para rendimento de gros.


a
a
7

Total de hemcitos

6
5
4
3
2
1

Cultivo

Mangue

Non-Outlier Max
Non-Outlier Min
75%
25%
Mediana
Outliers
Extremos

Local

Figura 2.39: Desenho esquemtico para nmero total de hemcitos em dois locais.
a
u
o
So observados 4 valores discrepantes, um h
a
brido com produao aqum dos demais e, 3
c
e
h
bridos com produes acima dos demais. A distribuio assimtrica ` direita, portanto,
co
ca e
e
a
no segue uma distribuiao normal.
a
c
2. Na gura 2.39 representa-se duas distribuioes de freqncias, uma para local Cultivo e
c
ue
outra para Mangue. Os resultados referem-se a varivel nmero total de hemcitos no bivalve
a
u
o
Crossostrea rhizophorae coletados em ambiente de cultivo e mangue. Descreva e compare as
principais informaoes (valor t
c
pico, simetria, disperso, outliers) das duas distribuioes.
a
c
O nmero total mediano de hemcitos nos dois locais praticamente o mesmo e, em
u
o
e
torno de 2, 5.103 /mm3 . As duas distribuioes so assimtricas. No mangue, a distribuio
c
a
e
ca
apresenta valores discrepantes.

96

Tabela 2.40: Produao de cana-de-aucar em toneladas por hectare


c
c
Variedade 1 65 68 75 76 77
78 80 80 82 86
Variedade 2

88 89
93 95
99

90 91
96 97

92
97

Tabela 2.41: Tamanho de pec


olos de Hydrocotille sp

Area umida

Area seca
13,8
14,3
14,5
15,0
15,0
15,5
15,5
15,5
15,6

15,6
15,8
15,8
15,8
15,8
16,0
16,0
16,0
16,1

16,1
16,3
16,3
16,3
16,3
16,5
16,5
16,6
16,6

16,6
16,8
16,8
16,9
17,0
17,0
17,2
17,4

7,3
7,6
7,8
7,8
8,0
8,2
8,2
8,3
8,3

8,4
8,4
8,4
8,6
8,6
8,6
8,6
9,0
9,0

9,0
9,0
9,3
9,3
9,3
9,6
9,6
9,8
9,8

10,4
10,4
10,9
10,9
11,7
11,7
12,0

2.2.4.1 Exerc
cios Propostos
1. Para se estudar o comportamento de duas variedades de cana-de-aucar, realizou-se
c
um experimento onde foram obtidos os resultados indicados na tabela 2.40.
a) Calcular a M d, Q1 , Q3 , Q3 Q1 , Q1 1, 5(Q3 Q1 ) e Q3 + 1, 5(Q3 Q1 ) para cada uma
das variedades.
b) Faa o desenho esquemtico mltiplo para os dados das variedades 1 e 2.
c
a
u
c) Compare os dois conjuntos de dados atravs do desenho do item b).
e
2. Para se estudar o comportamento de uma planta t
pica de dunas, a Hydrocotille sp,
quanto ao seu desenvolvimento, mediu-se o tamanho do pec (cm), em duas reas: seca e
olo
a
umida. Selecionou-se de cada uma dessas reas, amostras aleatrias de plantas e mediu-se o

a
o
tamanho dos pec
olos. Os dados so dados na tabela 2.41.
a
a) Calcular a M d, Q1 , Q3 , Q3 Q1 , Q1 1, 5(Q3 Q1 ) e Q3 + 1, 5(Q3 Q1 ) para cada uma
das variedades.
b) Faa o desenho esquemtico mltiplo para os dados das reas seca e umida.
c
a
u
a

c) Compare os dois conjuntos de dados, quanto as principais caracter


sticas, atravs do
e
desenho do item b).

97

Tabela 2.42: Dados de produao de matria seca e radiao fotossinttica ativa


c
e
ca
e
Produo
ca

10 60 110

160

220 280

340 400

460

520

Radiao
ca

18 55 190

300

410 460

570 770

815

965

3. Verique, construindo os desenhos esquemticos para os dados da tabela 2.36, se


a
existem valores discrepantes. Obs. utilize os clculos j realizados neste exerc
a
a
cio.
2.2.5

Coeciente de Correlao
ca

E comum na prtica o interesse em se analisar o comportamento conjunto de duas ou mais


a
variveis quantitativas. Nessa seao trataremos do estudo de correlaao entre duas variveis
a
c
c
a
quantitativas, porm, a generalizao para mais de duas variveis poss
e
ca
a
e
vel. Vamos pensar
que estamos interessados em obter uma medida estat
stica que indique se existe ou no
a
relao entre duas variveis, qual a magnitude e o sinal dessa relaao. Muitas vezes estamos
ca
a
c
interessados em obter uma medida estat
stica que indique a fora da relao linear entre
c
ca
duas variveis quantitativas X e Y. Por exemplo, queremos vericar se existe correlao
a
ca
entre doses de nitrognio e a produo de milho. Uma medida de correlao linear muito
e
ca
ca
utilizada na prtica o coeciente de correlao de Pearson.
a
e
ca

Diagrama de Disperso
a
Um primeiro passo para vericar se existe correlao entre duas variveis quantitativas
ca
a
e
construir um grco de disperso, que nada mais do que a representaao grca dos pares
a
a
e
c
a
de valores num sistema cartesiano. No eixo das abcissas colocamos a varivel X e no eixo
a
das ordenadas a varivel Y.
a
Exemplo. Considere os dados referentes ` produo de matria seca de uma planta (Y)
a
ca
e
e a quantidade de radiaao fotossinttica ativa (X). Os dados obtidos experimentalmente so
c
e
a
apresentados na tabela 2.42.
O diagrama de disperso mostrado na gura 2.40. Atravs da pura observaao da
a e
e
c
distribuio dos pontos, conclu
ca
mos que existe uma dependncia entre as variveis produao
e
a
c
(Y) e radiao (X), porque no conjunto das observaes, a medida que aumenta a radiaao
ca
co
c
fotossinttica, tambm aumenta a produao de matria seca. Em termos prticos, isso
e
e
c
e
a

98

600

Produo (g/m

2)

500
400
300
200
100
0

200

400

600

800

Radiao fotossinttica (W/m

1000

2)

Figura 2.40: Diagrama de dispero das varivies produao e radiaao fotossinttica


a
a
c
c
e
0,56
0,52

Radiao (%)

0,48
0,44
0,40
0,36
0,32
0,28
0,1

0,3

0,5

0,7

0,9

1,1

1,3

Espaamento (m)

Figura 2.41: Diagrama de dispero das varivies radiao e espaamento


a
a
ca
c
signica que conhecendo-se a quantidade de radiaao ajuda a prever a produao de matria
c
c
e
seca.
Exemplo. Deseja-se saber se existe correlaao entre o espaamento das linhas na cultura
c
c
da soja (X) e a frao da radiaao solar extinta pela planta (Y). Para atender a esse objetivo
ca
c
foram coletados pares de valores das duas variveis. Os resultados otidos foram:
a
Radiaao
c

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

1,1

Espaamento
c

0,53

0,51 0,48

0,45

0,44 0,41

0,40

0,39 0,36

0,30

Observando-se o grco 2.41 vericamos uma dependncia inversa entre espaamento


a
e
c
e radiao, ou seja, aumentando-se o espaamento entre linhas ocorre uma diminuiao na
ca
c
c

99

Tabela 2.43: Valores de salinidade (g/l) e temperatura para a regio III da Lagoa da Cona
ceio
ca
Estao Temperatura (Y) Salinidade (X)
ca
23
23A
24
25
26
27
27A
28

24,0
23,0
23,0
26,0
25,5
25,0
24,3
23,0

3,85
9,61
2,26
2,06
2,89
9,61
10,58
11,40

26,5
26,0

Temperatura

25,5
25,0
24,5
24,0
23,5
23,0
22,5

11

13

Salinidade

Figura 2.42: Diagrama de dispero das varivies salinidade e temperatura


a
a
frao da radiao solar extinta pela planta.
ca
ca
Exemplo. Uma pesquisadora esta interessada em vericar se existe dependncia entre
e
a salinidade (g/l) e a temperatura para a regio III da Lagoa da Conceiao. Os dados esto
a
c
a
descritos na tabela 2.43.
O diagrama de disperso mostrado na gura 2.42. Olhando-se para o grco 2.42, no
a e
a
a
observamos um relacionamento linear entre a salinidade e a temperatura, ou seja, os resultados no indicam que aumentando-se a salinidade existe uma diminuo ou um aumento
a
ca
da temperatura.

O Coeciente de Correlao
ca
O coeciente de correlaao, representado pela letra r, utilizado para quanticar a
c
e

100

Y
r>0

Figura 2.43: Correlao positiva


ca
associaao entre duas variveis quantitativas. Indica o quanto a nuvem de pontos aproximac
a
se de uma reta. Salientamos que duas variveis podem apresentar uma associaao, por
a
c
exemplo, curvil
nea, ao invs de linear. Neste curso trataremos somente de associaao linear
e
c
entre duas variveis. O coeciente de correlaao, (r), uma medida estat
a
c
e
stica que assume
valores entre
1 r 1,
onde r = 1 indica uma relao linear inversa perfeita e, r = 1 indica uma relaao positiva
ca
c
perfeita entre as variveis. Quando o valor de r for igual a zero, signica que no existe
a
a
associaao entre as variveis.
c
a
Considere a gura 2.43. Aqui, atravs de uma transformaao, a origem foi transportada
e
c
para o centro da nuvem de pontos, ento, a origem do sistema dado pelo par (, y ).
a
e
x
Tecnicamente foi feita uma translocaao de eixos. Notamos que a grande maioria dos pontos
c
o
o
esto situados no 1 e 3 quadrantes. Nesses quadrantes as coordenadas tm o mesmo sinal
a
e
e, portanto, o produto ser sempre positivo. Assim, se para cada ponto zermos o produto
a
de suas coordenadas e somarmos esses produtos, o resultado ser um nmero positivo, pois
a
u
existem mais produtos positivos do que negativos. Portanto, r > 0. Isto signica uma
associaao positiva entre as variveis.
c
a
Para a disperso da gura 2.44 a soma dos produtos das coordenadas na maioria
a
e
negativa. Isto acarreta um r < 0, portanto, caracterizando uma relaao negativa (uma
c

101

Y
r<0

Figura 2.44: Correlao negativa


ca
cresce enquanto a outra decresce) entre as variveis .
a
Para a disperso da gura 2.45 a soma dos produtos das coordenadas ser prxima de
a
a o
0, indicando que no existe associao entre as variveis.
zero. Portanto, r =
a
ca
a
a
c
e
Exemplo. Considere os dados referentes ` produao de matria seca de uma planta
(Y) e a quantidade de radiaao fotossinttica ativa (X), mostrados na tabela 2.42 e, que,
c
e
desejamos saber se existe associao entre a produo e a radiao e qual a grandeza desta
ca
ca
ca
associaao. Pela gura 2.40 percebe-se um relacionamento linear entre elas, agora, desejamos
c
quantica-lo atravs do clculo do coeciente de correlaao, o qual passamos a fazer passo a
e
a
c
passo. Inicialmente, precisamos fazer a mudana de origem do sistema para o ponto (, y ),
c
x
onde x = 455, 30 e y = 256, 00. Os resultados encontram-se nas colunas 4 e 5 da tabela
2.44. Existe, ainda, um problema quanto ` escala usada. A varivel X, dada em g/m2 ,
a
a
e
2
e Y , dada em W/m , como X tem maior disperso, o produto car mais afetado pelos
e
a
a
resultados de X do que de Y . Para corrigir isso, podemos reduzir as duas variveis para
a
uma mesma escala, isso obtido dividindo-se os desvios pelos respectivos desvios padres
e
o
das variveis, onde: X = 308, 1263 e Y = 164, 4506. Observe que so os desvios padres
a
a
o
populacionais. Esses novos valores esto nas colunas 6 e 7 da tabela 2.44. Na ultima coluna
a

da tabela, indica-se os produtos das variveis padronizadas; a soma dos mesmos, cujo valor
a
igual a 9,953 que, como espervamos, positiva. Para completar o clculo do coeciente
e
a
e
a
de correlaao basta dividir 9,953 pelo nmero de pares de valores (mdia), cujo valor igual
c
u
e
e

102

Y
r=0

Figura 2.45: Correlaao nula


c
a:

9, 953
= 0, 9953.
10
Portanto, para esse exemplo, o grau de associaao linear est quanticada em 0,9953. Indic
a
cando uma relaao linear muito forte positiva entre as duas variveis.
c
a
Uma frmula prtica para o clculo do coeciente de correlao dada por:
o
a
a
ca e
Correlao(X,Y) =
ca

Corr(X, Y ) =

n(
n(

xy) (

x2 ) (

x)2

x
n(

y)
y2) (

y)2

(2.14)

Exemplo. Vamos considerar os dados de produao de matria seca e a quantidade de


c
e
radiao fotossinttica para mostrar os clculos da estat
ca
e
a
stica 2.14. Os clculos intermedirios
a
a
esto desenvolvidos na tabela 2.45. O valor do coeciente de correlaao por 2.14 :
a
c
e
Corr(X, Y ) =

10(1669880) (4553)(2560)
10(3022399)

45532

10(925800)

25602

5043120
= 0, 9953.
5067155, 33

2.2.5.1 Exerc
cios propostos
1. A tabela 2.46 apresenta os valores de condutividade (mho) e salinidade (g/l) para a
regio III da Lagoa da Conceiao.
a
c
a) Construir o grco de disperso. Conclua sobre a dependncia entre as variveis X e Y.
a
a
e
a
b) Quantique a dependncia entre X e Y atravs do coeciente de correlaao. Existe uma
e
e
c
dependncia forte, mdia ou fraca?
e
e

103

Tabela 2.44: Etapas intermedirias para o clculo do coeciente de correlao


a
a
ca
Observaao x
c
y (x x) (y y ) Zx = (x x)/x Zy = (y y )/y Zx Zy

1
2
3
4
5
6
7
8
9
10

18
55
190
300
410
460
570
770
815
965

10
60
110
160
220
280
340
400
460
520

-437,3
-400,3
-265,3
-155,3
-45,3
4,7
114,7
314,7
359,7
509,7

-246,0
-196,0
-146,0
-96,0
-36,0
24,0
84,0
144,0
204,0
264,0

-1,419
-1,299
-0,861
-0,504
-0,147
0,015
0,372
1,021
1,167
1,654

-1,496
-1,192
-0,888
-0,584
-0,219
0,146
0,511
0,876
1,240
1,605

2,123
1,548
0,764
0,294
0,032
0,002
0,190
0,894
1,448
2,656

Tabela 2.45: Etapas intermedirias para o clculo do coeciente de correlao (frmula


a
a
ca
o
operacional)
Observaao
c
x
y
x2
y2
xy
1
2
3
4
5
6
7
8
9
10

18
55
190
300
410
460
570
770
815
965

10
60
110
160
220
280
340
400
460
520

324
3025
36100
90000
168100
211600
324900
592900
664225
931225

100
3600
12100
25600
48400
78400
115600
160000
211600
270400

180
3300
20900
48000
90200
128800
193800
308000
374900
501800

Totais

4553

2560

3022399

925800

1669880

104

Tabela 2.46: Valores de condutividade (mho) e salinidade (g/l) para a regio III da Lagoa
a
da Conceiao
c
Estao Condutividade (Y) Salinidade (X)
ca
23
24
25
26
27
28

19,92
11,78
14,11
16,10
36,52
51,46

Tabela 2.47: Notas mdias de


e
Sesso
a
Tempo de
de
estocagem (dias)
avaliaao
c
x
1
2
3
4
5
6

9
14
22
29
36
43

3,85
2,26
2,06
2,89
9,61
11,40
aroma de caf torrado e mo
e
do
Resultado mdio da equipe de
e
provadores para cada amostra
y1 y2
y3
4,8
4,0
3,7
3,2
3,7
2,5

4,7
4,7
3,7
3,5
3,0
2,8

4,7
4,8
3,5
3,2
3,3
2,7

2. Um estudo de vida de prateleira do caf torrado e mo foi realizado. Os testes


e
do
o
sensoriais foram iniciados a partir do 9 dia de estocagem e depois a intervalos de mais ou
menos 7 dias. Em cada poca de avaliaao sensorial trs amostras (pacotes) foram obtidas
e
c
e
ao acaso. Seis provadores treinados avaliaram as trs amostras simultaneamente, julgando
e
o produto quanto ao aroma em uma escala descritiva de 1 a 6 pontos: 6 = excelente; 5 =
bom; 4 = aceitvel; 3 = pouco aceitvel; 2 = inaceitvel e 1 = no beb
a
a
a
a
vel. Os resultados
obtidos so dados na tabela 2.47.
a
a) faa o diagrama de disperso entre as variveis tempo e mdia de aroma;
c
a
a
e
b) calcule o coeciente de correlao entre as duas variveis e faa uma concluso.
ca
a
c
a
2.2.6

Ajuste da Equao de uma Reta


ca

O coeciente de correlaao d um nmero que resume o grau de relacionamento linear


c a
u

105

entre duas variveis, por exemplo, r = 0, 90; o ajuste de um modelo linear simples tem como
a
resultado uma equao matemtica que descreve esse relacionamento. A partir do momento
ca
a
que temos um modelo ajustado, o conjunto de dados passa a ser representado atravs deste.
e
Vamos procurar estabelecer uma equao matemtica linear, isto , ajustar a equaao de
ca
a
e
c
uma reta para descrever o relacionamento entre duas variveis. Olhando-se para a gura
a
2.40, observa-se que existe uma relaao linear positiva entre as variveis produao (Y ) e
c
a
c
radiao (X), portanto, podemos ajustar a equaao de uma reta aos dados. As variveis Y
ca
c
a
e X so tambm denominadas de variveis dependentes e independentes, respectivamente.
a
e
a
Utilizaao:
c
1. Temos duas variveis que medem aproximadamente a mesma coisa, mas uma delas
a
e
relativamente dispendiosa, ou dif de lidar, enquanto que a outra no. Por exemcil
a
plo, a resistncia e a dureza de um material podem estar relacionadas, de modo que
e
conhecendo-se a dureza podemos estimar a resistncia. Se o teste de resistncia destroi
e
e
o material, enquanto que o teste de dureza no o destroi, uma pessoa interessada em
a
estimar a resistncia, obviamente preferir conar nos resultados do teste de dureza
e
a
para estimar a resistncia. A nalidade de uma equao de regresso seria ento estie
ca
a
a
mar valores de uma varivel, com base em valores conhecidos da outra. Esse estudo
a
tambm conhecido como calibrao da equao de regresso.
e e
ca
ca
a
ca
co
a e
a
2. Outra aplicao das equaes de regresso explicar valores de uma varivel em termos
da outra. Isto , podemos suspeitar de uma relaao de causa e efeito entre duas
e
c
variveis. Por exemplo, quantidade de fertilizante e produao de trigo.
a
c
a
c
3. Predizer valores futuros de uma varivel. Por exemplo, predizer produoes futuras.

A Equao da Reta
ca
Uma reta dada pela equao matemtica:
e
ca
a
yi = + xi
onde o parmetro representa o ponto onde a reta corta o eixo dos y e o parmetro o
a
a
e
coeciente angular, ou ainda, o quanto varia a mdia de y para o aumento de uma unidade
e
da varivel x. Esses parmetros esto representados na gura 2.46. Por exemplo, a reta
a
a
a
estimada por,
yi = 5 + 3xi

106

yi = + xi

x=1

y
x

x+1

Figura 2.46: Interpretaao dos parmetros da equaao de uma reta


c
a
c
intercepta o eixo das ordenadas no ponto em que y = 5; o coeciente angular da reta vale 3,
o que signica que a cada unidade de variao de x, correspondem 3 unidades de variaao
ca
c
de y. Dando alguns valores para x, podemos resolver a equao para obter os valores de y
ca

(leia-se y chapu e representa os valores estimados da varivel Y ).


e
a
Valores de xi

y = 5 + 3xi

2,0
3,0
5,0

11
14
20

Devemos, atravs de um mtodo adequado, estimar os parmetros e .


e
e
a

Estimativas dos Parmetros e


a
A idia bsica na estimativa da parte funcional do modelo, + xi , encontrar a reta
e
a
e
que passa o mais prximo poss
o
vel de todos os pontos observados. Representaremos esta
reta por:
y = a + bx

e a denominaremos de reta estimada pelos dados. Um critrio conhecido como mtodo dos
e
e
m
nimos quadrados, fornece as seguintes expresses para as estimativas dos parmetros da
o
a
equao:
ca
b =

n(

xy) ( x)( y)
n( x2 ) ( x)2

107

Tabela 2.48: Clculos intermedirios para a estimao dos parmetros


a
a
ca
a
Dados

clculos intermedirios
a
a
xy

x2

10
60
110
160
220
280
340
400
460
520

180
3300
20900
48000
90200
128800
193800
308000
374900
501800

324
3025
36100
90000
168100
211600
324900
592900
664225
931225

2560

1669880

3022399

18
55
190
300
410
460
570
770
815
965
4553

yb x
n
onde n o nmero de pares (x, y) observados (tamanho da amostra).
e
u
Exemplo. Ilustraremos a obtenao da equaao da reta com as observaoes de produao
c
c
c
c
(Y ) e radiaao (X) (descritos anteriormente). A tabela 2.48 apresenta os dados originais e
c
os clculos intermedirios para se encontrar as estimativas dos parmetros. Encontramos:
a
a
a
a =

10(1669880) (4553)(2560)
= 0, 5312;
10(3022399) (4553)2
2560 0, 5312(4553)
a =
= 14, 1537.
10
A equaao da reta estimada com base nos dados da amostra ca:
c
b =

yi = 14, 154 + 0, 531xi .

Os valores observados, juntamente com a equaao estimada da reta esto na gura 2.47.
c
a
Como era esperado, observa-se um bom ajuste da equaao da reta aos dados observados.
c
A distncia de cada um dos valores observados at a equao da reta chamada de desvio
a
e
ca
e
ou res
duo e so representados por ei . O clculo dos desvios dado por:
a
a
e
e i = yi yi .

108

y=14,154+0,531*x+eps
650
550

produo

450
350
250
150
50
-50
-100

100

300

500

700

900

1100

radiao

Figura 2.47: Reta ajustada aos dados observados


Por exemplo, o primeiro res
duo dado por:
e
e1 = 10 (14, 154 + 0, 531 18) = 10 23, 71 = 13, 71.
Para todos os dados de produao e radiaao, dados na tabela 2.48, os valores ajustados
c
c
e os res
duos so dados por:
a
Valores estimados

Desvios ou res
duos

23,71
43,37
115,08
173,51
231,94
258,50
319,93
423,16
447,07
526,74

-13,71
16,63
-5,08
-13,51
-11,94
21,50
23,07
-23,16
12,93
-6,74

O grco dos valores ajustados versus os res


a
duos dado na gura 2.48. O padro
e
a
esperado que os pontos estejam alatoriamente distribu
e
dos em torno do valor zero. Se
ocorrer este padro, dizemos que o modelo adequado para representar os nossos dados.
a
e
Observamos na gura 2.48 que os pontos encontram-se distribu
dos ao acaso em torno do

109

30
20

Residuos

10
0
-10
-20
-30
-50

50

150

250

350

450

550

650

Valores estimados

Figura 2.48: Grco dos valores ajustados versus res


a
duos
valor zero, portanto, o modelo linear simples (equao da reta), pode ser utilizado para
ca
os dados amostrados. Num outro caso, se o padro de distribuiao fosse curvil
a
c
neo, um

c
polinmio de 2 grau seria o indicado. Assim, podemos querer estimar (avaliar) a produao
o
para um valor de radiao igual a 100. Este valor obtido fazendo-se:
ca
e
yi = 14, 154 + 0, 531 100 = 67, 254.

2.2.6.1 Exerc
cios propostos
1. a) Obtenha a equaao da reta para os dados da tabela 2.46, isto , para condutividade
c
e
(Y ) e salinidade (X).
b) De acordo com esta funao, quais seriam os valores estimados () para os valores de x da
c
y
tabela 2.46.
c) O que voc acha da discrepncia entre os valores observados e estimados (y y )?
e
a

d) Encontre o valor estimado (), para salinidade igual a 5,0.


y
2. a) Encontre a equaao da reta para os dados da tabela 2.47, ou seja, a equao do
c
ca
tempo de estocagem (Y ) sobre o aroma.
b) Voc considera que esta equao est explicando bastante da relaao entre tempo de
e
ca
a
c
estocagem e aroma?
c) Faa o grco dos res
c
a
duos versus valores ajustados. Existe algum padro na distribuiao?
a
c
3. (Albert et.al. 1999, pgina 173 e 708). A curva mostrada na gura 2.49 descrita
a
e
pela equaao:
c
velocidade = Vmax [S/(S + KM )]
(2.15)

110

Taxa de transporte (mmol/min)

220
180
140
100
60
20
-20

10

Concentrao de soluto (mm)

Figura 2.49: Cintica enzimtica


e
a
a qual chamada de equaao de Michaelis-Menten. A velocidade da reao enzimtica (V)
e
c
ca
a
aumenta ` medida que a concentrao do substrato (S) aumentada, at que um valor
a
ca
e
e
mximo (Vmax ) atingido. Para a maioria das enzimas, a concentrao de substrato na qual
a
e
ca
a velocidade da reao metade da mxima fornece uma medida direta da fora de ligao
ca e
a
c
ca
do substrato ` enzima (KM ).
a
Para o transporte de acetado mediado por prote carreadora, a relaao entre concenna
c
trao, S, e taxa de transporte, V , pode ser descrita pela equao 2.15, que descreve reaoes
ca
ca
c
enzimticas simples:
a
T axa de transporte = Vmax S/(S + KM )
(2.16)
Desejamos, atravs do ajuste da equaao de regresso, estimar os parmetros Vmax e KM .
e
c
a
a
Para facilitar a obteno dos mesmos, fazemos uma transformaao na equaao 2.16, de tal
ca
c
c
forma que, os dados possam ser dispostos como uma linha reta. Fazendo-se a transformao
ca
inversa, temos:
1/taxa = (KM /Vmax )(1/S) + 1/Vmax .
(2.17)
Portanto, temos a equao de uma reta: y = + x, onde: y = 1/V , x = 1/S, = 1/Vmax
ca
e = KM /Vmax . Para os dados da tabela 2.49, encontre as estimativas dos parmetros
a
Vmax e KM , ajustando a equaao de uma reta .Conhecendo-se os valores de Vmax e KM voc
c
e
pode calcular as taxas de transporte para as concentraes de 0,5 mM e 100 mM de acetato
co
usando a equaao 2.16. Encontre estes valores.
c

111

Tabela 2.49: Valores de concentraao (S) e taxa de transporte (V)


c
S
V 1/S
1/V
0,1
0,3
1,0
3,0
10,0

18 10,0
46 3,3
100 1,0
150 0,33
182 0,1

0,056
0,022
0,01
0,0067
0,0055

Modelos de Probabilidades para Experimentos Simples

3.1

Introduo
ca

O importante estudo de probabilidade anterior aos anos de 1500, sculo XVI. Nessa
e
e
poca , as aplicaoes eram dirigidas aos jogos de azar. Pessoas se utilizavam do conhecimento
e
c
da teoria das probabilidades para planejar estratgias de apostas. Conta-se que um senhor
e
conhecido como Cavaleiro de Mer, amigo do francs Pascal (1610), e grande apreciador
e
e
de jogos, solicitava ao mesmo, que calculasse suas chances de ganho.
No entanto, somente no sculo XX, que o clculo de probabilidade teve um desenvolvie
e
a
mento bastante grande, e baseado numa teoria matemtica atravs de axiomas (condioes)
a
e
c
rigorosos, denioes e teoremas.
c
A probabilidade um ramo da matemtica cuja grande aplicaao na estat
e
a
c e
stica, como
veremos a seguir. At o presente momento do nosso curso de estat
e
stica, estudamos, de
forma emp
rica, isto , sem uma justicativa cient
e
ca (s descrevendo e no explicando), o
o
a
comportamento dos fenmenos, eventos da natureza, atravs da construo das distribuies
o
e
ca
co
de frequncias. Aqui, temos especial interesse em experincias aleatrias, casuais, ou seja,
e
e
o
devemos realizar o experimento para saber qual ser o resultado. Por exemplo, no poss
a
a e
vel
saber qual ser a produo por hectare de uma linhagem X de feijo, se este no for plana
ca
a
a
tado, colhido e mensurado. Outros exemplos de experimentos aleatrios: 1) germinaao de
o
c
sementes; 2) sobrevivncia de enxertos; 3) nmero de microncleos/3000 clulas; 4) nmero
e
u
u
e
u
de plantas numa determinada rea.
a

112

Experimentos aleatrios: quando repete-se o experimento, em condioes mais


o
c
prximas poss
o
veis, do resultados geralmente diferentes.
a
Vericando-se os fenmenos aleatrios na natureza, construindo as suas distribuioes de
o
o
c
freqncias (conhecimento emp
ue
rico), e com o surgimento da teoria da probabilidade, foi
poss matematizar a natureza, isto , criar modelos probabil
vel
e
sticos (distribuies de probco
abilidades) que representam muito bem os fenmenos da natureza. Com isso, poss
o
e
vel,
fazendo-se algumas suposioes adequadas (hipteses, conjecturas) e sem a necessidade de se
c
o
observar diretamente o fenmeno, estabelecer distribuioes de probabilidades que represeno
c
tam muito bem as distribuioes de freqncias, quando o fenmeno observado diretamente.
c
ue
o
e
Esses modelos probabil
sticos so considerados hoje a espinha dorsal da estat
a
stica, pois,
como veremos, todos os procedimentos inferenciais (amostra populaao), so aplicaoes
c
a
c
de probabilidade. Vamos ilustrar a construao de modelos probabil
c
sticos com dois exemplos.
Exemplo 1: de um grupo de duas mulheres (M) e trs homens (H), uma pessoa ser
e
a
sorteada para presidir uma determinada reunio. Queremos estudar as probabilidades de
a
que o presidente seja do sexo masculino ou feminino. Suposioes:
c
o
1 ) S existem duas possibilidades.

2 ) Cada pessoa tem a mesma chance de ser sorteada.


Tabela 3.1: Modelo de probabilidades para o experimento:
Sexo

M H
2
5

Freqncia terica
ue
o

Total

3
5

Exemplo 2: o objetivo estudar a distribuiao das proporoes no lanamento de um


e
c
c
c
dado. Vamos construir esta distribuiao atravs de suposioes tericas;
c
e
c
o
1 ) s podem ocorrer seis faces e,
o
u
2 ) considerando o dado como sendo perfeito, cada face deve ocorrer o mesmo nmero de
vezes e, portanto, a proporao de ocorrncia de cada face de 1 .
c
e
e
6
Assim, o modelo terico de freqncias para esse experimento :
o
ue
e
Faces do dado

Total

Freqncias
ue

1
6

1
6

1
6

1
6

1
6

1
6

113

A primeira grande aplicaao de probabilidade nas biocincias, foi com as leis da heredc
e
2
itariedade (Mendel, 1822-1884) . Outras aplicaes podem ser: chance de sobrevivncia
co
e
(germina ou no germina), distribuiao e interao de espcies animais ou vegetais, risco de
a
c
ca
e
doenas, ocorrncia de mutaoes, previso de safras, na previso de chuvas, geadas, granizos,
c
e
c
a
a
etc.
Uma aplicao, particularmente importante para o nosso curso, quando um pesquisador
ca
e
conduz um experimento. Quando um experimento instalado, desejamos comparar os efeitos
e
dos tratamentos (variaoes de um fator a ser estudado). Para se estimar os efeitos dos
c
tratamentos e tambm para executar os testes estat
e
sticos necessrio o uso de repetioes
e
a
c
(aplicao do mesmo tratamento em diversas unidades experimentais e que formar a amostra
ca
a
de estudo), atravs das quais vamos ter a possibilidade de calcular a variabilidade dos dados,
e
ou seja, a varincia. O pesquisador esfora-se ao mximo para manter todas as condioes
a
c
a
c
experimentais o mais constantes poss
veis, s deixando variar os tratamentos. Por exemplo,
o
num experimento agr
cola de campo, vamos aplicar um inseticida, herbicida ou fungicida
de forma homognea em todo o experimento; a fertilidade do solo deve ser igual para todos
e
os tratamentos. A temperatura, a umidade, a luminosidade, devem ser mantidas constante
dentro de um laboratrio. A temperatura deve ser constante em todos os pontos dentro de
o
uma estufa . E assim por diante. Pois bem, por maior que seja esse esforo para manter toc
das as condies experimentais o mais constantes poss
co
veis, os valores obtidos nas repetioes
c
dos tratamentos dicilmente resultam em valores iguais, quase com certeza absoluta que
e
todos os valores vo diferir uns dos outros. Pode-se concluir que sempre vo existir variaoes.
a
a
c
Logo, um pequisador no pode armar com 100% de certeza que o tratamento A melhor
a
e
que o B, e assim por diante. Portanto, todas as concluses tomadas, ou as inferncias reo
e
alizadas, so feitas com certo grau de incerteza; essa incerteza ns expressamos em termos
a
o
de probabilidade. Ento, quando um pesquisador diz que o tratamento A melhor que o B,
a
e
ao n de signicncia de 5%, ele admite que pode estar tomando uma deciso errnea e
vel
a
a
o
que a probabilidade de erro de no mximo igual a 5%. Estes experimentos cujos resultae
a
dos podem no ser os mesmos, de repetio para repetiao, so chamados de experimentos
a
ca
c
a
aleatrios, probabilsticos ou estocsticos.
o

a
Todas as inferncias realizadas tem certo grau de incerteza expressadas por
e
probabilidades.
2

Gregor Johann Mendel, botnico da Morvia.


a
a

114

7
T3

24
2

20
8
T1

42
3

T5

T5

T1

T6

T2

T6

T6

T3
14

T5

T3

T1

T1
23
35

T6
20
30

T5
19

T2
14
34

9
29

15
24

23

T5

T1

T4

T4
24
33

25
28

21
23

11
18

T1

T6

T2

T3
18
32

26
27

9
22

14
7

18
12

T3

T4

31
T5

19
26

11
21

13
16

14
11

21
6

T6

T2

25
T2

26
20

13
15

20
10

35
5

19
T3

12
14

22
9

10
4

13
T4

T4
15
36

T4
20

T2
21

Figura 3.1: No canto superior esquerdo est indicado a unidade experimental; no centro `
a
a
direita o tratamento e, no canto inferior esquerdo, est indicado o nmero de brotos por
a
u
explante
A seguir apresentamos um exemplo de um experimento no delineamento inteiramente
casualizado.
Avaliao do Comportamento In Vitro de abacaxi Ananas comosus cv.
ca
Primavera
Objetivo: determinao de um meio de cultura onde produza um maior nmero de mudas
ca
u
por explante (meristema) inoculado.
Tratamentos:
Meio de cultura 1 (T1)
Meio de cultura 2 (T2)
Meio de cultura 3 (T3)
Meio de cultura 4 (T4)
Meio de cultura 5 (T5)
Meio de cultura 6 (T6)
Unidade experimental: Um tubo de ensaio.
Variveis observadas: 1) nmero de brotos por explante inoculado; 2) tamanho dos brotos
a
u
em cm; 3) nmero de folhas por broto, etc.
u
Delineamento Experimental: delineamento inteiramente casualizado com 20 repeties.
co
Obs: na gura 3.1 apresentamos esse delineamento utilizando somente os resultados de 6
repetioes. Condies experimentais controladas ao mximo: Temperatura de 24 C 1 C ;
c
co
a
fotoper
odo de 16hs luz; intensidade luminosa de 4000 lux, meristemas uniformes (tamanho).

115

Independente de qual seja a aplicaao, observa-se que quando utiliza-se do clculo de


c
a
probabilidade existe sempre um elemento do acaso, aleatrio ou de incerteza, quanto a
o
ocorrncia ou no de um evento, fenmeno futuro. Assim sendo, parece improvvel, em
e
a
o
a
muitas situaoes , armar por antecipao, o que vai ocorrer, mas perfeitamente poss
c
ca
e
vel
quanticar quo provvel a ocorrncia de determinado evento, fenmeno futuro.
a
a
e
e
o
As probabilidades so utilizadas para exprimir a chance de ocorrncia de
a
e
determinado evento.

3.2

Conceitos Fundamentais

Inicialmente, interessante denirmos a notao a ser utilizada para representar algum


e
ca
fato, fenmeno. Existe uma relaao entre a teoria dos conjuntos e a teoria das probabilio
c
dades, assim, ser utilizada a notao e s
a
ca
mbolos da teoria dos conjuntos. Os conjuntos so
a
representados por letras maisculas e os seus elementos, so colocados entre chaves (A={a,
u
a
e, i, o, u }).
H duas maneiras pelas quais se pode descrever os elementos de um conjunto:
a
1 ) Consiste em relacionar todos os elementos do conjunto, ou um nmero suu
ciente deles.
Exemplo: desejamos representar os h
bridos de milho, de ciclo tardio, recomendados para
a regio de Chapec, altitude menor que 800m da safra 1988/89.
a
o
A={C125, AG28, AG35, SAVE, 342-A, C408, AG401, C317}.
Outro exemplo: principais espcies do genro Biomphalaria em Santa Catarina.
e
e
B={ B.straminea; B.glabrata; B.tenagophila };
2 ) Consiste em formular uma regra que dena a(s) caracter
stica(s) comum(ns)
aos membros do conjunto. Exemplos:
A={Todos os gneros de formigas da fam Formicidae};
e
lia
B={Todas as espcies do gnero Biomphalaria};
e
e
C={Todas as plantas que produzem O2 };
D={Todas as espcies da fam das Solanaceas};
e
lia

116

AA

AA

gentipos

Aa

Aa

AA

Aa

zigotos

Figura 3.2: Resultados do cruzamento de gentipos


o
E={Espcies do gnero Biomphalaria que so hospedeiras intermedirias do Schistossoma
e
e
a
a
mansoni };
Essa notaao ser utlilizada para representar espaos amostrais e eventos.
c
a
c
Inicialmente, dissemos que no necessrio vericar diretamente o fenmeno para ena e
a
o
tender o seu comportamento, a sua variabilidade, enm, a sua distribuiao de freqncias e,
c
ue
sim, que poss
e
vel, fazendo-se algumas suposioes adequadas, criar um modelo terico que
c
o
represente muito bem essa distribuiao, so os chamados modelos probabil
c a
sticos. Vamos ver
a construao de mais um modelo de probabilidade.
c
Exemplo: Se cruzarmos indiv
duos de gentipos AA e Aa. Queremos estudar as proo
poroes dos resultados desse cruzamento. O gene A de um indiv
c
duo AA encontra o gene A
ou o gene a de um indiv
duo Aa. As clulas fertilizadas tem gentipo AA e Aa, conforme
e
o
gura 3.2. Observamos:
o
a a
1 ) Que s existem essas duas possibilidades, pois Aa e aA no so ordenados.
2 ) No existe razo nenhuma para admitir que um dos dois resultados ocorra
a
a
com maior frequncia, sendo assim, teremos o seguinte modelo terico de frequncias para o
e
o
e
experimento,
Cruzamentos
AA Aa Total
Frequncia terica
e
o

1/2

1/2

O espao dos resultados desse experimento, ou simplesmente, espao amostral, represenc


c
tado pela letra grega (mega), ca:
o
= {AA, Aa}.
As vezes o espao amostral representado pela letra S. Portanto, espao amostral, o conc
e
c
e
junto de todos os resultados poss
veis do experimento. Cada um dos elementos, observaoes
c
que compem chama-se de ponto amostral.
o
Agora, suponha que para o espao amostral, = {AA, Aa}, estamos interessados no
c
evento homozigoto, ento, temos:
a
A = {AA}.

117

Poder
amos tambm estar interessados no evento heterozigoto, ento, temos:
e
a
B = {Aa}.
Portanto, eventos so subconjuntos do espao amostral, , ou seja, um conjunto de
a
c
e
resultados de um experimento. Se um evento coincide com o espao amostral, , ele se
c
chama evento certo e temos,
A =
A = {AA, Aa}
A evento dos fentipos com dominncia.
o
a
Observaao: o alelo A dominante sobre a, portanto, Aa tem o mesmo fentipo que AA.
c
e
o
Se um evento no possui nenhum elemento do espao amostral, temos o evento imposs
a
c
vel,
A = (phi).
Exemplo: D={homozigoto recessivo}={aa}.
Quando o evento constitu de apenas um elemento temos o evento simples. Como
e
do
exemplos temos os eventos A e B.
Do exemplo acima, podemos fazer uma generalizaao. Todo o fenmeno ou experimento
c
o
no qual est envolvido um elemento casual, aleatrio, ou de incerteza, ter seu modelo
a
o
a
de probabilidades.
Um modelo probabil
stico ca denido, especicado, constru no momento em que esdo,
tabelecemos o espao amostral () e as probabilidades dos pontos amostrais; para o exemplo,
c
temos o seguinte modelo probabil
stico:
Cruzamentos

AA

Frequncias tericas
e
o

Aa

1/2 1/2

Total
1

Esse espao amostral discreto, pois podemos enumerar todos os resultados do experimento.
c
e
Essa enumerao pode ser nita ou innita.
ca
Exemplo de modelo. Cruzamos o gentipo Aa (pai) e Aa (me). Os resultados dos
o
a
cruzamentos esto indicados na gura 3.3.
a
Observaoes:
c
1. As quatro recombinaoes AA, Aa, aA e aa so igualmente provveis.
c
a
a

118

Pai
Aa

Aa

espermatozide

zigoto

Me

AA

Aa

vulos

aa

aA

Figura 3.3: Cruzamento de gentipos


o
2. As duas recombinaes Aa e aA no so ordenadas, isto , no poss distingui-las
co
a a
e a e
vel
biologicamente.
Logo, o espao de resultados :
c
e
= {AA, Aa, aa}.
Como as recombinaoes so igualmente provveis, associamos a cada uma delas a probabilc
a
a
idade 1/4, logo, o modelo probabil
stico para o experimento ca:
Cruzamentos

AA

Frequncia terica
e
o

1
4

Aa
1
4

1
4

aa Total
1
2

1
4

Aqui, novamente, o espao amostral discreto.


c
e
Exemplo de modelo: Em tomateiros, vamos fazer o cruzamento entre dois indiv
duos
homozigticos, um sendo recessivo, sp sp , e responsvel pelo hbito de crescimento determio
a
a
nado e o outro dominante, Sp Sp , responsvel pelo hbito de crescimento indeterminado. Em
a
a
F1 obtm-se: Sp sp . Fazendo-se a autofecundaao desses indiv
e
c
duos F1(F1F1), obtm-se as
e
seguintes recombinaes:
co
Sp Sp ; Sp sp ; sp Sp e sp sp
todas com a mesma frequncia terica e igual a 1/4. Veja o quadro:
e
o
F1
F1

Sp

sp

Sp
sp

Sp Sp
sp Sp

Sp sp
sp sp

Observaoes:
c
c
a
a
1. As quatro recombinaoes so igualmente provveis.

119

2. As duas recombinaes, Spsp e spSp, no so ordenadas, no sendo poss diferencico


a a
a
vel
a
las biologicamente.
O modelo probabil
stico ca:
Cruzamentos

Sp Sp

sp Sp

sp sp

Total

Frequncia terica
e
o

1
4

2
4

1
4

Observao: Um espao amostral pode ser denido de diferentes maneiras para um mesmo
ca
c
experimento, dependendo dos objetivos do problema a ser estudado. Por exemplo, suponha
que lancemos uma moeda cinco vezes. Se estamos interessados apenas na sequncia de caras
e
e coroas obtida, um espao amostral :
c
e
1 = {ckkkk, kckkk, kkckk, kkkck, ...}.
Observao: so poss
ca
a
veis 25 =32 pontos amostrais. Mas se estamos interessados no
nmero de caras obtidas, ento, um espao amostral :
u
a
c
e
2 = {0, 1, 2, 3, 4, 5}.
Temos, aqui, outro exemplo de espao amostral discreto.
c
Exemplo: Considere um experimento que consiste em medir as alturas H de homens
adultos. Um espao amostral conveniente :
c
e
= {H : H > 0},
isto , o conjunto de todos os nmeros reais positivos. Se A indica o evento a altura de
e
u
homens adultos superior a 150 cm e inferior a 200 cm, ento A={H:150<H<200}. Esses
e
a
so exemplos de espaos amostrais cont
a
c
nuos, pois o intervalo contm um nmero innito de
e
u
valores.
Outro exemplo: Considere um experimento que consiste em medir as alturas h de
plantas de milho. Um espao amostral conveniente ={h:h>0}, isto , o conjunto de
c
e
e
todos os nmeros reais positivos.
u

3.3

Operaoes com Eventos


c

Como os eventos so subconjuntos do espao amostral , so tambm conjuntos, logo,


a
c
a
e
todas as operaes realizadas com conjuntos so vlidas para os eventos.
co
a a

120

Figura 3.4: Diagrama de Venn para a reunio de eventos


a

Figura 3.5: Diagrama de Venn para a intersecao de eventos


c
Se A e B so dois eventos de , ento, a operaao (AB), que l-se: A unio com B,
a
a
c
e
a
signica a ocorrncia do evento A ou do evento B ou de ambos, ou seja, os pontos amostrais
e
pertencem ao evento A ou ao evento B ou, ainda, a ambos. Essa operaao tambm chamada
c e
e
de reunio dos eventos. A representaao grca dada na gura 3.4. Esta gura chamada
a
c
a
e
e
de Digrama de Venn. Em aritmtica assemelha-se com (A+B).
e
Exemplo: Se A={1,2} e B={1,5,6}, ento (AB)={1,2,5,6}. Observe que o ponto 1
a
ocorre nos dois eventos mas est relacionado uma unica vez. O ponto 2 s ocorre em A e os
a

o
pontos 5 e 6 ocorrem em B.
Uma outra operao entre eventos a interseco, representada pelo s
ca
e
ca
mbolo . Ento,
a
(AB) a ocorrncia dos eventos A e B, simultaneamente, ou seja, formado pelos pontos
e
e
e
amostrais que pertencem ao eventos A e B. Em aritmtica, assemelha-se com o produto
e
(AB). A representaao grca da interseco dada na gura 3.5.
c
a
ca e
Exemplo: Duas fam
lias, por exemplo, solanaceaes (pimenta, pimento, tomate) e mira

121

Figura 3.6: Complementar de um evento


taceaes (goiaba, pitanga, jaboticaba) de uma mesma ordem so por denio disjuntas, isto
a
ca
, no possuem espcies em comum, logo sua interseco vazia, isto , (A B) = .
e a
e
ca e
e
Exemplo: Para os eventos A={1,2} e B={1,5,6}, (AB)={1}.
Indica-se por Ac o complementar do evento A, e signica a no ocorrncia de A. Outra
a
e
forma de representaao A. A representao grca do complemento de um evento dada
c e
ca
a
e
na gura 3.6.
Exemplo: No lanamento de um dado podemos estar interessados no evento saiu face
c

mpar, A={1,3,5}, qual o evento que ocorre sempre que A no ocorre? Resposta: Ac ={2,4,6}.
e
a
Exemplo: Vamos considerar todas as espcies pertencentes a ordem Himenoptera como
e
sendo o espao amostral, . Estamos interessados na fam Formicidae, este o nosso
c
lia
e
evento. Qual ser o complementar desse evento? Consistir de todas as espcies da ordem
a
a
e
Himenoptera, mas no pertencente a fam Formicidae.
a
lia
Algumas outras operaes envolvendo interseco, reunio e complemento so dadas por:
co
ca
a
a
a)
b)
c)
d)
e)
f)

(A B)c = Ac B c (Lei de Morgan);


(A B)c = Ac B c (Lei de Morgan);
A Ac = ;
A Ac = ;
A (B C) = (A B) (A C);
A (B C) = (A B) (A C) (distributiva).

Exerc
cio. Construa os diagramas de Venn para os itens a) e b).

Eventos Mutuamente Exclusivos e Independncia


e
Se dois eventos no podem ocorrer ao mesmo tempo, ou seja, se a ocorrncia de um deles
a
e

122

impede a possibilidade de ocorrncia do outro, so chamados eventos mutuamente exclusivos


e
a
ou disjuntos.
Exemplo: considere os resultados do lanamento de um dado, ={1,2,3,4,5,6}, e os
c
eventos, A={1,3,5} e B={2,4,6}, ento os eventos A e B so mutuamente exclusivos pois
a
a
AB=.
Exemplo: Considere como sendo todas as espcies da ordem Himenoptera, e os eventos
e
A={espcies da fam Formicidae} e B={ espcies da fam Apidae}, ento os eventos A
e
lia
e
lia
a
e B so mutuamente exclusivos, pois AB=.
a
Dois eventos, associados a um experimento aleatrio, so ditos independentes quando a
o
a
ocorrncia de um deles no interfere na ocorrncia do outro.
e
a
e
Exemplo: vamos supor que dois alunos tentem resolver uma mesma questo em sepa
arado, ao mesmo tempo. Os eventos que consistem em que cada um dos alunos acerte a
questo so independentes, pois o fato de um aluno acertar a questo no inuencia no fato
a a
a a
do outro tambm acertar.
e
Outro exemplo: Cegueira e surdez, espera-se que sejam independentes.
Em ensaios agr
colas de campo, as parcelas experimentais so independentes, pois o
a
resultado de uma unidade experimental no interfere no resultado das demais.
a
A deniao de independncia important
c
e
e
ssima em estat
stica. A maioria dos testes,
pressupem independncia entre os eventos, como veremos na seao 8.
o
e
c
Eventos mutuamente exclusivos so independentes? No, eventos mutuamente exclusivos
a
a
so dependentes, pois a ocorrncia de um deles impede a ocorrncia do outro.
a
e
e

3.4

A Probabilidade de Um Evento

Seja qual for o evento, por exemplo, chuva, gentipos homozigticos, produao de uma
o
o
c
cultura, saiu face
mpar ,etc., a probabilidade de um evento A, denotada por P(A) um
e
nmero entre 0 e 1, que indica a chance de ocorrncia de A. Quanto mais prximo de 1
u
e
o
e
P(A) = maior a chance de ocorrncia de A, e quanto mais prxima de 0 P(A) =
e
e
o
e
menor a chance de ocorrncia do evento A. Denio:
e
e
ca
Seja um experimento aleatrio e um espao amostral associado a esse
o
c
experimento. A cada evento A associamos um nmero real representado por P(A)
u
e denominado probabilidade de A, que expressa a chance de ocorrncia de A .
e

123

Sempre temos as seguintes probabilidades: quando o evento imposs


e
vel, A=
P(A)=0; quando o evento certo, A= P(A)=1, portanto:
e
0 P (A) 1 .

3.5

Conceito de Probabilidade

Conceito de Freqncia Relativa


ue
Existem experincias que podem ser repetidas muitas vezes sob condioes quase cone
c
stantes. Sendo assim, observa-se que a freqncia relativa estabiliza em certos valores e
ue
serve como estimativa da probabilidade. Nesse caso incluem-se as experincias genticas,
e
e
muito importante para a rea de biocincias.
a
e
Vamos utilizar um exemplo para ilustrar o conceito de probabilidade baseado na teoria
freqntista.
ue
Vamos considerar o nmero de nascimentos de meninas e meninos, n. O espao de
u
c
resultados ={masc.,fem.}. Neste experimento, vamos supor que estamos interessados no
e
nmero de nascimentos de meninos, n1 , ento, n1 a freqncia absoluta ou simplesmente a
u
a
e
ue
freqncia de nascimentos de meninos. A freqncia absoluta pode ser um nmero qualquer
ue
ue
u
entre 0 n1 n. Mas, como vimos anteriormente, a probabilidade de um evento, um
e
nmero entre 0 e 1. Portanto, para nos aproximarmos do conceito de probabilidade, vamos
u
e
considerar a freqncia relativa, f1 , ento, f1 = n1 , isto ,
ue
a
n
Freqncia relativa de um evento =
ue

freqncia observada do evento


ue
.
nmero total de repetioes do experimento
u
c

Agora, pode-se ver facilmente que a freqncia relativa, varia de 0 a 1 (0 f1 1). A


ue
freqncia relativa freqntemente expressada em percentagem, logo, 0% f1 100%.
ue
e
ue
Se o nmero de repetioes do experimento for muito grande, a freqncia f1 estabiliza em
u
c
ue
certos valores, por exemplo, para n=100.000 nascimentos, temos que f1 = 53%, este valor
e
usado como estimativa da probabilidade, a freqncia relativa converge para a probabilidade.
ue
Existem regras que demonstram como tal estimativa convel.
e
a
Denio: Se aps n repeties de um experimento, com n sucientemente grande, se
ca
o
co
vericar n1 ocorrncias de um evento, ento a probabilidade de ocorrncia desse evento ser
e
a
e
a
a freqncia relativa n1 .
ue
n
Exemplo 1: Se cruzarmos dois indiv
duos com gentipos AA e Aa, o gene A do ino
div
duo AA encontra o gene A ou o gene a do indiv
duo Aa. O espao dos resultados
c

124

desse experimento ={AA,Aa}. Fatores experimentais demonstram que os dois resultados


e
ocorrem com a mesma probabilidade, isto :
e
P (AA) =

1
1
= 50% e P (Aa) = = 50%
2
2

Para completar nosso modelo probabil


stico, duas condioes sempre devem ser respeitadas:
c
1. 0 P (Ei ) 1;
2.

P (Ei )= 1.

Onde, Ei representa um evento qualquer. Como vemos, a probabilidade total do experimento


deve ser igual a 1. Estas duas condies so necessrias, a m de que o nosso modelo seja
co
a
a
consistente com o conceito de freqncia relativa. No exemplo de cruzamentos de indiv
ue
duos,
temos que 0P(AA)1 e a 0P(Aa)1 e P(AA) + P(Aa)=0.5 + 0.5=1.
Exemplo 2: foram colhidas amostras aleatrias de indiv
o
duos de uma populaao e veric
cado os seus grupos sangu
neos: A, B, AB e O. Ento o ={A,B,AB,O}. Foram encontradas
a
as freqncias 40%, 10%, 5%, 45% para os grupos A, B, AB e O, repectivamente, podemos
ue
dizer que a probabilidade de sortear um indiv
duo da populaao com grupo sangu
c
neo A
e
de 40% e assim por diante.
Exerc
cio resolvido: considere o experimento de cruzamentos de gentipos AaAa, e
o
1
1
os eventos A={AA,aa} e B={Aa}, tais que P(A)= 2 , P(B)= 2 e P(A B)=0. Calcular:
a) P (Ac ).
b) P (B c ).
c) P (Ac B c ).
d) P (Ac B c ).
e) P (Ac B)
Soluao:
c
a) 1 P (A) = 1

1
2

= 1.
2

b) 1 P (B) = 1

1
2

= 1.
2

c) P [(A B)c ] = 1 P (A B) = 1 1 = 0.
d) P [(A B)c ] = 1 P (A B) = 1 0 = 1.

125

e)

Como no temos uma operao direta, descrevemos da seguinte forma:


a
ca
B = (A B) (Ac B)
P (B) = P (A B) + P (Ac B)

logo,
P (Ac B) = P (B) P (A B) =

3.6

1
1
0= .
2
2

A Regra da Adio
ca

Introduziremos a noao de adiao de eventos atravs de um exemplo. Considere um


c
c
e
censo realizado nos domic
lios da comunidade polonesa de Dom Pedro, prximo ` Curitiba,
o
a
para se estudar a mortalidade dos residentes na colnia. A mortalidade foi vericada sobre
o
o marido, a mulher, marido e mulher e lhos. Em mdia o estudo foi realizado sobre trs
e
e
geraes. Os dados esto mostrados na tabela 3.2.
co
a
Tabela 3.2: Mortalidade dos residentes na colnia polonesa de Dom Pedro, Curitiba, Paran.
o
a
Idade
Sexo
Total
Masculino(M) Feminino(F)
0 a 1(A)
2 a 4(B)
5 a 9(C)
10 a 14(D)
15 a 29(E)
> 29 (G)

33
4
2
0
1
7

28
7
2
1
6
8

61
11
4
1
7
15

Total

47

52

99

O evento A indica o evento que acontece quando, ocorrer uma morte na colnia, esta
o
pessoa deve ter at um ano de idade. O evento M acontece quando, ocorrer uma morte na
e
colnia, esta pessoa for do sexo masculino. Os demais eventos tem signicados anlogos.
o
a
Sendo assim, a probabilidade de ocorrncia do evento A, isto , a pessoa falecida tiver idade
e
e
entre 0 e 1 ano dada por,
e
P (A) =

61
= 61, 62%.
99

126

A probabilidade de ocorrncia do evento M, isto , a pessoa falecida ser do sexo masculino


e
e
vale,
47
P (M ) =
= 47, 47%.
99
a
E fcil ver tambm que a probabilidade da ocorrncia de A e M, simultaneamente vale,
e
e
P (A M ) =

33
= 33, 33%,
99

isto , temos uma probabilidade de 33,33% da pessoa falecida ser do sexo masculino e ter
e
at um ano de idade.
e
Agora, se desejarmos calcular a probabilidade de ocorrncia de A e/ou de M, isto ,
e
e
P (A M ), como ser o clculo? O resultado ser dado por:
a
a
a
P (A M ) = P (A) + P (M ) P (A M )
P (A M ) = 0, 6162 + 0, 4747 0, 3333
P (A M ) = 0, 7576
P (A M ) = 75, 76%.
Devemos subtrair P (A M ), pois, caso contrrio, estar
a
amos contando duas vezes as
pessoas falecidas do sexo masculino e com idade entre 0 e 1 ano.
De modo geral, se A e B so dois eventos quaisquer, a chamada regra da adio dada
a
ca e
por:
P (A B) = P (A) + P (B) P (A B).
(3.1)
Esta regra vlida para mais do que dois eventos, ou seja, podemos generaliz-la. Por
e a
a
exemplo, para trs eventos: A, B e C, a regra ca:
e
P (A B C) = P (A) + P (B) + P (C) P (A B) P (A C) P (B C) + P (A B C).
Se considerarmos os eventos A e C, a P (A C) calculada do seguinte modo:
e
61
= 0, 6162 = 61, 62%;
99
4
P (C) =
= 0, 040 = 4, 00%;
99
P (A C) = 0, 6162 + 0, 040 = 0, 6562 = 65, 62%,
P (A) =

pois, nesse caso, os eventos A e C so disjuntos ou mutuamente exclusivos, pois se A ocorre,


a
impede a ocorrncia de C, e vice-versa. Nesse caso, ento, A C = , logo P (A C) = 0.
e
a

127

Ento, quando os dois eventos so mutuamente exclusivos, a expresso geral 3.1 se


a
a
a
reduz para,
P (A B) = P (A) + P (B).
Exemplo: considere o lanamento de dois dados, sendo os eventos A={soma dos nmeros
c
u
obtidos igual a 9}, B={nmero do primeiro dado maior ou igual a 4} e C={soma dos nmeros
u
u
menor ou igual a 4}. Enumere os elementos de A, B e C. Obtenha P(AB) e P(AC).
1
1
2
3
4
5
6

1
2
3
4
5
6

1
1
1
1
1
1

2
1
2
3
4
5
6

2
2
2
2
2
2

3
1
2
3
4
5
6

3
3
3
3
3
3

4
1
2
3
4
5
6

4
4
4
4
4
4

5
1
2
3
4
5
6

5
5
5
5
5
5

6
1
2
3
4
5
6

6
6
6
6
6
6

A = {36 45 54 63}
B = {41 42 43 44 45 46 51 52 53 54 55 56 61 62 63 64 65 66}
C = {11 21 12 31 22 13}
4
18
3
19
+

= .
36 36 36
36
4
6
0
10
P (A C) = P (A) + P (C) P (A C) =
+

= .
36 36 36
36

P (A B) = P (A) + P (B) P (A B) =

3.7

Probabilidade Condicional e Independncia


e

Vamos voltar a tabela 3.2 para explicar o que uma probabilidade condicional. Dado
e
que ocorra a morte de uma pessoa com idade entre 0 e 1 ano, a probabilidade dessa pessoa
ser do sexo feminino de 28 = 0,4590= 45,9%. Isto porque de um total de 61 falecimentos
e
61
com idade entre 0 e 1 ano, 28 so do sexo feminino.
a
Representamos uma probabilidade condicional da seguinte forma:
P (Feminino| idade entre 0 e 1 ano) =

28
= 45, 9%.
61

L-se, assim: a probabilidade da pessoa falecida ser do sexo feminino, dado que (|) ela tem
e
idade entre 0 e 1 ano de 45,9%. A barra vertical indica o evento que ocorreu, o evento
e
conhecido, isto , sabe-se que a pessoa falecida tem entre 0 e 1 ano, dado isso, deseja-se
e

128

AB
Figura 3.7: espao reduzido da probabilidade condicional
c
saber qual a probabilidade dela ser do sexo feminino. Podemos agora dar uma deniao
e
c
de probabilidade condicional.
Denio: Para dois eventos quaisquer A e B, associados a um experimento, sendo
ca
P (B) > 0, denimos a probabilidade condicional de A, quando B tiver ocorrido, como
sendo:
P (A B)
P (A|B) =
.
(3.2)
P (B)
Para se entender a expresso 3.2, basta pensar que o espao amostral cou reduzido, ou
a
c
restrito ao evento B. Veja gura 3.7. A presena da interseco no numerador justicada
c
ca
e
facilmente considerando que a ocorrncia de A, quando se sabe que B ocorreu, corresponde
e
` ocorrncia de A e de B simultaneamente, isto , de sua intersecao.
a
e
e
c
Para o exemplo mencionado, se A e F, indicam, respectivamente, os eventos idade entre
0 e 1 ano e sexo feminino, temos:
P (F |A) =

P (F A)
28 99
=
.
P (A)
61 99

Observe que =99, e A=61, sendo que desaparece (simplicaao), portanto, o novo espao
c
c
de resultados A. Assim,
e
28
P (F |A) =
= 45, 9%.
61
De modo geral, sempre que calculamos a P(A), dado que B tenha ocorrido, estamos
sempre calculando a P(A) em relao ao espao amostral reduzido de B, isto , o espao
ca
c
e
c
amostral ca reduzido de para B.
Exemplo: Numa populaao os animais podem ser fecundos e no fecundos. Vinte por
c
a
cento (20%) dos animais da raa X so fecundos; trinta por cento (30%) dos animais da raa
c
a
c
Y so no fecundos e setenta e cinco por cento (75%) dos animais so da raa X. Considere
a a
a
c

129

os eventos:
H={o animal da raa X}
e
c
A={o animal fecundo}
e
Raa
c

M={o animal da raa Y}


e
c
B={o animal no fecundo}
a e
Fecundidade
No Fecundo(B) Fecundo(A)
a

Total

X (H)
Y (M)

60
7,5

15
17,5

75
25

Total

67,5

32,5

100

P (M |A) = P (M A)/P (A);


0, 175
P (M |A) =
= 0, 5384.
0, 325
P (B|M ) = P (B M )/P (M ) = 0, 075/0, 25 = 0, 30 = 30%.
P (A H) = P (A) + P (H) P (A H) = 0, 325 + 0, 75 0, 15 = 0, 925.

Regra do Produto de Probabilidades


Da relaao 3.2 podemos obter a chamada Regra do Produto de Probabilidades, dada por:
c
P (A B) = P (B) P (A|B).

(3.3)

Exemplo: para os dados do exemplo de populaao de animais, temos,


c
P (A H) = P (A|H) P (H) = 0, 20 0, 75 = 0, 15 = 15%.

Um Caso Importante: Independncia


e
Uma situaao especial da frmula acima muito importante. Essa situao ocorre quando
c
o
e
ca
os dois eventos A e B so independentes, isto , quando a ocorrncia do evento A no
a
e
e
a
inuencia na ocorrncia do evento B, e vice-versa. Vamos atravs de um exemplo ilustrar a
e
e
independncia entre eventos.
e
Exemplo: um cientista quer saber se existe dependncia entre a cegueira para as cores
e
e a surdez nos homens. Admite-se as seguintes probabilidades para os eventos :

Cegueira

Surdez
Frequncia
e

Surdez(S) No Surdez(S)
a
total

Cegueira para cores(C)

No Cegueira(C)
a

0,0004
0,0046

0,0796
0,9154

0,0800
0,9200

Frequncia total
e

0,0050

0,9950

1,0000

130

O evento C corresponde a homens com cegueira para cores, e o evento S corresponde a


homens com surdez. Vamos calcular a probabilidade de surdez dado que o evento cegueira
para cores ocorreu:
0, 0004
P (S C)
P (S|C) =
=
= 0, 0050.
P (C)
0, 0800
Por sua vez, a probabilidade de surdez :
e
P (S) = 0, 0050
ento,
a
P (S|C) = P (S),
isto , a surdez independente da cegueira para cores, pois a ocorrncia da cegueira para
e
e
e
cores no alterou a probabilidade de ocorrncia da surdez. Logo, a ocorrncia de um evento
a
e
e
no inuenciou na ocorrncia do outro.
a
e
Generalizando, Se dois eventos so independentes , a P (A | B) = P (A), ento a regra
a
a
do produto de probabilidades ca:
P (A B) = P (A)P (B).
Essa frmula pode ser tomada como deniao de independncia, ou seja, A e B so indeo
c
e
a
pendentes se, e somente se,
P (A B) = P (A)P (B).
(3.4)
Exemplo com dependncia: Uma urna contm duas bolas brancas (B) e trs vermele
e
e
has (V ). Suponha que sorteemos duas bolas ao acaso, em sequncia e sem reposio. Isto
e
ca
signica que escolhemos a primeira bola, vericamos a sua cor e no a devolvemos ` urna,
a
a
misturamos as bolas restantes e retiramos a segunda bola. O diagrama de rvore ilustra
a
as possibilidades, veja gura 3.8. Em cada galho da rvore esto indicadas as probabilia
a
dades de ocorrncia, sendo que para segundas bolas temos probabilidades condicionais. A
e
distribuio de probabilidades do exemplo dada por:
ca
e
Resultados

Probabilidades
21
54
23
54
32
54
32
54

BB
BV
VB
VV
Total

=
=
=
=
1

131

2
20
6
20
6
20
6
20

1/4

B
2\5

3/4

2/4

3/5

2/4

Figura 3.8: diagrama de rvore


a
As probabilidades calculadas no quadro foram obtidas atravs da probabilidade condicional.
e
Por exemplo, a probabilidade de sair branca na primeira e branca na segunda dada por:
e
P (BB) = P (Branca na primeira)P (Branca na segunda | Branca na primeira) = (2/5)(1/4).
Considere os eventos: B1={saiu bola branca na primeira retirada} e B2={saiu bola branca
na segunda retirada}.
2
2
2 5
1
P (B2|B1) =
=
= .
20 5
20 2
4
6
8
2
2
+
=
= .
P (B2) = P (BB) + P (V B) =
20 20
20
5
Portanto, sendo que P (B2|B1) = P (B2), implica que os eventos B1 e B2 so dependentes,
a
pois a ocorrncia de B1 alterou a probabilidade de B2.
e
Os eventos excesso de peso (E) e presso elevada (A), biologicamente so dependentes.
a
a

3.8

Teorema de Bayes

Uma das relaes mais importantes envolvendo probabilidades condicionais dada pelo
co
e
teorema de Bayes, que expressa uma probabilidade condicional em termos de outras probabilidades condicionais e marginais. Vamos apresentar o Teorema de Bayes atravs de um
e
exemplo.
Exemplo. Temos trs prossionais: um Agrnomo, um Bilogo e um Engenheiro Civil.
e
o
o

132

Cada um deles plantou 10 mudas de lamos. Das 10 plantadas pelo Agrnomo 9 sobrea
o
viveram; 5 do Bilogo e 2 do Engenheiro. Escolhe-se uma muda ao acaso, se a muda sobreo
viveu, qual a probabilidade de ela ter sido plantada pelo Engenheiro Civil? Veja a gura
3.9. Queremos encontrar a P (E | S). Sabemos que:
Marginais

Condicionais

P(A)= 10 = 1
30 3
10 1
P(B)= 30 = 3
P(E)= 10 = 1
30 3

P (S | A)=90%
P (S | B)=50%
P (S | E)=20%

As probabilidades marginais so tambm chamadas de probabilidades ` priori. Da denio


a
e
a
ca
de probabilidade condicional, temos:
P (E|S) =

P (E S)
.
P (S)

Mas,
P (E S) = P (E) P (S|E)
Assim:

P (E)P (S|E)
.
(3.5)
P (S)
As probabilidades no numerador sempre sero conhecidas. Precisamos encontrar o valor
a
da probabilidade do denominador, P(S). Como A, B e E so eventos mutuamente exclusivos,
a
e reunidos formam o espao amostral completo, podemos decompor S, na reunio de trs
c
a
e
outros que tambm so mutuamente exclusivos, ou seja:
e
a
P (E|S) =

S = (A S) (B S) (E S)
e ento:
a
P (S) = P (A S) + P (B S) + P (E S)
P (S) = P (A)P (S|A) + P (B)P (S|B) + P (E)P (S|E)

S
NS

(A) Agrnomo
U
U
U
U
U
U
U
U
U

(B) Bilogo
U
U
U
U

(E) Engenheiro
U
U

Figura 3.9: Sobrevivncia de mudas de lamos


e
a

133

Substituindo-se esse resultado em (3.5), obtem-se:


P (E|S) =

P (E)P (S|E)
.
P (A)P (S|A) + P (B)P (S|B) + P (E)P (S|E)

Esse valor conhecido como probabilidade ` posteriori. Assim;


e
a
(1 3) 0, 20
((1 3) 0, 90) + ((1 3) 0, 50) + ((1 3) 0, 20)
0, 06667
0, 06667
P (E|S) =
=
= 0, 1250
0, 30 + 0, 16667 + 0, 06667
0, 5333
P (E|S) = 12, 50%.
P (E|S) =

Generalizando para n eventos.


Seja C1 , C2 , C3 , ..., Cn , uma partio do espao amostral , isto , Ci Cj = para i = j,
ca
c
e
e C1 C2 C3 ... Cn = ; consideramos A um evento qualquer. Tambm so conhecidas
e
a
P (Ci ) e P (A|Ci ) para i = 1, 2, 3, ..., n. Ento, temos:
a
P (Ci |A) =

P (Ci )P (A|Ci )
(3.6)
P (C1 )P (A|C1 ) + P (C2 )P (A|C2 ) + P (C3 )P (A|C3 ) + ... + P (Cn )P (A|Cn )

para i = 1, 2, 3, ..., n.
Exerc
cios resolvidos
1. Num experimento com tomates em casa-de-vegetao, tm-se 26 vasos distribu
ca
e
dos
segundo o seguinte delineamento.
Variedades

Adubos
1 2 3

Total

1
2
3

3 4
1 3
5 2

2
3
3

9
7
10

total

9 9

26

Sorteia-se um adubo (coluna) ao acaso, do qual sorteia-se uma variedade, vericando-se


que ocorreu a variedade 2. Qual a probabilidade de que esta variedade esteja sendo tratada
com o adubo 1?
Sejam os eventos:
A1 = ocorrer o adubo 1;
A2 = ocorrer o adubo 2;
A3 = ocorrer o adubo 3;
B2 = ocorrer a variedade 2.

134

Verica-se que: A1 A2 A3= e A1 A2 A3=S.


Marginais

Condicionais

9
P(A1)= 26
9
P(A2)= 26
8
P(A3)= 26

P (B2 | A1) =
P (B2 | A2) =
P (B2 | A3) =

1
9
3
9
3
8

P (A1)P (B2|A1)
P (A1)P (B2|A1) + P (A2)P (B2|A2) + P (A3)P (B2|A3)
1
P (A1 | B2) = .
7
2. (Beiguelman) A freqncia esperada de pessoas Rh+ em uma populao estimada
ue
ca e
em 90%. Qual a freqncia esperada, nessa populaao de casais:
ue
c
P (A1 | B2) =

a) Rh+ Rh+
0, 90 0, 90 =

(Rh+
0, 81

e Rh+ )?
= 81%;

b) Rh Rh
0, 10 0, 10 =

(Rh
0, 01

e Rh )?
= 1%;

c) Rh+
H
0, 90
M
0, 90

0, 09

Rh
M
0, 10 =
H
0, 10 =

d) M arido Rh+
0, 90
e) M arido Rh
0, 10

0, 09
=
Resultado =

9%
9%
18%;

M ulher Rh

0, 10
= 0, 09 = 9%;
M ulher Rh+

0, 90
= 0, 09 = 9%.

Observaao: os fatores so independentes do sexo.


c
a
3. (Beiguelman) Numa populaao a freqncia de indiv
c
ue
duos Rh estimada em 16%, a
e
de Rh+ portadores do gene responsvel pelo grupo Rh estimada em 48%, e a de Rh+ no
a
e
a
portadores desse gene em 36%. Qual a probabilidade de um indiv
duo Rh+ dessa populao
ca
ser portador do gene que determina o grupo Rh ?
A = {indiv
duo ser Rh+ }
B = {indiv
duo Rh+ e portador do gene que determina o grupo Rh }

135

P (A) =
P (B|A) =

0, 48
P (AB)
P (A)

+ 0, 36 = 0, 84
= 0,48 = 0, 5714
0,84

4. (Beiguelman) Entre os casais Rh+ e Rh+ da questo anterior, qual a proporao


a
c
esperada daqueles capazes de gerar um(a) lho(a) Rh ?
Observaao: O casal (homen e mulher) tem que ser portador do gene responsvel pelo grupo
c
a
Rh . Logo, 0,5714 0,5714 = 0,3265 = 32,65%.
5. Dena um espao amostral para cada um dos seguintes experimentos aleatrios:
c
o
a) Investigam-se fam
lias com quatro crianas, anotando-se a conguraao segundo o
c
c
sexo.
R: {MMMM, MMMF, MMFM,MFMM,...,FFFF}. Temos um total de 24 = 16 eventos.
b) Trs jogadores A, B e C disputam um torneio de tnis. Inicialmente, A joga com B
e
e
e o vencedor joga com C, e assim por diante. O torneio termina quando um jogador ganha
duas vezes em seguida ou quando so disputadas, ao todo, quatro partidas.
a
R: {AA, ACC, ACBB, BB, BCC, BCAA, ACBA, BCAB}.
c)Lance um dado at que a face 5 aparea pela primeira vez.
e
c
R: {5, F5, FF5, FFF5, FFFF5,.....}, onde F=face diferente de 5.
d) De todos os alunos do curso de estat
stica, escolhe-se um ao acaso e anota-se a sua
altura.
R: {h | 1, 50 h 2,00} onde h a altura.
e
6. Uma gua contaminada se forem encontrados bacilos tipo A e/ou bacilos tipo B
a
e
e C simultaneamente. As probabilidades de se encontrarem bacilos tipo A, B e C so,
a
respectivamente, 0,30; 0,20 e 0,80. Existindo bacilos tipo A no existiro bacilos tipo B.
a
a
Existindo bacilos tipo B, a probabilidade de existirem bacilos tipo C reduzida ` metade.
e
a
Calcular:
a) P(BC);
b) P(gua ser contaminada);
a
c) P(B|gua contaminada).
a
R:
P (A)
= 0, 30
P (B)
= 0, 20
P (C)
= 0, 80
P (B | A) =
P (C | B) = 0, 40

136

a)

b)

c)

3.9

P (B C)

=
P (B) + P (C) P (B C)
=
0, 20 + 0, 80 (0, 2 0, 40)
=
1 0, 08
=
0, 92
P (contaminada)
=
P (A (B C))
=
P (A) + P (B C) P [A (B C)]
=
0, 30 + 0, 08 0, 00
=
0, 38
P (B | contaminada) = P (B contaminada) P (contaminada)
=
P (B C) 0, 38
=
0, 08 0, 38
=
0, 21

Exerc
cios Propostos

1. Num levantamento em um munic


pio sobre a propriedade da terra e o tamanho do
estabelecimento agr
cola encontrou-se a seguinte situao:
ca
45 agricultores proprietrios com estabelecimentos menores que 50 hectares
a
10 agricultores arrendatrios com estabelecimentos menores que 50 hectares
a
15 agricultores proprietrios com estabelecimentos maiores que 50 hectares
a
2 agricultores arrendatrios com estabelecimentos maiores que 50 hectares
a
Ao escolher ao acaso algum agricultor do munic
pio, qual a probabilidade de que:
e
a) o estabelecimento agr
cola tenha menos de 50 hectares?
b) o agricultor seja arrendatrio e o estabelecimento agr
a
cola menor de 50 hectares?
2. Em um experimento semeiam-se 4 blocos de 5 parcelas cada, com algodo. Em cada
a
bloco, aparecem as variedades A, B, C, D e E, portanto, cada bloco contm 5 parcelas, uma
e
para cada variedade, e estas sero designadas as parcelas atravs de um sorteio. Veja gura
a
e
3.10. Observe que a construao dos blocos controla a diferena de fertilidade do solo. Assim,
c
c
podemos estudar o efeito das variedades livre do efeito da fertilidade. Em todos os blocos
a variedade C foi a mais produtiva. Qual a probabilidade de que isso tenha ocorrido por
acaso, ou seja, as cinco variedades so igualmente produtivas e a variedade C foi a mais
a
produtivas devido a fatores aleatrios no experimento? Qual a suposiao feita? Observao:
o
c
ca
outra situao de uso do delineamento em blocos completos ao acaso, com germinador de
ca
e

137

Bloco 1

Bloco 2

Bloco 3

Fertilidade

Bloco 4

+
c
Figura 3.10: Delineamento blocos ao acaso
sementes. Para controlar diferenas de temperatura e luminosidade dentro do germinador,
c
consideramos cada prateleira como um bloco.
3. No experimento anterior, suponha-se que a variedade C foi a mais produtiva em 3
blocos e teve o 2 lugar no outro bloco. Qual a probabilidade de ela se destacar igualmente
ou mais do que nesse ensaio por simples acaso? Qual a suposiao feita?
c
4. Em um certo locus podem ocorrer dois alelos C e D. Admitamos que os poss
veis
gentipos tm as seguintes probabilidades:
o
e
P (CC) = 0, 46; P (CD) = 0, 31; P (DD) = 0, 23.
Qual a probabilidade de que um gentipo contenha:
e
o
a) o alelo C?
b) o alelo D?
c) Qual a suposiao feita em a) e b)?
c
5. Em um locus de um certo par de cromossomos, podem ocorrer alelos A e a. Os
gentipos AA, Aa, aa tm probabilidades:
o
e
PAA = 0, 11; PAa = 0, 37; Paa = 0, 52.
Em um locus de outro par de cromossomos, podem ocorrer os alelos B e b. Os gentipos
o
BB, Bb, bb tm as probabilidades:
e
PBB = 0, 35; PBb = 0, 25; Pbb = 0, 40.
Encontrar as probabilidades de combinaoes genticas:
c
e
a) AA junto com BB, isto AA e BB.
e

138

b) Aa junto com Bb, isto Aa e Bb.


e
c) Qual a suposiao feita?
c
6. Um homen visita um casal que tem dois lhos. Uma das crianas, um menino, vem a
c
sala. Encontre a probabilidade, de o outro tambm ser um menino, se:
e
a) sabe-se que a outra criana mais nova; observao: construa o espao amostral de
c e
ca
c
um casal que tem dois lhos de acordo com o sexo dos mesmos, e considere a ordem de
nascimento.
b) nada se sabe sobre a outra criana.
c
OBSERVACAO: construa o espao de resultados para um casal com dois lhos.

c
7. Numa certa cidade, 40% da populaao tem cabelos castanhos, 25% olhos castanhos e
c
15% tem cabelos e olhos castanhos. Uma pessoa da cidade selecionada aleatoriamente.
e
a) Se ela tem cabelos castanhos, qual a probabilidade de ter tambm olhos castanhos?
e
e
b) Se ela tem olhos castanhos, qual a probabilidade de no ter cabelos castanhos?
e
a
c) Qual a probabilidade de no ter nem cabelos nem olhos castanhos?
e
a
8. Um lote formado por 10 animais sadios, 4 com problemas menores e 2 com problemas
e
graves. Todos os animais so numerados e feita a escolha de um animal ao acaso. Ache a
a
e
probabilidade de que:
a) ele no tenha problemas;
a
b) ele no tenha problemas graves;
a
c) ele ou seja sadio ou tenha problemas graves.
9. Se do lote de animais descritos no problema 8, dois animais forem escolhidos (sem
reposiao), ache a probabilidade de que:
c
a) ambos sejam sadios;
b) ao menos um seja sadio;
c) no mximo um seja sadio;
a
d) exatamente um seja sadio;
e) nenhum deles seja sadio.
10. Tem-se um pacote com 20 sementes, 8 das quais tem um alto poder germinativo
(germinam), e 12 no germinam. As sementes so analisadas uma aps a outra. Se essas
a
a
o
sementes forem extra
das ao acaso, sem reposiao, qual ser a probabilidade de que:
c
a
a) as duas primeiras sementes no germinam;
a
b)as duas primeiras sementes germinam;
c) das duas primeiras sementes analisadas, uma germina e a outra no germina;
a
OBS: Estes eventos no so independentes.
a a
11. Um enxerto tem a probabilidade de sobreviver duas vezes maior do que no sobrea

139

viver. Plantados trs enxertos, qual a probabilidade de exatamente dois sobreviverem?


e
12. De trs eventos A, B e C, suponhamos A e B independentes, B e C mutuamente
e
exclusivos. Suas probabilidades so:
a
P(A)=0,50,

P(B)=0,30 e P(C)=0,10.

Calcular as probabilidades de:


a) B e C ocorrerem (ambos);
b) ocorrer ao menos um dentre A e B;
c) B no ocorrer;
a
d) ocorrerem os trs.
e
13. Um produtor aceitar um lote com 100 sacos de sementes scalizadas, se uma amostra
a
de 5 sacos escolhidos ao acaso do lote e inspecionada, no contenha nenhum com poder
a
germinativo inferior ao especicado. Qual a probabilidade que ele aceite o lote se este
e
contm 10 sacos com poder germinativo abaixo do especicado?
e
14. Suponha que a probabilidade de se pegar gripe durante uma epidemia seja de 0,60.
A experincia tem mostrado que uma vacina vem tendo sucesso de 80% na prevenao da
e
c
gripe, quando aplicada em pessoas expostas a uma epidemia. Uma pessoa no vacinada tem
a
probabilidade de 0,90 de pegar gripe, quando exposta a uma epidemia. Duas pessoas, uma
vacinada e outra no, viajam a negcio. Suponha que elas no vo para o mesmo lugar, no
a
o
a a
a
vo estar em contato com as mesmas pessoas e no vo se encontrar (independentes). Qual
a
a a
a probabilidade de que pelo menos uma delas que gripada?
e
15. Num experimento gentico feito um cruzamento com Drosophila, no qual ese
e
e
e
a
a
stica chamada olhos
perado que 1 das prognies tero olhos brancos e 1 tero a caracter
4
2
vermelhos. Assume que os dois locus gnicos segregam independentemente.
e
a) Qual a proporao de prognies deveriam exibir ambas as caracter
c
e
sticas simultaneamente?
b) Se 4 moscas so amostradas aleatoriamente, qual a probabilidade de todas serem olhos
a
e
brancos?
c) Qual a probabilidade que nenhuma das 4 moscas tenham olhos brancos ou olhos
e
vermelhos?
d) Se duas moscas so amostradas, qual a probabilidade que pelo menos uma das moscas
a
e
tm olhos brancos ou vermelhos ou ambas as caracter
e
sticas?
16. Uma empresa de sementes scalizadas, vende pacotes com 20 Kg cada. As mquinas
a
A, B e C enchem 25, 35 e 40% do total produzido, respectivamente. Da produo de cada
ca
mquina 5, 4 e 2%, respectivamente, so pacotes fora do peso aceitvel. Escolhe-se ao acaso
a
a
a
um pacote e verica-se que est fora do peso aceitvel. Qual a probabilidade de que o pacote
a
a
venha da mquina A?
a

140

Tabela 3.3: Fecundidade de duas raas su


c
nas
Raas
c
Fecundidade

Fecundas (F) No fecundas (F )


a
Total
A (A)
B (B)

12 0,42857
8 0,28571

2 0,07143
6 0,21428

14 0,5000
14 0,5000

Total

20 0,71428

8 0,28572

28 1,0000

17. Se ambos os pais tem gentipo Aa (heterozigotos), seus lhos tem gentipos AA, Aa
o
o
e aa com probabilidades
1
P (AA) = 1 , P (Aa) = 1 , P (aa) = 4 .
4
2

Qual a probabilidade de que dentre quatro crianas:


c
a) pelo menos uma tenha o gentipo aa.
o
b) Qual o nmero esperado de crianas com gentipo Aa?
u
c
o
18. Em uma maternidade de Florianpolis nasceram em um determinado ms 220
o
e
crianas. No mesmo per
c
odo nasceram em uma maternidade de Chapec 197 crianas. Do
o
c
total de 417 recm-nascidos nessas maternidades, 217 eram do sexo masculino e 200 eram
e
do sexo feminino. Se a proporao de meninos e meninas entre os recm-nascidos for indec
e
pendente da sua procedncia (as variveis sexo e procedncia so independentes), qual o
e
a
e
a
nmero esperado de meninos e de meninas em cada um das maternidades durante o per
u
odo
em anlise?
a
19. O estudo de uma tribo no Brasil revelou que 75% tinha sangue tipo A e o restante
tinha sangue tipo O. Sessenta por cento (60%) de toda a populao tinha fator Rh , enquanto
ca
+
30% tinha Rh e sangue tipo A. Usando estas informaoes, encontre a probabilidade de que
c
um membro da tribo tenha:
a) Sangue tipo A ou Rh+ .
b) Sangue tipo A e Rh .
c) Rh+ mas no sangue tipo A.
a
d) Sangue tipo O e Rh .
20. Num estudo sobre fecundidade de duas raas su
c
nas, foram examinados 14 animais
de cada raa, obtendo-se o resultado exposto na tabela 3.3. a) A fecundidade independente
c
e
da raa? Justique atravs da deniao de independncia de eventos.
c
e
c
e
b) Qual a P (F | A)? e c) P (F A)?
e

141

Modelos de Probabilidades para Variveis Aleatrias


a
o
Discretas

4.1

Introduo
ca

At aqui introduzimos alguns modelos probabil


e
sticos para experimentos simples, isto ,
e
experimentos cujos os espaos de resultados () so simples. Esta teoria bsica de probabilc
a
a
idade foi importante para uma boa compreenso do que probabilidade e, tambm, para o
a
e
e
conhecimento de algumas propriedades e regras as quais so uteis no estudo, por exemplo, de
a
gentica. Para variveis qualitativas, os modelos vistos na seao anterior se adaptam muito
e
a
c
bem .
No estudo de Anlise Exploratria de Dados, tivemos contato com diversas variveis
a
o
a
obtidas de experimentos reais, como por exemplo, rendimento de gros de h
a
bridos de milho
em kg/ha, nmero de dias da emergncia ` oraao (ciclo da cultura), altura de plantas,
u
e
a
c
nmero de plantas sadias colhidas na rea util de uma parcela, nmero de microncleos em
u
a

u
u
5000 clulas de peixes do tipo bagre, dimetro de Paepalanthus. Para atender estas situaes
e
a
co
prticas mais gerais, precisamos ampliar os conceitos bsicos vistos at o momento, para que
a
a
e
tenhamos modelos probabil
sticos que representem todos os tipos de variveis vistas at aqui.
a
e
Em outras palavras, precisamos sosticar mais nossos modelos.
Inicialmente, dada a sua maior simplicidade estudaremos os modelos para variveis
a
aleatrias discretas. Alguns exemplos de variveis aleatrias discretas so: nmero de plano
a
o
a
u
tas sadias (ou doentes) numa unidade experimental, nmero de insetos capturados numa aru
madilha, nmero de brotos por explante, nmero de sementes que germinam numa amostra
u
u
de 400 sementes, proporao de enxertos sobreviventes. J os modelos para variveis cont
c
a
a
nuas
necessitaro de um artif matemtico, que consiste na generalizao do conceito de hisa
cio
a
ca
tograma, estudado na anlise exploratria de dados. Esta generalizaao consiste em se fazer
a
o
c
o nmero de classes tender para o innito e ser estudado no prximo cap
u
a
o
tulo.
Do ponto de vista prtico, desejvel que se dena uma varivel associada a um experia
e
a
a
mento, de tal modo que seus resultados sejam numricos. Vejamos alguns exemplos.
e
Exemplo 1. No caso de um questionrio, e as respostas poss
a
veis so sim ou no,
a
a
podemos associar uma varivel que toma os valores 1 para sim e 0 para no.
a
a
Exemplo 2. Num estudo sobre sobrevivncia de enxertos em ameixeiras, temos duas
e
possibilidades, o exerto sobrevive ou morre, podemos atribuir o valor 1 para sobrevive e 0
para morte. Uma razo para isto, que os recursos dispon
a
e
veis para a anlise estat
a
stica

142

BV

BV

BB

BV

VB

VV

Figura 4.1: Experimento gentico com ores de ervilhas


e
das variveis quantitativas so maiores, mais amplas do que para variveis qualitativas. Isto
a
a
a
sugere o uso de artif
cios para transformar as variveis qualitativas em variveis quantitativas.
a
a
Quando uma varivel apresenta resultados que tendem a variar de uma observaao para
a
c
outra, em razo da variaao do acaso, chama-se varivel aleatria, `s quais iremos associar
a
c
a
o
a
modelos probabil
sticos. Por exemplo, temos as seguintes variveis aleatrias: nmero de
a
o
u
indiv
duos de determinada espcie vegetal encontrados em quadrados de 10m 10m em um
e
campo, a converso alimentar de su
a
nos em crescimento.
Vamos poder vericar at o nal desse curso, a grande importncia da construao de
e
a
c
modelos probabil
sticos para variveis quantitativas.
a

4.2

O Conceito de Varivel Aleatria Discreta e Funo de Proba


o
ca
abilidade

Vamos, agora, atravs de um exemplo, denir o que uma varivel aleatria discreta,
e
e
a
o
funo de probabilidade e distribuio de probabilidade, em termos matemticos.
ca
ca
a
Exemplo: em um experimento gentico com res de ervilhas, os gentipos BB e V V
e
o
o
produzem ptalas das ores de cor branca e vermelha, respectivamente. Em F1, obtemos:
e
BBVV=BV ,
que so ores de cor rosa (gentipo que produz ptalas rosas). Fazendo-se a autofecundaao
a
o
e
c
de ores BV, obtemos os gentipos da gura 4.1.
o
Vamos denir a varivel X como sendo igual ao nmero de alelos V em cada resultado
a
u
da gura 4.1 (gentipos). Os resultados associados pela varivel X, dada a suposiao que
o
a
c
os eventos so igualmente provveis e BV e V B no so ordenados, so:
a
a
a a
a

143


A2
A3

A1

-2

-1

Figura 4.2: Esquema para o signicado de varivel aleatria


a
o

Resultados (eventos)

Probabilidades

xi

BB
BV
VB
VV

1
4
1
4
1
4
1
4

0
1
1
2

Estes resultados so mostrados no esquema da gura 4.2, considerando os eventos A1 =


a
{BB}; A2 = {BV, V B}; A3 = {V V }. Vemos na gura 4.2, pois, que a cada resultado do
experimento (evento), a varivel X=nmero de alelos V em cada gentipo, associa um
a
u
o
valor numrico. Essa associo em matemtica chamada de funo.
e
ca
a
e
ca
Denio: uma varivel aleatria uma funao que associa a todo evento pertencente
ca
a
o e
c
a uma partiao do espao amostral (), um unico nmero real.
c
c

u
Notamos, que a varivel aleatria para ser discreta deve assumir valores em um conjunto
a
o
enumervel (nito ou innito) de pontos do conjunto dos nmeros reais (R).
a
u
Vimos como associar nmeros aos eventos, agora, muito importante que se associe
u
e
probabilidades a estes valores da varivel, isto , como associar a cada valor xi da varivel
a
e
a
aleatria X a sua probabilidade de ocorrncia? Ela dada pela probabilidade de ocorrncia
o
e
e
e
do evento correspondente (eventos equivalentes). Matematicamente, temos:
1
P (X = 0) = P ({BB}) = ,
4
pois, X = 0 se, e somente se, ocorre o evento BB;
P (X = 1) = P ({BV ouV B}) =

144

2
1 1
+ = ,
4 4
4

pois X = 1 se, e somente se, ocorrem eventos BV ou V B.


1
P (X = 2) = P ({V V }) = ,
4
pois X = 2 se, e somente se, ocorre o evento V V .
Agora vamos trabalhar com nmeros, ao invs de conjuntos, isso implica que podemos
u
e
usar funoes, derivadas, integrais, que so muito utilizadas para representar os fenmenos
c
a
o
da natureza.
Na tabela a seguir esquematizamos a distribuio de probabilidades da varivel aleatria
ca
a
o
X (nmero de alelos V em cada gentipo)
u
o
xi

p(xi )

1
4

2
4

1
4

Ao conjunto de pontos [xi ; p(xi )] damos o nome de Distribuio de Probabilidades (Modelo


ca
probabil
stico) da varivel aleatria X.
a
o
importante vericar que, para que haja uma distribuio de probabilidades de uma
E
ca
varivel aleatria discreta X, necessrio que:
a
o
e
a
a)

p(xi ) 0

para todo i;

b)

p(xi ) = 1;

c)

P (X = xi ) = p(xi ).

i=1

Denio: chama-se funo de probabilidade da varivel aleatria discreta X, que asca


ca
a
o
sume os valores x1 , x2 , x3 , ..., xn , a funo p(xi ) que a cada valor de xi associa a sua probaca
bilidade de ocorrncia, isto ,
e
e
p(xi ) = P (X = xi ).
Nas prximas sees vamos mostrar algumas funoes de probabilidades famosas.
o
co
c

4.3

O Valor Esperado de Uma Varivel Aleatria Discreta. Varincia.


a
o
a
Propriedades

Existem caracter
sticas numricas que so muito importantes em uma distribuio de
e
a
ca
probabilidades de uma varivel aleatria, discreta ou cont
a
o
nua. Essas caracter
sticas numricas
e
so os parmetros das distribuioes. Os dois parmetros mais importantes so a mdia e a
a
a
c
a
a
e
varincia.
a

145

A mdia tambm chamada de valor esperado, de esperana matemtica ou de mdia


e
e
e
c
a
e
populacional de uma varivel aleatria, e a sua representao E(X), ou X , a qual l-se: a
a
o
ca e
e
esperana matemtica da varivel aleatria X.
c
a
a
o
Vamos, atravs de alguns exemplos, introduzir o conceito de esperana matemtica.
e
c
a
Exemplo 1. O agricultor produtor de batatas-sementes (exemplo da seo 4.3 quer
ca
saber qual o lucro mdio esperado por caixa da mesma. Vamos supor que:
e
Uma caixa do tipo I (50 < dimetro 60 mm) d um lucro de -30,00 u.m.;
a
a
Uma caixa do tipo II (40 < dimetro 50 mm) d um lucro de 100,00 u.m.;
a
a
Uma caixa do tipo III (28 < dimetro 40 mm) d um lucro de 85,00 u.m.;
a
a
Uma caixa do tipo IV (23 < dimetro 28 mm) d um lucro de -10,00 u.m.
a
a
As probabilidades (estimativas da frequncia relativa) de um agricultor obter uma caixa do
e
tipo:
I 100/500 =
e

0, 20;

II 180/500 =
e

0, 36;

III 140/500 =
e

0, 28;

IV 80/500 =
e

0, 16.

Ento, se chamarmos de X: o lucro por caixa de batata-semente e o lucro mdio por caixa
a
e
de E(X), temos:
X = E(X) = 0, 20(30, 00) + 0, 36(100, 00) + 0, 28(85, 00) + 0, 16(10, 00)
X = E(X) = (6, 00) + 36, 00 + 23, 80 + (1, 6)
X = E(X) = 52, 20 u.m.
Exemplo 2. Considere a produo de pepinos para conserva, qual o lucro mdio esperado
ca
e
pelo agricultor por caixa de pepino? Considere os seguintes valores de lucros para cada uma
das classicaoes:
c
a
1a classe(pepinos de 6 ` 9 cm)
2a classe(pepinos de 9 ` 12 cm)
a
a
3 classe(pepinos maior que 12 cm)
alados

lucro
lucro
lucro
lucro

de
de
de
de

600
500
390
50

u.m./cx.
u.m./cx.
u.m./cx.
u.m./cx

As probabilidades (estimativas de frequncias relativas) de um agricultor obter uma caixa


e

146

do tipo:
1a classe
2a classe
3a classe
alados

300/500 = 0, 60
e
100/500 = 0, 20
e
50/500 = 0, 10
e
50/500 = 0, 10
e
p(xi ) = 1, 0

Ento, se X o lucro por caixa de pepino para conserva e E(X) o lucro mdio esperado
a
e
e
e
por cada caixa, temos que:
X = E(X) = 0, 60(600) + 0, 20(500) + 0, 10(390) + 0, 10(50)
X = E(X) = 360 + 100 + 39 5
X =

E(X) = 494 u.m./cx.

Exemplo 3. Em fam
lias com 4 crianas, vamos admitir, para simplicar, que a proc
porao de crianas que nascem do sexo masculino e feminino 1:1. Seja a varivel aleatria
c
c
e
a
o
X=nmero de meninos em fam
u
lias com quatro crianas. O espao de resultados para
c
c
4
fam
lias com 4 crianas dado por (2 pontos amostrais):
c e
= {F F F F, M F F F, F M F F, F F M F, F F F M, M M F F, M F M F, M F F M,
F M M F, F M F M, F F M M, M M M F, M M F M, M F M M, F M M M, M M M M }.
Os valores que X pode assumir so:
a
X = {0, 1, 2, 3, 4}.
As probabilidades so dadas por:
a
P (X = 0) =

1
;
16

P (X = 1) =

4
;
16

P (X = 2)

6
4
; P (X = 3) = ;
16
16

P (X = 4) =

1
.
16

As probabilidades correspondentes podem ser obtidas pela frmula (funao de probabilo


c
idade):
n 1
P (X = k) =
.
k 2n
Agora, representamos por E(X) ou X , o nmero mdio de meninos em tais fam
u
e
lias.
Qual o valor de E(X)?
e
E(X) = X = (

1
4
6
4
1
0) + ( 1) + ( 2) + ( 3) + ( 4) = 2.
16
16
16
16
16

147

Portanto,
X = E(X) = p1 x1 + p2 x2 + p3 x3 + p4 x4 .
4

X = E(X) =

xi p(xi ).
i=1

Denio: se uma varivel aleatria discreta X, toma os valores x1 , x2 , ..., xn , com as


ca
a
o
probabilidades correspondentes p(x1 ), p(x2 ), ..., p(xn ), ento o seu valor esperado, E(X) ou
a
X ,
e
X = E(X) =
xi p(xi ), onde i = 1, 2, 3, ..., n.
E(X) uma mdia dos valores que a varivel aleatria pode assumir, onde cada valor
e
e
a
o
ponderado pela probabilidade da varivel aleatria ser igual a esse valor. No caso do
e
a
o
agricultor, 494 u.m. o valor esperado do lucro por caixa se ele executar o plantio do pepino
e
um nmero grande de vezes, isto , quando repetir a lavoura de pepino vrias vezes.
u
e
a
A expresso do valor esperado muito semelhante aquela da mdia aritmtica apresena
e
e
e
tada na seao , onde:
c

M e(X) = X =
f i xi .
A distinao entre pi , a probabilidade da varivel aleatria X assumir o valor xi , e fi , a
c
a
o
freqncia relativa do resultado xi , que a primeira corresponde a valores obtidos de um
ue
e
modelo terico ajustado para os dados e, a segunda, corresponde as freqncias observadas
o
ue
da varivel. Como pi e fi tem a mesma interpretaao, todas as medidas e grcos discutidos
a
c
a
no estudo de anlise exploratria de dados para distribuioes de freqncias (fi ), possuem
a
o
c
ue
um correspondente na distrbuio de probabilidades (pi ).
ca
Um segundo parmetro, a varincia de uma distribuio de probabilidade, que mede
a
e
a
ca
o grau de disperso (ou de concentraao) de probabilidades em torno da mdia verdadeira.
a
c
e
Quanto menor a varincia, maior o grau de concentraao das probabilidades em torno da
a
c
mdia e vice-versa, quanto maior a varincia, maior o grau de disperso das probabilidades
e
a
a
em torno da mdia.
e
Chamamos de varincia de X ao valor:
a
2
X =

[xi E(X)]2 p(xi ) =

p(xi )x2
i

Demonstrao:
ca
n
2
X

[xi E(X)]2 p(xi )

=
i=1

148

p(xi )xi

= E(X 2 ) [E(X)]2 .

x2 2xi E(X) + [E(X)]2 p(xi )


i

=
i=1
n

x2 p(xi )
i

2E(X)

i=1

i=1
2

x2 p(xi ) 2
i

xi p(xi )

xi p(xi )
i=1

x2 p(xi )
i

i=1
2

i=1

i=1

p(xi )

xi p(xi ) + [E(X)]

xi p(xi )

i=1

i=1

= E(X 2 ) [E(X)]2 .
O resultado acima foi obtido com as restrioes:
c
n

p(xi ) = 1

E(X) =

i=1

xi p(xi ).
i=1

Outra expresso para a varincia de X dada por:


a
a
e
2
X = E[X E(X)]2 .

Para contornar o problema da unidade elevada ao quadrado, denimos o desvio padro,


a
2
X .

X =

Para o exemplo do lucro por caixa de batata-semente, temos:


xi (lucro)

p(xi )

x2
i

p(xi )x2
i

-30,00
100,00
85,00
-10,00

0,20
0,36
0,28
0,16

900,00
10.000,00
7.225,00
100,00

180
3.600
2.023
16

Total

1,00

5819

Logo:
2
X = 5819 [52, 20]2
2
X = 3.094 u.m.2

e o valor do desvio padro :


a e
X = D.P.(X) =

3.094, 16

X = D.P.(X) = 55, 63 u.m..

149

Para o exemplo da varivel lucro esperado por caixa de pepino para conserva, temos:
a
2
X = 281.400 [494]2
2
X = 37.364 u.m.2 /cx.

O desvio padro ca:


a
= =

37.364

= = 193, 29 u.m./cx.
Para o exemplo da varivel do nmero de meninos em fam com quatro crianas, temos:
a
u
lia
c
2
X = 5 22 = 1 menino2 .

2
X =
X = 1 = 1 menino.

Algumas Propriedades da Esperana Matemtica e da


c
a
Varincia
a
1) Seja K uma constante, temos que E(K) = K.
Demonstrao:
ca
n

E(K) =

Kp(xi )
i=1
n

= K

p(xi )
i=1

= K(1) = K.
2) Sejam K uma constante e X uma varivel aleatria, temos que: E(KX) = KE(X).
a
o
Demonstrao:
ca
n

Kxi p(xi )

E(KX) =
i=1

= K

xi p(xi )
i=1

= KE(X).

150

3) Sejam X e Y duas variveis aleatrias, temos que: E(X Y ) = E(X) E(Y ).


a
o
Demonstrao: para facilitar o entendimento da demonstrao construimos a tabela a seguir.
ca
ca
Y
x1 = 0
y1 =1
y2 =2
y3 =3
p(x)

X
x2 = 1

x3 = 2

3/20
1/20
4/20
8/20

3/20
1/20
1/20
5/20

2/20
2/20
3/20
7/20

p(y)

E(X Y ) =

(xi yj )p(xi , yj )
i=1 j=1
m
n

xi p(xi , yj )
i=1 j=1
m
n

yj p(xi , yj )
i=1 j=1
n
m

xi
i=1

Agora, para um i xo,

8/20
4/20
8/20
1,00

p(xi , yj )
j=1

yj
j=1

p(xi , yj ).
i=1

p(xi , yj ) = p(xi )
j=1

e, para j xo,

p(xi, yj ) = p(yj ),
i=1

logo, podemos escrever:


m

E(X Y ) =

xi p(xi )
i=1

yj p(yj )
j=1

E(X Y ) = E(X) E(Y ).


Exemplo. Deve-se escolher um homen dentre um grupo de homens. O peso mdio no
e
grupo de H = 79 Kg, com desvio padro de H = 10 Kg. Uma mulher deve ser escolhida
e
a
de um grupo de mulheres com peso mdio de M = 65 Kg e desvio padro de M = 7 Kg.
e
a
Determine a E(XH + XM ) e a varincia V ar(XH + XM ) dos pesos combinados de um homen
a
e de uma mulher.
E(XH + XM ) = H + M

151

= 79 + 65 = 144Kg.
2
2
2
XH +XM = XH + XM (XH independente de XM )

= 100 + 49 = 149Kg 2 .

149 = 74, 5 kg.


=

XH +XM

4) Se X e Y so variveis aleatrias independentes, ento:


a
a
o
a
E(XY ) = E(X)E(Y ).
Demonstrao:
ca
m

E(XY ) =

xi yj p(xi , yj )
i=1 j=1
n
m

xi yj p(xi )p(yj )
i=1 j=1
m

xi p(xi )
i=1

yj p(yj )
j=1

= E(X)E(Y ).
5) V ar(K) = 0.
Demonstrao:
ca
V ar(K) = E(K 2 ) [E(K)]2
= K2 K2
V ar(K) = 0.
6) V ar(KX) = K 2 V ar(X).
Demonstrao:
ca
V ar(KX) = E(K 2 X 2 ) [E(KX)]2
= K 2 E(X 2 ) [KE(X)]2
= K 2 E(X 2 ) K 2 [E(X)]2
= K 2 {E(X 2 ) [E(X)]2 }
= K 2 V ar(X).
Denio: Se X e Y so duas variveis aleatrias, a covarincia de X e Y denida por:
ca
a
a
o
a
e
Cov(X, Y ) = E[(X E(X))(Y E(Y ))] = E(XY ) E(X)E(Y ),

152

ou seja, o valor mdio do produto dos desvios de X e Y em relaao aos seus valores mdios.
e
c
e
A covarincia uma medida de associaao entre X e Y .
a
e
c
Demonstrao:
ca
m

Cov(X, Y ) =

[xi E(X)][yj E(Y )]p(xi , yj )


i=1 j=1
m
n

Cov(X, Y ) =

xi yj p(xi , yj )
i=1 j=1
m
n

xi E(Y )p(xi , yj )
i=1 j=1
m

i=1 j=1

Por denio:
ca

E(X)yj p(xi , yj ) +

E(X)E(Y )p(xi , yj ).
i=1 j=1

xi yj p(xi , yj ) = E(XY ).
i=1 j=1

Logo,
m

Cov(X, Y ) = E(XY ) E(Y )

xi
i=1

E(X)

p(xi , yj )
j=1

yj
j=1

p(xi , yj ) + E(X)E(Y )
i=1

p(xi , yj )
i=1 j=1

Cov(X, Y ) = E(XY ) E(Y )E(X) E(X)E(Y ) + E(X)E(Y )


Cov(X, Y ) = E(XY ) E(X)E(Y ).
Exemplo: vamos considerar a distribuiao conjunta de probabilidades das variveis
c
a
X=nmero de vagens por planta e Y =nmero de gros por vagem:
u
u
a
Y
2

p(x)

0
1
2

0/15
2/15
0/15

0/15
2/15
1/15

0/15 0/15
3/15 2/15
2/15 1/15

0/15
1/15
1/15

0/15
10/15
5/15

p(y) 2/15

3/15

5/15 3/15

2/15

Inicialmente, deniremos a varivel W = XY e vamos obter a sua distribuio de probabila


ca

153

idades.
W

P(W )

W P(W )

0
1
2
3
4
6
8

2/15
2/15
4/15
2/15
3/15
1/15
1/15

0/15
2/15
8/15
6/15
12/15
6/15
8/15

Temos que: E(X) = 20/15, E(Y ) = 30/15, portanto, COV (X, Y )=(42/15)-(20/15)(30/15)
= (42/15)-(588/225) = 2,8-2,6667 =-0,1333.
7) V ar(X Y ) = V ar(X) + V ar(Y ) Cov(X, Y )
onde Cov(X, Y ) = E(XY ) E(X)E(Y ), como foi demonstrado.
Demonstrao:
ca
V ar(X + Y ) = E (X + Y )2 [E(X + Y )]2
= E(X 2 ) + 2E(XY ) + E(Y 2 ) [E(X) + E(Y )]2
= E(X 2 ) + 2E(XY ) + E(Y 2 ) [E(X)]2 2E(X)E(Y ) [E(Y )]2
= E(X 2 ) [E(X)]2 E(Y 2 ) [E(Y )]2 + 2E(XY ) 2E(X)E(Y )
= V ar(X) + V ar(Y ) + 2Cov(X, Y ).
Se X e Y so duas variveis aleatrias independentes, ento Cov(X, Y ) = 0 e, portanto,
a
a
o
a
V ar(X Y ) = V ar(X) + V ar(Y ).
Observaao: se Cov(X, Y ) = 0 no implica que X e Y so independentes. Pode ter uma
c
a
a
outra dependncia que no a linear.
e
a
Uma frmula prtica para o clculo da covarincia dada por:
o
a
a
a
e
n

Cov(X, Y ) =

xi y i
i=1

4.4

n
i=1

xi
n

n
i=1

yi

Alguns Modelos Probabil


sticos para Variveis Aleatrias Disca
o
retas

154

Os diferentes tipos de distribuies de probabilidades podem ser considerados como modco


elos para descrever situaes reais que envolvam resultados gerados pelo acaso. Uma conco
sequncia da simplicao, ou seja, da eliminao de detalhes de pouca importncia dos
e
ca
ca
a
fenmenos reais, que, em suas formas mais puras, elementares, poucos problemas so realo
e
a
mente unicos. Por isso, freqentemente um pequeno nmero de modelos suciente para

u
u
e
resolver muitos problemas que, a primeira vista, no parecem relacionados. Podemos, ento,
a
a
concluir que a maioria dos problemas podem ser resolvidos com o aux de poucos modelos
lio
bsicos.
a
Esses modelos, cada qual apresentam uma srie de hipteses ou pressuposioes, que devem
e
o
c
ser atendidas para que o modelo possa ser utilizado validamente.
O ponto chave para a utilizaao de um modelo consiste em confrontar as hipteses bsicas
c
o
a
do modelo e as condies da situao real. Se as hipteses bsicas so vericadas (atendidas),
co
ca
o
a
a
pode-se usar o modelo em questo.
a
Nesta seao, iremos estudar alguns desses modelos, procurando enfatizar como eles ocorc
rem na prtica, sua funo de probabilidade, parmetros, e como calcular probabilidades.
a
ca
a

4.5

Distribuio de Bernoulli
ca

Seja um experimento onde desejamos vericar se uma semente de trigo, germina ou


no germina.
a

E claro que quando realizamos um experimento estamos interessados em vericar alguma(s) varivel(is). Ento, precisamos associar uma varivel aleatria X que chamaremos
a
a
a
o
de germinao da semente de trigo aos poss
ca
veis resultados do experimento; como temos
apenas dois resultados poss
veis, a varivel aleatria X vale:
a
o
x = 1 se a semente germinar;
x = 0 se a semente no germinar.
a
Vamos estabelecer algumas condies (pressuposies):
co
co
oe

ca
1. S feita uma unica tentativa (repetio) do experimento;
2. S so poss
o a
veis dois resultados (germina ou no germina).
a
Vamos denir o evento G={A semente germina}, sendo a sua probabilidade dada por
P (G) = , portanto, o valor do parmetro est entre 0 (zero) e 1 (um); a probabilidade
a
a

da semente no germinar, P (G) = 1 = q.


a
e

155

A distribuiao de probabilidades ca:


c
Resultados

G
G

xi

p(xi )

0
1

1 =q

Total

+ (1 ) = 1

Dizemos que a varivel aleatria X=germinao da semente, assim denida, tem disa
o
ca
tribuio de Bernoulli.
ca
A funao de probabilidade de uma varivel Bernoulli dada por:
c
a
e
P (X = xi ) = xi (1 )1xi .

(4.1)

Exemplo: Podemos obter as probabilidades da varivel aleatria assumir os valores 0 e


a
o
1 atravs da aplicaao da funao de probabilidade:
e
c
c
P (X = 0) = 0 (1 )10 = (1 );
P (X = 1) = 1 (1 )0 = .

Esperana Matemtica e Varincia de uma Varivel Aleatria


c
a
a
a
o
Bernoulli

E(X) =

xi p(xi ) = (0 (1 )) + (1 ) = 0 + = .

V AR(X) = E(X 2 ) [E(X)]2 .


E(X 2 ) =

x2 p(xi ) = 02 (1 ) + 12 = .
i

V AR(X) = 2 = (1 ).
Exemplo 1: uma urna tem 30 bolas brancas e 20 verdes. Retira-se uma bola dessa urna.
Seja X= saiu bola verde. Verique se um ensaio de Bernoulli (confronte as suposies do
e
co
modelo com as condioes do ensaio). Determinar P (X = xi ), calcular E(X) e V ar(X).
c
Sim, pois

1) uma unica repetio

ca
2) somente dois resultados (verde ou branco)
X=

0 (1 ) =
1

156

30
50
20
50

=
=

3
5
2
5

Podemos estruturar a funo de probabilidade da seguinte forma:


ca
P (X = xi ) = (0, 40)xi (0, 60)1xi .
A mdia e a varincia valem:
e
a
E(X) = 0, 40 e V ar(X) = 0, 24, respectivamente.
Exemplo 2: em uma gaiola esto seis coelhos com uma mutaao sangu
a
c
nea letal e trs
e
outros com uma mutao ssea. Sorteia-se, aleatoriamente, um coelho dessa gaiola. Seja X=
ca o
presena de mutaao ssea. Verique se um ensaio de Bernoulli. Determinar a P (X = xi ),
c
c o
e
calcular E(X), V ar(X).
Sim, pois:

1) uma unica repetio;

ca
2) somente dois resultados poss
veis (mutaao ssea ou sangu
c o
nea).

X=

0 (1 ) =
1

6
9
3
9

= 0, 6667
= 0, 3333

P (X = xi ) = (0, 3333)xi (0, 6667)1xi .


E(X) =

xi p(xi ) = 0 0, 06667 + 1 0, 3333 = 0, 3333.

V ar(X) = (1 ) = 0, 3333 0, 6667 =

4.6

2
6 3
= .
9 9
9

A Distribuio Binomial
ca

O objetivo inicial encontrarmos a funo de probabilidade (a expresso matemtica) da


e
ca
a
a
3
distribuio binomial . Para isso vamos ver como a distribuiao binomial ocorre na prtica.
ca
c
a
Suponha, agora, que desejamos vericar a germinaao de duas sementes de trigo. Vamos
c
estabelecer quatro pressuposioes nessa experincia: primeira pressuposiao: o fato de uma
c
e
c
semente germinar ou no, no tem inuncia no fato da outra semente germinar ou no, isto
a
a
e
a
, a germinao das sementes so independentes; segunda pressuposio: a probabilidade
e
ca
a
ca
das sementes germinarem permanece constante (para isso, deve-se utilizar no experimento,
sementes bastante homogneas quanto `s propriedades f
e
a
sicas, qu
micas e biolgicas) e igual
o
a (identicamente distribu
das); terceira pressuposio: s h dois resultados poss
ca
o a
veis,
3

Esta distribuio foi estudada pelo matemtico suio Jacob Bernoulli (1664-1705)
ca
a
c

157

germina, ou no germina, e a quarta pressuposiao: existe n = 2 repetioes. A varivel


a
c
c
a
(X) pode ser denida como o nmero de sementes que germinam e, a probabilidade de uma
u
semente germinar continua sendo igual a .
Observe que vamos usar as denioes de P (A B) e P (A B), onde P (A B) =
c
P (A) + P (B) e P (A B) = P (A)P (B), dadas nas subseoes 3.6 e 3.7.
c
A distribuiao de probabilidade ca:
c
Resultados

xi

p(xi )

GG

GG

GG

GG

2
1
1
0

= 2 (1 )0
(1 )= 1 (1 )1
(1 )= 1 (1 )1
(1 )(1 )= 0 (1 )2

p(2)=1 2 (1 )0 =
p(1)=2 1 (1 )1 =

2
2
2
1

2 (1 )22
1 (1 )21

p(0)=1 0 (1 )2 =

2
0

0 (1 )20

Na tabela, o primeiro resultado mostrado que as duas sementes germinam, isto ,


e
e
temos o resultado GG. Neste caso, em que as duas sementes germinam, o valor assumido
pela varivel X, nmero de sementes que germinam, x = 2. Estamos considerando que a
a
u
e
probabilidade de uma semente germinar , ou seja, P (G) = . Assim, a probabilidade de
e
duas sementes germinarem dada por: P (G1 G2 ) = P (G1 )P (G2 ) = = 2 , onde G1 e
e
G2 representam as sementes 1 e 2, respectivamente, de germinar. Esta probabilidade pode
ser reescrita como:
. = 2 (1 )0 = 1 2 (1 )0 =
onde,

2
2

2 2
(1 )22 ,
2

leia-se, combinao de 2, tomados 2 a 2, e calculada por:


ca
e
2
2

2!
2!
12
=
=
= 1.
2!(2 2)!
2!0!
1 2 (1)

Para o segundo resultado, em que uma semente germina (G) e a outra no germina (G),
a
a probabilidade dada por:
e

P (G G) = P (G)P (G) = (1 ) = 1 (1 )1 .
Observe que, temos duas combinaoes poss
c
veis em que uma semente germina e a outra no
a

germina, GG e GG, portanto, a probabilidade vale:

P (GG GG) = 2 1 (1 )1 =

2 1
(1 )21 .
1

Neste clculo usamos combinaoes pois a ordem dos resultdos no importa. Na verdade, em
a
c
a
termos de resultados, corresponde a um unico resultado, qual seja: uma semente germina e

a outra no germina.
a

158


Usamos o mesmo procedimento para calcular a P (G G).
Vamos, agora, vericar a germinaao de trs sementes de trigo (vamos repetir o exc
e
perimento 3 vezes); considerando verdadeira a hiptese de independncia e probabilidades
o
e
constantes, , a distribuiao de probabilidade ca:
c
Resultados

xi

P (X = xi ) = p(xi )

GGG

GGG

GGG

GGG

GGG

GGG

GGG

GGG

3
2
2
2
1
1
1
0

= 3 (1 )0
(1 ) = 2 (1 )1
(1 ) = 2 (1 )1
(1 ) = 2 (1 )1
(1 )(1 ) = 1 (1 )2
(1 )(1 ) = 1 (1 )2
(1 )(1 ) = 1 (1 )2
(1 )(1 )(1 ) = 0 (1 )3

Total

1 3 (1 )0 =
3 2 (1 )1 =

3
3
3
2

3 (1 )33
2 (1 )32

3 1 (1 )2 =

3
1

1 (1 )31

1 0 (1 )3 =

3
0

0 (1 )30

Generalizando para n ensaios. Vamos agora vericar a germinaao de n sementes de


c
trigo (n repeties do experimento, ou, tambm, podemos dizer, n ensaios independentes de
co
e
Bernoulli), a probabilidade de k sementes de trigo germinar e, portanto, n k sementes no
a
germinar, nesta sequncia:
e

G, G, ..., G, G, G, ..., G
k

nk

dada por:
e
k (1 )nk .
Mas, uma outra sequncia de k sementes que germinam e n k sementes que no germinam
e
a
:
e

G, G, G, ..., G, G, G, G..., G.
O valor da probabilidade continua sendo k (1 )nk .
Uma outra sequncia poderia ser:
e

G, G, G, ..., G, G, G, G..., G.
Novamente, o valor da probabilidade nesta sequncia k (1 )nk .
e
e
Mas, existem:
n
n!
=
k
k!(n k)!

159

de tais sequncias, onde k sementes germinam e n k sementes no germinam, de modo que


e
a
a probabilidade de k sementes germinarem dada por:
e
P (X = k) =

n k
(1 )nk
k

para k = 0, 1, 2, 3.., n.
Observao: a denominaao binomial decorre do fato de os coecientes
ca
c
os coecientes do desenvolvimento binomial das n potncias (a + b).
e
Estas probabilidades tambm podem ser indicadas por:
e

(4.2)

n
k

serem exatamente

b(k : n; ).
Os poss
veis valores de k = 0, 1, 2, 3..., n e as probabilidades P (X = k), dadas em 4.2
constituem a chamada distribuio binomial.
ca
Quando uma varivel aleatria X tem distribuiao binomial com os parmetros n e
a
o
c
a
escrevemos:
X : b(n; ).
Suposioes do modelo binomial:
c
1. Existem n repetioes ou provas idnticas do experimento. Exemplo: nmero de plantas
c
e
u
sadias colhidas em parcelas de 20m2 (foram plantadas 27 plantas em cada parcela),
X : 0, 1, 2, ..., 27, ento, n o nmero total de casos poss
a
e
u
veis da varivel que estamos
a
estudando.
o a
veis (plantas sadias ou doentes).
2. S h dois tipos de resultados poss
3. As probabilidades de sucesso e 1 de fracasso permanecem constantes em todas as
repeties. Na prtica no temos certeza absoluta disso, mas consideramos verdadeira
co
a
a
esta suposiao desde que as probabilidades sejam prximas.
c
o
4. Todos os resultados das repeties so independentes uns dos outros.
co
a
Exemplo 1. Num rebanho bovino 30% dos animais esto atacados de febre aftosa.
a
Retira-se ao acaso, uma amostra de 10 animais.
1)Verique se a varivel nmero de animais doentes pode ser estudada pelo modelo binoa
u
mial. Justique.
2) Estruturar a funo de probabilidade e representar a distribuiao de probabilidade num
ca
c
grco.
a
3) Qual a probabilidade de se encontrar 6 animais doentes?

160

Primeiramente vamos vericar se a varivel X: nmero de animais com febre aftosa,


a
u
pode ser estudada pelo modelo binomial.
1) Temos n = 10 animais, ento X : 0, 1, 2, ..., 10.
a
2) Uma animal est ou no est com febre aftosa.
a
a
a
3) A probabilidade para cada animal, de ter febre aftosa, constante.
e
4) Os 10 animais so selecionados aleatoriamente, ao acaso, isso garante a independncia.
a
e
Assim,
X : b(10; 0, 30).
Temos:
= 0, 30
1 = q = 1 0, 30 = 0, 70
n = 10
portanto, a estrutura da funao de probabilidade dada por:
c
e
P (X = k) =

10
0, 30k 0, 7010k .
k

No apndice 1 temos a tabela das probabilidades binomiais. Como sabemos, estas probae
bilidades so dadas em funo do nmero de repetioes e da proporo de sucessos. Para uma
a
ca
u
c
ca
distribuio binomial, temos que b(6:10;0,30)=0,037=3,7%. Tambm, obtemos diretamente
ca
e
da tabela da distribuiao binomial, que:
c
P (X = 0)
P (X = 1)
P (X = 2)
P (X = 3)
P (X = 4)
P (X = 5)
P (X = 6)
P (X = 7)
P (X = 8)
P (X = 9)
P (X = 10)

b(0 : 10; 0, 30)


b(1 : 10; 0, 30)
b(2 : 10; 0, 30)
b(3 : 10; 0, 30)
b(4 : 10; 0, 30)
b(5 : 10; 0, 30)
b(6 : 10; 0, 30)
b(7 : 10; 0, 30)
b(8 : 10; 0, 30)
b(9 : 10; 0, 30)
b(10 : 10; 0, 30)

=
=
=
=
=
=
=
=
=
=
=

0, 028
0, 121
0, 233
0, 267
0, 200
0, 103
0, 037
0, 009
0, 001
0, 000
0, 000

O grco da distribuiao de probabilidade dado na gura 4.3.


a
c
e

161

0,30
0,26
0,22

P(X=x)

0,18
0,14
0,10
0,06
0,02
-0,02
-2

10

12

Nmero de animais com febre aftosa

Figura 4.3: Distribuiao de probabilidade para animais com febre aftosa


c
A probabilidade de encontrarmos 6 animais doentes, isto , de k = 6 vale:
e
10
(0, 30)6 (0, 70)4 = 210 0, 00073 0, 2401
6
P (X = 6) = 0, 037

P (X = 6) =

P (X = 6) = 3, 7%.
Exemplo 2. Numa criao de coelhos, 40% so machos. Qual a probabilidade de que
ca
a
nasam pelo menos 2 coelhos machos, num dia em que nasceram 19 coelhos? Estruturar a
c
funo de probabilidade e representar a distribuiao gracamente.
ca
c
Primeiramente, vamos vericar se a varivel X: nmero de coelhos machos, pode ser
a
u
estudada pelo modelo binomial.
1) Temos n=19 repetioes do experimento.
c
2) Um coelho macho ou fmea.
e
e e
3) A probabilidade de ser macho 0,40 e permanece constante.
e
4) Os resultados (macho e fmea), em cada nascimento, so independentes.
e
a
Assim:
X = 0, 1, 2, 3, ..., 19
= 0, 40
logo:
X : b(19; 0, 40).
Portanto, a estrutura da funo de probabilidade dada por:
ca
e
P (X = k) =

19
0, 40k 0, 6019k .
k

162

0,22

0,18

Px(x)

0,14

0,10

0,06

0,02

-0,02
-2

10

14

18

22

Nmero de coelhos machos

Figura 4.4: Distribuiao de probabilidade para animais com febre aftosa


c
A probabilidade desejada, P (X 2), dada por:
e
P (X 2) = 1 P (X < 2) = 1 [P (X = 0) + P (X = 1)]
19
19
(0, 40)1 (0, 60)18
(0, 40)0 (0, 60)19 +
= 1
1
0
= 1 (0, 000 + 0, 001)
= 0, 999.
As probabilidades para X : b(19; 0, 40), valem:
P (X
P (X
P (X
P (X
P (X
P (X
P (X
P (X
P (X
P (X

= 0)
= 1)
= 2)
= 3)
= 4)
= 5)
= 6)
= 7)
= 8)
= 9)

=
=
=
=
=
=
=
=
=
=

0, 000
0, 001
0, 005
0, 017
0, 047
0, 093
0, 145
0, 180
0, 180
0, 146

P (X
P (X
P (X
P (X
P (X
P (X
P (X
P (X
P (X
P (X

= 10)
= 11)
= 12)
= 13)
= 14)
= 15)
= 16)
= 17)
= 18)
= 19)

=
=
=
=
=
=
=
=
=
=

0, 098
0, 053
0, 024
0, 008
0, 002
0, 001
0, 000
0, 000
0, 000
0, 000.

O grco da distribuio de probabilidade dado na gura 4.4.


a
ca
e

A Esperana Matemtica e Varincia


c
a
a

163

Uma varivel aleatria binomial X a soma de n variveis independentes do tipo Bernoulli


a
o
e
a
(Y ),
X = Y1 + Y2 + Y3 + ... + Yn .
Aplicando as propriedades da esperana matemtica e varincia, e lembrando que E(Yi ) =
c
a
a
e V ar(Yi ) = (1 ), temos:
E(X) = E(Y1 + Y2 + Y 3 + ... + Yn )
E(X) = E(Y1 ) + E(Y2 ) + E(Y3 ) + ... + E(Yn )
E(X) = + + + ... +
E(X) = n.
No exemplo dos animais com febre aftosa , temos:
E(X) = 10 0, 30
E(X) = 3.
Portanto, em mdia, esperamos encontrar trs animais com aftosa, dentre os dez selecionados.
e
e
A varincia ca:
a
V ar(X) = V ar(Y1 + Y2 + Y3 + ... + Yn ),
como os (Y s) so independentes, a varincia de uma soma de variveis aleatrias a soma
a
a
a
o
e
das varincias dessas variveis, ento:
a
a
a
V ar(X) = V ar(Y1 ) + V ar(Y2 ) + ... + V ar(Yn )
V ar(X) = (1 ) + (1 ) + ... + (1 )
V ar(X) = n(1 ).
No exemplo dos animais com febre aftosa, temos:
V ar(X) = n(1 ) = 10 0, 30 0, 70 = 2, 1 animais2 .
O desvio padro vale:
a
D.P.(X) =

V ar =

2, 1 = 1, 449 animais.

Uma varivel aleatria binomial, como vimos, obtida de contagens, frequncias de sucesa
o
e
e
sos, todavia, em muitas situaes, importante expressar os dados na forma de proporo,
co e
ca
por exemplo, representar que 18 sementes germinaram em 20 sementes testadas, corresponde
a p = 18 20 = 0, 90. Neste caso (de proporoes) a mdia e a varincia so dadas por:
c
e
a
a
E(P ) = .

164

Demonstrao:
ca

1
n
E(n1 ) =
= .
n
n
(1 )
.
V ar(P ) =
n

E(P ) = E

n1
n

Demonstrao:
ca
V ar(P ) = V ar(

n1
1
(1 )
1
) = 2 V ar(n1 ) = 2 n(1 ) =
.
n
n
n
n

As probabilidades das proporoes so exatamente iguais as probabilidades das contagens.


c a
Para o exemplo dos animais com febre aftosa, a probabilidade da proporao de animais com
c
febre aftosa, numa amostra de 10 animais, ser igual a 0,30 igual a 0,267, ou seja, exatamente
e
igual a probabilidade de encontrarmos 3 animais com febre aftosa, P (X = 3) = 0, 267.
Assim, a distribuiao de probabilidades para a proporao de animais com febre aftosa
c
c
e
dada por:
P(X=0)
0,028

4.7

P(X=1)
0,121

P(X=2)
0,233

P(X=3)
0,267

P(X=4)
0,200

P(X=5)
0,103

P(X=6)
0,037

P(X=7)
0,009

P(X=8)
0,001

P(X=9)
0,000

P(X=10)
0,000

Distribuio de Poisson
ca

Um exemplo de aplicaao da distribuio de Poisson4 na rea biolgica, diz respeito


c
ca
a
o
ao estudo do padro de distribuio de uma certa espcie vegetal ou animal num campo
a
ca
e
ou oresta, enm, numa determinada rea. As disciplinas de dinmica de populaes e
a
a
co
entomologia utilizam muito esta distribuio.
ca
Inicialmente precisamos considerar que os indiv
duos da espcie se distribuem aleatoriae
mente no campo. Veja gura 4.5.
Outras duas formas de distribuies so a uniforme e por contgio5 . Veja gura 4.6.
co
a
a
Se a distribuio aleatria, isto implica que a posio de um indiv
ca e
o
ca
duo completamente
e
independente da posiao de qualquer outro indiv
c
duo da populaao.
c
Para este estudo, uma grade sobreposta ` rea de estudo, formando um grande nmero
e
aa
u
de quadrantes (quadrados ou retngulos). Veja a gura 4.7.
a
4

O nome desta distribuio est associado ao matemtico francs S. Denis Poisson (1781-1840).
ca
a
a
e
E mais comum na natureza ocorrer uma distribuio por contgio, nesse caso, a distribuio utilizada
ca
a
ca
e
a binomial negativa.
5

165

Habitat

Figura 4.5: Distribuiao aleatria dos indiv


c
o
duos de uma determinada espcie numa rea
e
a

(a) Distribuio uniforme


ca

(b) Distribuio por contgio


ca
a

Figura 4.6: Outras formas de distribuioes


c

166

Figura 4.7: Distribuio em quadrantes


ca
Podemos contar em cada quadrante, o nmero de indiv
u
duos. Nos quadrantes da gura
4.7, observamos quadrantes vazios, com 1 indiv
duo, com 2 indiv
duos, com 3 indiv
duos,
e assim por diante. Observamos que o nmero de indiv
u
duos/quadrante baixo, digamos,
e
menor que 10. Na distribuio de Poisson esperamos que esse nmero seja menor ou igual a 9
ca
u
ou 10. Devido a este fato, a distribuio de Poisson tambm conhecida como a distribuio
ca
e e
ca
dos eventos raros. No nosso exemplo, isto signica que o nmero de indiv
u
duos por quadrante
pequeno em relaao ao nmero total de indiv
e
c
u
duos na rea de estudo. No signica que
a
a
um exemplar da espcie ocorra muito esporadicamente.
e
Observe que o nmero de indiv
u
duos num quadrante independente do nmero de ine
u
div
duos em outro quadrante. Alm disso, supe-se que o nmero mdio de indiv
e
o
u
e
duos por
quadrante permanece constante.
Pode o padro de distribuio aleatria, visto acima, ser descrito matematicamente? A
a
ca
o
resposta sim, e feita atravs da distribuiao de Poisson.
e
e
e
c
A distribuiao de Poisson largamente utilizada para contagens de indiv
c
e
duos, plantas,
colnias de bactrias, itens, objetos, dados num intervalo de tempo, numa rea, num volume,
o
e
a
num comprimento. Exemplos de variveis Poisson: nmero de colnias de bactrias de uma
a
u
o
e
dada cultura por 0, 01 mm2 numa plaqueta de microscpio; nmero de defeitos por 100 m de
o
u
tecido; nmero de acidentes numa esquina movimentada e bem sinalizada por dia; nmero de
u
u
1
chamadas telefnicas numa central de PABX num intervalo de tempo de 2 minuto; nmero
o
u
de part
culas radioativas emitidas numa unidade de tempo; nmero de cultivares selecionadas
u
num processo de melhoramento, nmero de microncleos/1000 clulas.
u
u
e
A probabilidade de se encontrar zero indiv
duos por quadrado, de encontrar 1 indiv
duo,

167

de encontrar 2 indiv
duos, e assim por diante, pode ser obtida atravs da tabela da dise
tribuio binomial (Apndice 1). Vericamos que as pressuposioes do modelo binomial so
ca
e
c
a
atendidas, seno vejamos:
a
1. n indiv
duos, so as n repetioes do experimento;
a
c
2. como a distribuiao aleatria, a posio de um indiv
c e
o
ca
duo totalmente independente
e
da posiao dos outros;
c
3. a probabilidade de um quadrante receber um indiv
duo igual a , e sempre a
e
e
mesma;
4. um indiv
duo pertence ou no pertence ao quadrante.
a

Aproximao da Distribuio Binomial Atravs da Distribuio


ca
ca
e
ca
de Poisson
Acontece que, nas situaes mencionadas acima, o valor de n grande e/ou desconhecido,
co
e
no exemplo, n o nmero de plantas na rea, suponhamos que seja, por exemplo, n = 600 (na
e u
a
prtica este valor desconhecido) e o valor de pequeno, no exemplo, a probabilidade
a
e
e
e
de um indiv
duo estar num determinado quadrante, por exemplo, se temos 100 quadrantes,
1
ue
duos por quadrante baixa). Nesse caso,
e
= 100 = 0, 01 (sabemos que a freqncia de indiv
podemos aproximar probabilidades binomiais atravs da distribuiao de Poisson, isto ,
e
c
e
en (n)k
b(k : n, )
, com k = 0, 1, 2, ...
=
k!

(4.3)

onde e o nmero de Euler e vale 2,718282. A demonstrao dessa aproximao pode ser
e
u
ca
ca
a
encontrada em Morettin (Estat
stica Bsica, 6 edio), e vlida quando n tende ao innito
a
ca
e a
e tende a zero. Observe no modelo 4.3, diferentemente do modelo binomial, que no existe
a
uma limitaao superior para o nmero de ocorrncias, isto , k = 1, 2, 3, .....
c
u
e
e
Esta aproximao boa para n sucientemente grande e pequeno, de tal forma que
ca e
verica-se a desigualdade, n 7.

E comum representar-se n por , (l-se: lambda), o nmero mdio de indiv


e
u
e
duos por
quadrante, no exemplo n = 600(0, 010) = 6 indiv
duos/quadrante, ento, a expresso 4.3
a
a
ca:
e ()k
P (X = k) =
(4.4)
k!
para k = 0, 1, 2, 3, .... As probabilidades dadas pela funao 4.4, juntamente com os valores
c
de k = 0, 1, 2, 3, ... constituem a distribuiao de Poisson. Os valores das probabilidades, para
c
alguns valores de , o nmero mdio, so dados no apndice 2.
u
e
a
e

168

Se os valores observados aproximam-se dos valores esperados pelo modelo de Poisson,


ento a distribuiao da espcie aleatria. Este um importante resultado para os Bilogos.
a
c
e e
o
e
o
Exemplo 1: cem pssaros tem a chance, um de cada vez, de escolher entre vinte
a
gaiolas dispostas em um c
rculo. Admitimos que os pssaros no tem preferncia direcional.
a
a
e
Vamos denir a var
avel de interesse como sendo X=nemro de pssaros por gaiola. Qual
u
a
a probabilidade de que uma gaiola espec
e
ca seja escolhida 0, 1, 2, ..., vezes?
Como n = 100, = 1/20 = 0, 05 e n = 100 0, 05 = 5 7 podemos usar a distribuiao
c
de Poisson. Temos que P (X = 0) a probabilidade de uma gaiola no ser escolhida por
e
a
nenhum pssaro, e assim por diante. Temos que:
a
P (X
P (X
P (X
P (X
P (X

= 0)
= 1)
= 2)
= 3)
= 4)

=
=
=
=
=

e5 (5)0
0!
e5 (5)1
1!
e5 (5)2
2!
e5 (5)3
3!
e5 (5)4
4!

=
=
=
=
=

0,006741
1
0,006745
1
0,0067425
12
0,00674125
123
0,00674625
1234

=
=
=
=
=

0, 0067
0, 0337
0, 0842
0, 1404
0, 1755.

Para os demais casos, temos:


P (X = 5) = 0, 1755

P (X = 11) = 0, 0082

P (X = 6) = 0, 1462

P (X = 12) = 0, 0034

P (X = 7) = 0, 1044

P (X = 13) = 0, 0013

P (X = 8) = 0, 0653

P (X = 14) = 0, 0005

P (X = 9) = 0, 0363

P (X = 15) = 0, 0002

P (X = 10) = 0, 0181

P (X 6) = 0.

A distribuiao de probabilidades, de acrdo com a distribuiao de Poisson, dada na gura


c
o
c
e
4.8.
Exemplo 2: a probabilidade de um indiv
duo ter reaao negativa a certa injeao de
c
c e
0,001. Suponha que 2.000 indiv
duos receberam a injeao. Estruturar a funo de probabilc
ca
idade e fazer o grco da distribuiao. Determinar a probabilidade de que, (a) exatamente
a
c
trs, (b) mais que quatro tenham reaao negativa.
e
c
Com as informaes do problema, temos:
co
= 0, 001 n = 2000 = 2000 0, 001 = 2
Assim:
P (X = k) =

e2 2k
para k = 0, 1, 2, 3, ...
k!

169

0,22

0,18

Px(X)

0,14

0,10

0,06

0,02

-0,02
-2

10

14

18

Nmero de pssaros por gaiola

Figura 4.8: Grco da distribuio de probabilidades do nmero de pssaros


a
ca
u
a
0,30
0,26
0,22

P(X=K)

0,18
0,14
0,10
0,06
0,02
-0,02
-2

10

12

Nmero de indivduos com reao negativa

Figura 4.9: Distribuiao de probabilidade para reaao negativa


c
c
A distribuio de probabilidades de acrdo com o modelo de Poisson dada na gura 4.9.
ca
o
e
A probabilidade de exatamente 3 apresentarem reao negativa :
ca
e
P (X = 3) =

e2 23
= 0, 1804 = 18, 4%.
3!

A probabilidade de mais de 4 apresentarem reaao negativa :


c
e
P (X > 4) = 1 [P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3) + P (X = 4)]
= 1 [0, 1353 + 0, 2707 + 0, 2707 + 0, 1804 + 0, 0902] = 1 94, 73% = 5, 27%.

A Esperana Matemtica e a Varincia


c
a
a

170

Demonstra-se que:
E(X) = V ar(X) = .
Portanto, na distribuio de Poisson, a mdia igual a varincia. Uma justicativa que
ca
e
e
a
e
fazendo-se tender a zero, implica que, q = 1 , tende para 1. Como a mdia, = n,
e
e
2
2
um valor considerado xo e nito, temos que a varincia = n(1), tende para = n.
a
No exemplo dos pssaros:
a
E(X) = n = = mdia de 5 pssaros por gaiola.
e
a
V ar(X) = 5 pssaros2 .
a

5 = 2, 23 pssaros/gaiola.
a
D.P.(X) =
Exerc
cios resolvidos
1) Num certo ano, o IBAMA registrou no litoral catarinense (rea de reserva), 18 mortes
a
de golnhos.
a)Qual a probabilidade de, num determinado ms do prximo ano, ocorrerem menos de 2
e
e
o
mortes?
b) Qual a probabilidade de ocorrerem 2 mortes no prximo ano?
e
o
a)
= 18/12 = 1, 5 golnhos/ms
e
P (X = 0) = (e1,5 1, 50 )/0! = 0, 223130 1 = 0, 22313
P (X = 1) = (e1,5 1, 51 )/1! = 0, 334695
P (X = 0) + P (X = 1) = 0, 22313 + 0, 334695 = 0, 557825.
b)
= 18 golnhos
P (X = 2) = (e18 182 )/2! = 0, 0000025
2) Suponha que 80% de uma criaao de su
c
nos esteja atacada por leptospirose. Se uma
amostra de 1000 su
nos for examinada por um veterinrio e seja Y o nmero de porcos
a
u
doentes dessa amostra de 1000:
a) qual o valor esperado de Y ?
e
b) qual o desvio padro de Y ?
e
a
Sendo:
n = 1000 = 0, 80 (1 ) = 0, 20

171

a) E(Y ) = n = 800 su
nos.

b) D.P.(Y ) = n(1 ) = 160=12,649 su


nos.
2
V ar(Y ) = 160 su
nos .
3) Doze pares de animais experimentais so submetidos a duas dietas diferentes, A e B.
a
A atribuiao da dieta aos animais de cada par feita ao acaso, aleatoriamente (princ
c
e
pio da
casualizao). Aps o experimento acha-se a diferena em ganho de peso entre os animais
ca
o
c
submetidos a dieta A e a dieta B. Se a diferena for positiva (A B > 0), o resultado ser
c
a
chamado de sucesso.
a) Verique se um experimento binomial (atender as 4 suposies).
e
co
b) Calcule E(X), V ar(X) e D.P.(X).
c) Qual a probabilidade de que pelo menos 9 sucessos ocorram se as duas dietas no possuem
a
diferenas reais no que diz respeito a varivel ganho de peso?
c
a
a)
Tm-se n = 12 repeties do experimento.
e
co
c
e
constante, em cada repetiao a probabilidade de sucesso de 50%.
S h dois tipos de resultados poss
o a
veis.
Os resultados das repeties so independentes.
co
a
b)
E(X) = 12

1
=6
2

1 1
V ar(X) = n(1 ) = 12 = 3
2 2

D.P.(X) =
3 = 1, 73.
c)
= 0, 50 = 50% (1 ) = 0, 50 = 50%.
12
9
12
10
12
11
12
12

(0, 50)9 (0, 50)3


(0, 50)10 (0, 50)2
(0, 50)11 (0, 50)1
(0, 50)12 (0, 50)0

=
=
=
=

0, 0540
0, 0160
0, 0030
0, 000.

0, 0540 + 0, 0160 + 0, 0030 + 0, 000 = 0, 73 = 73%

172

4) Na tabela 4.1, X signica nmero de lhos homens em fam


u
lias com 12 lhos. Calcule
para cada valor da varivel o nmero de fam
a
u
lias que voc deveria esperar se X : b(12; 0, 5)
e
A probabilidade de encontrarmos 0 homens numa fam dada por:
lia e
P (X = 0) =

12
0, 500 0, 50120 = 0, 000.
0

A probabilidade de encontrarmos 1 homem numa fam dada por:


lia e
P (X = 1) =

12
0, 501 0, 50121 = 0, 003.
1

A probabilidade de encontrarmos 2 homem numa fam dada por:


lia e
P (X = 2) =

12
0, 502 0, 50122 = 0, 016.
2

Essas probabilidades e as demais so dadas na terceira coluna da tabela 4.1. O nmero


a
u
esperado de fam
lais com zero lhos homens, pela binomial, vale: 10690 0 = 0; o nmero
u
esperado de fam
lias com 1 lho homem, pela binomial, vale: 10690 0, 003 = 32, e assim
para os demais valores de X. Esses valores so encontrados na quarta coluna da tabela 4.1.
a
Voc acha que o modelo binomial razovel para explicar o fenmeno? Justique.
e
e
a
o
Sim. Pois as freqncias esperadas so prximas das freqncias observadas. Apresentam o
ue
a
o
ue
mesmo comportamento, regularidade.

4.8

Exerc
cios Propostos

1) Considerando que a probabilidade de nascer uma criana do sexo feminino de 47%,


c
e
qual a probabilidade de que uma fam de 6 lhos seja constitu por seis crianas do sexo
lia
da
c
feminino?
2) Suponhamos que a porcentagem de germinao de sementes de feijo seja de 70%.
ca
a
Vo ser semeadas 4 sementes por cova, as quais sero espaadas de 0,40m entre linhas e
a
a
c
0,20m entre covas. Supondo-se que cada canteiro a ser semeado conste de 6 linhas de 5m de
comprimento, qual o nmero mdio esperado de covas falhadas (nem uma semente germinou,
u
e
das quatro semeadas) por canteiro?
3) Um contador eletrnico de bactrias registra, em mdia, 5 bactrias por cm3 de um
o
e
e
e
l
quido. Admitindo-se que esta varivel tenha distribuiao de Poisson;
a
c
a) qual o desvio padro do nmero de bactrias por cm3 ?
e
a
u
e
b) Encontre a probabilidade de que pelo menos duas bactrias ocorram num volume de
e
l
quido de 1cm3 .

173

Tabela 4.1: Nmero de fam


u
lias com X homens

0
1
2
3
4
5
6
7
8
9
10
11
12

No observado de fam
lias

5
35
180
599
1250
1990
2400
2060
1350
600
179
35
7

Total

10.690

0,000
0,003
0,016
0,054
0,121
0,193
0,226
0,193
0,121
0,054
0,016
0,003
0,000

No esperado

0
32
171
577
1294
2063
2416
2063
1294
577
171
32
0

1,000

10690

Probabilidades

4) Em 30 bezerros nascidos, 60% foi do sexo feminino. Calcular o valor esperado (esperana) e o desvio padro esperado.
c
a
5) Se a probabilidade de um indiv
duo sofrer uma reao nociva, resultante da infeco
ca
ca
de um determinado soro 0,0001. Determinar a probabilidade de, entre 2.000 indiv
e
duos:
a) exatamente trs sofrerem a reao; b) mais de dois sofrerem a reao.
e
ca
ca
6) Um produtor de sementes vende pacotes com 20 sementes cada. Os pacotes que
apresentarem mais de uma semente sem germinar sero indenizados. A probabilidade de
a
uma semente germinar 0,98. a) Qual a probabilidade de um pacote no ser indenizado?
e
e
a
b) Se o produtor vende 1000 pacotes, qual o nmero esperado de pacotes indenizados?
e
u
c) Quando o pacote indenizado, o produtor tem um preju de 1,20 u.m. (unidades
e
zo
monetrias) e, se o pacote no for indenizado, ele tem um lucro de 2,50 u.m. Qual o lucro
a
a
l
quido esperado por pacote? d) Calcule a mdia e a varincia da varivel nmero de
e
a
a
u
sementes que no germinam por pacote.
a
7) Sabe-se que 20% dos animais submetidos a um certo tratamento no sobrevivem. Se
a
esse tratamento foi aplicado em 20 animais e se X o nmero de no sobreviventes: a) qual
e
u
a
o nmero mdio esperado de animais no sobreviventes, VAR(X) e DP(X)? b) Calcular a
e
u
e
a

174

P (2 < X 4); c) Calcular a P (X 2).


8) Examinaram-se 2.000 ninhadas de 5 porcos cada uma, segundo o nmero de machos.
u
Os dados esto apresentados na tabela abaixo.
a
Nmero de machos (X)
u

Nmero de ninhadas
u

0
1
2
3
4
5

20
360
700
680
200
40

Total

2000

a) Calcule a proporao mdia de machos.


c
e
b) Calcule, para X=0, X=1 e X=2, o nmero de ninhadas que voc deve esperar se X : b(5, ),
u
e
onde a proporao mdia de machos calculada em a).
e
c
e
c) Faa um grco, onde no eixo do Y vo as probabilidades ( probabilidade de encontrar 0
c
a
a
machos por ninhada, 1 macho por ninhada,....,5 machos por ninhada) e no eixo da abcissas
vai o nmero de machos.
u
9) Uma certa regio orestal foi dividida em 109 quadrados para estudar a distribuio
a
ca
de Primula simenses selvagem. A priori, supomos que este tipo distribui-se aleatoriamente
na regio. O quadro abaixo indica o nmero de quadrados com X Primula Simenses; o
a
u
nmero mdio de plantas por quadrado foi de 2,2 (encontre esse valor).
u
e
X plantas por quadrado

Nmero de quadrados com X plantas


u

0
1
2
3
4
5
6
7
8
>8

26
21
23
14
11
4
5
4
1
0

Total

109

175

a) Se as plantas se distribuem aleatoriamente na regio, qual a probabilidade de encontrarmos


a
pelo menos 2 Primulas num quadrante?
b) D as frequncias esperadas de quadrados para os valores de X=0, X=1 e X=2.
e
e
c) Apenas comparando os resultados de b) com as frequncias observadas, podemos concluir
e
que a distribuiao da espcie aleatria?
c
e e
o
d) Faa um grco, onde no eixo das ordenadas vo as probabilidades ( probabilidade de
c
a
a
encontrar 0 plantas por quadrado, 1 planta por quadrado,......,8 plantas por quadrado), e no
eixo das abcissas vo o nmero de plantas/quadrado.
a
u
10) Quando contamos eritrcitos (clulas sangu
o
e
neas vermelhas) pode ser utilizado um
reticulado, sobre o qual uma gota de sangue igualmente distribu
e
da. Sob microscpio
o
e

observada uma mdia de 8 eritrcitos por cada quadrado. E razovel que contagens por
e
o
a
quadrado, frequentemente, se desviem de 1 ou 2 da mdia 8, e ocasionalmente de 3 ou mais?
e
11) Oito ratos experimentais movem-se aleatoriamente sobre uma superf que subcie
e
dividida em vinte quadrantes de mesmo tamanho, numerados 1, 2, 3, ...,20. Uma fotograa
tirada. Admitindo-se a distribuiao de Poisson,
e
c
a) qual a probabilidade de que exatamente um rato seja encontrado no quadrante no 1?
e
b) quantos quadrantes devem conter 0, 1, 2,...ratos?
12) Uma armadilha para pegar vespa foi testada. Somente 128 das 720 vespas atra
das
pela isca puderam ser apanhadas. Portanto, a probabilidade de pegarmos uma vespa
e
estimada como sendo = 0, 178. Qual a probabilidade de que dentre trs vespas escolhidas
e
e
aleatoriamente:
a) nenhuma seja capturada,
b) pelo menos uma seja capturada?
13) Admitindo que cada criana tenha 51% de probabilidade de ser menino:
c
Determine a probabilidade de uma fam de 4 lhos ter:
lia
a) exatamente um menino;
b) ao menos um menino.
14) Avaliaram-se 30 parcelas (rea de terra de 20m2 ) de 27 plantas de mandioca cada
a
uma, de acordo com o nmero de plantas doentes colhidas. Os dados esto apresentados na
u
a

176

tabela abaixo:
Nmero de plantas doentes colhidas (X)
u

Nmero de parcelas com X plantas doentes


u

0
1
2
3
4

14
8
4
3
1

Total

30

a) Calcule a proporao mdia de plantas doentes.


c
e
b) Calcule para cada valor de X, o nmero de parcelas que voc deve esperar se X : b(27, ),
u
e
onde a proporao mdia calculada em a).
e
c
e
c) Existe uma boa aproximaao entre as propores observadas e as estimadas pelo modelo
c
co
binomial?
d) Faa o grco, onde no eixo do Y tm-se as probabilidades (probabilidade de encontrar 0
c
a
e
plantas doentes por parcela, 1 planta doente por parcela,..., 4 plantas doentes por parcela)
no eixo do X tm-se o nmero de plantas doentes colhidas (0,1,2,3,4).
e
u
15) Determine o nmero esperado de meninos em uma fam com 8 crianas, supondo
u
lia
c
ser a distribuiao do sexo igualmente provvel. Qual a probabilidade de ocorrer o nmero
c
a
e
u
esperado de meninos?
16) Suponhamos que o processo de esterelizaao para um experimento biolgico comc
o
preenda n estgios diferentes, cada um com probabilidade de sucesso. Se uma falha
a
em qualquer dos estgios ocasiona contaminao, qual a probabilidade de contaminaao se
a
ca
c
n = 10 e = 0, 99?
17) Suponha que Xt seja o nmero de part
u
culas emitidas em t horas por uma fonte
radioativa, tenha uma distribuiao de Poisson com parmetro 20t. Qual ser a probabilidade
c
a
a
de que exatamente 5 part
culas sejam emitidas durante um per
odo de 15 minutos?
18) Supondo-se que durante o abate de su
nos, em um determinado frigor
co do Oeste
Catarinense, o nmero de su
u
nos descartados pelo Servio de Inspeao Federal seja uma
c
c
varivel aleatria com mdia de 90 animais por ms (30 dias). Pergunta-se, qual a probabila
o
e
e
idade de serem descartados:
a) quatro su
nos por dia?
b) pelo menos 2 su
nos por dia?
19) Numa fam de 4 lhos, seja X = nmero de meninos e Y = nmero de variaes
lia
u
u
co
na sequncia de sexos. Relacionar o espao amostral e, ento:
e
c
a

177

a) construir a distribuio conjunta de X e Y ;


ca
b) X e Y so independentes?
a
c) quanto vale a covarincia entre X e Y ?
a
20) Segundo a teoria de Mendel, no enxerto de duas espcies de plantas com ores
e
amarelas e brancas, 30% das plantas resultantes tm or amarela. Em sete pares de plantas
e
enxertadas, qual a probabilidade (a) de no resultar or amarela, (b) de haver 4 ou mais
a
plantas com or amarela?
21) Um laboratrio contratado para fornecer, a um distribuidor, lotes de vacinas para
o e
gado. Ocasionalmente, algumas vacinas se revelam inecazes. O distribuidor quer protegerse contra o risco de receber um nmero indesejvel de vacinas inecazes. Como no poss
u
a
a e
vel
testar todas as vacinas (j que o teste inutiliza a vacina), o distribuidor adota o seguinte
a
processo de seleo: extrai de cada lote uma amostra aleatria de 10 ampolas, contendo
ca
o
um nmero X de vacinas estreis. Se X=0, o lote aceito. Se X 1, o lote rejeitado.
u
e
e
e
Este processo designado plano de amostragem simples com amostra de tamanho n = 10 e
e
nmero de aceitaao c = 0. Admitamos que o tamanho do lote seja sucientemente grande
u
c
para que a distribuio de X seja (aproximadamente) binomial, com n = 10 e =fraao
ca
c
desconhecida de vacinas estreis em cada lote.
e
a) Se = 0, 20, qual a probabilidade de o lote ser aceito?
b) Calcule a probabilidade, P(A), de aceitar um lote, para = 0, 05, = 0, 10, = 0, 20
e = 0, 40. Grafe P (A) como funao de , unindo os pontos do grco por uma curva
c
a
cont
nua (esta curva chamada curva caracter
e
stica de operao (CCO) para o plano de
ca
amostragem.
22) Sementes certicadas de feijo so vendidas em um saco de 15 Kg ao preo de 200 u.m.
a a
c

cada. E caracter
stica de produo que 20% das sementes apresentem poder germinativo
ca
abaixo do especicado. Um comprador fez a seguinte proposta ao produtor de sementes: de
cada saco escolhe 25 sementes, ao acaso e paga por saco:
25,00 u.m. se todas as sementes germinarem;
17,00 u.m. se uma ou duas sementes no germinarem;
a
10,00 u.m. se trs ou mais sementes no germinarem.
e
a
O que melhor para o produtor, manter o seu preo de 20,00 u.m. por saco ou aceitar a
e
c
proposta do comprador?
Sugesto: encontrar o preo mdio esperado pelo produtor.
a
c
e
23) O nmero de mortes por afogamento em ns de semana, numa cidade praiana de
u
e
2 para cada 50.000 habitantes. Qual a probabilidade de que em 200.00 habitantes ocorram

178

5 afogamentos?
Obs: X= nmero de mortes por afogamentos uma varivel Poisson.
u
e
a
24) Num lote de sementes cujo percentual de germinao 0,70, foi retirada uma amostra
ca e
de 10 sementes e colocada num germinador. Se X o nmero de sementes germinadas:
e
u
a) estruturar a funo de probabilidade de X, e fazer o grco da distribuio de probabilica
a
ca
dade;
b) determinar a probabilidade de germinarem duas ou mais sementes;
c) determinar a mdia, a varincia e o desvio padro da distribuio de X.
e
a
a
ca
25) Seja X o nmero de crianas no imunizadas numa campanha de vacinaao conu
c
a
c
tra uma determinada doena, onde a probabilidade de no-imunizaao = 103 . De
c
a
c e
5000 crianas vacinadas, numa determinada localidade, qual a probabilidade de no carem
c
a
imunes:
a) uma criana;
c
b) uma criana ou mais;
c
c) estruture a funo de probabilidade e faa um grco da distribuiao de probabilidade.
ca
c
a
c
26) Um graflogo diz que pode determinar o sexo de uma pessoa com base em sua letra.
o
Para testar tal armaao, do-se 15 pares de amostras de caligraas a esse tcnico, cada par
c
a
e
sendo por um texto escrito por um homen e por uma mulher. Se esse tcnico for, na verdade,
e
incapaz de determinar seus julgamentos com base em palpites, qual a probabilidade de ele
e
identicar corretamente a caligraa masculina em 10 ou mais desses 15 pares?
27) Um produtor de sementes arma que apenas 5% das sementes que vende no germia
nam. Um comerciante compra regularmente um lote de sementes desse produtor, mas sob a
seguinte condiao: ele aceita o lote se, em 10 sementes escolhidas ao acaso, no mximo uma
c
a
no germinar; caso contrrio o lote todo rejeitado.
a
a
e
a) Se o produtor de fato tem razo, qual a probabilidade de um lote ser rejeitado?
a
b) Suponha que o produtor esteja mentindo, isto , na verdade a proporao de sementes
e
c
que no germinam de 10%. Qual a probabilidade de um lote ser aceito, segundo o critrio
a
e
e
acima?
28) Vericou-se que o nmero de quebras cromossmicas em um roedor, em qualquer
u
o
per
odo de um dia, num local polu
do, pode ser considerado como uma varivel aleatria
a
o
que tenha distribuiao de Poisson com parmetro 0,1. (Isto , em mdia haver uma quebra
c
a
e
e
a
cromossmica a cada 10 dias). Vamos supor que este roedor car 20 dias neste local polu
o
a
do
para experincia.
e
a) Qual a probabilidade de se encontrar menos de trs quebras cromossmicas?
e
o
b) Qual a probabilidade de se encontrar mais de duas quebras cromossmicas?
o

179

29) Em uma determinada regio ocorre em mdia 1 geada a cada 5 anos. Vamos denir
a
e
X como sendo o nmero de geadas nos prximos 5 anos.
u
o
a) Qual a probabilidade de ocorrncia de no mximo 1 geada nos prximos 5 anos?
e
e
a
o
b) Qual a probabilidade de ocorrncia de pelo menos duas geadas nos prximos 5 anos?
e
e
o
30) Um agricultor tem duas alternativas para a venda de seu produto que fornecido em
e
lotes de 500 sacos de sementes certicadas cada.
a) O comprador A, que paga 8,00 u.m. por saco e no exige nenhum teste.
a
b) O comprador B, que, para cada lote recebido retira 10 sacos ao acaso e os examina: se
todos os 10 esto dentro das especicaes, quanto ao poder germinativo, paga 5.000,00 u.m.
a
co
pelo lote; se entre os 10 sacos houver um fora da especicao, paga 4.000,00 u.m. pelo lote;
ca
e se entre os 10 houver dois ou mais sacos fora das especicaoes paga apenas 2.500,00 u.m.
c
pelo lote. Sabendo o agricultor ser de 10% a porcentagem real de sacos fora da especicaao
c
que produz, qual a melhor alternativa para a venda de seu produto?
sugesto: calcule o preo de venda esperado para cada alternativa.
a
c
31) Um Engenheiro Agrnomo pode atender, normalmente, 4 estabelecimentos agr
o
colas
por dia. Em mdia (), ele atende 3 estabelecimentos agr
e
colas por dia. Se o agrnomo
o
tiver que atender mais de 4 estabelecimentos agr
colas em um dia ele dever fazer horasa
extras para atender a essas solicitaoes. Qual a probabilidade do agrnomo ter que fazer
c
e
o
horas-extras? Sendo = 3.
32) Um produtor de camares de gua-doce tratados com uma alimentao especial,
o
a
ca
deseja comparar o sabor proporcionado por esta nova alimentao com o sabor produzido
ca
pela alimentaao tradicional. A cada um de 4 provadores so fornecidos 3 poroes exatac
a
c
mente iguais, em ordem aleatria, duas das quais com a alimentaao tradicional, e a outra
o
c
com alimentaao especial. Cada um desses provadores inquirido sobre a poro que prefc
e
ca
ere. Suponha que essas duas frmulas sejam igualmente saborosas. Seja Y o nmero de
o
u
provadores que preferem camares tratados com alimentao especial.
o
ca
a) Qual a probabilidade de pelo menos 3 dos 4 provadores preferirem a frmula nova?
e
o
b) Calcule o valor esperado de Y .
33) Um casal deseja ter 8 crianas. Chamamos de X a varivel nmero de lhos homens
c
a
u
e que a probabilidade de nascer lho do sexo masculino ou feminino de 50% para cada um,
e
responda:
a) Verique se esta situao pode ser estudada pela distribuiao binomial (atender as quatro
ca
c
suposioes do modelo). b) Calcule a E(X) e DP (X).
c
c) Qual a probabilidade que nasam no m
c
nimo 4 lhos homens?
d) Faa um grco, onde no eixo Y so as probabilidades (probabilidade de zero sucesso, 1
c
a
a

180

sucesso,..., 8 sucessos), e no eixo das abcissas vai o nmero de lhos homens.


u
34) O nmero de part
u
culas gama, emitidas por segundo, por certa substncia radioativa
a
uma varivel aleatria com distribuiao de Poisson com mdia n = 3. Se um instrumento
e
a
o
c`
e
registrador torna-se inoperante quando h mais de 4 part
a
culas por segundo,
a) Qual a probabilidade de isto acontecer em um dado segundo?
b) Qual o desvio padro dessa varivel aleatria?
e
a
a
o
35) Uma fonte radioativa observada durante 7 intervalos de tempo, cada um de dez
e
segundos de durao. O nmero de part
ca
u
culas emitidas X durante cada per
odo observado,
tem uma distribuiao de Poisson com parmetro 5.
c
a
a) Qual a probabilidade de quem em cada um dos 7 intervalos de tempo, 4 ou mais
e
part
culas sejam emitidas?
b) Qual a probabilidade de que em cada um dos sete intervalos de tempo, trs ou menos
e
e
part
culas sejam emitidas?
c) Qual a probabilidade de que pelo menos um dos sete intervalos, 4 ou mais part
e
culas
sejam emitidas?
36) Suponha que o registro metereolgico mostra que em mdia 5 dos 30 dias do ms de
o
e
e
novembro so chuvosos.
a
a) Supondo a distribuiao binomial com cada dia visto como uma prova independente, enconc
tre a probabilidade de que no prximo ms de novembro no mximo 3 dias sejam chuvosos.
o
e
a
b) D razes para justicar o uso da distribuio binomial na soluao de a).
e
o
ca
c
37) Um certo tratamento capaz de imunizar 78% dos animais contra uma determinada
e
doena. Uma nova amostra de 50 animais testada. Seja X o nmero de animais que se
c
e
u
tornaro imunes.
a
a) Verique se um experimento binomial (confronte as hipteses do modelo com a situaao
e
o
c
real).
b) Qual a E(X)?
e
c) Qual o DP(X)?
e
d) qual a P (X < 2)?
e
38) Numa campanha de vacinaao contra a aftosa, um animal de cada 1000 vacinados
c
no ca imune ` molstia. Se forem vacinados 5000 animais, qual a probabilidade de no
a
a
e
a
carem imunes:
a) cinco animais;
b) dois animais ou mais.
39) Uma fonte mineral contm um nmero mdio de 4 bactrias por cm3 . Dez tubos de
e
u
e
e
ensaio, de 1cm3 , so enchidos com este l
a
quido. Supondo que a distribuiao de Poisson
c
e

181

aplicvel, encontre a probabilidade:


a
a) de que todos os 10 tubos de ensaio apresentem bactrias, isto , contenham ao menos
e
e
uma bactria cada;
e
b) que exatamente 8 tubos de ensaio apresentem bactrias.
e
1
40) A experincia mostra que somente 3 dos pacientes tendo certa doena recupera-se
e
c
sob um tratamento padro. Uma nova droga promissora ser administrada a um grupo de 12
a
a
pacientes que tem a doena. Se a cl
c
nica requer que ao menos 7 dos pacientes se recuperem
antes de aceitar a nova droga como o melhor tratamento, qual a probabilidade de que a
e
droga seja desacreditada, mesmo quando a taxa de recuperaao aumenta para 1 ?
c
2
41) Considere uma anomalia metablica que atinge aproximadamente 1 em cada 100
o
bebs. Se 4 nascem em um hospital espec
e
co, em certo dia, qual a probabilidade de:
e
a) nenhum apresentar esse problema?
b) no mais de um apresentar esse problema?
a
Resolva o exerc pela distribuiao binomial e Poisson. Compare os resultados.
cio
c

182

Modelos de Probabilidades para Variveis Aleatrias


a
o
Cont
nuas

5.1

Introduo
ca

Vamos ver agora como criar um modelo probabil


stico, o que uma funao densidade
e
c
de probabilidade (f.d.p.), e como calcular probabilidades no caso de variveis aleatrias
a
o
cont
nuas.
Como j foi comentado anteriormente, a construo de modelos para variveis aleatrias
a
ca
a
o
cont
nuas, envolve a idia da generalizao do histograma, isto , fazer o nmero de classes
e
ca
e
u
tender para o innito (). Fazendo-se o nmero de classes tender para o innito, implica que
u
os intervalos de classe tornam-se extremamente pequenos, podemos dizer,
nmos. A forma
do histograma sofre uma grande modicao, passando a apresentar um comportamento
ca
bastante regular. Assim, as barras isoladas de um histograma, como a da gura 5.1(a),
torna-se uma curva suave, ou seja, cont
nua, como o da gura 5.1(b). Esta curva cont
nua a
e
representao grca de uma funao, representada por, fX (x), chamada de funao densidade
ca
a
c
c
de probabilidade (f.d.p.), equivalente as funoes de probabilidades para variveis aleatrias
c
a
o
discretas. Esta fX (x) a expresso matemtica do modelo probabil
e
a
a
stico para a varivel
a
aleatria quantitativa cont
o
nua X. Na verdade, a varivel aleatria X dene a curva, ou
a
o
seja, o modelo.
Na gura 5.1(a), a rea de uma determinada barra, indica a porcentagem de valores
a
dentro daquela barra, tambm a probabilidade de ser obtida uma medida dessa classe. Na
e
e
gura 5.1(b), a rea total sob a curva equivale a 1 ou 100% e, portanto, a rea entre dois
a
a
pontos, digamos a e b, e a curva, corresponde a probabilidade de se encontrar um valor entre
aqueles pontos ou a porcentagem de valores dentro daquele intervalo.
J foram constru
a
dos muitos modelos tericos para variveis aleatrias cont
o
a
o
nuas; o que
devemos fazer escolher aquele adequado para a varivel aleatria em estudo.
e
a
o
Exemplo: se a f.d.p. (funao densidade de probabilidade) de uma varivel aleatria for
c
a
o
denida da seguinte maneira:

ex para X 0

fX (x) =
0
para X < 0

>0

183

0,57

0,63

0,69

0,75

0,81

0,87

0,93

0,99 1,05

(a) Histograma para uma varivel


a
aleatria cont
o
nua X

(b) Histograma alisado - curva


cont
nua

Figura 5.1: A varivel aleatria cont


a
o
nua X varia continuamente

f X (x )

x
0
Figura 5.2: Representaao grca do modelo exponencial
c
a
A representaao grca desse modelo dado na gura 5.2.
c
a
e
Dizemos que X tem distribuio exponencial ou X segue o modelo exponencial com
ca
parmetro , o nmero mdio de ocorrncias (igual a distribuiao de Poisson).
a
u
e
e
c
Por exemplo, num estudo de radioatividade, as cintilaes seguem a distribuiao de Poisco
c
son. Os instantes, quando os ncleos se desintegram, so representados por t1 , t2 , t3 , ..., tn .
u
a
Em adiao, os intervalos de tempo entre valores de t consecutivos, t1 , t2 , ... . Esta varivel
c
a
aleatria cont
o e
nua e segue o modelo exponencial.
Exemplo: se a f.d.p. de uma varivel aleatria X dada por:
a
o
e
fX (x) =

1
ba

para a x b
para outros casos.

a < b, ambos reais.


A representaao grca desse modelo dada na gura 5.3.
c
a
e

184

f X (x )

1
b a

x
a

Figura 5.3: Representaao grca do modelo uniforme


c
a
Dizemos que X tem distribuio uniforme , ou segue o modelo uniforme com parmetros
ca
a
a e b.
Exemplo de distribuio uniforme: em um estudo de comportamento animal, pssaros
ca
a
foram libertados um de cada vez, sob circunstncias que tornam dif a orientaao. Esperavaa
cil
c
se que os pssaros escolheriam direoes aleatrias. Est-se medindo o ngulo entre o norte
a
c
o
a
a
e a direo tomada pelo pssaro, no sentido horrio (azimute). A direao dita aleatria se
ca
a
a
c e
o
0
0
cada azimute de 0 a 360 tem a mesma chance de ser escolhido.
Varivel em estudo: X = ngulo em graus.
a
a
Espao amostral: = {x R|0 x 360}.
c
Portanto, podemos estabelecer o seguinte modelo para a varivel ngulo em graus:
a
a
fX (x) =

1
360

para 0 x 360
para outros casos.

A representao grca desse modelo dada na gura 5.4.


ca
a
e
Podemos vericar que:
P (X = 900 ) = 0.
1
P (0 X 90) = .
4
P (900 X 1200 ) =
Dados dois nmeros a e b quaisquer a P (a X b) =
u

185

1
.
12
ba
.
3600

f X (x )

1/360

360

Figura 5.4: Modelo de distribuiao da varivel ngulo (graus)


c
a
a
1,30

1,30

0,97

0,97

0,65

0,65

0,32

0,32

0,00

0,50

1,00

1,49

0,00

1,99

(a) Distribuio de Weibull para


ca
=1

0,50

1,00

1,49

1,99

(b) Distribuio de Weibull para


ca
=2

Figura 5.5: A distribuiao de Weibull


c
Outro exemplo: se a f.d.p de uma varivel aleatria for dada por:
a
o
fX (x) =

x1 ex para x 0
0
para x < 0

onde uma constante positiva.


e
cujo grco para = 1 e = 2 dado na gura 5.5. Dizemos que X tem distribuiao
a
e
c
de Weibull, ou segue o modelo de Weibull. Essa distribuiao tem muitas aplicaes em
c
co
teoria da conabilidade, onde estuda-se sistemas e seus componentes, por exemplo, sistemas
biolgicos, como o corpo humano.
o
No hitograma 5.1(a), gura 5.1, para calcular a frequncia relativa das medidas num
e
determinado intervalo, precisamos somar as frequncias relativas das barras desse intervalo,
e
ou seja, preciso encontrar a `rea total de todas as barras do histograma correspondente ao
e
a

186

intervalo desejado. Correspondentemente, obtemos a probabilidade de que a varivel X caia


a
feito atravs
no intervalo [a,b], calculando a `rea entre [a,b] e a curva. Como isso feito? E
a
e
e
do clculo da integral da funo fX (x) entre os pontos a e b, ento:
a
ca
a
b

P (a X b) =

fX (x)dx.
a

Qual a probabilidade de uma medida de -globulina ser exatamente igual a 0, 86666?


0,86666

P (X = 0, 86666) =

fX (x)dx = 0
0,86666

pois a `rea sob um ponto do eixo x zero. No h contradiao nesse resultado, pois exa
e
a a
c
e
tremamente improvvel que X assuma esse valor particular. Alm do mais, existem innitos
a
e
outros nmeros na vizinhana de 0,86666, de tal forma que a probabilidade to pequena
u
c
e a
que tende a desaparecer. Ento, para variveis aleatrias cont
a
a
o
nuas, tanto faz escrever:
P (a X b) = P (a X < b) = P (a < X b) = P (a < X < b).
Formalmente, a deniao de varivel aleatria cont
c
a
o
nua a seguinte:
e
Denio: diz-se que X uma varivel aleatria cont
ca
e
a
o
nua, se existir uma funo f(.)
ca
denominada funo densidade de probabilidade (fdp) de X que satisfaa as seguites condies:
ca
c
co
a) fX (x) 0 para todo x (no-negativa)
a
+

b)

fX (x)dx = 1

c) para quaisquer a e b, com < a < b <= , teremos: P (a X b) =

fX (x)dx.
a

Pode-se construir modelos tericos probabil


o
sticos para variveis aleatrias, escolhendoa
o
se adequadamente as funes densidades de probabilidades. Teoricamente, qualquer funao
co
c
f (.), que seja no-negativa e cuja rea total sob a curva seja igual ` unidade, caracterizar
a
a
a
a
uma varivel aleatria cont
a
o
nua.
De um modo geral, podemos dizer que as variveis aleatrias, cujos os valores resultam
a
o
de mensuraoes ou medies (geralmente so valores fracionrios), so variveis aleatrias
c
co
a
a
a
a
o
cont
nuas. Exemplos: rendimento de milho em Kg/ha, dimetro de Paepalanthus, dimetro
a
a
de Biomphalarias, altura de plantas, etc.

5.2

O Valor Esperado de Uma Varivel Aleatria Cont


a
o
nua

187

Podemos estender todas as denies feitas para varivel aleatria discreta, de modo
co
a
o
equivalente, `s variveis aleatrias cont
a
a
o
nuas.
Se X uma varivel aleatria cont
e
a
o
nua, dene-se a esperana matemtica de X, como
c
a
sendo:
+
X = E(X) =

xfX (x)dx.

A esperana matemtica pode ser entedida como um centro de distribuiao de probac


a
c
bilidade.
A expresso para a varincia de variveis aleatrias cont
a
a
a
o
nuas dada por:
e
V ar(X) =

2
X

= E (X E(X))

[X E(X)]2 fX (x)dx

ou,
2
V ar(X) = X = E(X 2 ) E 2 (X)

onde:
E(X 2 ) =

x2 fX (x)dx.

O desvio padro dado por:


a e
V ar(X).

DP (X) = X =

Exemplo. Determine a esperana e a varincia da varivel aleatria X cuja f.d.p. dada


c
a
a
o
e
por:
sen x,
0x
2
fX (x) =
0,
caso contrrio.
a

E(X) =

xfX (x)dx =

x sen(x)dx.

Fazendo a integrao por partes (por substituio no d), temos:


ca
ca a a
dv = v

d
=
dx

=x
1 d = dx

v=

vd

dv = sen(x)dx
sen(x)dx = cos(x).

Assim,

E(X) = x(cos x)
0

188

1(cos x)dx

E(X) = x(cos x) +

cos(x)dx

E(X) = [x(cos x) + sen x]90


0
E(X) = [xcos x + sen x]90
0
E(X) = [90 0 + 1] [0 1 + 0]
E(X) = 1 0
E(X) = 1

E(X ) =

x2 sen xdx.

= x2
d
= 2x d = 2xdx
dx

dv = sen(x)dx
v = sen(x)dx = cos(x)

E(X 2 ) = x2 (cos x)

2x(cos x)dx

E(X 2 ) = x2 cos x + 2

xcos(x)dx.

Porm, temos que (integrando por partes novamente),


e
xcos xdx = xsen x

1sen xdx = xsen x + cos x

Retornando, temos que:

2
E(X 2 ) = [x2 cos x + 2xsen x + 2cos x]0
2

E(X 2 ) = [ 0 + 2 1 + 0] 2 1
4
2
E(X 2 ) = 2

V ar(X) = 2 1
V ar(X) = 3.

5.3

5.3.1

A Distribuio Normal
ca

Introduo
ca

189

800
700
600
500
400
300
200
100
0

Figura 5.6: Distribuiao de freqncia em forma de sino


c
ue
O modelo normal ocupa uma posio de grande destaque tanto a n
ca
vel terico como
o
prtico, isso porque o modelo normal representa com boa aproximaao muitos fenmenos
a
c
o
da natureza e, tambm, porque muitos mtodos estat
e
e
sticos pressupem que a varivel sob
o
a
estudo apresente, pelo menos aproximadamente, uma distribuio normal.
ca
Outra razo que o modelo normal, serve como boa aproximaao, de probabilidades
a e
c
binomiais, quando n grande (n > 20) e no nem muito pequeno nem muito grande
e
a e
(0, 10 < < 0, 90), de tal sorte que o menor resultado de n ou n(1 ) seja 5, isto
, tem-se uma varivel com distribuio binomial, e para facilitar o seu estudo, usa-se a
e
a
ca
distribuio normal.
ca
Outra razo da importncia do modelo normal que as distribuioes amostrais de mdias
a
a
e
c
e
e tambm das propores, em amostras grandes, n > 30, tendem a ser distribuidas normale
co
mente (distribuio normal), isto muito importante para o estudo de inferncia estat
ca
e
e
stica.
Esse resultado conhecido como teorema central do limite, e ser visto com mais detalhes
e
a
no estudo de distribuies amostrais.
co
As distribuioes normais surgiram a aproximadamente duas centenas de anos passados,
c
e de que forma? Cientistas coletando um grande nmero de observaoes de uma varivel
u
c
a
e construindo sua distribuiao de frequncia, vericaram que repetidamente o histograma
c
e
apresentava a forma da gura 5.6. A distribuio de freqncias da gura 5.6 conhecida
ca
ue
e
como distribuiao em forma de sino.
c
Mais tarde, esse fato foi transformado em termos matemticos, isto , numa expresso
a
e
a
matemtica que representasse aqueles fenmenos de forma bem aproximada. Esse modelo
a
o
matemtico pode ser visto na gura 5.7. Observa-se na gura 5.7 uma curva cont
a
nua,

190

800
Distribuio
Normal

700
600

Funo densidade
de probabilidade

500
400
300
200
100
0

Figura 5.7: Uma curva cont


nua que aproxima a distribuio de freqncias observadas
ca
ue
simtrica em torno do seu ponto central, isto , da sua mdia. Costuma-se designar essa
e
e
e
distribuio por distribuiao Gaussiana devido ao seu criador, Karl F. Gauss (1777-1855).
ca
c
Em termos formais, matemticos, temos a seguinte deniao para varivel aleatria
a
c
a
o
cont
nua com distribuio normal.
ca
Denio: dizemos que uma varivel alaeatria cont
ca
a
o
nua X tem distribuiao normal,
c
2
2
com parmetros e , onde < < + e 0 < < +, representam a mdia e a
a
e
varincia da populao X, respectivamente, se a sua funao densidade de probabilidade for
a
ca
c
dada por:
(x)2
1
fX (x) = e 22 , < x < +.
2
Costuma-se represesntar essa varivel aleatria por X : N (, 2 ). Onde e representa a base
a
o
dos logaritmos naturais e vale aproximadamente 2,7182.
Pode-se demonstrar que:
+

i)

xfX (x)dx = .

E(X) =

ii) V ar(X) = E[X E(X)]2 = 2 .


iii) fX (x) simetrica ao redor de x = , isto , f ( + x) = f ( x) para todo x.
e
e
Assim, observamos que os dois parmetros e 2 , que caracterizam a distribuiao normal,
a
c
so a mdia e a varincia de X. O desvio padro calculado a partir da varincia de X e
a
e
a
a e
a
vale:

DP (X) = 2 = .

191

fX(x)

Figura 5.8: A distribuiao normal com mdia e pontos de inexo


c
e
a
A gura 5.8 ilustra o grco de uma distribuio normal com valores particulares de e
a
ca
. Ela simtrica em relaao a mdia e teoricamente varia de a +.
e
e
c
e
A distribuiao normal ca completamente denida por dois parmetros: mdia () e
c
a
e
desvio padro (), ento, fcil perceber que para cada combinaao de uma mdia e um
a
a e a
c
e
desvio padro existe uma distribuio normal. Exemplos de variveis com distribuiao nora
ca
a
c
mal podem ser: pesos de bovinos, pesos de frangos, quantidades de chuva (mm), quantidades
de -globulina no plasma sangu
neo de pessoas, comprimentos do ante-brao de morcgos,
c
e
etc. Portanto, na prtica, temos um nmero ilimitado de distribuioes normais. O impora
u
c
tante que sob qualquer curva normal a `rea total igual a 1 ou 100%. Como a curva
e
a
e
normal simtrica em relao a mdia, temos que a probabilidade de obtermos um valor
e
e
ca
e
acima da mdia 50%, da mesma forma, a probabilidade de obter um valor abaixo da mdia
e
e
e
50%.
e
A probabilidade de uma varivel aleatria com distribuiao normal tomar um valor entre
a
o
c
dois pontos quaisquer, por exemplo, entre os pontos a e b, igual ` rea sob a curva normal
e
aa
compreendida entre aqueles dois pontos. Veja gura 5.9. Suponha, ento, que X : N (, 2 )
a
e queiramos determinar a probabilidade de X estar entre a e b, portanto devemos realizar o
seguinte clculo:
a
b
(x)2
1
e 22 dx.
P (a < X < b) =
a 2
Acontece que essa integral no pode ser calculada exatamente, conseqentemente, a probaa
u
bilidade s pode ser obtida aproximadamente, e por mtodos numricos.
o
e
e
Vimos, portanto, que temos dois problemas. O primeiro deles o fato de existirem ine
nitas distribuioes normais, e o segundo a diculdade para se calcular probabilidades na
c
e
2

192

Figura 5.9: A probabilidade de x estar entre os pontos a e b corresponde a rea achurada da


a
gura.
distribuio normal. Para resolver esses dois problemas, foi realizado uma transformao na
ca
ca
varivel aleatria X, originando uma nova varivel, denominada de varivel aleatria nora
o
a
a
o
mal padronizada e representada pela letra Z, cuja distribuiao denomina-se de distribuio
c
ca
normal padro, a qual passaremos a estudar.
a
5.3.2

A Distribuio Normal Padro


ca
a

Acabamos de levantar dois problemas relevantes das distribuioes normais, quais sec
jam: 1) existe uma innidade de distribuioes normais, isto implica na impossibilidade de
c
se elaborar uma tabela que contenha todas as probabilidades; deve-se ressaltar que estas
probabilidades podem ser obtidas com o uso de um software, por exemplo, Excel, e 2) a
integral da f.d.p. da distribuiao normal no pode ser calculada exatamente, e somente por
c
a
procedimentos de clculo numrico. Mas, foi desenvolvida uma alternativa, a qual soluciona
a
e
os problemas levantados, que o de se trabalhar com valores padronizados, isto , a mdia
e
e
e
tomada como origem, referncia do novo sistema (a nova mdia tem valor zero), e o desvio
e
e
e
padro como medida de afastamento a contar da mdia, ou seja, a nova unidade de medida.
a
e
e
Esta nova escala chamada de escala Z.
e
Dene-se a varivel Z como sendo:
a
X
Z=
,

onde:
Z = nmero de desvios padres a contar da mdia;
u
o
e

193

x
60

70

80

90 100 110 120 130 140

-4

-3

-2

-1

z
0

Mdia da varivel z

Esta observao afasta-se 1


desvio padro da mdia

Figura 5.10: Distribuio das variveis X e Z


ca
a
X = a varivel na unidade original;
e
a
= a mdia da populaao;
e
e
c
= o desvio padro da populaao.
e
a
c
Exemplo: consideremos uma distribuio normal com mdia = 100 e desvio padro
ca
e
a
= 10. Para x = 100, temos:
100 100
= 0.
z=
10
Para x = 120, temos:
120 100
z=
= 2,
10
e assim por diante. A gura 5.10 apresenta a distribuio de X e de Z.
ca
Denio: se X : N (, 2 ), ento a varivel aleatria Z denida por:
ca
a
a
o
Z=

tem uma distribuiao N (0, 1), isto , tem distribuiao normal com mdia = 0 e varincia
c
e
c
e
a
2 = 1, cuja funao densidade de probabilidade dada por:
c
e
1 2
1
fZ (z) = e 2 z
2

z +.

Mdia e Varincia da Varivel Aleatria Z


e
a
a
o

194

Figura 5.11: Distribuio normal padro. A rea achurada corresponde a probabilidade de


ca
a
a
uma observao estar no intervalo [0;z]
ca
Demonstrao:
ca
1
1
1
E(X ) = [E(X) E()] = ( ) = 0.

2
2
V (Z) = E(Z ) [E(Z)]
E(Z) =

= E(Z 2 )
= E

1
1
E(X )2 = 2 E(X 2 2X + 2 )
2

1
[E(X 2 ) 2E(X) + 2 ]
2
1
1
=
[E(X 2 ) 2 ] = 2 [E(X 2 ) [E(X)]2 ]
2

1 2
= 1.
=
2
=

5.3.3

O Uso da Tabela da Distribuio Normal Padro


ca
a

No apndice 3, temos a tabela da distribuiao normal padro. Esta tabela d a rea entre
e
c
a
a a
a mdia (zero), o valor de z e a curva, isto , a tabela d a probabilidade de um valor cair no
e
e
a
intervalo [0 a z]. Veja a gura 5.11, na qual a rea achurada corresponde a probabilidade.
a
A distribuio normal padro ou reduzida, absolutamente simtrica em relao a mdia
ca
a
e
e
ca
e
(origem), em funo disso, a tabela s dada para valores positivos de z. Se o valor calculado
ca
oe
de z for negativo, basta consider-lo como positivo e entrar na tabela diretamente. A era
a
a
total vale 100% ou 1, assim, acima de temos 50% da rea e abaixo de temos os outros
a

195

Figura 5.12: P (0 z 1, 25) = 0, 3944


50%.
Exemplo 1. Vamos determinar a rea entre 0(mdia) e z=1,25, isto , P (0 z
a
e
e
1, 25). O que desejamos saber a rea achurada da gura 5.12. Essa rea corresponde a
e a
a
probabilidade P (0 z 1, 25). Na tabela, encontramos para z = 1, 25, P (0 z 1, 25) =
0, 3944.
Exemplo 2. Qual a rea entre 0 (mdia) e z = 1, 73, isto , a P (0 z 1, 73). O que
a
e
e
desejamos a rea entre 0 e 1,73 e a curva da gura 5.13. Com o aux da tabela para
e a
lio
z = 1, 73 temos P (0 z 1, 73) = 0, 4582.
Exemplo 3. Qual a probabilidade de z estar entre -1,73 e 0 (P (1, 73 z 0))? Como
e
a curva da distribuiao normal padro absolutamente simtrica, essa probabilidade pode
c
a e
e
ser obtida calculando-se a P (0 z 1, 73). Como vimos no exemplo 2 essa probabilidade
vale 0,4582.
Exemplo 4. Qual o valor de P (z 1, 73)? Essa probabilidade corresponde a rea
e
a
achurada da gura 5.14. A rea da metade da curva normal vale exatamente 50%, logo a
a
rea alm de z 50% menos o valor tabelado de z=1,73, ento:
a
e
e
a
P (z 1, 73) = 0, 50 P (0 z 1, 73) = 0, 50 0, 4582 = 0, 0418.
Exemplo 5. Qual a probabilidade de z estar entre -1 e 1 (P (1 z 1))? A rea
e
a
achurada da gura 5.15 indica essa probabilidade.
P (1 z 1) = P (0 z 1) + P (0 z 1)
= 2P (0 z 1)
= 2(0, 3413)

196

Figura 5.13: P (0 z 1, 73) = 0, 4582

Figura 5.14: P (z 1, 73)

197

Figura 5.15: P (1 z 1)
= 0, 6826.
Exemplo 6. Qual a probabilidade de z estar entre 1 e 3 (P (1 z 3))?. Essa
e
probabilidade corresponde a rea achurada da gura 5.16.
a
P (1 z 3) = P (0 z 3) P (0 z 1)
= 0, 4986 0, 3413
= 0, 1573.
Exemplo 7. Suponha que X seja uma varivel aleatria com distribuio normal de
a
o
ca

Figura 5.16: P (1 z 3)

198

mdia = 3 e varincia 2 = 16, e desejamos calcular a P (2 X 5). O primeiro passo


e
a
e
calcularmos a varivel z.
a
P (2 X 5) = P
= P
= P

X
5
2

53
23
z
4
4
1
1
z
.
4
2

Portanto,
P (0, 25 z 0, 5) = P (0 z 0, 25) + P (0 z 0, 50)
= 0, 0987 + 0, 1915
= 0, 2902.
5.3.4

A Distribuio Normal como Aproximao da Distribuio Binomial


ca
ca
ca

Muitas situaoes reais podem ser convenientemente descritas pelo modelo binomial.
c
Acontece que quando o nmero de repeties do experimento (n) for muito grande, para
u
co
se calcular as probabilidades binomiais, so necessrios clculos extensos e, as vezes, soa
a
a
mente poss a resoluao com o uso de computadores. Para n sucientemente grande e
e
vel
c
no prximo de 0 (zero) e de 1 (um), j se obtm boas aproximaes da normal ` binoa
o
a
e
co
a
mial. Se n aumenta, a necessidade de se ter prxima de 0,5 diminue. Para saber se a
o
aproximao boa, uma sugesto vericar se n 5 e n(1 ) 5, desde que n > 20 e
ca e
a e
0, 50.
=
Uma diculdade vericada neste tipo de aproximao que o modelo normal para
ca e
e
varivel aleatria cont
a
o
nua (pensar em intervalo), enquanto o modelo binomial para varivel
e
a
aleatria discreta. Para melhorar a aproximao, necessrio, um pequeno ajuste (correo
o
ca e
a
ca
de continuidade) que consiste em subtrair e/ou somar 1/2 aos valores da varivel aleatria
a
o
discreta. Mostraremos o procedimento atravs de um exemplo.
e
Exemplo. Consideremos a varivel aleatria Y : b(10; 1/2), isto , temos uma varivel
a
o
e
a
aleatria binomial com parmetros n = 10 e = 1/2, e desejamos calcular P (8 Y 10),
o
a
a gura 5.17 mostra a distribuio de Y e a curva normal, respectivamente. Chamando X
ca
a varivel com distribuio normal, temos:
a
ca
P (8 Y 10) = P (7, 5 X 10, 5) = P

199

7, 5 n
n(1 )

10, 5 n
n(1 )

(a) Distribuio de uma varivel binoca


a
mial, de mdia 5
e

(b) Distribuio normal como aproxca


imao da binomial
ca

Figura 5.17: Aproximaao normal ` distribuio binomial


c
a
ca
onde, n e n(1 ) so a mdia e o desvio padro da distribuiao binomial e valem
a
e
a
c
n = 10(0, 50) = 5, 0 e 10(0, 50)(0, 50) = 1, 58113, respectivamente. Logo,
P

7, 5 5, 0
10, 5 5, 0
z
1, 58113
1, 58113

= P (1, 5811 z 3, 4785) = 0, 499750, 44295 = 0, 0568 = 5, 68%.

Resolvendo o problema pela distribuio binomial, obtemos:


ca
P (8 Y 10) = 0, 044 + 0, 010 + 0, 001 = 0, 055 = 5, 5%.
Observamos que os dois resultados so bem prximos, mesmo com n pequeno, porm, p =
a
o
e
0, 50.
Exerc
cios resolvidos
1) O comprimento, em cm, de Pnaeus schmitti (camaro marinho), em condioes normais
a
c
no esturio (Lagoa do Ibiraquera), tem distribuio aproximadamente normal, com mdia
a
ca
e
de 6,0 cm e varincia de 0, 2 cm2 .
a
a) Qual o intervalo simtrico em torno da mdia, que conter 75% dos comprimentos dos
e
e
a
camares?
o
b) Qual o valor de comprimento, c, que superado por 7% dos valores?
e
Do problema temos que:
= 6, 0 2 = 0, 2 = 0, 4472.
Com o aux de um programa estat
lio
stico, ou com a tabela da distribuiao normal padro,
c
a
para P (Z1 < Z < Z2 ) = 75%, simtrico em torno de Z, obtemos Z1 = 1, 150349 e
e

200

Z2 = 1, 150349. Portanto,
X1 6
= X1 = 5, 4856.
0, 4472
X2 6
1, 150349 =
= X2 = 6, 5144.
0, 4472

1, 150349 =

b) Para uma probabilidade de 43% (50%-7%), obtemos na tabela da distribuiao normal


c
padro aproximadamente z = +1, 48. Portanto,
a
c6
1, 48 =
c = 6, 66.
0, 2
Assim, 7% dos camares tem comprimento igual ou superior a 6,66 cm.
o
2) O dimetro de certa espcie de rvore uma varivel aleatria com distribuio normal
a
e
a
e
a
o
ca
de mdia 50 cm e desvio padro de 6 cm. Se o dimetro de uma rvore diferir da mdia de
e
a
a
a
e
mais de 10 cm, esta rvore vendida por 10 u.m; caso contrrio, vendida por 20 u.m. Qual
a
e
a
e
o preo mdio de venda de cada rvore?
c
e
a
Do problema temos que:
= 50 cm = 6 cm.
A probabilidade de uma rvore diferir mais do que 10 cm da mdia populacional :
a
e
e
60 50
40 50
) + P (Z <
)
6
6
P (Z > 1, 67) + P (Z < 1, 67) = 2P (Z > 1, 67)

P (X > 60 cm) + P (X < 40 cm) = P (Z >

= 2[0, 5 P (0 < Z < 1, 67)]


= 2[0, 5 0, 45254]
= 0, 09492.
A probabilidade de uma rvore apresentar dimetro entre 40 e 60 cm 1-0,09492=0,90508.
a
a
e
Portanto, o preo mdio de venda de cada rvore :
c
e
a
e
E(X) = (10 0, 09492) + (20 0, 90508) = 0, 9492 + 18, 11 = 19, 05.
3) Os ovos da produo de uma granja so classicados em grande ou pequenos, conforme
ca
a
seu dimetro. Vericou-se que 45% dos ovos so considerados grandes. Supondo que os ovos
a
a
so colocados em caixas de 60, aleatoriamente, pergunta-se:
a
a) Em que porcentagem de caixas teremos pelo menos 50% de ovos grandes? (50% igual a
e
30 ovos).

201

b) Em que porcentagem de caixas teremos exatamente 50% de ovos grandes?


Sendo:
= 0, 45 n = 60 n = 0, 45 60 = 27.
O desvio padro do nmero de ovos por caixa, dado por:
a
u
e
n(1 ) =

60 0, 45 0, 55 = 3, 85356 ovos.

a) Usando aproximaao normal ` binomial, a probabilidade de uma caixa conter 30 ou mais


c
a
ovos, vale:
29, 5 27
)
3, 85356
P (Z 0, 65) = 0, 5 P (0 Z 0, 65)

P (Y 30) = P (X 29, 5) = P (Z

= 0, 5 0, 24215
= 0, 25785.
b) A probabilidade de encontrarmos exatamente 30 ovos, :
e
30, 5 27
29, 5 27
Z
)
3, 85356
3, 85356
P (0, 65 Z 0, 91) = 0, 31859 0, 24215

P (Y = 30) = P (29, 5 X 30, 5) = P (

= 0, 0764.
4) Suponhamos que 5% dos indiv
duos que foram inoculados contra um surto de gripe
tiveram reaoes srias indesejveis devido a inoculaao. Usando a aproximo normal `
c
e
a
c
ca
a
distribuio binomial, calcule a probabilidade de que mais de 16 indiv
ca
duos dos 200 indiv
duos
inoculados tenham tais reaoes.
c
Com as informaoes do problema temos que:
c
= 0, 05

n = 200
n = 200 0, 05 = 10
n(1 ) = 200 0, 95 = 190
n(1 ) = 3, 0822.

A probabilidade de que mais de 16 indiv


duos tenham reaes, :
co e
P (Y > 16) = P (Y 17)

16, 5 10
)
3, 0822
= P (Z 2, 1089)

P (X 16, 5) = P (Z

= 0, 5 0, 48257
= 0, 0174
= 1, 74%.

202

5.3.5

Exerc
cios propostos

1) Determinar a rea limitada pela curva normal em cada um dos casos abaixo:
a
a) entre z=0 e z=1,2;
b) entre z=-0,68 e z=0;
c) entre z=0,46 e z=2,21;
d) entre z=-0,81 e z=1,94;
e) ` esquerda de z=-0,6;
a
f) ` direita de z=-1,23
a
g) ` direita de z=2,05 e ` esquerda de z=1,44.
a
a
h) entre z=-1 e z=+1
i) entre z=-1,96 e z=+1,96
j) entre z=-2,56 e z=+2,56
2) A altura dos indiv
duos de uma populaao distribui-se normalmente com mdia de
c
e
1,56 m e desvio padro de 0,09 m. Qual a percentagem nesta distribuiao, de indiv
a
c
duos
com altura de 1,80 m ou mais?
3) O peso mdio das reses, que se encontram num curral de uma determinada fazenda,
e
de 200 kg, e o desvio padro de 10kg. Em 120 animais retirados ao acaso do curral,
e
a e
quantos pesaro mais de 185 kg? Vamos considerar que o peso das reses tenha distribuo
a
ca
normal.
4) Foi feito um estudo sobre a altura de plantas de milho de certo h
brido, observando-se
que ela se distribui normalmente com mdia 2,20 m e desvio padro de 0,20 m. Qual a
e
a
porcentagem de plantas com altura: a)entre 2,15m e 2,25m; b)entre 2,00m e 2,40m; c)acima
de 2,30m.
5) Em indiv
duos sadios, o consumo renal de oxignio tem distribuiao normal de mdia
e
c
e
3
3
12 cm /min e desvio padro 1,5 cm /min.
a
a) Determinar a proporao de indiv
c
duos sadios com consumo: inferior a 10 cm3 /min; superior a 8 cm3 /min; entre 9,4 e 13,2 cm3 /min; igual a 11,6 cm3 /min.
b) Determinar o valor do consumo renal que superado por 98,5% dos indiv
e
duos sadios.
c) Determinar uma faixa simtrica em torno do valor mdio que contenha 90% dos valores
e
e
do consumo renal.
6) A observaao dos pesos, X, de um grande nmero de espigas de milho mostrou que essa
c
u
varivel normalmente distribu com mdia = 90g e desvio padro = 7g. Num proa
e
da
e
a
grama de melhoramento, entre outras caracter
sticas, uma cultivar deve satisfazer a condio
ca
78 < X < 104g, onde X a varivel aleatria peso da espiga. Nessas condioes, tendo -se
e
a
o
c

203

100 linhagens, pergunta-se:


a) Qual a proporao de linhagens que dever ser aceita?
c
a
b) Qual o nmero de linhagens que continuar participando do programa de melhoramento?
u
a
7) Suponha que o contedo de bactrias de um tipo particular, presentes em um recipiu
e
ente de gua de 1 mililitro, tenha distribuiao aproximadamente normal, com mdia de 85
a
c
e
bactrias e desvio padro de 9 bactrias. Qual a probabilidade de uma dada amostra de 1ml
e
a
e
conter mais de 100 bactrias?
e
8) A distribuiao dos pesos de coelhos criados numa granja pode muito bem ser reprec
sentado por uma distribuio normal, com mdia de 5 kg e desvio padro de 0,8 kg. Um
ca
e
a
abatedouro comprar 5.000 coelhos e pretende classic-los de acordo com o peso, do seguinte
a
a
modo: 20% dos leves como pequenos, os 55% seguintes como mdios, os 15% seguintes como
e
grandes e os 10% mais pesados como extras. Quais os limites de peso para cada classicao?
ca
9) Num povoamento orestal de distribuio aproximadamente normal dos dimetros `
ca
a
a
altura do peito (D.A.P.), a mdia de 16,2 cm, e o desvio padro de 3,4 cm. Determinar
e
e
a e
o valor D tal que tenhamos P (D.A.P. > D) = 5%
10) Suponha que a varivel dimetro de P aepalanthus tenha distribuio normal com
a
a
ca
2
mdia 10mm e varincia 4mm .
e
a
a) Qual a probabilidade de um P aepalanthus aleatoriamente retirado dessa populaao ter
e
c
dimetro maior que 14?
a
b) Se dois P aepalanthus forem selecionados aleatoriamente dessa populao, qual a probca
e
abilidade de ambos serem maiores que 14?
11) Num povoamento orestal temos uma distribuio aproximadamente normal dos
ca
dimetros ` altura do peito (D.A.P.) das rvores, com mdia de 12,6 cm e desvio padro de
a
a
a
e
a
3,1 cm. Se cortarmos todas as rvores de menos de 15 cm de dimetro, qual a porcentagem
a
a
de rvores que restaro de p?
a
a
e
12) Uma mquina de empacotar determinado produto apresenta variaes de peso com
a
co
desvio padro de 20 g. Em quanto deve ser regulado o peso mdio do pacote, para que
a
e
apenas 10% tenham menos de 400 g?
13) O peso bruto de latas de conserva uma varivel aleatria, com mdia 1000 gramas
e
a
o
e
e desvio padro 20 gramas. As latas tem peso mdio de 100 gramas e desvio padro de 10
a
e
a
gramas, tambm com distribuiao normal.
e
c
a) Qual a probablidade de uma lata conter menos de 850 gramas de peso l
quido?
b) Qual a probabilidade de uma lata conter mais de 920 gramas de peso l
quido? OBS.
Considere X como sendo o peso bruto e Y como sendo o peso da lata. Como X e Y so
a
independentes, a V AR(X Y ) = V AR(X) + V AR(Y ) e o D.P.(X Y ) = V AR(X Y ),

204

assim D.P.(X Y ) = 22, 3606.


14) As vendas de sementes de milho tem distribuiao aproximadamente normal com
c
mdia 500 sacos e desvio padro 50 sacos. Se a empresa decide produzir 600 sacos no ms
e
a
e
em estudo, qual a probabilidade de que no possa atender a todos os pedidos do ms, por
e
a
e
estar com a produao esgotada?
c
15) Se X uma varivel aleatria N (95; 56, 25), determinar b tal que
e
a
o
a) P (X > b) = 0, 975 e
b) P (X > b) = 0, 8708.
16) Sabe-se que o comprimento de ptalas de uma populao de plantas da espcie X
e
ca
e
normalmente distribu com mdia = 3, 2cm e = 1, 8cm. Qual a proporao na
e
da
e
c
populaao esperada ter um comprimento de ptalas.
c e
e
a) maior do que 4, 5cm?
b)entre 2,9 e 3, 6cm?
c) Determinar o valor do comprimento de ptalas que superado por 65% das plantas.
e
e
17) Suponha que a altura em cm de uma cultivar de trigo normalmente distribu
e
da
com mdia de 100cm. Se um melhorista exige que ao menos 90% das plantas tenham altura
e
superior a 80cm, qual o maior valor que pode assumir, satisfazendo as exigncias do
e
melhorista?
18) Em um exame de estat
stica, a nota mdia foi 70, com = 4, 5. Todos os alunos que
e
obtiveram nota 75 a 89 receberam conceito B. Se as notas tm distribuiao aproximadamente
e
c
normal, e se 10 estudantes obtiveram conceito B, quantos se submeteram ao exame?
19) Uma enchedora automtica de garrafas de vinho est regulada para que o volume
a
a
3
mdio de l
e
quido em cada garrafa seja de = 1000cm e o desvio padro = 10cm3 . Pode-se
a
admitir que a distribuio da varivel seja normal.
ca
a
a) Qual a porcentagem de garrafas em que o volume de l
quido menor que 990cm3 ?
e
b) Qual a porcentagem de garrafas em que o volume de l
quido no se desvia da mdia em
a
e
mais que dois desvios padres, em ambos os lados?
o
c) O que acontecer com a porcentagem do item (b) se a mquina for regulada de forma que
a
a
a mdia seja 1.200cm3 e o desvio padro 20cm3 ? Explique.
e
a
20) A observaao dos pesos, X, de um grande nmero de espigas de milho mostrou
c
u
que essa varivel normalmente distribu com mdia = 90g e desvio padro = 7g.
a
e
da
e
a
Num programa de melhoramento, entre outras caracter
sticas, uma cultivar deve satisfazer
a condiao 78 < X < 104g, onde X a varivel aleatria peso da espiga. Nessas condioes,
c
e
a
o
c
tendo-se 100 linhagens, pergunta-se:
a) qual a proporao de linhagens que dever ser aceita?
c
a

205

b) qual a proporao de linhagens que dever ser rejeitada?


c
a
c) qual o nmero de linhagens que continuar participando do programa de melhoramento?
u
a
21) Sabe-se que o peso mdio, em arrobas, de abate de bovinos, normalmente dise
e
tribu com mdia 18 e varincia 2,25. Um lote de 5000 cabeas, com essa caracter
do
e
a
c
stica,
foi destinado ao frigor
co que abate s a partir de um peso m
o
nimo w. Supondo que foram
abatidas apenas 4200 cabeas,
c
a) qual o nmero esperado de bovinos com peso entre 17 e 19?
u
b) qual o valor w?
c) qual a P (w < X < )?
22) Suponha que os dimetros de P aepalanthus sejam distribu
a
dos com mdia 12cm e
e
desvio padro 5cm. Um P aepalanthus considerado pequeno se seu dimetro for menor
a
e
a
que 4cm ou grande se seu dimetro for maior que 19cm.
a
a) Encontre a porcentagem de P aepalanthus considerados pequenos e grandes.
b) Quinze por cento dos P aepalanthus maiores so classicados como grandes. Encontre o
a
dimetro m
a
nimo para ser classicado como grande.
23) O tempo de validade de um princ
pio ativo de um determinado inseticida tem distribuio normal de mdia 803 dias e varincia 1581(dias)2 . Determinar a probabilidade de
ca
e
a
validade deste inseticida:
a) antes de 750 dias;
b) entre 700 e 900 dias;
c) depois do tempo mdio.
e
24) A distribuiao das relaes altura/comprimento de conchas de mexilhes Perna perna,
c
co
o
num ambiente de costo batido, pode ser representada por uma distribuiao aproximadaa
c
mente normal, com mdia de 0,5 e desvio padro de 0,02414. Um pesquisador pretende
e
a
classic-los de acordo com a relao acima, do seguinte modo: 25% dos mais leves como pea
ca
quenos, os 50% seguintes como mdios e os 25% restantes como grandes. Quais os valores de
e
altura/comprimento que classicam os mexilhes como sendo pequenos, mdios e grandes?
o
e
25) O comprimento do corpo de um animal da espcie X segue uma distribuiao normal,
e
c
com mdia e desvio padro = 10mm.
e
a
a) De quanto deve ser o comprimento mdio do corpo, , para que apenas 10% dos animais
e
tenham menos do que 500 mm?
b) Com o comprimento mdio obtido no item a), qual a probabilidade de que o comprie
mento total de 4 animais escolhidos ao acaso seja inferior a 2000 mm?
26) Uma mquina automtica para encher sacos de sementes de milho h
a
a
bridos est
a
regulada para que o peso mdio de sementes em cada saco seja de 20Kg e o desvio padro
e
a

206

0, 2Kg. Pode-se admitir que a distribuio da varivel seja normal.


ca
a
a) Qual a porcentagem de sacos em que o peso de sementes no se desvia da mdia em mais
a
e
que dois desvios padres?
o
b) O que acontecer com porcentagem do item a) se a mquina for regulada de forma que a
a
a
mdia seja 30Kg e o desvio padro 0, 30Kg?
a
a
c) Qual a probabilidade de encontrar um saco com mais de 20, 5Kg?
27) O dimetro de certa espcie de rvore uma varivel aleatoria com distribuiao
a
e
a
e
a
c
normal de mdia 40cm e desvio padro 5cm. Se o dimetro de uma rvore diferir da mdia
e
a
a
a
e
de mais de 8cm, esta rvore vendida por 10u.m; caso contrrio, vendida por 20u.m.
a
e
a
e
a) Qual o preo mdio de venda de cada rvore?
c
e
a
b) Qual probabilidade de encontrar uma rvore com dimetro entre 35cm e 45cm?
e
a
a
28) Uma mquina de encher sacos de sementes de milho h
a
bridos pode ser regulada de
modo a descarregar uma mdia de Kg de sementes por saco. Admitindo que a quntidade
e
em Kg necessria para encher um saco de sementes tenha distribuio normal, com desvio
a
ca
padro de 0, 3Kg por saco, calcule o valor de de modo que sacos com mais de 22Kg
a
ocorram apenas 1% das vezes.
29) Numa espcie de planta, por exemplo, a Grevilha robusta, a altura das plantas tem
e
distribuio aproximadamente normal com desvio padro de 4m e tal que 20% das plantas
ca
a
possuem alturas inferiores a 10m.
a) Calcule a proporao de rvores com altura superior a 18m.
c
a
b) Nesta populao, qual um valor da altura, A, cuja probabilidade de se encontrar uma
ca
e
rvore com altura maior ou igual a A seja de 10%, isto , P (altura >A) = 10%?
a
e
30) Num povoamento orestal, considere que X, a medida do dimetro ` altura do peito
a
a
(DAP), tenha distribuiao normal (aproximadamente), com mdia = 16, 2cm e varincia
c
e
a
2
2
= 11, 56cm . Tomando-se ao acaso uma rvore do povoamento, pergunta-se: qual a
a
probabilidade do DAP da rvore selecionada casualmente ser:
a
a) menor que 19,6cm?
b) entre 14,0 e 16,0cm?
c) qual o valor de DAP, que superado por 10% dos valores?
e
`
APROXIMACAO NORMAL A BINOMIAL

31) De um lote de sementes, extra


mos uma amostra de 100 sementes ao acaso; se 10%
das sementes do lote no germinam, calcular a probabilidade de 12 sementes da amostra no
a
a
germinarem.
32) De um pomar de pessegueiros so colhidos 2000 frutos; se 45% dos frutos colhidos
a
so classicados como ideais para a indstria de conservas, qual a probabilidade de 950 ou
a
u

207

mais pssegos obterem a classicao ideal?


e
ca
33) Dois pesquisadores desenvolveram a tcnica do transplante nuclear, segundo a qual,
e
um ncleo de uma clula de um dos ultimos estgios de um embrio transplantado para
u
e

a
a e
um zigoto (clula unica, o vulo fertilizado), para se vericar se o ncleo pode desenvolver-se
e

o
u
normalmente. Se a probabilidade de que um transplante singelo seja bem sucedido de 0,65,
e
qual a probabilidade de mais de 70 transplantes, em 100, obterem sucesso?
e
34) Para comparar a produao de duas cultivares, A e B, de uma determinada espcie
c
e
vegetal, foram plantadas 60 reas de terras de 5 3 = 15m2 , separadas em pares (30 pares)
a
segundo a fertilidade do solo (isto , existe homogeneidade da fertilidade dentro do par; entre
e
os pares h diferena de fertilidade). Uma rea de cada par recebeu a cultivar A e a outra
a
c
a
rea do par recebeu a cultivar B. Dentro de cada par foi feito um sorteio para saber qual
a
a rea que receberia a cultivar A e a B, respectivamente. Veja gura 5.18. As produoes
a
c
nas 60 reas (30 pares) das cultivares foram anotadas, sendo que em 19 pares a cultivar A
a
apresentou uma maior produao do que a cultivar B. Se no h qualquer diferena entre as
c
a a
c
duas cultivares quanto a produo, isto , o fato da cultivar A produzir mais do que a B, ou
ca
e
a cultivar B produzir mais do que a A, aleatria, casual. Nesse caso, a probabilidade p de
e
o
que a produao de uma cultivar de um par seja maior que a produao de uma cultivar de
c
c
um par seja maior que a produao da outra cultivar ser de 0,50.
c
a
a) Calcular a probabilidade desse resultado (em 19 pares a cultivar A teve maior produao)
c
ter ocorrido por acaso. Use a aproximaao normal ` binomial.
c
a
b) Caso essa probabilidade for menor ou igual a 5%, considera-se que essse resulatdo obtido
no experimento indica que a cultivar A realmente mais produtiva que a cultivar B. Qual
e
a sua concluso?
a
35) Dez por cento dos ps de milho que foram inoculados contra um certo v
e
rus tiveram
reaes srias indesejveis devido a inoculao. Calcule a probabilidade de que mais de 20
co
e
a
ca
ps de milho dos 150 ps inoculados tenham tais reaoes.
e
e
c

208

Par 1

Par 2

Par 3

Par 30

Fertilidade

B
A

+
Figura 5.18: Projeto experimental para comparao de duas cultivares
ca

6
6.1

Introduo ` Inferncia Estat


ca a
e
stica
Introduo
ca

Na seao 1.1, foi dito que um curso bsico de estat


c
a
stica deve contemplar, de forma
esquemtica, os seguintes assuntos: Anlise Exploratria de Dados, Modelos Probabil
a
a
o
sticos,
Amostragem e Inferncia Estat
e
stica. Esquematicamente, isso foi ilustrado na gura 1.2.
Agora, ns vamos ver como reunir a Anlise Exploratria de Dados, Modelos Probo
a
o
abil
sticos e Amostragem, para podermos desenvolver um estudo important
ssimo dentro
da estat
stica, conhecido pelo nome de Inferncia Estat
e
stica, isto , como tirar concluses
e
o
sobre parmetros da populaao (por exemplo, sobre mdias, propores, varincias) com
a
c
e
co
a
base no estudo de somente uma parte da populao, ou seja, com base em uma amostra.
ca
Lembre-se que uma populaao, em estat
c
stica, formada por todos os valores poss
e
veis de
uma caracter
stica desejvel; por exemplo, todos os valores de altura dos alunos do curso
a
de Cincias Biolgicas. Amostra uma parte da populaao. Logo, o estudo da Inferncia
e
o
e
c
e
Estat
stica nos capacita a fazer generalizaes para a populaao, mais especicamente, sobre
co
c
os parmetros populacionais, com base nos resultados obtidos numa amostra, atravs das
a
e
estat
sticas amostrais. Veja gura 6.1.

209

Plano de

Populao

Amostra

Amostragem

Inferncia

Avaliao das caractersticas desejadas


Figura 6.1: O racioc
nio indutivo da inferncia estat
e
stica

Um experimento

Todos os experimentos similares

Alguns dados experimentais

Todos os valores possveis

Generalizaes

(, , )

( X , P, S)

Figura 6.2: O processo de generalizao com experimentos


ca
Num experimento, obtemos alguns dados experimentais (amostra) atravs do uso de
e
repetioes dos tratamentos, e generalizamos os resultados para todos os experimentos simic
lares (populao conceitual). A gura 6.2 ilustra o processo de generalizao numa situaao
ca
ca
c
experimental.
Os dois problemas bsicos da inferncia estat
a
e
stica so: Estimao e Testes de Hipteses.
a
ca
o
Vamos, atravs de um exemplo, ilustrar estas duas situaoes.
e
c
Exemplo: um pesquisador est interessado em avaliar a produao mdia por planta,
a
c
e
, da cultivar de ma denominada Gala, para as seguintes condies: plantas com idade
ca
co
de aproximadamente 5 anos, em bom estado tossanitrio, cultivadas com alta tecnologia e
a
para a regio I do zoneamento agroclimtico de Santa Catarina. A populao formada por
a
a
ca e
todas as plantas da cultivar Gala nas condies citadas. Mais especicamente, a populaao
co
c e
constitu por todos os valores de produao por planta. Para essa nalidade, o pesquisador
da
c
vai coletar uma amostra aleatria de, por exemplo, 10 plantas6 , da referida cultivar nas
o
condies descritas. Suponha que as produoes por planta, em kg, foram:
co
c
Plantas

Produao
c

84

82 90

86 80

91 85

10

79 81 82

Mdia Desvio padro


e
a
84

4,0552

Com os 10 valores de produo/planta podemos calcular uma estimativa da produao mdia


ca
c
e
6

O tamanho da amostra deve ser determinado com o aux da estat


lio
stica.

210


por planta, x = 84 kg. Portanto, estamos usando a mdia da amostra, X, como estimador

e
da mdia verdadeira, . Essa estimativa chamada de estimativa pontual, pois origina um
e
e
unico valor da estimativa do parmetro. Esse um racioc

a
e
nio tipicamente indutivo, onde se
parte do particular (amostra) para o geral (populao). Esse um exemplo de problema de
ca
e
estimao.
ca
Um fato importante que se observa quando trabalhamos com amostras, que sempre
e

vamos ter que a mdia verdadeira, , igual a mdia na amostra, X, mais um erro de
e
e
e
amostragem. A representaao disso dada por:
c
e

= X + erro amostral

onde o termo erro amostral a diferena entre a estat


e
c
stica (X) e o parmetro (). Apesar do
a
nome erro, isto no quer dizer que a amostragem foi feita de forma errada e, que, portanto,
a
deve-se coletar uma nova amostra. Esse valor pode ser negativo ou positivo, pequeno ou
grande. Em todas as pesquisas vamos estar envolvidos com o erro amostral. Dizemos que
uma estimativa precisa, se tivermos alto grau de conana de que o erro amostral associado
e
c
a estimativa em questo, pequeno. A preciso e a conana so dois conceitos chaves nesse
a e
a
c a
estudo. A preciso pode ser entendida como a diferena mxima entre a estimativa e o
a
c
a
parmetro que o pesquisador deseja considerar no seu estudo. Voltaremos a tratar deste
a
assunto posteriormente.
Uma outra forma de estimao atravs da construao dos intervalos de conana para
ca e
e
c
c
os parmetros. Nesse caso, temos uma estimativa intervalar, isto , temos um intervalo,
a
e
dentro do qual esperamos que o valor populacional se encontre, isto com um certo grau de
conana. Por exemplo, para os dados de produo/planta da cultivar Gala temos o seguinte
c
ca
intervalo de conana:
c
81, 10 86, 90.
A interpretao do intervalo a seguinte: temos 95% de conana que a verdadeira mdia
ca
e
c
e
encontra-se no intervalo de 81,10 kg a 86,90 kg. Essa forma de estimaao muito mais
c e
informativa que a estimativa pontual. O pesquisador pode vericar se esse intervalo curto
e
(preciso, informativo) ou se muito amplo (pouco informativo).
e
O segundo problema o de teste de hipteses ou testes de signicncia de parmetros.
e
o
a
a
Vamos expor esse problema dando continuidade ao exemplo da cultivar Gala.
Vamos supor que o pesquisador deseja saber se a produo mdia/planta da cultivar
ca
e
Gala diferente signicativamente, ou seja, estatisticamente, da produao mdia/planta da
e
c
e
cultivar Golden. Para isso, foi obtida uma outra amostra aleatria de 10 plantas da cultivar
o

211

Tabela 6.1: Produao por planta, em Kg, de macs das cultivares Gala e Golden
c
a
Plantas
Variedades 1
2
3 4
5
6 7 8
9
10 Mdia Desvio padro
e
a
Gala
Golden

84
95

82 90
102 85

86 80
93 104

91 85
89 98

79 81
99 107

82
106

84,0
97,8

4,06
7,32

Golden sob as mesmas condies descritas para a cultivar Gala. Os dados das duas amostras
co
aleatrias esto apresentadas na tabela 6.1.
o
a
As estimativas da produo mdia das duas cultivares, calculadas com os dados das duas
ca
e
amostras foram 84 Kg/planta e 97,8 kg/planta para as cultivares Gala e Golden, respectivamente. Portanto, a diferena vericada entre as duas cultivares, com essas duas amostras,
c
foi de 13,8 kg/planta a favor da cultivar Golden.
Observando-se os dados individualmente, vericamos que para as plantas 3 e 6, as
produoes na cultivar Gala foram superiores a da Golden. Portanto, podemos pensar que
c
e
perfeitamente poss obtermos um par de amostras, dentre todas as amostras poss
vel
veis de
serem sorteadas, no qual a produo mdia da cultivar Gala superior a da Golden. Isso
ca
e
e
devido simplesmente a amostragem, ou seja, variaoes devido a amostragem.
c
Assim, o problema que se apresenta, o de decidir o que uma diferena real (signicae
e
c
tiva), isto , devido ` cultivar, ou uma diferena casual (no signicativa), isto , devido a
e
a
c
a
e
variaao casual na amostra.
c
Deve car claro que na prtica retirada somente uma amostra de cada cultivar.
a
e
Logicamente, o pesquisador pretende generalizar os resultados obtidos na anlise esa
tat
stica, isto , ele deseja saber se h diferena signicativa entre as mdias verdadeiras
e
a
c
e
Gala e Golden (desconhecidas pelo pesquisador). Como ele est trabalhando com duas
a
amostras aleatrias, dentre um grande nmero de poss
o
u
veis amostras, ele no pode fazer
a
armaes com 100% de certeza, mas ele pode perfeitamente fazer uma armao probaco
ca
bil
stica, indicando a probabilidade de erro ao fazer uma armao sobre uma hiptese em
ca
o
teste. Para isso, utilizaremos as distribuioes de probabilidades, como veremos nas prximas
c
o
sees.
co

6.2

Estat
sticas e Parmetros
a

Na seao anterior, utilizamos uma notaao prpria para diferenciar medidas usadas para
c
c
o
descrever caracter
sticas da amostra e da populao. Essa diferenciao bastante util em
ca
ca e

212

estudos de inferncia estat


e
stica.
Uma estat
stica uma medida usada para descrever uma caracter
e
stica da amostra. Ase
sim, por exemplo, X uma estat
stica usada para estimar a mdia verdadeira; S o estimador
e
e
do desvio padro populacional e P a estat
a
e
stica para estimar a proporao populacional.
c
Por outro lado, um parmetro uma medida usada para descrever uma caracter
a
e
stica da
populaao. Geralmente so representados por letras gregas, assim, por exemplo, representa
c
a
a mdia populacional; representa a proporo populacional e representa o desvio padro
e
ca
a
populacional.
Quando uma estat
stica assume um determinado valor, temos o que denomina-se de
estimativa. Temos os dados de uma particular amostra, calculamos o valor da estat
stica de
interesse, este valor a nossa estimativa. Por exemplo, a estimativa da produo mdia por
e
ca
e
planta da cultivar Gala de x = 84 kg/planta. Outro exemplo, a estimativa da proporao
e

c
de peixes com comprimento total menor do que 50 mm p = 46%.
e
Um resumo da notaao utilizada apresentada no quadro a seguir.
c
e
Notaao utilizada para representar parmetros, estat
c
a
sticas (ou estimadores) e estimativas
Caracter
stica

Parmetros
a

Mdia
e
Proporo
ca
Varincia
a
Desvio padro
a

6.3

Estat
sticas ou Estimadores

X
P
S2
S

Estimativas
x

p
s2
s

Como Selecionar Uma Amostra

Como vimos nos exemplos anteriores, um pesquisador trabalha com apenas uma parte
da populaao, isto , com uma amostra. A maneira como selecionada uma amostra de
c
e
e
e
extrema importncia, pois atravs dos dados amostrais que sero calculadas as estimativas
a
e
e
a
dos parmetros desconhecidos da populao e, tambm, sero feitas armativas sobre os
a
ca
e
a
mesmos.
a
E fcil de se imaginar, que um ponto fundamental, o pesquisador ter um bom conhece
imento da populao, pois quanto mais ele conhecer a populao, mais informativa ser a
ca
ca
a
amostra selecionada. Por exemplo, se um Bilogo deseja fazer um estudo sobre a poluio
o
ca
de uma ba em peixes do genro Bagre, ele vai precisar coletar uma amostra de peixes
a,
e
desse gnero e avaliar o nmero de microncleos em 5000 clulas. Para se ter uma amostra
e
u
u
e
representativa, necessrio ter um bom conhecimento sobre o comportamento desse tipo de
e
a

213

peixe.
Em resumo, preciso garantir que a amostra seja representativa da populaao, isto , uma
e
c
e
amostra deve posssuir as mesmas caracter
sticas bsicas da populaao, no que diz respeito
a
c
`s variveis que desejamos pesquisar.
a
a
Vamos, aqui, apresentar novamente os conceitos de populao e amostra, devido a sua
ca
importnica para o estudo da inferncia estat
a
e
stica. Populaao consiste de todos os valores
c
poss
veis de uma varivel. Estes valores no precisam ser todos diferentes, nem um nmero
a
a
u
nito. Exemplos: 1) todos os valores poss
veis da produao de milho por hectare; 2) todos
c
os pesos ao nascer de coelhos da raa gigante; 3) todos os valores de dimetros de Biomc
a
phalarias do Poo do Crrego Grande; 4) todos os valores de microncleos de roedores de
ca
o
u
uma regio polu
a
da. Por outro lado, uma amostra, uma parte (subconjunto) da populaao.
e
c
Exemplos: 1) os rendimentos de milho, em kg/ha, de uma amostra de 5 unidades experimentais (canteiros); 2) os pesos ao nascer de uma ninhada de coelhos da raa gigante; 3) os
c
dimetros de uma amostra de 30 Biomphalarias do Poo do Crrego Grande; 4) os valores
a
ca
o
de microncleos de uma amostra de 25 roedores.
u
As situaoes de amostragem, nas cincias biolgicas e agronmicas, na prtica, so
c
e
o
o
a
a
inmeras e podem ser mais ou menos complexas. Vejamos alguns exemplos de seleao de
u
c
amostras.
Exemplo 1. Desejamos desenvolver uma pesquisa scio-econmica, sobre os agricultores
o
o
integrados ` uma empresa, onde estamos interessados em diversos parmetros relativos a
a
a
atividade agropecuria. A populao constitu por todos os agricultores integrados ` ema
ca e
da
a
presa. Podemos denir vrias variveis associadas a cada agricultor (propriedade agr
a
a
cola).
Essas variveis sero observadas sobre uma amostra de 200 agricultores. Para selecionar os
a
a
agricultores que participaro da amostra, sorteamos, com regras bem denidas, 200 chas
a
de um chrio, onde conste todos os agricultores integrados.
a
Exemplo 2. Estamos interessados numa pesquisa para tratar a glicemia7 em peixes
Mandi8 atravs da injeao de glucagnio. Estamos interessados em parmetros sobre o teor
e
c
o
a
de aucar no sangue desses peixes. A populaao constitu por todos os peixes Mandi
c
c e
da
do local de estudo. Nesse caso, o pesquisador no tem acesso a toda a populaao de peixes
a
c
Mandi. Assim, ele vai selecionar (amostra) aqueles que esto acess
a
veis. Por exemplo, se
desejamos uma amostra de 15 peixes, o pesquisador poder utilizar os peixes capturados com
a

uma tarrafa, ou selecionar alguns peixes em um laboratrio. E importante que os peixes


o
selecionados para participarem da amostra, tenham as mesmas caracter
sticas da populaao.
c
7
8

Presena de glicoce no sangue em cota siolgica.


c
o
Designao comum a vrias espcies de peixes siluriformes, especialmente da fam dos pimelodideos.
ca
a
e
lia

214

Exemplo 3. Numa pesquisa sobre propriedades qu


micas de uvas da cultivar Cabernet,
com idade de 6 anos, nas seguintes condioes (tratamentos):
c
Tratamento 1: plantas sadias;
Tratamento 2: plantas com infeco mdia da virose do enrolamento;
ca
e
Tratamento 3: plantas com infeco forte da virose do enrolamento.
ca
Podemos estar interessados no parmetro, teor mdio de aucar da cultivar, sob cada uma
a
e
c
das trs condioes. As populaoes so formadas por todas as plantas adultas da cultivar
e
c
c
a
cabernet na regio considerada para cada um dos tratamentos. Mais especicamente, estaa
mos interessados no teor de aucar das plantas para cada um dos tratamentos. Nesse caso, o
c
pesquisador selecionou intencionalmente 10 plantas, para cada tratamento, de um parreiral.
Portanto, temos 3 amostras, cada uma de tamanho igual a 10.
Exemplo 4. Em estudos sobre a distribuio e abundncia de primatas na natureza,
ca
a
deseja-se conhecer o nmero de animais em uma determinada rea e a rea de ocorrncia
u
a
a
e
atual desses animais. A contagem por transectos lineares um dos mtodos mais usados
e
e
para a estimativa da densidade de vrias espcies de animais. Necessita-se fazer a abertura
a
e
de algumas trilhas (transectos) na mata, por onde sero feitas as observaes e caminhadas.
a
co
O tamanho da amostra corresponde ao nmero de vezes que cada trilha deve ser caminhada,
u
por exemplo, 40 repetioes.
c
Em resumo, a obtenao de soluoes adequadas para problemas de amostragem exige, em
c
c
geral, muito bom senso, conhecimento do fenmeno biolgico e experincia. Como percebeo
o
e
mos, existem muitas maneiras de se retirar uma amostra de uma populao. Existe um
ca
campo dentro da estat
stica que trata dos planos de amostragem. Entretanto, o plano mais
simples e talvez o mais importante em estat
stica o plano conhecido como Amostragem
e
Casual Simples e, desse plano, que trataremos agora.
e

6.4

Amostragem Casual Simples

O que caracteriza este tipo de amostragem, que todos os elementos da populao


e
ca
tem probabilidade igual de pertencer a amostra e, todas as poss
veis amostras, tem igual
probabilidade de serem sorteadas.
Vamos, atravs de um exemplo, apresentar com detalhes uma denio precisa, ou seja,
e
ca
em termos matemticos, de amostra aleatria simples. Essa a deniao de amostra aleatria
a
o
e
c
o
simples mais adequada a experimentaao.
c

215

Tabela 6.2: Distribuio de frequncias das alturas dos alunos do curso de estat
ca
e
stica bsica.
a
Altura Frequncias absolutas Frequncias relativas
e
e
1,50
1,60
1,70
1,80
1,90
2,00

5
10
15
8
5
2

0,1111
0,2222
0,3333
0,1778
0,1111
0,0445

Total

45

1,0000

Exemplo: suponha que a nossa populaao so todos os alunos da classe de estat


c a
stica
bsica. Suponhamos, tambm, que a distribuio dos valores de altura (X) dos alunos da
a
e
ca
classe seja a da tabela 6.2.
Obter uma amostra aleatria simples dessa populao, equivale matematicamente a coloo
ca
car numa caixa ou num saco de papel, 45 pedacinhos de papis numerados de 1 a 45 e, aps,
e
o
proceder a um sorteio. O primeiro papel sorteado pode assumir qualquer valor x da primeira
coluna da tabela 6.2, com as probabilidades apresentadas na terceira coluna da mesma. Vamos representar essa primeira observaao por X1 . Vamos repor esse papel na caixa. O
c
segundo papel escolhido aleatoriamente, tambm pode assumir qualquer valor x da primeira
e
coluna da tabela 6.2, com as probabilidades dadas na terceira coluna. Vamos representar essa
segunda observaao por X2 . Repomos esse papel na caixa. Repetimos esse procedimento
c
at selecionar todos os n elementos da amostra (X1 , X2 , ..., Xn ).
e
Observe que a distribuio de probabilidades de X1 , a mesma distribuio da populao,
ca
e
ca
ca
isto , de X; a distribuiao de probabilidades de X2 , a mesma distribuiao de probabilidades
e
c
e
c
de X; e, assim, para X3 , ..., Xn .
c
e
Ento, diz-se que X1 , X2 , ..., Xn tem a mesma distribuiao de probabilidades, e qual
a
esta distribuiao? a distribuio da populao, ou seja, de X. Dizemos que X1 , X2 , ..., Xn
c
ca
ca
so identicamente distribudas.
a

De um modo geral, as observaes X1 (altura do primeiro aluno sorteado), X2 (altura do


co
segundo aluno sorteado),...,Xn (altura do n-simo aluno sorteado) sero independentes caso
e
a
a amostragem seja feita com reposiao. No caso de populaes muito grandes (n < 0, 05N )
c
co
as amostragens com reposio e sem reposiao se equivalem (as probabilidades quase no se
ca
c
a
alteram), de modo que, mesmo na amostragem sem reposiao, ainda temos independncia9 .
c
e
9

Em populaes pequenas e a amostragem feita sem reposio, implica que a distribuio de X2 depende
co
e
ca
ca

216

Em experimentaao, a situaao mais geral, a de amostragem sem reposiao de uma popc


c
e
c
ulao muito grande, considerada innita, de sorte que podemos considerar as observaes
ca
co
aleatrias X1 , X2 , ..., Xn como independentes e identicamente distribu
o
das. Agora, podemos
denir amostra aleatria simples de forma precisa.
o
Denio: uma amostra aleatria simples de tamanho n, de uma varivel aleatria X,
ca
o
a
o
aquela cujas n observaoes X1 , X2 , ..., Xn so independentes e identicamente distribu
e
c
a
das.
6.4.1

Obteno de Uma Amostra Aleatria Simples


ca
o

A obteno de uma amostra verdadeiramente aleatria vai depender muito da situaao


ca
o
c
da populaao. Frequentemente, no poss obter-se uma amostra aleatria - aquela em
c
a e
vel
o
que cada membro da amostra selecionado aleatoriamente da populaao - pois a mesma no
e
c
a
se adapta aos dados da pesquisa. Por exemplo, na pesquisa para tratar a glicemia em peixes
Mandi atravs da injeo de glucagnio (200 g), os peixes que formam a amostra so os
e
ca
o
a
acess
veis, que esto no laboratrio ou que sero capturados com uma tarrafa.
a
o
a
Na pesquisa para estudar o teor mdio de aucar da cultivar cabernet, em trs condies
e
c
e
co
(tratamentos) diferentes, quais sejam: 1) plantas sadias; 2) plantas com infeco mdia da
ca
e
virose do enrolamento e 3) plantas com infecao forte da virose do enrolamento, o pesquisador
c
selecionou intencionalmente 10 plantas de cada tratamento de um parreiral.
Nos dois exemplos, imprescind que os elementos que participam da amostra tenham
e
vel
as mesmas caracter
sticas da populao para a qual se deseja generalizar os resultados. Isto
ca
signica que a amostra deve ser representativa da populaao.
c
Uma outra situaao, o caso da pesquisa scio-econmica dos agricultores de um dec e
o
o
terminado munic
pio, em que temos uma listagem de todos os agricultores desse munic
pio.
Nesse caso, podemos numerar todos os agricultores de 1 at N , sorteando-se, a seguir, por
e
meio de um processo bem denido, que nos garanta a aleatoriedade, n agricultores dessa
sequncia, os quais formaro a amostra.
e
a
Um procedimento util para realizar o sorteio usar a tabela de nmeros aleatrios. Esta

e
u
o
tabela dada no apndice 7. As tabelas de nmeros aleatrios contm os 10 algarismos (0, 1,
e
e
u
o
e
2, 3, 4, 5, 6, 7, 8, 9) e so formadas por sucessivos sorteios do conjunto deles. Essas tabelas
a
foram exaustivamente testadas e a sua aleatoriedade garantida.
e
Na tabela de nmeros aleatrios, esses nmeros podem ser lidos isoladamente, ou em
u
o
u
grupos de dois, trs, quatro, ou mais algarismos; podem ser lidos em qualquer ordem: por
e
de X1 .

217

colunas em qualquer sentido, por linhas em qualquer sentido, diagonalmente. Vamos, atravs
e
de um exemplo, fazer uma ilustrao do uso da tabela de nmeros aleatrios.
ca
u
o
Exemplo. A nalidade da pesquisa determinar o peso mdio, o peso total, em
e
e
toneladas, e a porcentagem de fornecimentos abaixo de X toneladas, de cana-de-aucar,
c
entregue pelos fornecedores ` indstria. A populao formada por 250 fornecedores de
a
u
ca e
cana-de-aucar. Deseja-se sortear uma amostra de 21 fornecedores.
c
Primeiramente, os 250 fornecedores so listados por ordem alfabtica. Aps isso, a popa
e
o
ulao numerada de 1 at 250. Como a identicaao exigiu nmeros com 3 algarismos,
ca e
e
c
u
e
necessrio lermos nmeros de 3 algarismos na tabela de nmeros aleatrios. Utilizando a
a
u
u
o
tabela (apndice 7), decidimos ler nmeros das colunas 8, 9 e 10, e, vamos, ler percorrendo
e
u
as colunas de cima para baixo, os nmeros encontrados foram:
u
826 97 820
232 497 174
406 207 313
140 490 499
537 56 331
902 910 7
611 264 893
883 233 640
928 741 234
138 694 806

176
397
348
134
742
929
441
655
746
952

452
419
963
719
981
775
809
520
312
876

328 868 817 402


519 699 13 415
476 932 870 827
209 681 471 612
662 625 957 450
785 935 30 573
813 113 79 933
815 440 69 798
616 173 995 496
3
876 436 379

253
772
718
424
331
941
136

A amostra selecionada formada pelos nmeros em itlico na matriz. Atravs desses nmeros
e
u
a
e
u
identica-se os agricultores que vo fazer parte do estudo.
a
Em resumo, para selecionarmos uma amostra, com a utilizaao da tabela de nmeros
c
u
aleatrios, devemos seguir os seguintes passos:
o
c
c
1) faa uma lista dos itens da populaao;
2) numere os itens da lista, a comear de 1;
c
u
u
3) leia os nmeros na tabela de modo que o nmero de algarismos em cada um seja
igual ao nmero de algarismos do ultimo nmero da sua listagem. Exemplo, se o ultimo
u

nmero 1370, devem ser lidos nmeros com 4 algarismos;


u
e
u
4) despreze os nmeros que no correspondem aos nmeros da lista ou que sejam
u
a
u
repeties de nmeros lidos anteriormente (amostragem sem reposiao). Continue o
co
u
c
processo at ter o nmero desejado de observaes;
e
u
co

218

5) use os nmeros assim identicados para coletar os itens que vo fazer parte da
u
a
amostra.
Exerc
cio. A nalidade da pesquisa o de determinar o nmero de insetos/quadrante
e
u
e o total de insetos na rea. Sortear 15 quadrados de um total de 100, de 10 m2 cada.
a
As tcnicas estat
e
sticas que veremos nas seoes subsequntes deste curso, pressupem que
c
e
o
a amostra foi selecionada aleatoriamente ou por algum processo equivalente. Embora, para
os dados de uma pesquisa, nem sempre uma amostra aleatria poss
o e
vel, tomando-se algumas precauoes especiais no delineamento da pesquisa, esta suposiao (amostra aleatria)
c
c
o
pode ser pertinente, por exemplo, num experimento, fazendo-se a casualizaao (sorteio) dos
c
tratamentos `s unidades experimentais.
a

6.5

Distribuies Amostrais
co

O objetivo pelo qual selecionamos uma amostra, para obter estimativas de parmetros
e
a
2
desconhecidos da populaao (, , ), fazer armaes sobre os mesmos e, tambm, nos
c
co
e
auxilia na vericaao da forma (distribuio) como a estat
c
ca
stica se distribue.
Vamos raciocinar em cima da seguinte pergunta, relativa ao exemplo em que o pesquisador
est interessado em avaliar a produo mdia (), por planta, da cultivar de ma Gala. O
a
ca
e
ca
valor da produo mdia por planta (), numa amostra de 10 plantas, vai ser um valor
ca
e
x
prximo da verdadeira produao mdia referente a todas as plantas da cultivar Gala?10
o
c
e
Como o valor da verdadeira produao mdia por planta desconhecido, responderemos
c
e
e
a pergunta atravs do estudo de como se distribuem os poss
e
veis valores de x.

Quando se extraem repetidas amostras de uma mesma populao, so obtidos diferca


a
entes valores de x. Provavelmente, os valores das mdias amostrais so todos diferentes e,

e
a
tambm, diferentes da verdadeira mdia da populao, simplesmente devido a fatores cae
e
ca
suais na amostragem. Esta variabilidade conhecida como variabilidade amostral. Portanto,
e
torna-se imprescind
vel, quando vamos fazer inferncias sobre parmetros populacionais,
e
a
levar em consideraao a variabilidade amostral.
c
Vamos estudar a variabilidade amostral atravs das distribuioes amostrais. Estas dise
c
tribuies amostrais so descritas pelas distribuies de probabilidades, como a distribuiao
co
a
co
c
normal, a binomial. Neste caso, estas so conhecidas como distribuioes amostrais.
a
c
A gura 6.3 ilustra o esquema de uma distribuiao amostral. Na gura 6.3, temos:
c
10

Depende da estat
stica, do tamanho da amostra e da variabilidade na populao.
ca

219

Amostra 1
Uma populao
com uma
caracterstica X e
os parmetros de
interesse:
(, , 2)

2
( x1 , s1 , p1 )

Amostra 2

( x 2 , s2 , p 2 )
2

.
Amostra k

.
2
( xk , sk , pk )

Figura 6.3: Distribuiao amostral de uma estat


c
stica
1. Uma populaao X, por exemplo, valores de glicemia (mg%), em peixes Mandi, com
c
um certo parmetro de interesse.
a
2. Retirar todas as poss
veis amostras de tamanho n da populaao de acordo com um
c
determinado projeto.

stica de interesse (X, S 2 , P ).


3. Para cada amostra vamos calcular a estat
4. Os valores da estat
stica, calculados nas amostras, vo formar uma nova populaao (de
a
c
mdias, de varincias, de proporoes), cuja distribuio recebe o nome de distribuiao
e
a
c
ca
c
amostral (de mdias, de varincias, de proporoes). Assim o conjunto:
e
a
c

e
ca
e
e
x1 , x2 , ..., xk denominado de distribuio amostral das mdias ou da mdia; o
conjunto:
p1 , p2 , ..., pk denominado de distribuio amostral das propores ou da proe
ca
co
porao; o conjunto:
c
s2 , s2 , ..., s2 denominado de distribuiao amostral da varincia.
c
a
1 2
k e
6.5.1

Distribuio Amostral da Proporo


ca
ca

Para ilustrar o desenvolvimento do estudo de distribuiao amostral da proporo e da


c
ca
mdia, vejamos um exemplo simples. Salientamos, que esse exemplo, no qual a populao
e
ca e
bastante pequena, e a amsotragem feita com reposiao, tem m puramente didtico.
e
c
a
Um agricultor quer vender alguns su
nos para uma agroindstria. Vamos supor que ele
u
possua somente 4 su
nos, logo, o tamanho da populao N = 4 su
ca e
nos. Para a nossa

220

Tabela 6.3: Pesos de 4 su


nos
Su
nos Peso (kg)
A
B
C
D

68
80
84
87

nalidade, suponhamos conhecidos os pesos dos su


nos, embora o agricultor no os conhea.
a
c
Os pesos dos animais so dados na tabela 6.3.
a
Vamos considerar que um su com menos de 75 kg obtenha um preo bastante inferior
no
c
na agroindstria. Sabemos que existe apenas 1 su nessa situao na populao, portanto,
u
no
ca
ca
a proporo, (), de su
ca
nos com peso inferior a 75 kg na populaao de 1/4=0,25, ou,
c e
25%. O agricultor deseja estimar esta proporo de su
ca
nos com peso inferior a 75 kg. Para
isso, ele decide selecionar uma amostra de 2 su
nos, com reposio e, usar a proporo
ca
ca
encontrada nesta amostra, como estimativa da proporo na populao. Isto nos sugere
ca
ca
algumas perguntas fundamentais:
c
quais as proporoes amostrais que o agricultor pode obter?
qual a probabilidade de cada uma?
qual a forma da distribuiao das proporoes amostrais?
c
c
Para responder a essas perguntas, precisamos construir a distribuio amostral das proca
poroes. Presumivelmente, o agricultor faria uma amostragem sem reposiao, pois no dec
c
a
sejaria pessar um mesmo su duas vezes. Para o nosso estudo, vamos considerar uma
no
amostragem com reposio, pois a populao e as amostras so muito pequenas. Na tabela
ca
ca
a
6.4 temos todas as amostras poss
veis de tamanho igual a dois su
nos. Observe, por exemplo,
para a amostra (A,A), que no temos uma ordenao nos resultados, pois s temos um su
a
ca
o
no
A, e isto implica numa unica amostra.

A distribuio amostral da proporao de su


ca
c
nos com peso abaixo de 75 kg, para n = 2,
ca:
p
0/2
1/2
2/2
P rob(P = p) 9/16=0,5625

6/16=0,3750

1/16=0,0625

A representaao grca da distribuio amostral da proporo de su


c
a
ca
ca
nos com peso inferior
a 75 kg, para amostras de tamanho 2, extra
das de uma populao com 4 su
ca
nos e, proporao
c
populacional igual a 1/4, dada na gura 6.4.
e

221

Tabela 6.4: Todas as amostras poss


veis de tamanho igual a dois, com reposio. As proca
poroes e as mdias amostrais.
c
e
Tamanho da Nmero de amostras Amostras Pesos Proporao su
u
c
nos Mdia peso
e
amostra
poss
veis
abaixo de 75 kg
de su
nos
2

N n = 42 = 16

A,B
A,C
A,D
B,C
B,D
C,D
B,A
C,A
D,A
C,B
D,B
D,C
A,A
B,B
C,C
D,D

68;80
68;84
68;87
80;84
80;87
84,87
80;68
84,68
87;68
84,80
87;80
87;84
68;68
80,;80
84;84
87;87

1/2
1/2
1/2
0/2
0/2
0/2
1/2
1/2
1/2
0/2
0/2
0/2
2/2
0/2
0/2
0/2

74,0
76,0
77,5
82,0
83,5
85,5
74,0
76,0
77,5
82,0
83,5
85,5
68,0
80,0
84,0
87,0

0,6

Probabilidades

0,5
0,4
0,3
0,2
0,1
0,0
0,0

Proporo populacional
0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

Propores amostrais

Figura 6.4: Distribuio amostral da proporao de su


ca
c
nos com peso abaixo de 75 kg, tamanho
da amostra igual a 2.

222

Como a nossa amostra de tamanho dois, imposs obter uma proporo amostral
e
e
vel
ca
com valor igual a 25%. Porm, podemos observar que a verdadeira proporo (populacional)
e
ca
encontra-se entre 0% e 50%, que so os valores que apresentam as maiores probabilidades
a
de ocorrncia na amostra. A forma da distribuio assimtrica.
e
ca e
e
Como vimos no estudo de variveis aleatrias discretas, contagens ou propores, podem
a
o
co
ser estudadas pela distribuiao binomial. Vamos, para a situaao em estudo, vericar se as
c
c
pressuposioes do modelo binomial so atendidas.
c
a
c
1) Temos duas repetioes (n = 2).
2) Em cada repetiao, somente temos duas posssibilidades: abaixo ou acima de 75 kg.
c
3) As probabilidades permanecem constantes em todas as repeties do experimento (amostrgem
co
com reposiao).
c
4) Os resultados das repetioes so independentes (amostra aleatria).
c
a
o
Portanto, as pressuposies do modelo binomial so todas atendidas. Da tabela da disco
a
tribuio binomial (Apndice 1), para n = 2 e = 0, 25, obtemos:
ca
e
P (X = 0) = P rob(p = 0, 00) = 0, 5625;
P (X = 1) = P rob(p = 0, 50) = 0, 3750;
P (X = 2) = P rob(p = 1, 00) = 0, 0620.
Como podemos ver, obtemos exatamente os mesmos valores da distribuiao amostral das proc
poroes. Assim, na prtica, no preciso construir empiricamente a distribuiao amostral
c
a
a e
c
das propores, pois, a mesma, representada pela distribuiao binomial. Portanto, esco
e
c
tas distribuies representam uma situaao real. Como veremos, uma outra distribuio
co
c
ca
amostral muito utilizada a distribuio normal.
e
ca
A partir de agora, construiremos as distribuies amostrais utilizando diretamente a
co
tabela da distribuio binomial.
ca
A distribuiao amostral da proporo de su
c
ca
nos com peso abaixo de 75,0 kg, para uma
amostra de tamanho n = 3, dada por:
e
p

0/3

P rob(P = p) 0,4219

1/3

2/3

3/3

0,4219

0,1406

0,0156

A representaao grca desta distribuiao dada na gura 6.5.


c
a
c e

223

0,55

Probabilidades

0,45
0,35
0,25
0,15

0,05
-0,05
0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

Propores amostrais

Figura 6.5: Distribuio amostral das proporoes para amostras de tamanho 3.


ca
c
0,55

Probabilidades

0,45
0,35
0,25
0,15
0,05
-0,05
0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

Propores amostrais

Figura 6.6: Distribuio amostral das proporoes para amostras de tamanho 4.


ca
c
Observa-se, logicamente, que os valores se alteraram. Vericamos que h uma probabila
idade de 42% de o valor da proporao amostral ser igual a 0,3333, o que est prximo da
c
a o
proporao verdadeira que de 0,25. A probabilidade de se obter um valor de p = 1, 00
c
e
e
praticamente nula. Observe que a forma da distribuio tambm est mudando.
ca
e
a
A distribuio amostral da proporo de su
ca
ca
nos com peso abaixo de 75 kg para um
tamanho de amostra n = 4, dada por:
e
p

0/4

P rob(P = p) 0,3164

1/4

2/4

3/4

4/4

0,4219

0,2109

0,0469

0,0039

A representaao grca desta distribuiao dada na gura 6.6.


c
a
c e
Vericamos que existe uma probabilidade de 42% de a proporo amostral ser igual a
ca

224

Probabilidades

0,30
0,24
0,18
0,12
0,06

0,00
0,0

0,2

0,4

0,6

0,8

1,0

Propores amostrais

Figura 6.7: Distribuio amostral das proporoes para amostras de tamanho 10


ca
c
proporao populacional, e a probabilidade de maior valor. Observe que a variabilidade
c
e
amostral est diminuindo, por exemplo, a probabilidade de encontrarmos uma proporo
a
ca
amostral igual a 1,00 praticamente nula, vericamos que 0 p 0, 75. Outro fato impore
tante, que vale a pena salientar, que a forma da distribuio est mudando, observamos que
e
ca
a
a medida que aumentamos o tamanho da amostra, a distribuio amostral das propores
ca
co
vai tomando a forma de sino (distribuio normal).
ca
Bem, no podemos retirar amostras com tamanho maior que quatro, pois a nossa popa
ulao constitu por somente quatro su
ca e
da
nos, mas podemos, de forma intuitiva, vericar
que a medida que o tamanho da amostra aumenta, a distribuiao amostral das propores
c
co
se aproxima da distribuio normal. Para car mais claro esta tendncia, suponha que a
ca
e
populaao seja constitu de 50 su
c
da
nos, e o agricultor vai retirar amostras de 10 su
nos,
vamos supor que a proporao populacional continua sendo a mesma, isto , = 0, 25. A
c
e
distribuio de probabilidades dada por:
ca
e
p

0/10

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

P rob(P = p)

0,0563

0,1877

0,2816

0,2503

0,1460

0,0584

0,0162

0,0031

0,0004

0,0000

0,0000

A representaao grca desta distribuiao dada na gura 6.7. Observa-se, claramente, que
c
a
c e
a medida que n aumenta, temos:
a distribuiao amostral das proporoes aproxima-se da distribuiao normal, com =
c
c
c
0, 25;
a variabilidade amostral diminui, isso implica que amostras grandes tem forte tendncia
e
a fornecer uma estat
stica amostral prxima do verdadeiro valor do parmetro popuo
a
lacional;
as propores amostrais prximas a 0,25 so as que apresentam maiores probabilidades
co
o
a
de ocorrncia.
e

225

Para n sucientemente grande, e nem muito prximo de 0 (zero) ou de 1 (um), digamos


o
entre 0,10 e 0,90, a aproximao da distribuio normal d bons resultados. Na prtica, uma
ca
ca
a
a
sugesto vericar se n 5 e n(1 ) 5. Assim, podemos considerar a distribuiao
a e
c
amostral de P do seguinte modo:
P N

(1 )
n

Portanto, a mdia das proporoes amostrais sempre igual a proporao populacional (P =


e
c
e
c
(1 )/n.
). O desvio padro da distribuiao amostral das propores dado por:
a
c
co e
Esses resultados so oriundos da distribuio binomial. Tambm, a distribuiao segue um
a
ca
e
c
modelo normal.
Quando a populaao nita e conhecemos o seu tamanho, representado pela letra N ,
c e
devemos vericar se o tamanho da amostra (n) maior ou igual a 5% do tamanho da
e
populaao (N ), ou seja, vericar a desigualdade, n 0, 05N . Neste caso, devemos proceder
c
a uma correao no desvio padro, do seguinte modo:
c
a
P =

(1 )
n

N n
.
N 1

A correao N n conhecida como correo para populao nita.


c
e
ca
ca
N 1
Em muitas situaes, o pesquisador est interessado no nmero de ocorrncias (n1 ) de
co
a
u
e
uma determinada varivel, ao invs da proporao. Com as mesmas consideraes feitas para
a
e
c
co
uma proporao, podemos considerar o nmero de ocorrncias como tendo uma distribuio
c
u
e
ca
normal, com mdia e desvio padro dados por:
e
a
E(n1 ) = n

n1 =

n(1 ).

Quando a populaao for considerada nita (n 0, 05N ), procedemos a correo no desvio


c
ca
padro, que torna-se:
a
N n
.
n1 = n(1 )
N 1
Exemplo 1. Um processo de encher garrafas de vinho d em mdia 10% de mal enchidas.
a
e
Extra uma amostra de 125 garrafas, qual a probabilidade de que a proporao amostral
da
c
de garrafas mal enchidas esteja entre 9% e 11%?
Como n grande, no prximo de zero e n = 125(0, 10) = 12, 5, podemos considerar
e
a e o
a distribuio normal para aproximar probabilidades binomiais. Nesse exemplo, a populao
ca
ca
innita, pois ela formada por todas as garrafas enchidas e que viro a ser enchidas,
e
e
a

226

portanto, no h necessidade de se fazer a correao para populaao nita no desvio padro.


a a
c
c
a
No exemplo, a mdia e o desvio padro valem:
e
a
= 0, 10 (1 ) = 1 0, 10 = 0, 90 P =

(1 )
=
n

0, 10(0, 90)
= 0, 0268.
125

Vamos calcular os valores de z1 e z2 :


z1 =

0, 09 0, 10
p
=
= 0, 37.
P
0, 0268

z2 =

0, 11 0, 10
p
=
= 0, 37.
P
0, 0268

Portanto, a probabilidade vale:


P rob(0, 09 P 0, 11) = P rob(0, 37 z 0, 37) = 2P rob(0 z 0, 37) = 2(0, 1443) = 0, 2886 = 28, 86%.

Exemplo 2. Sabe-se que 5% das latas de pssego industrializados pela indstria A, em


e
u
uma jornada de trabalho, apresentam peso drenado fora dos padres. Qual a probabilidade
o
de, em uma amostra de 200 latas, apresentarem-se fora dos padres: a) 6% ou mais? e b)
o
4% ou menos?
Temos n sucientemente grande e n = 200(0, 05) = 10, portanto, em termos prticos,
a
podemos usar a distribuiao normal como aproximaao da distribuio binomial. Vamos
c
c
ca
considerar a populao como sendo innita. A mdia e o desvio padro so dados por:
ca
e
a a
= 0, 05

(1 ) = (1 0, 05) = 0, 95

P =

0, 05(0, 95)
= 0, 0154.
200

Para o item a) a probabilidade vale:


z=

0, 06 0, 05
= 0, 65.
0, 0154

P rob(P 0, 06) = P rob(z 0, 65) = 0, 5 P rob(0 z 0, 65) = 0, 5 0, 2422 = 0, 2578 = 25, 78%.

Para o item b) a probabilidade vale:


z=

0, 04 0, 05
= 0, 65.
0, 0154

P rob(P 0, 04) = P rob(z 0, 65) = 0, 5 0, 2422 = 0, 2578 = 25, 78%.


Exemplo 3. (Bussab & Morettin, 1987). Um procedimento de controle de qualidade
foi planejado para garantir um mximo de 10% de itens defeituosos na produao. A cada 15
a
c

227

minutos sorteia-se uma amostra de 50 peas e, havendo mais de 15% de defeituosas, pra-se
c
a
a produao para vericaoes. Qual a probabilidade de uma parada desnecessria?
c
c
a
Temos que n = 50(0, 10) = 5. Obtemos para a mdia e o desvio padro os seguintes
e
a
valores:
= 0, 10

(1 ) = (1 0, 10) = 0, 90

P =

0, 10(0, 90)
= 0, 0424.
50

Os diferentes valores de p so obtidos devido ` variaao casual na amostra. Mesmo a


a
a
c
populaao tendo uma proporao = 10%, podemos obter uma amostra com p acima de
c
c
15% devido puramente ao azar de selecionar a amostra. Por isso a pergunta acima: qual
a probabilidade de uma parada desnecessria? ou seja, encontrar um p 15% quando, na
a
verdade, temos = 10%.
0, 15 0, 10
z=
= 1, 18.
0, 0424
P rob(P 0, 15) = P rob(z 1, 18) = 0, 1190 = 11, 90%.
Exemplo 4. (Bussab & Morettin, 1987). Suponha que a produo do exemplo
ca
anterior esteja sob controle, isto , = 0, 10, e que os itens sejam vendidos em caixas com
e
100, qual a probabilidade de que uma caixa no tenha nenhum defeituoso?
a
Se um cliente encontrar mais do que 18 defeituosos ele recebe uma caixa grtis. Qual a
a
proporao esperada de clientes bonicados?
c
A mdia e o desvio padro valem:
e
a
= n = 100(0, 10) = 10 =

n(1 ) =

100(0, 10)(0, 90) = 3.

0, 50 10
0, 5 10
z
3
3
= P rob(3, 50 z 3, 17) = 0, 49977 0, 49924 = 0, 00053.

P rob(Y = 0, 0) = P rob(0, 50 X 0, 50) = P rob

Para a segunda pergunta, temos:


18, 5 10
)
3
= P rob(z 2, 83) = 0, 5 P rob(0 z 2, 83) = 0, 00233 = 0, 233%.

P rob(Y 19) = P rob(X 18, 5) = P rob(z

6.5.2

Distribuio Amostral da Mdia


ca
e

Passamos agora a estudar a distribuio amostral da estat


ca
stica X, a mdia amostral.
e

228

Para mostrarmos os principais resultados (propriedades) de uma distribuiao amostral de


c
mdias, retornemos ao exemplo da populaao de 4 su
e
c
nos, e que, o agricultor, agora, deseja
avaliar o peso mdio dos su
e
nos.
Vamos, aqui, novamente apresentar os dados de pesos de su
nos.
Su
nos Peso (kg)
A
B
C
D

68
80
84
87

A mdia, a varincia e o desvio padro populacional valem:


e
a
a
=

x/N = 79, 75 kg.

(x )2
208, 75
=
= 52, 18 kg 2 .
4
N
2 =
=

52, 18 = 7, 22 kg.

2 =

Com o bojetivo de avaliar a mdia populacional ( = 79, 75 kg), o agricultor decide


e
selecionar uma amostra aleatria simples de tamanho 2, com reposiao. Vamos vericar
o
c
quais os valores que o agricultor pode obter para a mdia da amostra. Para essa nalidade,
e
vamos retirar todas as poss
veis amostras de tamanho n = 2, com reposio, da populaao
ca
c
de 4 su
nos e, para cada uma das amostras, calcular a mdia, x. Portanto, vamos usar a
e

estat
stica amostral X. Os resultados poss
veis so apresentados na tabela 6.4.
a
Os valores da mdia, varincia e desvio padro da distribuiao amostral das mdias valem:
e
a
a
c
e

X = E(X) =

1
68 +
16

xp() =
x

2
74 + ... +
16

1
87
16

= 79, 75 kg.

2
X

k
x
i=1 (i

)2 ni
n
1(68 79, 75)2 + 2(74 79, 75)2 + ... + 1(87 79, 75)2
=
16
2
= 26, 09 kg .

X =

26, 09 = 5, 1078 kg.

Observamos que o valor da mdia da distribuio amostral das mdias o mesmo da


e
ca
e
e
mdia da populaao (X = ). A varincia da distribuiao amostral das mdias pode ser
e
c
a
c
e

229

3,0

Freqncias absolutas

2,5
2,0
1,5
1,0

0,5
0,0
66

70

74

78

82

86

90

Mdias amostrais

Figura 6.8: Distribuio amostral das mdias para amostras de tamanho 2


ca
e
obtida por:

52, 18
2
=
= 26, 09 kg 2 .
n
2
Portanto, o desvio padro da mdia dado por:
a
e
e
2
X =

X = .

No exemplo, o erro padro da mdia vale, X = 7,2236 = 5, 1078 kg.


a
e

2
Mostramos como ca a mdia e a varincia da distribuiao amostral da mdia para
e
a
c
e
uma amostra de tamanho n = 2. Agora, Vamos vericar a forma da distribuio amostral.
ca
A representao grca dada na gura 6.8. A mdia verdadeira encontra-se entre as
ca
a
e
e
mdias amostrais com maior frequncia de ocorrncia. Como o tamanho da amostra muito
e
e
e
e
pequeno, no podemos concluir sobre o modelo da distribuiao amostral das mdias. Isto
a
c
e
ser feito quando o tamanho da amostra for maior.
a
Considerando amostras aleatrias simples de tamanho n = 3, selecionadas com reposio,
o
ca

230

da populaao com 4 su
c
nos, temos os seguintes resultados:
Mdia Frequncia
e
e

Mdia Frequncia
e
e

68,00
72,00
73,33
74,33
76,00
77,33
78,33
78,67
79,67
80,00

80,67
81,33
82,33
82,67
83,67
84,00
84,67
85,00
86,00
87,00

1
3
3
3
3
6
6
3
6
1

3
3
3
3
6
1
3
3
3
1

A mdia, a varincia e o desvio padro da distribuiao amostral das mdias apresentam os


e
a
a
c
e
valores:
X = 79, 75 kg.

2
X =

2
52, 18
=
= 17, 40 kg 2 .
n
3

X =

17, 40 = 4, 17 kg.

Sabemos, que a mdia e a varincia de uma distribuiao amostral de mdias sempre vo ser
e
a
c
e
a
dadas por:
X = .

2
.
n
Quando ocorrer a desigualdade, n 0, 05N , devemos proceder a correo para populaao
ca
c
nita do desvio padro, o qual torna-se:
a
2
X =

X =

N n
.
N 1

A representaao grca da distribuio amostral das mdias, para um tamanho de amostra


c
a
ca
e
igual a 3, dada na gura 6.9.
e
Observamos que a medida que aumentamos o tamanho da amostra, (n), as mdias
e
amostrais vo tendendo a concentrar-se em torno da mdia verdadeira (). Os casos exa
e
tremos, de mdias muito grandes ou pequenas, vo passando a ter pouca frequncia de
e
a
e

231

Freqncias absolutas

6
5
4
3
2
1
0
66

70

74

78

82

86

90

Mdias amostrais

Figura 6.9: Distribuio amostral das mdias para amostras de tamanho 3


ca
e
ocorrncia. Podemos armar que, para n sucientemente grande, o histograma aproximae
se da forma da distribuiao normal, isto , a distribuiao amostral das mdias pode ser
c
e
c
e
representada pela distribuio normal.
ca
A seguir passamos a analisar o comportamento dos histogramas das mdias para vrias
e
a
distribuies de X, quando vamos aumentando o tamanho da amostra. Na gura 6.10 tm-se
co
e
os histogramas correspondentes ` distribuiao amostral das mdias de algumas populaes,
a
c
e
co
X.
Os exemplos da gura 6.10, nos indicam que quando o tamanho da amostra vai aumentando, independente da distribuio da varivel aleatria cont
ca
a
o
nua X, a distribuiao amostral
c
das mdias aproxima-se cada vez mais de uma distribuiao normal. A rapidez dessa cone
c
vergncia depende da distribuiao da populaao original da qual a amostra retirada. Se a
e
c
c
e
populaao original prxima da normal, ou uniforme, sua convergncia rpida. J, se a
c
e o
e
e a
a
distribuio da populao tem a forma de um V (bimodal) ou assimtrica, essa convergncia
ca
ca
e
e
mais demorada. Este resultado, fundamental na teoria de inferncia estat
e
e
stica, provado
e
pelo teorema central do limite. Esse teorema diz o seguinte:
se a populao sobre a qual desejamos selecionar uma amostra aleatria simples (X1 , ..., Xn ),
ca
o
tem distribuiao normal, a distribuiao amostral das mdias tambm ser normal, para
c
c
e
e
a
qualquer tamanho de amostra, com mdida e varincia 2 /n;
e
a
se a populao sobre a qual desejamos selecionar uma amostra aleatria simples (X1 , ..., Xn ),
ca
o
no tem distribuiao normal, a distribuiao amostral das mdias ser aproximadamente
a
c
c
e
a
2
normal com mdia e varincia /n, para amostras sucientemente grandes. Como
e
a
sugesto, aceita-se que para amostras com mais de 30 observaes a aproximaao j
a
co
c a

232

Figura 6.10: Histogramas da distribuio amostral das mdias para diversas populaoes,
ca
e
c
para diversos tamanhos de amostras. Fonte: Bussab & Morettin (1987)

233

pode ser considerada muito boa.


Resultados importantes sobre a distribuio amostral das mdias
ca
e
1. A mdia da distribuiao amostral das mdias sempre igual a mdia da populao,
e
c
e
e
e
ca
isto , X = .
e
2. O desvio padro da distribuiao amostral das mdias dado por:
a
c
e
e

X = .

n
Quando for vericada a desigualdade, n 0, 05N , ou seja, a amostra representa 5%
ou mais da populaao, procedemos a correo para populaao nita no desvio padro,
c
ca
c
a
cando:

N n
X =
.

n N 1
e
c
3. Quando o tamanho da amostra sucientemente grande, independente da distribuiao
da populaao bsica, a distribuiao amostral das mdias, aproxima-se cada vez mais
c a
c
e
de uma distribuiao normal.
c
Exemplo 1. Uma nova raao para aumento de peso deve ser aplicada a uma amostra
c
aleatria de 25 frangos (n = 25), de um grande lote (o lote a populao). Se se espera que
o
e
ca
seja de 2 kg o desvio pado () do ganho de peso no per
a
odo de um ms, qual a probabilidade
e

de que a mdia dessa amostra (X), dira da mdia de todo o lote () em mais do que 0,5
e
e
| 0, 5)? considerando que os frangos tratados com a nova rao no tem um
kg (| X
ca a
ganho de peso maior do que os tratados com a rao padro.
ca
a
Inicialmente, passamos a calcular o valor da varivel z.
a
z=

0, 5
x

0, 5
= =
= 1, 25.
X
0, 4

2/ 25

Portanto, a probabilidade pedida vale (lembre do mdulo):


o
P (z 1, 25) + P (z 1, 25) = 2P (z 1, 25)
= 0, 2112.

(6.1)

A probabilidade de X diferir de em mais do que 0,5 kg, devido ao acaso, de 21,12%.


e
Exemplo 2. Suponha que o peso de 2500 alunos da UFSC normalmente distribu
e
do
com mdia de 60,5 kg e desvio padro de 12 kg. Qual ser a mdia e o desvio padro da
e
a
a
e
a

234

distribuio amostral da mdia, na hiptese de utilizar amostras de tamanho n = 36? Qual


ca
e
o
a probabilidade da mdia de uma amostra de tamanho n = 36 se encontrar: a) entre 58 e
e
e
62 kg? b) abaixo de 55 kg? e c) acima de 65 kg?
A mdia e o desvio padro da distribuiao amostral valem:
e
a
c
X = 60, 5 kg

12
X = = 2 kg.

36

Para o item a) a probabilidade vale:


z1 =

58 60, 5
= 1, 25
2

z2 =

62 60, 5
= 0, 75.
2

P (58 X 62) = P (1, 25 z 0, 75)


= 0, 39435 + 0, 27337
= 0, 6677.
Item b),
z=

55 60, 5
= 2, 75
2

P (X 55) = P (z 2, 75)
= 0, 0030.
Item c),
z=

65 60, 5
= 2, 25
2

P (X 65) = P (z 2, 25)
= 0, 0122.
Exerc
cios resolvidos
1. O governo coleta uma amostra aleatria de 400 estudantes da UFSC, para obter uma
o
indicao dos que so a favor do ensino superior pago. Determine a probabilidade de obter
ca
a
uma proporo amostral que dira por mais de 3% da proporao populacional de estudantes
ca
c
que so a favor do ensino pago, se esta proporao 10%.
a
c e

0, 07 0, 10
0, 13 0, 10
P rob(0, 07 P 0, 13) = P rob
z
0,10(0,90)
400

= P rob(2 z 2) = 0, 9545.

235

0,10(0,90)
400

Portanto, a resposta 1-0,9545=0,0455=4,55%.


e
2. Os camares machos da espcie Penaeus paulensis para serem considerados adultos
o
e
devem apresentar um comprimento total maior ou igual a 22 mm. Se numa populao de
ca
camares machos, a mdia dos comprimentos foi igual a = 27, 3mm e desvio padro =
o
e
a
7, 8mm, portanto, considerada como sendo uma populaao adulta. a) Qual a probabilidade
c

de, para uma amostra de n = 35 camares, obtermos uma mdia X < 22mm? b) Qual deve
o
e

ser o valor para a mdia do comprimento total, , a m de que a P (X 22) = 0, 05 = 5%?


e
22 27, 3

= P (z 4, 02)
7, 8/ 35
= 0, 5 0, 49997 = 0, 00003 = 0, 003%.

P (X 22) = P

b) Para uma rea de 5%, no lado esquerdo da curva, o valor de z -1,645.


a
e
1, 645 =

6.6

22
= 24, 1688mm.
1, 3184

Exerc
cios Propostos

1. Se vamos extrair amostras de n=100 observaes de uma populaao muito grande, em


co
c
que a proporao populacional 20%, que percentagem de propores amostrais poderemos
c
e
co
esperar nos intervalos abaixo? a) 16% a 24% b) maior que 24%.
2. A proporo de estmatos da epiderme abaxial da folha de macieira da variedade M-9
ca
o
com tamanho acima de um determinado valor = 0, 12 = 12%. Extra uma amostra de
e
da
35 folhas, qual a probabilidade de que a proporao esteja entre 8% e 13%?
c
3. Sabe-se que 46% de peixes Xenomelaniris brasiliensis, na localidade da praia da
Barra da Lagoa, Florianpolis, apresentam comprimento total acima de 50mm. Qual a
o
e
probabilidade de uma amostra aleatria com 35 peixes apresentar mais que 53% ou menos
o
que 40% de peixes com comprimento total acima de 50 mm?
4. Um distribuidor de sementes determina, atravs de testes, que 5% das sementes no
e
a
germinam. Ele vende pacotes de 200 sementes com garantia de 90% de germinao. Qual a
ca
probabilidade de um pacote no satisfazer a garantia?
a
5. Os n
veis de glutationa na regio do cerebelo em ratos apresentam mdia de 1,7M
a
e
e desvio padro de 0,4M . Os n
a
veis de glutationa de uma amostra de 8 ratos foram
mensurados. A mdia da amostra usada para decidir se os ratos esto estressados. Aplicae
e
a
se a seguinte regra de deciso: se o n de glutationa da amostra de 8 ratos igual ou maior
a
vel
e
do que 2,0 M os ratos so considerados estressados. Qual a probabilidade de se considerar
a
os ratos como estressados?

236

6. Suponha que o rendimento de milho, em kg/ha, no Oeste Catarinense, uma varivel


e
a
normalmente distribu
da, com mdia de 7069 kg/ha e desvio padro de 593,15 kg. Que
e
a
valores espera-se encontrar para a mdia e o desvio padro da distribuiao amostral das
e
a
c
mdias, na hiptese de utilizar amostras de tamanho n=36? Qual a probabilidade da
e
o
e
mdia de uma amostra se encontrar: a) entre 6809 e 7395 kg/ha; b) abaixo de 6816 kg/ha;
e
c) acima de 7389 kg/ha.
7. O nmero de hemcitos/l de hemolinfa (THC) em fmeas de camaro Macrobrachium
u
o
e
a
rosemberguii normalmente distribu com mdia () de 18.000 e desvio padro () de 5125.
e
da
e
a
Em uma amostra aleatria de n = 30 fmeas, qual a probabilidade de que o nmero mdio
o
e
u
e
de hemcitos/l de hemolinfa (THC) seja maior do que 19.000?
o
8. O nmero de estmatos da epiderme abaxial em reas aleatrias de 0,24 mm2 de
u
o
a
o
macieira da variedade M9 normalmente distribu com mdia = 159, 8 e desvio padro
e
da
e
a
de = 34, 5582. Em uma amostra aleatria de n = 35 folhas, qual a probabilidade de que
o
o nmero mdio de estmatos seja menor do que 140?
u
e
o
9. Uma varivel aleatria X tem distribuio normal, com mdia 100 e desvio padro 10.
a
o
ca
e
a
e
a) Qual a P (90 < X < 110)? b) Se X a mdia de uma amostra de 16 elementos retirados
e
< 110).
dessa populaao, calcule P (90 < X
c
10.(Bussab & Morettin, 1987). Um professor d um teste rpido, constante de 18 questes
a
a
o
do tipo certo-errado. Para testar a hiptese de o estudante estar adivinhando a resposta, ele
o
adota a seguinte regra de deciso:Se 12 ou mais esto corretas, ele no est adivinhando.
a
a
a
a
Qual a probabilidade de rejeiao da hiptese de o estudante estar adivinhando a resposta,
c
o
quando, na realidade, ela verdadeira?
e

237

Avaliao dos Parmetros


ca
a

7.1

Introduo
ca

Estimaao o nome tcnico para o processo que consiste em utilizar os dados de uma
c e
e
amostra para avaliar parmetros populacionais desconhecidos, ou, como o prprio nome
a
o
indica, estimar os mesmos. Dentre as diversas caracter
sticas (parmetros) de uma populao
a
ca
que podem ser estimadas, ns vamos estudar as mais utilizadas, quais sejam: a mdia, a
o
e
proporo e o desvio padro.
ca
a
Um pesquisador sempre est desenvolvendo um processo de estimao. Talvez, os rea
ca
sultados estat
sticos apresentados neste cap
tulo, sejam os mais importantes para quem faz
pesquisa. Por exemplo, um Bilogo pode estar interessado na proporao de microncleos em
o
c
u
5000 clulas sangu
e
neas em peixes do genro bagre; um Agrnomo pode estar interessado na
e
o
estimao da produao de uma cultura ou de uma criaao. Outros exemplos, estimaao dos
ca
c
c
c
preju
zos causados pelo ataque de uma praga ou doena; estimar o dimetro de caramujos;
c
a
estimar o tamanho de Lulas encontradas no trato digestivo de Atuns; tamanho de crustceos
a
da classe Malacostraca e sub-classe Eumalacostraca, popularmente conhecida com o nome
de Caprelas; estimativas de parmetros estat
a
sticos genticos (varincia gentica, ambiental,
e
a
e
fenot
pica).

7.2

Propriedades dos Estimadores

Um estimador uma estat


e
stica amostral, isto , vericada na amostra, que ser usada
e
a
para a estimaao de um parmetro populacional. As estat
c
a
sticas amostrais mais frequntes
e

so a mdia, a proporo e o desvio padro, representados por: X, P e S, respectivamente.


a
e
ca
a

Os parmetros so representados pelas letras gregas, , e , respectivamente. E desejvel


a
a
a
que os estimadores apresentem certas propriedades, ou seja, certas qualidades. Dentre as
propriedades desejveis de um estimador podemos citar:
a
no-tendencioso ou no-viesado, quer dizer, o estimador, em mdia, igual ao
a
a
e
e
o parmetro
parmetro populacional. Em termos formais, temos que: para e ,
a
a
e o estimador de uma caracter
stica qualquer, respectivamente, a no tendenciosidade
a
= , isto , sua mdia deve ser igual ao parmetro. Por exemplo,
implica que E()
e
e
a

E(X) = X = e E(P ) = P = ;

238

consistente, quer dizer, que para amostras grandes, a diferena entre o estimador e o
c
parmetro tende a ser pequena, isto , a varincia tende a zero, e o estimador noa
e
a
e a
2

viesado. Por exemplo, a V ar(X) = /n, indica que quando n tende para o innito,

a V ar(X) tende para zero. Da mesma forma, a V ar(P ) = (1 )/n, tende para

zero quando n tende para o innito. Portanto, X e P so estimadores consistentes dos


a
parmetros e , respectivamente.
a
Observe que essas propriedades so vlidas para o estimador no conjunto de todas
a a
as amostras poss
veis; pode acontecer que, para uma dada amostra em particular,
o estimador esteja bem distante do parmetro. As prximas duas propriedades so
a
o
a
importantes para o caso de termos mais de um estimador para o mesmo parmetro, e
a
queremos saber qual deles o melhor;
e
preciso, tambm conhecida como eciente, quer dizer, deseja-se que o estimador seja
e
altamente concentrado, isto , que tenha pequena varincia (cada observaao prxima
e
a
c
o
de sua mdia). Portanto, dados dois estimadores, o que possuir menor varincia o
e
a
e
mais preciso ou eciente. Por exemplo, para uma distribuiao normal, pode-se mostrar
c
que a mdia 57% mais eciente do que a mediana para a estimaao da mediana da
e
e
c
populao.
ca
o
vel
a
e
acurado, quer dizer, que o estimador seja o mais prximo poss do parmetro, isto ,

que o erro amostral, e = , seja o menor poss


vel. Cada observaao o mais prximo
c
o
do parmetro. Um estimador acurado no-viesado e tem varincia pequena.
a
e a
a
O exemplo a seguir, tirado de Bussab & Morettin (1987), serve bem para ilustrar as
propriedades de um estimador. No exemplo, supe-se que desejamos comprar um rie e,
o
dentre muitos, foram selecionados 4 deles, denominados de A, B, C e D. Com o objetivo
de test-los, foram dados 15 tiros com cada um deles. A representao grca dada na
a
ca
a
e
gura 7.1. Com o objetivo de selecionar uma arma dentre as quatro, devemos adotar alguns
critrios. Os ries B e D so viesados, isto , os tiros esto deslocados do alvo, alm disso,
e
a
e
a
e
o rie B tem pouca preciso. O rie A no viesado, porm, apresenta baixa preciso, isto
a
a e
e
a
, os tiros esto muito espalhados. Os ries A, B e D so pouco acurados (viesados e/ou
e
a
a
baixa preciso), isto , os tiros no acertam o alvo. De acordo com esses critrios o rie
a
e
a
e
selecionado seria o C, pois ele acurado (no-viesado e preciso).
e
a

Os estimadores X, P e S atendem `s suposioes acima, com excesso do desvio padro


a
c
a
a
(S) que para ser um estimador no-viesado de devemos usar n 1 no denominador, ao
a

239

(a) Rie A: no-viesado,


a
pouco preciso, pouco acurado

(b) Rie B: viesado, pouco


preciso e pouco acurado

(c) Rie C: no-viesado, basa


tante preciso e acurado

(d) Rie D: viesado, bastante


preciso e pouco acurado

Figura 7.1: Resultados de 15 tiros dos ries A, B, C e D (ilustrao das propriedades dos
ca
estimadores). Fonte: Bussab & Morettin (1987).

240

invs de n. Lembre-se que o desvio padro amostral calculado por:


e
a
e
s=

n
i=1 (xi

x)2

.
n1

Se desejamos estimar a proporao populacional , intuitivo pensarmos em calcular


c
e
a proporao com os dados da amostra, isto , calcular a proporao de favorveis a um
c
e
c
a
determinado evento na amostra. Porm, existem situaoes que no se tem uma sugesto, to
e
c
a
a a
clara, de qual estimador que deve ser usado. Por exemplo, um experimento foi instalado
e
de acordo com o delineamento inteiramente casualizado. Neste delineamento as unidades
experimentais so as mais homogneas poss
a
e
veis, portanto, espera-se que a variao seja
ca
devida ao fator em estudo. Como exemplos de fatores de interesse podemos citar: locais,
variedades, espcies, dietas, etc. O modelo matemtico desse delineamento dado por:
e
a
e
y =+ +
onde y a caracter
e
stica que estamos interessados, por exemplo, comprimento do corpo de
um animal; uma constante; o efeito do fator em estudo e so pequenas variaoes
e
e
a
c
que ocorrem no experimento, pois o pesquisador no tem condioes de controlar em 100%
a
c
todas as variveis do experimento. O pesquisador tem interesse em estimar os parmetros
a
a
e . Para estimar , uma sugesto usar a mdia geral do experimento (m). Para estimar
a e
e

, o que devemos usar? Demonstra-se que a estimativa do i-simo n do fator em estudo


e
vel
dado por:
e
Total do i-simo n do fator
e
vel
m.

i =

o de repetioes
n
c

7.3

Mtodos para Encontrar Estimadores


e

Pelos fatos observados na seo anterior, podemos concluir que necessrio que existam
ca
e
a
mtodos apropriados para encontrarmos os estimadores dos parmetros em estudo. Para
e
a
resolver o problema de como encontrar os estimadores mais adequados, os dois mtodos mais
e
utilizados so: 1) mtodo dos mnimos quadrados e 2) mtodo da mxima verossimilhana.
a
e

e
a
c
Vamos apresentar o mtodo da mxima verossimilhana.
e
a
c

Mtodo da Mxima Verossimilhana


e
a
c
Suponha, por exemplo, que dentre n = 3 sementes em teste, obtemos 2 sucessos (duas
sementes germinaram) e 1 fracasso (uma semente no germinou). Vamos considerar que a
a

241

probabilidade de uma semente germinar , onde 0 1. Vamos denir a varivel X


e
a
como sendo o nmero de sementes que germinaram. O que devemos utilizar como estimador
u
de ? Este um experimento binomial (verique as pressuposioes do modelo binomial), e
e
c
a sua funao de probabilidade dada por:
c
e
P (X = k) =

n k
(1 )nk .
k

Para n = 3 e k = 2, temos:
P (X = 2) =

3 2
(1 )1 = 3 2 (1 ).
2

Vamos chamar esta expresso de funo de mxima verossimilhana e a representemos por:


a
ca
a
c
L() = 3 2 (1 ).

(7.1)

Queremos encontrar o valor de que maximiza a funo 7.1. O procedimento para esse
ca
m o que veremos a seguir. Calculando-se a derivada de L() e igualando-se a zero temos:
e
L () = 2(1 ) + 2 (1)
= 2(1 ) 2
= 2 2 2 2
= 2 3 2
= (2 3) = 0
a
do que segue que = 0 ou = 2/3. E fcil ver que o ponto de mximo p = 2/3, basta
a
e
substituir estes dois valores de em 7.1. Portanto, o estimador de mxima verossimilhana
a
c
p = 2/3. Podemos chegar a esta mesma concluso encontrando-se o ponto cr
e
a
tico, calcular
a derivada segunda, e observar se temos um ponto de mximo (o valor da derivada segunda,
a
no ponto cr
tico, negativo). O ponto cr
e
tico dado por:
e
(2 3) = 0 2 3 = 0 = 2/3.
A derivada segunda, em relao a , ca:
ca
(2 3) + (3) 2 6(2/3) = 2.
Como a segunda derivada negativa, temos que p = 2/3 ponto de mximo.
e

e
a

242

7.4

Estimativas Pontuais e Intervalares

De modo geral, vamos supor que os valores da populaao se distribuem segundo um


c
dado modelo probabil
stico, cujos parmetros so desconhecidos e, portanto, precisam ser
a
a
estimados. Lembramos que os estimadores possuem as suas correspondentes distribuioes
c
amostrais.
Na estimaao por ponto, procede-se a estimaao do parmetro atravs de um unico valor.
c
c
a
e

A obtenao dos estimadores X, P e S feita de forma direta, aplicando as denies de


c
e
co
mdia aritmtica, proporo e desvio padro aos dados da amostra, tomando-se o cuidado
e
e
ca
a
de que para o clculo do desvio padro usa-se n 1 no denominador. Assim, uma estimativa
a
a
pontual da mdia populacional, , a mdia aritmtica da amostra, x = ( x)/n. Uma
e
e
e
e

estimativa da proporo populacional , , obtida atravs do clculo da proporao na


ca
e
e
a
c
amostra, dada por: p = n1 /n, onde n1 o nmero de elementos na amostra que possuem
e
u
determinada caracter
stica desejada e n o nmero total de elementos na amostra. Como
e
u
estimativa do desvio padro populacional, , usa-se o desvio padro da amostra, s, dado
a
a
por: s =
(x x)2 /(n 1).

Na estimaao por intervalo, encontramos um limite inferior e um limite superior, os quais


c
vo formar um intervalo de valores, dentro do qual esperamos, com certo grau de conana,
a
c
que o verdadeiro valor do parmetro esteja inclu
a
do.
O intervalo de conana muito mais informativo do que uma estimativa atravs de um
c e
e
unico valor. Pois, no intervalo, alm de termos a informao pontual, tambm temos uma

e
ca
e
boa idia da variabilidade do parmetro. Devido a grande importncia dos intervalos de
e
a
a
conana passamos, agora, a estud-los com mais detalhes.
c
a

Intervalos de Conana
c
Como j tivemos oportunidade de estudar, o processo de obtenao de amostras aleatrias
a
c
o
produz estimativas cujos valores so diferentes do parmetro populacional, e tambm difera
a
e
entes entre si, gerando, o que denominamos de variabilidade amostral da estat
stica. A
variabilidade amostral estudada atravs das distribuioes amostrais. Ns j estudamos
e
e
c
o a
no cap
tulo 6, as distribuioes amostrais da mdia e da proporo, portanto, conhecemos o
c
e
ca
modelo probabil
stico, a mdia e a varincia das mesmas.
e
a
Devido a variabilidade amostral, importante que se faa uma estimativa intervalar para
e
c
um parmetro populacional. Essa estimativa intervalar nos d um intervalo dentro do qual
a
a
esperamos, com um certo grau de conana, que o parmetro se encontre.
c
a

243

Para compreendermos o processo de construao de um intervalo de conana, vamos


c
c
supor que tenhamos coletado uma amostra de 35 estudantes de graduao do curso de
ca
Cincias Biolgicas, e observamos a idade mdia de 23 anos. A questo que nos vem em
e
o
e
a
mente a seguinte: ser que este valor de x = 23 anos est prximo do verdadeiro valor (),
e
a

a o
desconhecido, isto , prximo da mdia de idade de todos os alunos do curso?
e
o
e
Para responder a esta pergunta, ns devemos levar em consideraao a distribuiao amostral
o
c
c
da mdia. Do estudo sobre distribuies amostrais, vimos que a distribuiao amostral das
e
co
c
mdias normal ou aproximadamente normal na maioria das situaoes prticas, para um
e
e
c
a
tamanho de amostra sucientemente grande.
Sendo normal, simtrica em torno da mdia , sabemos que 68% das mdias amostrais
e
e
e
esto a menos de 1 desvio padro de cada lado da mdia da distribuio amostral, que
a
a
e
ca
e
igual a mdia da populao, . Vejamos os clculos.
e
ca
a
P (1 Z 1) = P
= P
= P
= P

X
1
/ n

= 68%

1 X 1
= 68%
n
n

1 X + 1
= 68%
n
n

= 68%.
1 X + 1
n
n

A gura 7.2 mostra os resultados. Observamos que 32% das mdias amostrais estaro afase
a
tadas mais do que 1 desvio padro da verdadeira mdia (). Assim, se armarmos que a
a
e
mdia de uma amostra se afasta menos do que 1 desvio padro da mdia, a partir da mdia
e
a
e
e
verdadeira, podemos esperar estar certos 68% das vezes e, consequentemente, errados 32%
das vezes. Vimos, por construao que:
c

P ( 1/ n X + 1/ n) = 68%.
Desejamos um intervalo de conana para a mdia verdadeira, , portanto, podemos reescrc
e
ever a desigualdade entre parnteses, da seguinte forma:
e

P (X 1/ n X + 1/ n) = 68%.

Podemos armar, com uma conana de 68%, que a verdadeira mdia est entre X 1/ n.
c
e
a
Sabemos tambm, que 95% das mdias amostrais, estaro a menos de 1,96 desvios padres
e
e
a
o
de cada lado da mdia da distribuiao amostral, X = . Vejamos os clculos.
e
c
a

P (1, 96 Z 1, 96) = P

1, 96

244

X
1, 96
/ n

= 95%

+1

68%
16%

16%

Figura 7.2: Intervalo para uma mdia com 68% de conana


e
c
= P
= P
= P

= 95%
1, 96 X 1, 96
n
n

1, 96 X + 1, 96
= 95%
n
n

= 95%.
1, 96 X + 1, 96
n
n

A gura 7.3 mostra os resultados. Aqui, cerca de 5% da mdias estaro a mais de 1,96 desvios
e
a
padres da verdadeira mdia. Se zermos a armativa de que a mdia de uma amostra est
o
e
e
a
a menos de 1,96 desvios padres da mdia, a partir da mdia verdadeira, podemos esperar
o
e
e
estar certos 95% das vezes, conseqentemente, errados 5% das vezes. Da mesma forma que
u
anteriormente, estamos interessados no intervalo de conana para a mdia verdadeira, ,
c
e
portanto, vamos reescrever a desigualdade, da seguinte forma:

P (X 1, 96/ n X + 1, 96/ n) = 95%.

Temos 95% de conana de que a mdia verdadeira encontra-se no intervalo X 1, 96/ n.


c
e
A gura 7.4 mostra os resultados para um intervalo com 99% de conana. Aqui, cerca
c
de 1% das mdias estaro a mais de 2,58 desvios padres da verdadeira mdia. Se zermos
e
a
o
e
a armativa de que a mdia amostral est a menos de 2,58 desvios padres da verdadeira
e
a
o
mdia, podemos esperar estar certos 99% das vezes e, conseqentemente, errados 1% das
e
u
2, 58/n.
vezes. Neste caso, o intervalo de conana dado por: X
c e
Na verdade, ns nunca saberemos se uma mdia amostral est bem prxima, ou bem
o
e
a
o
afastada da mdia verdadeira, sendo assim, s poss construirmos um intervalo de cone
oe
vel

245

1,96

+ 1,96

95%
2,5%

2,5%

Figura 7.3: Intervalo para uma mdia com 95% de conana


e
c

2,58

+ 2,58
n

99%
0,5%

0,5%

Figura 7.4: Intervalo para uma mdia com 99% de conana


e
c

246

ana, dentro do qual esperamos que o verdadeiro valor da mdia populacional se encontre,
c
e
com um certo grau de conana.
c
Esse intervalo chamado de intervalo de conana, e a nossa conana de estarmos certos
e
c
c
de 1 (P robabilidade de erro), dada em porcentagem, e, por isso, chama-se de n de
e
vel
conana, representado pela letra grega (l-se gama). A probabilidade de erro, P (erro),
c
e
denomina-se de nvel de signicncia e representa-se pela letra grega (l-se alfa).

a
e
Do exposto, podemos estabelecer a forma do intervalo de conana para a mdia popuc
e

lacional, considerando que a estat


stica X avaliada com os dados da amostra x.
e

I.C.(;): z/2 X .
x

Onde, x a mdia da amostra; z/2 um valor obtido na tabela da distribuio normal


e
e
e
ca
a
ca
e
padro ao n de signicncia ; X o desvio padro da distribuio amostral da mdia
a
vel
a
e

ou erro padro da mdia, calculado por: X = / n.


a
e

Interpretao do Intervalo de Conana


ca
c
De uma populao com a caracter
ca
stica X de interesse do estudo, se retirarmos todas as
amostras poss
veis de tamanho n e, para cada uma das amostras, calcularmos o intervalo de

a
a
a
conana da forma: x 1, 96/ n, ento, 95% deles contero o parmetro populacional, .
c

A representao grca do signicado do intervalo de conana dada na gura 7.5.


ca
a
c e
Como vemos na gura 7.5, o intervalo pode ou no conter o parmetro , mas, pelo
a
a
exposto nesta seo, temos 95% de conana de que o intervalo contenha o verdadeiro valor
ca
c
do parmetro populacional.
a

Desse modo, tudo o que foi feito e dito aqui para o estimador X do parmetro , vlido
a
e a
tambm para qualquer outro estimador (por exemplo: P, S).
e
7.4.1

Intervalo de Conana para a Mdia da Populao


c
e
ca

Vamos dividir o estudo do intervalo de conana para a mdia da populaao, (), em


c
e
c
dois casos:
quando o desvio padro da populaao () conhecido;
a
c
e
quando o desvio padro da populaao () no conhecido
a
c
a e

247

/2=2,5%

1-

1,96
n

Populao
com uma
caracterstica
X de interesse

x1 1,96 x

Amostra 1

Amostra 2

x2 1,96 x

= 95%

/2=2,5%

+ 1,96
n

x1
x2

x1 + 1,96 x
x2 + 1,96 x

Amostra k

xk 1,96 x

xk

xk + 1,96 x

Figura 7.5: Interpretaao de um intervalo de conana para a mdia verdadeira, com conc
c
e
ana de 95% e varincia conhecida
c
a

Intervalo de Conana para a Mdia Populacional Quando o


c
e
Desvio Padro da Populao Conhecido
a
ca e
Para que o intervalo de conana tenha validade, deve-se vericar a suposio de que a
c
ca
distribuio amostral das mdias seja normal. Conforme vimos, isso verdade se a varivel
ca
e
e
a
X tem distribuiao normal, caso contrrio, ser aproximadamente normal, se a amostra for
c
a
a
sucientemente grande (n > 30).
Quando o desvio padro populacional conhecido, o intervalo de conana para a mdia
a
e
c
e
da populaao dado por:
c e
I.C.(;): x z/2 X ,

(7.2)

onde, X = / n.

Exemplo 1. A distribuiao dos pesos de pacotes de sementes de milho, enchidos autoc


maticamente por uma certa mquina, normal, com desvio padro () conhecido e igual a
a
e
a

248

200 g. Uma amostra de 15 pacotes retirada ao acaso apresentou os seguintes pesos, em kg,
20,05
19,89
20,09

20,10
19,70

20,25
20,30

19,78 19,69
19,93 20,25

19,90
20,18

20,20
20,01

Construir os intervalos de 95% e 99% de conana para o peso mdio dos pacotes de sementes
c
e
de milho.
Os valores da mdia e do desvio padro da mdia so:
e
a
e
a
0, 20
n = 15 x = 20, 02 X = = 0, 0516.

15
Como a populao conceitualmente innita (formada pelos pacotes enchidos e que viro a
ca
e
a
ser enchidos), no necessrio fazermos a correao no desvio padro. Assim, o intervalo de
a e
a
c
a
conana, ca:
c
I.C.(; 95%) : 20, 02 1, 96(0, 0516)
: 20, 02 0, 1012
: 19, 92 20, 12.
Portanto, temos 95% de conana, de que a mdia da populao esteja entre os pesos 19,92
c
e
ca
e 20,12 kg/pacote.
O intervalo com conana de 99% ca:
c
I.C.(; 99%) : 20, 02 2, 58(0, 0516)
: 20, 02 0, 1332
: 19, 89 20, 15.
Podemos armar, com 99% de conana, de que a mdia da populaao est entre os pesos
c
e
c
a
19,89 e 20,15 kg/pacote.

Intervalo de Conana para a Mdia Populacional Quando o


c
e
Desvio Padro da Populao Desconhecido
a
ca e
Na maioria das situaoes prticas, o desvio padro da populao, , no conhecido, usac
a
a
ca
a e
se, nesse caso, o desvio padro da amostra, s, como estimativa do desvio padro populacional,
a
a
substituindo-se nas frmulas, por s.
o
Esta substituio pura e simples, no intervalo de conana dado em 7.2, causa uma
ca
c
alterao no n de conana quando o tamanho da amostra pequeno (n < 30), isto , o
ca
vel
c
e
e

249

pesquisador pensa que est trabalhando com um n de conana, por exemplo, de 95%,
a
vel
c
quando, na realidade, o n de conana menor, portanto, deve-se ampliar o intervalo.
vel
c e
Como feito esse ajuste? Sabemos que a mdia tem distribuio normal com mdia e
e
e
ca
e

desvio padro / n, logo, quando conhecemos , a estat


a
stica
Z=

/ n

ter distribuiao normal padro com mdia 0 (zero) e varincia 1 (um) e representa-se por:
a
c
a
e
a
Z N (0, 1). E, assim, usamos esse modelo para resolvermos o nosso problema de estimao.
ca
Porm, quando usamos o desvio padro da amostra, S, no lugar do desvio padro da
e
a
a
populaao, , obteremos uma nova estat
c
stica, denominada de estat
stica t, dada por:
t(n1) =

X
.
S/ n

Essa estat
stica t tem distribuio t de Student11 com (n 1) graus de liberdade12 . Asca
sim como a distribuiao normal, ela simtrica, com mdia zero, porm, apresenta maior
c
e
e
e
e
variabilidade nos extremos da distribuiao. Quando o n sucientemente grande, o desvio
c
e
padro da amostra, S, aproxima-se do desvio padro da populaao, , e as correspondentes
a
a
c
distribuies tambm aproximam-se. Na gura 7.6 podemos vericar a forma da distribuiao
co
e
c
das estat
sticas t e Z. A principal diferena entre as duas distribuies que a distribuiao t
c
co e
c
tem maior rea nas extremidades, isto , ela mais dispersa, devido ao uso do desvio padro
a
e
e
a
amostral, S. Isso signica que, para um dado n de conana, o valor de t ser um pouco
vel
c
a
maior que o correspondente valor de Z, ampliando o intervalo.
Um intervalo de conana para a mdia, quando usamos o desvio padro da amostra
c
e
a
e
dado pela equao:
ca
s
I.C.(;): tn1; n
x

11

(7.3)

O criador da distribuio t de Student foi W. S. Gossett, o qual adotou o pseudnimo de Student (sculo
ca
o
e
XX). Posteriormente essa distribuio foi estudada por Ronald A. Fisher.
ca
12
Wonnacott & Wonnacott, pgina 186, explicam graus de liberdade da seguinte forma: numa amostra de
a
n observaes, existem n graus de liberdade; para calcularmos o desvio padro, precisamos calcular os desvios
co
a

em torno da mdia, (Xi X), os primeiros n 1 res


e
duos so livres, porm, o ultimo ca completamente
a
e

= 0. Exemplo, consideremos uma amostra de 2 observaes, 21 e


determinado pela condio (Xi X)
ca
co
= 18, os res
15. Como X
duos so 3 e -3, o segundo res
a
duo sendo necessariamente o negativo do primeiro.
Enquanto o primeiro res
duo livre, o segundo estritamente determinado, logo, h apenas um grau de
e
e
a
liberdade.

250

1-

/2

/2
-tc

tc

-3,50

(a) Distribuio t de Student


ca

-1,75

0,00

1,75

3,50

(b) Distribuio normal padro


ca
a

Figura 7.6: Forma das distribuies t de Student e normal padro


co
a
onde x e s so a mdia e o desvio padro da amostra, respectivamente; n o tamanho da

a
e
a
e
amostra; o n de conana; o n de signicncia e t um valor de tabela da
e
vel
c
e
vel
a
e
distribuio t de Student, obtido com n 1 graus de liberdade e n de signicncia .
ca
vel
a
A distribuio t s teoricamente adequada quando a varivel em estudo apresentar disca
oe
a
tribuio normal. Na prtica, quando n aumenta, indo alm de 30 observaoes, a necessidade
ca
a
e
c
de admitir normalidade diminui.

Uso da Tabela da Distribuio t


ca
No apndice 4, temos a tabela da distribuio de Student. A distribuiao t de Student
e
ca
c
e
ligeiramente diferente para cada amostra, ou seja, ela dependente do tamanho da amostra.
e
Para obter um valor de t precisamos de duas informaoes: 1) o n de signicncia desejado,
c
vel
a
isto , a probabilidade de erro e 2) o nmero de graus de liberdade, isto , o tamanho da
e
u
e
amostra menos um, (n 1). Por exemplo, para = 0, 05 e n = 28, portanto, 27 graus de
liberdade, o valor de t 2,052. Encontre este valor na tabela.
e
Nota-se que esta tabela esta disposta de forma diferente da tabela da distribuiao normal
c
padro. As reas (probabilidades) esto na primeira linha da tabela e no no corpo da tabela
a
a
a
a
e, observe que estas reas correspondem ao n de signicncia (); os valores de t esto
a
vel
a
a
no corpo da tabela e os graus de liberdade esto relacionados na primeira coluna (margem
a
esquerda).
Exemplo 1. O peso mdio, ao nascer, de bezerros da raa Ibag, examinada uma
e
c
e
amostra de 20 partos, foi de 26 kg com um desvio padro de 2 kg. D a estimativa por
a
e
intervalo do verdadeiro peso mdio utilizando um n de conana de 95% ( = 5%).
e
vel
c

251

Da tabela da distribuiao t obtemos t19;0,05 = 2, 093. O intervalo de conana ca:


c
c
2
I.C.(; 95%) : 26 2, 093
20
: 26 0, 936
25, 064 26, 936.
Exemplo 2. Os res
duos industriais jogados nos rios, muitas vezes, absorvem o oxignio
e
necessrio ` respirao dos peixes e outras formas de vida aqutica. Uma lei estadual exige
a a
ca
a
um m
nimo de 5 ppm de oxignio dissolvido, a m de que o contedo do mesmo seja suciente
e
u
para manter a vida aqutica. Seis amostras de gua retiradas de um rio revelaram os
a
a

ndices:4,9, 5,1, 4,9, 5,0, 5,0 e 4,7 ppm de oxignio dissolvido. Construir o intervalo com 95%
e
de conana para a verdadeira mdia de oxignio, em ppm, e interpretar.
c
e
e
A mdia e o desvio padro da amostra valem: x = 4, 9333 e s = 0, 1366. O valor tabelado
e
a

de t, com 5 graus de liberdade e = 0, 05 2,571. O intervalo de conana ca:


e
c
0, 1366
IC(; 95%) : 4, 9333 2, 571
6
: 4, 9333 0, 14337
4, 79 5, 08.
Podemos armar com 95% de conana que a verdadeira mdia de oxignio dissolvido est
c
e
e
a
entre 4,79 e 5,08 ppm. Portanto, no podemos armar que o contedo de oxignio dissolvido
a
u
e
suciente para manter a vida aqutica.
e
a
7.4.2

Intervalo de Conana para Uma Proporo


c
ca

O intervalo de conana para uma proporo populacional (), muito semelhante ao


c
ca
e
intervalo de conana para uma mdia populacional com conhecido. A principal diferena
c
e
c
est no desvio padro da distribuio amostral das proporoes, que dado por:
a
a
ca
c
e
P =

(1 )
.
n

Assim, o intervalo de conana dado por:


c e

I.C.(;):p z/2

252

(1)
.
n

(7.4)

Usamos z na expresso do intervalo de conana, pois, como vimos, a proporo amostral,


a
c
ca
P , segue uma distribuio aproximadamente normal para n sucientemente grande e 0, 10
ca
0, 90, ento,
a
p
z=
(1)
n

tem distribuiao normal com mdia 0 (zero) e varincia 1 (um) e para = 0, 05, temos:
c
e
a
P (1, 96 Z 1, 96) = 0, 95.
Isso implica que, o intervalo de conana para , com 95%, dado por:
c
e
p 1, 96

(1 )
p + 1, 96
n

(1 )
.
n

Uma diculdade encontrada para o clculo do desvio padro, que precisamos saber o
a
a e
valor de , o qual desconhecido e desejamos estim-lo. Sabemos que para uma amostra
e
a
sucientemente grande, espera-se que a proporo amostral, P , seja prxima da verdadeira
ca
o
proporao, . Alm disso, vemos que ocorre uma compensao entre P e (1 P ). Portanto,
c
e
ca
na frmula do desvio padro, vamos substituir pelo seu estimador P , a qual ca,
o
a
SP =

P (1 P )
.
n

A expresso do intervalo de conana, considerando a proporo estimada com os dados de


a
c
ca
uma amostra, :
e
p(1 p)
I.C.(; ) : p z/2
.
(7.5)
n
Chamamos a ateno que para determinar o intervalo de conana de uma proporao
ca
c
c
no usamos a distribuiao t de Student.
a
c
Exemplo 1. Em certo lago, uma amostra de 1000 peixes acusou 290 tilpias. Construa
a
um intervalo de 95% de conana para a verdadeira proporo de tilpias na populaao
c
ca
a
c
piscosa do lago. Interpretar o intervalo.
A proporo vericada na amostra (estimativa pontual) vale p = 290/1000 = 0, 29. Para
ca
= 0, 05, o valor de z igual a 1,96. O intervalo de conana :
e
c e
IC(; 95%) : 0, 29 1, 96

0, 29(0, 71)
1000

: 0, 29 0, 0281
0, 2619 0, 3181.

253

Podemos armar, com 95% de conana, que a porcentagem de tilpias est entre 26,19% e
c
a
a
31,81%.
Exemplo 2. Uma amostra de 35 peixes da espcie Xenomelaniris brasiliensis coletada
e
na localidade Praia da Barra da Lagoa, Florianpolis, SC, apresentou 46% de peixes com
o
comprimento total acima de 50 mm. Encontre um intervalo, com 99% de conana, dentro
c
do qual deve estar a verdadeira proporo de peixes com comprimento acima de 50 mm.
ca
O valor de z para = 0, 01 2,58. O intervalo ca:
e
IC(; 99%) : 0, 46 2, 58

0, 46(0, 54)
35

: 0, 46 0, 2174
0, 2426 0, 6774.
7.4.3

Erro de Estimao ou de Amostragem


ca

Erro de Estimao da Mdia


ca
e

Ao coletarmos uma amostra e calcularmos a mdia dos valores desta amostra (X), die
cilmente ela vai ser igual a mdia verdadeira (), apesar de estarem prximas, para amostras
e
o
sucientemente grandes. Como a amostra uma parte da populao, lgico pensar que
e
ca e o
os dois valores dicilmente vo coincidir. Lembre-se do estudo da distribuiao amostral da
a
c
mdia. Portanto, quando vamos estimar um parmetro, sempre estamos sujeitos a comee
a
ter um erro, denominado erro de estimaao ou de amostragem, que a diferena entre a
c
e
c
estat
stica amostral e o parmetro, isto ,
a
e

e = X .
A gura 7.8 ilustra o erro de estimaao associado a um intervalo de conana. Podemos
c
c
ver que a mdia verdadeira (), pode estar prxima ou distante da mdia da amostra (),
e
o
e
x
assim, no intervalo de conana, dizemos que temos, por exemplo, 95% de conana de que
c
c

elas no diferem mais do que t5%;n1 (S/ n).


a
A expresso do intervalo de conana da mdia verdadeira quando o desvio padro popa
c
e
a
ulacional desconhecido dada por:
e
e
S

X t .
n

254

Erro
mximo

Erro

x t

x +t

Centro do
intervalo

Limite
superior

s
n

Limite
inferior

s
n

Figura 7.7: Erro de estimaao associado a um intervalo de conana


c
c
Com o intervalo de conana, podemos concluir, com n
c
vel de conana , que a mdia
c
e

da amostra no se afasta mais do que t(S/ n) da mdia verdadeira. Portanto, o erro de


a
e
estimao mximo associado ao intervalo de conana dado por:
ca
a
c e
S
e = t .
n
Podemos ver que o erro mximo de estimaao a semi-amplitude do intervalo de conana.
a
c e
c
Sendo assim, bastante comum na prtica, especicarmos um erro mximo tolervel,
e
a
a
a
por exemplo, 10% da mdia da amostra, e encontrar o tamanho da amostra necessrio para
e
a
que a nossa pesquisa tenha uma preciso (erro) e conana de acordo com o desejado.
a
c
Exemplo. Um experimentador, est interessado em desenvolver um meio de cultura
a
eciente para micropropagaao da espcie Eucalyptus viminalis. Esse meio de cultura contm
c
e
e
hormnio BAP na concentraao de 0,1 mg/l e cinetina a 0,2 mg/l. Cada tubo de ensaio
o
c
recebeu um n de uma planta de 4 meses. As culturas foram avaliadas aps 30 dias. A
o
o
varivel aqui estudada foi o nmero de folhas. Os resultados foram os seguintes:
a
u
Tubo
1 2
Nmero 10 10
u

3
2

Tubo
11 12
Nmero 14 14
u
Tubo
21 22
Nmero 12 10
u

4
8

5
14

7
11

8 9
11 12

10
8

13 14
9 6

15 16 17
6 8 8

18 19
6 12

20
8

23 24
15 5

25 26 27
7 6 9

28 29
11 13

30
8

255

6
8

Estime o nmero mdio de folhas utilizando um intervalo de conana de 95%. Faa uma
u
e
c
c
interpretao.
ca
Temos os seguintes resultados: x = 9, 3667; s = 3, 0904; n = 30 e t(0.05;29) = 2, 045.

3, 0904
IC(; 95%) : 9, 3667 2, 045
30
: 9, 3667 1, 1538
8, 2128 10, 5205.
Qual o erro mximo associado ao intervalo encontrado? Faa a interpretao.
a
c
ca
O erro mximo de 1,1538 folhas. Portanto, camos com a certeza de que a estimativa de
a
e
9,3667 folhas, afasta-se da mdia verdadeira de no mximo 1,1538 folhas, para um n de
e
a
vel
conana de 95%.
c
Quando o desvio padro populacional for conhecido, o erro de estimao dado por:
a
ca e

e = z .
n

Erro de Estimao Para Uma Proporo


ca
ca
Vimos que o erro de estimaao ou de amostragem nada mais do que a metade da
c
e
amplitude do intervalo de conana. No caso de uma proporao, o intervalo de conana
c
c
c e
calculado por:
p(1 p)
p z/2
.
n
Donde obtemos o erro de estimao,
ca
e = z/2

p(1 p)
.
n

(7.6)

Exemplo. No estudo dos peixes da espcie Xenomelaniris brasiliensis coletados na


e
localidade da Praia da Barra da Lagoa, Florianpolis, SC, qual o erro mximo associado
o
a
ao intervalo encontrado? Interpretar. O erro mximo de 0,2174 ou 21,74%. Portanto, a
a
e
proporao amostral de 46%, no difere em mais do que 21,74% da proporao populacional,
c
a
c
em ambos os lados, para um n de conana de 95%. Voc acha que a amplitude desse
vel
c
e
intervalo pequena, mdia ou grande?
e
e
7.4.4

Determinao do Tamanho da Amostra


ca

256

Determinao do Tamanho da Amostra Para Estimar Uma


ca
Mdia
e
Uma das perguntas mais freqntes em estat
ue
stica : qual o tamanho da amostra
e
e
necessrio para estimar a mdia? A resposta a esta pergunta, s poss de ser dada, aps
a
e
oe
vel
o
o pesquisador da rea de interesse, fornecer algumas informaoes, como veremos a seguir.
a
c
Podemos determinar o tamanho da amostra (n), atravs da frmula do erro de estimaao
e
o
c
associado a um intervalo de conana,
c

e = z .
n
Para uma amostra aleatria simples, quando o desvio padro populacional () conhecido,
o
a
e
ou temos alguma informao sobre o mesmo, determinamos o tamanho da amostra pela
ca
expresso:
a
n=

z 2
.
e

(7.7)

Na expresso 7.7, o valor de e deve ser fornecido pelo pesquisador e indica a preciso
a
a
desejada na pesquisa, isto , quo prximas esto a mdia da amostra e a mdia da populao.
e
a
o
a
e
e
ca
Pense bem sobre isso, pois a mdia verdadeira nos desconhecida.
e
e
Denida pelo pesquisador a probabilidade de erro (), encontramos a conana desejada
c
na pesquisa, dada por (1 ). Assim, podemos ver que o pesquisador deve ter informaao
c
sobre a preciso e a conana que ele deseja para o seu trabalho.
a
c
Alm da preciso e da conana, o pesquisador precisa ter alguma informaao sobre a
e
a
c
c
2
variabilidade da populaao, isto , sobre a varincia ( ).
c
e
a
Exemplo 1. Continuaao do exemplo dos pesos de pacotes de sementes de milho. Que
c
tamanho de amostra ser necessrio coletar para produzir um intervalo de 95% de conana
a
a
c
para a verdadeira mdia, com uma preciso de 50 gramas? Veja gura 7.8. Portanto,
e
a
vamos encontrar um tamanho de amostra, de modo que tenhamos 95% de conana, de
c
que a mdia da amostra difere de no mximo 50 gramas, para os dois lados, da mdia da
e
a
e
populaao. Aplicando a frmula do tamanho da amostra, obtemos:
c
o
n=

1, 96(0, 20)
0, 05

= 61, 46 62.
=

Portanto, necessita-se de 62 pacotes de milho para estimar a mdia populacional com a


e
preciso e a conana desejadas.
a
c

257

-0,05

+0,05

E=0,05
2,5%

95%

2,5%

Figura 7.8: Tamanho de amostra para um erro de estimao de 0,05 kg e conana de 95%,
ca
c
portanto, n de signicncia de 5%
vel
a
Na prtica, geralmente o desvio padro populacional () desconhecido, ou no temos
a
a
e
a
conhecimento de um limite superior para o mesmo. Nesse caso, dever
amos usar o desvio
padro da amostra (s), e a distribuiao t de Student. Acontece que a amostra ainda no foi
a
c
a
coletada para que possamos conhecer o valor de s, desvio padro da amostra, ento, uma
a
a
soluo coletar uma amostra piloto de n elementos para, com base nela, obtermos uma
ca e
estimativa de s, empregando-se a seguir a expresso:
a

n=

t.s 2
.
e

(7.8)

Onde t o valor de tabela, com n 1 graus de liberdade (tamanho da amostra piloto menos
e
um), e probabilidade de erro igual a . Se n n implica que a amostra piloto j suciente
ae
para a estimao da mdia, caso contrrio, devemos retirar mais elementos da populaao
ca
e
a
c
para completar o tamanho m
nimo da amostra.
Exemplo 2. Continuaao do exemplo dos pesos ao nascer de bezerros da raa Ibag.
c
c
e
Que tamanho de amostra ser necessrio para produzir um intervalo de conana de 95%
a
a
c
para a verdadeira mdia, com uma preciso de 5% da mdia da amostra preliminar?
e
a
e
A amostra piloto de tamanho n = 20, nos forneceu uma x = 26 kg e s = 2 kg. Temos ainda

que a preciso desejada vale e = 0, 05(26) = 1, 3 kg e t(19;0,05) = 2, 093. Portanto, o tamanho


a
da amostra vale:
2
2, 093(2, 0)
n=
= 10, 37 11.
=
1, 3

258

Necessitamos de uma amostra de 11 bezerros para a preciso e conana estipuladas pelo


a
c
pesquisador. Como a amostra piloto tem tamanho n = 20, maior que o tamanho da amostra
necessrio n = 11 bezerros, implica que a amostra piloto j suciente para o estudo.
a
ae
Podemos usar dois outros procedimentos para estimar o desvio padro, s, quais sejam:
a
a
o
sabemos que aproximadamente 96% dos valores de uma varivel aleatria com distribuiao normal, encontram-se no intervalo ( 2s e x + 2s), assim, o tamanho deste
c
x

intervalo 4s. Podemos tomar os dois valores extremos dos dados dispon
e
veis e calcular
a amplitude de variao ( ) dos dados. Para obter uma estimativa de s, calculamos:
ca
= 4s s = /4;
uma estimativa de s pode ser obtida em artigos, livros, dissertaoes, teses, ou seja,
c
atravs de uma referncia bibliogrca.
e
e
a
Quando conhecemos o tamanho da populao (N ), e verica-se a desigualdade n >
ca
0, 05N , deve-se proceder a uma correo ou ajuste para populao nita, do seguinte modo:
ca
ca

n0 =

n
n
1+ N

(7.9)

Preliminarmente, a amostra dimensionada para populaao innita (n 0, 05N ), obtendoe


c
se o tamanho n e, numa segunda fase, corrigimos para populaao nita, obtendo-se o tamanho
c
n0 , dado por 7.9.
Uma Aplicao em Ecologia - Mtodo para Censo de Primatas na Natureza
ca
e
A utilizaao de trilhas (transectos, preferencialmente linhas retas) abertas no local um
c
e
dos mtodos mais usados para a estimativa da densidade (contagem) de vrias espcies de
e
a
e

animais. E importante que as trilhas estejam bem localizadas, pois elas devem amostrar as
diferentes vegetaes do local em estudo.
co
Aqui, o tamanho da amostra corresponde ao nmero de vezes que devemos percorrer
u
cada trilha selecionada, e calculada atravs da expresso:
e
e
a
n=

(2ts)2
e2

Os termos que aparecem nesta frmula j foram discutidos. Ressaltamos que a estimativa do
o
a
desvio padro da amostra (s), pode ser obtida atravs de uma amostra piloto (preliminar).
a
e
Exemplo. Desejamos determinar o tamanho da amostra (nmero de vezes que devemos
u
percorrer as trilhas), para obter um intervalo de conana com 90% e erro de 0,2 animais.
c

259

De uma amostra piloto com 5 repeties em todas as trilhas obteve-se uma estimativa do
co
desvio padro com sendo igual a 0,3 indiv
a
duos/km2 . Para o clculo do tamanho da amostra
a
temos as seguintes informaes:
co
t(com 5-1=4 graus de liberdade e = 0, 10)=2,132
s=0,3
e=0,2
O tamanho da amostra dado por:
e
n=

(2.2, 132.0, 3)2


= 40, 90 41
=
(0, 2)2

De acordo com as exigncias do intervalo de conana, precisamos de 41 repetioes. Como


e
c
c
j foram feitas 5 repetioes, necessitamos de mais 36 repetioes. A referncia bibliograca
a
c
c
e
utilizada foi ..................................

Determinao do Tamanho da Amostra Para Estimar Uma


ca
Proporo
ca
Para encontrarmos o tamanho necessrio de uma amostra para estimarmos uma proa
porao, procedemos de forma anloga ao que foi feito para o caso de estimao de uma
c
a
ca
mdia.
e
De 7.6 obtemos a expresso para o tamanho da amostra, dado por:
a

n=

2
z/2 [p(1p)]

e2

z/2 2
e

p(1 p).

(7.10)

Acontece que, ns no sabemos o valor de p, pois a amostra ainda no foi retirada.


o a
a
Podemos, entretanto, conhecer uma limitaao superior para a proporao em estudo. Por
c
c
exemplo, sabemos que a proporao de sementes que germinam, de uma determinada espcie,
c
e
seguramente, no superior a 0,90. Ento, usamos esse valor para p.
a e
a
A diculdade de no se conhecer uma estimativa do valor de , tambm pode ser resolvida
a
e
atravs de uma amostra piloto de n elementos, onde, com base nesta amostra, obtemos uma
e
estimativa, p, e empregamos, a seguir, a expresso 7.10. Se n n , a amostra piloto j o
a
ae
suciente para a estimao. Caso contrrio, deveremos retirar da populaao, os elementos
ca
a
c
necessrios ` complementaao do tamanho m
a
a
c
nimo da amostra.
Uma terceira alternativa, usar para p, o valor 0,50, pois, para este valor, o produto
e
p(1 p) mximo e igual a 0,25=1/4. Se substitu
e a
rmos esse valor na expresso 7.10,
a

260

obtemos:
n=

2
z/2

4e2

(7.11)

Ento, quando no temos a menor idia sobre o valor de , pode-se, inicialmente admitir
a
a
e
= 0, 50 para o clculo do tamanho da amostra. Com este procedimento, estamos superesa
timando o tamanho da amostra, ou seja, vamos trabalhar com uma amostra maior do que o
necessrio, assim, estaremos pecando por excesso.
a
Exemplo 1. Considere que uma amostra piloto de 35 peixes da espcie Xenomelaniris
e
brasiliensis foi coletada na localidade da Praia da Barra da Lagoa, Florianpolis, SC, e
o
apresentou 46% de peixes com comprimento total acima de 50 mm. Se quisermos estimar
a proporo de peixes com comprimento acima de 50 mm, qual o tamanho da amostra
ca
necessrio para que tenhamos 99% de conana de que o erro de nossa estimativa no seja
a
c
a
superior a 5%?
O valor de z para = 0, 01 2,58. O tamanho da amostra necessrio :
e
a e
2, 582
0, 46(1 0, 46)
0.052
= 2662, 56(0, 2484)

n =

= 661, 38
662.
=
Portanto, precisamos de uma amostra de 662 peixes para obtermos uma proporao amostral
c
que no dira da proporo verdadeira em mais do que 5%.
a
ca
Neste mesmo exemplo, suponha que no saibamos nada sobre , qual deve ser o tamanho
a
da amostra pesquisada?
Temos, = 99% e e = 5%, portanto:
n=

2, 582
= 665, 64 666.
=
4(0, 052 )

Do mesmo modo que para a estimao de uma mdia, se conhecemos o tamanho da


ca
e
populaao N e vericarmos a desigualdade n 0, 05N , devemos proceder a correao para
c
c
populaao nita dada em 7.9.
c
Quando o tamanho da populao conhecido e a amostra representa mais do que 5% da
ca e
populaao, ento, como j foi mostrado anteriormente, devemos aplicar um fator de correao
c
a
a
c
para populaoes nitas para reduzir a estimativa do erro padro da mdia e da proporao.
c
a
e
c
Esse fator dado por: (N n)/N 1.
e

261

Exemplo 2. Sorteou-se uma amostra aleatria simples de 100 estudantes do curso


o
de Engenharia Agronmica e, solicitou-se aos mesmos, que anotassem suas despesas com
o
alimentao no per
ca
odo de um ms. H 500 estudantes matriculados no curso. O resultado
e
a
da amostra foi uma despesa mdia de 40 u.m. e um desvio padro de 10 u.m. (u.m.=
e
a
unidades monetrias).
a
a) Construa um intervalo de 95% de conana para a verdadeira mdia.
c
e
b) Qual a importncia de uma amostra aleatria nesse caso?
a
o
c) Qual o tamanho da amostra necessrio para que tenhamos 98% de conana de que o erro
a
c
na nossa estimativa no seja superior a 2,0 u.m.?
a
Como conhecemos o tamanho da populaao (N = 500), vamos vericar se a populao
c
ca
pode ser considerada nita. Como 100 > 0, 05(500) = 25, podemos consider-la como tal.
a
Portanto, o erro padro da mdia vale:
a
e
s
sX =

N n
10
=
N 1
100

500 100
= 0, 8953.
500 1

Como usamos o desvio padro da amostra, vamos usar a distribuiao t de Student. O


a
c
intervalo de conana ca:
c
IC(; 95%) : 40 1, 99(0, 8953)
: 40 1, 782
38, 218 41, 782.
Sempre devemos ter uma amostra aleatria. Isso garante, por exemplo, a independncia
o
e
dos resultados.
O tamanho da amostra dado por:
e
n=

2, 3646 10
2

= 139, 24 140.
=

O tamanho da amostra, com a correao para populaao nita ca:


c
c
n0 =

140
= 107, 9 108.
=
1 + 140
500

Exerc
cios resolvidos
1. De uma amostra de 100 peixes da espcie Xenomelaniris brasiliensis, coletada na
e
Armao do Pntano do Sul, Florianpolis, SC, vericou-se que 57 deles apresentavam comca
a
o
primento total maior que 50 mm. Com base nessa informaao, determine o intervalo de
c
conana de 99% para a verdadeira proporao de peixes com comprimento total acima de
c
c

262

50 mm. Qual o tamanho de amostra necessrio para estimar a verdadeira proporao com
a
c
preciso de 5%, usando uma conana de 95%?
a
c
Temos n = 100, p = 57/100 = 0, 57 e q = 1 p = 0, 43.
0, 57(0, 43)
100
: 0, 57 0, 12773

IC(; 99%) : 0, 57 2, 58

0, 44227 0, 6977.
O clculo do tamanho da amostra ca:
a
2

1, 96
n =
0, 57(0, 43)
0, 05
= 376, 63 377.
=
2. O dimetro mdio de Biomphalaria tenagophila, examinada uma amostra de 35 ania
e
mais, foi de 0,871 mm com um desvio padro de 0,057 mm.
a
a) D a estimativa por intervalo do verdadeiro dimetro mdio utilizando um n de cone
a
e
vel
ana de 95%.
c
b) Que tamanho de amostra ser necessrio para produzir um intervalo de conana de 95%
a
a
c
para a verdadeira mdia, com uma preciso de 2% da mdia da amostra preliminar?
e
a
e
Temos, n = 35, x = 0, 871 mm, s = 0, 057 mm e = 0, 02(0, 971) = 0, 0174.

0, 057
IC(; 95%) : 0, 871 2, 032
35
: 0, 871 0, 0196
0, 8514 0, 8906.
2, 032(0, 057)
n =
0, 0174
= 44, 21 45.
=

3. Em um experimento, 320 de 400 sementes germinaram. Determine o intervalo de


conana de 98% para a verdadeira proporao de sementes que germinam. Para realizar o
c
c
teste de germinaao, quantas sementes sero necessrias utilizar, se se deseja um intervalo
c
a
a
de conana de 95%, com preciso de 4%?
c
a
Temos p = 320/400 = 0, 80.
IC(; 98%) ; 0, 80 2, 325

0, 80(0, 20)
400

: 0, 80 0, 0465
0, 7535 0, 8465.

263

n =

7.5

1, 96
0, 04

0, 80(0, 20) = 384, 16 385.


=

Exerc
cios Propostos

1) Um antroplogo mediu as alturas de uma amostra aleatria de 100 homens de detero


o
minada populao, encontrando a mdia amostral de 173 cm. Se a varincia da populaao
ca
e
a
c
for de 9 cm:
a) calcular um intervalo de 95% de conana para a altura mdia de toda a populaao.
c
e
c
Interpretar o I.C.
b) determinar um intervalo de 99% de conana para a altura mdia de toda a populao.
c
e
ca
Interpretar o I.C.
c) Qual a probabilidade de encontrar um homen com altura superior a 177 cm.
e
2) Uma mquina enche pacotes de caf com uma varincia igual a 100 g 2 . Ela estava
a
e
a
regulada para ench-los com 500 g, em mdia. Agora, ela se desregulou e queremos saber
e
e
qual a nova mdia verdadeira (populacional). Uma amostra de 25 pacotes apresentou uma
e
mdia igual a 485 g.
e
a) Construir intervalos de conana de 95% e 99% de conana para a mdia verdadeira.
c
c
e
Interpretar os intervalos de conana
c
b) Qual o erro mximo associado aos intervalos encontrados em a). Interpretar.
a
c) Que tamanho de amostra ser necessrio para produzir um intervalo de conana para
a
a
c
a verdadeira mdia populacional, com uma preciso de 3,5 gramas de caf em qualquer dos
e
a
e
sentidos, dado que o desvio padro da populaao conhecido e igual a 10 gramas de caf.
a
c e
e
Use uma conana de 99%.
c
3) De um povoamento de eucaliptos, sorteou-se 30 rvores e determinou-se o dimetro,
a
a
em cm, com a nalidade de estimar o dimetro mdio do povoamento. Dimetros de 30
a
e
a
eucaliptos em cm:
10,1
16,7
28,9
38,5

15,8
29,1
27,9
35,5

18,5
28,0
22,5
34,2

22,3
30,3
32,9
31,8

23,5
26,8
29,5
32,5

17,2 17,8
28,0 17,8
28,3 34,2
41,8

18,7
18,9
38,5

Com base nessa amostra calcule:


a) os intervalos de conana aos n
c
veis de 95% e 99%;
b) qual o tamanho da amostra necessrio para estimar o dimetro mdio de plantas de
a
a
e
eucalipto se o erro mximo deve ser de 5% da mdia para um n de conana de 95%?
a
e
vel
c

264

4) De 1000 lavouras de arroz, foi levantada uma amostra de 25 lavouras e a informao


ca
a respeito da produtividade permitiu o clculo do rendimento mdio, por hectare (1 ha =
a
e
2
10.000 m ), que foi de 3400 kg com um desvio padro de 150 kg.
a
a) Determine o intervalo de conana a 95% e 99%, para o verdadeiro rendimento mdio.
c
e
b) Que tamanho deve ter a amostra para que seja de 95% a conana na estimativa 3400
c
100?
5) Do rebanho bovino de determinado munic
pio, em maio, constatou-se que 30% de
20 animais examinados estavam com febre aftosa, e em junho, examinaram-se outros 20
animais, constatou-se que 18% estavam acometidos daquela molstia.
e
Deseja-se saber entre que limites esteve a verdadeira proporo de animais com febre aftosa,
ca
tanto no ms de maio como no ms de junho. Utilize um n de conana de 95%.
e
e
vel
c
Qual o erro mximo associado aos intervalos encontrados. Interpretar.
a
Num trabalho futuro, qual o tamanho de amostra necessrio para obter um intervalo de 95%
a
de conana para a proporao, com um erro tolervel de 0,08, em cada um dos mses?.
c
c
a
e
6) Da produao de compotas de pssego, da safra 79/80, de uma determinada indstria,
c
e
u
foram examinadas 30 latas e 3 delas estavam fora dos padres para a exportao. Determinar
o
ca
o intervalo de conana, a 99%, para a verdadeira proporao de latas que esto fora dos
c
c
a
padres para exportaao.
o
c
7) De uma partida de 1000 sacos de sementes de trigo tomou-se uma amostra de 50
sacos e vericou-se que 10 deles apresentavam teor de umidade acima do mximo permitido
a
para o armazenamento. Com base nessa informao, determine o intervalo de conana, de
ca
c
99%, para a verdadeira proporao de sacos com teor de umidade acima do limite mximo
c
a
permitido e o nmero mximo e m
u
a
nimo de sacos de sementes com esse problema.
8) Num experimento de campo, o tratamento A, com nove repeties, tem mdia de 1500
co
e
kg/ha de feijo. Temos uma estimativa do desvio padro s=180 kg/ha, com 30 graus de
a
a
liberdade. Obter o intervalo de conana para a mdia, ao n de 95% de conana.
c
e
vel
c
9) De uma amostra de 26 valores de nmero de colnias de Salmonella typhimurium, em
u
o
placas que contm a infuso de Bauhinia forticata, encontrou-se um desvio padro igual a
e
a
a
47 colnias, e mdia igual a 76,15 colnias.
o
e
o
a) Qual o intervalo de conana de 95% para a mdia populacional?
c
e
b) Que tamanho deve ter uma amostra para que o intervalo 76, 155 tenha 95% de conana?
c
10) Estime (Intervalo de Conana), o comprimento mdio () de Pnaeus schmitti em
c
e
condies normais no esturio (Lagoa de Ibiraquera) e num viveiro de cultivo (Fazenda de
co
a
engorda de Laguna), sabendo-se que uma amostra de 30 indiv
duos apresentou os resultados
da tabela 7.1. (U se = 95%).

265

Tabela 7.1: Valores de comprimento


Lagoa de Ibiraquera
Fazenda de engorda de Laguna
Classes
4,70
5,07
5,44
5,81
6,18
6,55

Frequncias
e

5,07
5,44
5,81
6,18
6,55
6,92

2
2
11
11
3
1

Classes
7,6
8,2
8,8
9,4
10,0
10,6

Frequncias
e

8,2
8,8
9,4
10,0
10,6
11,2

2
0
9
13
4
2

11) Uma amostra aleatria de 60 prognies indica que 70% delas apresentam resistncia `
o
e
e
a
antracnose. Construir um intervalo de conana para , a proporo de prognies resistentes
c
ca
e
` antracnose, com = 95%.
a
12) O dimetro de altura do peito (DAP) de Tabebuia ochracea, o Ip-Amarelo do Campo,
a
e
fam Bigoniceas, uma varivel aleatria com distribuiao aproximadamente normal de
lia
a
e
a
o
c
mdia 0,70 cm e desvio padro de 0,40 cm. Encontre um intervalo de conana em torno da
e
a
c
mdia que contenha 95% dos valores de DAP.
e
13) De um experimento anterior sabe-se que o desvio padro da altura de plantas de um
a
determinado h
brido de milho = 0, 80 m.
e
a) Selecionada uma amostra de 72 plantas deste h
brido, observou-se uma mdia de 2,10 m.
e
Qual o intervalo de conana de 95% para a mdia populacional?
c
e
b) Que tamanho deve ter uma amostra para que o intervalo 2, 10 0, 20 tenha 99% de
conana?
c
14) Um agrnomo realizou um levantamento para estudar o desenvolvimento de duas
o
espcies de rvores, a Bracatinga e a Canaf
e
a
stula. Para esta nalidade foram coletadas
duas amostras de tamanhos igual a 10 rvores. Os resultados para altura, em metros, esto
a
a
descritos abaixo para as duas amostras:
Bracatinga
6,5
9,3

6,9 6,9
10,1 11,4

8,6
15,2

Canaf
stula
8,7 8,2
17,2 14,8

10,0
15,9

10,3 13,4
20,6 21,9

14,4
23,8

Para vericar a hiptese de que as alturas das duas espcies so diferentes, o agrnomo
o
e
a
o
adotou o seguinte critrio. Construir os intervalos com 95% de conana, para cada uma
e
c
das espcies. Se os intervalos se sobrepem (se interceptam) concluir que no h diferenas
e
o
a a
c
signicativas entre as duas alturas mdias, caso contrrio, concluir que h diferenas entre
e
a
a
c

266

as mesmas. Baseado neste critrio qual a concluso do agrnomo?


e
a
o
15) As bromlias so plantas ep
e
a
tas que vivem sobre galhos e troncos das rvores, dea
nominados fortos. O estdio arbreo pioneiro formado pela vegetao que proporciona o
o
a
o
e
ca
sombreamento efetivo do solo, originando um microclima umido e sombreado. Uma amostra

de 35 fortos no estdio arbreo pioneiro da Floresta Ombrla na Ilha de Santa Catarina,


o
a
o
o
apresentou 40% sem bromlias.
e
1. Encontre um intervalo de conana com 99% para a verdadeira proporo de fortos
c
ca
o
sem bromlias. Faa a interpretaao do intervalo.
e
c
c
a
c
ca
2. Qual o erro mximo associado ao intervalo? Faa a interpretao.
3. Para estimar a proporao de fortos sem bromlias (), qual o tamanho de amostra
c
o
e
necessrio para que tenhamos 99% de conana de que o erro de nosssa estimativa
a
c
no seja maior do que 5%? Faa a interpretaao do n. Considere a amostra com 35
a
c
c
fortos como sendo uma amostra preliminar (piloto).
o
o
a
a
4. Uma outra amostra de 35 fortos, no estdio de oresta secundria, apresentou 2%
sem bromlias. Encontre o intervalo de conana com 99% para a verdadeira proporo
e
c
ca
(), de fortos sem bromlia.
o
e
5. Para concluir se existe diferena estat
c
stica entre as duas proporoes, o(a) Bilogo(a),
c
o
usou o seguinte critrio: se os intervalos se sobrepem (se cruzam, interceptam) conclui
e
o
que no h diferena entre as duas propores. Qual a concluso do(a) Bilogo(a)?
a a
c
co
a
o
Faa a representaao grca dos intervalos.
c
c
a
16) Os valores de DAP (Dimetro ` Altura do Peito), em cm, de fortos possuidores
a
a
o
de Vriesea incurvata (bromlia, conhecida como espada de Davi), em vegetaao primria da
e
c
a
Floresta Tropical Atlntica, em Santo Amro da Imperatriz, SC, foram:
a
a
10,02
7,80
6,40
8,90
31,80

11,70
2,66
9,93
16,90
33,00

13,92
6,13
4,60
3,60

14,63 4,75
9,20 9,90
22,20 12,65
10,75 18,00

7,54
14,20
33,60
6,00

12,30
2,27
7,20
4,15

1. Construa o intervalo de conana em torno da mdia verdadeira que contenha 95%


c
e
dos valores de DAP.
2. Que tamanho de amostra (n) ser necessrio coletar para produzir um intervalo de
a
a
conana com 95% para a verdadeira mdia, com preciso de 5% da mdia da amostra?
c
e
a
e

267

Testes de Hipteses Sobre os Parmetros


o
a

8.1

Introduo
ca

Um problema que ns precisamos aprender a resolver o de testar uma hiptese, isto ,


o
e
o
e
feita uma determinada armaao sobre um parmetro populacional, por exemplo, sobre uma
c
a
mdia populacional ou uma proporo populacional, ser que os resultados de uma amostra
e
ca
a
contrariam ou no tal armaao? Podemos estar interessados em vericar, por exemplo, se
a
c
as seguintes armaoes so verdadeiras:
c
a
1. a produtividade do milho em Santa Catarina, de 2300 kg/ha;
e
2. os comprimentos mdios dos ante-braos de duas espcies de morcgos so iguais;
e
c
e
e
a
3. a proporao de xaao de toplncton em dois tipos de solos a mesma;
c
c
a
e
4. a produao mdia de duas cultivares de feijo a mesma;
c
e
a e
5. pocas de plantio esto associadas com a sobrevivncia das mudas.
e
a
e
O objetivo de um teste estat
stico de hipteses fornecer ferramentas que nos permitam
o
e
aceitar ou rejeitar uma hiptese estat
o
stica atravs dos resultados de uma amostra.
e
Para exemplicar, vamos considerar um teste de germinaao de sementes, onde foram
c
analisadas 400 sementes de milho, obtidas por um processo de amostragem aleatria, de um
o
grande lote de sementes, encontrando-se, nesta amostra, um poder germinativo de 92,8%.
Porm, a distribuidora arma que no haver menos de 94% de germinaao no lote. O que
e
a
a
c
ns devemos responder com o aux de um teste de hipteses, se podemos considerar a
o
lio
o
e
armao da distribuidora como sendo verdadeira ou no.
ca
a
Aqui, tambm devemos levar em considerao a variabilidade amostral, j vista no estudo
e
ca
a
de distribuies amostrais. Sabemos que retiramos somente uma amostra de 400 sementes
co
deste lote, na verdade, poder
amos retirar k amostras de 400 sementes desse lote e, para
cada uma delas, calcular a porcentagem de germinao de sementes, ir
ca
amos obter k valores
de porcentagens, provavelmente, a maioria deles diferentes uns dos outros. Ento, existe,
a
o que ns conhecemos por variabilidade amostral e, como vimos, podem ser representadas
o
pelas distribuies de probabilidades. Assim, uma pergunta que podemos fazer a seguinte:
co
e
ser que este valor de 92,8% de poder germinativo pode ser considerado como sendo devido a
a
esta variaao amostral, ou um valor muito distante de 94%, sendo, portanto, uma diferena
c
e
c
real? ou seja, pouco provvel obter uma amostra com 92,8% de um lote com um poder
e
a

268

germintativo de 94%?. No podemos responder essa pergunta sem o aux da estat


a
lio
stica,
portanto, precisamos fazer um teste estat
stico de hipteses para chegarmos a uma concluso.
o
a
Para todos os testes estat
sticos, inicialmente devemos formular as hipteses. Sempre
o
vamos ter duas hipteses estat
o
sticas, quais sejam:
1. hiptese nula: a hiptese que sugere que a armaao que estamos fazendo sobre o
o
e
o
c
parmetro populacional verdadeira. Essa hiptese representada por H0 . No nosso
a
e
o
e
exemplo, a hiptese nula que a verdadeira porcentagem de germinao de sementes
o
e
ca
de 94%, portanto, a distribuidora est certa, e a representamos por:
e
a
H0 : = 94%.
2. Hiptese alternativa: a hiptese que sugere que a armao que estamos fazendo
o
e
o
ca
sobre o parmetro populacional falsa e a representamos por H1 . No nosso exemplo,
a
e
a hiptese alternativa que o poder germinativo do lote menor que 94%, pois deo
e
e
vemos nos precaver contra o lote ter menos do que 94% de germinaao e, portanto, a
c
distribuidora no est certa, e a representamos por:
a
a
H1 : < 94%.
Portanto, a construo da hiptese alternativa, depende do grau de conhecimento biolgico
ca
o
o
ou agronmico sobre o fenmeno, ou das informaes que se tm do problema em estudo.
o
o
co
e
Existem trs armaoes que podemos fazer em uma hiptese alternativa:
e
c
o
1. H1 : = 94% (temos um teste bilateral);
2. H1 : > 94% (temos um teste unilateral ` direita);
a
3. H1 : < 94% (temos um teste unilateral ` esquerda).
a
Na subseao 8.2 ilustra-se estes trs casos.
c
e
Se, aps realizado o teste estat
o
stico, a deciso a de no rejeitar a hiptese nula, ento
a e
a
o
a
dizemos que a diferena vericada entre o valor encontrado na amostra e o valor alegado pela
c
distribuidora devido ` variao amostral e, portanto, o lote tem 94% de poder germinativo.
e
a
ca
Por outro lado, se o teste estat
stico indicar que ns devemos rejeitar a hiptese nula, ento
o
o
a
dizemos que a diferena vericada entre o valor encontrado na amostra e o alegado pela
c
distribuidora real, isto , o lote no tem 94% de poder germinativo e, de acordo com a
e
e
a
hiptese alternativa, ele apresenta menos de 94% de germinao.
o
ca

269

Sempre que ns tomamos a deciso de no rejeitar ou rejeitar uma hiptese nula, estamos
o
a
a
o
correndo o risco de uma deciso errnea. Por exemplo, podemos rejeitar uma hiptese nula
a
o
o
quando dever
amos aceit-la. Assim, como o que ocorre nos intervalos de conana, quando
a
c
armamos que o parmetro est dentro do intervalo, existe uma probabilidade de ele no
a
a
a
pertencer ao mesmo. O que acontece na prtica, que ns sabemos qual o valor dessa
a
e
o
e
probabilidade e, geralmente, ele baixo. Portanto, sempre que tomamos uma deciso de
e
a
rejeitar uma hiptese nula, temos uma alta probabilidade de estarmos certos.
o
No nosso exemplo, a estat
stica de interesse a proporao de sementes que germinam (P ),
e
c
dada em porcentagem. Assim, devemos conhecer a distribuio amostral de uma proporao,
ca
c
pois, como sabemos, ela descreve a variabilidade amostral. Sabemos que a distribuio
ca
amostral das proporoes (P ), quando o tamanho da amostra sucientemente grande, segue
c
e
uma distribuiao normal com mdia e desvio padro,
c
e
a
P =

(1 )
,
n

onde a proporo populacional e n o tamanho da amostra. Nesse caso, estamos


e
ca
e
considerando a populaao como sendo innita, caso contrrio, necessrio fazer a correao
c
a
e
a
c
para populaao nita no desvio padro.
c
a
Assim, se a armaao da distribuidora verdadeira, isto , se a nossa hiptese nula
c
e
e
o
realmente est correta, ento, a nossa amostra com 92,8% de poder germinativo vem de uma
a
a
distribuio amostral com mdia P = = 94% e desvio padro
ca
e
a
P =

0, 94(0, 06)
= 0, 01187 = 1, 187%.
400

Podemos usar a distribuio normal, para calcularmos a probabilidade de obter um valor


ca
de poder germinativo igual ou menor que 92,8%, de uma amostra de 400 sementes, extra de um lote (populaao) com poder germinativo de 94%. Com o aux da tabela da
da
c
lio
distribuio normal padro, dada no apndice 3, obtemos:
ca
a
e
0, 928 0, 940
0, 0119
= P rob(z 1, 01)

P rob(P 0, 928) = P rob z

= 0, 5 P rob(0 z 1, 01)
= 0, 5 0, 34375
= 0, 1563 = 15, 63%.
A gura 8.1 mostra a rea da distribuio normal padro correspondente ao valor de z
a
ca
a
1, 01 ou p 0, 928. Portanto, ns temos uma probabilidade bastante alta de obter um
o

270

(Escala padro)
0,928

(Escala real)

0,940

Figura 8.1: Probabilidade de encontrar um valor menor que 92,8% de um lote com 94,0%
de poder germinativo
valor de poder germinativo igual ou menor que 92,8% devido ` variao amostral, ou seja,
a
ca
temos 15,63% de probabilidade de obter uma amostra com um poder germinativo igual ou
menor do que 92,8% de um lote com 94% de poder germinativo.
Se rejeitssemos H0 : = 94%, o risco de erro, ou seja, rejeitar H0 quando na verdade
a
dever
amos aceitar, seria de 15,63%, o que muito alto. Isto nos leva a no rejeitar H0 e,
e
a
assim, concluir que a amostra oriunda de um lote com 94% de poder germinativo, e que
e
a diferena entre os valores 94% e 92,8% devido ` amostragem. Este risco chamado de
c
e
a
e
n de signicncia do teste e representa-se pela letra grega . A mesma interpretaao
vel
a
c
feita para os intervalos de conana. O n de signicnica tambm chamado de n
c
vel
a
e e
vel
descritivo ou valor p do teste. No exemplo, = 15, 63%.
Agora, vamos supor que a porcentagem de germinaao de sementes na amostra foi de
c
89,5%, ao invs de 92,8%. Neste caso, a probabilidade de obter um valor de poder germinae
tivo amostral igual ou menor que 89,5% devido ` variaao amostral dada por:
a
c
e
0, 895 0, 94
0, 0119
= P rob(z 3, 78)

P rob(P 0, 895) = P rob z

= 0, 5 P rob(0 z 3, 78)
= 0, 5 0, 4999
= 0, 0001.
A gura 8.2, de acordo com os clculos, mostra que praticamente nula a probabilidade
a
e
de se obter uma amostra com valor de 89,5% de um lote com 94% de poder germinativo. Isto

271

-3,78

0,00

(Escala padro)

0,895

0,94

(Escala real)

Figura 8.2: Probabilidade de encontrar um valor menor que 89,5% de um lote com 94,0%
de poder germinativo
signica que ns temos fortes ind
o
cios para rejeitar a hiptese nula (H0 : = 94%). Cono
clu
mos, portanto, que improvvel que esta amostra provenha de um lote de sementes com
e
a
o poder germinativo alegado pela distribuidora. Neste caso, o risco de uma deciso errnea
a
o
vale 0,0001, ou seja, a probabilidade de rejeitarmos H0 , quando na verdade dever
amos
aceit-la de 0,0001 ou 0,01%. Assim, o valor p do teste 0,01%.
a e
e
Na prtica, os n
a
veis de signifncia aceitveis, so, geralmente, = 0, 05 = 5% e =
a
a
a
0, 01 = 1%. Em alguns casos, utiliza-se = 0, 10 = 10%. Supondo que o pesquisador dena
como sendo de 5% o erro mximo de suas concluses. Assim, na amostra com 92,8% de
a
o
poder germinativo, o menor valor de para o qual rejeitamos H0 vale 15,63%, portanto,
maior do que o erro mximo aceitvel pelo pesquisador, isso implica que devemos aceitar
a
a
a hiptese nula. Na amostra com 89,5% de poder germinativo, o menor valor de para o
o
qual rejeitamos H0 vale 0,01%, portanto, menor do que os 5% xado pelo pesquisador, isso
implica que rejeitamos a hiptese nula. Se o pesquisador xar o n de signicncia em
o
vel
a
= 1%, as concluses seriam as mesmas. O leitor concorda?
o
Portanto, em trs passos:
e
1. formulaao das hipteses;
c
o
2. clculo das probabilidades com a estat
a
stica correta e
3. no rejeitar ou rejeitar H0
a
podemos concluir um teste de hipteses. At aqui, calculamos a probabilidade de encono
e
trar um valor igual ou mais extremo do que o pesquisador encontrou no experimento (),
devido ao acaso (variaoes aleatrias). Se este valor for menor do que um valor xado pelo
c
o
pesquisador, por exemplo, = 5%, rejeitamos a hiptese nula, caso contrrio, aceitamos H0 .
o
a

272

Mtodo Tradicional
e
Uma outra forma de se fazer um teste de hipteses, o qual o denominaremos de mtodo
o
e
tradicional, seria xar o n de signicncia desejado para o trabalho, por exemplo, = 5%.
vel
a
Para este n de signicncia considerado, podemos encontrar os valores correspondentes
vel
a
de z e p e, a partir deles, denir as regies de aceitaao e rejeiao da hiptese nula. Se os
o
c
c
o
valores calculados de z ou de p, com os dados da amostra, pertencerem a regio de aceitaao,
a
c
ento, conclui-se a favor de H0 , caso contrrio, rejeita-se a hiptese nula. Vamos continuar
a
a
o
com o nosso exemplo, para mostrar como feito o teste de hiptese nesse caso.
e
o
Vamos considerar que o nvel de signicncia (valor p) xado pelo pesquisador seja =

a
5%. Na distribuiao normal padro, o valor de z, abaixo do qual temos 5% da observaes,
c
a
co
vale -1,65. Observe que o nosso teste feito no lado esquerdo da curva, isto , ele um teste
e
e
e
unilateral. Voc pode obter este valor diretamente da tabela da distribuio normal padro,
e
ca
a
basta encontrar o valor de z que corresponde a uma probabilidade de 0,45; ou, ento, usar
a
um programa (software) estat
stico. No esquea que as probabilidades so dadas no corpo
a
c
a
da tabela da distribuio normal padro. Encontre este valor. Podemos encontrar o valor
ca
a
de p que corresponde ao valor de z = 1, 65, da seguinte forma:
z =

p
(1)
n

p 0, 94
0, 0119
p = 0, 92 = 92%.

1, 65 =

A gura 8.3 ilustra as regies de aceitaao e de rejeio da hiptese nula para um n


o
c
ca
o
vel
de signifcncia de 5%. Embora esperamos que o poder germinativo seja de 94%, ns temos
a
o
5% das porcentagens amostrais com valores abaixo de 92% de germinaao. Portanto, se
c
aceitarmos tomar z = 1, 65 ou p = 92% como linha divisria entre o que uma diferena
o
e
c
casual ou real, h um risco de 5% de rejeitarmos a hiptese nula quando ela de fato
a
o
e
verdadeira.
O valor de z, calculado com os dados da amostra vale:
z=

0, 928 0, 940
= 1, 01.
0, 0119

A proporao vericada na amostra foi igual a p = 0, 928 = 92, 8%. Como podemos ver na
c
gura 8.3, o valor calculado de z com os dados da amostra pertence a regio de aceitaao
a
c
da hiptese nula. Da mesma forma, o valor da proporao encontrada na amostra de 92,8%,
o
c

273

Regio de
rejeio de H0

Regio de aceitao de H0

45%
5%
-1,65

0,00

0,92

0,94

Figura 8.3: Regies de aceitao e de rejeiao da hiptese nula para uma probabilidade de
o
ca
c
o
erro de 5%
pertence a regio de aceitaao. Portanto, conclu
a
c
mos que no devemos rejeitar a hiptese
a
o
nula de que = 94%, ao n de signicncia de 5%.
vel
a
Pelo que foi exposto, podemos estabelecer uma sequncia lgica para a realizaao de um
e
o
c
teste de hiptese pelo mtodo tradicional. Os itens dessa sequncia so:
o
e
e
a
ca
o
sticas. Como vimos, todo
1. todo o trabalho inicia com a formulao das hipteses estat
teste estat
stico envolve duas hipteses: hiptese nula (H0 ) e a hiptese alternativa
o
o
o
(H1 );
stica amostral ou estimador que ele vai usar
2. o pesquisador precisa decidir qual a estat
2

(X, P, S , X1 X2 ) e, ter conhecimento dos resultaods da distribuio amostral do


ca
estimador, pois como vimos, ela descreve a variabilidade amostral;
3. o pesquisador precisa xar um n de signifcncia () para o teste e, assim, delimitar
vel
a
as regies de aceitaao e de rejeiao da hiptese nula;
o
c
c
o
4. calcular o valor da estat
stica teste (no nosso curso vamos usar as estat
sticas z, t e 2 )
com os dados da amostra (valor calculado) que ser comparado com o valor de tabela
a
(valor cr
tico);
5. consiste em vericar se o valor da estat
stica teste (valor calculado com os dados da

274

amostra), pertence ou no ` regio de rejeiao de H0 . Se no pertence ` regio de


a a
a
c
a
a
a
rejeiao, no rejeitamos H0 , caso contrrio, rejeitamos H0 .
c
a
a
Ultimamente, com a crescente disponibilizao de microcomputadores e programas (softca
wares) estat
sticos, mais informativo encontrarmos o n m
e
vel nimo signicativo, n desvel
critivo ou valor p de um teste, que em ingls denomina-se p-value.
e

8.2

Testes de Hipteses Unilaterais e Bilaterais


o

Vimos que existem trs possibilidades para a hiptese alternativa, quais sejam:
e
o
H1 : = 0 (teste bilateral)
H1 : > 0 (teste unilateral ` direita)
a
H1 : < 0 (teste unilateral ` esquerda)
a
A gura 8.4 ilustra essas trs possibilidades para a hiptese alternativa. Observe as respece
o
tivas regies de aceitaao e de rejeiao da hiptese nula em cada caso. No teste bilateral, as
o
c
c
o
reas de rejeiao correspondem a /2, enquanto que nos testes unilaterais, a rea de rejeiao
a
c
a
c
corresponde a . Observe que o sinal > ou < aponta para o lado da curva a ser utilizado.
Quando denimos o n
vel de signicncia () do teste, consequentemente temos o ponto
a
cr
tico, ou seja, o ponto limitrco entre as duas regies.
o
o

8.3

Erros Tipo I e Tipo II

De acordo com o que vimos, quando rejeitamos a hiptese nula, corremos o risco de
o
estarmos tomando uma deciso errnea, ou seja, ns rejeitamos a hiptese nula quando na
a
o
o
o
verdade dever
amos aceit-la. Este risco o n de signicncia ou valor p do teste e
a
e
vel
a
e
representado pela letra grega . Esse n de signicncia tambm conhecido como erro
vel
a
e
e
tipo I e, a probabilidade de sua ocorrncia vale . Um segundo tipo de erro que podemos
e
cometer, aceitar a hiptese nula, quando ela de fato falsa. Neste caso, temos o erro tipo
e
o
e
II, o qual representado pela letra grega . Esquematicamente, temos:
e
Se H0 :
e
no rejeitar H0
a

verdadeira
deciso correta (1 )
a

falsa
erro tipo II ()

rejeitar H0

erro tipo I ()

deciso correta (1 )
a

Aao
c

275

1
/2
Regio de rejeio

/2

Regio de aceitao

Regio de aceitao

Regio de rejeio
Ponto
crtico

Ponto
crtico

Regio de rejeio
Ponto
crtico

(a) Teste bilateral

(b) Teste unilateral ` direita


a

Regio de rejeio

1
Regio de aceitao

Ponto
crtico

(c) Teste unilateral ` esquerda


a

Figura 8.4: Testes de hipteses unilaterais e bilaterais


o

276

Na prtica, costume escolher-se n


a
e
veis tradicionais (5% e 1%) para e ignorar o erro tipo
II, ou seja, vamos nos preocupar em controlar o erro tipo I.

8.4

Testes de Mdias Populacionais


e

O objetivo de testar-se hipteses sobre mdias verdadeiras avaliar certas armaoes


o
e
e
c
feitas sobre as mesmas. Por exemplo, podemos desejar vericar a armao de que as
ca
alturas mdias de plantas de feijo, para sementes de alto e baixo vigor, so iguais.
e
a
a
Existem, basicamente, trs tipos de armaoes que se podem fazer quando se estuda
e
c
mdias populacionais, quais sejam:
e
1. a armaao diz respeito a uma mdia populacional, ento, temos o teste de uma mdia
c
e
a
e
populacional. Exemplo, os pesos ao nascer de bezerros da raa Nelore, no planalto
c
Catarinense, em agsto, de 25,5 kg;
o
e
2. a armaao diz que as mdias de duas populaes (dois tratamentos) so iguais, temos,
c
e
co
a
ento, o teste de comparaao de duas mdias. Exemplos: 1) as produoes mdias de
a
c
e
c
e
batatinhas de duas variedades so iguais e 2) as reas foliares espec
a
a
cas mdias da
e
espcie Cecropia glaziovi, cujo nome vulgar embaba ou embava, em amostras
e
e
u
u
situadas na borda da mata e na mata fechada so iguais.
a
c
e
c
3. a armaao diz que as mdias de mais de duas populaoes (mais do que dois tratamentos) so todas iguais, temos, ento, o teste de comparao de k mdias, com k > 2.
a
a
ca
e
Neste caso, devemos fazer uma Anlise de Varincia. Existem diversos livros especiala
a
izados em planejamento e anlise de experimentos, que tratam desse tipo de anlise,
a
a
por exemplo, os livros de Vieira (1999) e Steel & Torrie (1960). Por exemplo, desejamos saber se h diferenas entre trs locais (Ba Norte, Ba Sul e Pntano do Sul),
a
c
e
a
a
a
quanto ao nmero mdio de microncleos por 5000 clulas sangu
u
e
u
e
neas de peixes do
gnero bagre.
e
As tcnicas que ns vamos estudar pressupem uma distribuiao normal da distribuio
e
o
o
c
ca
X1 X2 ). Como sabemos, essa suposiao ser vlida

amostral da estat
stica ou estimador (X,
c
a a
se a distribuiao da varivel em estudo seguir uma distribuiao normal e a amostragem
c
a
c
for aleatria e, em geral, com boa aproximao se a amostra for sucientemente grande
o
ca
(sugesto: n 30).
a

277

8.4.1

Teste de Uma Mdia Populacional Quando a Varincia Populacional for


e
a
Desconhecida

Como j foi dito no estudo dos intervalos de conana, comum na prtica no conhecera
c e
a
a
2
mos o valor da varincia populacional ( ). Ento, devemos estim-la atravs dos valores
a
a
a
e
obtidos na amostra, atravs da varincia amostral (S 2 ).
e
a
No estudo de intervalos de conana, j discutimos que, ao substituir pela sua estimac a
tiva s, devemos utilizar a distribuio t de Student com n 1 graus de liberdade, onde n
ca
e
o tamanho da amostra.
Do estudo de intervalos de conana, obtemos a expresso da estat
c
a
stica teste a ser usada
aqui, dada por:

X 0
,
(8.1)
t(n1) =
S

a qual tem distribuio t de Student com n 1 graus de liberdade.


ca
Como j foi salientado, para pequenas amostras importante que a varivel em estudo
a
e
a
2
2
tenha distribuiao normal (X : N (; ), com e desconhecidos).
c
Para o teste de uma mdia, a hiptese nula dada por:
e
o
e
H 0 : = 0 .
Com conhecimento a respeito do assunto em estudo, o pesquisador ir selecionar uma das
a
seguintes hipteses alternativas:
o
H1 : = 0 (teste bilateral)
H1 : > 0 (teste unilateral ` direita)
a
H1 : < 0 (teste unilateral ` esquerda)
a
Como j foi dito, na realizaao de um teste de hiptese, costuma-se calcular o valor p do
a
c
o
teste. No caso do teste de uma mdia quando a varincia populacional for desconhecida, o
e
a
valor p calculado como segue. Para testar se signicativamente menor do que o valor
e
e
estabelecido na hiptese, H0 : = 0 , calculamos a probabilidade da varivel aleatria t,
o
a
o
assumir um valor menor ou igual ao valor de t(n1) calculado com os dados da pesquisa de
acordo com a equaao 8.1. Quando a hiptese alternativa H1 : < 0 , isto , temos um
c
o
e
e
teste unilateral ` esquerda, esta probabilidade P (t t(n1) ), a qual pode ser obtida em
a
e
tabelas da distribuio t de Student (Apndice 4), ou atravs de programas estat
ca
e
e
sticos. A
hiptese de nulidade H0 ser rejeitada se este valor p for bem pequeno, digamos, inferior a
o
a

278

5%. Da mesma forma, se a hiptese alternativa for H1 : > 0 , a hiptese nula (H0 ), ser
o
o
a
rejeitada se a P (t t(n1) ) for bem pequena. Se a hiptese alternativa for bilateral, isto
o
, H1 : = 0 , ento valores grandes negativos ou valores grandes positivos de t(n1) , so
e
a
a
fortes indicativos para a rejeio da hiptese nula. Neste caso, a hiptese nula ser rejeitada
ca
o
o
a
se P (t t(n1) ) + P (t t(n1) ), a qual igual a 2P (t |t(n1) |), for pequena.
e
Vejamos, agora, a aplicaao do teste de hiptese de que uma mdia populacional, ,
c
o
e
e
2
igual a um valor xo, 0 , supondo-se que a varincia populacional, , seja desconhecida.
a
Exemplo 1. Supe-se que a produtividade mdia de feijo da safra no Estado de Santa
o
e
a
Catarina de 800 kg/ha. Para investigar a veracidade dessa armao, consultou-se uma
e
ca
publicao do Instituto CEPA-SC, onde obteve-se os seguintes valores de produtividade
ca
mdia de feijo:
e
a
Safra

80/81

81/82

82/83

83/84

84/85

85/86

86/87

Produtividade

1017

980

507

841

899

264

700

87/88 88/89
800

653

a) Qual a concluso ao n de signicncia de 5%?


a
vel
a
b) D a estimativa da verdadeira produtividade mdia, com conana de 95%.
e
e
c
A nossa varivel em estudo a produtividade mdia anual. Como so valores mdios,
a
e
e
a
e
podemos assumir que a distribuio da varivel normal.
ca
a
e
Como no temos informaoes adicionais se a produtividade mdia maior ou menor do
a
c
e
e
que 800 kg, vamos construir as hipteses do seguinte modo:
o
H0 : = 800 kg/ha versus H1 : = 800 kg/ha.
A amostra nos fornece, x = 740, 11 kg/ha e s = 240, 68 kg/ha. Como vamos fazer um

teste sobre uma mdia populacional, com varincia estimada com os dados de uma amostra,
e
a
usamos a estat
stica 8.1, a qual segue uma distribuio t de Student com 9 1 = 8 graus
ca
de liberdade. Para um n de signicncia de 5% e, com o uso da tabela da distribuiao t
vel
a
c
(apndice 4) ou de um programa estat
e
stico, obtemos:
t(n1;) = t(91;0,05) = t(8;0,05) = 2, 306.
A regio de rejeio dada pelos valores |t8 | > 2, 306; a regio de aceitaao compreende os
a
ca e
a
c
valores (inclusive) entre -2,306 e 2,306, isto , |t8 | 2, 306. A gura 8.5 mostra as regies
e
o
de aceitaao e de rejeiao da hiptese. Observe nesta gura, como o teste bilateral, que
c
c
o
e
o n de signicncia est dividido em duas partes (0, 05/2), ou seja, 0,025 na cauda do
vel
a
a
lado esquerdo e 0,025 na cauda do lado direito. Com os valores da amostra vamos calcular

279

0,95
0,025
-2,306

Regio de
rejeio

0,00

0,025
2,306

Regio de aceitao

Regio de
rejeio

Figura 8.5: Regies de aceitaao e de rejeiao da hiptese nula com = 5%, para o teste de
o
c
c
o
uma mdia populacional
e
a estat
stica teste,
t8 =

740, 11 800
240,68

59, 89
= 0, 746.
80, 226

Como o valor calculado (-0,746) cai na regio de aceitaao de H0 , concluimos a favor de H0 .


a
c
Os dados da amostra indicam, ao n de signicncia de 5%, que a produtividade mdia
vel
a
e
pode ser considerada igual a 800 Kg/ha. Acabamos de fazer o teste pelo mtodo tradicional.
e
Podemos chegar a mesma concluso calculando diretamente o menor n para o qual
a
vel
rejeitamos a hiptese nula, devido ao acaso, isto , encontrando o n m
o
e
vel nimo signicativo
ou valor p do teste. Devemos calcular a
P (t < 0, 746) + P (t > 0, 746)
devido ao acaso. Se esse valor for igual ou maior do que 5% devemos aceitar a hiptese
o
nula, caso contrrio, rejeitamos. Com o uso de um programa estat
a
stico, na distribuiao de
c
Student, com 8 graus de liberdade, obtemos,
P (t < 0, 746) = 0, 238507.
Como a distribuiao simtrica a P (t > 0, 746) tambm vale 0,238507, assim, o n m
c e
e
e
vel nimo
signicativo do teste vale (2 0, 238507) = 0, 477017. Portanto, no rejeitamos a hiptese
a
o
nula, pois se a rejeitarmos, a probabilidade do erro tipo I de 47,81%.
e
O intervalo de conana, para a mdia verdadeira, ca:
c
e
240, 68
IC(; 95%) : 740, 11 2, 306
9

280

: 740, 11 185, 00
555, 1 925, 11.
Observao: Podemos chegar a mesma concluso de um teste de hiptese bilateral
ca
a
o
atravs do estudo do intervalo de conana. Sempre que o intervalo incluir o valor de H0 ,
e
c
devemos aceitar a hiptese nula. No exemplo, 800 kg/ha, est contido no intervalo, portanto,
o
a
aceitamos H0 : = 800 kg/ha.
Exemplo 2. Foi retirada uma amostra de tamanho 10, da populaao de pesos aos 210
c
dias de bezerros da raa Nelore. Os valores, em kg, foram os seguintes:
c
178

199 182

186 188

191

189 185

174 158

Teste as hipteses:
o
H0 : = 186 vs H1 : < 186,
ao n de signicncia de 5%.
vel
a
A varivel em estudo do tipo cont
a
e
nua e vamos assumir que a mesma tenha, pelo menos
aproximadamente, distribuiao normal. Como desejamos fazer um teste para uma mdia
c
e
e temos uma estimativa da varincia, vamos usar a estat
a
stica 8.1. Na amostra obtemos
x = 183 e s = 11, 18. Para = 5%, da tabela da distribuiao t de Student, para um teste

c
unilateral (de acordo com a hiptese alternativa), obtemos, t(9;0,05) = 1, 83. Para encontrar
o
este valor na tabela da distribuiao t de Student (apndice 4), devemos entrar na coluna de
c
e
P = 0, 10, pois a tabela bilateral e o teste unilateral. A tabela s fornece valores positivos
e
e
o
de t, como ela simtrica, basta mudar o sinal. A regio de rejeiao corresponde aos valores
e
e
a
c
menores do que -1,83; a regio de aceitao formada pelos valores maiores ou igual a -1,83.
a
ca e
A gura 8.6 mostra as duas regies. Com os dados da amostra temos:
o
t9 =

183 186
11,18

10

= 0, 847.

O valor -0,847 est na regio de aceitao, portanto, aceita-se a hiptese nula. Os dados
a
a
ca
o
da amostra suportam a hiptese de que a mdia dos pesos aos 210 dias de bezerros da raa
o
e
c
Nelore igual a 186 kg, com probabilidade de erro de 5%.
e
Podemos fazer o teste atravs da interpretaao do valor p. Com o aux de um programa
e
c
lio
estat
stico vamos encontrar o valor p do teste. O menor valor de para o qual rejeitamos a
hiptese nula :
o
e
P (t < 0, 847) = 0, 2095 = 20, 95%.
Como 20,95% maior do que os 5% denido pelo pesquisador, devemos aceitar a hiptese
e
o

nula. E assim, o pesquisador admite uma probabilidade de erro de no mximo 5%, neste
a

281

0,05

-1,83
Regio de rejeio

Regio de aceitao

Figura 8.6: Regies de aceitaao e de rejeiao da hiptese nula com = 5%, para o teste de
o
c
c
o
uma mdia populacional
e
exemplo, se ele rejeitar a hiptese, a probabilidade de erro de 20,95%, portanto, ele deve
o
e
aceitar a hiptese nula.
o
Exemplo 3. Continuaao do exemplo dos res
c
duos industriais jogados nos rios da seo
ca
7.4.1. Leia aquele enunciado. Teste as hipteses:
o
H0 : = 5 versus H1 : = 5
O valor da estat
stica teste :
e
t5 =

4, 933 5, 000

= 1, 2014
0, 1366/ 6

O valor terico de t : t(5;0,05) = 2, 571. Portanto, a regio de aceitaao est entre -2,571 e
o
e
a
c
a
2,571. Como o valor -1,2014 est dentro desta regio, no rejeitamos a hiptese nula.
a
a
a
o
Uma Aplicao em Distribuio Espacial
ca
ca
Sabemos que, na distribuiao de Poisson, os indiv
c
duos se distribuem aleatoriamente num
habitat. Na distribuiao de Poisson, a mdia igual a varincia 2 , ou seja, 2 /=1, como
c
e
e
a
visto na seo 4.7. Quando a razo, 2 /, for menor do que 1 dizemos que a distribuio
ca
a
ca e
2
uniforme; se a razo / for maior do que 1 conclu
a
mos que a distribuiao agregada.
c e
Neste caso estamos interessados em testar as seguintes hipteses:
o
H0 : 2 / = 1

versus

Ha : 2 / = 1

ou seja, sob H0 , a distribuio da espcie aleatria. Para vericar as hipteses assim


ca
e
e
o
o
formuladas, a estat
stica do teste dada por:
e

| S 2 /X 1 |
t=
.
2/(n 1)

282

Tabela 8.1: Distribuio de Primula simenses


ca
X plantas por quadrado Nmero de quadrados com X plantas
u
0
1
2
3
4
5
6
7
8
>8

26
21
23
14
11
4
5
4
1
0

Total

109

a qual tem distribuio t de Student com n 1 graus de liberdade.


ca
Exemplo: Uma certa regio orestal foi dividida em 109 quadrados para estudar a disa
tribuio de Primula simenses selvagem. A priori, supomos que este tipo distribui-se aleatoca
riamente na regio. A tabela 8.1 indica o nmero de quadrados com X Primula Simenses; o
a
u
nmero mdio de plantas por quadrado foi de 2,2, e a varincia foi igual a 3,9549, portanto,
u
e
a
o desvio padro vale 1,9887. (Encontre esses valores).
a
O valor da estat
stica t :
e
t=

3,9903
2,1929

2
1091

0, 8196
= 6, 02
0, 1361

O valor de t da tabela vale t(108;0,05) = 1, 98. Como 6,02 > 1,98, rejeitamos a hiptese nula e
o
concluimos que a distribuio por agregado. A referncia bibliogrca utilizada foi Brower
ca e
e
a
& Zar, ano??
8.4.2

Teste de Duas Mdias Populacionais com Varincias Populacionais Dee


a
sconhecidas

Vamos, nesta seao, estender o procedimento anterior para o caso de comparaao de


c
c
duas mdias populacionais, quando as varincias populacionais so desconhecidas. A fundae
a
a
mentao bsica continua sendo a mesma, s se faro algumas alteraoes quanto ` estat
ca a
o
a
c
a
stica
teste a ser utilizada.

283

Inicialmente, vamos supor que temos duas amostras selecionadas de populaes normais
co
(varivel em estudo apresente, pelo menos aproximadamente, uma distribuio normal).
a
ca
A questo da normalidade especialmente importante quando o tamanho da amostra
a
e
e
pequeno. Para cada amostra, vamos calcular a mdia e a varincia dos dados.
e
a
O objetivo do teste, neste caso, decidir se as mdias de duas populaes so iguais. De
e
e
co
a
modo geral, vamos testar hipteses referentes ao valor real da diferena entre duas mdias
o
c
e
populacionais, ou seja,
H 0 : 1 2 = .
Na prtica, temos especial interesse quando
a
igualdade das duas mdias, ou seja,
e

= 0, neste caso, testamos a hiptese de


o

H0 : 1 = 2 .
Como no caso do teste de uma mdia populacional, temos trs possibilidades para a
e
e
hiptese alternativa, quais sejam,
o
H1 : 1 = 2 (teste bilateral)
H1 : 1 > 2 (teste unilateral ` direita)
a
H1 : 1 < 2 (teste unilateral ` esquerda).
a
Num teste de comparaao de duas mdias, temos dois casos a considerar, quais sejam:
c
e
1. dados pareados ou amostras dependentes. Os dados de duas amostras constituem dados pareados quando esto relacionados dois a dois, segundo algum critrio
a
e
que introduz um inuncia marcante entre os diversos pares de valores. Exemplo: dee
sejamos fazer um teste estat
stico para vericar se existe diferena signicativa entre
c
as mdias das notas obtidas na primeira avaliao e na segunda avaliao da disciplina
e
ca
ca
de estat
stica. Ento, para cada aluno, tomamos a sua nota na primeira avaliao e
a
ca
na segunda avaliao. Como existem diferenas entre os alunos (alguns estudam mais,
ca
c
outros tem mais facilidade com a disciplina, etc.), os pares de notas (cada aluno um
par de notas) no so independentes. Existe o fator aluno introduzindo uma inuncia
a a
e
forte entre os pares de dados. Outro exemplo: vamos submeter seis animais de determinada espcie a uma nova dieta. Am de determinar o efeito da dieta foram tomados
e
os pesos antes e depois da dieta. Nesse caso, as observaoes foram feitas nos mesmos
c
animais, medindo uma caracter
stica antes e depois deles serem submetidos a uma
dieta.

284

2. dados no pareados ou amostras independentes. Neste caso, os dados das duas


a
amostras no esto relacionados por nenhum fator que possa confundir (misturar) o
a
a
efeito do fator em estudo. Exemplo: vamos fazer um estudo com o objetivo de vericar
se o comprimento do ante-brao de morcgos de duas espcies so iguais. Para isso,
c
e
e
a
tomamos uma amostra de morcgos da espcie A e uma outra amostra de morcgos da
e
e
e
espcie B. Podemos perceber que os dados das duas amostras no esto relacionados,
e
a
a
ou seja, as duas amostras so independentes, pois os resultados de uma amostra no
a
a
interfere nos resultados da outra amostra.
Para o caso de amostras independentes, podemos, ainda, distinguir duas situaes, quais
co
sejam:
1. quando as varincias so desconhecidas mas podem ser consideradas iguais, ou seja, a
a
a
ordem de grandeza no difere muito;
a
2. quando as varincias so desconhecidas e consideradas desiguais, ou seja, a ordem de
a
a
grandeza difere bastante.
Vamos fazer dois testes de signicncia para comparao de duas mdias de amostras
a
ca
e
independentes, um para varincias homogneas (consideradas iguais) e outro para varincias
a
e
a
heterogneas (consideradas desiguais). Portanto, percebemos que tambm h a necessidade
e
e
a
de se fazer um teste de hipteses para as varincias populacionais, para podermos decidir se
o
a
as mesmas podem ser consideradas iguais ou no.
a

Teste para Dados Pareados


Inicialmente, vamos apresentar um exemplo que esta muito relacionado com o planejamento de um experimento. Na verdade, vamos exemplicar a construao do delineamento,
c
talvez o mais utilizado na experimentaao, denominado de blocos ao acaso.
c
Vamos supor que desejamos colocar em teste duas cultivares de feijo. Decidiu-se que
a
sero feitas sete repeties de cada cultivar, portanto, os tamanhos das amostras vo ser
a
co
a
iguais e igual a 7, n1 = n2 = 7. Tambm, decidiu-se que as unidades experimentais vo ser
e
a
2
formadas por reas de terra (canteiros) de 20 m e sero utilizadas 250 gramas de sementes
a
a
por unidade experimental. Como temos duas cultivares, cada uma com 7 repeties, vamos
co
precisar de 14 unidades experimentais. Vamos imaginar, que a rea que o pesquisador tem
a
a disposiao para implantar o experimento, apresenta uma considervel inclinao, fazendo
c
a
ca
com que exista heterogeneidade entre as unidades experimentais, quanto ` fertilidade do
a

solo. Na parte alta do terreno a fertilidade menor do que na parte baixa do mesmo. E
e

285

Parte alta do terreno


Bloco I

C2

Bloco II

C1

Bloco III

C2

C1

Bloco IV

C1

C2

Bloco V

C1

Fertilidade

C2

C2

C1
C1

C2

Bloco VI

C2

C1

Bloco VII

Parte baixa do terreno

Figura 8.7: Delineamento blocos ao acaso


fundamental que o pesquisador encontre uma forma de dispor as unidades experimentais, de
tal forma que a diferena de fertilidade seja eliminada da comparao entre as duas cultivares.
c
ca
Portanto, j de in
a
cio, devemos descartar a possibilidade de se fazer uma sorteio aleatrio
o
das duas cultivares nas 14 unidades experimentais. Imagine, que no sorteio, a maioria das
unidades experimentais que esto localizadas na faixa mais frtil da rea receba a cultivar
a
e
a
1. Dessa forma, no saberemos distinguir o que variao devido a cultivar ou devido `
a
e
ca
a
fertilidade do solo (os efeitos esto confundidos). A forma correta do desenho experimental
a
dado na gura 8.7. Foram constru
e
dos sete blocos, dentro de cada bloco as unidades so
a
homogneas quanto ` fertilidade, pois esto na mesma faixa do terreno. Entre os blocos pode
e
a
a
e deve existir diferenas de fertilidade. O sorteio das cultivares `s unidades experimentais
c
a
feito independentemente para cada bloco. Portanto, a formaao de blocos constitue um
e
c
pareamento.
O critrio para a formaao dos pares pode ser, por exemplo, as formulaoes de um
e
c
c
comprimido, ou seja, o que denominamos em experimentaao de fator. Deseja-se comparar
c
dois mtodos de determinaao da quantidade de princ
e
c
pio ativo presente nos comprimidos,
quais sejam: 1) HPLC e 2) Titulaao. Para cada formulao aplica-se os dois mtodos. Se
c
ca
e

286

temos, por exemplo, sete formulaoes, teremos sete pares.


c
Vamos apresentar o teste de duas mdias para dados pareados atravs de um exemplo.
e
e
Como zemos para o caso do teste de hiptese de uma mdia, aqui, tambm vamos fazer o
o
e
e
teste pelo enfoque tradicional, ou seja, xamos o valor do n de signicncia (), enconvel
a
tramos as regies de aceitaao e de rejeio da hiptese e vericamos em qual destas regies
o
c
ca
o
o
o valor da estat
stica teste se encontra, e pelo mtodo atual, ou seja, encontrando-se qual o
e
menor valor de para o qual rejeitamos a hiptese nula, ou seja, o (valor p). Como poder
o
a
ser vericado, o teste para comparao de duas mdias de amostras pareadas, um teste
ca
e
e
para comparaao de uma mdia de valores de diferenas dos pares.
c
e
c
Exemplo. Foi conduzido um experimento para estudar o contedo de hemoglobina no
u
sangue de su
nos com decincia de niacina. Aplicou-se 20 mg de niacina em 8 su
e
nos.
Podemos armar que o contedo de hemoglobina no sangue diminuiu, com a aplicaao de
u
c
niacina, ao n de signicncia de 5%? Encontre o intervalo de conana com 95% para a
vel
a
c
verdadeira diferena entre as duas mdias. Foram mensurados os n
c
e
veis de hemoglobina no
sangue antes e depois da aplicao da niacina, os resultados obtidos no experimento foram:
ca
Su
nos

Antes (A)

Depois (B)

Diferenas (A-B)
c

1
2
3
4
5
6
7
8

13,6
13,6
14,7
12,1
12,3
13,2
11,0
12,4

11,4
12,5
14,6
13,0
11,7
10,3
9,8
10,4

2,2
1,1
0,1
-0,9
0,6
2,9
1,2
2,0

Vamos considerar que temos um suporte terico para esperar que o contedo de hemoglobina
o
u
no sangue diminua com a aplicaao de niacina, portanto, as hipteses cam:
c
o
H 0 : A = B

versus H1 : A > B .

As mesmas hipteses, dadas em forma de diferenas entre as duas mdias, D = A B ,


o
c
e
podem ser escritas como,
H0 : D = 0 versus H1 : D > 0.
Trabalhando-se com as diferenas, na verdade estamos eliminando as diferenas entre os
c
c
indiv
duos (no exemplo, su
nos). Vamos admitir que, sob H0 , as diferenas de contedo de
c
u

287

0,00
Regio de aceitao

1,89
2,66
Regio de rejeio

Figura 8.8: Teste de hiptese para comparar duas mdias de dados pareados
o
e
hemoglobina, seguem, pelo menos aproximadamente, uma distribuio normal com mdia
ca
e
2
2
0 (zero) e varincia D , e a representamos por: D N (0, D ). Tomando-se os valores das
a
diferenas entre A e B, ca
c
mos no caso do teste de uma mdia com varincia desconhecida,
e
a
cuja estat
stica teste dada por:
e

D D
,
(8.2)
tn1 =
SD

e
a qual segue uma distribuio t de Student com n 1 graus de liberdade. Aqui, D a mdia
ca
e
das diferenas entre os valores de A e B; SD o desvio padro das diferenas e D o valor
c
e
a
c
e
dado na hiptese nula, geralmente este valor nulo. Com os dados da amostra obtemos:
o
e

d = 1, 15, sd = 1, 225.

Para um n de signicncia xado em 5%, e teste unilateral, obtemos na tabela da


vel
a
distribuio t de Student o valor t7 = 1, 895. A estat
ca
stica teste 8.2 calculada com os valores
da amostra vale,
1, 15 0
= 2, 655.
t7 =
1, 225/ 8
As regies do teste de hiptese e o valor da estat
o
o
stica teste esto indicadas na gura 8.8, para
a
o n de signicncia desejado. Como o valor de t calculado na amostra cai na regio de
vel
a
a
rejeio de H0 , conclu
ca
mos, ao n de signicncia de 5%, que o contedo de hemoglobina
vel
a
u
diminui com a aplicao de 20 mg de niacina.
ca
Podemos, facilmente, obter o n m
vel nimo signicativo do teste, determinando a probabilidade de se encontrar um valor igual ou mais extremo do que 2,655 devido ao acaso. Com
o aux de um programa estat
lio
stico, este valor dado por,
e
P (t > 2, 655) = 0, 016352.

288

Portanto, a probabilidade de que esse resultado tenha ocorrido devido ao acaso, de apenas
e
1,64%. Como este valor menor do que os 5% xado pelo pesquisador, rejeitamos a hiptese
e
o
nula.
Importante: devemos tomar muito cuidado quando estamos usando um programa estat
stico para fazer um teste de hiptese, no sentido de vericar se o programa est fazendo
o
a
um teste bilateral ou unilateral. Por exemplo, o programa Statistica, para o exemplo em
estudo, fornece um valor p de 0,032665, ou seja, est considerando um teste bilateral. Neste
a
caso, devemos dividir 0,032665 por 2 para obtermos o valor p correto.
O intervalo de conana para D dado por:
c
e
1, 225
IC(D ; 95%) : 1, 15 2, 365
8
: 1, 15 1, 0243
0, 1257 D 2, 1743.

(8.3)

Observe que o valor de t vale 2,365, obtido diretamente na tabela para = 5%, pois o
intervalo de conana bilateral, assim como a tabela por ns utilizada.
c e
o

Teste para Comparao de Duas Mdias, de Amostras


ca
e
Independentes e Varincias Desconhecidas e Supostas Iguais
a
Como vimos, o procedimento de teste de hipteses sempre segue uma mesma sequncia,
o
e
o que muda a estat
e
stica amostral de interesse do pesquisador e a estat
stica de teste a ser
utilizada.
Vamos supor que as amostras sejam independentes, oriundas de duas populaoes com
c
distribuio normal e que as varincias das duas populaes so desconhecidas e, portanto,
ca
a
co
a
precisam ser estimadas, e que no diram muito em ordem de grandeza.
a
Para sabermos se duas varincias podem ser consideradas iguais, ou seja, se existe hoa
mogeneidade de varincias, necessrio que se proceda a um teste de hipteses sobre as
a
e
a
o
varincias populacionais. Portanto, inicialmente, vamos testar a hiptese de homogeneidade
a
o
de varincias e, em seguida, dado que aceitamos que as varincias so iguais, vamos testar a
a
a
a
hiptese de igualdade entre as mdias das duas populaes. O teste de comparao de duas
o
e
co
ca
mdias, quando as varincias so desiguais ou heterogneas, ser apresentada na prxima
e
a
a
e
a
o
seo. A comparaao entre varincias feita com o uso do teste F, o qual passamos a estudar.
ca
c
a
e

Teste F para Comparao de Varincias Populacionais


ca
a

289

Como qualquer outro teste, devemos sempre iniciar pela formulaao das hipteses, que
c
o
nesse caso so dadas por,
a
2
2
H0 : 1 = 2

2
2
versus H1 : 1 > 2 .

Onde 1 e 2 so as varincias da populao 1 e populaao 2, respectivamente. A hiptese


a
a
ca
c
o
nula admite que as duas populaes tem a mesma varincia. Observe que na hiptese sempre
co
a
o
temos os parmetros. A hiptese alternativa admite que a varincia da populaao 1 maior
a
o
a
c
e
do que a varincia da populaao 2, ou seja, as varincias so heterogneas. Portanto, vamos
a
c
a
a
e
aqui, sempre fazer um teste unilateral.
Quando desejamos comparar varincias, devemos utilizar a estat
a
stica F , dada pelo quo2
2
ciente entre as duas estimativas de varincias, s2 e s2 , de 1 e 2 , respectivamente, distintas
a
1
2
e supostas independentes. Temos,
s2
1
F = 2.
(8.4)
s2
As varincias s2 e s2 so calculadas com os n1 e n2 dados das amostras, respectivamente.
a
1
2 a
Assim, dizemos que a s2 esto associados n1 1 graus de liberdade (numerador) e, da mesma
a
1
2
forma, para s2 esto associados n2 1 graus de liberdade (denominador). Vamos admitir
a
2
sempre que s1 maior do que s2 , ou seja, no numerador vamos usar a varincia maior, de
e
a
2
tal modo que tenhamos F 1.
A concluso do teste pode ser feita atravs do n m
a
e
vel nimo signicativo (valor p). Se
este valor for bastante baixo, digamos, menor do que 5%, rejeitamos a hiptese nula, caso
o
contrrio, no rejeitamos. Outra forma fazer a comparao do valor de F , calculado com
a
a
e
ca
os dados das amostras (Fcalculado ), e o valor de F cr
tico, obtido na tabela da distribuio F ,
ca
dada no apndice 6, com n1 1 graus de liberdade no numerador e n2 1 graus de liberdade
e
no denominador, e com um n de probablidade xado pelo pesquisador. Ento, por este
vel
a
procedimento, rejeitamos H0 se Fcalculado > Fn1 1,n2 1, . A tabela fornecida no apndice 6
e
apresenta o n de signicncia () xado em 5%. Existem tabelas para outros valores de .
vel
a
Porm, os programas estat
e
sticos j nos fornecem as probabilidades, atravs da distribuiao
a
e
c
de F , ou o valor p do teste.
Exemplo 1. As produes de duas variedades de milho, em toneladas por hectare, foram
co
as seguintes:
Variedade A 1,3 1,4 1,1 1,4 1,5
Variedade B

1,8

1,6 1,9

1,9 1,8

Dos dados das amostras obtemos, xA = 1, 34, xB = 1, 80, s2 = 0, 0231 e s2 = 0, 0150.

A
B
Inicialmente, vamos testar a hiptese de homogeneidade de varincias. Assim, o valor da
o
a

290

estat
stica F ,
e

0, 0231
= 1, 54,
0, 0150
a qual tem 5 1 = 4 graus de liberdade no numerador e 5 1 = 4 graus de liberdade no
denominador. Com o aux de um programa estat
lio
stico, encontramos que o n m
vel nimo
signicativo vale exatamente: P (F > 1, 54) = 0, 343. Como este valor maior do que 0,05
e
ou 5%, conclu
mos que as duas varincias podem ser consideradas iguais.
a
Podemos fazer o teste de homogeneidade de varincias pelo mtodo tradicional, ou seja,
a
e
xando o n de signicncia e construindo as regies de aceitao e de rejeio da hiptese
vel
a
o
ca
ca
o
de nulidade. Com o aux da tabela da distribuiao F (apndice 6), com um n de siglio
c
e
vel
nicncia de 5%, com 4 e 4 graus de liberdade no numerador e denominador, respectivamente,
a
obtemos o valor de F cr
tico como sendo igual a 6,39. Como o valor de Fcalculado menor
e
do que o F cr
tico (1,54 6,39), aceitamos a hiptese nula, portanto, as varincias so hoo
a
a
mogneas. A regio de rejeiao formada pelos valores de F maiores que 1,54 e, a regio de
e
a
c e
a
aceitao formada pelos valores de F menores ou igual a 1,54.
ca e
Voltemos, agora, ao objetivo do pesquisador, que vericar se duas mdias populacionais
e
e
podem ser consideradas iguais ou no. No exemplo, as hipteses so dadas por:
a
o
a
F =

H 0 : A = B

versus H1 : A = B .

Para estudar se duas mdias populacionais so iguais ou no, a estat


e
a
a
stica teste a ser
utilizada dada por:
e

(X1 X2 ) (1 2 )
t=
(8.5)
2
2
(n1 1)S1 +(n2 1)S2
1
1
+ n2
n1 +n2 2
n1
a qual tem distribuiao t de Student com n1 + n2 2 graus de liberdade. Vamos aplicar o
c
teste no exemplo das duas variedades de milho. A estat
stica de teste 8.5 vale,
t8 =

(1, 34 1, 80) 0
(51)0,0231+(51)0,0150
5+52

1
5

1
5

0, 46
0, 0191(0, 40)

= 5, 263.

Com o aux da tabela (bilateral) da distribuiao de Student, para um teste bilateral, com
lio
c
8 graus de liberdade, o n m
vel nimo signicativo vale,
P (t < 5, 269) + P (t > 5, 269) < 0, 001.
Para obter este valor de probabilidade, entramos na tabela com 8 graus de liberdades (1a
coluna). Seguimos pela linha dos 8 graus de liberdade at encontrar um valor igual ou mais
e
prximo de 5,263. O valor mais prximo encontrado 5,041, cuja probabilidade vale 0,001.
o
o
e

291

95%
2,5%
-2,306

Regio de

0,00

2,5%
2,306

Regio de aceitao

Regio de
rejeio

rejeio

Figura 8.9: Teste de hiptese para comparar duas mdias dos dados de produao de duas
o
e
c
variedades de milho
Como o valor encontrado da estat
stica teste (5,263) menor do que 5,041, implica que o
e
valor da probabilidade menor do que 0,001.
e
Usando um software estat
stico, para 8 graus de liberdade, teste bilateral, obtemos exatamente a P (|t| < 5, 269) =, 000756 ou 0,0756%, portanto, devemos rejeitar a hiptese nula,
o
e conclu
mos que as produoes das duas variedades diferem entre si, sendo que a cultivar B
c
mais produtiva, ao n de signicncia de 0,0756%.
e
vel
a
Podemos, tambm, realizar o teste de hiptese pela maneira tradicional. Neste caso,
e
o
devemos xar o n de signicncia desejado, encontrar as regies de aceitao e de rejeiao
vel
a
o
ca
c
da hiptese nula e vericar em qual das regies est o valor da estat
o
o
a
stica de teste. Por
exemplo, para = 5%, da tabela da distribuiao t (teste bilateral), obtemos, t8;5% = 2, 306.
c
As regies esto mostradas na gura 8.9. Como o valor da estat
o
a
stica teste, t = 5, 269,
est na regio de rejeio da hiptese nula, conclu
a
a
ca
o
mos que as mdias diferem entre si, com
e
probabilidade de erro de 5%.
Podemos calcular o intervalo de conana para a diferena entre as mdias, A B . O
c
c
e
intervalo de conana dado pela expresso,
c e
a
IC(A B ; 95%) : (A xB ) tnA +nB 2;5% sxA B ,
x

x
onde sxA B o desvio padro da diferena entre as duas mdias, e dado por:
a
c
e
e

x e
2
2
1
(nA 1)SA + (nB 1)SB 1
+
.
nA + nB 2
nA nB

Para o exemplo, o intervalo de conana dado por,


c e
IC(A B ; 95%) : 0, 46 2, 306(0, 0873)

292

: 0, 46 0, 20131
0, 6613 A B 0, 2587.
Portanto, podemos armar com 95% de conana, que a verdadeira diferena entre as duas
c
c
mdias encontra-se no intervalo de -0,6613 e -0,2587.
e
O intervalo de conana tambm nos indica se existe ou no diferena signicativa entre
c
e
a
c
as duas mdias, ou seja, ele nos fornece o resultado de um teste de hiptese. Ns devemos
e
o
o
aceitar a hiptese nula, H0 : A = B , se o valor desta hiptese, encontra-se dentro do
o
o
intervalo de conana, caso contrrio, devemos rejeitar a hiptese nula. Se H0 : A = B ,
c
a
o
ento H0 : A B = 0, portanto, o valor da hiptese 0 (zero). Como vemos, o valor da
a
o
e
hiptese, no est inclu no intervalo, isso implica que devemos rejeitar a hiptese nula.
o
a
a
do
o
Como o teste de hiptese oriundo do intervalo de conana, estamos seguros para utilizar
o
e
c
esse critrio.
e
Exemplo 2. Os tempos gastos na manobra dos arados Fuador e Erechim, foram os
c
seguintes:
Fuador
c

0,20

0,22 0,18

0,23

0,12 0,20

0,13

0,12 0,13

0,22

0,17

Erechim 0,36

0,48 0,33

0,43

0,40 0,43

0,33

0,36 0,35

0,40

0,35

Espera-se que o arado Fuador produza melhores resultados (gaste menos tempo na manobra).
c
Testar a hiptese de que as mdias de tempos gasto no diferem signicativamente ao n
o
e
a
vel
de 5%. Encontre o intervalo de conana para a diferena das mdias F E .
c
c
e
Com os dados amostrais obtemos: xF = 0, 1745, xE = 0, 3836, s2 = 0, 0018 e s2 =

F
E
0, 0023.
O primeiro passo vericarmos se existe homogeneidade de varincias, ou seja, vamos
e
a
2
2
2
2
testar as hipteses, H0 : F = E vs H1 : E > F . A estat
o
stica F vale, F = s2 /s2 =
E
F
0, 0023/0, 0018 = 1, 2778, com 10 graus de liberdade no numerador e 10 graus de liberdade
no denominador. Com o aux de um programa estat
lio
stico, na distribuiao F , obtemos o
c
n m
vel nimo signicativo do teste (valor p), o qual vale,
P (F > 1, 2778) > 0, 352869.
De acordo com esse resultado, devemos aceitar a hiptese de varincias semelhantes.
o
a
Fazendo o teste de outra forma; podemos xar em 5% e encontrar o valor de F ,
com 10 (numerador) e 10 (denominador) graus de liberdade. Da tabela de F , encontramos
F10;10;5% = 2, 98. Como o valor de F calculado com os dados da amostra menor do que o
e
valor de F da tabela, aceitamos a hiptese nula.
o

293

Partimos, agora, para o teste sobre as mdias populaionais. As hipteses sobre as mdias
e
o
e
verdadeiras, de interesse do pesquisador, so formuladas como:
a
H 0 : F = E

H 1 : F < E .

O valor da estat
stica 8.5, vale:
t20 =

(0, 1745 0, 3836) 0


(111)0,0018+(111)0,0023
11+112

1
11

= 10, 831.
+

1
11

A probabilidade de encontrar um valor mais extremo do que -10,831, devido ao acaso,


e
praticamente nulo, ou seja,
P (t < 10, 831) 0.
=
Conclu
mos que o tempo gasto na manobra com o arado Fuador realmente inferior ao
c
e
arado Erechim.
Pelo mtodo tradicional de testar uma hiptese, temos: t20;5% = 1, 725. Como o valor
e
o
de t calculado menor do que o valor de t de tabela, rejeitamos a hiptese nula.
e
o
O intervalo de conana de 95%, para a diferena entre as duas mdias, dado por:
c
c
e
e
IC(F E ; 95%) : 0, 2091 2, 086(0, 01931)
0, 2494 F E 0, 1688.
Conclu
mos, com conana de 95%, que a verdadeira diferena entre as duas mdias F E ,
c
c
e
est entre 0,17 e 0,25.
a

Teste para Comparao de Duas Mdias, de Amostras


ca
e
Independentes e Varincias Desconhecidas e Supostas Desiguais
a
Suponhamos que as amostras sejam oriundas de duas populaoes com distribuiao norc
c
mal, independentes e varincias heterogneas e desconhecidas, portanto, precisam ser estia
e
madas com os valores da amostra. Neste caso, a estat
stica de teste da diferena entre duas
c
mdias, dada por:
e
e

(X1 X2 ) (1 2 )
t=
.
(8.6)
2
2
S1
S2
+ n2
n1
Prova-se que esta varivel tem uma distribuiao aproximada de Student, com graus de
a
c
liberdade corrigido, dados por:
v=

2
S1
S2
+ n2
n1
2

 2 2
S1
n1

n1 1

294

2
S2
n2

2

n2 1

Exemplo 1. Em um centro agr


cola, deseja-se testar o efeito de determinado fertilizante
sobre a produao de trigo. Para isso, escolheram-se 24 reas de terra, cada uma com 5
c
a
2
2 = 10m , de uma grande rea homognea. Metade dessas unidades so tratadas com
a
e
a
um fertilizante, enquanto a outra metade no recebe o fertilizante, este denominado de
a
e
tratamento controle. A produao mdia de trigo sem fertilizante foi de 1260 kg/ha com
c
e
desvio padro de 730 kg/ha, enquanto que a produo mdia com fertilizante foi de 1710
a
ca
e
kg/ha com desvio padro de 280 kg/ha. Podemos armar que houve aumento signicativo
a
na produao de trigo devido a utilizaao do fertilizante?
c
c
Antes de fazermos o teste sobre as mdias populacionais, devemos vericar se as varincias
e
a
so homogneas ou no, para decidirmos qual estat
a
e
a
stica t devemos usar, 8.5 ou 8.6?. Para
isso, vamos utilizar a estat
stica F , dada em 8.4, que no exemplo, vale, F = 532900/78400 =
6, 7972, com 11 (numerador) e 11(denominador) graus de liberdade. A probabilidade de
encontrar um valor maior do que 6,7972, devido ao acaso , P (F > 6, 7972) =, 001790,
e
menor do que 5%, portanto, conclu
mos que as varincias so consideradas diferentes.
a
a
As hipteses, sobre a mdias populacionais, so formuladas do seguinte modo:
o
e
a
H0 : F = C

H 1 : F > C .

De acrdo com a hiptese alternativa, o nosso teste unilateral. O valor da estat


o
o
e
stica t, :
e
t=

(1710 1260) (0)


532900
12

78400
12

= 1, 99,

com graus de liberdade,


v=

532900
12

( 532900 )
12
11

78400 2
12
2

( 78400 )
12

= 14, 17 15.
=

11

Da distribuiao t, com 15 graus de liberdade, o valor da probabilidade de encontrar um valor


c
mais extremo do que 1,99 vale,
P (t > 1, 99) = 0, 032570.
Conclu
mos que o uso de fertilizante provocou um aumento real na produo de trigo, ao
ca
n de signicncia de 3,26%.
vel
a
Fazendo o teste pelo mtodo tradicional. Fixando-se o n de signicncia () em 5%,
e
vel
a
obtemos da distribuio t de Student, t15;5% = 0, 01753. Como o valor calculado com os
ca
dados da amostra (t = 1, 99) maior do que o da distribuiao t de Student, rejeitamos H0 ,
e
c

295

consequentemente, podemos armar, ao n de signicncia de 5%, que o uso de fertilizante


vel
a
causa um acrscimo signicativo na produao.
e
c
Exemplo 2. As seguintes medidas de Cytochrome oxidase foram determinadas em machos de peixes Periplaneta em mm3 por 10 minutos por miligrama,
Tratamentos

tamanho amostra

mdia desvio padro


e
a

varincia
a

24 horas aps injeao de methoxyclor


o
c

24,8

0,9

0,81

Controle

19,7

2,8

7,84

Verique se existe efeito signicativo da aplicaao de methoxyclor quanto as mdias de


c
e
Cytochrome oxidase.
2
2
Como primeiro passo, vamos aplicar o teste F , para vericar as hipteses: H0 : T = C ,
o
2
2
stica F vale, F = 7, 84/0, 81 = 9, 68, com 2 e 4 graus de
versus H1 : T < C . A estat
liberdade. A P (F > 9, 68) = 0, 0293, consequentemente, conclu
mos que as varincias so
a
a
heterogneas. Para a comparao entre as duas mdias vamos usar a estat
e
ca
e
stica 8.6.
As hipteses, sobre as mdias verdadeiras, so dadas por:
o
e
a
H0 : T = C

H 1 : T = C .

O valor da estat
stica dada em 8.6 :
e
(24, 8 19, 7) 0
t=
= 3, 06,
0,81 7,84
5
3

com, graus de liberdade,


v=

0,81
5

( 0,81 )
5
4

7,84 2
3
2

( 7,84 )
3

= 2, 25 3.
=

A probabilidade de encontrarmos um valor de t mais extremo do que 3,06 ,


e
P (|t| > 3, 06) = P (t < 3, 06) + P (t > 3, 06) = 0, 054993 = 5, 5993%.
Portanto, ao n
vel de signicncia de 5%, devemos aceitar a hiptese nula. Pelo mtodo
a
o
e
tradicional, temos t3;5% = 3, 182, portanto, o valor 3,06 cai na regio de aceitaao de H0 .
a
c
O intervalo de conana para a verdadeira diferena entre as duas mdias ca,
c
c
e
IC(T C ; 95%) : (24, 8 19, 7) 3, 182(1, 6659)
: 5, 10 5, 3010
0, 2010 T C 10, 4010.
Conclu
mos, com conana de 95%, que a verdadeira diferena entre as duas mdias est
c
c
e
a
entre -0,20 e 10,40. Como o intervalo inclui o valor da hiptese nula, devemos aceit-la.
o
a

296

8.5

Teste Para Proporoes


c

Aqui, desejamos avaliar certas armaoes feitas sobre proporoes ou porcentagens popc
c
ulacionais. Vamos considerar o estudo de teste de hipteses sobre propores em duas
o
co
situaes, quais sejam: 1) teste para uma proporao populacional e 2) teste para duas ou
co
c
mais proporoes.
c
8.5.1

Teste Para Uma Proporo Populacional


ca

Feita uma armao sobre uma proporao, desejamos saber se os dados de uma amostra
ca
c
suportam ou no tal armao. Por exemplo, vericar se a armativa de que 20% dos
a
ca
indiv
duos de uma comunidade apresentam certa caracter
stica gentica.
e
A construo de um teste de hiptese para uma proporo, segue o mesmo procedimento
ca
o
ca
mostrado para o teste sobre uma mdia. A hiptese nula arma que a proporao verdadeira,
e
o
c
, igual a um certo valor 0 . Ento,
e
a
H 0 : = 0 .
Para a hiptese alternativa, devemos escolher adequadamente uma, dentre as trs possibilio
e
dades:
H1 : = 0

(teste bilateral)

H 1 : > 0

(teste unilateral ` direita)


a

H 1 : < 0

(teste unilateral ` esquerda).


a

Como vimos no estudo de distribuiao amostral de uma proporao ou de contagens, a


c
c
estat
stica P (a proporao da amostra), segue aproximadamente uma distribuiao normal
c
c
para n sucientemente grande, isto ,
e
P :N

(1 )
n

Portanto, para se testar uma proporao, vamos usar a estat


c
stica Z, dada por:
z=

p 0
0 (10 )
n

(8.7)

Para testar se p signicativamente menor do que o valor estabelecido na hiptese, 0 ,


e
o
calculamos a probabilidade da varivel aleatria normal padro Z, assumir um valor menor
a
o
a

297

ou igual ao valor de z obtido com os dados da pesquisa. Quando a hiptese alternativa


o
e
H1 : < 0 , esta probabilidade P (Z z), a qual pode ser obtida em tabelas da distribuio
e
ca
normal (Apndice 3), ou atravs de programas estat
e
e
sticos. A hiptese de nulidade H0 ser
o
a
rejeitada se este valor p for bem pequeno, digamos inferior a 5%. Da mesma forma, se a
hiptese alternativa for H1 : > 0 , a hiptese nula (H0 ), ser rejeitada se a P (Z z)
o
o
a
for bem pequena. Se a hiptese alternativa for bilateral, isto , H1 : = 0 , ento valores
o
e
a
grandes negativos ou valores grandes positivos de z, so fortes indicativos para a rejeio da
a
ca
hiptese nula. Neste caso a hiptese nula ser rejeitada se P (Z z) + P (Z z), a qual
o
o
a
e
igual a 2P (Z |z|) for pequena.
Exemplo 1. O rtulo de uma caixa de sementes informa que a porcentagem de gero
minao de 90%. Entretanto, como a data limite de validade j foi ultrapassada, acredita-se
ca e
a
que a porcentagem de germinaao seja inferior a 90%. Faz-se um experimento e, de 400 sec
mentes testadas, 350 germinaram. Ao n
vel de signicncia de 10%, rejeita-se a hiptese
a
o
de que a porcentagem de germinao de 90%? Determine o intervalo de conana para o
ca e
c
verdadeiro poder germinativo.
As hipteses cam:
o
H0 : = 90%
H1 : < 90%.
Como o tamanho da amostra sucientemente grande, assumimos que:
e
P :N

0, 90;

0, 90(0, 10)
400

Temos, na amostra, p = 350/400 = 0, 875 e P =


z=

0,90(0,10)
400

= 0, 015. A estat
stica Z vale,

p 0
0, 875 0, 90
=
= 1, 67.
P
0, 015

A probabilidade de se encontrar um valor de z menor do que -1,67, devido ao acaso, (valor


e
encontrado com o uso de um software estat
stico e teste unilateral. Aprendemos a fazer este
clculo de probabilidade, usando a tabela da distribuio normal padro, na subseao 5.3.2):
a
ca
a
c
P (z < 1, 67) = 0, 04746.
Como este valor menor do que 0,10, rejeitamos a h otese de que o poder germinativo de
e
p
uma caixa de sementes de 90% em favor da hiptese de que o poder germinativo menor
e
o
e
do que 90%, ao n de signicncia de 10%.
vel
a
Pelo mtodo tradicional de se fazer teste de hiptese, para = 10%, com o aux da
e
o
lio
tabela da distribuio normal padro, dada no apndice 3, temos z = 1, 28. A gura 8.10
ca
a
e

298

90%

10%
-3,50

-1,75

0,00

1,75

3,50

-1,28
Regio de aceitao

Regio de rejeio

Figura 8.10: Teste de hiptese de uma proporao pelo mtodo tradicional


o
c
e
indica as regies de aceitao e de rejeiao da hiptese de nulidade. Como o valor -1,67
o
ca
c
o
encontra-se na regio de rejeiao, conclu
a
c
mos que o poder germinativo menor do que 90%,
e
ao n de signicncia de 10%.
vel
a
O intervalo de conana para a verdadeira proporao de germinaao, dado em 7.5, :
c
c
c
e
0, 875 1, 65

0, 875(1 0, 875)
400

0, 875 0, 0273
0, 8477 0, 9023.
Exemplo 2. Um(a) Bilogo(a), com base em conhecimentos tericos e prticos, arma
o
o
a
que a proporao () de fortos no estdio arbreo pioneiro da Floresta Ombrla na Ilha
c
o
a
o
o
de Santa Catarina, apresenta 47% sem bromlias. Numa amostra de 35 fortos, p = 40%
e
o
no apresentaram bromlias. Teste a armativa do(a) Bilogo(a). (Formular as hipteses
a
e
o
o
do teste, calcular o valor p e concluir).
Hipteses:
o
H0 : = 47%
H1 : = 47%
Clculo do valor p:
a
z=

0, 40 0, 47
0,47(10,47)
35

= 0, 8297

p(z 0, 8297) = 0, 5 0, 2967 = 0, 2033 valor p = 2 0, 2033 = 0, 4066


Portanto, no rejeitamos a hiptese nula.
a
o

299

Tabela 8.2: Distribuiao conjunta das frequncias das variveis poca de plantio/forma de
c
e
a
e
corte e sobrevivncia de ra de ameixeiras
e
zes

Epoca-Forma
Ra
zes
Total
Sobreviventes Mortas
Fora Primavera - Longo
Fora Primavera - Curto
Na Primavera - Longo
Na Primavera - Curto

84
133
156
209

240
240
240
240

Total
8.5.2

156
107
84
31
378

582

960

Teste de Duas ou Mais Proporoes (Teste de Qui-Quadrado)


c

E muito freqnte nos trabalhos de pesquisa, os dados representarem freqncias (contaue


ue
gens) de ocorrncias de determinada caracter
e
stica, que podem classicar-se em categorias
de variveis qualitativas. Os dados de freqncias, classicados por categorias de variveis
a
ue
a
qualitativas, podem ser representados por uma tabela de contingncia, como a tabela 8.2.
e
Embora os totais de linhas tenham sido previamente xados, ou seja, trabalhou-se com 240
ra para cada grupo, isto no acarreta nenhuma modicaao na anlise dos dados. Desezes
a
c
a
jamos, aqui, testar a hiptese de independncia entre as duas classicaes, ou seja, entre a
o
e
co
combinao poca/forma e a sobrevivncia.
ca e
e
Na seao 2.1.3.6, apresentamos em detalhes como calcular a estat
c
stica qui-quadrado (2 ).
O leitor deve voltar `quela seao, caso no esteja lembrado do clculo da estat
a
c
a
a
stica. O 2
uma medida de afastamento da hiptese de independncia, isso implica que, quanto maior
e
o
e
for o valor da estat
stica, maior a associao ou grau de dependncia entre as variveis. O
e
ca
e
a
2
valor de para a tabela 8.2 ,
e
rs
2

=
i=1

(oi ei )2
ei

(61, 5)2 (61, 5)2 (12, 5)2


(63, 5)2
+
+
+ ... +
94, 5
145, 5
94, 5
145, 5
= 141, 05.
=

O valor de qui-quadrado est entre 0 (zero) e + (mais innito). O valor 0 indica que
a
a sobrevivncia no depende da combinaao poca de plantio e forma de corte. Quanto
e
a
c e
maior o valor do qui-quadrado, mais as freqncias observadas se afastam das freqncias
e
ue
ue
esperadas. Isto indica, que a sobrevivncia dos enxertos depende da combinao poca
e
ca e

300

de plantio e forma de corte. A questo que devemos responder agora a seguinte: ser
a
e
a
2
que o valor encontrado de = 141, 05 grande o suciente para podermos armar que
e
a dependncia signicativa, ou no? Para obter a resposta devemos fazer um teste de
e
e
a
hipteses envolvendo a estat
o
stica 2 . Esse teste foi desenvolvido pelo estat
stico britnico
a
Karl Pearson em 1960. Inicialmente, vamos formular as hipteses do teste:
o
H0 :a combinaao poca de plantio e forma de corte no est associada com a sobrec e
a
a
vivncia de ra
e
zes.
H1 : a combinaao poca de plantio e forma de corte est associada com a sobrevivncia
c e
a
e
de ra
zes.
A estat
stica que vamos utilizar para fazer o teste de hiptese dada por:
o
e
rs
2

=
i=1

(oi ei )2
,
ei

(8.8)

a qual, segue uma distribuiao de qui-quadrado, com (r 1)(s 1) graus de liberdade, onde
c
r o nmero de linhas e s o nmero de colunas da tabela. Esta distribuiao dada no
e
u
e
u
c e
apndice 5. Existem diversos pacotes estat
e
sticos que calculam as probabilidades para a
distribuio de 2 e, ns, faremos o uso desses recursos. Alguns softwares dispon
ca
o
veis so:
a
Statistica, Minitab, Statgraphics, SAS, Excel.
Vamos calcular a probabilidade de encontrar um valor de 2 , com 3 graus de liberdade,
mais extremo do que o encontrado na pesquisa, devido ao acaso. Temos,
P (2 > 141, 05) = 0, 00001.
Portanto, rejeitamos a hiptese nula, e conclu
o
mos que a sobrevivncia de ra de ameixeiras
e
zes
depende da combinaao entre poca de plantio e forma de corte. A probabilidade de estarmos
c
e
tomando uma deciso errnea praticamente nula.
a
o
e
Para usar a tabela da distribuiao de qui-quadrado, assim como na distribuio de Stuc
ca
dent, necessitamos xar o n de signicncia () do teste e calcular os graus de liberdade
vel
a
da estat
stica. Para fazer o teste pelo mtodo tradicional, precisamos xar o n de sige
vel
nicncia e, assim, delimitar as regies de aceitaao e de rejeio. Por exemplo, para = 5%,
a
o
c
ca
e trs graus de liberdade, da tabela da distribuio de qui-quadrado, obtemos,
e
ca
2 = 7, 815.
3;5%
A gura 8.11 apresenta as regies de aceitaao e de rejeio da hiptese. Observe que
o
c
ca
o
a distribuio de qui-quadrado assimtrica, diferentemente das distribuies normal e t.
ca
e
e
co

301

95%
5%

0,00

6,25

12,50

18,75

25,00

7,815
Regio de aceitao

Regio de rejeio

Figura 8.11: Teste de hiptese para comparar propores de sobrevivncia de ra


o
co
e
zes de
ameixeiras
Como o valor de 2 = 141, 05, calculado com os dados observados, maior do que o valor
e
2
3;5% = 7, 815, ou seja, pertence a regio de rejeio, chegamos a mesma concluso ao n
a
ca
a
vel
de signicncia de 5%.
a
Restrioes do Teste de Qui-Quadrado
c
Dado que a distribuiao da estat
c
stica de qui-quadrado (2.1), neste caso, uma dise
2
tribuio aproximada de , precisamos tomar certos cuidados na sua aplicaao. Um dos
ca
c
cuidados garantir que no mais de 20% dos valores esperados das caselas sejam inferiores
e
a
a 5. Se tal condiao no se vericar, devemos agrupar uma ou mais linhas (ou colunas), a
c a
m de obter a frequncia esperada m
e
nima. Isto pode prejudicar os objetivos do trabalho.
Aumentar o tamanho da amostra uma alternativa, pois quanto maior for o tamanho da
e
amostra mais a estat
stica 8.8 se aproxima da distribuiao terica de Qui-Quadrado..
c
o
Quando as frequncias esperadas so pequenas (menores do que 5) e a tabela 2 2,
e
a
e
podemos usar o Teste Exato de Fisher. Numa tabela 2 2, nenhuma frequncia esperada
e
deve ser menor que 5.
Para tabelas 2 2, deve-se aplicar uma correao, chamada correo de continuidade ou
c
ca
correao de Yates, que consiste em subtrair 0,5, das diferenas entre as frequncias observadas
c
c
e
e esperadas, tomadas em mdulo. Isto porque em tabelas 2 2, o teste de 2 tende a indicar
o
signicncia mais do que deveria. Com esta correao, diminui-se o valor de 2 calculado,
a
c
melhorando a aproximaao com a distribuio terica de 2 . A estat
c
ca
o
stica de 2 com a

302

Tabela 8.3: Distribuio conjunta das frequncias das variveis poca de plantio e sobreca
e
a
e
vivncia de ra de ameixeiras
e
zes

Epoca
Ra
zes
Total
Sobreviventes Mortas
Fora Primavera
Na Primavera

263
115

217
365

480
480

Total

378

582

960

correo de continuidade dada por:


ca
e
rs

2 =
i=1

(|oi ei | 0, 5)2
.
ei

(8.9)

Exemplo: continuao do exemplo das ra


ca
zes de ameixeiras. Podemos querer
saber se existe diferenas estat
c
sticas entre as duas pocas de plantio, ou seja, vericar se
e
existe diferena entre plantar na primavera e fora da primavera. Neste caso, vamos construir
c
uma nova tabela de contingncia, a partir da tabela 8.2. O resultado (frequncias observadas)
e
e
a tabela 8.3. Os valores das frequncias esperadas, sob a hiptese de independncia, so:
e
e
o
e
a

Epoca

Ra
zes
Sobreviventes Mortas

Total

Fora Primavera
Na Primavera

189
189

291
291

480
480

Total

378

582

960

O valor da estat
stica 8.9 :
e
rs
2

=
i=1

(|oi ei | 0, 5)2
= 28, 58 + 28, 58 + 18, 56 + 18, 56 = 94, 29.
ei

Para um n de signicncia de 5% e graus de liberdade igual a (2-1)(2-1)=1, o valor cr


vel
a
tico
de qui-quadrado vale: 3,841. Portanto, como o valor calculado maior que o valor cr
e
tico,
devemos rejeitar a hiptese nula e, assim, podemos armar que existe diferena entre as duas
o
c
pocas de plantio, ao n de signicncia de 5%. Temos que 54,8% dos enxertos plantados
e
vel
a
fora da primavera sobrevivem, enquanto que, na primavera, 24,0% dos enxertos sobrevivem.
O menor valor de , para o qual rejeitamos a hiptese nula (valor p) : P (2 > 94, 29) =
o
e
0, 00001. Portanto, a probabilidade de rejeitarmos a hiptese nula, quando dever
o
amos
aceit-la, praticamente nula.
a
e
Exerc
cio: teste se existe efeito de forma de corte, ao n de signicncia de 5%. Envel
a
contre o valor p do teste.

303

Tabela 8.4: Segregaao mendeliana em ervilhas


c
Tipos de ervilhas Frequncias observadas Frequncias esperadas
e
e
Amarelas lisas
Verdes lisas
Amarelas rugosas
Verdes rugosas

315
108
101
32

312,75
104,25
104,25
34,75

Total

556

556,00

Outra Aplicao do Teste de 2


ca
Uma aplicaao importante do teste de 2 vericar se as frequncias observadas seguem
c
e
e
(esto de acordo) com propores previstas por teorias ou hipteses. Um exemplo clssico,
a
co
o
a
o caso da segregaao mendeliana em ervilhas.
e
c
Na descendncia obtida de cruzamentos entre plantas com sementes amarelas lisas e
e
outras de sementes verdes rugosas, obtemos na primeira geraao (F1) ervilhas amarelas
c
lisas. Estas, cruzadas entre si, produzem em F2, ervilhas de quatro tipos indicadas na tabela
8.4.
Pela teoria mendeliana, as proporoes esperadas para esses tipos de ervilhas so: 9/16,
c
a
3/16, 3/16 e 1/16, respectivamente. Com base nessa teoria calculamos as frequncias ese
peradas dadas na tabela 8.4. Desejamos testar as seguintes hipteses atravs do teste de
o
e
qui-quadrado:
H0 : os dados concordam com a teoria mendeliana
H1 : os dados no concordam com a teoria mendeliana.
a
A estat
stica de 2 vale,
2 =

(315 312, 75)2 (108 104, 25)2 (101 104, 25)2 (32 34, 75)2
+
+
+
= 0, 47.
312, 75
104, 25
104, 25
34, 75

O valor de 2 bastante baixo, sugerindo que devemos aceitar a hiptese nula. Entretanto,
e
o
devemos encontrar o n m
vel nimo signicativo do teste, o qual vale,
P (2 > 0, 47) = 0, 925431 = 92, 54%.
Este valor muito superior a 5%, portanto, podemos armar que os dados concordam com
e
a teoria mendeliana, ao n de signicncia de 92,34%.
vel
a

304

Pelo mtodo tradicional, ao n


e
vel de signicncia de 5% e com 3 graus de liberdade,
a
temos:
2
0,05;3 = 7, 81.
Como o valor calculado de 2 menor do que o valor da distribuiao de 2 , aceitamos H0 .
e
c
Portanto, as frequncias observadas seguem as propores estabelecidas por Mendel.
e
co

8.6

Exerc
cios Propostos

1. Sabe-se que a proporao de sementes de soja, com danos mecnicos, provocados pelo
c
a
beneciamento, = 0, 18. Foram feitas 40 observaoes durante um dia de trabalho e se
e
c
constatou que p=0,20. Vericar se a mquina precisa ser regulada, ao n de signicncia
a
vel
a
de 5%.
2. Foram as seguintes as produes mdias de duas variedades de soja, em t/ha: variedade
co
e
A: mdia=3,8 t/ha com varincia = 0,36 (t/ha)2 ; variedade B: mdia=4,6 t/ha com varincia
e
a
e
a
= 0,04 (t/ha)2 . As informaoes obtidas, para as variedades A e B, foram baseadas em
c
amostras de tamanhos 30 e 35 respectivamente. Teste a hiptese de que no h diferena
o
a a
c
signicativa entre as produoes mdias, ao n de 1% de probabilidade.
c
e
vel
3.(Lindstrom,1918; Snedecor & Cochran,1972). Em um experimento envolvendo o cruzamento de dois tipos de milho, Lindstrom encontrou quatro tipos distintos: verde(T1),
dourado(T2), listras verdes (T3) e lisas verdes e douradas (T4). De acordo com a hereditariedade mendeliana, as probabilidades de obter esses quatro tipos so: 9/16, 3/16, 3/16
a
e 1/16, respectivamente. Em 1301 indiv
duos da segunda geraao, Lindstrom encontrou as
c
seguintes frequncias:
e
T1
773
231
T2
T3
238
T4
59
total 1301
Teste a hiptese de que a distribuio segue as leis da hereditariedade Mendeliana, contra a
o
ca
hiptese alternativa de que a distribuio no segue as leis da hereditariedade.
o
ca a
4. Que suposies so feitas acerca das populaes de onde se extraem amostras aleatrias
co a
co
o
independentes, quando se utiliza a distribuio t de Student exata para realizar inferncias
ca
e
a respeito da diferena entre mdias populacionais?
c
e

305

5. A rea foliar mdia da espcie Laguncularia rancemosa do Manguezal do Bairro Santa


a
e
e
Mnica (no polu
o
a
do) de 50,76 cm2 . Espera-se que a rea foliar do Manguezal do Bairro
e
a
Itacorubi seja maior devido a poluiao do ambiente. Para vericar se essa armaao
c
c e
verdadeira coletou-se uma amostra de tamanho n = 20, do Manguezal do Itacorubi, cujos
resultados foram:
39,4 39,6
51,2 54,6

39,9
54,8

45,6 45,6
54,6 55,1

46,1
55,1

46,1 50,2
55,5 56,2

50,2
66,3

51,0
66,5

a)Esses resultados trazem evidncias estat


e
sticas de que houve aumento da rea foliar? Use
a
n de signicncia de 5%.
vel
a
b) Construir o intervalo de conana com 90%, para a verdadeira mdia da rea foliar do
c
e
a
Manguezal do Itacorubi. Interpretar o resultado.
6. Faz-se um estudo com o objetivo de conhecer melhor a biologia e a distribuiao de
c
fmeas de Macrobrachium potiuna na ilha de Santa Catarina, comparando-se dois locais
e
em condies ambientais diferentes. Para isso coletou-se duas amostras, uma no Crrego
co
o
do Chico em Ratones (A) e a outra no Poao do Crrego Grande (B). os resultados de
c
o
comprimento total, em mm, de fmeas ov
e
genas, foram:
Local

Amostra

Crrego do Chico
o
Poao do Crrego
c
o

30
30

Mdia Desvio padro


e
a
32,25
20,32

3,26
4,02

a) Determinar o intervalo de conana de 99% para a verdadeira mdia de comprimento


c
e
total para cada um dos locais. Interpretar.
b) Qual deve ser o tamanho da amostra para que a amplitude total de um intervalo de 99%
de conana para a mdia populacional do Poao do Crrego Grande seja no mximo igual
c
e
c
o
a
a 4 mm?
c) Voc diria que a diferena de comprimentos nos dois locais estat
e
c
e
sticamente signicante?
use = 5%.
7. Foi conduzido um experimento com o objetivo de avaliar o poder germinativo de duas
cultivares de cebola: a) Bola Precoce-Empasc 352 e b) Norte 14. foram utilizadas para
o teste de germinao, 4 repetioes de 100 sementes, totalizando 400 sementes para cada
ca
c
cultivar. A varivel de estudo o nmero de sementes que germinaram. os resultados esto
a
e
u
a
apresentados na tabela 8.5. Teste a hiptese de que no h dependncia entre cultivares e
o
a a
e
nmero de sementes que germinam, ao n de signicncia de 5%. De outro modo, poderia
u
vel
a
perguntar: existe diferena entre as duas cultivares quanto ` germinaao?
c
a
c

306

Tabela 8.5: Poder germinativo de duas cultivares de cebola


Cultivares
Germinaao
c
Total
Germinaram No germinaram
a
Bola precoce
Norte 14

392
381

8
19

400
400

Total

773

27

800

8. Um agricultor que planta frut


feras deseja testar um novo tipo de inseticida, cujo
fabricante garante reduzir os preju
zos causados por certo tipo de inseto. Para vericar essa
armao do fabricante do inseticida, o agricultor pulveriza 200 rvores com o produto novo
ca
a
e 200 rvores com o produto que normalmente usa, obtendo os resultados:
a
Inseticida novo

Inseticida padro
a

240
980

227
820

Produao mdia (kg/planta)


c
e
Varincia
a

Estes dados indicam evidncia suciente de que o inseticida novo melhor do que o padro
e
e
a
(normalmente usado)?
9. Deseja-se testar a hiptese da possibilidade da quantidade de prote
o
nas totais no
plasma, depois de determinada operaao em portadores de esquistossomose mansnica, ser
c
o
diferente da quantidade antes da operaao. Foi utilizada uma amostra de 17 pacientes, cujos
c

307

resultados foram:
Paciente Antes
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

6,9
7,8
6,6
5,9
7,8
6,4
8,8
7,3
8,0
8,6
7,7
7,9
8,7
5,8
9,2
9,3
8,9

Depois
6,9
8,6
8,7
7,3
7,8
8,2
9,3
7,3
7,6
7,8
7,6
7,8
8,1
6,8
8,3
10,2
9,1

Faa o teste de hiptese e conclua.


c
o
10. Um bilogo est interessado em determinar o dimetro mdio da roseta foliar da
o
a
a
e
bromlia de sol (ambiente de sol). o dimetro foi medido numa amostra de tamanho n = 20,
e
a
obtendo-se os seguintes resultados:
7,3 8,2
5,2 8,4

9,1 3,4
5,4 6,6

10,5 3,6
6,4 5,8

9,5
6,6

4,8 9,1
7,0 4,8

6,8
9,1

a) Estime o dimetro mdio da roseta foliar utilizando um intervalo de conana de 95%.


a
e
c
b) Sabe-se que o dimetro mdio da roseta foliar das bromeliaceas em rea sombreada
a
e
a
e
de 16 cm. Os dados amostrais obtidos evidenciam que as bromlias de sol desenvolvem-se
e
menos do que as de sombra? Faa o teste de hiptese com n de signicncia de 5%.
c
o
vel
a
c) Num trabalho futuro com bromlias de sol, determine o tamanho da amostra necessrio
e
a
para que o erro cometido na estimaao seja de, no mximo, 0,70, com probabilidade de 95%.
c
a
11. Para comparar o peso vivo e peso jejum do gado Crioulo Lageano, um pesquisador
selecionou aleatoriamente uma amostra de 15 animais e anotou o seus pesos. Os dados
resultantes esto descritos abaixo. Esses dados tm evidncia suciente para garantir que
a
e
e

308

exite diferena entre peso vivo e peso jejum? Indique o n m


c
vel nimo signicativo do teste
().
Animal Peso vivo Peso jejum Animal Peso vivo Peso jejum
1
2
3
4
5
6
7
8

498
510
540
580
440
350
595
513

453
466
491
480
405
315
557
477

9
10
11
12
13
14
15

398
410
450
495
508
515
560

353
380
412
453
462
477
505

12. Realizou-se uma pesquisa para comparar dois locais, Itaja e Ararangu, quanto `

a
a
produao de arroz irrigado, em t/ha, na safra 88/89. Dez prognies foram utilizadas nos
c
e
dois locais e os seus resultados anotados.
Itaja

5,3
5,7
7,0
6,2
8,0

9,3
9,2
6,9
7,0
6,5

Ararangu
a
6,0
6,3
7,2
6,8
7,8

8,4
8,3
7,2
7,3
7,0

Teste a hiptese de igualdade entre as produoes mdias.


o
c
e
13. Um agrnomo realizou um levantamento para estudar o desenvolvimento de duas
o
espcies de rvores, a bracatinga (Mimosa scabrella) e Canaf
e
a
stula (Peltophorum dubium).
Para esta nalidade foram coletadas duas amostras de tamanhos igual a 30 rvores. Os
a
resultados para altura (dados ct
cios), em metros, foram:
Bracatinga
6,4
6,8
6,9
6,9
6,9

7,0 9,0
8,3 9,1
8,6 9,3
8,7 9,9
8,7 10,1

10,2
11,4
13,7
14,8
15,2

Canaf
stula
16,1
16,3
17,2
18,4
20,0

20,1
20,3
21,4
22,8
22,8

8,2
9,7
9,8
10,0
10,0

10,1
10,3
11,2
13,2
13,4

14,1
14,2
14,4
14,8
15,9

20,2
20,3
20,6
29,9
23,8

25,7
30,9
35,5
38,2
40,0

40,1
40,2
40,5
41,8
42,3

A hiptese levantada pelo pesquisador que a Canaf


o
e
stula deve apresentar uma altura mdia
e
maior do que a Bracatinga. Esses dados indicam evidncia suciente para suportar a hiptese
e
o
do pesquisador?

309

14. Um bilogo deseja fazer um estudo para vericar a especicidade do fungo Gigaspora
o
gigantea com as plantas Spartina sp e Tibouchina sp. Foram coletadas 20 amostras de solos
em volta da Spartina sp e 20 amostras de Tibouchina sp e vericada a quantidade de fungo
presente. os resultados foram:
Spartina sp
303
116
117
115
84

78
93
63
63
55

59
43
41
35
25

Tibouchina sp
15
10
5
6
3

305
110
110
112
85

74
95
62
60
53

60 18
40 11
40 4
32 9
22 4

Esses dados tem evidncia suciente para indicar uma diferena entre as quantidades mdias
e
c
e
de Gigaspora gigantea encontrada em plantas de Spartina sp e Tibouchina sp?
15. Para determinar qual de duas cultivares de trigo mais produtiva, um Centro
e
de Pesquisas em Agricultura selecionou quatro reas de terra, cada rea em uma regio
a
a
a
recomendada para a produao de trigo no Estado de Santa Catarina. Cada rea totalmente
c
a
e
homognea e foi dividida em duas partes. Foram semeadas as duas cultivares, uma em cada
e
parte da rea, atravs de um sorteio. Entre as regies dever haver diferenas de produo.
a
e
o
a
c
ca
As produoes, em kg/ha, foram:
c
Munic
pio
Abelardo Luz
Chapec
o
Campos Novos
Mafra

Cultivares
CEP 15-Batou CEP 18-Cavera

2912
2528
3309
2324

3854
3295
3916
2548

Qual a cultivar de trigo mais produtiva? Use n de signicncia de 5%. Interpretar.


e
vel
a
16. Foi conduzido um experimento, no qual avaliou-se a utilizaao de uma, duas e trs
c
e
2
armadilhas (ra de tayuy) por 400 m , com e sem inseticida para capturar a vaquinha (Diaz
a
brotica speciosa) na cultura do feijo. Os dados obtidos, relativos ao nmero de vaquinhas
a
u

310

capturadas, foram:
Armadilhas

Inseticida
Com Sem
114
1067
715
1896

Uma armadilha
Duas armadilhas
Trs armadilhas
e
Total

Total
301
1429
988
2718

197
362
273
822

Podemos armar que existem diferenas signicativas entre o nmero de armadilhas utic
u
lizadas com relaao ao uso de inseticida, ao n de signicncia de 5%?
c
vel
a
17. Um agricultor que planta frutas deseja testar um novo tipo de inseticida, cujo fabricante garante reduzir o preju por danos causados por certo tipo de inseto, consequentezo
mente aumenta a produo. Para vericar essa armao do fabricante do inseticida, o
ca
ca
agricultor pulveriza 200 rvores com o novo inseticida e 200 rvores com o inseticida normala
a
mente utilizado. O agricultor anotou a produo mdia por rvore para os dois inseticidas.
ca
e
a
a)Formule as hipteses do teste (H0 e H1 ), em termos de mdias populacionais.
o
e
b) D a deniao de para esse experimento.
e
c
18. Foi realizado um experimento para avaliar o comportamento in vitro da espcie
e
Mandevilla velutina (Apocincea), provenientes de duas regies diferentes: Cerrado e Restinga.
a
o
Aps isolar os explantes, com um n com duas gemas axilares, obtidos das plantas matrizes,
o
o
foi instalado o experimento com delineamento inteiramente casualizado com 20 repeties
co
(20 explantes para o Cerrado e 20 para a Restinga), portanto, temos um total de 40 unidades
experimentais. Esse experimento produziu um desvio padro s = 1, 5611 com 38 graus de
a
liberdade. A varivel utilizada foi a altura em cm dos explantes de Mandevilla cultivadas
a
in vitro durante 45 dias, cujos resultados foram:
Cerrado
5,3
2,5
5,1
2,6
1,2

3,1
4,1
3,7
5,0
1,6

3,0
4,7
2,6
4,2
4,0

Restinga
4,7
6,4
2,9
3,2
2,1

3,6
2,3
6,0
2,1
5,2

4,3
3,9
2,1
2,4
2,0

2,7
3,9
5,6
4,7
1,9

5,1
4,7
2,1
6,1
8,1

a) Teste a hiptese de que no h diferena entre as duas regies, ao n de signicncia


o
a a
c
o
vel
a
de 5%, para altura de explantes de Mandevilla.
b) Construa o intervalo de conana de 95%, para a diferena das mdias populacionais.
c
c
e
19. Foi desenvolvido um estudo para vericar a qualidade dos vinhos em um Estado. Uma
propriedade f
sica avaliada nesse estudo foi a estabilidade dos vinhos, dada em 4 categorias:

311

pssima, problemtica, regular e aceitvel. Numa amostra de 188 garrafas de vinho, foram
e
a
a
encontrados os seguintes resultados:
Vinho

Estabilidade
Pssima Problemtica Regular
e
a

Total
Aceitvel
a

Branco
Rosado
Tinto

8
10
29

29
22
21

28
10
13

7
3
8

72
45
71

Total

47

72

51

18

188

a) Teste a hiptese de que no h relao (dependncia) entre tipos de vinhos e estabilidade.


o
a a
ca
e
b) Teste a hiptese de que os vinhos tinto e branco so independentes da estabilidade. Qual
o
a
dos dois vinhos pior quanto ` estabilidade?
e
a
20. Nitrognio o elemento mais comum aplicado no solo. Em regies tropicais, apee
e
o
nas uma parte do nitrognio aplicado aproveitado pelas culturas. Informaao sobre , a
e
e
c
porcentagem mdia de nitrognio perdido, importante para pesquisas sobre as condies
e
e
e
co
timas de crescimento das plantas. Os dados a seguir descritos, representam a quantidade
o
de nitrognio perdido (dado em porcentagem do total de nitrognio aplicado):
e
e
10,8 13,5
10,5 8,0
14,0 9,5

11,8
10,0
8,7

9,0 14,7
9,8 10,3
13,8 12,8

a) Faa o teste de hiptese, ao n de signicncia de 5%, para vericar se os dados da


c
o
vel
a
amostra suportam a hiptese de que a porcentagem mdia de nitrognio perdido () menor
o
e
e
e
do que 13%.
b) Calcule o valor p do teste e interprete.
21. Para vericar a efetividade de um novo tratamento contra infestao de pulges que
ca
o
atacam as folhas das plantas, em 100 plantas atacadas e tratadas com o novo inseticida,
foram encontradas 9 plantas com pulges depois de uma semana do tratamento. Desejamos
o
saber se os resultados observados justicam a armaao de que menos de 15% da populao
c
ca
de plantas tratadas tero infestaao de pulges. Utilize um n
a
c
o
vel de signicncia de 5%.
a
Calcule o valor p e interprete.
22. Sabe-se que o mar na Ba Norte, em Florianpolis, polu
a
o
e
do. Os mexilhes do gnero
o
e
Perna perna so animais ltradores, ou seja, alimentam-se de matria orgnica dissolvida
a
e
a
na gua. Para mexilhes cultivados em ambiente sem poluio, neste estudo o local de
a
o
ca
e
Sambaqui, admite-se que o peso mdio de mexilhes igual a 30 g. Os valores medidos em
e
o e

312

20 mexilhes na Ba Norte foram:


o
a
26

26,5

27

33,5

34

35

28

28,5

36,4 37,6

29

29,4 31

38,5

38,7 41

32

32,5

40,6 41,6

Verique, atravs de um teste de hiptese, se realmente o peso dos mexilhes na Ba Norte


e
o
o
a
maior do que em Sambaqui. (Use = 0, 05).
e
Estime, atravs da construo do intervalo de conana com 95%, o peso mdio populae
ca
c
e
cional de mexilhes na Ba Norte.
o
a
23. Queremos comparar dois mtodos de poda em plantas de erva-mate, denominados
e
de A e B . Vamos considerar que dispomos de 40 rvores de erveiras numa mata nativa.
a
Considere duas maneiras no planejamento deste experimento:
1. sorteamos 20 rvores aleatoriamente para receber o mtodo A, e as restantes receberam
a
e
o mtodo B. Aps medimos a produao de massa verde de todas as rvores.
e
o
c
a
a
a
2. medimos, inicialmente, os dimetros dos caules das 40 rvores. Em seguida, numeramos
as rvores, em ordem crescente de seus dimetros, de 1 at 40. Consideremos os 20
a
a
e
pares formados: (1;2), (3;4), (5;6),...,(39;40), e de cada par sorteamos uma rvore para
a
receber o mtodo A, a outra rvore do par recebe o mtodo B. Obtemos, assim, duas
e
a
e
amostras de 20 rvores cada. Aps medimos a produao de massa verde de todas as
a
o
c
rvores.
a
stico de hipteses em cada caso?
o
Qual o teste estat
Qual dos dois procedimentos voc prefereria? Por qu?
e
e

313

Bibliograa
ALBERTS,B., BRAY,D., JOHNSON,A., LEWIS,J., RAFF,M., ROBERTS,K., WALTER,P.
Fundamentos da biologia celular. Uma introduo ` biologia molecular da clula. Edica a
e
tora Artes Mdicas Sul. Porto Alegre, 1999.
e
BARBETTA,P.A. Estatstica aplicada `s cincias sociais. 4. ed. Florianpolis: Editora da

a e
o
Universidade Federal de Santa Catarina, 2001.
BATSCHELET,E. Introduo ` matemtica para biocientistas. So Paulo: Editora da
ca a
a
a
Universidade de So Paulo, 1978.
a
BOX,G.E.P., HUNTER,W.G., HUNTER,J.S. Statistics for experimenters. Canad: John
a
Wiley, 1978.
BROWN,D., ROTHERY,P. Models in Biology: mathematics, statistics and computing. New
York: John Wiley & Sons, 1994.
BROWER,J.E., ZAR,J.H. Fields & Laboratory Methods for General Ecology.
Dubuque, Iowa: WCB, ano???.

2.

ed.

BUSSAB,W.O., MORETTIN,P.A. Estatstica bsica. 4. ed. Coleao Mtodos Quantita


a
c
e
tivos. So Paulo: Editora Atual, 1987.
a
CENTENO,A.J. Curso de estatstica aplicada ` biologia. Goinia: Editora da Universidade

a
a
Federal de Gois, 1982.
a
FINNEY,D.J. An introduction to statistical science in agriculture.
HEATH,O.V.S. A estat
stica na pesquisa cient
ca. v. 1. So Paulo: Editora da USP,
a
1981.
JUNIOR,P.S., MACHADO,A.A., ZONTA,E.P. da SILVA,J.B. Curso de estat
stica. v. 1 e
2. Pelotas: Editora Universitria, 1992.
a
MENDENHALL,N. Probabilidade e estatstica. v. 1 e 2. Rio de Janeiro: Editora Campos,

1985.
MONTGOMERY,D.D. Design and analysis of experiments. 5. ed. New York: John Wiley
& Sons, Inc. 2001.
MORETTIN,L.G. Estatstica bsica: probabilidade. 6. ed. So Paulo: McGraw-Hill.

a
a

314

PERES,C.A., SALDIVA,C.D. Planejamento de experimentos. So Paulo - SP. 5 Simpsio


a
o
Nacional de Probabilidade e Estat
stica.
SNEDECOR,G.W., COCHRAN,W.S. Statistical methods. 6. ed. Ames: Iowa State Univ.,
1972.
SOARES,J.F., FARIAS,A.A., CESAR,C.C. Introduo ` estat
ca a
stica. Rio de Janeiro: Editora Guanabara Koogan S.A., 1991.
SOARES,J.F., SIQUEIRA,A.L. Introduo ` estat
ca a
stica mdica. 1. ed. Belo Horizonte:
e
Editora da Universidade Federal de Minas Gerais, 1999.
STEEL,R.G.D., TORRIE,J.H. Principles and procedures of statistics. New York: Willey,
1960.
TUKEY,J.W. Exploratory data analysis. Reading, Mass.: Addison-Wesley, 1971.
VIEIRA,S. Estatstica experimental. 2. ed. So Paulo: Editora Atlas S.A., 1999.

a
WONNACOTT,T.H., WONNACOTT,R.J. Estat
stica aplicada ` economia e ` adminina
a
strao. 1. ed. Rio de Janeiro: Livros Tcnicos e Cient
ca
e
cos Editora, 1981.

315

Apndice 1
e
Tabela da distribuio binomial
ca
Tabela 1: Distribuiao binomial: probabilidade de cada
c
valor k em funao de n e
c

0,05

0,10

0,15

0,20

0,25

0
1

0,9500 0,9000 0,8500 0,8000 0,7500 0,7000 0,6500 0,6000 0,5500 0,5000
0,0500 0,1000 0,1500 0,2000 0,2500 0,3000 0,3500 0,4000 0,4500 0,5000

0
1
2

0,9025 0,8100 0,7225 0,6400 0,5625 0,4900 0,4225 0,3600 0,3025 0,2500
0,0950 0,1800 0,2550 0,3200 0,3750 0,4200 0,4550 0,4800 0,4950 0,5000
0,0025 0,0100 0,0225 0,0400 0,0625 0,0900 0,1225 0,1600 0,2025 0,2500

0
1
2
3

0,8574 0,7290
0,1354 0,2430
0,0071 0,0270
0,0001 0,0010

0,6141 0,5120
0,3251 0,3840
0,0574 0,0960
0,0034 0,0080

0,4219 0,3430 0,2746 0,2160 0,1664 0,1250


0,4219 0,4410 0,4436 0,4320 0,4084 0,3750
0,1406 0,1890 0,2389 0,2880 0,3341 0,3750
0,0156 0,0270 0,0429 0,0640 0,0911 0,1250

0
1
2
3
4

0,8145 0,6561
0,1715 0,2916
0,0135 0,0486
0,0005 0,0036
0,0000 0,0001

0,5220 0,4096
0,3685 0,4096
0,0975 0,1536
0,0115 0,0256
0,0005 0,0016

0,3164 0,2401 0,1785 0,1296 0,0915 0,0625


0,4219 0,4116 0,3845 0,3456 0,2995 0,2500
0,2109 0,2646 0,3105 0,3456 0,3675 0,3750
0,0469 0,0756 0,1115 0,1536 0,2005 0,2500
0,0039 0,0081 0,0150 0,0256 0,0410 0,0625

0
1
2
3
4
5

0,7738 0,5905
0,2036 0,3281
0,0214 0,0729
0,0011 0,0081
0,0000 0,0005
0,0000 0,0000

0,4437 0,3277
0,3915 0,4096
0,1382 0,2048
0,0244 0,0512
0,0022 0,0064
0,0001 0,0003

0,2373 0,1681 0,1160 0,0778 0,0503 0,0313


0,3955 0,3602 0,3124 0,2592 0,2059 0,1563
0,2637 0,3087 0,3364 0,3456 0,3369 0,3125
0,0879 0,1323 0,1811 0,2304 0,2757 0,3125
0,0146 0,0284 0,0488 0,0768 0,1128 0,1563
0,0010 0,0024 0,0053 0,0102 0,0185 0,0313

0,7351 0,5314

0,3771

0,2621 0,1780

0,30

0,1176

0,35

0,0754

0,40

0,0467

0,45

0,0277

0,50

0,0156

continua na prxima pgina


o
a

316

(Probabilidades binomiais) continuao da pgina anterior


ca
a

0,05

0,10

0,15

0,20

0,25

1
2
3
4
5
6

0,2321
0,0305
0,0021
0,0001
0,0000
0,0000

0,3543
0,0984
0,0146
0,0012
0,0001
0,0000

0,3993
0,1762
0,0415
0,0055
0,0004
0,0000

0,3932
0,2458
0,0819
0,0154
0,0015
0,0001

0,3560
0,2966
0,1318
0,0330
0,0044
0,0002

0
1
2
3
4
5
6
7

0,6983 0,4783
0,2573 0,3720
0,0406 0,1240
0,0036 0,0230
0,0002 0,0026
0,0000 0,0002
0,0000 0,0000
0,0000 0,0000

0,3206 0,2097
0,3960 0,3670
0,2097 0,2753
0,0617 0,1147
0,0109 0,0287
0,0012 0,0043
0,0001 0,0004
0,0000 0,0000

0,1335 0,0824 0,0490 0,0280 0,0152 0,0078


0,3115 0,2471 0,1848 0,1306 0,0872 0,0547
0,3115 0,3177 0,2985 0,2613 0,2140 0,1641
0,1730 0,2269 0,2679 0,2903 0,2918 0,2734
0,0577 0,0972 0,1442 0,1935 0,2388 0,2734
0,0115 0,0250 0,0466 0,0774 0,1172 0,1641
0,0013 0,0036 0,0084 0,0172 0,0320 0,0547
0,0001 0,0002 0,0006 0,0016 0,0037 0,0078

0
1
2
3
4
5
6
7
8

0,6634 0,4305
0,2793 0,3826
0,0515 0,1488
0,0054 0,0331
0,0004 0,0046
0,0000 0,0004
0,0000 0,0000
0,0000 0,0000
0,0000 0,0000

0,2725 0,1678
0,3847 0,3355
0,2376 0,2936
0,0839 0,1468
0,0185 0,0459
0,0026 0,0092
0,0002 0,0011
0,0000 0,0001
0,0000 0,0000

0,1001 0,0576 0,0319 0,0168 0,0084 0,0039


0,2670 0,1977 0,1373 0,0896 0,0548 0,0313
0,3115 0,2965 0,2587 0,2090 0,1569 0,1094
0,2076 0,2541 0,2786 0,2787 0,2568 0,2188
0,0865 0,1361 0,1875 0,2322 0,2627 0,2734
0,0231 0,0467 0,0808 0,1239 0,1719 0,2188
0,0038 0,0100 0,0217 0,0413 0,0703 0,1094
0,0004 0,0012 0,0033 0,0079 0,0164 0,0313
0,0000 0,0001 0,0002 0,0007 0,0017 0,0039

0
1
2
3
4

0,6302 0,3874
0,2985 0,3874
0,0629 0,1722
0,0077 0,0446
0,0006 0,0074

0,2316 0,1342
0,3679 0,3020
0,2597 0,3020
0,1069 0,1762
0,0283 0,0661

0,0751 0,0404 0,0207 0,0101 0,0046 0,0020


0,2253 0,1556 0,1004 0,0605 0,0339 0,0176
0,3003 0,2668 0,2162 0,1612 0,1110 0,0703
0,2336 0,2668 0,2716 0,2508 0,2119 0,1641
0,1168 0,1715 0,2194 0,2508 0,2600 0,2461

0,30

0,35

0,40

0,45

0,50

0,3025
0,3241
0,1852
0,0595
0,0102
0,0007

0,2437
0,3280
0,2355
0,0951
0,0205
0,0018

0,1866
0,3110
0,2765
0,1382
0,0369
0,0041

0,1359
0,2780
0,3032
0,1861
0,0609
0,0083

0,0938
0,2344
0,3125
0,2344
0,0938
0,0156

continua na prxima pgina


o
a

317

(Probabilidades binomiais) continuao da pgina anterior


ca
a

0,05

0,10

0,15

0,20

0,25

5
6
7
8
9

0,0000
0,0000
0,0000
0,0000
0,0000

0,0008
0,0001
0,0000
0,0000
0,0000

0,0050
0,0006
0,0000
0,0000
0,0000

0,0165
0,0028
0,0003
0,0000
0,0000

0,0389
0,0087
0,0012
0,0001
0,0000

0,0735
0,0210
0,0039
0,0004
0,0000

0,1181
0,0424
0,0098
0,0013
0,0001

0,1672
0,0743
0,0212
0,0035
0,0003

0,2128
0,1160
0,0407
0,0083
0,0008

0,2461
0,1641
0,0703
0,0176
0,0020

10

0
1
2
3
4
5
6
7
8
9
10

0,5987
0,3151
0,0746
0,0105
0,0010
0,0001
0,0000
0,0000
0,0000
0,0000
0,0000

0,3487
0,3874
0,1937
0,0574
0,0112
0,0015
0,0001
0,0000
0,0000
0,0000
0,0000

0,1969
0,3474
0,2759
0,1298
0,0401
0,0085
0,0012
0,0001
0,0000
0,0000
0,0000

0,1074
0,2684
0,3020
0,2013
0,0881
0,0264
0,0055
0,0008
0,0001
0,0000
0,0000

0,0563
0,1877
0,2816
0,2503
0,1460
0,0584
0,0162
0,0031
0,0004
0,0000
0,0000

0,0282
0,1211
0,2335
0,2668
0,2001
0,1029
0,0368
0,0090
0,0014
0,0001
0,0000

0,0135
0,0725
0,1757
0,2522
0,2377
0,1536
0,0689
0,0212
0,0043
0,0005
0,0000

0,0060
0,0403
0,1209
0,2150
0,2508
0,2007
0,1115
0,0425
0,0106
0,0016
0,0001

0,0025
0,0207
0,0763
0,1665
0,2384
0,2340
0,1596
0,0746
0,0229
0,0042
0,0003

0,0010
0,0098
0,0439
0,1172
0,2051
0,2461
0,2051
0,1172
0,0439
0,0098
0,0010

11

0
1
2
3
4
5
6
7
8
9
10
11

0,5688
0,3293
0,0867
0,0137
0,0014
0,0001
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000

0,3138
0,3835
0,2131
0,0710
0,0158
0,0025
0,0003
0,0000
0,0000
0,0000
0,0000
0,0000

0,1673
0,3248
0,2866
0,1517
0,0536
0,0132
0,0023
0,0003
0,0000
0,0000
0,0000
0,0000

0,0859
0,2362
0,2953
0,2215
0,1107
0,0388
0,0097
0,0017
0,0002
0,0000
0,0000
0,0000

0,0422
0,1549
0,2581
0,2581
0,1721
0,0803
0,0268
0,0064
0,0011
0,0001
0,0000
0,0000

0,0198
0,0932
0,1998
0,2568
0,2201
0,1321
0,0566
0,0173
0,0037
0,0005
0,0000
0,0000

0,0088
0,0518
0,1395
0,2254
0,2428
0,1830
0,0985
0,0379
0,0102
0,0018
0,0002
0,0000

0,0036
0,0266
0,0887
0,1774
0,2365
0,2207
0,1471
0,0701
0,0234
0,0052
0,0007
0,0000

0,0014
0,0125
0,0513
0,1259
0,2060
0,2360
0,1931
0,1128
0,0462
0,0126
0,0021
0,0002

0,0005
0,0054
0,0269
0,0806
0,1611
0,2256
0,2256
0,1611
0,0806
0,0269
0,0054
0,0005

0,30

0,35

0,40

0,45

0,50

continua na prxima pgina


o
a

318

(Probabilidades binomiais) continuao da pgina anterior


ca
a

0,05

0,10

0,15

0,20

0,25

12

0
1
2
3
4
5
6
7
8
9
10
11
12

0,5404
0,3413
0,0988
0,0173
0,0021
0,0002
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000

0,2824
0,3766
0,2301
0,0852
0,0213
0,0038
0,0005
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000

0,1422
0,3012
0,2924
0,1720
0,0683
0,0193
0,0040
0,0006
0,0001
0,0000
0,0000
0,0000
0,0000

0,0687
0,2062
0,2835
0,2362
0,1329
0,0532
0,0155
0,0033
0,0005
0,0001
0,0000
0,0000
0,0000

0,0317
0,1267
0,2323
0,2581
0,1936
0,1032
0,0401
0,0115
0,0024
0,0004
0,0000
0,0000
0,0000

0,0138
0,0712
0,1678
0,2397
0,2311
0,1585
0,0792
0,0291
0,0078
0,0015
0,0002
0,0000
0,0000

0,0057
0,0368
0,1088
0,1954
0,2367
0,2039
0,1281
0,0591
0,0199
0,0048
0,0008
0,0001
0,0000

0,0022
0,0174
0,0639
0,1419
0,2128
0,2270
0,1766
0,1009
0,0420
0,0125
0,0025
0,0003
0,0000

0,0008
0,0075
0,0339
0,0923
0,1700
0,2225
0,2124
0,1489
0,0762
0,0277
0,0068
0,0010
0,0001

0,0002
0,0029
0,0161
0,0537
0,1208
0,1934
0,2256
0,1934
0,1208
0,0537
0,0161
0,0029
0,0002

13

0
1
2
3
4
5
6
7
8
9
10
11
12
13

0,5133
0,3512
0,1109
0,0214
0,0028
0,0003
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000

0,2542
0,3672
0,2448
0,0997
0,0277
0,0055
0,0008
0,0001
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000

0,1209
0,2774
0,2937
0,1900
0,0838
0,0266
0,0063
0,0011
0,0001
0,0000
0,0000
0,0000
0,0000
0,0000

0,0550
0,1787
0,2680
0,2457
0,1535
0,0691
0,0230
0,0058
0,0011
0,0001
0,0000
0,0000
0,0000
0,0000

0,0238
0,1029
0,2059
0,2517
0,2097
0,1258
0,0559
0,0186
0,0047
0,0009
0,0001
0,0000
0,0000
0,0000

0,0097
0,0540
0,1388
0,2181
0,2337
0,1803
0,1030
0,0442
0,0142
0,0034
0,0006
0,0001
0,0000
0,0000

0,0037
0,0259
0,0836
0,1651
0,2222
0,2154
0,1546
0,0833
0,0336
0,0101
0,0022
0,0003
0,0000
0,0000

0,0013
0,0113
0,0453
0,1107
0,1845
0,2214
0,1968
0,1312
0,0656
0,0243
0,0065
0,0012
0,0001
0,0000

0,0004
0,0045
0,0220
0,0660
0,1350
0,1989
0,2169
0,1775
0,1089
0,0495
0,0162
0,0036
0,0005
0,0000

0,0001
0,0016
0,0095
0,0349
0,0873
0,1571
0,2095
0,2095
0,1571
0,0873
0,0349
0,0095
0,0016
0,0001

14

0
1

0,4877 0,2288 0,1028 0,0440 0,0178 0,0068 0,0024 0,0008 0,0002 0,0001
0,3593 0,3559 0,2539 0,1539 0,0832 0,0407 0,0181 0,0073 0,0027 0,0009

0,30

0,35

0,40

0,45

0,50

continua na prxima pgina


o
a

319

(Probabilidades binomiais) continuao da pgina anterior


ca
a

15

0,05

0,10

0,15

0,20

2
3
4
5
6
7
8
9
10
11
12
13
14

0,25

0,1229
0,0259
0,0037
0,0004
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000

0,2570
0,1142
0,0349
0,0078
0,0013
0,0002
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000

0,2912
0,2056
0,0998
0,0352
0,0093
0,0019
0,0003
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000

0,2501
0,2501
0,1720
0,0860
0,0322
0,0092
0,0020
0,0003
0,0000
0,0000
0,0000
0,0000
0,0000

0,1802
0,2402
0,2202
0,1468
0,0734
0,0280
0,0082
0,0018
0,0003
0,0000
0,0000
0,0000
0,0000

0,1134
0,1943
0,2290
0,1963
0,1262
0,0618
0,0232
0,0066
0,0014
0,0002
0,0000
0,0000
0,0000

0,0634
0,1366
0,2022
0,2178
0,1759
0,1082
0,0510
0,0183
0,0049
0,0010
0,0001
0,0000
0,0000

0,0317
0,0845
0,1549
0,2066
0,2066
0,1574
0,0918
0,0408
0,0136
0,0033
0,0005
0,0001
0,0000

0,0141
0,0462
0,1040
0,1701
0,2088
0,1952
0,1398
0,0762
0,0312
0,0093
0,0019
0,0002
0,0000

0,0056
0,0222
0,0611
0,1222
0,1833
0,2095
0,1833
0,1222
0,0611
0,0222
0,0056
0,0009
0,0001

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

0,4633
0,3658
0,1348
0,0307
0,0049
0,0006
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000

0,2059
0,3432
0,2669
0,1285
0,0428
0,0105
0,0019
0,0003
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000

0,0874
0,2312
0,2856
0,2184
0,1156
0,0449
0,0132
0,0030
0,0005
0,0001
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000

0,0352
0,1319
0,2309
0,2501
0,1876
0,1032
0,0430
0,0138
0,0035
0,0007
0,0001
0,0000
0,0000
0,0000
0,0000
0,0000

0,0134
0,0668
0,1559
0,2252
0,2252
0,1651
0,0917
0,0393
0,0131
0,0034
0,0007
0,0001
0,0000
0,0000
0,0000
0,0000

0,0047
0,0305
0,0916
0,1700
0,2186
0,2061
0,1472
0,0811
0,0348
0,0116
0,0030
0,0006
0,0001
0,0000
0,0000
0,0000

0,0016
0,0126
0,0476
0,1110
0,1792
0,2123
0,1906
0,1319
0,0710
0,0298
0,0096
0,0024
0,0004
0,0001
0,0000
0,0000

0,0005
0,0047
0,0219
0,0634
0,1268
0,1859
0,2066
0,1771
0,1181
0,0612
0,0245
0,0074
0,0016
0,0003
0,0000
0,0000

0,0001
0,0016
0,0090
0,0318
0,0780
0,1404
0,1914
0,2013
0,1647
0,1048
0,0515
0,0191
0,0052
0,0010
0,0001
0,0000

0,0000
0,0005
0,0032
0,0139
0,0417
0,0916
0,1527
0,1964
0,1964
0,1527
0,0916
0,0417
0,0139
0,0032
0,0005
0,0000

0,30

0,35

0,40

0,45

0,50

continua na prxima pgina


o
a

320

(Probabilidades binomiais) continuao da pgina anterior


ca
a

0,55

0,60

0,65

0,70

0,75

0,80

0,85

0,90

0,95

0,97

0
1

0,4500 0,4000 0,3500 0,3000 0,2500 0,2000 0,1500 0,1000 0,0500 0,0300
0,5500 0,6000 0,6500 0,7000 0,7500 0,8000 0,8500 0,9000 0,9500 0,9700

0
1
2

0,2025 0,1600 0,1225 0,0900 0,0625 0,0400 0,0225 0,0100 0,0025 0,0009
0,4950 0,4800 0,4550 0,4200 0,3750 0,3200 0,2550 0,1800 0,0950 0,0582
0,3025 0,3600 0,4225 0,4900 0,5625 0,6400 0,7225 0,8100 0,9025 0,9409

0
1
2
3

0,0911 0,0640
0,3341 0,2880
0,4084 0,4320
0,1664 0,2160

0,0429 0,0270
0,2389 0,1890
0,4436 0,4410
0,2746 0,3430

0,0156 0,0080 0,0034 0,0010 0,0001 0,0000


0,1406 0,0960 0,0574 0,0270 0,0071 0,0026
0,4219 0,3840 0,3251 0,2430 0,1354 0,0847
0,4219 0,5120 0,6141 0,7290 0,8574 0,9127

0
1
2
3
4

0,0410 0,0256
0,2005 0,1536
0,3675 0,3456
0,2995 0,3456
0,0915 0,1296

0,0150 0,0081
0,1115 0,0756
0,3105 0,2646
0,3845 0,4116
0,1785 0,2401

0,0039 0,0016 0,0005 0,0001 0,0000 0,0000


0,0469 0,0256 0,0115 0,0036 0,0005 0,0001
0,2109 0,1536 0,0975 0,0486 0,0135 0,0051
0,4219 0,4096 0,3685 0,2916 0,1715 0,1095
0,3164 0,4096 0,5220 0,6561 0,8145 0,8853

0
1
2
3
4
5

0,0185 0,0102
0,1128 0,0768
0,2757 0,2304
0,3369 0,3456
0,2059 0,2592
0,0503 0,0778

0,0053 0,0024
0,0488 0,0284
0,1811 0,1323
0,3364 0,3087
0,3124 0,3602
0,1160 0,1681

0,0010 0,0003 0,0001 0,0000 0,0000 0,0000


0,0146 0,0064 0,0022 0,0005 0,0000 0,0000
0,0879 0,0512 0,0244 0,0081 0,0011 0,0003
0,2637 0,2048 0,1382 0,0729 0,0214 0,0082
0,3955 0,4096 0,3915 0,3281 0,2036 0,1328
0,2373 0,3277 0,4437 0,5905 0,7738 0,8587

0
1
2

0,0083 0,0041 0,0018 0,0007 0,0002 0,0001 0,0000 0,0000 0,0000 0,0000
0,0609 0,0369 0,0205 0,0102 0,0044 0,0015 0,0004 0,0001 0,0000 0,0000
0,1861 0,1382 0,0951 0,0595 0,0330 0,0154 0,0055 0,0012 0,0001 0,0000
continua na prxima pgina
o
a

321

(Probabilidades binomiais) continuao da pgina anterior


ca
a

0,55

0,60

0,65

0,70

0,75

3
4
5
6

0,3032
0,2780
0,1359
0,0277

0,2765
0,3110
0,1866
0,0467

0,2355
0,3280
0,2437
0,0754

0,1852
0,3241
0,3025
0,1176

0,1318
0,2966
0,3560
0,1780

0
1
2
3
4
5
6
7

0,0037 0,0016
0,0320 0,0172
0,1172 0,0774
0,2388 0,1935
0,2918 0,2903
0,2140 0,2613
0,0872 0,1306
0,0152 0,0280

0,0006 0,0002
0,0084 0,0036
0,0466 0,0250
0,1442 0,0972
0,2679 0,2269
0,2985 0,3177
0,1848 0,2471
0,0490 0,0824

0,0001 0,0000 0,0000 0,0000 0,0000 0,0000


0,0013 0,0004 0,0001 0,0000 0,0000 0,0000
0,0115 0,0043 0,0012 0,0002 0,0000 0,0000
0,0577 0,0287 0,0109 0,0026 0,0002 0,0000
0,1730 0,1147 0,0617 0,0230 0,0036 0,0008
0,3115 0,2753 0,2097 0,1240 0,0406 0,0162
0,3115 0,3670 0,3960 0,3720 0,2573 0,1749
0,1335 0,2097 0,3206 0,4783 0,6983 0,8080

0
1
2
3
4
5
6
7
8

0,0017 0,0007
0,0164 0,0079
0,0703 0,0413
0,1719 0,1239
0,2627 0,2322
0,2568 0,2787
0,1569 0,2090
0,0548 0,0896
0,0084 0,0168

0,0002 0,0001
0,0033 0,0012
0,0217 0,0100
0,0808 0,0467
0,1875 0,1361
0,2786 0,2541
0,2587 0,2965
0,1373 0,1977
0,0319 0,0576

0,0000 0,0000 0,0000 0,0000 0,0000 0,0000


0,0004 0,0001 0,0000 0,0000 0,0000 0,0000
0,0038 0,0011 0,0002 0,0000 0,0000 0,0000
0,0231 0,0092 0,0026 0,0004 0,0000 0,0000
0,0865 0,0459 0,0185 0,0046 0,0004 0,0001
0,2076 0,1468 0,0839 0,0331 0,0054 0,0013
0,3115 0,2936 0,2376 0,1488 0,0515 0,0210
0,2670 0,3355 0,3847 0,3826 0,2793 0,1939
0,1001 0,1678 0,2725 0,4305 0,6634 0,7837

0
1
2
3
4
5
6

0,0008 0,0003
0,0083 0,0035
0,0407 0,0212
0,1160 0,0743
0,2128 0,1672
0,2600 0,2508
0,2119 0,2508

0,0001 0,0000
0,0013 0,0004
0,0098 0,0039
0,0424 0,0210
0,1181 0,0735
0,2194 0,1715
0,2716 0,2668

0,0000 0,0000 0,0000 0,0000 0,0000 0,0000


0,0001 0,0000 0,0000 0,0000 0,0000 0,0000
0,0012 0,0003 0,0000 0,0000 0,0000 0,0000
0,0087 0,0028 0,0006 0,0001 0,0000 0,0000
0,0389 0,0165 0,0050 0,0008 0,0000 0,0000
0,1168 0,0661 0,0283 0,0074 0,0006 0,0001
0,2336 0,1762 0,1069 0,0446 0,0077 0,0019

0,80

0,85

0,90

0,95

0,97

0,0819
0,2458
0,3932
0,2621

0,0415
0,1762
0,3993
0,3771

0,0146
0,0984
0,3543
0,5314

0,0021
0,0305
0,2321
0,7351

0,0005
0,0120
0,1546
0,8330

continua na prxima pgina


o
a

322

(Probabilidades binomiais) continuao da pgina anterior


ca
a

0,60

0,65

0,70

0,75

0,55

0,80

0,85

0,90

0,95

0,97

7
8
9

0,1110
0,0339
0,0046

0,1612 0,2162
0,0605 0,1004
0,0101 0,0207

0,2668 0,3003
0,1556 0,2253
0,0404 0,0751

0,3020
0,3020
0,1342

0,2597
0,3679
0,2316

0,1722
0,3874
0,3874

0,0629
0,2985
0,6302

0,0262
0,2116
0,7602

10

0
1
2
3
4
5
6
7
8
9
10

0,0003
0,0042
0,0229
0,0746
0,1596
0,2340
0,2384
0,1665
0,0763
0,0207
0,0025

0,0001
0,0016
0,0106
0,0425
0,1115
0,2007
0,2508
0,2150
0,1209
0,0403
0,0060

0,0000
0,0005
0,0043
0,0212
0,0689
0,1536
0,2377
0,2522
0,1757
0,0725
0,0135

0,0000
0,0001
0,0014
0,0090
0,0368
0,1029
0,2001
0,2668
0,2335
0,1211
0,0282

0,0000
0,0000
0,0004
0,0031
0,0162
0,0584
0,1460
0,2503
0,2816
0,1877
0,0563

0,0000
0,0000
0,0001
0,0008
0,0055
0,0264
0,0881
0,2013
0,3020
0,2684
0,1074

0,0000
0,0000
0,0000
0,0001
0,0012
0,0085
0,0401
0,1298
0,2759
0,3474
0,1969

0,0000
0,0000
0,0000
0,0000
0,0001
0,0015
0,0112
0,0574
0,1937
0,3874
0,3487

0,0000
0,0000
0,0000
0,0000
0,0000
0,0001
0,0010
0,0105
0,0746
0,3151
0,5987

0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0001
0,0026
0,0317
0,2281
0,7374

11

0
1
2
3
4
5
6
7
8
9
10
11

0,0002
0,0021
0,0126
0,0462
0,1128
0,1931
0,2360
0,2060
0,1259
0,0513
0,0125
0,0014

0,0000
0,0007
0,0052
0,0234
0,0701
0,1471
0,2207
0,2365
0,1774
0,0887
0,0266
0,0036

0,0000
0,0002
0,0018
0,0102
0,0379
0,0985
0,1830
0,2428
0,2254
0,1395
0,0518
0,0088

0,0000
0,0000
0,0005
0,0037
0,0173
0,0566
0,1321
0,2201
0,2568
0,1998
0,0932
0,0198

0,0000
0,0000
0,0001
0,0011
0,0064
0,0268
0,0803
0,1721
0,2581
0,2581
0,1549
0,0422

0,0000
0,0000
0,0000
0,0002
0,0017
0,0097
0,0388
0,1107
0,2215
0,2953
0,2362
0,0859

0,0000
0,0000
0,0000
0,0000
0,0003
0,0023
0,0132
0,0536
0,1517
0,2866
0,3248
0,1673

0,0000
0,0000
0,0000
0,0000
0,0000
0,0003
0,0025
0,0158
0,0710
0,2131
0,3835
0,3138

0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0001
0,0014
0,0137
0,0867
0,3293
0,5688

0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0002
0,0035
0,0376
0,2433
0,7153

12

0
1

0,0001 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
0,0010 0,0003 0,0001 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
continua na prxima pgina
o
a

323

(Probabilidades binomiais) continuao da pgina anterior


ca
a

0,55

0,60

0,65

0,70

0,75

2
3
4
5
6
7
8
9
10
11
12

0,0068
0,0277
0,0762
0,1489
0,2124
0,2225
0,1700
0,0923
0,0339
0,0075
0,0008

0,0025
0,0125
0,0420
0,1009
0,1766
0,2270
0,2128
0,1419
0,0639
0,0174
0,0022

0,0008
0,0048
0,0199
0,0591
0,1281
0,2039
0,2367
0,1954
0,1088
0,0368
0,0057

0,0002
0,0015
0,0078
0,0291
0,0792
0,1585
0,2311
0,2397
0,1678
0,0712
0,0138

0,0000
0,0004
0,0024
0,0115
0,0401
0,1032
0,1936
0,2581
0,2323
0,1267
0,0317

0,0000
0,0001
0,0005
0,0033
0,0155
0,0532
0,1329
0,2362
0,2835
0,2062
0,0687

0,0000
0,0000
0,0001
0,0006
0,0040
0,0193
0,0683
0,1720
0,2924
0,3012
0,1422

0,0000
0,0000
0,0000
0,0000
0,0005
0,0038
0,0213
0,0852
0,2301
0,3766
0,2824

0,0000
0,0000
0,0000
0,0000
0,0000
0,0002
0,0021
0,0173
0,0988
0,3413
0,5404

0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0003
0,0045
0,0438
0,2575
0,6938

13

0
1
2
3
4
5
6
7
8
9
10
11
12
13

0,0000
0,0005
0,0036
0,0162
0,0495
0,1089
0,1775
0,2169
0,1989
0,1350
0,0660
0,0220
0,0045
0,0004

0,0000
0,0001
0,0012
0,0065
0,0243
0,0656
0,1312
0,1968
0,2214
0,1845
0,1107
0,0453
0,0113
0,0013

0,0000
0,0000
0,0003
0,0022
0,0101
0,0336
0,0833
0,1546
0,2154
0,2222
0,1651
0,0836
0,0259
0,0037

0,0000
0,0000
0,0001
0,0006
0,0034
0,0142
0,0442
0,1030
0,1803
0,2337
0,2181
0,1388
0,0540
0,0097

0,0000
0,0000
0,0000
0,0001
0,0009
0,0047
0,0186
0,0559
0,1258
0,2097
0,2517
0,2059
0,1029
0,0238

0,0000
0,0000
0,0000
0,0000
0,0001
0,0011
0,0058
0,0230
0,0691
0,1535
0,2457
0,2680
0,1787
0,0550

0,0000
0,0000
0,0000
0,0000
0,0000
0,0001
0,0011
0,0063
0,0266
0,0838
0,1900
0,2937
0,2774
0,1209

0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0001
0,0008
0,0055
0,0277
0,0997
0,2448
0,3672
0,2542

0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0003
0,0028
0,0214
0,1109
0,3512
0,5133

0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0004
0,0057
0,0502
0,2706
0,6730

14

0
1
2
3

0,0000 0,0000
0,0002 0,0001
0,0019 0,0005
0,0093 0,0033

0,0000 0,0000
0,0000 0,0000
0,0001 0,0000
0,0010 0,0002

0,80

0,85

0,90

0,95

0,97

0,0000 0,0000 0,0000 0,0000 0,0000 0,0000


0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
continua na prxima pgina
o
a

324

(Probabilidades binomiais) continuao da pgina anterior


ca
a

15

0,55

0,60

0,65

0,70

4
5
6
7
8
9
10
11
12
13
14

0,75

0,0312
0,0762
0,1398
0,1952
0,2088
0,1701
0,1040
0,0462
0,0141
0,0027
0,0002

0,0136
0,0408
0,0918
0,1574
0,2066
0,2066
0,1549
0,0845
0,0317
0,0073
0,0008

0,0049
0,0183
0,0510
0,1082
0,1759
0,2178
0,2022
0,1366
0,0634
0,0181
0,0024

0,0014
0,0066
0,0232
0,0618
0,1262
0,1963
0,2290
0,1943
0,1134
0,0407
0,0068

0,0003
0,0018
0,0082
0,0280
0,0734
0,1468
0,2202
0,2402
0,1802
0,0832
0,0178

0,0000
0,0003
0,0020
0,0092
0,0322
0,0860
0,1720
0,2501
0,2501
0,1539
0,0440

0,0000
0,0000
0,0003
0,0019
0,0093
0,0352
0,0998
0,2056
0,2912
0,2539
0,1028

0,0000
0,0000
0,0000
0,0002
0,0013
0,0078
0,0349
0,1142
0,2570
0,3559
0,2288

0,0000
0,0000
0,0000
0,0000
0,0000
0,0004
0,0037
0,0259
0,1229
0,3593
0,4877

0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0006
0,0070
0,0568
0,2827
0,6528

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

0,0000
0,0001
0,0010
0,0052
0,0191
0,0515
0,1048
0,1647
0,2013
0,1914
0,1404
0,0780
0,0318
0,0090
0,0016
0,0001

0,0000
0,0000
0,0003
0,0016
0,0074
0,0245
0,0612
0,1181
0,1771
0,2066
0,1859
0,1268
0,0634
0,0219
0,0047
0,0005

0,0000
0,0000
0,0001
0,0004
0,0024
0,0096
0,0298
0,0710
0,1319
0,1906
0,2123
0,1792
0,1110
0,0476
0,0126
0,0016

0,0000
0,0000
0,0000
0,0001
0,0006
0,0030
0,0116
0,0348
0,0811
0,1472
0,2061
0,2186
0,1700
0,0916
0,0305
0,0047

0,0000
0,0000
0,0000
0,0000
0,0001
0,0007
0,0034
0,0131
0,0393
0,0917
0,1651
0,2252
0,2252
0,1559
0,0668
0,0134

0,0000
0,0000
0,0000
0,0000
0,0000
0,0001
0,0007
0,0035
0,0138
0,0430
0,1032
0,1876
0,2501
0,2309
0,1319
0,0352

0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0001
0,0005
0,0030
0,0132
0,0449
0,1156
0,2184
0,2856
0,2312
0,0874

0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0003
0,0019
0,0105
0,0428
0,1285
0,2669
0,3432
0,2059

0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0006
0,0049
0,0307
0,1348
0,3658
0,4633

0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0001
0,0008
0,0085
0,0636
0,2938
0,6333

325

0,80

0,85

0,90

0,95

0,97

Apndice 2
e
Tabela da distribuio de Poisson
ca
Tabela 3: Distribuio de Poisson: probabilidade de cada valor k em funo
ca
ca
de
k
0,005

0,015

0,02

0,025

0,03

0,035

0,04

0,045

0,05

0,055

0,06

0,07

0,9950
0,0050
0,0000
0,0000
0,0000

0,9900
0,0099
0,0000
0,0000
0,0000

0,9851
0,0148
0,0001
0,0000
0,0000

0,9802
0,0196
0,0002
0,0000
0,0000

0,9753
0,0244
0,0003
0,0000
0,0000

0,9704
0,0291
0,0004
0,0000
0,0000

0,9656
0,0338
0,0006
0,0000
0,0000

0,9608
0,0384
0,0008
0,0000
0,0000

0,9560
0,0430
0,0010
0,0000
0,0000

0,9512
0,0476
0,0012
0,0000
0,0000

0,9465
0,0521
0,0014
0,0000
0,0000

0,9418
0,0565
0,0017
0,0000
0,0000

0,9324
0,0653
0,0023
0,0001
0,0000

0,09

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,2

1,4

0,9139
0,0823
0,0037
0,0001
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000

0,9048
0,0905
0,0045
0,0002
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000

0,8187
0,1637
0,0164
0,0011
0,0001
0,0000
0,0000
0,0000
0,0000
0,0000

0,7408
0,2222
0,0333
0,0033
0,0003
0,0000
0,0000
0,0000
0,0000
0,0000

0,6703
0,2681
0,0536
0,0072
0,0007
0,0001
0,0000
0,0000
0,0000
0,0000

0,6065
0,3033
0,0758
0,0126
0,0016
0,0002
0,0000
0,0000
0,0000
0,0000

0,5488
0,3293
0,0988
0,0198
0,0030
0,0004
0,0000
0,0000
0,0000
0,0000

0,4966
0,3476
0,1217
0,0284
0,0050
0,0007
0,0001
0,0000
0,0000
0,0000

0,4493
0,3595
0,1438
0,0383
0,0077
0,0012
0,0002
0,0000
0,0000
0,0000

0,4066
0,3659
0,1647
0,0494
0,0111
0,0020
0,0003
0,0000
0,0000
0,0000

0,3679
0,3679
0,1839
0,0613
0,0153
0,0031
0,0005
0,0001
0,0000
0,0000

0,3012
0,3614
0,2169
0,0867
0,0260
0,0062
0,0012
0,0002
0,0000
0,0000

0,2466
0,3452
0,2417
0,1128
0,0395
0,0111
0,0026
0,0005
0,0001
0,0000

1,8

0
1
2
3
4

0,01

2,5

3,5

4,5

10

0,1653
0,2975
0,2678
0,1607
0,0723
0,0260
0,0078
0,0020
0,0005
0,0001
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000

0,1353
0,2707
0,2707
0,1804
0,0902
0,0361
0,0120
0,0034
0,0009
0,0002
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000

0,0821
0,2052
0,2565
0,2138
0,1336
0,0668
0,0278
0,0099
0,0031
0,0009
0,0002
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000

0,0498
0,1494
0,2240
0,2240
0,1680
0,1008
0,0504
0,0216
0,0081
0,0027
0,0008
0,0002
0,0001
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000

0,0302
0,1057
0,1850
0,2158
0,1888
0,1322
0,0771
0,0385
0,0169
0,0066
0,0023
0,0007
0,0002
0,0001
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000

0,0183
0,0733
0,1465
0,1954
0,1954
0,1563
0,1042
0,0595
0,0298
0,0132
0,0053
0,0019
0,0006
0,0002
0,0001
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000

0,0111
0,0500
0,1125
0,1687
0,1898
0,1708
0,1281
0,0824
0,0463
0,0232
0,0104
0,0043
0,0016
0,0006
0,0002
0,0001
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000

0,0067
0,0337
0,0842
0,1404
0,1755
0,1755
0,1462
0,1044
0,0653
0,0363
0,0181
0,0082
0,0034
0,0013
0,0005
0,0002
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000

0,0025
0,0149
0,0446
0,0892
0,1339
0,1606
0,1606
0,1377
0,1033
0,0688
0,0413
0,0225
0,0113
0,0052
0,0022
0,0009
0,0003
0,0001
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000

0,0009
0,0064
0,0223
0,0521
0,0912
0,1277
0,1490
0,1490
0,1304
0,1014
0,0710
0,0452
0,0263
0,0142
0,0071
0,0033
0,0014
0,0006
0,0002
0,0001
0,0000
0,0000
0,0000
0,0000

0,0003
0,0027
0,0107
0,0286
0,0573
0,0916
0,1221
0,1396
0,1396
0,1241
0,0993
0,0722
0,0481
0,0296
0,0169
0,0090
0,0045
0,0021
0,0009
0,0004
0,0002
0,0001
0,0000
0,0000

0,0001
0,0011
0,0050
0,0150
0,0337
0,0607
0,0911
0,1171
0,1318
0,1318
0,1186
0,0970
0,0728
0,0504
0,0324
0,0194
0,0109
0,0058
0,0029
0,0014
0,0006
0,0003
0,0001
0,0000

0,0000
0,0005
0,0023
0,0076
0,0189
0,0378
0,0631
0,0901
0,1126
0,1251
0,1251
0,1137
0,0948
0,0729
0,0521
0,0347
0,0217
0,0128
0,0071
0,0037
0,0019
0,0009
0,0004
0,0002

k
0
1
2
3
4
5
6
7
8
9
k
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23

continua na prxima pgina


o
a

326

(Probabilidades de Poisson) continuao da pgina anterior


ca
a
k
1,8
24
25

2,5

3,5

4,5

10

0,0000
0,0000

0,0000
0,0000

0,0000
0,0000

0,0000
0,0000

0,0000
0,0000

0,0000
0,0000

0,0000
0,0000

0,0000
0,0000

0,0000
0,0000

0,0000
0,0000

0,0000
0,0000

0,0000
0,0000

0,0001
0,0000

327

Apndice 3
e
Tabela da distribuio normal padro
ca
a
Tabela 4: Distribuio normal padro. P a probabilica
a
e
dade da varivel aleatria Z estar entre 0 e Zc , ou seja,
a
o
P rob(0 Z Zc ) = P

Zc

z
0
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6

0,0000
0,0398
0,0793
0,1179
0,1554
0,1915
0,2257
0,2580
0,2881
0,3159
0,3413
0,3643
0,3849
0,4032
0,4192
0,4332
0,4452

0,0040
0,0438
0,0832
0,1217
0,1591
0,1950
0,2291
0,2611
0,2910
0,3186
0,3438
0,3665
0,3869
0,4049
0,4207
0,4345
0,4463

0,0080
0,0478
0,0871
0,1255
0,1628
0,1985
0,2324
0,2642
0,2939
0,3212
0,3461
0,3686
0,3888
0,4066
0,4222
0,4357
0,4474

Segunda decimal dos valores de z


3
4
5
6
0,0120
0,0517
0,0910
0,1293
0,1664
0,2019
0,2357
0,2673
0,2967
0,3238
0,3485
0,3708
0,3907
0,4082
0,4236
0,4370
0,4484

0,0160
0,0557
0,0948
0,1331
0,1700
0,2054
0,2389
0,2704
0,2995
0,3264
0,3508
0,3729
0,3925
0,4099
0,4251
0,4382
0,4495

0,0199
0,0596
0,0987
0,1368
0,1736
0,2088
0,2422
0,2734
0,3023
0,3289
0,3531
0,3749
0,3944
0,4115
0,4265
0,4394
0,4505

0,0239
0,0636
0,1026
0,1406
0,1772
0,2123
0,2454
0,2764
0,3051
0,3315
0,3554
0,3770
0,3962
0,4131
0,4279
0,4406
0,4515

0,0279
0,0675
0,1064
0,1443
0,1808
0,2157
0,2486
0,2794
0,3078
0,3340
0,3577
0,3790
0,3980
0,4147
0,4292
0,4418
0,4525

0,0319
0,0714
0,1103
0,1480
0,1844
0,2190
0,2517
0,2823
0,3106
0,3365
0,3599
0,3810
0,3997
0,4162
0,4306
0,4429
0,4535

0,0359
0,0753
0,1141
0,1517
0,1879
0,2224
0,2549
0,2852
0,3133
0,3389
0,3621
0,3830
0,4015
0,4177
0,4319
0,4441
0,4545

continua na prxima pgina


o
a

328

(Probabilidades da normal padro) continuao da pgina anterior


a
ca
a

z
0
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9
4,0

0,4554
0,4641
0,4713
0,4772
0,4821
0,4861
0,4893
0,4918
0,4938
0,4953
0,4965
0,4974
0,4981
0,4987
0,4990
0,4993
0,4995
0,4997
0,4998
0,4998
0,4999
0,4999
0,5000
0,5000

0,4564
0,4649
0,4719
0,4778
0,4826
0,4864
0,4896
0,4920
0,4940
0,4955
0,4966
0,4975
0,4982
0,4987
0,4991
0,4993
0,4995
0,4997
0,4998
0,4998
0,4999
0,4999
0,5000
0,5000

0,4573
0,4656
0,4726
0,4783
0,4830
0,4868
0,4898
0,4922
0,4941
0,4956
0,4967
0,4976
0,4982
0,4987
0,4991
0,4994
0,4995
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000
0,5000

Segunda decimal dos valores de z


3
4
5
6
0,4582
0,4664
0,4732
0,4788
0,4834
0,4871
0,4901
0,4925
0,4943
0,4957
0,4968
0,4977
0,4983
0,4988
0,4991
0,4994
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000
0,5000

0,4591
0,4671
0,4738
0,4793
0,4838
0,4875
0,4904
0,4927
0,4945
0,4959
0,4969
0,4977
0,4984
0,4988
0,4992
0,4994
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000
0,5000

329

0,4599
0,4678
0,4744
0,4798
0,4842
0,4878
0,4906
0,4929
0,4946
0,4960
0,4970
0,4978
0,4984
0,4989
0,4992
0,4994
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000
0,5000

0,4608
0,4686
0,4750
0,4803
0,4846
0,4881
0,4909
0,4931
0,4948
0,4961
0,4971
0,4979
0,4985
0,4989
0,4992
0,4994
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000
0,5000

0,4616
0,4693
0,4756
0,4808
0,4850
0,4884
0,4911
0,4932
0,4949
0,4962
0,4972
0,4979
0,4985
0,4989
0,4992
0,4995
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000
0,5000

0,4625
0,4699
0,4761
0,4812
0,4854
0,4887
0,4913
0,4934
0,4951
0,4963
0,4973
0,4980
0,4986
0,4990
0,4993
0,4995
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000
0,5000

0,4633
0,4706
0,4767
0,4817
0,4857
0,4890
0,4916
0,4936
0,4952
0,4964
0,4974
0,4981
0,4986
0,4990
0,4993
0,4995
0,4997
0,4998
0,4998
0,4999
0,4999
0,4999
0,5000
0,5000

Apndice 4
e
Tabela da distribuio t de Student
ca
Tabela 5: Distribuiao t de Student. Valores cr
c
ticos de
t tais que a probabilidade da varivel aleatria t estar
a
o
entre tc e tc vale 1-, ou seja, P (tc t tc ) = 1

1-

/2

/2
-tc

tc

Graus de
liberdade

0,30

0,20

0,10

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

1,963
1,386
1,250
1,190
1,156
1,134
1,119
1,108
1,100
1,093
1,088
1,083
1,079
1,076
1,074
1,071

3,078
1,886
1,638
1,533
1,476
1,440
1,415
1,397
1,383
1,372
1,363
1,356
1,350
1,345
1,341
1,337

6,314 12,706 15,894


2,920 4,303 4,849
2,353 3,182 3,482
2,132 2,776 2,999
2,015 2,571 2,757
1,943 2,447 2,612
1,895 2,365 2,517
1,860 2,306 2,449
1,833 2,262 2,398
1,812 2,228 2,359
1,796 2,201 2,328
1,782 2,179 2,303
1,771 2,160 2,282
1,761 2,145 2,264
1,753 2,131 2,249
1,746 2,120 2,235

0,05

Valores de
0,04
0,02
31,821
6,965
4,541
3,747
3,365
3,143
2,998
2,896
2,821
2,764
2,718
2,681
2,650
2,624
2,602
2,583

0,01

0,002

0,001

63,656
9,925
5,841
4,604
4,032
3,707
3,499
3,355
3,250
3,169
3,106
3,055
3,012
2,977
2,947
2,921

318,289
22,328
10,214
7,173
5,894
5,208
4,785
4,501
4,297
4,144
4,025
3,930
3,852
3,787
3,733
3,686

636,578
31,600
12,924
8,610
6,869
5,959
5,408
5,041
4,781
4,587
4,437
4,318
4,221
4,140
4,073
4,015

continua na prxima pgina


o
a

330

(Probabilidades da distribuio t de Student) continuao da pgina anterior


ca
ca
a

Graus de
liberdade

Valores de
0,04
0,02

0,30

0,20

0,10

0,05

17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35

1,069
1,067
1,066
1,064
1,063
1,061
1,060
1,059
1,058
1,058
1,057
1,056
1,055
1,055
1,054
1,054
1,053
1,052
1,052

1,333
1,330
1,328
1,325
1,323
1,321
1,319
1,318
1,316
1,315
1,314
1,313
1,311
1,310
1,309
1,309
1,308
1,307
1,306

1,740
1,734
1,729
1,725
1,721
1,717
1,714
1,711
1,708
1,706
1,703
1,701
1,699
1,697
1,696
1,694
1,692
1,691
1,690

2,110
2,101
2,093
2,086
2,080
2,074
2,069
2,064
2,060
2,056
2,052
2,048
2,045
2,042
2,040
2,037
2,035
2,032
2,030

2,224
2,214
2,205
2,197
2,189
2,183
2,177
2,172
2,167
2,162
2,158
2,154
2,150
2,147
2,144
2,141
2,138
2,136
2,133

40
45
50
55
60
100

1,050
1,049
1,047
1,046
1,045
1,042

1,303
1,301
1,299
1,297
1,296
1,290

1,684
1,679
1,676
1,673
1,671
1,660

2,021
2,014
2,009
2,004
2,000
1,984

2,123
2,115
2,109
2,104
2,099
2,081

331

0,01

0,002

0,001

2,567
2,552
2,539
2,528
2,518
2,508
2,500
2,492
2,485
2,479
2,473
2,467
2,462
2,457
2,453
2,449
2,445
2,441
2,438

2,898
2,878
2,861
2,845
2,831
2,819
2,807
2,797
2,787
2,779
2,771
2,763
2,756
2,750
2,744
2,738
2,733
2,728
2,724

3,646
3,610
3,579
3,552
3,527
3,505
3,485
3,467
3,450
3,435
3,421
3,408
3,396
3,385
3,375
3,365
3,356
3,348
3,340

3,965
3,922
3,883
3,850
3,819
3,792
3,768
3,745
3,725
3,707
3,689
3,674
3,660
3,646
3,633
3,622
3,611
3,601
3,591

2,423
2,412
2,403
2,396
2,390
2,364

2,704
2,690
2,678
2,668
2,660
2,626

3,307
3,281
3,261
3,245
3,232
3,174

3,551
3,520
3,496
3,476
3,460
3,390

Apndice 5
e
Tabela da distribuio de Qui-Quadrado (2 )
ca
Tabela 6: Distribuiao de Qui-Quadrado. Valores cr
c
ticos
de qui-quadrado tais que a probabilidade da varivel
a
2
2
aleatria ser maior do que c vale , ou seja, P (2
o
2 ) =
c

2c

Graus de
liberdade

0,30

0,20

0,10

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

1,074
2,408
3,665
4,878
6,064
7,231
8,383
9,524
10,656
11,781
12,899
14,011
15,119
16,222
17,322
18,418

1,642
3,219
4,642
5,989
7,289
8,558
9,803
11,030
12,242
13,442
14,631
15,812
16,985
18,151
19,311
20,465

2,706
4,605
6,251
7,779
9,236
10,645
12,017
13,362
14,684
15,987
17,275
18,549
19,812
21,064
22,307
23,542

Valores de
0,05
0,04
0,02
3,841
5,991
7,815
9,488
11,070
12,592
14,067
15,507
16,919
18,307
19,675
21,026
22,362
23,685
24,996
26,296

4,218
6,438
8,311
10,026
11,644
13,198
14,703
16,171
17,608
19,021
20,412
21,785
23,142
24,485
25,816
27,136

5,412
7,824
9,837
11,668
13,388
15,033
16,622
18,168
19,679
21,161
22,618
24,054
25,471
26,873
28,259
29,633

0,01

0,002

0,001

6,635
9,210
11,345
13,277
15,086
16,812
18,475
20,090
21,666
23,209
24,725
26,217
27,688
29,141
30,578
32,000

9,549
12,429
14,796
16,923
18,908
20,791
22,601
24,352
26,056
27,721
29,354
30,957
32,536
34,091
35,627
37,146

10,827
13,815
16,266
18,466
20,515
22,457
24,321
26,124
27,877
29,588
31,264
32,909
34,527
36,124
37,698
39,252

continua na prxima pgina


o
a

332

(Probabilidades da distribuio de Qui-Quadrado) continuao da pgina anterior


ca
ca
a

Graus de
liberdade

Valores de
0,05
0,04
0,02

0,30

0,20

0,10

17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35

19,511
20,601
21,689
22,775
23,858
24,939
26,018
27,096
28,172
29,246
30,319
31,391
32,461
33,530
34,598
35,665
36,731
37,795
38,859

21,615
22,760
23,900
25,038
26,171
27,301
28,429
29,553
30,675
31,795
32,912
34,027
35,139
36,250
37,359
38,466
39,572
40,676
41,778

24,769
25,989
27,204
28,412
29,615
30,813
32,007
33,196
34,382
35,563
36,741
37,916
39,087
40,256
41,422
42,585
43,745
44,903
46,059

27,587
28,869
30,144
31,410
32,671
33,924
35,172
36,415
37,652
38,885
40,113
41,337
42,557
43,773
44,985
46,194
47,400
48,602
49,802

28,445
29,745
31,037
32,321
33,597
34,867
36,131
37,389
38,642
39,889
41,132
42,370
43,604
44,834
46,059
47,282
48,501
49,716
50,928

40
45
50
55
60

44,165
49,452
54,723
59,980
65,226

47,269
52,729
58,164
63,577
68,972

51,805
57,505
63,167
68,796
74,397

55,758
61,656
67,505
73,311
79,082

56,946
62,901
68,804
74,662
80,482

333

0,01

0,002

0,001

30,995
32,346
33,687
35,020
36,343
37,659
38,968
40,270
41,566
42,856
44,140
45,419
46,693
47,962
49,226
50,487
51,743
52,995
54,244

33,409
34,805
36,191
37,566
38,932
40,289
41,638
42,980
44,314
45,642
46,963
48,278
49,588
50,892
52,191
53,486
54,775
56,061
57,342

38,648
40,136
41,610
43,072
44,522
45,961
47,392
48,811
50,223
51,627
53,022
54,411
55,792
57,167
58,536
59,899
61,256
62,607
63,955

40,791
42,312
43,819
45,314
46,796
48,268
49,728
51,179
52,619
54,051
55,475
56,892
58,301
59,702
61,098
62,487
63,869
65,247
66,619

60,436
66,555
72,613
78,619
84,580

63,691
69,957
76,154
82,292
88,379

70,617
77,179
83,656
90,061
96,403

73,403
80,078
86,660
93,167
99,608

Apndice 6
e
Tabela da distribuio F
ca
Tabela 7: Distribuio F: valores cr
ca
ticos de F. A rea
a
achurada corresponde a 5% da rea total e, representa, a
a
probabilidade de se obter um valor de F maior do que um
valor F0,05;n1 1;n2 1 , onde n1 1 e n2 1 so os graus de
a
liberdade do numerador e denominador, respectivamente.

5%
0

Fc

Graus de liberdade
do denominador
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

161,45 199,50
18,51 19,00
10,13
9,55
7,71
6,94
6,61
5,79
5,99
5,14
5,59
4,74
5,32
4,46
5,12
4,26
4,96
4,10
4,84
3,98
4,75
3,89
4,67
3,81
4,60
3,74
4,54
3,68

Graus de liberdade do numerador


3
4
5
6
7
215,71
19,16
9,28
6,59
5,41
4,76
4,35
4,07
3,86
3,71
3,59
3,49
3,41
3,34
3,29

224,58
19,25
9,12
6,39
5,19
4,53
4,12
3,84
3,63
3,48
3,36
3,26
3,18
3,11
3,06

230,16
19,30
9,01
6,26
5,05
4,39
3,97
3,69
3,48
3,33
3,20
3,11
3,03
2,96
2,90

233,99
19,33
8,94
6,16
4,95
4,28
3,87
3,58
3,37
3,22
3,09
3,00
2,92
2,85
2,79

236,77
19,35
8,89
6,09
4,88
4,21
3,79
3,50
3,29
3,14
3,01
2,91
2,83
2,76
2,71

238,88 240,54
19,37 19,38
8,85
8,81
6,04
6,00
4,82
4,77
4,15
4,10
3,73
3,68
3,44
3,39
3,23
3,18
3,07
3,02
2,95
2,90
2,85
2,80
2,77
2,71
2,70
2,65
2,64
2,59

continua na prxima pgina


o
a

334

(Probabilidades da distribuicao F) continuao da pgina anterior


ca
a

Graus de liberdade
do denominador

16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

4,49
4,45
4,41
4,38
4,35
4,32
4,30
4,28
4,26
4,24
4,23
4,21
4,20
4,18
4,17

3,63
3,59
3,55
3,52
3,49
3,47
3,44
3,42
3,40
3,39
3,37
3,35
3,34
3,33
3,32

Graus de liberdade do numerador


3
4
5
6
7
3,24
3,20
3,16
3,13
3,10
3,07
3,05
3,03
3,01
2,99
2,98
2,96
2,95
2,93
2,92

3,01
2,96
2,93
2,90
2,87
2,84
2,82
2,80
2,78
2,76
2,74
2,73
2,71
2,70
2,69

2,85
2,81
2,77
2,74
2,71
2,68
2,66
2,64
2,62
2,60
2,59
2,57
2,56
2,55
2,53

2,74
2,70
2,66
2,63
2,60
2,57
2,55
2,53
2,51
2,49
2,47
2,46
2,45
2,43
2,42

2,66
2,61
2,58
2,54
2,51
2,49
2,46
2,44
2,42
2,40
2,39
2,37
2,36
2,35
2,33

2,59
2,55
2,51
2,48
2,45
2,42
2,40
2,37
2,36
2,34
2,32
2,31
2,29
2,28
2,27

2,54
2,49
2,46
2,42
2,39
2,37
2,34
2,32
2,30
2,28
2,27
2,25
2,24
2,22
2,21

continua na prxima pgina


o
a

335

(Probabilidades da distribuicao F) continuao da pgina anterior


ca
a

Graus de liberdade
do denominador
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

10

11

241,88 242,98
19,40 19,40
8,79
8,76
5,96
5,94
4,74
4,70
4,06
4,03
3,64
3,60
3,35
3,31
3,14
3,10
2,98
2,94
2,85
2,82
2,75
2,72
2,67
2,63
2,60
2,57
2,54
2,51
2,49
2,46
2,45
2,41
2,41
2,37
2,38
2,34
2,35
2,31
2,32
2,28
2,30
2,26
2,27
2,24
2,25
2,22
2,24
2,20
2,22
2,18
2,20
2,17
2,19
2,15
2,18
2,14
2,16
2,13

Graus de liberdade do numerador


12
13
14
15
16
243,90
19,41
8,74
5,91
4,68
4,00
3,57
3,28
3,07
2,91
2,79
2,69
2,60
2,53
2,48
2,42
2,38
2,34
2,31
2,28
2,25
2,23
2,20
2,18
2,16
2,15
2,13
2,12
2,10
2,09

336

244,69
19,42
8,73
5,89
4,66
3,98
3,55
3,26
3,05
2,89
2,76
2,66
2,58
2,51
2,45
2,40
2,35
2,31
2,28
2,25
2,22
2,20
2,18
2,15
2,14
2,12
2,10
2,09
2,08
2,06

245,36
19,42
8,71
5,87
4,64
3,96
3,53
3,24
3,03
2,86
2,74
2,64
2,55
2,48
2,42
2,37
2,33
2,29
2,26
2,22
2,20
2,17
2,15
2,13
2,11
2,09
2,08
2,06
2,05
2,04

245,95
19,43
8,70
5,86
4,62
3,94
3,51
3,22
3,01
2,85
2,72
2,62
2,53
2,46
2,40
2,35
2,31
2,27
2,23
2,20
2,18
2,15
2,13
2,11
2,09
2,07
2,06
2,04
2,03
2,01

246,47
19,43
8,69
5,84
4,60
3,92
3,49
3,20
2,99
2,83
2,70
2,60
2,51
2,44
2,38
2,33
2,29
2,25
2,21
2,18
2,16
2,13
2,11
2,09
2,07
2,05
2,04
2,02
2,01
1,99

17

18

246,92 247,32
19,44 19,44
8,68
8,67
5,83
5,82
4,59
4,58
3,91
3,90
3,48
3,47
3,19
3,17
2,97
2,96
2,81
2,80
2,69
2,67
2,58
2,57
2,50
2,48
2,43
2,41
2,37
2,35
2,32
2,30
2,27
2,26
2,23
2,22
2,20
2,18
2,17
2,15
2,14
2,12
2,11
2,10
2,09
2,08
2,07
2,05
2,05
2,04
2,03
2,02
2,02
2,00
2,00
1,99
1,99
1,97
1,98
1,96

Apndice 7
e
Tabela de n meros aleatrios
u
o
Tabela 8: Tabela de nmeros aleatrios
u
o
27
42
70
27
09

07
96
95
81
32

94
93
03
35
50

02
24
73
60
76

42
13
48
34
89

62
96
56
19
91

53
82
76
50
84

83
62
22
21
59

62
25
91
75
49

79
57
51
27
09

15
42
46
98
00

75
29
53
05
65

04
23
44
90
86

91
92
31
10
01

21
63
76
96
09

38
53
50
97
12

34
27
65
12
48

35
27
69
42
02

59
10
80
06
87

13
84
34
62
11

70
00
30
80
04

84
34
94
29
06

98
36
67
07
51

56
09
20
39
75

25
04
24
73
77

70
15
81
78
60

12
64
30
75
33

86
65
32
03
68

80
71
73
19
60

61
71
24
52
92

01
76
83
60
90

11
24
96
47
66

82
05
99
72
36

78
67
50
34
47

81
27
62
71
78

56
54
14
36
80

16
41
08
56
25

65
17
47
71
95

62
35
13
37
29

70
31
27
91
39

99
05
15
98
30

72
91
29
32
26

39
43
46
02
27

70
96
97
14
97

14
57
56
07
68

09
73
11
43
83

53
54
01
20
19

19
44
00
97
99

86
58
66
09
07

68
35
80
82
10

63
15
51
25
29

99
02
35
39
84

46
13
40
96
49

22
93
08
35
10

81
86
38
84
84

49
97
95
10
68

07
49
61
74
45

57
62
33
08
53

58
84
12
78
43

29
83
21
15
43

76
08
38
60
85

61
30
97
12
11

33
28
55
46
06

19
23
44
44
45

60
25
39
34
99

42
81
73
94
45

83
71
08
41
93

53
21
29
67
60

25
17
24
29
63

21
83
13
02
83

75
02
06
45
65

80
14
45
80
01

90
47
47
50
85

35
24
87
66
73

80
24
03
78
79

82
90
25
92
98

26
59
59
53
35

39
29
50
95
54

87
64
94
44
71

76
18
53
88
83

89
21
24
58
74

15
85
35
29
60

92
92
86
83
46

85
60
25
26
51

99
82
16
53
22

74
70
19
32
38

52
29
85
09
12

78
85
33
97
26

68
29
55
77
83

91
15
39
25
34

48
86
88
22
82

91
74
18
07
05

45
63
79
78
51

91
68
97
72
59

85
28
41
09
76

56
23
77
86
10

66
96
36
87
48

97
44
96
82
75

92
78
50
84
74

92
00
06
37
10

91
62
94
43

99
09
18
75

67
09
43
50

88
30
36
76

34
45
42
77

54
21
66
21

59
10
04
43

76
55
24
07

44
19
03
94

97
83
92
54

29
74
65
84

73
16
21
08

26
08
05
01

72
08
84
83

67
72
23
00

12
85
14
11

29
80
87
53

17
49
38
52

96
82
17
23

73
65
92
16

17
49
73
85

09
89
49
26

66
49
71
42

75
52
35
81

80
60
83
82

continua na prxima pgina


o
a

337

continuao da pgina anterior


ca
a

14 44 78 26 46 51 23 22 42 70 53 79 42 32 12 20 53 05 32 17 23 96 26 99 29
24
97
35
42
30

22
34
81
04
00

31
87
40
38
99

90
79
66
95
20

73
10
59
55
59

75
61
27
86
96

81
34
41
32
36

82
44
10
49
98

42
80
16
52
21

25
36
68
44
04

18
37
34
95
44

42
53
78
77
53

48
30
88
87
16

65
67
04
00
90

79
26
56
45
08

51
40
81
99
66

02
88
07
26
85

68
80
96
07
49

54
00
70
14
63

55
00
86
72
76

90
67
07
89
95

32
24
27
05
79

69
09
75
82
00

29
72
50
05
72

11
14
65
09
85

18
48
35
37
84

82
57
36
22
38

08
16
82
32
83

05
92
27
84
76

46
57
32
16
85

55
82
11
83
94

11
91
00
22
02

13
96
32
82
05

63
04
11
28
20

06
63
62
52
53

62
43
36
97
92

28
40
60
62
96

43
76
46
55
17

26
23
76
02
73

23
83
75
54
10

54
58
48
83
60

26
65
78
53
08

52
23
01
61
68

53
77
07
83
81

42
76
57
04
18

48
24
81
10
35

44
57
49
91
25

41
88
29
04
77

42
00
44
68
92

99
29
40
36
12

56
09
31
40
21

23
33
63
08
25

64
99
35
27
84

29
94
04
39
89

17
34
15
70
97

92
11
76
80
44

70
34
95
04
70

93
17
80
10
33

19
90
81
58
04

94
53
30
96
19

19
43
22
70
12

66
14
95
51
66

42
10
72
29
72

72
96
62
36
52

89
82
79
51
42

26
49
83
89
49

85
40
76
33
15

37
65
25
30
56

92
45
32
07
21

00
58
08
60
50

25
02
80
90
21

09
36
41
74
99

71
21
97
51
71

48
47
16
96
97

40
42
76
92
10

338

339
2. Sim. Para os gripados, 52,17% no foram vacinados, ou seja, mais da metade. Para os
a
no gripados, 59,22% aplicaram duas doses da vacina, ou seja, a maioria dos no gripados
a
a
foram vacinados.
3. b)30,29% c)56,50%.
4. No.
a
b) Resposta gura 1.
2. Veja gura 2.
4. Veja gura 3.
Respostas dos exerc
cios da seo 2.1.3.5
ca
1
2

21
24

5
11

1
3

27
38

Total

45

16

65

Local

Nmero de abortos
u
0 1
2

Total

1. a)
Respostas dos exerc
cios da seo 2.1.3.3
ca
Respostas dos exerc
cios sobre anlise exploratria de dados
a
o

Respostas de Alguns dos Exerc


cios
Figura 1: Grco da distribuiao conjunta de local e aborto
a
c

1
Local Rio vermelho

1
2
Local Costa da lagoa

Nmero de observaes

10
15
20

25

340
Figura 3: Grco da distribuio conjunta do local e peso de mexilhes
a
ca
o

Figura 2: Grco da distribuiao conjunta da situao de posse e adoo


a
c
ca
ca

2* 1 1 1 2 2 2 2 3 3 3 3 3
2o 5 6 8 8 8
3* 0 0 3
3o 5 5 6 9 9
4* 0 0 2 2
4o 5 6 6 8
5* 0
5o 9
Figura 4: Ramo-e-folhas da durao do primeiro estdio ninfal
ca
a
6. Sim, pois xando-se os totais de locais em 100%, vericamos no manguezal que 60% dos
mexilhes so leves e somente 5,71% so pesados. Por outro lado, no Sambaqui, vericamos
o
a
a
somente 2,94% de leves e 55,88% de pesados. Portanto, no Sambaqui temos animais mais
pesados.
Respostas dos exerc
cios da seo 2.1.3.7
ca

1. C=0,1567 C =0,2216. O que demonstra que local e aborto esto fracamente associados.
a
2. C = 0, 6008; C =0,8496. O que demonstra que porte e hbito esto associados.
a
a

2
4. C = 0, 5634; C = 0, 7967; = 32, 0898; V = 0, 6819.
Respostas dos exerc
cios da seo 2.1.3.11
ca

2. Ramo-e-folhas na gura 4. a) 30 dias; b) Assimtrica ` direita; c) Visualmente no


e
a
a
apresenta .
Respostas dos exerc
cios da seo 2.2.5.1
ca
1. b) r=0,9840, portanto existe uma forte dependncia entre as duas variveis.
e
a
Respostas dos exerc
cios da seo 2.2.6.1
ca

341

1. a) y = 4, 777 + 3, 780x; b) y =19,33 13,32 12,56 15,70 41,10 47,87.

3. y = 0, 005 + 0, 005x; Vmax = 200mmol/min e KM = 1, 0mM. Os resultados das taxas de

transportes so: 67 mmol/min e 198 mmol/min.


a

Respostas dos exerc


cios propostos sobre modelos de probabilidades para experimentos simples, seo 3.9
ca

1) a) 55 b) 10
72
72
2) 0,16%. Independncia entre os resultados dos blocos.
e
2
3) 625 = 0, 32%. Idem ao exerc 2.
cio
4) a) 0,77 b) 0,54 c) Os eventos so mutuamente exclusivos.
a
5) a) 0,0385 b) 0,0925 c) os pares de cromossomos so independentes.
a
6) i)P(A)=1/2 ii)P(A)=1/3.
7) i)37,5% ii) 0,10 =0,40=40% iii)50%.
0,25
8) a) 5 b) 7 c) 3 .
8
8
4
3
7
9) a) 8 b) 8 c) 5 d) 1 e) 1
8
2
8
48
10) a) 33 b) 14 c) 95
95
95
4
11) 9
12) a)0,00 b)0,65 c)0,70 d)0,0
13) 0,59
14) 0,5952
15) a) 12,5% b) 0,391% c) 0,0198 d) 85,94%
16) 36,23%
17) a)0,6836 b) E(X)=2
18) fazer a tabela
19) a) 0,85 b) 0,45 c) 0,10 d) 0,15
20) a) No so independentes. P (F | A) = P (F ), altera as probabilidades. b) 85,71% e
a a
c)78,57%.
Respostas dos exerc
cios propostos sobre modelos de probabilidade para variveis
a
aleatrias discretas, seo 4.8
o
ca

342

1) 1,08%
2) E(X) = np = 156 0, 0081 = 1, 26 covas.
3) a) 2,236 bactrias/cm3 b) 0,95957.
e
4) E(X)=18 DP(X)=2,7.
5) a) 0,11% b) 0,119%
6) a) 0,94 b)60 c) 2,28 u.m. d)E(X)=0,4 VAR(X)=0,392.
7) a) 4 animais VAR(X)=3,2 animais2 DP(X)=1,8 animais b) 0,4236 c) 0,931.
8) a) E(X)=np=2,4 ento, espera-se em mdia 2,4 machos por ninhada. A proporo mdia
a
e
ca
e
:2,4/5=0,48. b) Para X=0 76, X=1 351 e X=2 648, X=3 598, X=4 276, X=5 51.
e
9) a) 0,6454 b) 12 - 27 - 29. c) Concluo que a D. de Poisson est razoavelmente bem adea
quada a esta situao.
ca

10) DP (X) = 8 = 2, 828. Desvios de 1, 2 ou 3, ocorrem frequentemnte. Desvios maiores


que trs so raros.
e a
11) a)0,2681 b) 0 rato:13 quadrantes 1 rato:5,36 quad. 2 ratos:1,07 quad.
12) a)55,54% b) 100-55,54%=44,46%
13) a)=24% b)=94,24%.
14) a) Nmero mdio de plantas doentes colhidas = 0,965, logo, proporao mdia = 0,965/27
u
e
c
e
= 0,0357 = 3,57% b)Para X=0 11,24; X=1 11,24; X=2 5,41; X=3 1,67 e X=4 0,36 c)No
a e
muito boa a aproximao. Acreditamos modelo de Poisson seja melhor.
ca
15) E(X) = n = 8.(1/2) = 4. P(X=4)=0,27.
16)9,56%
17) Para 15 minutos o parmetro (Valor mdio) vale 5. P(X=5)=0,17546
a
e
18) a) 0,1680 b) 0,800852

343

0,65

0,55

0,45

P(A)

0,35

0,25

0,15

0,05

-0,05
0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

0,45

Figura 5: Curva caracter


stica de operao (CCO)
ca
19) a)
Y
X

1 2 3

0
1
2
3
4

1
0
0
0
1

0
2
2
2
0

Total 2

0
2
2
2
0

Total

0
0
2
0
0

1
4
6
4
1

6 6 2

16

b) No so independentes, pois P(X e Y) no igual a P(X).P(Y) c) E(X)= 32/16; E(Y)=


a a
a e
24/16; fazendo Z=X.Y temos que E(Z)=48/16, assim COV(X,Y)= 48/16 - (32/16 . 24/16)=45.
20) P(X=0)=0,0824 P (X 4) = 0, 126
21) a) 0,107 b) 0,599; 0,349; 0,107 e 0,006. O grco dado na gura 5.
a
e
22) 10,72 u.m., que o preo mdio por saco da proposta, logo o produtor deve manter seu
c
e
preo de 20,00 u.m. por saco.
c
23)0,091603.
24) a) P(X=k)= 10 0, 70k 0, 30nk . Veja gura 6. b) P (X 2) = 1 [P (X = 0) + P (X =
k
1)] = 1 0, 00015 = 0, 99985 c) E(X)=7 VAR(X)=2,1.
25) a)0,0337 b)0,9933 c) P (X = k) = (e5 .5k )/k!. Veja gura 7.
26)15,1%.
27) a) 0,086138 b) 0,736098.
28) a) 0,676676 b) 0,323324.
29) a) 73,57% b)26,42%.
30) a) 4.000,00 u.m. para o lote b) 3.952,434 u.m. para o lote. Assim, melhor a opao A.
e
c

344

0,30
0,26
0,22

P(X=x)

0,18
0,14
0,10
0,06
0,02
-0,02
-2

10

12

Nmero de sementes que germinam

Figura 6: Grco da distribuiao de probabilidades do nmero de sementes que germinam


a
c
u
0,22

0,18

P(X=x)

0,14

0,10

0,06

0,02

-0,02
-2

10

14

18

Figura 7: Grco da distribuio de probabilidades do nmero de crianas imunizadas


a
ca
u
c
31) 18,48%
32) a) 11,11% b) 1,333
33) a)
1) Existe n=8 repetioes do experimento.
c
2) H independncia entre os nascimentos.
a
e
3) S h dois tipos de resultados poss
o a
veis.
4) constante, em cada nascimento a probabilidade de sucesso de 50%.
e
b) E(X)=4 DP(X)=1,4142 c) 63,6% d)
34) a) 18,47% b) 1,73.
35) a) 11,53% b) 0,00929% c) 73,45%.
36) a) 23,94%
b)
1) Cada dia independente
e
2) Existe n=30 repeties igualmente provveis
co
a

345

0,30
0,26

Probabilidades

0,22
0,18
0,14
0,10
0,06
0,02
-0,02
-1

Nmero de filhos

Figura 8: Distribuio de probabilidade para nmero de lhos homens


ca
u
3) constante
4) S h 2 resultados poss
o a
veis: chove ou no chove.
a
37)
38)
39)
40)
41)

a) Sim; b) 39 c) 2,929 d) 0%
a) 17,54% b) 95,95724%.
a) 0,5% b) 2,98%.
0,61.
a) 96,059% (Binomial) e 0,96078% (Poisson) b) 99,94%.

Respostas dos exerc


cios propostos para modelos de probabilidade para variveis
a
aleatrias cont
o
nuas, seo 5.3.5
ca

1) a) 0,3848 b) 0,2517 c)0,3092 d)0,7648 e)0,2743 f)0,8907 g)0,9453 h)0,68 i)0,95 j)0,99.
2)0,0038 ou 0,38%
3) P (X > 185kg) = 0, 9332. Logo, tm-se 120x0,9332=112 animais.
e
4) a)0,1974 b)0,6826 c)0,3085
5) a)0,0918; 0,9962; 0,7463; 0; b)8,745cm3/min c)9,5325 a 14,4675
6) a)0,9336 b)93,36 prognicos.
e
7) 0,047
8) 4,33; 5,54; 6,02
9) z=1,645 logo D=21,79 cm
10) a)0,0228 b) 0,053%
11) 22,06%
12) mdia=425,7 g.
e

346

13) a) 0,01222 b) 0,18673


14) 0,02275 = 2,275%
15) a)b=109,70 b)b=86,56 (????)
16) a)0,2358 b)15,7% c)2, 507cm
17) 15,625
18)75
19) a)15,87% b)95,45% c) A porcentagem permanece a mesma. Sempre existir das oba
servaoes entre 2 e +2 da mdia, se a distribuiao normal padro.
c
e
c e
a
20) a)0,9336 b) 0,0664 c) 93
21)a)2486 b)w=16,52 c)0,34
22) a)13,56% b)D=17,20
23) a)0,0968 b)0,9879 c)0,5
24) x1=0,484 x2=0,516
25) a) 512,85mm b)0,51%.
26)a)95,45% b) A porcentagem continua sendo a mesma, pois, se a distribuio normal,
ca e
ento, entre a mdia 2 desvios padres, tem-se 95,45% do dados. c)0,621%
a
e
o
27) a)18,904 b)68,3%
28) =21,303
29) 12,30% b) A=18,52m
30) a)0,8413 b)0,218230 c)20,569
31) 0,10427 ou 10,43%
32) 0,01321=1,32%.
33) 0,1736=17,36%.
34) a)0,04977 b) Conclui-se que a cultivar A mais produtiva que a B.
e
35) 34,15%.

Respostas dos exerc


cios propostos sobre distribuies amostrais, seo 6.6
co
ca

1. a) 68,3% b)0,15866 = 16%.


2. 33,87%.
3. P rob(P 0, 40) + P rob(P 0, 53) = 0, 2388 + 0, 20327 = 0, 4421 = 44, 21%.
4. 0,06% [prob.germinar=0,95; prob.de no-germinar=0,05; n=200]. Utilizar distribuiao
a
c
normal padro.
a

347


5. P (X 2, 0) = 1, 7%.
6. A mdia da distribuio amostral igual a 7069 kg/ha e o desvio padro igual a 98,8583
e
ca
e
a
kg/ha. a) 99,53% b) 0,52% c) 0,06%.
7. Mdia populacional=18000; desvio padro populacional=5125; n=30. Resp.0,1423=14,23%.
e
a

8. P (X 140) = 0, 035%.
9. a)68% b)100%.
10)0,119.

Respostas dos exerc


cios propostos sobre avaliao de parmetros (estimao),
ca
a
ca
seo 7.5
ca

1) a) li=172,410 ls=173,589 b) li=172,226 ls=173,774 c) 9,18%.


2) a) li=481 ls=489 li=479,84 ls=490,16 b) 54,34=55 pacotes.
3) a) li=23,5963 ls=29,5037 li=22,5694 ls=30,5306 b) n=148,52=149.
4) a) li=3338,00 ls=3461,92 li=3316,09 ls=3483,91 b) n=9,585=10.
5) Para o ms de maio: Li=0,0991 Ls=0,5009 erro=0,20 e n=127. Para o ms de junho:
e
e
Li=0,0116 Ls=0,3489 erro=0,1683 e n=89.
6) li=zero ls=0,2413.
7) li=0,054 ls=0,3459 m
nimo=54 mximo=346.
a
8) li=1377,6 ls=1622,4 kg/ha.
9) 57, 16 95, 14 b) n=375
10) Lagoa: 5, 73 6, 51 Fazenda: 9, 31 9, 81 .
11)0, 584 0, 816.
12)0, 084 1, 484.
13) a) 1, 9152 2, 2848 b) n=106,5 107.
14) 7, 5076 Bra 12, 6524 11, 5418 Can 19, 1182. Concluir que no h diferenas
a a
c
signicativas entre as duas espcies.
e
15) a) 0, 1864 0, 6136. Baixa preciso, aumentar o tamanho da amostra n. b)
a
e = 0, 2136, temos 99% de conana que a proporo obtida na amostra no difere mais do
c
ca
a
que 0,2136 de . c) n = 640 d) 0, 041 0, 081. e) veja gura 9.
16) a) 8, 7168 15, 0632 b) n 855
=
Respostas dos exerc
cios propostos sobre testes de hipteses, seo 8.6
o
ca

348

70
65
60
55
50
45
40
35
30
25
20
15
10
5
-5

Pioneiro Secundrio
Figura 9: Representaao grca dos intervalos de conana
c
a
c
1)Zc=0,329 Zt=1,645 - conclui-se que a mquina no precisa ser regulada
a
a
2. g.l. = 34, 52 35, Tt=2,724 Tc=6,98 Rejeita-se H0 . A variedade B superior.
e
2
2
3. = 9, 27, 0,05;3 = 7, 815, portanto, a distribuio no segue as leis da hereditariedade.
ca a
o
2
2
2
2
o
4. 1 ), XA N (A , A ) e XB N (B , B ); 2 ), A = B e 3o ) as amostras so indepena
dentes.
5. t = 0, 2479. Aceita-se a hiptese nula. 48, 25 54, 11
o
6. 30, 6097 33, 8904; 18, 2972 22, 3427 b) n = 31 c) t=12,623, rejeita-se a
hiptese nula.
o
7. 2 = 3, 8347. Aceita-se a hiptese nula. As duas variedades so semelhantes quanto `
o
a
a
germinao de sementes.
ca
8. t = 4, 333. Rejeita-se a hiptese nula, o inseticida novo melhor do que o padro.
o
e
a
9. t = 1, 598, aceita-se a hiptese nula, a quantidade de prote
o
nas no plasma a mesma.
e
10. a) 5, 9373 7, 8227. b) t = 20, 2482, portanto, rejeitamos a hiptese nula. c)
o
37.
n = 36, 27 =
11. t = 10, 588, P (t > 10, 588) < 0, 1%. Rejeita-se a hiptese nula.
o
12. P (F > 3, 02) = 0, 057602, portanto, aceita-se H0 . t = 0, 24, P (|t > 0, 24|) =, 811620,
portanto, aceita-se a hiptese nula.
o
13. F=4,974, P (F > 4, 974) = 0, 000022, assim, as varincias so heterogneas. t = 3, 8977,
a
a
e
P (t > 3, 8977) = 0, 000181, existe diferena signicativa entre as alturas das duas espcies.
c
e

349

14. F = 1, 006, P (F > 1, 006) = 0, 494867, varincias homogneas. t = 0, 05417, P (|t >
a
e
0, 05417|) = 0, 957084 = 95, 71%, aceita-se H0 .
15. t = 4, 149, P (|t < 4, 149|) = 0, 025441 = 2, 54%. A cultivar CEP 18-Cavera mais
e
produtiva.
16. 2 = 164, 62, com 2 graus de liberdade, P (2 > 164, 62) = 0, 000000. Existe diferena
c
signicativa entre o nmero de armadilhas utilizadas na captura da vaquinha com relao
u
ca
ao uso de inseticida.

17. a) H0 : N = U e H0 : N > U . b) E a probabilidade do agricultor aceitar como melhor o inseticida novo, sendo que, na verdade, no existe diferena entre os dois inseticidas,
a
c
quanto ` produo.
a
ca
18. a) t = 0, 688, com 38 graus de liberdade, P (|t < 0, 688|) = 0, 495631 = 49, 56%,
aceita-se a hiptese nula. b)-0,34-2,021(0,49366) C R 0, 34 + 2, 021(0, 49366).
o
2
19. = 22, 352, com 6 graus de liberdade, P (2 > 22, 352) = 0, 001047 = 0, 1047%, existe
diferenas entre os trs tipos de vinhos quanto ` estabilidade. b) 2 = 18, 755, com 3 graus
c
e
a
2
de liberdade, P ( > 18, 755) = 0, 000308 = 0, 0308%, existe diferenas entre os dois tipos
c
de vinhos quanto ` estabilidade. O vinho tinto pior que o branco.
a
e
20. a) t(calculado) = 3, 35, t(tabelado)=-1,761, rejeita-se a hiptese de nulidade. b)valor p =
o
0, 002382, tomando-se como referncia o valor 0,05, rejeita-se a hiptese nula.
e
o
21. a)z=-1,68, Rejeita-se H0 . b) valor p=,046479, rejeita-se H0 .
22. t19 = 2, 91 P (t 2, 91) est entre 0,1% e 0,5%, portanto, rejeita-se a hiptese de nula
o
idade e conclui-se que a mdia na Ba Norte realmente maior do que em Sambaqui. O
e
a
e
intervalo ca: 31, 0 35, 8
23. a) no caso 1 devemos usar o teste t para comparao de duas mdias independentes
ca
e
com varincias desconhecidas e, no caso 2, devemos usar o teste t para comparao de duas
a
ca
mdias para dados pareados. b) Prefereria o planejamento 2 pois devemos comparar as duas
e
mdias sob igualdade de condies.
e
co

350


Indice Remessivo
experimento
fatorial, 14
unifatorial, 14

351

También podría gustarte