Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Centro Tecnolgico
o
Departamento de Informtica e Estat
a
stica
ESTAT
ISTICA BASICA APLICADA AS CIENCIAS
AGRONOMICAS E BIOLOGICAS
Com Noes de Experimentao
co
ca
FLORIANOPOLIS
Santa Catarina - Brasil
Julho - 2003
Sumrio
a
1 Introduo Geral
ca
1.1 A Cincia Estat
e
stica na Pesquisa Agronmica e Biolgica
o
o
1.1.1 Forma de coleta dos dados . . . . . . . . . . . . . .
1.1.2 Erro Experimental ou Res
duo . . . . . . . . . . . .
1.1.3 Anlise Exploratria de Dados . . . . . . . . . . . .
a
o
1.1.4 Inferncia Estat
e
stica . . . . . . . . . . . . . . . . .
1.1.5 Teoria da Probabilidade e seus Modelos . . . . . . .
1.2 A Estat
stica e o Mtodo Cient
e
co . . . . . . . . . . . . .
1.3 Aspectos do Planejamento Estat
stico de um Experimento
1.3.1 Experimentos com um Fator e mais de um Fator . .
1.3.2 Tratamento Controle . . . . . . . . . . . . . . . . .
1.3.3 Variveis e Covariveis . . . . . . . . . . . . . . . .
a
a
1.3.4 Repetio e Casualizao . . . . . . . . . . . . . . .
ca
ca
1.4 Exerc
cios Propostos . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5
5
5
6
7
8
11
13
19
20
21
22
22
23
25
25
25
26
29
29
35
38
42
47
48
53
53
65
2.2
2.1.3.10 Ramo-e-Folhas . . . . . . . . . . . . . . . . . . . . . . . . . 66
2.1.3.11 Exerc
cios Propostos . . . . . . . . . . . . . . . . . . . . . . 70
Algumas Medidas Associadas ` Variveis Quantitativas . . . . . . . . . . . . 72
a
a
2.2.1 Medidas de Tendncia Central . . . . . . . . . . . . . . . . . . . . . . 72
e
2.2.2 Medidas de Disperso . . . . . . . . . . . . . . . . . . . . . . . . . . 80
a
2.2.2.1 Exerc
cios Propostos . . . . . . . . . . . . . . . . . . . . . . 88
2.2.3 O Uso da Mediana e dos Quartis na Interpretaao de um Conjunto de
c
Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
2.2.4 Desenho Esquemtico (em ingls leia-se Box Plot) . . . . . . . . . . . 93
a
e
2.2.4.1 Exerc
cios Propostos . . . . . . . . . . . . . . . . . . . . . . 97
2.2.5 Coeciente de Correlaao . . . . . . . . . . . . . . . . . . . . . . . . . 98
c
2.2.5.1 Exerc
cios propostos . . . . . . . . . . . . . . . . . . . . . . 103
2.2.6 Ajuste da Equaao de uma Reta . . . . . . . . . . . . . . . . . . . . . 105
c
2.2.6.1 Exerc
cios propostos . . . . . . . . . . . . . . . . . . . . . . 110
Simples
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
112
112
116
120
123
124
126
128
132
137
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
183
183
187
189
189
193
195
199
203
.
.
.
.
.
.
.
.
.
209
209
212
213
215
217
219
220
228
236
.
.
.
.
.
.
.
.
.
238
238
238
241
243
247
252
254
256
264
8.4
8.5
8.6
277
278
283
297
297
300
305
Bibliograa
314
316
326
328
330
332
334
337
339
1
1.1
Introduo Geral
ca
A Cincia Estat
e
stica na Pesquisa Agronmica e Biolgica
o
o
A estat
stica uma cincia que se preocupa com o planejamento de uma pesquisa, envole
e
vendo desde a forma de coleta das observaoes, obtidas em experimentos ou levantamentos,
c
at a maneira como ser feita a organizao, a descriao, o resumo dos dados, e a avaliaao
e
a
ca
c
c
e armaao sobre caracter
c
sticas de interesse do pesquisador.
As anlises estat
a
sticas dependem da forma de como os dados so coletados, e o planejaa
mento estat
stico da pesquisa indica o esquema sob o qual os dados sero obtidos. Portanto,
a
o planejamento da pesquisa e a anlise estat
a
stica dos dados obtidos esto intimamente
a
ligados.
Planejamento da pesquisa Anlise estat
a
stica
Dessa forma, o pesquisador deve possuir um razovel conhecimento de estat
a
stica para
Em alguns casos, como por exemplo, na descriao de novas espcies orestais, os dados
c
e
so obtidos atravs da simples observao de como o fenmeno acontece na natureza. Neste
a
e
ca
o
caso, no so feitas alteraoes no fenmeno em estudo. Outro exemplo, o estudo sobre os
a a
c
o
e
efeitos da poluiao ambiental de uma regio sobre animais roedores de determinada espcie.
c
a
e
Neste caso, um certo nmero de animais (amostra), capturados na regio estudada, ser analu
a
a
isado contando o nmero de microncleos existentes a cada cinco mil clulas (caracter
u
u
e
stica
estudada).
Levantamento: observa-se o fenmeno na natureza
o
Por outro lado, em muitas outras situaes, as observaes precisam ser geradas e so
co
co
a
feitas comumente sob condioes controladas pelo pesquisador, e os fatos, eventos ou fenmenos
c
o
1.1.2
Quando instala-se um experimento, desejamose vericar o efeito de diferentes tratamentos, sendo que, os demais efeitos, que no os de tratamentos, devem ser controlados ao
a
mximo do ponto de vista prtico. Portanto, as pulverizaoes com produtos qu
a
a
c
micos, as
capinas, as mensuraoes, etc. devem ser feitas de modo o mais homogneo poss em todo
c
e
vel
o experimento. Da mesma forma, a disponibilidade de gua, a temperatura, a umidade e
a
as sementes utilizadas, devem ser as mais similares poss
veis. Acontece que, na prtica, por
a
maiores que sejam os esforos dos pesquisadores para homogeneizar todos esses efeitos, isto
c
no poss
a e
vel, sempre levando ` ocorrncia de variaoes casuais ou aleatrias. Isto pode ser
a
e
c
o
vericado quando, ao repetir o experimento, sob condies as mais prximas poss
co
o
veis do
experimento anterior, obtemos resultados diferentes. Essas variaoes so chamadas de erro
c
a
experimental ou simplesmente erro. E bom chamar a atenao que apesar do termo erro,
c
isto no signica que o experimento foi mal feito. Muitos preferem o termo res
a
duo para
caracterizar essas variaes aleatrias. Vale a pena ressaltar que essas variaoes tambm
co
o
c
e
ocorrem para dados obtidos atravs de levantamentos.
e
Finney (1952) diz que o propsito da cincia estat
o
e
stica fornecer uma base objetiva para
e
a anlise de problemas nos quais os dados esto sujeitos a variao do acaso. Por maiores que
a
a
ca
sejam os conhecimentos de um pesquisador sobre, por exemplo, nutriao e siologia animal,
c
ele jamais ser capaz de predizer com exatido qual vai ser o peso de um su criado
a
a
no
sob determinadas condioes. Existe um grande nmero de causas que fazem este resultado
c
u
variar, como, por exemplo, variaoes genticas, de temperatura ambiental, umidade, doenas,
c
e
c
etc. Assim, quando o elemento acaso est presente em um problema, diculdades reais so
a
a
introduzidas. Observe que estamos interessados em estudar os fenmenos ditos aleatrios,
o
o
isto , aqueles em que o elemento do acaso est presente.
e
a
E importante ressaltar que quase tudo que fazemos no nosso cotidiano so fenmenos
a
o
aleatrios e, portanto, apresentam uma chance de ocorrncia devido ao acaso. Assim sendo,
o
e
seria desejvel determinar qual a sua probabilidade de ocorrncia. Para tal nalidade
a
e
e
precisamos estabelecer o modelo probabil
stico adequado.
Fenmeno aleatrio Modelo probabil
o
o
stico
A seguir, vamos apresentar duas partes importantes da estat
stica, quais sejam: anlise
a
exploratria de dados e inferncia estatstica.
o
e
1.1.3
Tabela 1.1: Valores da duraao em dias do quinto estdio ninfal de Triatoma klugi com
c
a
alimentao em galo, MIP, UFSC, Florianpolis, SC, 2001.
ca
o
26 37 39 40 41 42 42
43 44 45 45 45 45 45
47 48 48 48 48 48 49
49 49 51 51 51 52 53
53 53 56 57 60 62 62
13
12
Nmero de observaes
11
10
9
8
7
6
5
4
3
2
1
0
26
31
36
41
47
52
57
62
Figura 1.1: Histograma da duraao, em dias, do quinto estdio ninfal de Triatoma klugi
c
a
1.1. Esses resultados foram representados atravs de um histograma dado na gura 1.1.
e
Duas interpretaoes so: 1) um valor para representar os dados igual a 48 dias; 2) observac a
e
se no histograma uma cauda mais longa em direo aos valores menores, assim, diz-se que
ca
a distribuio levemente assimtrica ` esquerda, ou seja, existe uma concentraao maior
ca e
e
a
c
de valores em torno e acima do valor representativo. A anlise exploratria de dados ser
a
o
a
estudada na seao 2.
c
1.1.4
Inferncia Estat
e
stica
3200
4150
4380
4000
2850
1980 2220
2330 3700
2830 3420
2630 3150
1780 2100
2470
3346
3522
3246
2328
na tabela 1.2. Para cada dose de nitrognio so plantados 5 canteiros de terra de 20m2 cada,
e
a
portanto, o tamanho da amostra para cada dose de nitrognio 5,ou seja, foram feitas 5
e
e
repetioes dos tratamentos. Para cada amostra existe uma correspondente populao; cada
c
ca
populaao formada por todos os valores poss
c e
veis de produao em kg/ha para a dose corc
respondente. Aps realizada a anlise estat
o
a
stica e a interpretao dos resultados a partir de
ca
um modelo que relacione a produo com as doses de nitrognio, ser indicada qual(is) a(s)
ca
e
a
melhor(es) dose(s) de nitrognio para a cultura do milho.
e
A estat
stica inferencial, dada a sua grande importncia, apresenta um grande nmero
a
u
10
para obter outras cinco repetioes, essa diferena poderia se modicar. E mais importante
c
c
pensar do seguinte modo. Suponha que seja praticvel repetir o experimento continuamente,
a
isto , aumentar o nmero de repetioes indenidamente. A diferena mdia das produoes
e
u
c
c
e
c
entre as duas doses provavelmente ir estabilizar num determinado valor. Este valor pode
a
ser considerado como sendo a diferena verdadeira entre as duas doses. Ento o problema de
c
a
resumir os dados pode ser colocado desta outra forma: o que pode-se dizer sobre a diferena
c
verdadeira entre a dose 3 e o controle? Esses so problemas de inferncia que sero tratados
a
e
a
neste curso nas sees 6, 7 e 8.
co
1.1.5
11
conana que a diferena mdia de produao, em kg/ha de milho, entre a dose 3 e o controle,
c
c
e
c
da cultivar A est entre 694 e 1589 kg/ha. Ento poss determinar limites dentro dos
a
a e
vel
quais a verdadeira diferena deve encontrar-se, com um certo grau de certeza, dada por uma
c
probabilidade, xada pelo pesquisador. Esses intervalos so conhecidos em estat
a
stica como
intervalos de conana. A espinha dorsal da inferncia estat
c
e
stica a teoria da probabilidade,
e
com seus modelos probabil
sticos, a qual deve necessariamente fazer parte de um curso de
estat
stica.
O que um modelo no sentido geral da palavra? Modelo uma verso simplicada de
e
e
a
algum evento, fenmeno, acontecimento da vida real. Exemplos: um globo uma verso
o
e
a
simplicada do planeta terra; uma maquete de um prdio, um layout (distribuiao interna),
e
c
etc.
Um dos propsitos da cincia descrever e fazer previses de eventos do mundo real, do
o
e
e
o
mundo no qual ns vivemos. Uma maneira pela qual isto feito, construindo-se modelos
o
e
e
matemticos (que so expresses matemticas) que adequadamente descrevem os fenmenos
a
a
o
a
o
do mundo real. Exemplo: desejamos fazer um estudo sobre a distribuio de uma espcie
ca
e
vegetal num habitat. Vamos supor que a distribuio dessa espcie no habitat aleatria,
ca
e
e
o
casual, sendo assim, essa distribuio se ajustar ao que conhecido como modelo de Poisson.
ca
a
e
Outro exemplo: suponhamos que 10 vacas de mesma idade e raa so tratadas com uma
c a
determinada rao A para aumentar a produo de leite (total da lactao). Admitimos que
ca
ca
ca
a probabilidade de aumento de produao na lactaao de = 0, 65. Ento podemos estar
c
c e
a
interessados em saber qual a probabilidade de exatamente 8 vacas aumentarem a produao
e
c
na lactaao. Nesse caso o modelo a ser usado o binomial. Estes modelos sero estudados
c
e
a
na seao 4.
c
Na construao de um modelo deve-se simplicar as coisas e certos pormenores devem ser
c
desprezados, claro que estes pormenores no devem ter importncia para o entendimento
e
a
a
do fenmeno em estudo. A resoluo do problema matemtico pode estar correta e, mesmo
o
ca
a
assim, estar em grande discordncia com os dados observados, simplesmente por que as
a
hipteses bsicas feitas no so conrmadas. Por isso, muito importante deduzir certas
o
a
a a
e
conseqncias do modelo e, a seguir, comparar esses resultados previstos pelo modelo com
ue
12
Amostragem
Teoria de probabilidades
Inferncia estatstica
Tpicos especiais
1.2
A Estat
stica e o Mtodo Cient
e
co
estat
stica). E claro que deve haver uma correspondncia perfeita entre estas duas hipteses.
e
o
Por exemplo, no caso do experimento de aplicaao de diferentes doses de nitrognio podec
e
mos formular a seguinte hiptese cient
o
ca: poss aumentar a produao de milho (kg/ha)
e
vel
c
atravs da aplicao de nitrognio. E a seguinte hiptese estat
e
ca
e
o
stica: existe diferenas enc
1
Hiptese cient
o
ca: Dado um problema bem denido, identicado, vamos imaginar uma explicao para
ca
algum aspecto do problema que nos tenha despertado interesse. Essa a hiptese, e deve ser coerente com
e
o
as observaes importantes j feitas, aliada aos conhecimentos tericos que o pesquisador possue sobre o
co
a
o
assunto.
13
14
(2)
Observaes
ou dados
Planejamento estatstico
do experimento
Anlise estatstica
(1)
Formulao de
hipteses
(3)
Verificao das
hipteses formuladas
(4)
Desenvolvimento
da teoria
c
Vericar a capacidade e comprimento de brotaao;
estudar a produao de massa verde;
c
vericar a sobrevivncia das erveiras decepadas.
e
a
4) Formulao da hiptese cientca. E vivel a recuperao de ervais nativos e improca
o
ca
dutivos atravs da prtica da decepa.
e
a
5) Escolha dos fatores que devem ser inclu
dos no estudo e seus correspondentes n
veis
(tratamentos). O pesquisador deve escolher os fatores a serem estudos, a faixa na qual esses
fatores sero variados, e os n
a
veis espec
cos utilizados no experimento. Neste projeto o
fator, tambm conhecido como varivel independente, a decepa, e as alturas em que ser
e
a
e
a
realizada a mesma so os tratamentos (n
a
veis do fator). Foram utilizadas quatro alturas
de decepa (4 tratamentos), quais sejam: tratamento 1 - altura de decepa a 0,00 m do solo;
tratamento 2 - altura de decepa a 0,30 m do solo; tratamento 3 - altura de decepa a 0,60 m
15
A estat
stica bastante rica em planos (delineamentos) experimentais. E nesse item que a
e
estat
stica participa fortemente do planejamento da pesquisa, ou seja, a sua contribuiao
c e
bastante grande, de tal forma que pode-se chamar esta etapa de planejamento estat
stico do
16
unidades experimentais (pois temos 4 tratamentos); como cada unidade experimental tem
8 plantas, ento, um bloco tem 32 plantas. Os blocos esto controlando as diferenas de
a
a
c
dimetros entre as plantas, assim, o bloco I formado por 32 plantas com dimetros entre
a
e
a
10 e 13 cm (exclusive); o bloco II formado por 32 plantas com dimetros entre 13 e 16 cm
e
a
(exclusive); o bloco III formado por 32 plantas com dimetros entre 16 e 19 cm (exclusive);
e
a
o bloco IV formado por 32 plantas com dimetros entre 19 e 22 cm (exclusive) e o bloco V
e
a
formado por 32 plantas com dimetros superiores a 22 cm. Portanto, cada tratamento ser
e
a
a
repetido 5 vezes, uma em cada bloco. Dentro de cada bloco houve o sorteio (aleatorizaao)
c
de qual unidade receber o tratamento 1, qual receber o tratamento 2, e assim por diante.
a
a
Este delineamento experimental denominado de blocos completos ao acaso.
e
9) Coleta dos dados. Aqui so feitas as medidas das variveis estabelecidas pelo pesquisador.
a
a
As variveis, logicamente, devem avaliar diretamente os efeitos dos tratamentos de acordo
a
com objetivos do experimento. Tambm podem ser coletadas variveis complementares, que
e
a
sero uteis para explicar o comportamento dos tratamentos.
a
10) Anlise estat
a
stica dos resultados. O objetivo da anlise estat
a
stica vericar as
e
hipteses formuladas no in da pesquisa cient
o
cio
ca. Por exemplo, comparar as mdias de
e
produao de massa foliar obtidas com cada uma das alturas de decepa, ou, estabelecer uma
c
relao funcional entre a produo de massa foliar e a altura de decepa das plantas.
ca
ca
Existem excelentes softwares estat
sticos para realizar as anlises. A anlise de res
a
a
duos
uma importante tcnica para vericar, por exemplo, se o modelo adequado.
e
e
e
11) Relatrio nal (publicao). Apresentar tabelas e grcos de forma a mostrar os
o
ca
a
efeitos esperados, comparar os resultados obtidos com os objetivos do experimento para
vericar se as questes propostas foram respondidas. Apresentar medidas de preciso das
o
a
estimativas. Se poss
vel, fazer referncias a outras pesquisas similares e uma avaliaao de
e
c
todas as etapas com sugestes para poss
o
veis alteraoes em pesquisas futuras.
c
A experimentaao uma importante fase do processo de aprendizagem, onde ns formuc e
o
lamos hipteses, realizamos o experimento para pesquisar sobre essas hipteses e, de acordo
o
o
com os resultados, formulamos novas hipteses, e assim sucessivamente. Isto sugere que a
o
experimentao iterativa.
ca e
Projeto 2 - Anlise de Alguns Aspectos da Dinmica de Populaes de Duas
a
a
co
Amostras de Biomphalaria tenagophila Submetidas a Diferentes Concentraoes de
c
Matria Orgnica no Meio.
e
a
1) Identicao do problema. A importncia do genro Biomphalaria no contexto da
ca
a
e
sade pblica brasileira deve-se ao fato de que dentre as 19 espcies que constituem este
u
u
e
17
genro, dez delas so encontradas no Brasil, sendo que trs so hospedeiras intermedirias
e
a
e a
a
do Schistosoma mansoni, causador da esquistossomose mansoni, um dos mais importantes
problemas de sade pblica em muitos pa tropicais e subtropicais. Sua ocorrncia acenu
u
ses
e
e
tuada entre populaes carentes de alguns pa subdesenvolvidos. Segundo a Organizaao
co
ses
c
Mundial da Sade, so estimados 200 milhes de pessoas como tendo sido contaminadas
u
a
o
pelo S. mansoni, enquanto, outros 500 a 600 milhes correm o risco de contra
o
-la. As trs
e
espcies hospedeiras so: B. straminea; B. glabrata e B. tenagophila.
e
a
No Brasil, estima-se em 5,5 milhes de pessoas infectadas, isto parece ser uma subestio
mativa, pois o Instituto de Medicina Tropical (IMT), da Faculdade de Medicina da USP,
estimou em 10 milhes o nmero de pessoas infectadas.
o
u
Em Santa Catarina, o primeiro foco de transmisso ocorreu em So Francisco do Sul,
a
a
atravs da B. tenagophila. Hoje, tem-se registro de B. tenagophila em 26 munic
e
pios do
nordeste do Estado.
Na Ilha de Santa Catarina, pesquisadores obtiveram registros de B. tenagophila, B.
oligoza e Drepanotrema sp, em 8 pontos estratgicos.
e
Em consequncia da alta endemicidade da esquistossomose no pa a distribuiao dos
e
s,
c
planorb
deos vem sofrendo constantes investigaes, sendo que especial atenao tem sido
co
c
dada, ainda, ao controle da expanso das espcies vetoras, apesar que a rea ocupada por
a
e
a
cada uma das espcies vetoras do S. mansoni, est aumentando.
e
a
O genro Biomphalaria apresenta uma grande tolerncia a diferentes condies ecolgicas,
e
a
co
o
isto permitiu sua ampla distribuiao geogrca. Muitos autores analisaram o comportamento
c
a
reprodutivo e crescimento em funo de uma srie de variveis, sendo que os efeitos de
ca
e
a
temperatura, tipo ou ausncia de alimentaao, inuncia do fotoperiodismo e densidade
e
c
e
populacional so alguns que receberam maior ateno.
a
ca
As condies do meio exigidas pelas biomfalrias para colonizar um ambiente, so:
co
a
a
riquezas de microora e matria orgnica, pouca turbidez, boa insolao, pH em torno de
e
a
ca
6 a 8, teor de NaCl abaixo de 3 por 1000 e temperatura mdia entre 20 C e 25 C. Cabe
e
aqui ressaltar, todavia, que as bionfalrias suportam modicaes considerveis nas caraca
co
a
ter
sticas f
sicas, qu
micas e biolgicas de seus ambientes, podendo, inclusive, utizar-se da
o
estivaao como uma estratgia para suportar a adversidade do meio.
c
e
Sabendo-se que os representantes do gnero Biomphalaria so constantementes encone
a
trados em grande variedades de colees de gua doce, paradas ou pouco correntes, natural
co
a
ou articialmente alagadas, que um unico espcime capaz de produzir, por autofecundao,
e
e
ca
uma populao de numerosos indiv
ca
duos e que B. tenagophila est em provvel extenso em
a
a
a
Santa Catarina, torna-se importante estudar os fatores biticos e abiticos que interferem
o
o
18
na biologia, distribuiao e adaptaao aos ambientes por eles explorados. Assim sendo, o
c
c
objetivo do presente trabalho avaliar crescimento, desempenho reprodutivo, sobrevivncia
e
e
e fecundidade de duas amostras de B. tenagophila, considerando-se diferentes condies do
co
meio.
2) Objetivo geral. Determinar o efeito de diferentes condioes do meio (poluiao) sobre a
c
c
biologia de B. tenagophila.
3) Objetivos espec
cos:
Vericar (estudar) o crescimento de B. tenagophila.
Estudar o desempenho reprodutivo da espcie.
e
4) Hiptese cientca. Num meio com poluio, o desenvolvimento biolgico da espcie
o
ca
o
e
prejudicado.
e
5) Escolha do fator que deve ser inclu no estudo e seus correspondentes n
do
veis. Nesse
projeto, o fator em estudo poluio, tambm chamado de varivel independente, os difere
ca
e
a
entes n
veis de poluiao so os tratamentos. Nesse trabalho foram utilizados dois tratamentos,
c a
quais sejam: 1) Sem poluiao (com troca de gua) e 2) com poluiao (completa a gua).
c
a
c
a
6) Escolha da unidade experimental. Nesse experimento a unidade experimental um
e
caramujo. Cada unidade experimental formada por um copo de vidro (mini-aqurio), com
e
a
60 ml de gua deionizada, contendo um caramujo.
a
7) Escolha das variveis que sero medidas nas unidades experimentais. Algumas variveis
a
a
a
avaliadas neste experimento foram: dimetro em trs diferentes tempos (nascimento, na 1a
a
e
desova e no nal do experimento); idade na 1a desova; nmero de ovos desenvolvidos; nmero
u
u
de ovos viveis; nmero de ovos inviveis; nmero total de ovos.
a
u
a
u
8) Determinao das regras e procedimentos pelos quais os tratamentos so atribu
ca
a
dos `s
a
unidades experimentais. Nesse experimento a amostra total foi composta por 51 caramujos
(i.. 51 unidades experimentais). Atravs de um processo aleatrio foram escolhidos 23
e
e
o
caramujos para receberem o tratamento T e 28 caramujos para receberem o tratamento C.
A regra de estabelecer os tratamentos `s unidades experimentais foi completamente ao acaso.
a
9) Coleta de dados; Anlise estatstica dos dados e Relatrio nal. Idem ao que foi
a
o
comentado para o projeto 1.
1.3
19
9
8
Textura
7
6
5
4
Dose 1
Dose 2
Dose 3
Dose 4
2
0,5
1,0
1,5
2,0
2,5
3,0
3,5
4,0
4,5
5,0
5,5
Dose 5
Figura 1.4: Efeito da interao entre doses de leite de vaca e doses de coagulante
ca
1.3.1
Nos projetos 1 e 2, vimos dois experimentos com apenas 1 fator. No projeto 1 o fator
a decepa e, no projeto 2 a poluio. Em muitos caso, temos experimentos com mais de
e
e
ca
um fator. Considere um experimento com cinco (5) doses de leite de vaca e cinco (5) doses
de coagulante. Aqui temos 2 fatores em estudo, doses de leite e coagulante, com 5 n
veis
cada um, caracterizando um . E interessante salientar que a escolha dos fatores e seus n
veis
incumbncia do pesquisador. Nos experimentos fatoriais poss estudar-se a interao
e
e
e
vel
ca
que existe entre os fatores, isto , como o comportamento dos n
e
e
veis de um fator dentro
dos n
veis do outro fator. A gura 1.4 ilustra o efeito da interaao entre os fatores leite de
c
vaca e coagulante.
Os fatores podem ser quantitativos ou qualitativos. A temperatura de um forno, os n
veis
de nitrognio e de fsforo so exemplos de fatores quantitativos, enquanto que, fabricantes
e
o
a
de drogas, diferentes locais e meios de cultura so fatores qualitativos.
a
20
Tratamento Controle
21
peratura ambiente (25 C) e o experimento foi feito a 2 C (frango cr). O que ? O tratau
e
mento controle consiste em se realizar todos os procedimentos que so feitos nas unidades
a
experimentais usadas para os outros tratamentos, exceto a aplicaao do efeito em estudo.
c
Exemplo: num estudo sobre aditivos em alimentos, um tratamento pode consistir de uma
porao de um vegetal contendo um aditivo particular que servido a um degustador. O
c
e
tratamento controle consistiria de uma porao do mesmo vegetal servido ao degustador, na
c
mesma situao experimental, exceto que no seria utilizado o aditivo no alimento. E funca
a
damental que o tratamento controle seja conduzido nas mesmas condioes experimentais dos
c
outros tratamentos.
1.3.3
Variveis e Covariveis
a
a
O que pode constituir problema, as vezes, a forma como a varivel medida, pois disso
e
a e
depende a preciso das observaoes e o tipo de anlise a ser executada. Exemplo: se os
a
c
a
valores da varivel sabor de um alimento dada numa escala de 1 a 10, pode-se aumentar a
a
e
preciso e facilitar a anlise, utilizando-se como observao, a mdia de 3 valores da mesma
a
a
ca
e
unidade experimental.
Quando temos uma varivel que inuencia as variveis dependentes, chama-se a mesma
a
a
de covarivel. Exemplos: 1) se o tempo necessrio para executar um experimento 30 dias,
a
a
e
e se a temperatura do ambiente tem inuncia na varivel dependente (resposta), ento, a
e
a
a
temperatura deve ser mantida constante. Se isso no for poss
a
vel, ento, deve-se medir a
a
temperatura para cada unidade experimental; 2) num experimento para comparar 4 meios
de cultura em frangos congelados onde a varivel dependente a populaao de Staphilococus
a
e
c
aureus, cada frango apresenta uma populaao inicial de Staphilococus diferente, neste caso,
c
a populaao inicial de Staphilococus a covarivel; 3) Num experimento para estudar a
c
e
a
produao de 10 variedades de soja, o nmero de sementes que germinam nos canteiros
c
u
e
a covarivel. Estas variveis entram na anlise como covariveis e, observe que elas no
a
a
a
a
a
podem ser controladas pelo pesquisador. Este fato que as diferencia de uma varivel de
e
a
perturbaao (nuisance variable).
c
1.3.4
Repetio e Casualizao
ca
ca
22
1.4
Exerc
cios Propostos
23
24
2
2.1
2.1.1
25
38
34
30
26
22
18
14
10
10
12
14
16
18
20
22
26
Ciclo
Altura planta
Altura espiga
(kg/ha)
(dias)
(cm)
(cm)
6388
65
242
103
dentado
6166
65
258
134
semi-dentado
6047
65
240
104
semi-dentado
5889
66
243
108
semi-dentado
5823
69
257
128
dentado
ms
5513
68
241
108
semi-dentado
5202
64
235
108
dentado
5172
68
240
103
dentado
5166
69
253
123
dentado
ms
10
4975
70
250
117
semi-dentado
ms
11
4778
70
242
114
dentado
mr
12
4680
66
245
111
semi-duro
ms
13
4660
69
239
110
semi-duro
mr
14
5403
73
264
138
dentado
ms
15
5117
76
282
149
dentado
mr
16
5063
72
274
151
dentado
17
4993
71
279
134
semi-dentado
18
4980
72
274
140
dentado
ms
19
4770
73
244
140
dentado
20
4685
71
265
139
semi-duro
mr
21
4614
73
248
110
semi-dentado
22
4552
73
265
128
semi-dentado
23
3973
74
261
124
semi-dentado
mr
24
4550
71
259
129
semi-duro
25
5056
64
252
104
semi-duro
mr
26
4500
70
271
109
dentado
ms
27
4760
68
243
137
semi-duro
28
5110
66
252
141
semi-dentado
ms
29
4960
70
262
120
dentado
ms
30
4769
73
260
118
dentado
31
4849
74
250
119
semi-dentado
32
1
Rendimento mdio
e
Tipo gro
a
5230
71
255
138
semi-duro
(escala)
Ferrugem
E
D
a
veis
dentro de um determinado intervalo. Esta variveis, dependendo da preciso utia
a
lizada na mediao, so capazes de diferenciar animais, plantas para valores muito pec a
28
Feita a coleta dos dados, atravs de censos, de levantamentos por amostragem (Survey,
e
em ingls), ou de experimentos, os mesmos apresentam-se, geralmente, de maneira desore
ganizada, ainda sem valor informativo sobre o fenmeno em estudo, portanto, os mesmos
o
devem ser organizados e resumidos, para possibilitarem a obteno de informaoes uteis para
ca
c
o trabalho de pesquisa.
O estudo das distribuies de freqncias nos permite conhecer a forma, a maneira como
co
ue
os valores de uma varivel se comporta, isto , poss ter uma boa idia global dos valores,
a
e e
vel
e
ou seja, da distribuiao. Uma distribuiao de freqncias pode ser representada em forma
c
c
ue
de tabela ou grco.
a
2.1.3.1 Distribuies de Freqncias de Variveis Qualitativas. Representao
co
ue
a
ca
em Tabelas
Feita a coleta dos dados relativa `s variveis denidas no in
a
a
cio da pesquisa, o investigador tem interesse, agora, em conhecer o comportamento dessas variveis considerando
a
os elementos pesquisados, por exemplo, conhecer a distribuiao da varivel resistncia `
c
a
e
a
ferrugem pesquisada em 32 h
bridos de milho, na regio de Chapec, SC.
a
o
29
Este estudo pode ser feito atravs da construo de distribuioes de freqncias, chamandoe
ca
c
ue
se de frequncia, por exemplo, o nmero de h
e
u
bridos para a categoria S, MS, MR, e R,
respectivamente. Chama-se, portanto, distribuio de freqncias, a correspondncia entre
ca
ue
e
categorias ou valores poss
veis de uma varivel e as respectivas freqncias. Inicialmente
a
ue
vamos representar as distribuioes de freqncias em tabelas.
c
ue
Alguns aspectos importantes devem ser levados em considerao na construao de uma
ca
c
tabela, quais sejam:
tulo completo; as trs questes que devem ser respondidas
e
o
1. Toda tabela deve conter um t
num t
tulo so: o qu se est estudando? onde foi feito o estudo? e quando?. O t
a
e
a
tulo
deve ser colocado na parte superior da tabela.
2. Se os dados no so prprios deve-se indicar a fonte dos mesmos. Ela vai na parte
a a
o
inferior da tabela.
3. As notas e chamadas so utilizadas para fazer esclarecimentos de ordem geral e esa
pec
cas, respectivamente. Ambas so numeradas, geralmente em algarismos arbicos,
a
a
pode-se, ainda, utilizar letras minsculas ou s
u
mbolos, como por exemplo, asterisco.
Tambm so colocadas na parte inferior da tabela.
e
a
4. Os totais e subtotais devem ser bem destacados.
e
u
5. De preferncia usar o mesmo nmero de casas decimais para os algarismos.
6. No devem ser fechadas lateralmente.
a
7. Quando algum valor da tabela nulo pela prpria natureza do fenmeno em estudo,
e
o
o
deve-se utilizar o h
fen (-) para substitu
-lo. Quando no se tem informao sobre
a
ca
algum valor deve-se colocar trs pontos (...). Se existe dvida sobre a exatido da
e
u
a
informaao deve-se usar ponto de interrogao (?). Se algum valor for omitido para
c
ca
evitar individualizao, deve-se usar a letra x. O s
ca
mbolo de pargrafo () utilizado
a
e
para reticar uma informao publicada anteriormente.
ca
Exemplo. A tabela 2.1 apresenta os dados sobre resistncia ` ferrugem de 32 h
e
a
bridos
de milho (coluna 7). A distribuio de freqncias para essa varivel apresentada na tabela
ca
ue
a e
2.2, cuja construao passamos a discutir.
c
Na tabela 2.2, a primeira coluna mostra todas as categorias da varivel resistncia `
a
e
a
ferrugem. Na segunda coluna temos as freqncias absolutas, resultantes da contagem de
ue
30
10
6
9
7
0,313
0,188
0,281
0,219
31,250
18,750
28,125
21,875
TOTAL
32
1,000
31,250
50,000
-
100,000
quantas observaes se identicam com cada categoria. A notao para as freqncias abco
ca
ue
solutas ni , assim temos, n1 = 10, n2 = 6, n3 = 9, n4 = 7. A terceira coluna apresenta
e
uma medida relativa de cada freqncia, obtida da diviso de cada freqncia absoluta pelo
ue
a
ue
nmero total de observaoes, resultando nas propores ou freqncias relativas (fi = ni /n).
u
c
co
ue
Por exemplo, a freqncia relativa da categoria R calculada por: f1 = 10 32 = 0, 3125.
ue
e
Multiplicando por 100 as freqncias relativas, temos as percentagens de ocorrncias de cada
ue
e
resultado observado (coluna 4). A ultima coluna da tabela apresenta a porcentagem acumu
lada, dada pela porcentagem da respectiva coluna adicionada da(s) anterior(es) ` ela. Por
a
exemplo, os 50% da categoria MR o resultado da adio de 18,75% e 31,25%. Observa-se
e
ca
na tabela 2.2 que temos praticamente 50% de h
bridos resistentes e 50% de suscept
veis.
Deixamos as categorias MS e S com traos pois no tem sentido prtico o clculo das porc
a
a
a
centagens acumuladas neste caso, ou seja, no tem sentido armarmos que 100% dos h
a
bridos
so suscept
a
veis.
Essas medidas relativas so particularmente importantes na comparaao entre distribuioes
a
c
c
de freqncias, como veremos a seguir em distribuies bidimensionais, isto , quando temos
ue
co
e
duas variveis em estudo. Quando temos mais do que duas variveis o racioc o mesmo.
a
a
nio e
Tabelas Bidimensionais
A tabela 2.3 mostra trs distribuioes de freqncias, uma para cada regio preferencial.
e
c
ue
a
Dizemos que esta tabela bidimensional, pois apresenta a distribuiao de duas variveis,
e
c
a
quais sejam: 1) resistncia ` ferrugem e 2) regio.
e
a
a
Como os totais marginais da tabela 2.3 so diferentes, e isto diculta a interpretao,
a
ca
interessante trabalhar com porcentagens, tornando, assim, os resultados comparveis. As
e
a
31
10
6
9
7
3
12
3
1
12
2
3
2
25
20
15
10
TOTAL
32
19
19
70
31,2
18,8
28,1
21,9
15,8
63,2
15,8
5,2
63,2
10,5
15,8
10,5
35,8
28,6
21,4
14,3
TOTAL
100,0
100,0
100,0
100,0
porcentagens podem ser calculadas de trs formas: 1) xando-se os totais de linhas em 100%;
e
2) xando-se os totais de colunas em 100% e 3) xando-se o total geral em 100%. Isto vai
de acordo com o objetivo da pesquisa, uma delas ser a mais adequada.
a
Na tabela 2.4 xamos os totais de colunas em 100%. Este tipo de distribuiao serve para
c
comparar a distribuiao das regies conforme a resistncia ` ferrugem, ou seja, para uma
c
o
e
a
dada regio podemos analisar a varivel resistncia ` ferrugem. Com respeito a essa tabela,
a
a
e
a
observamos que em Campos Novos a porcentagem de h
bridos moderadamente resistentes
e
bem superior `s outras duas regies, 63,2% em Campos Novos contra 18,8% em Chapec e
a
o
o
10,5% em Iara. Por outro lado, vemos que Iara apresenta a maior porcentagem de h
c
c
bridos
resistentes ` ferrugem (63,2%), bem superior ` Chapec (31,2%) e Campos Novos (15,8%).
a
a
o
Percebe-se que em Chapec a distribuiao mais homognea nas categorias da resistncia.
o
c e
e
e
32
40,0
30,0
60,0
70,0
12,0
60,0
20,0
10,0
48,0
10,0
20,0
20,0
100,0
100,0
100,0
100,0
TOTAL
45,7
27,1
27,1
100,0
14,3
8,6
12,9
10,0
4,3
17,1
4,3
1,4
17,1
2,9
4,3
2,8
35,7
28,6
21,4
14,3
TOTAL
45,7
27,1
27,1
100,0
33
180 a 300
19
25
301 a 422
36
24
60
Total
45
49
94
(Amostra A: indiv
duos agrupados numa bacia e Amostra I: indiv
duos isolados em copos
de vidro), produziu os resultados da tabela 2.7:
a) Dos indiv
duos que tiveram tempo de vida entre 58 e 179 dias, qual a porcentagem
deles para a condio Agrupados? e Isolados?
ca
b) Qual a porcentagem de indiv
duos para tempo de vida entre 180 e 300 dias e condiao
c
Isolados?
c) Dos indiv
duos submetidos ` condio de Agrupados, qual a porcentagem de indiv
a
ca
duos
teve tempo de vida entre 301 e 422?
Observou-se 9 indiv
duos com tempo de vida entre 58 e 179 dias, portanto, as porcentagens so dadas por: 3/9=33,33% e 6/9=66,67%, respectivamente. A resposta do item b)
a
: 19/94=0,2021=20,21%. Observou-se um total de 45 indiv
e
duos submetidos a condio
ca
de Agrupados, portanto, a porcentagem dos que tem tempo de vida entre 301 e 422 :
e
36/45=0,80=80%.
34
2.1.3.2
deixar uma distncia entre os retngulos. E usado quando as inscrioes a serem colocadas
a
a
c
sob os retngulos forem muito extensas. Sempre que poss ordenar as barras em ordem
a
vel
decrescente. A gura 2.3 mostra o grco de barras da distribuio da tabela 2.2.
a
ca
35
Resistncia ferrugem
ms
mr
10
11
Nmero de hbridos
36
Resistentes
Semi-duro
Susceptvel
Tipo de gro
M. susceptvel
M. resistente
Semi-dentado
Dentado
Nmero de hbridos
Nmero de observaes
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0
Dentado
Semi-dentado
Semi-duro
Tipo de gro
37
resistentes, 35,7 %
Resistncia ferrugem
Figura 2.6: Distribuiao das proporoes (%) da resistncia ` ferrugem, para o tipo de gro
c
c
e
a
a
dentado, para a regio I, 1987/88
a
Os grcos de linhas so adequados para dados ordenados ao longo do tempo (sries
a
a
e
temporais) e servem para comparar distribuioes. Na gura 2.7, apresentamos o grco de
c
a
linhas da varivel acidez em cido ltico (%) de 4 tratamentos, denominados aqui por PA,
a
a
a
PB, PC e C.
Exerc
cio resolvido
1. Um pesquisador est procurando vericar se existe associao entre hbito de crescia
ca
a
mento (3=indeterminado trepador e 4=indeterminado prostrado) e porte (Tr=trepador,
EB=ereto na base e Pr=prostrado) na cultura do feijo de vagem. Para esse m foi cona
duzido um experimento na UFSC, safra 1991/92, cujos resultados esto na tabela 2.8.
a
a) Construa a distribuiao de frequncia conjunta para as variveis hbito de crescimento e
c
e
a
a
porte. Resposta tabela 2.9.
b) Faa um grco para a distribuio de freqncia conjunta do item a). Resposta gura
c
a
ca
ue
2.8.
2.1.3.3 Exerc
cios Propostos
1. Um pesquisador est procurando vericar se existe associaao entre local (1= Rio
a
c
vermelho; 2= Costa da lagoa) e nmero de abortos para crianas do sexo feminino. Para
u
c
esse m foi feito um levantamento, cujos resultados esto apresentados na tabela 2.10 (Obs:
a
A unidade de amostragem uma fam
e
lia):
a) Construa a distribuiao de freqncias conjunta para as variveis local e nmero de
c
ue
a
u
abortos.
b) Faa um grco para a distribuio de freqncias conjunta do item a).
c
a
ca
ue
38
0,76
0,72
0,68
0,64
0,60
C
0,56
PC
PB
0,52
PA
0,48
14
21
28
Tempo em dias
Figura 2.7: Comportamento da varivel acidez em cido ltico (%) nos diversos tratamentos
a
a
a
durante a maturaao de salame tipo italiano,UFSC, 1992
c
Tr
EB
Pr
Tr
Tr
Tr
Pr
EB
Tr
Tr
4
4
3
3
3
3
4
4
4
4
Tr
Tr
Pr
Pr
Pr
EB
EB
EB
Tr
Tr
4
4
3
4
4
4
4
4
3
4
39
Tr
Tr
Tr
Tr
Tr
Tr
Tr
Tr
Pr
Tr
4
4
4
3
4
3
4
3
4
4
Pr
Tr
Pr
Pr
Tr
Pr
Pr
Pr
Tr
Tr
4
3
3
3
4
4
4
4
3
4
Tr
Pr
Pr
Pr
Tr
Tr
Tr
Tr
Pr
Tr
1 6,3%
2 12,5%
13 81,3%
28 82,4%
3 8,8%
3 8,8%
29 58,0%
5 10,0%
16 32,0%
Total
16 100,0%
34 100,0%
50 100,0%
40
0
0
1
0
0
0
0
2
2
0
1
1
0
0
2
2
2
2
2
2
2
2
2
2
2
2
2
2
0
1
1
1
1
1
0
0
0
0
0
0
0
0
2
2
2
2
2
2
2
2
2
2
1
1
1
1
0
0
1
1
2
0
0
0
0
1
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
2
1
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
2. Um economista agr
cola est estudando os fatores que afetam a adoo de uma nova
a
ca
variedade de arroz altamente produtiva. Os resultados obtidos esto na tabela 2.11.
a
a) Faa um grco para tabela 2.11, mostrando o comportamento da adoao segundo a
c
a
c
situao de posse da terra (perl linha). Faa a interpretao dos resultados.
ca
c
ca
3. Foi conduzido um experimento com o objetivo de avaliar o poder germinativo de
duas cultivares de cebola: A) Bola Precoce-EMPASC 352 e B) Norte 14. Foram utilizadas
para o teste de germinaao, 4 repetioes de 100 sementes, totalizando 400 sementes para
c
c
cada cultivar. A varivel de estudo o nmero de sementes que germinam. Os resultados
a
e
u
Tabela 2.11: Distribuio conjunta de freqncias
ca
ue
Posse
Adoo
ca
Total
Adota No adota
a
Proprietrio
a
Vrios arendatrios
a
a
Unico arendatrio
a
102
42
5
26
10
2
128
52
7
Total
149
38
187
41
392
381
8
19
400
400
Total
773
27
800
21
1
12
14
2
19
35
34
Total
22
26
21
69
obtidos esto na tabela 2.12. Faa um grco mostrando o comportamento das cultivares
a
c
a
com relaao ` germinao das sementes. Faa a interpretaao dos resultados.
c a
ca
c
c
4. A tabela 2.13 representa a distribuiao conjunta das variveis local de coleta e peso
c
a
de mexilhes. Faa um grco para representar a distribuio conjunta. Obtenha uma
o
c
a
ca
concluso relevante.
a
2.1.3.4 Tabelas de Contingncia
e
E muito freqnte nas Cincias Biolgicas o interesse em vericar se duas variveis qualiue
e
o
a
tativas apresentam-se associadas, isto , se o conhecimento de uma varivel ajuda a entender
e
a
uma outra varivel. Construindo uma distribuiao de freqncia conjunta das duas variveis,
a
c
ue
a
ou seja, uma tabela de contingncia, podemos satisfazer de forma exploratria esse objetivo.
e
o
Vamos vericar que a simples construo da distribuiao conjunta das freqncias ser um
ca
c
ue
a
poderoso instrumento para ajudar na compreenso dos dados. Como veremos, as tabelas
a
constru
das na seo anterior, so chamadas de tabelas de contingncia e sero agora introca
a
e
a
duzidas formalmente.
Para se construir uma tabela de contingncia, deve-se observar conjuntamente as duas
e
variveis nos elementos em estudo. Por exemplo, vamos observar para cada aluno, o grau
a
de satisfaao com o curso e o preparo dos professores. Se desejamos descrever a varivel
c
a
grau de satisfao com o curso, sabendo-se que a mesma tem associao com o preparo dos
ca
ca
42
B1
B2
...
Br
TOTAIS
A1
A2
.
As
n11
n21
.
ns1
n12
n22
.
ns2
...
...
...
...
n1r
n2r
.
nsr
n1.
n2.
.
ns.
TOTAIS
n.1 =
s
i=1
ni1
n.2 =
s
i=1
ni2
... n.r =
s
i=1
nir
n.. =
s
i=1
r
j=1
nij
43
Tabela 2.15: Distribuiao conjunta das freqncias das variveis resistncia ` ferrugem e
c
ue
a
e
a
tipo de gro para 32 h
a
bridos de milho, 1987/88.
Tipo de gro Resistncia ` ferrugem1 Totais
a
e
a
R MR MS
S
Dentado
Semi-dentado
Semi-duro
5
4
1
2
1
3
6
2
1
1
4
2
14
11
7
Total
10
6
9
7
32
R = resistente; MR = moderadamente resistente; MS = moderadamente suscept
vel; S =
suscept
vel.
Tabela 2.16: Distribuio conjunta das percentagens das variveis resistncia ` ferrugem e
ca
a
e
a
tipo de gro para 32 h
a
bridos de milho, 1987/88.
Tipo de gro Resistncia ` ferrugem1 Totais
a
e
a
R
MR MS
S
Dentado
Semi-dentado
Semi-duro
35,7
36,4
14,3
14,3
9,1
42,8
42,9
18,2
14,3
7,1
36,4
28,6
100,0
100,0
100,0
Total
31,2 18,8 28,1 21,9 100,0
R = resistente; MR = moderadamente resistente; MS = moderadamente suscept
vel; S =
suscept
vel.
colunas) e a distribuiao marginal do tipo de gro (totais de linhas), enquanto que a tabela
c
a
toda representa a distribuio conjunta das duas variveis.
ca
a
Como os totais marginais da tabela 2.15 so diferentes, torna-se dif fazer alguma
a
cil
interpretao. Para facilitar, podemos incluir as freqncias relativas, em porcentagem,
ca
ue
que podem ser calculadas em relaao aos totais de linhas, colunas ou em relaao ao total
c
c
geral. Os totais (linhas, colunas ou geral) em porcentagens so comparveis, pois reduz-se
a
a
as freqncias a um mesmo total.
ue
A tabela 2.16 apresenta as porcentagens calculadas em relaao aos totais de linhas. Sendo
c
assim, vamos estudar a distribuiao da resistncia ` ferrugem para cada um dos diferentes
c
e
a
tipos de gros (os pers so as linhas).
a
a
Interpretao: observa-se, para os h
ca
bridos selecionados, um indicativo de associao
ca
44
entre a resistncia ` ferrugem e o tipo de gro, pois, enquanto o tipo de gro semi-duro apree
a
a
a
senta a menor porcentagem de resistncia ` ferrugem (14,3%), o tipo de gro semi-dentado
e
a
a
apresenta a menor porcentagem de moderadamente resistentes (9,1%) e o tipo de gro dena
tado apresenta a menor porcentagem de h
bridos suscet
veis ` ferrugem (7,1%). Podemos
a
vericar esta associao de outra forma. Observamos na amostra selecionada que 31,2%
ca
dos h
bridos so resistentes (R) ` ferrugem. Ora, se no existe associao (dependncia)
a
a
a
ca
e
entre as variveis, esperar
a
amos esta mesma porcentagem (31,2%) para todos os 3 tipos
de gros. Observamos, na amostra de h
a
bridos, uma porcentagem de 35,7% para dentado,
36,4% para semi-dentado e 14,3% para semi-duro, este ultimo resultado bastante abaixo dos
31,2% esperados. Isto nos leva a acreditar que realmente existe associaao entre a resistncia
c
e
` ferrugem e o tipo de gro dos h
a
a
bridos de milho amostrados.
Exerc
cios resolvidos
1. Para os dados da tabela 2.8 podemos considerar que o hbito est associado com o
a
a
porte? justique.
Sim, pois vericamos que para o hbito de crescimento 3, 81,3% dos materiais apresentam
a
porte prostrado. Por outro lado, para hbito 4, 82,4% dos materiais apresentam porte
a
trepador. Procure entender esta associaao atravs do grco da gura 2.8
c
e
a
2. Os dados da tabela de contingncia 2.17 tem por objetivo analisar a segregaao
e
c
dos dados de uma prognie de uma espcie X segregando para dois fatores: precocidade e
e
e
virescncia (tipo de decincia de clorola). Sabe-se que a precocidade recessiva em relao
e
e
e
ca
` ciclo tardio e controlada, neste caso, por um par de genes. O tipo virescente tambm
a
e
e e
recessivo em relaao ao normal e controlado por um par de genes.
c
a) Fixe os totais de colunas em 100%. Resposta tabela 2.17.
b) Faa um grco para a tabela, vericando a distribuiao da precocidade segundo a
c
a
c
virescncia (perl coluna). Resposta gura 2.9.
e
c) Os dois pares de genes so herdados independentemente ou h evidncia de associao?
a
a
e
ca
justique com apresentao de valores. Existe uma associaao fraca entre as variveis, pois
ca
c
a
para virescncia normal observa-se que 77,11% apresentam precocidade tardia. Observa-se
e
quase a mesma porcentagem (75,83%) para virescente e tardio. Portanto, no houve uma
a
mudana razovel quando mudamos de n de virescncia, indicando associao fraca.
c
a
vel
e
ca
3. A tabela de contingncia 2.18 refere-se ao nmero de pssaros de uma particular
e
u
a
espcie, classicados de acordo com duas variveis qualitativas, que so: 1 ) local da oresta
e
a
a
e 2 ) estaao do ano. Os pssaros foram observados alimentando-se de acordo com as duas
c
a
variveis. Um pesquisador levantou a hiptese (no in do trabalho), de que os pssaros
a
o
cio
a
alimentam-se nestes 3 locais da oresta nas mesmas propores na primavera e no outono.
co
45
3470 77,11%
1030 22,89%
910 75,83%
290 24,17%
4380 76,84%
1320 23,16%
5700 100,00%
do ano
Arvores
Arbusto
Cho
a
Primavera
Outono
30 50,8%
13 21,3%
20 33,9%
22 36,1%
9 15,3%
26 42,6%
59 100,0%
61 100,0%
Total
43 35,8%
42 35,0%
35 29,2%
120 100,0%
46
60
50
50
40
40
30
30
20
20
10
porcentagens
60
10
rvores Arbustos
Cho
Primavera
rvores Arbustos
Cho
Outono
47
24
289
9
100
13
565
46
954
Total
313
109
578
1000
48
2 /n(min(l 1, c 1)),
Independncia de Variveis
e
a
Quando se constroi uma distribuio conjunta de freqncias, um dos principais objetivos,
ca
ue
procurar estabelecer a associaao existente entre as variveis, isto , desejamos conhecer o
e
c
a
e
grau de dependncia entre as variveis, pois conhecendo o grau de dependncia entre elas,
e
a
e
podemos prever o melhor resultado de uma varivel sabendo-se o resultado da outra. Por
a
exemplo, se desejamos saber o local da oresta onde os pssaros se alimentam, se nos tivermos
a
informao sobre a estao do ano, vamos ter condioes de estimar com maior preciso o
ca
ca
c
a
49
local onde os pssaros se alimentam, pois existe uma dependncia entre o local da oresta e
a
e
a estaao do ano.
c
A dependncia no no sentido de que uma determina a outra. Por exemplo, num estudo
e
a e
para vericar se existe associaao entre a satisfaao com o emprego e os salrios percebidos,
c
c
a
no signica que melhorando as condioes de trabalho (satisfaao), vai melhorar os salrios.
a
c
c
a
Em primeiro lugar, observamos que, independentemente da estao do ano, 35,8% dos
ca
pssaros se alimentam nas rvores, 35% nos arbustos e 29,2% no cho.
a
a
a
Ora, se existe independncia entre o local da oresta e a estaao do ano, esperamos estas
e
c
mesmas porcentagens para cada categoria da estaao do ano. Comparando-se as frequncias,
c
e
podemos interpretar que existe dependncia entre as variveis.
e
a
Quando existe dependncia entre as variveis interessante conhecer a magnitude dessa
e
a
e
associaao, ou seja, conhecer se a associaao fraca, moderada ou forte. Portanto, imporc
c e
e
tante termos uma medida de associao entre variveis categorizadas.
ca
a
u
e
a
Teoricamente este valor varia entre 0 (zero) e 1 (um), 0 C 1, sendo nulo quando as
variveis so independentes. Quando existe uma associaao perfeita entre as duas variveis,
a
a
c
a
o coeciente de contingncia de Pearson vale 1.
e
Para o clculo do coeciente necessrio, em primeiro lugar, calcularmos uma outra
a
e
a
estat
stica, chamada de Qui-Quadrado, e representada pela letra grega elevada a potncia
e
2
2. Ento, passamos de imediato ao clculo do , atravs do exemplo da tabela 2.18.
a
a
e
Na hiptese de independncia, esperamos para local da oresta rvores e estao primavo
e
a
ca
era, 590, 358 = 21, 122 pssaros; para local da oresta rvores e estao outono, esperamos
a
a
ca
61 0, 358 = 21, 838 pssaros, e assim para todas as caselas restantes da tabela. Um modo
a
prtico de se encontrar as freqncias esperadas sob a hiptese de independncia, dado por:
a
ue
o
e
e
f e11 =
59 43
n1. n.1
=
= 21, 141.
n..
120
A notaao f e11 indica a freqncia esperada para a estao primavera (linha 1) e local rvores
c
ue
ca
a
(coluna 1). Se o leitor no est lembrado desses
a
a
ndices, veja novamente a tabela 2.14.
Para a casela 21, isto , estao outono (linha 2) e local rvores (coluna 1), temos:
e
ca
a
f e21 =
61 43
n2. n.1
=
= 21, 858.
n..
120
50
do ano
Arvores Arbusto
Cho
a
Primavera
Outono
30 21,14
13 21,86
20 20,65
22 21,35
9 17,21
26 17,79
59
61
43
42
35
120
Total
do ano
a
Arvores Arbusto Cho
Primavera
Outono
8,86
-8,86
-0,65
0,65
-8,21
8,21
=
i=1
(oi ei )2
ei
(2.1)
2 =
= 15, 0501.
a
E fcil perceber que se 2 = 0, as duas variveis so independentes e que se 2 > 0 indica
a
a
51
associaao das variveis. O valor de Qui-Quadrado no possui um limite superior, pois varia
c
a
a
de 0 (zero) a + ( mais innito). Na seao 8.5.2 iremos fazer o teste de qui-quadrado, que
c
e
um teste conrmatrio, no sentido de poder armar se existe ou no associao signicativa
o
a
ca
(estatisticamente comprovada) entre as variveis.
a
Descritivamente, Karl Pearson props o chamado coeciente de contingncia, represeno
e
tado pela letra C, denido por:
2
C=
,
(2.2)
2 + n
onde n o nmero total de observaoes. Para o exemplo em estudo temos:
e
u
c
15, 0501
= 0, 3338,
15, 0501 + 120
C=
indicando que existe associaao, porm podemos dizer que a associao fraca.
c
e
ca e
Quando existe uma associaao perfeita, esse coeciente no atinge o valor 1, por isso, foi
c
a
sugerido uma correao, a qual consiste em calcular,
c
C =
C
(t 1)/t
(2.3)
onde t o m
e
nimo entre o nmero de colunas e o nmero de linhas da tabela de contingncia.
u
u
e
Para o exemplo, onde t = 2, temos:
0, 3338
C =
(2 1)/2
= 0, 4721.
Agora, temos uma associaao moderada entre as variveis. Devemos considerar as variveis
c
a
a
como moderadamente associadas.
Exerc
cio resolvido
1. Para os dados da tabela 2.9, obter o coeciente de contingncia de Pearson e interpree
tar.
O valor de qui-quadrado :
e
2 = 7, 3877 + 3, 4766 + 0, 1000 + 0, 0470 + 12, 1278 + 5, 7072 = 28, 8464.
O valor do coeciente de conngncia :
e
e
C=
28, 8464
= 0, 6049.
28, 8464 + 50
0, 6049
1/2
= 0, 8554.
52
2.1.3.7 Exerc
cios Propostos
1. Com os dados da tabela 2.10, calcule o coeciente de contigncia de Pearson e conclua.
e
2. Com os dados da tabela 2.8, calcule o coeciente de contigncia de Pearson e conclua.
e
3. Com os dados da tabela 2.12, calcule o coeciente de contingncia de Pearson e
e
interprete.
4. Calcule o coeciente de contingncia de Pearson e o de Cramr para os dados da
e
e
tabela 2.13. Faa a interpretaao.
c
c
2.1.3.8 Distribuies de Freqncias de Variveis Quantitativas: Diagrama de
co
ue
a
Pontos, Grco de Colunas e Histograma
a
Inicialmente faremos uma breve introduao sobre o estudo de distribuioes de frequncias
c
c
e
para variveis aleatrias quantitativas e, aps, discutiremos as tcnicas para este estudo.
a
o
o
e
Quando a varivel em estudo quantitativa, discreta ou cont
a
e
nua, as principais caracter
sticas a serem observadas numa distribuiao de frequncias so:
c
e
a
o
1. valor tpico ou representativo, que como o prprio nome indica, corresponde a escolha
de um unico valor para representar todo o conjunto de valores;
53
2
parcela (rea de 19,44 m ) varia no intervalo de 23 a 27 plantas (5 valores diferentes),
a
nmero de gros por vagem de soja. Nesse caso diz-se que no h perda de informaao
u
a
a a
c
e as distribuioes de frequncias so feitas de forma idntica `s variveis qualitativas
c
e
a
e
a
a
(categorizadas). Tambm pode-se fazer o diagrama de pontos; b) quando temos muitos
e
valores diferentes da varivel procedemos de forma idntica ao de varivel cont
a
e
a
nua,
isto , vamos criar faixas de ocorrncia. Por exemplo, ciclo da cultura de 150 gentipos
e
e
o
de feijo.
a
Passamos, agora, ao estudo da construao das distribuies de frequncias para variveis
c
co
e
a
aleatrias quantitativas. Os mtodos abordados so: Diagrama de Pontos, Dados Agrupados
o
e
a
em Classes e Ramo-e-Folhas.
Diagrama de Pontos
Quando temos poucas observaes de uma varivel em estudo (at aproximadamente 25),
co
a
e
a distribuiao pode ser representada por um diagrama de pontos, isto , cada observaao
c
e
c
corresponde a um ponto na reta dos nmeros reais. E poss representar duas ou mais disu
vel
tribuies no mesmo diagrama, para isso basta identicar cada distribuiao por um s
co
c
mbolo
diferente (criar uma legenda). A gura 2.11 ilustra esse diagrama com os pesos ao nascer de
24 bezerros machos das raas Charoleza e Gir, em kg. Os dados para as duas raas so:
c
c
a
Charoleza
Gir
47
40
45 37
43 44
41 46
46 48
54
47 34
51 54
25 40 45
55 56 57
48 40
55 54
Charoleza
Gir
20
25
30
35
40
45
50
55
60
55
Dieta 2
Dieta 1
550
570
590
610
630
650
670
690
710
730
750
770
790
810
830
Ganho de peso
Dieta 2
820
670
580
700
570
675
570
590
590
590
600
610
560
630
570
56
13
18
11 15
22 22
24 20
20 17
20 19
25
1
3
4
8
14
30
0,0333
0,1000
0,1333
0,2667
0,4667
1,0000
3,33
10,00
13,33
26,67
46,67
100,00
3,33
13,33
26,67
46,67
100,00
d) valores discrepantes;
e) formaao de subgrupos.
c
ue
a
2.23. Na primeira coluna da tabela temos os valores observados da varivel, quais sejam: 23,
a
24, 25, 26 e 27.
57
58
Figura 2.14: Grco de colunas do nmero de plantas sadias de mandioca, Chapec, SC,
a
u
o
1984
N de plantas colhidas sadias
28
3,33%
13,33%
10,00%
26,67%
46,67%
N de parcelas
27
26
25
24
23
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0
22
23
24
25
26
27
28
2
4
Freqncias
6
8
10
12
14
16
10 0
1 11
4 4 5
10 3 14
12 4
3 2
1 2
28 4
Faa uma representaao grca para os dados (grco de ordenadas ou de colunas). Faa a
c
c
a
a
c
interpretao do grco.
ca
a
59
Freqncia
ue
Freqncia
ue
Freqncia
ue
Freq. rel.
mdio
e
absoluta
acumulada
relativa
Porcentagem
acumulada
Porcentagem
acumulada
3973
4456
0,0313
0,0313
3,13
3,13
4456
4939
12
13
0,3750
0,4063
37,50
40,63
4939
5422
13
26
0,4063
0,8126
40,63
81,26
5422
5905
29
0,0937
0,9063
9,37
90,63
5905
6388
32
0,0937
1,0000
9,37
100,00
TOTAL
32
1,0000
100,00
denidas de acordo com resultados lgicos da varivel, por exemplo, denir 5 classes com
o
a
amplitudes de 500 kg. Outra forma decidirmos pelo nmero de classes a ser utilizado e,
e
u
a seguir, fazer a diviso da amplitude total dos dados pelo nmero de classes, sendo que,
a
u
o resultado encontrado ser a amplitude de cada classe. Por exemplo, amplitude total dos
a
dados da tabela 2.24
e
= 6388 3973 = 2415 kg/ha. Se desejamos ter 5 classes, isso
implica que a amplitude de cada classe ser igual a i = 2415/5 = 483 kg/ha. Veja a
a
primeira coluna da tabela 2.25. Nesta tabela temos a distribuio de freqncias completa
ca
ue
da varivel em estudo.
a
A freqncia absoluta ou simplesmente freqncia de classe (segunda coluna da tabela),
ue
ue
representada por ni , o nmero indicativo da quantidade de valores, indiv
e
u
duos, itens,
elementos, etc. pertencentes a essa classe. A freqncia absoluta acumulada de uma classe
ue
a soma da freqncia dessa classe com as freqncias das classes anteriores (coluna 3). A
e
ue
ue
freqncia relativa ou proporo, representada por fi , denida pelo quociente da freqncia
ue
ca
e
ue
absoluta da classe e o nmero total de observaes, ou seja, fi = ni /n, onde n = 32 (coluna 4).
u
co
Tambm temos a freqncia relativa acumulada, calculada da mesma forma que a freqncia
e
ue
ue
absoluta acumulada (coluna 5). A porcentagem (coluna 6) a forma que a maioria das
e
pessoas entendem, mais expl
e
cito, tem maior xito, e simplesmente a multiplicaao das
e
e
c
proporoes por 100, isto , 100fi . Da mesma forma podemos ter as freqncias percentuais
c
e
ue
acumuladas (coluna 7).
A representao grca dessas distribuies recebe um nome especial, histogramas, e
ca
a
co
e
mostrado na gura 2.15. E um grco de colunas justapostas em que a altura de cada coluna
a
representa a freqncia absoluta ou porcentagem de ocorrncias da classe. Este grco, como
ue
e
a
a maioria dos demais deste livro, foi feito no programa Statistica.
60
14
40,63%
Freqncia absoluta
13
12
11
37,5%
10
9
8
7
6
5
4
3
2
9,37%
9,37%
3,13%
1
0
<= 4456
(4456;4939]
(4939;5422]
(5422;5905]
> 5905
61
14
37,5%
40,63%
Freqncia absoluta
12
10
8
6
9,37%
4
2
0
9,37%
3,3%
4214,5
4697,5
5180,5
5663,5
6146,5
62
de brotos de
1,34 1,37
1,35 1,37
1,36 1,39
1,36 1,41
explantes de
1,43 1,47
1,43 1,47
1,44 1,49
1,46 1,50
abacaxi
1,52 1,68
1,57 1,73
1,61 1,77
1,62
39
1,0000
100,00
ser o suciente para nos dar uma boa idia do fenmeno, deve por em evidncia a
e
o
e
regularidade do fenmeno. Assim, vale a pena salientar, que a deciso sobre o nmero
o
a
u
de classes cabe ao pesquisador.
Exerc
cios resolvidos
1. Os dados da tabela 2.26 foram obtidos de um experimento desenvolvido para avaliar o
comportamento In Vitro de abacaxi (Ananas comosus) cv. Primavera e refere-se a varivel
a
altura dos brotos de explantes, em cm. (dados ordenados crescentemente).
a) Preencha a tabela de distribuio de freqncias 2.27.
ca
ue
b) Construa um histograma.
c) Faa algumas interpretaes relevantes.
c
co
d) Pode-se dizer que esta amostra oriunda de uma populao com distribuiao normal?
e
ca
c
Justique. Observao: leia mais adiante o tpico O modelo normal.
ca
o
As freqncias absolutas, relativas e percentagens para as 6 classes so dadas por: 4, 6,
ue
a
12, 10, 4, 3, 0,1026, 0,1538, 0,3077, 0,2564, 0,1026, 0,0769, 10,26, 15,38, 30,77, 25,64, 10,26
e 7,69, respectivamente. O histograma dado na gura 2.17. A distribuiao aproximadae
c e
mente simtrica. Um valor representativo do conjunto de dados 1,36. No observa-se valor
e
e
a
discrepante. Pode-se dizer que a varivel altura de explantes de abacaxi segue aproximadaa
mente uma distribuiao normal.
c
63
16
Nmero de explantes
14
Esperado sob
Modelo Normal
12
10
8
6
4
2
0
0,782
0,934
1,086
1,238
1,390
1,542
1,694
1,846
0,3458
0,3482
0,3487
0,3490
0,3547
0,3574
0,3648
0,3796
0,3815
0,3874
0,3924
0,3931
0,3971
0,4015
0,4125
0,4142
0,4182
0,4326
0,4358
0,4573
0,4582
0,4657
0,4670
0,4823
0,4862
0,4921
0,5010
0,5231
0,5521
0,5841
0,6284
0,6357
0,6489
0,6570
0,6704
0,6780
0,6842
0,6898
0,6945
0,6950
0,6970
0,7125
0,7126
0,7154
0,7179
0,7256
0,7321
0,7783
0,7884
0,7894
0,7912
0,8023
0,8046
0,8451
0,8467
0,8468
0,8564
0,8654
0,8665
0,9214
0,9421
0,9573
0,9689
64
10
Borda Mata
Mata Fechada
7
6
5
4
3
2
> ,927
(,885;,927]
(,843;,885]
(,801;,843]
(,759;,801]
(,717;,759]
(,676;,717]
(,634;,676]
(,55;,592]
(,592;,634]
(,508;,55]
(,466;,508]
(,424;,466]
(,34;,382]
(,382;,424]
(,298;,34]
<= ,256
1
(,256;,298]
Freqncias absolutas
25,60
25,90
25,90
27,75
28,30
29,05
Tabela 2.29:
29,95 32,20
31,25 32,20
31,70 33,75
41,75
42,80
43,95
44,05
45,20
46,74
mata fechada. A distribuiao mais simtrica na amostra da borda da mata, com os dados
c e
e
concentrando-se mais na parte central.
2.1.3.9 Exerc
cios Propostos
1. Os dados da tabela 2.29 referem-se a biometria total, em mm, do Macrobrachium
potiuna (Mller, 1880) da fam Palaemonidae. Obs. os dados encontram-se ordenados.
u
lia
a) Construa a tabela de distribuio de freqncias com 6 classes para os dados.
ca
ue
b) Construa o histograma.
c) Indique um valor representativo para os dados; comente sobre a assimetria; esta amostra
oriunda de uma populao com distribuio aproximadamente normal? justique.
e
ca
ca
2. Dispe-se de uma relaao de 36 produoes em kg/ha de milho do munic de Chapec
o
c
c
pio
o
e uma relaao de 36 produoes, tambm em kg/ha, do munic de Campos Novos. A tabela
c
c
e
pio
de distribuiao de freqncias dada em 2.30. Construa o pol
c
ue
e
gono de freqncias mltiplo.
ue
u
Com base no pol
gono de frequncia mltiplo, discuta e compare as duas distribuies
u e
u
co
quanto as principais caracter
sticas.
O Modelo Normal
65
4552
4904
5256
5608
5960
6312
6664
Total
1
3
5
8
8
6
5
6613
7095
7577
8059
8541
9023
9505
36
7095
7577
8059
8541
9023
9505
9987
1
2
4
13
7
7
2
36
Ramo-e-Folhas
Tanto os histogramas, como os demais tipos de grcos vistos anteriormente, do uma boa
a
a
idia da forma da distribuiao da varivel em estudo, isto , do comportamento dos dados.
e
c
a
e
Um outro modo de representao de um conjunto de valores, com o objetivo de se ter uma
ca
idia geral dos dados, o ramo-e-folhas. Uma vantagem do ramo-e-folhas sobre o histograma
e
e
que no primeiro no h perda de informao dos dados, pois trabalha-se com todos os dados
e
a a
ca
originais. E poss
vel, tambm, atravs do ramo-e-folhas obter-se algumas outras informaoes
e
e
c
mais gerais sobre os dados, o que ser mostrado atravs de um exemplo. O ramo-e-folhas
a
e
e
util quando o conjunto de dados no muito numeroso, pois, caso contrrio, a interpretaao
a e
a
c
66
Frequncias tericas
0,60
0,45
0,30
0,15
0,00
-3,50
-1,75
0,00
1,75
3,50
Valores padronizados
16
Freqncia absoluta
14
12
10
8
6
4
2
0
3068
3672
4275
4879
5483
6087
6690
67
3
4
5
6
973
500 550 552 614 660 680 685 760 769 770 778 849 960 975 980 993
056 063 110 117 166 172 202 230 403 513 823 889
047 166 388
Unidade 1,0
3|973 = 3973
973
500
056
513
047
550
063
823
166
552 614 660 680 685 760 769 770 778 849 960 975 980 993
110 117 166 172 202 230 403
889
388
Unidade 1,0
3o|973=3973
68
3
4*
4
4
4
4
5*
5
5
5
5
6*
6
6
973
823 889
047 166
388
Unidade 1,0
3 |973 = 3973 kg/ha
69
calos, em cm,
0,00 0,00
0,00 0,00
0,38 0,39
0,54 0,56
0,80 0,81
de Mandevilla velutina
0,00 0,00 0,00
0,00 0,00 0,20
0,42 0,42 0,42
0,57 0,60 0,61
0o
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
2 3 3 3 3 3
4 4 4 4 4 5 5 5 5
00|0 = 0,0
6 6 6 6 6
0q
8 8
unidade: 0,10
70
de peso
9,54
13,04
18,17
21,60
26,79
da carne, em gramas,
9,53 11,13 11,76
14,05 14,88 16,22
18,53 19,17 19,65
21,99 22,74 23,71
27,20 30,20 30,85
de mexilhes do manguezal
o
12,69 12,92
16,38 16,92
19,80 19,81
25,14 25,34
33,97 36,35
9o
49
54
1o
622 638 692 764 814 853 914 965 980 981
2o
90|49 = 9,49
3o
10|101=11,01
635
unidade: 0,01
53
71
39 39
45 46
40 41
46 47
41 41
47 49
42 44
49 51
dos tratamentos. Quais os valores para representar os dois tratamentos? Qual dos dois
tratamentos apresenta maior disperso? Comente sobre a assimetria das distribuies. Tm
a
co
e
valores discrepantes? Pode-se dizer que estas duas amostras so oriundas de duas populaoes
a
c
com distribuiao pelo menos aproximadamente normal? justique?
c
2. Faa um ramos-e-folhas da varivel durao do primeiro estdio ninfal de Triatoma
c
a
ca
a
klugi, em dias, alimentadas em galo, cujos valores so:
a
21 21
21 22
22 22
22
23 23
23 23
23 25
26
28 28
28 30
30 33
35
35 36
39 39
40 40
42
42 45
46 46
48 50
59
2.2
2.2.1
mediana dos resultados da varivel. E importante chamar a ateno desde j, que sempre
a
ca
a
72
que for apresentada uma medida de tendncia central necessrio apresentar tambm uma
e
e
a
e
medida de variabilidade, disperso, que sero tratadas na prxima seao.
a
a
o
c
O objetivo dessa seao apresentar as principais medidas de tendncia central, as quais
c e
e
so assim chamadas devido ao fato dos dados naturalmente tenderem a se concentrar em
a
torno desses valores centrais. As trs medidas de tendncia central mais utilizadas para
e
e
resumir um conjunto de dados so:
a
A mdia aritmtica
e
e
A mediana
A moda
Estas medidas aplicam-se para dados isolados, como tambm para dados organizados
e
numa distribuiao de freqncias em classes, sendo assim, ser mostrado o procedimento de
c
ue
a
clculo dessas medidas para os dois casos, quais sejam: 1) dados isolados e 2) agrupados em
a
classes.
A mdia aritmtica a idia que ocorre a grande maioria das pessoas quando se fala
e
e
e
e
em mdia; como ela possui certas propriedades importantes, ela a medida de posiao mais
e
e
c
utilizada. Contudo, ela pode nos levar a erros de interpretao, assim, a mediana pode
ca
ser a medida mais recomendada em muitas situaoes. Ainda nesta seo indicaremos estas
c
ca
situaes.
co
A mdia aritmtica (M e), a soma dos valores numricos de uma varivel dividida pelo
e
e
e
e
a
nmero deles. Por exemplo, considere os pesos ao nascer, em kg, de 10 bezerros da raa
u
c
Charoleza:
47 51
45 50 50
52 46
49 53
51
47 + 51 + 45 + 50 + 50 + 52 + 46 + 49 + 53 + 51
= 49, 4kg.
10
Genericamente, a M e, quando todos os valores so diferentes uns dos outros, dada por:
a
e
x1 + x2 + ... + xn
1
M e(X) =
=
n
n
xi
(2.4)
i=1
onde n o nmero de dados da amostra e X uma varivel em estudo, por exemplo, peso
e
u
e
a
ao nascer. A letra grega , leia-se sigma (maiscula), como pode ser visto na equao 2.4,
u
ca
representa um somatrio, isto , uma soma de valores.
o
e
73
M e(X) =
f i xi .
i=1
Exemplo. Para os dados dos pesos ao nascer de bezerros da raa Charoleza, com k = 8
c
valores diferentes, temos:
(1 45) + (1 46) + (1 47) + (1 49) + (2 50) + (2 51) + (1 52) + (1 53)
(1 + 1 + 1 + 1 + 2 + 2 + 1 + 1)
= (0, 10 45) + (0, 10 46) + (0, 10 47) + (0, 10 49) + (0, 20 50) +
M e(X) =
46 48 54
56 44
43 55
57
Encontre a mdia aritmtica da amostra dos pesos ao nascer de bezerros da raa Gir.
e
e
c
O diagrama de pontos para as duas raas dado na gura 2.26. Percebe-se que os dois
c e
conjuntos de dados so bastante diferentes, entretanto, apresentam a mesma mdia, ento,
a
e
a
74
Mdias
38
42
46
50
54
58
62
Charoleza
Gir
Pesos ao nascer
Figura 2.26: Diagrama de pontos para peso ao nascer das raas Charoleza e Gir
c
onde ni , fi e si so a freqncia absoluta, freqncia relativa e o ponto mdio da i-sima
a
ue
ue
e
e
classe, respectivamente, e k o nmero de classes do histograma.
e
u
Exemplo. Para a distribuio de freqncias da tabela 2.25, que diz respeito aos
ca
ue
rendimentos, em kg/ha, de h
bridos de milho, a mdia aritmtica tem como resultado,
e
e
M e(X) = 5105, 031kg. Vamos ao clculo.
a
M e(X) = 0, 0313(4214, 5) + 0, 3750(4697, 5) + 0, 4063(5180, 5) + 0, 0937(5663, 5) + 0, 0937(6146, 5)
= 5105, 031 kg
75
4
i=1 ni xi
4
i=1 ni
1328000
= 2656, 00 u.m.
500
Assim, existem desvios positivos, negativos e nulos. Para os dados de pesos ao nascer de
bezerros da raa Charoleza, temos:
c
d1 =45-49,4=-4,4 d2 =46-49,4=-3,4 d3 =47-49,4=-2,4 d4 =49-49,4=-0,4 d5 =50-49,4=0,6
d6 =50-49,4=0,6 d7 =51-49,4=1,6 d8 =51-49,4=1,6 d9 =52-49,4=2,6 d10 =53-49,4=3,6
A primeira propriedade que a soma dos desvios calculados em relao a mdia aritmtica
e
ca
e
e
do conjunto de dados nula:
e
n
di = 0.
(xi x) =
i=1
i=1
No exemplo: -4,4-3,4-2,4-0,4+0,6+0,6+1,6+1,6+2,6+3,6=0.
A segunda propriedade que a soma dos quadrados dos desvios em relao a mdia
e
ca
e
e
um m
nimo. Formalmente, temos:
n
n
2
d2 = m
nimo.
i
(xi x) =
i=1
i=1
76
Posio da Md:5,5
38
42
46
50
54
58
62
Pesos ao nascer
Figura 2.27: Diagrama de pontos para peso ao nascer da raa Charoleza - clculo da mediana
c
a
Veremos a utilizao dessas propriedades quando tratarmos do estudo de medidas de
ca
disperso.
a
Uma segunda medida de tendncia central a mediana. A mediana divide um conjunto
e
e
de dados ao meio, onde 50% dos valores se posicionam abaixo da mediana, e 50% dos valores
se posicionam acima da mediana, portanto, a mediana, uma medida baseada na ordenaao
e
c
dos dados (rank, em ingls).
e
Denio: a mediana de um conjunto de valores, o valor M d que ocupa a posio
ca
e
ca
(n + 1)/2, quando os dados esto ordenados crescentemente. Se (n + 1)/2 for fracionrio,
a
a
toma-se como mediana, a mdia dos dois valores de posioes mais prximas a (n + 1)/2.
e
c
o
Exemplo. Vamos calcular a mediana dos pesos ao nascer de bezerros, em kg, da raa
c
Charoleza. Atravs do diagrama de pontos da gura 2.27, podemos observar que a dise
tribuio de freqncias apresenta uma assimetria ` esquerda, nesse caso recomendvel o
ca
ue
a
e
a
uso da mediana em preferncia ` mdia. A posio da mediana dada por: i = (10 + 1)/2 =
e
a e
ca
e
5, 5. Na gura 2.27 est indicada esta posiao. Como a posiao um nmero fracionrio, a
a
c
c e
u
a
c
a
mediana ser a mdia aritmtica entre os valores que ocupam a 5a e a 6a posiao, ento,
a
e
e
M d = (50 + 50)/2 = 50 kg.
Uma medida estreitamente relacionada com a mediana so os quartis. Embora no
a
a
sejam medidas de tendncia central, sero aqui tratadas devido a semelhana com o clculo
e
a
c
a
da mediana. Os quartis dividem um conjunto de dados em 4 partes iguais, do seguinte
modo: aproximadamente 25% dos dados sero inferiores ao primeiro quartil (Q1 ), ou seja,
a
25% dos dados esto localizados em posiao inferior ao primeiro quartil; 50% dos dados
a
c
ocupam posiao inferior ao segundo quartil (M d), que a mediana, e aproximadamente 75%
c
e
dos dados ocupam posio inferior ao terceiro quartil (Q3 ), portanto, 25% dos valores esto
ca
a
localizados em posio superior ao terceiro quartil.
ca
Denio: dado um conjunto de dados ordenados, podemos obter, de forma aproximada,
ca
77
Q3
Q1
Md
38
42
46
50
54
58
62
Pesos ao nascer
Figura 2.28: Diagrama de pontos para peso ao nascer da raa Charoleza - 1 e 3 quartis
c
o primeiro quartil, (Q1 ), como sendo a mediana dos valores de posies menores ou iguais
co
` posiao da mediana. A mediana dos valores de posioes maiores ou iguais ` posiao da
a
c
c
a
c
mediana corresponde ao terceiro quartil, (Q3 ).
Exemplo. Vamos calcular o Q1 e o Q3 para os dados de pesos ao nascer, em kg, de
bezerros da raa Charoleza. A posiao do elemento primeiro quartil : i = (n + 1)/2 =
c
c
e
(5 + 1)/2 = 3, logo Q1 = 47Kg. O valor de n igual a 5 pois temos cinco valores em
e
posiao menor ou igual ` posiao da mediana. A posiao do elemento terceiro quartil :
c
a
c
c
e
i = (n + 1)/2 = (5 + 1)/2 = 3, logo Q3 = 51Kg. Na gura 2.28 esto indicados o 1 e o 3
a
quartil, juntamente com a mediana.
O clculo da mediana e dos quartis para um histograma sero feitos por meio de argua
a
mentos geomtricos, atravs da proporcionalidade existente entre rea e base de retngulos.
e
e
a
a
Geometricamente, a mediana o valor da abcissa que determina uma linha vertical que
e
divide o histograma em duas partes de reas iguais, ento, 50% da rea do histograma est
a
a
a
a
abaixo da mediana e 50% da rea est acima da mediana. Da mesma forma, o 1 quartil o
a
a
e
valor da abcissa que determina uma linha vertical que divide o histograma em duas partes
de reas diferentes, ou seja, 25% da rea est abaixo do 1 quartil e 75% da rea est acima
a
a
a
a
a
do 1 quartil. O terceiro quartil o valor da abcissa que determina uma linha vertical que
e
divide o histograma em duas partes de reas diferentes, ou seja, 75% da rea est abaixo do
a
a
a
3 quartil e 25% da rea est acima do 3 quartil.
a
a
Exemplo. Vamos encontrar os valores da mediana e dos quartis para a varivel rendia
mento de gros, em kg/ha, de h
a
bridos de milho. O histograma dado na gura 2.15. A
e
classe mediana aquela cuja porcentagem acumulada , de pelo menos, 50%, ento, no exeme
e
a
plo, a mediana um valor que encontra-se na terceira classe, cujos limites inferior e superior
e
so: 4939 e 5422, respectivamente. Agora, vamos usar a regra da proporcionalidade, que
a
e
78
dada por:
5422 4939
M d 4939
=
.
40, 6
9, 4
No lado esquerdo do sinal de igualdade, temos o limite superior (5422) subtra do limite
do
inferior (4939) da classe mediana, dividido pela porcentagem de observaoes desta classe
c
(40,6). No lado direito do sinal de igualdade, temos um outro retngulo cuja rea vale 9,4%,
a
a
obtida da seguinte forma: somando-se as reas das classes anteriores ` classe mediana, temos
a
a
3,13+37,50=40,63%, assim, 50,0-40,6=9,4%; a base deste novo retngulo M d 4939,
a
e
cujo valor M d estamos interessados em determinar.
Obtemos o valor da mediana fazendo-se:
M d = 11, 8276(9, 4) + 4939 = 5050, 828 kg.
O clculo dos quartis feito de maneira anloga ao clculo da mediana. A classe que
a
e
a
a
contm o 1 quartil aquela cuja porcentagem acumulada de pelo menos 25%, no exemplo,
e
e
e
a
o 1 quartil encontra-se na segunda classe, cujos limites inferior e superior so: 4456 e
4939, respectivamente; a porcentagem de observaoes nesta classe de 37,5%. Pela regra da
c
e
proporcionalidade encontramos:
4939 4456
Q1 4456
=
Q1 = 4738, 072 kg.
37, 5
21, 9
O valor 21,9 obtido fazendo-se 25,0-3,1.
e
A classe que contm o 3 quartil aquela cuja percentagem acumulada seja de pelo
e
e
menos 75%, no exemplo, a terceira classe, cujo limite inferior, superior e porcentagem de
e
observaoes valem: 4939, 5422 e 40,6, respectivamente. Aplicando a regra obtemos:
c
5422 4939
Q3 4939
=
Q3 = 5348, 241 kg.
40, 6
34, 4
Na gura 2.29 apresentamos o histograma da varivel rendimento de gros, em kg/ha,
a
a
acompanhado dos quartis.
Finalmente, temos a moda (Mo), denida com o valor que ocorre com maior freqncia
ue
num conjunto de dados. Pela prpria denio percebe-se que a moda pode no existir, pois
o
ca
a
pode no existir um valor mais freqnte que os demais, ou existindo, pode no ser a unica,
a
ue
a
79
14
40,63%
13
37,5%
12
Freqncia absoluta
11
10
9
8
7
6
5
4
9,37%
9,37%
3
2
3,13%
1
0
Q1=4738 Md=5051Q3=5348
Rendimento mdio (kg/ha)
Medidas de Disperso
a
80
Xi
5,4
5,4
5,8
6,4
6,4
6,6
6,6
6,8
6,8
7,0
7,3
7,3
7,5
8,2
8,8
8,8
6,94 6,94 6,94 6,94 6,94 6,94 6,94 6,94 6,94 6,94 6,94 6,94 6,94 6,94 6,94 6,94
x
( x i x ) -1,54 -1,54 -1,14 -0,54 -0,54 -0,34 -0,34 -0,14 -0,14 0,06 0,36 0,36 0,56 1,26 1,86 1,86
( x i x ) 2 2,37 2,37 1,30 0,29 0,29 0,12 0,12 0,02 0,02 0,00 0,13 0,13 0,31 1,59 3,46 3,46
Figura 2.30: Clculo da varincia do dimetro da roseta foliar de bromlias expostas ao sol
a
a
a
e
Desvio interquart
lico
Para os mtodos estat
e
sticos, as medidas de disperso so de fundamental importncia,
a a
a
pois a necessidade do uso da estat
stica devida a existncia de variabilidade nos dados
e
e
observados.
Para a varincia e o desvio padro, o princ bsico analisar os desvios das observaes
a
a
pio a
e
co
em relaao ` mdia. Em cada caso, o valor zero para a varincia ou desvio padro, indica
c a e
a
a
ausncia de variaao; a variao vai aumentando ` medida que aumenta o valor da medida
e
c
ca
a
de disperso.
a
A varincia uma medida de disperso que nos fornece uma idia da variabilidade dos
a
e
a
e
dados em torno da mdia. Ela o quociente entre a soma dos quadrados dos desvios dos
e
e
dados observados, tomados em relaao a sua mdia aritmtica e o nmero de dados (n)
c
e
e
u
2
5,8 6,4
7,3 7,3
6,4 6,6
7,5 8,2
6,6
8,8
6,8
8,8
n
i=1 (xi
x)2
.
n1
15, 98
= 1, 065 cm2 .
15
81
(2.6)
Foi tambm selecionada uma outra amostra de 16 valores de dimetros da roseta foliar
e
a
de bromlias em ambiente de sombra. Os resultados foram:
e
13,4
15,4
13,7
15,7
14,4 14,6
16,2 16,4
14,6
16,7
14,8 15,2
17,5 17,8
15,2
17,8
Para esses dados o valor da varincia s2 = 1, 893 cm2 . Obtenha esse valor. A concluso
a
e
a
que podemos tirar que, para a varivel dimetro, as bromlias em ambiente de sombra so
e
a
a
e
a
mais heterogneas (apresentam maior variabilidade) do que as expostas ao sol.
e
Para os dados de peso ao nascer de bezerros, obtemos s2 = 6, 92 kg 2 e s2 = 36, 48 kg 2 ,
CH
G
para as raas Charoleza e Gir, respectivamente. Portanto, a raa Gir muito mais hetc
c
e
erognea do que a raa Charoleza, para peso no nascimento.
e
c
A varincia apresenta um inconveniente de ordem prtica, pois como ela expressa
a
a
e
em unidades ao quadrado, isto causa problemas de interpretaao. Uma outra medida de
c
variabilidade, calculada atravs da varincia, o desvio padro da amostra (s). Na prtica o
e
a
e
a
a
desvio padro preferido em relao a varincia, pois ele expresso na mesma unidade dos
a e
ca
a
e
dados originais. O desvio padro nada mais do que a ra quadrada da varincia, logo:
a
e
z
a
s=
s2 .
(2.7)
k
i=1 (xi
x)2 ni
,
n1
(2.8)
82
N
i=1 (xi
)2
(2.9)
s
100.
x
(2.10)
E uma medida de disperso relativa porque estabelece uma relaao entre o desvio padro
a
c
a
e a mdia. Sendo uma medida independente da unidade da varivel util para se estudar
e
a
e
comparativamente duas ou mais distribuies.
co
Exemplo. Os dois conjuntos de dados abaixo referem-se ao comprimento do corpo e
peso de fmeas de Penaeus paulensis (Crustacea, Decapoda, Penaidae), respectivamente,
e
obtidos nas despescas dos viveiros do Centro de Cincias Agrrias da Universidade Federal
e
a
de Santa Catarina. O comprimento do corpo dado em mm, enquanto que o peso dado
e
e
em g.
27
30
0,14
0,18
26 26
30 33
0,16
0,23
25 25
33 33
0,14 0,12
0,28 0,28
0,12
0,32
25 25
35 35
23 23
35 36
0,12 0,11
0,31 0,33
0,09
0,36
0,07
0,33
A mdia e o desvio padro para cada uma das amostras so: xC = 29, 1667 mm, yP =
e
a
a
4,6305
29,1667
83
0,0984
0,2050
baixo
mdio
e
alto
muito alto
k
i=1 (si
x)2 ni
n1
(2.11)
k
i=1 (si
)2 ni
para dados populacionais
(2.12)
N
onde: k o nmero de classes; si o ponto mdio da i-sima classe; ni o nmero de dados
e
u
e
e
e
e
u
observados na i-sima classe e N o tamanho da populaao. A unica alteraao das frmulas
e
e
c
c
o
anteriores a substituiao dos valores originais, xi , pelos pontos mdios, si .
e
c
e
Exemplo. para a distribuio de frequncias da tabela 2.24, que diz respeito aos rendica
e
mentos, em kg/ha, de h
bridos de milho, o valor da varincia dado por:
a
e
2
1
{[(4214, 5 5105, 0)2 1] + [(4697, 5 5105, 0)2 12] + [(5180, 5 5105, 0)2 13]
32 1
+ [(5663, 5 5105, 0)2 3] + [(6146, 5 5105, 0)2 3]}
s2 =
s2 = 227409, 74 (kg/ha)2 .
O desvio padro vale:
a
s = s2 = 476, 87 kg/ha.
Da mesma forma que a mdia aritmtica, a varincia uma medida de disperso, que
e
e
a
e
a
representa bem a realidade, quando os dados apresentam pelo menos aproximadamente uma
84
Q3 Q1 .
Exemplo. Para os valores de rendimento de gros, em kg/ha, de h
a
bridos de milho, o
valor do desvio interquart
lico 5348,2-4738,1=610,1. Temos que 50% dos valores encontrame
se no intervalo de 4738,1 a 5348,2.
a
entre a mdia mais 1 desvio padro e a mdia menos 1 desvio padro. O responsvel pelos
e
a
e
a
a
dados (Agrnomo, Bilogo), deve avaliar se estes intervalos so amplos (pouco precisos), ou
o
o
a
no (precisos), para o fenmeno real em estudo.
a
o
Vimos a importncia de se identicar as observaoes discrepantes num conjunto de dados.
a
c
Numa distribuio aproximadamente normal, algum(ns) valor(es) maior(es) que x + 3s, ou,
ca
a
peso de fmeas de Penaeus paulensis encontramos x = 0, 2050 e s = 0, 0984. Temos que
e
x + 3s = 0, 2050 + 3(0, 0984) = 0, 5000 e x 3s = 0, 2050 3(0, 0984) = 0, 0902. Como na
amostra estudada no temos nem um valor acima de 0,50 conclu
a
mos, por este critrio, que
e
no existe valor discrepante.
a
85
68%
95,5%
-3,50
-1,75
0,00
1,75
3,50
-3,50
-1,75
0,00
1,75
3,50
99,7%
-3,50
-1,75
0,00
1,75
3,50
Figura 2.31: Distribuio dos dados, sob o modelo normal, de acordo com e .
ca
86
8 4 5
6 3
temos que pelo menos 75% das observaoes encontram-se no intervalo [0;8]. Vericando-se
c
os dados da amostra encontramos 100% das observaes nesse intervalo.
co
Exerc
cio resolvido
1. Utilizando os dados da tabela 2.33, calcule a mdia, a varincia, o desvio padro e o
e
a
a
coeciente de variaao para cada um dos tratamentos.
c
Sem rizbio
o
34,35
20,45
4,52
13,16%
20
i=1
x=
xi /20
s =
x)2 /(20 1)
s = s2
s
CV (%) = x .100
20
i=1 (xi
Com rizbio
o
43,3
19,91
4,46
10,30%
Suspeitos
x 2s
Discrepantes
x 3s
Sem rizbio
o
34, 35 4, 52
[29,83;38,87]
Com rizbio
o
43, 3 4, 46
[38,84;47,76]
87
Tabela 2.34: Distribuiao de frequncia da varivel altura de calos em cm, num per
c
e
a
odo de
30 dias in vitro da espcie Mandevilla velutina
e
Altura de calos Ponto mdio (si ) Frequncia absoluta (ni )
e
e
0,00
0,14
0,28
0,42
0,56
0,70
0,14
0,28
0,42
0,56
0,70
0,84
0,07
0,21
0,35
0,49
0,63
0,77
15
1
5
8
7
2
Total
38
encontramos:
Q1
Sem rizbio
o
Com rizbio
o
Md
Q3
31
40,5
34
44
37,5
46,5
2.2.2.1 Exerc
cios Propostos
1. A tabela de distribuio de frequncias 2.34 foi constru a partir dos dados da tabela
ca
e
da
2.31. Observe que a distribuio assimtrica. Calcular a mdia, varincia, desvio padro,
ca e
e
e
a
a
mediana e quartis da distribuio. Considere o conjunto 1 formado pela mdia e varincia,
ca
e
a
e o conjunto 2 formado pela mediana e quartis. Qual dos dois conjuntos voc recomendaria
e
para essa distribuiao?
c
88
78
80
80
82
86
88
89
90
91
92
93
95
96
97
97
99
42,88
36,22
28,86
22,56
22,92
27,94
41,45
42,59
15,25
33,29
25,34
25,67
17,64
33,97
11,13
9,49
16,92
12,91
14,05
14,88
19,17
21,60
20,01
19,81
16,22
t=
s
1
n1
1
n2
onde s =
(2.13)
Caso |t| < 2 as produes mdias so semelhantes, caso contrrio so diferentes. Qual a
co
e
a
a
a
e
sua concluso?
a
3. Na tabela 2.36 temos os resultados da varivel peso de carne, em gramas, de mexilhes
a
o
do Sambaqui e do Manguezal. a) calcule a mdia e a mediana para cada um dos locais. Onde
e
houve maior crescimento?
b) Calcule o Q1 e o Q3 para cada um dos locais. Explique o signicado destes nmeros.
u
c) Compare os dois locais quanto a homogeneidade (calcule uma medida de disperso e
a
conclua).
d) Calcule o coeciente de variao para cada local e interprete. A concluso a mesma do
ca
a e
item c? Qual das duas concluses a denitiva?.
o e
4. A tabela 2.37 apresenta uma amostra de valores de peso de mexilho do Sambaqui.
a
a) Construa o histograma. A distribuiao apresenta a forma do modelo normal? Justique.
c
89
3
6
5
7
4
4
2
2
1
1
8,57
17,14
14,29
20,00
11,43
11,43
5,71
5,71
2,86
2,86
b) Localize a classe que contm o percentil de ordem 90 (P90 ). Interprete este valor.
e
c) Acima de que peso encontram-se 85% dos mexilhes (Calcule o P15 )?
o
2.2.3
O objetivo do uso da mediana e dos quartis obter informaoes sobre a forma, o valor
e
c
representativo, a disperso e os valores discrepantes da distribuiao dos dados observados.
a
c
Atravs destas estat
e
sticas poss obter-se todas as informaes relevantes de uma dise
vel
co
tribuio.
ca
Sabemos que a mdia e o desvio padro so afetados, de forma exagerada, por valores
e
a a
extremos (valores altos ou baixos), portanto no so medidas indicadas para distribuies
a a
co
assimtricas, pois no representam bem a realidade dos fatos. Alm disso, somente com a
e
a
e
mdia e o desvio padro no temos idia da forma como os dados se distribuem. A sugesto
e
a a
e
a
fazer uso das seguintes medidas:
e
i) Mediana.
ii) Os valores extremos (inferior e superior) do conjunto de dados.
iii) O 1 e 3 quartis.
Obtemos, ento, o que se denomina na literatura por esquema dos cinco nmeros ou esquema
a
u
extremos-e-quartis.
90
1,4
6,3
1,9
6,5
2,8 3,1
6,7 6,7
3,5 3,5
6,8 6,9
3,6 3,9
8,1 8,6
4,3 4,5
10,4 12,7
4,6
16,3
4,8
16,8 16,9
Tabela 2.39: Clculo dos quartis e extremos para dados de crescimento do pseudobulbo de
a
Laelia purpurata
Md Q1 Q3 Ei Es Q1 1, 5(Q3 Q1 ) Q3 + 1, 5(Q3 Q1 )
Luz direta
2,7
2,1 4,8
1,6
9,5
-1,95
8,85
Luz indireta
6,3
3,6 8,1
1,4 16,9
-3,15
14,85
91
Valores discrepantes
99,3%
Valores discrepantes
Figura 2.32: Area (99,3%) entre os pontos limites na distribuiao normal. A rea no
c
a
a
achurada corresponde aos outliers
50% dos
dados
Q1 Mediana Q3
Ei
Es
92
18
Comprimento do pseudobulbo
16
14
12
10
8
6
4
2
0
Luz direta
Luz indireta
No Outlier Max
No Outlier Min
75%
25%
Mediana
Outliers
Condio
93
Ei
Q1
Md
Q3
Es
Ei
Q1
Md
Q3
Es
Figura 2.35: Em distribuies dispersas os valores dos quartis e extremos cam mais afastaco
dos da mediana
25% (Q1 ) a 75% (Q3 ) e representado gracamente por uma caixa. Os comprimentos
e
das caudas so dados pelas linhas cont
a
nuas que vo da caixa (retngulo) aos valores mais
a
a
afastados que no sejam outliers. Observe na tabela 2.39 que os extremos superiores cam
a
iguais a 8,8 e 12,7, para luz direta e indireta, respectivamente, ou seja, os extremos inferiores
e superiores so os menores e os maiores valores da distribuiao, desde que no sejam outliers.
a
c
a
Os outliers esto representados por pequenos c
a
rculos vazios e observa-se na gura 2.34 a
presena dos mesmos em ambos os ambientes. No se observa valores discrepantes para os
c
a
valores inferiores das distribuioes.
c
Nas guras 2.35 e 2.36 temos o comportamento dos quartis e mediana quanto a disperso
a
e a assimetria. As posioes relativas dos Q1 , Q3 e M d do uma idia da assimetria da
c
a
e
distribuio. No nosso exemplo, a distribuio com luz direta mais assimtrica do que com
ca
ca
e
e
luz indireta. Observe na gura 2.37 como ca o desenho esquemtico para uma distribuio
a
ca
normal. Podemos ver claramente que a amostra para luz direta no originria de uma
a e
a
populaao com distribuiao normal; mesma concluso para luz indireta.
c
c
a
Exerc
cios resolvidos
1. Construir o desenho esquemtico para a varivel rendimento de gros em kg/ha da
a
a
a
tabela 2.1. Os valores da mediana e dos quartis foram calculados considerando os dados
individualmente, isto , no so agrupados em classes e aparecem na legenda da gura
e a a
2.38. Encontre estes valores. Este desenho esquemtico foi feito no programa Statistica.
a
Obtenha informaoes relevantes sobre a varivel em estudo. Voc saberia fazer esta gura
c
a
e
na mo? O rendimento mdio 4986,5 kg/ha. O desvio interquart
a
e
e
lico vale 493,5 kg/ha.
94
E1
Q1
Md
Q3
E1
Es
Q1
Md
Q3
Es
Ei
Q1
Md
Q3
Es
95
Box Plot
6600
6200
5800
5400
5000
4600
Non-Outlier Max = 58
Non-Outlier Min = 45
4200
75% = 5216
25% = 4722,5
Median = 4986,5
3800
Outliers
RENDIMENTO
Total de hemcitos
6
5
4
3
2
1
Cultivo
Mangue
Non-Outlier Max
Non-Outlier Min
75%
25%
Mediana
Outliers
Extremos
Local
Figura 2.39: Desenho esquemtico para nmero total de hemcitos em dois locais.
a
u
o
So observados 4 valores discrepantes, um h
a
brido com produao aqum dos demais e, 3
c
e
h
bridos com produes acima dos demais. A distribuio assimtrica ` direita, portanto,
co
ca e
e
a
no segue uma distribuiao normal.
a
c
2. Na gura 2.39 representa-se duas distribuioes de freqncias, uma para local Cultivo e
c
ue
outra para Mangue. Os resultados referem-se a varivel nmero total de hemcitos no bivalve
a
u
o
Crossostrea rhizophorae coletados em ambiente de cultivo e mangue. Descreva e compare as
principais informaoes (valor t
c
pico, simetria, disperso, outliers) das duas distribuioes.
a
c
O nmero total mediano de hemcitos nos dois locais praticamente o mesmo e, em
u
o
e
torno de 2, 5.103 /mm3 . As duas distribuioes so assimtricas. No mangue, a distribuio
c
a
e
ca
apresenta valores discrepantes.
96
88 89
93 95
99
90 91
96 97
92
97
Area umida
Area seca
13,8
14,3
14,5
15,0
15,0
15,5
15,5
15,5
15,6
15,6
15,8
15,8
15,8
15,8
16,0
16,0
16,0
16,1
16,1
16,3
16,3
16,3
16,3
16,5
16,5
16,6
16,6
16,6
16,8
16,8
16,9
17,0
17,0
17,2
17,4
7,3
7,6
7,8
7,8
8,0
8,2
8,2
8,3
8,3
8,4
8,4
8,4
8,6
8,6
8,6
8,6
9,0
9,0
9,0
9,0
9,3
9,3
9,3
9,6
9,6
9,8
9,8
10,4
10,4
10,9
10,9
11,7
11,7
12,0
2.2.4.1 Exerc
cios Propostos
1. Para se estudar o comportamento de duas variedades de cana-de-aucar, realizou-se
c
um experimento onde foram obtidos os resultados indicados na tabela 2.40.
a) Calcular a M d, Q1 , Q3 , Q3 Q1 , Q1 1, 5(Q3 Q1 ) e Q3 + 1, 5(Q3 Q1 ) para cada uma
das variedades.
b) Faa o desenho esquemtico mltiplo para os dados das variedades 1 e 2.
c
a
u
c) Compare os dois conjuntos de dados atravs do desenho do item b).
e
2. Para se estudar o comportamento de uma planta t
pica de dunas, a Hydrocotille sp,
quanto ao seu desenvolvimento, mediu-se o tamanho do pec (cm), em duas reas: seca e
olo
a
umida. Selecionou-se de cada uma dessas reas, amostras aleatrias de plantas e mediu-se o
a
o
tamanho dos pec
olos. Os dados so dados na tabela 2.41.
a
a) Calcular a M d, Q1 , Q3 , Q3 Q1 , Q1 1, 5(Q3 Q1 ) e Q3 + 1, 5(Q3 Q1 ) para cada uma
das variedades.
b) Faa o desenho esquemtico mltiplo para os dados das reas seca e umida.
c
a
u
a
97
10 60 110
160
220 280
340 400
460
520
Radiao
ca
18 55 190
300
410 460
570 770
815
965
Coeciente de Correlao
ca
Diagrama de Disperso
a
Um primeiro passo para vericar se existe correlao entre duas variveis quantitativas
ca
a
e
construir um grco de disperso, que nada mais do que a representaao grca dos pares
a
a
e
c
a
de valores num sistema cartesiano. No eixo das abcissas colocamos a varivel X e no eixo
a
das ordenadas a varivel Y.
a
Exemplo. Considere os dados referentes ` produo de matria seca de uma planta (Y)
a
ca
e
e a quantidade de radiaao fotossinttica ativa (X). Os dados obtidos experimentalmente so
c
e
a
apresentados na tabela 2.42.
O diagrama de disperso mostrado na gura 2.40. Atravs da pura observaao da
a e
e
c
distribuio dos pontos, conclu
ca
mos que existe uma dependncia entre as variveis produao
e
a
c
(Y) e radiao (X), porque no conjunto das observaes, a medida que aumenta a radiaao
ca
co
c
fotossinttica, tambm aumenta a produao de matria seca. Em termos prticos, isso
e
e
c
e
a
98
600
Produo (g/m
2)
500
400
300
200
100
0
200
400
600
800
1000
2)
Radiao (%)
0,48
0,44
0,40
0,36
0,32
0,28
0,1
0,3
0,5
0,7
0,9
1,1
1,3
Espaamento (m)
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
Espaamento
c
0,53
0,51 0,48
0,45
0,44 0,41
0,40
0,39 0,36
0,30
99
Tabela 2.43: Valores de salinidade (g/l) e temperatura para a regio III da Lagoa da Cona
ceio
ca
Estao Temperatura (Y) Salinidade (X)
ca
23
23A
24
25
26
27
27A
28
24,0
23,0
23,0
26,0
25,5
25,0
24,3
23,0
3,85
9,61
2,26
2,06
2,89
9,61
10,58
11,40
26,5
26,0
Temperatura
25,5
25,0
24,5
24,0
23,5
23,0
22,5
11
13
Salinidade
O Coeciente de Correlao
ca
O coeciente de correlaao, representado pela letra r, utilizado para quanticar a
c
e
100
Y
r>0
101
Y
r<0
da tabela, indica-se os produtos das variveis padronizadas; a soma dos mesmos, cujo valor
a
igual a 9,953 que, como espervamos, positiva. Para completar o clculo do coeciente
e
a
e
a
de correlaao basta dividir 9,953 pelo nmero de pares de valores (mdia), cujo valor igual
c
u
e
e
102
Y
r=0
9, 953
= 0, 9953.
10
Portanto, para esse exemplo, o grau de associaao linear est quanticada em 0,9953. Indic
a
cando uma relaao linear muito forte positiva entre as duas variveis.
c
a
Uma frmula prtica para o clculo do coeciente de correlao dada por:
o
a
a
ca e
Correlao(X,Y) =
ca
Corr(X, Y ) =
n(
n(
xy) (
x2 ) (
x)2
x
n(
y)
y2) (
y)2
(2.14)
10(1669880) (4553)(2560)
10(3022399)
45532
10(925800)
25602
5043120
= 0, 9953.
5067155, 33
2.2.5.1 Exerc
cios propostos
1. A tabela 2.46 apresenta os valores de condutividade (mho) e salinidade (g/l) para a
regio III da Lagoa da Conceiao.
a
c
a) Construir o grco de disperso. Conclua sobre a dependncia entre as variveis X e Y.
a
a
e
a
b) Quantique a dependncia entre X e Y atravs do coeciente de correlaao. Existe uma
e
e
c
dependncia forte, mdia ou fraca?
e
e
103
1
2
3
4
5
6
7
8
9
10
18
55
190
300
410
460
570
770
815
965
10
60
110
160
220
280
340
400
460
520
-437,3
-400,3
-265,3
-155,3
-45,3
4,7
114,7
314,7
359,7
509,7
-246,0
-196,0
-146,0
-96,0
-36,0
24,0
84,0
144,0
204,0
264,0
-1,419
-1,299
-0,861
-0,504
-0,147
0,015
0,372
1,021
1,167
1,654
-1,496
-1,192
-0,888
-0,584
-0,219
0,146
0,511
0,876
1,240
1,605
2,123
1,548
0,764
0,294
0,032
0,002
0,190
0,894
1,448
2,656
18
55
190
300
410
460
570
770
815
965
10
60
110
160
220
280
340
400
460
520
324
3025
36100
90000
168100
211600
324900
592900
664225
931225
100
3600
12100
25600
48400
78400
115600
160000
211600
270400
180
3300
20900
48000
90200
128800
193800
308000
374900
501800
Totais
4553
2560
3022399
925800
1669880
104
Tabela 2.46: Valores de condutividade (mho) e salinidade (g/l) para a regio III da Lagoa
a
da Conceiao
c
Estao Condutividade (Y) Salinidade (X)
ca
23
24
25
26
27
28
19,92
11,78
14,11
16,10
36,52
51,46
9
14
22
29
36
43
3,85
2,26
2,06
2,89
9,61
11,40
aroma de caf torrado e mo
e
do
Resultado mdio da equipe de
e
provadores para cada amostra
y1 y2
y3
4,8
4,0
3,7
3,2
3,7
2,5
4,7
4,7
3,7
3,5
3,0
2,8
4,7
4,8
3,5
3,2
3,3
2,7
105
entre duas variveis, por exemplo, r = 0, 90; o ajuste de um modelo linear simples tem como
a
resultado uma equao matemtica que descreve esse relacionamento. A partir do momento
ca
a
que temos um modelo ajustado, o conjunto de dados passa a ser representado atravs deste.
e
Vamos procurar estabelecer uma equao matemtica linear, isto , ajustar a equaao de
ca
a
e
c
uma reta para descrever o relacionamento entre duas variveis. Olhando-se para a gura
a
2.40, observa-se que existe uma relaao linear positiva entre as variveis produao (Y ) e
c
a
c
radiao (X), portanto, podemos ajustar a equaao de uma reta aos dados. As variveis Y
ca
c
a
e X so tambm denominadas de variveis dependentes e independentes, respectivamente.
a
e
a
Utilizaao:
c
1. Temos duas variveis que medem aproximadamente a mesma coisa, mas uma delas
a
e
relativamente dispendiosa, ou dif de lidar, enquanto que a outra no. Por exemcil
a
plo, a resistncia e a dureza de um material podem estar relacionadas, de modo que
e
conhecendo-se a dureza podemos estimar a resistncia. Se o teste de resistncia destroi
e
e
o material, enquanto que o teste de dureza no o destroi, uma pessoa interessada em
a
estimar a resistncia, obviamente preferir conar nos resultados do teste de dureza
e
a
para estimar a resistncia. A nalidade de uma equao de regresso seria ento estie
ca
a
a
mar valores de uma varivel, com base em valores conhecidos da outra. Esse estudo
a
tambm conhecido como calibrao da equao de regresso.
e e
ca
ca
a
ca
co
a e
a
2. Outra aplicao das equaes de regresso explicar valores de uma varivel em termos
da outra. Isto , podemos suspeitar de uma relaao de causa e efeito entre duas
e
c
variveis. Por exemplo, quantidade de fertilizante e produao de trigo.
a
c
a
c
3. Predizer valores futuros de uma varivel. Por exemplo, predizer produoes futuras.
A Equao da Reta
ca
Uma reta dada pela equao matemtica:
e
ca
a
yi = + xi
onde o parmetro representa o ponto onde a reta corta o eixo dos y e o parmetro o
a
a
e
coeciente angular, ou ainda, o quanto varia a mdia de y para o aumento de uma unidade
e
da varivel x. Esses parmetros esto representados na gura 2.46. Por exemplo, a reta
a
a
a
estimada por,
yi = 5 + 3xi
106
yi = + xi
x=1
y
x
x+1
y = 5 + 3xi
2,0
3,0
5,0
11
14
20
e a denominaremos de reta estimada pelos dados. Um critrio conhecido como mtodo dos
e
e
m
nimos quadrados, fornece as seguintes expresses para as estimativas dos parmetros da
o
a
equao:
ca
b =
n(
xy) ( x)( y)
n( x2 ) ( x)2
107
clculos intermedirios
a
a
xy
x2
10
60
110
160
220
280
340
400
460
520
180
3300
20900
48000
90200
128800
193800
308000
374900
501800
324
3025
36100
90000
168100
211600
324900
592900
664225
931225
2560
1669880
3022399
18
55
190
300
410
460
570
770
815
965
4553
yb x
n
onde n o nmero de pares (x, y) observados (tamanho da amostra).
e
u
Exemplo. Ilustraremos a obtenao da equaao da reta com as observaoes de produao
c
c
c
c
(Y ) e radiaao (X) (descritos anteriormente). A tabela 2.48 apresenta os dados originais e
c
os clculos intermedirios para se encontrar as estimativas dos parmetros. Encontramos:
a
a
a
a =
10(1669880) (4553)(2560)
= 0, 5312;
10(3022399) (4553)2
2560 0, 5312(4553)
a =
= 14, 1537.
10
A equaao da reta estimada com base nos dados da amostra ca:
c
b =
Os valores observados, juntamente com a equaao estimada da reta esto na gura 2.47.
c
a
Como era esperado, observa-se um bom ajuste da equaao da reta aos dados observados.
c
A distncia de cada um dos valores observados at a equao da reta chamada de desvio
a
e
ca
e
ou res
duo e so representados por ei . O clculo dos desvios dado por:
a
a
e
e i = yi yi .
108
y=14,154+0,531*x+eps
650
550
produo
450
350
250
150
50
-50
-100
100
300
500
700
900
1100
radiao
Desvios ou res
duos
23,71
43,37
115,08
173,51
231,94
258,50
319,93
423,16
447,07
526,74
-13,71
16,63
-5,08
-13,51
-11,94
21,50
23,07
-23,16
12,93
-6,74
109
30
20
Residuos
10
0
-10
-20
-30
-50
50
150
250
350
450
550
650
Valores estimados
c
polinmio de 2 grau seria o indicado. Assim, podemos querer estimar (avaliar) a produao
o
para um valor de radiao igual a 100. Este valor obtido fazendo-se:
ca
e
yi = 14, 154 + 0, 531 100 = 67, 254.
2.2.6.1 Exerc
cios propostos
1. a) Obtenha a equaao da reta para os dados da tabela 2.46, isto , para condutividade
c
e
(Y ) e salinidade (X).
b) De acordo com esta funao, quais seriam os valores estimados () para os valores de x da
c
y
tabela 2.46.
c) O que voc acha da discrepncia entre os valores observados e estimados (y y )?
e
a
110
220
180
140
100
60
20
-20
10
111
18 10,0
46 3,3
100 1,0
150 0,33
182 0,1
0,056
0,022
0,01
0,0067
0,0055
3.1
Introduo
ca
O importante estudo de probabilidade anterior aos anos de 1500, sculo XVI. Nessa
e
e
poca , as aplicaoes eram dirigidas aos jogos de azar. Pessoas se utilizavam do conhecimento
e
c
da teoria das probabilidades para planejar estratgias de apostas. Conta-se que um senhor
e
conhecido como Cavaleiro de Mer, amigo do francs Pascal (1610), e grande apreciador
e
e
de jogos, solicitava ao mesmo, que calculasse suas chances de ganho.
No entanto, somente no sculo XX, que o clculo de probabilidade teve um desenvolvie
e
a
mento bastante grande, e baseado numa teoria matemtica atravs de axiomas (condioes)
a
e
c
rigorosos, denioes e teoremas.
c
A probabilidade um ramo da matemtica cuja grande aplicaao na estat
e
a
c e
stica, como
veremos a seguir. At o presente momento do nosso curso de estat
e
stica, estudamos, de
forma emp
rica, isto , sem uma justicativa cient
e
ca (s descrevendo e no explicando), o
o
a
comportamento dos fenmenos, eventos da natureza, atravs da construo das distribuies
o
e
ca
co
de frequncias. Aqui, temos especial interesse em experincias aleatrias, casuais, ou seja,
e
e
o
devemos realizar o experimento para saber qual ser o resultado. Por exemplo, no poss
a
a e
vel
saber qual ser a produo por hectare de uma linhagem X de feijo, se este no for plana
ca
a
a
tado, colhido e mensurado. Outros exemplos de experimentos aleatrios: 1) germinaao de
o
c
sementes; 2) sobrevivncia de enxertos; 3) nmero de microncleos/3000 clulas; 4) nmero
e
u
u
e
u
de plantas numa determinada rea.
a
112
M H
2
5
Freqncia terica
ue
o
Total
3
5
Total
Freqncias
ue
1
6
1
6
1
6
1
6
1
6
1
6
113
A primeira grande aplicaao de probabilidade nas biocincias, foi com as leis da heredc
e
2
itariedade (Mendel, 1822-1884) . Outras aplicaes podem ser: chance de sobrevivncia
co
e
(germina ou no germina), distribuiao e interao de espcies animais ou vegetais, risco de
a
c
ca
e
doenas, ocorrncia de mutaoes, previso de safras, na previso de chuvas, geadas, granizos,
c
e
c
a
a
etc.
Uma aplicao, particularmente importante para o nosso curso, quando um pesquisador
ca
e
conduz um experimento. Quando um experimento instalado, desejamos comparar os efeitos
e
dos tratamentos (variaoes de um fator a ser estudado). Para se estimar os efeitos dos
c
tratamentos e tambm para executar os testes estat
e
sticos necessrio o uso de repetioes
e
a
c
(aplicao do mesmo tratamento em diversas unidades experimentais e que formar a amostra
ca
a
de estudo), atravs das quais vamos ter a possibilidade de calcular a variabilidade dos dados,
e
ou seja, a varincia. O pesquisador esfora-se ao mximo para manter todas as condioes
a
c
a
c
experimentais o mais constantes poss
veis, s deixando variar os tratamentos. Por exemplo,
o
num experimento agr
cola de campo, vamos aplicar um inseticida, herbicida ou fungicida
de forma homognea em todo o experimento; a fertilidade do solo deve ser igual para todos
e
os tratamentos. A temperatura, a umidade, a luminosidade, devem ser mantidas constante
dentro de um laboratrio. A temperatura deve ser constante em todos os pontos dentro de
o
uma estufa . E assim por diante. Pois bem, por maior que seja esse esforo para manter toc
das as condies experimentais o mais constantes poss
co
veis, os valores obtidos nas repetioes
c
dos tratamentos dicilmente resultam em valores iguais, quase com certeza absoluta que
e
todos os valores vo diferir uns dos outros. Pode-se concluir que sempre vo existir variaoes.
a
a
c
Logo, um pequisador no pode armar com 100% de certeza que o tratamento A melhor
a
e
que o B, e assim por diante. Portanto, todas as concluses tomadas, ou as inferncias reo
e
alizadas, so feitas com certo grau de incerteza; essa incerteza ns expressamos em termos
a
o
de probabilidade. Ento, quando um pesquisador diz que o tratamento A melhor que o B,
a
e
ao n de signicncia de 5%, ele admite que pode estar tomando uma deciso errnea e
vel
a
a
o
que a probabilidade de erro de no mximo igual a 5%. Estes experimentos cujos resultae
a
dos podem no ser os mesmos, de repetio para repetiao, so chamados de experimentos
a
ca
c
a
aleatrios, probabilsticos ou estocsticos.
o
a
Todas as inferncias realizadas tem certo grau de incerteza expressadas por
e
probabilidades.
2
114
7
T3
24
2
20
8
T1
42
3
T5
T5
T1
T6
T2
T6
T6
T3
14
T5
T3
T1
T1
23
35
T6
20
30
T5
19
T2
14
34
9
29
15
24
23
T5
T1
T4
T4
24
33
25
28
21
23
11
18
T1
T6
T2
T3
18
32
26
27
9
22
14
7
18
12
T3
T4
31
T5
19
26
11
21
13
16
14
11
21
6
T6
T2
25
T2
26
20
13
15
20
10
35
5
19
T3
12
14
22
9
10
4
13
T4
T4
15
36
T4
20
T2
21
Figura 3.1: No canto superior esquerdo est indicado a unidade experimental; no centro `
a
a
direita o tratamento e, no canto inferior esquerdo, est indicado o nmero de brotos por
a
u
explante
A seguir apresentamos um exemplo de um experimento no delineamento inteiramente
casualizado.
Avaliao do Comportamento In Vitro de abacaxi Ananas comosus cv.
ca
Primavera
Objetivo: determinao de um meio de cultura onde produza um maior nmero de mudas
ca
u
por explante (meristema) inoculado.
Tratamentos:
Meio de cultura 1 (T1)
Meio de cultura 2 (T2)
Meio de cultura 3 (T3)
Meio de cultura 4 (T4)
Meio de cultura 5 (T5)
Meio de cultura 6 (T6)
Unidade experimental: Um tubo de ensaio.
Variveis observadas: 1) nmero de brotos por explante inoculado; 2) tamanho dos brotos
a
u
em cm; 3) nmero de folhas por broto, etc.
u
Delineamento Experimental: delineamento inteiramente casualizado com 20 repeties.
co
Obs: na gura 3.1 apresentamos esse delineamento utilizando somente os resultados de 6
repetioes. Condies experimentais controladas ao mximo: Temperatura de 24 C 1 C ;
c
co
a
fotoper
odo de 16hs luz; intensidade luminosa de 4000 lux, meristemas uniformes (tamanho).
115
3.2
Conceitos Fundamentais
116
AA
AA
gentipos
Aa
Aa
AA
Aa
zigotos
1/2
1/2
117
Poder
amos tambm estar interessados no evento heterozigoto, ento, temos:
e
a
B = {Aa}.
Portanto, eventos so subconjuntos do espao amostral, , ou seja, um conjunto de
a
c
e
resultados de um experimento. Se um evento coincide com o espao amostral, , ele se
c
chama evento certo e temos,
A =
A = {AA, Aa}
A evento dos fentipos com dominncia.
o
a
Observaao: o alelo A dominante sobre a, portanto, Aa tem o mesmo fentipo que AA.
c
e
o
Se um evento no possui nenhum elemento do espao amostral, temos o evento imposs
a
c
vel,
A = (phi).
Exemplo: D={homozigoto recessivo}={aa}.
Quando o evento constitu de apenas um elemento temos o evento simples. Como
e
do
exemplos temos os eventos A e B.
Do exemplo acima, podemos fazer uma generalizaao. Todo o fenmeno ou experimento
c
o
no qual est envolvido um elemento casual, aleatrio, ou de incerteza, ter seu modelo
a
o
a
de probabilidades.
Um modelo probabil
stico ca denido, especicado, constru no momento em que esdo,
tabelecemos o espao amostral () e as probabilidades dos pontos amostrais; para o exemplo,
c
temos o seguinte modelo probabil
stico:
Cruzamentos
AA
Frequncias tericas
e
o
Aa
1/2 1/2
Total
1
Esse espao amostral discreto, pois podemos enumerar todos os resultados do experimento.
c
e
Essa enumerao pode ser nita ou innita.
ca
Exemplo de modelo. Cruzamos o gentipo Aa (pai) e Aa (me). Os resultados dos
o
a
cruzamentos esto indicados na gura 3.3.
a
Observaoes:
c
1. As quatro recombinaoes AA, Aa, aA e aa so igualmente provveis.
c
a
a
118
Pai
Aa
Aa
espermatozide
zigoto
Me
AA
Aa
vulos
aa
aA
AA
Frequncia terica
e
o
1
4
Aa
1
4
1
4
aa Total
1
2
1
4
Sp
sp
Sp
sp
Sp Sp
sp Sp
Sp sp
sp sp
Observaoes:
c
c
a
a
1. As quatro recombinaoes so igualmente provveis.
119
Sp Sp
sp Sp
sp sp
Total
Frequncia terica
e
o
1
4
2
4
1
4
Observao: Um espao amostral pode ser denido de diferentes maneiras para um mesmo
ca
c
experimento, dependendo dos objetivos do problema a ser estudado. Por exemplo, suponha
que lancemos uma moeda cinco vezes. Se estamos interessados apenas na sequncia de caras
e
e coroas obtida, um espao amostral :
c
e
1 = {ckkkk, kckkk, kkckk, kkkck, ...}.
Observao: so poss
ca
a
veis 25 =32 pontos amostrais. Mas se estamos interessados no
nmero de caras obtidas, ento, um espao amostral :
u
a
c
e
2 = {0, 1, 2, 3, 4, 5}.
Temos, aqui, outro exemplo de espao amostral discreto.
c
Exemplo: Considere um experimento que consiste em medir as alturas H de homens
adultos. Um espao amostral conveniente :
c
e
= {H : H > 0},
isto , o conjunto de todos os nmeros reais positivos. Se A indica o evento a altura de
e
u
homens adultos superior a 150 cm e inferior a 200 cm, ento A={H:150<H<200}. Esses
e
a
so exemplos de espaos amostrais cont
a
c
nuos, pois o intervalo contm um nmero innito de
e
u
valores.
Outro exemplo: Considere um experimento que consiste em medir as alturas h de
plantas de milho. Um espao amostral conveniente ={h:h>0}, isto , o conjunto de
c
e
e
todos os nmeros reais positivos.
u
3.3
120
o
pontos 5 e 6 ocorrem em B.
Uma outra operao entre eventos a interseco, representada pelo s
ca
e
ca
mbolo . Ento,
a
(AB) a ocorrncia dos eventos A e B, simultaneamente, ou seja, formado pelos pontos
e
e
e
amostrais que pertencem ao eventos A e B. Em aritmtica, assemelha-se com o produto
e
(AB). A representaao grca da interseco dada na gura 3.5.
c
a
ca e
Exemplo: Duas fam
lias, por exemplo, solanaceaes (pimenta, pimento, tomate) e mira
121
mpar, A={1,3,5}, qual o evento que ocorre sempre que A no ocorre? Resposta: Ac ={2,4,6}.
e
a
Exemplo: Vamos considerar todas as espcies pertencentes a ordem Himenoptera como
e
sendo o espao amostral, . Estamos interessados na fam Formicidae, este o nosso
c
lia
e
evento. Qual ser o complementar desse evento? Consistir de todas as espcies da ordem
a
a
e
Himenoptera, mas no pertencente a fam Formicidae.
a
lia
Algumas outras operaes envolvendo interseco, reunio e complemento so dadas por:
co
ca
a
a
a)
b)
c)
d)
e)
f)
Exerc
cio. Construa os diagramas de Venn para os itens a) e b).
122
3.4
A Probabilidade de Um Evento
Seja qual for o evento, por exemplo, chuva, gentipos homozigticos, produao de uma
o
o
c
cultura, saiu face
mpar ,etc., a probabilidade de um evento A, denotada por P(A) um
e
nmero entre 0 e 1, que indica a chance de ocorrncia de A. Quanto mais prximo de 1
u
e
o
e
P(A) = maior a chance de ocorrncia de A, e quanto mais prxima de 0 P(A) =
e
e
o
e
menor a chance de ocorrncia do evento A. Denio:
e
e
ca
Seja um experimento aleatrio e um espao amostral associado a esse
o
c
experimento. A cada evento A associamos um nmero real representado por P(A)
u
e denominado probabilidade de A, que expressa a chance de ocorrncia de A .
e
123
3.5
Conceito de Probabilidade
124
1
1
= 50% e P (Aa) = = 50%
2
2
P (Ei )= 1.
1
2
= 1.
2
b) 1 P (B) = 1
1
2
= 1.
2
c) P [(A B)c ] = 1 P (A B) = 1 1 = 0.
d) P [(A B)c ] = 1 P (A B) = 1 0 = 1.
125
e)
logo,
P (Ac B) = P (B) P (A B) =
3.6
1
1
0= .
2
2
A Regra da Adio
ca
33
4
2
0
1
7
28
7
2
1
6
8
61
11
4
1
7
15
Total
47
52
99
O evento A indica o evento que acontece quando, ocorrer uma morte na colnia, esta
o
pessoa deve ter at um ano de idade. O evento M acontece quando, ocorrer uma morte na
e
colnia, esta pessoa for do sexo masculino. Os demais eventos tem signicados anlogos.
o
a
Sendo assim, a probabilidade de ocorrncia do evento A, isto , a pessoa falecida tiver idade
e
e
entre 0 e 1 ano dada por,
e
P (A) =
61
= 61, 62%.
99
126
33
= 33, 33%,
99
isto , temos uma probabilidade de 33,33% da pessoa falecida ser do sexo masculino e ter
e
at um ano de idade.
e
Agora, se desejarmos calcular a probabilidade de ocorrncia de A e/ou de M, isto ,
e
e
P (A M ), como ser o clculo? O resultado ser dado por:
a
a
a
P (A M ) = P (A) + P (M ) P (A M )
P (A M ) = 0, 6162 + 0, 4747 0, 3333
P (A M ) = 0, 7576
P (A M ) = 75, 76%.
Devemos subtrair P (A M ), pois, caso contrrio, estar
a
amos contando duas vezes as
pessoas falecidas do sexo masculino e com idade entre 0 e 1 ano.
De modo geral, se A e B so dois eventos quaisquer, a chamada regra da adio dada
a
ca e
por:
P (A B) = P (A) + P (B) P (A B).
(3.1)
Esta regra vlida para mais do que dois eventos, ou seja, podemos generaliz-la. Por
e a
a
exemplo, para trs eventos: A, B e C, a regra ca:
e
P (A B C) = P (A) + P (B) + P (C) P (A B) P (A C) P (B C) + P (A B C).
Se considerarmos os eventos A e C, a P (A C) calculada do seguinte modo:
e
61
= 0, 6162 = 61, 62%;
99
4
P (C) =
= 0, 040 = 4, 00%;
99
P (A C) = 0, 6162 + 0, 040 = 0, 6562 = 65, 62%,
P (A) =
127
1
2
3
4
5
6
1
1
1
1
1
1
2
1
2
3
4
5
6
2
2
2
2
2
2
3
1
2
3
4
5
6
3
3
3
3
3
3
4
1
2
3
4
5
6
4
4
4
4
4
4
5
1
2
3
4
5
6
5
5
5
5
5
5
6
1
2
3
4
5
6
6
6
6
6
6
6
A = {36 45 54 63}
B = {41 42 43 44 45 46 51 52 53 54 55 56 61 62 63 64 65 66}
C = {11 21 12 31 22 13}
4
18
3
19
+
= .
36 36 36
36
4
6
0
10
P (A C) = P (A) + P (C) P (A C) =
+
= .
36 36 36
36
P (A B) = P (A) + P (B) P (A B) =
3.7
Vamos voltar a tabela 3.2 para explicar o que uma probabilidade condicional. Dado
e
que ocorra a morte de uma pessoa com idade entre 0 e 1 ano, a probabilidade dessa pessoa
ser do sexo feminino de 28 = 0,4590= 45,9%. Isto porque de um total de 61 falecimentos
e
61
com idade entre 0 e 1 ano, 28 so do sexo feminino.
a
Representamos uma probabilidade condicional da seguinte forma:
P (Feminino| idade entre 0 e 1 ano) =
28
= 45, 9%.
61
L-se, assim: a probabilidade da pessoa falecida ser do sexo feminino, dado que (|) ela tem
e
idade entre 0 e 1 ano de 45,9%. A barra vertical indica o evento que ocorreu, o evento
e
conhecido, isto , sabe-se que a pessoa falecida tem entre 0 e 1 ano, dado isso, deseja-se
e
128
AB
Figura 3.7: espao reduzido da probabilidade condicional
c
saber qual a probabilidade dela ser do sexo feminino. Podemos agora dar uma deniao
e
c
de probabilidade condicional.
Denio: Para dois eventos quaisquer A e B, associados a um experimento, sendo
ca
P (B) > 0, denimos a probabilidade condicional de A, quando B tiver ocorrido, como
sendo:
P (A B)
P (A|B) =
.
(3.2)
P (B)
Para se entender a expresso 3.2, basta pensar que o espao amostral cou reduzido, ou
a
c
restrito ao evento B. Veja gura 3.7. A presena da interseco no numerador justicada
c
ca
e
facilmente considerando que a ocorrncia de A, quando se sabe que B ocorreu, corresponde
e
` ocorrncia de A e de B simultaneamente, isto , de sua intersecao.
a
e
e
c
Para o exemplo mencionado, se A e F, indicam, respectivamente, os eventos idade entre
0 e 1 ano e sexo feminino, temos:
P (F |A) =
P (F A)
28 99
=
.
P (A)
61 99
Observe que =99, e A=61, sendo que desaparece (simplicaao), portanto, o novo espao
c
c
de resultados A. Assim,
e
28
P (F |A) =
= 45, 9%.
61
De modo geral, sempre que calculamos a P(A), dado que B tenha ocorrido, estamos
sempre calculando a P(A) em relao ao espao amostral reduzido de B, isto , o espao
ca
c
e
c
amostral ca reduzido de para B.
Exemplo: Numa populaao os animais podem ser fecundos e no fecundos. Vinte por
c
a
cento (20%) dos animais da raa X so fecundos; trinta por cento (30%) dos animais da raa
c
a
c
Y so no fecundos e setenta e cinco por cento (75%) dos animais so da raa X. Considere
a a
a
c
129
os eventos:
H={o animal da raa X}
e
c
A={o animal fecundo}
e
Raa
c
Total
X (H)
Y (M)
60
7,5
15
17,5
75
25
Total
67,5
32,5
100
(3.3)
Cegueira
Surdez
Frequncia
e
Surdez(S) No Surdez(S)
a
total
No Cegueira(C)
a
0,0004
0,0046
0,0796
0,9154
0,0800
0,9200
Frequncia total
e
0,0050
0,9950
1,0000
130
Probabilidades
21
54
23
54
32
54
32
54
BB
BV
VB
VV
Total
=
=
=
=
1
131
2
20
6
20
6
20
6
20
1/4
B
2\5
3/4
2/4
3/5
2/4
3.8
Teorema de Bayes
Uma das relaes mais importantes envolvendo probabilidades condicionais dada pelo
co
e
teorema de Bayes, que expressa uma probabilidade condicional em termos de outras probabilidades condicionais e marginais. Vamos apresentar o Teorema de Bayes atravs de um
e
exemplo.
Exemplo. Temos trs prossionais: um Agrnomo, um Bilogo e um Engenheiro Civil.
e
o
o
132
Cada um deles plantou 10 mudas de lamos. Das 10 plantadas pelo Agrnomo 9 sobrea
o
viveram; 5 do Bilogo e 2 do Engenheiro. Escolhe-se uma muda ao acaso, se a muda sobreo
viveu, qual a probabilidade de ela ter sido plantada pelo Engenheiro Civil? Veja a gura
3.9. Queremos encontrar a P (E | S). Sabemos que:
Marginais
Condicionais
P(A)= 10 = 1
30 3
10 1
P(B)= 30 = 3
P(E)= 10 = 1
30 3
P (S | A)=90%
P (S | B)=50%
P (S | E)=20%
P (E S)
.
P (S)
Mas,
P (E S) = P (E) P (S|E)
Assim:
P (E)P (S|E)
.
(3.5)
P (S)
As probabilidades no numerador sempre sero conhecidas. Precisamos encontrar o valor
a
da probabilidade do denominador, P(S). Como A, B e E so eventos mutuamente exclusivos,
a
e reunidos formam o espao amostral completo, podemos decompor S, na reunio de trs
c
a
e
outros que tambm so mutuamente exclusivos, ou seja:
e
a
P (E|S) =
S = (A S) (B S) (E S)
e ento:
a
P (S) = P (A S) + P (B S) + P (E S)
P (S) = P (A)P (S|A) + P (B)P (S|B) + P (E)P (S|E)
S
NS
(A) Agrnomo
U
U
U
U
U
U
U
U
U
(B) Bilogo
U
U
U
U
(E) Engenheiro
U
U
133
P (E)P (S|E)
.
P (A)P (S|A) + P (B)P (S|B) + P (E)P (S|E)
P (Ci )P (A|Ci )
(3.6)
P (C1 )P (A|C1 ) + P (C2 )P (A|C2 ) + P (C3 )P (A|C3 ) + ... + P (Cn )P (A|Cn )
para i = 1, 2, 3, ..., n.
Exerc
cios resolvidos
1. Num experimento com tomates em casa-de-vegetao, tm-se 26 vasos distribu
ca
e
dos
segundo o seguinte delineamento.
Variedades
Adubos
1 2 3
Total
1
2
3
3 4
1 3
5 2
2
3
3
9
7
10
total
9 9
26
134
Condicionais
9
P(A1)= 26
9
P(A2)= 26
8
P(A3)= 26
P (B2 | A1) =
P (B2 | A2) =
P (B2 | A3) =
1
9
3
9
3
8
P (A1)P (B2|A1)
P (A1)P (B2|A1) + P (A2)P (B2|A2) + P (A3)P (B2|A3)
1
P (A1 | B2) = .
7
2. (Beiguelman) A freqncia esperada de pessoas Rh+ em uma populao estimada
ue
ca e
em 90%. Qual a freqncia esperada, nessa populaao de casais:
ue
c
P (A1 | B2) =
a) Rh+ Rh+
0, 90 0, 90 =
(Rh+
0, 81
e Rh+ )?
= 81%;
b) Rh Rh
0, 10 0, 10 =
(Rh
0, 01
e Rh )?
= 1%;
c) Rh+
H
0, 90
M
0, 90
0, 09
Rh
M
0, 10 =
H
0, 10 =
d) M arido Rh+
0, 90
e) M arido Rh
0, 10
0, 09
=
Resultado =
9%
9%
18%;
M ulher Rh
0, 10
= 0, 09 = 9%;
M ulher Rh+
0, 90
= 0, 09 = 9%.
135
P (A) =
P (B|A) =
0, 48
P (AB)
P (A)
+ 0, 36 = 0, 84
= 0,48 = 0, 5714
0,84
136
a)
b)
c)
3.9
P (B C)
=
P (B) + P (C) P (B C)
=
0, 20 + 0, 80 (0, 2 0, 40)
=
1 0, 08
=
0, 92
P (contaminada)
=
P (A (B C))
=
P (A) + P (B C) P [A (B C)]
=
0, 30 + 0, 08 0, 00
=
0, 38
P (B | contaminada) = P (B contaminada) P (contaminada)
=
P (B C) 0, 38
=
0, 08 0, 38
=
0, 21
Exerc
cios Propostos
137
Bloco 1
Bloco 2
Bloco 3
Fertilidade
Bloco 4
+
c
Figura 3.10: Delineamento blocos ao acaso
sementes. Para controlar diferenas de temperatura e luminosidade dentro do germinador,
c
consideramos cada prateleira como um bloco.
3. No experimento anterior, suponha-se que a variedade C foi a mais produtiva em 3
blocos e teve o 2 lugar no outro bloco. Qual a probabilidade de ela se destacar igualmente
ou mais do que nesse ensaio por simples acaso? Qual a suposiao feita?
c
4. Em um certo locus podem ocorrer dois alelos C e D. Admitamos que os poss
veis
gentipos tm as seguintes probabilidades:
o
e
P (CC) = 0, 46; P (CD) = 0, 31; P (DD) = 0, 23.
Qual a probabilidade de que um gentipo contenha:
e
o
a) o alelo C?
b) o alelo D?
c) Qual a suposiao feita em a) e b)?
c
5. Em um locus de um certo par de cromossomos, podem ocorrer alelos A e a. Os
gentipos AA, Aa, aa tm probabilidades:
o
e
PAA = 0, 11; PAa = 0, 37; Paa = 0, 52.
Em um locus de outro par de cromossomos, podem ocorrer os alelos B e b. Os gentipos
o
BB, Bb, bb tm as probabilidades:
e
PBB = 0, 35; PBb = 0, 25; Pbb = 0, 40.
Encontrar as probabilidades de combinaoes genticas:
c
e
a) AA junto com BB, isto AA e BB.
e
138
c
7. Numa certa cidade, 40% da populaao tem cabelos castanhos, 25% olhos castanhos e
c
15% tem cabelos e olhos castanhos. Uma pessoa da cidade selecionada aleatoriamente.
e
a) Se ela tem cabelos castanhos, qual a probabilidade de ter tambm olhos castanhos?
e
e
b) Se ela tem olhos castanhos, qual a probabilidade de no ter cabelos castanhos?
e
a
c) Qual a probabilidade de no ter nem cabelos nem olhos castanhos?
e
a
8. Um lote formado por 10 animais sadios, 4 com problemas menores e 2 com problemas
e
graves. Todos os animais so numerados e feita a escolha de um animal ao acaso. Ache a
a
e
probabilidade de que:
a) ele no tenha problemas;
a
b) ele no tenha problemas graves;
a
c) ele ou seja sadio ou tenha problemas graves.
9. Se do lote de animais descritos no problema 8, dois animais forem escolhidos (sem
reposiao), ache a probabilidade de que:
c
a) ambos sejam sadios;
b) ao menos um seja sadio;
c) no mximo um seja sadio;
a
d) exatamente um seja sadio;
e) nenhum deles seja sadio.
10. Tem-se um pacote com 20 sementes, 8 das quais tem um alto poder germinativo
(germinam), e 12 no germinam. As sementes so analisadas uma aps a outra. Se essas
a
a
o
sementes forem extra
das ao acaso, sem reposiao, qual ser a probabilidade de que:
c
a
a) as duas primeiras sementes no germinam;
a
b)as duas primeiras sementes germinam;
c) das duas primeiras sementes analisadas, uma germina e a outra no germina;
a
OBS: Estes eventos no so independentes.
a a
11. Um enxerto tem a probabilidade de sobreviver duas vezes maior do que no sobrea
139
P(B)=0,30 e P(C)=0,10.
140
12 0,42857
8 0,28571
2 0,07143
6 0,21428
14 0,5000
14 0,5000
Total
20 0,71428
8 0,28572
28 1,0000
17. Se ambos os pais tem gentipo Aa (heterozigotos), seus lhos tem gentipos AA, Aa
o
o
e aa com probabilidades
1
P (AA) = 1 , P (Aa) = 1 , P (aa) = 4 .
4
2
141
4.1
Introduo
ca
u
u
5000 clulas de peixes do tipo bagre, dimetro de Paepalanthus. Para atender estas situaes
e
a
co
prticas mais gerais, precisamos ampliar os conceitos bsicos vistos at o momento, para que
a
a
e
tenhamos modelos probabil
sticos que representem todos os tipos de variveis vistas at aqui.
a
e
Em outras palavras, precisamos sosticar mais nossos modelos.
Inicialmente, dada a sua maior simplicidade estudaremos os modelos para variveis
a
aleatrias discretas. Alguns exemplos de variveis aleatrias discretas so: nmero de plano
a
o
a
u
tas sadias (ou doentes) numa unidade experimental, nmero de insetos capturados numa aru
madilha, nmero de brotos por explante, nmero de sementes que germinam numa amostra
u
u
de 400 sementes, proporao de enxertos sobreviventes. J os modelos para variveis cont
c
a
a
nuas
necessitaro de um artif matemtico, que consiste na generalizao do conceito de hisa
cio
a
ca
tograma, estudado na anlise exploratria de dados. Esta generalizaao consiste em se fazer
a
o
c
o nmero de classes tender para o innito e ser estudado no prximo cap
u
a
o
tulo.
Do ponto de vista prtico, desejvel que se dena uma varivel associada a um experia
e
a
a
mento, de tal modo que seus resultados sejam numricos. Vejamos alguns exemplos.
e
Exemplo 1. No caso de um questionrio, e as respostas poss
a
veis so sim ou no,
a
a
podemos associar uma varivel que toma os valores 1 para sim e 0 para no.
a
a
Exemplo 2. Num estudo sobre sobrevivncia de enxertos em ameixeiras, temos duas
e
possibilidades, o exerto sobrevive ou morre, podemos atribuir o valor 1 para sobrevive e 0
para morte. Uma razo para isto, que os recursos dispon
a
e
veis para a anlise estat
a
stica
142
BV
BV
BB
BV
VB
VV
4.2
Vamos, agora, atravs de um exemplo, denir o que uma varivel aleatria discreta,
e
e
a
o
funo de probabilidade e distribuio de probabilidade, em termos matemticos.
ca
ca
a
Exemplo: em um experimento gentico com res de ervilhas, os gentipos BB e V V
e
o
o
produzem ptalas das ores de cor branca e vermelha, respectivamente. Em F1, obtemos:
e
BBVV=BV ,
que so ores de cor rosa (gentipo que produz ptalas rosas). Fazendo-se a autofecundaao
a
o
e
c
de ores BV, obtemos os gentipos da gura 4.1.
o
Vamos denir a varivel X como sendo igual ao nmero de alelos V em cada resultado
a
u
da gura 4.1 (gentipos). Os resultados associados pela varivel X, dada a suposiao que
o
a
c
os eventos so igualmente provveis e BV e V B no so ordenados, so:
a
a
a a
a
143
A2
A3
A1
-2
-1
Resultados (eventos)
Probabilidades
xi
BB
BV
VB
VV
1
4
1
4
1
4
1
4
0
1
1
2
u
Notamos, que a varivel aleatria para ser discreta deve assumir valores em um conjunto
a
o
enumervel (nito ou innito) de pontos do conjunto dos nmeros reais (R).
a
u
Vimos como associar nmeros aos eventos, agora, muito importante que se associe
u
e
probabilidades a estes valores da varivel, isto , como associar a cada valor xi da varivel
a
e
a
aleatria X a sua probabilidade de ocorrncia? Ela dada pela probabilidade de ocorrncia
o
e
e
e
do evento correspondente (eventos equivalentes). Matematicamente, temos:
1
P (X = 0) = P ({BB}) = ,
4
pois, X = 0 se, e somente se, ocorre o evento BB;
P (X = 1) = P ({BV ouV B}) =
144
2
1 1
+ = ,
4 4
4
p(xi )
1
4
2
4
1
4
p(xi ) 0
para todo i;
b)
p(xi ) = 1;
c)
P (X = xi ) = p(xi ).
i=1
4.3
Existem caracter
sticas numricas que so muito importantes em uma distribuio de
e
a
ca
probabilidades de uma varivel aleatria, discreta ou cont
a
o
nua. Essas caracter
sticas numricas
e
so os parmetros das distribuioes. Os dois parmetros mais importantes so a mdia e a
a
a
c
a
a
e
varincia.
a
145
0, 20;
II 180/500 =
e
0, 36;
III 140/500 =
e
0, 28;
IV 80/500 =
e
0, 16.
Ento, se chamarmos de X: o lucro por caixa de batata-semente e o lucro mdio por caixa
a
e
de E(X), temos:
X = E(X) = 0, 20(30, 00) + 0, 36(100, 00) + 0, 28(85, 00) + 0, 16(10, 00)
X = E(X) = (6, 00) + 36, 00 + 23, 80 + (1, 6)
X = E(X) = 52, 20 u.m.
Exemplo 2. Considere a produo de pepinos para conserva, qual o lucro mdio esperado
ca
e
pelo agricultor por caixa de pepino? Considere os seguintes valores de lucros para cada uma
das classicaoes:
c
a
1a classe(pepinos de 6 ` 9 cm)
2a classe(pepinos de 9 ` 12 cm)
a
a
3 classe(pepinos maior que 12 cm)
alados
lucro
lucro
lucro
lucro
de
de
de
de
600
500
390
50
u.m./cx.
u.m./cx.
u.m./cx.
u.m./cx
146
do tipo:
1a classe
2a classe
3a classe
alados
300/500 = 0, 60
e
100/500 = 0, 20
e
50/500 = 0, 10
e
50/500 = 0, 10
e
p(xi ) = 1, 0
Ento, se X o lucro por caixa de pepino para conserva e E(X) o lucro mdio esperado
a
e
e
e
por cada caixa, temos que:
X = E(X) = 0, 60(600) + 0, 20(500) + 0, 10(390) + 0, 10(50)
X = E(X) = 360 + 100 + 39 5
X =
Exemplo 3. Em fam
lias com 4 crianas, vamos admitir, para simplicar, que a proc
porao de crianas que nascem do sexo masculino e feminino 1:1. Seja a varivel aleatria
c
c
e
a
o
X=nmero de meninos em fam
u
lias com quatro crianas. O espao de resultados para
c
c
4
fam
lias com 4 crianas dado por (2 pontos amostrais):
c e
= {F F F F, M F F F, F M F F, F F M F, F F F M, M M F F, M F M F, M F F M,
F M M F, F M F M, F F M M, M M M F, M M F M, M F M M, F M M M, M M M M }.
Os valores que X pode assumir so:
a
X = {0, 1, 2, 3, 4}.
As probabilidades so dadas por:
a
P (X = 0) =
1
;
16
P (X = 1) =
4
;
16
P (X = 2)
6
4
; P (X = 3) = ;
16
16
P (X = 4) =
1
.
16
1
4
6
4
1
0) + ( 1) + ( 2) + ( 3) + ( 4) = 2.
16
16
16
16
16
147
Portanto,
X = E(X) = p1 x1 + p2 x2 + p3 x3 + p4 x4 .
4
X = E(X) =
xi p(xi ).
i=1
M e(X) = X =
f i xi .
A distinao entre pi , a probabilidade da varivel aleatria X assumir o valor xi , e fi , a
c
a
o
freqncia relativa do resultado xi , que a primeira corresponde a valores obtidos de um
ue
e
modelo terico ajustado para os dados e, a segunda, corresponde as freqncias observadas
o
ue
da varivel. Como pi e fi tem a mesma interpretaao, todas as medidas e grcos discutidos
a
c
a
no estudo de anlise exploratria de dados para distribuioes de freqncias (fi ), possuem
a
o
c
ue
um correspondente na distrbuio de probabilidades (pi ).
ca
Um segundo parmetro, a varincia de uma distribuio de probabilidade, que mede
a
e
a
ca
o grau de disperso (ou de concentraao) de probabilidades em torno da mdia verdadeira.
a
c
e
Quanto menor a varincia, maior o grau de concentraao das probabilidades em torno da
a
c
mdia e vice-versa, quanto maior a varincia, maior o grau de disperso das probabilidades
e
a
a
em torno da mdia.
e
Chamamos de varincia de X ao valor:
a
2
X =
p(xi )x2
i
Demonstrao:
ca
n
2
X
=
i=1
148
p(xi )xi
= E(X 2 ) [E(X)]2 .
=
i=1
n
x2 p(xi )
i
2E(X)
i=1
i=1
2
x2 p(xi ) 2
i
xi p(xi )
xi p(xi )
i=1
x2 p(xi )
i
i=1
2
i=1
i=1
p(xi )
xi p(xi ) + [E(X)]
xi p(xi )
i=1
i=1
= E(X 2 ) [E(X)]2 .
O resultado acima foi obtido com as restrioes:
c
n
p(xi ) = 1
E(X) =
i=1
xi p(xi ).
i=1
X =
p(xi )
x2
i
p(xi )x2
i
-30,00
100,00
85,00
-10,00
0,20
0,36
0,28
0,16
900,00
10.000,00
7.225,00
100,00
180
3.600
2.023
16
Total
1,00
5819
Logo:
2
X = 5819 [52, 20]2
2
X = 3.094 u.m.2
3.094, 16
149
Para o exemplo da varivel lucro esperado por caixa de pepino para conserva, temos:
a
2
X = 281.400 [494]2
2
X = 37.364 u.m.2 /cx.
37.364
= = 193, 29 u.m./cx.
Para o exemplo da varivel do nmero de meninos em fam com quatro crianas, temos:
a
u
lia
c
2
X = 5 22 = 1 menino2 .
2
X =
X = 1 = 1 menino.
E(K) =
Kp(xi )
i=1
n
= K
p(xi )
i=1
= K(1) = K.
2) Sejam K uma constante e X uma varivel aleatria, temos que: E(KX) = KE(X).
a
o
Demonstrao:
ca
n
Kxi p(xi )
E(KX) =
i=1
= K
xi p(xi )
i=1
= KE(X).
150
X
x2 = 1
x3 = 2
3/20
1/20
4/20
8/20
3/20
1/20
1/20
5/20
2/20
2/20
3/20
7/20
p(y)
E(X Y ) =
(xi yj )p(xi , yj )
i=1 j=1
m
n
xi p(xi , yj )
i=1 j=1
m
n
yj p(xi , yj )
i=1 j=1
n
m
xi
i=1
8/20
4/20
8/20
1,00
p(xi , yj )
j=1
yj
j=1
p(xi , yj ).
i=1
p(xi , yj ) = p(xi )
j=1
e, para j xo,
p(xi, yj ) = p(yj ),
i=1
E(X Y ) =
xi p(xi )
i=1
yj p(yj )
j=1
151
= 79 + 65 = 144Kg.
2
2
2
XH +XM = XH + XM (XH independente de XM )
= 100 + 49 = 149Kg 2 .
XH +XM
E(XY ) =
xi yj p(xi , yj )
i=1 j=1
n
m
xi yj p(xi )p(yj )
i=1 j=1
m
xi p(xi )
i=1
yj p(yj )
j=1
= E(X)E(Y ).
5) V ar(K) = 0.
Demonstrao:
ca
V ar(K) = E(K 2 ) [E(K)]2
= K2 K2
V ar(K) = 0.
6) V ar(KX) = K 2 V ar(X).
Demonstrao:
ca
V ar(KX) = E(K 2 X 2 ) [E(KX)]2
= K 2 E(X 2 ) [KE(X)]2
= K 2 E(X 2 ) K 2 [E(X)]2
= K 2 {E(X 2 ) [E(X)]2 }
= K 2 V ar(X).
Denio: Se X e Y so duas variveis aleatrias, a covarincia de X e Y denida por:
ca
a
a
o
a
e
Cov(X, Y ) = E[(X E(X))(Y E(Y ))] = E(XY ) E(X)E(Y ),
152
ou seja, o valor mdio do produto dos desvios de X e Y em relaao aos seus valores mdios.
e
c
e
A covarincia uma medida de associaao entre X e Y .
a
e
c
Demonstrao:
ca
m
Cov(X, Y ) =
Cov(X, Y ) =
xi yj p(xi , yj )
i=1 j=1
m
n
xi E(Y )p(xi , yj )
i=1 j=1
m
i=1 j=1
Por denio:
ca
E(X)yj p(xi , yj ) +
E(X)E(Y )p(xi , yj ).
i=1 j=1
xi yj p(xi , yj ) = E(XY ).
i=1 j=1
Logo,
m
xi
i=1
E(X)
p(xi , yj )
j=1
yj
j=1
p(xi , yj ) + E(X)E(Y )
i=1
p(xi , yj )
i=1 j=1
p(x)
0
1
2
0/15
2/15
0/15
0/15
2/15
1/15
0/15 0/15
3/15 2/15
2/15 1/15
0/15
1/15
1/15
0/15
10/15
5/15
p(y) 2/15
3/15
5/15 3/15
2/15
153
idades.
W
P(W )
W P(W )
0
1
2
3
4
6
8
2/15
2/15
4/15
2/15
3/15
1/15
1/15
0/15
2/15
8/15
6/15
12/15
6/15
8/15
Temos que: E(X) = 20/15, E(Y ) = 30/15, portanto, COV (X, Y )=(42/15)-(20/15)(30/15)
= (42/15)-(588/225) = 2,8-2,6667 =-0,1333.
7) V ar(X Y ) = V ar(X) + V ar(Y ) Cov(X, Y )
onde Cov(X, Y ) = E(XY ) E(X)E(Y ), como foi demonstrado.
Demonstrao:
ca
V ar(X + Y ) = E (X + Y )2 [E(X + Y )]2
= E(X 2 ) + 2E(XY ) + E(Y 2 ) [E(X) + E(Y )]2
= E(X 2 ) + 2E(XY ) + E(Y 2 ) [E(X)]2 2E(X)E(Y ) [E(Y )]2
= E(X 2 ) [E(X)]2 E(Y 2 ) [E(Y )]2 + 2E(XY ) 2E(X)E(Y )
= V ar(X) + V ar(Y ) + 2Cov(X, Y ).
Se X e Y so duas variveis aleatrias independentes, ento Cov(X, Y ) = 0 e, portanto,
a
a
o
a
V ar(X Y ) = V ar(X) + V ar(Y ).
Observaao: se Cov(X, Y ) = 0 no implica que X e Y so independentes. Pode ter uma
c
a
a
outra dependncia que no a linear.
e
a
Uma frmula prtica para o clculo da covarincia dada por:
o
a
a
a
e
n
Cov(X, Y ) =
xi y i
i=1
4.4
n
i=1
xi
n
n
i=1
yi
154
u
u
e
resolver muitos problemas que, a primeira vista, no parecem relacionados. Podemos, ento,
a
a
concluir que a maioria dos problemas podem ser resolvidos com o aux de poucos modelos
lio
bsicos.
a
Esses modelos, cada qual apresentam uma srie de hipteses ou pressuposioes, que devem
e
o
c
ser atendidas para que o modelo possa ser utilizado validamente.
O ponto chave para a utilizaao de um modelo consiste em confrontar as hipteses bsicas
c
o
a
do modelo e as condies da situao real. Se as hipteses bsicas so vericadas (atendidas),
co
ca
o
a
a
pode-se usar o modelo em questo.
a
Nesta seao, iremos estudar alguns desses modelos, procurando enfatizar como eles ocorc
rem na prtica, sua funo de probabilidade, parmetros, e como calcular probabilidades.
a
ca
a
4.5
Distribuio de Bernoulli
ca
E claro que quando realizamos um experimento estamos interessados em vericar alguma(s) varivel(is). Ento, precisamos associar uma varivel aleatria X que chamaremos
a
a
a
o
de germinao da semente de trigo aos poss
ca
veis resultados do experimento; como temos
apenas dois resultados poss
veis, a varivel aleatria X vale:
a
o
x = 1 se a semente germinar;
x = 0 se a semente no germinar.
a
Vamos estabelecer algumas condies (pressuposies):
co
co
oe
ca
1. S feita uma unica tentativa (repetio) do experimento;
2. S so poss
o a
veis dois resultados (germina ou no germina).
a
Vamos denir o evento G={A semente germina}, sendo a sua probabilidade dada por
P (G) = , portanto, o valor do parmetro est entre 0 (zero) e 1 (um); a probabilidade
a
a
155
G
G
xi
p(xi )
0
1
1 =q
Total
+ (1 ) = 1
Dizemos que a varivel aleatria X=germinao da semente, assim denida, tem disa
o
ca
tribuio de Bernoulli.
ca
A funao de probabilidade de uma varivel Bernoulli dada por:
c
a
e
P (X = xi ) = xi (1 )1xi .
(4.1)
E(X) =
xi p(xi ) = (0 (1 )) + (1 ) = 0 + = .
x2 p(xi ) = 02 (1 ) + 12 = .
i
V AR(X) = 2 = (1 ).
Exemplo 1: uma urna tem 30 bolas brancas e 20 verdes. Retira-se uma bola dessa urna.
Seja X= saiu bola verde. Verique se um ensaio de Bernoulli (confronte as suposies do
e
co
modelo com as condioes do ensaio). Determinar P (X = xi ), calcular E(X) e V ar(X).
c
Sim, pois
ca
2) somente dois resultados (verde ou branco)
X=
0 (1 ) =
1
156
30
50
20
50
=
=
3
5
2
5
ca
2) somente dois resultados poss
veis (mutaao ssea ou sangu
c o
nea).
X=
0 (1 ) =
1
6
9
3
9
= 0, 6667
= 0, 3333
4.6
2
6 3
= .
9 9
9
A Distribuio Binomial
ca
Esta distribuio foi estudada pelo matemtico suio Jacob Bernoulli (1664-1705)
ca
a
c
157
xi
p(xi )
GG
GG
GG
GG
2
1
1
0
= 2 (1 )0
(1 )= 1 (1 )1
(1 )= 1 (1 )1
(1 )(1 )= 0 (1 )2
p(2)=1 2 (1 )0 =
p(1)=2 1 (1 )1 =
2
2
2
1
2 (1 )22
1 (1 )21
p(0)=1 0 (1 )2 =
2
0
0 (1 )20
2
2
2 2
(1 )22 ,
2
2!
2!
12
=
=
= 1.
2!(2 2)!
2!0!
1 2 (1)
Para o segundo resultado, em que uma semente germina (G) e a outra no germina (G),
a
a probabilidade dada por:
e
P (G G) = P (G)P (G) = (1 ) = 1 (1 )1 .
Observe que, temos duas combinaoes poss
c
veis em que uma semente germina e a outra no
a
germina, GG e GG, portanto, a probabilidade vale:
P (GG GG) = 2 1 (1 )1 =
2 1
(1 )21 .
1
Neste clculo usamos combinaoes pois a ordem dos resultdos no importa. Na verdade, em
a
c
a
termos de resultados, corresponde a um unico resultado, qual seja: uma semente germina e
a outra no germina.
a
158
Usamos o mesmo procedimento para calcular a P (G G).
Vamos, agora, vericar a germinaao de trs sementes de trigo (vamos repetir o exc
e
perimento 3 vezes); considerando verdadeira a hiptese de independncia e probabilidades
o
e
constantes, , a distribuiao de probabilidade ca:
c
Resultados
xi
P (X = xi ) = p(xi )
GGG
GGG
GGG
GGG
GGG
GGG
GGG
GGG
3
2
2
2
1
1
1
0
= 3 (1 )0
(1 ) = 2 (1 )1
(1 ) = 2 (1 )1
(1 ) = 2 (1 )1
(1 )(1 ) = 1 (1 )2
(1 )(1 ) = 1 (1 )2
(1 )(1 ) = 1 (1 )2
(1 )(1 )(1 ) = 0 (1 )3
Total
1 3 (1 )0 =
3 2 (1 )1 =
3
3
3
2
3 (1 )33
2 (1 )32
3 1 (1 )2 =
3
1
1 (1 )31
1 0 (1 )3 =
3
0
0 (1 )30
G, G, ..., G, G, G, ..., G
k
nk
dada por:
e
k (1 )nk .
Mas, uma outra sequncia de k sementes que germinam e n k sementes que no germinam
e
a
:
e
G, G, G, ..., G, G, G, G..., G.
O valor da probabilidade continua sendo k (1 )nk .
Uma outra sequncia poderia ser:
e
G, G, G, ..., G, G, G, G..., G.
Novamente, o valor da probabilidade nesta sequncia k (1 )nk .
e
e
Mas, existem:
n
n!
=
k
k!(n k)!
159
n k
(1 )nk
k
para k = 0, 1, 2, 3.., n.
Observao: a denominaao binomial decorre do fato de os coecientes
ca
c
os coecientes do desenvolvimento binomial das n potncias (a + b).
e
Estas probabilidades tambm podem ser indicadas por:
e
(4.2)
n
k
serem exatamente
b(k : n; ).
Os poss
veis valores de k = 0, 1, 2, 3..., n e as probabilidades P (X = k), dadas em 4.2
constituem a chamada distribuio binomial.
ca
Quando uma varivel aleatria X tem distribuiao binomial com os parmetros n e
a
o
c
a
escrevemos:
X : b(n; ).
Suposioes do modelo binomial:
c
1. Existem n repetioes ou provas idnticas do experimento. Exemplo: nmero de plantas
c
e
u
sadias colhidas em parcelas de 20m2 (foram plantadas 27 plantas em cada parcela),
X : 0, 1, 2, ..., 27, ento, n o nmero total de casos poss
a
e
u
veis da varivel que estamos
a
estudando.
o a
veis (plantas sadias ou doentes).
2. S h dois tipos de resultados poss
3. As probabilidades de sucesso e 1 de fracasso permanecem constantes em todas as
repeties. Na prtica no temos certeza absoluta disso, mas consideramos verdadeira
co
a
a
esta suposiao desde que as probabilidades sejam prximas.
c
o
4. Todos os resultados das repeties so independentes uns dos outros.
co
a
Exemplo 1. Num rebanho bovino 30% dos animais esto atacados de febre aftosa.
a
Retira-se ao acaso, uma amostra de 10 animais.
1)Verique se a varivel nmero de animais doentes pode ser estudada pelo modelo binoa
u
mial. Justique.
2) Estruturar a funo de probabilidade e representar a distribuiao de probabilidade num
ca
c
grco.
a
3) Qual a probabilidade de se encontrar 6 animais doentes?
160
10
0, 30k 0, 7010k .
k
No apndice 1 temos a tabela das probabilidades binomiais. Como sabemos, estas probae
bilidades so dadas em funo do nmero de repetioes e da proporo de sucessos. Para uma
a
ca
u
c
ca
distribuio binomial, temos que b(6:10;0,30)=0,037=3,7%. Tambm, obtemos diretamente
ca
e
da tabela da distribuiao binomial, que:
c
P (X = 0)
P (X = 1)
P (X = 2)
P (X = 3)
P (X = 4)
P (X = 5)
P (X = 6)
P (X = 7)
P (X = 8)
P (X = 9)
P (X = 10)
=
=
=
=
=
=
=
=
=
=
=
0, 028
0, 121
0, 233
0, 267
0, 200
0, 103
0, 037
0, 009
0, 001
0, 000
0, 000
161
0,30
0,26
0,22
P(X=x)
0,18
0,14
0,10
0,06
0,02
-0,02
-2
10
12
P (X = 6) =
P (X = 6) = 3, 7%.
Exemplo 2. Numa criao de coelhos, 40% so machos. Qual a probabilidade de que
ca
a
nasam pelo menos 2 coelhos machos, num dia em que nasceram 19 coelhos? Estruturar a
c
funo de probabilidade e representar a distribuiao gracamente.
ca
c
Primeiramente, vamos vericar se a varivel X: nmero de coelhos machos, pode ser
a
u
estudada pelo modelo binomial.
1) Temos n=19 repetioes do experimento.
c
2) Um coelho macho ou fmea.
e
e e
3) A probabilidade de ser macho 0,40 e permanece constante.
e
4) Os resultados (macho e fmea), em cada nascimento, so independentes.
e
a
Assim:
X = 0, 1, 2, 3, ..., 19
= 0, 40
logo:
X : b(19; 0, 40).
Portanto, a estrutura da funo de probabilidade dada por:
ca
e
P (X = k) =
19
0, 40k 0, 6019k .
k
162
0,22
0,18
Px(x)
0,14
0,10
0,06
0,02
-0,02
-2
10
14
18
22
= 0)
= 1)
= 2)
= 3)
= 4)
= 5)
= 6)
= 7)
= 8)
= 9)
=
=
=
=
=
=
=
=
=
=
0, 000
0, 001
0, 005
0, 017
0, 047
0, 093
0, 145
0, 180
0, 180
0, 146
P (X
P (X
P (X
P (X
P (X
P (X
P (X
P (X
P (X
P (X
= 10)
= 11)
= 12)
= 13)
= 14)
= 15)
= 16)
= 17)
= 18)
= 19)
=
=
=
=
=
=
=
=
=
=
0, 098
0, 053
0, 024
0, 008
0, 002
0, 001
0, 000
0, 000
0, 000
0, 000.
163
V ar =
2, 1 = 1, 449 animais.
Uma varivel aleatria binomial, como vimos, obtida de contagens, frequncias de sucesa
o
e
e
sos, todavia, em muitas situaes, importante expressar os dados na forma de proporo,
co e
ca
por exemplo, representar que 18 sementes germinaram em 20 sementes testadas, corresponde
a p = 18 20 = 0, 90. Neste caso (de proporoes) a mdia e a varincia so dadas por:
c
e
a
a
E(P ) = .
164
Demonstrao:
ca
1
n
E(n1 ) =
= .
n
n
(1 )
.
V ar(P ) =
n
E(P ) = E
n1
n
Demonstrao:
ca
V ar(P ) = V ar(
n1
1
(1 )
1
) = 2 V ar(n1 ) = 2 n(1 ) =
.
n
n
n
n
4.7
P(X=1)
0,121
P(X=2)
0,233
P(X=3)
0,267
P(X=4)
0,200
P(X=5)
0,103
P(X=6)
0,037
P(X=7)
0,009
P(X=8)
0,001
P(X=9)
0,000
P(X=10)
0,000
Distribuio de Poisson
ca
O nome desta distribuio est associado ao matemtico francs S. Denis Poisson (1781-1840).
ca
a
a
e
E mais comum na natureza ocorrer uma distribuio por contgio, nesse caso, a distribuio utilizada
ca
a
ca
e
a binomial negativa.
5
165
Habitat
166
167
de encontrar 2 indiv
duos, e assim por diante, pode ser obtida atravs da tabela da dise
tribuio binomial (Apndice 1). Vericamos que as pressuposioes do modelo binomial so
ca
e
c
a
atendidas, seno vejamos:
a
1. n indiv
duos, so as n repetioes do experimento;
a
c
2. como a distribuiao aleatria, a posio de um indiv
c e
o
ca
duo totalmente independente
e
da posiao dos outros;
c
3. a probabilidade de um quadrante receber um indiv
duo igual a , e sempre a
e
e
mesma;
4. um indiv
duo pertence ou no pertence ao quadrante.
a
(4.3)
onde e o nmero de Euler e vale 2,718282. A demonstrao dessa aproximao pode ser
e
u
ca
ca
a
encontrada em Morettin (Estat
stica Bsica, 6 edio), e vlida quando n tende ao innito
a
ca
e a
e tende a zero. Observe no modelo 4.3, diferentemente do modelo binomial, que no existe
a
uma limitaao superior para o nmero de ocorrncias, isto , k = 1, 2, 3, .....
c
u
e
e
Esta aproximao boa para n sucientemente grande e pequeno, de tal forma que
ca e
verica-se a desigualdade, n 7.
168
= 0)
= 1)
= 2)
= 3)
= 4)
=
=
=
=
=
e5 (5)0
0!
e5 (5)1
1!
e5 (5)2
2!
e5 (5)3
3!
e5 (5)4
4!
=
=
=
=
=
0,006741
1
0,006745
1
0,0067425
12
0,00674125
123
0,00674625
1234
=
=
=
=
=
0, 0067
0, 0337
0, 0842
0, 1404
0, 1755.
P (X = 11) = 0, 0082
P (X = 6) = 0, 1462
P (X = 12) = 0, 0034
P (X = 7) = 0, 1044
P (X = 13) = 0, 0013
P (X = 8) = 0, 0653
P (X = 14) = 0, 0005
P (X = 9) = 0, 0363
P (X = 15) = 0, 0002
P (X = 10) = 0, 0181
P (X 6) = 0.
e2 2k
para k = 0, 1, 2, 3, ...
k!
169
0,22
0,18
Px(X)
0,14
0,10
0,06
0,02
-0,02
-2
10
14
18
P(X=K)
0,18
0,14
0,10
0,06
0,02
-0,02
-2
10
12
e2 23
= 0, 1804 = 18, 4%.
3!
170
Demonstra-se que:
E(X) = V ar(X) = .
Portanto, na distribuio de Poisson, a mdia igual a varincia. Uma justicativa que
ca
e
e
a
e
fazendo-se tender a zero, implica que, q = 1 , tende para 1. Como a mdia, = n,
e
e
2
2
um valor considerado xo e nito, temos que a varincia = n(1), tende para = n.
a
No exemplo dos pssaros:
a
E(X) = n = = mdia de 5 pssaros por gaiola.
e
a
V ar(X) = 5 pssaros2 .
a
5 = 2, 23 pssaros/gaiola.
a
D.P.(X) =
Exerc
cios resolvidos
1) Num certo ano, o IBAMA registrou no litoral catarinense (rea de reserva), 18 mortes
a
de golnhos.
a)Qual a probabilidade de, num determinado ms do prximo ano, ocorrerem menos de 2
e
e
o
mortes?
b) Qual a probabilidade de ocorrerem 2 mortes no prximo ano?
e
o
a)
= 18/12 = 1, 5 golnhos/ms
e
P (X = 0) = (e1,5 1, 50 )/0! = 0, 223130 1 = 0, 22313
P (X = 1) = (e1,5 1, 51 )/1! = 0, 334695
P (X = 0) + P (X = 1) = 0, 22313 + 0, 334695 = 0, 557825.
b)
= 18 golnhos
P (X = 2) = (e18 182 )/2! = 0, 0000025
2) Suponha que 80% de uma criaao de su
c
nos esteja atacada por leptospirose. Se uma
amostra de 1000 su
nos for examinada por um veterinrio e seja Y o nmero de porcos
a
u
doentes dessa amostra de 1000:
a) qual o valor esperado de Y ?
e
b) qual o desvio padro de Y ?
e
a
Sendo:
n = 1000 = 0, 80 (1 ) = 0, 20
171
a) E(Y ) = n = 800 su
nos.
1
=6
2
1 1
V ar(X) = n(1 ) = 12 = 3
2 2
D.P.(X) =
3 = 1, 73.
c)
= 0, 50 = 50% (1 ) = 0, 50 = 50%.
12
9
12
10
12
11
12
12
=
=
=
=
0, 0540
0, 0160
0, 0030
0, 000.
172
12
0, 500 0, 50120 = 0, 000.
0
12
0, 501 0, 50121 = 0, 003.
1
12
0, 502 0, 50122 = 0, 016.
2
4.8
Exerc
cios Propostos
173
0
1
2
3
4
5
6
7
8
9
10
11
12
No observado de fam
lias
5
35
180
599
1250
1990
2400
2060
1350
600
179
35
7
Total
10.690
0,000
0,003
0,016
0,054
0,121
0,193
0,226
0,193
0,121
0,054
0,016
0,003
0,000
No esperado
0
32
171
577
1294
2063
2416
2063
1294
577
171
32
0
1,000
10690
Probabilidades
4) Em 30 bezerros nascidos, 60% foi do sexo feminino. Calcular o valor esperado (esperana) e o desvio padro esperado.
c
a
5) Se a probabilidade de um indiv
duo sofrer uma reao nociva, resultante da infeco
ca
ca
de um determinado soro 0,0001. Determinar a probabilidade de, entre 2.000 indiv
e
duos:
a) exatamente trs sofrerem a reao; b) mais de dois sofrerem a reao.
e
ca
ca
6) Um produtor de sementes vende pacotes com 20 sementes cada. Os pacotes que
apresentarem mais de uma semente sem germinar sero indenizados. A probabilidade de
a
uma semente germinar 0,98. a) Qual a probabilidade de um pacote no ser indenizado?
e
e
a
b) Se o produtor vende 1000 pacotes, qual o nmero esperado de pacotes indenizados?
e
u
c) Quando o pacote indenizado, o produtor tem um preju de 1,20 u.m. (unidades
e
zo
monetrias) e, se o pacote no for indenizado, ele tem um lucro de 2,50 u.m. Qual o lucro
a
a
l
quido esperado por pacote? d) Calcule a mdia e a varincia da varivel nmero de
e
a
a
u
sementes que no germinam por pacote.
a
7) Sabe-se que 20% dos animais submetidos a um certo tratamento no sobrevivem. Se
a
esse tratamento foi aplicado em 20 animais e se X o nmero de no sobreviventes: a) qual
e
u
a
o nmero mdio esperado de animais no sobreviventes, VAR(X) e DP(X)? b) Calcular a
e
u
e
a
174
Nmero de ninhadas
u
0
1
2
3
4
5
20
360
700
680
200
40
Total
2000
0
1
2
3
4
5
6
7
8
>8
26
21
23
14
11
4
5
4
1
0
Total
109
175
observada uma mdia de 8 eritrcitos por cada quadrado. E razovel que contagens por
e
o
a
quadrado, frequentemente, se desviem de 1 ou 2 da mdia 8, e ocasionalmente de 3 ou mais?
e
11) Oito ratos experimentais movem-se aleatoriamente sobre uma superf que subcie
e
dividida em vinte quadrantes de mesmo tamanho, numerados 1, 2, 3, ...,20. Uma fotograa
tirada. Admitindo-se a distribuiao de Poisson,
e
c
a) qual a probabilidade de que exatamente um rato seja encontrado no quadrante no 1?
e
b) quantos quadrantes devem conter 0, 1, 2,...ratos?
12) Uma armadilha para pegar vespa foi testada. Somente 128 das 720 vespas atra
das
pela isca puderam ser apanhadas. Portanto, a probabilidade de pegarmos uma vespa
e
estimada como sendo = 0, 178. Qual a probabilidade de que dentre trs vespas escolhidas
e
e
aleatoriamente:
a) nenhuma seja capturada,
b) pelo menos uma seja capturada?
13) Admitindo que cada criana tenha 51% de probabilidade de ser menino:
c
Determine a probabilidade de uma fam de 4 lhos ter:
lia
a) exatamente um menino;
b) ao menos um menino.
14) Avaliaram-se 30 parcelas (rea de terra de 20m2 ) de 27 plantas de mandioca cada
a
uma, de acordo com o nmero de plantas doentes colhidas. Os dados esto apresentados na
u
a
176
tabela abaixo:
Nmero de plantas doentes colhidas (X)
u
0
1
2
3
4
14
8
4
3
1
Total
30
177
cada. E caracter
stica de produo que 20% das sementes apresentem poder germinativo
ca
abaixo do especicado. Um comprador fez a seguinte proposta ao produtor de sementes: de
cada saco escolhe 25 sementes, ao acaso e paga por saco:
25,00 u.m. se todas as sementes germinarem;
17,00 u.m. se uma ou duas sementes no germinarem;
a
10,00 u.m. se trs ou mais sementes no germinarem.
e
a
O que melhor para o produtor, manter o seu preo de 20,00 u.m. por saco ou aceitar a
e
c
proposta do comprador?
Sugesto: encontrar o preo mdio esperado pelo produtor.
a
c
e
23) O nmero de mortes por afogamento em ns de semana, numa cidade praiana de
u
e
2 para cada 50.000 habitantes. Qual a probabilidade de que em 200.00 habitantes ocorram
178
5 afogamentos?
Obs: X= nmero de mortes por afogamentos uma varivel Poisson.
u
e
a
24) Num lote de sementes cujo percentual de germinao 0,70, foi retirada uma amostra
ca e
de 10 sementes e colocada num germinador. Se X o nmero de sementes germinadas:
e
u
a) estruturar a funo de probabilidade de X, e fazer o grco da distribuio de probabilica
a
ca
dade;
b) determinar a probabilidade de germinarem duas ou mais sementes;
c) determinar a mdia, a varincia e o desvio padro da distribuio de X.
e
a
a
ca
25) Seja X o nmero de crianas no imunizadas numa campanha de vacinaao conu
c
a
c
tra uma determinada doena, onde a probabilidade de no-imunizaao = 103 . De
c
a
c e
5000 crianas vacinadas, numa determinada localidade, qual a probabilidade de no carem
c
a
imunes:
a) uma criana;
c
b) uma criana ou mais;
c
c) estruture a funo de probabilidade e faa um grco da distribuiao de probabilidade.
ca
c
a
c
26) Um graflogo diz que pode determinar o sexo de uma pessoa com base em sua letra.
o
Para testar tal armaao, do-se 15 pares de amostras de caligraas a esse tcnico, cada par
c
a
e
sendo por um texto escrito por um homen e por uma mulher. Se esse tcnico for, na verdade,
e
incapaz de determinar seus julgamentos com base em palpites, qual a probabilidade de ele
e
identicar corretamente a caligraa masculina em 10 ou mais desses 15 pares?
27) Um produtor de sementes arma que apenas 5% das sementes que vende no germia
nam. Um comerciante compra regularmente um lote de sementes desse produtor, mas sob a
seguinte condiao: ele aceita o lote se, em 10 sementes escolhidas ao acaso, no mximo uma
c
a
no germinar; caso contrrio o lote todo rejeitado.
a
a
e
a) Se o produtor de fato tem razo, qual a probabilidade de um lote ser rejeitado?
a
b) Suponha que o produtor esteja mentindo, isto , na verdade a proporao de sementes
e
c
que no germinam de 10%. Qual a probabilidade de um lote ser aceito, segundo o critrio
a
e
e
acima?
28) Vericou-se que o nmero de quebras cromossmicas em um roedor, em qualquer
u
o
per
odo de um dia, num local polu
do, pode ser considerado como uma varivel aleatria
a
o
que tenha distribuiao de Poisson com parmetro 0,1. (Isto , em mdia haver uma quebra
c
a
e
e
a
cromossmica a cada 10 dias). Vamos supor que este roedor car 20 dias neste local polu
o
a
do
para experincia.
e
a) Qual a probabilidade de se encontrar menos de trs quebras cromossmicas?
e
o
b) Qual a probabilidade de se encontrar mais de duas quebras cromossmicas?
o
179
29) Em uma determinada regio ocorre em mdia 1 geada a cada 5 anos. Vamos denir
a
e
X como sendo o nmero de geadas nos prximos 5 anos.
u
o
a) Qual a probabilidade de ocorrncia de no mximo 1 geada nos prximos 5 anos?
e
e
a
o
b) Qual a probabilidade de ocorrncia de pelo menos duas geadas nos prximos 5 anos?
e
e
o
30) Um agricultor tem duas alternativas para a venda de seu produto que fornecido em
e
lotes de 500 sacos de sementes certicadas cada.
a) O comprador A, que paga 8,00 u.m. por saco e no exige nenhum teste.
a
b) O comprador B, que, para cada lote recebido retira 10 sacos ao acaso e os examina: se
todos os 10 esto dentro das especicaes, quanto ao poder germinativo, paga 5.000,00 u.m.
a
co
pelo lote; se entre os 10 sacos houver um fora da especicao, paga 4.000,00 u.m. pelo lote;
ca
e se entre os 10 houver dois ou mais sacos fora das especicaoes paga apenas 2.500,00 u.m.
c
pelo lote. Sabendo o agricultor ser de 10% a porcentagem real de sacos fora da especicaao
c
que produz, qual a melhor alternativa para a venda de seu produto?
sugesto: calcule o preo de venda esperado para cada alternativa.
a
c
31) Um Engenheiro Agrnomo pode atender, normalmente, 4 estabelecimentos agr
o
colas
por dia. Em mdia (), ele atende 3 estabelecimentos agr
e
colas por dia. Se o agrnomo
o
tiver que atender mais de 4 estabelecimentos agr
colas em um dia ele dever fazer horasa
extras para atender a essas solicitaoes. Qual a probabilidade do agrnomo ter que fazer
c
e
o
horas-extras? Sendo = 3.
32) Um produtor de camares de gua-doce tratados com uma alimentao especial,
o
a
ca
deseja comparar o sabor proporcionado por esta nova alimentao com o sabor produzido
ca
pela alimentaao tradicional. A cada um de 4 provadores so fornecidos 3 poroes exatac
a
c
mente iguais, em ordem aleatria, duas das quais com a alimentaao tradicional, e a outra
o
c
com alimentaao especial. Cada um desses provadores inquirido sobre a poro que prefc
e
ca
ere. Suponha que essas duas frmulas sejam igualmente saborosas. Seja Y o nmero de
o
u
provadores que preferem camares tratados com alimentao especial.
o
ca
a) Qual a probabilidade de pelo menos 3 dos 4 provadores preferirem a frmula nova?
e
o
b) Calcule o valor esperado de Y .
33) Um casal deseja ter 8 crianas. Chamamos de X a varivel nmero de lhos homens
c
a
u
e que a probabilidade de nascer lho do sexo masculino ou feminino de 50% para cada um,
e
responda:
a) Verique se esta situao pode ser estudada pela distribuiao binomial (atender as quatro
ca
c
suposioes do modelo). b) Calcule a E(X) e DP (X).
c
c) Qual a probabilidade que nasam no m
c
nimo 4 lhos homens?
d) Faa um grco, onde no eixo Y so as probabilidades (probabilidade de zero sucesso, 1
c
a
a
180
181
182
5.1
Introduo
ca
ex para X 0
fX (x) =
0
para X < 0
>0
183
0,57
0,63
0,69
0,75
0,81
0,87
0,93
0,99 1,05
f X (x )
x
0
Figura 5.2: Representaao grca do modelo exponencial
c
a
A representaao grca desse modelo dado na gura 5.2.
c
a
e
Dizemos que X tem distribuio exponencial ou X segue o modelo exponencial com
ca
parmetro , o nmero mdio de ocorrncias (igual a distribuiao de Poisson).
a
u
e
e
c
Por exemplo, num estudo de radioatividade, as cintilaes seguem a distribuiao de Poisco
c
son. Os instantes, quando os ncleos se desintegram, so representados por t1 , t2 , t3 , ..., tn .
u
a
Em adiao, os intervalos de tempo entre valores de t consecutivos, t1 , t2 , ... . Esta varivel
c
a
aleatria cont
o e
nua e segue o modelo exponencial.
Exemplo: se a f.d.p. de uma varivel aleatria X dada por:
a
o
e
fX (x) =
1
ba
para a x b
para outros casos.
184
f X (x )
1
b a
x
a
1
360
para 0 x 360
para outros casos.
185
1
.
12
ba
.
3600
f X (x )
1/360
360
1,30
0,97
0,97
0,65
0,65
0,32
0,32
0,00
0,50
1,00
1,49
0,00
1,99
0,50
1,00
1,49
1,99
x1 ex para x 0
0
para x < 0
186
P (a X b) =
fX (x)dx.
a
P (X = 0, 86666) =
fX (x)dx = 0
0,86666
pois a `rea sob um ponto do eixo x zero. No h contradiao nesse resultado, pois exa
e
a a
c
e
tremamente improvvel que X assuma esse valor particular. Alm do mais, existem innitos
a
e
outros nmeros na vizinhana de 0,86666, de tal forma que a probabilidade to pequena
u
c
e a
que tende a desaparecer. Ento, para variveis aleatrias cont
a
a
o
nuas, tanto faz escrever:
P (a X b) = P (a X < b) = P (a < X b) = P (a < X < b).
Formalmente, a deniao de varivel aleatria cont
c
a
o
nua a seguinte:
e
Denio: diz-se que X uma varivel aleatria cont
ca
e
a
o
nua, se existir uma funo f(.)
ca
denominada funo densidade de probabilidade (fdp) de X que satisfaa as seguites condies:
ca
c
co
a) fX (x) 0 para todo x (no-negativa)
a
+
b)
fX (x)dx = 1
fX (x)dx.
a
5.2
187
Podemos estender todas as denies feitas para varivel aleatria discreta, de modo
co
a
o
equivalente, `s variveis aleatrias cont
a
a
o
nuas.
Se X uma varivel aleatria cont
e
a
o
nua, dene-se a esperana matemtica de X, como
c
a
sendo:
+
X = E(X) =
xfX (x)dx.
2
X
= E (X E(X))
[X E(X)]2 fX (x)dx
ou,
2
V ar(X) = X = E(X 2 ) E 2 (X)
onde:
E(X 2 ) =
x2 fX (x)dx.
DP (X) = X =
E(X) =
xfX (x)dx =
x sen(x)dx.
d
=
dx
=x
1 d = dx
v=
vd
dv = sen(x)dx
sen(x)dx = cos(x).
Assim,
E(X) = x(cos x)
0
188
1(cos x)dx
E(X) = x(cos x) +
cos(x)dx
E(X ) =
x2 sen xdx.
= x2
d
= 2x d = 2xdx
dx
dv = sen(x)dx
v = sen(x)dx = cos(x)
E(X 2 ) = x2 (cos x)
2x(cos x)dx
E(X 2 ) = x2 cos x + 2
xcos(x)dx.
2
E(X 2 ) = [x2 cos x + 2xsen x + 2cos x]0
2
E(X 2 ) = [ 0 + 2 1 + 0] 2 1
4
2
E(X 2 ) = 2
V ar(X) = 2 1
V ar(X) = 3.
5.3
5.3.1
A Distribuio Normal
ca
Introduo
ca
189
800
700
600
500
400
300
200
100
0
190
800
Distribuio
Normal
700
600
Funo densidade
de probabilidade
500
400
300
200
100
0
i)
xfX (x)dx = .
E(X) =
DP (X) = 2 = .
191
fX(x)
192
Acabamos de levantar dois problemas relevantes das distribuioes normais, quais sec
jam: 1) existe uma innidade de distribuioes normais, isto implica na impossibilidade de
c
se elaborar uma tabela que contenha todas as probabilidades; deve-se ressaltar que estas
probabilidades podem ser obtidas com o uso de um software, por exemplo, Excel, e 2) a
integral da f.d.p. da distribuiao normal no pode ser calculada exatamente, e somente por
c
a
procedimentos de clculo numrico. Mas, foi desenvolvida uma alternativa, a qual soluciona
a
e
os problemas levantados, que o de se trabalhar com valores padronizados, isto , a mdia
e
e
e
tomada como origem, referncia do novo sistema (a nova mdia tem valor zero), e o desvio
e
e
e
padro como medida de afastamento a contar da mdia, ou seja, a nova unidade de medida.
a
e
e
Esta nova escala chamada de escala Z.
e
Dene-se a varivel Z como sendo:
a
X
Z=
,
onde:
Z = nmero de desvios padres a contar da mdia;
u
o
e
193
x
60
70
80
-4
-3
-2
-1
z
0
Mdia da varivel z
tem uma distribuiao N (0, 1), isto , tem distribuiao normal com mdia = 0 e varincia
c
e
c
e
a
2 = 1, cuja funao densidade de probabilidade dada por:
c
e
1 2
1
fZ (z) = e 2 z
2
z +.
194
2
2
V (Z) = E(Z ) [E(Z)]
E(Z) =
= E(Z 2 )
= E
1
1
E(X )2 = 2 E(X 2 2X + 2 )
2
1
[E(X 2 ) 2E(X) + 2 ]
2
1
1
=
[E(X 2 ) 2 ] = 2 [E(X 2 ) [E(X)]2 ]
2
1 2
= 1.
=
2
=
5.3.3
No apndice 3, temos a tabela da distribuiao normal padro. Esta tabela d a rea entre
e
c
a
a a
a mdia (zero), o valor de z e a curva, isto , a tabela d a probabilidade de um valor cair no
e
e
a
intervalo [0 a z]. Veja a gura 5.11, na qual a rea achurada corresponde a probabilidade.
a
A distribuio normal padro ou reduzida, absolutamente simtrica em relao a mdia
ca
a
e
e
ca
e
(origem), em funo disso, a tabela s dada para valores positivos de z. Se o valor calculado
ca
oe
de z for negativo, basta consider-lo como positivo e entrar na tabela diretamente. A era
a
a
total vale 100% ou 1, assim, acima de temos 50% da rea e abaixo de temos os outros
a
195
196
197
Figura 5.15: P (1 z 1)
= 0, 6826.
Exemplo 6. Qual a probabilidade de z estar entre 1 e 3 (P (1 z 3))?. Essa
e
probabilidade corresponde a rea achurada da gura 5.16.
a
P (1 z 3) = P (0 z 3) P (0 z 1)
= 0, 4986 0, 3413
= 0, 1573.
Exemplo 7. Suponha que X seja uma varivel aleatria com distribuio normal de
a
o
ca
Figura 5.16: P (1 z 3)
198
X
5
2
53
23
z
4
4
1
1
z
.
4
2
Portanto,
P (0, 25 z 0, 5) = P (0 z 0, 25) + P (0 z 0, 50)
= 0, 0987 + 0, 1915
= 0, 2902.
5.3.4
Muitas situaoes reais podem ser convenientemente descritas pelo modelo binomial.
c
Acontece que quando o nmero de repeties do experimento (n) for muito grande, para
u
co
se calcular as probabilidades binomiais, so necessrios clculos extensos e, as vezes, soa
a
a
mente poss a resoluao com o uso de computadores. Para n sucientemente grande e
e
vel
c
no prximo de 0 (zero) e de 1 (um), j se obtm boas aproximaes da normal ` binoa
o
a
e
co
a
mial. Se n aumenta, a necessidade de se ter prxima de 0,5 diminue. Para saber se a
o
aproximao boa, uma sugesto vericar se n 5 e n(1 ) 5, desde que n > 20 e
ca e
a e
0, 50.
=
Uma diculdade vericada neste tipo de aproximao que o modelo normal para
ca e
e
varivel aleatria cont
a
o
nua (pensar em intervalo), enquanto o modelo binomial para varivel
e
a
aleatria discreta. Para melhorar a aproximao, necessrio, um pequeno ajuste (correo
o
ca e
a
ca
de continuidade) que consiste em subtrair e/ou somar 1/2 aos valores da varivel aleatria
a
o
discreta. Mostraremos o procedimento atravs de um exemplo.
e
Exemplo. Consideremos a varivel aleatria Y : b(10; 1/2), isto , temos uma varivel
a
o
e
a
aleatria binomial com parmetros n = 10 e = 1/2, e desejamos calcular P (8 Y 10),
o
a
a gura 5.17 mostra a distribuio de Y e a curva normal, respectivamente. Chamando X
ca
a varivel com distribuio normal, temos:
a
ca
P (8 Y 10) = P (7, 5 X 10, 5) = P
199
7, 5 n
n(1 )
10, 5 n
n(1 )
7, 5 5, 0
10, 5 5, 0
z
1, 58113
1, 58113
200
Z2 = 1, 150349. Portanto,
X1 6
= X1 = 5, 4856.
0, 4472
X2 6
1, 150349 =
= X2 = 6, 5144.
0, 4472
1, 150349 =
201
60 0, 45 0, 55 = 3, 85356 ovos.
P (Y 30) = P (X 29, 5) = P (Z
= 0, 5 0, 24215
= 0, 25785.
b) A probabilidade de encontrarmos exatamente 30 ovos, :
e
30, 5 27
29, 5 27
Z
)
3, 85356
3, 85356
P (0, 65 Z 0, 91) = 0, 31859 0, 24215
= 0, 0764.
4) Suponhamos que 5% dos indiv
duos que foram inoculados contra um surto de gripe
tiveram reaoes srias indesejveis devido a inoculaao. Usando a aproximo normal `
c
e
a
c
ca
a
distribuio binomial, calcule a probabilidade de que mais de 16 indiv
ca
duos dos 200 indiv
duos
inoculados tenham tais reaoes.
c
Com as informaoes do problema temos que:
c
= 0, 05
n = 200
n = 200 0, 05 = 10
n(1 ) = 200 0, 95 = 190
n(1 ) = 3, 0822.
16, 5 10
)
3, 0822
= P (Z 2, 1089)
P (X 16, 5) = P (Z
= 0, 5 0, 48257
= 0, 0174
= 1, 74%.
202
5.3.5
Exerc
cios propostos
1) Determinar a rea limitada pela curva normal em cada um dos casos abaixo:
a
a) entre z=0 e z=1,2;
b) entre z=-0,68 e z=0;
c) entre z=0,46 e z=2,21;
d) entre z=-0,81 e z=1,94;
e) ` esquerda de z=-0,6;
a
f) ` direita de z=-1,23
a
g) ` direita de z=2,05 e ` esquerda de z=1,44.
a
a
h) entre z=-1 e z=+1
i) entre z=-1,96 e z=+1,96
j) entre z=-2,56 e z=+2,56
2) A altura dos indiv
duos de uma populaao distribui-se normalmente com mdia de
c
e
1,56 m e desvio padro de 0,09 m. Qual a percentagem nesta distribuiao, de indiv
a
c
duos
com altura de 1,80 m ou mais?
3) O peso mdio das reses, que se encontram num curral de uma determinada fazenda,
e
de 200 kg, e o desvio padro de 10kg. Em 120 animais retirados ao acaso do curral,
e
a e
quantos pesaro mais de 185 kg? Vamos considerar que o peso das reses tenha distribuo
a
ca
normal.
4) Foi feito um estudo sobre a altura de plantas de milho de certo h
brido, observando-se
que ela se distribui normalmente com mdia 2,20 m e desvio padro de 0,20 m. Qual a
e
a
porcentagem de plantas com altura: a)entre 2,15m e 2,25m; b)entre 2,00m e 2,40m; c)acima
de 2,30m.
5) Em indiv
duos sadios, o consumo renal de oxignio tem distribuiao normal de mdia
e
c
e
3
3
12 cm /min e desvio padro 1,5 cm /min.
a
a) Determinar a proporao de indiv
c
duos sadios com consumo: inferior a 10 cm3 /min; superior a 8 cm3 /min; entre 9,4 e 13,2 cm3 /min; igual a 11,6 cm3 /min.
b) Determinar o valor do consumo renal que superado por 98,5% dos indiv
e
duos sadios.
c) Determinar uma faixa simtrica em torno do valor mdio que contenha 90% dos valores
e
e
do consumo renal.
6) A observaao dos pesos, X, de um grande nmero de espigas de milho mostrou que essa
c
u
varivel normalmente distribu com mdia = 90g e desvio padro = 7g. Num proa
e
da
e
a
grama de melhoramento, entre outras caracter
sticas, uma cultivar deve satisfazer a condio
ca
78 < X < 104g, onde X a varivel aleatria peso da espiga. Nessas condioes, tendo -se
e
a
o
c
203
204
205
206
207
a
a e
um zigoto (clula unica, o vulo fertilizado), para se vericar se o ncleo pode desenvolver-se
e
o
u
normalmente. Se a probabilidade de que um transplante singelo seja bem sucedido de 0,65,
e
qual a probabilidade de mais de 70 transplantes, em 100, obterem sucesso?
e
34) Para comparar a produao de duas cultivares, A e B, de uma determinada espcie
c
e
vegetal, foram plantadas 60 reas de terras de 5 3 = 15m2 , separadas em pares (30 pares)
a
segundo a fertilidade do solo (isto , existe homogeneidade da fertilidade dentro do par; entre
e
os pares h diferena de fertilidade). Uma rea de cada par recebeu a cultivar A e a outra
a
c
a
rea do par recebeu a cultivar B. Dentro de cada par foi feito um sorteio para saber qual
a
a rea que receberia a cultivar A e a B, respectivamente. Veja gura 5.18. As produoes
a
c
nas 60 reas (30 pares) das cultivares foram anotadas, sendo que em 19 pares a cultivar A
a
apresentou uma maior produao do que a cultivar B. Se no h qualquer diferena entre as
c
a a
c
duas cultivares quanto a produo, isto , o fato da cultivar A produzir mais do que a B, ou
ca
e
a cultivar B produzir mais do que a A, aleatria, casual. Nesse caso, a probabilidade p de
e
o
que a produao de uma cultivar de um par seja maior que a produao de uma cultivar de
c
c
um par seja maior que a produao da outra cultivar ser de 0,50.
c
a
a) Calcular a probabilidade desse resultado (em 19 pares a cultivar A teve maior produao)
c
ter ocorrido por acaso. Use a aproximaao normal ` binomial.
c
a
b) Caso essa probabilidade for menor ou igual a 5%, considera-se que essse resulatdo obtido
no experimento indica que a cultivar A realmente mais produtiva que a cultivar B. Qual
e
a sua concluso?
a
35) Dez por cento dos ps de milho que foram inoculados contra um certo v
e
rus tiveram
reaes srias indesejveis devido a inoculao. Calcule a probabilidade de que mais de 20
co
e
a
ca
ps de milho dos 150 ps inoculados tenham tais reaoes.
e
e
c
208
Par 1
Par 2
Par 3
Par 30
Fertilidade
B
A
+
Figura 5.18: Projeto experimental para comparao de duas cultivares
ca
6
6.1
209
Plano de
Populao
Amostra
Amostragem
Inferncia
Um experimento
Generalizaes
(, , )
( X , P, S)
Produao
c
84
82 90
86 80
91 85
10
79 81 82
4,0552
210
por planta, x = 84 kg. Portanto, estamos usando a mdia da amostra, X, como estimador
e
da mdia verdadeira, . Essa estimativa chamada de estimativa pontual, pois origina um
e
e
unico valor da estimativa do parmetro. Esse um racioc
a
e
nio tipicamente indutivo, onde se
parte do particular (amostra) para o geral (populao). Esse um exemplo de problema de
ca
e
estimao.
ca
Um fato importante que se observa quando trabalhamos com amostras, que sempre
e
vamos ter que a mdia verdadeira, , igual a mdia na amostra, X, mais um erro de
e
e
e
amostragem. A representaao disso dada por:
c
e
= X + erro amostral
211
Tabela 6.1: Produao por planta, em Kg, de macs das cultivares Gala e Golden
c
a
Plantas
Variedades 1
2
3 4
5
6 7 8
9
10 Mdia Desvio padro
e
a
Gala
Golden
84
95
82 90
102 85
86 80
93 104
91 85
89 98
79 81
99 107
82
106
84,0
97,8
4,06
7,32
Golden sob as mesmas condies descritas para a cultivar Gala. Os dados das duas amostras
co
aleatrias esto apresentadas na tabela 6.1.
o
a
As estimativas da produo mdia das duas cultivares, calculadas com os dados das duas
ca
e
amostras foram 84 Kg/planta e 97,8 kg/planta para as cultivares Gala e Golden, respectivamente. Portanto, a diferena vericada entre as duas cultivares, com essas duas amostras,
c
foi de 13,8 kg/planta a favor da cultivar Golden.
Observando-se os dados individualmente, vericamos que para as plantas 3 e 6, as
produoes na cultivar Gala foram superiores a da Golden. Portanto, podemos pensar que
c
e
perfeitamente poss obtermos um par de amostras, dentre todas as amostras poss
vel
veis de
serem sorteadas, no qual a produo mdia da cultivar Gala superior a da Golden. Isso
ca
e
e
devido simplesmente a amostragem, ou seja, variaoes devido a amostragem.
c
Assim, o problema que se apresenta, o de decidir o que uma diferena real (signicae
e
c
tiva), isto , devido ` cultivar, ou uma diferena casual (no signicativa), isto , devido a
e
a
c
a
e
variaao casual na amostra.
c
Deve car claro que na prtica retirada somente uma amostra de cada cultivar.
a
e
Logicamente, o pesquisador pretende generalizar os resultados obtidos na anlise esa
tat
stica, isto , ele deseja saber se h diferena signicativa entre as mdias verdadeiras
e
a
c
e
Gala e Golden (desconhecidas pelo pesquisador). Como ele est trabalhando com duas
a
amostras aleatrias, dentre um grande nmero de poss
o
u
veis amostras, ele no pode fazer
a
armaes com 100% de certeza, mas ele pode perfeitamente fazer uma armao probaco
ca
bil
stica, indicando a probabilidade de erro ao fazer uma armao sobre uma hiptese em
ca
o
teste. Para isso, utilizaremos as distribuioes de probabilidades, como veremos nas prximas
c
o
sees.
co
6.2
Estat
sticas e Parmetros
a
Na seao anterior, utilizamos uma notaao prpria para diferenciar medidas usadas para
c
c
o
descrever caracter
sticas da amostra e da populao. Essa diferenciao bastante util em
ca
ca e
212
c
de peixes com comprimento total menor do que 50 mm p = 46%.
e
Um resumo da notaao utilizada apresentada no quadro a seguir.
c
e
Notaao utilizada para representar parmetros, estat
c
a
sticas (ou estimadores) e estimativas
Caracter
stica
Parmetros
a
Mdia
e
Proporo
ca
Varincia
a
Desvio padro
a
6.3
Estat
sticas ou Estimadores
X
P
S2
S
Estimativas
x
p
s2
s
Como vimos nos exemplos anteriores, um pesquisador trabalha com apenas uma parte
da populaao, isto , com uma amostra. A maneira como selecionada uma amostra de
c
e
e
e
extrema importncia, pois atravs dos dados amostrais que sero calculadas as estimativas
a
e
e
a
dos parmetros desconhecidos da populao e, tambm, sero feitas armativas sobre os
a
ca
e
a
mesmos.
a
E fcil de se imaginar, que um ponto fundamental, o pesquisador ter um bom conhece
imento da populao, pois quanto mais ele conhecer a populao, mais informativa ser a
ca
ca
a
amostra selecionada. Por exemplo, se um Bilogo deseja fazer um estudo sobre a poluio
o
ca
de uma ba em peixes do genro Bagre, ele vai precisar coletar uma amostra de peixes
a,
e
desse gnero e avaliar o nmero de microncleos em 5000 clulas. Para se ter uma amostra
e
u
u
e
representativa, necessrio ter um bom conhecimento sobre o comportamento desse tipo de
e
a
213
peixe.
Em resumo, preciso garantir que a amostra seja representativa da populaao, isto , uma
e
c
e
amostra deve posssuir as mesmas caracter
sticas bsicas da populaao, no que diz respeito
a
c
`s variveis que desejamos pesquisar.
a
a
Vamos, aqui, apresentar novamente os conceitos de populao e amostra, devido a sua
ca
importnica para o estudo da inferncia estat
a
e
stica. Populaao consiste de todos os valores
c
poss
veis de uma varivel. Estes valores no precisam ser todos diferentes, nem um nmero
a
a
u
nito. Exemplos: 1) todos os valores poss
veis da produao de milho por hectare; 2) todos
c
os pesos ao nascer de coelhos da raa gigante; 3) todos os valores de dimetros de Biomc
a
phalarias do Poo do Crrego Grande; 4) todos os valores de microncleos de roedores de
ca
o
u
uma regio polu
a
da. Por outro lado, uma amostra, uma parte (subconjunto) da populaao.
e
c
Exemplos: 1) os rendimentos de milho, em kg/ha, de uma amostra de 5 unidades experimentais (canteiros); 2) os pesos ao nascer de uma ninhada de coelhos da raa gigante; 3) os
c
dimetros de uma amostra de 30 Biomphalarias do Poo do Crrego Grande; 4) os valores
a
ca
o
de microncleos de uma amostra de 25 roedores.
u
As situaoes de amostragem, nas cincias biolgicas e agronmicas, na prtica, so
c
e
o
o
a
a
inmeras e podem ser mais ou menos complexas. Vejamos alguns exemplos de seleao de
u
c
amostras.
Exemplo 1. Desejamos desenvolver uma pesquisa scio-econmica, sobre os agricultores
o
o
integrados ` uma empresa, onde estamos interessados em diversos parmetros relativos a
a
a
atividade agropecuria. A populao constitu por todos os agricultores integrados ` ema
ca e
da
a
presa. Podemos denir vrias variveis associadas a cada agricultor (propriedade agr
a
a
cola).
Essas variveis sero observadas sobre uma amostra de 200 agricultores. Para selecionar os
a
a
agricultores que participaro da amostra, sorteamos, com regras bem denidas, 200 chas
a
de um chrio, onde conste todos os agricultores integrados.
a
Exemplo 2. Estamos interessados numa pesquisa para tratar a glicemia7 em peixes
Mandi8 atravs da injeao de glucagnio. Estamos interessados em parmetros sobre o teor
e
c
o
a
de aucar no sangue desses peixes. A populaao constitu por todos os peixes Mandi
c
c e
da
do local de estudo. Nesse caso, o pesquisador no tem acesso a toda a populaao de peixes
a
c
Mandi. Assim, ele vai selecionar (amostra) aqueles que esto acess
a
veis. Por exemplo, se
desejamos uma amostra de 15 peixes, o pesquisador poder utilizar os peixes capturados com
a
214
6.4
215
Tabela 6.2: Distribuio de frequncias das alturas dos alunos do curso de estat
ca
e
stica bsica.
a
Altura Frequncias absolutas Frequncias relativas
e
e
1,50
1,60
1,70
1,80
1,90
2,00
5
10
15
8
5
2
0,1111
0,2222
0,3333
0,1778
0,1111
0,0445
Total
45
1,0000
Em populaes pequenas e a amostragem feita sem reposio, implica que a distribuio de X2 depende
co
e
ca
ca
216
e
u
o
tabela dada no apndice 7. As tabelas de nmeros aleatrios contm os 10 algarismos (0, 1,
e
e
u
o
e
2, 3, 4, 5, 6, 7, 8, 9) e so formadas por sucessivos sorteios do conjunto deles. Essas tabelas
a
foram exaustivamente testadas e a sua aleatoriedade garantida.
e
Na tabela de nmeros aleatrios, esses nmeros podem ser lidos isoladamente, ou em
u
o
u
grupos de dois, trs, quatro, ou mais algarismos; podem ser lidos em qualquer ordem: por
e
de X1 .
217
colunas em qualquer sentido, por linhas em qualquer sentido, diagonalmente. Vamos, atravs
e
de um exemplo, fazer uma ilustrao do uso da tabela de nmeros aleatrios.
ca
u
o
Exemplo. A nalidade da pesquisa determinar o peso mdio, o peso total, em
e
e
toneladas, e a porcentagem de fornecimentos abaixo de X toneladas, de cana-de-aucar,
c
entregue pelos fornecedores ` indstria. A populao formada por 250 fornecedores de
a
u
ca e
cana-de-aucar. Deseja-se sortear uma amostra de 21 fornecedores.
c
Primeiramente, os 250 fornecedores so listados por ordem alfabtica. Aps isso, a popa
e
o
ulao numerada de 1 at 250. Como a identicaao exigiu nmeros com 3 algarismos,
ca e
e
c
u
e
necessrio lermos nmeros de 3 algarismos na tabela de nmeros aleatrios. Utilizando a
a
u
u
o
tabela (apndice 7), decidimos ler nmeros das colunas 8, 9 e 10, e, vamos, ler percorrendo
e
u
as colunas de cima para baixo, os nmeros encontrados foram:
u
826 97 820
232 497 174
406 207 313
140 490 499
537 56 331
902 910 7
611 264 893
883 233 640
928 741 234
138 694 806
176
397
348
134
742
929
441
655
746
952
452
419
963
719
981
775
809
520
312
876
253
772
718
424
331
941
136
A amostra selecionada formada pelos nmeros em itlico na matriz. Atravs desses nmeros
e
u
a
e
u
identica-se os agricultores que vo fazer parte do estudo.
a
Em resumo, para selecionarmos uma amostra, com a utilizaao da tabela de nmeros
c
u
aleatrios, devemos seguir os seguintes passos:
o
c
c
1) faa uma lista dos itens da populaao;
2) numere os itens da lista, a comear de 1;
c
u
u
3) leia os nmeros na tabela de modo que o nmero de algarismos em cada um seja
igual ao nmero de algarismos do ultimo nmero da sua listagem. Exemplo, se o ultimo
u
218
5) use os nmeros assim identicados para coletar os itens que vo fazer parte da
u
a
amostra.
Exerc
cio. A nalidade da pesquisa o de determinar o nmero de insetos/quadrante
e
u
e o total de insetos na rea. Sortear 15 quadrados de um total de 100, de 10 m2 cada.
a
As tcnicas estat
e
sticas que veremos nas seoes subsequntes deste curso, pressupem que
c
e
o
a amostra foi selecionada aleatoriamente ou por algum processo equivalente. Embora, para
os dados de uma pesquisa, nem sempre uma amostra aleatria poss
o e
vel, tomando-se algumas precauoes especiais no delineamento da pesquisa, esta suposiao (amostra aleatria)
c
c
o
pode ser pertinente, por exemplo, num experimento, fazendo-se a casualizaao (sorteio) dos
c
tratamentos `s unidades experimentais.
a
6.5
Distribuies Amostrais
co
O objetivo pelo qual selecionamos uma amostra, para obter estimativas de parmetros
e
a
2
desconhecidos da populaao (, , ), fazer armaes sobre os mesmos e, tambm, nos
c
co
e
auxilia na vericaao da forma (distribuio) como a estat
c
ca
stica se distribue.
Vamos raciocinar em cima da seguinte pergunta, relativa ao exemplo em que o pesquisador
est interessado em avaliar a produo mdia (), por planta, da cultivar de ma Gala. O
a
ca
e
ca
valor da produo mdia por planta (), numa amostra de 10 plantas, vai ser um valor
ca
e
x
prximo da verdadeira produao mdia referente a todas as plantas da cultivar Gala?10
o
c
e
Como o valor da verdadeira produao mdia por planta desconhecido, responderemos
c
e
e
a pergunta atravs do estudo de como se distribuem os poss
e
veis valores de x.
e
a
tambm, diferentes da verdadeira mdia da populao, simplesmente devido a fatores cae
e
ca
suais na amostragem. Esta variabilidade conhecida como variabilidade amostral. Portanto,
e
torna-se imprescind
vel, quando vamos fazer inferncias sobre parmetros populacionais,
e
a
levar em consideraao a variabilidade amostral.
c
Vamos estudar a variabilidade amostral atravs das distribuioes amostrais. Estas dise
c
tribuies amostrais so descritas pelas distribuies de probabilidades, como a distribuiao
co
a
co
c
normal, a binomial. Neste caso, estas so conhecidas como distribuioes amostrais.
a
c
A gura 6.3 ilustra o esquema de uma distribuiao amostral. Na gura 6.3, temos:
c
10
Depende da estat
stica, do tamanho da amostra e da variabilidade na populao.
ca
219
Amostra 1
Uma populao
com uma
caracterstica X e
os parmetros de
interesse:
(, , 2)
2
( x1 , s1 , p1 )
Amostra 2
( x 2 , s2 , p 2 )
2
.
Amostra k
.
2
( xk , sk , pk )
220
68
80
84
87
6/16=0,3750
1/16=0,0625
221
N n = 42 = 16
A,B
A,C
A,D
B,C
B,D
C,D
B,A
C,A
D,A
C,B
D,B
D,C
A,A
B,B
C,C
D,D
68;80
68;84
68;87
80;84
80;87
84,87
80;68
84,68
87;68
84,80
87;80
87;84
68;68
80,;80
84;84
87;87
1/2
1/2
1/2
0/2
0/2
0/2
1/2
1/2
1/2
0/2
0/2
0/2
2/2
0/2
0/2
0/2
74,0
76,0
77,5
82,0
83,5
85,5
74,0
76,0
77,5
82,0
83,5
85,5
68,0
80,0
84,0
87,0
0,6
Probabilidades
0,5
0,4
0,3
0,2
0,1
0,0
0,0
Proporo populacional
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
Propores amostrais
222
Como a nossa amostra de tamanho dois, imposs obter uma proporo amostral
e
e
vel
ca
com valor igual a 25%. Porm, podemos observar que a verdadeira proporo (populacional)
e
ca
encontra-se entre 0% e 50%, que so os valores que apresentam as maiores probabilidades
a
de ocorrncia na amostra. A forma da distribuio assimtrica.
e
ca e
e
Como vimos no estudo de variveis aleatrias discretas, contagens ou propores, podem
a
o
co
ser estudadas pela distribuiao binomial. Vamos, para a situaao em estudo, vericar se as
c
c
pressuposioes do modelo binomial so atendidas.
c
a
c
1) Temos duas repetioes (n = 2).
2) Em cada repetiao, somente temos duas posssibilidades: abaixo ou acima de 75 kg.
c
3) As probabilidades permanecem constantes em todas as repeties do experimento (amostrgem
co
com reposiao).
c
4) Os resultados das repetioes so independentes (amostra aleatria).
c
a
o
Portanto, as pressuposies do modelo binomial so todas atendidas. Da tabela da disco
a
tribuio binomial (Apndice 1), para n = 2 e = 0, 25, obtemos:
ca
e
P (X = 0) = P rob(p = 0, 00) = 0, 5625;
P (X = 1) = P rob(p = 0, 50) = 0, 3750;
P (X = 2) = P rob(p = 1, 00) = 0, 0620.
Como podemos ver, obtemos exatamente os mesmos valores da distribuiao amostral das proc
poroes. Assim, na prtica, no preciso construir empiricamente a distribuiao amostral
c
a
a e
c
das propores, pois, a mesma, representada pela distribuiao binomial. Portanto, esco
e
c
tas distribuies representam uma situaao real. Como veremos, uma outra distribuio
co
c
ca
amostral muito utilizada a distribuio normal.
e
ca
A partir de agora, construiremos as distribuies amostrais utilizando diretamente a
co
tabela da distribuio binomial.
ca
A distribuiao amostral da proporo de su
c
ca
nos com peso abaixo de 75,0 kg, para uma
amostra de tamanho n = 3, dada por:
e
p
0/3
P rob(P = p) 0,4219
1/3
2/3
3/3
0,4219
0,1406
0,0156
223
0,55
Probabilidades
0,45
0,35
0,25
0,15
0,05
-0,05
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
Propores amostrais
Probabilidades
0,45
0,35
0,25
0,15
0,05
-0,05
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
Propores amostrais
0/4
P rob(P = p) 0,3164
1/4
2/4
3/4
4/4
0,4219
0,2109
0,0469
0,0039
224
Probabilidades
0,30
0,24
0,18
0,12
0,06
0,00
0,0
0,2
0,4
0,6
0,8
1,0
Propores amostrais
0/10
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10
P rob(P = p)
0,0563
0,1877
0,2816
0,2503
0,1460
0,0584
0,0162
0,0031
0,0004
0,0000
0,0000
A representaao grca desta distribuiao dada na gura 6.7. Observa-se, claramente, que
c
a
c e
a medida que n aumenta, temos:
a distribuiao amostral das proporoes aproxima-se da distribuiao normal, com =
c
c
c
0, 25;
a variabilidade amostral diminui, isso implica que amostras grandes tem forte tendncia
e
a fornecer uma estat
stica amostral prxima do verdadeiro valor do parmetro popuo
a
lacional;
as propores amostrais prximas a 0,25 so as que apresentam maiores probabilidades
co
o
a
de ocorrncia.
e
225
(1 )
n
(1 )
n
N n
.
N 1
n1 =
n(1 ).
226
(1 )
=
n
0, 10(0, 90)
= 0, 0268.
125
0, 09 0, 10
p
=
= 0, 37.
P
0, 0268
z2 =
0, 11 0, 10
p
=
= 0, 37.
P
0, 0268
(1 ) = (1 0, 05) = 0, 95
P =
0, 05(0, 95)
= 0, 0154.
200
0, 06 0, 05
= 0, 65.
0, 0154
P rob(P 0, 06) = P rob(z 0, 65) = 0, 5 P rob(0 z 0, 65) = 0, 5 0, 2422 = 0, 2578 = 25, 78%.
0, 04 0, 05
= 0, 65.
0, 0154
227
minutos sorteia-se uma amostra de 50 peas e, havendo mais de 15% de defeituosas, pra-se
c
a
a produao para vericaoes. Qual a probabilidade de uma parada desnecessria?
c
c
a
Temos que n = 50(0, 10) = 5. Obtemos para a mdia e o desvio padro os seguintes
e
a
valores:
= 0, 10
(1 ) = (1 0, 10) = 0, 90
P =
0, 10(0, 90)
= 0, 0424.
50
n(1 ) =
0, 50 10
0, 5 10
z
3
3
= P rob(3, 50 z 3, 17) = 0, 49977 0, 49924 = 0, 00053.
6.5.2
228
68
80
84
87
(x )2
208, 75
=
= 52, 18 kg 2 .
4
N
2 =
=
52, 18 = 7, 22 kg.
2 =
estat
stica amostral X. Os resultados poss
veis so apresentados na tabela 6.4.
a
Os valores da mdia, varincia e desvio padro da distribuiao amostral das mdias valem:
e
a
a
c
e
X = E(X) =
1
68 +
16
xp() =
x
2
74 + ... +
16
1
87
16
= 79, 75 kg.
2
X
k
x
i=1 (i
)2 ni
n
1(68 79, 75)2 + 2(74 79, 75)2 + ... + 1(87 79, 75)2
=
16
2
= 26, 09 kg .
X =
229
3,0
Freqncias absolutas
2,5
2,0
1,5
1,0
0,5
0,0
66
70
74
78
82
86
90
Mdias amostrais
52, 18
2
=
= 26, 09 kg 2 .
n
2
Portanto, o desvio padro da mdia dado por:
a
e
e
2
X =
X = .
2
Mostramos como ca a mdia e a varincia da distribuiao amostral da mdia para
e
a
c
e
uma amostra de tamanho n = 2. Agora, Vamos vericar a forma da distribuio amostral.
ca
A representao grca dada na gura 6.8. A mdia verdadeira encontra-se entre as
ca
a
e
e
mdias amostrais com maior frequncia de ocorrncia. Como o tamanho da amostra muito
e
e
e
e
pequeno, no podemos concluir sobre o modelo da distribuiao amostral das mdias. Isto
a
c
e
ser feito quando o tamanho da amostra for maior.
a
Considerando amostras aleatrias simples de tamanho n = 3, selecionadas com reposio,
o
ca
230
da populaao com 4 su
c
nos, temos os seguintes resultados:
Mdia Frequncia
e
e
Mdia Frequncia
e
e
68,00
72,00
73,33
74,33
76,00
77,33
78,33
78,67
79,67
80,00
80,67
81,33
82,33
82,67
83,67
84,00
84,67
85,00
86,00
87,00
1
3
3
3
3
6
6
3
6
1
3
3
3
3
6
1
3
3
3
1
2
X =
2
52, 18
=
= 17, 40 kg 2 .
n
3
X =
17, 40 = 4, 17 kg.
Sabemos, que a mdia e a varincia de uma distribuiao amostral de mdias sempre vo ser
e
a
c
e
a
dadas por:
X = .
2
.
n
Quando ocorrer a desigualdade, n 0, 05N , devemos proceder a correo para populaao
ca
c
nita do desvio padro, o qual torna-se:
a
2
X =
X =
N n
.
N 1
231
Freqncias absolutas
6
5
4
3
2
1
0
66
70
74
78
82
86
90
Mdias amostrais
232
Figura 6.10: Histogramas da distribuio amostral das mdias para diversas populaoes,
ca
e
c
para diversos tamanhos de amostras. Fonte: Bussab & Morettin (1987)
233
X = .
n
Quando for vericada a desigualdade, n 0, 05N , ou seja, a amostra representa 5%
ou mais da populaao, procedemos a correo para populaao nita no desvio padro,
c
ca
c
a
cando:
N n
X =
.
n N 1
e
c
3. Quando o tamanho da amostra sucientemente grande, independente da distribuiao
da populaao bsica, a distribuiao amostral das mdias, aproxima-se cada vez mais
c a
c
e
de uma distribuiao normal.
c
Exemplo 1. Uma nova raao para aumento de peso deve ser aplicada a uma amostra
c
aleatria de 25 frangos (n = 25), de um grande lote (o lote a populao). Se se espera que
o
e
ca
seja de 2 kg o desvio pado () do ganho de peso no per
a
odo de um ms, qual a probabilidade
e
de que a mdia dessa amostra (X), dira da mdia de todo o lote () em mais do que 0,5
e
e
| 0, 5)? considerando que os frangos tratados com a nova rao no tem um
kg (| X
ca a
ganho de peso maior do que os tratados com a rao padro.
ca
a
Inicialmente, passamos a calcular o valor da varivel z.
a
z=
0, 5
x
0, 5
= =
= 1, 25.
X
0, 4
2/ 25
(6.1)
234
12
X = = 2 kg.
36
58 60, 5
= 1, 25
2
z2 =
62 60, 5
= 0, 75.
2
55 60, 5
= 2, 75
2
P (X 55) = P (z 2, 75)
= 0, 0030.
Item c),
z=
65 60, 5
= 2, 25
2
P (X 65) = P (z 2, 25)
= 0, 0122.
Exerc
cios resolvidos
1. O governo coleta uma amostra aleatria de 400 estudantes da UFSC, para obter uma
o
indicao dos que so a favor do ensino superior pago. Determine a probabilidade de obter
ca
a
uma proporo amostral que dira por mais de 3% da proporao populacional de estudantes
ca
c
que so a favor do ensino pago, se esta proporao 10%.
a
c e
0, 07 0, 10
0, 13 0, 10
P rob(0, 07 P 0, 13) = P rob
z
0,10(0,90)
400
= P rob(2 z 2) = 0, 9545.
235
0,10(0,90)
400
de, para uma amostra de n = 35 camares, obtermos uma mdia X < 22mm? b) Qual deve
o
e
= P (z 4, 02)
7, 8/ 35
= 0, 5 0, 49997 = 0, 00003 = 0, 003%.
P (X 22) = P
6.6
22
= 24, 1688mm.
1, 3184
Exerc
cios Propostos
236
237
7.1
Introduo
ca
Estimaao o nome tcnico para o processo que consiste em utilizar os dados de uma
c e
e
amostra para avaliar parmetros populacionais desconhecidos, ou, como o prprio nome
a
o
indica, estimar os mesmos. Dentre as diversas caracter
sticas (parmetros) de uma populao
a
ca
que podem ser estimadas, ns vamos estudar as mais utilizadas, quais sejam: a mdia, a
o
e
proporo e o desvio padro.
ca
a
Um pesquisador sempre est desenvolvendo um processo de estimao. Talvez, os rea
ca
sultados estat
sticos apresentados neste cap
tulo, sejam os mais importantes para quem faz
pesquisa. Por exemplo, um Bilogo pode estar interessado na proporao de microncleos em
o
c
u
5000 clulas sangu
e
neas em peixes do genro bagre; um Agrnomo pode estar interessado na
e
o
estimao da produao de uma cultura ou de uma criaao. Outros exemplos, estimaao dos
ca
c
c
c
preju
zos causados pelo ataque de uma praga ou doena; estimar o dimetro de caramujos;
c
a
estimar o tamanho de Lulas encontradas no trato digestivo de Atuns; tamanho de crustceos
a
da classe Malacostraca e sub-classe Eumalacostraca, popularmente conhecida com o nome
de Caprelas; estimativas de parmetros estat
a
sticos genticos (varincia gentica, ambiental,
e
a
e
fenot
pica).
7.2
E(X) = X = e E(P ) = P = ;
238
consistente, quer dizer, que para amostras grandes, a diferena entre o estimador e o
c
parmetro tende a ser pequena, isto , a varincia tende a zero, e o estimador noa
e
a
e a
2
viesado. Por exemplo, a V ar(X) = /n, indica que quando n tende para o innito,
a V ar(X) tende para zero. Da mesma forma, a V ar(P ) = (1 )/n, tende para
239
Figura 7.1: Resultados de 15 tiros dos ries A, B, C e D (ilustrao das propriedades dos
ca
estimadores). Fonte: Bussab & Morettin (1987).
240
n
i=1 (xi
x)2
.
n1
i =
o de repetioes
n
c
7.3
Pelos fatos observados na seo anterior, podemos concluir que necessrio que existam
ca
e
a
mtodos apropriados para encontrarmos os estimadores dos parmetros em estudo. Para
e
a
resolver o problema de como encontrar os estimadores mais adequados, os dois mtodos mais
e
utilizados so: 1) mtodo dos mnimos quadrados e 2) mtodo da mxima verossimilhana.
a
e
e
a
c
Vamos apresentar o mtodo da mxima verossimilhana.
e
a
c
241
n k
(1 )nk .
k
Para n = 3 e k = 2, temos:
P (X = 2) =
3 2
(1 )1 = 3 2 (1 ).
2
(7.1)
Queremos encontrar o valor de que maximiza a funo 7.1. O procedimento para esse
ca
m o que veremos a seguir. Calculando-se a derivada de L() e igualando-se a zero temos:
e
L () = 2(1 ) + 2 (1)
= 2(1 ) 2
= 2 2 2 2
= 2 3 2
= (2 3) = 0
a
do que segue que = 0 ou = 2/3. E fcil ver que o ponto de mximo p = 2/3, basta
a
e
substituir estes dois valores de em 7.1. Portanto, o estimador de mxima verossimilhana
a
c
p = 2/3. Podemos chegar a esta mesma concluso encontrando-se o ponto cr
e
a
tico, calcular
a derivada segunda, e observar se temos um ponto de mximo (o valor da derivada segunda,
a
no ponto cr
tico, negativo). O ponto cr
e
tico dado por:
e
(2 3) = 0 2 3 = 0 = 2/3.
A derivada segunda, em relao a , ca:
ca
(2 3) + (3) 2 6(2/3) = 2.
Como a segunda derivada negativa, temos que p = 2/3 ponto de mximo.
e
e
a
242
7.4
e
ca
e
boa idia da variabilidade do parmetro. Devido a grande importncia dos intervalos de
e
a
a
conana passamos, agora, a estud-los com mais detalhes.
c
a
Intervalos de Conana
c
Como j tivemos oportunidade de estudar, o processo de obtenao de amostras aleatrias
a
c
o
produz estimativas cujos valores so diferentes do parmetro populacional, e tambm difera
a
e
entes entre si, gerando, o que denominamos de variabilidade amostral da estat
stica. A
variabilidade amostral estudada atravs das distribuioes amostrais. Ns j estudamos
e
e
c
o a
no cap
tulo 6, as distribuioes amostrais da mdia e da proporo, portanto, conhecemos o
c
e
ca
modelo probabil
stico, a mdia e a varincia das mesmas.
e
a
Devido a variabilidade amostral, importante que se faa uma estimativa intervalar para
e
c
um parmetro populacional. Essa estimativa intervalar nos d um intervalo dentro do qual
a
a
esperamos, com um certo grau de conana, que o parmetro se encontre.
c
a
243
a o
desconhecido, isto , prximo da mdia de idade de todos os alunos do curso?
e
o
e
Para responder a esta pergunta, ns devemos levar em consideraao a distribuiao amostral
o
c
c
da mdia. Do estudo sobre distribuies amostrais, vimos que a distribuiao amostral das
e
co
c
mdias normal ou aproximadamente normal na maioria das situaoes prticas, para um
e
e
c
a
tamanho de amostra sucientemente grande.
Sendo normal, simtrica em torno da mdia , sabemos que 68% das mdias amostrais
e
e
e
esto a menos de 1 desvio padro de cada lado da mdia da distribuio amostral, que
a
a
e
ca
e
igual a mdia da populao, . Vejamos os clculos.
e
ca
a
P (1 Z 1) = P
= P
= P
= P
X
1
/ n
= 68%
1 X 1
= 68%
n
n
1 X + 1
= 68%
n
n
= 68%.
1 X + 1
n
n
A gura 7.2 mostra os resultados. Observamos que 32% das mdias amostrais estaro afase
a
tadas mais do que 1 desvio padro da verdadeira mdia (). Assim, se armarmos que a
a
e
mdia de uma amostra se afasta menos do que 1 desvio padro da mdia, a partir da mdia
e
a
e
e
verdadeira, podemos esperar estar certos 68% das vezes e, consequentemente, errados 32%
das vezes. Vimos, por construao que:
c
P ( 1/ n X + 1/ n) = 68%.
Desejamos um intervalo de conana para a mdia verdadeira, , portanto, podemos reescrc
e
ever a desigualdade entre parnteses, da seguinte forma:
e
P (X 1/ n X + 1/ n) = 68%.
Podemos armar, com uma conana de 68%, que a verdadeira mdia est entre X 1/ n.
c
e
a
Sabemos tambm, que 95% das mdias amostrais, estaro a menos de 1,96 desvios padres
e
e
a
o
de cada lado da mdia da distribuiao amostral, X = . Vejamos os clculos.
e
c
a
P (1, 96 Z 1, 96) = P
1, 96
244
X
1, 96
/ n
= 95%
+1
68%
16%
16%
= 95%
1, 96 X 1, 96
n
n
1, 96 X + 1, 96
= 95%
n
n
= 95%.
1, 96 X + 1, 96
n
n
A gura 7.3 mostra os resultados. Aqui, cerca de 5% da mdias estaro a mais de 1,96 desvios
e
a
padres da verdadeira mdia. Se zermos a armativa de que a mdia de uma amostra est
o
e
e
a
a menos de 1,96 desvios padres da mdia, a partir da mdia verdadeira, podemos esperar
o
e
e
estar certos 95% das vezes, conseqentemente, errados 5% das vezes. Da mesma forma que
u
anteriormente, estamos interessados no intervalo de conana para a mdia verdadeira, ,
c
e
portanto, vamos reescrever a desigualdade, da seguinte forma:
245
1,96
+ 1,96
95%
2,5%
2,5%
2,58
+ 2,58
n
99%
0,5%
0,5%
246
ana, dentro do qual esperamos que o verdadeiro valor da mdia populacional se encontre,
c
e
com um certo grau de conana.
c
Esse intervalo chamado de intervalo de conana, e a nossa conana de estarmos certos
e
c
c
de 1 (P robabilidade de erro), dada em porcentagem, e, por isso, chama-se de n de
e
vel
conana, representado pela letra grega (l-se gama). A probabilidade de erro, P (erro),
c
e
denomina-se de nvel de signicncia e representa-se pela letra grega (l-se alfa).
a
e
Do exposto, podemos estabelecer a forma do intervalo de conana para a mdia popuc
e
I.C.(;): z/2 X .
x
a
a
a
conana da forma: x 1, 96/ n, ento, 95% deles contero o parmetro populacional, .
c
Desse modo, tudo o que foi feito e dito aqui para o estimador X do parmetro , vlido
a
e a
tambm para qualquer outro estimador (por exemplo: P, S).
e
7.4.1
247
/2=2,5%
1-
1,96
n
Populao
com uma
caracterstica
X de interesse
x1 1,96 x
Amostra 1
Amostra 2
x2 1,96 x
= 95%
/2=2,5%
+ 1,96
n
x1
x2
x1 + 1,96 x
x2 + 1,96 x
Amostra k
xk 1,96 x
xk
xk + 1,96 x
Figura 7.5: Interpretaao de um intervalo de conana para a mdia verdadeira, com conc
c
e
ana de 95% e varincia conhecida
c
a
(7.2)
onde, X = / n.
248
200 g. Uma amostra de 15 pacotes retirada ao acaso apresentou os seguintes pesos, em kg,
20,05
19,89
20,09
20,10
19,70
20,25
20,30
19,78 19,69
19,93 20,25
19,90
20,18
20,20
20,01
Construir os intervalos de 95% e 99% de conana para o peso mdio dos pacotes de sementes
c
e
de milho.
Os valores da mdia e do desvio padro da mdia so:
e
a
e
a
0, 20
n = 15 x = 20, 02 X = = 0, 0516.
15
Como a populao conceitualmente innita (formada pelos pacotes enchidos e que viro a
ca
e
a
ser enchidos), no necessrio fazermos a correao no desvio padro. Assim, o intervalo de
a e
a
c
a
conana, ca:
c
I.C.(; 95%) : 20, 02 1, 96(0, 0516)
: 20, 02 0, 1012
: 19, 92 20, 12.
Portanto, temos 95% de conana, de que a mdia da populao esteja entre os pesos 19,92
c
e
ca
e 20,12 kg/pacote.
O intervalo com conana de 99% ca:
c
I.C.(; 99%) : 20, 02 2, 58(0, 0516)
: 20, 02 0, 1332
: 19, 89 20, 15.
Podemos armar, com 99% de conana, de que a mdia da populaao est entre os pesos
c
e
c
a
19,89 e 20,15 kg/pacote.
249
pesquisador pensa que est trabalhando com um n de conana, por exemplo, de 95%,
a
vel
c
quando, na realidade, o n de conana menor, portanto, deve-se ampliar o intervalo.
vel
c e
Como feito esse ajuste? Sabemos que a mdia tem distribuio normal com mdia e
e
e
ca
e
/ n
ter distribuiao normal padro com mdia 0 (zero) e varincia 1 (um) e representa-se por:
a
c
a
e
a
Z N (0, 1). E, assim, usamos esse modelo para resolvermos o nosso problema de estimao.
ca
Porm, quando usamos o desvio padro da amostra, S, no lugar do desvio padro da
e
a
a
populaao, , obteremos uma nova estat
c
stica, denominada de estat
stica t, dada por:
t(n1) =
X
.
S/ n
Essa estat
stica t tem distribuio t de Student11 com (n 1) graus de liberdade12 . Asca
sim como a distribuiao normal, ela simtrica, com mdia zero, porm, apresenta maior
c
e
e
e
e
variabilidade nos extremos da distribuiao. Quando o n sucientemente grande, o desvio
c
e
padro da amostra, S, aproxima-se do desvio padro da populaao, , e as correspondentes
a
a
c
distribuies tambm aproximam-se. Na gura 7.6 podemos vericar a forma da distribuiao
co
e
c
das estat
sticas t e Z. A principal diferena entre as duas distribuies que a distribuiao t
c
co e
c
tem maior rea nas extremidades, isto , ela mais dispersa, devido ao uso do desvio padro
a
e
e
a
amostral, S. Isso signica que, para um dado n de conana, o valor de t ser um pouco
vel
c
a
maior que o correspondente valor de Z, ampliando o intervalo.
Um intervalo de conana para a mdia, quando usamos o desvio padro da amostra
c
e
a
e
dado pela equao:
ca
s
I.C.(;): tn1; n
x
11
(7.3)
O criador da distribuio t de Student foi W. S. Gossett, o qual adotou o pseudnimo de Student (sculo
ca
o
e
XX). Posteriormente essa distribuio foi estudada por Ronald A. Fisher.
ca
12
Wonnacott & Wonnacott, pgina 186, explicam graus de liberdade da seguinte forma: numa amostra de
a
n observaes, existem n graus de liberdade; para calcularmos o desvio padro, precisamos calcular os desvios
co
a
250
1-
/2
/2
-tc
tc
-3,50
-1,75
0,00
1,75
3,50
a
e
a
e
amostra; o n de conana; o n de signicncia e t um valor de tabela da
e
vel
c
e
vel
a
e
distribuio t de Student, obtido com n 1 graus de liberdade e n de signicncia .
ca
vel
a
A distribuio t s teoricamente adequada quando a varivel em estudo apresentar disca
oe
a
tribuio normal. Na prtica, quando n aumenta, indo alm de 30 observaoes, a necessidade
ca
a
e
c
de admitir normalidade diminui.
251
ndices:4,9, 5,1, 4,9, 5,0, 5,0 e 4,7 ppm de oxignio dissolvido. Construir o intervalo com 95%
e
de conana para a verdadeira mdia de oxignio, em ppm, e interpretar.
c
e
e
A mdia e o desvio padro da amostra valem: x = 4, 9333 e s = 0, 1366. O valor tabelado
e
a
(1 )
.
n
I.C.(;):p z/2
252
(1)
.
n
(7.4)
tem distribuiao normal com mdia 0 (zero) e varincia 1 (um) e para = 0, 05, temos:
c
e
a
P (1, 96 Z 1, 96) = 0, 95.
Isso implica que, o intervalo de conana para , com 95%, dado por:
c
e
p 1, 96
(1 )
p + 1, 96
n
(1 )
.
n
Uma diculdade encontrada para o clculo do desvio padro, que precisamos saber o
a
a e
valor de , o qual desconhecido e desejamos estim-lo. Sabemos que para uma amostra
e
a
sucientemente grande, espera-se que a proporo amostral, P , seja prxima da verdadeira
ca
o
proporao, . Alm disso, vemos que ocorre uma compensao entre P e (1 P ). Portanto,
c
e
ca
na frmula do desvio padro, vamos substituir pelo seu estimador P , a qual ca,
o
a
SP =
P (1 P )
.
n
0, 29(0, 71)
1000
: 0, 29 0, 0281
0, 2619 0, 3181.
253
Podemos armar, com 95% de conana, que a porcentagem de tilpias est entre 26,19% e
c
a
a
31,81%.
Exemplo 2. Uma amostra de 35 peixes da espcie Xenomelaniris brasiliensis coletada
e
na localidade Praia da Barra da Lagoa, Florianpolis, SC, apresentou 46% de peixes com
o
comprimento total acima de 50 mm. Encontre um intervalo, com 99% de conana, dentro
c
do qual deve estar a verdadeira proporo de peixes com comprimento acima de 50 mm.
ca
O valor de z para = 0, 01 2,58. O intervalo ca:
e
IC(; 99%) : 0, 46 2, 58
0, 46(0, 54)
35
: 0, 46 0, 2174
0, 2426 0, 6774.
7.4.3
Ao coletarmos uma amostra e calcularmos a mdia dos valores desta amostra (X), die
cilmente ela vai ser igual a mdia verdadeira (), apesar de estarem prximas, para amostras
e
o
sucientemente grandes. Como a amostra uma parte da populao, lgico pensar que
e
ca e o
os dois valores dicilmente vo coincidir. Lembre-se do estudo da distribuiao amostral da
a
c
mdia. Portanto, quando vamos estimar um parmetro, sempre estamos sujeitos a comee
a
ter um erro, denominado erro de estimaao ou de amostragem, que a diferena entre a
c
e
c
estat
stica amostral e o parmetro, isto ,
a
e
e = X .
A gura 7.8 ilustra o erro de estimaao associado a um intervalo de conana. Podemos
c
c
ver que a mdia verdadeira (), pode estar prxima ou distante da mdia da amostra (),
e
o
e
x
assim, no intervalo de conana, dizemos que temos, por exemplo, 95% de conana de que
c
c
X t .
n
254
Erro
mximo
Erro
x t
x +t
Centro do
intervalo
Limite
superior
s
n
Limite
inferior
s
n
3
2
Tubo
11 12
Nmero 14 14
u
Tubo
21 22
Nmero 12 10
u
4
8
5
14
7
11
8 9
11 12
10
8
13 14
9 6
15 16 17
6 8 8
18 19
6 12
20
8
23 24
15 5
25 26 27
7 6 9
28 29
11 13
30
8
255
6
8
Estime o nmero mdio de folhas utilizando um intervalo de conana de 95%. Faa uma
u
e
c
c
interpretao.
ca
Temos os seguintes resultados: x = 9, 3667; s = 3, 0904; n = 30 e t(0.05;29) = 2, 045.
3, 0904
IC(; 95%) : 9, 3667 2, 045
30
: 9, 3667 1, 1538
8, 2128 10, 5205.
Qual o erro mximo associado ao intervalo encontrado? Faa a interpretao.
a
c
ca
O erro mximo de 1,1538 folhas. Portanto, camos com a certeza de que a estimativa de
a
e
9,3667 folhas, afasta-se da mdia verdadeira de no mximo 1,1538 folhas, para um n de
e
a
vel
conana de 95%.
c
Quando o desvio padro populacional for conhecido, o erro de estimao dado por:
a
ca e
e = z .
n
p(1 p)
.
n
(7.6)
256
e = z .
n
Para uma amostra aleatria simples, quando o desvio padro populacional () conhecido,
o
a
e
ou temos alguma informao sobre o mesmo, determinamos o tamanho da amostra pela
ca
expresso:
a
n=
z 2
.
e
(7.7)
Na expresso 7.7, o valor de e deve ser fornecido pelo pesquisador e indica a preciso
a
a
desejada na pesquisa, isto , quo prximas esto a mdia da amostra e a mdia da populao.
e
a
o
a
e
e
ca
Pense bem sobre isso, pois a mdia verdadeira nos desconhecida.
e
e
Denida pelo pesquisador a probabilidade de erro (), encontramos a conana desejada
c
na pesquisa, dada por (1 ). Assim, podemos ver que o pesquisador deve ter informaao
c
sobre a preciso e a conana que ele deseja para o seu trabalho.
a
c
Alm da preciso e da conana, o pesquisador precisa ter alguma informaao sobre a
e
a
c
c
2
variabilidade da populaao, isto , sobre a varincia ( ).
c
e
a
Exemplo 1. Continuaao do exemplo dos pesos de pacotes de sementes de milho. Que
c
tamanho de amostra ser necessrio coletar para produzir um intervalo de 95% de conana
a
a
c
para a verdadeira mdia, com uma preciso de 50 gramas? Veja gura 7.8. Portanto,
e
a
vamos encontrar um tamanho de amostra, de modo que tenhamos 95% de conana, de
c
que a mdia da amostra difere de no mximo 50 gramas, para os dois lados, da mdia da
e
a
e
populaao. Aplicando a frmula do tamanho da amostra, obtemos:
c
o
n=
1, 96(0, 20)
0, 05
= 61, 46 62.
=
257
-0,05
+0,05
E=0,05
2,5%
95%
2,5%
Figura 7.8: Tamanho de amostra para um erro de estimao de 0,05 kg e conana de 95%,
ca
c
portanto, n de signicncia de 5%
vel
a
Na prtica, geralmente o desvio padro populacional () desconhecido, ou no temos
a
a
e
a
conhecimento de um limite superior para o mesmo. Nesse caso, dever
amos usar o desvio
padro da amostra (s), e a distribuiao t de Student. Acontece que a amostra ainda no foi
a
c
a
coletada para que possamos conhecer o valor de s, desvio padro da amostra, ento, uma
a
a
soluo coletar uma amostra piloto de n elementos para, com base nela, obtermos uma
ca e
estimativa de s, empregando-se a seguir a expresso:
a
n=
t.s 2
.
e
(7.8)
Onde t o valor de tabela, com n 1 graus de liberdade (tamanho da amostra piloto menos
e
um), e probabilidade de erro igual a . Se n n implica que a amostra piloto j suciente
ae
para a estimao da mdia, caso contrrio, devemos retirar mais elementos da populaao
ca
e
a
c
para completar o tamanho m
nimo da amostra.
Exemplo 2. Continuaao do exemplo dos pesos ao nascer de bezerros da raa Ibag.
c
c
e
Que tamanho de amostra ser necessrio para produzir um intervalo de conana de 95%
a
a
c
para a verdadeira mdia, com uma preciso de 5% da mdia da amostra preliminar?
e
a
e
A amostra piloto de tamanho n = 20, nos forneceu uma x = 26 kg e s = 2 kg. Temos ainda
258
intervalo 4s. Podemos tomar os dois valores extremos dos dados dispon
e
veis e calcular
a amplitude de variao ( ) dos dados. Para obter uma estimativa de s, calculamos:
ca
= 4s s = /4;
uma estimativa de s pode ser obtida em artigos, livros, dissertaoes, teses, ou seja,
c
atravs de uma referncia bibliogrca.
e
e
a
Quando conhecemos o tamanho da populao (N ), e verica-se a desigualdade n >
ca
0, 05N , deve-se proceder a uma correo ou ajuste para populao nita, do seguinte modo:
ca
ca
n0 =
n
n
1+ N
(7.9)
animais. E importante que as trilhas estejam bem localizadas, pois elas devem amostrar as
diferentes vegetaes do local em estudo.
co
Aqui, o tamanho da amostra corresponde ao nmero de vezes que devemos percorrer
u
cada trilha selecionada, e calculada atravs da expresso:
e
e
a
n=
(2ts)2
e2
Os termos que aparecem nesta frmula j foram discutidos. Ressaltamos que a estimativa do
o
a
desvio padro da amostra (s), pode ser obtida atravs de uma amostra piloto (preliminar).
a
e
Exemplo. Desejamos determinar o tamanho da amostra (nmero de vezes que devemos
u
percorrer as trilhas), para obter um intervalo de conana com 90% e erro de 0,2 animais.
c
259
De uma amostra piloto com 5 repeties em todas as trilhas obteve-se uma estimativa do
co
desvio padro com sendo igual a 0,3 indiv
a
duos/km2 . Para o clculo do tamanho da amostra
a
temos as seguintes informaes:
co
t(com 5-1=4 graus de liberdade e = 0, 10)=2,132
s=0,3
e=0,2
O tamanho da amostra dado por:
e
n=
n=
2
z/2 [p(1p)]
e2
z/2 2
e
p(1 p).
(7.10)
260
obtemos:
n=
2
z/2
4e2
(7.11)
Ento, quando no temos a menor idia sobre o valor de , pode-se, inicialmente admitir
a
a
e
= 0, 50 para o clculo do tamanho da amostra. Com este procedimento, estamos superesa
timando o tamanho da amostra, ou seja, vamos trabalhar com uma amostra maior do que o
necessrio, assim, estaremos pecando por excesso.
a
Exemplo 1. Considere que uma amostra piloto de 35 peixes da espcie Xenomelaniris
e
brasiliensis foi coletada na localidade da Praia da Barra da Lagoa, Florianpolis, SC, e
o
apresentou 46% de peixes com comprimento total acima de 50 mm. Se quisermos estimar
a proporo de peixes com comprimento acima de 50 mm, qual o tamanho da amostra
ca
necessrio para que tenhamos 99% de conana de que o erro de nossa estimativa no seja
a
c
a
superior a 5%?
O valor de z para = 0, 01 2,58. O tamanho da amostra necessrio :
e
a e
2, 582
0, 46(1 0, 46)
0.052
= 2662, 56(0, 2484)
n =
= 661, 38
662.
=
Portanto, precisamos de uma amostra de 662 peixes para obtermos uma proporao amostral
c
que no dira da proporo verdadeira em mais do que 5%.
a
ca
Neste mesmo exemplo, suponha que no saibamos nada sobre , qual deve ser o tamanho
a
da amostra pesquisada?
Temos, = 99% e e = 5%, portanto:
n=
2, 582
= 665, 64 666.
=
4(0, 052 )
261
N n
10
=
N 1
100
500 100
= 0, 8953.
500 1
2, 3646 10
2
= 139, 24 140.
=
140
= 107, 9 108.
=
1 + 140
500
Exerc
cios resolvidos
1. De uma amostra de 100 peixes da espcie Xenomelaniris brasiliensis, coletada na
e
Armao do Pntano do Sul, Florianpolis, SC, vericou-se que 57 deles apresentavam comca
a
o
primento total maior que 50 mm. Com base nessa informaao, determine o intervalo de
c
conana de 99% para a verdadeira proporao de peixes com comprimento total acima de
c
c
262
50 mm. Qual o tamanho de amostra necessrio para estimar a verdadeira proporao com
a
c
preciso de 5%, usando uma conana de 95%?
a
c
Temos n = 100, p = 57/100 = 0, 57 e q = 1 p = 0, 43.
0, 57(0, 43)
100
: 0, 57 0, 12773
IC(; 99%) : 0, 57 2, 58
0, 44227 0, 6977.
O clculo do tamanho da amostra ca:
a
2
1, 96
n =
0, 57(0, 43)
0, 05
= 376, 63 377.
=
2. O dimetro mdio de Biomphalaria tenagophila, examinada uma amostra de 35 ania
e
mais, foi de 0,871 mm com um desvio padro de 0,057 mm.
a
a) D a estimativa por intervalo do verdadeiro dimetro mdio utilizando um n de cone
a
e
vel
ana de 95%.
c
b) Que tamanho de amostra ser necessrio para produzir um intervalo de conana de 95%
a
a
c
para a verdadeira mdia, com uma preciso de 2% da mdia da amostra preliminar?
e
a
e
Temos, n = 35, x = 0, 871 mm, s = 0, 057 mm e = 0, 02(0, 971) = 0, 0174.
0, 057
IC(; 95%) : 0, 871 2, 032
35
: 0, 871 0, 0196
0, 8514 0, 8906.
2, 032(0, 057)
n =
0, 0174
= 44, 21 45.
=
0, 80(0, 20)
400
: 0, 80 0, 0465
0, 7535 0, 8465.
263
n =
7.5
1, 96
0, 04
Exerc
cios Propostos
15,8
29,1
27,9
35,5
18,5
28,0
22,5
34,2
22,3
30,3
32,9
31,8
23,5
26,8
29,5
32,5
17,2 17,8
28,0 17,8
28,3 34,2
41,8
18,7
18,9
38,5
264
265
Frequncias
e
5,07
5,44
5,81
6,18
6,55
6,92
2
2
11
11
3
1
Classes
7,6
8,2
8,8
9,4
10,0
10,6
Frequncias
e
8,2
8,8
9,4
10,0
10,6
11,2
2
0
9
13
4
2
11) Uma amostra aleatria de 60 prognies indica que 70% delas apresentam resistncia `
o
e
e
a
antracnose. Construir um intervalo de conana para , a proporo de prognies resistentes
c
ca
e
` antracnose, com = 95%.
a
12) O dimetro de altura do peito (DAP) de Tabebuia ochracea, o Ip-Amarelo do Campo,
a
e
fam Bigoniceas, uma varivel aleatria com distribuiao aproximadamente normal de
lia
a
e
a
o
c
mdia 0,70 cm e desvio padro de 0,40 cm. Encontre um intervalo de conana em torno da
e
a
c
mdia que contenha 95% dos valores de DAP.
e
13) De um experimento anterior sabe-se que o desvio padro da altura de plantas de um
a
determinado h
brido de milho = 0, 80 m.
e
a) Selecionada uma amostra de 72 plantas deste h
brido, observou-se uma mdia de 2,10 m.
e
Qual o intervalo de conana de 95% para a mdia populacional?
c
e
b) Que tamanho deve ter uma amostra para que o intervalo 2, 10 0, 20 tenha 99% de
conana?
c
14) Um agrnomo realizou um levantamento para estudar o desenvolvimento de duas
o
espcies de rvores, a Bracatinga e a Canaf
e
a
stula. Para esta nalidade foram coletadas
duas amostras de tamanhos igual a 10 rvores. Os resultados para altura, em metros, esto
a
a
descritos abaixo para as duas amostras:
Bracatinga
6,5
9,3
6,9 6,9
10,1 11,4
8,6
15,2
Canaf
stula
8,7 8,2
17,2 14,8
10,0
15,9
10,3 13,4
20,6 21,9
14,4
23,8
Para vericar a hiptese de que as alturas das duas espcies so diferentes, o agrnomo
o
e
a
o
adotou o seguinte critrio. Construir os intervalos com 95% de conana, para cada uma
e
c
das espcies. Se os intervalos se sobrepem (se interceptam) concluir que no h diferenas
e
o
a a
c
signicativas entre as duas alturas mdias, caso contrrio, concluir que h diferenas entre
e
a
a
c
266
11,70
2,66
9,93
16,90
33,00
13,92
6,13
4,60
3,60
14,63 4,75
9,20 9,90
22,20 12,65
10,75 18,00
7,54
14,20
33,60
6,00
12,30
2,27
7,20
4,15
267
8.1
Introduo
ca
268
269
Sempre que ns tomamos a deciso de no rejeitar ou rejeitar uma hiptese nula, estamos
o
a
a
o
correndo o risco de uma deciso errnea. Por exemplo, podemos rejeitar uma hiptese nula
a
o
o
quando dever
amos aceit-la. Assim, como o que ocorre nos intervalos de conana, quando
a
c
armamos que o parmetro est dentro do intervalo, existe uma probabilidade de ele no
a
a
a
pertencer ao mesmo. O que acontece na prtica, que ns sabemos qual o valor dessa
a
e
o
e
probabilidade e, geralmente, ele baixo. Portanto, sempre que tomamos uma deciso de
e
a
rejeitar uma hiptese nula, temos uma alta probabilidade de estarmos certos.
o
No nosso exemplo, a estat
stica de interesse a proporao de sementes que germinam (P ),
e
c
dada em porcentagem. Assim, devemos conhecer a distribuio amostral de uma proporao,
ca
c
pois, como sabemos, ela descreve a variabilidade amostral. Sabemos que a distribuio
ca
amostral das proporoes (P ), quando o tamanho da amostra sucientemente grande, segue
c
e
uma distribuiao normal com mdia e desvio padro,
c
e
a
P =
(1 )
,
n
0, 94(0, 06)
= 0, 01187 = 1, 187%.
400
= 0, 5 P rob(0 z 1, 01)
= 0, 5 0, 34375
= 0, 1563 = 15, 63%.
A gura 8.1 mostra a rea da distribuio normal padro correspondente ao valor de z
a
ca
a
1, 01 ou p 0, 928. Portanto, ns temos uma probabilidade bastante alta de obter um
o
270
(Escala padro)
0,928
(Escala real)
0,940
Figura 8.1: Probabilidade de encontrar um valor menor que 92,8% de um lote com 94,0%
de poder germinativo
valor de poder germinativo igual ou menor que 92,8% devido ` variao amostral, ou seja,
a
ca
temos 15,63% de probabilidade de obter uma amostra com um poder germinativo igual ou
menor do que 92,8% de um lote com 94% de poder germinativo.
Se rejeitssemos H0 : = 94%, o risco de erro, ou seja, rejeitar H0 quando na verdade
a
dever
amos aceitar, seria de 15,63%, o que muito alto. Isto nos leva a no rejeitar H0 e,
e
a
assim, concluir que a amostra oriunda de um lote com 94% de poder germinativo, e que
e
a diferena entre os valores 94% e 92,8% devido ` amostragem. Este risco chamado de
c
e
a
e
n de signicncia do teste e representa-se pela letra grega . A mesma interpretaao
vel
a
c
feita para os intervalos de conana. O n de signicnica tambm chamado de n
c
vel
a
e e
vel
descritivo ou valor p do teste. No exemplo, = 15, 63%.
Agora, vamos supor que a porcentagem de germinaao de sementes na amostra foi de
c
89,5%, ao invs de 92,8%. Neste caso, a probabilidade de obter um valor de poder germinae
tivo amostral igual ou menor que 89,5% devido ` variaao amostral dada por:
a
c
e
0, 895 0, 94
0, 0119
= P rob(z 3, 78)
= 0, 5 P rob(0 z 3, 78)
= 0, 5 0, 4999
= 0, 0001.
A gura 8.2, de acordo com os clculos, mostra que praticamente nula a probabilidade
a
e
de se obter uma amostra com valor de 89,5% de um lote com 94% de poder germinativo. Isto
271
-3,78
0,00
(Escala padro)
0,895
0,94
(Escala real)
Figura 8.2: Probabilidade de encontrar um valor menor que 89,5% de um lote com 94,0%
de poder germinativo
signica que ns temos fortes ind
o
cios para rejeitar a hiptese nula (H0 : = 94%). Cono
clu
mos, portanto, que improvvel que esta amostra provenha de um lote de sementes com
e
a
o poder germinativo alegado pela distribuidora. Neste caso, o risco de uma deciso errnea
a
o
vale 0,0001, ou seja, a probabilidade de rejeitarmos H0 , quando na verdade dever
amos
aceit-la de 0,0001 ou 0,01%. Assim, o valor p do teste 0,01%.
a e
e
Na prtica, os n
a
veis de signifncia aceitveis, so, geralmente, = 0, 05 = 5% e =
a
a
a
0, 01 = 1%. Em alguns casos, utiliza-se = 0, 10 = 10%. Supondo que o pesquisador dena
como sendo de 5% o erro mximo de suas concluses. Assim, na amostra com 92,8% de
a
o
poder germinativo, o menor valor de para o qual rejeitamos H0 vale 15,63%, portanto,
maior do que o erro mximo aceitvel pelo pesquisador, isso implica que devemos aceitar
a
a
a hiptese nula. Na amostra com 89,5% de poder germinativo, o menor valor de para o
o
qual rejeitamos H0 vale 0,01%, portanto, menor do que os 5% xado pelo pesquisador, isso
implica que rejeitamos a hiptese nula. Se o pesquisador xar o n de signicncia em
o
vel
a
= 1%, as concluses seriam as mesmas. O leitor concorda?
o
Portanto, em trs passos:
e
1. formulaao das hipteses;
c
o
2. clculo das probabilidades com a estat
a
stica correta e
3. no rejeitar ou rejeitar H0
a
podemos concluir um teste de hipteses. At aqui, calculamos a probabilidade de encono
e
trar um valor igual ou mais extremo do que o pesquisador encontrou no experimento (),
devido ao acaso (variaoes aleatrias). Se este valor for menor do que um valor xado pelo
c
o
pesquisador, por exemplo, = 5%, rejeitamos a hiptese nula, caso contrrio, aceitamos H0 .
o
a
272
Mtodo Tradicional
e
Uma outra forma de se fazer um teste de hipteses, o qual o denominaremos de mtodo
o
e
tradicional, seria xar o n de signicncia desejado para o trabalho, por exemplo, = 5%.
vel
a
Para este n de signicncia considerado, podemos encontrar os valores correspondentes
vel
a
de z e p e, a partir deles, denir as regies de aceitaao e rejeiao da hiptese nula. Se os
o
c
c
o
valores calculados de z ou de p, com os dados da amostra, pertencerem a regio de aceitaao,
a
c
ento, conclui-se a favor de H0 , caso contrrio, rejeita-se a hiptese nula. Vamos continuar
a
a
o
com o nosso exemplo, para mostrar como feito o teste de hiptese nesse caso.
e
o
Vamos considerar que o nvel de signicncia (valor p) xado pelo pesquisador seja =
a
5%. Na distribuiao normal padro, o valor de z, abaixo do qual temos 5% da observaes,
c
a
co
vale -1,65. Observe que o nosso teste feito no lado esquerdo da curva, isto , ele um teste
e
e
e
unilateral. Voc pode obter este valor diretamente da tabela da distribuio normal padro,
e
ca
a
basta encontrar o valor de z que corresponde a uma probabilidade de 0,45; ou, ento, usar
a
um programa (software) estat
stico. No esquea que as probabilidades so dadas no corpo
a
c
a
da tabela da distribuio normal padro. Encontre este valor. Podemos encontrar o valor
ca
a
de p que corresponde ao valor de z = 1, 65, da seguinte forma:
z =
p
(1)
n
p 0, 94
0, 0119
p = 0, 92 = 92%.
1, 65 =
0, 928 0, 940
= 1, 01.
0, 0119
A proporao vericada na amostra foi igual a p = 0, 928 = 92, 8%. Como podemos ver na
c
gura 8.3, o valor calculado de z com os dados da amostra pertence a regio de aceitaao
a
c
da hiptese nula. Da mesma forma, o valor da proporao encontrada na amostra de 92,8%,
o
c
273
Regio de
rejeio de H0
Regio de aceitao de H0
45%
5%
-1,65
0,00
0,92
0,94
Figura 8.3: Regies de aceitao e de rejeiao da hiptese nula para uma probabilidade de
o
ca
c
o
erro de 5%
pertence a regio de aceitaao. Portanto, conclu
a
c
mos que no devemos rejeitar a hiptese
a
o
nula de que = 94%, ao n de signicncia de 5%.
vel
a
Pelo que foi exposto, podemos estabelecer uma sequncia lgica para a realizaao de um
e
o
c
teste de hiptese pelo mtodo tradicional. Os itens dessa sequncia so:
o
e
e
a
ca
o
sticas. Como vimos, todo
1. todo o trabalho inicia com a formulao das hipteses estat
teste estat
stico envolve duas hipteses: hiptese nula (H0 ) e a hiptese alternativa
o
o
o
(H1 );
stica amostral ou estimador que ele vai usar
2. o pesquisador precisa decidir qual a estat
2
274
8.2
Vimos que existem trs possibilidades para a hiptese alternativa, quais sejam:
e
o
H1 : = 0 (teste bilateral)
H1 : > 0 (teste unilateral ` direita)
a
H1 : < 0 (teste unilateral ` esquerda)
a
A gura 8.4 ilustra essas trs possibilidades para a hiptese alternativa. Observe as respece
o
tivas regies de aceitaao e de rejeiao da hiptese nula em cada caso. No teste bilateral, as
o
c
c
o
reas de rejeiao correspondem a /2, enquanto que nos testes unilaterais, a rea de rejeiao
a
c
a
c
corresponde a . Observe que o sinal > ou < aponta para o lado da curva a ser utilizado.
Quando denimos o n
vel de signicncia () do teste, consequentemente temos o ponto
a
cr
tico, ou seja, o ponto limitrco entre as duas regies.
o
o
8.3
De acordo com o que vimos, quando rejeitamos a hiptese nula, corremos o risco de
o
estarmos tomando uma deciso errnea, ou seja, ns rejeitamos a hiptese nula quando na
a
o
o
o
verdade dever
amos aceit-la. Este risco o n de signicncia ou valor p do teste e
a
e
vel
a
e
representado pela letra grega . Esse n de signicncia tambm conhecido como erro
vel
a
e
e
tipo I e, a probabilidade de sua ocorrncia vale . Um segundo tipo de erro que podemos
e
cometer, aceitar a hiptese nula, quando ela de fato falsa. Neste caso, temos o erro tipo
e
o
e
II, o qual representado pela letra grega . Esquematicamente, temos:
e
Se H0 :
e
no rejeitar H0
a
verdadeira
deciso correta (1 )
a
falsa
erro tipo II ()
rejeitar H0
erro tipo I ()
deciso correta (1 )
a
Aao
c
275
1
/2
Regio de rejeio
/2
Regio de aceitao
Regio de aceitao
Regio de rejeio
Ponto
crtico
Ponto
crtico
Regio de rejeio
Ponto
crtico
Regio de rejeio
1
Regio de aceitao
Ponto
crtico
276
8.4
amostral da estat
stica ou estimador (X,
c
a a
se a distribuiao da varivel em estudo seguir uma distribuiao normal e a amostragem
c
a
c
for aleatria e, em geral, com boa aproximao se a amostra for sucientemente grande
o
ca
(sugesto: n 30).
a
277
8.4.1
Como j foi dito no estudo dos intervalos de conana, comum na prtica no conhecera
c e
a
a
2
mos o valor da varincia populacional ( ). Ento, devemos estim-la atravs dos valores
a
a
a
e
obtidos na amostra, atravs da varincia amostral (S 2 ).
e
a
No estudo de intervalos de conana, j discutimos que, ao substituir pela sua estimac a
tiva s, devemos utilizar a distribuio t de Student com n 1 graus de liberdade, onde n
ca
e
o tamanho da amostra.
Do estudo de intervalos de conana, obtemos a expresso da estat
c
a
stica teste a ser usada
aqui, dada por:
X 0
,
(8.1)
t(n1) =
S
278
5%. Da mesma forma, se a hiptese alternativa for H1 : > 0 , a hiptese nula (H0 ), ser
o
o
a
rejeitada se a P (t t(n1) ) for bem pequena. Se a hiptese alternativa for bilateral, isto
o
, H1 : = 0 , ento valores grandes negativos ou valores grandes positivos de t(n1) , so
e
a
a
fortes indicativos para a rejeio da hiptese nula. Neste caso, a hiptese nula ser rejeitada
ca
o
o
a
se P (t t(n1) ) + P (t t(n1) ), a qual igual a 2P (t |t(n1) |), for pequena.
e
Vejamos, agora, a aplicaao do teste de hiptese de que uma mdia populacional, ,
c
o
e
e
2
igual a um valor xo, 0 , supondo-se que a varincia populacional, , seja desconhecida.
a
Exemplo 1. Supe-se que a produtividade mdia de feijo da safra no Estado de Santa
o
e
a
Catarina de 800 kg/ha. Para investigar a veracidade dessa armao, consultou-se uma
e
ca
publicao do Instituto CEPA-SC, onde obteve-se os seguintes valores de produtividade
ca
mdia de feijo:
e
a
Safra
80/81
81/82
82/83
83/84
84/85
85/86
86/87
Produtividade
1017
980
507
841
899
264
700
87/88 88/89
800
653
teste sobre uma mdia populacional, com varincia estimada com os dados de uma amostra,
e
a
usamos a estat
stica 8.1, a qual segue uma distribuio t de Student com 9 1 = 8 graus
ca
de liberdade. Para um n de signicncia de 5% e, com o uso da tabela da distribuiao t
vel
a
c
(apndice 4) ou de um programa estat
e
stico, obtemos:
t(n1;) = t(91;0,05) = t(8;0,05) = 2, 306.
A regio de rejeio dada pelos valores |t8 | > 2, 306; a regio de aceitaao compreende os
a
ca e
a
c
valores (inclusive) entre -2,306 e 2,306, isto , |t8 | 2, 306. A gura 8.5 mostra as regies
e
o
de aceitaao e de rejeiao da hiptese. Observe nesta gura, como o teste bilateral, que
c
c
o
e
o n de signicncia est dividido em duas partes (0, 05/2), ou seja, 0,025 na cauda do
vel
a
a
lado esquerdo e 0,025 na cauda do lado direito. Com os valores da amostra vamos calcular
279
0,95
0,025
-2,306
Regio de
rejeio
0,00
0,025
2,306
Regio de aceitao
Regio de
rejeio
Figura 8.5: Regies de aceitaao e de rejeiao da hiptese nula com = 5%, para o teste de
o
c
c
o
uma mdia populacional
e
a estat
stica teste,
t8 =
740, 11 800
240,68
59, 89
= 0, 746.
80, 226
280
: 740, 11 185, 00
555, 1 925, 11.
Observao: Podemos chegar a mesma concluso de um teste de hiptese bilateral
ca
a
o
atravs do estudo do intervalo de conana. Sempre que o intervalo incluir o valor de H0 ,
e
c
devemos aceitar a hiptese nula. No exemplo, 800 kg/ha, est contido no intervalo, portanto,
o
a
aceitamos H0 : = 800 kg/ha.
Exemplo 2. Foi retirada uma amostra de tamanho 10, da populaao de pesos aos 210
c
dias de bezerros da raa Nelore. Os valores, em kg, foram os seguintes:
c
178
199 182
186 188
191
189 185
174 158
Teste as hipteses:
o
H0 : = 186 vs H1 : < 186,
ao n de signicncia de 5%.
vel
a
A varivel em estudo do tipo cont
a
e
nua e vamos assumir que a mesma tenha, pelo menos
aproximadamente, distribuiao normal. Como desejamos fazer um teste para uma mdia
c
e
e temos uma estimativa da varincia, vamos usar a estat
a
stica 8.1. Na amostra obtemos
x = 183 e s = 11, 18. Para = 5%, da tabela da distribuiao t de Student, para um teste
c
unilateral (de acordo com a hiptese alternativa), obtemos, t(9;0,05) = 1, 83. Para encontrar
o
este valor na tabela da distribuiao t de Student (apndice 4), devemos entrar na coluna de
c
e
P = 0, 10, pois a tabela bilateral e o teste unilateral. A tabela s fornece valores positivos
e
e
o
de t, como ela simtrica, basta mudar o sinal. A regio de rejeiao corresponde aos valores
e
e
a
c
menores do que -1,83; a regio de aceitao formada pelos valores maiores ou igual a -1,83.
a
ca e
A gura 8.6 mostra as duas regies. Com os dados da amostra temos:
o
t9 =
183 186
11,18
10
= 0, 847.
O valor -0,847 est na regio de aceitao, portanto, aceita-se a hiptese nula. Os dados
a
a
ca
o
da amostra suportam a hiptese de que a mdia dos pesos aos 210 dias de bezerros da raa
o
e
c
Nelore igual a 186 kg, com probabilidade de erro de 5%.
e
Podemos fazer o teste atravs da interpretaao do valor p. Com o aux de um programa
e
c
lio
estat
stico vamos encontrar o valor p do teste. O menor valor de para o qual rejeitamos a
hiptese nula :
o
e
P (t < 0, 847) = 0, 2095 = 20, 95%.
Como 20,95% maior do que os 5% denido pelo pesquisador, devemos aceitar a hiptese
e
o
nula. E assim, o pesquisador admite uma probabilidade de erro de no mximo 5%, neste
a
281
0,05
-1,83
Regio de rejeio
Regio de aceitao
Figura 8.6: Regies de aceitaao e de rejeiao da hiptese nula com = 5%, para o teste de
o
c
c
o
uma mdia populacional
e
exemplo, se ele rejeitar a hiptese, a probabilidade de erro de 20,95%, portanto, ele deve
o
e
aceitar a hiptese nula.
o
Exemplo 3. Continuaao do exemplo dos res
c
duos industriais jogados nos rios da seo
ca
7.4.1. Leia aquele enunciado. Teste as hipteses:
o
H0 : = 5 versus H1 : = 5
O valor da estat
stica teste :
e
t5 =
4, 933 5, 000
= 1, 2014
0, 1366/ 6
O valor terico de t : t(5;0,05) = 2, 571. Portanto, a regio de aceitaao est entre -2,571 e
o
e
a
c
a
2,571. Como o valor -1,2014 est dentro desta regio, no rejeitamos a hiptese nula.
a
a
a
o
Uma Aplicao em Distribuio Espacial
ca
ca
Sabemos que, na distribuiao de Poisson, os indiv
c
duos se distribuem aleatoriamente num
habitat. Na distribuiao de Poisson, a mdia igual a varincia 2 , ou seja, 2 /=1, como
c
e
e
a
visto na seo 4.7. Quando a razo, 2 /, for menor do que 1 dizemos que a distribuio
ca
a
ca e
2
uniforme; se a razo / for maior do que 1 conclu
a
mos que a distribuiao agregada.
c e
Neste caso estamos interessados em testar as seguintes hipteses:
o
H0 : 2 / = 1
versus
Ha : 2 / = 1
| S 2 /X 1 |
t=
.
2/(n 1)
282
26
21
23
14
11
4
5
4
1
0
Total
109
3,9903
2,1929
2
1091
0, 8196
= 6, 02
0, 1361
O valor de t da tabela vale t(108;0,05) = 1, 98. Como 6,02 > 1,98, rejeitamos a hiptese nula e
o
concluimos que a distribuio por agregado. A referncia bibliogrca utilizada foi Brower
ca e
e
a
& Zar, ano??
8.4.2
283
Inicialmente, vamos supor que temos duas amostras selecionadas de populaes normais
co
(varivel em estudo apresente, pelo menos aproximadamente, uma distribuio normal).
a
ca
A questo da normalidade especialmente importante quando o tamanho da amostra
a
e
e
pequeno. Para cada amostra, vamos calcular a mdia e a varincia dos dados.
e
a
O objetivo do teste, neste caso, decidir se as mdias de duas populaes so iguais. De
e
e
co
a
modo geral, vamos testar hipteses referentes ao valor real da diferena entre duas mdias
o
c
e
populacionais, ou seja,
H 0 : 1 2 = .
Na prtica, temos especial interesse quando
a
igualdade das duas mdias, ou seja,
e
H0 : 1 = 2 .
Como no caso do teste de uma mdia populacional, temos trs possibilidades para a
e
e
hiptese alternativa, quais sejam,
o
H1 : 1 = 2 (teste bilateral)
H1 : 1 > 2 (teste unilateral ` direita)
a
H1 : 1 < 2 (teste unilateral ` esquerda).
a
Num teste de comparaao de duas mdias, temos dois casos a considerar, quais sejam:
c
e
1. dados pareados ou amostras dependentes. Os dados de duas amostras constituem dados pareados quando esto relacionados dois a dois, segundo algum critrio
a
e
que introduz um inuncia marcante entre os diversos pares de valores. Exemplo: dee
sejamos fazer um teste estat
stico para vericar se existe diferena signicativa entre
c
as mdias das notas obtidas na primeira avaliao e na segunda avaliao da disciplina
e
ca
ca
de estat
stica. Ento, para cada aluno, tomamos a sua nota na primeira avaliao e
a
ca
na segunda avaliao. Como existem diferenas entre os alunos (alguns estudam mais,
ca
c
outros tem mais facilidade com a disciplina, etc.), os pares de notas (cada aluno um
par de notas) no so independentes. Existe o fator aluno introduzindo uma inuncia
a a
e
forte entre os pares de dados. Outro exemplo: vamos submeter seis animais de determinada espcie a uma nova dieta. Am de determinar o efeito da dieta foram tomados
e
os pesos antes e depois da dieta. Nesse caso, as observaoes foram feitas nos mesmos
c
animais, medindo uma caracter
stica antes e depois deles serem submetidos a uma
dieta.
284
solo. Na parte alta do terreno a fertilidade menor do que na parte baixa do mesmo. E
e
285
C2
Bloco II
C1
Bloco III
C2
C1
Bloco IV
C1
C2
Bloco V
C1
Fertilidade
C2
C2
C1
C1
C2
Bloco VI
C2
C1
Bloco VII
286
Antes (A)
Depois (B)
Diferenas (A-B)
c
1
2
3
4
5
6
7
8
13,6
13,6
14,7
12,1
12,3
13,2
11,0
12,4
11,4
12,5
14,6
13,0
11,7
10,3
9,8
10,4
2,2
1,1
0,1
-0,9
0,6
2,9
1,2
2,0
Vamos considerar que temos um suporte terico para esperar que o contedo de hemoglobina
o
u
no sangue diminua com a aplicaao de niacina, portanto, as hipteses cam:
c
o
H 0 : A = B
versus H1 : A > B .
287
0,00
Regio de aceitao
1,89
2,66
Regio de rejeio
Figura 8.8: Teste de hiptese para comparar duas mdias de dados pareados
o
e
hemoglobina, seguem, pelo menos aproximadamente, uma distribuio normal com mdia
ca
e
2
2
0 (zero) e varincia D , e a representamos por: D N (0, D ). Tomando-se os valores das
a
diferenas entre A e B, ca
c
mos no caso do teste de uma mdia com varincia desconhecida,
e
a
cuja estat
stica teste dada por:
e
D D
,
(8.2)
tn1 =
SD
e
a qual segue uma distribuio t de Student com n 1 graus de liberdade. Aqui, D a mdia
ca
e
das diferenas entre os valores de A e B; SD o desvio padro das diferenas e D o valor
c
e
a
c
e
dado na hiptese nula, geralmente este valor nulo. Com os dados da amostra obtemos:
o
e
d = 1, 15, sd = 1, 225.
288
Portanto, a probabilidade de que esse resultado tenha ocorrido devido ao acaso, de apenas
e
1,64%. Como este valor menor do que os 5% xado pelo pesquisador, rejeitamos a hiptese
e
o
nula.
Importante: devemos tomar muito cuidado quando estamos usando um programa estat
stico para fazer um teste de hiptese, no sentido de vericar se o programa est fazendo
o
a
um teste bilateral ou unilateral. Por exemplo, o programa Statistica, para o exemplo em
estudo, fornece um valor p de 0,032665, ou seja, est considerando um teste bilateral. Neste
a
caso, devemos dividir 0,032665 por 2 para obtermos o valor p correto.
O intervalo de conana para D dado por:
c
e
1, 225
IC(D ; 95%) : 1, 15 2, 365
8
: 1, 15 1, 0243
0, 1257 D 2, 1743.
(8.3)
Observe que o valor de t vale 2,365, obtido diretamente na tabela para = 5%, pois o
intervalo de conana bilateral, assim como a tabela por ns utilizada.
c e
o
289
Como qualquer outro teste, devemos sempre iniciar pela formulaao das hipteses, que
c
o
nesse caso so dadas por,
a
2
2
H0 : 1 = 2
2
2
versus H1 : 1 > 2 .
1,8
1,6 1,9
1,9 1,8
A
B
Inicialmente, vamos testar a hiptese de homogeneidade de varincias. Assim, o valor da
o
a
290
estat
stica F ,
e
0, 0231
= 1, 54,
0, 0150
a qual tem 5 1 = 4 graus de liberdade no numerador e 5 1 = 4 graus de liberdade no
denominador. Com o aux de um programa estat
lio
stico, encontramos que o n m
vel nimo
signicativo vale exatamente: P (F > 1, 54) = 0, 343. Como este valor maior do que 0,05
e
ou 5%, conclu
mos que as duas varincias podem ser consideradas iguais.
a
Podemos fazer o teste de homogeneidade de varincias pelo mtodo tradicional, ou seja,
a
e
xando o n de signicncia e construindo as regies de aceitao e de rejeio da hiptese
vel
a
o
ca
ca
o
de nulidade. Com o aux da tabela da distribuiao F (apndice 6), com um n de siglio
c
e
vel
nicncia de 5%, com 4 e 4 graus de liberdade no numerador e denominador, respectivamente,
a
obtemos o valor de F cr
tico como sendo igual a 6,39. Como o valor de Fcalculado menor
e
do que o F cr
tico (1,54 6,39), aceitamos a hiptese nula, portanto, as varincias so hoo
a
a
mogneas. A regio de rejeiao formada pelos valores de F maiores que 1,54 e, a regio de
e
a
c e
a
aceitao formada pelos valores de F menores ou igual a 1,54.
ca e
Voltemos, agora, ao objetivo do pesquisador, que vericar se duas mdias populacionais
e
e
podem ser consideradas iguais ou no. No exemplo, as hipteses so dadas por:
a
o
a
F =
H 0 : A = B
versus H1 : A = B .
(X1 X2 ) (1 2 )
t=
(8.5)
2
2
(n1 1)S1 +(n2 1)S2
1
1
+ n2
n1 +n2 2
n1
a qual tem distribuiao t de Student com n1 + n2 2 graus de liberdade. Vamos aplicar o
c
teste no exemplo das duas variedades de milho. A estat
stica de teste 8.5 vale,
t8 =
(1, 34 1, 80) 0
(51)0,0231+(51)0,0150
5+52
1
5
1
5
0, 46
0, 0191(0, 40)
= 5, 263.
Com o aux da tabela (bilateral) da distribuiao de Student, para um teste bilateral, com
lio
c
8 graus de liberdade, o n m
vel nimo signicativo vale,
P (t < 5, 269) + P (t > 5, 269) < 0, 001.
Para obter este valor de probabilidade, entramos na tabela com 8 graus de liberdades (1a
coluna). Seguimos pela linha dos 8 graus de liberdade at encontrar um valor igual ou mais
e
prximo de 5,263. O valor mais prximo encontrado 5,041, cuja probabilidade vale 0,001.
o
o
e
291
95%
2,5%
-2,306
Regio de
0,00
2,5%
2,306
Regio de aceitao
Regio de
rejeio
rejeio
Figura 8.9: Teste de hiptese para comparar duas mdias dos dados de produao de duas
o
e
c
variedades de milho
Como o valor encontrado da estat
stica teste (5,263) menor do que 5,041, implica que o
e
valor da probabilidade menor do que 0,001.
e
Usando um software estat
stico, para 8 graus de liberdade, teste bilateral, obtemos exatamente a P (|t| < 5, 269) =, 000756 ou 0,0756%, portanto, devemos rejeitar a hiptese nula,
o
e conclu
mos que as produoes das duas variedades diferem entre si, sendo que a cultivar B
c
mais produtiva, ao n de signicncia de 0,0756%.
e
vel
a
Podemos, tambm, realizar o teste de hiptese pela maneira tradicional. Neste caso,
e
o
devemos xar o n de signicncia desejado, encontrar as regies de aceitao e de rejeiao
vel
a
o
ca
c
da hiptese nula e vericar em qual das regies est o valor da estat
o
o
a
stica de teste. Por
exemplo, para = 5%, da tabela da distribuiao t (teste bilateral), obtemos, t8;5% = 2, 306.
c
As regies esto mostradas na gura 8.9. Como o valor da estat
o
a
stica teste, t = 5, 269,
est na regio de rejeio da hiptese nula, conclu
a
a
ca
o
mos que as mdias diferem entre si, com
e
probabilidade de erro de 5%.
Podemos calcular o intervalo de conana para a diferena entre as mdias, A B . O
c
c
e
intervalo de conana dado pela expresso,
c e
a
IC(A B ; 95%) : (A xB ) tnA +nB 2;5% sxA B ,
x
x
onde sxA B o desvio padro da diferena entre as duas mdias, e dado por:
a
c
e
e
x e
2
2
1
(nA 1)SA + (nB 1)SB 1
+
.
nA + nB 2
nA nB
292
: 0, 46 0, 20131
0, 6613 A B 0, 2587.
Portanto, podemos armar com 95% de conana, que a verdadeira diferena entre as duas
c
c
mdias encontra-se no intervalo de -0,6613 e -0,2587.
e
O intervalo de conana tambm nos indica se existe ou no diferena signicativa entre
c
e
a
c
as duas mdias, ou seja, ele nos fornece o resultado de um teste de hiptese. Ns devemos
e
o
o
aceitar a hiptese nula, H0 : A = B , se o valor desta hiptese, encontra-se dentro do
o
o
intervalo de conana, caso contrrio, devemos rejeitar a hiptese nula. Se H0 : A = B ,
c
a
o
ento H0 : A B = 0, portanto, o valor da hiptese 0 (zero). Como vemos, o valor da
a
o
e
hiptese, no est inclu no intervalo, isso implica que devemos rejeitar a hiptese nula.
o
a
a
do
o
Como o teste de hiptese oriundo do intervalo de conana, estamos seguros para utilizar
o
e
c
esse critrio.
e
Exemplo 2. Os tempos gastos na manobra dos arados Fuador e Erechim, foram os
c
seguintes:
Fuador
c
0,20
0,22 0,18
0,23
0,12 0,20
0,13
0,12 0,13
0,22
0,17
Erechim 0,36
0,48 0,33
0,43
0,40 0,43
0,33
0,36 0,35
0,40
0,35
Espera-se que o arado Fuador produza melhores resultados (gaste menos tempo na manobra).
c
Testar a hiptese de que as mdias de tempos gasto no diferem signicativamente ao n
o
e
a
vel
de 5%. Encontre o intervalo de conana para a diferena das mdias F E .
c
c
e
Com os dados amostrais obtemos: xF = 0, 1745, xE = 0, 3836, s2 = 0, 0018 e s2 =
F
E
0, 0023.
O primeiro passo vericarmos se existe homogeneidade de varincias, ou seja, vamos
e
a
2
2
2
2
testar as hipteses, H0 : F = E vs H1 : E > F . A estat
o
stica F vale, F = s2 /s2 =
E
F
0, 0023/0, 0018 = 1, 2778, com 10 graus de liberdade no numerador e 10 graus de liberdade
no denominador. Com o aux de um programa estat
lio
stico, na distribuiao F , obtemos o
c
n m
vel nimo signicativo do teste (valor p), o qual vale,
P (F > 1, 2778) > 0, 352869.
De acordo com esse resultado, devemos aceitar a hiptese de varincias semelhantes.
o
a
Fazendo o teste de outra forma; podemos xar em 5% e encontrar o valor de F ,
com 10 (numerador) e 10 (denominador) graus de liberdade. Da tabela de F , encontramos
F10;10;5% = 2, 98. Como o valor de F calculado com os dados da amostra menor do que o
e
valor de F da tabela, aceitamos a hiptese nula.
o
293
Partimos, agora, para o teste sobre as mdias populaionais. As hipteses sobre as mdias
e
o
e
verdadeiras, de interesse do pesquisador, so formuladas como:
a
H 0 : F = E
H 1 : F < E .
O valor da estat
stica 8.5, vale:
t20 =
1
11
= 10, 831.
+
1
11
(X1 X2 ) (1 2 )
t=
.
(8.6)
2
2
S1
S2
+ n2
n1
Prova-se que esta varivel tem uma distribuiao aproximada de Student, com graus de
a
c
liberdade corrigido, dados por:
v=
2
S1
S2
+ n2
n1
2
2 2
S1
n1
n1 1
294
2
S2
n2
2
n2 1
H 1 : F > C .
78400
12
= 1, 99,
532900
12
( 532900 )
12
11
78400 2
12
2
( 78400 )
12
= 14, 17 15.
=
11
295
tamanho amostra
varincia
a
24,8
0,9
0,81
Controle
19,7
2,8
7,84
H 1 : T = C .
O valor da estat
stica dada em 8.6 :
e
(24, 8 19, 7) 0
t=
= 3, 06,
0,81 7,84
5
3
0,81
5
( 0,81 )
5
4
7,84 2
3
2
( 7,84 )
3
= 2, 25 3.
=
296
8.5
Aqui, desejamos avaliar certas armaoes feitas sobre proporoes ou porcentagens popc
c
ulacionais. Vamos considerar o estudo de teste de hipteses sobre propores em duas
o
co
situaes, quais sejam: 1) teste para uma proporao populacional e 2) teste para duas ou
co
c
mais proporoes.
c
8.5.1
Feita uma armao sobre uma proporao, desejamos saber se os dados de uma amostra
ca
c
suportam ou no tal armao. Por exemplo, vericar se a armativa de que 20% dos
a
ca
indiv
duos de uma comunidade apresentam certa caracter
stica gentica.
e
A construo de um teste de hiptese para uma proporo, segue o mesmo procedimento
ca
o
ca
mostrado para o teste sobre uma mdia. A hiptese nula arma que a proporao verdadeira,
e
o
c
, igual a um certo valor 0 . Ento,
e
a
H 0 : = 0 .
Para a hiptese alternativa, devemos escolher adequadamente uma, dentre as trs possibilio
e
dades:
H1 : = 0
(teste bilateral)
H 1 : > 0
H 1 : < 0
(1 )
n
p 0
0 (10 )
n
(8.7)
297
0, 90;
0, 90(0, 10)
400
0,90(0,10)
400
= 0, 015. A estat
stica Z vale,
p 0
0, 875 0, 90
=
= 1, 67.
P
0, 015
298
90%
10%
-3,50
-1,75
0,00
1,75
3,50
-1,28
Regio de aceitao
Regio de rejeio
0, 875(1 0, 875)
400
0, 875 0, 0273
0, 8477 0, 9023.
Exemplo 2. Um(a) Bilogo(a), com base em conhecimentos tericos e prticos, arma
o
o
a
que a proporao () de fortos no estdio arbreo pioneiro da Floresta Ombrla na Ilha
c
o
a
o
o
de Santa Catarina, apresenta 47% sem bromlias. Numa amostra de 35 fortos, p = 40%
e
o
no apresentaram bromlias. Teste a armativa do(a) Bilogo(a). (Formular as hipteses
a
e
o
o
do teste, calcular o valor p e concluir).
Hipteses:
o
H0 : = 47%
H1 : = 47%
Clculo do valor p:
a
z=
0, 40 0, 47
0,47(10,47)
35
= 0, 8297
299
Tabela 8.2: Distribuiao conjunta das frequncias das variveis poca de plantio/forma de
c
e
a
e
corte e sobrevivncia de ra de ameixeiras
e
zes
Epoca-Forma
Ra
zes
Total
Sobreviventes Mortas
Fora Primavera - Longo
Fora Primavera - Curto
Na Primavera - Longo
Na Primavera - Curto
84
133
156
209
240
240
240
240
Total
8.5.2
156
107
84
31
378
582
960
=
i=1
(oi ei )2
ei
O valor de qui-quadrado est entre 0 (zero) e + (mais innito). O valor 0 indica que
a
a sobrevivncia no depende da combinaao poca de plantio e forma de corte. Quanto
e
a
c e
maior o valor do qui-quadrado, mais as freqncias observadas se afastam das freqncias
e
ue
ue
esperadas. Isto indica, que a sobrevivncia dos enxertos depende da combinao poca
e
ca e
300
de plantio e forma de corte. A questo que devemos responder agora a seguinte: ser
a
e
a
2
que o valor encontrado de = 141, 05 grande o suciente para podermos armar que
e
a dependncia signicativa, ou no? Para obter a resposta devemos fazer um teste de
e
e
a
hipteses envolvendo a estat
o
stica 2 . Esse teste foi desenvolvido pelo estat
stico britnico
a
Karl Pearson em 1960. Inicialmente, vamos formular as hipteses do teste:
o
H0 :a combinaao poca de plantio e forma de corte no est associada com a sobrec e
a
a
vivncia de ra
e
zes.
H1 : a combinaao poca de plantio e forma de corte est associada com a sobrevivncia
c e
a
e
de ra
zes.
A estat
stica que vamos utilizar para fazer o teste de hiptese dada por:
o
e
rs
2
=
i=1
(oi ei )2
,
ei
(8.8)
a qual, segue uma distribuiao de qui-quadrado, com (r 1)(s 1) graus de liberdade, onde
c
r o nmero de linhas e s o nmero de colunas da tabela. Esta distribuiao dada no
e
u
e
u
c e
apndice 5. Existem diversos pacotes estat
e
sticos que calculam as probabilidades para a
distribuio de 2 e, ns, faremos o uso desses recursos. Alguns softwares dispon
ca
o
veis so:
a
Statistica, Minitab, Statgraphics, SAS, Excel.
Vamos calcular a probabilidade de encontrar um valor de 2 , com 3 graus de liberdade,
mais extremo do que o encontrado na pesquisa, devido ao acaso. Temos,
P (2 > 141, 05) = 0, 00001.
Portanto, rejeitamos a hiptese nula, e conclu
o
mos que a sobrevivncia de ra de ameixeiras
e
zes
depende da combinaao entre poca de plantio e forma de corte. A probabilidade de estarmos
c
e
tomando uma deciso errnea praticamente nula.
a
o
e
Para usar a tabela da distribuiao de qui-quadrado, assim como na distribuio de Stuc
ca
dent, necessitamos xar o n de signicncia () do teste e calcular os graus de liberdade
vel
a
da estat
stica. Para fazer o teste pelo mtodo tradicional, precisamos xar o n de sige
vel
nicncia e, assim, delimitar as regies de aceitaao e de rejeio. Por exemplo, para = 5%,
a
o
c
ca
e trs graus de liberdade, da tabela da distribuio de qui-quadrado, obtemos,
e
ca
2 = 7, 815.
3;5%
A gura 8.11 apresenta as regies de aceitaao e de rejeio da hiptese. Observe que
o
c
ca
o
a distribuio de qui-quadrado assimtrica, diferentemente das distribuies normal e t.
ca
e
e
co
301
95%
5%
0,00
6,25
12,50
18,75
25,00
7,815
Regio de aceitao
Regio de rejeio
302
Tabela 8.3: Distribuio conjunta das frequncias das variveis poca de plantio e sobreca
e
a
e
vivncia de ra de ameixeiras
e
zes
Epoca
Ra
zes
Total
Sobreviventes Mortas
Fora Primavera
Na Primavera
263
115
217
365
480
480
Total
378
582
960
2 =
i=1
(|oi ei | 0, 5)2
.
ei
(8.9)
Epoca
Ra
zes
Sobreviventes Mortas
Total
Fora Primavera
Na Primavera
189
189
291
291
480
480
Total
378
582
960
O valor da estat
stica 8.9 :
e
rs
2
=
i=1
(|oi ei | 0, 5)2
= 28, 58 + 28, 58 + 18, 56 + 18, 56 = 94, 29.
ei
303
315
108
101
32
312,75
104,25
104,25
34,75
Total
556
556,00
(315 312, 75)2 (108 104, 25)2 (101 104, 25)2 (32 34, 75)2
+
+
+
= 0, 47.
312, 75
104, 25
104, 25
34, 75
O valor de 2 bastante baixo, sugerindo que devemos aceitar a hiptese nula. Entretanto,
e
o
devemos encontrar o n m
vel nimo signicativo do teste, o qual vale,
P (2 > 0, 47) = 0, 925431 = 92, 54%.
Este valor muito superior a 5%, portanto, podemos armar que os dados concordam com
e
a teoria mendeliana, ao n de signicncia de 92,34%.
vel
a
304
8.6
Exerc
cios Propostos
1. Sabe-se que a proporao de sementes de soja, com danos mecnicos, provocados pelo
c
a
beneciamento, = 0, 18. Foram feitas 40 observaoes durante um dia de trabalho e se
e
c
constatou que p=0,20. Vericar se a mquina precisa ser regulada, ao n de signicncia
a
vel
a
de 5%.
2. Foram as seguintes as produes mdias de duas variedades de soja, em t/ha: variedade
co
e
A: mdia=3,8 t/ha com varincia = 0,36 (t/ha)2 ; variedade B: mdia=4,6 t/ha com varincia
e
a
e
a
= 0,04 (t/ha)2 . As informaoes obtidas, para as variedades A e B, foram baseadas em
c
amostras de tamanhos 30 e 35 respectivamente. Teste a hiptese de que no h diferena
o
a a
c
signicativa entre as produoes mdias, ao n de 1% de probabilidade.
c
e
vel
3.(Lindstrom,1918; Snedecor & Cochran,1972). Em um experimento envolvendo o cruzamento de dois tipos de milho, Lindstrom encontrou quatro tipos distintos: verde(T1),
dourado(T2), listras verdes (T3) e lisas verdes e douradas (T4). De acordo com a hereditariedade mendeliana, as probabilidades de obter esses quatro tipos so: 9/16, 3/16, 3/16
a
e 1/16, respectivamente. Em 1301 indiv
duos da segunda geraao, Lindstrom encontrou as
c
seguintes frequncias:
e
T1
773
231
T2
T3
238
T4
59
total 1301
Teste a hiptese de que a distribuio segue as leis da hereditariedade Mendeliana, contra a
o
ca
hiptese alternativa de que a distribuio no segue as leis da hereditariedade.
o
ca a
4. Que suposies so feitas acerca das populaes de onde se extraem amostras aleatrias
co a
co
o
independentes, quando se utiliza a distribuio t de Student exata para realizar inferncias
ca
e
a respeito da diferena entre mdias populacionais?
c
e
305
39,9
54,8
45,6 45,6
54,6 55,1
46,1
55,1
46,1 50,2
55,5 56,2
50,2
66,3
51,0
66,5
Amostra
Crrego do Chico
o
Poao do Crrego
c
o
30
30
3,26
4,02
306
392
381
8
19
400
400
Total
773
27
800
Inseticida padro
a
240
980
227
820
Estes dados indicam evidncia suciente de que o inseticida novo melhor do que o padro
e
e
a
(normalmente usado)?
9. Deseja-se testar a hiptese da possibilidade da quantidade de prote
o
nas totais no
plasma, depois de determinada operaao em portadores de esquistossomose mansnica, ser
c
o
diferente da quantidade antes da operaao. Foi utilizada uma amostra de 17 pacientes, cujos
c
307
resultados foram:
Paciente Antes
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
6,9
7,8
6,6
5,9
7,8
6,4
8,8
7,3
8,0
8,6
7,7
7,9
8,7
5,8
9,2
9,3
8,9
Depois
6,9
8,6
8,7
7,3
7,8
8,2
9,3
7,3
7,6
7,8
7,6
7,8
8,1
6,8
8,3
10,2
9,1
9,1 3,4
5,4 6,6
10,5 3,6
6,4 5,8
9,5
6,6
4,8 9,1
7,0 4,8
6,8
9,1
308
498
510
540
580
440
350
595
513
453
466
491
480
405
315
557
477
9
10
11
12
13
14
15
398
410
450
495
508
515
560
353
380
412
453
462
477
505
12. Realizou-se uma pesquisa para comparar dois locais, Itaja e Ararangu, quanto `
a
a
produao de arroz irrigado, em t/ha, na safra 88/89. Dez prognies foram utilizadas nos
c
e
dois locais e os seus resultados anotados.
Itaja
5,3
5,7
7,0
6,2
8,0
9,3
9,2
6,9
7,0
6,5
Ararangu
a
6,0
6,3
7,2
6,8
7,8
8,4
8,3
7,2
7,3
7,0
7,0 9,0
8,3 9,1
8,6 9,3
8,7 9,9
8,7 10,1
10,2
11,4
13,7
14,8
15,2
Canaf
stula
16,1
16,3
17,2
18,4
20,0
20,1
20,3
21,4
22,8
22,8
8,2
9,7
9,8
10,0
10,0
10,1
10,3
11,2
13,2
13,4
14,1
14,2
14,4
14,8
15,9
20,2
20,3
20,6
29,9
23,8
25,7
30,9
35,5
38,2
40,0
40,1
40,2
40,5
41,8
42,3
309
14. Um bilogo deseja fazer um estudo para vericar a especicidade do fungo Gigaspora
o
gigantea com as plantas Spartina sp e Tibouchina sp. Foram coletadas 20 amostras de solos
em volta da Spartina sp e 20 amostras de Tibouchina sp e vericada a quantidade de fungo
presente. os resultados foram:
Spartina sp
303
116
117
115
84
78
93
63
63
55
59
43
41
35
25
Tibouchina sp
15
10
5
6
3
305
110
110
112
85
74
95
62
60
53
60 18
40 11
40 4
32 9
22 4
Esses dados tem evidncia suciente para indicar uma diferena entre as quantidades mdias
e
c
e
de Gigaspora gigantea encontrada em plantas de Spartina sp e Tibouchina sp?
15. Para determinar qual de duas cultivares de trigo mais produtiva, um Centro
e
de Pesquisas em Agricultura selecionou quatro reas de terra, cada rea em uma regio
a
a
a
recomendada para a produao de trigo no Estado de Santa Catarina. Cada rea totalmente
c
a
e
homognea e foi dividida em duas partes. Foram semeadas as duas cultivares, uma em cada
e
parte da rea, atravs de um sorteio. Entre as regies dever haver diferenas de produo.
a
e
o
a
c
ca
As produoes, em kg/ha, foram:
c
Munic
pio
Abelardo Luz
Chapec
o
Campos Novos
Mafra
Cultivares
CEP 15-Batou CEP 18-Cavera
2912
2528
3309
2324
3854
3295
3916
2548
310
capturadas, foram:
Armadilhas
Inseticida
Com Sem
114
1067
715
1896
Uma armadilha
Duas armadilhas
Trs armadilhas
e
Total
Total
301
1429
988
2718
197
362
273
822
Podemos armar que existem diferenas signicativas entre o nmero de armadilhas utic
u
lizadas com relaao ao uso de inseticida, ao n de signicncia de 5%?
c
vel
a
17. Um agricultor que planta frutas deseja testar um novo tipo de inseticida, cujo fabricante garante reduzir o preju por danos causados por certo tipo de inseto, consequentezo
mente aumenta a produo. Para vericar essa armao do fabricante do inseticida, o
ca
ca
agricultor pulveriza 200 rvores com o novo inseticida e 200 rvores com o inseticida normala
a
mente utilizado. O agricultor anotou a produo mdia por rvore para os dois inseticidas.
ca
e
a
a)Formule as hipteses do teste (H0 e H1 ), em termos de mdias populacionais.
o
e
b) D a deniao de para esse experimento.
e
c
18. Foi realizado um experimento para avaliar o comportamento in vitro da espcie
e
Mandevilla velutina (Apocincea), provenientes de duas regies diferentes: Cerrado e Restinga.
a
o
Aps isolar os explantes, com um n com duas gemas axilares, obtidos das plantas matrizes,
o
o
foi instalado o experimento com delineamento inteiramente casualizado com 20 repeties
co
(20 explantes para o Cerrado e 20 para a Restinga), portanto, temos um total de 40 unidades
experimentais. Esse experimento produziu um desvio padro s = 1, 5611 com 38 graus de
a
liberdade. A varivel utilizada foi a altura em cm dos explantes de Mandevilla cultivadas
a
in vitro durante 45 dias, cujos resultados foram:
Cerrado
5,3
2,5
5,1
2,6
1,2
3,1
4,1
3,7
5,0
1,6
3,0
4,7
2,6
4,2
4,0
Restinga
4,7
6,4
2,9
3,2
2,1
3,6
2,3
6,0
2,1
5,2
4,3
3,9
2,1
2,4
2,0
2,7
3,9
5,6
4,7
1,9
5,1
4,7
2,1
6,1
8,1
311
pssima, problemtica, regular e aceitvel. Numa amostra de 188 garrafas de vinho, foram
e
a
a
encontrados os seguintes resultados:
Vinho
Estabilidade
Pssima Problemtica Regular
e
a
Total
Aceitvel
a
Branco
Rosado
Tinto
8
10
29
29
22
21
28
10
13
7
3
8
72
45
71
Total
47
72
51
18
188
11,8
10,0
8,7
9,0 14,7
9,8 10,3
13,8 12,8
312
26,5
27
33,5
34
35
28
28,5
36,4 37,6
29
29,4 31
38,5
38,7 41
32
32,5
40,6 41,6
313
Bibliograa
ALBERTS,B., BRAY,D., JOHNSON,A., LEWIS,J., RAFF,M., ROBERTS,K., WALTER,P.
Fundamentos da biologia celular. Uma introduo ` biologia molecular da clula. Edica a
e
tora Artes Mdicas Sul. Porto Alegre, 1999.
e
BARBETTA,P.A. Estatstica aplicada `s cincias sociais. 4. ed. Florianpolis: Editora da
a e
o
Universidade Federal de Santa Catarina, 2001.
BATSCHELET,E. Introduo ` matemtica para biocientistas. So Paulo: Editora da
ca a
a
a
Universidade de So Paulo, 1978.
a
BOX,G.E.P., HUNTER,W.G., HUNTER,J.S. Statistics for experimenters. Canad: John
a
Wiley, 1978.
BROWN,D., ROTHERY,P. Models in Biology: mathematics, statistics and computing. New
York: John Wiley & Sons, 1994.
BROWER,J.E., ZAR,J.H. Fields & Laboratory Methods for General Ecology.
Dubuque, Iowa: WCB, ano???.
2.
ed.
a
a
Federal de Gois, 1982.
a
FINNEY,D.J. An introduction to statistical science in agriculture.
HEATH,O.V.S. A estat
stica na pesquisa cient
ca. v. 1. So Paulo: Editora da USP,
a
1981.
JUNIOR,P.S., MACHADO,A.A., ZONTA,E.P. da SILVA,J.B. Curso de estat
stica. v. 1 e
2. Pelotas: Editora Universitria, 1992.
a
MENDENHALL,N. Probabilidade e estatstica. v. 1 e 2. Rio de Janeiro: Editora Campos,
1985.
MONTGOMERY,D.D. Design and analysis of experiments. 5. ed. New York: John Wiley
& Sons, Inc. 2001.
MORETTIN,L.G. Estatstica bsica: probabilidade. 6. ed. So Paulo: McGraw-Hill.
a
a
314
a
WONNACOTT,T.H., WONNACOTT,R.J. Estat
stica aplicada ` economia e ` adminina
a
strao. 1. ed. Rio de Janeiro: Livros Tcnicos e Cient
ca
e
cos Editora, 1981.
315
Apndice 1
e
Tabela da distribuio binomial
ca
Tabela 1: Distribuiao binomial: probabilidade de cada
c
valor k em funao de n e
c
0,05
0,10
0,15
0,20
0,25
0
1
0,9500 0,9000 0,8500 0,8000 0,7500 0,7000 0,6500 0,6000 0,5500 0,5000
0,0500 0,1000 0,1500 0,2000 0,2500 0,3000 0,3500 0,4000 0,4500 0,5000
0
1
2
0,9025 0,8100 0,7225 0,6400 0,5625 0,4900 0,4225 0,3600 0,3025 0,2500
0,0950 0,1800 0,2550 0,3200 0,3750 0,4200 0,4550 0,4800 0,4950 0,5000
0,0025 0,0100 0,0225 0,0400 0,0625 0,0900 0,1225 0,1600 0,2025 0,2500
0
1
2
3
0,8574 0,7290
0,1354 0,2430
0,0071 0,0270
0,0001 0,0010
0,6141 0,5120
0,3251 0,3840
0,0574 0,0960
0,0034 0,0080
0
1
2
3
4
0,8145 0,6561
0,1715 0,2916
0,0135 0,0486
0,0005 0,0036
0,0000 0,0001
0,5220 0,4096
0,3685 0,4096
0,0975 0,1536
0,0115 0,0256
0,0005 0,0016
0
1
2
3
4
5
0,7738 0,5905
0,2036 0,3281
0,0214 0,0729
0,0011 0,0081
0,0000 0,0005
0,0000 0,0000
0,4437 0,3277
0,3915 0,4096
0,1382 0,2048
0,0244 0,0512
0,0022 0,0064
0,0001 0,0003
0,7351 0,5314
0,3771
0,2621 0,1780
0,30
0,1176
0,35
0,0754
0,40
0,0467
0,45
0,0277
0,50
0,0156
316
0,05
0,10
0,15
0,20
0,25
1
2
3
4
5
6
0,2321
0,0305
0,0021
0,0001
0,0000
0,0000
0,3543
0,0984
0,0146
0,0012
0,0001
0,0000
0,3993
0,1762
0,0415
0,0055
0,0004
0,0000
0,3932
0,2458
0,0819
0,0154
0,0015
0,0001
0,3560
0,2966
0,1318
0,0330
0,0044
0,0002
0
1
2
3
4
5
6
7
0,6983 0,4783
0,2573 0,3720
0,0406 0,1240
0,0036 0,0230
0,0002 0,0026
0,0000 0,0002
0,0000 0,0000
0,0000 0,0000
0,3206 0,2097
0,3960 0,3670
0,2097 0,2753
0,0617 0,1147
0,0109 0,0287
0,0012 0,0043
0,0001 0,0004
0,0000 0,0000
0
1
2
3
4
5
6
7
8
0,6634 0,4305
0,2793 0,3826
0,0515 0,1488
0,0054 0,0331
0,0004 0,0046
0,0000 0,0004
0,0000 0,0000
0,0000 0,0000
0,0000 0,0000
0,2725 0,1678
0,3847 0,3355
0,2376 0,2936
0,0839 0,1468
0,0185 0,0459
0,0026 0,0092
0,0002 0,0011
0,0000 0,0001
0,0000 0,0000
0
1
2
3
4
0,6302 0,3874
0,2985 0,3874
0,0629 0,1722
0,0077 0,0446
0,0006 0,0074
0,2316 0,1342
0,3679 0,3020
0,2597 0,3020
0,1069 0,1762
0,0283 0,0661
0,30
0,35
0,40
0,45
0,50
0,3025
0,3241
0,1852
0,0595
0,0102
0,0007
0,2437
0,3280
0,2355
0,0951
0,0205
0,0018
0,1866
0,3110
0,2765
0,1382
0,0369
0,0041
0,1359
0,2780
0,3032
0,1861
0,0609
0,0083
0,0938
0,2344
0,3125
0,2344
0,0938
0,0156
317
0,05
0,10
0,15
0,20
0,25
5
6
7
8
9
0,0000
0,0000
0,0000
0,0000
0,0000
0,0008
0,0001
0,0000
0,0000
0,0000
0,0050
0,0006
0,0000
0,0000
0,0000
0,0165
0,0028
0,0003
0,0000
0,0000
0,0389
0,0087
0,0012
0,0001
0,0000
0,0735
0,0210
0,0039
0,0004
0,0000
0,1181
0,0424
0,0098
0,0013
0,0001
0,1672
0,0743
0,0212
0,0035
0,0003
0,2128
0,1160
0,0407
0,0083
0,0008
0,2461
0,1641
0,0703
0,0176
0,0020
10
0
1
2
3
4
5
6
7
8
9
10
0,5987
0,3151
0,0746
0,0105
0,0010
0,0001
0,0000
0,0000
0,0000
0,0000
0,0000
0,3487
0,3874
0,1937
0,0574
0,0112
0,0015
0,0001
0,0000
0,0000
0,0000
0,0000
0,1969
0,3474
0,2759
0,1298
0,0401
0,0085
0,0012
0,0001
0,0000
0,0000
0,0000
0,1074
0,2684
0,3020
0,2013
0,0881
0,0264
0,0055
0,0008
0,0001
0,0000
0,0000
0,0563
0,1877
0,2816
0,2503
0,1460
0,0584
0,0162
0,0031
0,0004
0,0000
0,0000
0,0282
0,1211
0,2335
0,2668
0,2001
0,1029
0,0368
0,0090
0,0014
0,0001
0,0000
0,0135
0,0725
0,1757
0,2522
0,2377
0,1536
0,0689
0,0212
0,0043
0,0005
0,0000
0,0060
0,0403
0,1209
0,2150
0,2508
0,2007
0,1115
0,0425
0,0106
0,0016
0,0001
0,0025
0,0207
0,0763
0,1665
0,2384
0,2340
0,1596
0,0746
0,0229
0,0042
0,0003
0,0010
0,0098
0,0439
0,1172
0,2051
0,2461
0,2051
0,1172
0,0439
0,0098
0,0010
11
0
1
2
3
4
5
6
7
8
9
10
11
0,5688
0,3293
0,0867
0,0137
0,0014
0,0001
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,3138
0,3835
0,2131
0,0710
0,0158
0,0025
0,0003
0,0000
0,0000
0,0000
0,0000
0,0000
0,1673
0,3248
0,2866
0,1517
0,0536
0,0132
0,0023
0,0003
0,0000
0,0000
0,0000
0,0000
0,0859
0,2362
0,2953
0,2215
0,1107
0,0388
0,0097
0,0017
0,0002
0,0000
0,0000
0,0000
0,0422
0,1549
0,2581
0,2581
0,1721
0,0803
0,0268
0,0064
0,0011
0,0001
0,0000
0,0000
0,0198
0,0932
0,1998
0,2568
0,2201
0,1321
0,0566
0,0173
0,0037
0,0005
0,0000
0,0000
0,0088
0,0518
0,1395
0,2254
0,2428
0,1830
0,0985
0,0379
0,0102
0,0018
0,0002
0,0000
0,0036
0,0266
0,0887
0,1774
0,2365
0,2207
0,1471
0,0701
0,0234
0,0052
0,0007
0,0000
0,0014
0,0125
0,0513
0,1259
0,2060
0,2360
0,1931
0,1128
0,0462
0,0126
0,0021
0,0002
0,0005
0,0054
0,0269
0,0806
0,1611
0,2256
0,2256
0,1611
0,0806
0,0269
0,0054
0,0005
0,30
0,35
0,40
0,45
0,50
318
0,05
0,10
0,15
0,20
0,25
12
0
1
2
3
4
5
6
7
8
9
10
11
12
0,5404
0,3413
0,0988
0,0173
0,0021
0,0002
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,2824
0,3766
0,2301
0,0852
0,0213
0,0038
0,0005
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,1422
0,3012
0,2924
0,1720
0,0683
0,0193
0,0040
0,0006
0,0001
0,0000
0,0000
0,0000
0,0000
0,0687
0,2062
0,2835
0,2362
0,1329
0,0532
0,0155
0,0033
0,0005
0,0001
0,0000
0,0000
0,0000
0,0317
0,1267
0,2323
0,2581
0,1936
0,1032
0,0401
0,0115
0,0024
0,0004
0,0000
0,0000
0,0000
0,0138
0,0712
0,1678
0,2397
0,2311
0,1585
0,0792
0,0291
0,0078
0,0015
0,0002
0,0000
0,0000
0,0057
0,0368
0,1088
0,1954
0,2367
0,2039
0,1281
0,0591
0,0199
0,0048
0,0008
0,0001
0,0000
0,0022
0,0174
0,0639
0,1419
0,2128
0,2270
0,1766
0,1009
0,0420
0,0125
0,0025
0,0003
0,0000
0,0008
0,0075
0,0339
0,0923
0,1700
0,2225
0,2124
0,1489
0,0762
0,0277
0,0068
0,0010
0,0001
0,0002
0,0029
0,0161
0,0537
0,1208
0,1934
0,2256
0,1934
0,1208
0,0537
0,0161
0,0029
0,0002
13
0
1
2
3
4
5
6
7
8
9
10
11
12
13
0,5133
0,3512
0,1109
0,0214
0,0028
0,0003
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,2542
0,3672
0,2448
0,0997
0,0277
0,0055
0,0008
0,0001
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,1209
0,2774
0,2937
0,1900
0,0838
0,0266
0,0063
0,0011
0,0001
0,0000
0,0000
0,0000
0,0000
0,0000
0,0550
0,1787
0,2680
0,2457
0,1535
0,0691
0,0230
0,0058
0,0011
0,0001
0,0000
0,0000
0,0000
0,0000
0,0238
0,1029
0,2059
0,2517
0,2097
0,1258
0,0559
0,0186
0,0047
0,0009
0,0001
0,0000
0,0000
0,0000
0,0097
0,0540
0,1388
0,2181
0,2337
0,1803
0,1030
0,0442
0,0142
0,0034
0,0006
0,0001
0,0000
0,0000
0,0037
0,0259
0,0836
0,1651
0,2222
0,2154
0,1546
0,0833
0,0336
0,0101
0,0022
0,0003
0,0000
0,0000
0,0013
0,0113
0,0453
0,1107
0,1845
0,2214
0,1968
0,1312
0,0656
0,0243
0,0065
0,0012
0,0001
0,0000
0,0004
0,0045
0,0220
0,0660
0,1350
0,1989
0,2169
0,1775
0,1089
0,0495
0,0162
0,0036
0,0005
0,0000
0,0001
0,0016
0,0095
0,0349
0,0873
0,1571
0,2095
0,2095
0,1571
0,0873
0,0349
0,0095
0,0016
0,0001
14
0
1
0,4877 0,2288 0,1028 0,0440 0,0178 0,0068 0,0024 0,0008 0,0002 0,0001
0,3593 0,3559 0,2539 0,1539 0,0832 0,0407 0,0181 0,0073 0,0027 0,0009
0,30
0,35
0,40
0,45
0,50
319
15
0,05
0,10
0,15
0,20
2
3
4
5
6
7
8
9
10
11
12
13
14
0,25
0,1229
0,0259
0,0037
0,0004
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,2570
0,1142
0,0349
0,0078
0,0013
0,0002
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,2912
0,2056
0,0998
0,0352
0,0093
0,0019
0,0003
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,2501
0,2501
0,1720
0,0860
0,0322
0,0092
0,0020
0,0003
0,0000
0,0000
0,0000
0,0000
0,0000
0,1802
0,2402
0,2202
0,1468
0,0734
0,0280
0,0082
0,0018
0,0003
0,0000
0,0000
0,0000
0,0000
0,1134
0,1943
0,2290
0,1963
0,1262
0,0618
0,0232
0,0066
0,0014
0,0002
0,0000
0,0000
0,0000
0,0634
0,1366
0,2022
0,2178
0,1759
0,1082
0,0510
0,0183
0,0049
0,0010
0,0001
0,0000
0,0000
0,0317
0,0845
0,1549
0,2066
0,2066
0,1574
0,0918
0,0408
0,0136
0,0033
0,0005
0,0001
0,0000
0,0141
0,0462
0,1040
0,1701
0,2088
0,1952
0,1398
0,0762
0,0312
0,0093
0,0019
0,0002
0,0000
0,0056
0,0222
0,0611
0,1222
0,1833
0,2095
0,1833
0,1222
0,0611
0,0222
0,0056
0,0009
0,0001
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
0,4633
0,3658
0,1348
0,0307
0,0049
0,0006
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,2059
0,3432
0,2669
0,1285
0,0428
0,0105
0,0019
0,0003
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0874
0,2312
0,2856
0,2184
0,1156
0,0449
0,0132
0,0030
0,0005
0,0001
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0352
0,1319
0,2309
0,2501
0,1876
0,1032
0,0430
0,0138
0,0035
0,0007
0,0001
0,0000
0,0000
0,0000
0,0000
0,0000
0,0134
0,0668
0,1559
0,2252
0,2252
0,1651
0,0917
0,0393
0,0131
0,0034
0,0007
0,0001
0,0000
0,0000
0,0000
0,0000
0,0047
0,0305
0,0916
0,1700
0,2186
0,2061
0,1472
0,0811
0,0348
0,0116
0,0030
0,0006
0,0001
0,0000
0,0000
0,0000
0,0016
0,0126
0,0476
0,1110
0,1792
0,2123
0,1906
0,1319
0,0710
0,0298
0,0096
0,0024
0,0004
0,0001
0,0000
0,0000
0,0005
0,0047
0,0219
0,0634
0,1268
0,1859
0,2066
0,1771
0,1181
0,0612
0,0245
0,0074
0,0016
0,0003
0,0000
0,0000
0,0001
0,0016
0,0090
0,0318
0,0780
0,1404
0,1914
0,2013
0,1647
0,1048
0,0515
0,0191
0,0052
0,0010
0,0001
0,0000
0,0000
0,0005
0,0032
0,0139
0,0417
0,0916
0,1527
0,1964
0,1964
0,1527
0,0916
0,0417
0,0139
0,0032
0,0005
0,0000
0,30
0,35
0,40
0,45
0,50
320
0,55
0,60
0,65
0,70
0,75
0,80
0,85
0,90
0,95
0,97
0
1
0,4500 0,4000 0,3500 0,3000 0,2500 0,2000 0,1500 0,1000 0,0500 0,0300
0,5500 0,6000 0,6500 0,7000 0,7500 0,8000 0,8500 0,9000 0,9500 0,9700
0
1
2
0,2025 0,1600 0,1225 0,0900 0,0625 0,0400 0,0225 0,0100 0,0025 0,0009
0,4950 0,4800 0,4550 0,4200 0,3750 0,3200 0,2550 0,1800 0,0950 0,0582
0,3025 0,3600 0,4225 0,4900 0,5625 0,6400 0,7225 0,8100 0,9025 0,9409
0
1
2
3
0,0911 0,0640
0,3341 0,2880
0,4084 0,4320
0,1664 0,2160
0,0429 0,0270
0,2389 0,1890
0,4436 0,4410
0,2746 0,3430
0
1
2
3
4
0,0410 0,0256
0,2005 0,1536
0,3675 0,3456
0,2995 0,3456
0,0915 0,1296
0,0150 0,0081
0,1115 0,0756
0,3105 0,2646
0,3845 0,4116
0,1785 0,2401
0
1
2
3
4
5
0,0185 0,0102
0,1128 0,0768
0,2757 0,2304
0,3369 0,3456
0,2059 0,2592
0,0503 0,0778
0,0053 0,0024
0,0488 0,0284
0,1811 0,1323
0,3364 0,3087
0,3124 0,3602
0,1160 0,1681
0
1
2
0,0083 0,0041 0,0018 0,0007 0,0002 0,0001 0,0000 0,0000 0,0000 0,0000
0,0609 0,0369 0,0205 0,0102 0,0044 0,0015 0,0004 0,0001 0,0000 0,0000
0,1861 0,1382 0,0951 0,0595 0,0330 0,0154 0,0055 0,0012 0,0001 0,0000
continua na prxima pgina
o
a
321
0,55
0,60
0,65
0,70
0,75
3
4
5
6
0,3032
0,2780
0,1359
0,0277
0,2765
0,3110
0,1866
0,0467
0,2355
0,3280
0,2437
0,0754
0,1852
0,3241
0,3025
0,1176
0,1318
0,2966
0,3560
0,1780
0
1
2
3
4
5
6
7
0,0037 0,0016
0,0320 0,0172
0,1172 0,0774
0,2388 0,1935
0,2918 0,2903
0,2140 0,2613
0,0872 0,1306
0,0152 0,0280
0,0006 0,0002
0,0084 0,0036
0,0466 0,0250
0,1442 0,0972
0,2679 0,2269
0,2985 0,3177
0,1848 0,2471
0,0490 0,0824
0
1
2
3
4
5
6
7
8
0,0017 0,0007
0,0164 0,0079
0,0703 0,0413
0,1719 0,1239
0,2627 0,2322
0,2568 0,2787
0,1569 0,2090
0,0548 0,0896
0,0084 0,0168
0,0002 0,0001
0,0033 0,0012
0,0217 0,0100
0,0808 0,0467
0,1875 0,1361
0,2786 0,2541
0,2587 0,2965
0,1373 0,1977
0,0319 0,0576
0
1
2
3
4
5
6
0,0008 0,0003
0,0083 0,0035
0,0407 0,0212
0,1160 0,0743
0,2128 0,1672
0,2600 0,2508
0,2119 0,2508
0,0001 0,0000
0,0013 0,0004
0,0098 0,0039
0,0424 0,0210
0,1181 0,0735
0,2194 0,1715
0,2716 0,2668
0,80
0,85
0,90
0,95
0,97
0,0819
0,2458
0,3932
0,2621
0,0415
0,1762
0,3993
0,3771
0,0146
0,0984
0,3543
0,5314
0,0021
0,0305
0,2321
0,7351
0,0005
0,0120
0,1546
0,8330
322
0,60
0,65
0,70
0,75
0,55
0,80
0,85
0,90
0,95
0,97
7
8
9
0,1110
0,0339
0,0046
0,1612 0,2162
0,0605 0,1004
0,0101 0,0207
0,2668 0,3003
0,1556 0,2253
0,0404 0,0751
0,3020
0,3020
0,1342
0,2597
0,3679
0,2316
0,1722
0,3874
0,3874
0,0629
0,2985
0,6302
0,0262
0,2116
0,7602
10
0
1
2
3
4
5
6
7
8
9
10
0,0003
0,0042
0,0229
0,0746
0,1596
0,2340
0,2384
0,1665
0,0763
0,0207
0,0025
0,0001
0,0016
0,0106
0,0425
0,1115
0,2007
0,2508
0,2150
0,1209
0,0403
0,0060
0,0000
0,0005
0,0043
0,0212
0,0689
0,1536
0,2377
0,2522
0,1757
0,0725
0,0135
0,0000
0,0001
0,0014
0,0090
0,0368
0,1029
0,2001
0,2668
0,2335
0,1211
0,0282
0,0000
0,0000
0,0004
0,0031
0,0162
0,0584
0,1460
0,2503
0,2816
0,1877
0,0563
0,0000
0,0000
0,0001
0,0008
0,0055
0,0264
0,0881
0,2013
0,3020
0,2684
0,1074
0,0000
0,0000
0,0000
0,0001
0,0012
0,0085
0,0401
0,1298
0,2759
0,3474
0,1969
0,0000
0,0000
0,0000
0,0000
0,0001
0,0015
0,0112
0,0574
0,1937
0,3874
0,3487
0,0000
0,0000
0,0000
0,0000
0,0000
0,0001
0,0010
0,0105
0,0746
0,3151
0,5987
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0001
0,0026
0,0317
0,2281
0,7374
11
0
1
2
3
4
5
6
7
8
9
10
11
0,0002
0,0021
0,0126
0,0462
0,1128
0,1931
0,2360
0,2060
0,1259
0,0513
0,0125
0,0014
0,0000
0,0007
0,0052
0,0234
0,0701
0,1471
0,2207
0,2365
0,1774
0,0887
0,0266
0,0036
0,0000
0,0002
0,0018
0,0102
0,0379
0,0985
0,1830
0,2428
0,2254
0,1395
0,0518
0,0088
0,0000
0,0000
0,0005
0,0037
0,0173
0,0566
0,1321
0,2201
0,2568
0,1998
0,0932
0,0198
0,0000
0,0000
0,0001
0,0011
0,0064
0,0268
0,0803
0,1721
0,2581
0,2581
0,1549
0,0422
0,0000
0,0000
0,0000
0,0002
0,0017
0,0097
0,0388
0,1107
0,2215
0,2953
0,2362
0,0859
0,0000
0,0000
0,0000
0,0000
0,0003
0,0023
0,0132
0,0536
0,1517
0,2866
0,3248
0,1673
0,0000
0,0000
0,0000
0,0000
0,0000
0,0003
0,0025
0,0158
0,0710
0,2131
0,3835
0,3138
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0001
0,0014
0,0137
0,0867
0,3293
0,5688
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0002
0,0035
0,0376
0,2433
0,7153
12
0
1
0,0001 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
0,0010 0,0003 0,0001 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
continua na prxima pgina
o
a
323
0,55
0,60
0,65
0,70
0,75
2
3
4
5
6
7
8
9
10
11
12
0,0068
0,0277
0,0762
0,1489
0,2124
0,2225
0,1700
0,0923
0,0339
0,0075
0,0008
0,0025
0,0125
0,0420
0,1009
0,1766
0,2270
0,2128
0,1419
0,0639
0,0174
0,0022
0,0008
0,0048
0,0199
0,0591
0,1281
0,2039
0,2367
0,1954
0,1088
0,0368
0,0057
0,0002
0,0015
0,0078
0,0291
0,0792
0,1585
0,2311
0,2397
0,1678
0,0712
0,0138
0,0000
0,0004
0,0024
0,0115
0,0401
0,1032
0,1936
0,2581
0,2323
0,1267
0,0317
0,0000
0,0001
0,0005
0,0033
0,0155
0,0532
0,1329
0,2362
0,2835
0,2062
0,0687
0,0000
0,0000
0,0001
0,0006
0,0040
0,0193
0,0683
0,1720
0,2924
0,3012
0,1422
0,0000
0,0000
0,0000
0,0000
0,0005
0,0038
0,0213
0,0852
0,2301
0,3766
0,2824
0,0000
0,0000
0,0000
0,0000
0,0000
0,0002
0,0021
0,0173
0,0988
0,3413
0,5404
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0003
0,0045
0,0438
0,2575
0,6938
13
0
1
2
3
4
5
6
7
8
9
10
11
12
13
0,0000
0,0005
0,0036
0,0162
0,0495
0,1089
0,1775
0,2169
0,1989
0,1350
0,0660
0,0220
0,0045
0,0004
0,0000
0,0001
0,0012
0,0065
0,0243
0,0656
0,1312
0,1968
0,2214
0,1845
0,1107
0,0453
0,0113
0,0013
0,0000
0,0000
0,0003
0,0022
0,0101
0,0336
0,0833
0,1546
0,2154
0,2222
0,1651
0,0836
0,0259
0,0037
0,0000
0,0000
0,0001
0,0006
0,0034
0,0142
0,0442
0,1030
0,1803
0,2337
0,2181
0,1388
0,0540
0,0097
0,0000
0,0000
0,0000
0,0001
0,0009
0,0047
0,0186
0,0559
0,1258
0,2097
0,2517
0,2059
0,1029
0,0238
0,0000
0,0000
0,0000
0,0000
0,0001
0,0011
0,0058
0,0230
0,0691
0,1535
0,2457
0,2680
0,1787
0,0550
0,0000
0,0000
0,0000
0,0000
0,0000
0,0001
0,0011
0,0063
0,0266
0,0838
0,1900
0,2937
0,2774
0,1209
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0001
0,0008
0,0055
0,0277
0,0997
0,2448
0,3672
0,2542
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0003
0,0028
0,0214
0,1109
0,3512
0,5133
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0004
0,0057
0,0502
0,2706
0,6730
14
0
1
2
3
0,0000 0,0000
0,0002 0,0001
0,0019 0,0005
0,0093 0,0033
0,0000 0,0000
0,0000 0,0000
0,0001 0,0000
0,0010 0,0002
0,80
0,85
0,90
0,95
0,97
324
15
0,55
0,60
0,65
0,70
4
5
6
7
8
9
10
11
12
13
14
0,75
0,0312
0,0762
0,1398
0,1952
0,2088
0,1701
0,1040
0,0462
0,0141
0,0027
0,0002
0,0136
0,0408
0,0918
0,1574
0,2066
0,2066
0,1549
0,0845
0,0317
0,0073
0,0008
0,0049
0,0183
0,0510
0,1082
0,1759
0,2178
0,2022
0,1366
0,0634
0,0181
0,0024
0,0014
0,0066
0,0232
0,0618
0,1262
0,1963
0,2290
0,1943
0,1134
0,0407
0,0068
0,0003
0,0018
0,0082
0,0280
0,0734
0,1468
0,2202
0,2402
0,1802
0,0832
0,0178
0,0000
0,0003
0,0020
0,0092
0,0322
0,0860
0,1720
0,2501
0,2501
0,1539
0,0440
0,0000
0,0000
0,0003
0,0019
0,0093
0,0352
0,0998
0,2056
0,2912
0,2539
0,1028
0,0000
0,0000
0,0000
0,0002
0,0013
0,0078
0,0349
0,1142
0,2570
0,3559
0,2288
0,0000
0,0000
0,0000
0,0000
0,0000
0,0004
0,0037
0,0259
0,1229
0,3593
0,4877
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0006
0,0070
0,0568
0,2827
0,6528
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
0,0000
0,0001
0,0010
0,0052
0,0191
0,0515
0,1048
0,1647
0,2013
0,1914
0,1404
0,0780
0,0318
0,0090
0,0016
0,0001
0,0000
0,0000
0,0003
0,0016
0,0074
0,0245
0,0612
0,1181
0,1771
0,2066
0,1859
0,1268
0,0634
0,0219
0,0047
0,0005
0,0000
0,0000
0,0001
0,0004
0,0024
0,0096
0,0298
0,0710
0,1319
0,1906
0,2123
0,1792
0,1110
0,0476
0,0126
0,0016
0,0000
0,0000
0,0000
0,0001
0,0006
0,0030
0,0116
0,0348
0,0811
0,1472
0,2061
0,2186
0,1700
0,0916
0,0305
0,0047
0,0000
0,0000
0,0000
0,0000
0,0001
0,0007
0,0034
0,0131
0,0393
0,0917
0,1651
0,2252
0,2252
0,1559
0,0668
0,0134
0,0000
0,0000
0,0000
0,0000
0,0000
0,0001
0,0007
0,0035
0,0138
0,0430
0,1032
0,1876
0,2501
0,2309
0,1319
0,0352
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0001
0,0005
0,0030
0,0132
0,0449
0,1156
0,2184
0,2856
0,2312
0,0874
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0003
0,0019
0,0105
0,0428
0,1285
0,2669
0,3432
0,2059
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0006
0,0049
0,0307
0,1348
0,3658
0,4633
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0001
0,0008
0,0085
0,0636
0,2938
0,6333
325
0,80
0,85
0,90
0,95
0,97
Apndice 2
e
Tabela da distribuio de Poisson
ca
Tabela 3: Distribuio de Poisson: probabilidade de cada valor k em funo
ca
ca
de
k
0,005
0,015
0,02
0,025
0,03
0,035
0,04
0,045
0,05
0,055
0,06
0,07
0,9950
0,0050
0,0000
0,0000
0,0000
0,9900
0,0099
0,0000
0,0000
0,0000
0,9851
0,0148
0,0001
0,0000
0,0000
0,9802
0,0196
0,0002
0,0000
0,0000
0,9753
0,0244
0,0003
0,0000
0,0000
0,9704
0,0291
0,0004
0,0000
0,0000
0,9656
0,0338
0,0006
0,0000
0,0000
0,9608
0,0384
0,0008
0,0000
0,0000
0,9560
0,0430
0,0010
0,0000
0,0000
0,9512
0,0476
0,0012
0,0000
0,0000
0,9465
0,0521
0,0014
0,0000
0,0000
0,9418
0,0565
0,0017
0,0000
0,0000
0,9324
0,0653
0,0023
0,0001
0,0000
0,09
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,2
1,4
0,9139
0,0823
0,0037
0,0001
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,9048
0,0905
0,0045
0,0002
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,8187
0,1637
0,0164
0,0011
0,0001
0,0000
0,0000
0,0000
0,0000
0,0000
0,7408
0,2222
0,0333
0,0033
0,0003
0,0000
0,0000
0,0000
0,0000
0,0000
0,6703
0,2681
0,0536
0,0072
0,0007
0,0001
0,0000
0,0000
0,0000
0,0000
0,6065
0,3033
0,0758
0,0126
0,0016
0,0002
0,0000
0,0000
0,0000
0,0000
0,5488
0,3293
0,0988
0,0198
0,0030
0,0004
0,0000
0,0000
0,0000
0,0000
0,4966
0,3476
0,1217
0,0284
0,0050
0,0007
0,0001
0,0000
0,0000
0,0000
0,4493
0,3595
0,1438
0,0383
0,0077
0,0012
0,0002
0,0000
0,0000
0,0000
0,4066
0,3659
0,1647
0,0494
0,0111
0,0020
0,0003
0,0000
0,0000
0,0000
0,3679
0,3679
0,1839
0,0613
0,0153
0,0031
0,0005
0,0001
0,0000
0,0000
0,3012
0,3614
0,2169
0,0867
0,0260
0,0062
0,0012
0,0002
0,0000
0,0000
0,2466
0,3452
0,2417
0,1128
0,0395
0,0111
0,0026
0,0005
0,0001
0,0000
1,8
0
1
2
3
4
0,01
2,5
3,5
4,5
10
0,1653
0,2975
0,2678
0,1607
0,0723
0,0260
0,0078
0,0020
0,0005
0,0001
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,1353
0,2707
0,2707
0,1804
0,0902
0,0361
0,0120
0,0034
0,0009
0,0002
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0821
0,2052
0,2565
0,2138
0,1336
0,0668
0,0278
0,0099
0,0031
0,0009
0,0002
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0498
0,1494
0,2240
0,2240
0,1680
0,1008
0,0504
0,0216
0,0081
0,0027
0,0008
0,0002
0,0001
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0302
0,1057
0,1850
0,2158
0,1888
0,1322
0,0771
0,0385
0,0169
0,0066
0,0023
0,0007
0,0002
0,0001
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0183
0,0733
0,1465
0,1954
0,1954
0,1563
0,1042
0,0595
0,0298
0,0132
0,0053
0,0019
0,0006
0,0002
0,0001
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0111
0,0500
0,1125
0,1687
0,1898
0,1708
0,1281
0,0824
0,0463
0,0232
0,0104
0,0043
0,0016
0,0006
0,0002
0,0001
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0067
0,0337
0,0842
0,1404
0,1755
0,1755
0,1462
0,1044
0,0653
0,0363
0,0181
0,0082
0,0034
0,0013
0,0005
0,0002
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0025
0,0149
0,0446
0,0892
0,1339
0,1606
0,1606
0,1377
0,1033
0,0688
0,0413
0,0225
0,0113
0,0052
0,0022
0,0009
0,0003
0,0001
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0009
0,0064
0,0223
0,0521
0,0912
0,1277
0,1490
0,1490
0,1304
0,1014
0,0710
0,0452
0,0263
0,0142
0,0071
0,0033
0,0014
0,0006
0,0002
0,0001
0,0000
0,0000
0,0000
0,0000
0,0003
0,0027
0,0107
0,0286
0,0573
0,0916
0,1221
0,1396
0,1396
0,1241
0,0993
0,0722
0,0481
0,0296
0,0169
0,0090
0,0045
0,0021
0,0009
0,0004
0,0002
0,0001
0,0000
0,0000
0,0001
0,0011
0,0050
0,0150
0,0337
0,0607
0,0911
0,1171
0,1318
0,1318
0,1186
0,0970
0,0728
0,0504
0,0324
0,0194
0,0109
0,0058
0,0029
0,0014
0,0006
0,0003
0,0001
0,0000
0,0000
0,0005
0,0023
0,0076
0,0189
0,0378
0,0631
0,0901
0,1126
0,1251
0,1251
0,1137
0,0948
0,0729
0,0521
0,0347
0,0217
0,0128
0,0071
0,0037
0,0019
0,0009
0,0004
0,0002
k
0
1
2
3
4
5
6
7
8
9
k
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
326
2,5
3,5
4,5
10
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0001
0,0000
327
Apndice 3
e
Tabela da distribuio normal padro
ca
a
Tabela 4: Distribuio normal padro. P a probabilica
a
e
dade da varivel aleatria Z estar entre 0 e Zc , ou seja,
a
o
P rob(0 Z Zc ) = P
Zc
z
0
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
0,0000
0,0398
0,0793
0,1179
0,1554
0,1915
0,2257
0,2580
0,2881
0,3159
0,3413
0,3643
0,3849
0,4032
0,4192
0,4332
0,4452
0,0040
0,0438
0,0832
0,1217
0,1591
0,1950
0,2291
0,2611
0,2910
0,3186
0,3438
0,3665
0,3869
0,4049
0,4207
0,4345
0,4463
0,0080
0,0478
0,0871
0,1255
0,1628
0,1985
0,2324
0,2642
0,2939
0,3212
0,3461
0,3686
0,3888
0,4066
0,4222
0,4357
0,4474
0,0160
0,0557
0,0948
0,1331
0,1700
0,2054
0,2389
0,2704
0,2995
0,3264
0,3508
0,3729
0,3925
0,4099
0,4251
0,4382
0,4495
0,0199
0,0596
0,0987
0,1368
0,1736
0,2088
0,2422
0,2734
0,3023
0,3289
0,3531
0,3749
0,3944
0,4115
0,4265
0,4394
0,4505
0,0239
0,0636
0,1026
0,1406
0,1772
0,2123
0,2454
0,2764
0,3051
0,3315
0,3554
0,3770
0,3962
0,4131
0,4279
0,4406
0,4515
0,0279
0,0675
0,1064
0,1443
0,1808
0,2157
0,2486
0,2794
0,3078
0,3340
0,3577
0,3790
0,3980
0,4147
0,4292
0,4418
0,4525
0,0319
0,0714
0,1103
0,1480
0,1844
0,2190
0,2517
0,2823
0,3106
0,3365
0,3599
0,3810
0,3997
0,4162
0,4306
0,4429
0,4535
0,0359
0,0753
0,1141
0,1517
0,1879
0,2224
0,2549
0,2852
0,3133
0,3389
0,3621
0,3830
0,4015
0,4177
0,4319
0,4441
0,4545
328
z
0
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9
4,0
0,4554
0,4641
0,4713
0,4772
0,4821
0,4861
0,4893
0,4918
0,4938
0,4953
0,4965
0,4974
0,4981
0,4987
0,4990
0,4993
0,4995
0,4997
0,4998
0,4998
0,4999
0,4999
0,5000
0,5000
0,4564
0,4649
0,4719
0,4778
0,4826
0,4864
0,4896
0,4920
0,4940
0,4955
0,4966
0,4975
0,4982
0,4987
0,4991
0,4993
0,4995
0,4997
0,4998
0,4998
0,4999
0,4999
0,5000
0,5000
0,4573
0,4656
0,4726
0,4783
0,4830
0,4868
0,4898
0,4922
0,4941
0,4956
0,4967
0,4976
0,4982
0,4987
0,4991
0,4994
0,4995
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000
0,5000
0,4591
0,4671
0,4738
0,4793
0,4838
0,4875
0,4904
0,4927
0,4945
0,4959
0,4969
0,4977
0,4984
0,4988
0,4992
0,4994
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000
0,5000
329
0,4599
0,4678
0,4744
0,4798
0,4842
0,4878
0,4906
0,4929
0,4946
0,4960
0,4970
0,4978
0,4984
0,4989
0,4992
0,4994
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000
0,5000
0,4608
0,4686
0,4750
0,4803
0,4846
0,4881
0,4909
0,4931
0,4948
0,4961
0,4971
0,4979
0,4985
0,4989
0,4992
0,4994
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000
0,5000
0,4616
0,4693
0,4756
0,4808
0,4850
0,4884
0,4911
0,4932
0,4949
0,4962
0,4972
0,4979
0,4985
0,4989
0,4992
0,4995
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000
0,5000
0,4625
0,4699
0,4761
0,4812
0,4854
0,4887
0,4913
0,4934
0,4951
0,4963
0,4973
0,4980
0,4986
0,4990
0,4993
0,4995
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000
0,5000
0,4633
0,4706
0,4767
0,4817
0,4857
0,4890
0,4916
0,4936
0,4952
0,4964
0,4974
0,4981
0,4986
0,4990
0,4993
0,4995
0,4997
0,4998
0,4998
0,4999
0,4999
0,4999
0,5000
0,5000
Apndice 4
e
Tabela da distribuio t de Student
ca
Tabela 5: Distribuiao t de Student. Valores cr
c
ticos de
t tais que a probabilidade da varivel aleatria t estar
a
o
entre tc e tc vale 1-, ou seja, P (tc t tc ) = 1
1-
/2
/2
-tc
tc
Graus de
liberdade
0,30
0,20
0,10
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1,963
1,386
1,250
1,190
1,156
1,134
1,119
1,108
1,100
1,093
1,088
1,083
1,079
1,076
1,074
1,071
3,078
1,886
1,638
1,533
1,476
1,440
1,415
1,397
1,383
1,372
1,363
1,356
1,350
1,345
1,341
1,337
0,05
Valores de
0,04
0,02
31,821
6,965
4,541
3,747
3,365
3,143
2,998
2,896
2,821
2,764
2,718
2,681
2,650
2,624
2,602
2,583
0,01
0,002
0,001
63,656
9,925
5,841
4,604
4,032
3,707
3,499
3,355
3,250
3,169
3,106
3,055
3,012
2,977
2,947
2,921
318,289
22,328
10,214
7,173
5,894
5,208
4,785
4,501
4,297
4,144
4,025
3,930
3,852
3,787
3,733
3,686
636,578
31,600
12,924
8,610
6,869
5,959
5,408
5,041
4,781
4,587
4,437
4,318
4,221
4,140
4,073
4,015
330
Graus de
liberdade
Valores de
0,04
0,02
0,30
0,20
0,10
0,05
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
1,069
1,067
1,066
1,064
1,063
1,061
1,060
1,059
1,058
1,058
1,057
1,056
1,055
1,055
1,054
1,054
1,053
1,052
1,052
1,333
1,330
1,328
1,325
1,323
1,321
1,319
1,318
1,316
1,315
1,314
1,313
1,311
1,310
1,309
1,309
1,308
1,307
1,306
1,740
1,734
1,729
1,725
1,721
1,717
1,714
1,711
1,708
1,706
1,703
1,701
1,699
1,697
1,696
1,694
1,692
1,691
1,690
2,110
2,101
2,093
2,086
2,080
2,074
2,069
2,064
2,060
2,056
2,052
2,048
2,045
2,042
2,040
2,037
2,035
2,032
2,030
2,224
2,214
2,205
2,197
2,189
2,183
2,177
2,172
2,167
2,162
2,158
2,154
2,150
2,147
2,144
2,141
2,138
2,136
2,133
40
45
50
55
60
100
1,050
1,049
1,047
1,046
1,045
1,042
1,303
1,301
1,299
1,297
1,296
1,290
1,684
1,679
1,676
1,673
1,671
1,660
2,021
2,014
2,009
2,004
2,000
1,984
2,123
2,115
2,109
2,104
2,099
2,081
331
0,01
0,002
0,001
2,567
2,552
2,539
2,528
2,518
2,508
2,500
2,492
2,485
2,479
2,473
2,467
2,462
2,457
2,453
2,449
2,445
2,441
2,438
2,898
2,878
2,861
2,845
2,831
2,819
2,807
2,797
2,787
2,779
2,771
2,763
2,756
2,750
2,744
2,738
2,733
2,728
2,724
3,646
3,610
3,579
3,552
3,527
3,505
3,485
3,467
3,450
3,435
3,421
3,408
3,396
3,385
3,375
3,365
3,356
3,348
3,340
3,965
3,922
3,883
3,850
3,819
3,792
3,768
3,745
3,725
3,707
3,689
3,674
3,660
3,646
3,633
3,622
3,611
3,601
3,591
2,423
2,412
2,403
2,396
2,390
2,364
2,704
2,690
2,678
2,668
2,660
2,626
3,307
3,281
3,261
3,245
3,232
3,174
3,551
3,520
3,496
3,476
3,460
3,390
Apndice 5
e
Tabela da distribuio de Qui-Quadrado (2 )
ca
Tabela 6: Distribuiao de Qui-Quadrado. Valores cr
c
ticos
de qui-quadrado tais que a probabilidade da varivel
a
2
2
aleatria ser maior do que c vale , ou seja, P (2
o
2 ) =
c
2c
Graus de
liberdade
0,30
0,20
0,10
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1,074
2,408
3,665
4,878
6,064
7,231
8,383
9,524
10,656
11,781
12,899
14,011
15,119
16,222
17,322
18,418
1,642
3,219
4,642
5,989
7,289
8,558
9,803
11,030
12,242
13,442
14,631
15,812
16,985
18,151
19,311
20,465
2,706
4,605
6,251
7,779
9,236
10,645
12,017
13,362
14,684
15,987
17,275
18,549
19,812
21,064
22,307
23,542
Valores de
0,05
0,04
0,02
3,841
5,991
7,815
9,488
11,070
12,592
14,067
15,507
16,919
18,307
19,675
21,026
22,362
23,685
24,996
26,296
4,218
6,438
8,311
10,026
11,644
13,198
14,703
16,171
17,608
19,021
20,412
21,785
23,142
24,485
25,816
27,136
5,412
7,824
9,837
11,668
13,388
15,033
16,622
18,168
19,679
21,161
22,618
24,054
25,471
26,873
28,259
29,633
0,01
0,002
0,001
6,635
9,210
11,345
13,277
15,086
16,812
18,475
20,090
21,666
23,209
24,725
26,217
27,688
29,141
30,578
32,000
9,549
12,429
14,796
16,923
18,908
20,791
22,601
24,352
26,056
27,721
29,354
30,957
32,536
34,091
35,627
37,146
10,827
13,815
16,266
18,466
20,515
22,457
24,321
26,124
27,877
29,588
31,264
32,909
34,527
36,124
37,698
39,252
332
Graus de
liberdade
Valores de
0,05
0,04
0,02
0,30
0,20
0,10
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
19,511
20,601
21,689
22,775
23,858
24,939
26,018
27,096
28,172
29,246
30,319
31,391
32,461
33,530
34,598
35,665
36,731
37,795
38,859
21,615
22,760
23,900
25,038
26,171
27,301
28,429
29,553
30,675
31,795
32,912
34,027
35,139
36,250
37,359
38,466
39,572
40,676
41,778
24,769
25,989
27,204
28,412
29,615
30,813
32,007
33,196
34,382
35,563
36,741
37,916
39,087
40,256
41,422
42,585
43,745
44,903
46,059
27,587
28,869
30,144
31,410
32,671
33,924
35,172
36,415
37,652
38,885
40,113
41,337
42,557
43,773
44,985
46,194
47,400
48,602
49,802
28,445
29,745
31,037
32,321
33,597
34,867
36,131
37,389
38,642
39,889
41,132
42,370
43,604
44,834
46,059
47,282
48,501
49,716
50,928
40
45
50
55
60
44,165
49,452
54,723
59,980
65,226
47,269
52,729
58,164
63,577
68,972
51,805
57,505
63,167
68,796
74,397
55,758
61,656
67,505
73,311
79,082
56,946
62,901
68,804
74,662
80,482
333
0,01
0,002
0,001
30,995
32,346
33,687
35,020
36,343
37,659
38,968
40,270
41,566
42,856
44,140
45,419
46,693
47,962
49,226
50,487
51,743
52,995
54,244
33,409
34,805
36,191
37,566
38,932
40,289
41,638
42,980
44,314
45,642
46,963
48,278
49,588
50,892
52,191
53,486
54,775
56,061
57,342
38,648
40,136
41,610
43,072
44,522
45,961
47,392
48,811
50,223
51,627
53,022
54,411
55,792
57,167
58,536
59,899
61,256
62,607
63,955
40,791
42,312
43,819
45,314
46,796
48,268
49,728
51,179
52,619
54,051
55,475
56,892
58,301
59,702
61,098
62,487
63,869
65,247
66,619
60,436
66,555
72,613
78,619
84,580
63,691
69,957
76,154
82,292
88,379
70,617
77,179
83,656
90,061
96,403
73,403
80,078
86,660
93,167
99,608
Apndice 6
e
Tabela da distribuio F
ca
Tabela 7: Distribuio F: valores cr
ca
ticos de F. A rea
a
achurada corresponde a 5% da rea total e, representa, a
a
probabilidade de se obter um valor de F maior do que um
valor F0,05;n1 1;n2 1 , onde n1 1 e n2 1 so os graus de
a
liberdade do numerador e denominador, respectivamente.
5%
0
Fc
Graus de liberdade
do denominador
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
161,45 199,50
18,51 19,00
10,13
9,55
7,71
6,94
6,61
5,79
5,99
5,14
5,59
4,74
5,32
4,46
5,12
4,26
4,96
4,10
4,84
3,98
4,75
3,89
4,67
3,81
4,60
3,74
4,54
3,68
224,58
19,25
9,12
6,39
5,19
4,53
4,12
3,84
3,63
3,48
3,36
3,26
3,18
3,11
3,06
230,16
19,30
9,01
6,26
5,05
4,39
3,97
3,69
3,48
3,33
3,20
3,11
3,03
2,96
2,90
233,99
19,33
8,94
6,16
4,95
4,28
3,87
3,58
3,37
3,22
3,09
3,00
2,92
2,85
2,79
236,77
19,35
8,89
6,09
4,88
4,21
3,79
3,50
3,29
3,14
3,01
2,91
2,83
2,76
2,71
238,88 240,54
19,37 19,38
8,85
8,81
6,04
6,00
4,82
4,77
4,15
4,10
3,73
3,68
3,44
3,39
3,23
3,18
3,07
3,02
2,95
2,90
2,85
2,80
2,77
2,71
2,70
2,65
2,64
2,59
334
Graus de liberdade
do denominador
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
4,49
4,45
4,41
4,38
4,35
4,32
4,30
4,28
4,26
4,24
4,23
4,21
4,20
4,18
4,17
3,63
3,59
3,55
3,52
3,49
3,47
3,44
3,42
3,40
3,39
3,37
3,35
3,34
3,33
3,32
3,01
2,96
2,93
2,90
2,87
2,84
2,82
2,80
2,78
2,76
2,74
2,73
2,71
2,70
2,69
2,85
2,81
2,77
2,74
2,71
2,68
2,66
2,64
2,62
2,60
2,59
2,57
2,56
2,55
2,53
2,74
2,70
2,66
2,63
2,60
2,57
2,55
2,53
2,51
2,49
2,47
2,46
2,45
2,43
2,42
2,66
2,61
2,58
2,54
2,51
2,49
2,46
2,44
2,42
2,40
2,39
2,37
2,36
2,35
2,33
2,59
2,55
2,51
2,48
2,45
2,42
2,40
2,37
2,36
2,34
2,32
2,31
2,29
2,28
2,27
2,54
2,49
2,46
2,42
2,39
2,37
2,34
2,32
2,30
2,28
2,27
2,25
2,24
2,22
2,21
335
Graus de liberdade
do denominador
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
10
11
241,88 242,98
19,40 19,40
8,79
8,76
5,96
5,94
4,74
4,70
4,06
4,03
3,64
3,60
3,35
3,31
3,14
3,10
2,98
2,94
2,85
2,82
2,75
2,72
2,67
2,63
2,60
2,57
2,54
2,51
2,49
2,46
2,45
2,41
2,41
2,37
2,38
2,34
2,35
2,31
2,32
2,28
2,30
2,26
2,27
2,24
2,25
2,22
2,24
2,20
2,22
2,18
2,20
2,17
2,19
2,15
2,18
2,14
2,16
2,13
336
244,69
19,42
8,73
5,89
4,66
3,98
3,55
3,26
3,05
2,89
2,76
2,66
2,58
2,51
2,45
2,40
2,35
2,31
2,28
2,25
2,22
2,20
2,18
2,15
2,14
2,12
2,10
2,09
2,08
2,06
245,36
19,42
8,71
5,87
4,64
3,96
3,53
3,24
3,03
2,86
2,74
2,64
2,55
2,48
2,42
2,37
2,33
2,29
2,26
2,22
2,20
2,17
2,15
2,13
2,11
2,09
2,08
2,06
2,05
2,04
245,95
19,43
8,70
5,86
4,62
3,94
3,51
3,22
3,01
2,85
2,72
2,62
2,53
2,46
2,40
2,35
2,31
2,27
2,23
2,20
2,18
2,15
2,13
2,11
2,09
2,07
2,06
2,04
2,03
2,01
246,47
19,43
8,69
5,84
4,60
3,92
3,49
3,20
2,99
2,83
2,70
2,60
2,51
2,44
2,38
2,33
2,29
2,25
2,21
2,18
2,16
2,13
2,11
2,09
2,07
2,05
2,04
2,02
2,01
1,99
17
18
246,92 247,32
19,44 19,44
8,68
8,67
5,83
5,82
4,59
4,58
3,91
3,90
3,48
3,47
3,19
3,17
2,97
2,96
2,81
2,80
2,69
2,67
2,58
2,57
2,50
2,48
2,43
2,41
2,37
2,35
2,32
2,30
2,27
2,26
2,23
2,22
2,20
2,18
2,17
2,15
2,14
2,12
2,11
2,10
2,09
2,08
2,07
2,05
2,05
2,04
2,03
2,02
2,02
2,00
2,00
1,99
1,99
1,97
1,98
1,96
Apndice 7
e
Tabela de n meros aleatrios
u
o
Tabela 8: Tabela de nmeros aleatrios
u
o
27
42
70
27
09
07
96
95
81
32
94
93
03
35
50
02
24
73
60
76
42
13
48
34
89
62
96
56
19
91
53
82
76
50
84
83
62
22
21
59
62
25
91
75
49
79
57
51
27
09
15
42
46
98
00
75
29
53
05
65
04
23
44
90
86
91
92
31
10
01
21
63
76
96
09
38
53
50
97
12
34
27
65
12
48
35
27
69
42
02
59
10
80
06
87
13
84
34
62
11
70
00
30
80
04
84
34
94
29
06
98
36
67
07
51
56
09
20
39
75
25
04
24
73
77
70
15
81
78
60
12
64
30
75
33
86
65
32
03
68
80
71
73
19
60
61
71
24
52
92
01
76
83
60
90
11
24
96
47
66
82
05
99
72
36
78
67
50
34
47
81
27
62
71
78
56
54
14
36
80
16
41
08
56
25
65
17
47
71
95
62
35
13
37
29
70
31
27
91
39
99
05
15
98
30
72
91
29
32
26
39
43
46
02
27
70
96
97
14
97
14
57
56
07
68
09
73
11
43
83
53
54
01
20
19
19
44
00
97
99
86
58
66
09
07
68
35
80
82
10
63
15
51
25
29
99
02
35
39
84
46
13
40
96
49
22
93
08
35
10
81
86
38
84
84
49
97
95
10
68
07
49
61
74
45
57
62
33
08
53
58
84
12
78
43
29
83
21
15
43
76
08
38
60
85
61
30
97
12
11
33
28
55
46
06
19
23
44
44
45
60
25
39
34
99
42
81
73
94
45
83
71
08
41
93
53
21
29
67
60
25
17
24
29
63
21
83
13
02
83
75
02
06
45
65
80
14
45
80
01
90
47
47
50
85
35
24
87
66
73
80
24
03
78
79
82
90
25
92
98
26
59
59
53
35
39
29
50
95
54
87
64
94
44
71
76
18
53
88
83
89
21
24
58
74
15
85
35
29
60
92
92
86
83
46
85
60
25
26
51
99
82
16
53
22
74
70
19
32
38
52
29
85
09
12
78
85
33
97
26
68
29
55
77
83
91
15
39
25
34
48
86
88
22
82
91
74
18
07
05
45
63
79
78
51
91
68
97
72
59
85
28
41
09
76
56
23
77
86
10
66
96
36
87
48
97
44
96
82
75
92
78
50
84
74
92
00
06
37
10
91
62
94
43
99
09
18
75
67
09
43
50
88
30
36
76
34
45
42
77
54
21
66
21
59
10
04
43
76
55
24
07
44
19
03
94
97
83
92
54
29
74
65
84
73
16
21
08
26
08
05
01
72
08
84
83
67
72
23
00
12
85
14
11
29
80
87
53
17
49
38
52
96
82
17
23
73
65
92
16
17
49
73
85
09
89
49
26
66
49
71
42
75
52
35
81
80
60
83
82
337
14 44 78 26 46 51 23 22 42 70 53 79 42 32 12 20 53 05 32 17 23 96 26 99 29
24
97
35
42
30
22
34
81
04
00
31
87
40
38
99
90
79
66
95
20
73
10
59
55
59
75
61
27
86
96
81
34
41
32
36
82
44
10
49
98
42
80
16
52
21
25
36
68
44
04
18
37
34
95
44
42
53
78
77
53
48
30
88
87
16
65
67
04
00
90
79
26
56
45
08
51
40
81
99
66
02
88
07
26
85
68
80
96
07
49
54
00
70
14
63
55
00
86
72
76
90
67
07
89
95
32
24
27
05
79
69
09
75
82
00
29
72
50
05
72
11
14
65
09
85
18
48
35
37
84
82
57
36
22
38
08
16
82
32
83
05
92
27
84
76
46
57
32
16
85
55
82
11
83
94
11
91
00
22
02
13
96
32
82
05
63
04
11
28
20
06
63
62
52
53
62
43
36
97
92
28
40
60
62
96
43
76
46
55
17
26
23
76
02
73
23
83
75
54
10
54
58
48
83
60
26
65
78
53
08
52
23
01
61
68
53
77
07
83
81
42
76
57
04
18
48
24
81
10
35
44
57
49
91
25
41
88
29
04
77
42
00
44
68
92
99
29
40
36
12
56
09
31
40
21
23
33
63
08
25
64
99
35
27
84
29
94
04
39
89
17
34
15
70
97
92
11
76
80
44
70
34
95
04
70
93
17
80
10
33
19
90
81
58
04
94
53
30
96
19
19
43
22
70
12
66
14
95
51
66
42
10
72
29
72
72
96
62
36
52
89
82
79
51
42
26
49
83
89
49
85
40
76
33
15
37
65
25
30
56
92
45
32
07
21
00
58
08
60
50
25
02
80
90
21
09
36
41
74
99
71
21
97
51
71
48
47
16
96
97
40
42
76
92
10
338
339
2. Sim. Para os gripados, 52,17% no foram vacinados, ou seja, mais da metade. Para os
a
no gripados, 59,22% aplicaram duas doses da vacina, ou seja, a maioria dos no gripados
a
a
foram vacinados.
3. b)30,29% c)56,50%.
4. No.
a
b) Resposta gura 1.
2. Veja gura 2.
4. Veja gura 3.
Respostas dos exerc
cios da seo 2.1.3.5
ca
1
2
21
24
5
11
1
3
27
38
Total
45
16
65
Local
Nmero de abortos
u
0 1
2
Total
1. a)
Respostas dos exerc
cios da seo 2.1.3.3
ca
Respostas dos exerc
cios sobre anlise exploratria de dados
a
o
1
Local Rio vermelho
1
2
Local Costa da lagoa
Nmero de observaes
10
15
20
25
340
Figura 3: Grco da distribuio conjunta do local e peso de mexilhes
a
ca
o
2* 1 1 1 2 2 2 2 3 3 3 3 3
2o 5 6 8 8 8
3* 0 0 3
3o 5 5 6 9 9
4* 0 0 2 2
4o 5 6 6 8
5* 0
5o 9
Figura 4: Ramo-e-folhas da durao do primeiro estdio ninfal
ca
a
6. Sim, pois xando-se os totais de locais em 100%, vericamos no manguezal que 60% dos
mexilhes so leves e somente 5,71% so pesados. Por outro lado, no Sambaqui, vericamos
o
a
a
somente 2,94% de leves e 55,88% de pesados. Portanto, no Sambaqui temos animais mais
pesados.
Respostas dos exerc
cios da seo 2.1.3.7
ca
1. C=0,1567 C =0,2216. O que demonstra que local e aborto esto fracamente associados.
a
2. C = 0, 6008; C =0,8496. O que demonstra que porte e hbito esto associados.
a
a
2
4. C = 0, 5634; C = 0, 7967; = 32, 0898; V = 0, 6819.
Respostas dos exerc
cios da seo 2.1.3.11
ca
341
1) a) 55 b) 10
72
72
2) 0,16%. Independncia entre os resultados dos blocos.
e
2
3) 625 = 0, 32%. Idem ao exerc 2.
cio
4) a) 0,77 b) 0,54 c) Os eventos so mutuamente exclusivos.
a
5) a) 0,0385 b) 0,0925 c) os pares de cromossomos so independentes.
a
6) i)P(A)=1/2 ii)P(A)=1/3.
7) i)37,5% ii) 0,10 =0,40=40% iii)50%.
0,25
8) a) 5 b) 7 c) 3 .
8
8
4
3
7
9) a) 8 b) 8 c) 5 d) 1 e) 1
8
2
8
48
10) a) 33 b) 14 c) 95
95
95
4
11) 9
12) a)0,00 b)0,65 c)0,70 d)0,0
13) 0,59
14) 0,5952
15) a) 12,5% b) 0,391% c) 0,0198 d) 85,94%
16) 36,23%
17) a)0,6836 b) E(X)=2
18) fazer a tabela
19) a) 0,85 b) 0,45 c) 0,10 d) 0,15
20) a) No so independentes. P (F | A) = P (F ), altera as probabilidades. b) 85,71% e
a a
c)78,57%.
Respostas dos exerc
cios propostos sobre modelos de probabilidade para variveis
a
aleatrias discretas, seo 4.8
o
ca
342
1) 1,08%
2) E(X) = np = 156 0, 0081 = 1, 26 covas.
3) a) 2,236 bactrias/cm3 b) 0,95957.
e
4) E(X)=18 DP(X)=2,7.
5) a) 0,11% b) 0,119%
6) a) 0,94 b)60 c) 2,28 u.m. d)E(X)=0,4 VAR(X)=0,392.
7) a) 4 animais VAR(X)=3,2 animais2 DP(X)=1,8 animais b) 0,4236 c) 0,931.
8) a) E(X)=np=2,4 ento, espera-se em mdia 2,4 machos por ninhada. A proporo mdia
a
e
ca
e
:2,4/5=0,48. b) Para X=0 76, X=1 351 e X=2 648, X=3 598, X=4 276, X=5 51.
e
9) a) 0,6454 b) 12 - 27 - 29. c) Concluo que a D. de Poisson est razoavelmente bem adea
quada a esta situao.
ca
343
0,65
0,55
0,45
P(A)
0,35
0,25
0,15
0,05
-0,05
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
1 2 3
0
1
2
3
4
1
0
0
0
1
0
2
2
2
0
Total 2
0
2
2
2
0
Total
0
0
2
0
0
1
4
6
4
1
6 6 2
16
344
0,30
0,26
0,22
P(X=x)
0,18
0,14
0,10
0,06
0,02
-0,02
-2
10
12
0,18
P(X=x)
0,14
0,10
0,06
0,02
-0,02
-2
10
14
18
345
0,30
0,26
Probabilidades
0,22
0,18
0,14
0,10
0,06
0,02
-0,02
-1
Nmero de filhos
a) Sim; b) 39 c) 2,929 d) 0%
a) 17,54% b) 95,95724%.
a) 0,5% b) 2,98%.
0,61.
a) 96,059% (Binomial) e 0,96078% (Poisson) b) 99,94%.
1) a) 0,3848 b) 0,2517 c)0,3092 d)0,7648 e)0,2743 f)0,8907 g)0,9453 h)0,68 i)0,95 j)0,99.
2)0,0038 ou 0,38%
3) P (X > 185kg) = 0, 9332. Logo, tm-se 120x0,9332=112 animais.
e
4) a)0,1974 b)0,6826 c)0,3085
5) a)0,0918; 0,9962; 0,7463; 0; b)8,745cm3/min c)9,5325 a 14,4675
6) a)0,9336 b)93,36 prognicos.
e
7) 0,047
8) 4,33; 5,54; 6,02
9) z=1,645 logo D=21,79 cm
10) a)0,0228 b) 0,053%
11) 22,06%
12) mdia=425,7 g.
e
346
347
5. P (X 2, 0) = 1, 7%.
6. A mdia da distribuio amostral igual a 7069 kg/ha e o desvio padro igual a 98,8583
e
ca
e
a
kg/ha. a) 99,53% b) 0,52% c) 0,06%.
7. Mdia populacional=18000; desvio padro populacional=5125; n=30. Resp.0,1423=14,23%.
e
a
8. P (X 140) = 0, 035%.
9. a)68% b)100%.
10)0,119.
348
70
65
60
55
50
45
40
35
30
25
20
15
10
5
-5
Pioneiro Secundrio
Figura 9: Representaao grca dos intervalos de conana
c
a
c
1)Zc=0,329 Zt=1,645 - conclui-se que a mquina no precisa ser regulada
a
a
2. g.l. = 34, 52 35, Tt=2,724 Tc=6,98 Rejeita-se H0 . A variedade B superior.
e
2
2
3. = 9, 27, 0,05;3 = 7, 815, portanto, a distribuio no segue as leis da hereditariedade.
ca a
o
2
2
2
2
o
4. 1 ), XA N (A , A ) e XB N (B , B ); 2 ), A = B e 3o ) as amostras so indepena
dentes.
5. t = 0, 2479. Aceita-se a hiptese nula. 48, 25 54, 11
o
6. 30, 6097 33, 8904; 18, 2972 22, 3427 b) n = 31 c) t=12,623, rejeita-se a
hiptese nula.
o
7. 2 = 3, 8347. Aceita-se a hiptese nula. As duas variedades so semelhantes quanto `
o
a
a
germinao de sementes.
ca
8. t = 4, 333. Rejeita-se a hiptese nula, o inseticida novo melhor do que o padro.
o
e
a
9. t = 1, 598, aceita-se a hiptese nula, a quantidade de prote
o
nas no plasma a mesma.
e
10. a) 5, 9373 7, 8227. b) t = 20, 2482, portanto, rejeitamos a hiptese nula. c)
o
37.
n = 36, 27 =
11. t = 10, 588, P (t > 10, 588) < 0, 1%. Rejeita-se a hiptese nula.
o
12. P (F > 3, 02) = 0, 057602, portanto, aceita-se H0 . t = 0, 24, P (|t > 0, 24|) =, 811620,
portanto, aceita-se a hiptese nula.
o
13. F=4,974, P (F > 4, 974) = 0, 000022, assim, as varincias so heterogneas. t = 3, 8977,
a
a
e
P (t > 3, 8977) = 0, 000181, existe diferena signicativa entre as alturas das duas espcies.
c
e
349
14. F = 1, 006, P (F > 1, 006) = 0, 494867, varincias homogneas. t = 0, 05417, P (|t >
a
e
0, 05417|) = 0, 957084 = 95, 71%, aceita-se H0 .
15. t = 4, 149, P (|t < 4, 149|) = 0, 025441 = 2, 54%. A cultivar CEP 18-Cavera mais
e
produtiva.
16. 2 = 164, 62, com 2 graus de liberdade, P (2 > 164, 62) = 0, 000000. Existe diferena
c
signicativa entre o nmero de armadilhas utilizadas na captura da vaquinha com relao
u
ca
ao uso de inseticida.
17. a) H0 : N = U e H0 : N > U . b) E a probabilidade do agricultor aceitar como melhor o inseticida novo, sendo que, na verdade, no existe diferena entre os dois inseticidas,
a
c
quanto ` produo.
a
ca
18. a) t = 0, 688, com 38 graus de liberdade, P (|t < 0, 688|) = 0, 495631 = 49, 56%,
aceita-se a hiptese nula. b)-0,34-2,021(0,49366) C R 0, 34 + 2, 021(0, 49366).
o
2
19. = 22, 352, com 6 graus de liberdade, P (2 > 22, 352) = 0, 001047 = 0, 1047%, existe
diferenas entre os trs tipos de vinhos quanto ` estabilidade. b) 2 = 18, 755, com 3 graus
c
e
a
2
de liberdade, P ( > 18, 755) = 0, 000308 = 0, 0308%, existe diferenas entre os dois tipos
c
de vinhos quanto ` estabilidade. O vinho tinto pior que o branco.
a
e
20. a) t(calculado) = 3, 35, t(tabelado)=-1,761, rejeita-se a hiptese de nulidade. b)valor p =
o
0, 002382, tomando-se como referncia o valor 0,05, rejeita-se a hiptese nula.
e
o
21. a)z=-1,68, Rejeita-se H0 . b) valor p=,046479, rejeita-se H0 .
22. t19 = 2, 91 P (t 2, 91) est entre 0,1% e 0,5%, portanto, rejeita-se a hiptese de nula
o
idade e conclui-se que a mdia na Ba Norte realmente maior do que em Sambaqui. O
e
a
e
intervalo ca: 31, 0 35, 8
23. a) no caso 1 devemos usar o teste t para comparao de duas mdias independentes
ca
e
com varincias desconhecidas e, no caso 2, devemos usar o teste t para comparao de duas
a
ca
mdias para dados pareados. b) Prefereria o planejamento 2 pois devemos comparar as duas
e
mdias sob igualdade de condies.
e
co
350
Indice Remessivo
experimento
fatorial, 14
unifatorial, 14
351