Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. CONCEITOS FUNDAMENTAIS DE ESTATSTICA 2. FASES DO MTODO OU TRABALHO ESTATSTICO 3. DISTRIBUIES DE FREQUNCIAS 4. REPRESENTAES GRFICAS DAS DISTRIBlJlES 5. MEDIDAS DE POSiO 6. MEDIDAS DE DISPERSO 7. REFERNCIAS BII3L10GRFICAS
D[~ FREQUNCIAS
15 18 24 27
UNIDADE
11 - INTRODUO
28 28 29 31 32 34 38 39 41 42 44
1. INTRODUO 2. ESPAO AMOSTRAL E EVENTOS 3. NOES FUNDAMENTAIS DE PROBABILIDADE 4. PROBABILIDADE EM ESPAOS AMOSTRAIS FINITOS E EQUIPROV VEIS 5. PROBABILIDADE CONDICIONADA 6. TEOREMA DE BA YES 7. EVENTOS INDEPENDENTES 8. REFERNCIAS BIBLIOGRFiCAS APNDICE A - ALGUMAS NOES DA TEORIA DOS CONJUNTOS APNDICE B - TCNICAS DE CONTAGEM
DE I)ROBABILlDADE , "
47 47 49 52 54 57 64
INTRODUO VARIVEIS ALEATRIAS DISCRETAS VARl VEIS ALEATRIAS CONTNUAS ESPERANA MATEMTICA E V ARINCIA ALGUMAS DISTRIBUIES DE PROBABILIDADE REFERNCIAS BIBLIOGRFiCAS
UNIDADE IV - ESTATSTICA
INFERENCIAL
65 65 69 70 74 75 76
1. NOES ELEMENTARES DE AMOSTRAGEM 2. DISTRIBUIO AMOSTRAL 2.1. DISTRIBUIO AMOSTRAL DA MDIA 2.2. DISTRIBUIO AMOSTRAL DA PROPORO 2.3. DISTRIBUIO AMOSTRAL DA VARINCIA 3. REFERNCIAS BIBLIOGRFICAS
UN IDA D E V - ESTIMA
.............................................77 77 77 78 80 81 82 85 86
1. INTTtODUO , 2. ESTIMAO PONTUAL 2.1. PROPRIEDADES DOS ESTIMADORES , 2.2. ESTIMADORES PONTUAI S 3. ESTIMAO POR INTERVALO 3. I. INTERVALO DE CONFIANA PARA A MDIA DA POPULAO 3.2. INTERVALO DE CONFIANA PARA A PROPORO DA POPULAO 4. REFERNCIAS lJlI3L10GRFI CAS
UN lDAD E VI - TESTES 1. 2. 3. 4. 5. 6.
INTRODUO CONCEITOS fUNDAMENTA IS PASSOS PARA CONSTRUO DE UM TESTE DE HIPTESES TESTES. SOBRE A MDIA DA POPULAO TESTES SOBRE A PROPORO DA POPULAO REFERNCIAS BIBLIOGRFl CAS
UNIDADE 1. 2. 3. 4.
VII - REGRESSO
E CORRELAO
96 96 96 99
104
TA
nE LAS
.....................................................
... .........................................
..... 105
li..-
--------,
-ESTATSTICA "Podemos considerar a Estatstica como 11m cmrjllllto ele mtodos e processos qllaJltitaJil'oS qlle sen'e para e.'itlldar e medir os fenmellos coletl'os". A estatstica teve acelerado desenvolvimento a partir do sculo XVII, atravs dos estudos de BERNOULLI, FERMAT, PASCAL. LAPLACE. GAUSS, GALTON, PEARSON, FISHER, POISSON, KOLMOGOROV e outros que estabeleceram suas caractersticas essenciais. Ela no alcanou ainda um estado definitivo. Continua a progredir na ao direta do desejo de investigao dos fenmenos coletivos. A Estatstica considerada como Cincia no sentido do estudo de uma populao. Mantm com a Matemtica uma relao de dependncia, solicitando-lhe auxlio, sem o qual no poderia desenvolver-se. Com as outras Cincias mantm a relao de complemento, quando utilizada como instrumento de pesquisa. Em especial a relao de complemento a forma que a Estatstica, atravs de seus MTODOS ESTATSTICOS, mantm com as reas Tecnolgicas, as Cincias Exatas e outras, servindo como instrumento auxiliar na tomada de decises. A Estatstica tem como OBJETIVO o estudo dos fenmenos coletivos. Objetivando o estudo quantitativo e qualitativo dos dados (ou informaes), obtidos nos vrios campos da atividade cientlica, a Estatstica manipula dois conjuntos de dados fundamentais: a "pop"lao" e a "amostra".
POPULAO ( ou Universo) o conjunto dos seres, objetos ou informaes que interessam ao estudo de um fenmeno coletivo segundo alguma(s} caracterstica(.'l). , portanto, u~ conjunto definido de informaes relativas a qualquer rea de interesse, podendo, quanto ao nmero de elementos, ser: finita (tamanho N) ou infinita. Na maioria das vezes, no conveniente, ou mesmo possvel realizar o levantamento dos dados referentes a todos os elementos de uma populao. Portanto, analisamos parte da populao, isto amo,stramos. AMOSTRA
..,
085: Parmetro. Estimador e Estimativa a) Uma caracterstica numrica estabelecida para toda uma populao denominada parmetro. b) Uma caracterstica numrica estabelecida para uma amostra denominada estimeu/or. c) O valor numrico assumido pelo estimador numa determinada amostra denominada estimatiJ'a. Por exemplo: no fenmeno coletivo eleio para prefeito do municpio de Joo Pessoa, a populao o conjunto de todos os eleitores habilitados na respectiva cidade. Um parmetro a proporo de votos do candidato A. Uma amostra pode ser um grupo de 1.000 eleitores selecionados em todo o municpio. Um cstimador a proporo de votos do candidato A obtida na amostra. O valor resultante do estimador, a proporo amostrai, a estimativa. Em. aplicaes efetivas, onde aplica-se o processo de amostragem, o nmero de elementos componentes de uma amostra , geralmente, bastante reduzido em relao ao nm~ro de elementos componentes da populao. _ PROCESSOS ESTATSTICOS DE ABORDAGEM
Quando solicitados a estudar um fenmeno coletivo podemos optar entre os seguintes processos estatsticos: .a) CENSO - avaliao direta de um parmetro, utilizando-se todos os componentes da populao. Propriedades Principais do Censo: Admite ~rro processual zero e tem confiabilidade 100% - E caro. lento - quase semp'rc desatualizado - Nem sempre vivel. b) AMOSTRAGEM Propriedades (Inferncia) - avaliao indireta de um parmetro, com base em um estimador atravs do clculo das probabilidades. Principais da Estimao: Admite erro processual positivo e tem confiabilidade menor que 100% - barata rpida - atualizada - sempre vivel.
No sentido de disciplimi, a Estatstica ensina mtodos racionais para a obteno de informaes a respeito de um fenmeno coletivo, alm de obter concluses vlidas para o fenmeno e tambm permitir tomada de decises, atravs de alguma(s) caracterstica(s) de valores numricos observados. Desta forma, a Estatstica. pode ser dividida em duas grandes lnfcrcncial. I) ESTATSTICA DESC1UTIVA - a parte da Estatstica que tem por objetivo descrever os dados observados. So atribuies da Estatstica Descritiva: a) A organizao dos dados. b) A reduo dos dados. c) A representao dos dados. reas: DCSCI'itiv:l c
d) A obteno de algumas informaes que auxiliam a descrio do fenmeno observado . A organizao dos dados consiste na ordenao e crtica quanto correo dos valores observados, falhas humanas, omisses, abandono de dados duvidosos, etc . Reduo dos dados - O entendimento e compreenso de grande quantidade de dados atravs de simples leitura de seus valores individuais uma tarefa extremamente rdua e dificil mesmo para o mais experimentado pesquisador, portanto deveremos tabular os dados . A representao dos dados - Os dados estatsticos podem ser mais faclmente compreendidos quando apresentados atravs de uma representao grfica, a qual permite uma visualizao instantnea de todos os dados. Os grficos quando bem representativos, tornam-se importantes instrumentos de trabalho. A obteno de algumas informaes que sumarizam os dados, facilitando a descrio dos fenmenos observados. Isto encerra as atribuies da Estatstica Descritiva. 11) K,)TA 1iSTlCA lNl'1~RI';NCIAL (ou II/dufiva) - a parte da Estatstica que tem por objetivo obter e generalizar concluses para a populao a partr de uma amostra. Complementando o processamento estatstico, no caso de uma estimao, a Estatstica Indutiva estuda os parmetros. a partir do uso de estimadores usando o clculo das probabilidades, elemento este que viabiliza a inferncia estatstica. Em resumo, um estudo estatstico completo que recorra s tcnicas de Estatstica Inferencial ir envolver tambm, direta ou indiretamente, tpicos de Estatstica Descritiva, Clculo das Probabilidades e Amostragem. Logo, para se desenvolver um curso completo e razovel de Estatstica, todos esses assuntos devem ser abordados. No diagrama abaixo est indicado como essas reas esto j-c1acionadas.
~
Estatstica Descritiva ~IE
I Amostragem I ~
,. ~statlstlca lnferencial
"0
"
e VARIVEIS
ESTATSTICAS
Normalmente, no trabalho estatstico o pesquisador se v obrigado a lidar com grande quantidade de valores numricos resultantes de um censo ou de uma amostragem. Estes valores numricos so chamados dadm; estatsticos.
As informaes ou dados caractersticos dos fenmcnos ou populacs so denominados varil'ei.'i e.'ttat.'itica.'i ou simplesmcnte l'arth'ei.'i. Conforme suas caractersticas particulares, podem ser classificadas como: QUlultitatl'll.'i c Qu.alitativlls. QUANTIT ATl VAS - So aquelas que podem ser expressas em termos numricos. Em geral so as resultantes de medies, enumeraes ou contagens. So subdivididas em cOlltllUas e discretas. conforme abaixo. ContnuD.'i - so aquelas que podem assumir qualquer valor num certo intervalo de medida, podendo ser associados ao conjunto dos nmeros reais, ou seja, seus valores possveis formam um conjunto no enumervel. Entre outras, enquadram-se nesta categoria as medidas de tempo, comprimento, espessura, rea, volume, peso e velocidade. Discretas (ou desc{mtmlD.'.) - quando s podem assumir determinados valores num certo intervalo, podendo ser associadas ao conjunto dos nmcros inteiros, ou seja, seus possveis valores formam um conjunto finito ou enumervel. Em geral, representam nmcros inteiros resultantes do processo de contagem, como o nmero de alunos por sala, de crditos por disciplinas, de pacientes atendidos diariamente num hospital, etc. De modo geral, as medies do origem as variveis contnuas e as contagens ou enumeraes, as variveis discretas. Designamos estas variveis por letras latinas, em geral , as ltimas: X, Y, Z. QUALITATIVAS - Nem sempre os elementos de uma populao so exclusivamente contveis. Muitas vezes, eles podem ser qualificados tambm segundo algumas de suas caractersticas tpicas. Nesses casos, as variveis podcm ser agrupadas em lIomillais ou ordil,ais( por postos ). Nominais - quando puderem ser reunidas em categorias ou espcies com idnticos atributos. Aqui se incluem os agrupamentos por sexo, rea de estudo, desempenho, cor, raa, nacionalidade e religio. Ordillais - quando os elcmentos forem reunidos segundo a ordem em quc aparecem dispostos numa lista ou rol. So tpicos desta forma de agrupamento, as listas classificatrias de concursos e as tabelas de campeonatos. . Em geral, uma mesma populao pode scr caracterizada por mais de um tipo. de varivel. Assim os inscritos num vestibular, por exemplo, podem ser contados, medidos ou pesados, podem ser agrupados segundo o sexo ou rea de estudo e podcm ainda ser classificados segundo a,s notas obtidas nas provas prestadas .
.
-.
1-
NVEIS DE MENSURAO
o objetivo de estudarmos os nveis de mensurao das variveis cstatsticas consiste em determinar a complexidade da anlise das variveis (caractersticas de interesse) envolvidas no estudo de uma populao ou de uma amostra. As pessoas de uma comunidade podem ser estudadas sob diversos ngulos. Por exemplo, podem ser classificadas quanto ao SEXO (masculino/feminino), quanto
4 ...
-~
ESTATURA (baixa/mdia/alta), quanto REN DA (pobres/ricas) etc. SEXO, ESTATURA, RENDA so varivcs, isto , so caractersticas s quais podemos associar conceitos ou nmeros e assim expressar, de certa maneira, informaes sob a forma de medidas. 1". nvel: _ o nvel de mensurao mais baixo, mais rudimentar possvel. A escala de medida desse nvel chama-se NOMINAL. O fundamento para a atribuio dos nmeros de natureza qualitativa. Exemplos: VAIUVEL QUALITATIVA NOlvflNAL - 1 Nvel - Escala Nominal (classificao por tipos ou atributos). a) Populao: moradores de um cidade
( ordenao ou postos).
4". nvcl: O 40 nvel define a c1lmada escala das raztJes ou RACIONAL. Essa escala muito parecida com a de 3". nveI, exccto quanto origem. O ZCIOO absoluto, isto , zero mesmo. No 40 nvel todas as operaes aritmticas so possveis, isto , adio, subtrao, multiplicao c diviso.
"j
Exemplos: VAIUA VEL QUANTITA TlVA f)/,SCR/~TA - 4 Nvel - Escala das Razes (processo de
contagem e ordenao). e) Populao: casais residentes em uma cidade Varivel: nmero de filhos (O, 1,2, 3,4 ou mais filhos) f) POjJulalio: peas produzidas por uma mquina Varivel: nmero de defeituosas da produo diria (O, 1,2,3,4,5, ." )
VA1UA Vr-L QUANTITA TIVA CONJiNUA - 4 Nvel - Escala das Razes (processo de
medio). g) POjJula{io: peas produzidas por uma mquina Varivel: dimetro externo (p. ex., 0,96 cm) h) Populalio: estudantes de uma escola Varivel: tempo de estudo dirio em certa disciplina (p. ex., 2,30 h) A Complexidade da anlise das variveis aumenta quanto maior for o nvel desta
140. NVELI
130. Nvr::L I
120. NVELI 110. NVELI Escala Nominal Escala Inter\'alar
(,
Imaginemos, por exemplo, que a Biblioteca Central da UFPb tenha necessidade de .obter informaes acerca dos usurios em potencial que utilizam-na. O primeiro trabalho da equipe encarregada -da pesquisa, ser evidentemente, o de obter resposta para aquelas perguntas. Seriam ento: - Quem deseja as informaes? _ O que devemos perguntar no questionrio? _ Ser executada sempre? A pesquisa ser peridica ou ocasional? - Por que desejam as informaes? - Para que desejam as informaes? _ Quando dever estar concluda a pesquisa? _ Qual a poca oportuna-para a aplicao dos questionrios? Ainda na fase do planejamento, temos: EXAME DAS INFORMAES DISPONVEIS, ou seja, anlise da reunio de tudo que foi publicado sobre o assunto, obtendo-se relatrios sobre atividades semelhantes ou correlatas. A DEFINIO DO UNIVERSO, isto , saber qual o conjunto a ser pesquisado, distribuindo, classificando ou agrupando os elementos desse conjunto em populaes, para permitir um trabalho mais fcil, mais lgico, mais racional. O tipo de levantamento, CENSO ou AMOSTRAGEM, dever ser decidido com a devida antecedncia c-a necessria anlise das vantagens e desvantagens de um e de outro, em virtude do custo financeiro e .do prazo determinado para a concluso do trabalho. COLETA DE DADOS Aps cuidadoso planejamento e a devida determinao das caractersticas mensurveis do fenmeno coletivamente tpico que se quer pesquisar, damos incio coleta dos dados numricos necessrios sua descrio.
A coleta dos dados poder ser feita de diversas formas. A ideal aquela que maximiza os recursos disponveis, dados os objetivos e a preciso previamente estipulados. No seu planejamento, deve-se considerar o tipo de dado a ser coletado, o local onde este se manifestar, a frequncia de sua ocorrncia, e outras particularidades julgadas importantes. Quando os dados se referirem ou estiverem em poder de pessoas, sua coleta poder ser realizada mediante respostas a questionrios previamente' elaborados. Esses questionrios podem ser enviados aos entrevistados para devoluo posterior ou podem ser .aplicados pelos prprios pesquisadores ou por- entrevistadores externos ou contratados, devidamente treinados. Os dados ou informaes representativas dos fenmenos ou problema em estudo podem ser obtidos de duas formas: por via direta ou por l'ia i"direta,
Por via direta - quando feita sobre elementos informativos de registro obrigatrio
(p. ex.: nascimentos, casamentos, bitos, matrculas de alunos etc.) ou, ainda, quando os dados so coletados pelo prprio pesquisador atravs de cntrevistas ou questionrios. A coleta direta de dados, com relao ao fator tempo, pode ser classificada em: a) contnua, tambm denominada registro, feita continuamente, tal como a de nascimentos, bitos, etc.; b) peridica, quando feita em intervalos constantes de tempo, como os censos( de 10 em 1O anos), os balanos de uma empresa comercial, etc.; . c) ocasional, quando feita extemporaneamente, a fim de atender a uma conjuntura ou a uma emergncia, como no caso de epidemias que assolam ou dizimam seres humanos
Por l'ia i"direta - quando inferida de elementos conhecidos (coleta direta) e/ou
conhecimento de outros fenmenos relacionados com o fenmeno estudado. Como exemplo, podemos citar a pesquisa sobre a mortalidade infantil, que feita atravs de dados colhidos via coleta direta.
APURAO OU PROCESSAMENTO
DOS DADOS
Uma vez assegurado que os dados brutos so consistentes, devemos submet-los ao processamento adequado aos fins pretendidos. A apurao ou processamento dos dados pode ser manual ou clctr-nica. Os processos e mtodos estatsticos a que um conjunto de dados pode ser submetido sero nosso objeto de estudo nas sees seguintes.
8
l
EXI)OSIO
ou AI)RESENTAO
DOS DADOS
Por mais diversa que seja a finalidade que se tenha em vista, os dados devem ser apresentados sob forma adequada (abclas ali gl"ficos), tornando niais fcil o exame daquilo que est sendo objeto de tratamento estatstico e ulterior obteno de medidas tpicas. No caso particular da estatstica descritiva, objetivo do estudo se limita, na maioria dos casos, simples apresentao dos dados, assim entendida a exposio organizada e resumida das informaes coletadas atravs de tabelas ou quadro . bem como dos grficos , resultantes. ANLISE DOS RESULTADOS Como j dissemos, o objetivo ltimo da Estatstica tirar concluses sobre o todo (populao) a partir de informaes fornecidas por parte representativa do todo (amostra). Assim, realizadas as fases anteriores (Estatstica dcscl"itiva), fazemos uma anlise dos resultados obtidos, atravs dos mtodos da Estatstica Infcrcncial, que tem por base a induo ou inferncia, e tiramos desses resultados concluses e previses.
3. DISTJUnUICES J)E FIU~Q(JI~NCIAS Os dados numricos, aps coletados suo colocados em srie e apresentados em
tabelas ou quadros. Quando se estuda orna varivel (qualitativa ou quantitativa), o maior interesse do pesquisador eonhecer a distribuio dessa varivel atravs das 'possveis realizaes (valores) da mesma. Iremos, pois, ver uma maneira de se dispor um cOI~unto de valores, de modo a se ter uma boa idia global subre esses valores, ou seja, de sua distribuio. Consideremos,
TABELA
1.1 - Infonnaes sobre sexo, curso, idade (anos), pr(}(.:edncia, renda .fmiliar, nlmero de disciplinas malriclIiado(a), peso (kg) e allllra (cm) de 31 alunos matriculados na . disciplina CLC. das PROBo e ESTATSTICA I, perodo 97.1 - turma: 04 - tumo da manh.
lO
SEXO
CURSO
lDAlJE
(anos)
PROCEDf~NClJ\
RENDA FAMIIJAR
PESO
(kg)
ALTURA
(em)
Capital 27 Cincias Masc Interior 18 Eng Civil Masc Capital 21 Cincias Fem Interior Eng Mec 23 Masc Interior Eng Mec 23 Masc O.Re.gio 21 Cincias Fcm Capital 21 Cincias Fem Interior 27 Eng Mec Masc Capital 21 Eng Civil Masc Capital 19 Eng Civil Fem O.Regio 18 Eng Civil Masc II O.Regio 18 Eng Civil Masc 12 Capital Eng Mec 22 Fem 13 Capital 19 Ellg Civil Fem 14 Capital 19 Eng Civil 15 Masc Capital 18 Eng Civil 16 Masc Capital 19 Eng Civil 17 Masc Capital 23 Ellg Civil 18 Masc O.Re~io 19 Eng Civil 19 Masc Capital 18 Eng Civil Fem 20 Capital 18 Eng Civil Masc 21 Capital 20 Eng Civil Masc 22 Capital 19 Eng Civil' 23 N.lnf .. Capital 24 Ellg Civil Masc 24 Capital 20 Eng Civil Fem 25 Capital 21 Eng Civil Fem 26 Capital 20 Eng Civil Masc 27 Interior 21 Eng Civil Masc 28 Interior 20 Eng Civil Masc 29 Capital Eng Civil N.1nf Masc 30 Capital 21 Eng Civil Fem 31 FONTE: Questionrio aplicado - aula 18/03/97
OI 02 03 04 05 06 07 08 09 10
Baixa Mdia Mdia Baixa Baixa Mdia Mdi Mdia Alta Mdia Mdia Alta Mdia Mdia Mdia Alta Mdia Mdia Mdia Mdia Mdia Mdia Mdia. Mdia Mdia Mdia Mdia Mdia Baixa Mdia Mdia
3 7
6
5 5 7 8 4 5 6 5 6
6
5 5
6
68 60 57 54 54 47 46 90 51 43 73 69 70 57 73 55
82
5 4 5 5 5
5 7
7
6
5
5
6
6 3
6
65 71 68 70 67 68 70 58 51 84 65 62 84 62
153 162 174 172 158 177 175 172 165 183 167 181 175 170 170 170 177 170 170 161 158 180 167 164 170 173
10
(varivel qualitativa ou
quantitativa discreta)
1 _ A tabela 1.2 apresenta a distribuio de frequncia PROCEDNCIA, usando-se os dados da tabela 1.1 .
Tabela 1.2 _ Frequncias e Percentuais dos 31 estudantes de Calco Probo Est 1 Turno: Manh, Turma: 04, Perodo: 97.1 - segundo a Regio de Procedncia PUOCI'.:J)NC1A Capital Interior O. Regio Total
FONTE: Tabela 1.1
,..p
ele 1',:,illllolJles
1'ercellllllll
L
21
f, I}/l
C>7,7
19,4 129 -' 100
4 31
EXEMPLO 2 _ A tabela 1.3 apresenta a distribuio de frequncia da varivel N DE DISCIPLINAS MATRlCULADO(A), usando-se os dados da tabela 1.1 - ( DADOS NO -AGRUPADOS) Tabela 1.3 _ Distribuio de frequncias e percentuais do N de Disciplinas Matriculado(a) dos 31 estudantes de Cale. Probo Est 1- Turno: Manh, Turma: 04, Periodo: 97.1. lf2 DisC MA TIUC
N dc Estudalltcs
(;
Percclltua!
(;%
6,5 6,5 41,9 29,0 12,9 3,2
\00
193 4 5
2
2 13 9 4 1
7 8 Total ou
3\
OBS.:
L =>
DISTRIBUIO quantitativa).
Constri-se classes de valores, quando a variabilidade dos dados grande, levando em considerao o nmero de valores que pertencem a cada classe. A construo de tabelas de frequncias para variveis cntnuas necessita de certos cuidados.
1I
EXEMPLO 3 - A tabela 1.4 apresenta a distribuio de frequncias da varivel ALTURA (medida em cm), usando-se os dados da tabela 1.1 - (DADOS AGRUPADOS)
Tabela 1.4 - Frequncias e percentuais das ALTURAS dos 31 estudantes de CALe. PROBo EST I Percenlual
N de l:"~\'//ldallles
.00
1--
f;
I
.f,~oo
3,4 13,8 41,5 31,0
157
1--.................. .. 85 P~.J:~== 1
Total
OUL
1---1-
4 12 9 .. 3
29
.1,3
JOO,O
2 no informaram a altura.
OBSERVAO:
1) De um modo geral tem-se a destacar cm uma t:abcln (disposio escrita que se obtm referindo-se a uma coleo de dados numricos a uma determinada ordem de classificao ): i) Elementos essenciais: Ttlllo: Indicao que precede a tabela e que contm a designao do fato observado, o local e a poca em foi registrado. Cabealho: Parte superior da tabela que especifica o contedo das colunas. Col'llla Indicadora: Parte da tabela que especifica o contedo das linhas. Corpo da tabela: Conjunto de colunas e linhas que contm as informaes sobre a varivel em estudo. ii) Elementos complementares: Fonte: Indicao da entidade responsvel pelo fornecimento dos dados 'ou pela sua elaborao. Notas: Informaes de natureza geral destinadas a conceituar ou esclarecer o contedo das tabelas ou a indicar a metodologia adotada no levantamento ou na elaborao dos dados. Chamadas: Informaes de natureza especifica sobre determinada parte da tabela, destinada a conceituar ou a esclarecer dados 2) As tabelas apresentadas oficialmente devem atender s normas do IBGE.
_ REGRAS BSICAS PARA ELABORAO DE UMA DISTRIBUIO FREQUNCIAS POR INTERVALOS - (DADOS AGRUPADOS)
DE
1. Efetua-se um ROL ESTATSTICO (ordenao crescente ou decrescente de grandeza) nos Dados Brutos (aqueles ainda no organizados numericamente).
12
L
2. Determina-se a AMI)LITUDE TOTAL dos dados Ar = Xmx - Xmn ,onde Xmx : maior valor observado e Xmn observado 3. Escolhe-se convenientemente
menor valor
podemos tomar K ou a frmula de Slurges K == 1+ 3,3. iogJl, 1I ~ 25 (totai de observaes). Se possvel determina-se, ou seja, constri-se classes de mesma amplitude, tomando 4. Efetua-se h == --.
=...r;;
AT K
o AGRUI)AMHNTO l~M CLAS,)'/~'S e, a seguir, toma-se as i'1~EQUJ~'NCIAS SIMPLES DE CLASSES, elaborando-se, portanto, a tabela de distribuio de frequncias.
EXEMPLO 4 _ Elabore uma tabela de distribuio c)e /i'equncias (dados agrupados) da varivcllDADE (em anos) dos 30 estudantes de Cale. probo Est I, Turno: Manh, Turma 04, Perodo: 97.1, conforme
DADOS BRUTOS
U:ulos Bmlos
abaixo:
HOL [STATSTlCO (crcsccntc)
27 18 21 19 19 23 20 21
21 23 23 21 21 27 18 18 22 19 19 18 19 18 18 20 19 24 20 21 20 21
18 18 18 19 19 19 21 2 I 21 23 23 23
18 19 21 24
18 20 21 27
18 19 19 20 20 20 21 21 22 27
= J3 ~ 5 (aproximao
9
anos
por falta)
e Amplitude de classe
c:)
h~
k = 5" = 1,8 == 2
AT
Passo 4: AGRUPAMENTO
EM CLASSES
+ FREQUNCIAS
SIMPLES DE CLASSES
Tabela 1.5 _ DISTRIBUiO DE FREQUNCIAS DAS IDADES (em GIIO.\) DE 30 ESTUDANTES DE CALCo PROBo ESTATSTICA 1- TURNO: MANH, TURMA: 04,
PERODO: 97.1
i
IDADES
(allo.\) 18
W-
Estudanles
.
20
1--"""'--
20 \------ 22 22 1------' 24
24 1------ 26 ~\-----28 Total ou L
FONTE: Tabela 1.1 NOTA: Dos 31 respondentes,
12 11 4 1
2 30
1 no informou a idade.
J]
ESSENCIAIS
numa Distribuio
de
Classe ou Intervalo de classe -------> Li (incluir) Por exemplo, distribuio das Idades, tabela 1.5: 1 classe -----> Li = ii. AMPLITUDE
1------ Ls
(excluir)
181-----
Ls = 20
2 classe -----> Li = 20
1----- Ls = 22,
etc.
DE CLASSE: Iti
= Ls - Li,
Por exemplo, distribuio das Idades, tabela 1.5: 1 classe --> It 1 = 20 - I 8 = 2 2 classe --> "2
=
22 - 20 = 2 ,
... ,
s classe
--> 115 = 28 - 26
=2
Como as classes tm mesma amplitude denominamos, simplesmente, por PONTO MEDIO DE CLASSE: X ,=
,,= Li - Ls
11I.
L +L 2 S,
I
18 + 20 2'
19 .
2- classe ---> Xl
No caso de classes com mesma amplitude It, tomamos: 2 classe -----> Xl + Iz = 19 + 2 = 21 3 classe
x,.. = Xi
-----> Xl + It = 21
+ 2 = 23 etc.
I:';i':'u:",,',','um'
IV.
I
de observaes)
FREQUNCIA
L/;
i=1
L/;
=
Por ex.~ /1
12
/2 = 11
/]=4
/4= I
/5=2
L.I; = /I = 30
14
--
5.
FREQUNCIA
RELATIVA
E PERCENTlJAL
DE CLASSE
Lfli
fiJ~ = -n
,1;
f/lo
ou
L.I: % = 100
6. FREQUNCIA
(soma das frequncias percentuais) SIMPL~S ACUMlJLADA (do tipo "abaixo de")
F; = /1 + /2 + /3 +'" +.1: ,
7. FREQUNCIA RELATIVA
Fr;
= /r
J
+ fr2 + fr3 +'" + fi~ , frequncia relativa acumulada da i-sima classe ou valor
frequncia percentual acumulada classe ou valor .__._ .
Freq.Perc.
.
da i-sima
___
Freq. Simples
fi
1 4 12 9 3 __ ................... 29
Freq. Percentual fi %
..
Freq.Simples
........
_~_
~
1 5 1-7 26
29
Total ouL
1,000
100,0
4 _ REPRESENTACES
DE FREOUNCIAS
grfico csttstico uma forma de apresentao dos dados estatisticos, cujo objetivo o de produzir, no investigador ou no pblico em geral, uma impresso rpida e viva do fenmeno em estudo, j que os grficos falam mais rpidos que as sries ( tabelas ). Para tornarmos possvel uma representao grfica, estabelecemos uma correspondncia entre os termos da srie e determinada figura geomtrica, de tal modo que cada elemento da srie seja representado por uma figura proporcional.
15
- REQUISITOS
A representao grfica de um fcnmcno dcve ohcdcccr aos seguintcs rcquisitos primurdiais: a) Simplicidade - indispensvel devido neccssidade de levar a uma rpida apreenso do scntido geral du fcnmcno aprcscntado a fim dc no 110S perdcrlllos na observao de mincias de importncia secundria. b) Clarcza - o grfico deve possibilitar uma correta interpretao dos valores represcntativos do fcnmeno cm cstudo. c) Veroacidadc - indispensvel qualqucr cOlllcntilrio, posto que, sc no reprcsenta uma realidade, o grfico perdc sua linalidade. Os principais tipos de grficos cstatsticos para as distribuics de frequncias so os DIAGRAMAS, os quais so grficos geomtricos de, no mximo duas dimenses. Para sua construo, em geral, fazemos uso do sistema cartesiano. Dentre os principais tipos de diagramas destacamos, segundo a varivel em estudo: Varivel Qualitativa"
GRFICOS EM BARRAS OU COLUNAS, GRFICOS EM SETORES rDistribuio por Valores to) GRFICO EM COLUNAS (ou Basto)
POLGONO
DE
GRFICO
EM COLUNAS
OU BARRAS
- a representao
retngulos,
GRFICO
dispostos ho,oizontalrnente
(em barras) ou
Exemplo: Grfico 1.
POR SETORES - o grfico que representa as partes de um todo, por setores de um crculo, visando justamente comparar estas partes entre si e em relao ao todo.
Excmplo: Grfico 2. Procedncia dos Estudantes ele Calco Probo Estatstica I Turno: Manh, Turma: 04, Pcrodo: 97.] . Grfico]
30
Grfico 2
O,Regio
lU
Inlerior
Capilal
Li: o
Capital
<Il
Interior
O.Regio
Procedncia
16
HISTOGRAMA _ a representao grlica de ullIa distrihuio de fj'equncias de uma varivel quantitativa (dados agrupados) por meio de retflngulos justapostos centrados nos pontos mdios das classes e cujas reas so propoll.:ionais s li'clJuncias das c1asscs. Exemplo: Grlico 3 Grfico 3:
Alturas dos estudantes de Cale. Probo Estatstica I Turno: Manh, Turma: 04, Perodo: 97.1
~. 14 F requenCla .
12 10
__ ._-_ --~ ..
I
-----
ll
r=.-::.:::::::::::::
...._.
8
6 4
-_
_ --
2 O
Altura
POLGONO. DE FREQUNCIAS - a representao grfica de uma distribuio de frequncias por meio de uma linha poligonal fechada ou polgono, cuja rea total igual a do histograma. Exemplo: Grfico 4. Grfico 4:
Alturas dos estudantes de Calc. Probo Est I Turno: Manh, Turma: 04, Perodo: 97.1
14
Frequncia
12
10
Polgono de frequncia
8
6 4 2 O
146,5 153,5 160,5 167,5 174,5 181,5 188,5
Altura
17
15 -
MEDIDAS
DE POSiO
Vimos anteriormente a sintetizao dos dados sob a forma de tabelas, grficos e distribuies de frequncias. Aqui, vamos aprender o clculo de medidas que possibilitem representar um conjunto de dados (valores de uma varivel quantitativa, isto , informaes numricas), relativos observao de determinado fenmeno de forma reduzida. Estes ndices estatsticos so as MEDIDAS DE POSiO e, dentre as mais importantes, citamos as Mcdidas dc Tcndncia Ccnh"al, que recebem tal denominao pelo fato dos dados observados tenderem, em geral, a se concentrar em torno de valores centrais. Dentre as medidas de tendncia central, destacamos: a Mdia aritmtica ou Mdia; :1 Mod:l; a Mcdi:lna. As outras medidas de posio so as SEIlARATRIZES, a prpria I11cdian:l; os q uar.tis; os pCI'ccntis. 1. MDIA ARITMTICA (ou simplesmente MDIA) que englobam:
Dcfinio 5.1: (a) Dada uma populao constituda de N elementos, Xl, X2, ..., XN sua mdia, denotada por ~ , mede o valor mdio do cOl~unto de dados, sendo expressa na mesma unidade, e definida por: XI + X2+. ..+X N
N
fl=-----
ou
J1=}j
:LX;
( Mdia populacional).
Eg. (I)
(b) Dada uma amostra consttuda de n elementos, X" X2, ..., XIl denotada
sua mdia,
x=
ou
- = --' LX X
11
(Mdia amostrai)
Eq. (2)
Exemplo: Determinar a mdia do seguinte conjunto (amostra) de valores Xi: 3, 7,8, 10, I]
Logo, X
L _ = -- X; - 3 + 7 + 85+ 10 + 11 =>
11
= 7,8
18
----
DE FREQUNCIA
11
Seja um conjunto de dados ( uma amostra) constituda de , X Z, X2, ..., Xk ocorrendo com respectivas n.equnciasll'
12, ...,Ik
~fi".
li .
- = 2:X. .r
X
I
L.r
ou simplcsmcnte
r.
El).
(J)
onde
"O~ ~/i
013S.: A expresso acima usada tanto no caso dc distrihui~:lo dc lIcqulll.:ias por vallllcs, como para dados agrupados CllI dasscs. No scgulldo caso, os X 'i. ' rcprcsclltalllos pontos mdios de classes. Exemplo: Determinar a mdia do scguinlc conjunto de valorcs, 2, 8, 5, 3, 8, 2, 2, 5, 8, 2, 5, 8 e 2 Xi 2
3 5 8
Xi: 2, 3, 8, 8, 5, 2, 2,
ti
8 2
4 6
Xi*~
16 6
20
48
20
90
= "X.f L. i.;
Li; = 20
90
=>
= -1,5
11
L/i = 20
OB5.: A Equao (3) uma adequao da equao (2) no caso de um conjunto de valores
1. uma medida de tendncia central que por uniformizar os valores de um cOI~unto de dados, no representa bem os conjuntos que revelam tendncias extremas. Ou seja, grandemente influenciada pelos valores extremos (grandes) do COI~unto. 2. No pode ser calculada para distribuies de frequncias com limites indeterminados (indefinidos).
19
Excmplo:
impossvel
calcular
reprcsclllaliva
das id;l<les
NJ
de /Jesso(JS
~ I 21
52 I XC>
1------011
4I
JX
2
mais
Desprezando as classes aherlas, islo , com limites indeterminadus, a sim, poderi.1I110S calcular a rclc.ida lIIdia.
TolnJ ou
JOO
e de lIIaior elllprego.
3. o promdio
mais cOllhccido
4. facilmcntc calculvcl. 5. Pode ser tratada algebricamcnte (ver propricdadcs). 6. Serve para compararmos cOI~untos semelhantes. 7. particularmente indicada para sries (conjuntos) que possucm os valores simtricos cm relao a um valor mdio e de frequncia mxima. 8. Dcpendc de todos os valores do cOltiunto de dados. Propriedades: " L(X; - x) = O.
;~ I
2 - Somando-se ou subtraindo-se uma constantc (c) a todos os valorcs de uma varivel, a mdia do conjunto fica aumentada ou diminuda dessa constante, isto ,
1'; = Xi
:t c=> Y
=X
-
:f: c
3 - Multplicando-sc ou dividindo-se todos os valores de lima varivel por uma constante (c), a mdia do conjunto fica multiplicada ou dividida por essa constante, isto ,
= X * c => Y =
I
X'" c ou Y
=X
-;-c => Y
=X
-;-c,
I)ara
c:;t:O.
2. MODA Definio 5.2: Dado m conjunto de valores, a moda, denotada A/o, o valor que ocorre com maior frecjuncia, ou seja, o valor mais frequente do conjunto de dados.
20
OBS.:
i) A moda de um conjunto de dados pode no existir (figura (a) ) ii) A moda de um conjunto de dados pode no ser nica (figura (c) )
f f f'
(a)
(b)
~(C)
(unmodal)
(bimodal)
Exemplo: Determine a moda dos seguintes conjuntos de dados abaixo a) 2, 2, 3, 3, 5, 5, 8, 8 b) 2,2,3, 5,5,5,8,8 c) 2,2,2, 3, 3, 5, 5, 5,8
5 = 2 e Alo = 5
_ CLCULO DA MODA PARA DADOS AGRUPADOS Em uma distribuio de frequncias com dados agrupados em classes, denominamos classe modal que possui a maior frequncia, e, conseqentemente, ser esta classe que conter a moda. FRMULA de CZUBER (il1terpreta~~o geomtrica atravs de Histograma)
Mo ~ L., +
C" ~'l1J."..
onde: Lmo : limite inferior da classe modal hmo : amplitude da classe modal Mo classe modal Exemplo: Utilizando os dados apresentados na tabela 1.4, determine a ALTURA MODAL dos 29 estudantes de Clc~lo das. Probabilidades. e Estatstica I - Turno: Manh, Turma: 04, Perodo: 97.1 Classe modal (2 .) 164
a
Classes
1-----
171 ,
Ll110
164 ,
h1l0
12,'
hmo = 7
21
______________________________
.11 = /'mx
Logo, Mo
fwll
= 12 -
4 = 8;
L1.z
= /,IUX ou
~}arJ
= 12 - 9 = 3
Mo
=
164+(_8_)*7 = 8+3
169,lcl1l
169cI11
VANTAGENS E DESVANTAGENS DA MODA 1. No depende de todos os valores do conjunto de dados, podendo mesmo no se alterar com a modificao de alguns dcles. 2. No influenciada por valores extremos (grandes) do cOI~unto de dados. 3. Pode ser calculada para distrtbuies com limites indetcrminados (indefinidos) na maioria dos casos.
3. MEDIANA
Definio 5.3: Considere uma srie (conjunto de dados) ordenada, constitudo de li valores. A mediana, denotada Me , o valor que divide o conjunto em duas partes iguais ( isto , em duas partes de 50% cada). Exemplos: a) Calcular a mediana do seguinte conjunto de dados: 2, 3, 5, 8, 9, 11, 13 Me = 8 (termo de ordem central) (n = 7 mpar)
Verificamos que, estando ordenados os valores de uma srie (conjunto de dados) e sendo 11 o nmero de elementos da srie, o valor mediano ser: - o termo de ordem central
11
+1
2
Me
XliiI 1
se
11
for mpar;
X +X
11
-+1
11
11
e -
11
+ I,
}\I
hj
e=
].
se
11
for par.
22
'---------'
CLCULO DA MEDIANA NUMA DISTR.lI3UIO DE FREQUNCIAS a) Dados No-agrllpados Neste caso, para a srie de valores ordenados em ordem crescente de grandeza (i. e., em um rol), a mediana o valor mdio ou a mdia aritmtica dos valores centrais, caso tenhamos um nmero mpar ou par de valores na srie. b) Dados Agrupados em Clas.'.es No caso de dados agrupados, rc1embramos que uma distribuio de frequncias pode ser representada por meio de um Histograma. Dizemos ento que a mediana ser o valor de X (abscissa) cuja ordenada divide a rea total do Histograma em duas partes iguais. Assim, para dados agrupados, a mediana obtida atravs de interpolao de acordo eom a seguinte frmula:
li. 2
---i' flui
Ime
Me
= Ln,.
J
17m
onde:
Lme o limite inferior da classe mediana; fme a frcquncia simples da classe mediana;
Fali!
50%
50%
ou nJ2
ou nJ2
Md
classes
Exemplo: Determinar a ALTURA MEDIANA dos 29 estudantes da turma de Cal. Probo Est I, Turno: Manh, Turma: 04, Perodo: 97.1 - Turno da tarde, conforme os dados agrupados na tabela 1.4 (estendida).
1';2 = 29/2 = 14,5 (50%) ==> Classe mediana (2.) : 164 1----- 171 (Classe mediana:
primeira classe que ultrapassar 50% (n/2) ou mais das observaes) Lme = 164 , .
flfle =
12;
hme=7 ;
F1lI1t
=>
Md == 164+ (
ou
Md
170clIl
2]
PROPRIEDADES
DA MEDIANA
i) A mediana no influenciada por valores extremos (grandes) de uma srie ou conjunto de dados. ii) A mediana de uma srie de dados agrupados de classes extremas indefinidas pode ser calculada.
16.
MEDIDAS
DE DISPEJ{Sol
Na seo anterior, aprendemos a calcular e entender convenientemente as medidas de 'posio representativas de um determinado conjunto de dados, onde destacamos a mdia, a moda e a mediana. Sejam quatro conjuntos A, B, C e O com os seguintes valores: Conjunto A => 7, 7, 7, 7, 7 Conjunto B ==> 5, 6, 7, 8, 9 Conjunto C ==> 4, 5, 7, 9, 10 Conjunto D ==> O, 5, 10, 10, la Para representarmos cada conjunto, podemos calcular a sua respectiva mdia (Eq.( 1,encontrando
-
XA = XIJ = Xc = X D = 7.
Vemos assim que apesar de constituidos de valores diferentes, os grupos revelam uma mesma mdia aritmtica. Observando-os mais detalhadamente, notamos que em cada grupo os valores se distribuem diferentemente em relao mdia 7. Necessitamos assim de uma medida estatstica complementar para melhor caracterizar cada COI~unto apresentado. As medidas estatsticas responsveis pela variao ou disperso dos valores de um conjunto so as medidas de disperso ou de variabilidade, onde se destacam a' amplitude total, a l'ar;llcia, (} desl';o padro e o coeficiente de l'ariao. Em princpio, diremos que entre dois ou mais conjuntos de dados, o mais disperso ( ou menos homogneo ) aquele que tem a maior medida de disperso. 1 - A AMPLITUDE TOTAL Medida j apresentada na elaborao de uma distribuio de frequncias com dados agrupados em classes, denotamos AT. ~
AT = Xn,A' - Xn"."
w.4 ,
conjunto. 2- A VARlNCIA A varincia de Um conjunto de dados ( amostra ou populao) mede a variabilidade do conjunto em termos de desvios quadrados em relao mdia aritmtica do conjunto. uma
24
_quantidade sempre no negativa e expressa em unidades quadradas do conjunto de dados, sendo de dificil interpretao. Definio 6.1: a) Seja um conjunto ( populao) varincia denotada constitudo de N elementos XI, X2 .... , XN Sua
cl, definida
=
por:
(52
L:(X/
-)Ir
xf
1
Eq (5) , onde
= k_XI
N
Il
a mdia populacional
, Xn. Sua
S2 =
L:(X; 11-
Eq (6) , onde
- = --' LX X
/1
a mdia amostrai
OBS.:
A equao (6) utilizada quando -nosso interesse no se restringe descrio dos dados mas, partindo da amostra, visamos tirar inferncias vlidas para sua respectiva populao. No caso de estarmos interessados apenas na descrio dos dados, podemos usar no divisor "em lugar de " - J
Exemplo 2: petermine a varincia do seguinte conjunto (amostra) De acordo com a equao (6)temos:
Xi : 2, 3, 5, 7, 8
+(7_5)2
+(8_5)2
onde
X= LX;
11
5-1 +9 = 26 ==> 4
=5=
S2
=
25
6,5
DE FREQUNCIAS
S2
L(X; /1-
Xr ..1;
1
Eq. ( 7 ) ,
/1
= 2: f
X'i.>
25
FRMULA ALTERNATIVA
derivada da Equao ( 7 ) :
ou
S2 =
/1
,.1; L X'.
2
(LX
. .1;)2
/1-1
1/
(/1-1)
Eq. ( 8 )
3 - O DESVIO PADRo urna outra medida de disperso mais comumente empregada do que a varincia, por ser expresso na mesma unidade do conjunto de dados. Mede a "DISPERSO ABSOLUTA" de um conjunto de valores e obtida a partir da varincia. Desvio Padro = + .JVaric./1cia ( Raiz quadrada positiva da Varincia )
Conforme, o conjunto de dados, trate-se de uma populao ou uma amostra, teremos o desvio padro dado por:
L(X; - PY
N
L(X -xf
j
/1-1
= J6:5
=:;===>
S = 2,55
Exemplo 3: Calcular a varincia e o desvio padro para a distribuio de frequncias das ALTURAS dos 29 estudantes de Clculo das Probabilidades e Estatistica I Turno: Manh, Turma: 04, Perodo: 97.1. ALTURAS (cm) 150 1---- 157 1571---- 164 ]64 1---- I 71 171 178 ] 781---- 185 Total ou L; No. Est fi 1 4 ]2 9 3 29 P. Mdio Xi 153,5 ]60,5 167,5 174,5 18],5
Xl
J
X.
J
.,
I;
X.
'
t:
I
T----
Varincia .
==>
2
=
11' L; X.
I
2*.f. -t[.X/.f )2 i I
11*(11-])
29*836157,25-(4920,5)2
----------_
_ 37239,95 _ 4586.
_,
29*28
812
= 45,86cm2
26
4 - O COEFICiENTE DE VARIAO uma quantidade adimensional e selVe para comparar dois ou mais conjuntos de dados de unidades diferentes. Mede a "DISPERSO RELATIVA" de um conjunto de dados. expresso, usualmente, em percentagem (% ).
Populao Amostra
====> CV
(Y
~l :j:;
O
=f:.
=>
CV
O.
Exemplo 4: Calcule o coeficiente de variao (disperso relativa) das ALTURAS dos 29 estudantes da Turma 04 - Turno da Manh de Calc. Probo Est 1 - Perodo: 97.1 Tabela 1.4 Da distribuio das alturas, (tabela 1.4), temos: Altura mdia => X = 169 '67 cm . e o Desvio Padro ===> .\' = 6,77c11l
Cv =
I69,67cm
x 100 = 3 99
"
ou seja. CV = 3 99%
.. '
7. REFERNCIAS
BIBLIOGRFICAS
1. Costa Neto, P.L.O. Estatstica. Editora Edgar Dlucher. 2. Mendenhall, W. Probabilidade e E'sta/slica. Editora Campus, VaI. I e 11.
27
o clculo
peas fabricadas contado. 5. Uma lmpada fabricada e em seguida ensaida quanto durao de vida, pela colocao em um soquete. O tempo decorrido (em horas) at queimar anotado.
objetivo
que
28
12. ESPAO
AMOSTRALEEVENTOS
Definio 2.1: Definiremos e.\pao amostraI, para cada experimento aleatrio E, como o
conjunto de todos os possveis resultados do experimento, e o denotaremos porO. EXEMPLO 2.1: Determine os espaos amostrais associados aos cxperimentos dos excmplos anteriores.
SOLUO: {I ,2,3,4,5,6} .02 = {(Ca,Ca), (Ca,Co), (Co,Ca), (Co,Co)}, onde Ca c Co reprcsentam a ocorrncia de cara e coroa, respectivamente. E3 ~ .03= {O,1,2} E4 ~ .04= {IO,11,12, .... } Es ~ .os = {t E ~H t ~O) /
~
E1
.o) =
2 ~
A fim de descrever um espao amostrai associado a um experimento, devemos ter bastante claro o que estamos mensurando ou observando. Por isso, devemos falar de "um" espao amostrai e no de "o",espao amostraI. Vcja a diferena entre .o2e fh Saliente-se, tambm, que o rcsultado de um cxperimcnto no nccessariamente, um nmero. Por exemplo, em E2, cada resultado .um sequncia de Caras (Ca) e Coroas (Co).
.o, associado a um experimento E) um conjunto de resultados do experimento, isto , qualquer subconjunto do espao amostrai um evento.
Diz-se que "ocorre o evento A", quando o resultado do experimeno aleatrio for um elemento de A. Em particular, o conjunto universo, .o, e o conjunto vazio, ~, so tambm eventos, onde .o denominado de evento certo e q, evento impossvel. Se A contm apenas um elemento, dizemos que A um evento elementar ou simples. A partir das operaes entre cOI~untos (Apndice A) podemos formar novos eventos, tais como:
* *
*
A u B o evento que ocorrer se e somente se A ou B ou ambos ocorrerem. A (1 B o evento que ocorrer se e somente se A .. B ocorrerem simultancamcntc.
A ocorrer se e somente se no ocorrer A.
n.
Definio 2.3: Dois eventos A e B, so ditos mutuamente excludentes (M.E.), se eles no puderem ocorrer simultaneamente, isto , A (1 B = ljJ .
29
EXEMPLO 2.2: Lanar um dado e observar a face voltada para Cima. Considere os
seguintes cventos: A: B: C: D: o nmero o nmero o nmero o nmero par. impar. maior que 4. menor ou igual a 2.
n=
{l,2}
n:
AuB
=<1>
AnB=n
c) A = {l,3,5} AnB
--
12,4,6}
AnB
AnD=(2} d) A n C = {6} : cvcnto elcmentar BnD={I} BnC= {5} CnD=<I> Os eventos A e B, assim como os eventos C e O, so mutuamente excludentes. Obs: Note que o item c) exemplifica as leis de "De Morgan". (ver Apndice A)
30
3. NOCESFUNDAMENTAJS DE rl{OBAllILlDADE
Definio
e D. um espao amostrai associado a E. Probabilidade uma funo P que associa a cada evento A E F(D.) a um nmero real representada por P(A) e denominada probabilidade do evento A, satisfazendo aos seguintes axiomas:
1. O::;;P(A) ::;;1. 2. P(D.) = 1. .3. Se A e B forem evento.s mutuamente excludentes, P(A u 13) = P(A) + P(B) Se AI, A2, ... , An, . forem, dois a dois, eventos mutuamente excludentes, ento, P(u:1AJ
= P(A,)
'"
Por enquanto, no sabemos como calcular P(A). Ns apenas arrolamos algumas propriedades gerais que P(A) possui. Vamos, inicialmente, enunciar e demonstrar algumas consequncias relacionadas a P(A) que decorrem das condies acima e que no dependem da maneira pela qual ns relmente calculamos P(A).
PROPRIEDADES
FUNDAMENTAIS
Propriedade j.1: Se ~ for o cOI~unto vazio, ento P(4,)=O. Demonstrao: Para qualquer evento A, sabemos que
A=Au~ e
A n<p=~
Ento, A e 4> so eventos mutuamente cxcludentes. De 3. temos P(A) = P(A u <fi) Portanto, P( 4 = O
=
= P(A)
P(A) + P(~)
Propriedade 3.2: Se A for o evcnto complcmcntar dc A, cnto P( A) Demonstrao: Para qualquer evento A, sabemos que
D.=AuA
I - P(A).
<fi=AnA
p(n)=p(Au
A) = P(A) + P( A ).
De 2. Temos
31
----,
1- P(A).
Propriedade 3.3:Se A e B forem eventos quaisquer tais que A c B ento P(A) ~ P(B). Demollstrao: Sabemos que
B = A u (B nA) , onde A e (8 nA) Consequentemente, P(B) so eventos mutuamente excludentes.
= P(A)
e-
tl
B)
Ento, P(A u B) = P(A) + P(B) - P(A n I3) Como exerccio pode-se facilmente provar a propriedade acima para trs eventos. Se A, B e C so trs eventos quaisquer, ento
P(A uB uC) = P(A) + P(B) + P(C) - P(A nI3) - P(A nC) - P(B nC) + P(A nBne)
4.PROBABJLIDADE
Definio 4.1:Seja
espao amostrai associado a um experimento aleatrio E com um nmero finito de resultados possiveis, Ento, .n pode ser escrito da seguinte forma:-, .n = {a\,a2,...,a e seja Ai = {ad i=I,2, ...,n todos os eventos elementares de Q. A cada evento elementar {ai} associaremos um nmero pi, denominado de probabilidade de {ai}, que satisfaa s seguintes condies:
ll }
.n um
]2
1. Pi ~ o, i = 1,2, ... , n. 2. PI + P2 + ... + p" = I Como {ad um evento, essas condies so coerentes com aquelas postuladas para as probabilidades dos eventos em geral, isto , com os axiomas da definio 3.1. Suponha, agora, que um evento I3 seja constitudo de k resultados, I S; k S; n, a saber,
B= {a l,a2, ... ,al;},
onde 1,2, ... ,k representam qualquer dos k ndices, de I at n. Consequentemente, do axioma 3 da definio de probabilidade (3. I) que
P(B)
conclui-se
EXEMPLO
4.1: Trs cavalos, A, I3 e C, esto numa corrida; A duas vezes mais provvel de ganhar que B e I3 duas vezes mais do que C. Quais so as probabilidades de vitria de cada um, isto , P(A), P(B) e P(C) ? Seja P(C) = P; como B duas vezes mais provvel de ganhar do que C, P(B)=2p; e como A duas vezes mais provvel do que B, P(A) = 2P(B) = . 2(2p) = 4p. Como a soma das probabilidades tem que ser I; ento p+2p-l-4p=1 Logo, P(A) = 4/7; ou 7p=1 P(B) = 2/7 ou e 1'=1/7. P(C) = 1/7
SOLUO:
Pergunta: Qual a probabilidade de que B ou C ganhe? Por definio, P(B u C) = P(B) + P(C) = 2/7 + 1/7 = 3/7
{a\,a2,...,an} associado a um experimento E e Ai = {ad i= I ,2, ... ,n os eventos elementares de .0.. O espao equiprovve! se
.o. =
.o. dito
P(Ai) = p, i = 1,2, ..., n, ou seja, se todos os eventos elementares so igualmente provveis. Consequentemente, das condies 1. e 2. da definio 4.1, vem:
1. pi=P~O, i=1,2, ...,n. 2. Pi + P2 + ... + pn':: P + P + ... + p = 1 De 2. tem-se que np = 1 e consequentemcnte, p = 1/n.
33
I
Logo, se o espao amostrai equiprovvcl, a probabilidade de cada um dos pontos 1/n. Disto decorre que, para qualquer evento B formado de k resultados, I ~ k ~
k . l1(lJ) ou seja, P(B) =--= /1(0)
11,
tem-se
P(B)
= -,
11
EXEM PLO 4.2: Selecione aleatoriamente uma carta de um baralho comum de 52 cartas. Sejam A: a carta uma espada e B: a carta uma figura. Calcule P(A), P(B) e P(A n 13) SOLUO: Como temos um espao cquiprovvel,
/10' de e.\fJadas 13 P(A)=----=-=/10' de carlas 52
P(B) =
/lO'de fi~lIras
11'"
de cartas
<
12. 3 =-=-
52
13
P(A n B)
= /I'"
IS.PROBABILlDADECONDICIONADA
EXEMPLO
5.1: Um lote formado pelos seguintes artigos: 80 no defeituosos e 20 defeituosos. Dois artigos so retirados do lote. Sejam A= {o 10 artigo defeituoso} e B={ o 2 artigo defeituoso}. Calcule P(A) e 1'(13),a) com reposio; b) scm reposio.
= PC}]) = 29{00
extraindo do lote, existiro 20 peas defeituosas no total de 100. b) Se estivermos extraindo sem reposio, ainda verdade que P(A) =
X. Mas e sobre
P(B)?
lote no momento de se extrair a segunda pea. Isto , devemos saber se A ocorreu ou nao. Estl? ex.emplo mostra a necessiuade de se introduzir o seguinte conceito. Sejam A e B dois eventos associados ao experimento E. Denotaremos por P(BI A) a
34
Sempre que calcularmos P(I3/A), estaremos essencialmente calculando P(B) em relao ao espao amoslral reduzido A, em lugar de faz-lo em relao ao espao original n. EXEMPLO 5.2: Dois dados onde Xi eventos: Determine: honestos so lanados, registrando-se o resultado como (XI,X2), o resultado do i-simo dado, i= 1,2. Considere os seguintes A={(xI,xz)/ XI + X2= lO} e 13={(xl,x2)1 XI> X2}. P(A), P(B), P(A n B), P(B/A) e I>(NB).
SOLUO:
O espao amostraI .o pode ser representado pela seguinte lista de 36 resultados igualmente provveis.
(1,1),(1,2),
, (1,6), , (2 :6),
. ~,
.o =
(2,1), (2,2),
~.
..................... .
(6,1), (6,2), ... , (6,6)
11(.0)=36,
A n 13={(6,4)}
n(B) = 15 P(B)=-, 36
15
n(A n B) = 1
P(AnH)=-, 36
P(B I A) =..!., uma vez que o espao amostrai , agora, formado por A.
De modo equivalente, ternos P( A / B)
= _1 .
15
Se fizermos um exame cuidadoso dos vrios nmeros calculados, concluiremos que P(B / A)= P(A nB) . P(A) e
P(A / 13)
= f}(A
n B)
P(B)
Essas relaes no surgiram apenas neste caso particular. Ao contrrio, so bastante gerais, e nos do caminho para definir a probabilidade condicionada. Defi"io 5.1: Sejam A e B dois eventos quaisquer de um mesmo espao amostrai Q. Chamamos probabilidade do evento A, dado que o evento 13 ocorreu, ao seguinte quociente: P(A / li) = _P_(A_n_IJ_) se P(B) > O P(J-J) , Obsen'aes: 1. Se P(B)
= O, nada
35
P(H) = O.
_ n(A n H) n(/1)
n H)/
In(D.)
H)/ /1/(0.)
l'(A / H)
=
1/(
Me uinas
Tempo de uso N lJ Total
M
4
2
E 3
I
Total
7
3 10
A mais importante consequncia da definio de probabilidade condicional acima, o seguinte teorema. Teorema 5.1 (Teorema da Multiplicao de Probabilidade.\):
.o, ento:
P(lJ / A)
= P(B)*
P(A / B)
ou
P(A n H)
= P(A)*
para mais
de dois eventos. Sejam AI, A2, . , Ao eventos quaisquer de um mesmo probabilidade da ocorrncia simultnea de AI, A2, .. , Ao dada por: espao amostrai 0., a
(\ ... (\
Ao-I)
](,
EXEMPLO .
5.4: Uma caixa contm 4 lmpadas boas e 2 queimadas. Retira-se ao acaso 3 . lmpadas, sem reposio. Calcule a probabilidade dessas 3 lmpadas serem boas.
SOLUO:
= -. 4 5
At aqui, empregamos o conceito de probabilidade condicional a lim de avaliar a probabilidade de ocorrncia conjunta de dois ou mais eventos. Veremos, no prximo teorema, como aplicar esse conceito para calcular, de outra maneira, ti probabilidade de um evento qualquer A. Teorema 5.2 (Teorema da Probabilidade Total):Sejam A um evento qualquer do espao amostraI n e BI, B2, ... , Bk uma partio do mesmo espao amostrai n, ento: P(A) =.P(N B1)P(BJ) Demonstrao:
L P(A ;=.
/ H; )P(H
j)
Como A = (A l B1) u (A n B2) u u (A l Bk) e (A n B.), (A (A n I3k) so eventos mutuall'n"fn " r-I"ri,-.'ltes,temos P(A) = P(A
l
B2),
... ,
EXEMI)LO
5.5: Voltando ao exemplo 5.1, calcule a P(U) se as retiradas dos artigos so feitas sem reposio. Comoj vimos P(A) =~. Logo, pela propriedade 3.2, temos que F(A) =~.
SOLUO:
Agora, P(B / A) = ~, porque se A tiver ocorrido, ento na segunda extrao 99 restaro somente 99 peas, das quais 19 delas sero defeituosas. De modo similar, temos que P(JJ / A) = 20 . Pelo teorema da probabilidade total, temos
99
P(Bp= P(B / A)P(A)
::
+ P(/J / A)P(A)
= -*- + -*- = -. 99 5 99 5 5
19
20
37
EXEMPLO 5.6: Uma determinada pea manufatura por trs fbricas, digamos A, B e C.
Sabe-se que A. produz o dobro de peas que 13, e que fi e C produzem o mesmo nmero de peas. Sabe-se tambm que 2% de peas produzidas por A assim como por fi so defeituosas, enquanto que 4% daquelas produzidas por C so defeituosas. Todas as peas so colocadas em um depsito, e depois uma pea extrada ao acaso. Qual a probabilidade de que essa pea seja defeituosa? SOLUO: Seja os eventos A={a pea provm da fbrica A}, B={a pea provm da fbrica B}, C= {a pea provm da fbrica C} e D= {a pea defeituosa} . Temos que P(A)=2P(B), e P(B)=P(C). Substituindo essas P(A)+P(B)+P(C)=l, temos que 2P(B)+P(il)+P(B) = 1, logo, . P(B)=P(C)= 1/4, enqualito que 1'(1\) = 1/2. relaes em
Como queremos determinar P(D) e os eventos A, B e C formam uma partio do espao amostraI, podemos aplicar o teorema da probabilidade total, o qual escreveremos como P(D) = P(D/A)P(A) + P(D/B)P(B) + P(D/C)P(C). Pelo enunciado do problema, temos que P(D/A) = P(DIB) = 0,02, enquanto P(D/C) = 0,04. Levando-se esses valores expresso acima, encontraremos
1 1 P(D) = O 02* - + O 02* -
2'
4'
+ O 04* - == O 025
4'
16 TEOREMADEBAYES
Poderemos empregar o Exemplo 5.6 para sugerir outro importante resultado. Suponha-se que uma pea seja retirada do depsito e se verifique ser ela defeituosa. Qual a probabilidade de que tenha sido produzida na fbrica A ? Poderemos calcular esta probabilidade pelo seguinte teorema. Teorema 6.1 (Teorema de Bayes): Sejam BI, B2, ... , Bk uma partio do espao amostrai A um evento qualquer associado a .Q , ento:
ne
PC A I Ri) PC B
P(B; I A)
i )
= 'L:=1 P(A
, i = 1,2, ... , k
/ B)P(B)
38
P (A )
P(A)
. .
I
= 1,2, ... , k
P (A)=
L P (A
./=\
/ B) P ( B ./ ) . Logo, ./
P(B
j
A)
'Ll
I'(A / U; )I'(IJ,)
./)
P(A / J3)P(J-')
j
, i
1,2, ... ,k
}=1
EXEMPLO obtcmos
6.1:Voltando
P(A / D) =
EXEMPLO
6.2: Numa certa turma, 1% dos homcns e 4% das mulheres tm menos que 1,60m. de altura. Alm disso, 60% dos estudantes so homens. Ora, se um estudante selecionado aleatoriamente e tem menos que 1,60m. de altura, qual a probabilidade do estudante ser um homem? Sejam A={estudantes de menos de 1,60m. de altura}
SOLUO:
M={ estudantes do sexo feminino} e H={ estudantcs do sexo masculino}. Pelo teorema de Baycs, P H/A = I'(A / II)I'(I/) ( ) P(A / H)P(H) + P(A / M)P(M)
=_
(0,01)*(0.(,0)
=~
1i
17 EVENTOS
INDEPENDENTES
Consideremos dois eventos A e B quaisquer de um mesmo espao amostrai O. Dizemos que A e B so dois eventos independentes se a probabilidade de ocorrncia do evento A no altera a probabilidade de ocorrncia do evento B, isto , P(B) = P(B/A). Pelo Teorema de Multiplicao de Probabilidades, temos:
* P(B)
39
Definio
7.1:
so
il1depel1dentes
se
somente
se
Consequentemente,
EXEMPLO 7.1: Suponha que um dado equilibrado seja jogado duas vezes. Definamos os eventos A e B, da seguinte forma: A={o primeiro dado mostra um nmero par}, B= {o segundo dado mostra um 5 oU um 6} . Determine P(A), P(B), P(A n 13), P(A/13) e P(131A).
1
J'
. ........................
(6,6)
Entao
P(A)
= -36 = -2'
18
PC/)~
= -36 = -3'
12
-36 = -6 .
Consequentemcnte, P(A I B)
= P(A n B) P(B)
_ 1I 6 1 --=-= 1/3 2
P(A)
'
P(JJ I A)
11
eventos.
Ali,
.o.
Dizemos
Ali
nA.) = P(A J
)
)* f)(A P(A;)*
)'
:t:.
P(A; nA J n Ak
= 1,2,... ,1/
n
"
;=1
P(A),
40
...
EXEMPLO
'7.2: Suponha que um par de moedas no viciadas seja jogada. Definamos os eventos: A= {cara na primeira moeda l, B= {cara na segunda moeda} e C= {cara em exatamente uma moeda} .
(l
B), P(A
(l
C), 1'(B
(1 C)
c P(A
(l
(l
C).
n=
{(Ca,Ca),(Ca,Co),(Co,Ca),(Co,Co)},
A={(Ca,Ca),(Ca,Co)
Logo, P(A)
= P(H) = P(C)
P(A n/J)=
P({Ca,Cil})=~,
P(A(l
",. .)=P({.l,CO})=-, C C
B
/)(IJ
(l
4
P(B)* P(C)
P(A
(l
(l
C) = P(ljJ)
= O:t: P(A)*
Este exemplo mostra que os eventos so dois a dois independentes, eventos no so independentes.
mas os trs
8. REFERNCIAS
41
so fundamentais Teoria das Probabilidades. Um C()/~ill11to uma colco de objetos. Gcralmcntc os conjuntos so reprcscntados por letras maiscula: A, B, .... Os objetos que formam o conjunto A so denominados elementos de A. Quando a for um elemento de A denotaremos a E A c quando a no for um elemento de A escrevemos a ~ A. Definiremos o conjunto vazio como sendo o conjunto que no contenha qualquer elemento e o conjunto universal como aquele que formado por todos os objetos que estejam em estudo. A partir do conjunto vazio (~) e do conjunto universal (U), podemos enumerar as duas seguintes propriedades: 1. <p c A, para qualquer A. 2. A c U, desde que j se tenha definido o conjunto universal.
Consideremos, agora, a importncia de combinar conjuntos a fim de formar novos conjuntos. No que segue, consideramos A e.B dois conjuntos arbitrrios. 1. Unio: A u B ={x: x E A 011 X E B}. o conjunto dos elementos que pertencem a A ou a B
(}II
a ambos.
a A e a B.
42
3. Complementao:
EXEMPLO:
Ento, A = {4,5,6},AuB=
Enunciaremos abaixo algumas propriedades importantes: Sejam A, B e C trs conjuntos quaisquer. 1. 2. 3. 4. ldcmpotncia: A u A = A ~ A n A = A. Comutativa: A u B = B u A ~ A n B = B n A. Associativa: A n (B n C) = (A n B) n C ~ A u (B u C) = (A u B) u C. Distributiva: A u (B n C) = (A u B) n (A u C) ~ A n (B u C) = (A n B) u (A n C).
U = ifJ;
r/J= (j ;
A n A = ifJ;
A u A =U.
A partir dessas identidades podemos enunciar as seguintes definies. 1Jefi o A.I: D-se o nome de CUl~iulIl() das classes de A, e denota-se por F(A), classe ni de todos os possivcis subconjuntos de A. Para efcito de exemplo, considerc A = {a,b,c}, ento F(A) ={cP, {a}, {b}, {c}, {a,b}, {a,c}, {b,c}, {a,b,c}=A} Em geral, se A finito c tem
11
ni
ifJ,
=A
Vi = 1,2, ... , 11
2. Ai n Ai
/I
= ifJ,
Vi:j:. j
3. UA;
;=\
43
EXEMPLO: Seja A = {a,b,c}, ento . AI = {a} e A2 = {b,c} representam uma partio, enquanto que AI
{a}, A2
{a,b} e A3
{b} no representaria.
APNDICE
B- TCNICAS
DE CONTAGEJtf
Nem sempre possvel enumerar de forma simples o espao amostraI e o evento. Por esta razo, so necessrios alguns procedimentos de contagem qu~ so estudados pela anlise combinatria. Existem vrias maneiras de dispor os objetos de uma coleo em grupos. Esses grupos denominam-se agrupamentos e os objetos que os constituem chama-se de elementos. Em qualquer das maneiras de disposio dos elementos, existem dois casos: 1. Em cada agrupamento todos os elementos so distintos - agrupamento simples. 2. Em cada agrupamento pode haver repeties dos elementos - agrupamento com repetio. Os agrupamentos, quanto ao modo de formao, podem ser classificados em :
Arralljos, Perm.llta(ies e COl1lbillaijes. Os agrupamentos simples diferem pela ordem ou pela l1atureza de seus elementos. Diferem pela natureza quando pelo menos, um dos elementos de um dos agrupamentos no for elemento do outro. Defillio B.l: Sendo 11 um inteiro positivo, definimos 11! = (11)(11-1)(11-2) f .... denominamos de/atorial de 11.Tambm definimos O! = 1. e o
SOLUO:
P4 = 41 = 4.3.2.1 = 24. A saber, temos, o seguinte conjunto, {abcd, abdc, acbd, acdb, adbc,adcb, baed, bade, bead, beda, bdae, bdea, eabd,cadb, cbad,cbda,cdab, cdba, dabe,dacb,dbac,dbca,dcab,dcba}
44
li!
} '
1I,
- 11.. I'1
EXEMPLO SOLUO:
B.2:Quantos anagramas podemos formar com as letras da palavra CARCARA? Temos 2 letras C, 3 letras A c 2 letras R, num total de 7 letras. Ento, teremos,
P72
o
' 1
o,"
2. ARRANJOS A. ARRANJOS . \'It.1PLE.\' DE OBJETOS DISTINTOS So os agrupamentos de r elementos dentre 11 elementos distintos. Difcrem m agrupamento do outro, pela natureza ou pela ordem de seus elementos. O nmero de arranjos -AI'
A(II,,) 11
EXEMPLO
= ~ = 12 agrupamentos
2!
{ab, ac, ad, ba, bc, bd, ca, cb, cd, da, db, de} . B. ARRANJOS COjt,f REPOSIO DO OBJETO SELECIONADO So os agrupamentos de r elementos que podemos formar com /I elementos (O<r<II). Diferem um do outro pela ordem, pela natureza ou pela repetio de r c1emcntos dentro do mesmo agrupamento. O nmero de agrupamentos :
A (1I,r)
EXEMPLO
= /I
DA: Com as quatro primeiras letras do alfabeto, quantos agrupamentos de 2 elementos podcmos formar se a cscolha for feita sucessivamcnte e com reposio do elemento cscolhido ?
45
SOLUO:
Teremos A(:.2)
= 42 = 16 agrupamentos,
a saber, teremos,
{aa, ab, ac, ad, ba, bb, be, bd, ca, eb, cc, cd, da, db, de, dd}
C",r =.C,. 11 -
I. 1(11 .
li! _
I"
)1
EXEMPLO 8.5: Com as quatro primeiras letras do alfabeto, quantas combinaes de dois elementos podemos formar? SOLUA0:
Teremos
C:
OBSERVAES:
I I
1. A: = _1_'_=
(/l-li)!
_11.
01
.1*
= 11\ = 1'"
---=1.
li!
2. A "
r __
---=1.
111
'1* ('r
11
(l1-r)!
r!(l1-r)!
r
11
3. Cr=
11
Cr
+ _(_11_-_1_),
I"!(I1-I"-I)'-
r(_I_l-_I )_! +_(1_1 )_(_1I_-_1_)! ('_I -_I )_,_1"_+_1_1 -_I" __ ( -_'_.) I"!(II-I")! I"!(II-r)!
11-1
11\
4.
- I"!(II-I")!
C;,
46
11. INTRODUO
que pretendemos, nesta unidade, apresentar alguns modelos tericos de distribuio de probabilidade, aos quais um experimento aleatrio estudado possa ser adaptado, o que permitir a soluo de grande nmero de problemas prticos.
espao amostrai associado a E. Um funo X, que associe a cada elemento <OE n um nmero real, X(<o), denominada varivel alealria.
Q wl
y
n UI11
'2
EXEMPLO
1.1: Suponha que duas moedas sejam lanadas e observamos a sequncia de caras e coroas obtidas. Considere o espao amostrai associado a esse experimento. Isto ,
n=
onde
de
cara
coroa,
respectivamente. Definamos a varivel aleatria da seguinte forma: X o nmero de caras obtidas nas duas moedas. Da, X(Ca,Ca) = 2; X(Ca,Co) = X(Co,Ca) = 1 ; X(Co,Co) = O. uma exigncia fundamental de uma funo unvoca: A cada <O n corresponder exatamente um valor X(w). Diferentes valores de w E podem levar ao mesmo valor de X. Como pode ser visto no exemplo acima, onde vimos que X(Ca,Co) = X(Co,Ca) = 1. espao Rx, conjunto de todos os valores possveis de X, algumas vezes denominado contradomll/l1o. De certo modo, poderemos considerar Rx como um outro espao amostraI. O espao amostrai (original) n corresponde ao resultado ( possivelmente no numrico) do experimento, enquanto Rx o espao amostrai associado varivel aleatria X, representando a caracterstica numrica de interesse. Se tivermos X( <O)= <o, teremos
.o. = Rx .
47
n. Seja X uma varivel aleatria definida em n e seja Rx seu contradomnio. Seja B um evento definido em relao a Rx, isto , B c Rx. Ento, define-se A como
A
{co
E D..
1 X ( (O)
E H}
Assim, A ser constitudo por todos os rcsultados em .o, para os quais X (liJ) E B. Neste caso, diz-se que A e B so eveutus equivalentes. Como pode ser visualizado na seguinte figura: Q
X(wti
n
n?
J que X(Ca,Co) = X(Co,Ca) = I se, e somente se, X(ro)=I, temos que A = {(Ca,Co),(Co,Ca)} equivalente a B.
Definio 1.3: Seja B um evento no contradomnio Rx. Define-se P(B) da seguinte forma 1'(B) = P(A), onde A = {w E.oI X(o) EH}.
Em outras palavras, como B equivalcntc a A em igual probabilidade de A.
n, a probabilidade
de B
Uma vez que as probabilidades associadas aos vrios resultados (ou eventos) no contradomnio Rx tcnham sido determinadas (mais precisamente, induzidas), ignoraremos frequentemente o espao amostrai original .o, que deu origem a essas probabilidades. O
48
-----,
fato, de que essas probabilidades sejam determinadas por uma funo de probabilidade definida sobre o espao amostrai original n, passa desapercebido' quando eslamos interessados em estudar os valores da varivel alealria X.
Definio 2.1: A varivel X dita discreta se o nmero de valores possveis de X, isto , o contradomnio Rx , for um conjunto finto ou enumervel. EXEM PLO 2.1: Consideremos um lole Colll 4 peas, das quais 2 so defeituosas, retiremos ao acaso duas peas, com reposio. Seja Ento, D e
= a pea
defeituosa,
P = a pea perfeita.
n ={DD,
X(ffi)
{DD} O
{OP,PD} 1
{PP} 2
Definio 2.2: Seja X uma varivel aleatria discreta, ento X pode assumir os valores XI, X2, .... Chamaremos de fuulo de probabilidade da varivel aleatria X a funo que a cada Xi associa sua probabilidade de ocorrncia, ou seja, P(X = Xi) = P(X(r'v) = X;) = p(X;), tal que: a) O S; p(X; ) S; 1
u.
.\
b) LP(x,)
;=1
=1
2.2: Consideremos a varivel aleatria do exemplo anterior, ento: P(X = O) = 1/4, P(X = 1) = 1/2, P(X = 2) = 1/4, P(X S; 2) = per!) = I e P(X < O)=P(I\I) = O
2
EXEMPLO
= i)
~ 1, para i = 0,1,2 e
L P(X
;=0
= i) = 1
41)
A funo de probabilidade pode ser representada por tabela, grfico ou frmula. Para o exemplo anterior, temos: Tabela: P(X= Grfico:
p(x 1
X; Xi)
O 1/4
I 1/2
2 1/4
1/2 1/4
o
Frmula: p(xi)
= (2 ) .!.,
Xi
Xi
= 0,1,2
EXEMPLO
2.3: {j"mpar de dados lanado. Seja X a varivel aleatria que associa a cada ponto (a,b) de n a soma de desses nmeros, isto , X(a,b) = a + b. Determine a funo de probabilidade de X. O espao amostrai Q formado de 36 pares ordenados de nmeros entre I e6: Q= {(1,1),(1,2), ..... ,(6,6)} X
SOLUO:
Ento,
uma
varivel
aleatria
em
com
o contradomnio
Rx
p(Xj)
1136T2136
~~
4 ... ~ 3i36T4/36
6~
8_~
10.~
5i36T6/36
5i3614/36
3136l2/36
12 1/36
Obtemos, por exemplo, p( 4) = 3/36, pois (1,3), (2,2) e (3,1) so os pontos de cuja soma das componentes 4~ ento p(4) = P(X = 4) = P({(l,3),(2,2),(3,1)})
=
236
50
acumulada da varivel
P(X ~ x)
= Lp(xJ
x,~.l'
EXEMPLO
2.4: Considerando
acumulada.
a funo
dc distribuio
SOLUO:
F(O) = P(X ~ O) = 1/4 F(l)
F(2)
= P( X = J)(X
~ 1) = 3/4
~ 2)
ento,
O, se x < O F(x)
1/4, se O ~ x < )
3 / 4, se 1 ~ x < 2
1, se x 2:: 2
.
e
(.
1
~ F(x2)
3. F no decrescente, isto , se
XI ~
51
4. A magnitude F(x_)
de cada
salto
onde
5. F( x _)
6. F(x+)
Definio 3.1: Uma varivel aleatria X contnua se existir uma funo f, denominada
fUllo de densidade seguintes condies:
1. f(x)
2
de probabilidade
O, para todo x
=I
Rx
2.
r:f(;'ptx
-00
Ob.'ien'alies:
1. P(a ~ X ~ b) representa
de probabilidade
= xo) = rOf(x)dx = O xo
nula,
3. Como a probabilidade de X assumir valores em pontos isolados ento: P(a ~ X::; b) = P(a::; X <b) = P(a < X ::;b) = P(a < X <b)
EXEMPLO 3.1:Suponha que X uma varivel aleatria contnua com a seguinte fdp: 2X, O < x < I,
f( x)
= { O; para
a) Mostre que f(x) uma fdp. b) Calcule P(X $' 1/2) c) Calcule P(X::; 112/1135. X ::;2/3)
SOLUO:
a) Evidentemente,f(x)
Rx e f~2xdx = x 21~ = 1.
52
1/2
diretamente
condicional,
J(2x)Jx
) _ P( 1/ 35, X ~ 1/2) _1/3 - P(1 / 3 ~ X ~ 2/3) - lfl3 (2x)Jx
1/3 _
-1/3-\2
5/36 _ 5
Da definio 2.3, a funo de distribuio acumulada, para o caso continuo dada por: F(x) = r..,f(s)d~' EXEMPLO 3.2: Sejaf(x) como definida no exemplo 3.1. Calcule a funo de distribuio acumulada e representc graficamcnte esta funo.
SOLUO:
F(x)
O, se x < O,
f(2s)d\'
= Xl,
se
x < I,
[1: se
Graficamente, F(x)
x 2: 1
.A\
(1,1)
/-'X
Obsen'ao:
Seja F(x) a funo de distribuio acumulada contnua X, ~om fdp 1(>.), Ento f(x) seja derivvel.
=~
F(x),
EXEMI)LO
3.3: Suponha que a varivel aleatria X tenha funo de distribuio acumulada F dada por: O, se x < O F(x)
x, se O ~ x < 1
I, se x;::: I
Calcule a fdp de X.
53
= I, para
f(x)
4. ESPERANA
MATEMTICA
E VARINCIA
Nos modelos matemticos aleatrios, que temos considerado, os parmetros podem, tambm, ser empregados para caracterizar a distribuio de probabilidade. A cada distribuio de probabilidade, podemos associr certos parmetros, os quais fornecem informao valiosa sobre a distribuio, tal como a declividade de uma reta fornece informao importante sobre a relao linear que representa. Um dos parmetros mais importantes dado na definio abaixo.
Defi!,io 4.1: Seja X uma varivel aleatria discreta, com valores possveis XI, ..., XII, ...
Seja p(Xj) = P(X=Xi), i=1,2, ...,n, ... Ento, o valor esperado, eWeralla matemtica de X, valol' mdio de X, ou expectncia de X, denotado por E(X) definido como
w ~
E(X) = LX;p(x;),
;=1
se a srie LX;p(x;)
;~I
se 'Llxilp(x;)
;=1
'"
<'00 .
Seja X uma varivel aleatria continua com fdp f(x). O valor e.\perado de X
definido como
E(~) Notao: E(X) = J1
=
<
00.
SOLUA0: L(X)
= LX;p(x;)
;=1
= 0*-+
4
1*-+2*- = 1. 4 4
Isto representa que ao retirarmos duas peas do lote, esperamos, em mdia, vir uma pea defeituosa.
54
~--
. SOLUA0: E(X)
= K.
uma varivel aleatria X por uma constante, sua mdia fica
2. Multiplicando-se
Kh'(X)
3. A mdia da soma ou da diferena de duas variveis aleatrias , respectivamente, a soma ou diferena das mdias.
E(X:t Y)
= E(X):t
E(Y)
Obsen'ao: Note que toda funo de uma varivel aleatria X tambm uma varivel 2 aleatria. Podemos, portanto, falar na esperana de X , 2X + I, dentre outras. Teramos, por exemplo, a esperana de X dclillida como:
2
E(X2)
= LX;
;=1
+OO
p(x;),
E(X2)
=f
-00
(x2
f (xd-c
Notao:
V(X)
(52
Observao: 1. A varincia de uma varivel aleatria, uma medida que d a idia de disperso dos valores da varivel, em relao ao seu valor esperado. 2. A expresso da varincia na definio acima pode ainda ser escrita como:
V(X) = E(X2)
[i';(X)f
55
..
DA VARINCIA
=O
por uma constante sua varincia fica
2. Multiplicando-se uma varivel aleatria multiplicada pelo quadrado da constante. V(KX) = K2V(X). 3. Somando-se ou subtraindo-se altera,
V(K:f: X) = V(X)
4. A varincia da soma ou da difercna de duas variveis aleatrias dada por: . V(X:f: 1') = V(X) + V(Y):t 2*cov(X,Y) onde cov(X,1')
OJJS.: Quando
= EU X
- E(X)XY
- E(Y)]}
= E(XY)
- E(X)E(Y) E(T)
X e Y so variveis aleatrias
indepcndentes,
= E(X)I~(Y),
consequentemente,
= V(X)
+ V(Y)
Notamos que se uma varivel aleatria medida em certa unidade, a varincia dessa varivel expressa no quadrado dessa unidade Para fins de comparao e facilidade de interpretao introduz-se o conceito do desvio padro da varivel aleatria, dcnotado por a( X), que definido como a raiz quadrada positiva da varincia, isto , a(X)
= Ja
(X)
EXEMPLO 4.3: Calcule a esperana matemtica c a varincia da varivel aleatria X, '., cuja fdp dada abaixo.
K,
(x)
= { O,
SOLUO: Para que [(x) satisfaa a condio (2) da dcfinio 3.1, temos que
J.a
b-a
mesma definio.
56
Agora, E(X) f -
Ix--dx (h-a)
b ]
li
(b-a
')
2 ,b
2 I,. - 2(b-a)
2(b-a)
Da, V(X )
V(X)
= 4h +40
= b +a
3 2 ,,,
4 -2ab
= (b _a)2
2 +4ah-30 12
-3h
-6ah
12
5.ALGLJMAS I>ISTIUIJUICES
DE l'I{OBAIJILlJ)ADE
Dentre as funes de probabilidade, ser'o abordados algumas especiaIs. Apresentaremos inicialmente as distribuies discretas mais importantes e finalizamos esta seo com a distribuio contnua mais utilizada na teoria da probabilidade, a distribuio Normal. 5.1. Distribuio de 8e . oulli Suponha que realizamos um experimento E, cujo resultado pode ser observado e classificado como sucesso ou fracasso, caso o evento que nos interessa ocorra ou no, respectivamente. Associaremos p, a probabilidade de sucesso, ao evento que nos interessa e I-p
=
X-
P(X ~Xi)
O l-p
1 P
=
p(J-p),
que so as pnnclpals
57
..J
EX~MPLO
5.1:Seja o experimento E: "Lanar um dado e 'observar a tce superior". Defina o evento: "o nmero mltiplo de 3" e a varivel X definida como o nmero de sucesso. Determine a funo de probabilidade de X, calcule a esperana e a varincia.
SOLUO:Temos
= ~, 6
logo 1- P
=4. 6
I
=2
9 Binomial
4/6
2/6
=.!-
e Var(X)
5.2. Distribuico
Vamos considerar experimentos que satisfaam as seguintes condies: 1. O experimento deve ser repetido, nas mesmas condies, um nmero finito de vezes
(n).
2. As provas repetidas devem ser independentes,
resultados das sucessivas. 3. Em cada prova deve aparecer um dos possveis resultados: sucesso ou fracasso. 4. No decorrer do experimento, a probabilidade p do sucesso e a probabilidade q (q=l-p) do insucesso manter-se-o constante. S. Definimos a varivel aleatria discreta Y como sendo o nmero de sucessos nas realizaes. Ento Y = X + Xz+ ... +XII, onde cada Xi, (i
J 11
P(Y
= k) =",(11) P k
(1-: p)
' n-k
,k =0,1, ...
11
pois, para Y=k teremos observado k sucessos, cada um com probabilidade consequentemente (l1-k) fracassos, cada um com probabilidade (l-p).
fJ
Notao: Y - B(II,p), que cquivalentc a dizer que Y tem uma distribuio Binomial com , parmetros
11
e p.
A mdia da Binomial :
E(Y)
= I1p,
+ X2 + ... +X,,)
= V(X)
= I1fJ(l-
17)
EXEMPLO
5.2:Dois times de futebol, A e B, jogam entre si 6 vezes. Suponha que as probabilidades de A ganhar, perder ou' empatar um jogo, so as mesmas, e permaneam constante durante as 6 partidas. Encontre a probabilidade do time A ganhar 4 vezes e calcule a esperana. e a varincia. Seja X o nmero de vezes que o time A ganha. 6, P
SOLUO:
Temos que
11 =
= -,
ento,
P(X = k) = k
6)(1)"( '3
1-
1)(6-k) '3
,k
= 0,1,2,3,4,5,6
1 4 15*8"1*9' 20
= 243
E a esperana E(X)
= 6*J. = 2, 3
= 6*J.*~3 = ~ 3 3
5.3. Distribuio
de Poissol1
Uma varivel aleatria X, assumindo os valores 0,1,2, ... tem distribuio de Poisson Com parmetro (IVO) e denotaremos por X-P(), quando a probabilidade da varivel aleatria assumir um valor k, k fixado, dada por: .
e-. "
P(X = k) = --,k
k!
= 0,1,2, ....
Var(X)
= ,
onde lembramos
o fato que
L-. = e k!
k=O
'" "
obtido pelo desenvolvimento da srie de Taylor nas vizinhanas de zero. Esta distribuio infinita enumervel' ocorre em muitos fenmenos naturais, tais como o nmero de chamadas telefnicas por minuto em uma central telefnica, o nmero de erros de impresso por pgina em um texto e o nmero de partculas a emitidas por uma substncia radioativa. EXEMPLO 5.3: Numa fbrica existem vrias mquinas de um certo tipo. Depois de muitas observaes chegou-se concluso que o nmero de mquinas que se avariam em cada ms uma varivel aleatria com distribuio de Poisson com parmetro 3. Qual a probabilidade de que em um determinado ms se avariem 7 ou mais mquinas?
59
SOLUO: P(X;:: 7) =
L_e *=7
'"
-33k
=
0,0335
k!
Em muitos estudos estatsticos, h muitas vezes necessidade de considerarmos a ocorrncias de eventos casuais que se processam a longo do tempo, ou espao. Por exemplo, a) Chegada de chamadas telefnicas a uma central telefnica. b) Nmero de erros de impresso em um texto. c) Nmero de carros que passam por um cruzamento durante um intervalo de tempo t. d) Chegadas de clientes a um caixa de banco. Observamos, ento, que h uma varivel "t", a qual comporta-se de modo que enquanto "1" aumenta a probabilidade de sucesso tende a aumentar. , Faremos algumas hipteses para construir um modelo para estas situaes. a) Eventos definidos em intervalos disjuntos so independentes. b) A distribuio do nmero de ocorrncias em qualquer intervalo depende apenas do comprimento do intervalo e no dos seus extremos. c) Em intervalos de mesmo comprimento, as probabilidades de ocorrncia de um mesmo nmero de sucessos so iguais. d) Em intervalos muito pequenos, a probabilidade de ocorrncia de mais de um sucesso zero. Sob estas hipteses, pode-se mostrar que a probabilidade intervalos de tempo t, dada por: de ocorrncias em
P(X/
= k) =
e-(.t/\./)*
k!
,k
= 0,1,2, ....
O nmero mdio de ocorrncias em' um intervalo t dado por: t.'(X) = I e a varincia da distribuio tambm I . Observe que quando 1= 1, recamos na expresso anterior (P(X=k). EXEMPLO 5.4: Em mdia h duas chamadas por hora num certo telefone. Calcule a probabilidade de no haver chamada em 90 minutos.
=-=2
1
e
e-3O (3,0)0
!=--
90 _ 15'
,
60
.~ = O) = ----
O!
= 0,04979
60
Apresentaremos
5.4. Distribuidio Normal Muitas das variveis analisadas na pesquisa scio-econmica aproximam da distribuio normal. Seja uma varivel aleatria contnua que assume valores reais. Dizemos que X tem distribuio normal com parmetros ~ c (52 onde ~ = E(X) e (52 = Var(X), e dCI~otarclllos X - N(/l,O'\ se sua funo de densidade de probabilidade for da' forma: j(x)= I ~e
2Jra
_.I,(x"I')2 2 l<1
correspondcm ou se
,-00
2 00,a
>0,
I.
.\
\.
/ /
--_./
PROPRIEDADES
\\\
\
//
j.J.-O
jJ.
"'"
"--
~'""
""""---
j.J.+O
DA CURVA NORMAL:
1. unimodal, isto , f(x) tem um ponto de mximo, cuja abscissa x = /l. Esse ponto situado no meio da distribuio aquele em que coincidem os valores da mdia, moda e mediana. 2. f(x) simtrica com relao reta x = 1-'. 3. f(x) tem dois pontos de inflexo, cujas abscissas so x = p- a e x = fJ -I a 4. f(x) tem uma assntota: eixo x, isto , a partir do topo a curva cai gradativmente at formar as caudas, que se estendem indefinidamente, aproximando-se cada vez mais da linha base, sem entretanto, jamais toc-la. 5. Fixando-se a mdia, verifica-se que o achatamento da curva est diretamente ligado ao valor do desvio padro 0', ou seja, quanto maior for o desvio padro mais achatada a curva como pode ser vista na figura abaixo.
(,1
...
. J
f(x)
..
-_.-_ ..-.-
__._./'
/
\ "'. ~
'",-
._--_--_
..
o=
..
Para o clculo das probabilidades surgem dois problemas: 1. integrar a funo de densidade 2. tabelar os dados, j que -00 < I' < 00 e
0-
> O.
A soluo para este problema surge fazendo uma mudana na varivel. A mudana :
z=
Ento: (Z) =
X-p
o-
E( X-I-') oo-
= ~(E(X)
o-
- p) = ~CLJ- p)
= O,
e
Var(Z) = var(X -
p) = _l-Var(X) a
2
Ento, Z ,- N(O, 1), isto , a varivel aleatria Z tem distribuio normal padro, reduzida ou Standard e sua fdp dada por:
'I.
fez)
= J'2lf' e
._.1
z2
-00
<z <00
A curva normal padro conserva as mesmas propriedades listadas anteriormente. Atravs de mtodos de integrao numrica podemos calcular integrais da distribuio acima, e de fato P(Z::; x) tem sido tabelada extensivamente. A funo distribuio acumulada da distribuio normal padro denotada por cjJ(x), isto , 1 cjJ(x) = r;::..,;2lf
(e-
/2
)dz ,
_'"
62
Podemos utilizar a. tabulao da funo .r/J. a fim ~e calculrmos a P(a ~ Z ~b), visto que P(a ~ Z ~ b) = P(Z ~ h) - P(Z ~ a) = r/J(h)- q,(a). A utilidade notvel da tabulao acima devida ao fato de que, se X tiver qualquer distribuio normal N(~l,(J2), a funo tabelada r/J pode ser empregada para calcular probabilidades associadas a X. Simplesmente empregaremos a transformada para a varivel Z. Consequenteme~te, P(a5.X~b)= p
( Z5.-;;- - fi) a
=ljJ -;;-
1. Seja Z uma varivel aleatria com distribuio normal padro. Encontre: a) P(O ~ Z ~ 1,42) b) P(-0,73 ~ Z ~ O) c) P(-1,37~Z~2,01) SOLUO: a) P(05. Z 5. 1,42) = r/J(1,42)- r/J(O)= 0,9222 - 0,5 = 0,4222 b) P(-0,73 ~ Z ~ O) = r/J(0)-ljJ(-0,73) = 0,5-0,2327 = 0,2673 c) P(-1,37 ~ Z ~ 2,01) = ljJ(2,01)-ljJ(-1,37) = 0,9778-0,0853 d) P(0,65 ~ Z ~ 1,26) = r/J(1,26)- ljJ(0,65) = 0,8962 - 0,7422 e) P(Z? f)
d) P(0,65 ~ Z ~ 1,26)
e) P(Z? f)
1,13)
p(IZI ~ 0,5)
= 0,8925
= 0,1540
p(IZI ~
1,13) = 1- P(Z < 1,13) = 1- ljJ(I,13) = 1- 0,8708 = 0,1292 0,5) = P( -0,5 ~ Z ~ 0,5) = ljJ(0,5)- ljJ(-0,5) = 0,6915 - 0,3085 = 0,3830
2. Seja Z uma varivel aleatria com distribuio normal padro. Determine o valor de I
se:
a) P(Z 5. ') = 0,7967 b) P(t ~ Z ~ 2) = 0,1000 SOLUO: a) P(Z ~ I) = 0,7967 => r/J(I) = 0,7967 => t = 0,83 b) P(Z > ,) = 0,9099 => 1- r/J(I) = 0,9099 => ljJ(I) = 0,090 I=> t = -1,34 P(O ~ Z ~ t) = 0,4236 => 4>(1) -4>(0) = 0,4236 => 4>(1) - 0,5 = 0,4236 => r/J(t) c) P(O ~ Z ~ t) d) P(Z > I)
= 0,4236
= 0,9099
= 0,9236
c) t = 1,43 P(I ~ Z ~ 2) = 0,1000 => ljJ(2) - ljJ(t) = 0,1 => 0,9772 -4>(1) = 0,1 => ljJ(1) = 0,8772 => d)
,= 1,16
63
3. Seja X uma varivel aleatria com distribuio N(2;0,16). Calcule: a) P(X > 2,3) c) P(X
$
t)
= 0,48
d) P(X > t)
= 0,34
p( XO,4 2 s; 2,3 ,-4 2) = 1- "'(O 75) = 1- O 7734 = 02266 O X::; 2,1) = p( 1,8- 2 s; X - 2 2,1 - 2) = })(-0,5::; Z 0,25) = 4J(0,25) - fjJ(-0,5)
=
1-,
Y' , , , $ $
0,4
0,4
0,4
c) P(X
-.
t0,4
=> t
1,98
P(X> d)
f/J --
= 0,66 => P ( --
X - 2 t-2)
$ --
0,4
0,4
= 0,66
t( 0,4
2)
4. Os salrios mensais dos operrios industriais so distribudos normalmente, em torno da mdia de R$ 50,00, com desvio padro de R$ 4,00. Encontre a probabilidade de um operrio ter um salrio semanal situado entre R$ 49,00 e R$ 52,00.
::; 52 - 50)
P( -0,25::; Z
0,5)
= fjJ(0,5) -
fjJ(-0,25)
, pois, de se esperar que, em mdia, 29,02% dos operrios tcnham salrios entre
R$ 49,00 e R$ 52,00. 6. REFERNCIAS BIBLIOGRFICAS aplicaes estatstica. Livros tcnicos Cicntficos
64
...'
Dizemos que em determinadas ocasies, h de se proceder a coleta de dados diretamente da origem, isto , dos sujeitos com quem pretendemos realizar determinado estudo. Entretanto, quando impossvel se observar toda a populao em que desejamos estudar o fenmeno, recorremos s tcnicas de amostragetri, em que nos Iilnitamos a uma
amostra do Universo.
Damos incio a determinao de uma frao da populao, que ir fornecer informaes que sero generalizadas para a populao. Para que esta generalizao seja possvel, os integrantes da amostra devem ser escolhidos adequadamente. Existe a necessidade de definIrmos o conjunto de elementos para os quais devem ser observadas e/ou mensuradas as variveis de interesse dentro da questo ou problema estabelecido. Vamos, ento, definir alguns termos necessrios. CONCEITOS POPULAO BSICOS: OBJETO:
a populao total de interesse sobre a qual desejamos obter informaes. Por exemplo, as peas produzidas por uma fbrica. POPULAO DE ESTUDO: o cOl~unto de indivduos de interesse especfico. Ex.: as peas que permanecem no estoque. CARACTERSTICA POPULACIONAL: Este o aspecto da populao que interessa ser medido. Ex.: O dimetro das peas. UNIDADE AMOSTRAL: Deve ser definida de acordo com o interesse do estudo, podendo ser uma pea, um indivduo, uma famlia, uma fazenda, etc. A escolha deve ser feita no incio da investigao. ESTRUTURA AMOSTRAL: a fonte do nosso estudo, ou seja, o conjunto de unidades amostrais. Ex.: O conjunto das peas selecionadas. VANTAGENS E DESVANTAGENS DA AMOSTRAGEM CENSO EM RELAO AO
VANTAGENS: . a)Economia: evidente que ao utilizarmos apenas uma frao de uma populao, estaremos economizando dinheiro, material, pessoal, etc. b)Rapidez: Quando desejamos urgncia nas informaes a economia de tempo ser indiscutvel. c)Maior amplitude do Universo: Como mesmo custo do CENSO, temos condies de pesquisar uma rea muito maior. d)Mair exatido: Num planejamento em que utilizamos amostragem, consideramos que o pessoal a ser utilizado mais treinado e especializado, concorrendo para que os resultados encontrados sejam mais detalhados, o que no ocorre com o CENSO.
65.
.I
DESVANTAGENS: Em uma populao com nmero menor que 100 (ccm) elementos, a utilizao de amostragem no ser vantajosa. Neste caso procederemos o Censo. A principal desvantagem seria a de que no proporciona informao sobre todos os elementos da populao. TIPOS DE AMOSTRAGEM: AMOSTRAGEM I)ROBABILISTICA: o proccdimcnto atravs do qual cxiste uma probabilidade conhecida e diferente de zero para cada elemento da populao vir a ser sc1ecionado para constituir a amostra. Tambm dita amostragem aleatria. AMOSTRAGEM NO PROBABILSTICA (ou NO ALEATRI): Quando, processo de seleo, no existe nenhum mecanismo de probabilidade associado. no
PROCEDIMENTOS POPULACES
Segundo a definio de amostragem probabilstica, existe a suposio de sorteio com regras bem determinadas, cuja realizao s ser possvel se a populao for finita e totalmente acessvel. Essa amostragem probabilstica a melhor garantia da representatividade da amostra, pois o acaso ser o nico responsvel por eventuais discrepncias entre a populao e a amostra. POPULAO FINITA: um conjunto de N elementos, onde N um nmcro natural inteiro. AMOSTRAGEM SEM REPOSIO: um procedimento de amostragem tal que cada elemento selecionado no retoma populao at que o tamanho pr-definido para a amostra tenha se completado. Os principais tipos de amostragens~probabilsticas I - AMOSTRAGEM CASUAL SIMPLES SIMPLES (A.A.S). so: ALEATRIA
(A.C.S) ou AMOSTRAGEM
Dada uma populao finita com N elementos consideremos a seleo de 11 < N elementos para constituir uma amostra, scm reposio. Pode-se demonstrar que o nmero total, de amostras possveis, nestas circunstncias :
Cl1 N
Definio 1.1:
REPOSIO,
'
U"m procedimento de amostragem dito CASUAL SIMPLES, SEM se cada uma das possveis amostras tm a mesma probabilidade de seleo.
66
A partir da definio acima, possvel demonstrar que, cada' elemento, na populao, tem a mesma probabilidade de ser selecionada na amostra. Por isso, tal fato tem :sido utilizado para caracterizar uma amostragem casual simples. a) PROCEDIMENTOPR TICO PARA SELECIONAR UMA A.C.S.
Para poder distribuir, a cada elemento na populao, a mesma probabilidade de ser selecionado, sem reposio, necessrio, inicialmente, estabelecer a identificao de cada elemento atravs de um rtulo. Isto constitui a operao de listagem da populao de estudo. Em geral, a listagem estabelecida identificando, cada clemento na populao, por um nmero. Por exemplo, se a populao tem tamnho N = 350 ento, os' elemcntos so identificados pelos nmeros.: 001~ 002~ 003~ ..... ~348; 349; 350. Uma vez listada' a populao podcr-se-ia utilizar' procedimentos mecnicos para selecionar a amostra, digamos, de tamanho /I :::;;o 10. Poderamos utilizar, por exemplo, uma roleta (no viciada) com nmeros de 001 a 350 e gir-la 10 vezes anotando os nmeros de parada da roleta (e excluindo as possveis repeties). Os elementos populacionais rotulados com tais nmeros seriam os componentes da amostra. Alternativamente, poderamos colocar 350 bolas numeradas de 00 I a 350, em uma urna e selecionar 10 bolas numeradas. Outros procedimentos mecnicos poderiam ser imaginados. No entanto, tais procedimentos so, operacionalmente complexos principalmente para grandes populaes. A questo resolvida, de modo mais simples, atravs do uso da TABELA DE DGITOS ALEATRIOS ou pela gerao de nmeros aleatrios em algum programa computacional. A tabela constituda de tal forma que cada um dos dgitos de O a 9 tem a mesma probabilidade de aparecer, em uma' dada posio, que qualquer outro, na referida tabela.
11- AMOSTRAGEM SISTEMTICA. realizada quando os elementos da populao esto ordenados e a retirada dos elementos da amostra feita periodicamente, ou sistematicamente.
Suponhamos que se deseja selecionar uma amostra de tamanho /I de uma populao finita de tamanho N Suponhamos que o quociente (N / /I) = K seja um nmcro inteiro. Uma amostra sistemtica, de intervalo K, consste em selecionar I a cada K elementos da populao de interesse. O carter aleatrio ou: casual dado pela seleo do INCIO CASUAL. Este determinado selecionando-se, aleatoriamente, um nmero entre 1 e K. Este nmero corresponde ao primeiro elemento selecionado para compor a amostra. Os demas so obtidos adicionando-se K ao incio casual. Por exemplo: K = 5. Incio casual 3. Ento, os elementos selecionados sero os elementos numerados pelos nmeros 3, 8, 13, 18, ... A amostragem sistemtica extremamente simples para ser operacionada em trabalho de campo, razo pela qual, em muitas circunstncias utilizada em substituio da amostragem aleatria simples.
lU - AMOSTRAGEM ESTRATIFICADA.
A estratificao de.uma populao correspondelltea uma subdiviso da mesma, em subpopulaes, de tal forma que haja a maior homogeneidade possvel dentro e maior
(,7
heterogeneidade
constitui
um estrato. Um exemplo prtico disso ocorre ao supor que um tipo de opinio pblica de uma cidade pudesse depender da renda do opinante, isto , ser inOuenciado pelo bairro de residncia do opinante. Uma amostra casual simples, entre a grande quantidade de amostras possveis, poderia favorecer o aparecimento de todos os opinantes de um bairro s e nenhum dos demais, produzindo um vis nos resultados. Para evitar tal fato e garantir a presena de elementos de todos. os bairros ligados rea de inOuncia em questo, podemos subdividir a populao por bairro de residncia e, ento, selecionar uma amostra aleatria simples ou uma amostra sistemtica, dentro de cada bairro. Dizemos, neste caso, que o bairro a VARIVEL DE ESTRA TLFICAO, ou que a POPULAO foi ESTRATIFICADA POR BAIRROS. Sempre que em uma investigao existe uma ou mais variveis que podem interferir nos resultados da varivel sob anlise conveniente controlar o efeito de tais variveis tomando-as como variveis de estratificao.
IV - AMOSTRAGEM
POR CONGLOMERADOS
Uma amostragem por conglomerado uma amostra aleatria simples na qual cada unidade amostrai um grupo, ou congloillerado, dc elemcntos. Este esquema amostrai utilizado quando h uma subdiviso da populao em grupos que sejam bastante semelhantes entre si, mas com fortes discrepncias dentro dos grupos, de modo que cada um possa ser uma pequena representao da populao de interesse especfico. A esses grupos dar-se o nome de CONGLOMERADOS. O primeiro passo para se usar este processo especilicar conglomerados apropriados. Os elementos entre os conglomerados devem ter caractersticas similares. Como regra geral, o nmero de elementos em um conglomerado deve ser pequeno em relao ao tamanho da populao, e o nmero de conglomerados razoavelmente grande. Tanto no caso da. amostragem estratificada, como no da amostragem por conglomerado, a populao deve est dividida em grupos. Na amostragem estratificada, entretanto, seleciona-se uma amostra aleatria simples dentro de cada grupo (estrato), enquanto que na amostragem por conglomerado selecionam-se amostras aleatrias simples de grupos (conglomerados), e todos os itens dcntro dos conglomerados selecionados faro parte da amostra. " Para o exemplo da amostragem nos bairros da cidade, teramos 'os bairros como ESTRATOS e as CASAS como CONGLOMERADOS. Uma vez feita a escolha do Bairro, seleciona-se ao acaso as casas que faro parte da amostra. Uma vez escolhida a casa, todos os seus moradores devem fazer parte da amostra. Desta forma, existe uma homogeneidade entre as casas do mesmo bairro, devido s condies scio-ecnmicas que levaram seus moradores para l, e uma heterogeneidade entre os moradores da casa em termos de idade, sexo, renda, nvel de instruo, etc. A amostragem por conglomerado recomendada quando: a) Ou no se tem um sistema de referncia listando todos os elementos da populao, ou a obteno dessa listagem dispendiosa~ b) O custo da obteno de informaes crcsce com o aumcnto da distncia entre os elementos.
68
Obsen'uo: .
A inferncia estatstica embasada em conceitos e resultados da Teoria da' Probabilidade. Por outro lado, antes de iniciar qualquer anlise dos dados atravs dos mtodos estatsticos da estatstica indutiva, preciso organiz-los, o que feito com as tcnicas da estatstica descritiva. Um outro problema que surge paralelamente o da escolha da amostra, pois nossas concluses, referentes populao, vo basear-se nos. resu.Jtados dessa amostra. Certos cuidados devem ser tomados no processo de obteno dessa amostra, ou seja, no processo de "amostragem", pois muitas vezes erros grosseiros e concluses falsas ocorrem devido a falhas' nesse processo. .
...
abaixo, onde temos: i. Uma populao X, com um certo parmetro e de interesse. ii. Todas as amostras retirdas da populao, de acordo com um certo procedimento. iii. Para cada amostra, calculamos o valor t da estatstica 1'. iv. Os valores de t formam uma nova populao, cuja distribuio recebe o nome de distribuio amostrai de T. Populao Amostra
-- (t)
CJ
8
(,\)
..J
Vejamos
um exemplo
simples
para aclarar
um pouco
melhor
o conceito
de
distribuio amostraI. EXEMPLO 2.1: Uma populao consiste de 5 elementos (N = 5): 2, 3, 6, 8 e 11. Considere todas as amostras de tamanho 11 = 2 que dela podem ser retiradas. Determine todas as possveis amostras e calcule as respectivas mdias e varincias: a) com reposio; b) sem reposio. SOLUO: a) Com reposio: Amostras Mdias Varincia Amostras Mdias Varincia
2;2 2
O
2;6 4 8 8;2 5 18
2;8 5 18
8;3
3;3
3 O
3;6
4,5 4,5
6;3
6;6
4,5 4,5
6
O
6;8
7
5,5 12,5
32
b) Sem reposio: Amostras Mdias Varincia Amostras Mdias Varincia 2;3 2,5 0,5 6;8 7 2
2'6 ..z. 2'8 ..z.
4 8
6'11
5
18
8'2 ..z.
2'11
3;6 4,5
3;8 5,5
3i..! I
7
6'2 ..z.
4
-'4,5
4,5
11'8
6;3
4,5
8; 1I
12,5
11 ;2
32
I li3
-'
8,5
12,5
5 18
Ui>
8,5
-'
7 2
9,5
6,5
4,5
40,5
7 32
9,5
12,5
4,5
Se, por exemplo, a quantidade populacional de interesse for a mdia, a grandeza estatstica adotada ser a mdia amostrai (X). Neste caso, a distribuio amostrai ser denominada Distribuio AI11(}s,,.~1 Mdia. da
-
/2.1.DISTRIBUICO
AMOSTH.AL
DA MDIA
Vamos estudar agora a distribuio amostrai da estatstica X, a mdia da amostra. ' Consideremos uma populao identificada pela varivel X, cujos parmetros mdia populacional f.J = E (X) e varincia populacional (Y 2 = VaI' (X), so supostamente conhecidos. Vamos retirar todas as possveis amostras casuais simples de tamanho 11 dessa populao, e para cada uma calcular a mdia X. Em seguida, construamos a distribuio amostrai e estudemos suas propriedades. Ilustremos com os dados do exemplo 2.1.
70
EXEMPLO 2.2: Calcule a mdi~ e a varincia da populao do exemplo 2.1. Construa a distribuio de X para todas as amostras de tamanho 11 = 2, retiradas da populao X do excmplo 2.1. a) Com rcposio b) Sem reposio.
SOLUO:
A populao {2,3,6,8,11} tem mdia a) Com reposio:
fi
= 6 e varincia
UI
= 10,8.
x I 2 P( .i = x) 1/25
2,5 2/25
4.5 2/25
5 2/25
5,5 2/25
" 1/25
(,.5 2/25
7 4/25
8 1/25
X,5 2/25
9.5
11
1/25 2/25
2125
1125
F(X) =
.J
-2 E(X)=
"
25
'
25
I *-+ 25
Var(X)
Observe que a mdia das mdias amostrais coincide com a mdia populacional, e que _ 108 a varincia de X igual a Var(X) dividida por 11, isto , Var(X) = = 5,4
-t7
b) Sem reposio:
x P(X=x)
2,5 2/20
4 2/20
4,5 2/20
5 2/20
5,5 2/20
6,5 2/20
8,5 2/20
9,5 2/20
4/20
E(X) E(X
_ z:=
-2
x'l)
"
. .
)='"'X'/J.
.LJ
-2
2 =(25)2*_+42*-+ ' 20
2
2 20
Var(X)
= 40,05 - 6 = 4,05 Observe que a mdia das mdias amostrais coincide com a mdia populacional, e que
dividida por
li
* (5-2) -5-1
3 =54 *-=405
'
'
71
..
_---
....
Notao: 1-' e (J" : mdia e desvio padro da populao. J1 x e (J"x : mdia e desvio padro da distribuio amostraI da mdia.
Ohs. :
(J"x
Suponha que podemos extrair todas as amostras de tamanho uma populao finita de tamanho N, neste caso podemos mostrar que:
J1.\'
(sem reposio) de
=- J1
e crx
= j;;
cr
~N-ll
N.
Se o tamanho da populao for muito grande, infinito ou ainda a amostragem for feita com reposio, os resultados acima passam a ser:
JI.\c -
JI
e cr. x
cr
-VC 11
-- conhecida como o ttor de correo amostraI para populao N -1 finita, ou simplesmente "Fator de Correo".
A quantidade
N-II
PROPRIEDADES
DA DISTRI8UIO
AMOSTRAL
DA MDIA
Duas propriedades muito importantes para a aproximao da distribuio amostraI da mdia para a distribuio Normal, so apresentadas a seguir: 1 - Para grandes valores de 11 (11 > 30), a distribuio amostrai da mdia Normal com mdia J1 e desvio padro (J"j," independente da populao da qual a amostra foi retirada, ou
11
- = --' LX
". n
distribuio Normal. 2 - Caso a populao a qual X pertence seja Normal, a distribuio amostrai da mdia tambm ser Normal, mesmo para pequenos valores de 11, ou seja, se uma amostra de qualquer tamanho for retirada da mesma populao a que X pertence, tendo ~ distribuio Normal, ento X Obs.: Se uma a.a.s. que Xl, X2,
- = --' , tambm LX
f1
J1
'<: 30.
XI, X2, ... , Xn foi retirada de uma populao a qual X pertence, temos ... , Xn so independentes, com 1-.;(X,) = J1 e ~rar(Xj) = (J"2 (a mesma
72
L
--------
--,
mdia e mesma varincia da v. a. X), assim se X tem distribuio Normal, ou temos que:
Cf!
11
> 30,
X -
N(,u , -)
e fazendo
z=
X-Jl
- N(O,I).
11
-:r;;
A vantagem de estabelecer uma distribuio Normal para X que a partir desse fato podemos usar a tabela da Normal reduz.ida para calcular algumas probabilidades mais facilmente, como o caso do seguinte exemplo:
EXEMPLO 2.3: Quinhentos estudantes de uma escola da rede estadual tem peso mdio 42,32 Kg e desvio padro 8,5 Kg. Determine: a) Qual a probabilidade de uma a.a.s. de tamanho peso total superior a 4.368,5 Kg? b) Para 1.000 amostras todas de mesmos tamanho
/I =
(11
N = 500 , ,u = 42,32 e a
a)
11 =
100
= 8,5
100,
(
P(~
Xi > 4368,5)
= p(X
> 43,685)
=
=P
Z>
= 0,0537
espera-se que o peso total
Retirando-se amostras de 100 alunos dessa populao, ultrapasse 4.368,5 Kg. em cerca 5,37% das possveis amostras. b) Para uma amostra com _
P(40,56<
11 =
100, 43,76 - 42,32) / ~ = 8,5 '" 100 1J( 1,69) -1J(-2,07) = 0,9545 - 0,0192
"
X <43,76)
=p
(40,56 - 42,32
... / ~-
<Z<
= 0,9353
73
2.2. DISTRIDUICO
AMOSTRAL
DA PROPORCO
Admita que a populao infinita, ou que a amostragem feita com reposio. Vamos considerar que a proporo de indivduos, nessa populao, portadores de uma certa caracterstica /l. Assim, cada 'elemento da populao pode ser considerado como uma varivel aleatria X, tal que:
_{I,
X, Portanto:
Logo, X uma varivel aleatria com distribuio de Bernoulli com parmetro p, isto P(sucesso) = P(X = 1) = p, e P(fracasso) = P(X = O) = l-p. .
E(X)
J-I
=p
J"ur()()
()2
=
/I
Retirada uma a.a.s. dessa populao dc tamanho total de indivduos com a caracterstica binomial com parmetros distribuio Normal, para amostraI, temos que:
/I
L Xi
;:.-1
"
, o
/1
P = X,
a proporo
jJ _
pOIS,
'
1,(8,,) 1"((")
= VareS,,)
=
1
11., e
1
Var(p)
= Var(.)
= 11
1,
-2
I/ar(.),,) = l-/1p(l/I
p)
= ---=/1
p(! - p)
(Ji"
EXEMPLO
2.4: Em uma 'eleio, dcterminado candidato recebeu 46% dos votos. Determine a probabilidadc de que, em um cscrutnio efetuado em
a) 200 e
b) 1000 dos votantes, se obtcnha maioria em favor do candidato. SOLUO.: ;~ a)
Ill
=0,46 101)
2.
(Tj,
=,
,.pO /1"
p)
=>
()il
=0,035242
P ( p> 200
( 0,505 - 0,46) = P z> 0,035242 = P(Z > 1,28)= 1 -ljJ( 1,28)= 1- 0,8997 = 0,1~03
',' .r
Espera-se que em escrutnio com 200 votantes, 10,03% desses tenham maioria para o candidato.
74
..
0,0002484
~ 501) = p ( Z> ---- - 0,46) = jJ(Z > 2 60) = 1- "'(260) = 1- O9953 = O0047 0,501 . P j'J> -1000 OO15760 7 ~, Y' , , , ( ,
J
Espera-se
que escrutnio
0,47%
2.3. DISTRIDUJCO
AMOSTRAL
DA VARINCIA
Tomando todas as amostras aleatrias possveis, de tamanho 11, de uma populao, e calculando a varincia de cada amostra, obtemos a distribuio amostrai das varincias. EXEMPLO 2.5: Obtenha a distribuio amostrai das varincias a partir do exemplo 2.1.
SOLUO:
a) com reposio:
S2
p(S2=S2)
E(S)=
2
o
5/25
0,5 2/25
2 2/25 5 0*-+0 25
2/25
12,5 4125
18 2/25 270 25
32 2/25
40,5 2/25
L s2P(S 2 =s 2)=
=
'
2 .. , +405*-=-= ' 25
108 '
Es2)2)
I (S2)2 p(S2
= S2) = 02
* -25 + (O' 5)
1_
+ 25
+(405)2 ,
b) Sem reposio:
S2
p(S2=S2)
E(S)=
2
0,5 2/20
2 2/20 2
4,5 4/20
12,5
4/20
18
2/20
2/20
32 2120
40,5 2/20
Is
P(S
=s
2 )=05*-+ 20 ,
'
S2)2)
= I(S2)2
p(S2
* ;0
= 340,95
75
A.derivao das propriedades gerais da distribuio dessa estatstica no muito fcil, e o modelo de probabilidade resultante depende do resultado apresentado abaixo.
11
tem dlstnbuio
.,
(}"
liberdade
(x t'-I)'
E(Y) = (11- I) c Var(Y) = 2(11- I).
(}"2
11-1
)y
sendoE(S2)=,
11-1
) E(-Y) = (
11-1
,(11-1)=0"2
(}".
(}".
2
2(}"4
2(11- I) = (
/1-1
Observe que o exemplo 2.5, no satisfaz as condies do teorema e portanto, os valores das esperanas e das varincias no coincide com os resultados do tcorema, com exceo do valor da esperana no caso com reposio, que tem uma justificativa terica fora do contexto deste curso. EXEM PLO 2.6: Observou-se que a produo mensal de uma indstria durante vrios anos, verificando-se que essa produo obedecia a uma distribuio normal, com varincia 300. Aps um perodo de 24 meses, constatou-se que X = 10000 e S2 = 400 .Qual a probabilidade dessa varincia ter aumentado?
SOLUO:
P(S
. ,2
> 400)
=P
(24
= P(X
2 (23)
> 30,67)
= 0,10
3. REFERNCIAS "BIBLIOGRFICAS
1. Morettin,
3. Spiegel, M.R. (1978). Probabilidade e E,.tatstica. Editora McGraw Hill do Brasil Ltda.
76
l
IUNlDADEV
- BSTIMAO
I
I
IUNTRODUCO
.....
o problema de estimao informalmente definido por: Assuma que alguma caracterstica dos elementos da populao possa ser representada por uma varivel aleatria X, a qual tem densidade Ix (x; O), onde a forma da densidade conhecida, mas o parmetro
desconhecido (se fosse conhecido, a funo de probabilidade seria completamente especificada, e no haveria necessidade de fazcr inferncia). Assuma que os valores xl'x ' ,xnde uma amostra aleatria XpX2, . , ,Xn de Ix(x;O) possa ser observada. Em base dos valores amostrais observados
2
XI ,Xl'
...
,X"
parmetro desconhecido ou o valor de alguma funo do parmetro desconhecido. Esta estimao pode ser feita de duas maneiras. A primeira, chamada de esOmac1o pOll/ual, o valor que alguma estatstica, digamos T(X., Xl' ... , X,,), assume ou estima, o desconhecido Tal estatstica chamada de estimado,. pOlltual. A segunda, chamada de estimao por ill/erva/o, definida por duas estatsticas, dig~mos 1; (X" Xl' ... ,X,,) e ~(X"Xl' (TI eX
I'
e.
... ,X,,),
X
2 , ,
onde 1'2 ex
l'
T,(X"Xl,
... ,Xn)
< Tl(XI'X2"",Xn),
tal com
que
n)'
2 , . ,
n)
constitua
um
intervalo
probabilidade
12.
ESTIMACO
PONTUAL
..
Lembrando o que j foi dito na primeira unidade, chama-se e. timlll/or, quantidade calculada em funo da amostra, que sendo uma funo amostrai, considerada uma estatstica, e como tal uma varivel aleatria, caracterizada por uma distribuio de probabilidade e seus respectivos parmetros prprios. Estimatil'a um particular valor nmerico assumido p'or um estir.nador.
77
2.l.PROPRIEDADES
DOS ESTIMADORES
mostrar como as propriedades de um estimador
comprar um rine e, aps algumas selees, restou-nos 4 alternativas que chamaremos de rifles A, B, C e D. Foi-nos permitido fazcr um teste com cada rifle. Este teste consistiu em fixar o rine num cavalete, mirar o centro do alvo e disparar 15 tiros. Repetiu-se o procedimento para cada rifle e os resultados esto ilustrados na figura abaixo .
':@3~~, ~
~~~
/-x::::::*:::::---~
. '-..:*-"X".
"---
--
(A)
(B)
x
x x
(C)
(D)
Para analisar qual a melhor arma, podemos fixar critrios. Por exemplo, segundo o critrio de "em mdia acertar o alvo", escolheramos as armas A e C. Segundo o critrio de "no ser muitO dispersivo" (varincia pequena), a escolha recairia nas armas C e D. A arma C aquela que rene as duas propriedades e, segundo esses critrios, essa seria a melhor arma. Mas, se outro critrio fosse introduzido (por exemplo, preo), talvez essa no fosse a arma mais interessante. s vezes, a soluo deve ser um compromisso entre todas as propriedades. Esse exemplo nos permite introduzir alguns conceitos informalmente. Diremos que um estimador no tendencioso se "em mdia acerta o alvo". Chamaremos de preciso proximidade de cada observao de sua prpria mdia. A curcia mede a proximidade de cada observao ao valor alvo que se procura atingir.
78
-----,
Desse modo, pdemos descrever cada arma do seguinte modo: Arma Arma Arma Arma A: No tendenciosa, baixa preciso e pouco acurada. B: Tendenciosa, baixa preciso e pouco acurada. C: No tendenciosa, boa preciso e muito acurada. D: Tendenciosa, alta preciso e pouco acura,da.
Do exposto acima, notamos a importncia de se definir propriedades desejveis para estimadores. O primeiro critrio que iremos abordar o de no tendenciosidade. a) No-Tcndenciosidade no tendencioso) de ele pretende estimar (Sem Vcio): Diz-se que um estimador T no viciado (ou ainda quando seu valor esperado o prprio parmetro populacional que isto , E(T)
e, e,
= e,
para todo
Note que a esperana de T calculada sobre a distribuio amostrai de T. Por exemplo, a mdia amostrai X, um estimador no viciado para o parmetro populacional f.1. (isto , E( X) b) Consistncia: no viciado,
J.I).
Diz-se que uma sequncia de es'timadores Tn CO/1siste/1te se, alm de ser sua varincia tende a zero, quando o tamanho da amostra (/1)
e limVar(l;,)=0
n-.)-U)
Isto significa que, sendo T um estimador consistente, pode-se aumentar significativamente o tamanho da amostra, de modo a tornar o erro de estimao to prximo a zero quanto se deseje. Por exemplo, a mdia amostrai .X, um estimado r consistente de J.1.
2
(lim Var(X)
II-)(.()
lim ~
1I-)fO
11
= O) .
rrar(1;
ento, TI dito mais eficie11te que T 2.
) < Var(1~ ),
Por exemplo, pode-se mostrar que a mdia e a mediana so estimadores no tendenciosos para a mdia de uma populao Normal, mas X mais eficiente, pois a sua varincia menor.
E:xEMPLO 2.2: Considere uma populao qualquer, com mdia J.l e varincia unitria, da
qual so obtida todas as amostras possveis de tamanho 3. Qual(is) does) estimadores abaixo (so) no tendencioso(s) para f.l?
7lJ
~ a) b) c)
111
1 6 XI
+3"x2 +3"x.1
f.1~
1 1 1 +- x +- X 3x 23 3 3 ~] 1 I
=1 1 =-
f.13
XI
+ - x2 + 6
3'
X ~
-I-
] ] 3" J1 + 3" li = J1
I J 9
E(.u3) = 4li(xl)+61~(XJ+3li(xJ=
Ento,
~]
4'u+ 6P+)P=T2P
fi2
um estimador no-tendencioso.
12.2. ESTIMADORES
PONTUAIS
. Para se proceder estimao pontual, deve-se escolher o melhor estimador possivel, colher a amostra e, em funo de seus elementos, verificar a estimativa obtida, a qual corresponder a um ponto sobre o eixo de variao da varivel. MDIA: O melhor estimador da mdia populacional, " ""'x
P = X
A --
f.1,
a mdia amostrai
X,
isto , 2.1
= ..!..::!.~,
11
Pode-se provar que este estimador satisfaz as propriedades de um bom estimador: Pela distribuio amostrai da mdia observa-se facilmente que este um estimador notendencioso e consistente. Alm disso, podemos provar que tambm eficiente. VARINCIA: Quando a mdia expresso: I-' conhecida, deve-se estimar a varincia atravs da
d2
:",2
" L (xi
= _;._,'
_1-')2
_
11
2.2
80
... ,
i.
" L (Xi
- J.1)1
11
u=s=
ice.\
2.3
Quando a mdia J.1 desconhecida, que a situao mais comum na prtica, deve-se substituir o valor de I' por X, a mdia amostrai, e estimar a varincia pela expresso: " L(x; - X)l -I = SI = _.;0._1 _
11-1
2.4
L(x
X)I
2.5
u=s=
i',J
11-1
Observe que o denominador nas expresses (2.4) e (2.5) 11-1 ao invs de /1 das expresses (2.2) e (2.3). Embora para grandes amostras seja indiferente o uso de 11 ou 11-1. Estes estimadores tambm satisfazem algumas propriedades de um bom cstimador: no tendencioso, consistente e eficiente para (J'I. Observe a distribuio amostrai da varincia para se convencer que este um estimador no-tendencioso e consistente.
"'\-'11
11
caracteristica entre os 11 elementos da amostra. Observando-se a distribuio amostrai da proporo, verifica-se que um estimador no-tendencioso e consistente. Quando a populao finita, desejando-se estimar pontualmente o nmero de elementos da populao que apresentem uma determinada caracterstica, esse nmero estimado por Nj, onde N o tamanho da populao.
[3. ESTIMACOPOR
INTERVALO Xl' X
I'" .,
I
X"' que tem densidade
Ix
(x; O)
possa ser observada. Com base nos valores amostrais observados, estimamos o valor do parmetro desconhecido ou o valor de alguma funo do parmetro desconhecido. Entretanto, por melhores que sejam as qualidades do estimador utilizado, no devemos
e,
SI
esperar que essa estimativa coincida com o verdadeiro valor do parmetro. Na verdade, a probabilidade de que isto acontea extremamente pequcna, sendo igual a zero, quando T for uma varivel aleatria contnua. Ento, desejvel que a estimativa pontual seja acompanhada por alguma medida do erro possvel da estimativa. nesse sentido que a estimao por intervalo complementa a estimao pontual. Na verdade, procuramos um intervalo em torno da estimativa, onde este intervalo produzido pelo estimador pontual acompanhado de uma medida de confiabilidade de que o verdadeiro valor do parmetro pertena ao intervalo encontrado. Ento, a amplitude desse intervalo uma medida natural da preciso da estimativa. Esses intervalos so chamados Intel"Valo de Confiana, e a probabilidade de que esse intervalo contenha o verdadeiro valor do parmetro, denomina-se Nvel de Confiana ou Grau de Confiana, sendo representado por (1- a). Logo, a ser a probabilidade de erro ao se afirmar que o intervalo contm o verdadeiro valor do parmetro.
3.1. INTERVALO
DE CONFIANCA
Duas situaes so consideradas quando desejamos estabelecer um Intervalo de Confiana para P, a mdia da populao: Quando a varincia populacional ou no conhecida. Vamos considerar tambm que a distribuio de X Normal, sendo esta suposio feita ou a partir da distribuio dos elementos da populao ou atravs de grandes amostras, isto , estamos considerando que a populao que origina X Normal ou que, o tamanho da amostra, /I > 30~ Portanto, para todos os efeitos supomos que
X - N(P;
~12).
UI11
intervalo da forma:
80],
isto ,
[ X:!: CO ], ERRO DE
onde
&0
a semi-amplitude
tal que:
,LI
0)
p(lx - I < 8
que equivalente a P(p-b"O<'X
= I- a,
<p-l-b'o)=I-a.
< li < X
-I- 80)
= 1-
a.
82
a) cr2 conhecida: Como, tnhamos observado anteriormente quando falvamos de distribuio Normal, e estvamos interessados em determinar uma constante 'a' tal que P(Z < a) = "o, onde Xo seria a rea na tabel da distribuio Normal padronizada, inferior ao valor de 'a', por exernplo, se Xo = 0,05 (5%), isso implica que 'a = -1,64' (ver tabela da distribuio Normal reduzida). Assim vamos tratar os valores de 'a' pela notao z" e
2
Xo
P(Z < -z a
=a/2 ,
P(Z > +z
a )
o-
a/2
P(_z,,<Z<+za)=(l-a).
I 2
--
Co
da'seguinte maneira:
[;0 -
:::::>
[J1 -
[;0 -
J-l
<Z <
J-.l +
. a
J1]
== 1- a
J::
[;. + P ----2-<Z<-_o c
.[ cr a
J::
e +Z
fI
=l-a
'
=>
:- Z
Co
.j;;
PC X
-
.j;;
Co
l'
.J::
:::::>
=-I
+ Co a
a:::::> Co
= z~ J;i
2
.j;;
Isto ,
1 - ex
u P(X-=a-<P<X+za--
- ..r;;
I
-- J;, 2
aJ
=I-a.
Em outras palavras, isso significa que a probabilidade de que o verdadeiro valor de pertena ao intervalo (- X EXEMPLO
Z
fI
J.1-
a ~ + z" r X
'1/11
'i
u r'1/ /I
J igual a (1 - ex).
3.1: A medida dos dimetros de uma amostra aleatria de 200 cilindros fabricados por uma determinada mquina, acusou uma mdia de 2,093 em. Sabe-se que o desvio padro dos dimetros dos cilindros de 0,107 em. Determine o intervalo de 95% confiana para o dimetro mdio de todos os cilindros.
SOLUO:
11
200,
= 2,093,
:::::>
= 0,05
=> a/2
= 0,025
0,025
:::::>
=a
2
= 1,96
IC(,u.)
= ( 2,093
- 1,96 *
0,107
= (2,078;2,108)
Isto significa dizer que, com probabilidade 0,95 o verdadeiro valor da mdia dos dimetros dos cilindros pertence ao intervalo (2,078cm;2, 108cm).
lO
b) 0-2 desconhecida: Quando no conhecemos o desvio padro da populao, devemos estim-lo com base no conjunto amostraI. Adota-se como cstimador a varincia amostrai S2: " L(x; - X)2
~'2 __ '._1 _
/I-I
A substituio simples da varincia populacional pela varincia amostrai, somente justificvel para grandes amostras (11 > 30). Para amostras pequenas (11 < 30), torna-se necessrio uma correo na distribuio padronizada, que consiste em substituir a distribuio Normal (2) pela distribuico t-Student ( 't' de Student). Como veremos a seguir. Conforme mostrou" Gosset, a estatstica: 1'= .X-I'
.\'
J-;i
distribui-se simetricamente, com mdia zero, porm no normalmente. claro que, para grandes amostras, S deve ser prximo a a, c as correspondentes distribuies. T devem estar prximas da Normal reduzida. Vemos, pois, que existe uma faml.ia de distribuies T cuja forma tende distribuio Normal reduzida quando 11 cresce. Notemos que a estatstica definida acima tem 11-1 graus de liberdade, o que justifica a sua notao por l(n-/l.
Notao: T -'(n-.I).
A tabela da distribuio t-Student fornece valores de t em funo de diversos graus de liberdade vede algumas probabilidades correspondentes cauda direita na respectiva distribuio. importante notar que a expresso acima pode ser escrita X-I-' ( 1'=--*-=2(5
(
S
S
-.
J:;
Conseq uentem ente, onde
1(n l;a12)
o
t(n l;"/2)
o
Cf
za/l
"""lo
LJ
=> Z(l/l
= t("01;'l/2)
(5
'/1-1'
representa o
PC X -
Co
Co) =
1 ~a
2.
J-;;
(5
0.0
..rn
(5)
=l-a
.
= 1- a .
'VII
n-I;2
(l)
sJ
'V /I
84
l
Em outras ,palavras, isso significa, no caso da varincia desconhecida e com que a probabilidade de que o verdadeiro valor de p pertena ao intervalo
11
< 30,
(
igual a (1 - a). EXEMPLO
X-I
(,,<;_) .j;, ,
,-'X+l
s -
,-
s]
3.2: Uma amostra de 10 medidas do p direito ," dos degraus dC?uma escada acusou os seguintes valorcs, em ccntmetros: 20, 23,27, 19,26,24, 30, 23, 18 e 28. Determine um intcrvalo de 99% de confiana para a mdia do verdadeiro p direito dos degraus da escada.
SOLUO:
/1=
10,
x=
23,8 e S=3,99,com
l-a.
1(9;0,005)
0,99
= 3,25
* JlO
3,99
;23,8- 3,25
*..J\O
3,99)
= (19,70;27,90)
Logo, com 99% de confiana a mdia de todos os ps direito dos degraus desta escada esto entre 19,70cm. e 27,90cm.
3.2. INTERVALO A
/I
DE CONFIt\NCAPt\Rt\ amostrai de
t\ I)ROPORCO
distribuio
'
iJ ,
para
grandes
amostras
N( p, p(l- p)
o -- V
2
~ &" ; I) + 1:" )
por um caminho scmelhante ao que foi feito no caso de estimao de 11, chega-se facilmente a - . . c = za \1p(l- p) . Note que essa expressa0 e em tudo analoga ao . mtervalo de confiana
11
7..r,;
F- P)(,
o desvio padro do
p.
p.
Tal substituio
encontra justificativa no fato que, sendo a amostra grande para haver satisfeito s condies da aproximao pela Normal, a estimativa deve scr razoavelmente prxima do valor real do parmetro. Alm do que, o eventual erro a mais que poderamos cometer ao substituir p por jJ seria em boa parte compensado pelo erro a menos que, ento, cometeramos ao substituir 1- p por 1 _ fi, e vice-versa, o que torna ainda mais justificvel a aproximao feita.
xs
J -J.: z"
2
fi
significando que
~ ~ jJ(1 p ( p-z~_ 11
2
::;;p::;;p+z~_
2
J( I 11
p-]
= 1_
!l_ )
==
aI2
EXEMPLO
3.3: Uma amostra aleatria de 1000 eleitores de certo distrito eleitoral d 350 como favorveis a certo candidato. Determine um intervalo de confian~ ao nvel de 95% para a proporo de eleitores favorveis ao candidato. 1- u == 0,95
IC(p)
0,35 - 1,96 *
f1
'.
35(1- O35) ~o 35(1- O 35) ' ;0,35 + 1,96 *' ,\ 1000 1000
= (0,32;0,38)
4. REFERNCIAS
BIBLIOGRFICAS
1. Morettin, P. A. & Bussab, W. 0.( 1984). A--ltodos_ Qualltitativos para Ecollomistas Administradores - Estatstica Bsica. Atual Editora Ltda. 2. Costa Neto, P.L.O. (1977). Estatstica. Edgard Blcher Ltda. 3. Mood, A. M., Graybill, F. A. & Boes, D.e. (1974). lntroduction Statistics. 33 ed. San Farncisco. McGraw-Hill Book Co.
to the Theory of
".
86
I UNIDADE
VI-TESTES
.
DE HIPTESES
I
I
11. TNTRODUCO<
Estudaremos uma forma de tratar o problema de lzer uma afirmao sobre o parmetro desconhecido O associado a uma varivel aleatria X, baseado em uma amostra aleatria simples (a. a. s.)(X.,x2, ... ,XII)' extrada da populao. . Em vez de procurarmos uma estimativa pontual do parmetro ou um intervalo de . confiana deste parmetro, freqentemente nos parecer conveniente admitir um valor hipottico para o parmetro B, e depois utilizar a informao da amostra para confirmar ou rejeitar esse valor hipottico. ' Um problema de teste de hiptese paramtrico sempre ter a seguinte forma: Seja X _ f(x;B), B E0, onde 0 chamado de espao paramtrico, e o conjunto de todos os valores possveis do parmetro da v. a. X. Especificamos um conjunto 0 o' tal que e o c e, e a pergunta que fazemos :
nesta a. a. s. mais razovel acreditar que O E o' do que no pertena. Antes de falarmos de teste de hipteses, precisamos introduzir algumas notaes e darmos algumas definies.
12.
CONCEJTOSFUNDAMENTAIS
I
]f o'
Define-se por H o a hiptese existente, chamada hiptese nula, a ser testada e P?r H\ a hiptese alternativa. O teste ir levar a aceitao ou rejeio. de o que eorresponde rejeio ou aceitao de li J' respectivamente. Entretanto, para manter a uniformidade enuncia-se o resultado [mal sempre em termos da hiptese Ho' ou seja aceitar ou rejeitar H o . Qualquer que seja a deciso tomada, estamos sujeitos a cometer erros. Para facilitar a linguagem, necessitamos das seguintes defmies: Erro tipo 1: rejeitar a hiptese nula, quando esta verdadeira. probabilidade de cometer esse erro, isto , a = P( erro tipo I) = P(rejeitar H o / H o verdadeira) Chamamos de a a
Erro tipo 11: no rejeitar fi o quando H o llsa. A probabilidade de cometer esse erro indicada por f3, logo, f3 = P(erro tipo ll) = P(no rejeitar Ho/ lIo falsa)
X7
-.1,
Nossas decises em um teste de hiptese podem ser resumidos na seguinte tabela: Tabela 1: Acertos e Erros nas decises tomadas em um teste de hiptese
---Amostra __ !~~pulao _
Realidade 1-10 Verdade Deciso Correta (I-a) Ho Falsa (=Ht Erro tipo 11 (P) Deciso Correta (1-
A probabilidade a. de cometer um erro de primeira espcie um valor arbitrrio e recebe o nome de Nvel de Significncia do teste. O resultado da amostra .cada vez mais significante para rejeitar H o quanto menor for esse nvel. Usualmente, esses valores so fixados em 10%, 5% ou 1%. . A probabilidade ~ uma funo que depende dos valores do parmetro sob H, e 1- p denominado de Potncia do Teste, ou seja a capacidade de rejc,itar H o quando H o falsa, urna medida de qualidade do teste. Um teste de hiptese que fornece uma regra de deciso com uma funo pqtncia maior que outro dito mais poderoso. Note que na prtica no conhecemos a realidade. Jamais saberemos se a deciso tomada foi certa ou errada. O certo que podemos cometer dois tipos de CITO: o erro tipo 1 quando nossa deciso rejeitar lJ o sendo H o verdadeira e o erro tipo 11 quando nossa deciso for aceitar Ho sendo llo falsa. Pensamos ento que um teste de hiptese ideal aquele em que a regra de deciso que ele oferece torna mnimo os erros tipo 1 e 11. Isto no possvel, pois ao tentar minimizar o erro tipo I estamos aumentando o erro tipo 11 e viceversa. No entanto, quando fixamos o erro tipo 1, conseguiremos diminuir o erro tipo II aumentando o tamanho da amostra o mximo possvel, dentro das limitaes, de tempo e custo, permitidas. Sendo um teste de hiptese uma regra de deciso, e esta Aceitar ou Rjeitar Ho' o conjunto de valores que levam a rejeitar fio chamado de Conjunto Crtica, denotado por RC. O complemento Regio de Aceitao. C .tico ou Regio de RC chamado de Conj unto de Aceitao ou
3. PASSOS PARA CONSTf~UCO ()E UM TESTE DE IIIPTESES Vimos, na seo anterior, o procedimento que se deve usar para realizar um teste de hiptese, discutindo as notaes tcnicas. Daremos abaixo uma seqncia que pode ser usada sistematicamente para qualqu' teste de hipteses.
H,:O;/:.O()
(a)
"',
K8
Poderamos
da forma:
(b)
HI:O>Ou
dependendo das inforinaes que o problema traz.
(c)
o nivel de signilicncia
. Passo:
Use a teoria estatstica e as informaes disponveis para decidir qual estatstca ser usada para julgar !J ()' No se esquea de identificar a distribuio amostraI adequada.
a regio crtica do teste, Re. fornecidas pela amostra para encontrar o valor da
regio crtica,
conhecida ou
Il
> 30:
1.. Hipteses:
H.:p<po
HJ:p>Jl()
2. Fixar
a.
89
3. Estatstica do Teste: X - N
()l;'~,')
a)
Ho:p
H
I:
= Po
:t:
/-..,('!_, __ ,l~.
J.10
.d
').,.,
l' .,' .. .
. -Z,V2
+Z".12
b)
~ "",,,~'~~~i"f.i
-Z'L
'
...
c)
Ho: p
= Pu
H):p>po
..
~"
.
"f.;'j.V),,"-_
~"
+Za.
5. Calcular a Estatstica Z c =
X-Po
0/
/Jn
6. Deciso: Rejeita-se ou no H o ? Depende da Regio CrLica do passo 4. Se Z c E RC , rejeita-se 110, Caso contrrio, aceita-se H o . 7. Concluso
EXEMPLO 4.1: Uma mquina automtica de encher pacotes de caf enche-os segundo uma
distribuio normal, com mdia p e varincia 400 g2. O valor de fJ pode ser fixado num mostrador situado numa posio um pouco inacessvel. A mquina foi regulada para I' = 500g. Desejamos, de meia em meia hora, colher uma amostra de ] 6 pacotes e verificar se a produo est sob controle, isto , se P = 500g ou no. Se uma dessas amostras apresentar uma mdia de 492 g, voc pararia ou no a produo para verificar se o !TI0strador est ou no na posio correta?
90
SOLUA0:
11 =
16 X
= 492
g,
cr
= 400g
c Jlo = 500g
1. Ho:
H.: J.1
= 0,005
, X - N(II ,25)
Normal, obtemos que -Z".J2 '-
' isto
= -2,58 e Za./2
= 2,58.
5, Zc=
492 - 500
=-1,6
desconhecida e
li
< 30:
1. Hipteses:
110
(a) (b)
H I: P > Jlo
2. Fixar
(c)
a.
do Teste:
3. Estatstica
X -
t-Student
com
11-1
da hiptese alternativa.
a)
Ho: JI
= Jlo
.~ .,!';:j(':V~~i .
,,--.....
H]:p:tJlo
..~ ,,
/
,
""- b~
til.';
i :'. Oh!~\"'h
-I., '.'
lJ\
b)
~
< .~;
;~;l ~
-la.
"'"
c)
H o: p = Po H I: P > Po
.~
/~'-_. .
la.
S. Calcular a Estatstica I e =
X-fi \' /
l /
// ..j";;
6. Deciso: Rejeita-se ou no IJ o ? Depende da Regio Crtica do passo 4. Se I c E RC , rejeita-se H o . Caso contrrio, aceita-se Ho' 7. Concluso
EXEMPLO 4.2: Um fabricante afirma que seus cigarros contm no mais que 30 mg de nicotina. Uma amostra de 25 cigarros fornecem mdia de 31,5mg e desvio padro de 3mg. Ao nvel de 5%, os dados refutam ou no a afirmao do fabricante? SOLUO: 1. Ho: P
11
= 25,
= 30
H,: p > 30
2. a
= 0,05
1,71.
31,5 - 30 5. le = 6. Como
31m
(I e
= 2,5
deciso ser de rejeitar H o .
= 2,5) E RC , a nossa
92
7. Ao nvel de significncia de 5%, h evidncia de que os cigarros contenham mais que 30rng de nicotina. ",
Vamos usar os passos descritos na seo 3 para mostrar a construo do teste para propores. 1. Hipteses: Temos uma populao, e temos uma hiptese sobre a proporo p de indivduos portadores de uma certa caracterstica. Essa hiptese afirma que essa proporo igual a um certo nmero pu. Ento,
,Ho:p=
Po
deve fornecer informaes sobre a forma da alternativa. Que ter uma
o problema
H,:p -:t- Po H,:p<po H,:p>po
2. Fixar a.
3. Estatstica do Teste:
fi -
N p,
( p(l- P)
11
a)
Ho:p=po H1:p-:t-po
./~,
.,.~~ c.......... ,
.
'
)..
~r~~." ~ .. jtr_
-Z,J/2
Z,l
b)
Ho:p= Po
H1:p<po
4r"
.
-Z"
~.
93
.J
c)
Ho:p=po H]:p>po
.;.;..:, .
_.//~
..
' t'.'T.~'1n._
Za.
p- po 5. Calcular a Estatstica Z c =
Po(l-po)/
/11
6. Deciso: Rejeita-se ou no lJ o? Dcpende da Regio Critica do passo 4. Se Zc El~C ,rejcita-se /lo' Casoconlrrio, aceita-se !Iu' 7. Concluso
EXEMPLO
5.1: Uma estao de televiso afirma que 60% dos televisores estavam ligados no seu programa especial da ltima segunda-feira. Uma rede competidora deseja contestar essa afirmao, e decide, para isso, usar uma amostra aleatria de 200 famlias, das quais 104 responderam afirmativamente. Qual deve ser o procedimcnto adotado para julgar a afirmao da estao?
11
SOLUO:
= 20
= 0,05
fi -
N(P,
p(l-
200
P))
= 0,52
=0,=5=2=-=0=,=)()=_ 2 3 I = / ' 0,60 1\: 0,40; /200
E RC
Zc
p- Po Po(1- Po)/
In
6. Como
(Zc
= -2,31)
94
7. Ao nvel de 5% de significncia, podemos dizcr quc h evidncias de que a audincia do programa de segunda-feira no f~i de 60% e sim inferior a esse nmcro.
6.REFERNC[AS
BIBLIOGRFICAS
1. Morettin, P. A. & Bussab, W. 0.(1984). A4todos Quantitativos Administradores - Estatstica lJsica. Atual Editora LLda. 2. Costa Neto, P.L.O. (1977). l~statstic([. Edgard l3lchcr LLda.
para Ecollomistas
e "'
3. Mood, A. M., Graybill, F. A. & Bocs, D.e. (1974). lntroduction Statistics. 3a. ed. San Francisco. McGraw-Hill13ook Co.
to thc ThcolY of
1)5
____
.J
............................
'
'1 I
11. INTRODUO.
Correlao e Regresso so duas tcnicas estreitamente relacionadas que envolvem uma forma de estimao. A diferena entre essas duas tcnicas e o tipo de estimao estudados anteriormente que as tcnicas anteriores foram utilizadas para estimar um nico parmetro, enquanto as tcnicas apresentadas agora se referem estimao de uma relao
que possa existir na populao. A anlise de correlao d um nmero que resume o grau de relacionamcnto entrc duas variveis~ a anlise de regresso tem como resultado uma equao matemtica que descreve o relacionamento entre elas. Esta equao utilizada para estimar ou predizer valores futuros de uma varivel quando se conhece os valores da outra varivel. A anlise de correlao til em trabalhos exploratrios, ou quando um pesquisador procura determinar quais variveis so potencialmente importantes, sendo que o interesse est no grau ou fora do relacionamento. Esta tcnica utilizada quando no h dependncia funcional entre as variveis, embora possam ser correlacionadas.
12.CORRELACO.......
.....
o objetivo do estudo da correlao a determinao do grau de relacionamento entre duas variveis emparelhadas. O termo "correlao" significa "co-relacionamento", pois indica at que ponto os valores de uma varivel esto relacionados com os da outra. Se os pontos observados das variveis, digamos (X,Y) representados num diagrama de disperso parecem cair prximos a uma reta, dizemos que temos uma correlao linear. Dizemos que a correlao positiva se a tendncia crescente, ou seja, valores pequenos de X fornecem valores pequenos de Y e vice-versa (ver Figura 2.1.a) . A correlao negativa se a tendncia decrescente (Figura 2.1.b) e nula se no observa - se
tendncia alguma (Figura 2.I.c). Figura 2.1: Possveis formas de correlao linear. (a) .YI y
X X
I
(b) Y
(c)
xxx xxx xx x x x x x x x
X
xx x x x x x x x x x x x xx x X
I
x x x x x x x x x x x x
1)(,
,
Uma medida do grau e do sinal da correlao correlao linear de Pearson", definido por: 'cov( X, Y) ..e estimado por ,. =: Sx Sr
=:
O'XO'1'
de
Sxr
- X)(1~ - Y)
1/
S,\1'
= ,~
-1 dados por
Sx ,Sy
n
so _X)2
os desvios-padres
das variveis
X e Y na amostra,
~)X;
Sx =
!=.!
d
11-1
, respectivamente.
11-1
PROPRIEDADES
DO COEFICIENTE
DE CORRELAO
"LINEAR.
1. Este coeficiente adimensionaI, logo no afetado pelas unidades adotadas. Alm disso, apresenta duas propriedades que caracterizam a natureza da relao linear entre as duas variveis. Uma o sinal (+ ou -) e a outra a magnitude. 2. O sinal o mesmo que o do coeficiente angular de uma reta imaginria que se "ajusta" aos dados se fossem traados num diagrama de disperso. 3. A magnitude indica o quo prximo da reta imaginria esto os pontos individuais. 4. O valor de ,. E [-1,1]. Se r = -1, dizemos que h uma correlao linear negativa perfeita e se,. = 1, uma correlao linear positiva perfeita. importante assinalar que U1,n coeficiente de correlao linear igual a zero, no implica em ausncia de relao entre as duas variveis, e sim que h uma ausncia de relao linear entre as duas variveis.
TESTE DE SIGNIFICNCJAPARA
O COEFICIENTE
DE CORJ{ELAO.
Como o valor de r calculado com base nos 11 elementos de uma amostra e que portanto, representa uma estimativa, ou melhor, uma boa estimativa do verdadeiro coeficiente de correlao populacional, necessrio fazermos uma inferncia estatstica a respeito de p. Isto , queremos saber se um dado valor de r, combindo com o respectivo tamanho da amostra
11,
permite concluir,
um
97
-,
Para tanto, pressupomos que as variveis X e Y apresentam uma distribuio Normal Bivariada e seguiremos os seguintes passos. 1. Formular as hipteses: I-Io:P (no h correlao entre as variveis) H1:p 1:- O (h correlao entre as variveis)
=O
2. Fixar o nvel de significncia 3. Estudar a distribuio de probabilidade::::> t-Student com (n-2) graus de liberdade. 4. Regio Crtica (Regio Grifada)
/
r,,1
~
",-...,..."
/
I
"h..
t;, ..!~!1"') f
-t2
tu12
=r
--2
'-2
l-r
6. Deciso: Rejeita-se ou no fIo? Depende da Regio Crtica do passo 4. Se 'cERC, 7. Concluso rejeita-se Ho' Caso contrrio, aceita-se Ho'
EXEMPLO 2.1: A tabela abaixo d o preo mdio das aes e ttulos divulgados pela bolsa de Nova York nos anos 1950 1959. Calcule o coeficiente de correlao de Pearson, interprete o resultado e verifique sua significncia ao nvel de
5%.
Preo Mdio dos Ttulos 102.43 100.43 97.43 97.81 98.32 100.07 97.08 91.59 94.85 94.65 974.66
Ano 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 Total
Preo Mdio da Aes 35.22 39.87 41.85 43.23 40.06 53.29 54.14 49.12 40.71 55.15 452.64
98
x =45,26;
Y=97,47;
- v)
=90,51 e
L(X
X)(r;
= -91,98:
=-04561
(.,
.J Xl' -
. -91,98/9 ~=~=i-~~5'
:
* ~(90,51/9)
'
Conclumos que existe uma ccrta correlao negativa entrc os prcos mdios de aes e de ttulos, isto , uma tendncia de baixa nos preos de aes quando se verifica alta nos preos de ttulos, e vice-versa, muito cmbora tal relacionamcnto no seja accntuado. Para anteriormente. 1. Formular as hipteses: Ho:p =0 (no h correlao cntrc as variveis) H(:p -:F O (h correlao entre as variveis) 2. a = 0,05 3. Distribuio t-Student com 8 graus de liberdade. 4. Da tabela da distribuio t-Student, obtemos que t(8;O.025)2,31. = Logo, RC = {te E~H/ te < -2,31 ou te > 2,31} 5. Calcular a estatstica do teste: te = r testar a significncia da correlao, seguiremos os sete passos citados
fg
1- r
2
l-2 -0,4561 ~9 =
1- (-0,4561)
= -1,4496
6. Como
(te = -1,4496)
II RC,
7. Ao nvel de signifiencia de 5%, no podemos afirmar que exista uma correlao entre o preo mdio de aes e o preo mdio de ttulos nos anos de 1950 1959.
13~REGRESSO<
Quando analisamos dados que sugerem a existncia de uma relao funcional entre duas variveis, surge ento o problema de se determinar uma funo que exprima esse relacionamento, ou seja temos um problema de regresso conforme denominao introduzida por Fisher. Portanto, ao imaginar uma relao funcional entre duas variveis, digamos X e Y, estamos interessados numa funo que explique grande parte da variao de Y por X, ou
99
l
vice-versa. Uma parcela, entretanto, permanece em geral scm ser explicada, e ser atribuda ao acaso (erro experimental). Admita que a varivel X seja suposta sem erro, ou seja, no alcatria, enquanto a varivel Y apresenta uma variao residual, a qual responsvel pela disperso dos pontos experimentais em tonia da equao de regresso. Essa situao corresponde a experimentos em que os valores de X so pr-fixados pelo expcrimcntador, e por isso scrchamada dc varivel independente, enquanto os valorcs de Y sero dctcrminados experimentalmcnte, c Y dita varivel depcndentc. Se admitirmos que Y funo linear de X, podcmos cstabelcccr uma rcgresso lincar simples, cujo modelo cstatstico :
Y; =a+f3X
+~,
i= 1,2,... ,11
nosso
objetivo
ser estimar
a c fJ,
da reta
terica,
atravs
dos
pontos
cxperimentais fornccidos pela amostra, obtcndo um rcta estimada da forma: J~ onde a, b e Y; so as estimativas de a,f3
= a + b.. '(
e dc E(Y;) , rcspcctivamente.
ESTIMAO DOS PARMETROS. Para cada para de valores obscrvados (Xi' J~) , podemos estabelecer o desvio e = Y - Y = Y - (a + bX )
, I I I I
mtodo dos mnimos quadrados consistc cm adotar como parmetros os valores que minimizam a soma dos quadrados dos dcsvios
estimativas
dos
Z=Le
i=1
" Z
j
=L(J;-(a+hXiz
i~1
A funo Z ter mnimo quando suas derivadas parciais cm relao a "a" e "b" forcm nulas. (Note que Z no tem mximo)
8Z az
" = -2LJ(Y;
-(a+bXi
=O
=O
(1) (2)
o que
100
..;"I
lIa+bLX; { aLX;
= LY;
=
+bLX;2 a = Y -bX
LX;Y;
Ento,
h-------
L e; = O (3),
L X; e; = O (4), j que
(a +bXJ. =0 (5).
= aLe; +bLX;e;
4. H modelos que podem ser linearizados, tais como: Y = apx => Inf = Ina + Xlnp f
pln X
Y = o~- }~)(1~ - Y) +
Y; ) + (1~- Y
2
vcrdadc, cnto
2
L (1~Mas, onde
Y)
L (1~-
L o~- }~ + L(1~ )
Y) 2 + 2 L (1~ -
}~)(}~-
Y).
L o,,; L Cf, -
i;)(f; - Y) =
L (1~-
f;) 2 denominada de Soma de Quadrados Residual (SQ Res) denominada de Soma de Quadrados da Regresso (SQReg)
L (f; - y)2
Logo,
.
SQT = SQReg + SQRes, ou seJa) =
SQ RCK
S01'
SQRes + S01'
Quociente
definido
por
R2 = S~~;.K
denominado
de
"Coeflcientc
de
Determinao" que O~ R
2 ~
11-2
11-2
11-2
101
l
Os mesmos problemas de estimao e testes de hipteses sobre os parmetros podem ser considerados no modelo de regresso, com rdao aos parmetros a e f3, e para tanto inicia-se pelo estudo das distribuies amostrais.
Como b - f3 = ~
L(X;
- X)~
-
L,(X ',- X_ J
2
~,
L(X, - X)
Se os erros tm distribuio normal, seguc-se quc b tcm distribuio normal, isto , b - N(J.1b , a;) . Com um pouco de lgebra pode-se mostrar que ' ,
}'" = f3
2
a2
0""
L(X;
_ X)l.
\'2
~2
dI!
- X)
a- N(a,(~
-2 X
j-
11
+L
x' X) -, (X
j -
Ja J .
2
Sendo o estimador
.~
~2.2
(J"
-;
) \
.2 .\/1
Baseado nas distribuies amostrais podem ser obtidos intervalos de confiana para os parmetros. Sendo to o valor crtico da distribuio t-Student com (11-2) graus de liberdade e ao nvel de confiana estabelecido, respectivamente. os intervalos de confiana para
e a so,
JC(P) = (b - toSb;b
+ t"Sb)
Je(a)
= (a -
toS'7;a
+ 'oS,,)
TESTE DE SJGNIFICNCIA
rARA A REGRESSO.
1. Formular as hipteses: 110: P = O (no h regresso) fi I: f3 :t:- O (h regresso) 2. Fixar o nvel de significncia 3. Estudar a distribuio de probabilidade
=>
102
/"",
.J,. ....:d / "'''ii~l rP~!";"~"
~"r . :~ t,u2
__
-t,,12
= ---
h -/~, SI>
6. Deciso: Rejeita-se ou no H o ? Depende da Regio Crtica do passo 4. Se 7. Concluso Observao: possvel testar o parmetro a, cmbora seja um caso dc mcnor intcrcsse prtico, 3.1: A tabela abaixo'apresenta os pesos respectivos X e Y de uma amostra de 12 pais e de seus filhos mais velhos. Determine a reta de regresso c faa um teste de hiptese ao nvel de 5% de significncia para a regresso. Peso dos pais (X) Peso dos filhos (Y)
(c E
EXEMPLO
68 66 68 65 69 66 68
65
..-
71 67 68 70 LY=811
- X)2
L (X;
- X)(Y; - Y) = 40,33
103
b= Logo,
. '
Y; = a + bX
= 35,8238 + 0,47632X;
Para testar a significncia da regresso, seguiremos os passos citados anteriormente. 1. I-1o: P = O (no h regresso) H 1: P ;I:. O (h regresso)
2. a = 0,05
3. A distribuio <deprobabilidade uma t-Sludenl com 10 graus de liberdade. 4. Da tabela da distribuio t-Student, obtemos que Logo, RC = {'e E~H/ 'e < -2,23 ou 'e> 2,23} ,2 _LY;2 5.SR'l
b t(Jl);O.025)
= 2,23.
-aLY;
11-2
-bLXi}~
_54849-35,8238*811-0,47632*54107
-
=23652
'
10
= S2 =
b
S2
R
23652
,
2:(X;
_ X)2
84,67
= O027934 . '
7. Ao nvel dc significncia dc 5%, podemos afirmar que exista uma relao funcional cntre o peso dos pais e dos seus filhos mais velhos.
14. REFERNCIAS
BIBLIOGRFICAS
1. Costa Neto, P.L.O. (1977). 4~'1atstica. Edgard Blcher Ltda. 2. Draper, N.R; Smith,H. (1981). Applied Regressiol1 Al1a/ysis. Wiley. 3. Hoflinann, R; Vieira, S. (1977) Anlise de Regressto. EDUSP.
)04
1 t9t'0 Lttt'O
68'0
189t'0 98Zt'0
L68'0 O<:'O 9l'0 018Z'0
8t'0 lZH'O
9LLZ'0
19Lt"0
t9t'O
tL6CO
t6'O
8l Z 'O LL 8 Z' O 9tZ'0 9n'0
9'0
186Z'0
60t'0
O~O('O
~10'0
9L9(:'0 8Z'0
0'0 1'0 tO. '0 t'O. s'O9'0 L'O8'0 6'0 0'11'1 ,'1f'lt'l. S'l9'1 L'I 8'16'1 0',;I', -
HtZ'O 8tl<:"0
L981"0
8tZ'0
LLl<:'O
8HZ'O
99lZ'0 LL61'0 l1Ll'O
t9Z'O
LZ<:'O
60Ll'0 68Z'0
t681'0
91'0
6t61 'O
891'0
:0,'0
<:9Ll'0 Hl'O Z6Zl'0
190,'0
88L 1'O 6(l'O
1191'0
6L1'0 OL11'0 860'0 Z80'0
0991'0 Ltl'O
01ZI'0 OZOI'O 80"0 80LO'0 Z8O'0
060<:'0 t181'0
(:9l'0
9ttl'O
OZI'O
69tl'0
HZ1'0
<:6tl'0
lLll'O
tll'O
ZI11'O
%01'0
880'0 LO'O
HOl'O 1060'0
6tLO'0
601'0 8160'0
t9LO'0
l 'O 111'0
l60'0 6LO'0 90'0 LHO'O
t60'0
8LLO'0
t6O'O 8tO'0
Z6O'O
8190'0
O~O'O
090'0
91 O'O
t90'0 9HO'0
LltO'O
HtO'O t8O'O
LOO'O
60tO'0
6Z0'0 Z9Z0'0 LO<:O'O Z910'0
000'0
8ZO'0
tI 0'0
OZO'O L610'0
ttZO'O Z610'0
Ol0'0
<:0<:0'0
8l0'0 ZZ10"0
9tO'0
,O'O
ttO'O
tLZO'O LI ZO'O OLI0'0
18<:0'0
zno'o
tLI0'0
8nO'0
6LI0'0
t600'0
1 LOO'O
9<:10'0 9600'0
(LOO'O
HI0'0
Z010'0 8LOO'0 6OO'0
\;.i
6600'0
LOO'O
610'0
LOI0'0 Z800'0 Z900'0 L tOO'O OO'O
z',f', -
t', S', -
.'
9', L',8', -
noo'o
6100'0 100'0 O
9100'0
ZOOO'O
1000'0
L
li
8100'0 0100'0 1
6', 0' Z
OyaCJ\:ld 'Nlt\T'tlONOYJlil8nIlSIO
- I V73HV.L
_e
TABELA
I -CONTINUAO
z
0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8
0,5000 0,5398 0,5793 0,6179 0,6554 0,6915 0,7257 0,7580 0,7881 0,8159 0,8413 0,8643 0,8849 0,9032 0,9192 0,9332 0,9452 0,9554 0,9641 0,9713 0,9772 0,9821 0,9861 0,9893 0,9918 0,9938 0,9953 0,9965 0,9974 0,9981 0.9987
1 0,5040 0,5438 0,5832 0,6217 0,6591 0,6950 0,7291 0,7611 0,7910 0,8186., 0,8438 0,8665 0,8869 0,9049 0,9207 0,9345 0,9463 0,9564 0,9648 0,9719 0,9778 0,9826 0,9864 0,9896 0,9920 0,9940 0,9955 0,9966 0,9975 0,9982" 0,9990
,.
2 0,5080 0,5478 0,5871 0,6255 0,6628 0,6985 0,7324 0,7642 0,7939 0,8212 0,8461 0,8686 0,8888 0.9066 0.9222 0,9357 0,9474 0,9573 0,9656 0,9726 0,9783 0,9830 0,9868 0,9898 0,9922 0,9941 0.9956 0,9967 0,9976 0.9982 0.'9993
3 0,5120 0,5517 0,5910 0,6293 0,6664 0,7019 0,7357 0,7673 0,7967 0,8238 0,8485 0,8708 0,8907 0,9082 0.9236 0,9370 0,9484 0.9582 0,9664 0,9732 0,9788 0,9834 0,9871 0,9901 0,9925 0,9943 0,9957 0,9968 0,9977 0,9983 0.9995
0,5160 0,5557 0,5948 0,6331 0,6700 0,7054 0,7389 0,7703 0,7995 0,8264 0,8508 0,8729 0,8925 0,9099 0,9251 0,9382 0,9495 0,9591 0,9671 0,9738 0,9793 0,9838 0,9874 0,9904 0,9927 0,9945 0,9959 0,9969 0,9977 0,9984 0.9997
5 0,5199 0,5596 0,5987 0,6368 0,6736 0,7088 0,7422 0,7734 0,8023 0,8289 0,8531 0,8749 0,8944 0,9115 0,9265 0,9394 0,9505 0.9599 0,9678 0,9744 0,9798 0,9842 0,9878 0,9906 0,9929 0,9946 0,9960 0,9970 0,9978 0,9984 0.9998
6 0,5239 0,5636 0,6026 0,6406 0,6772 0,7123 0,7454 0,7764 0,8051 0,8315 0,8554 0,8770 0,8962 0,9131 0,9278 0,9406 0.9515 0,9608 0,9686 0,9750 0,9803 0,9846 0,9881 0,9909 0,9931 0.9948 0,9961 0,9971 0,9979 0,9985 0.999'8
7 0,5279 0,5675 0,6064 0,6443 0,6808 0,7157 0,7486 0,7794 0,8078 0,8340 0,8577 0,8790 0.8980 0,9147 0,9292 0,9418 0,9525 ,0,9616 0,9693 0,9756 0,9808 0,9850 0,9884 0,9911 0,9932 0,9949 0,9962 0,9972 0,9979 0,9985 0,9999
8 0,5319 0,5714 0,6103 0,6480 0,6844 0,7190 0,7517 0,7823 0,8106 0,8365 0,8599 0,8810 0,8997 0,9162 0,9306 0,9430 0,9535 0,9625 0,9700 0,9762 0,9812 0,9854 0,9887 0,9913 0,9934 0,9951 0,9963 0,9973 0,9980 0,9986 0.9999
9 0,5359 0,5753. 0,6141 0,6517 0,6879 0,7224 0,7549 0,7853 0,813} 0,8389 0.8621 0,8830 0,9015 0.9177 0.9319 0,9441 0,9545 0.9633 0.9706 0.9767 0.9817 0,9857 0,9890 0.9916 0.9936 0.9952 0.9964 0,9974 0,9981 0,9986 1.0000
2,9 3,0
...........................
'
'
TABELA
Graus de Liberdade
(v)
1
Probabilidade
0,100 0,050 ..
6,31 2,92 2,33 2,13 2, o 2 1. 9-1 1,90 1,86 1,83 1,8 1 1. 8 1. 7 1,77 1. 7 1. 7 O 8 6 5
da
0,025
12,71 4,30 3, 1 8 2.78 2,57 2,45 2,37 2,3 1 2,26 2,23 2.20 2, I 8 2.16 2.15 2.13 2, I 2.1 2. I 2. o 2. o 2 I
Cauda
Superior
0,010
3 1,82 6,97 4,54 3,75 3,37 3,14 3, o 2,90 2,82 2,76
(N v e I de
0,005
65,66 9,93 5,84 4,60 -I, o 3
Significncia)
0,0025
127,32 14, o 9 7,45 5,60 4,77 4,32 4, 03 3,83 3,69 3,5 g 3. 5 o 3. -I 3 3.37 3.32 3,29 3.25 3.22 3.20 3,1 7 3,15 3,14 3,12 3,10 3. o 9 3, 08 3.07 3. 06 3, 05 3, 04 3. o 3 2,97 2,92 2,86 2.81
0,001
318,31 22,33 10,:2 I 7,17 5,89 5,2 1 4,79 4.50 4.30 4,14 4. 03 3,93 3.85 3,79 3,73 3.69 3.65 3.6 I 3.60 3,55 3,53 3.5 1 3.49 3.48 3, -I 5 3, -I 4 3. -I 2 3,4.1 3, -I o 3,39 3,3 1 3,:2 3 3,16 3,
0,0005
636,62 J 1,6 12,9.2 8,61 5,89
2 3 4 5
6 7 . 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40
3, 08 1,89 1,6-1 I ,53 1,48 1,4-1 I, -I 2 1, -I o 1,38 I,]i 1,36 1,36 I ,3 5 1 ,3 5 1. 3-1 1. 3 -I 1.33 1.33 1,33 1,33 1. 3 2 1,32 1,32 1,32 1,32 1 ,3 1 ,3 1,31 1 ,3 1,3 2 I I 1
('\
3,71 3,50 3,36 3,25 3.17 3,1 1 3. O 6 3. 01 2.9 g 2.95 2.92 2.90 2.88 2.86 2,85 2.83 2. g 2 2.81 2, g o 2,79 2,78 2.77 .2,76 2.76 2.75 2,70 2,66 2,62 2.58
5,96 5,41 5, o 4 4.78 4,59 4.32 4.32 4,22 4.12 4. 07 4, 02 3,96 3.92 3.88 3,85 3,82 3.79 3.77 3,75 3,73 3,71 3,6 g 3,67 3,66 3,65 3,55 3,46 3,37 1,30
2, i' 2 2.68 2.65 2,62 2,60 2,58 2,57 2.55 2,H 2,53 2,52 2,5 1 2,50 2, -I 9 2,49 2,H 2. -I 7 2,.P 2,46 2, -I 6 2, -I 2 2,39 2,36 2,33
1,75 I.H 1,73 1. 7 3 1.73 1.72 1.72 1,71 1,71 1,71 1. 71 1. 7 O 1,70 1. 7 O 1. 7 o 1,68 1. 6 7 1,66 I. 6 3
9 9
2, 08 2. 07 2. o 7 2. o 6 2, o 6 2, o 6 2. o 5 2. o 5 2. 05 2. 0-1 2. o 2 2, 1.93
60
120
co
oo
1,93
o9
TABELA III-
DISTRIBUIO
QUI-QUADRADO
(X )
,.:lo
Graus de Liberdade
(v)
1
da 0,900
O, 02 0,'21 0,58 1, o 6 1,61 2,20 2,83 3,49 4,17 4,87 5 . .58 6.30 7, 04 7,79 8,5.5 9,3 I 10, I O 10.90 I 1,7 o 12,40 13,20 14. O o 14,80 1.5,70 16,50 17.30 18, I O 1 8,9 o 19,80 2 0,6 o 29, I O 4 6.5 o
C a I da 0,750
0,10 0,58 1,2 1 1,92 2,67 3,45 4,25 .5, o 7 5,90 6,74 7,.5 8 8,44 9,30 I 1),2 O I I. o o 12,80 12,81) 13,70 14,60 15,.5 o 16,30 17,20 18,10 19, o o 19,90 2 1),8 o 2 I ,70 22,70 23,60 24.50 33,70 52.30
Superior 0;500
0,46 1,39 2,37 3,36 4,35 .5,3.5 6,3.5 7,34 8,34 9,34 10,30 1 1,3 12,30 13,30 14,30 16.30 16,30 17.30 18,30 19,30 2 0,3 o 2 1,3 o 22. J o 23, J o 24,30 25,30 26,30 27.30 29,30 29.30 39,31) 59.30
(N v e I de 0,250
1, J 2 2.77 4,11 5,39 6,63 7,84 9, o 4 10,20 1 1,4 o 1 2.5 13.70 14.80 16, o o 17, 10 18,20 2 0,.5 2 0,5 2 1,6 22.70 23.80
':;ignificncia) 0,100 ,
2.71 4.61 6.25 7,78 9,24 10,60 1:::, o o 13.41) 14,70 16, OO 17.30 18 . .5I) 19.80 2 I. I O 22,30 2 ~. 8 O'
24.80
0,950
0,050
3,84 5,99 7,81 9,49 1 1.1 I) 12,60 14,10 1 .5 .5o 16.90 18.30 19,70 :::I . o I) :::2." I) :::3.7 o :::5, OI) :::7 .60 :::7,6 o :::8.9 o 3 O. I o 3 I ," o 32,70 33,90 35,20 36," 37,70
0,025
5, o 2 7.38 9,35 11,10 12,8 14,4 o 16, o o 17,.5 o 19,0 o 2 1),5 o 2 1,9 O :Z3.3 o 24,70 26, 10 Z7,.5 o 3 0.2 o 3 0,2 o 3 1,5 O 32,90 3 4,2 o J 5,5 J 6,8 38.10 39,40 4 0,6
0,010
6.63 9,21 1 1,3 o 1 J. 3 o 1.5, 1 o 16,80 18,50 2 0.1 21,70 23020
2
3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60
0,00 0,20 0,12 0,30 0,.5 .5 0,87 1,24 1,6.5 2,0 9 2,.5 6 3, 0.5 3,.5 7 4, 1 I 4,66 5,2 J 5,81 6,41 7, O I 7,63 8,26
8,90
0.01 O, I o 0,35 0,71 1, 1 .5 1,64 2,17 2,73 3,33 3,9" 4.57 .5.23 5.89 6.57 7,26 7.96 8.67 9.39 10. I o 10.90 1 1,6 O 12. J o 1 J. I o 13,80 14.60 1.5 .40 16,20 16.90 17.70 18,50 26.50 43.20
I)
24,70 26.21) 27. i I) 29,10 3 0.6 o 33.40 3 J. 4 I) 34.80 36,::: o 37,61) 38.90 40,30 4 1,6
4
J.
o o o
26, Oo 27,20 28,40 29.60 3 1),8 o 3:::. o o 33.21) J.1, 4 o 3:',61) 36,70 37,90 39, I O 40.30 51,80 7 ~. 40
24,90 26, o o 27, I o 28,20 29,30 3 0,4 o 3 I ,5 O 32.60 33,70 34,80 4.5.60 67. O o
o o o
I)
oo
J
44.
..............................................
-
TABELA IV VI
DISTRIBUlO
= V2 =
Nvel de Significncia
~
1
de 10%
3 .'
53,59 9,16 S, 3 9 4,19 3,62 3,29 3,0 7 2,9:: 2,81 2,73 2,66 2,61 2.56 2,52 2.49 2,46 2,44 2,42 2,40 2,38 2,36 2,35 2,34 2,33 2,32 2.31 2,30 2,29 2,28 2,28 2.23 2,18 2,13 2, 08
1
39,86 8,53 5,54 4,54 4,06 3,78 3.59 3,46 3,36 3,29 3,23 3,18 3,14 3,10 3,0 7 3, o 5 3,0 3 3,01 2.99 2,97 2,96 2.95 :2,94 2,93 2,92 2,91 2.90 2,89 2,89 2.88 2.84 2.79 2.75 2,71
2
49,50 9,00 5,46 4,32 3,78 3,46 3,26 3,11 3, 01 2.92 2,86 2.81 2,76 2,73 2,70 2.67 2.64 2,62 2.61
4
55,83 9,24 5,34 4,11 3,5:: 3,18 2,96 2,81 2.69 2.61 2,54 2,48 2,43 2.39 2,36 2,33 2.31 2,29 2.2 i 2.25 2,23 2,22 2,21 2,19 2.18 2.1"7
2.1 i
5
57,24 9,29 5,31 4,05 3,45 3,1 1 2,88 2,73 2,61 2.52 2,45 2,39 2.35 2.31 2,27 2,24 2.22 2.20 2,18 2.16 2,14 2,13 2,11 2.10 2,09 2. o 8 2,0 7 2,06 2. o 6 2. o 5 2,00 1,95 1,90 1,85
6
58,20 9,33 5,28 4,01 3,40 3, 05 2,83 2,67 2.55 2,46 2.39 2,33 2,28 2.24 2,21 2. I 8 2,15 2,1) 2,1 1 2,09 2,0 8 2,06 2, 05 2,04 2. o 2 2.01 2,00 2,00 1,99 1,98 \ ,93 I. 8 7 1,82 1,77
7
58,91 9,35 5,27 3,98 3,37 3,0 1 2,78 2.62
8
59,44 9,37 5,25 9,95 3.34 2.98 2,75 2.59 2.47 2.38 2.30 2.24 2,20 2.15 2.12 2.09 2.06 2,04 2.02 2.00 l. 98 1,97 1, 95 1,94 1, 9 3 1,92 1,91 I. 90 I. 8 9 1,88 I, 8 3 I. 7 7 I. 72 1,67
9
59,86 9,38 5,24 3,94 3,32 2,96 2.72 2,56 2.44 2,35 2,27 2,21 2.16 2,12 2, o 9 2,06 2,0 3 2,0 o 1.98 1,96 1,95 1,9) 1,9:: 1,91 1,89 1,83 1,81 1,87 1,86 1,85 \,79 1,74 1,68 1,63
10
60,19 9,39 5,23 3,92 3.3 o 2,94 2.70 2,54 2.42 2,32 2.25 2.19 2,14 2,10 2, o 6 2.0 ) 2,0 o l. 98 1, 9 6 I. 94 1,92 l. 9 o 1, 8 9 1,88 1, 8 7 1,86 1,85 1,84 I. 8 3 1,82 I, 7 6 1,71 1,65 1,60
12
6 0,71 9,41 5,22 3,90 3,27 2,90 2,67 2,50 2,38 2,28 2,21 2,15 2,10
15
6l,22 9,42 5,20 3,87 3,24 2,87 2,63 2,46 2,34 2.24 2.17 ::.10
20
61,74 9,44 5,18 3,84 3,21 2,84 2,59 2,42 2,30 2,20 2,12 2,06 2.01 I. 96 I. 9 2 1,89 1,86 1,84 1,81 1,79 1,78 1,76 1,74 1,73 1,72 1,71 1.70 1,69 1,68 1,61 \,6\ 1,54 1,48 1,42
24
62.0 o 9.45 5.18 3,83 3,19 2,82
30
62,26 9,46 5,17 3,82 3,17 2,80
40
60
120
00
2 3 4
6
6
7 8
2,58
2,40 2.28 2.18 2.10 2.04 1,98 I. 9 4 I. 9 o I. 8 7 I. 8 4 I. 81 1,79 1,77 1,75 I. 73 1,72 1,70 I. 6 9 1,68 1,67 1,66 1,65 1,64 1,57 1, 5 I 1.45 1,38
2,56
2,38 2.25 2,16 2.08 2,0 1 1,96 1,91 1,87 1, 8 4 1,81 1,78 1,76 1,74 1, 7 2 1,70 1,69 1,67 1,66 1.65 1,64 1,6 ) 1,62 1.61
9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 25 27 28 29 30 40 60 120
00
2.51
2.4 I 2.34 2.20 2.23 2.19 2.16 2.1) 2.10 2.08 2,06 2,0 4 2,02 2,01 1,99 1,98 1,97 I. 9 6 1,95 I. 9 4 1,93 I. 93 I. 8 7 I. 8 2 1.77 1,72
2.05
2.01 I. 97 I. 9 4 I. 91 1, 8 9 1.86 I. 8 4 l. 8 3 1,81 1,80 1,78 1, 7 7 1,76 1,75 1,74 I. 7 3 1,72 \,66 1,6 o l. 55 1,49
:: ,o
2,53 2,52
2,51
2.50
2.50
2.49 2.44 2,39 2,) 5 2,30
5 2, 02 1,99 1,96 1,93 1,91 1,89 1,87 1,86 1,84 1,83 1,82 1,81 1,80 1,79 1,78 1,77 1,7\ 1,66 1,60 1,55
\,54
1,48 1,41 1,34
63,33 63,06 62.79 62.53 4,49 9,47 9,48 9,47 5,13 5,14 5,15 5,16 3,76 3,78 3,79 3,80 3,10 3,12 3,14 3,16 2,72 2,74 2,76 2,78 2,47 2,49 2,51 2.54 2,29 2,32 2,36 2.34 2,16 2.18 2.21 2.23 2, 08 2.06 2. I I 2.13 1,97 2.00 2. o 3 2.05 1,93 1.90 1,96 I. 99 1,85 I. 8 8 1,90 I. 9 3 1,80 I. 8 3 1.86 I. 8 9 I. 7 9 I. 76 I. 8 2 1,85 1, 7 2 1,75 I. 7 8 1.8 I 1, 7 2 1,69 I. 7 5 I. 7 8 1,69 1.66 1.72 I. 75 1,67 1,63 1,70 I. 7 3 1,64 1.61 1,68 1,71 1,59 1,66 1,62 1,69 1,57 1,60 1,64 1,67 1, 55 I. 59 I. 6 2 1,66 1,53 1,57 1,61 1,64 1,52 1,56 1,59 1,63 1,50 1,54 1,53 1,61 1,49 1,53 1,5 i 1.6 o 1,43 I. 5 2 1,56 1,59 1,47 1, 5 I 1,55 1,58 1,46 1,50 I. 5 4 I. 57 I, 4 2 I, 4 7 I. J 8 I, 5 \ I. 2 9 1.44 1,40 1,35 1, 2 6 1,19 1,37 1,32 1,00 1,17 1.3 o 1.24
TABELA IV - DISTRIBUIO
Vi
F - Continuao
Nvel de Significncia
1
V2
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
de 5%
3 4 5 6
7 8
9
10
12
15
20
24
30
40
60
120
23
24
25
26 27 28 29 30 40 60 120
<Xl
254,30 253,30 252,20 251,10 250,10 249,10 248.00 245,90 2 olI. 90 H3.90 240.50 238,90 2H,00 236.80 224,60 230,20 199,50 215.70 161,40 19,50 19.49 18.ol8 19,47 19,45 19.46 19.45 19,43 19,40 19.41 19,38 19.35 19,37 19,33 19,25 19,30 19,16 19,00 18,51 8.53 8.55 8.57 8.59 8,6ol 8,62 8,66 8,7ol 8,70 8.81 8.79 8.8ol 8.74 8,85 9,12 9,28 9.0 I 9,55 10,13 5.63 5,66 5,69 5.72 5,75 5,77 5.80 5,86 5.91 6,04 6,00 5.96 6.09 6,39 6,26 6.16 6,59 6.94 7,71 4,40 4.36 4,43 4,46 4,50 4,53 4,56 4,62 4.7ol 4,68 4.77 4,81 4.88 4,95 5,41 5,19 5,05 5,79 6,61 3.67 3,70 3.74 3.77 3,81 3,87 3,84 3,94 4,00 4,10 4,06 4,15 4.21 4,39 4,28 5.1ol 4,53 4.76 5,99 3,23 3,2i 3.30 3,38 3.H 3.4ol 3.41 3,51 3,6ol 3,68 3.57 3.79 3,73 3,97 3.87 4,12 4,74 4,35 5,59 2.93 2.97 3.0ol 3,0 I 3,08 3.12 3.15 3.22 3,39 3.28 3,44 3.35 3.50 4,07 3,69 3.58 4.46 3.84 5,32 2.71 2.75 2.79 2.83 2,86 2,9ol 2.90 3,lol 3,0 I 3.07 3.18 3,23 3,29 3.37 3.63 3.48 4.26 3.86 5,12 2.H 2.58 2.62 2.66 2,70 2,77 2.H 2,85 2.91 2,93 3.1ol 3.02 3.07 3,33 3.22 3,48 4.10 3.71 4.96 2.40 2.45 2,49 2.53 2.57 2,61 2.65 2,72 2.79 2.90 2,85 30,1 2,95 3,20 3,09 3,59 3,36 3,98 4,8-1 2.30 2.H 2.38 2,43 2.47 2,51 2.5ol 2,62 2.69 2,85 2.80 2.75 2.91 3,49 3.1 I 3.00 3.26 3,89 4.75 2.21 2.25 2.3ol 2.30 2,38 2,46 2.42 2,53 2.67 2,60 2.71 2.83 2.77 3,03 2,92 3,41 3,18 3.81 4.67 2.13 2,22 2.18 2.27 2.31 2.35 2.39 2,46 2.65 2,60 2.53 2,70 2.76 3,11 2,85 3,34 2.96 3.74 4,60 2,07 2.11 2.16 2.20 2.25 2.29 2.33 2.5 ol 2.40 2,6ol 2,48 2.59 2,79 2.71 3,06 2,90 3,29 4.5 ol 3.68 2.0 I 2.06 2.11 2,15 2,19 2.2ol 2.28 2.42 2.35 2,H 2.49 2.7ol 2.59 2.66 3,24 3,0 I 2.85 3,63 4,49 1.96 2.0 \ 2,06 2.10 2.15 2.19 2.23 2.31 2.38 2.49 2.45 2.61 2,55 2,81 2.70 3,20 2.96 3,59 4,45 1,97 1.92 2.02 2.06 2.11 2,15 2.19 2,27 2,3ol 2.46 2.41 2.58 2.51 2.93 2.77 2,66 3,55 3.16 4,41 1.88 1,93 1.98 2,03 2,07 2,11 2.16 2,31 2.23 2,38 2.42 2,74 2,48 2.54 3,13 2,90 2.63 3.52 4.38 1.84 1,90 1.95 1,99 2,04 2,12 2.08 2,20 2,35 2.28 2,39 2.5 I 2,45 2,87 3,10 2.71 2.60 3,49 4.35 1,87 1.81 1,92 1,96 2,01 2,05 2.10 2,18 2.25 2.37 2,32 2,57 2.49 2,42 2,68 2.84 3,47 3.07 4,32 1,8ol 1.78 1,9ol 1,89 1.98 2.07 2.03 2,34 2,23 2.15 2.46 2.30 2,82 2,66 2.40 3,4ol 3,05 2.55 4,30 1,76 1,8\ 1,86 1,91 1,96 2.0 I 2,05 2,20 2,13 2,27 2.4ol 2.32 2.6ol 2.37 3,03 2.80 2.53 3.42 4.28 1.73 1.8ol 1.79 1,9ol 1.89 2.03 1.98 2.11 2.18 2.30 2.25 2,62 2,51 2.42 2.36 2.78 3,40 3.01 4.26 1, 77 1.71 1,82 1,92 1.87 1,96 2.01 2,09 2,16 2.28 2,34 2.24 2.40 2.76 2.49 3,39 2.60 4.2ol 2.99 1,69 1.75 1,80 1,85 1,90 1,99 1,95 2,07 2.15 2.27 2.39 2,H 2.22 2.7 ol 2,59 2.47 2,98 3.37 4,23 1,67 1,73 1.79 1,84 1,88 1,97 1.93 2,06 2.25 2,20 2.13 2,46 2.37 2,31 2,57 2,96 3,35 2.73 4.21 1,65 1, 71 l. 77 I. 82 1,87 1,96 1,90 2,04 2.12 2.24 2,19 2.36 2,29 2,71 2,56 2.45 3.34 2.95 4.20 1,64 1, 70 1,75 1,81 1,85 1,94 1,94 2,03 2.\ O 2,13 2,43 2,2 S 2.22 2.35 2,55 2,93 2.70 3,33 4.18 1,62 1.68 1,74 1,79 1,84 1,89 1,93 2.09 2.0 I 2.21 2,16 2.33 2.27 2.42 2,69 2.53 2,92 3.32 4.17 1,51 1,6ol 1,58 1,69 1,74 1, 79 I. 80l 2.00 1,92 2.12 2.0 :; 2,ol5 2.25 2.1 S 2,84 2.H 2.61 3.23 4,08 1,47 1.39 1,53 I, 59 1,65 1,70 1,8ol 1,75 1,92 2.04 2,10 2.17 1.99 2,76 2.53 2.25 2.37 4,00 3.15 1,25 1,35 1,43 1,50 1,55 1,61 1.66 I. 83 1,75 1.96 1,91 2,02 2.ol5 2.09 2,68 2.29 2.17 3.07 3,92 1.00 I. 22 1.32 1,46 1.39 1.75' 1.57 1.52 1,67 1,94 1.88 I. 8 3 2,21 2.01 3,8ol 2.60 2.3 i 2.10 3.00
= V2 =
"
Nvel de Significncia
1
1 2 3 4 5 6 7 4052,00 98,50 34, \2 2\ ,20 16,26 13,75 12,25 1\ ,26 10,56 10,04 9,65 9,33 9,07 8,86 8,68 8.53 8,40 8,29 8, \8 8,10 8,02 7,95 7,88 7,82 7,77 7,72 7,68 7,64 7,60 7,56 7,31 7,08 6,85 6,63
de 1%
,.
2
4999,00 99,00 30,82 \8,00 13,27 10,92 9.55 8,65 8,02 7,56 7,21 6,93 6,70 6,51 6,36 6,23 6.1\ 6,01 5,93 5.85 5,78 5,72 5.66 5,61 5,57 5.53
3
5402,00 99, \7 29,46 \6,69 12,06 9,78 8,45 7.;9 6,99 6,55 6,22 5.95 5.74 5.56 5,42 5,29 5,18 5,09 5.0 \ 4,94 4,87 4,82 4,76 4,72 4,68 4,64 4,60 4,57 4,54 4,5 I 4,31 4, \3 3,95 3,78
4
5625,00 99,25 28,7\ 15,98 11,39 9.15 7.85 7.0 \ 6,42 5,99 5.67 5.41 5.21 5.04 4.89 4.77 4.67 4.58 4.50 4.43 4,37 4,3\ 4.26 4.22 4.18 4.14 4,11 4.07 4.04 4,02 3.83 3,65 3.48 3.32
5
5764,00 99,30 28,24 \5,52 10,97 8,75 7,46 6,63 6.06 5,64 5,32 5,06 4,86 4,69 4,56 4,H 4.34 4,25 4,17 4,10 4,04 3,99 3,94 3,90 3,85 3,82 3,78 3,75 3,73 3,70 3,5\ 3,34 3,17 3.02
6
5859,00 99,33 27,9\ \5,2\ 10,67 8.47 7,19 6.37 5.80 5.39 5.07 4,82 4.62 4.46 4.32 4.28 4.10 4.0 \ 3.94 3.87 3.8\ 3,76 3,71 3.67 3,63 3.59 3.56 3,53 3.50 3.47 3.29 3,12 2.96 2.80
7
5928.00 99.36 27067 14,98 10.46 8.26 6,99 6, \8 5.6 I 5.20 4.89 4.64 4.44 4.28 4.\4 4.03 3.93 3.84 3.77 3,70 3.64 3.59 3.54 3.50 3,46 3.42 3.39 3.36 3.33 3.30 3.\2 2.95 2.79 2.64
8
5982.00 99,37 27,49 \4,80 10,29 8,10 6.84 6,03 5,47 5.06 4,74 4,50 4,30 4,14 4,00 3,89 3,78 3,7\ 3,63 3,% 3,5\ 3,45 3,41 3,36 3,32 3.29 3,26 3,23 3.20 3,17 2,99 2.82 2.66 2.5\
9
6022,00 99,39 27,35 14,66 10.16 7,89 6.72 5.9\ 5.35 4,94 4,63 4,39 4,19 4.03 3,89 3.78 3,68 3,60 3.52 3,46 3.40 3,35 3.30 3,26 3.22 3, I 8 3,\5 3,\2 3,09 3,07 2.89 2.72 2.56 2.4\
10
6056,00 99,40 27,23 \4,55 10,05 7,87 6.62 5,8\ 5,26 4.85 4.54 4,30 4.10 3,94 3.80 3,69 3,59 3,5\ 3,43 3.37 3,31 3,26 3.2\ 3.\7 3, I 3 3,09 3,06 3,03 3,00 2,98 2,80 2,63 2,47 2.32
12
6106,00 99,42 27,0 5 14,37 9.98 7,72 6,47 5.67 5, I I 4,71 4,40 4, \6 3,96 3,80 3,67 3.55 3,46 3,37 3.30 3,23 3.17 3,12 3.07 3,03 2,99 2,96 2.93 2.90 2,87 2,84 2.66 2.50 2.34 2.18
15
6\57.00 99.43 26,87 14.20 9.72 7.56 6.3\ 5.52 4.96 4.56 4,25 4,0 I 3.82 3.66 3,52 3.4\ 3.31 3,23 3,15 3.09 3,03 2.98 2.93 2.89 2.85 . 2.8\ 2.78 2.75 2.73 2,70 2.52 2.35 2.19 2.04
20
6209,00 99,45 26,69 14,02 9,55 7,40 6.16 5,36 4.81 4,4 I 4,10 3,86 3.66 3.51 3.37 3.26 3,16 3.08 3,00 2.94 2.88 2,83 2.78 2,74 2.70 2.66 2.63 2.60 2.57 2,55 2.37 2.20 2.03 1,88
24
6235,00 99,46 26,60 13,93 9,47 7.3\ 6.07 5,28 4.73 4.33 4,02 3.78 3,59 3,43 3,29 3.18 3.08 3,00 2,92 2,86 2,80 2.75 2,70 2,66 2.62 2,58 2,55 2,52 2,49 2,47 2.29 2,12 1,95 1.79
30
626\,00 99,47 26,50 \3.84 9.38 7.23 5.99 5.20 4,65 4,25 3.94 3,70 3,5\ 3.25 3.2\ 3, \ o 3,00 2.92 2.84 2.78 2.72 2.67 2.62 2.58 2.5-1 2,50 2.47 2,44 2.4\ 2.39 2.20 2.03 1.86 1,70
40
6287.00 99,47 26,4\ 13,75 9,29 7,14 5,9\ 5, \2 4.57 4,17 3,86 3.62 3,43 3.27 3.13 3,02 2,92 2,84 2,76 2,69 2.67 2,58 2.54 2.49 2,.0 2,42 2,38 2,35 2,33 2,JO 2. \\ \,94 \,76 1,59
60
6313.00 99,48 26,32 13,65 9.20 7.06 5,82 5.03 4.48 4.08 3.78 3,54 3.34 3,18 3,05 2,93 2,83 2.75 2.67 2.6\ 2.55 2.50 2,45 2,40 2.36 2,83 2.29 2,26 2.23 2,2\ 2.02 \ ,84 1.66 1.47
120
6339,00 99,49 26,22 13,56 9,1\ 6.97 5.74 4.95 4.40 4,00 3,69 3,45 3,25 3,09 2.96 2.84 2,75 2,66 2,58 2.52 2.46 2.40 2.35 2.31 2.27 2,23 2.20 2,17 2.\4 2,11 \,92 I. 73 1,53 1.32 6366,00 99,50 26, \3 13,46 9,02 6,88 5.65 4.86 4,3 I 3,9 I 3,60 3,36 3,17 3.04 2,87 2,75 2,65 2,57 2,49 2.42 2,36 2,31 2,26 2.2\ 2, \ 7 2. I 3 2, I o 2,06 2,03 2,0 I I. 80 1.60 1,38 \ ,00
8 9
10 11 12 13 1'4 15 16 17
18
19 20 21 22 23 24 25 26 27 28 29 30 40 60 120
00
5.49
5.45 5,42 5,39 5.\8 4.98 4,79 4.6\
I1
II
---~--PERODO: 98.1
PROFESSORES: CLAUDIA REGINA O. P. LIMA MANOEL R. DE SENA JR. JOZEMAR P. DOS SANTOS
'
UNIVERSIDADE FEDERAL DA PARABA CENTRO DE CINCIAS EXATAS E DA NATUREZA DEPARTAMENTO DE ESTATSTICA LISTA DE EXERCCIOS DE ESTATSTICA DESCRITIVA UNIDADE I DISTRIBUIO DE FREQUNCIA
2) Os seguinte nmeros referem-se ao nmero de itens defeituosos por lote de 40 itens. Disponha os dados numa distribuio de freql1ncia para valores isolados, o grfico de barras e a ogiva.
05 08 03 00 12 00 04 01 09 09 05
\O
OI 08 04 08
10 02 00 03
11 03 07 07
08 08 05 02
07 04 0(, 0(,
07 04 05 02
OJ
03 03 05
3) Numa amostra de 49 participantes, vrias tarefas foram atribudas, pessoa, anotando-se os tempos (em minutos) de realizao:
17.82 18.26 23.19 20.01 20.90 21.30 18.49 14.51 13.24 17.38 15.64 18.76 20.14 16.79 15.66 13.90 16.78 18.90 14.59 I.70 15.69 17.00 18.96 20.34 21.52 17.84 14.55 17.66 20.14 19.40 17.30 13.98 18.92 l.73 16.88 15.18 14.20 17.50 15.75 14.50 17.83 15.40 21.20 22.42 25.30 24.38 18.93 ).8 20.00
uma a cada
Construa uma distribuio de frequncia por intervalo e represente graficamente esta distribuio, atravs de histograma, polgono de freql1ncia e ogiva.
~
" 's.
o
I 2 3 4 5
()
ri I
"
4 3 2
0.25 0.15
7 Total
20
....
b)
Classes
0-2 2-4 4-6 10 10-12 Xi I
r'i
:Hl
~ 5
7 27 15
lO \OU
x-
72
~n
13 91
o. 10
0.07
14 - 16 Total
--
MEDiDAS DE POSIO 5) Quais as medidas de posio? Defina-as. 6) O nmero de carros vendidos por cada um dos 10 vendedores de uma agncia, em um dado ms, em ordem crescente, : 2,4,7, 10, 10, lO, 12, 12, 14, 15. Calcule a mdia, a moda e a mediana c inlerprete-as. 7) Os dados seguintes referem-se pluviosidade anual, nos ltimos 50 anos, numa determinada regio.
15.2 23.4 25.1 30.1 28.0 14.6 17.8 42.0 30.1 25.3 27.9 26.9 35.2 22.1 31.8 24.9 10.8 15.6 24.4 31.0 20.0 19.9 25.5 28.7 28.3 41.5 1.X 21).7 15.0 13.5 10.7 31.4 27.8 2.1 32.1 30.0 19.8 14.6 28.2 25.4 35.7 29.6 22.1 11).4 26.7 40.9 28.2 24.1 28.7 36.8
a) Construa uma distribuio de frequncia com o nmero de classes necessrio; b) Calcule a mdia, llloda e mediana com dados isolados e, atravs da distribuio de frequncia. Compare os rcsultados. 8) Enumere pelo mcnos 4 propriedades da mdia. 'MEDIDAS DE DISPERSO 9) a) b) c) Defina e diga a sua utilidade: Varincia; Desvio Padro; Coeficiente de Variao.
10) Para os dados do exerccio 06, calcule a varincia, o desvio padro e o coeficiente de variao e interprete-os. 11) Com os valores <:\.0 exerccio 07, ealcule a varincia, o desvio padro e o coeficiente de variao, atra~s da distribuio de frequncia e para os dados isolados, interpretando os resultados
c comparando-os.
12) Enumere 02 propriedades da varincia. 13) O peso mdio dos alunos de 67.3 kg. com desvio padro de 10kg., enquanto que a altura mdia de 170 em. com desvio padro de 15 cm. Qual das medidas mais homognea ?
'
'
DEPARTAMENTO
MEDIDAS DE POSIO
5) 6) 7) a) b) 9,6; 10; 10. 27,272; multi-modal (14,6; 22,1; 28,2; 28,7;30,1; 36,8); 27,95; 27,4; 28,088; 27,559 . 8) -
MEDIDAS DE DISPERSO
9) 10) 17,378; 4,169; 43,42% 11) 49,373; 7,026; 25,76%; 48,145; 6,939; 25,32% 12) 13) Altura
UNIVERSIDADE FEDERAL DA PARABA CENTRO DE CINCIAS EXATAS E DA NATUREZA DEPARTAMENTO DE ESTATSTICA LISTA DE EXERCCIOS DE PROBAI3ILIDADE UNIDADES 11E 111
EXPERIMENTO
ALEATRIO
1) Considerc
os
cxpcrimcntos
aleatrios
dados
seguir
idcntifiquc
espao
amostrai
correspondente
a cada um.
a) Em um estoque de 100 peas de uma linha de produo so contadas o nmero de, peas .defeituosas. b) Peas so fabricadas at que uma dzia de peas perfeitas sejam produzidas e o nmero total de peas produzidas contado. c) Peas que saem de uma linha de produo so marcadas defeituosas (D) ou no defeituosas (N). As peas so inspecionadas e sua condio registrada. Isto feito at que duas peas defeituosas consecutivas sejam fabricadas, ou que quatro peas tenham sido inspecionadas, aquilo que ocorrer em primeiro lugar. .
NOES DE PROBABILIDADE
y - x e P(A u 13) = z
P(A); P(B); P(A (lB); P(A u JJ) 3) Uma loja dispe de 12 geladeiras do mesmo tipo, das quais 4 aprescntam defeitos. a) Se um fregus vai comprar uma geladcira, qual a probabilidade de levar uma geladeira defeituosa? b) Se uma fregus comprar duas geladeiras, qual a probabilidade de levar uma defeituosa e outra perfeita? 4) Sabendo-se que 20% das peas produzidas por um processo apresentam defeito do tipo I, 10% do tipo lI, e 25% pelo menos um dos dois defeitos, qual a probabilidade de que uma pea tenha: a) Os dois defeitos? b) Somente defeito do tipo II ? 5) Um dado viciado de modo que eada nmero par duas vezes mais provvel de aparecer que qualquer nmero impar.' Encontre a probabilidade de: a) Aparecimento de um nmero par. b) Aparecimento de um nmero menor que 3.
6) Dez fichas numeradas de I a 10 so misturadas em uma urna. Duas fichas numeradas (X, Y) so extradas uma a uma, sucessivamente e sem reposio. a) Qual a probabilidade de que X + Y = lO? b) Qual a probabilidade de que Y > 6X ?
PROBABILIDADE
CONDICIONADA
7) Trs turmas X, Y e Z tm, respectivamente, 60%, 30% e ] 0% do total de um curso. As percentagens de um aluno com mdia abaixo de 7 so, respectivamente, 2%, 3% e 4%. Um aluno escolhido aleatoriamente. a) Qual a probabilidade destc aluno tcr mdia abaixo de 7? b) Se um aluno teve mdia abaixo de 7, qual a probabilidade de ser d' turma Z ? 8) Uma indstria fabrica trs modelos de turbinas. Os percentuais de fabricao para os trs modelos so respectivamente 40%, 30% e 30%. Os percentuais de vendas para cada modelo so: 90%, 80% e 95%, respectivamente. Uma turbina escolhida ao acaso na produo.
a) Qual a probabilidade dela ser vendida? b) Se ela no for vendida, qual a probabilidade de que ela seja do modelo 2 ? c) Se ela for vendida, qual a probabilidade de que ela no seja do modelo] ?
EVENTOS INDEPENDENTES 9) Sejam A e B dois eventos, tais que P(A) = 0,4 e P(A u H) = 0,7. Seja P(B) = p. Para que valor de "p", A e B sero mutuamente excludentes? Para que valor de "p", A e B sero independentes? 10)Numa oficina funcionam 6 mquinas idnticas, para qualquer uma dclas, a probabilidade de entrar em pane durante um dia de trabalho igual a O,]. Supondo-se que as falhas ocorram independentemente entre si, pede-se para calcular a probabilidade: a) Nenhuma entrar em pane. b) Pelo menos uma entrar em pane.
11) De uma caixa que contm 7 peas das quais 4 so defeituosas, retirou-se, sem reposio, 3 peas. Defina X = n' de peas defeituosas entre as retiradas. Determine: a) A distribuio de probabilidade de X. b) A funo de dlstribuio acumulada de X. c) O nmero esperado de peas defeituosas.
-..,.,...--
-~
1)( A
V)
= X = { -.,se.x = 1,2,3. 5
O,caso. contrario
CX
a) Encontre c e determine o valor mais provvel de X. b) Encontre a funo de distribuio acumulada de X. 13) Suponha que a porccntagem de lcool (lOOX) em certo composto uma v. a , onde X, O<X< I, tcm a seguinte densidade: 2(l- x ),0 < x < 1 I(x) = { O,caso.contrario a) Encontre a funo de distribuio acumulada de X. b) Calcule a percentagem mdia dc lcool no composto. c) Considere que o preo de venda deste composto dependa do contedo de lcool. Espccificamcnte, se 0<x<1/3, o composto vendido por R$ 2,88 o litro. Se 1/3<x<l, o preo de venda de R$ 2,61 o litro. Calcule o prco mdio de venda, por litro, do composto.
DISTRIBUIO
BINOMIAL
14) Suponha que uma v. a X tenha distribuio binomial, com mdia E(X) = 4 e varincia V(X). = 3. a) Encontre n. b) Calcule P(X <2). 15) Um estado onde h grande nmero de residncias na zona rural, tem 60% dessas residncias seguradas contra incndio. Sorteia-se 8 residncias ao acaso, com reposio. Se X o nmero de residncias seguradas contra incndio, calcule: a) A probabilidade de que pelo menos 3 dessas 8 residncias tenham seguro contra incndio. b) O nmero esperado e a varincia do nmero de residncias no seguradas contra incndio.
DISTRIBUIO
UNIFORME
16) Dizemos que X tem distribuio uniforme no intervalo (a,b), se sua densidade for do tipo:
1
I(x) =
{
-b-,.a<x<!J
17) O erro X na lcitura de um medidor de presso tcm distribuio uniforme no intervalo (-1/4,1/4). a) Calcule a probabilidade de cometer um erro inferior a 1/8. b) Calcule a mdia e o desvio padro da distribuio do erro.
DISTRIBUIO NORMAL
18) O nmero de pedidos para a compra de ccrto produto que uma companhia recebe por semana, distribui-se normalmente com mdia 125 unidades e dcsvio padro 30 unidades. Se uma certa semana, o estoque disponvel de 150 unidades, qual a probabilidade de que todos os pedidos sejam atendidos? 19) O tempo de vida de transistores produzidos por certa indstria, tcm distribuio aproximadamente normal com valor espcrado dc 500 horas e desvio padro dc 50 horas; a) Qual a probabilidade de que um transistor produzido por essa indstria tenha vida inferior aSSO horas? b) Um comprador exigc quc pelo mcnos 95% dos transistores fornccidos tcnham vida supcrior a 400 horas. Esta exigncia dele ser cumprida? ) Se tomarmos uma amostra dc 10000 desses transistorcs, quanto se espera que tenham vida superior a 600 horas ? 20) Suponha que a carga de ruptura X de um cabo (Em Kgt) tcnha distribuio N(lOO,16). Cada cabo fornece um lucro de R$ 3,50 se X>95. Se X<95, o cabo poder ser utilizado para uma finalidade diferente dando um lucro de R$l ,20. Fabricando-se muitos desses cabos, qual o lucro esperado por cabo ? 21) Suponha que o vo de uma porta em construo deve ser utilizado por pessoas quc tm altura normalmente distribuda com mdia 1,80m e desvio padro de 8cm. a) Qual a altura mnima, do vo da porta que no mais de 2% das pessoas batam com a cabea na
~~?
pela porta scm se curvar?
b) Se o vo da porta for construdo com 1,85m de altura, dentre 1000 pessoas, quantas passariam
CONDICIONADA
7) a) 2,5% ; b) 16% 8) a) 88,5% ; b) 52,17% ; c) 59,32% EVENTOS INDEPENDENTES 9) 30%; 50% 10) a) 53,14%; b) 46,86% VARIVEIS ALEATRIAS 11) a) -; b) -; c) 1,7 12) a) 5/6 ; 3; b)13)a)-; b)33,33%; c)2,76 DISTRIBUIO BINOMIAL
18) 79,67% 19) a) 84,13%; b) Sim; c) 228 20) 3,26 a) a) 1,9648 m; b) 736
UNIVERSIDADE FEDERAL DA PARABA CENTRO DE CINCIAS EXATAS E DA NATUREZA DEPARTAMENTO DE ESTATSTICA LISTA DE EXERCCIOS DE INFERNCIA UNIDADES IV, V E VI DISTRIBUIO AMOSTRAL 1) Suponha que uma populao seja 16. Uma amostra de 25 elementos a) Qual a probabilidade que a mdia b) Qual a probabilidade que a mdia c) Qual a probabilidade quea mdia Normalmente distribuda com mdia 10 e varincia foi retirada dessa populao. Determine: amostraI seja superior a 12? amostrai seja inferior a 8? amos"trallique entre 9 e li?
2) Os pesos de fardos recebidos por um certo depsito tem em m6dia 200 kg. e desvio padro 30 kg. Supondo Normalidade para os pesos dos fardos, pede-se: a) Determinar a probabilidade de que em uma amostras de 25 desses fardos fornea peso mdio seja superior a 210 kg. b) Se o limite especfico de segurana de um elevador de 7668 kg., determinar a probabilidade de que 36 fardos recebidos ao acaso e carregado nesse elcvador no exceda o limite de segurana. 3) Um distribuidor de sementes determina atravs de testes que 5% das sementes no . germinam. Ele vende pacotes de 200 scmcntcs com garantia dc 90% de germinao. Qual a probabilidade de um pacote no satislzer a garantia? 4) Determine a probabilidade de que, das prximas 200 crianas a nascerem, a) menos de 40% sejam nlcninos, b) entre 43% e 57% sejam meninas, c) mais de 54% sejam meninos. Admita probabilidades iguais de nascimento para menino ou menina. 5) Uma populao Normal tem varincia 15. Extraindo-se dessa populao amostras do tamanho 5, que perccntagens podemos esperar com varincias a) inferiores a lO? b) superiores a 20 ? c) entre 5 e lO? 6) A vida mdia das lmpadas fabricadas por determinada companhia de 2000 horas, com desvio padro de 60 horas. - Escolhidas 10 lmpadas ao acaso, determinc a probabilidade de o desvio padro amostrai a) no exceder 50 horas? b) estar entre 50 e 70 horas?
INTERV ALOS DE CONFIANA 1) Retira-se ao acaso uma amostra de 33 notas de um concurso para professor. Sabendo-se que a mdia dessa amostra 30,0, e que a distribuio das notas Normal com um desvio padro de 2,5, determinar:
1.1) intervalos de 90%, 92% e 95% de confiana para a verdadeira nota mdia no concurso. 1.2)Se a nota mdia est nos intervalos: a)30 :t 0,5 b)30:t 1,0 c)30:t 1,2. Determine o nvel de confiana dos intervalos. 2) O diretor de uma empresa deseja estimar o nmero mdio de horas de treinamento para seus funcionrios. Determine o tamanho mnimo da amostra necessria para tanto, admitindo um fator de erro de :t4 horas a um nvel de confiana da estimativa de 95% e um desvio padro populacional de 12 horas. 3) De 50.000 computadores usados por todas as escolas e universidades da Paraba, retira-se uma amostra aleatria de 400 dcle~ e obtm-se a vida mdia de 800 horas c o desvio padro de 100 hs. 3.1)Qual o lC de 99% para a verdadeira vida mdia de todos os computadores da Paraba? 3.2)Com que confiana dir-se-ia que a vida mdia 800 :l: 0,98? 3.3)Que tamanho deve ter a amostra para que seja de 95% a conliana na estimativa 800.:t 7,84? (Que suposies voc fez para responder as questes acima?) 4) Deseja-se estimar qual a porcentagem mdia t) da receita familiar gasta com educao pelos moradores de uma certa localidade. Para isso, selecionou-se aleatoriamente uma amostra de 16 famlias, que apresentou os resultados (em %): 41 44 35 42 34 29 42 42 38 62 29 63 38 45 48 40 Admitindo Normalidade ,para a populao, construir um intervalo com 95% para ~. 5) Em 9 testes de consumo de gs de cozinha em canteiros de obras obteve-se, respectivamente, 16, 14, 17, 15, 15, 14, 18, 17 e 18 dias/bujo de gs (sob condies especficas). Supondo Normalidade, construa IC com a)95% e b)99% para o consumo verdad.eiro mdio dirio dos canteiros por bujo de gs. 6) Suponha que estamos interessados em estimar a porcentagem de consumidores de um certo produto. Se uma amostra de tamanho 300 forneceu 100 indivduos que consomem o dado produto, determine: a) Um intervalo de 95% de confiana para verdadeira percentagem de consumidores e interprete o rcsultado. b) O tamanho da amostra para que o erro da estimativa no exceda a 0,02 unidades com probabilidade 0,95 e interprete o resultado. 7) Quinze dias antes do 2". turno das eleies presidenciais de 1989 foi feita uma pesquisa com 400 eleitores de Joo Pessoa e verificou-se que 208 eram favorveis a Lula 42 estavam indecisos e os restantes eram fhvorveis a Collor. a) Construa um intervalo de 90% de confiana para a proporo de eleitores favorveis a Lula naquela ocasio. b) Determine a confiana dos scguintes intervalos para Collor: 0,37.i0,03; 0,37.i0,04.
l_
--,
..
TESTE DE HIPTESES 1) O CREA esto riiuito preocupados com o tempo perdido com acidentes de trabalho, cuja mdia, nos ltimos tempos, tem sido da ordem de 60 horas/homem por ano e desvio padro de 20 horas/homem. Tentou-se um programa de preveno de. acidentes e, aps o mesmo, tomou-se uma amostra de 9 obras e mediu-se o nmero de horas/homens perdidas por acidente, que foi de 50 horas. Voc diria, ao nvel de 5%, que h evidncia de melhoria? 2) Uma fbrica de automveis anuncia que seus carros consomem, em mdia 11 litros por 100 km, com desvio padro de 0,8 litros. Uma revista resolve testar essa afirmao e analisa 35 automveis dessa marca, obtendo 11,3 litros por 100 km como consumo mdio (considerar distribuio Normal). O que a revista pode concluir sobre o anncio da fbrica, ao nvel de 10% ? 3) O salrio mdio dos empregados do prque industrial de J. Pessoa de 2,5 salriosmnimos, com desvio padro de 0,5 salrios-mnimos. Se uma firma particular emprega 49 empregados com um salrio mdio de 2,3 salrios-mnimos, podemos afirmar que esta indstria paga salrios inferiores, ao nvel de 5% ? 4) No passado, determinada mquina produziu arruelas de espessura mdia de 0,05 cm. A fim de verificar se a mquina ainda est em boas condies, toma-se uma amostra de 10 arruelas, cuja espessura mdia de 0,053cm., com desvio padro de 0,003cm. Teste a hiptese de que a mquina ainda est em boas condies, utilizando um nvel de significncia de 0,01. 5) Um teste de resistncia de 6 eordas fabricadas por determinada companhia acusou resistncia mdia de 7.750 tono com desvio padro de 143 ton., contra a alegao do fabricante de que a resistnca mdia seria de 8.000 tono Pode-se justificar a alegao do fabricante ao nvel de 5% de significncia ? 6) Os produtores de um determinado programa de televiso pretendem modific-lo se, pelo menos, um q~arto dos possuidores de televiso no o assistirem regularmente. Uma pesquisa encomendada a uma empresa especializada mostrou que, de 400 famlias entrevistadas, 80 assistem o programa regularmente. Baseado nos dados, qual deve ser a deciso dos produtores, ao nvel de 5% de significneia ? 7) O consumidor de um certo produto acusou o fabricante, dizendo que mais de 20% das unidades fabricadas apresentam defeito. Para confirmar sua acusao, ele usou uma amostra de tamanho 50, onde 27% das peas eram defeituosas. Mostre eomo o fabricante poderia refutar a acusao. Utilize um nvel de significncia de 10%.
....
DEPARTAMENTO
DE ESTATSTICA
- CCEN - UFPb
. Respostas da Lista dc'Exerccios_ - Unidades IV, V e Professores: Claudia~ Manoel e Jozemar Distribuio Amostrai 1) 2) 3) 4) 5) 6) a) 0,62% b) 0,62% c) 78,88% a)4,75% b) 99,53% 0,94% a) 0,23% b)95,24% c) 12,92% a) 50% b) 25% c) 25% a) 50% b) 40%
vr.
~,
'
---",.,.- ~
. ,. -.
Intervalo de Confiana 1) 1.1) 30 ::!:: O,72kg ~30 ::!:: 0,76kg ; 30 ::!:: 0,85kg 1.2) a) 74,98% b) 97,86% c) 99,42% 2) n= 35 3) 3.1) 800 ::!::12~9hs 3.2) 1 - a = 15,86% 3.3)n = 625 4} 42::!::5,10% 5) a) 16 ::!::1,22km/l b) 16 ::!::1,77km/l 6) a) 0,33:t 0,05 b) n = 2135 7) a) 0,52 :t0,04 b) 78,5%~ 90,3% Teste de Hipteses I) Aceito Ho 2) Rejeito I-L. 3) Rejeito Ho 4) Aceito Ho 5) Rejeito H~ 6) Rejeito He, 7) Aceito Ho
.,
--