Está en la página 1de 33
= Parte 2 Da descricao a tomada de decisdes Capitulo 5 Probabilidade e curva normal Capitulo 6 Amostras e populacdes Probabilidade e curva normal + Regras da probabilidade + Gélculo da probabilidade sob a * Distribuigées de probabilidade curva normal Quadro 5.1 Pratica e estatistica: ‘Quadro 5.2 Exemplo passo a paso: excedendo 0 tempo do parquimetro probabilidade sob a curva normal ‘Quadro 5.3 Exernplo passo a passo: calculo de escores de probabilidade baseadas na curva normal * Resumo + Acurva normal como uma distribuicao de probabilidade * Caracteristicas da curva normal + Omodeloe a realidade da curva normal * A area sob a curva normal © Termos-chave © Exercicios + Escores padrao e a curva normal * Exercicios em SPSS ‘a Parte I, voltamos nossa atengio para as manciras de descrever variiveis, Em particular, ¢o- megamos a explorar variaveis focando suas distribuigdes — categorizando dados ¢ elaboran- do grificos para frequéncias. Isso nos permitiu ver padrdes ¢ tendéncias, ver as acorréncias mais frequentes ¢ as mais extremas, Resumimos ainda mais essas distribuigdes por meio de calculos de medidas de tendéncia central e variabitidade. Até 0 momento, nossas interpretagdes € conclusdes a respeito de varidveis vieram somente daquilo que observamos. Coletamos informagdes a respeito de uma varivel e entdo descrevemos © que obtivemos usando uma série de medidas estatisticas, como poreentagens € médias. Desse pontoem diante, nossa abordagem sera de certa maneira diferente, Primeiro, sugeriremos determi= nadas teorias, proposigdes ou hipéteses a respeito das varidveis, que sero, entdo, testadas a partir dos dados que observamos. fundamento da romada de decisdes — 0 proceso de testar hipéteses por meio da anilise de dados — é a probabilidade. A probabilidade é um conceito dificil de compreender e, no entanto, & usado com bastante frequéncia. Fazemos perguntas como “qual a chance de eu tirar um 10 nessa Capitulo 5 + Probabilidade e curva normal 123 prova?”, “qual a chance desse casamento durar?”, “se eu tirar uma carta, qual a chance de ela ser menor do que 52°, “qual a chance desse time vencer as finais?” Em conversas no dia a dia, respon- demos essas questées com palpites vagos ¢ subjetivos, como “provavelmente”, “uma chance boa” ou “improvavel”. Pesquisadores buscam responder essas questdes de maneira muito mais precisa e cientifica, usando 0 conceito de probabilidade. Hi dois tipos de probabilidade, um baseado em matemitica teGrica e 0 outro, em abservagio sistemitica. Probabilidades te6ricas refletem o mecanismo da chance ou a aleatoriedade juntamente com determinadas suposig&es que fazemos a respeito de eventos. No caso mais simples, sabemos que probabilidade de oblermos “cara” no langamento de uma moeda ¢ de 0,5, supondo, de forma bastante razodvel, que a moeda tenha um peso equilibrado de maneira que ambos os lados tenham 4 mesma chance de sai, De maneira similar, vocé pode adivinhar a resposla de uma questiio de miltipla escolha com cinco itens para a qual vocé ndo faz ideia alguma com uma probabilidade de 0,20 de acertar a resposta, Isso presume, é claro, que as cinco respostas tenham a mesma chance de ser a resposta correta. Probabilidades empiricas so aquelas para as quais dependemos de observagio para deter- minar ou estimar valores. A probabilidade de ter um filho do sexo masculino gira em tomo de 0,51 baseado em dados demograficos de longo prazo. Apesar de haver dois resultados possiveis (deixando de lado a possibilidade de gémeos ou trigémeos), ha ligeiramente mais nascimentos de bebés do sexo masculino do que de bebés do sexo feminino, Probabilidades empiricas sao essencialmente porcentagens baseadas em um grande néimero de observagies. A probabilidade de que o time da casa venga um jogo profissional de futebol ame- ricano fica em torno de 0,6 (6 de 10 jogos vencidos pelo time da casa), um “fato” que sabemos a partir da observagao de centenas de jogos ao longo dos anos, Se nossas porcentagens sio baseadas em grandes nimeros de observagdes, podemos tratar, com seguranga, as probabilidades empiricas como estimativas razoavelmente corretas da verdade. ‘Em ambas as formas, a probabilidade (P) varia de 0 a 1,0, embora por vezes se utilize uma porcentagem no lugar de um decimal para expressar o nivel de probabilidade. Por exemplo, uma probabilidade de 0,50 (ou S chances de 10) ¢, is vezes, chamada de uma chance de 50%. Apesar de 4s porcentagens serem mais usadas na linguagem do dia a dia, a forma decimal € a mais apropriada para 0 uso estatistico, ‘Uma probabilidade de zero implica que algo é impossivel; probabilidades proximas de zero, como 0,01, 0,05 ou 0,10 implicam ocorréncias muito improviveis, No outro extremo, uma proba- bilidade de 1,0 constitui certeza, ¢ altas probabilidades como 0,90, 0,95, 0,99 significam resultados muito provaveis ou presumiveis. Algumas probabilidades sio faceis de calcular: a maioria das pessoas sabe que a probabi- lidade de obterem cara ao langar uma moeda é de 0,50. Entretanto, situagdes mais complexas envolvem a aplicagao de varias regras basicas de probabilidades. Da mesma maneira que tivemos de aprender operacées aritméticas basicas, temos de aprender algumas operagoes basicas que nos permitirdo calcular probabilidades mais complexas ¢ interessantes. Regras da probabilidade O termo probabilidade refere-se a probabilidade relativa de ocorréncia de qualquer resultado dado ou evento — isto é, a probabilidade associada a um evento é 0 niimero de vezes que o evento pode ocorrer em relagio ao nimero total de vezes que qualquer evento pode ocorrer. 124 Estatistica para ciéncias humanas Nimero de vezes que o resultado ou evento pade ocorrer Probabilidade de um resultado ou evento = Niimero total de vezes que qualquer resultado ou evento pode ocorrer Por exemplo, suponha que certo jiri consista de cinco homens e sete mulheres. Além disso, suponha que o escrevente do tribunal escolha o lider do jiri optando aleatoriamente por um carto ‘em uma pilha de 12 cartes, cada cartio impresso com o nome de um jurado, Sendo P(F) a proba- bilidade de que o lider seja do sexo feminino, pyr) — Nuimero de jurados do sexo feminine _ 7 - 9.55 Numero total de jurados 12 A probabilidade de um evento nao ocorrer, conhecido como a regra complementar da pro- babilidade, é 1 menos a probabilidade de o evento ocorrer. Desse modo, a probabilidade de que © lider do jiri nio seja do sexo femninino, sendo P(F), ¢ a barra sobre o F simbolizando “nio”, ow -complementar, € PF) = 1 PF) = 10,58 =0,42 Para outro exemplo, supanha que um determinado departamento de policia urbana seja capaz de resolver (ou solucionar) 60% de seus casos de homicidios. Desse modo, a probabilidade de solugao dos homicidios é P(C) = 0,60 (ou simplesmente 0,6). Para qualquer homicidio em particular, digamos .0 primeiro do ano, a probabilidade de que ele nao seja solucionado & de P(C) = 0.4. Uma caracteristica importante da probabilidade é encontrada na regra da soma, que afirma que a probabilidade de obtencio de qualquer um dentre varios resultados diversos e distintos & igual & soma de suas probabilidades. Isto é, a probabilidade de que o evento A ou o evento B ‘ocorram & de: P(A ou B) = P(A) + PCB) Por exemplo, suponha que 0 réu em um julgamento por assassinato em primeiro grau tenha uma probabilidade de 0,52 de ser condenado conforme a acusagio, uma probabilidade de 0,26 de ser condenado por uma acusagio menor, e uma chance de 0,22 de ser considerado inocente. A chance de uma condenago em qualquer acusagao é a probabilidade de uma condenagio na acusa- ‘go de assassinato em primeiro grau mais a probabilidade de condenagio na acusagdo menor, ou 0,52 + 0,26 = 0,78, Observe também que essa resposta concorda com a regra de complementari- dade pela qual a probabilidade de ser considerado culpado em qualquer acusagio (a complementar da inocéncia) & de 1 —0,22 = 0,78. A regra da soma sempre presume que os resultados considerados so mutuamente excluden- tes — isto &, ndo hi meios de os dois resultados ocorrerem simultaneamente, De maneira mais precisa, a ocorréncia de qualquer resultado em particular (digamos, uma condenagdo pela acusagiio por assassinato em primeiro grau) exclui a possibilidade de qualquer outro resultado, ¢ vice-versa. Presumindo resultados mutuamente excludentes, podemos dizer que a probabilidade associ da com todos os resultados possiveis de um evento é sempre igual a 1. Aqui, somando as probabi- lidades para os trés vereditos possiveis que o jiri pode dar, encontramos: Capitulo 5 + Probabilidade e curva normal 125 P(culpado da acusagAo) + P(culpado de um crime menor) + Plinocente) = 0,52 + 0,26 + 0,22 Isso indica que algum resultado tem de ocorrer: se nao uma condenagio pela acusagio de assassinato em primeiro grau, entdo uma condenago por um crime menor ou uma absolvigao. ‘Outra caracteristica importante da probabilidade se toma evidente na regra da multiplicagao, que foca a possibilidade de obier dois ou mais resultados conjuntamente, A regra da multiplicagao afirma que a probabilidade de se obier uma combinagio de resultados independentes é igual ao produto de suas probabilidades individuais. Desse modo, a probabilidade de o evento.A eo evento B ocorrerem ¢ de: PUA e B)= P(A) * PB) © pressuposto de resultados independentes significa que a ocorréncia de um resultado no muda a probabilidade do outro. Em vez de considerar a probabilidade do resultado | ou do resul- tado 2 ocorrer como na regra da soma, a regra da multiplicagio diz respeito a probabilidade de ambos ocorrerem. Retornando ao departamento de policia urbano com uma taxa de solugiio de 60%, a probabi- lidade de que dois homicidios em particular sejam solucionades ao longo do ano ¢ de: P(homicidios A ¢ B serem ambos solucionados) = P(A ¢ solucionado) « P(B € solucionado) = (0,6)(0,6) = 0,36 Ampliando a questio um pouco mais, a probabilidade de que trés homicidios em particular sejam solucionados é 0 produto das trés respectivas probabilidades: P(homicidios A, B e C sio solucionades) = P(A é solucionado) « P(B é solucionado) x P(C é solucionado) = (0,6) (0,6) (0,6) = 0.216 Para que esse cileulo seja vilido, temos de presumir que os trés homicidios considerados io independentes um do outro. Se os trés homicidios fizeram parte de uma série de assassinatos presumivelmente cometidos por um assassino em série nao identificado, entdio nem a suposicao de independéncia, nem o ealeulo em si seriam validos, Por fim, a regra da multiplicagio pode ser aplicada em muitas situagdes, € no apenas em repetigdes de eventos similares, como a solugio de homicidios. Mais exatamente, a regra da mul- tiplicagdo nos permite calcular a probabilidade conjunta de qualquer niimero de resultados desde que eles sejam independentes. Suponha que uma promotora esteja trabalhando em dois casos, um julgamento por roubo e um por sequestro. A partir de experigneias anteriores, ela acredita que tem ‘uma chance de 0,80 de conseguir uma condenagdo pelo roubo ¢ uma chance de 0,70 de conseguir uma condenagio pelo sequestro. Desse modo, a probabilidade de que ela consiga condenagdes em ambos os casos ¢ de 0,7 x 0,8 = 0,56 (ligeiramente maior do que 50%). Distribuicées de probabilidade Na Parte 1, encontramos distribuigdes de dados nas quais frequéncias e porcentagens associadas com valores em particular foram determinadas. Por exemplo, a Tabela 2.8 mostra a distribuigdo de 126 _ Estatistica para ciéncias humanas QUADRO 5.1 Pratica e estatistica: excedendo o tempo do parquimetro Hans Zeisel e Harry Kalven J, relataram 0 uso fescinante (ou melhor, equivocado) da proba- bilidade no julgamento de um homem acusado de exceder o tempo do parquimetro na Suécia' Aparentemente, um policial havia notado as dire es para as quais 2s valvulas dos pneus do car- 10 do acusado voltados para o lado da calgada estavam apontadas usando 0 método das horas cheias para contabilizar 0 tempo que 0 carro fi- cou estacionado (por exemplo, uma hora, duas horas, trés horas etc). Digamos que a vélvula do pneu da frente apontava para uma hora € a do pneu de trés, para seis horas. Voltando mais tarde, 0 policial encontrou o carro ainda estacio- nado, excedendo o limite do tempo pago, e, para verificar se esse era mesmo 0 caso, ele observou que as valvulas ainda apontavam para uma hora @ seis horas. Ele, ento, emitiu uma multa 20 mo- torista por ter excedido 0 tempe do parquimetro, © proprietério do veiculo pediu que hou- vvesse um julgamento, alegando que ele havia deixado 0 espaco por um determinado tempo e voltado a ele mais tarde. Confrontado com a pro- vva contra ele relativa a posicaa dos pneus, ele ar- umentou que aquilo era uma mera coincidéndia, Um especialista testemunhou no tribunal quanto 4 probabilidade dos dois pneus terem se posicionado da mesma maneira apés 0 carro ter sido estacionado novamente. Ponderando que ada pneu tinha uma chance de 1/12 de retornar & mesma posicéo, ele calaulou que a probabilida- de de que ambos os pneus retornassem para suas antigas posicoes ao acaso seria de W/12 x 1/12 = 1/144 (devido @ regra da multiplicacao). Aparentemente, 0 juiz considerou que a pro- babilidade de 1 em 144 de uma cnincidéncia ocor- rer deuiava uma margem razoavel de divide, & ecidiu @ favor do acusada. Ele também observou que o resultado teria sido diferente se 0 policial ti- vesse observado os quatro pneus, j& que uma pro- babililade de 1/12 « 1/12 1/12 x 12= 120.736 resultaria em chances de coincidéncia pequenas. Na realidade, 0 juiz tomou a decisao cer- ta, mas usou 0 raciocinio estatistico errado. Para aplicara regra da multiplicacdo.a fim de calcular a probabilidade de ambos os pneus casarem com ‘uas pasicoes antigas, & preciso presumir que os ppneus sejam independentes — isto é, que eles Girem independentemente, Entretanto, esse nao 60 caso: as rodas ds frente e as de trés giram em Uunissono. Quando © pneu da frente se movimen- ta, 0 de tras 0 segue (apenas os lados esquerdo. € dreito gram em rotacbes diferentes quando o carro faz uma curva), ‘A verdadeira probabilidade de que ambos 05 pneus, dianteiro ¢ traseiro, retornem para suas PosigOes anteriores é simplesmente a probabili- dade de que um deles faca isso. Em outras pala- vas, Se um pneu casa com sua posicéo anterior (com uma probabilidade de 1/12), 0 outro tam- bbém tem de fazé-to. Portanto, a probabilidade de ‘que ambos os pneus estivessem posicionados da ‘mesma maneira se 0 acusado tivesse saido e vol- tado para o espago € de 1/12, ou 0,0833. * ZEISEL, Hans; KALVEN JR., Harry. Parking tickets and rnissing women: statistics and the law. im: TANUR, Judith M. ‘al, Statistics: a guide to the unknown. S3o Francisco: Holden Day, 1978, frequéncia de notas do PSAT de 336 estudantes. Os valores possiveis das notas sdo representados por -categorias, ¢ frequéncias © porcentagens representam as ocorréncias relativas das notas entre o grupo, Uma distribuigdo de probabilidade & diretamente andloga a uma distribuigio de frequéncia, ‘exceto que ela ¢ baseada na teoria (teoria da probabilidade) em vez de observado no mundo real (dados empiricos). Em uma distribuigao de probabilidade, especificamos os valores possiveis de uma varidvel ¢ calculamos as probabilidades associadas com cada valor. As probabilidades repre- sentam a chance de cada valor ocorrer, diretamente andloga as porcentagens em uma distribuigao de frequéncia, ‘Suponha que joguemos duas moedas, ¢ que X represente o niimero de vezes em que obtemos ‘cara. A varidvel X tem trés valores possiveis, 0, 1 ¢ 2, dependendo de obtermos zero, uma ou duas ccaras, Zero cara (X= 0) tem uma probabilidade de: Capitulo 5 © Probabilidade e curva normal 127 P(0 cara) = P(coroa na jogada 1)P(coroa na jogada 2) = (0,50)(0,50) = 0,25 Multipticamos a probabilidade de obtermos “coroa” nos lancamentas das moedas porque elas sGo jogadas de maneira independente Similarmente, para duas caras (X= 2), (2 caras) = P(cara na jogada !)P{cara na jogada 2) = (0,50)(0,50)= 0,25 Determinar a probabilidade de obtermos cara em uma de duas jogadas (X= 1) exige uma consideragdo extra. Hi duas maneiras de obtermos cara em um langamento: (1) cara (heads, H) na jogada 1 e coroa (tails, T) na jogada 2 (HT) ou (2) coroa na jogada 1 e cara na jogada 2 (TH). Como esses dois resultados possiveis so mutuamente exclusives (ambos no podem ocorrer ao mesmo tempo), podemos somar suas probabilidades respectivas. Isto é, PC cara) = P(HT ou TH) = P(HT) + P(TH) Como vimes anteriormente, as jogadas individuais das moedas sio independentes. Desse modo, podemos multiplicar a probabilidade de obtermos cara vezes a probabilidade de obtermos coroa para chegarmos i probabilidade de, primeiro, obtermos cara ¢, somente depois, obtermos uma coroa, P(HT); também podemos multiplicar a probabilidade de obtermos coroa ¢, entilo, cara, P(TH). Isto &, P(HT) + PCTH) = PH)P(T) + PCT)PCH), = (0,50)(0,50) + (0,50)(0,50) = 0,25 +0,25 A distribuigio de probabilidade completa para uma varidvel K é resumida na Tabela 5.1. Observe que as probabilidades somam 1,0. A distribuigio pode ser representada graficamente de maneira bastante semelhante & que usamos no caso das distribuigdes de frequéncia no Capitulo 2. Um grifico em barras de uma distribuigao de probabilidades coloca os valores da variivel ao longo da reta-base horizontal, © as probabilidades a0 longo do eixo vertical (veja a Figura 5,1). Vemos que a distribuigdo é simétrica, como seria de se esperar de moedas que niio favorecem nenhum de seus lados, Tabela 5.1 Distribuicio de probabilidade para 0 nimero de caras obtido em duas jogadas. x Probabilidade (P) o 0,25 1 0,50 iw os. Total 1,00 128 _Estatistica para ciéncias humanas Probabilidade 8 5 T T 0 1 2 Niimero de-caras Figura 5.1 Distribuicao de probabilidade de duas moedas. Podemos tracar uma distribuigdo. de probabilidade para 0 namero de solugdes em um grupo de homicidios de maneira similar a0 caso simples das duas moedas, exceto que 0 formato niio seri simétrico, pois a solugdo (clearance) e a no solucdo (nonclearance) nao sio igualmente proviveis como so 0s dois lados de uma moeda. Determinar a distribuigio de probabilidade para um mimero de solugdes entre trés homicidios é administrivel. Além de trés, a lgica nao se altera, mas os pas- sos se tomam mais exaustivos. Hi métodos alternativos para se lidar com problemas maiores, mas eles esto além do alcance dessa demonstragio introdutéria de probabilidade. A tabela a seguir mostra todas as combinagdes possiveis de solugdo € néio solugdo, repre- sentadas por C ¢ N (clearance ¢ nonclearance), respectivamente, para o grupo de wes casos de homicidios. Em virtude da regra da multiplicagao para resultados independentes, as probabilidades de qualquer uma das sequéncias de Cs ¢ Ns podem ser expressas com o produto de suas probabili- dades respectivas. Por fim, as oito diferentes possiveis combinagdes de resultados sdo mutuamente exelusivas. Isto é, qualquer que seja a combinagdo que ocorra para um grupo em particular de trés homicidios elimina as outras sete combinagdes alternativas. Como consequéncia de a combinaco ser mutuamente exclusiva, as probabilidades para as combinagdes alternativas podem ser somadas, ea soma das probabilidades das oito combinagdes possiveis & 1. Combinago Resultados Probabilidade A NNN PINNN) = PON)PUN)PEN), B CNN PICNN) == AC)PIN)PIN) c NCN PINCN) = PONPOVPEN) = (0,410,604) = 0,096 D NNC PINNC) = PANDPONYPIC) = (0,4)(0,4X0,6) = 0,096 E CCN PICCN) = POPOPIN) — = (0,6)(0,640,4) = 0,144 F Nc PICNC) = PIC)PINYP(C) = (0,610,406) = 0,144 G Nec PINCC) == PINIAC)P(C) 0.144 H ccc PECCE) = PCCP) 0.216 10 Capitulo 5 Probabilidade e curva normal 129 ‘Dadas essas probabilidades, podemos formar a distribuigdo de probabilidade tedrica na Tabe- la 5.2 para X, 0 mimero de homicidios solucionados entre um grupo de trés casos. E claro, X tem quatro valores possiveis, que variam de 0 (nenhum solucionado) a 3 (todos solucionados). Ao for- mar a distribuigdo de probabilidade, podemos somar as trés maneiras diferentes (combinagdes B aD) em que um dentre trés casos pode ser solucionado, assim como somar as probabilidades para as trés maneiras (combinagdes E a G) em que dois dentre trés homicidios podem ser solucionados. Tabela 5.2 Distribuicao de probabilidade do numero de solucdes para trés homicidios. x Pay) 0 0,064 I 0,288 2 0.432 5 02 10 A diferenca entre distribuigées de probabilidade e distribuicdes de frequéncia E importante saber diferenciar distribuigdes de frequéncia, como aquelas que vimos no Ca- pitulo 2, de distribuigdes de probabilidade. Observe novamente a Figura 5.1, que mostra a distri- buigio de probabilidade do niimero de caras que foram obtidas em dois langamentos de moedas. Essa é uma distribuigdo perfeitamente simétrica, com a probabilidade de se obter duas vezes cara igual a 0,25, idéntica probabilidade de nao se obter cara nenhuma vez. Ademais, isso mostra que a probabilidade de obtermos uma cara em dois langamentos ¢ de 0,50. A distribuigio é baseada na teoria da probabilidade, Ela descreve © que deveria acontecer quando jogamos duas moedas, Agora observaremos alguns dados. Jogue duas moedas ¢ registre o niimero de caras, repetin- do isso nave vezes. Quantas vezes vocé obteve zero cara, uma cara ¢ duas caras? Nossos proprios resultados em uma amostra de 10 langamentos de um par de moedas so exibides na Tabela 5.3. Essa é uma distribuigdo de frequéncia, ¢ nao uma distribuigdo de probabilidade. Ela ¢ baseada em observagées reais de 10 langamentos de duas moedas. Apesar de as porcentagens (30%, 60% € 10%) lembrarem probabilidades, elas nio 0 sao. A distribuicdo de porcentagem nio € igual a distribuigae de probabilidade dada anteriormente na Tabela 5.1. Uma distribuigio de probabilidade tedrica ou ideal retrata como as porcentagens deveriam ser em um. mundo perfeito. Infelizmente, no conseguimos um resultado perfeito — hi mais resultados com zero cara do que com duas Tabela 5.3 Distribuicao de frequéncia de 10 lancamentos de duas moedas. ‘Néimero decaras % 0 3 30,0 1 6 60,0 2 1 10,0 Total 10 100.0 130 _Estatistica para ciéncias humanas caras, por exemplo. O problema é que praticamente tudo pode acontecer em apenas 10 conjuntos de jogadas. Na realidade, poderiamos ter obtido resultados ainda mais assimétricos do que esses. Imagine se tivéssemos de repetir nossas jogadas de duas moedas muito mais vezes. Os resultados de 1.000 langamentos de duas moedas sio mostrados na distribuigao de frequéncia na Tabela 5.4 Essa distribuigio de frequéncia (com N= 1.000) parece bem melhor. Por que isso? Simples- mente tivemos mais sorte dessa vez do que quando langamos as moedas 10 vezes? De certa manei- ra, trata-se de uma questo de sorte, mas niio completamente, Como jd salientamos, com apenas 10 conjuntos de jogadas quase qualquer coisa pode acontecer — vocé poderia até tirar uma série de zero cara. Mas quando elevamos nosso experimento a 1.000 pares de jogadas, as coisas tendem a se ajustar com 0 decorrer do tempo. Séries de zero cara terio sido obtidas, mas da mesma maneira havera séries de uma cara ou duas caras. A medida que nos aproximamos de um niimero infinito de jogadas de duas moedas, as leis da probabilidade se tornam evidentes. Nossa sorte, se vocé quiser chamé-la assim, encontra um equilibrio. Uma distribuiglo de probabilidade é essencialmente uma distribuicdo de frequéncia para um niimero infinito de jogadas. Desse modo, talvez nunca observemos essa distribuigio de jogadas infinitas, mas sabemos que cla se parece com o que vemos na Figura 5.1. Tabela 5.4 Distribuicao de frequéncia de 1.000 langamentos de duas moedas. Nimerodecaras % 0 253 253 1 499 49.9 2 248 248 Total 1.000 1000 Média e desvio padrao de uma distribuicao de probabilidade Considerando a distribuigdo de frequéncia na Tabela 5.3 para 10 langamentos de duas moe- das, calcularemos 0 mimero médio de caras: = ee tN _OFOFOFLFIFIFIF+IF142 - 10 = 08 Esse resultado é baixo. A distribuigiio de probabilidade de jogadas de duas moedas mostrada na Figura 5.1 claramente sugere que a média deveria ser 1,0. Isto ¢, para o langamento de duas moedas, com 0 decorrer do tempo, voce deveria esperar uma média de uma cara, Observe, en- tretanto, que a distribuigio de frequéncias com N= 1.000 parece estar mais de acordo com essa expectativa, Para a Tabela 5.4 (coletando valores), Capitulo 5 « Probabilidade e curva normal 131 Ex w (253)(0) + (499)(1) + (248)(2) 1.000 = 0,995 Novamente, nossa “sorte” se nivela em longo prazo. Como vocé deve suspeitar, uma distribuiigao de probabilidade tem uma média. Como a média de uma distribuigao de probabilidade ¢ 0 valor que esperamos nivelar com 0 decorrer do tempo, la é chamada, as vezes, de valor esperado, Para caso do nimero de caras em langamentos de duas moedas, a média é I. Usamos a letra grega 1. (mi) para a média de uma distribuigdo de pro- babilidade (aqui p: = 1) para distingui-la de X, a média de uma distribuigdo de frequéncia, X é algo que calculamos a partir de um conjunto de dados observados ¢ suas frequéncias. Por outro lado, a média de uma distribuigiio de probabilidade (1) ¢ uma quantidade que decorre de nossa teoria sobre o que uma distribuigdo deve parecer. Uma distribuigiio de probabilidade também tem um desvio padrio, simbolizado por o (sig- ma), a letra grega equivalente ao s. Até aqui, temas usado:o s para representar o desvio padrio. Mas, daqui em diante, 0 5 representari o desvio padrio de um conjunto de dados observados ob- tidos por meio de pesquisa, e « representard o desvio padrao de uma distribuigao teérica que nao seja observada diretamente, Similarmente, s* denotaré a varidincia de um conjunto de dados obser- vados, ¢ 07 ser a varidincia de uma distribuigdo teérica. Encontraremos jt, o ¢ a? muitas vezes nos capitulos seguintes, e é importante termos em mente a diferenca entre .X, s ¢ s? (medidas de sintese de dados observados) por um lado, ¢ 4, o € 0 (caracteristicas de distribuigdes teéricas) por outro. ‘A média, a varidincia e 0 desvio padrio de uma distribuigtio de probabilidade sio calculados a partir dos valores possiveis de X'e suas probabilidades associadas P(X), w= EXP(X) o? = 3(X ~ w)P(X) T= VX (x) onde a soma se esiende sobre os valores possiveis de ¥. Usando essas férmulas, por exemplo, po- demos determinar que a distribuigao de probabilidade para uma série de homicidios solucionados (1X) em um grupo de trés casos tem a média, a variincia ¢ 0 desvio padrio a seguir: = SNP) (0,064) + 1(0,288) + 2(0,432) + 3(0,216) + 0,288 + 0,864 + 0,648 8 (X— wy (X) (0 ~ 1,8)°(0,064) + (1 — 1,8)°(0,288) + (2 — 1,8)°(0,432) + (3 — 1,870,216) = (—1,8)(0,064) + (-0,87(0,288) + (0,2)°(0,432) + (1.270.216) = 3,24(0,064) + 0,64(0,288) + 0,04(0,432) + 1,44(0,216) = 0,207 + 0,184 + 0,017 + 0,311 =0,72 a= VSP) = 70,72 ). 8485 132° Est ica para ciéncias humanas Desse modo, apesar de que, para qualquer grupo de trés homicidios, a policia poderia solu- cionar X=0, 1, 2 ou 3 deles, em longo prazo esperariamos uma média de 1,8 casos solucionados para cada trés homicidios, e um desvio padrio de aproximadamente 0,85. A curva normal como uma distribuicao de probabilidade Anteriormente, vimos que as distribuigdes de frequéncia podem assumir uma série de formas. Algumas sio perfeitamente simétricas ou sem nenhuma assimetria, outras sio assimétricas, seja negativa ou positivamente, ¢ outras, ainda, tém mais de um pico, e assim por diante. Isso também € verdade em casos de distribuigdes de probabilidade. Dentro dessa grande diversidade, ha uma distribuigao de probabilidade com a qual muitos cestudantes j4 esto familiarizados, nem que seja apenas por receberem notas “na curva”, Essa dis- tribuigdo, comumente conheeida como curva normal, & um modelo teérico ou ideal que foi abtido por meio de uma equacdo matemdtica, e no de pesquisa e coleta de dados. Entretanto, a utilidade da curva normal para o pesquisador pode ser vista em sua aplicagio em situagdes reais de pesquisa, Como veremos mais adiante, por exemplo, a curva normal pode ser usada para deserever distribuigdes de escores, interpretar o desvio padrio e fazer afirmagdes estatisticas. Em capitulos subsequentes, veremos que a curva normal é um ingrediente essencial da tomada de decisdes ¢s- tatisticas, por meio da qual o pesquisador generaliza seus resuliados de amostras para populagdes. Antes de proceder para uma discussio de tomada de decisio, primeiro é necessério ter uma com- preensiio das propriedades da curva normal, Caracteristicas da curva normal Como a curva normal pode ser caracterizada? Quais sdo as propriedades que a distinguem de ‘outras distribuigdes? Como indica a Figura 5.2, a curva normal ¢ um tipo de curva suave, simé- trica, cujo formato lembra o de um sino, sendo, por isso, amplamente conhecida como curva em Figura 5.2. forma da curva normal Capitulo 5 © Probabilidade e curva normal 133 forma de sino. Talvez a caracteristica mais extraordindria da curva normal seja a sua simetria: se dobrassemos a curva em seu ponto mais alto no centro, criariamos duas metades iguais, imagens espelho uma da outra. Além disso, a curva normal é unimodal, tendo apenas um pico ou ponto de maxima proba- bilidade — aquele ponto no meio da curva no qual a média, a mediana e a moda coincidem (0 estudante pode se lembrar que a média, a mediana e a moda ocorrem em diferentes pontos em uma distribuicdo assimétrica; veja 0 Capitulo 3). Do pico central arredondado da distribuigdo normal, acurva cai gradualmente em ambas as extremidades, estendendo-se indefinidamente em qualquer diregio e chegando cada vez mais perto da reta-base sem realmente tacd-la O modelo e a realidade da curva normal ‘Como ela é uma distribuigio de probabilidade, a curva normal é um ideal tedrico. Poderia~ mos entio perguntar: até que ponto as distribuigdes de dados reais (i.e., os dados coletados por pesquisadores no curso da realizagio de uma pesquisa) lembram proximamente ou se aproximam da forma da curva normal? Para fins ilustrativos, imaginaremos que todos os fendmenos soci psicolégicos ¢ fisicos sie distribuidos normalmente, Como seria esse mundo hipotético? ‘Quanto is caracteristicas humanas fisicas, a maioria dos adultos tem entre 1,50 m a 1,80 m de altura, com muito poucas pessoas sendo ou muito baixas (com menos de 1,50 1m) ou muito altas (com mais de 180m). Como mostra a Figura 5.3, 0 QI seria igualmente previsivel — a maior pro= porgio de escores de Ql estaria entre 85 e 115. Veriamos uma queda gradual de escores em ambas as extremidades com alguns poucos “génios” com um QI maior que 145 e igualmente poucos com inferior a 55. Da mesma maneira, relativamente poucos individuos seriam considerados extre= mistas politicos, seja a direita ou a esquerda, enquanto a maioria seria considerada politicamente moderada ou estaria no meio do caminho, Por fim, mesmo 0 padrio de desgaste em vaos de portas Jembraria a distribuigdo normal: a maior parte do desgaste ocorreria no centro do vio da porta, enquanto montantes gradualmente menores de desgaste ocorreriam em cada um dos lados. Alguns leitores devem ter notado, a essa altura, que o mundo hipotético da curva normal nfo difere radicalmente do mundo real. Caracteristicas como altura, QI, orientagio politica e desgaste em vios de portas parecem, realmente, aproximar-se da distribuigio normal tedrica. Como muitos fendmenos possuem essa caracteristica — porque ela ocorre com muita frequéncia na natureza (€ ss 70 as 100 Ts 130 Tas Figura 5.3 A distribuicao do Ql 134 Estatistica para ciéncias humanas Por outras razies que logo ficarao claras) —, pesquisadores em muitos campos tém usado ampla- mente a curva normal, aplicanda-a aos dados que coletam e analisam. Mas também deve ser observado que algumas varidveis nas ciéneias sociais, assim como em ‘outros setores, simplesmente nao se enquadram na nogao teériea da distribuig’io normal. Muitas distribuigdes so assimétricas, outras t8m mais de um pico, ¢ algumas so simétricas, mas niio tém forma de sino. Como um exemplo concreto, consideraremos a distribuigio de riqueza pelo mundo. “Todos sabem que existem muito mais “pobres” do que “rieos”. Desse modo, como mostra a Figura 5.4, a distribuigdo de riqueza (como indica a renda per capita) & extremamente assimétrica, de modo que uma pequena proporedo da populagio mundial recebe uma grande proporgdio da renda do mundo, Da mesma maneira, especialistas em demografia nos dizem que os Estados Unidos logo se tornardo uma terra de jovens e idosos. Do ponto de vista econdmico, essa distribuigio etdria representa um fardo para uma forga de trabalho relativamente pequena formada por cidadios de meia idade que sustentam um nimero desproporcionalmente grande de dependentes aposentados -¢ também em idade escolar. Quando temos uma boa razio para esperar desvios radicais da normalidade, como nos casos de idade e renda, a curva normal niio pode ser usada como modelo dos dados que obtivemos. Desse modo, cla nao pode ser aplicada a vontade a todas as distribuigdes encontradas pelo pesquisador, mas deve ser usada com bastante critério, Felizmente, estatisticos sabem que muitos fendmenos de interesse para o pesquisador social assumem a forma da curva normal, $2000 $3000 $4000 $5000 $6000 $7,000 Renda per capita Figura 5.4 A distribuicdo da renda per capita entre as nacées do mundo (em délares norte-americanos). A area sob a curva normal E importante ter em mente que a curva normal ¢ uma distribuigde ideal ou teérica (isto ¢, uma distribuigdo de probabilidade). Portanto, denotamos sua média por 4. seu desvio padriio por a. A média da distribuicio normal esti exatamente em seu centro (veja a Figura 5.5). O desvio padrio (7) &a distincia entre a média (1) € 0 ponto na reta-base logo abaixo, onde a porgio em forma de S invertido da curva muda de diregio, Capitulo 5° Probabilidade e curva normal 135 A porcio da curva ers forma de § invert ‘muda de diresio aq Figura 5.5 A area total sob a curva normal. Para empregar a distribuigao normal na soluco de problemas, temos de nos familiarizar com a drea sob a curva normal: a drea que se encontra entre a curva ¢ a reta-base contendo 100% ou todos os casos em qualquer distribuigdo normal dada. A Figura 5.5 mostra essa caracteristica. Poderiamos delimitar uma porcio dessa rea total tragando linhas a partir de dois pontos quaisquer, da linha de base até a curva. Por exemplo, usando a média como um ponto de partida, poderiamos tragar uma linha na média (j2) e outra linha no ponto que é Lor (1 desvio padrio de dis- tincia) acima da média. Como ilusira a Figura 5.6, essa porgio delimitada da curva normal inelui 34,13% da frequéncia total, a le Figura 5.6 A porcentagem da rea total sob a curva normal entre 1 e 0 ponto To acima de p.. 136 Estatistica para ciéncias humanas Da mesma mancira, podemos dizer que 47,72% dos casos sob a curva normal encontram-se entre a média ¢ 20° acima da média, ¢ que 49,87% encontram-se entre a média ¢ 30° acima da média (veja a Figura 5.7), Como veremos, uma proporgio constante da drea total sob a curva normal se encontrar entre a média ¢ qualquer distincia dada da média como medida em unidades o sigma. Isso € verdade independentemente da média ¢ do desvio padrio da distribuigdo em particular, ¢ aplica-se uni- versalmente a todos os dados que sio distribuidos normalmente. Desse modo, a dea sob a curva normal entre a média e 0 ponto 1 acima da média sempre inclui 34,13% do total de casos, nao importando se discutimos distribuigao de altura, inteligéncia, orientagio politica ou 0 padrao de desgaste em um vao de porta. A exigéncia basica, em cada caso, é a de que estejamos trabalhando ‘com uma distribuicdo normal de escores. A natureza simétrica da curva normal nos leva a ressaltar outro ponto importante: qualquer distdneia sigma acima da média contém a proporcdo idéntica de casos que a mesma distancia sig- ma abaixo da média. Desse modo, se 34,13% da dea total se encontram entre a média € Lor acima da média, entdio 34,13% da area total se encontram entre a média ¢ lor abaixo da média; se 47,72% se encontram entre a média e 2 acima da média, entio 47,72% estiio enire a média e 20 abaixo da média; se 49,87% esto entre a média ¢ 3a acima da média, entio 49,87% também estio entre a média e 3¢ abaixo da média. Em outras palavras, como ilustra a Figura 5.8, 68,26% da area total da curva normal (34,13% + 34,13%) situam-se entre —Lar ¢ +1o da média; 95,44% da area (47,72% + 47,72%) esto entre 2a ¢ +2e da média; 99,74%, ou quase todos os casos (49,87% + 49,87%), estiio entre —3or ¢ +3o da média, Podemos dizer, entio, que seis desvios padrio incliem praticamente todos 0s casos (mais de 99%) sob qualquer distribuigdo normal, A772 49.87% ” +o Bo Figura 5.7 A porcentagem da drea total sob a curva normal entre 1 @ os pontos que estao 20 e 30 de p. Capitulo § * Probabilidade e curva normal 137 30 0 le +l er Bo Figura 5.8 porcentagem da area total sob a curva normal entre =a e+ 1, ~2o e +20, e~30 e +30. Explicacao do desvio padrao Uma fungio importante da curva normal é ajudar a interpretar ¢ esclarecer o significado do desvio padrio, Para compreender como essa fungio ¢ posta em pritica, examinaremos 0 que alguns pesquisadores nos dizem a respeito de diferengas de género em termos de QI. Apesar das pretensdes de defensores da supremacia do sexo masculino, ha provas de que ambos, homens mulheres, tém escores de QI médios de aproximadamente 100, Também devemos dizer que esses escores de QI diferem notadamente em termos de variabilidade em torno da média, Em particular, suponhamos que QIs de individuos do sexo masculino tenham uma heterogeneidade maior do que 0 Qs de individuos do sexo feminino; isto é, a distribuigao de Qls para individuos do sexo mas culino contém uma porcentagem muito maior de escores extremos representando individuos muito inteligentes, assim como outros muito limitados, enquanto a distribuigio de Qls de individuos do sexo feminino tem uma porcentagem maior de escores localizados proximos da média, o ponto de maxima frequéncia no centro. Como 0 desvio padrio é uma medida de varingio, essas diferencas de género na variabilidade devem ser refletidas no valor sigma de cada distribuigio de escores de Qls. Desse modo, paderiamos descobrir que o desvio padrio é 15 para Qls de individuos do sexo masculino, mas apenas 10 para Qls de individuos do. sexo feminino. Sabendo qual é 0 desvio padrao de cada conjunto de escores de Qs e presumindo que cada conjunto seja distribuido normalmente, poderiamos, entio, estimar ¢ comparara porcentagem de homens e mulheres que tenham qualquer variagio dada de escores de QI. Por exemplo, medindo @ reta-base da distribuigdo de Qls de individuos do sexo masculino em unidades de desvio padrio, saberiamos que 68,26% desses escores estio entre -la ¢ +1o da média, Como o desvio padrio é sempre dado em unidades de escore bruto ¢ 7 = 15, também sabe- riamos que esses sio pontos na distribuigo nos quais escores de Qls de 115 ¢ 85 estdo localizados (u—o@ = 100-15 =85 ew +o = 100 + 15 = 115). Desse modo, 68,26% dos homens teriam escores de Qs entre 85 ¢ 115, Afastando-se da média ¢ mais longe ainda desses pontos, descobrimos, como ilustra a Figura 5.9, que 99,74%, ou seja, praticamente todos os homens tém escores de Qls entre 55.¢ 145 (entre—3o€ +307). Da mesma maneira, olhando em seguida a distribuigao de escores de Qls de individuos do sexo feminino como os descritos na Figura 5.10, vemos que 99,74% dos casos estariam entre 138. Estatistica para ciéncias humanas 35 = 100 as Be so) Figura 5.9 Distribuicéo de escores de Qls de individuos do sexo masculino. 0 w= 100 130 30) (30) Figura 5.10 _Distribuicao de escores de Qis de individuos do sexo feminino, ‘0s escores de 70 ¢ 130 (entre -3a e +3). Em comparagio com os homens, entiio, a distribuigio de escores de QIs de mulheres poderia ser considerada relativamente homogénea, tendo um imbito menor de escores extremos em qualquer diregio. Essa diferenga ¢ refletida no tamanho compara- tivo de eada desvio padrio ¢ no imbito de escores de Qls com valores entre ~3a e +3a da média. Uso da tabela A Ao discutir a distribuicdo normal, até 0 momento tratamos somente daquelas distincias da média que 40 miiltiplos exatos do desvio padrao. Isto é, eles foram precisamente um, dois ou trés desvios padrio, acima ou abaixo da média. Surge entio a seguinte questo: o que devemos fazer para determinar a porcentagem de casos para distancias que se encontram entre quaisquer dois valo- res de escores? Por exemplo, suponha que queiramos determinar a porcentagem da direa total entre a média e, digamos, um escore bruto loealizado 1,40e acima da média, Como mostra a Figura 5.11, Capitulo 5 + Probabilidade e curva normal 139 m +10 +r 31.408 Figura 5.11 Posico de um escore bruto que se encontra 1,400r acima de um escore bruto de 1,400 acima da média é obviamente maior do que 1a, estando, porém, a menos de 2o de distincia da média. Desse modo, sabemos que essa distineia da média incluiria mais do que 34,13%, mas menos do que 47,72% da area total sob a curva normal. Para determinar a porcentagem exata dentro desse intervalo, temos de empregar a Tabela A do Apéndice B. Isso mostra a porcentagem abaixo da curva normal (1) entre a média ¢ varias dis- tincias sigma a contar da média (na coluna b) e (2) em varios escores (ou além deles) em diregdo a.ambas as extremidades da distribuicdo (na coluna c). Essas distfincias sigma (de 0,00 a 4,00) so chamadas de z na coluna da esquerda (coluna a) da Tabela A, ¢ sio apresentadas com duas casas decimais. Observe que a simetria da curva normal torna possivel dar porcentagens para somente um lado da média, isto é, apenas metade da curva (50%). Valores na Tabela A representam qualquer um dos lados. A seguir, uma porgao da Tabela A: @ ) ©) < Areaentreamédiaez Area além de z 0,00 0,00 ‘50,00 0,01 040 49,60 0,02 0,80 49.20 0,03 1,20 48,80 0,04 1,60 48.40 0,05 1,99 48.01 0,06 2,39 4761 0.07 2,79 4721 0.08 3,19 4681 0,09 3,59 46,41 140 Estatistica para ciéncias humanas Ao aprender a usar ¢ compreender a Tabela A, poderiamos primeiro tentar localizar a porcen- tagem de casos entre uma distincia sigma de 1,00 ¢ a média (isso porque ja sabemos que 34,13% da Grea total se situa entre esses pontos na reta-base), Observando a coluna (b) da Tabela A, vemos que ela realmente indica que exatamente 34,13% da frequéncia total se enquadra entre a média uma distincia sigma de 1,00, Da mesma maneira, vemos que a area entre a média e a distancia sigma 2,00 inclui exatamente 47,72% da iirea total sob a curva. Mas como deseobrir a poreentagem de casos entre a média e uma distincia sigma de 1,40? Esse foi o problema na Figura 5.11, que requeria 0 uso da tabela em primeiro lugar. A entrada na coluna (b) correspondendo a uma distincia sigma de 1,40 inclui 41,92% da drea total sob a curva. Por fim, como determinar a porcentagem de casos além de 1,40 desvios padrio da média? Sem uma tabela para nos ajudar, podemos localizar a porcentagem nessa érea sob a curva normal simplesmente subtraindo nossa resposta anterior de 50%, pois essa é a Area total encontrada em. qualquer um dos lados da média. Entretanto, isso jé foi feito na coluna (c) da Tabela A, na qual vemos que exatamente 8,08% (50 ~ 41,92 = 8,08) dos casos estiio nesse valor ou acima dele, isto 6 1,40 desvio padrito da média, Escores padrao e a curva normal Agora estamos preparades para calcular a porcentagem da area total sob a curva normal associada com qualquer distincia sigma da média. Entretanto, pelo menos mais uma questao im- Portante tem de ser respondida: como determinamos a distancia sigma de qualquer escore bruto dado? Isto €, como convertemos nosso escore bruto — o escore que coletamos originalmente de nossos entrevistados — em unidades de desvio padrio? Se quiséssemos converter pés em jardas, simplesmente dividiriamos o nimero de pés por 3, pois ha 3 pés em uma jarda. Da mesma ma- |, 8e estivéssemos convertendo minutos em horas, dividiriamos 0 nimero de minutos por 60, pois hi 60 minutos em cada hora. Precisamente do mesmo modo, podemos converter qualquer escore bruto dado em unidades sigma dividindo a distancia do escore bruto da média pelo desvio padrio, Para ilustrar essa questo, imaginemos um escore bruto de 16 de uma distribuicio na qual i seja 13 ¢ oF seja 2. Tirando a diferenga entre o escore bruto e a média, e obtendo um desvio (16 — 13), vemos que um escore bruto de 16 é igual a 3 unidades de escore bruto acima da média, Dividindo essa distincia de escore bruto por a = 2, vemos que esse escore bruto é 1,5 (um e meio) desvio padrdo acima da média, Em outras palavras, a distincia sigma de um escore bruto de 16, nessa distribuigdo em particular, é de 1,5 desvios padrao acima da média. Devemos observar que independente da situagio de medida, sempre hé 3 pés em uma jarda e 60 minutos em uma hora. A constincia que marea essas outras medidas padrio nio € compartilhada pelo desvio padrio. Ela muda de uma distribuigdo para outra. Por essa razito, temos de saber 0 desvio padrio de uma distribuigo, calculando-o, estimando-o ou recebendo-o de alguém antes que sejamos eapazes de converter qualquer escore bruto em particular em unidades de desvio padrio. © processo que exemplificamos hi pouco — de encontrar a distincia sigma da média — produz um valor chamado de escore z ou excore padrio, que indica a diregéio ¢ o grau em que qualquer escore bruto dado se afasta da média de uma distribuigao em uma escala de unidades sigma (observe que a coluna da esquerda da Tabela A no Apéndice B é chamada de =). Desse modo, um escore z de +1,4 indica que o escore bruto encontra-se 1,4c (ou quase 1-7) acima da média, enquanto um escore z de -2,1 significa que o escore bruto cai ligeiramente niais do que 20 abaixo da média (veja a Figura 5.12). Obtemos um escore 2 por meio do cilculo do desvio (X~ 1), 0 que di a distincia do escore bruto da média, e entio dividindo esse desvio bruto pelo desvio padrio. Capitulo 5 + Probabilidade e curva normal 144 Tet * TatlA Figura 5.12 A posicao de z =-2,1 ez = +1,4.em uma distribuicdo normal. Fazendo 0 cilculo por meio da formula: onde 2 = média de uma distribuicgao o = desvio padrio de uma distribuigdo 2 =escore padrio Como exemplo, suponha que estejamos estudando a distribuigdo de renda anual de enfermei- ros domésticos em uma grande agéneia na qual a renda anual seja de $ 20.000 e o desvio padrio, de § 1,500. Presumindo que a distribuigdo da renda anual seja normal, podemos converter 0 eseore bruto dessa distribuigio, $ 22.000, em um escore padrio da seguinte maneira: 22,000 — 20.000 _ Ss th33 Desse modo, uma renda anual de $ 22,000 esti 1,33 desvio padrio acima da renda anual mé- dia de $ 20,000 ¢veja a Figura 5.13). Como outro exemplo, suponha que estejamos trabalhando com uma distribuigao normal de escores que represente a satisfagio no emprego de um grupo de trabalhadores urbanos, A escala varia de 0 a 20, com escores mais altos representando uma satisfagaio maior com 0 emprego. Digamos que a distribuigdo tenha uma média de 10 e um desvio padrio de 3. Para determinar a quantos desvios padrio um escore de 3 encontra-se da média de 10, obtemos a diferenga entre esse escore € a média, isto &, X-y=3-10 T 142. Estatistica para ciéncias humanas $20,000 $22,000 e433 Figura 5.13 A posicso de z= +1,33 para 0 escore bruto de $ 22.000. Entdo dividimos o resultado pelo desvio padrio: X-n el a 3 33 Desse modo, como mostra a Figura 5.14, um escore bruto de 3 nessa distribui¢do de escores cai 2,33 desvios padrao abaixo da média. 0 Figura 5.14 A posicao de 2 = -2,33 para o escore bruto de 3. Capitulo 5 + Probabilidade e curva normal 143 Calculo da probabilidade sob a curva normal Como veremos a seguir, a curva normal pode ser usada em conjungdio com os escores z¢ a Tabela A para determinar a probabilidade de se obter qualquer escore bruto em uma distribuigdo. No contexto atual, a curva normal ¢ uma distribuigio na qual ¢ possivel determinar as probabili- dades associadas com varios pontos ao longo da reta-base. Como foi observado anteriormente, a curva normal ¢ uma distribuigée de probabilidade na qual a area total sob a curva é igual a 100%; cla contém uma drea central cercando a média, onde escores ocorrem mais frequentemente, ¢ areas menores na diregdo de cada extremidade, onde ha um achatamento gradual ¢, desse modo, uma proporciio menor de escores extremamente altos ¢ baixos. Em termos de probabilidade, entio, po- demos dizer que a probabilidade diminui a medida que nos deslocamos ao longo da linha de base para longe da média em qualquer dire¢io. Desse modo, dizer que 68,26% da frequéncia total soba curva normal situa-se entre—Lo e +10 da média ¢ dizer que a probabilidade de que qualquer escore bruto dado esteja dentro desse intervalo ¢ de aproximadamente 68 em 100, Similarmente, dizer que 95.44% da frequéncia total sob a curva normal cai entre -2o € +20 da média € também dizer que 4 probabilidade de que qualquer escore bruto esteja dentro desse intervalo é de aproximadamente 95 em 100, e assim por diante. Esse é precisamente o mesmo conceito da probabilidade ou frequéncia relativa que vemos em ago ao lanarmos um par de moedas. Observe, entretanto, que as probabilidades associadas com reas sob a curva normal sio sempre dadas em relagdo a 100%, que é a area total sob a curva (por exemplo, 68 em 100, 95 em 100, 99 em 100), No exemplo do Quadro 5.2, foi pedido que determindssemos a probabilidade associada com a distincia entre a média e uma distincia sigma em relago.a ela. Entretanto, é possivel que muitas QUADRO5.2_Exemplo paso a paso: probabilidade sob a curva normal Para aplicar 0 conceito de peobabildade em relagdo 2 distibuigso normal, retornaremos a um exempio anterior. Foi pedida a conversio de um escore brute da distribuicéa do salario anual de uma agéncia de enfermeiros em seu equiva- lente de escore z que, presumimos, se aproxima- vva de uma curva normal. Essa distribuicdo de ren- da tinha uma média de $ 20.000 com um desvio padrao de $ 1.500. Aplicando a formula do escore z, apren- demos anteriormente que uma renda anual de $ 22.000 estava 1,33 acima da média de $ 20.000, istoé, 22.000 — 20.000 22,000 = 20.000 6 4 1.500 ae Determinaremos agora a probabilidade de ‘obtermos um escore que se encontre entre § 20.000, média, e $ 22.000. Em outras pala- vras, qual é 2 probabilidade de escothermos ale- atoriamente, em apenas uma tentativa, um en- fermeiro cuja renda anual esteja entre $ 20,000 € $ 22.000? O problema esté graficemente ilus- trado na Figura 5.15 (estamos fazendo 0 célculo ara a area sombreada sob a curva), e pode ser solucionado em dois passos se usarmos a formu- la do escore ze a Tabela A do Apéndice B. Passo Comerta o escore bruto ($ 22.000) em um escore 2, pm oe 3 = 22.000 20.000 500 = 41,33 (Desse modo, 0 escore bruto de $ 22.000 esta localizado 1,33 acima da média, Passo 2 Usando a Tabela A, calcule a porcentagem da 4rea total sob a cua entre 0 escore 2 (z= 41,33) e amédia 144 Estatistica para ciéncias humanas $20,000 $2200 Figura 5.15 A porcdo da area sob a curva narmal para a qual buscamos determinar a probabilidade de ocorréncia. Na coluna (b) da Tabela A, descobrimos que 40,82% dos enfermeiros ganham entre $ 20.000 $ 22.000 (veja a Figura 5.16). Desse modo, movendo a virgula decimal duas posicdes para a esquerda, vemos que a probabilidade (arredon- $20.00 = dada) ¢ de 41 em 100. Mais precisamente, P = 0.4082 € a probabilidade de encontrermos um individuo cuja renda anual esteja entre $ 20.000 e$ 22.000, 133 Figura 5.16 A porcentagem da area total sob a curva normal entre y = $ 20.000 e z= +1,33. vezes queiramos ealcular a porcentagem da area que esti em ou além de um determinado escore bruto em diregdo a uma das caudas da distribuigdo, ou entio determinar a probabilidade de obter cesses escores. Por exemplo, no caso presente, poderiamos querer saber a probabilidade de obter uma renda anual de $ 22.000 ou maior. Capitulo 5 © Probabilidade e curvanormal 445 Esse problema pode ser ilustrado graficamente, como mostra a Figura 5.17 (0 calculo é feito para a area sombreada sob a curva). Nesse caso seguiriamos os passos | ¢ 2, dese modo obtendo © escore ze caleulando a porcentagem sob a curva normal entre $ 20,000 ¢ um z = 1,33 (da Tabela A). No caso presente, entretanto, temos de dar um passo além e subirair a porcemtagem obtida na Tabela A de 50% — aquela porcentagem da drea total que se encontra em qualquer um dos lados da média. Felizmente, isso ja foi feito na coluna (c) da Tabela A. Portanto, ao subtrairmos 40,82% de 50% ou simplesmente verificando a coluna (c) da Tabela ‘A, descobrimos que um pouco mais da que 9% (9,18%) situa-se em $ 22.000 ou além desse valor. Em termos de probabilidade, podemos dizer (movendo a virgula duas posigées para a esquerda) que ha apenas um pouce mais do que 9 chances em 100 (P = 0,0918) de encontrarmos um enfer- meiro nessa agéncia cuja renda seja $ 20,000 ou mais, Foi observado anteriormente que qualquer distincia sigma dada acima da média contém a proporgdo idéntica de casos que a mesma distincia sigma abaixo da média, Por essa razo, nos so procedimento para calcular probabilidades associadas com pontos abaixo da média ¢ idéntico iquele seguido nos exemplos anteriores. Por exemplo, a porcentagem da area total entre o escore z = -1,33 ($ 18,000) © a média & idéntica & porcentagem entre o escore z= +1,33 ($ 22.000) ¢ a média. Sabemos, portanto, que existe uma maneira, a porcentagem da frequéncia total em —1,33 ou aquém desse valor ($ 18,000 ou menos) € igual porcentagem de frequéncia total em +1,33 ow além desse valor ($ 22.000 ou mais). Desse modo, ha uma probabilidade P = 0,0918 de encontrarmos um enfermeiro da agéncia com uma renda anual de § 18.000 ou menos. Podemos usar a Tabela A para encontrar a probabilidade de obtermos mais de uma tni- ca porgdo da drea sob a curva normal. Por exemplo, ja determinamos que P = 0,09 para rendas de $ 18,000 ou menos e para rendas de $ 22.000 ou mais. Para caleular a probabilidade de obtermos 5 18,000 ot menos ou $ 22.000 ou mais, simplesmente somamos sts probabilidades separada- mente como: a seguir: P= 0,0918 +0,0918 = 0.1836 $20.00 $22,000 e433 Figura 5.17 A porcao da Srea total sob a curva normal para a qual buscamos determinar a probabilidade de ocorréncia 146 Estatistica para ciéncias humanas De mancira similar, podemos calcular a probabilidade de encontrarmos um enfermeiro cuja renda esteja entre $ 18.000 ¢ $ 22,000 somando as probabilide des associadas com escores z de 1,33 de qualquer um dos lados da média, Portanto, P = 0,4082 + 04082 = 0,8164 Observe que 0,8164 + 0,1836 ¢ igual a 1,00, e representa todos os resultados possiveis sob a curva normal. ‘A aplicago da regra de multiplicagio A curva normal pode ser ilustrada por meio do cdleulo da probabilidade de encontrarmos quatro enfermeiros cujas rendas sejam $ 22,000 ou maiores. Ja sabemos que existe uma probabilidade P= 0,0918 de achar um iinico enfermeiro com renda de, no minimo, $ 22.000. Portanto, P = (0,0918)(0,0918)(0,09180,0918) (0,0918)* 0,00007 Aplicando a regra da multiplicagao, vemos que a probabilidade de encontrarmos quatro en- fermeiros de mancira aleatoria com renda de $ 22,000 ou mais é de apenas 7 em 100,000, Calculo de escores de probabilidade baseados na curva normal Na segiio anterior, usamos nosso conhecimento a respeito da média e do desvio padrio sobre uma variavel distribuida normalmente (como os salirios iniciais de enfermeiros) para determinar ‘reas em particular sab a curva normal. As porgdes da drea foram usadas, por sua ve7, para caleular virias porcentagens ou probabilidades a respeito da distribuigdo, como determinar a porcentagem de enfermeiros que ganham um saldrio de mais de $ 22.000. O processo de usar a Tabela A para converter eseores 2 em porgdes da area total pode ser invertido para calcular valores de escores de porgées de certas areas ou porcentagens. Sabemos, sem termos de consultar a Tabela A, que 0 salério acima do qual $0% dos enfermeiros ganha é de $ 20,000, Devido a simetria de forma, o salirio mediano que divide a distribuigio na metade € 0 mesmo que a média, Mas ¢ se quiséssemos saber 0 nivel de salirio que define os 10% de enfermei- ros mais bem pagos, i.e, a porgdo sombreada na Figura 5,18? $18500 "$17000 $1850 S$2n000 $2150. $23.00, $24.00 X=2 Figura 5.18 Calculo do salério acima do qual 10% dos enfermeinos domésticos so pagos. Capitulo 5 © Probabilidade e curva normal 147 QUADRO 5.3 Exemplo passo a passo: calculo de escores de probabilidade baseados na curva normal ‘Suponha que certa empresa de ambuldn- cas tena dados que demonstrem que o tempo de resposta do numero de emergéncia, do rece- bimento da chamada até a chegada da ambulan- cia, € normaimente distribuido com uma media de 5,6 min um desvio padréo de 1,8. Quanto ‘tempo ¢ necessério para trés quartos (75%) de ‘todas as chamadas serem atendidas, isto ¢, 0 va- lor abaixo do qual 75% dos tempos de resposta ‘caem? Passo1 Localize na Tabela A oescorez que cor- taa drea mais préxima a 75% abaixo dele, Como mostra a Figura 5.19, a porcio da area que re- presenta 75% dos tempos de resposta tem 25% dda area entre a média @ 0 escore z. Examinando atentamente a colina (b) da Tabela A para uma oz EY) 38 ‘rea proxima de 25, observa-se que z = 0,67 cor- ta 24,86 da Srea total. Passo 2 Converta.o valor 2 para seu equivalente de escore bruto. X=ptzo =5,6 + 0,67(1,8) 5,6+12 68 Desse modo, podemos dizer que em torno de trés quartos das chamadas para a assisténcia médica 540 atendidos dentro de 6,8 min. Por ou tro lado, um quarto das chamades exige mais de 6,8 min, ry 92 0 Figura 5.19 Calculo do valor abaixo do qual 75% dos tempos de resposta caem. 0 limiar para os 10% acima pode ser determinado por meio de uma consulta 4 Tabela A de uma porgao em particul da area (como a extremidade de 10% mais alta) para determinar os va- ores de escores z e entio converter aquele escore z em seu equivalente de escore bruto (salirio). Especificamente, examinamos atentamente a coluna (¢) para localizar a rea além (nesse caso, cima) de = que est mais proxima dos 10%. Aparentemente, 10,03% cai para além de um escore 2 de 1,28, Podemos usar entio uma forma modificada da formula usual do escore = para calcular X° dado um valor em particular de = Xaptoor 148 _Estatistica para ciéncias humanas Para calcular o limiar de 10% acima com js = $ 20,000 ¢ & = § 1.500, ¢ como descobrimos na Tabela A, = = 1,28, X= 20.000 + 1,28(1.500) = 20,000 + 1,920 21.920 Desse modo, com base na forma normal da distribuigio de salirios de enfermeiros com uma média de $ 20.000 ¢ um desvio padrio de $ 1.500, podemos determinar que os 10% que ganham mais tém salirios acima de $ 21.920. Resumo ‘Neste capitulo, introduzimos o conceito da probabilidade — a probabilidade relativa da ocorréncia de qualquer resultado ou evento dado — como a fundagao para a tomada de de- cisdo em estatistica. Indicado pelo mimero de vezes que um evento pode ocorrer em relagio 20 mimero total de vezes que qualquer evento pode ocorrer, probabilidades variam de O (um evento impossivel) a | (uma certeza). Probabilidades. podem ser somadas como na regra da soma, de maneira a estabelecer a probabilidade de obter qualquer um de diversos resultados diferentes; elas também podem ser multiplicadas, como na regra da multiplicacio, para deter- minar a probabilidade de se obter uma combinago de resultados independentes. Como vimos nos capitulos anteriores, uma distribuigdo de frequéncia é baseada em observacdes concretas do mundo real. Por outro lado, uma distribuiglo de probabilidade é teérica ou ideal; ela espe- cifica quais deveriam ser as porcentagens em um mundo perfeito. Desse modo, especificamos 0s valores possiveis de uma varidvel e calculamos as probabilidades associadas com cada uma. De maneira andloga as porcentagens em uma distribuigio de frequéncia, as probabilidades que obtemos em uma distribuigo de probabilidade representam a probabilidade (em vez da frequéncia de ocorréncia) de cada valor. © modelo tedrico conhecido como curva normal & uma distribuigio de probabilidade particularmente itil em situagdes de pesquisa real. Conhecida por sua forma de sino simétrica, a curva normal pode ser usada para descrever distribuigdes de escores, interpretar o desvio padkio e fazer declaragdes de probabilidade. Em conjungio com os escores padrio, podemos determinar a porcentagem da area total sob a curva normal associada com qualquer distincia sigma dada em relagio 4 média e a probabilidade de obter qualquer escore bruto em uma dis- tribuigdo, Em capitulos subsequentes, veremos que a curva normal & um ingrediente essencial da tomada de decisio estatistica. Termos-chave Area sob a curva normal Regra da multiplicagao ‘Curva normal Regra da soma Escore z (escore padrio) Resultados independentes Probabilidade Resultados mutuamente exclusives Regra complementar Exercicios 1. A probabilidade relativa de ocorréncia de qualquer evento dado é conhecida como o(a) do evento. a. desvio padrio. b, rea sob a curva normal. 2. A probabilidade varia de: a. zeroao infinito. b, zeroa 1,0. e. 1,02 1000. @. 10410, ‘3. Um investigador criminal trabalha para levar a justiga dois assassins em série — um que ‘laca prostitutas © outro que ataca estudantes universitirias, A partir de experiéncias anterio- res, 0 investigador é levado a acreditar que tem. uma chance de 0,50 de prender o assassino de prosiituias e umn chance de 0,65 de prender o assassino de estudantes. Para calcular a proba- bilidade de que ele va eapturar ambos os as- sassinos, vocé tem de_as probabilidades. a. somar b. subtrair ¢. multiplicar d. dividir 4. Uma distribuigao de probabilidade ¢ baseada: a. em observagdes reais. b. na teoria da probabilidade. €. na regra da soma. na regra da multiplicagao. 5. Qual dos itens a seguir ndo descreve uma cur- va normal’? a. Ela ¢ assimétrica. b, Ela é uma distribuigio de probabilidade. ¢, Sua drea total contém 100% de todos os casos. d._ A moda, a medianac a média: iticas, 6. Um(a) __ indica até que ponto um escore bruto individual cai da média de uma distri- buigdo; o(@) indica como os escores em geral se dispersam em torno da média. a. desvio padrio; escore z. Capitulo 5 « Probabilidade e curva normal 9. 10. 149 Ib. escore =; desvio padrio. €. probabilidade; escore d._ desvio padrio; probabilidade. A equagdo z = -1,33 indica que um escore bruto em particular encontra-se: ‘a, 1,33 desvio padrio abaixo da média. b. 1,33% abaixo da média €. 1,33 posigio percentil abaixo da média. 1,33 escore abaixo do desvio padrio. A equagao P= 0,33 para obter uma renda en- tre $ 40,000 e $ 50.000 representa: ‘uma porcentagem. uma probabilidade expressa como uma proporgio. uma frequéncia de ocorréncia. uum escore Os estudantes a seguir estiio matriculados em ‘um curso de Introdugao a Sociologia. Eles es- tio listados de acordo com ano que cursam © com a especializagio que buscam. Estudante —Ano——_Especializagiio ‘em sociologia 1 Segundo ano sim 2 Ultimo ano Nao 3 Sim 4 Nilo 3 Sim 6 Sim 7 s Sim 8 Terceiro ano Nio 9 ‘Segundo ano sim 10 ‘Segundo ano Nao Qual a probabilidade de escolhermos, a0 acase, uum estudante do segundo ano? b, um estuclante especializando-se em socio- logia? ©. um estudante do primeiro ano ou do se- undo ano? dum estudante que nio seja do primeiro ano? Foi perguntado a dez politicos quais eram seus pontos de vista a respeito da eutandsia. Eles foram listados juntamente com seu partido politico, 150 Estatistica para ciéncias humanas 12. 1B. Politico Partido politico Apoia a eutandsia 1 Republicano Nilo 2 Democrata Nio 3 Democrata Sim 4 Republicano Nao 5 Republicano Nio 6 = Democrata Nao 1 Democrata Sim 8 Democrata Sim 9 Republicano Nio 10 Democrata sim Qual é a probabilidade de escolhermos, ao acaso, a. um Republicano? b. um Democrata que apoia a eutanisia? ¢. um politico que nao apoia a cutandsia? um Republicano que nio apoia a eutandsia? Suponha que 16% dos presos em prisdes es duais sofram de alguma doenga psiquidtrica. Qual é a probabitidade de: um prisioneire em particular niio sofrer de uma doenga psiquiitrica? b. trés prisioneiros niio sofrerem de uma doenga psiquitrica? Uma pesquisa demonstrou que quase 25% dos adultos moradores de rua so veteranos de guerra. Qual é a probabilidade de esco- Thermos: ‘a. um morador de rua em particular que nio seja um veterano de guerra? bb. a0 acaso, dois moradores de rua que se jam ambos veteranos de guerra? Suponha que 20% dos homens (P = 0,20) ¢ 15% das mulheres (P = 0,15) sejam porta- dores de certa caracteristica genética. Essa caracteristica somente pode ser herdada por uma erianga se ambos os pais forem porta- dores. Qual é a probabilidade de uma erianga nascer com essa caracteristica genét Durante uma prova semestral de Historia Antiga, um estudante chega a duas questbes relativas a uma aula que perdeu, ¢ entiio cle decide responder aleatoriamente js duas questdes. Uma das questdes ¢ do tipo ver- dadeiro‘falso ¢ a outra é de miitipla escolha com cinco respostas possiveis. Qual é a pro- babilidade de ele dar: 15. 16. 7% . a resposta correta para a questio do tipo verdadciro/falso? a resposta correta para a questio de mile tipla escolha? €. as respostas corretas para ambas as ques- tes? d. as respostas incorretas para ambas as questdes? €. a resposta correta para a questio do tipo verdadcio/falso © a resposta incorreta para a questio de miltipla escolha? {a resposta incorreta para a questio do tipo verdadeiro/falso € a resposta correta para a questo de miiltipla escotha? Suponha que voe# compre um bilhete de lo- teria que contenha dois nimeros ¢ uma letra, como 3 7 P A. Qual & a probabilidade de voeé acertar © primeiro digito? Qual é a probabilidade de vocé acertar © segundo digito? €. Qual é a probabilidade de voeé nao acer- tar 0 primeiro digito? (Qual éa probabilidade de voo’ acertar tanto © primeiro quanto 0 segundo digitos? €. Qual é a probabilidade de vocé acertar a letra? £. Qual é a probabilidade de voc? acertar tudo (digitos e letra)? ‘Uma certa comunidade quer abordar 0 pro- biema de conflitos raciais no colégio local. O prefeito decide estabelecer uma comissio de trés moradores para aconsethi-lo, Para ser completamente justo no processo de selegao, © prefeito decide escolher os membros da comissio de maneira aleatéria, designando 0 Primeiro escolhido como lider da comissio, ‘A comunidade & composta de 30% de mora- dores brancos, 30% de moradores negros ¢ 20% de moradores latinos. Qual ¢ a proba- bilidade de: a. olider da comissio ser um morador branco? bo lider da comissio ser um morador negro? €. 0 lider da comissio ser branco ou latino?” ._ostrés membros da comissio serem negros? Escolhendo ao acaso uma carta de um bara- Iho padrio de $2 cartas, qual a proba dade de tirarmos: 18, 19, 20. a. © oito de ouros? 0 oito de ouros ou © oito de copas? . um oito? uma carta vermelha? €. uma carta com um desenho (valete, dama ou rei)? f. do seis a0 nove, inclusive? uma carta com um nimero impar? ‘Suponha que 31% dos Democratas e 63% dos Republicans apoiem a construgdio de mais usinas nucleares nos Estados Unidos. Agora suponha que haja 40 Republicanos e 35 De- ‘mocratas em uma sala, Qual é a probabilidade de, a0 acaso, a. escolhermos um Republicano? ‘b. escolhermos um Democrata? ¢. escolhermos um Republicano que apoie a construgio de mais usinas nucleares? escolhermos um Demoerata que apoic a construgaio de mais usinas nucleares? escolhermos um Democrata ¢ um Repu blicano que apoiem a construgio de mais usinas nucleares? {. escolhermos ao: acaso dois Republicans que niio apoiem a construgio de mais usi- nas nucleares? © ‘Uma pesquisa demonstrou que 6 de cada 10 casamenios terminam em divércio. Qual é a probabilidade de: @. um casal recém-casado permanecer casa- do “até que a morte os separe™? b. dois casais casados em uma ceriménia dupla se divoreiem? ‘Suponha que 2% de todos os criminosos con- denados sejam, na realidade, inocentes, a. Se uma pessoa é condenada por um crime, qual é a probabilidade de ela ser culpa Se duas pessoas so condenadas por eri- mes, qual é a probabilidade de ambas se- rem culpadas? ¢. Se trés pessoas so condenadas por cri- mes, qual & a probabilidade de as trés se~ rem culpadas? ‘Se quatro pessoas sio condenadas por cri- mes, qual ¢ a probabilidade de as quatro serem culpadas? ‘Sob qualquer distribuicio normal de escores, ‘qual porcentagem da iirca total esti: b. Capitulo 5° Probabilidade e curva normal 151 24. 25, entre a média (4) € um valor de escore que se encontra um desvio padrio (10) acima da média? ‘entre um valor de escore que se encontra um desvio padrio abaixo da média ¢ um valor de escore que se encontra um desvio padrio acima da média? ¢. entre a média e um valor de escore que se encontra +2e acima da médi: entre um. valor de escore que se encontra —2e abaixo da média.e um valor de esco- re que se encontra +2a acima da média? . O teste de avaliagio académica (SAT, do in- lés Scholastic Assessment Test) é padronizado para ser normalmente distribuido com uma mé- dia = 500 e um desvio padrio o = 100. Qual porcentagem de escores do SAT esti: centre 500 © 600? entre 400 © 600? ‘entre 500 ¢ 700? entre 300 ¢ 7002 acima de 600? f.abaino de 300? Para 0 SAT, determine o escore = (isto é, 0 nimero de desvios padrio ¢ o sentido) que cada um dos escores a seguir dista da média: a. 500 b 400 &. 650 570 ¢. 750 f. 380 Usando os escores z calculados no Problema 23 € na Tabela A, calcule qual ¢ a porcenta- gem de escores do SAT que se situa: a. 500 ou acima 400 ou abaixo entre S00 ¢ 650 570 ou acima centre 250 ¢ 750 f. 380 ou acima (Dica: 50% da frea esti em qualquer um dos lados da curva.) Excores de Qls so normalmente distribuidos ‘com uma média = 100 ¢ um desvio padio o = 15, Com base nessa distribuigo, determine: a. a porcentagem de escores de Qls entre 100 e 120. b. a probabilidade de escother, a0 acaso, luma pessoa com QI entre 100.¢ 120. a b & a e b © a © 26, Estat ica para ciéncias humanas €. a porcentagem de escores de Qs entre 88 ¢ 100. a probabilidade de escolher, a0 acaso, uma pessoa com QI entre 88 © 100. €. a porcentagem de escores de Qls de 110 ou mais. f. a probabilidade de escolher, a0 acaso, ‘uma pessoa com QI de 110 ou mais. & a probabilidade de eseolher, a0 acaso, duas pessoas com QI de 110 ou mais. 4 classificagio percentil correspondente a uum escore de QI de 128. Suponha que os assistentes (formados) de pesquisa em uma grande universidade sejam pagos por hora. Dados do departamento pes- soal demonstram que a distribuigao de sali- rios por hora pagos para estudantes: gradua- dos no campus é aproximadamente normal, com uma média de $ 12,00 ¢ um desvio pa- driio de $ 2,50, Determine: @& a porcentagem de assistentes graduados que ganham um salério por hora de $ 15 ou mais. 1b. a probabilidade de escother a0 acaso, dos arquivos de pessoal, um assistente gra- duado que ganhe um salirio por hora de ‘$15 ou mais. ©. a porcentagem de assistentes graduados que ganham entre $10 €$ 12 por hora. 4 probabilidade de escolher ao acaso, dos arquivos de pessoal, um assistente gra duado que ganhe entre $ 10 e312 por hora. €. a porcentagem de assistentes graduados que ganham um salirio por hora de $ 11 ou menos. fa probabilidade de escolher ao acaso, dos arquivos de pessoal, um assistente gra- duado que ganhe um salirio por bora de $ 11 ou menos. & a probabilidade de escother a0 acaso, de arquivos pessoais, um assistente gradua- do cujo salario por hora seja extremo em qualquer um dos sentides —$ 10 ow me- nos ow S14 ou mais. 4 probabilidade de escolher ao acase, dos arquivos pessoais, dois assistentes gra- 27. duados eujos salirios por hora sejam me= nores do que a média. i. a probabilidade de escother a0 acaso, dos arquivos de pessoal, dois assistentes gra- duados cujos salérios por hora sejam $ 13,50 ou mais. ‘Suponha que a carga de trabalho média para um agente de condicional seja de 115 crimi- noses e que o desvio padrio seja 10. Presu- mindo que os tamanhos das cargas de trabalho sejam distribuidos normalmente, determine: ‘a. a probabilidade de que um agente de con- dicional tenha uma carga de trabalho en- tre 90 ¢ 105 casos. a probabilidade de que um agente de con- dicional tenha uma carga de trabalho de ais de 135 casos. ¢. a probabilidade de que quatro agentes de condicional tenham uma carga de traba- Iho maior do que 135 casos. Suponha que 0 QI médio de um grupo de psi- copatas seja 108, ¢ que o desvio padrio seja 7. Presumindo uma distribuigio normal, de- termine: a. a porcentagem de escores de Qls entre 100e1 probabilidade de escolher, ao acaso, um psicopata que tenha um QI entre 100 € 110. €. a porcentagem de escores de Qls entre 90 © 105, d._a probabilidade de escolher, ao acaso, um psicopata que tenha wn Ql entre 90. 105. €. a porcentagem de escores de Qls que se~ jam 125 ou mais altos. £. a probabilidade de escolher, a0 acaso, um psicopata que tenha um QI de 125 ou mais. @- a probabilidade de escolher, a0 acaso, dois psicopatas que tenham ambos um QL de 125 ou mais, Uma importante companhia automebilistica alega que seu novo modelo tem um desem- penho médio de 25 mpg (milhas por galio). Funcionarios da empresa admitem que al- guns carros variam com base em uma série de fatores, e que os desempenhos de milhas por galio tém um desvio padrio de 4 mpg. ‘oct é funcionirio de um grupo de protegio 0 consumidor que rotineiramente realiza ‘est drives. Escothendo cinco carros aa acaso da linha de montagem, seu grupo descobre que les tm um desempenho de mpg ruim, defi- nido como 20 mpg ou menos, a. Presumindo que a alegagio da empresa seja verdadeira (qt = 25 ¢ 0 = 4), qual éa probabilidade de que um tinico carro es- colhido a0 acaso tenha um mau desermpe- nnho (20 mpg ou menos)? b Presumindo que a alegagio da empresa seja verdadeira (q = 25 © o = 4), qual ¢ a probabilidade de que cinco carros esco- Ihidos ao acaso tenham um mau desempe- rho (20 mpg ou menos)? ¢. Dado o mau desempenho que seu grupo observou em cinco carros de testes, qual Capitulo 5 © Probabilidade e curva normal 153 conclusio vocé pode tirar a respeito da alegagio sobre o mpg da empresa? 30, Presuma que os escores entre norte-america- nos de origem asiitica em uma eseala de alie- nagio sejam normalmente distribuidos com uma média p. = 22 © um desvio padrio o = 2,5 (escores mais altos refletem sentimentos maiores de alienago). Com base nessa distri- buigdo, determine: a. a probabilidade de um norte-americano de origem asiitica ter um escore de alie- nag entre 22 ¢ 25, b. a probabilidade de um norte-americano de origem astitica ter um escore de alie- nagdo de 25 ou mais. ese) ‘A seguranga na escola é uma questiio im- portante. Usando o SPSS para analisar Monitoring the Future Survey, descubra quiio seguro © estudante tipico se sente nas escolas de ensino médio norte-americanas (V1643). Determine a média e 0 desvio padrao. a. Usando a média ¢ 0 desvio padrio cal- culados, qual é a porcentagem esperada de estudiantes que se sintam satisfeitos, ou completamente satisfeitos com sua seguranga pessoal (6 ou mais)? b. Qual éa poreentagem esperada de estu- dantes que se sintam neutros ou abaixo disso em relagiio a quo seguros eles se seniem na escola? c. Qual é a probabilidade de escolher, 20 caso, um estudante que se sente neutro, ou abaixo disso a respeito de quo se- guro cle se sente na escola’? Usando © procedimento. de frequéncias (ANALYZE, DESCRIPTIVE STATIS- TICS, FREQUENCIES), pega um histo- grama de dados de audiéncia de televisio do General Social Survey (TVHOURS) com a eobertura de curva normal (do botio Charts), assim como a média ¢ 0 desvio pa- drio (do botao Statistics). ‘&, Comente a proximidade da distribuigo real coma curva normal. b. Baseado na distribuigio normal (usan- do o escore = ¢ a Tabela A), qual é probabilidade de que uma pessoa veja 3h ou mais de televiséo por dia? . Compare a probabilidade da distri- buigio normal com a proporgiio real de relatérias de pessoas que assistem 3h ou mais de televisio por dia. . Usando 0 procedimento de firequincias (ANALYZE, DESCRIPTIVE STATISTICS, FREQUENCIES), pega um hisiograma de dados de desemprego do Best Places Study com a cobertura de curva normal (do botio Charts), assim como a média © 0 desvio pa- diio (do bos Statistics). a, Comente a proximidade da distribuicdo real com a curva normal. b. Com base na distribuigdo nonmal (usan- doo escore zea Tabela A), qual é a pro- babilidade de que uma area estatistica metropolitana (MSA, do inglés Metro- politan Statistical Area) tenha uma taxa de desemprego de 6,5% ou acima disso? ¢. Compare a probabilidade da distribuigio normal com a proporgiio de escores reais de MSAs que sejam 6,5% ou maiores.

También podría gustarte