Está en la página 1de 44
Teste de diferencas entre médias © Ahipétese nula; nenhuma diferenca entre médias © Ahipotese de pesqui diferenca entre médias * Distribuigéo amostral das diferencas entre médias © Testes de hipdteses coma distribuicao das diferencas entre médias © Niveis de significancia + Erro padrao da diferenca entre médias © Teste de diferenca entre médias ‘Quadro 7.1 Exemplo passo a passo: teste de diferenca entre médias + Comparacdo entre amostras dependentes ‘Quadro 7.2 Exemplo passo a passo: teste de diferenga entre médias para as duas medicdes da mesma amostra alguma Quadro 7.3 Exemplo passo a passo: teste de diferenca entre médias para amastras relacionadas Teste de proporcoes para duas amostras Quadro 7.4 Exemplo passo a paso: teste de diferenca entre proporcoes Testes unilaterais Quadro 7.5 Exemplo passo a passo: teste unilateral de médias para duas medigdes da mesma amostra Exig@ncias para testar a diferenca entre médias Quadro 7.6 Exemplo passo a passo: grupos independentes, teste unilateral Resumo Termos-chave Exercicios Exercicios em SPSS ‘© Capitulo 6, vimos que a média ou proporcao populacional pode ser estimada a partir de in- formagdes que obtemos de uma jinica amostra. Por exemplo, poderiamos estimar o nivel de anomia em uma determinada cidade, a proporgiio de pessoas idosas com dificuldades econdmicas oua opinidio média em relagio & segregagao racial entre a populagao norte-americana. Apesar da abordagem descritiva, que retine fatos, usada para estimar médias e proporgdes ter uma importineia dbvia, ela ndo constitui a principal meta da tomada de decisto ou da atividade Capitulo 7 + Teste de diferencas entre médias 189 Longe disso, a maioria dos pesquisadores sociais esta preocupada com a tarefa Suponha, por exemplo, que um restaurante local anuncie um concurso para incrementar suas vendas no almogo. De acordo com a promagio, 20% das contas de refeigies geradas pelo compu- tador e escolhidas a0 acaso terdio uma estrela vermelha impressa, significando que oalmogo ¢ “por conta da casa”. Voce ja comeu no restaurante quatro vezes desde que a promogiio comegou, ¢ ainda nilo teve um almogo de graga. Vocé deveria comegar a questionar a autenticidade da promogo do restaurante? E que tal se vocé almogar oito vezes ¢ ainda assim nao ganhar, ou 16 vezes? Seria hora de reclamar ou voce poderia atribuir o fato 4 ma sorte? Com base no que sabemos a respeito das regras de probabilidade apresentadas no Capitulo 5, suas chances de nio conseguir uma refeigdo de graga ¢ de 0,8 cada vez que voce almoga. Qua- tro almogos sem ganhar a promogo tm uma probabilidade de (0,8)' = 0,410, bascado na regra da multiplicagao — ndo é uma ocorréncia totalmente improviivel. A chance de perder oito vezes seguidas ¢ (0,8)' = 0,168 — menos proviivel, mas ainda assim dificilmente seria uma justificativa para reclamar junto a secretaria de defesa do consumidor. Mas almogar nesse restaurante 16 vezes sem ganhar a refeicio seria muito improvivel, (0,8)'* = 0,028, presumindo que a alegago do res- taurante de que 20% das refeigdes a0 acaso sio gratuitas seja realmente vilida. Realmente, 16 almogos sem ganhar a promogio ¢ tio improvivel que vocé deveria questionar se a suposicaio de que 20% das contas tém uma estrela vermetha da sorte é verdadeira. E claro, ha uma pequena probabilidade (0,028) de vocé ter "azar", mas o cientista social (que nao aeredita em azar) concluiria, em vez disso, que a suposigdo de que 20% das contas tm estrelas vermelhas deve ser rejeitada. Essa é a logica (mas ndo propriamente a mecéinica) do teste de hipéteses. Estabelecemos uma hipStese sobre populacdes, coletamos dados amostrais e vemos quio proviveis sio os resultados da amostra, levando em consideragao nossa hipdtese sobre as populagdes. Se os resultados da amos- tra slo razoavelmente plausiveis quanto a hipétese a respeito de populagdes, retemos a hipétese e atribuimos qualquer divergéncia relativa a nossos resultados esperados ao puro aeaso baseado no erro amostral, Por outro lado, se 0s resultados da amostra sio improvaveis demais (por exemplo, menos de 5 chances em 100), entio rejeitamos a hipétese. Em ciéncias sociais, hipéteses geralmente dizem respeito a diferencas entre grupos. Ao testar essas diferengas, pesquisadores sociais fazem perguntas como: os alemies diferem dos norte-ame- ricanos em termos de obediéneia em relagéo a autoridade? Qual grupo possui a taxa de suicidio mais alta, protestantes ou catdlicos? Politicos conservadores disciplinam mais severamente seus filhos do que politicos liberais? Observe que cada questo da pesquisa envolve uma comparacéo entre dois grupos: conservadores versus liberais, protestantes versus catélicos, alemies versus norte-americanos. Analise um exemplo mais conereto. Suponha que um gerontologista esteja interessado em comparar dois métodos para melhorar a meméria de residentes em geriatria. Ele escolhe dez resi- dentes ¢, entio, divide-os aleatoriamente em dois grupos. A um grupo é designado o Método A, ¢ a0 outro, 0 Método B. Suponha ainda que, seguindo © treinamento de reforgo da memdria, os dez individuos re- cebam © mesmo teste de meméria, O escore médio da amostra para cinco individuos obtide por meio do Método A ¢ 82, ¢ a média amostral para o grupo analisado por meio do Método B € 77. 0 Método A é mais eficaz para melhorar a meméria? Talvez. Talvez no. E impossivel tirar qualquer conclusio até que saibamos mais sobre os dados. Digamos apenas por ora que 0s conjuntos de escores de meméria para os dois grupos de residentes sejam os seguintes: z }90 _Estatistica para ciéncias humanas Método A. Método 82 ® 83 ” 82 6 80 8 83 16 Média = 82 Médii No grupo que utilizou o Método A, 05 escores de meméria se encontram consistentemente na faixa dos 80 e poucos, de maneira que precisariamos de bastante certeza de que a média po- Pulacional estaria préxima da média amostral de $2. Similarmente, diriamos com certeza que a média populacional para o grupo que utilizou o Método B provavelmente se encontra proxima da média amostral de 77. Dada a homogeneidade dos escores e, dese modo, das médias amostrais, provavelmente poderiamos concluir que a diferenga entre médias amostrais é mais do que apenas © resultado de puro seaso-ou erro amostral, Na realidade, o Método A parece ser mais efieiente do que © Método B. Agora suponha em vez disso que 0s conjuntos de escores a seguir tenham produzido as duas médias amostrais 82 ¢ 77. Esté claro que em ambos os grupos ha uma ampla variabilidade ou dis- seminagao entre os escores de meméria. A consequéncia disso é que ambas as médias amostrais sio estimativas relativamente instiveis de suas respectivas médias populacionais. Dada a hetero geneidade dos escores amostrais ¢ a falibilidade das médias amostrais, nio poderiamos concluir, portanto, que a diferenga entre as médias amostrais nada mais seja do que o resultado de puro acaso ou erro amostral, Na realidade, hi provas suficientes para concluir que o Método A & mais eficiente do que 0 Método B. Método B 70 a 36 8 Média = 77 A hipotese nula: nenhuma diferenca entre médias ‘Tomou-se uma convengao na anilise estatistica iniciar 0 estudo pelo teste da hipdtese nula, que diz que duas amostras foram extraidas de populagdes equivalentes. De acordo com a hipdtese ula, qualquer diferenga observada entre amostras é considerada uma ocorréneia ao acaso resul- fante apenas do erro amostral, Portanto, uma diferenga obtida entre duas médias amost representa uma diferenga verdadeira entre suas médias populacionais. No contexto atual, a hipétese nula pode ser representada por: Mh, onde 1, = média da primeira populagio = média da segunda populagio Capitulo 7 Teste de diferencas entre médias 191 Examinaremos as hipéteses nulas para as questdes de pesquisa levantadas anteriormente: 1, Alemaes nio sio:nem mais, nem menos submissos & autoridade do que os norte-americanos. 2. Protestantes tém a mesma taxa de suicidio que catélicos. 3. Politicos conservadores ¢ liberais disciplinam seus filhos da mesma maneira. Deve ser observado que a hipétese nula nao exclui a possibilidade de obtermos diferengas entre médias amostrais. Pelo contrario, ela busca explicar tais diferengas atribuindo-as & operagao do erro amostral. De acordo com a hipétese nula, por exemplo, se descobrimos que uma amostna de professoras ganha um salirio menor (¥ = $ 32.000) do que uma amostra de professores (XY = $ 33.000), nao concluimos, baseado nisso, que a populagdo de professoras ganha menos que a populagdo de professores. Em vez disso, tratamos nossa diferenga de amostra obtida ($ 33.000 ~ $ 32.000 = § 1,000) como um produto de erro amostral —a diferenga que inevitavelmente resulta do processo de amostragem de uma determinada populagio, Como veremos mais tarde, esse aspecto da hipétese nula fornece um elo importante com a teoria da amostragem. Concluir que o erro amostral é responsivel pela diferenga obtida entre as médias amostrais manier a hipotese nula, O uso do termo manter nao implica que tenhamos provado que as médias populacionais sto iguais (se, = 4.) u mesmo que acreditamos nela, Tecnicamente, somos mera~ mente incapazes de rejeitar a hipdtese nula devido 4 falta de prova contraditéria. Portanto, a frase ‘manter a hipétese nula seri usada a0 longo do texto quando formos incapazes de rejeité-la Ahipétese de pesquisa: alguma diferenca entre médias A hipétese nula é geralmente (apesar de niio necessariamente) estabelecida com o intuito de a negarmos. Isso faz sentido, pois a maioria dos pesquisadores sociais busca estabelecer relagdes entre varidveis. Isto é, muitas vezes eles estio mais interessados em descobrir diferengas do que em determinar que elas nao existem. Diferengas entre os grupos — esperadas por razbes tedricas ‘ou empiricas — frequentemente fornecem o fundamento légico para a pesquisa. Se rejeitarmos a hipétese nula e descobrirmos que provavelmente nossa hipétese de no haver diferenga entre as probabilidades no procede, automaticamente aceitamos a hipdtese de pesquisa de que existe uma diferenga de populagiio verdadeira. Esse ¢ com frequéncia o resultado esperado em pesquisa social. A hipdtese de pesquisa diz que as duas amostras foram extraidas de populagdes tendo médias diferentes. Ela diz que a diferenca obtida entre as médias amostrais ¢ grande demais, para ser atribuida ao erro amostral. A hipotese de pesquisa para diferengas entre médias é simbolizada por: édia da primeira populagio 14, = média da segunda populagio Nota: lé-se # como néo é igual a. As hipéteses de pesquisa a seguir podem ser especificadas para as questes de pesquisa ¢o- Jocadas anteriormente: 1. Alemies diferem dos norte-americanos em relagio 4 obediéncia a autoridades. J92_Estatistica para ciéneias humanas 2. Protestantes nio tém a mesma taxa de suicidio que catdlicos. 3. Politicos liberais diferem dos conservadores quanto aos métodos permissivos na criagao: de seus filhos. Distribuigao amostral das diferencas entre médias. No capitulo anterior, vimos que as 100 médias de 100 amostras sorieadas por nosso pesqui: sador social excéntrico poderiam ser representadas em forma de uma distribuigdio amostral de médias. De maneira similar, imaginaremos que © mesmo pesquisador estude no uma, mas duas amostras de uma vez para fazer comparagdes entre elas. ‘Suponha, por exemplo, que nosso pesquisador social esteja ministrando um curso sobre so- ciologia da familia, Ele esta curioso para saber se ha diferengas de género quanto a opinides em relagio eriagdo dos filhos. Especificamente, ele esta interessado em determinar se homens € mulheres diferem em termos de permissividade na criagio dos filhos. Para testar as diferengas, ele primeiro constréi uma escala de nviltiplos itens, que inclui vé~ rias questdes sobre a adequagio de dar palmadas, exigir trabalho doméstico de criangas pequenas ¢ obediéneia as demandas dos pais. Sua escala de permissividade varia de um minimo de | (nem um pouce permissivo) a 100 (extremamente permissive). Em seguida, ele seleciona uma amostra aleatoria de 30 mulheres ¢ uma amostra aleat6ria de 30 homens do diretério de estudantes e pede que eles respondam o seu questionirio. Como ilustra graficamente a Figura 7.1, nosso pesquisa- dor excéntrico descobre que sua amostra de mulheres mais permissiva (T= 58,0) do que a sua amostra de homens (Y= 34,0). Antes que nosso pesquisador excéntrico conclua que individuos do sexo feminino sio real- mente mais permissivos que individuos do sexo masculino, ele poderia fazer a seguinte pergunta: Jevando em consideragio o erro amostral, podemos esperar uma diferenga entre 58,0 ¢ 54,0 (38,0 ~ 54,0 = +4,0) estritamente devido ao acaso, ¢ somente ao acaso? Com base somente na sorte, poderia a amostra de individuos do sexo feminino ter sido formada por pessoas mais permissivas do que a amostra de individuos do sexo masculino? Devemos manter a hipstese nula de nenhuma Observagao: 4 representa a diferensa médias entre diss amostras sleatiias, ‘cada uma contendo 30 membros. 580 = +40 Figura 7.1 Diferenca media em termos de permissividade entre amastras de individuos do sexo feminino e do sexo masculino extraidas de uma populacéo hipotética Capitula 7 Teste de diferencas entre médias 193 diferenga ou a diferenga amostral obtida de + 4.0 ¢ grande o suficiente para indicar uma verdadei- ra diferenga populacional entre individuos do sexo feminino e do sexo masculino quanto ais suas atitudes na criagio de seus filhos? No Capitulo 2 fomos introduzidos as distribuigdes de frequéncia de escores brutos de uma determinada populagio. No Capitulo 6, vimos que era possivel construir uma distribuigdo amostral de escores médios, uma distribuigtio de frequéncia de médias amostrais. Ao abordarmos a.questio em causa, temos de levar adiante a nogo da distribuigdo de frequéncia e examinar a natureza da distribuigdo amostral de diferencas entre médias — isto & uma distribuigo de frequéncia de um grande nimero de diferencas entre médias amostrais que foram tiradas aleatoriamente de uma determinada populagio. Para ilustrar a distribuigdo amostral de diferengas entre as médias, retornaremos ds atividades compulsivas de nosso pesquisador excéntrico, cuja paixdo por tirar amostras aleatérias mais uma vez.0 levou a continuar o processo de amostragem além de seus limites razoiveis. Em vez de tirar uma Gnica amostra de 30 mulheres ¢ uma Giniea amostra de 30 homens, ele estuda 70 pares dessas amostras (70 pares de amostras, cada um contendo 30 mulheres ¢ 30 homens), sentindo-se afortu- nado por dar aulas em uma escola grande. Para cada par de amostras, 0 pesquisador administra a mesma eseala de permissividade na criagSo dos filhos. Ele entio calcula uma média amostral para cada amostra do sexo ferninino ¢ uma média amostral para cada amostra do sexo masculino. Desse modo, ele tem uma média das mulheres e uma média dos homens para cada um de seus 70 pares de amostras. Em seguida, 0 pesquisador estabelece um escore de diferengas entre médias subiraindo escore médio para homens do escore médio para mulheres a cada par de amostras. Por exemplo, sua primeira comparacao produziu uma diferenca entre médias de +4,0. Seu segundo par de mé- dias poderia ser $7,0 para a amostra do sexo feminino 56,0 para a amostra do sexo masculino, produzindo uma diferenga entre escores médios de +1,0, Da mesma maneira, o terceiro par de amostras poderia ter produzido uma média de 60,0 para as mulheres ¢ uma média de 64,0 para os homens, e a diferenca entre médias seria de~—4,0. Obviamente, quanto maior o escore de diferenga, mais as duas amostras de entrevistados diferirio em relagio a permissividade. Observe que sempre subtraimos a média da segunda amostra da média da primeira amostra (no caso atual, subtraimos © escore médio para a amostra do sexo masculino da escore médio para a amostra do sexo femin no). Os 70 escores de diferencas entre médias obtidos por nosso pesquisador social excéntrico siio mostrados na Figuea 7.2, Suponhamos que sabemos que as populagées de homens ¢ mulheres nao diferem de maneira alguma quanto permissividade em suas atitudes ao criar seus filhos. Ampliando a discussio, digamos que p. = $7,0 tanto nas populagdes do sexo feminino quanto do sexo masculino. Se pre- sumirmos que a hipotese nula est correta que individuos do sexo masculino ¢ do sexo feminino so idénticos nesse sentido, podemos usar as 70 diferencas médias obtidas por nosso pesquisador excéntrico para ilustrar a distribuigio amostral de diferengas entre as médias, Isso é valido porque, na distribuigdo amostral de diferengas entre médias, supomos que todos os pares de amostras dife- rem apenas em virtude de erro amostral, ¢ ndio em fungdo de verdadeiras diferengas populacionais. Os 70 escores que representam diferengas entre médias mostrados na Figura 7.2 foram rear ranjados na Tabela 7.1 como uma distribuigio amostral de diferengas entre médias, Assim como os escores em outros tipos de distribuigdes de frequéncia, eles foram arranjados em ordem consecuti- va dos mais altos para os mais baixos, e a frequéncia de ocorréncia é indicada na coluna adjacente. 194 Estalistica para ciéncias humanas Observagdo: cada escore representa adiferenca média entre uma amostra de 30 mulheres ¢ uma de 30 homens. Figura 7.2. Setenta escores de diferencas entre médias que representam diferencas em termos de permissividade entre amostras de mulheres e de homens extraidas ao acaso de uma populacae hipotetica. Tabela 7.1 Distribuigso amostral de diferencas de médias para 70 pares de amostras ao acaso. N + Bsses eseores de diferengas ineluem valores fracionais (por exemplo, -5 inclui os valores -$,0 a-5,9). Para descrever as propriedades fundamentais de uma distribuigio amosteal de diferengas en- tre médias, a distribuigio de frequéncia da Tabela 7.1 € graficamente apresentada na Figura 7.3. Como podemos ver, a distribuicdo amastral de diferencas entre ax médias se aproxima de uma Capitulo 7 « Teste de diferencas entre médias 195 Frequéncia 1 14 L 1 1 L s 4 3 2 4 oF 4 #2 8 4 4s Figura 7.3 Poligono de frequéncia da distribuicao amostral das diferencas médias da Tabela 7.1. curva normal cuja média (média de diferencas entre a média) é zero.' Isso faz sentido porque as diferengas positivas ¢ negativas entre as médias na distribuiglo tendem a cancelar uma a outra (para cada valor negativo, parece haver um valor positivo de igual distincia da média). Como uma curva normal, a maioria das diferengas entre médias amostrais nessa distribuigao fica proxima de zero, seu ponto mais central; ha relativamente poucas diferengas entre médias com valores extremos em qualquer uma das diregdes da média dessas diferengas. Isso deve ser espe- rado, porque a distribuigdo total de diferengas entre médias ¢ resultado do erro amostral, e ndo de 4iferencas populacionais reais entre homens e mulheres. Em outras palavras, se a diferenga média real entre as populagdes de homens ¢ mulheres ¢ zero, também podemos esperar que a média da distribuicdo amostral de diferengas entre médias amostrais seja zero. Testes de hipéteses com a distribuicado das diferencgas entre médias Nos capitulos anteriores, aprendemos a fazer declaragdes de probabilidade em relagio 4 ocor- réncia tanto de escores brutos quanto de médias amostrais. Agora, procuramos fazer essas afir= mages sobre os escores de diferengas na distribuigdo amostral de diferengas entre médias. Como destacamos anteriormente, essa distribuigdo amostral assume a forma de curva normal ¢, portan- to, pode ser considerada uma distribuigiio de probabilidade. Podemos dizer que a probabilidade diminui a medida que nos afastamos cada vez mais da média de diferengas (zero). Mais especifica- mente, como ilustra a Figura 7.4, vemos que 68,26% das diferencas entre médias situam-se entre +1o" E-¥ ¢-lery,—x, a contar de zero, (A notagao a x, ¢,representa odesvio padrao das diferengas entre Xe ¥,,) Em termos de probabilidade, isso indica que P = 0,68 de qualquer diferenga entre médias amostraissituar-se dentrodesse interval. Similarmente, podemos dizer que existe umaprobabilidade [sso presume que extraimos grandes amostras aleatorias de uma determinada populagio de escores brutos, 196 Estatistica para ciéncias humanas + 68,26%—> Figura 7.4 Distribuicso amostral de diferencas entre médias como uma distribuic3o de probabilidade ‘aproximada de0,95 (95 chances em 100) de qualquer diferengaentre médias amostras stuar-se entre . = -¥, # contar de uma diferenga zero enire médias ¢ assim por diante. A distribuicdo amostral de diferengas fornece uma base segura para o teste de hipéteses sobre a diferenca entre duas médias amostrais. Diferentemente do pesquisador excéntrico que, compulsi= vamente, toma pares de amostras, uma depois da outra, a maioria dos pesquisadores estuda apenas um par de amostras para fazer inferéncias com base em apenas uma diferenga entre médias, ‘Suponha, por exemplo, que um pesquisador social quisesse testar a hipdtese do pesquisador excéntrico, ou pelo menos uma variagdo dela, de modo realista, Ele concorda que pode haver di- ferengas em termos de opinides quanto a cria¢do dos filhos, mas entre casais que ja tém filhos, € nao entre futuros pais. Ao acaso, ele escolhe 30 mies ¢ 30 pais (ndo necessariamente casais casados) e administra a escala de permissividade do pesquisador excéntrico a todos eles. Ele obtém escores de permis- sividade média de 45 para as mies ¢ de 40 para os pais. O pesquisador segue a seguinte linha de raciocinio: se a diferenga obtida entre as médias de 5 (45 ~ 40 = 5) encontra-se tio distante de uma diferenca de zero que tenha apenas uma pequena probabilidade de ocorréneia na distribuicao amostral de diferengas entre as médias, rejeitamos a hipotese nula, que diz que a diferenga obtida entre as médias ¢ um resultado de erro amostral. Se, por outro lado, nossa diferenga entre médias amostrais esta tio proxima de zero que sua probabilidade de ocorréncia seja grande, temos de manter a hipotese nula e tratar a diferenga obtida entre as médias meramente como um resultado de erro amostral, Portanto, procuramos determinar quiio distante de uma diferenga de zero est a diferenga obtida entre as médias (nesse caso, 5). Ao fazer isso, primeiro temos de converter a diferenca obtida em unidades de desvio padrao. Lembre-se de que convertemos escores bruros em unidades de desvio padrio usando a for- mula: Capitulo 7 + Teste de diferencas entre médias 197 onde X= escore bruto 14 = média da distribuigdo de escores brutos «r= desvio padirao da distribuigao de escores brutos Da mesma maneira, convertemos os escores médias em uma distribuigio de médias amostrais em unidades de desvio padrio usando a form onde Y = média amostral }4~ média populacional (média das médias) oy = erro padrio da média (desvio padrio da distribuigio de médias) No contexto atual, buscamos similarmente converter nossa diferenga de médias amostrais Jem unidades de desvio padrio usando a férmula: (%1-%)-0 onde Y, = média da primeira amostra ¥, = média da segunda amostra 0 = zero, o valor da média da distribuigdo amostral de diferencas entre médias (presu- mimos que x, ~ #1, = 0) ay, x, = desvio padrio da distribuigéo amostral de diferengas entre as médias Como presumimos que a média da distribuigdo das diferengas entre médias seja zero, pode mos eliminé-la da formula do escore z sem alterar nosso resultado, Portanto, Quanto & permissividade entre as amostras de mie ¢ pai, temos de converter a diferenca que obtivemos entre as médias em seu equivalente de escore 2. Se 0 desvio padrlo da distribuigdo amostral das diferengas entre as médias ¢ oy, y, (falaremos mais sobre como chegar a esse nime- ro posteriormente), obteremos 0 escore = a seguir: 45 — 40 2 =5 2 = +25 198 Estatistica para ciéncias humanas Desse modo, uma diferenga de 5 entre as médias para as duas amostras situa-se 2,5 desvios padrio de uma diferenga média de zero na distribuigdo de diferengas entre as médias. Qual é a probabilidade de que uma diferenga de 5 ou mais entre médias amostrais possa acontecer estritamente com base em um erro amostral? Ao verificar a coluna (c) da Tabela A.no Apéndice B, ficamos sabendo que = = 2,5 delimita 0,62% da area em cada extremidade, ou 1,24% no total (veja a Figura 7.5), Se arredondarmos, hi uma probabilidade P = 0,01 de a diferenga da média de 5 (ou maior do que 5) entre as amostras ocorret em consequéncia do erro amostral (e assim aparece na distribuigdo amostral) apenas uma vez em cada 100 diferengas médias. Diante disso, ndo cogitariamos rejeitar a hipotese nula¢ aceitar a hipétese de pesquisa de que uma diferen- ca populacional realmente existe entre mies ¢ pais quanto a permissividade na criagdo dos filhos? ‘Uma chance em 100 representa uma probabilidade bastante razoavel. Em uma situasio como essa, a maioria das pessoas escolheria rejeitar a hipétese nula, mesmo que fosse errado fazt-lo (ndio esqueca que I chance em 100 ainda permanece), Entretanto, a deci- so nem sempre ¢ to clara. Suponha, por exemplo, que ficamos sabendo que a diferenga obtida entre médias aconteceu por erro amostral em 10(P = 0,10), 15 (P = 0,15), ou 20 (P= 0,20) vezes de 100. Ainda assim rejeitaremos a hipétese nula? Ou daremos um passo com seguranga e atribui- remos a diferenga que obtivemos ao erro amostral’? E preciso um ponto de corte consistente para decidir se uma diferenga entre duas médias amostrais é tio grande que nio pode mais ser atribuida ao erro amostral. E preciso um método para determinar quando nossos resultados mostram uma diferenga estatisticamente significative. Quan- do uma diferenca é julgada significativa, ela € entao considerada real. Isto é, a diferenga ¢ grande 0 suficiente para ser generalizada para as populagdes das quais as amostras foram derivadas. Desse modo, estatisticamente significativo no significa necessariamente importante em sua esséncia; tampouco indica algo a respeito do tamanho da diferenga na populagio, Em amostras grandes, uma diferenga pequena pode ser estatisticamente significativa; em amostras pequenas, uma diferenga grande pode ser consequéncia de um erro amostral. 4 3 2 1 0 oF 42 oS 6 47 25 Figura 7.5 _Representacdo grafica da parcentagem da area total na distribuicéo de diferencas entre z =-2,5 ez = +2,5. Capitulo 7 + Teste de diferencas entre médias 199 Niveis de significancia Para determinar se nossa diferenga amostral obtida é estatisticamente significativa — se é 0 resultado da diferenga de populagio real, ¢ nio apenas um erro amostral —, ¢ costume estabelecer um nivel de significdncia, que ¢ representado pela letra grega « (alfa). O valor de alfa é 0 nivel de probabilidade no qual a hipétese nula pode ser rejeitada com confianga ¢ a hipétese de pesquisa pode ser aceita com confianga. Dessa maneira, decidimos rejeitar a hipdtese nula se a probabilida- de for muito pequena (por exemple, menos de $ chances em 100), o que significaria que a diferen- ‘cade amostra seria um produto de erro amostral. Convencionalmente, essa pequena probabilidade 6 representada por P< 0,05. Trata-se de uma questiio de convengdo usar @ nivel de significdincia «= 0,05. Isto ¢, estamos dispostos a rejeitar a hipétese nula se uma diferenca amostral obtida ocorrer ao acaso menos de $ vezes.em 100. O nivel de significancia de 0,05 esta graficamente representado na Figura 7.6. ‘Como podemos ver, o nivel de significincia de 0,05 se encontra nas areas pequenas das extremi- dades da distribuigio de diferengas de médias. Essas so as éreas sob a curva que representam uma ddistncia de mais ou menos 1,96 desvio padrio de uma diferenca média zero, Nesse caso (com um nivel de significdncia a = 0,05), os escores z de 1,96 so chamados de valores criticos; se obtemos ‘um escore z que excede 1,96 (isto€, z > 1,96 ouz <—I,96), dizemos que ele ¢ estatisticamente sig- nificativo. As regides sombreadas na Figura 7.6 sio chamadas de regides criticas ou de rejeicao, pois um escore z dentro dessas reas nos leva a rejeitar a hipétese nula (a porgao de cima da figura mostra as regides eriticas para um nivel de significdncia de 0,05), Para compreender melhor porque esse ponto em particular na distribuigdo amostral representa © nivel de significdncia de 0,05, poderiamos voltar & coluna (c) da Tabela A no Apéndice B para determinar a porcentagem da frequéncia total associada com 1,96 desvio padrio da média. Vemos que 1,96 desvio padrio em qualquer uma das diregdes representa 2,5% das diferengas nas médias amostrais. Em outras palavras, 95% dessas diferencas situam-se entre ~1,96a°x,-, € +1,960 x,-¥, de uma diferenga média zero; apenas 5% situam-se no ou além desse ponto (2,5% + 2,5% = 5%). 23% 25% a=005 0 ea +h96 5 a=001 ret 58 T * 0 carte Figura 7.6 Os niveis de significdncia de 0,05 e 0,01 oe. Estatistica para ciéncias humanas Niveis de significdncia podem ser estabelecidos para qualquer grau de probabilidade. Por exemplo, um nivel mais rigoroso ¢ 0 nivel de significdncia de 0,01, pelo qual a hipstese nula rejeitada se ha menos de | chance em 100 de que a diferenga amostral obtida pudesse ocorrer em consequéncia de um erro amostral. O nivel de significancia de 0,01 ¢ representado pela drea que se encontra a 2,58 desvios padrio. em ambas as diregdes de uma diferenca média de zero (veja a Figura 7.6). Niveis de significancia nao nos proporeionam uma declaragao absoluta quanto & corregao da hipétese nula, Sempre que decidimos rejeitar a hipétese nula em um determinado nivel de significdncia, consideramos a chance de tomar a decisio errada, Rejeitar a hipdtese nula quando deveriamos té-la mantido é conhecido como erro tipo I (veja a Figura 7.7). Um erro tipo I pode surgir apenas quando rejeitamos a hipdtese nula, e sua probabilidade varia de acordo com o nivel de significneia que escolhemos. Por exemplo, se rejeitamos a hipétese nula a0 nivel de signifi- cincia de 0,05 ¢ concluimos que hé diferengas de género nas atitudes quanto-a criagio dos filhos, entdo ha 5 chances em 100 de que estejamos errados. Em outras palavras, hit uma probabilidade P = 0,05 de termos cometido um erro tipo Le de o género, na realidade, nio exercer efeito algum. Da mesma maneira, se escolhemos © nivel de significancia cr = 0,01, hd apenas I chance em 100 (P = 0,01) de tomarmos a decisdo errada quanto a diferenga entre géneros, Obviamente, quanto mais rigoroso nosso nivel de significancia (e mais distante na extremidade ele se encontrar), menor a probabilidade de cometermos um erro tipo I. Considerando um exemplo extremo, estabelecer um nivel de significdncia de 0,001 significa que um erro tipo | ocorre apenas | vez em cada 1,000, A. probabilidade do erro tipo 1 é simbolizada por «. Quanto mais longe na extremidade da curva estiver nosso valor eritico, entretanto, maior 0 riseo de cometer outro tipo de erro conhecido como erro tipo II, Esse ¢ 0 erro de manter a hipé- tese nula quando deveriamos té-la rejeitado. O erro tipo II indica que nossa hipétese de pesquisa ainda pode estar correta, apesar da decisio de rejeité-la e de manter a hipétese nula, Um método para reduzir o risco de cometer o erro tipo II é aumentar o tamanho das amostras de maneira que a verdadcira diferenga populacional tenha mais chance de ser representada. A probabilidade do erro tipo II é representada por # (beta). Nio é possivel ter certeza de que ndo tomamos uma decisio errada quanto a hipétese nula, pois examinamos apenas as diferengas entre médias amostrais, ¢ nio enire médias da populagio DECISAO Manter a hipstese nula —-Rejeitar a hiptese nul Hipdtese nule ErotipoT verdadeira Pierro tipo =a REALIDADE Fig Bien wits Eero tipo I taka Pierro tipo II) = B Figura 7.7 Eros tipos |e I Capitulo 7 + Teste de diferencas entre médias. 201 completa. Enquanto nio tivermos conhecimento das verdadeiras médias populacionais, assumire- mos 0 risco de cometer um erro tipo T ou tipo IT, dependendo de nossa decistio. Esse ¢ o risco da tomada de decisio estatistica que 0 pesquisador social tem de estar disposto a correr. Escolha do nivel de significancia ‘Vimos que as probabilidades de cometermos 0 erro tipo I ¢ o erro tipo II sio inversamente rela- cionadas: quanto maior for um erro, menor sera o outro. Na pritica, um pesquisador nie tem controle real direto sobre a probabilidade do erro tipo II (B). Isto é, ele nao pode fixar a probabilidade de um erro tipo II em nenhum nivel, Por outro lado, a chance de cometermios um erro tipo | é uma grandeza controlada diretamente pelo pesquisador, pois ela ¢ precisamente a mesma do nivel de signi cncia (a) que ele escolhe para o teste de hipotese. E claro, quanto maior o nivel de significancia escolhido (digamos, 0,05 ou mesmo 0,10), maior a chance de ocorréncia de erro tipo I e menor a chance de ocorréncia de erro tipo II. Quanto menor © nivel de significincia escolhide (digamos, 0,01 ou mesmo 0,001), menor a chance de ocorréncia de erto tipo I, mas maior a probabilidade de ocorréncia de erro tipo Il. Predeterminamos nosso nivel de significdncia para um teste de hipétese com base em qual tipo de erro (tipo I ou tipo If) é mais caro ou danoso e, portanto, mais arriscado. Se em determinado caso fosse muito pior rejeitar uma hipétese verdadeiramente nula (erro tipo I) do que manter uma hipétese nula falsa (erro tipo 11), deveriamos optar por um pequeno nivel de significdncia (por exemplo, @ = 0,01 ou 0,001) para minimizar o risco de ocorréneia do erro tipo 1, mesmo a custa de aumentar a chance de ocorréncia do erro tipo II. Se, no entanto, a opinido for de que o erro tipo II seria pior, estabeleceriamos um nivel de significdncia grande (a= 0,05 ou 0,10) para produzir uma chance mais baixa de ocorréncia do erro tipo II, isto é, um valor de beta mais baixo, ‘Suponha, por exemplo, que uma pesquisadora esteja realizando uma pesquisa sobre diferen- gas em termos de género em desempenho no SAT para a qual ela administrou o teste para uma amostra de individuos do sexo masculino ¢ uma amostra de individuos do sexe feminino, Antes de decidir sobre um nivel de significdncia, ela deveria fazer uma pausa e perguntar a si mesma © que seria pior — dizer que hi uma verdadeira diferenga entre géneros com base nos resultados distorcidos por erros amostrais excessivos (erro tipo 1) ou no dizer que ha diferencas quando, na realidade, ha entre a populagio de individuos do sexo masculino e do sexo ferninino? Nesse caso, uum erro tipo I provavelmente seria muito mais danoso — paderia até ser usado como fundamento para diseriminagio injusta contra mulheres —,¢ entdo ela escolheu eleger um valor de alfa peque- no (digamos, de 0,01). ‘Consideremos uma situaco inversa — na qual um erro tipo II seja muito mais preocupante. ‘Suponha que um pesquisador esteja testando 0s efeitos do consumo de maconha sobre o desempe- nho no SAT e compare uma amostra de fumantes com uma amostra de nao fumantes. Se houvesse uma modesta indicagao que fosse de que 0 consumo da maconha afeta o desempenho dos estudan- tes, essa informagio deveria ser disseminada. Nao quereriamos que um pesquisador mantivesse a hipdtese mula de ndo diferenga na populagdo entre fumantes ¢ no fumanies se houvesse uma dife- renga observada nas médias amostrais apenas porque a diferenga ndo é bastante significativa, Esse erro tipo II poderia ter um sério impacto sobre a satide publica. Um erro tipo 1, por meio do qual © pesquisador foi levado a acreditar que consumo de maconha alterava 0 desempenho quando a diferenga havia sido somente devido ao acaso, certamente no seria tio problematico, Dada essa situaco, o pesquisador seria aconselhado a escolher um grande nivel alfa (como 0,10) para evitar Orisco de um erro tipo II sério. Isto 6, ele deveria ser menos rigoroso 20 rejeitar a hipétese nula. Apesar de alguns cientistas sociais poderem debater © ponto, a maior parte da pesquisa em ciéncia social envolve um custo minimo associado tanto com o erro tipo I quanto com 0 erro tipo I 202 _Estatistica para ciéncias humanas Com exceco de determinadas areas sensiveis em termos de politicas, grande parte da pesquisa social gira em torno de questdes relativamente no sensiveis, de maneira que erros em testes de hi- poteses niio causam quaisquer grandes problemas para os individuos ou para a sociedade como um todo, e podem afetar apenas a reputacao profissional do pesquisador. E verdade que ocasionalmen- te vemos em periddicos uma série de estudos contraditorios; parte disso pode ser devido a erros de testes. De qualquer maneira, devido 4 natureza indcua de grande parte da pesquisa, tornou-se um costume o uso de um nivel de significdincia modesto, normalmente «= 0,05. Qual é a diferenca entre P e a? A diferenga entre P e a pode ser um pouco confusa. Para evitar confusio, compararemos as duas quantidades de modo direto, Colocando de maneira simples, P é a probabilidade exata de se obter dados de uma amostra quando a hipdtese nula é verdadeira; o valor alfa é 0 limiar abaixo do qual a probabilidade ¢ considerada téo pequena que decidimos rejeitar a hipstese nula. Isto ¢, rejeitamos a hipétese nula se o valor P € menor que o valor alfa, e caso contrario, mantemos a hipétese nula. Ao testar hipsteses, um pesquisador decide com antecedéncia 0 valor alfa, Essa escolha é fei- ta pela ponderacio das implicagdes dos erros tipo I ¢ tipo II ou é simplesmente feita por convengiio — isto é, «= 0,05. O valoralfa se refere ao tamanho das regides da extremidade sob a eurva (de 2, por exemplo) que nos levario a rejeitar a hipétese nula, Isto é, alfa é a drea & direita do valor critico tabelade de +z ¢ 4 esquerda do valor tabelado de ~z, Com a= 0,05, essas regides esto a direita de +1,96 e a esquerda de z= =1,96 (veja a Figura 7.8), (Com a distribuiciio r, 0s valores eriticos Apenas a extremidade direita mostrada: area na extremidade esquerda € idéntica Valor crtico := 1,9 detimita uma drea de rejisio « = 008 tremidade direita mostraday, vextremidade esquerda ¢ idéntien. m2, Valor obtido = = 2,12 produe P<0.05 ¢ rejeta s hipétese mula Figura 7.8 Diferencas entre Pe a. Capitulo 7 + Teste de diferencas entre médias 203 dependem também dos graus de liberdade.) Desse modo, alfa representa a chance de ocorréncia do erro tipo I que estamos dispostos a tolerar, Por outro lado, P é a probabilidade real de se obter os dados da amostras caso a hipétese mula soja verdadeira. Se essa probabilidade for pequena o suficiente (isto é, se a hipétese nula for muito improvavel), tenderemos a rejeiti-la. Diferentemente do valor alfa, que & determinado pelo pes- quisador de antemio, o valor Pé determinado pelos priprios dados — especificamente pelo valor calculado da estatistica do teste, como 0 escore z —, ¢ nao é estabelecide pelo pesquisador. O valor Péa area A direita do +z calculado do lado positivo mais a area a esquerda do — caleulado do lado negative, Desse modo, se apds a coleta de dados um escore z de 2,12 for obtido, a coluna (¢) da Tabela A indicara que P = 0,034 (0,017 em cada extremidade). Se esse fosse 0 resultado, conclu riamos que P< 0,05, ¢ assim rejeitariamos a hipétese nula (veja a Figura 7.8). Na pritica, vocé nao confere regularmente © valor real de P, come fizemos ha pouco ao con sultar a Tabela A. preciso conferi-lo somente se 0 valor z calculado exceder o valor eritico para 0 nivel de a escolhido. Observe que a maneira mais rapida para determinar o valor critico para 2 & olhar para a linha de baixo da tabela r. Isto é, com graus de liberdade infinitos, ¢ é igual Se 0 z caleulado exceder o valor critico, simplesmente dizemos que P< 0,05 (se 0,03 fosse © nivel de significincia pré-selecionado) ¢ que os resultados sio estatisticamente significativos a0 nivel 0,05. Se oz calculado no excedero valor critico, diriamos que o resultado (ou diferenga) nio foi significativo, Em outras palavras, vocé no precisa determinar o valor real de P para tomar uma decisdo sobre a hipétese. Com a maioria dos softwares estatistices atualmente disponiveis, os va- lores exatos de P sio automaticamente calculados a partir de formulas elaboradas. Portanto, no fu- turo talvez venihamos a encontrar pessoas que dio o valor real de P, em vez de dizer que P< 0,05. Erro padrao da diferenca entre médias Raramente temos conhecimento em primeira mao do desvio padrao da distribuigio de dife- rengas de médias. E assim como no caso da distribuigdo amostral de médias (veja o Capitulo 6), seria um esforo enorme se realmente tirissemos um grande nimero de pares de amostras para calculé-lo, Entretanto, esse desvio padrio tem um papel importante no métode para testar hipote- ses a respeito das diferengas médias e, portanto, nio pode ser ignorado? Felizmente, temos um método simples por meio do qual o desvio padrio da distribuigio de diferengas pode ser estimado com base em apenas duas amostras que realmente sorteamos, A es- timativa amostral do desvio padrao da distribuigdio amostral das diferengas entre médias, chamada de erro padrio da diferenca entre médias e simbolizado por 5%, €: (* + Nat) + ) M+ 2)\ MN SNK, No capitulo anterior, foi destacado que os verdadeirox desvio padlo (or) ¢ erro paddo (-z) populacionais so raramente conheeidos. Tambim, nos casos de amostras, 0 verdadeiro erro padrio da diferenea é geralmente ddesconhecido. Entretanto, para 2 rara stuaco na qual os ertos padrio de ambas as médias amostrais lo conhecidos, © verdadeiro erro padrio da diferenca entre médias é: RR" a, Estatistica para ciéncias humanas onde s,’¢ 5,’ sdo as varidncias das duas amostras introduzidas no Capitulo 4: A formula para s¥,-¥, combina informagdes de duas amostras. Desse modo, a varidincia para cada amostra somada aos respectivs tamanhos de amostras vai para nossa estimativa de quo diferentes X, eX, podem ser devido somente ao erro amostral, Uma grande diferenca entre X, ¥, pode ocorrer se (1) a média for muito pequena, (2) a média for muito grande, ou (3) a média for moderadamente pequena enquanto a outra for moderadamente grande. A probabilidade de ocor- réncia de qualquer uma dessas condicdes é ditada por varidincias e tamanhos de amostra presentes nas respectivas amostras. Teste de diferenca entre médias Suponha que uma sociéloga especializada na érea médica tenha criado uma escala de milt- plos itens para medir o apoio a uma reforma no sistema de sade. Ela obteve os dados a seguir de uma amostra de 25 liberais e 35 conservadores na escala da reforma no sistema de saiide ‘A partir dessas informagées, podemos calcular a estimativa do erro padrio da diferenca entre édias: . 5 = Ke) = V(180,3448)(0,0686) = V12,3717 = 3,52 Descobrimos que o erro padrdo da diferenga entre médias (nossa estimativa do desvio padrao da distribuigdo amostral te6rica de diferengas entre médias) ¢ 3,52. Se estivéssemos testando a diferenga em termos de apoio para a reforma do sistema de satide entre liberais (média 60) e con- servadores (média 49), poderiamos usar nosso resultado do erro padrao para converter a diferenga entre médias amostrais em uma raziio r: Aqui, Capitulo 7 » Teste de diferencas entre médias 332 u “352 = 313 ‘Usamos # em vez de z, pois nio conhecemos os verdadeiros desvies padrio da populagio de liberais ¢ conservadores. Como estimamos tanto, quanto «, de s, ¢ 5, respectivamente, compen- samos usando a distribuigio ¢ mais ampla, com N, + N,~ 2 graus de liberdade. Para cada desvio QUADRO 7.1 _Exemplo passo a passo: teste de diferenca entre médias Parafornecer umexemploquemostre, passo ‘2 passo, o procedimento para testar uma diferen- Ga entre médias amostrais, digamos que quisésse- mos tester ahipotese nula ao nivel de significincia dea = 0,05 de que estudantes universitirios de ambos 05 sexos estejam iqualmente preocupactos ‘com suas perspectivas de emprego apés a forma- ture Misto ¢, 42, = p,). Para testar essa hipotese, suponha que pesquisemos amostras 20 acaso de 35 estudantes do sexo masculino e 35 estudantes do sexo ferninino usando uma escala de preocu- 1pa;50 com o-emprego variando de 1, "nem um pouco preocupado", @ 10, “extremamente preo- supado", Os escores de preocupacdo quanto 20 em- prego e, com a finalidade de considerar nossos alculos, seus valores elevados ao quadrado so 95 seguintes: Estudartes do sevo feminino (Mr 4 al 1 a 6 9 0 4 3 9 6 4 3 6 8 6 3 206 Estatistica para ciéncias humanas Estudantes do seco feminine (= 35) a a 49 9 16 36 81 64 16 25 64 4 49 1 25 36 16 64 49 36 _I6 1,195 Sonos ®euuenSousria lores a 1.563 . ues = 44,66 — 38,44 = 34,14 — 29,16 = 622 = 498 Capitulo 7 © Teste de diferencas entre médias 207 Passo 3 Calcule o erro padréo da diferenca ‘Como 0 valor exato para os graus de liber- entre as médias, dade (g! = 68)nbo & fornecido pela Tabela C, uso- ‘mos 0 valor seguinte mais baixo (gl = 60), entéo: as (as + Ns; ye =m) a M+™—2/\ MN @=005 tabela t = 2,000 +354 iz + z) 35435-2 N35 x35. Passo 6 Compare os valores t calculado e 217.7 + 1743\/_70 tabetado. ar il ‘0 tcalculado (1,394) ndo excede a tabela t (2,000), em nenhuma das diregdes, positiva ou 392)/_ 70 negativa, € assim mantemos a hipdtese nula de - 23) que néo ha diferenca nas médias populacionais. Isto ¢, a diferenca observada no nivel da média de = V(5,7647) (0,0571) reocupagio quanto 20 emprego entre amostras de estudantes universitérios do sexo masculino € = V0,3294 do sexo feminino podenia facilmente ter ocorrido: = 0574 como resultado de um erro amostral. (Desse modo, apesar de as médias amostrais, serem realmente diferentes (6,2 para estudantes do Passo 4 Calcule o valor t dividindo a di- sexo masculino ¢ 5,4 para estudantes do sexo fe- ference entre as médias pelo erro padio da __-minino), elas nfo foram sufcientemente diferentes diferenca para conclir que as populates de estudantes in versitarios do sexo masculing e feminino diferiam em sua preacupagéo mécéa quanto ao emprego aps a formatura, € daro, estarlamos cometendo um ero tipo (mantendo ume hipétese nula), no sentido de ‘que poderia realmente haver ume diferenca entre as médias populaconais, Mas esses resultados amos- = 1394 trais ndo sio tdo diferentes (X’,—, ndo é suficen- temente grande, nem tampouco os tamanhos das Passo 5 Determine o valor critico para t. amostras sao sufidentemente grandes a ponto de ngs permitira conclusdo de que diferengas amostais as aaa se verificam também na populeséo. padrio populacional que estimamos, perdemos um grau de liberdade do numero total de casos. Aqui, temos 60 casos dos quais subtraimos 2 para obter os $8 graus de liberdade, Voltando a Tabela C do Apéndice B, usamos 0 valor critico para 40 graus de liberdade, 0 valor mais préximo abaixo de 58, que nao é dado explicitamente. Nosso valor de fcalculado 3,13 excede todos 0s pontos eriticos padrio, exceto aquele para o nivel 0,001. Portanto, poderiamos rejeitar a hipétese nula ao nivel 0,10, 0,05 ou 0,01, o que quer que tenhamos estabelecido para @ valor alfa no inicio de nosso estudo. Se por alguma razao tivesse sido estabelecido um valor alfa 0,001 (a justificativa para a escolha de um teste tio rigoroso, nesse caso, poderia parecer insuficiente), teriamos de manter a hipstese nula apesar do valor alto de ¢, Consequentemente, nossa chance de cometer um erro tipo II seria bastante alta, 208 Estatistica para ciéncias humanas Ajuste para variancias desiguais A formula para estimar o erro padrio da diferenga entre médias que apresentamos anterior- mente junta ou combina informagées de varidincia de ambas as amostras. Ao fazer isso, presume-se que as varidincias populacionais sejam as mesmas para os dois grupos, iste é, 0? = a7. E claro que nao sabemos realmente a magnitude das duas variineias populacionais; como entio podemos eterminar se é razoavel presumir que sejam iguais? A resposta para esse dilema vem de varidincias das amostras, s,7 € s,%, ¢ depende se elas sio razoavelmente similares ou muito dissimilares. Afinal de contas, essas varidineias de amostras nos dio uma indicag3o quanto ao tamanho das varidncias da populacdo. Se as varidncias das amostras sio bastante diferentes em magnitude, entio colocé-las juntas a fim de obter uma estimativa do erro padrio total da diferenga entre as médias seria como combinar magas ¢ laranjas para fazer qualquer outra coisa que nao fosse um mix de frutas.. Assim como acontece com outras comparagies que fazemos, determinar se 51? s2? so tio diferentes em tamanho depende do tamanho da amostra (ou dos graus de liberdade). SPSS e outros produtos de software utilizam o Teste de Levene® para avaliar se as varidincias amostrais sii tio dissimilares a ponto de termos de rejeitar a nogio de que as varidincias populacionais sio as mes+ mas, Sem entrar em detalhes, uma regra pritica razoavelmente titil em casos como esse & buscar uma alternativa para sua combinagdo caso qualquer uma das varidncias amostrais seja mais do que duas vezes maior do que a outra. Em casos nos quais qualquer uma das variéncias amostrais mais do que o dobro da outra, especificamente, o erro padrio é calculado sem combinacao pela formula a seguir: Observe que as duas variincias estéio separadas sob o radical da raiz quadrada, em vez de combinadas como fazemos na formula usual para o erro padrio da diferenga entre médias. A formula para os graus de liberdade quando nao hi combinagio de variincias & bastante complexa, ¢ geralmente produz valores fracionados. Entretanto, uma simples e segura substituigo para os graus de liberdade ¢ pegar 0 menor de N, € N, Por exemplo, suponha que um professor pergunte 4 sua classe quantas horas eles levaram para fazer um dever de casa particularmente dificil que exigiu o uso de um computador, ¢ se usaram um PC ou um Mac, Os resultados so os seguintes: PC Mac N 36 23 Média 65 36 Varidincia 78 36 Desvio padrio 28 ‘A partir dos resultados da amostra, descobrimos que os usuarios de PCs levaram, em média, (0,9 hora a mais do que as usuarios do Mac para completar a tarefa, Mais relevante nesse exemplo & a ampla variabilidade entre os usuarios de PCs, com a varidncia amostral duas vezes maior do que aquela de usuarios de Macs. Usando a alternativa nao combinada de erro padrio, * OTeste (N da RT). ene € uma inferéneia estatistica usada para accssar a igualdade das variincias cm diferentes amostras Capitulo 7 + Teste de diferencas entre médias 209 V0,228+ 0,165 0,393 = 0,626 A razio ¢ € calculada da mesma forma que antes, mas com a estimativa nio combinada do erro padrio da diferenga entre médias no denominador. SK-% _ 65 — 56 ~ 0,626 = 1,457 Para graus de liberdade, usamos o menor dos dois tamanhos de amostras: gl = 23. Consultan- do a Tabela C no Apéndice B para gl = 3 ¢ um nivel de signifiedincia de 0,05, determinamos que a razio r tem de ser mais alta do que 2,069 para rejeitar a hipétese nula de médias populacionais iguais. Portanto, apesar de os usuarios de PCs terem levado, em média, quase uma hora a mais para completar 0 dever de casa, nio podemos descartar a possibilidade de que essa diferenga ocorreu como resultado do erro amostral. Comparacao entre amostras dependentes Até agora, discutimos as comparagdes entre duas amostras extraidas independentemente (por exemplo, homens versus mulheres, negros versus brancos, ou liberais versus conservadores). An- tes de mudarmos de tépico, temos de introduzir uma variagéo da comparagio de duas médias re- ferida como design anes e depois ou painel: 0 caso de uma tinica amostra medida em dois pontos diferentes no tempo (tempo | versus tempo 2). Por exemplo, um pesquisador pode querer medir a hostilidade em uma tinica amostra de criangas tanto antes quanto depois de elas terem assistido a um determinado programa de televiséio. Da mesma maneira, poderiamos querer medir diferengas em opinides quanto a pena de morte antes e depois de um julgamento por assassinato com grande cobertura da midia. Tenha em mente a distingao importante entre estudar a mesma amostra em duas ocasides diferentes ¢ estudar uma amostragem da mesma populacio em duas ocasides diferentes. O teste ¢ da diferenga entre médias para a mesma amostra medida duas vezes geralmente presume que as mesmas pessoas so examinadas repetidamente — em outras palavras, cada entrevistado é compa- rado a si mesmo em outro momento no tempo. Por exemplo, uma organizagdo de pesquisas de opinidio publica pode entrevistar os mesmos 1.000 norte-americanos tanto em 1995 quanto em 2000 para medir sua mudanga de opiniio ao lon- x0 do tempo. Como a mesma amostra é medida duas vezes, cabe a aplicagao do teste da diferenga entre médias para essa amostra, 210. Estatistica para ciéncias humanas Suponha, ao contririo, que essa organizagio de pesquisas adminisire o mesmo instrumento de pesquisa a uma amostra de 1,000 norte-americanos em 1995 e a uma amostra diferente de ‘outros 1,000 norte-americanos em 2000. Embora a pesquisa procure por mudangas de opiniaio a0 longo do tempo, as duas amostras teriam sido escolhidas independentemente — isto é, a selegiio de entrevistados em 2000 no dependeria de maneira alguma dos selecionados em 1995, Ape- sar de a mesma populagdo (norte-americanos) ter sido amostrada duas vezes, as pessoas entrevista das seriam diferentes, e desse modo, o teste # de diferenga entre médias para grupos independentes teria releviincia. QUADRO 7.2 Exemplo passo a passo: teste de diferenca entre médias para as duas medig6es da mesma amostra Analisemos 0 seguinte exemplo passo a passo de uma comparacdo “antes e depois”: supenha que vérios individuos tenham sido for cades por um governa municipal a se mudar de suas casas pare que uma autoestrada pudesse ser construida, Como pesquisedores sociais, temos interesse em determinar o impacto da mobilida- de residencial forcada em termos de amabilidade entre vizinhos (isto é, os sentimentos positives respelto dos vizinhos pré-mudanga versus senti- mentos a respeito dos vizinhos pés-mudanca) Nesse caso, entdo, p1, € 0 escore médio de ama- bilidade no tempo 1 (antes da mudanga)e wt, ¢ 0 escore médio de amabilidade no tempo 2 (depois da mudanga). Portanto, Antes da mudanga, ) Entrevistado Stephanie Myron Carol David Como mostra a tabela, fazer uma com- paracao do tipo antes e depois nos faz focar a diferenga entre 0 tempo 1 € 0 tempo 2, como reflete a formula por meio da qual abteros o desvio padrao (para a distrib diferengas antes e depois): So Hipétese mula: 0 gan de amabilidade nao (4s = 2) difere antes e depois da mudanca. Hipdtese de pesquisa: O grau de amabilidade difere (ur 2) canes e depois dha mudanga. Para testar 0 impacto dessa medida sobre o grau de amabilidade, entrevistamos uma amos- tra aleat6ria de seis individuos a respeito de seus Viinhos tanto antes quanto depois da mudanca forcada. Nossas entrevistas produziram os esco- res de amabilidade a sequir (escores mais altos de 1 a 4 indicam relagdes mais amigave's entre vizinhos). ee Diferenga (Diferenga)® ary (=X,-X) @) 1 1 1 2 -I 1 1 2 4 1 2 4 2 -I 1 1 3 2 8 =D'=20 onde s,, = desvio padrao da distribuigdo dos esco- res de diferencas antes e depois D=escore bruto depois da mudanca subtrat do do escore bruto antes da mudanca N= ndmero de casos ou entrevistados na amostra A partir dessa equacéo, obtemos 0 erro pa= dréo da diferenca entre médias: Passo 1 Calcule a média para cada ponto no tempo. Passo 2 Calcule 0 desvio padrao para a di- ferenca entre o tempo 1 € 0 tempo 2 t= fae Hh =z 7 233 - 133) 3} Passo 3 Calcule 0 erro padrao da diferenca entre médias. So Capitulo 7 + Teste de diferencas entre médias 214 Passo 4 Converta a diferenca da média ‘amostral em unidades de erro padréo da diferen- ca entre médias. Passo 5 Calcule o nuimero de graus de |i- berdade. gl=N-1 =6-1 =5 Observacéo: I se refere 20 ndimero total de casos, © no 20 niimero de escores, para 05 quais ha apenas dois por caso ou entrevistado Passo 6 Compare a razdo t obtida com a azo t apropriada na Tabela C. robtida = 1.47 tabela r= 2,571 gl=5 w= 0,05 Para rejeitar a hipotese nula 20 nivel de significdncia de 0,05 com 5 graus de liberdade, temos de obter uma razio t calculada de 2,571 Como nossa razso t 6 de apenas 1.47 — menor do que 0 valor tabelado exigido —, mantemos a hipotese nula. As diferencas amostrais de amabi- lidade obtidas antes e depois da mudanca foram provavelmente resultado do erro amostal

También podría gustarte