Está en la página 1de 23

So os clculos estatsticos que representam uma srie de dados orientando-nos quanto posio da distribuio em relao ao eixo horizontal As medidas

s do de grfico da curva de frequncia utilizadas (histograma). so: mdia tendncia central mais

aritmtica, moda e mediana. Mdia Aritmtica ( ) A medida de tendncia central mais comum para um conjunto de dados a mdia aritmtica. A mdia aritmtica amostral de um conjunto de dados o quociente entre a soma dos valores do conjunto e o nmero total dos valores.

Onde: xi so os valores da varivel e n o nmero de valores. Exemplo 1: Encontrar a mdia aritmtica para um conjunto de observaes: 5, 1, 6, 2, 4. Soluo: Temos cinco observaes: n=5, ento:

Quando a amostra muito grande e os dados so discretos, podem ocorrer valores repetidos. Nesse caso como vimos anteriormente (web aula 1), razovel organizar os dados em uma tabela de distribuio de frequncias e trabalharmos com dados agrupados. Quando os dados estiverem agrupados numa distribuio de

frequncia usaremos a mdia aritmtica do valores x1, x2, x3,....xn, ponderados pelas respectivas freqncia absolutas: F1, F2, F3,..., Fn, Assim:

Exemplo (Clculo da mdia sem intervalos de classe): Dada a seguinte distribuio de frequncia, determinar a mdia.

Uma maneira prtica para resolvermos este problema a composio da seguinte tabela (lembre-se que Fi=n):

Aplicando a equao acima obtemos:

Exemplo (Clculo da mdia com intervalos de classe): Neste caso, convencionamos que todos os valores includos em um determinado intervalo de classe coincidem com o seu ponto mdio, e assim determinamos a mdia aritmtica por meio da frmula

anterior, onde xi o ponto mdio da classe. Dada a seguinte distribuio de frequncia:

Aplicando a equao anterior temos que:

Mdia Aritmtica Ponderada (): A mdia aritmtica ponderada tambm chamada de mdia ponderada. empregada quando as variveis tm diferentes importncias relativas, ou, ainda diferentes pesos relativos. No clculo da mdia ponderada, cada valor coletado na srie tem uma participao proporcional ao seu peso, isto , proporcional importncia relativa no conjunto. O clculo da mdia ponderada obtido pela soma das variveis multiplicadas pelos seus pesos, dividida pela soma dos pesos de cada varivel. Assim:

Onde: - Mdia Ponderada xi observaes ou nmeros da varivel em estudo; pi ponderaes ou pesos da varivel Exemplo: Calcular a mdia aritmtica ponderada dos nmeros 10, 14, 18 e 30 sabendo-se que os seus pesos so respectivamente 1, 2, 3 e 5. RESOLUO:

Mediana (Md) A mediana o valor que ocupa a posio central do conjunto de dados ordenados (ROL), portanto est localizada na posio central tal que 50% dos valores so menores que a mediana, e os demais 50% so maiores.

Para a sua determinao utiliza-se a seguinte regra, depois de ordenada a amostra de n elementos dispostos segundo uma ordem (crescente ou decrescente): Quando o nmero de elementos (n) da srie estatstica for mpar, haver coincidncia da mediana com um dos elementos da srie. Neste caso existir um nico valor de posio central, e esse valor ser a mediana. Por exemplo, o conjunto de dados {2, 5, 6, 9, 10, 13, 15}, O valor que divide a esta srie em duas partes iguais igual a 9, logo a mediana 9. Quando o nmero de elementos da srie estatstica for par, nunca haver coincidncia da mediana com um dos elementos da srie de dados. A mediana ser sempre a mdia aritmtica dos 2 elementos centrais da srie de dados. Por exemplo, o conjunto de dados { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 }, a mediana no exemplo ser a mdia aritmtica do 5 e 6 termos da srie. Portanto, a mediana ser = (2+3) / 2, ou seja, m = 2,50. Em algumas circunstncias a medida melhor descreve a tendncia central dos dados. o caso de conjuntos com dados discrepantes, isto , dados que tm um ou mais valores bem maiores ou menores que os demais. Por exemplo: Em { 5, 7, 10, 13, 15 } a mdia = 10 e a mediana = 10 Em { 5, 7, 10, 13, 65 } a mdia =20 e a mediana = 10 A mdia do segundo conjunto de valores maior do que a do primeiro, por influncia dos valores extremos, ao passo que a mediana permanece a mesma. Clculo da mediana em dados agrupados e sem intervalos de classe (varivel discreta): Neste caso, o bastante identificar a

frequncia acumulada imediatamente superior metade da soma das frequncias. A mediana ser aquele valor da varivel (x) que corresponde a tal frequncia acumulada.

Quando o somatrio das frequncias (n) for mpar o valor mediano ser o termo de ordem dado pela frmula:

Onde: n= n. total de elementos; fi=frequncia acumulada

Quando o somatrio das frequncias (n) for par a mediana ser a mdia entre os elementos de ordem

Exemplo (n = impar): Dada a distribuio de frequncia:

Neste caso n=11, impar, logo a mediana (m) ser o elemento de ordem , ou seja, Por meio das

frequncias acumuladas encontra-se o valor de xi correspondente a mediana. Neste exemplo ser o valor 3, portanto, a mediana =3. Observe: ser o xi correspondente classe que contiver a ordem calculada. Exemplo (n = par): Dada a distribuio de frequncia:

Neste caso n=8, par, logo a mediana (m) ser a mdia entre os valores de

ordem Assim a mediana corresponde mdia: (4 elemento + 5 elemento) / 2 = (15 + 16) / 2 = 15,5 Clculo da mediana em dados agrupados e com intervalos de classe (varivel contnua): Devemos seguir os seguintes passos: 1 Passo) Determinamos as frequncias acumuladas ( fi = n);

2 Passo) Calculamos

; como a varivel contnua, no se

preocupe se n par ou mpar.

Passo) Marcamos

classe

correspondente

frequncia

acumulada imediatamente superior fi / 2. Tal classe ser a classe mediana (classe Md); 4 Passo) Calculamos a Mediana pela seguinte frmula:

Onde: lMd = limite inferior da classe mediana; n = tamanho da amostra ou nmero de elementos; FAA = a frequncia acumulada da classe anterior classe

mediana. h = a amplitude do intervalo da classe mediana. FMd = a frequncia da classe mediana. Exemplo: Dada a distribuio amostral, calcular a mediana.

1 que

Passo: Calcula-se

Como

n=58,

temos

2 Passo: Identifica-se a classe mediana (Md) pela frequncia acumulada. Neste caso a classe mediana a 3. 3 Passo: Aplica-se a frmula:

Neste caso: lMd = 55; n = 58; FAA= 17; h = 10, FMd = 18; Logo:

Moda (Mo) Dentre as principais medidas de posio, destaca-se a Moda. o valor da amostra que mais se repete; ou seja, valor que ocorre com maior frequncia. A Moda quando os dados no esto agrupados: A moda facilmente reconhecida: basta, de acordo com definio, procurar o valor que mais se repete. Por exemplo, no conjunto de dados {7, 8, 9, 10, 10, 10, 11, 12} a moda igual a 10.

H sries nas quais no exista valor modal, isto , nas quais nenhum valor aparea mais vezes que outros. Por exemplo, o conjunto de dados {3, 5, 8, 10, 12} no apresenta moda. A srie amodal. Em outros casos, pode haver dois ou mais valores de concentrao. Dizemos, ento, que a srie tem dois ou mais valores modais. Por exemplo, o conjunto de dados {2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9} apresenta duas modas: 4 e 7. Neste caso a srie bimodal. Distribuies Simples: Quando uma tabela de distribuio de frequncia apresenta grande quantidade de dados. importante destacar a classe de maior frequncia, a chamada classe modal. Essa classe mostra a rea em que os dados esto concentrados. Assim, para a distribuio:

A moda ser 248 (maior frequncia). Indica-se Mo=248 (moda) Valores Agrupados com intervalos de classe: A classe que apresenta a maior frequncia denominada classe modal. Pela definio, podemos afirmar que a moda, neste caso, o valor dominante que est compreendido entre os limites da classe modal. Um dos mtodos para determinao da moda a aplicao da frmula de CZUBER: 1 Passo) Identifique a classe modal (aquela que possuir maior frequncia). 2 Passo) Aplicar a frmula:

Onde:

l = limite inferior da classe modal d1 = frequncia da classe modal - frequncia da classe anterior da classe modal d2 = frequncia da classe modal - frequncia da classe posterior da classe modal h = amplitude da classe modal Exemplo: Determinar a moda para a seguinte distribuio de frequncia:

1 Passo) Identifica-se a classe modal. Neste caso, trata-se da 3 classe 2 I- 3. 2 Passo) Sabendo que:l = 2; d1 = 17-10=7; d2 = 17-8=9; h = 1. Aplica-se a frmula dada acima:

MEDIDAS DE DISPERSO

So

medidas

estatsticas

utilizadas

para

avaliar

grau

de

variabilidade ou disperso, dos valores em torno da mdia. Consideremos os seguintes conjuntos de valores das variveis X, Y e Z: X = {70, 70, 70, 70, 70} Y = {68, 69, 70, 71, 72} Z = {5, 15, 50, 120, 160} Podemos observar que os trs conjuntos apresentam a mesma mdia aritmtica = 350/5 = 70 Entretanto, fcil notar que o conjunto X mais homogneo que os conjuntos Y e Z, j que todos os valores so iguais mdia. O conjunto Y, por sua vez, mais homogneo que o conjunto Z, pois h menor diversificao entre cada um de seus valores e a mdia representativa. Portanto, conclumos ento que o conjunto X apresenta disperso nula e que o conjunto Y apresenta uma disperso menor que o conjunto Z. A seguir so apresentadas as principais medidas de disperso da estatstica: amplitude, desvio-mdio, desvio-padro e varincia. Medidas de Disperso Absoluta: Amplitude Total (A) a diferena entre o maior e o menor valor observado no conjunto de dados, conforme segue:

Exemplo: Para a srie: 10,12,20,22,25,33,38 a amplitude total dada por:

Observao: A utilizao da amplitude total como medida de disperso muito limitada, pois, sendo uma medida que depende apenas dos valores externos, instvel, no sendo afetada pela disperso dos valores internos. Desvio-Mdio (DM) O desvio mdio (DM) a mdia aritmtica dos valores absolutos dos desvios tomados em relao mdia.

Onde: n= nmero frequncia.

de

elementos;

mdia

amostral;

Fi

Veja que os desvios foram considerados em mdulo, evitandose assim que a soma fosse nula. Varincia populacional (2) e amostral (S2) A varincia uma medida que tem pouca utilidade como estatstica descritiva, porm extremamente importante na inferncia estatstica e em combinaes de amostras. A definio de varincia populacional (2) dada por:

Observaes:

1. 2. 3. 4.

2 indica varincia populacional e l-se sigma ao quadrado; = mdia Fi = frequncia N = tamanho da populao Para o caso do clculo da varincia amostral (s2) conveniente o uso da seguinte frmula:

Onde: = mdia amostral, n = tamanho da amostra. Desvio Padro populacional (s) e amostral (s) O desvio padro e a medida de disperso mais geralmente

empregada, pois leva em considerao a totalidade dos valores da varivel em estudo. um indicador de variabilidade bastante estvel. Observando-se a frmula original para o clculo da varincia, nota-se que a uma soma de quadrado. Dessa forma, se a unidade da varivel for, por exemplo, metro (m) teremos como resultado metro ao quadrado (m2). Para se ter a unidade original, necessita-se definir outra medida de disperso, que a raiz quadrada da varincia o desvio padro. Assim temos:

Resumindo: para o clculo do desvio-padro deve-se primeiramente determinar o valor da varincia e, em seguida, extrair a raiz quadrada desse resultado.

OBS.: O desvio padro tem a mesma dimenso de unidades dos valores da mdia. O desvio padro possui algumas propriedades, dentre as quais destacamos:

Somando-se (ou subtraindo-se) uma constante a todos os valores de uma varivel, o desvio padro no se altera. Multiplicando-se (ou dividindo-se) todos os valores de uma varivel por uma constante (diferente de zero), o desvio padro fica multiplicado (ou dividido) por essa constante. Exemplo: Calcular o desvio-mdio (DM), a varincia amostral (s2) e o desvio-padro amostral (s) da seguinte distribuio amostral.

Resoluo: Primeiramente precisamos do valor da mdia, conforme vimos anteriormente na web aula 3, temos que:

Portanto a mdia : 1) Clculo do Desvio-Mdio (DM)

Para o clculo do DM devero ser abertas novas colunas, conforme segue:

Portanto, 2) Clculo da Varincia Amostral (s2) Para calcularmos a varincia amostral (s2) preciso encontrar o valor de di2Fi. Para tanto, uma nova coluna dever ser considerada na tabela anterior:

Portanto,

3) Clculo desvio-padro Amostral (s) Como Resumindo: A distribuio possui mdia 8,06. Isto , seus valores esto em torno de 8,06 e seu grau de disperso de 1,20, medido pelo desvio-mdio, e de 1,69, medido pelo desvio-padro. Medida de Disperso Relativa: Coeficiente de Variao (CV) Trata-se de uma medida relativa de disperso til para comparao em termos relativos do grau de disperso em torno da mdia de sries distintas. dado por:

Onde: s= desvio-padro amostral e = mdia Exemplo: Numa empresa, o salrio mdio dos homens de R$ 4000,00 com desvio-padro de R$ 1500,00, e os das mulheres em mdia de R$ 3000,00 com desvio-padro de R$ 1200,00. Ento:

Logo, podemos concluir que nesta empresa os salrios das mulheres apresentam maior disperso relativa que o salrio dos homens. O que AMOSTRAGEM?

Mtodo de retirada de amostras de uma populao, ou seja, processo de seleo da amostra. Consiste em selecionar parte de uma populao, para observar, de forma que seja possvel estimar algo sobre toda a populao (inferncia estatstica). Amostragem X Censo
o o o o o o o o o

CENSO: Coletar informaes sobre TODOS os elementos da populao. AMOSTRAGEM: Coletar informaes de uma PARTE da populao (AMOSTRA). Por que fazer amostragem ao invs de Censo? Populao infinita; Economia; Menor tempo (informaes mais rpidas); Testes Destrutivos; Preciso controlada (Maior qualidade dos dados levantados); Concluses obtidas da amostra para a populao. Quando realizar o Censo? Populao Pequena; Populao apresenta grande variabilidade; Quando se dispe de dados da populao. Tipos de Amostragem Classificao Amostragem Probabilstica e No-Probabilstica. Amostragem PROBABILSTICA: Tcnicas de amostragem em que a seleo aleatria de tal forma que cada elemento tem igual probabilidade de ser sorteado para a amostra, e selecionado independentemente de qualquer outro. Assim se conhece a probabilidade de todas as combinaes amostrais possveis.

o o o o

Melhor recomendao que se deve fazer no sentido de se garantir a representatividade da amostra, pois o acaso ser o nico responsvel por eventuais discrepncias entre populao e amostra. Permite Inferncia Estatstica Pode-ser classificada em: Amostragem Aleatria Simples Amostragem Aleatria Sistemtica Amostragem Estratificada Amostragem por Conglomerados

Amostragem Aleatria Simples:


Todos os elementos da populao tm a mesma probabilidade de ser selecionado; o processo mais elementar e muito frequentemente utilizado; Vrios meios podem ser usados, desde que ofeream a mesma probabilidade de seleo de um elemento da amostra. VANTAGENS:

Facilidade de compreenso; Resultados podem ser projetados para a populao-alvo; DESVANTAGENS:

Em geral, resulta em menor preciso com maiores erros do que outras tcnicas de amostragem probabilstica; Pode no resultar em uma amostra representativa; Amostragem Aleatria Sistemtica: Trata-se de uma variao da amostragem simples, conveniente quando a populao est ordenada segundo critrio, como fichas de um fichrio.

obtido pela razo N (tamanho da populao) e n (tamanho da amostra); O primeiro elemento retirado aleatoriamente (entre 1 e K) e os de mais a partir de um intervalo K: o 1 elemento o i=K, o 2 elemento i+K, o 3 elemento i+2K e assim sucessivamente. Exemplo: Em uma populao de 100 (N), deseja-se uma obter uma amostra de 10 elementos (n), neste caso, o intervalo amostral 100/10 = 10. Assim, escolhe-se um n aleatrio entre 1 e 10. Imagine que 3 seja o nmero sorteado, a amostra consistir dos elementos 3, 13, 23, 33, 43, 53, 63, 73, 83, 93. Amostragem Aleatria Estratificada: Seu principal objetivo aumentar a preciso sem elevar o custo.

Utilizada quando a populao divide-se em subpopulaes (estratos) razoavelmente homogneos; A amostragem estratificada consiste em especificar quantos itens da amostra sero retirados de cada estrato; A seleo em cada estrato deve ser ALEATRIA;

Exemplo: Suponhamos que quisssemos no nosso exemplo fazer a amostragem de acordo com o departamento. A distribuio de elementos por departamentos est abaixo:

Amostragem

por

Conglomerados

ou

Agrupamentos: Esta

tcnica usada quando a identificao dos elementos da populao extremamente difcil, porm pode ser relativamente fcil dividir a populao em conglomerados (subgrupos) heterogneos representativos da populao global.

Uma amostra aleatria simples desses conglomerados pode ser escolhida, e uma contagem completa deve ser feita para o conglomerado sorteado. So exemplos de conglomerados: quarteires, famlias, organizaes, agncias, edifcios, etc. Amostragem No-Probabilstica: No possvel generalizar os resultados para a populao, pois amostras no probabilsticas no garantem a representatividade da populao. Pode ser dividida em:

Amostragem Amostragem Amostragem Amostragem

Acidental por Julgamento Intencional por Quotas

Dimensionamento da Amostra: Clculo do Tamanho Mnimo da Amostra:

Tipo de Varivel: Quantitativa? Qualitativa? Qual a variabilidade? (Quanto mais variada for a populao, maior ser a amostra necessria); Magnitude do Erro Estatstico: Quanto menor o erro admissvel; maior o tamanho da amostra; Tempo, Verbas e Pessoal Disponvel;

Frmulas para o Clculo do Tamanho da Amostra:

Onde: N = Tamanho da Populao; E0= Erro Amostral Tolervel (Exemplo: 2% = 0,02); n0= Primeira Aproximao do Tamanho da Amostra; n= Tamanho da Amostra; Exemplo 1: Em uma empresa que contm 2000 colaboradores, deseja-se fazer uma pesquisa de satisfao. Quantos colaboradores devem ser entrevistados para tal estudo? Considerar o erro amostral tolervel em 2%. Resoluo: E0= 2% = 0,02 Exemplo 2: Vamos repetir os clculos do exerccio anterior, definindo o erro amostral tolervel em 4%. Resoluo: E0= 4% = 0,04 Atravs deste segundo clculo, possvel observar que, quando aumentamos a margem de erro, o tamanho da amostra reduz. Exemplo 3: Vamos repetir os clculos do exerccio 2, supondo que na empresa tinha 30.000 colaboradores e considerando ainda o erro amostral tolervel em 4%. Resoluo: E0= 4% = 0,04 Observe que a diferena entre n e n0, neste ltimo clculo, muito pequena. Portanto: se o nmero de elementos da populao (N) muito grande, a primeira aproximao do tamanho da amostra j suficiente. Observao: N= 2.000 colaboradores (Exemplo 2) E0=0,04 (4%) n= 476 colaboradores (23,8% da populao) N= 30.000 colaboradores (Exemplo 3) E0=0,04 (4%) n= 612 colaboradores (2,04 % da populao) Portanto, podemos perceber que a relao entre a populao inicial (N) e o tamanho da amostra (n) pode ser descrita pela Figura 04.

Onde:

N = Tamanho da Populao; E0= Erro Amostral Tolervel (Exemplo: 2% = 0,02);

n0= Primeira Aproximao do Tamanho da Amostra; n= Tamanho da Amostra;

Exemplo 1: Em uma empresa que contm 2000 colaboradores, deseja-se fazer uma pesquisa de satisfao. Quantos colaboradores devem ser entrevistados para tal estudo? Considerar o erro amostral tolervel em 2%. Resoluo: E0= 2% = 0,02

Exemplo 2: Vamos repetir os clculos do exerccio anterior, definindo o erro amostral tolervel em 4%. Resoluo: E0= 4% = 0,04

Atravs deste segundo clculo, possvel observar que, quando aumentamos a margem de erro, o tamanho da amostra reduz. Exemplo 3: Vamos repetir os clculos do exerccio 2, supondo que na empresa tinha 30.000 colaboradores e considerando ainda o erro amostral tolervel em 4%. Resoluo: E0= 4% = 0,04

Observe que a diferena entre n e n0 , neste ltimo clculo, muito pequena. Portanto: se o nmero de elementos da populao (N) muito grande, a primeira aproximao do tamanho da amostra j suficiente. Observao: N= 2.000 colaboradores (Exemplo 2) E0=0,04 (4%) n= 476 colaboradores (23,8% da populao)

N= 30.000 colaboradores (Exemplo 3) E0=0,04 (4%) n= 612 colaboradores (2,04 % da populao)

Portanto, podemos perceber que a relao entre a populao inicial (N) e o tamanho da amostra (n) pode ser descrita pela Figura 04.

Figura 04: Relao entre o tamanho da populao inicial (N) e o tamanho da amostra (n)