Está en la página 1de 16

TAMAO DE LA MUESTRA Y TEORA ESTADSTICA

CARACTERSTICAS DE LA POBLACIN. Una pregunta prctica en gran parte de la investigacin de mercado tiene que ver con el tamao de la muestra. La encuesta, en principio, no puede ser aplicada sin conocer el tamao de la muestra. Supongamos que estamos interesados en las actitudes de los poseedores de boletos para la temporada operstica en el Teresa Carreo, al cambiar la hora de inicio de las ejecuciones de los das de la semana. La poblacin se compone de 10000 poseedores de boletos de la temporada. De los poseedores de los boletos, 3000 respondieron definitivamente si (lo cual se codifica como +2). Otros 2000 preferiran si (codificado como + 1), y as sucesivamente. La informacin necesaria es la respuesta promedio o la respuesta media en la poblacin (los 10000 poseedores de los boletos para la temporada), la cual se denomina como: = media de la poblacin = 0.3 Pero esta media de la poblacin generalmente es desconocida, y nuestra meta consiste en determinar su valor lo ms aproximadamente posible tomando una muestra de la poblacin.

TAMAO DE LA MUESTRA Y TEORA ESTADSTICA


Otra caracterstica poblacional de inters es la varianza de la poblacin, 2, y su raz cuadrada, la desviacin estndar de la poblacin, . La varianza de la poblacin es una medida de la dispersin de la poblacin, es el grado en el que los distintos poseedores de boletos de temporada difieren entre s en trminos de actitudes. Se basa en el grado en el que una respuesta difiere de la respuesta promedio de la poblacin. En nuestro ejemplo, la varianza de la poblacin es: = la varianza de la poblacin = 2.22 = la desviacin estndar de la poblacin = 1.49
2 Resultados de la codificacin de las respuestas de los poseedores de boletos (poblacin)
Respuesta R Frecuencia de la respuesta f 0.3 0.2 0.2 0.1 0.2 Promedio ponderado Rf 0.6 0.2 0 -0.1 -0.4 0.3 = Media de la Poblacin 0.3 0.3 0.3 0.3 0.3 Diferencia entre la respuesta R- 1.7 0.7 0.3 1.3 2.3 Diferencia elevada al cuadrado (R )2 2.89 0.49 0.09 1.69 5.29 Promedio ponderado (R )2f 0.87 0.10 0.02 0.17 1.06 2.22 =

+2 +1 0 -1 -2 Total

TAMAO DE LA MUESTRA Y TEORA ESTADSTICA


CARACTERSTICAS DE LA POBLACIN. Pero el problema realmente es que la media de la poblacin no es conocida y debe ser estimada a partir de una muestra. Considere una muestra aleatoria sencilla de tamao 10 la cual es tomada de la poblacin. La diez personas seleccionadas y sus actitudes respectivas se muestran a continuacin.
Resultados de la codificacin de las respuestas de los poseedores de boletos (muestra) Mara Virginia Lus Mayra Idmare David Yohama Rubn Vanesa Jean El profe X1 = +1 X2 = +2 X3 = +2 X4 = 0 X5 = +1 X6 = +1 X7 = -1 X8 = +1 X9 = -2 X10= 0

TAMAO DE LA MUESTRA Y TEORA ESTADSTICA


El clculo correspondiente a la media, varianza, y desviacin estndar pero ahora con respecto a la muestra ser mediante la aplicacin de las siguientes frmulas. Media:

Varianza: S2 =

= 1.61

Desviacin estndar: S = S2 ser pequea si las respuestas de la muestra son simulares, y grandes si se encuentran dispersas. Nuevamente, es importante hacer una distincin entre la varianza de la poblacin ( 2) y la varianza de la muestra (S2).

TAMAO DE LA MUESTRA Y TEORA ESTADSTICA


CONFIABILIDAD DE LA MUESTRA. Desde luego, todas las muestras no generaran el mismo valor x (o S). Si otra muestra aleatoria simple con tamao de 10 fuera tomada de la poblacin, x podr ser de 0.3, 1.2, 0.4, o cualquier otra cantidad. El punto importante es que x variara de muestra en muestra. Intuitivamente ser lgico pensar que la variacin en x ser ms grande a medida que la varianza de la poblacin, 2 sea ms grande. En un extremo, si no hay poblacin, no habr tampoco variacin en x. Tambin es razonable pensar que, a medida que aumenta el tamao de la muestra, la variacin en x disminuir. Cuando la muestra es pequea, se necesitan slo uno o dos valores extremos para afectar sustancialmente la media muestral, generando de este modo una x relativamente grande o pequea. A medida que aumenta el tamao de la muestra, estos valores extremos tendrn un menor impacto cuando aparezcan, porque sern promediados con ms valores. La variacin en es medida por su error estndar, es cual es:
x

= el error estndar de x =

x/

n = 1.49 / 10 = 0.47

TAMAO DE LA MUESTRA Y TEORA ESTADSTICA


( x puede escribirse simplemente como ). Note que el error estndar x depende de n, el tamao de la muestra. Si n se altera, el error estndar cambiar de acuerdo a ello, como se demuestra en el siguiente cuadro:
Tamao de la muestra 10 40 100 500

x
1.49 1.49 1.49 1.49

= x / n
0.470 0.235 0.149 0.067

La variable X tiene una distribucin de probabilidad similar a la forma acampanada de la distribucin normal. Con la media de la muestra x pasa lo mismo. En otras palabras, indica que x generalmente se acercar a la media de la poblacin () y que tiene iguales posibilidades de ser ms grande que o ms pequea. En la siguiente figura se muestra como el rea bajo la curva normal es dividida. Por ejemplo, la probabilidad de que x se encuentre dentro 2 X de la media de la poblacin () es de 0.95. Similarmente la probabilidad de que x se encuentre dentro de una X de la media de la poblacin () es del 68,20%.

TAMAO DE LA MUESTRA Y TEORA ESTADSTICA


La distribucin normal en funcin de X

En nuestro ejemplo de la sinfona, suponga que se obtuvieron 100 muestras diferentes de 10 sujetos. Aproximadamente el 95% de las medias muestrales resultantes x estaran dentro de 2 errores estndar ( X = 0.47) de la media de la poblacin ( = 0.3).

TAMAO DE LA MUESTRA Y TEORA ESTADSTICA


ESTIMACIN DEL INTEVALO DE CONFIANZA. La media de la muestra, x, es usada para estimar la media de la poblacin desconocida (). Debido a que x vara de muestra en muestra, no es desde luego, igual a la media de la poblacin (). Ello porque como se explic anteriormente hay un error de la muestra. Es til proporcionar una estimacin de intervalo en torno a el cual refleje nuestro juicio acerca del alcance del este error muestral. error de la muestra = estimacin del intervalo de El tamao del intervalo depender de qu tan confiados queramos estar de que el intervalo contenga la media de la poblacin verdadera y desconocida. Si fuera necesario tener una confianza del 95% de que la estimacin del intervalo contuviera a la media poblacional verdadera, la estimacin del intervalo seria: = estimacin de intervalo del 95% de En nuestro ejemplo el intervalo seria = 0.5 2 * 0.47 = 0.5 0.94

TAMAO DE LA MUESTRA Y TEORA ESTADSTICA


El tamao del intervalo se basa en 2 X porque, tal como se muestra en la figura de campana, la probabilidad de que X est entre X de la media poblacional es 0.95 (note que el intervalo anterior incluye la media poblacional . Adems: Interpretacin de z (Puntaje z, nmero de desviaciones estndar normales) Como la distribucin de la muestra es normal, se puede afirmar que: a) El 68,27% de las veces, los promedios de la muestra caern dentro de 1 b) El 95,45% de las veces, los promedios de la muestra caern dentro de 2 c) El 99,73% de las veces, los promedios de la muestra caern dentro de 3 Ejercicio: construya el intervalo de confianza para 1 X y 3 X y establezca el porcentaje de probabilidad correspondiente. Importante: Si la desviacin estndar ( X = ) es desconocida es necesario estimarla con la desviacin estndar de la muestra, S.
X X X

TAMAO DE LA MUESTRA Y TEORA ESTADSTICA


Estimacin del intervalo de confianza cuando ( X 1S/ n X 2S/ n X 3S/ n
X

= ) es desconocida desconocida desconocida desconocida

estimacin del intervalo de confianza de 68,27 % con estimacin del intervalo de confianza de 95,45 % con estimacin del intervalo de confianza de 99,73 % con

En nuestro ejemplo, sera 0.5 2 (1.27/ 10) = 0.50 0.80 Intervalo con 95% de confianza, una z de 2 y un tamao de muestra de 10. Ojo: De este modo, el tamao de la estimacin del intervalo depender de tres factores. El primero es el nivel de confianza. Si estamos dispuestos a tener menos confianza de que la estimacin del intervalo incluya a la media de la poblacin verdadera y desconocida, entonces el intervalo ser ms pequeo. El segundo factor es la desviacin estndar de la poblacin. Si hay poca variacin de la poblacin, entonces la estimacin del intervalo de la media poblacional ser ms pequea. El tercero el es tamao de la muestra. Conforme esta aumenta, el error de la muestra se ve reducido y el intervalo se volver ms pequeo.

TAMAO DE LA MUESTRA Y TEORA ESTADSTICA


LA PREGUNTA DEL TAMAO DE LA MUESTRA. Ahora, estamos finalmente listos para usar estos conceptos para que nos ayuden a determinar el tamao de la muestra. Para proceder, el anlisis debe especificar: El tamao del error de la muestra que se desea El nivel de confianza, por ejemplo, un nivel de confianza del 95%. Ojo: Esta especificacin depender de las intercomposicin entre el valor de la informacin ms exacta y el costo por un incremento en el tamao de la muestra. Para un nivel de confianza dado, un error muestral ms pequeo tendr un costo en trminos de un tamao de muestra ms grande. Similarmente, para un error de la muestra dado, un nivel de confianza ms alto tendr un costo en trminos de un tamao muestral ms grande. Estas afirmaciones se entendern ms fcilmente con algunos ejemplos.

TAMAO DE LA MUESTRA Y TEORA ESTADSTICA


Usando la frmula general para la estimacin del intervalo (recuerde que las mismas) x error muestral, x z / n Asu vez sabemos que error muestral = z / n y
X son

Dividiendo toda la expresin entre el error de la muestra y multiplicando por n, nos queda n = z / error muestral Despejando n tenemos n = z2
2

/ (error muestral)2

Esta n representa la frmula del tamao de la muestra. En nuestro ejemplo n es 99 (con desviacin estndar de la poblacin ( = 1.49) conocida, una z = 2, y un 95% de confianza teniendo un error muestral de 0.3.

TAMAO DE LA MUESTRA Y TEORA ESTADSTICA


Cuando la desviacin estndar de la poblacin ( ) no es conocida, se utilizan varios enfoques. a) utilizar una proveniente de estudios anteriores, b) usar la desviacin estndar de la muestra (S), tomada de una encuesta anterior o de una encuesta piloto, c) ponerse en el peor de los casos. Usar la desviacin estndar de la muestra (S) n = z2S2 / (error muestral)2 Esta n representa la frmula del tamao de la muestra cuando no se conoce la desviacin estndar de la poblacin. n = (22*1.272) / 0.802 En nuestro ejemplo n es 10 (con desviacin estndar de la poblacin (S = 1.27) conocida, una z = 2, y un 95% de confianza teniendo un error muestral de 0.80.

TAMAO DE LA MUESTRA Y TEORA ESTADSTICA


Ponerse en el peor de los casos En nuestro ejemplo, la varianza poblacional ms grande ocurrir si la mitad de la poblacin respondiera con un +2 y la otra mitad con un -2. La varianza de la poblacin seria entonces 4, y el tamao de la muestra recomendado, a un nivel de confianza del 95% y un error permitido de 0.3, seria 178. Note que el tamao de la muestra sera ms grande que lo deseado, y por lo tanto la exactitud deseada se vera excedida. Lo lgica indica que es admisible cometer errores cuando se ha optado por ser demasiado exacto. 2P = ( * (1 )) / n donde = la proporcin de la poblacin P = la proporcin de la muestra (correspondiente a x), usada para estimar la proporcin de la poblacin desconocida) 2 = la varianza de la poblacin de P P

La varianza de la poblacin sera de 0.5(2-0)2 + 0.5 (-2-0)2 = 0.5 x 4 + 0.5 x 4 = 4 Puesto que el 0.5 de la poblacin respondi con +2, y la media de la poblacin, o el promedio poblacional, sera cero.

La frmula para el tamao de la muestra es entonces n = (z2 * (1 )) / (error muestral)2

TAMAO DE LA MUESTRA Y TEORA ESTADSTICA


Para nuestro ejemplo la varianza de la poblacin sera de 0.5 (2-0)2 + (-2-0)2 = 0.5 * 4 + 0.5 * 4 = 4, puesto que el 0.5 de la poblacin respondi con un +2, y la media de la poblacin, o el promedio poblacional, seria cero. El clculo del error muestral en nuestro caso sera:
0.25 0.20 (1 ) 0.15 0.10 0.05

0.25

0.50

0.75

1.00

Como lo muestra la figura, el peor de los casos, es donde la varianza de la poblacin est a su mximo, y esto ocurre cuando la proporcin poblacional es igual a 0.50

(1 ) = 0.25 = 0.50

TAMAO DE LA MUESTRA Y TEORA ESTADSTICA


Debido a que la proporcin poblacional es desconocida, un procedimiento comn consiste en supone el peor de los casos. La frmula para el tamao de muestra se simplifica a n = (z2x0.25) / (error muestral)2 De este modo, si la proporcin de la poblacin debe ser estimada dentro de un error, de 0.05 (o 5 puntos porcentuales) a un nivel de confianza del 95%, el tamao necesario de la muestra es n = (22x0.25) / (0.05)2 = 400 Puesto que z = 2, correspondiente a un nivel de confianza del 95%, y el error muestral permitido es igual a 0.05. En general tenemos un pequeo resumen de frmulas: Tamao de la muestra = n = z2 / (error muestral)2 Para las proporciones = n = z2(0.25) / (error muestral)2 Cuando Cuando se conoce se desconoce

También podría gustarte