Está en la página 1de 19

Distribucin muestral de proporciones

Algunas secciones han sido tomadas de: Apuntes de Estadstica Inferencial Instituto Tecnolgico de Chiuhuahua

Distribucin muestral de Proporciones

Existen ocasiones en las cuales no estamos interesados en la media de una muestra, sino que queremos investigar la proporcin de personas con cierta preferencia, etc en la muestra. La distribucin muestral de proporciones es la adecuada para dar respuesta a estas situaciones. Esta distribucin se genera de igual manera que la distribucin muestral de medias, a excepcin de que al extraer las muestras de la poblacin se calcula el estadstico proporcin (p=x/n en donde x es el nmero de xitos u observaciones de inters y n el tamao de la muestra) en lugar de la media de cada muestra que era lo que calculamos antes.

El siguiente diagrama sirve para explicar el concepto de distribucin muestral de proporciones.

La distribucin muestral de proporciones est estrechamente relacionada con la distribucin binomial; una distribucin binomial es una distribucin del total de xitos en las muestras, mientras que una distribucin de proporciones es la distribucin de un promedio (media) de los xitos. Como consecuencia de esta relacin, las afirmaciones probabilsticas referentes a la proporcin muestral pueden evaluarse usando la aproximacin normal a la binomial, siempre que:

np 5 y

n(1-p) 5

Una distribucin binomial es, por ejemplo, si echamos una moneda al aire y observamos el lado que cae. Est claro que slo hay dos posibilidades. Ahora bien, la probabilidad de que caiga la moneda de cualquier lado es la misma siempre que sta no est cargada. Como cada caso tiene igual probabilidad de ocurrir, y siendo la suma de probabilidades siempre igual a 1, entonces la probabilidad de que caiga la moneda de algn lado es 0.5. Si realizamos el experimento n veces y queremos saber la probabilidad de que salga guila o sol x veces, entonces usamos una distribucin binomial.

Generacin de la Distribucin Muestral de Proporciones Suponga que se cuenta con un grupo de 12 personas, el cual tiene 4 personas con fobias. Se van a seleccionar 5 personas al azar de ese grupo sin reemplazo. Vamos a generar la distribucin muestral de proporciones para el nmero de personas con fobias. Como se puede observar en este ejercicio la proporcin de personas con fobias de esta poblacin es P = 4/12=1/3=0.333 Por lo que podemos decir que el 33% de las personas de este grupo tienen fobias. El nmero posible de muestras de tamao 5 a extraer de una poblacin de 12 elementos es 12C5=792, las cuales se pueden desglosar de la siguiente manera:
Personas sin fobias
1 2 3 4 5

Personas con fobias


4 3 2 1 0

Proporcin de Personas con fobias


4/5= 0.8 3/5= 0.6 2/5= 0.4 1/5= 0.2 0/5= 0

Combinaciones posibles
8C1*4C4 8C2*4C3 8C3*4C2 8C4*4C1

=8

= 112 = 336 = 280 = 56

8C5*4C0

TOTAL

792

Para calcular la media de la distribucin muestral de proporciones se tendra que hacer la sumatoria de la frecuencia por el valor de la proporcin muestral y dividirla entre el nmero total de muestras. Esto es:

(0.8 8) + (0.6 112) + (0.4 336) + (0.2 280) + (0 56) 1 p = = = 0.333 792 3

Como podemos observar la media de la distribucin muestral de proporciones es igual a la proporcin de la poblacin.

p = P

La desviacin estndar de la distribucin muestral de proporciones del ejemplo se puede calcular directamente con los datos:
(0.8 0.33) 2 8 + (0.6 0.33) 2 112 + (0.4 0.33) 2 336 + (0.2 0.33) 2 280 + (0 0.33) 2 56 = = 0.168 792

Sin embargo, podemos usar la distribucin binomial lo cual nos da la siguiente frmula para la desviacin estndar de la distribucin muestral de proporciones:

p =

P (1 P ) n

pero n es el tamao de la muestra

Notar que P es la proporcin de la poblacin

Como vimos antes, si contamos con una poblacin finita y un muestreo sin reemplazo, para calcular la desviacin estndar usamos la correccin (Como regla aproximada, si el muestreo se hace sin reemplazo y el tamao de la poblacin es 20 veces el tamao de la muestra o menor, entonces se puede usar la frmula):

p =

P (1 P ) N n n N 1

Para el ejemplo anterior tendramos la siguiente distribucin de probabilidades:

Usando la frmula tendramos entonces:

p =

P (1 P ) N n = n N 1

0.333(0.666) 12 5 = 0.168 5 12 1

Lo cual es igual al valor de la desviacin estndar obtenido antes

La frmula que se utilizar para el clculo de probabilidad en una distribucin muestral de proporciones est basada en la aproximacin de la distribucin binomial a la normal . Esta frmula nos servir para calcular la probabilidad del comportamiento de la proporcin en la muestra.

z=

p P

P (1 P ) n

Esta frmula se puede comparar a las anteriores si pensamos en que estamos calculando una diferencia entre la proporcin de la muestra y la de la poblacin en unidades de desviacin estndar, como era el caso de la distribucin de medias:

z=

A la frmula anterior se le puede agregar el factor de correccin (en el denominador):

z=

p P P (1 P ) N n n N 1

si se cumplen con las condiciones mencionadas anteriormente de que sea una poblacin finita (N/n < 20) y sin reemplazo.

Ejemplo: Se ha determinado que 85.1% de los estudiantes de una universidad fuman cigarrillos. Se toma una muestra aleatoria de 200 estudiantes. Calcular la probabilidad de que no ms de 80% de alumnos de la muestra fume.

Solucin: La media o valor esperado de la distribucin muestral es de P=0.851 (la proporcin de la poblacin), por lo que:

z=

p P P (1 P ) n

0.800 0.851 0.851(1 0.851) 200

= 2.0255

Usando las tablas de valor z, para z = -2.02 encontramos que la probabilidad de que no ms de (es decir, menos de) 80% de los alumnos de la muestra fumen es de 0.0214 o sea 2.14%

0.0214

Actividad 1. Suponer que de la gente que solicita ingresar a una compaa, 40% pueden aprobar un examen de artimtica para obtener el trabajo. Si se tomara una muestra de 20 solicitantes, Cul sera la probabilidad de que 50% o ms de ellos aprobaran? Datos: P = 0.40, n = 20, p = 0.50

z=

p P P (1 P ) n

0.50 0.40 0.40(1 0.40) 20

= 0.9129

Usando tablas de valor o calificacin z, o un programa para distribucin normal estndar (como Minitab, etc.), encontramos que el rea bajo la curva hasta un valor de z = 0.9129 es de 0.81935, o sea que (1- 0.81935) = 0.1806, por lo que la probabilidad de que 50% o ms aprobaran es de 18.06% .

El rea desde es de 0.81935

hasta z= 0.9129

Cmo calcular probabilidades normales usando MINITAB (versin en ingls): En el men superior: Calc > Probability Distributions > Normal Tenemos 3 opciones: Probability density Esta nos da el valor de la funcin de densidad, f(x) para un valor especfico de x. Esto no nos es muy til en esta clase. Cumulative Probability Esta nos da el rea bajo la curva hasta un valor z especfico. Usamos esto para encontrar probabilidades. Inverse Cumulative Probability Esto nos da el valor z para una rea especfica bajo la curva. Esto lo usamos para encontrar valores crticos. Hacer Click en la opcin que queremos. Se introduce la media y la desviacin estndar de la distribucin normal que estamos usando. En el caso de la estndar normal (Z) introducimos N(0,1). Hacemos Click en input constant e introducimos el valor de x (xvalue) para la opcin 1, el valor z para la opcin 2, o la probabilidad para la opcin 3.

Ejemplo: Cul es la probabilidad de que tengamos un valor mayor a 60 si tenemos datos con una distribucin normal con media 55 y deviacin estndar de 4? Esto es, encontrar P(x > 60).

Como puede verse en la figura, el resultado que se obtiene es que P(X < 60) = 0.8964. Notar que nos da los valores de la probabilidad de que X sea menor al valor dado, por lo que para nuestro problema: P(X > 60) = 1 - 0.8964 = 0.1036

Si lo que queremos es el rea para una calificacin Z (normal estndar) entonces, como se explic, podemos introducir una media igual a 0 y una desviacin estndar de 1.0, e introducir el valor de Z para el cual queremos encontrar la probabilidad.

Poner media = 0 Poner = 1.0

Poner z = valor de inters