Está en la página 1de 31

Captulo 7: Distribuciones muestrales

Recordemos:

Parmetro es una medida de resumen numrica que se calculara usando todas las unidades de la poblacin. Es un nmero fijo. Generalmente no lo conocemos. Estadstica es una medida de resumen numrica que se calcula de las unidades de la muestra. El valor de la estadstica se conoce cuando tomamos una muestra, pero varia de muestra en muestra variacin muestral

Inferencia estadstica: es el proceso de sacar conclusiones de la poblacin basados en la informacin de una muestra de esa poblacin.

Objetivos de la inferencia: estimacin de parmetros, intervalos de confianza y docimasia, test de hiptesis o pruebas de significacin estadstica.

Distribuciones muestrales Una estadstica muestral proveniente de una muestra aleatoria simple tiene un patrn de comportamiento (predecible) en repetidas muestras. Este patrn es llamado la distribucin muestral de la estadstica. Si conocemos la distribucin muestral podemos hacer inferencia. Las distribuciones muestrales adoptan diferentes formas segn las estadsticas investigadas y las caractersticas de la poblacin estudiada.

7.1 Distribucin muestral de una proporcin muestral La distribucin muestral de la proporcin muestral es la distribucin de los valores de las proporciones muestrales de todas las posibles muestras del mismo tamao n tomadas de la misma poblacin.

Suponga que estamos interesados en conocer la proporcin de mujeres en Chile. Nuestro parmetro de inters es:

nmero de mujeres en Chile P= nmero de habitantes en Chile


La poblacin es demasiado grande. Hacer un censo sera demasiado caro. Decidimos estimar el verdadero parmetro a partir de una muestra. La proporcin muestral sera:

nmero de mujeres en la muestra p= tamao de la muestra

Supongamos que sabemos que P = 0,5 Qu pasa si tomamos una muestra tamao n = 20 ? Muestra #1:
HMHHHMMMHHHMHMMHHMHM

$ Proporcin de mujeres p =9/20=0,45


Muestra #2:
MMHMHMMHHHHMHHMMMHMM

$ Proporcin de mujeres p =11/20=0,55


Muestra #3:
HHMMMHHMHMHMHMMHHMMH

$ Proporcin de mujeres p =10/20=0,50

En la prctica el investigador toma una muestra. El conocimiento de la distribucin muestral nos servir de base terica para hacer inferencia estadstica.

Para conocer la distribucin muestral de una estadstica deberamos considerar todas las posibles muestras de un tamao n, de una poblacin.

En la prctica, podemos simular la distribucin muestral aproximada o emprica, de la siguiente manera: 1. Seleccione "muchas" muestras aleatorias de mismo tamao de una poblacin. 2. En cada muestra calcule el estadstico muestral 3. Determine la distribucin muestral aproximada

Recuerden que al analizar distribucin nos interesa: 1. Forma (simtrica o sesgada)

una

2. Posicin central - la media de una distribucin muestral nos dice si el estadstico es un "buen" (insesgado) estimador del parmetro o es sesgado. 3. Dispersin - nos da una idea del error de muestreo.

cul es la proporcin de nmeros pares de la tabla de nmeros aleatorios? Usando tabla de nmeros aleatorios. Asumamos que el 50% de la poblacin es par, es decir P = 0,5 Vamos a tomar 50 muestras de tamao n = 4 de esta poblacin. Seleccionamos un punto de partida y elegimos 4 nmeros.

Supongamos que el punto de partida es Fila 20:


columna fila 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 1-5 10480 22368 24130 42167 37570 77921 99562 96301 89579 85475 28918 63553 09429 10365 07119 51085 02368 01011 52162 07056 48663 54164 32639 29334 02488 81525 29676 00742 05366 91921 00582 00725 69011 25976 09763 6-10 15011 46573 48360 93093 39975 06907 72905 91977 14342 36857 69578 40961 93969 61129 97336 12765 21382 54092 53916 97628 91245 58492 32363 37001 33062 72295 20591 57392 04213 26418 04711 69884 65795 57948 83473 11-15 01536 25595 22527 06243 81837 11008 56420 05463 63661 53342 88231 48235 52636 87529 71048 51821 52404 33362 46369 33787 85828 22421 05597 87637 28834 04839 68086 39064 25669 64117 87917 62797 95876 29888 73577 16-20 02011 85393 97265 61680 16656 42751 69994 07972 10228 53988 33276 03427 92737 85689 08178 51259 60268 94904 58586 09998 14346 74103 24200 87308 07351 96423 26432 66432 26422 94305 77341 56170 55293 88604 12908 21-25 81647 30995 76393 07856 06121 27756 98872 18876 17453 53060 70997 49626 88974 48237 77233 77452 89368 31273 23216 42698 09172 47070 13363 58731 19731 24878 46901 84673 44407 26766 42206 86324 18988 67917 30833 26-30 91646 89198 64809 16376 91782 53498 31016 20922 18103 59533 79936 69445 33488 52267 13916 16308 19885 04146 14513 06691 30168 25306 38005 00256 92420 82651 20849 40027 44048 25940 35126 88072 27354 48708 18317 31-35 69179 37982 15179 39440 60468 18602 71194 94595 57740 38867 56865 18663 36320 67689 47564 60756 55322 18594 83149 76988 90229 76468 94342 45834 60952 66566 89768 32832 37937 39972 74087 76222 26575 18912 28290 36-40 14194 53402 24830 53537 81305 70659 18738 56869 84378 62300 05859 72695 17617 93394 81056 92144 44819 29852 98736 13602 04734 26384 28728 15398 61280 14778 81536 61362 63904 22209 99547 36086 08625 82271 35797 41-45 62590 93965 49340 71341 49684 90665 44013 69014 25331 08158 90106 52180 30015 01511 97735 49442 01188 71585 23495 51851 59193 58151 35806 46557 50001 76797 86645 98947 45766 71500 81817 84637 40801 65424 05998 46-50 36207 34095 32081 57004 60672 15053 48840 60045 12566 17983 31595 20847 08272 26358 85977 53900 65255 85030 64350 46104 22178 06646 06912 41135 67658 14780 12659 96067 66134 64568 42607 93161 59920 69774 41688 51-55 20969 52666 30680 00849 14110 21916 63213 18425 58678 16439 01547 12234 84115 85104 29372 70960 64835 51132 94738 88916 30421 21524 17012 10367 32586 13300 92259 64760 75470 91402 43808 76038 29841 33611 34952

56-6

995 191 196 749 069 818 210 849 449 114 855 905 271 202 744 639 449 019 177 195 616 152 641 076 866 870 571 645 665 424 766 658 801 542 378

Resultados si el punto de partida es Fila 20:


Muestra Estadstico 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 0705 6976 2833 7870 9998 4269 8066 9176 9881 3602 5185 1461 0488 9161 9509 2562 5581 0448 6639 1245 8582 8143 4609 1723 0168 2/4 4/4 2/4 2/4 1/4 3/4 4/4 1/4 2/4 3/4 1/4 2/4 4/4 1/4 1/4 3/4 1/4 4/4 2/4 2/4 3/4 2/4 3/4 1/4 3/4

Muestra Estadstico 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 9022 9047 3459 1932 2178 3042 1616 6699 9043 2812 5416 4584 9222 4217 4103 4707 0253 0676 4682 6384 5815 1066 4621 5241 5227 3/4 2/4 1/4 1/4 2/4 3/4 2/4 2/4 2/4 4/4 2/4 3/4 3/4 2/4 2/4 2/4 2/4 3/4 4/4 3/4 1/4 3/4 3/4 2/4 2/4

Tabla:
Nmero de pares 0 1 2 3 4 Total Proporcin muestral 0/4 = 0,00 1/4 = 0,25 2/4 = 0,50 3/4 = 0,75 4/4 = 1,00 Frecuencia 0 10 20 14 6 Proporcin de todas las muestras

a) Cul fue la proporcin ms frecuente? b) Dibuje la distribucin emprica. Qu forma tiene?


muestral

Cada vez que tomamos una muestra tenemos una estimacin para el parmetro P . Estas estimaciones varan entre muestras variacin muestral

Se puede demostrar que si tomamos una m.a.s. de tamao n de una poblacin con $ parmetro P , la desviacin estndar de p

p =
es:

P(1 P) n
y

que depende de la verdadera proporcin del tamao muestral n .

Si el tamao muestral es n = 4 y la proporcin en la poblacin es P = 0,5 $ entonces la desviacin estndar de p es:

p =

P (1 P ) 0,5(1 0,5) = = 0,25 n 4

Que pasa si aumentamos el tamao muestral? Que pasa con P ? Cmo afecta el valor de P en la desviacin estndar?
P P(1-P) 0,1 0,09 0,2 0,16 0,3 0,21 0,4 0,24 0,5 0,25 0,6 0,24 0,7 0,21 0,8 0,16 0,9 0,09

0.3 0.25 0.2 0.15 0.1 0.05 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 P 1

P(1-P)

Sesgo y Precision Cuando estimamos un parmetro de la poblacin a partir de una estadstica muestral, nos va a interesar que la estimacin no tenga sesgo y sea precisa.

La figura ilustra la diferencia entre sesgo y precisin.

Distribucin muestral de una proporcin

Si P representa la proporcin de elementos en una poblacin con cierta caracterstica de inters, es decir, la proporcin de xitos, donde xito corresponde a tener la caracterstica. Si sacamos muestras aleatorias simples de tamao n de la poblacin donde la proporcin de xitos es P , entonces la distribucin muestral de la proporcin muestral tiene las siguientes propiedades: 1. El promedio de todos los valores $ posibles de p es igual al parmetro P . En $ otras palabras, p es un estimador insesgado de P . =P p

2. Error estndar de la proporcin muestral: Es la desviacin estndar de las posibles proporciones muestrales y mide la dispersin de la proporcin muestral.

p =

P(1 P) n

3. Si n es suficientemente grande, la distribucin de la proporcin muestral es aproximadamente Normal:

P (1 P ) ) p ~ N ( P, & n
cuando nP 5 y n(1-P) 5

Sangre En Chile el 5,3% de la poblacin tiene sangre factor Rh(-). En una muestra aleatoria de 400 sujetos de esa poblacin, se encuentra que un 8,8% tiene factor Rh(-). a) cul es el valor del parmetro? b) cul es el valor de la estadstica? c) Cul es la probabilidad de que en una nueva muestra aleatoria de tamao 400 de esa poblacin contenga al menos un 8,8% de personas con sangre factor Rh(-)?

P( p 8,8) =
d) Suponga que se toma una muestra aleatoria simple de tamao 10 de la misma poblacin. Queremos calcular la probabilidad de que 8,8% o ms tenga sangre factor Rh(-).

Distribucin muestral de la media muestral

La distribucin muestral de la media muestral es la distribucin de los valores de las medias muestrales de todas las posibles muestras del mismo tamao n tomadas de la misma poblacin.

Considere una poblacin cuya variable aleatoria X es discreta y con la siguiente distribucin:

La media de la poblacin es =
Suponga que no conocemos la poblacin o el valor de . Podemos tomar una m.a.s. de tamao n=2 de esta poblacin. Cul sera una muestra de tamao n=2 de esta poblacin? Cul sera la media muestral? Es igual a la media de la poblacin? Si tomamos otra muestra de tamao n=2, obtendramos la misma media muestral?

Distribucin muestral de la media muestral Si sacamos muestras aleatorias de tamao n de una poblacin con media y desviacin estndar , entonces la distribucin muestral de la media muestral tiene las siguientes propiedades: 1.El promedio de todos los valores posibles de medias muestrales es igual al parmetro . En otras palabras, la media muestral X es un estimador insesgado de .

=
x

2. Error estndar de la media muestral: Es la desviacin estndar de las posibles medias muestrales.

=
x

El error estndar disminuye si el tamao de la muestra aumenta.

3.Si la poblacin original tiene distribucin Normal, entonces para cualquier tamao muestral n la distribucin de la media muestral es tambin Normal:
Si X ~ N ( , ) x ~ N ( , n )

4.Si la poblacin de origen no es Normal, pero n es suficientemente grande la distribucin de la media muestral es aproximadamente Normal:
N ( , ) x ~ N ( , & An si X no es: n )

Nota:

- Un tamao de 30 es considerado suficiente. - El resultado en (4) se conoce como el Teorema del Lmite Central.

Suponga que X = peso de carga de camionetas en kilos, tiene distribucin normal con media = 300 k y varianza = 25. Se toma una muestra aleatoria de 25 camionetas cargadas y se calcula la media muestral. Esquema de las distribuciones de la variable aleatoria X y de la media muestral:
Distribution of X N(300, 1 )

Distribution of X N(300,25)

285

290

295

=30 300

305

310

315

Suponga que X = la edad de las madres en los nacimientos en Chile el ao 1995, tiene distribucin normal con media = 26,5 aos y desviacin estndar 6,3 aos. a) Describa la distribucin de la edad de la madre. b) Cul es la probabilidad de que una madre elegida al azar tenga ms de 30 aos? c) Suponga que tomamos una muestra aleatoria de n=25 madres cul es la probabilidad de que la media muestral sea mayor a 30? d) porqu las respuestas en (b) y (c) son distintas?