Está en la página 1de 31

Captulo 7: Distribuciones muestrales

Recordemos:

Parmetro es una medida de resumen


numrica que se calculara usando todas
las unidades de la poblacin.

Es un nmero fijo.
Generalmente no lo conocemos.

Estadstica es una medida de resumen


numrica que se calcula de las unidades
de la muestra.

El valor de la estadstica se conoce


cuando tomamos una muestra,
pero varia de muestra en muestra 

variacin muestral
Inferencia estadstica: es el proceso de
sacar conclusiones de la poblacin
basados en la informacin de una muestra
de esa poblacin.
Objetivos de la inferencia:

 estimacin de parmetros,

 intervalos de confianza y

 docimasia, test de hiptesis o pruebas


de significacin estadstica.
Distribuciones muestrales

Una estadstica muestral proveniente de


una muestra aleatoria simple tiene un
patrn de comportamiento (predecible) en
repetidas muestras. Este patrn es
llamado la distribucin muestral de la
estadstica.

Si conocemos la distribucin muestral


podemos hacer inferencia.

Las distribuciones muestrales adoptan


diferentes formas segn las estadsticas
investigadas y las caractersticas de la
poblacin estudiada.
7.1 Distribucin muestral
de una
proporcin muestral

La distribucin muestral de la
proporcin muestral es la distribucin
de los valores de las proporciones
muestrales de todas las posibles muestras
del mismo tamao n tomadas de la
misma poblacin.
Suponga que estamos interesados
en conocer la proporcin de mujeres en
Chile. Nuestro parmetro de inters
es:
nmero de mujeres en Chile
P=
nmero de habitantes en Chile

La poblacin es demasiado grande. Hacer un


censo sera demasiado caro. Decidimos
estimar el verdadero parmetro a partir de
una muestra.

La proporcin muestral sera:

nmero de mujeres en la muestra


p =
tamao de la muestra
Supongamos que sabemos que P = 0,5 Qu
pasa si tomamos una muestra tamao n = 20 ?
Muestra #1:

HMHHHMMMHHHMHMMHHMHM

Proporcin de mujeres p$ =9/20=0,45

Muestra #2:

MMHMHMMHHHHMHHMMMHMM

Proporcin de mujeres p$ =11/20=0,55

Muestra #3:

HHMMMHHMHMHMHMMHHMMH

Proporcin de mujeres p$ =10/20=0,50


En la prctica el investigador toma una
muestra. El conocimiento de la
distribucin muestral nos servir de base
terica para hacer inferencia estadstica.

Para conocer la distribucin muestral de


una estadstica deberamos considerar
todas las posibles muestras de un tamao
n, de una poblacin.
En la prctica, podemos simular la
distribucin muestral aproximada o
emprica, de la siguiente manera:

1. Seleccione "muchas" muestras


aleatorias de mismo tamao de una
poblacin.

2. En cada muestra calcule el estadstico


muestral

3. Determine la distribucin muestral


aproximada
Recuerden que al analizar una
distribucin nos interesa:

1. Forma (simtrica o sesgada)

2. Posicin central - la media de una


distribucin muestral nos dice si el
estadstico es un "buen" (insesgado)
estimador del parmetro o es sesgado.

3. Dispersin - nos da una idea del error


de muestreo.
cul es la proporcin de nmeros
pares de la tabla de nmeros aleatorios?

Usando tabla de nmeros aleatorios.


Asumamos que el 50% de la poblacin es
par, es decir P = 0,5

Vamos a tomar 50 muestras de tamao


n = 4 de esta poblacin.

Seleccionamos un punto de partida y


elegimos 4 nmeros.
Supongamos que el punto de partida es Fila
20:
columna
1-5 6-10 11-15 16-20 21-25 26-30 31-35 36-40 41-45 46-50 51-55 56-6
fila
1 10480 15011 01536 02011 81647 91646 69179 14194 62590 36207 20969 995
2 22368 46573 25595 85393 30995 89198 37982 53402 93965 34095 52666 191
3 24130 48360 22527 97265 76393 64809 15179 24830 49340 32081 30680 196
4 42167 93093 06243 61680 07856 16376 39440 53537 71341 57004 00849 749
5 37570 39975 81837 16656 06121 91782 60468 81305 49684 60672 14110 069
6 77921 06907 11008 42751 27756 53498 18602 70659 90665 15053 21916 818
7 99562 72905 56420 69994 98872 31016 71194 18738 44013 48840 63213 210
8 96301 91977 05463 07972 18876 20922 94595 56869 69014 60045 18425 849
9 89579 14342 63661 10228 17453 18103 57740 84378 25331 12566 58678 449
10 85475 36857 53342 53988 53060 59533 38867 62300 08158 17983 16439 114
11 28918 69578 88231 33276 70997 79936 56865 05859 90106 31595 01547 855
12 63553 40961 48235 03427 49626 69445 18663 72695 52180 20847 12234 905
13 09429 93969 52636 92737 88974 33488 36320 17617 30015 08272 84115 271
14 10365 61129 87529 85689 48237 52267 67689 93394 01511 26358 85104 202
15 07119 97336 71048 08178 77233 13916 47564 81056 97735 85977 29372 744
16 51085 12765 51821 51259 77452 16308 60756 92144 49442 53900 70960 639
17 02368 21382 52404 60268 89368 19885 55322 44819 01188 65255 64835 449
18 01011 54092 33362 94904 31273 04146 18594 29852 71585 85030 51132 019
19 52162 53916 46369 58586 23216 14513 83149 98736 23495 64350 94738 177
20 07056 97628 33787 09998 42698 06691 76988 13602 51851 46104 88916 195
21 48663 91245 85828 14346 09172 30168 90229 04734 59193 22178 30421 616
22 54164 58492 22421 74103 47070 25306 76468 26384 58151 06646 21524 152
23 32639 32363 05597 24200 13363 38005 94342 28728 35806 06912 17012 641
24 29334 37001 87637 87308 58731 00256 45834 15398 46557 41135 10367 076
25 02488 33062 28834 07351 19731 92420 60952 61280 50001 67658 32586 866
26 81525 72295 04839 96423 24878 82651 66566 14778 76797 14780 13300 870
27 29676 20591 68086 26432 46901 20849 89768 81536 86645 12659 92259 571
28 00742 57392 39064 66432 84673 40027 32832 61362 98947 96067 64760 645
29 05366 04213 25669 26422 44407 44048 37937 63904 45766 66134 75470 665
30 91921 26418 64117 94305 26766 25940 39972 22209 71500 64568 91402 424
31 00582 04711 87917 77341 42206 35126 74087 99547 81817 42607 43808 766
32 00725 69884 62797 56170 86324 88072 76222 36086 84637 93161 76038 658
33 69011 65795 95876 55293 18988 27354 26575 08625 40801 59920 29841 801
34 25976 57948 29888 88604 67917 48708 18912 82271 65424 69774 33611 542
35 09763 83473 73577 12908 30833 18317 28290 35797 05998 41688 34952 378
Resultados si el punto de partida es Fila 20:
Muestra Estadstico
1 0705 2/4
2 6976 4/4
3 2833 2/4
4 7870 2/4
5 9998 1/4
6 4269 3/4
7 8066 4/4
8 9176 1/4
9 9881 2/4
10 3602 3/4
11 5185 1/4
12 1461 2/4
13 0488 4/4
14 9161 1/4
15 9509 1/4
16 2562 3/4
17 5581 1/4
18 0448 4/4
19 6639 2/4
20 1245 2/4
21 8582 3/4
22 8143 2/4
23 4609 3/4
24 1723 1/4
25 0168 3/4
Muestra Estadstico
26 9022 3/4
27 9047 2/4
28 3459 1/4
29 1932 1/4
30 2178 2/4
31 3042 3/4
32 1616 2/4
33 6699 2/4
34 9043 2/4
35 2812 4/4
36 5416 2/4
37 4584 3/4
38 9222 3/4
39 4217 2/4
40 4103 2/4
41 4707 2/4
42 0253 2/4
43 0676 3/4
44 4682 4/4
45 6384 3/4
46 5815 1/4
47 1066 3/4
48 4621 3/4
49 5241 2/4
50 5227 2/4
Tabla:

Nmero de Proporcin Proporcin de


pares muestral Frecuencia todas las
muestras
0 0/4 = 0,00 0
1 1/4 = 0,25 10
2 2/4 = 0,50 20
3 3/4 = 0,75 14
4 4/4 = 1,00 6
Total

a) Cul fue la proporcin ms frecuente?

b) Dibuje la distribucin muestral


emprica. Qu forma tiene?

Cada vez que tomamos una muestra tenemos


una estimacin para el parmetro P .

Estas estimaciones varan entre muestras 


variacin muestral
Se puede demostrar que si tomamos una
m.a.s. de tamao n de una poblacin con
parmetro P , la desviacin estndar de p$

P(1 P)
p =
n
es:

que depende de la verdadera proporcin P y


del tamao muestral n .

Si el tamao muestral es n = 4 y la
proporcin en la poblacin es P = 0,5
entonces la desviacin estndar de p$ es:

P (1 P ) 0,5(1 0,5)
p = = = 0,25
n 4
Que pasa si aumentamos el tamao muestral?

Que pasa con P ? Cmo afecta el valor de


P en la desviacin estndar?
P P(1-P)
0,1 0,09
0,2 0,16
0,3 0,21
0,4 0,24
0,5 0,25
0,6 0,24
0,7 0,21
0,8 0,16
0,9 0,09

0.3
0.25
0.2
P(1-P)

0.15
0.1
0.05
0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
P
Sesgo y Precision
Cuando estimamos un parmetro de la
poblacin a partir de una estadstica
muestral, nos va a interesar que la
estimacin no tenga sesgo y sea precisa.
La figura ilustra la diferencia entre sesgo y
precisin.
Distribucin muestral de
una proporcin

Si P representa la proporcin de elementos


en una poblacin con cierta caracterstica de
inters, es decir, la proporcin de xitos,
donde xito corresponde a tener la
caracterstica.

Si sacamos muestras aleatorias simples de


tamao n de la poblacin donde la
proporcin de xitos es P , entonces la
distribucin muestral de la proporcin
muestral tiene las siguientes propiedades:

1. El promedio de todos los valores


posibles de p$ es igual al parmetro P . En
otras palabras, p$ es un estimador insesgado
de P .
=P
p
2. Error estndar de la proporcin
muestral: Es la desviacin estndar de las
posibles proporciones muestrales y mide
la dispersin de la proporcin muestral.

P(1 P)
p =
n

3. Si n es suficientemente grande, la
distribucin de la proporcin muestral es
aproximadamente Normal:

P (1 P )
p ~& N ( P, )
n
cuando nP 5 y n(1-P) 5
Sangre

En Chile el 5,3% de la poblacin tiene sangre factor


Rh(-). En una muestra aleatoria de 400 sujetos de esa
poblacin, se encuentra que un 8,8% tiene factor
Rh(-).

a) cul es el valor del parmetro?

b) cul es el valor de la estadstica?

c) Cul es la probabilidad de que en una nueva


muestra aleatoria de tamao 400 de esa
poblacin contenga al menos un 8,8% de
personas con sangre factor Rh(-)?

P( p 8,8) =

d) Suponga que se toma una muestra aleatoria


simple de tamao 10 de la misma poblacin.
Queremos calcular la probabilidad de que 8,8%
o ms tenga sangre factor Rh(-).
Distribucin muestral de la
media muestral

La distribucin muestral de la media


muestral es la distribucin de los valores de
las medias muestrales de todas las posibles
muestras del mismo tamao n tomadas de la
misma poblacin.
Considere una poblacin cuya variable
aleatoria X es discreta y con la siguiente
distribucin:

La media de la poblacin es =
Suponga que no conocemos la poblacin o el
valor de . Podemos tomar una m.a.s. de
tamao n=2 de esta poblacin.

Cul sera una muestra de tamao n=2 de esta


poblacin?

Cul sera la media muestral?

Es igual a la media de la poblacin?

Si tomamos otra muestra de tamao n=2,


obtendramos la misma media muestral?
Distribucin muestral de la media muestral

Si sacamos muestras aleatorias de tamao n de


una poblacin con media y desviacin
estndar , entonces la distribucin muestral de
la media muestral tiene las siguientes
propiedades:

1.El promedio de todos los valores posibles de


medias muestrales es igual al parmetro . En
otras palabras, la media muestral X es un
estimador insesgado de .
=
x
2. Error estndar de la media muestral: Es la
desviacin estndar de las posibles medias
muestrales.

=
x n
El error estndar disminuye si el tamao de la
muestra aumenta.
3.Si la poblacin original tiene distribucin
Normal, entonces para cualquier tamao
muestral n la distribucin de la media
muestral es tambin Normal:

Si X ~ N ( , ) x ~ N ( , )
n

4.Si la poblacin de origen no es Normal,


pero n es suficientemente grande la
distribucin de la media muestral es
aproximadamente Normal:

N ( , ) x ~& N ( , )
An si X no es: n
Nota:

- Un tamao de 30 es considerado suficiente.

- El resultado en (4) se conoce como el


Teorema del Lmite Central.
Suponga que X = peso de carga de
camionetas en kilos, tiene distribucin
normal con media = 300 k y varianza = 25.

Se toma una muestra aleatoria de 25


camionetas cargadas y se calcula la media
muestral.

Esquema de las distribuciones de la variable


aleatoria X y de la media muestral:

Distribution of X
N(300, 1 )

Distribution of X
N(300,25)

285 290 295 =30


300 305 310 315
Suponga que X = la edad de las madres
en los nacimientos en Chile el ao 1995,
tiene distribucin normal con media = 26,5
aos y desviacin estndar 6,3 aos.

a) Describa la distribucin de la edad de la


madre.

b) Cul es la probabilidad de que una


madre elegida al azar tenga ms de 30
aos?

c) Suponga que tomamos una muestra


aleatoria de n=25 madres cul es la
probabilidad de que la media muestral
sea mayor a 30?

d) porqu las respuestas en (b) y (c) son


distintas?

También podría gustarte