Está en la página 1de 31

Captulo 7: Distribuciones muestrales

Recordemos:

Parmetro es una medida de resumen


numrica que se calculara usando todas
las unidades de la poblacin.
Es un nmero fijo.
Generalmente no lo conocemos.
Estadstica es una medida de resumen
numrica que se calcula de las unidades
de la muestra.
El valor de la estadstica se conoce
cuando tomamos una muestra,
pero varia de muestra en muestra 
variacin muestral

Inferencia estadstica: es el proceso de


sacar conclusiones de la poblacin
basados en la informacin de una muestra
de esa poblacin.

Objetivos de la inferencia:
 estimacin de parmetros,
 intervalos de confianza y
 docimasia, test de hiptesis o pruebas
de significacin estadstica.

Distribuciones muestrales
Una estadstica muestral proveniente de
una muestra aleatoria simple tiene un
patrn de comportamiento (predecible) en
repetidas muestras. Este patrn es
llamado la distribucin muestral de la
estadstica.
Si conocemos la distribucin muestral
podemos hacer inferencia.
Las distribuciones muestrales adoptan
diferentes formas segn las estadsticas
investigadas y las caractersticas de la
poblacin estudiada.

7.1 Distribucin muestral


de una
proporcin muestral
La distribucin muestral de la
proporcin muestral es la distribucin
de los valores de las proporciones
muestrales de todas las posibles muestras
del mismo tamao n tomadas de la
misma poblacin.

Suponga que estamos interesados


en conocer la proporcin de mujeres en
Chile. Nuestro parmetro de inters
es:

nmero de mujeres en Chile


P=
nmero de habitantes en Chile
La poblacin es demasiado grande. Hacer un
censo sera demasiado caro. Decidimos
estimar el verdadero parmetro a partir de
una muestra.
La proporcin muestral sera:

nmero de mujeres en la muestra


p =
tamao de la muestra

Supongamos que sabemos que P = 0,5 Qu


pasa si tomamos una muestra tamao n = 20 ?
Muestra #1:
HMHHHMMMHHHMHMMHHMHM

Proporcin de mujeres p$ =9/20=0,45


Muestra #2:
MMHMHMMHHHHMHHMMMHMM

Proporcin de mujeres p$ =11/20=0,55


Muestra #3:
HHMMMHHMHMHMHMMHHMMH

Proporcin de mujeres p$ =10/20=0,50

En la prctica el investigador toma una


muestra. El conocimiento de la
distribucin muestral nos servir de base
terica para hacer inferencia estadstica.

Para conocer la distribucin muestral de


una estadstica deberamos considerar
todas las posibles muestras de un tamao
n, de una poblacin.

En la prctica, podemos simular la


distribucin muestral aproximada o
emprica, de la siguiente manera:
1. Seleccione
"muchas"
muestras
aleatorias de mismo tamao de una
poblacin.
2. En cada muestra calcule el estadstico
muestral
3. Determine la distribucin muestral
aproximada

Recuerden que al analizar


distribucin nos interesa:

una

1. Forma (simtrica o sesgada)


2. Posicin central - la media de una
distribucin muestral nos dice si el
estadstico es un "buen" (insesgado)
estimador del parmetro o es sesgado.
3. Dispersin - nos da una idea del error
de muestreo.

cul es la proporcin de nmeros


pares de la tabla de nmeros aleatorios?
Usando tabla de nmeros aleatorios.
Asumamos que el 50% de la poblacin es
par, es decir P = 0,5
Vamos a tomar 50 muestras de tamao
n = 4 de esta poblacin.
Seleccionamos un punto de partida y
elegimos 4 nmeros.

Supongamos que el punto de partida es Fila


20:
columna
fila
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35

1-5

6-10

10480
22368
24130
42167
37570
77921
99562
96301
89579
85475
28918
63553
09429
10365
07119
51085
02368
01011
52162
07056
48663
54164
32639
29334
02488
81525
29676
00742
05366
91921
00582
00725
69011
25976
09763

15011
46573
48360
93093
39975
06907
72905
91977
14342
36857
69578
40961
93969
61129
97336
12765
21382
54092
53916
97628
91245
58492
32363
37001
33062
72295
20591
57392
04213
26418
04711
69884
65795
57948
83473

11-15
01536
25595
22527
06243
81837
11008
56420
05463
63661
53342
88231
48235
52636
87529
71048
51821
52404
33362
46369
33787
85828
22421
05597
87637
28834
04839
68086
39064
25669
64117
87917
62797
95876
29888
73577

16-20
02011
85393
97265
61680
16656
42751
69994
07972
10228
53988
33276
03427
92737
85689
08178
51259
60268
94904
58586
09998
14346
74103
24200
87308
07351
96423
26432
66432
26422
94305
77341
56170
55293
88604
12908

21-25
81647
30995
76393
07856
06121
27756
98872
18876
17453
53060
70997
49626
88974
48237
77233
77452
89368
31273
23216
42698
09172
47070
13363
58731
19731
24878
46901
84673
44407
26766
42206
86324
18988
67917
30833

26-30
91646
89198
64809
16376
91782
53498
31016
20922
18103
59533
79936
69445
33488
52267
13916
16308
19885
04146
14513
06691
30168
25306
38005
00256
92420
82651
20849
40027
44048
25940
35126
88072
27354
48708
18317

31-35
69179
37982
15179
39440
60468
18602
71194
94595
57740
38867
56865
18663
36320
67689
47564
60756
55322
18594
83149
76988
90229
76468
94342
45834
60952
66566
89768
32832
37937
39972
74087
76222
26575
18912
28290

36-40
14194
53402
24830
53537
81305
70659
18738
56869
84378
62300
05859
72695
17617
93394
81056
92144
44819
29852
98736
13602
04734
26384
28728
15398
61280
14778
81536
61362
63904
22209
99547
36086
08625
82271
35797

41-45
62590
93965
49340
71341
49684
90665
44013
69014
25331
08158
90106
52180
30015
01511
97735
49442
01188
71585
23495
51851
59193
58151
35806
46557
50001
76797
86645
98947
45766
71500
81817
84637
40801
65424
05998

46-50
36207
34095
32081
57004
60672
15053
48840
60045
12566
17983
31595
20847
08272
26358
85977
53900
65255
85030
64350
46104
22178
06646
06912
41135
67658
14780
12659
96067
66134
64568
42607
93161
59920
69774
41688

51-55
20969
52666
30680
00849
14110
21916
63213
18425
58678
16439
01547
12234
84115
85104
29372
70960
64835
51132
94738
88916
30421
21524
17012
10367
32586
13300
92259
64760
75470
91402
43808
76038
29841
33611
34952

56-6

995
191
196
749
069
818
210
849
449
114
855
905
271
202
744
639
449
019
177
195
616
152
641
076
866
870
571
645
665
424
766
658
801
542
378

Resultados si el punto de partida es Fila 20:


Muestra Estadstico
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

0705
6976
2833
7870
9998
4269
8066
9176
9881
3602
5185
1461
0488
9161
9509
2562
5581
0448
6639
1245
8582
8143
4609
1723
0168

2/4
4/4
2/4
2/4
1/4
3/4
4/4
1/4
2/4
3/4
1/4
2/4
4/4
1/4
1/4
3/4
1/4
4/4
2/4
2/4
3/4
2/4
3/4
1/4
3/4

Muestra Estadstico
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50

9022
9047
3459
1932
2178
3042
1616
6699
9043
2812
5416
4584
9222
4217
4103
4707
0253
0676
4682
6384
5815
1066
4621
5241
5227

3/4
2/4
1/4
1/4
2/4
3/4
2/4
2/4
2/4
4/4
2/4
3/4
3/4
2/4
2/4
2/4
2/4
3/4
4/4
3/4
1/4
3/4
3/4
2/4
2/4

Tabla:
Nmero de
pares

Proporcin
muestral

Frecuencia

0
1
2
3
4
Total

0/4 = 0,00
1/4 = 0,25
2/4 = 0,50
3/4 = 0,75
4/4 = 1,00

0
10
20
14
6

Proporcin de
todas las
muestras

a) Cul fue la proporcin ms frecuente?


b) Dibuje la distribucin
emprica. Qu forma tiene?

muestral

Cada vez que tomamos una muestra tenemos


una estimacin para el parmetro P .
Estas estimaciones varan entre muestras 
variacin muestral

Se puede demostrar que si tomamos una


m.a.s. de tamao n de una poblacin con
parmetro P , la desviacin estndar de p$

p =

P(1 P)
n

es:
que depende de la verdadera proporcin
del tamao muestral n .

Si el tamao muestral es n = 4 y la
proporcin en la poblacin es P = 0,5
entonces la desviacin estndar de p$ es:

p =

P (1 P )
0,5(1 0,5)
=
= 0,25
n
4

Que pasa si aumentamos el tamao muestral?


Que pasa con P ? Cmo afecta el valor de
P en la desviacin estndar?

P(1-P)

P P(1-P)
0,1 0,09
0,2 0,16
0,3 0,21
0,4 0,24
0,5 0,25
0,6 0,24
0,7 0,21
0,8 0,16
0,9 0,09

0.3
0.25
0.2
0.15
0.1
0.05
0
0

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9


P

Sesgo y Precision
Cuando estimamos un parmetro de la
poblacin a partir de una estadstica
muestral, nos va a interesar que la
estimacin no tenga sesgo y sea precisa.

La figura ilustra la diferencia entre sesgo y


precisin.

Distribucin muestral de
una proporcin

Si P representa la proporcin de elementos


en una poblacin con cierta caracterstica de
inters, es decir, la proporcin de xitos,
donde xito corresponde a tener la
caracterstica.
Si sacamos muestras aleatorias simples de
tamao n de la poblacin donde la
proporcin de xitos es P , entonces la
distribucin muestral de la proporcin
muestral tiene las siguientes propiedades:
1. El promedio de todos los valores
posibles de p$ es igual al parmetro P . En
otras palabras, p$ es un estimador insesgado
de P .
=P
p

2. Error estndar de la proporcin


muestral: Es la desviacin estndar de las
posibles proporciones muestrales y mide
la dispersin de la proporcin muestral.

p =

P(1 P)
n

3. Si n es suficientemente grande, la
distribucin de la proporcin muestral es
aproximadamente Normal:

P (1 P )
)
p ~& N ( P,
n
cuando nP 5 y n(1-P) 5

Sangre
En Chile el 5,3% de la poblacin tiene sangre factor
Rh(-). En una muestra aleatoria de 400 sujetos de esa
poblacin, se encuentra que un 8,8% tiene factor
Rh(-).
a) cul es el valor del parmetro?
b) cul es el valor de la estadstica?
c) Cul es la probabilidad de que en una nueva
muestra aleatoria de
tamao 400 de esa
poblacin contenga al menos un 8,8% de
personas con sangre factor Rh(-)?

P( p 8,8) =
d) Suponga que se toma una muestra aleatoria
simple de tamao 10 de la misma poblacin.
Queremos calcular la probabilidad de que 8,8%
o ms tenga sangre factor Rh(-).

Distribucin muestral de la
media muestral

La distribucin muestral de la media


muestral es la distribucin de los valores de
las medias muestrales de todas las posibles
muestras del mismo tamao n tomadas de la
misma poblacin.

Considere una poblacin cuya variable


aleatoria X es discreta y con la siguiente
distribucin:

La media de la poblacin es =
Suponga que no conocemos la poblacin o el
valor de . Podemos tomar una m.a.s. de
tamao n=2 de esta poblacin.
Cul sera una muestra de tamao n=2 de esta
poblacin?
Cul sera la media muestral?
Es igual a la media de la poblacin?
Si tomamos otra muestra de tamao n=2,
obtendramos la misma media muestral?

Distribucin muestral de la media muestral


Si sacamos muestras aleatorias de tamao n de
una poblacin con media y desviacin
estndar , entonces la distribucin muestral de
la media muestral tiene las siguientes
propiedades:
1.El promedio de todos los valores posibles de
medias muestrales es igual al parmetro . En
otras palabras, la media muestral X es un
estimador insesgado de .

=
x

2. Error estndar de la media muestral: Es la


desviacin estndar de las posibles medias
muestrales.

=
x

El error estndar disminuye si el tamao de la


muestra aumenta.

3.Si la poblacin original tiene distribucin


Normal, entonces para cualquier tamao
muestral n la distribucin de la media
muestral es tambin Normal:
Si X ~ N ( , ) x ~ N ( ,

4.Si la poblacin de origen no es Normal,


pero n es suficientemente grande la
distribucin de la media muestral es
aproximadamente Normal:
N ( , ) x ~& N ( ,
An si X no es:

Nota:

- Un tamao de 30 es considerado suficiente.


- El resultado en (4) se conoce como el
Teorema del Lmite Central.

Suponga que X = peso de carga de


camionetas en kilos, tiene distribucin
normal con media = 300 k y varianza = 25.
Se toma una muestra aleatoria de 25
camionetas cargadas y se calcula la media
muestral.
Esquema de las distribuciones de la variable
aleatoria X y de la media muestral:
Distribution of X
N(300, 1 )

Distribution of X
N(300,25)

285

290

295

=30
300

305

310

315

Suponga que X = la edad de las madres


en los nacimientos en Chile el ao 1995,
tiene distribucin normal con media = 26,5
aos y desviacin estndar 6,3 aos.
a) Describa la distribucin de la edad de la
madre.
b) Cul es la probabilidad de que una
madre elegida al azar tenga ms de 30
aos?
c) Suponga que tomamos una muestra
aleatoria de n=25 madres cul es la
probabilidad de que la media muestral
sea mayor a 30?
d) porqu las respuestas en (b) y (c) son
distintas?

También podría gustarte