Está en la página 1de 45

MUESTREO

DISTRIBUCION MUESTRAL

10
Definiciones

Una población es el conjunto de individuos o elementos de


interés
Un censo es un intento de medir todos los elementos de
una población de interés
Una muestra es un subconjunto seleccionado de la
población

24/01/2017 2
Muestreo Aleatorio
El muestreo aleatorio es la base para inferencia estadística
acerca de una población basada en una muestra.
Ejemplo: Construir un restauran en un barrio?
Población: la reunión de ítems que quieren atención
(medir) N items.
Ejemplo: todas las personas en el barrio
Muestra: una parte pequeña de las unidades de la población
n items.
Ejemplo: 100 vecinos que acuerdan ser entrevistados.
Cuales 100?
Cómo se seleccionan?

24/01/2017 3
Muestra Representativa
Los mismos porcentajes en la muestra como en la población
Ejemplo: muestra es representativa si es que el mismo % se respeta :
trabajando, con jóvenes, edad, solteros, casados, etc …

Muestra Sesgada.
No es representativa de la población en una forma importante
Ejemplo: muestra es sesgada si hay muchos retirados

Marco: Acceso a la población (por número de 1 a N)


Ejemplo: de la guía :
1. José Pérez
2. María Rojas
… …
N. Carmen Leguía

24/01/2017 4
Muestreo sin reemplazo
Ninguna unidad debería aparecer más de una vez
Después que una unidad es seleccionada, esta es removida
de la población antes de seleccionar otra unidad
Muestreo con reemplazo
Una unidad puede ser representada más de una vez en la
muestra
Después que una unidad ha sido elegida, esta es devuelta a
la población antes que otra unidad sea seleccionada
Censo
Una muestra que representa a toda la población
Frecuentemente muy cara
Aún cuando sea razonable, puede que no sea costo-
eficiente
24/01/2017 5
Proceso de Muestreo
Aquí tenemos una buena (pero no perfecta) muestra
representativa.
Note que ningún triángulo abierto fue seleccionado.
Población
Muestra

24/01/2017 6
Estadísticos y Parámetros
Estadístico de la Muestra
Cualquier número calculado de la muestra. Una variable
aleatoria. Conocida
Ejemplo: Gasto promedio semanal en comida para una muestra
de 100 residentes. Aleatoria? Si! Debido a la aleatoriedad de la
selección de la muestra
Parámetro de la Población
Cualquier número calculado de la población completa
Un número fijo. Desconocido
Ejemplo: la media del gasto promedio en alimentos semanal para
todos los 77,386 residentes
Sabemos esto? NO!
Pero lo estimamos (con error)
24/01/2017 7
Estimador y Estimado
Estimador. Una muestra estadística usada para adivinar el
parámetro de la población
Ejemplo: Muestra promedio para los 100 residentes seleccionados es
un estimados de la media de la población de todos los 77,386
residentes
Estimado [EQUIVOCADO! Estimadores usualmente equivocados.
Usualmente útiles]
El número actual calculado de la data
Ejemplo: $33.91 es un estimado del gasto semanal por persona del
barrio
Error de la Estimación
Estimador menos el parámetro de la población. Desconocido
Ejemplo : 33.91 – 35.69 = –1.78
Media, todos 77,386
Promedio, 100 residentes residentes
(desconocido) Error estimación (desconocido)

24/01/2017 8
Terminología de Muestreo
Estimador No Sesgado
Correcto en Promedio. Sistemáticamente ni muy alto ni
muy bajo
Acierta en promedio aunque en cada vez pueda errar
Estudio Piloto
Estudio en pequeña magnitud antes del estudio completo
Pruebe su cuestionario en algún grupo de gente antes de
usarlo en cientos
Distribución de la Muestra
La distribución de probabilidad de un estadístico calculado
usando data de una muestra aleatoria

24/01/2017 9
Muestra Aleatoria

Una muestra aleatoria resulta cuando se seleccionan


n elementos de una población, de manera que todas
las combinaciones posibles de n elementos de la
población tienen igual probabilidad de salir elegidas

24/01/2017 10
Una muestra aleatoria provee los fundamentos para la
inferencia estadística y debe satisfacer :
1. Cada unidad de la población debe tener igual probabilidad
de ser seleccionada
Esto ayuda a asegurar representatividad, todas las
unidades de la población son igualmente exequibles
2. Unidades deben ser seleccionadas independientemente
unas de otras. Esto garantiza que cada ítem a ser escogido
brinda nueva e independiente información
Propiedades
Muestra es representativa de la población (en promedio)
La Inferencia Estadística va a usar la aleatoriedad de la
muestra
24/01/2017 11
Muestra Aleatoria 5 de 36

En un gramado de 6 por 6
5 cuadrados sombreados, seleccionados aleatoria mente,
uno a la vez. Sin reemplazo
Note que recuadros adyacentes pueden ser seleccionados
Si los excluimos entonces la selección no es independiente
Quizás Ud. Vea patrones sistemáticos
No están ahí por diseño, sino por coincidencia
Pero un patrón de tablero de damas es muy probable que
no sea aleatorio

24/01/2017 12
Selección de una
Muestra Aleatoria
Use una Tabla de Números Aleatorios

1. Establezca el marco (unidades de población de 1 a N)


2. Decida el punto de inicio en la tabla de números
aleatorios
3. Lea los dígitos aleatorios en grupos p.e., si N = 5,281,
entonces use grupos de 4 dígitos (N tiene 4 dígitos)
4. Incluya el número del grupo si es que éste es de 1 a N,
y no ha sido escogido aún.

24/01/2017 13
Tabla de Números Aleatorios
1 2 3 4 5 6 7 8 9 10
1 51449 39284 85527 67168 91284 19954 91166 70918 85957 19492
2 16144 56830 67507 97275 25982 69294 32841 20861 83114 12531
3 48145 48280 99481 13050 81818 25282 66466 24461 97021 21072
4 83780 48351 85422 42978 26088 17869 94245 26622 48318 73850
5 95329 38482 93510 39170 63683 40587 80451 43058 81923 97072
6 11179 69004 34273 36062 26234 58601 47159 82248 95968 99722
7 94631 52413 31524 02316 27611 15888 13525 43809 40014 30667

Por ejemplo 8
9
10
64275
72125
16463
10294
19232
42028
35027
10782
27927
25604
30615
48403
65695
42005
88963
36014
90419
79615
17988
32447
41218
02734
53688
43290
31732
36125
53618
29911
28456
68082

Comenzando en la fila 21, columna 3 11


12
13
10036
85356
84076
66273
51400
82087
69506
88502
55053
19610
98267
75370
01479
73943
71030
92338
25828
92275
55140
38219
55497
81097
13268
97123
73071
09016
40919
61544
77465
57479
14 76731 39755 78537 51937 11680 78820 50082 56068 36908 55399
Encontramos el 52794, siguiente 01466 15
16
19032
72791
73472
59040
79399
61529
05549
74437
14772
74482
32746
76619
38841
05232
45524
28616
13535
98690
03113
24011
17 11553 00135 28306 65571 34465 47423 39198 54456 95283 54637
18 71405 70352 46763 64002 62461 41982 15933 46942 36941 93412
19 17594 10116 55483 96219 85493 96955 89180 59690 82170 77643
20 09584 23476 09243 65568 89128 36747 63692 09986 47687 46448
21 81677 62634 52794 01466 85938 14565 79993 44956 82254 65223
22 45849 01177 13773 43523 69825 03222 58458 77463 58521 07273
23 97252 92257 90419 01241 52516 66293 14536 23870 78402 41759
24 26232 77422 76289 57587 42831 87047 20092 92676 12017 43554
25 87799 33602 01931 66913 63008 03745 93939 07178 70003 18158
19 17594 10116 55483 96219 85493 96955 26
27
46120
53292
62298
55652
69126
11834
07862
47581
76731
25682
58527
64085
39342
26587
42749
92289
57050
41853
91725
38354

20 09584 23476 09243 65568 89128 36747 28


29
30
81606
67819
50458
56009
47314
20350
06021
96988
87362
98392
89931
83996
40450
49395
86422
87721
37071
58694
50917
72658
71813
16978
53947
97695
39472
11996
28804
23505
64631
58523
21 81677 62634 52794 01466 85938 14565 31
32
59772
94752
27000
91056
97805
08939
25042
93410
09916
59204
77569
04644
71347
44336
62667
55570
09330
21106
02152
76588
33 01885 82054 45944 55398 55487 56455 56940 68787 36591 29914
22 45849 01177 13773 43523 69825 03222 34
35
85190
97747
91941
67607
86714
14549
76593
08215
77199
95408
39724
46381
99548
12449
13827
03672
84961
40325
76740
77312

23 97252 92257 90419 01241 52516 66293 36


37
38
43318
47874
24259
84469
71365
48079
26047
76603
71198
86003
57440
95859
34786
49514
94212
38931
17335
55402
34846
71969
93392
28711
58055
31965
42833
99136
94622
93019
73589
11673
24 26232 77422 76289 57587 42831 87047 39
40
31947
37911
64805
93224
34133
87153
03245
54541
24546
57529
48934
38299
41730
65659
47831
00202
26531
07054
02203
40168
41 82714 15799 93126 74180 94171 97117 31431 00323 62793 11995
42 82927 37884 74411 45887 36713 52339 68421 35968 67714 05883
43 65934 21782 35804 36676 35404 69987 52268 19894 81977 87764
44 56953 04356 68903 21369 35901 86797 83901 68681 02397 55359
45 16278 17165 67843 49349 90163 97337 35003 34915 91485 33814
46 96339 95028 48468 12279 81039 56531 10759 19579 00015 22829
47 84110 49661 13988 75909 35580 18426 29038 79111 56049 96451
48 49017 60748 03412 09880 94091 90052 43596 21424 16584 67970
49 43560 05552 54344 69418 01327 07771 25364 77373 34841 75927
50 25206 15177 63049 12464 16149 18759 96184 15968 89446 07168

24/01/2017 14
Ejemplo: Selección de la Muestra
Seleccionar una muestra aleatoria usando tabla # aleatoria
De un tamaño n = 4 para una población de tamaño N = 861,
comenzando en la fila 21, columna 3 de la Tabla
Comience con los dígitos aleatorios
52794 01466 85938 14565 79993 …
Agrupe por 3 (debido a que N = 861 tiene 3 dígitos )
527 940 146 685 938 145 657 …
Omita 000, y también 862, 863, …, 999
Omita duplicados, hasta n = 4 se obtiene en la muestra
527 146 685 145
La muestra aleatoria incluye las siguientes unidades de la
población (numeradas en el marco):
527, 146, 685, 145

24/01/2017 15
Seleccionando una Muestra Aleatoria
en Excel
Muestre la población en la (Hoja de cálculo)
Ordena la población en una columna por ítem de 1 a N
HERRAMIENTA – ANALISIS DE DATOS –
Cuadro de dialogo.
MUESTRA
ACEPTAR
Cuadro de dialogo
Rango de entrada B1:B10000
ALEATORIO
Numero de muestras 60
Rango de salida: E1:E60
ACEPTAR

24/01/2017 16
Proceso de Muestreo
La Población

Muestra Muestra Muestra … Muestra
n unid. n unid. n unid. n unid.

Estadístico Estadístico Estadístico Estadístico
(estimador) (estimador) (estimador)) … (estimador)

Un histograma de estos valores


imaginados representan la distribución
muestral de este estadístico

24/01/2017 17
Distribuciones Muestrales

10
Distribución Muestral de
Media

10
Distribución Muestral de 𝐗

Una distribución muestral incluye todos los valores


posibles que puede tomar un estadístico, como una media
muestral, para un tamaño de muestra dada.

𝐗 → 𝐍(𝛍𝐱 , 𝛔𝐱 )

µ 𝐗

24/01/2017 20
Error Standard de la Media 𝐬𝐱

El error standard de la media es la desviación standard


de la distribución muestral de las medias de las
muestras. 𝟐
𝛔 𝟐 𝛔𝐗 𝐍 − 𝐧
𝐕 𝐱 = 𝛔𝟐𝐗 =
𝐗 𝐕 𝐱 = 𝛔𝟐𝐗 =
𝐧 𝐧 𝐍−𝟏

𝐒 𝟐 𝐒𝐗𝟐 𝐍 − 𝐧
𝐕 𝐱 = 𝐒𝐗𝟐 =
𝐗
𝐕 𝐱 = 𝐒𝐗𝟐 =
𝐧 𝐧 𝐍−𝟏
𝛔𝐗 𝛔𝟐𝐗 𝐍 − 𝐧
𝛔𝐗 = error standard σ𝐱 𝛔𝐗 =
𝐧 𝐧 𝐍−𝟏

𝐒𝐗 𝐒𝐗𝟐 𝐍 − 𝐧
𝐒𝐗 = error standard 𝐬𝐱 𝐒𝐗 =
𝐧 𝐧 𝐍−𝟏

24/01/2017 21
Error Standard de la Media 𝐬𝐱

Definición: la Desviación Standard Estimada (de la distribución de la


muestra) de un estadístico
S
Error Standard del promedio S X 
n
Indica aproximadamente que tan lejos el promedio de la muestra
está de la media de la población  X
Ventaja: puede ser calculada usando data simple

Desviación Standard del promedio X 
n
También Indica aproximadamente que tan lejos promedio X está de
la media de la población 
Problema: no se puede calcular sin los parámetros de la población

24/01/2017 22
Error de Muestreo e

El error de muestreo es la diferencia entre un


estadístico muestral y su parámetro poblacional
correspondiente

e=𝐱-µ
e=p-𝝅
e=t-𝝉
e=a -A
24/01/2017 23
Ejemplo distribución muestral de medias.

Se tiene una población de 5 ciudadanos . Sea X la edad


de los ciudadanos, las edades son:

Alumno X ( Edad )

A 27
B 39
C 30
D 36
E 42

a. Calcular los parámetros de la población. µ σ2

24/01/2017 24
a. Calcular los parámetros de la población. µ σ2

x f(x) xf(x) (x-E(x))2f(x)

27 0.2 5.4 12.168


39 0.2 7.8 3.528
30 0.2 6.0 4.608
36 0.2 7.2 0.288
42 0.2 8.4 10.368
34.8 30.960
µ = 34.8
σ2= 30.96

24/01/2017 25
b. Tomar muestra de tamaño n = 2, con reemplazo.

A B C D E
A 27 27 39 27 30 27 36 27 42 27
B 27 39 39 39 30 39 36 39 42 39
C 27 30 39 30 30 30 36 30 42 30
D 27 36 39 36 30 36 36 36 42 36
E 27 42 39 42 30 42 36 42 42 42

24/01/2017 26
c. Calcular las 25 medias 𝐗 de las 25 muestras.

A B C D E
A 27.0 33.0 28.5 31.5 34.5
B 33.0 39.0 34.5 37.5 40.5
C 28.5 34.5 30.0 33.0 36.0
D 31.5 37.5 33.0 36.0 39.0
E 34.5 40.5 36.0 39.0 42.0

24/01/2017 27
𝐗
d. Calcular la media de las 25 medias aritméticas.

f f(x) xf(x) (x-E(x))2f(x)


27.0 1 0.04 1.08 2.4336
X  34.8 28.5 2 0.08 2.28 3.1752
igual a 30.0 1 0.04 1.20 0.9216

  34.8 31.5 2 0.08 2.52 0.8712


33.0 4 0.16 5.28 0.5184
S  15.48
2
x 34.5 4 0.16 5.52 0.0144
igual a 36.0 3 0.12 4.32 0.1728
2 37.5 2 0.08 3.00 0.5832
S 
2
x  30.96
2  15.48 39.0 3 0.12 4.68 2.1168
n
40.5 2 0.08 3.24 2.5992
42.0 1 0.04 1.68 2.0736
25 34.8 15.480

24/01/2017 28
e. Tomar muestra de tamaño n = 2, sin reemplazo.

A B C D E
A
B 27 39
C 27 30 39 30
D 27 36 39 36 30 36
E 27 42 39 42 30 42 36 42

24/01/2017 29
f. Calcular las 10 medias aritméticas 𝐗 de las 10 muestras.

A B C D E
A
B 33.0
C 28.5 34.5
D 31.5 37.5 33.0
E 34.5 40.5 36.0 39.0

24/01/2017 30
g. Calcular la media aritmética de las 10 medias aritméticas.

𝐗 f f(x) xf(x) (x-E(x))2f(x)


28.5 1 0.1 2.85 3.969
31.5 1 0.1 3.15 1.089
X  34.8 𝐱 =34.8
33.0 2 0.2 6.6 0.648
igual a
34.5 2 0.2 6.9 0.018
μ  34.8
36.0 1 0.1 3.6 0.144
S 2x  11.61
37.5 1 0.1 3.75 0.729
igual a
39.0 1 0.1 3.9 1.764
σ2 N  n
S 2
 40.5 1 0.1 4.05 3.249
x
n N 1
5 1  11.61
30.96 5  2
2
10 34.8 11.610

24/01/2017 31
Teorema de Límite Central
El Teorema del Límite Central establece que si se
selecciona una muestra aleatoria suficientemente
grande, de n observaciones, de una población, la
distribución muestral de las muestras se
aproximará a una distribución normal. Cuanto
más grande sea el tamaño de la muestra n, mejor
será la aproximación normal a la distribución
muestral de las medias de las muestras.

24/01/2017 32
Propiedades de la distribución
muestral de las medias
1. La media de la distribución muestral es igual a la
media de la población:  x=  x media 𝛍𝐗 = 𝛍𝐗
2. La desviación standard de la distribución
muestral de las medias (error standard) es igual a
la desviación standard de la población dividida
entre la raíz cuadrada del tamaño de la muestra:
3. La distribución muestral de las medias es
aproximadamente normal para tamaños de
muestras grandes n >= 30

24/01/2017 33
Teorema de Límite Central
Ayuda a encontrar probabilidades para un X promedio de
n individuos independientes proporcionando
La Media 𝛍𝐗 = 𝛍𝐗 = 𝝁 𝛔𝐗
La Desviación Standard 𝐗 𝛔 =
𝐧
La justificación para usar tablas normales de probabilidad :
Si es que n es grande, entonces el promedio es
aproximadamente normal, aún si los individuos están
sesgados
Trabaja para totales proporcionando
La Media 𝛍𝐓 = n𝛍
La Desviación Standard 𝛔 𝐓 = σX n
La justificación de usar tablas normales de probabilidad por
el total
24/01/2017 34
EJEMPLO
1. Individuos en una población 300

Altamente distribución no-normal
Media , desviación standard  0
0 5 10

2. Promedio de n = 3 individuos 200
X   / 3
No-normal, pero su media es igual  100

Menor desviación standard : 0


0 5 10

3. Promedio de n = 10 individuos
100
Cerca a la normal  X   / 10
Igual media 
Menor desviación standard 0
0 5 10

24/01/2017 35
Qué tan bueno para nosotros ?
X X   / n
Por qué molestarse con una muestra más grande para estimar ?
Aún muestreando sólo para n = 1 (o unas pocas) tenemos un
estimador no sesgado, que es en promedio, igual a 
Pero el error puede ser muy grande!
Cuando muestreamos para n = 100 o n = 1,000, lo que ganamos por
nuestro trabajo es un MENOR ERROR  X   / n , lo que
indica que nuestro estimador, está más cerca de media  desconocida
de la población
Nos indica cuanto la variabilidad del promedio del promedio de la
muestra está relacionada con la variabilidad de los individuos en la
población
Esto va a ser útil pronto cuando se defina el error standard

24/01/2017 36
𝐗 EJEMPLO:
Resuelto con Tabla de Dist.Norm.Estandar.
Las manzanas tienen un peso promedio de 7 onzas y una desviación
Standard 2 onzas. Estas son seleccionadas aleatoria mente y puestas en
cajas de 30. Encuentre la probabilidad que el promedio de peso de las
manzanas en la caja sea menos de 6.5 onzas.
Encuentre Prob( 𝐗 < 6.5) donde  = 7,  = 2, n = 30
Estandarice:  X    7
 X   / n  2 / 30  0.3651
Encuentre
 X   X 6.5  7   standard 
Prob    Prob  1.37 
 X 0.3651   normal 
Dibuje un diagrama, use la tabla normal

Respuesta es P( 𝐗 < 6.5) = 0.085 -3 -2 -1 0 1 2 3

–1.37

24/01/2017 37
EJEMPLO: Resuelto en Excel
𝛍𝐱= 2
𝛔𝐱= 2
n = 30

𝐗 = 6.5
𝟐 6.5 7 𝐗
𝛔𝐗 = = 𝟎. 𝟑𝟔𝟓𝟏
𝟑𝟎

𝐏( 𝐗 < 6.5 ) = 0.0855

𝐏( 𝐗 < 6.5 ) = DISTR.NORM.N(6.5, 7, 0.3651, 1) = 0.0855

24/01/2017 38
Distribución Muestral de
Total 𝛕

10
Distribución Muestral de
Total 𝛕

T→ 𝐍(𝛍𝐓 , 𝛔𝐓 )

𝛍𝐓 = n𝛍𝐱 𝛔𝐓 = 𝛔 𝐱 𝐧

24/01/2017 40
EJEMPLO:
Las manzanas tienen un peso promedio de 7 onzas y una
desviación standard 2 onzas. Estas son seleccionadas
aleatoria mente y puestas en cajas de 30. Encuentre la
probabilidad que el promedio de peso de las manzanas en
la caja sea menos de:
a) La proporción de los totales muestrales cuyos valores se encuentra
superior a 215 onz.
b) La proporción de los totales muestrales con valores entre 212 y 216
onz.
c) Dentro de que limites caerá el 90% de los totales muestrales
alrededor del total poblacional

24/01/2017 41
a) Resuelto con Tabla Normal Estandar.
𝛍𝐓 = n𝛍𝐱 𝛔𝐓 = 𝛔 𝐱 𝐧

La probabilidad que el peso total de la caja exceda 215


onzas
Por el teorema de límite central, “peso total” es
aproximádamente normal con
total  n  30  7  210 total   n  2 30  10.95
Standarize: Prob total  total  215  210   Prob standard  0.46 
  10.95   normal 
Encuentre.  total  

Dibuje un diagrama, use la tabla normal

Respuesta. P(τ > 215) = P( Z > 0.46) = 0.32 -3 -2 -1 0 1 2 3

0.46

24/01/2017 42
EJEMPLO: Resuelto en Excel

𝛍𝐱= 2 𝛍𝐓 = 30(7) = 210


𝛔𝐱= 2 𝛔𝐓 = 2 𝟑𝟎 = 10.9545
n = 30 n = 30

210 215 T

P( T > 215 ) = =1- DISTR.NORM(215,210,10.9545,1)


P( T > 215 ) = 0.3240

24/01/2017 43
b) P( 212 < A < 216 ) =

a μ t
P( 212 210
10.95  σt  216
10.95 ) 
 210

P(z1  Z  z 2 ) 
-3 -2 -1 0 1 2 3
P( 0.183 < Z < 0.548 ) = 0.13567

P( 212 < T < 216 ) = 0.13567

210 212 216

=DISTR.NORM.N(216,210,10.95,1)-DISTR.NORM.N(212,210,10.95,1)

24/01/2017 44
c) P( x1 < T < x2 ) = 0.90

x1 = 191.99
x1 =
DISTR.NORM.INV(0.05,210,10.95)
x2 = 228.01
x2 = 90%
DISTR.NORM.INV(0.95,210,10.95)

x1 210 x2
𝐱 𝟏 = INV.NORM(0.05, 210, 10.95) = 191.99
𝐱 𝟐 = INV.NORM(0.95, 210, 10.95) = 228.01

P( 191.99 < T < 228.01 ) = 0.90


24/01/2017 45

También podría gustarte