Está en la página 1de 46

MUESTREO

DISTRIBUCION MUESTRAL

10
Definiciones

Una población es el conjunto de individuos o elementos de


interés
Un censo es un intento de medir todos los elementos de
una población de interés
Una muestra es un subconjunto seleccionado de la
población

06/11/2020 2
Muestreo Aleatorio
El muestreo aleatorio es la base para inferencia estadística
acerca de una población basada en una muestra.
Ejemplo: Construir un restauran en un barrio?
Población: la reunión de ítems que quieren atención
(medir) N items.
Ejemplo: todas las personas en el barrio
Muestra: una parte pequeña de las unidades de la población
n items.
Ejemplo: 100 vecinos que acuerdan ser entrevistados.
Cuales 100?
Cómo se seleccionan?

06/11/2020 3
Muestra Representativa
Los mismos porcentajes en la muestra como en la población
Ejemplo: muestra es representativa si es que el mismo % se respeta :
trabajando, con jóvenes, edad, solteros, casados, etc …

Muestra Sesgada.
No es representativa de la población en una forma importante
Ejemplo: muestra es sesgada si hay muchos retirados

Marco: Acceso a la población (por número de 1 a N)


Ejemplo: de la guía :
1. José Pérez
2. María Rojas
… …
N. Carmen Leguía

06/11/2020 4
Muestreo sin reemplazo
Ninguna unidad debería aparecer más de una vez
Después que una unidad es seleccionada, esta es removida
de la población antes de seleccionar otra unidad
Muestreo con reemplazo
Una unidad puede ser representada más de una vez en la
muestra
Después que una unidad ha sido elegida, esta es devuelta a
la población antes que otra unidad sea seleccionada
Censo
Una muestra que representa a toda la población
Frecuentemente muy cara
Aún cuando sea razonable, puede que no sea costo-
eficiente
06/11/2020 5
Proceso de Muestreo
Aquí tenemos una buena (pero no perfecta) muestra
representativa.
Note que ningún triángulo abierto fue seleccionado.
Población
Muestra

06/11/2020 6
Estadísticos y Parámetros
Estadístico de la Muestra
Cualquier número calculado de la muestra. Una variable
aleatoria. Conocida
Ejemplo: Gasto promedio semanal en comida para una muestra
de 100 residentes. Aleatoria? Si! Debido a la aleatoriedad de la
selección de la muestra
Parámetro de la Población
Cualquier número calculado de la población completa
Un número fijo. Desconocido
Ejemplo: la media del gasto promedio en alimentos semanal para
todos los 77,386 residentes
Sabemos esto? NO!
Pero lo estimamos (con error)
06/11/2020 7
Estimador y Estimado
Estimador. Una muestra estadística usada para adivinar el
parámetro de la población
Ejemplo: Muestra promedio para los 100 residentes seleccionados es
un estimados de la media de la población de todos los 77,386
residentes
Estimado [EQUIVOCADO! Estimadores usualmente equivocados.
Usualmente útiles]
El número actual calculado de la data
Ejemplo: $33.91 es un estimado del gasto semanal por persona del
barrio
Error de la Estimación
Estimador menos el parámetro de la población. Desconocido
Ejemplo : 33.91 – 35.69 = –1.78
Media, todos 77,386
Promedio, 100 residentes residentes
(desconocido) Error estimación (desconocido)

06/11/2020 8
Terminología de Muestreo
Estimador No Sesgado
Correcto en Promedio. Sistemáticamente ni muy alto ni
muy bajo
Acierta en promedio aunque en cada vez pueda errar
Estudio Piloto
Estudio en pequeña magnitud antes del estudio completo
Pruebe su cuestionario en algún grupo de gente antes de
usarlo en cientos
Distribución de la Muestra
La distribución de probabilidad de un estadístico calculado
usando data de una muestra aleatoria

06/11/2020 9
Muestra Aleatoria

Una muestra aleatoria resulta cuando se seleccionan


n elementos de una población, de manera que todas
las combinaciones posibles de n elementos de la
población tienen igual probabilidad de salir elegidas

06/11/2020 10
Una muestra aleatoria provee los fundamentos para la
inferencia estadística y debe satisfacer :
1. Cada unidad de la población debe tener igual probabilidad
de ser seleccionada
Esto ayuda a asegurar representatividad, todas las
unidades de la población son igualmente exequibles
2. Unidades deben ser seleccionadas independientemente
unas de otras. Esto garantiza que cada ítem a ser escogido
brinda nueva e independiente información
Propiedades
Muestra es representativa de la población (en promedio)
La Inferencia Estadística va a usar la aleatoriedad de la
muestra
06/11/2020 11
Muestra Aleatoria 5 de 36

En un gramado de 6 por 6
5 cuadrados sombreados, seleccionados aleatoria mente,
uno a la vez. Sin reemplazo
Note que recuadros adyacentes pueden ser seleccionados
Si los excluimos entonces la selección no es independiente
Quizás Ud. Vea patrones sistemáticos
No están ahí por diseño, sino por coincidencia
Pero un patrón de tablero de damas es muy probable que
no sea aleatorio

06/11/2020 12
Selección de una
Muestra Aleatoria
Use una Tabla de Números Aleatorios

1. Establezca el marco (unidades de población de 1 a N)


2. Decida el punto de inicio en la tabla de números
aleatorios
3. Lea los dígitos aleatorios en grupos p.e., si N = 5,281,
entonces use grupos de 4 dígitos (N tiene 4 dígitos)
4. Incluya el número del grupo si es que éste es de 1 a N,
y no ha sido escogido aún.

06/11/2020 13
Tabla de Números Aleatorios
1 2 3 4 5 6 7 8 9 10
1 51449 39284 85527 67168 91284 19954 91166 70918 85957 19492
2 16144 56830 67507 97275 25982 69294 32841 20861 83114 12531
3 48145 48280 99481 13050 81818 25282 66466 24461 97021 21072
4 83780 48351 85422 42978 26088 17869 94245 26622 48318 73850
5 95329 38482 93510 39170 63683 40587 80451 43058 81923 97072
6 11179 69004 34273 36062 26234 58601 47159 82248 95968 99722
7 94631 52413 31524 02316 27611 15888 13525 43809 40014 30667

Por ejemplo 8
9
10
64275
72125
16463
10294
19232
42028
35027
10782
27927
25604
30615
48403
65695
42005
88963
36014
90419
79615
17988
32447
41218
02734
53688
43290
31732
36125
53618
29911
28456
68082

Comenzando en la fila 21, columna 3 11


12
13
10036
85356
84076
66273
51400
82087
69506
88502
55053
19610
98267
75370
01479
73943
71030
92338
25828
92275
55140
38219
55497
81097
13268
97123
73071
09016
40919
61544
77465
57479
14 76731 39755 78537 51937 11680 78820 50082 56068 36908 55399
Encontramos el 52794, siguiente 01466 15
16
19032
72791
73472
59040
79399
61529
05549
74437
14772
74482
32746
76619
38841
05232
45524
28616
13535
98690
03113
24011
17 11553 00135 28306 65571 34465 47423 39198 54456 95283 54637
18 71405 70352 46763 64002 62461 41982 15933 46942 36941 93412
19 17594 10116 55483 96219 85493 96955 89180 59690 82170 77643
20 09584 23476 09243 65568 89128 36747 63692 09986 47687 46448
21 81677 62634 52794 01466 85938 14565 79993 44956 82254 65223
22 45849 01177 13773 43523 69825 03222 58458 77463 58521 07273
23 97252 92257 90419 01241 52516 66293 14536 23870 78402 41759
24 26232 77422 76289 57587 42831 87047 20092 92676 12017 43554
25 87799 33602 01931 66913 63008 03745 93939 07178 70003 18158
19 17594 10116 55483 96219 85493 96955 26
27
46120
53292
62298
55652
69126
11834
07862
47581
76731
25682
58527
64085
39342
26587
42749
92289
57050
41853
91725
38354
28 81606 56009 06021 98392 40450 87721 50917 16978 39472 23505
20 09584 23476 09243 65568 89128 36747 29
30
67819
50458
47314
20350
96988
87362
89931
83996
49395
86422
37071
58694
72658
71813
53947
97695
11996
28804
64631
58523
21 81677 62634 52794 01466 85938 14565 31
32
59772
94752
27000
91056
97805
08939
25042
93410
09916
59204
77569
04644
71347
44336
62667
55570
09330
21106
02152
76588
33 01885 82054 45944 55398 55487 56455 56940 68787 36591 29914
22 45849 01177 13773 43523 69825 03222 34
35
85190
97747
91941
67607
86714
14549
76593
08215
77199
95408
39724
46381
99548
12449
13827
03672
84961
40325
76740
77312
36 43318 84469 26047 86003 34786 38931 34846 28711 42833 93019
23 97252 92257 90419 01241 52516 66293 37
38
47874
24259
71365
48079
76603
71198
57440
95859
49514
94212
17335
55402
71969
93392
58055
31965
99136
94622
73589
11673
24 26232 77422 76289 57587 42831 87047 39
40
31947
37911
64805
93224
34133
87153
03245
54541
24546
57529
48934
38299
41730
65659
47831
00202
26531
07054
02203
40168
41 82714 15799 93126 74180 94171 97117 31431 00323 62793 11995
42 82927 37884 74411 45887 36713 52339 68421 35968 67714 05883
43 65934 21782 35804 36676 35404 69987 52268 19894 81977 87764
44 56953 04356 68903 21369 35901 86797 83901 68681 02397 55359
45 16278 17165 67843 49349 90163 97337 35003 34915 91485 33814
46 96339 95028 48468 12279 81039 56531 10759 19579 00015 22829
47 84110 49661 13988 75909 35580 18426 29038 79111 56049 96451
48 49017 60748 03412 09880 94091 90052 43596 21424 16584 67970
49 43560 05552 54344 69418 01327 07771 25364 77373 34841 75927
50 25206 15177 63049 12464 16149 18759 96184 15968 89446 07168

06/11/2020 14
Ejemplo: Selección de la Muestra
Seleccionar una muestra aleatoria usando tabla # aleatoria
De un tamaño n = 4 para una población de tamaño N = 861,
comenzando en la fila 21, columna 3 de la Tabla
Comience con los dígitos aleatorios
52794 01466 85938 14565 79993 …
Agrupe por 3 (debido a que N = 861 tiene 3 dígitos )
527 940 146 685 938 145 657 …
Omita 000, y también 862, 863, …, 999
Omita duplicados, hasta n = 4 se obtiene en la muestra
527 146 685 145
La muestra aleatoria incluye las siguientes unidades de la
población (numeradas en el marco):
527, 146, 685, 145

06/11/2020 15
Seleccionando una Muestra Aleatoria
en Excel
Muestre la población en la (Hoja de cálculo)
Ordena la población en una columna por ítem de 1 a N
HERRAMIENTA – ANALISIS DE DATOS –
Cuadro de dialogo.
MUESTRA
ACEPTAR
Cuadro de dialogo
Rango de entrada B1:B10000
ALEATORIO
Numero de muestras 60
Rango de salida: E1:E60
ACEPTAR

06/11/2020 16
Proceso de Muestreo
La Población

Muestra Muestra Muestra … Muestra
n unid. n unid. n unid. n unid.

Estadístico Estadístico Estadístico Estadístico
(estimador) (estimador) (estimador)) … (estimador)

Un histograma de estos valores


imaginados representan la distribución
muestral de este estadístico

06/11/2020 17
Distribuciones Muestrales

10
Distribución Muestral de
Media

10
Distribución Muestral de 𝐗

Una distribución muestral incluye todos los valores


posibles que puede tomar un estadístico, como una media
muestral, para un tamaño de muestra dada.

𝐗 → 𝐍(𝛍𝐱 , 𝛔𝐱 )

µ 𝐗

06/11/2020 20
Error Standard de la Media 𝐬𝐱

El error standard de la media es la desviación standard


de la distribución muestral de las medias de las
muestras. 𝟐
𝛔𝟐 𝛔𝐗 𝐍 − 𝐧
𝐕 𝐱 = 𝛔𝟐𝐗 =
𝐗 𝐕 𝐱 = 𝛔𝟐𝐗 =
𝐧 𝐧 𝐍−𝟏

𝐒 𝟐 𝐒𝐗𝟐 𝐍 − 𝐧
𝐕 𝐱 = 𝐒𝐗𝟐 =
𝐗
𝐕 𝐱 = 𝐒𝐗𝟐 =
𝐧 𝐧 𝐍−𝟏
𝛔𝐗 𝛔𝟐𝐗 𝐍 − 𝐧
𝛔𝐗 = error standard σ𝐱 𝛔𝐗 =
𝐧 𝐧 𝐍−𝟏

𝐒𝐗 𝐒𝐗𝟐 𝐍 − 𝐧
𝐒𝐗 = error standard 𝐬𝐱 𝐒𝐗 =
𝐧 𝐧 𝐍−𝟏

06/11/2020 21
Error Standard de la Media 𝐬𝐱

Definición: la Desviación Standard Estimada (de la distribución de la


muestra) de un estadístico
S
Error Standard del promedio S X 
n
Indica aproximadamente que tan lejos el promedio de la muestra
está de la media de la población  X
Ventaja: puede ser calculada usando data simple

Desviación Standard del promedio X 
n
También Indica aproximadamente que tan lejos promedio X está de
la media de la población 
Problema: no se puede calcular sin los parámetros de la población

06/11/2020 22
Error de Muestreo e

El error de muestreo es la diferencia entre un


estadístico muestral y su parámetro poblacional
correspondiente

e=𝐱-µ
e=p-𝝅
e=t-𝝉
e=a-A
06/11/2020 23
Ejemplo distribución muestral de medias.

Se tiene una población de 5 ciudadanos . Sea X la edad


de los ciudadanos, las edades son:

Alumno X ( Edad )

A 27
B 39
C 30
D 36
E 42

a. Calcular los parámetros de la población. µ σ2

06/11/2020 24
a. Calcular los parámetros de la población. µ σ2

x f(x) xf(x) (x-E(x))2f(x)

27 0.2 5.4 12.168


39 0.2 7.8 3.528
30 0.2 6.0 4.608
36 0.2 7.2 0.288
42 0.2 8.4 10.368
34.8 30.960
µ = 34.8
σ2= 30.96

06/11/2020 25
b. Tomar muestra de tamaño n = 2, con reemplazo.

A B C D E
A 27 27 39 27 30 27 36 27 42 27
B 27 39 39 39 30 39 36 39 42 39
C 27 30 39 30 30 30 36 30 42 30
D 27 36 39 36 30 36 36 36 42 36
E 27 42 39 42 30 42 36 42 42 42

06/11/2020 26
c. Calcular las 25 medias 𝐗 de las 25 muestras.

A B C D E
A 27.0 33.0 28.5 31.5 34.5
B 33.0 39.0 34.5 37.5 40.5
C 28.5 34.5 30.0 33.0 36.0
D 31.5 37.5 33.0 36.0 39.0
E 34.5 40.5 36.0 39.0 42.0

06/11/2020 27
𝐗
d. Calcular la media de las 25 medias aritméticas.

f f(x) xf(x) (x-E(x))2f(x)


27.0 1 0.04 1.08 2.4336
X  34.8 28.5 2 0.08 2.28 3.1752
igual a 30.0 1 0.04 1.20 0.9216

  34.8 31.5 2 0.08 2.52 0.8712


33.0 4 0.16 5.28 0.5184
S  15.48
2
x 34.5 4 0.16 5.52 0.0144
igual a 36.0 3 0.12 4.32 0.1728
2 37.5 2 0.08 3.00 0.5832
S 
2
x  30.96
2  15.48 39.0 3 0.12 4.68 2.1168
n
40.5 2 0.08 3.24 2.5992
42.0 1 0.04 1.68 2.0736
25 34.8 15.480

06/11/2020 28
e. Tomar muestra de tamaño n = 2, sin reemplazo.

A B C D E
A
B 27 39
C 27 30 39 30
D 27 36 39 36 30 36
E 27 42 39 42 30 42 36 42

06/11/2020 29
f. Calcular las 10 medias aritméticas 𝐗 de las 10 muestras.

A B C D E
A
B 33.0
C 28.5 34.5
D 31.5 37.5 33.0
E 34.5 40.5 36.0 39.0

06/11/2020 30
g. Calcular la media aritmética de las 10 medias aritméticas.

𝐗 f f(x) xf(x) (x-E(x))2f(x)


28.5 1 0.1 2.85 3.969
31.5 1 0.1 3.15 1.089
X  34.8 𝐱 =34.8
33.0 2 0.2 6.6 0.648
igual a
34.5 2 0.2 6.9 0.018
μ  34.8
36.0 1 0.1 3.6 0.144
S 2x  11.61
37.5 1 0.1 3.75 0.729
igual a
39.0 1 0.1 3.9 1.764
σ2 N  n
S 2
 40.5 1 0.1 4.05 3.249
x
n N 1
5 1  11.61
30.96 5  2
2
10 34.8 11.610

06/11/2020 31
Teorema de Límite Central
El Teorema del Límite Central establece que si se
selecciona una muestra aleatoria suficientemente
grande, de n observaciones, de una población, la
distribución muestral de las muestras se
aproximará a una distribución normal. Cuanto
más grande sea el tamaño de la muestra n, mejor
será la aproximación normal a la distribución
muestral de las medias de las muestras.

06/11/2020 32
Propiedades de la distribución
muestral de las medias
1. La media de la distribución muestral es igual a la
media de la población:  x=  x media 𝛍𝐗 = 𝛍𝐗
2. La desviación standard de la distribución
muestral de las medias (error standard) es igual a
la desviación standard de la población dividida
entre la raíz cuadrada del tamaño de la muestra:
3. La distribución muestral de las medias es
aproximadamente normal para tamaños de
muestras grandes n >= 30

06/11/2020 33
Teorema de Límite Central
Ayuda a encontrar probabilidades para un X promedio de
n individuos independientes proporcionando
La Media 𝛍𝐗 = 𝛍𝐗 = 𝝁 𝛔𝐗
La Desviación Standard 𝐗 𝛔 =
𝐧
La justificación para usar tablas normales de probabilidad :
Si es que n es grande, entonces el promedio es
aproximadamente normal, aún si los individuos están
sesgados
Trabaja para totales proporcionando
La Media 𝛍𝐓 = n𝛍
La Desviación Standard 𝛔𝐓 = σX n
La justificación de usar tablas normales de probabilidad por
el total
06/11/2020 34
EJEMPLO
1. Individuos en una población 300

Altamente distribución no-normal
Media , desviación standard  0
0

5 10

2. Promedio de n = 3 individuos 200


X   / 3
No-normal, pero su media es igual  100

Menor desviación standard : 0


0 5 10

3. Promedio de n = 10 individuos
100
Cerca a la normal  X   / 10
Igual media 
Menor desviación standard 0
0 5 10

06/11/2020 35
Qué tan bueno para nosotros ?
X X   / n
Por qué molestarse con una muestra más grande para estimar ?
Aún muestreando sólo para n = 1 (o unas pocas) tenemos un
estimador no sesgado, que es en promedio, igual a 
Pero el error puede ser muy grande!
Cuando muestreamos para n = 100 o n = 1,000, lo que ganamos por
nuestro trabajo es un MENOR ERROR  X   / n , lo que
indica que nuestro estimador, está más cerca de media  desconocida
de la población
Nos indica cuanto la variabilidad del promedio del promedio de la
muestra está relacionada con la variabilidad de los individuos en la
población
Esto va a ser útil pronto cuando se defina el error standard

06/11/2020 36
𝐗 EJEMPLO:
Resuelto con Tabla de Dist.Norm.Estandar.
Las manzanas tienen un peso promedio de 7 onzas y una desviación
Standard 2 onzas. Estas son seleccionadas aleatoria mente y puestas en
cajas de 30. Encuentre la probabilidad que el promedio de peso de las
manzanas en la caja sea menos de 6.5 onzas.
Encuentre Prob( 𝐗 < 6.5) donde  = 7,  = 2, n = 30
Estandarice:  X    7
 X   / n  2 / 30  0.3651
Encuentre
 X   X 6.5  7   standard 
Prob    Prob  1.37 
 X 0.3651   normal 
Dibuje un diagrama, use la tabla normal

Respuesta es P( 𝐗 < 6.5) = 0.085 -3 -2 -1 0 1 2 3

–1.37

06/11/2020 37
EJEMPLO: Resuelto en Excel
𝛍𝐱 = 2
𝛔𝐱= 2
n = 30

𝐗 = 6.5
𝟐 6.5 7 𝐗
𝛔𝐗 = = 𝟎. 𝟑𝟔𝟓𝟏
𝟑𝟎

𝐏( 𝐗 < 6.5 ) = 0.0855

𝐏( 𝐗 < 6.5 ) = DISTR.NORM.N(6.5, 7, 0.3651, 1) = 0.0855

06/11/2020 38
Distribución Muestral de
Total 𝛕

10
Distribución Muestral de
Total 𝛕

T→ 𝐍(𝛍𝐓 , 𝛔𝐓 )

𝛍𝐓 = n𝛍𝐱 𝛔𝐓 = 𝛔 𝐱 𝐧

06/11/2020 40
EJEMPLO:
Las manzanas tienen un peso promedio de 7 onzas y una
desviación standard 2 onzas. Estas son seleccionadas
aleatoria mente y puestas en cajas de 30. Encuentre la
probabilidad que el promedio de peso de las manzanas en
la caja sea menos de:
a) La proporción de los totales muestrales cuyos valores se encuentra
superior a 215 onz.
b) La proporción de los totales muestrales con valores entre 212 y 216
onz.
c) Dentro de que limites caerá el 90% de los totales muestrales
alrededor del total poblacional

06/11/2020 41
a) Resuelto con Tabla Normal Estandar.
𝛍𝐓 = n𝛍𝐱 𝛔𝐓 = 𝛔 𝐱 𝐧

La probabilidad que el peso total de la caja exceda 215


onzas
Por el teorema de límite central, “peso total” es
aproximádamente normal con
total  n  30  7  210 total   n  2 30  10.95
Standarize: Prob total  total  215  210   Prob standard  0.46 
  10.95   normal 
Encuentre.  total  

Dibuje un diagrama, use la tabla normal

Respuesta. P(τ > 215) = P( Z > 0.46) = 0.32 -3 -2 -1 0 1 2 3

0.46

06/11/2020 42
EJEMPLO: Resuelto en Excel

𝛍𝐱 = 2 𝛍𝐓 = 30(7) = 210
𝛔𝐱= 2 𝛔𝐓 = 2 𝟑𝟎 = 10.9545
n = 30 n = 30

210 215 T

P( T > 215 ) = =1- DISTR.NORM(215,210,10.9545,1)


P( T > 215 ) = 0.3240

06/11/2020 43
b) P( 212 < A < 216 ) =

a μ t
P( 212 210
10.95  σt  216
10.95 ) 
 210

P(z1  Z  z 2 ) 
-3 -2 -1 0 1 2 3
P( 0.183 < Z < 0.548 ) = 0.13567

P( 212 < T < 216 ) = 0.13567

210 212 216

=DISTR.NORM.N(216,210,10.95,1)-DISTR.NORM.N(212,210,10.95,1)

06/11/2020 44
c) P( x1 < T < x2 ) = 0.90

x1 = 191.99
x1 =
DISTR.NORM.INV(0.05,210,10.95)

x2 = 228.01
x2 = 90%
DISTR.NORM.INV(0.95,210,10.95)

x1 210 x2
𝐱 𝟏 = INV.NORM(0.05, 210, 10.95) = 191.99
𝐱 𝟐 = INV.NORM(0.95, 210, 10.95) = 228.01

P( 191.99 < T < 228.01 ) = 0.90


06/11/2020 45
FIN

11/6/2020 46

También podría gustarte