Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DISTRIBUCION MUESTRAL
10
Definiciones
06/11/2020 2
Muestreo Aleatorio
El muestreo aleatorio es la base para inferencia estadística
acerca de una población basada en una muestra.
Ejemplo: Construir un restauran en un barrio?
Población: la reunión de ítems que quieren atención
(medir) N items.
Ejemplo: todas las personas en el barrio
Muestra: una parte pequeña de las unidades de la población
n items.
Ejemplo: 100 vecinos que acuerdan ser entrevistados.
Cuales 100?
Cómo se seleccionan?
06/11/2020 3
Muestra Representativa
Los mismos porcentajes en la muestra como en la población
Ejemplo: muestra es representativa si es que el mismo % se respeta :
trabajando, con jóvenes, edad, solteros, casados, etc …
Muestra Sesgada.
No es representativa de la población en una forma importante
Ejemplo: muestra es sesgada si hay muchos retirados
06/11/2020 4
Muestreo sin reemplazo
Ninguna unidad debería aparecer más de una vez
Después que una unidad es seleccionada, esta es removida
de la población antes de seleccionar otra unidad
Muestreo con reemplazo
Una unidad puede ser representada más de una vez en la
muestra
Después que una unidad ha sido elegida, esta es devuelta a
la población antes que otra unidad sea seleccionada
Censo
Una muestra que representa a toda la población
Frecuentemente muy cara
Aún cuando sea razonable, puede que no sea costo-
eficiente
06/11/2020 5
Proceso de Muestreo
Aquí tenemos una buena (pero no perfecta) muestra
representativa.
Note que ningún triángulo abierto fue seleccionado.
Población
Muestra
06/11/2020 6
Estadísticos y Parámetros
Estadístico de la Muestra
Cualquier número calculado de la muestra. Una variable
aleatoria. Conocida
Ejemplo: Gasto promedio semanal en comida para una muestra
de 100 residentes. Aleatoria? Si! Debido a la aleatoriedad de la
selección de la muestra
Parámetro de la Población
Cualquier número calculado de la población completa
Un número fijo. Desconocido
Ejemplo: la media del gasto promedio en alimentos semanal para
todos los 77,386 residentes
Sabemos esto? NO!
Pero lo estimamos (con error)
06/11/2020 7
Estimador y Estimado
Estimador. Una muestra estadística usada para adivinar el
parámetro de la población
Ejemplo: Muestra promedio para los 100 residentes seleccionados es
un estimados de la media de la población de todos los 77,386
residentes
Estimado [EQUIVOCADO! Estimadores usualmente equivocados.
Usualmente útiles]
El número actual calculado de la data
Ejemplo: $33.91 es un estimado del gasto semanal por persona del
barrio
Error de la Estimación
Estimador menos el parámetro de la población. Desconocido
Ejemplo : 33.91 – 35.69 = –1.78
Media, todos 77,386
Promedio, 100 residentes residentes
(desconocido) Error estimación (desconocido)
06/11/2020 8
Terminología de Muestreo
Estimador No Sesgado
Correcto en Promedio. Sistemáticamente ni muy alto ni
muy bajo
Acierta en promedio aunque en cada vez pueda errar
Estudio Piloto
Estudio en pequeña magnitud antes del estudio completo
Pruebe su cuestionario en algún grupo de gente antes de
usarlo en cientos
Distribución de la Muestra
La distribución de probabilidad de un estadístico calculado
usando data de una muestra aleatoria
06/11/2020 9
Muestra Aleatoria
06/11/2020 10
Una muestra aleatoria provee los fundamentos para la
inferencia estadística y debe satisfacer :
1. Cada unidad de la población debe tener igual probabilidad
de ser seleccionada
Esto ayuda a asegurar representatividad, todas las
unidades de la población son igualmente exequibles
2. Unidades deben ser seleccionadas independientemente
unas de otras. Esto garantiza que cada ítem a ser escogido
brinda nueva e independiente información
Propiedades
Muestra es representativa de la población (en promedio)
La Inferencia Estadística va a usar la aleatoriedad de la
muestra
06/11/2020 11
Muestra Aleatoria 5 de 36
En un gramado de 6 por 6
5 cuadrados sombreados, seleccionados aleatoria mente,
uno a la vez. Sin reemplazo
Note que recuadros adyacentes pueden ser seleccionados
Si los excluimos entonces la selección no es independiente
Quizás Ud. Vea patrones sistemáticos
No están ahí por diseño, sino por coincidencia
Pero un patrón de tablero de damas es muy probable que
no sea aleatorio
06/11/2020 12
Selección de una
Muestra Aleatoria
Use una Tabla de Números Aleatorios
06/11/2020 13
Tabla de Números Aleatorios
1 2 3 4 5 6 7 8 9 10
1 51449 39284 85527 67168 91284 19954 91166 70918 85957 19492
2 16144 56830 67507 97275 25982 69294 32841 20861 83114 12531
3 48145 48280 99481 13050 81818 25282 66466 24461 97021 21072
4 83780 48351 85422 42978 26088 17869 94245 26622 48318 73850
5 95329 38482 93510 39170 63683 40587 80451 43058 81923 97072
6 11179 69004 34273 36062 26234 58601 47159 82248 95968 99722
7 94631 52413 31524 02316 27611 15888 13525 43809 40014 30667
Por ejemplo 8
9
10
64275
72125
16463
10294
19232
42028
35027
10782
27927
25604
30615
48403
65695
42005
88963
36014
90419
79615
17988
32447
41218
02734
53688
43290
31732
36125
53618
29911
28456
68082
06/11/2020 14
Ejemplo: Selección de la Muestra
Seleccionar una muestra aleatoria usando tabla # aleatoria
De un tamaño n = 4 para una población de tamaño N = 861,
comenzando en la fila 21, columna 3 de la Tabla
Comience con los dígitos aleatorios
52794 01466 85938 14565 79993 …
Agrupe por 3 (debido a que N = 861 tiene 3 dígitos )
527 940 146 685 938 145 657 …
Omita 000, y también 862, 863, …, 999
Omita duplicados, hasta n = 4 se obtiene en la muestra
527 146 685 145
La muestra aleatoria incluye las siguientes unidades de la
población (numeradas en el marco):
527, 146, 685, 145
06/11/2020 15
Seleccionando una Muestra Aleatoria
en Excel
Muestre la población en la (Hoja de cálculo)
Ordena la población en una columna por ítem de 1 a N
HERRAMIENTA – ANALISIS DE DATOS –
Cuadro de dialogo.
MUESTRA
ACEPTAR
Cuadro de dialogo
Rango de entrada B1:B10000
ALEATORIO
Numero de muestras 60
Rango de salida: E1:E60
ACEPTAR
06/11/2020 16
Proceso de Muestreo
La Población
…
Muestra Muestra Muestra … Muestra
n unid. n unid. n unid. n unid.
…
Estadístico Estadístico Estadístico Estadístico
(estimador) (estimador) (estimador)) … (estimador)
06/11/2020 17
Distribuciones Muestrales
10
Distribución Muestral de
Media
10
Distribución Muestral de 𝐗
𝐗 → 𝐍(𝛍𝐱 , 𝛔𝐱 )
µ 𝐗
06/11/2020 20
Error Standard de la Media 𝐬𝐱
𝐒 𝟐 𝐒𝐗𝟐 𝐍 − 𝐧
𝐕 𝐱 = 𝐒𝐗𝟐 =
𝐗
𝐕 𝐱 = 𝐒𝐗𝟐 =
𝐧 𝐧 𝐍−𝟏
𝛔𝐗 𝛔𝟐𝐗 𝐍 − 𝐧
𝛔𝐗 = error standard σ𝐱 𝛔𝐗 =
𝐧 𝐧 𝐍−𝟏
𝐒𝐗 𝐒𝐗𝟐 𝐍 − 𝐧
𝐒𝐗 = error standard 𝐬𝐱 𝐒𝐗 =
𝐧 𝐧 𝐍−𝟏
06/11/2020 21
Error Standard de la Media 𝐬𝐱
06/11/2020 22
Error de Muestreo e
e=𝐱-µ
e=p-𝝅
e=t-𝝉
e=a-A
06/11/2020 23
Ejemplo distribución muestral de medias.
Alumno X ( Edad )
A 27
B 39
C 30
D 36
E 42
06/11/2020 24
a. Calcular los parámetros de la población. µ σ2
06/11/2020 25
b. Tomar muestra de tamaño n = 2, con reemplazo.
A B C D E
A 27 27 39 27 30 27 36 27 42 27
B 27 39 39 39 30 39 36 39 42 39
C 27 30 39 30 30 30 36 30 42 30
D 27 36 39 36 30 36 36 36 42 36
E 27 42 39 42 30 42 36 42 42 42
06/11/2020 26
c. Calcular las 25 medias 𝐗 de las 25 muestras.
A B C D E
A 27.0 33.0 28.5 31.5 34.5
B 33.0 39.0 34.5 37.5 40.5
C 28.5 34.5 30.0 33.0 36.0
D 31.5 37.5 33.0 36.0 39.0
E 34.5 40.5 36.0 39.0 42.0
06/11/2020 27
𝐗
d. Calcular la media de las 25 medias aritméticas.
06/11/2020 28
e. Tomar muestra de tamaño n = 2, sin reemplazo.
A B C D E
A
B 27 39
C 27 30 39 30
D 27 36 39 36 30 36
E 27 42 39 42 30 42 36 42
06/11/2020 29
f. Calcular las 10 medias aritméticas 𝐗 de las 10 muestras.
A B C D E
A
B 33.0
C 28.5 34.5
D 31.5 37.5 33.0
E 34.5 40.5 36.0 39.0
06/11/2020 30
g. Calcular la media aritmética de las 10 medias aritméticas.
06/11/2020 31
Teorema de Límite Central
El Teorema del Límite Central establece que si se
selecciona una muestra aleatoria suficientemente
grande, de n observaciones, de una población, la
distribución muestral de las muestras se
aproximará a una distribución normal. Cuanto
más grande sea el tamaño de la muestra n, mejor
será la aproximación normal a la distribución
muestral de las medias de las muestras.
06/11/2020 32
Propiedades de la distribución
muestral de las medias
1. La media de la distribución muestral es igual a la
media de la población: x= x media 𝛍𝐗 = 𝛍𝐗
2. La desviación standard de la distribución
muestral de las medias (error standard) es igual a
la desviación standard de la población dividida
entre la raíz cuadrada del tamaño de la muestra:
3. La distribución muestral de las medias es
aproximadamente normal para tamaños de
muestras grandes n >= 30
06/11/2020 33
Teorema de Límite Central
Ayuda a encontrar probabilidades para un X promedio de
n individuos independientes proporcionando
La Media 𝛍𝐗 = 𝛍𝐗 = 𝝁 𝛔𝐗
La Desviación Standard 𝐗 𝛔 =
𝐧
La justificación para usar tablas normales de probabilidad :
Si es que n es grande, entonces el promedio es
aproximadamente normal, aún si los individuos están
sesgados
Trabaja para totales proporcionando
La Media 𝛍𝐓 = n𝛍
La Desviación Standard 𝛔𝐓 = σX n
La justificación de usar tablas normales de probabilidad por
el total
06/11/2020 34
EJEMPLO
1. Individuos en una población 300
Altamente distribución no-normal
Media , desviación standard 0
0
5 10
06/11/2020 36
𝐗 EJEMPLO:
Resuelto con Tabla de Dist.Norm.Estandar.
Las manzanas tienen un peso promedio de 7 onzas y una desviación
Standard 2 onzas. Estas son seleccionadas aleatoria mente y puestas en
cajas de 30. Encuentre la probabilidad que el promedio de peso de las
manzanas en la caja sea menos de 6.5 onzas.
Encuentre Prob( 𝐗 < 6.5) donde = 7, = 2, n = 30
Estandarice: X 7
X / n 2 / 30 0.3651
Encuentre
X X 6.5 7 standard
Prob Prob 1.37
X 0.3651 normal
Dibuje un diagrama, use la tabla normal
–1.37
06/11/2020 37
EJEMPLO: Resuelto en Excel
𝛍𝐱 = 2
𝛔𝐱= 2
n = 30
𝐗 = 6.5
𝟐 6.5 7 𝐗
𝛔𝐗 = = 𝟎. 𝟑𝟔𝟓𝟏
𝟑𝟎
06/11/2020 38
Distribución Muestral de
Total 𝛕
10
Distribución Muestral de
Total 𝛕
T→ 𝐍(𝛍𝐓 , 𝛔𝐓 )
𝛍𝐓 = n𝛍𝐱 𝛔𝐓 = 𝛔 𝐱 𝐧
06/11/2020 40
EJEMPLO:
Las manzanas tienen un peso promedio de 7 onzas y una
desviación standard 2 onzas. Estas son seleccionadas
aleatoria mente y puestas en cajas de 30. Encuentre la
probabilidad que el promedio de peso de las manzanas en
la caja sea menos de:
a) La proporción de los totales muestrales cuyos valores se encuentra
superior a 215 onz.
b) La proporción de los totales muestrales con valores entre 212 y 216
onz.
c) Dentro de que limites caerá el 90% de los totales muestrales
alrededor del total poblacional
06/11/2020 41
a) Resuelto con Tabla Normal Estandar.
𝛍𝐓 = n𝛍𝐱 𝛔𝐓 = 𝛔 𝐱 𝐧
0.46
06/11/2020 42
EJEMPLO: Resuelto en Excel
𝛍𝐱 = 2 𝛍𝐓 = 30(7) = 210
𝛔𝐱= 2 𝛔𝐓 = 2 𝟑𝟎 = 10.9545
n = 30 n = 30
210 215 T
06/11/2020 43
b) P( 212 < A < 216 ) =
a μ t
P( 212 210
10.95 σt 216
10.95 )
210
P(z1 Z z 2 )
-3 -2 -1 0 1 2 3
P( 0.183 < Z < 0.548 ) = 0.13567
=DISTR.NORM.N(216,210,10.95,1)-DISTR.NORM.N(212,210,10.95,1)
06/11/2020 44
c) P( x1 < T < x2 ) = 0.90
x1 = 191.99
x1 =
DISTR.NORM.INV(0.05,210,10.95)
x2 = 228.01
x2 = 90%
DISTR.NORM.INV(0.95,210,10.95)
x1 210 x2
𝐱 𝟏 = INV.NORM(0.05, 210, 10.95) = 191.99
𝐱 𝟐 = INV.NORM(0.95, 210, 10.95) = 228.01
11/6/2020 46