Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DISTRIBUCIONES DE MUESTREO
2009 - Ing. José Manuel García
I calidadtotal@hotmail.com
Pantigozo
Objetivos de aprendizaje
Explicar porque en muchas situaciones una muestra es la
única forma posible para tener conocimiento de una
población.
Explicar los diversos métodos para seleccionar una muestra
Diferenciar entre muestreo probabilístico y no
probabilístico.
Definir y elaborar una distribución de muestreo de medias
muestrales.
Explicar el “teorema de limite central y su importancia en
la inferencia estadística.
Calcular los intervalos de confianza para medias y
proporciones.
Determinar que tan grande debe ser una muestra para
medias y proporciones.
Distribuciones muestrales
• En estudios pasados centramos nuestra atención en
técnicas que describen los datos, tales como
organizar datos en distribuciones de frecuencias y
calcular diferentes promedios y medidas de
variabilidad. Estábamos concentrados en describir
algo que ya ocurrió.
• También comenzamos a establecer los fundamentos
de la estadística inferencial, con el estudio de los
conceptos básicos de la probabilidad, las
distribuciones de probabilidad discretas y continuas.
Distribuciones que son principalmente generadas para
evaluar algo que podría ocurrir. Ahora veremos otro
tipo de distribución de probabilidad, que se llaman
distribuciones muestrales.
¿Por qué muestrear?
• Muestrear es una forma de evaluar la calidad de un
producto, la opinión de los consumidores, la eficacia
de un medicamento o de un tratamiento. Muestra es
una parte de la población. Población es el total de
resultados de un experimento. Hacer una conclusión
sobre el grupo entero (población) basados en
información estadística obtenida de un pequeño grupo
(muestra) es hacer una inferencia estadística.
• A menudo no es factible estudiar la población entera.
Algunas de las razones por lo que es necesario
muestrear son:
¿Por qué muestrear?
(continuación)
Muestra Probabilística
Muestra que se selecciona
de modo que cada
integrante de la población
en estudio tengan una
probabilidad conocida (no
igual a cero) de ser incluido
en la muestra.
MÉTODOS DE MUESTREO
PROBABILISTICO
Métodos de Muestreo
Muestra Aleatoria. Es una muestra seleccionada de
tal forma que cada integrante de una población que
está siendo estudiada tiene la misma probabilidad de
ser incluida en la muestra
A 30% o más 8 2 1
B 20 – 30% 35 10 5
C 10 – 20% 189 54 27
D 0 – 10% 115 33 16
E Con pérdida 5 1 1
Total 352 100 50
Muestreo Aleatorio Estratificado
• En un muestreo estratificado no proporcional, el
número de elementos estudiado en cada estrato es
desproporcionado con respecto a su número en la
población. Por ejemplo, si un muestreo no
proporcional fuese utilizado en el caso anterior, se
deberán pesar los resultados de cada estrato
multiplicándose por .02 en el estrato 1, por .10 en el
estrato 2, por .54 en el tres, etc.
• El muestro estratificado tiene la ventaja de reflejar
con más exactitud las características de la población.
Muestreo por Conglomerados
• Este método de muestro es empleado para reducir el
costo de muestrear una población cuando está
dispersa sobre una gran área geográfica. El
muestreo por bloque consiste en dividir el área
geográfica en sectores, seleccionar una muestra
aleatoria de esos sectores, y finalmente obtener una
muestra aleatoria de cada uno de los sectores
seleccionados.
Error de muestreo
• Si seleccionamos una muestra por el método de
muestreo aleatorio simple, por muestreo sistemático,
por muestreo estratificado, por muestreo por bloques
o por una combinación de estos métodos, es poco
probable que la media de la muestra sea idéntica a la
media de la población de donde fue obtenida. De la
misma forma, es probable que la desviación estándar
de la muestra no sea exactamente igual al valor
correspondiente de la población. Por lo tanto
podemos esperar alguna diferencia entre un
estadístico muestral y el correspondiente parámetro
poblacional. Esta diferencia es llamada error de
muestreo.
Error de muestreo
Error de muestreo es la diferencia entre un estadístico
muestral y su correspondiente parámetro poblacional
x = ΣX = 1000 = 25 arreglos
n 40
Ejemplo 01: (sigue)
• La variancia muestral s2 y la desviacion estandar
muestral ,s se utilizan para estimar la variancia
poblacional σ2 y la desviacion estandar
poblacional , σ s Se realizará un estudio sobre la
potencia de arranque en frío de baterías o
acumuladores de 12 voltios para estimar el numero
de veces que un motor con desplazamiento de 440
plg3 arrancara antes de que falle la batería. Una
muestra de 40 dispositivos seleccionados al azar dió
los siguientes números de arranque:
Variancia de la muestra:
s =
2 Σ(xi – x) 2
n-1
Variancia de la muestra:
s= Σ(xi – x)2
n-1
En donde X representa el valor de una elemento
seleccionado para la muestra, X es la media de la
muestra , y n es el numero en la muestra.
De igual manera, la proporción de la población que está a favor
de medidas mas estrictas para la protección ambiental puede
estimarse utilizando una proporción muestral. Si p es la
proporción poblacional desconocida y p es la proporción
muestral, la estimación puntual para la proporción de la
población es:
Número de éxitos de la muestran
p= Número muestrado
X
p= n
Ejemplo: De 2000 personas muestreadas, 1600 están a favor
de medidas mas estrictas de protección ambiental. ¿Cuál es la
proporción poblacional estimada?
Solucion:
23 60 79 32 57 74 52 70 82 36
80 77 81 95 41 65 92 85 55 76
52 10 64 75 78 25 80 98 81 67
41 71 83 54 64 72 88 62 74 43
60 78 89 76 84 48 84 90 15 79
34 67 17 82 69 74 63 80 85 61
Estimación por Intervalo
a) Haga un intervalo de confianza del 95% para
estimar la media poblacional
b) Haga un intervalo de confianza del 99% para
estimar la media poblacional
c) Compare los anteriores resultados
Solución del inciso (a)
Haga un intervalo de confianza del 95% para
estimar la media poblacional
1.- El nivel de confianza ya está establecido como
95%, se simboliza de la siguiente forma:
1 – α = 0.95
Estimación por Intervalo
2.- Cuando se trata de estimar la media poblacional la
variable aleatoria estándar es el valor Z de la
distribución normal, siempre y cuando la muestra sea
grande (n > 30). Como 1 – α es la probabilidad de que
la media poblacional se encuentre dentro del intervalo
(centro de la curva), α es la probabilidad de que no se
encuentre en el intervalo (extremos de la curva), y
cada extremo de la curva o cola corresponde a α/2.
En la tabla de la distribución normal se busca el valor
Z que corresponde al área de α/2 de la siguiente
manera:
Estimación por Intervalo
Estimación por Intervalo
1 – α = .95
α = 1 - .95 = .05
α/2 = .025
Se busca en la tabla nornal:
0.005 0.005
Z = -2.58 Z = 2.58
Estimación por Intervalo
1 – α = .99
α = 1 - .99 = .01
α/2 = .005
Se busca en la tabla nornal:
σ
σ =
x n
En donde:
s
s =
x n
Elaboración de los intervalos de confianza de
95% y 99% (n≥ 30)
INTERVALO DE S
CONFIANZA DE 95% = X ± 1.96
n
INTERVALO DE
S
CONFIANZA DE 99% = X ± 2.58
n
Intervalo de confianza para una
proporción de la población
INTERVALO DE p (1 - p )
CONFIANZA DE 95% = p ± 1.96
n
p (1 - p )
INTERVALO DE
= p ± 2.58
CONFIANZA DE 99%
n
Estimación por Intervalo con
muestras pequeñas (n ≤ 30)
• Para poder utilizar la distribución normal es necesario
que las muestras sean grandes (n > 30) y conocer σ.
Si no se conoce σ se utiliza S, pero si además la
muestra es chica los resultados no serán
satisfactorios. En estos casos se utiliza la
distribución t de student.
Estimación por Intervalo -
Características de t de Student
4 10 7 8 7 5 3 7 12 4 6 8 4 7 7 7 6 8 4 6
6 8 8 8 6 6 9 10 5 8 2 6 7 2 6 9 5 6 6 8
7 7 13 8 4 5 4 5 5 7
GRUPO B
HOMBRES MUJERES
2 0 3 6 9 10 9 6 5 10 8 5 4 9 7 8 8 10 6 7
8 9 5 5 8 6 10 8 5 4 6 6 5 9 4 9 3 7 5 8
9 1 11 5 3 7 8 15 8 6 7 4
Problemas
GRUPO C
HOMBRES MUJERES
8 2 6 1 5 8 9 2 7 6 6 3 11 6 7 7 1 9 6 4
4 7 10 8 5 2 7 7 6 6 6 8 6 8 4 9 2 8 1 6
7 4 9 2 8 11 2
GRUPO D
HOMBRES MUJERES
8 0 7 7 8 7 6 11 4 8 0 2 11 7 8 4 4 5 5 4
12 7 5 9 6 5 5 8 9 3 5 8 8 9 5 10 7 9 9 7
10 9 4 7 10 7
GRUPO E
HOMBRES MUJERES
4 8 11 9 4 7 8 9 8 9 2 14 1 8 6 2 7 5 9 4
4 6 4 8 6 6 5 4 7 7 9 8 7 5 6 5 8 5 9 6
7 4 7 4 7 5 6 6 8 8 8 7 6 2 6 6 7
Problemas
a) Obtenga una muestra de tamaño 15 por muestreo aleatorio
simple y haga una estimación de la media poblacional con una
confianza de 99%
b) Obtenga una muestra de tamaño 40 por muestreo aleatorio
sistemático y haga una estimación de la proporción poblacional
de estudiantes que tuvieron menos de 5 errores, con un nivel
de confianza de 93%
c) Obtenga una muestra de 50 estudiantes por muestreo aleatorio
estratificado y haga una estimación de la media poblacional
con nivel de confianza de 90%
d) ¿Cuál método de muestreo es el más apropiado para este
caso?
e) ¿De que tamaño debería ser la muestra si queremos que el
error máximo de estimación sea igual a 1?
Problemas
4.- Cierto banco encuentra que el uso de cajeros automáticos
reduce el costo de las transacciones bancarias de rutina. Este
banco instaló un cajero automático en las instalaciones de Fun
Toy Company. Este cajero es para uso exclusivo de los 500
empleados de Fun Toy Company. Después de algunos meses
de operación, se realizó un estudio sobre el uso del cajero y se
encontró lo siguiente:
NÚMERO DE VECES QUE USÓ EL CAJERO EL ÚLTIMO MES
4 2 2 3 3 3 2 1 3 5 2 3 3 1 4 1 3 4 2 2
1 4 5 1 3 3 4 2 4 3 2 1 3 3 2 3 2 1 4 5
2 2 1 3 3 3 4 2 1 3 2 1 2 2 1 3 2 2 2 1
0 2 2 0 2 1 3 1 2 1 3 2 5 2 1 3 1 0 2 2
1 4 2 3 2 1 2 2 2 4 2 2 4 1 1 1 2 1 4 2
4 2 5 2 3 1 2 4 2 1 4 1 3 1 3 1 1 4 2 5
2 3 3 1 4 3 1 2 0 4 1 1 2 2 2 1 1 2 3 3
2 3 2 3 4 2 3 3 4 3 1 2 0 3 1 3 1 2 3 2
4 3 4 1 3 4 2 2 4 2 2 1 2 2 3 3 2 4 3 4
2 2 2 2 3 2 2 3 2 2 2 0 3 2 1 2 1 2 2 2
1 4 2 3 0 3 2 1 1 2 2 3 1 2 2 5 1 1 4 2
2 2 2 3 2 3 3 2 4 1 1 2 2 2 2 3 1 2 2 2
5 0 1 2 3 1 0 2 2 1 2 3 1 2 3 0 3 5 0 1
4 2 3 0 3 0 2 1 2 2 1 2 2 4 3 2 2 4 2 3
2 2 2 4 0 2 0 2 2 4 2 3 3 1 2 0 3 2 2 2
2 3 2 2 1 3 2 1 3 2 2 3 2 1 2 2 3 2 3 2
2 0 2 2 2 2 3 3 2 3 2 2 2 2 1 2 1 2 0 2
3 1 3 3 2 2 3 2 4 1 2 3 2 2 4 3 3 3 1 3
4 2 2 1 3 2 1 1 2 4 1 3 0 3 2 2 2 4 2 2
3 3 4 1 1 2 1 1 3 2 3 4 2 1 3 3 1 3 3 4
2 2 3 3 3 3 2 3 3 2 3 3 2 2 3 3 3 2 2 3
3 3 1 1 2 0 1 0 3 4 2 2 2 2 1 2 1 3 3 1
2 3 2 2 1 3 0 2 3 2 3 1 2 2 2 2 2 2 3 2
2 2 2 2 3 2 1 1 0 3 4 3 0 2 2 3 1 2 2 2
0 2 2 2 3 1 2 0 2 2 3 2 3 5 1 1 2 0 2 2
Problemas
a) ¿Cuál es el método de muestro más apropiado para este
caso?
b) Obtenga una muestra aleatoria de 40 empleados de Fun Toy
Company y haga un intervalo de confianza del 98% para
estimar la media poblacional de las veces que usó el cajero en
el mes.
c) Obtenga una muestra de 25 empleados de Fun Toy Company y
estime la proporción poblacional de empleados que no
utilizaron el cajero en el mes con un intervalo de confianza de
96%
d) ¿De que tamaño deberá ser la muestra si el error máximo de
estimación es igual a 1?
Problemas
5.- Las estaturas en centímetros de una muestra aleatoria de 50
estudiantes universitarios son las siguientes:
179 168 163 175 173 175 176 180 175 172
168 181 173 162 174 168 178 165 175 181
180 160 166 178 175 163 163 160 181 180
168 175 171 178 182 188 171 184 170 177
175 169 185 171 168 173 177 169 181 164
X ±z s
n
( N - n
N - 1 )
Selección del Tamaño de la Muestra
• Para determinar el tamaño de la muestra,
necesitamos tomar en cuenta tres factores:
• Grado de Confianza: Probabilidad de que la
estimación efectuada se ajuste a la realidad. Cualquier
información que queremos recoger está distribuida
según una ley de probabilidad (Gauss o Student), así
llamamos nivel de confianza a la probabilidad de que
el intervalo construido en torno a un estadístico capte
el verdadero valor del parámetro. Es una convención
que se utilice un nivel de confianza del 95% (z=1.96),
o bien del 99% (z=2.58). Mientras más alto sea el nivel
de confianza, mayor será el tamaño de la muestra.
Selección del Tamaño de la Muestra
σx = E = 200 = 102.04
z 1.96
• El tamaño de la muestra se calcula despejando el
valor de n en la formula:
sx = s
n
Selección del Tamaño de la Muestra
• Donde:
sx es el error estándar de la muestra
s es la desviación estándar muestral
n es el tamaño de la muestra
Hasta ahora:
sx = s
n
Error total permisible Desviacion estandar de la muestra
Z desviaciones estandares Tamaño de la muestra
Selección del Tamaño de la Muestra
• Donde:
Si E representa el error total permisible.
E s
=
z n
200 s
=
1.96 n
s
102.04 =
n
Selección del Tamaño de la Muestra
• Variación de la Población: Si la población tiene una
dispersión amplia, se requiere una muestra grande. Por
otra parte si la población está concentrada (es
homogénea), el tamaño requerido de la muestra será
pequeño.
• Cuando no se conoce la desviación estándar de la
población es necesario hacer una estimación de ella.
Algunos métodos para hacer esta estimación son los
siguientes:
Selección del Tamaño de la Muestra
El enfoque del estudio comparativo. Este se utiliza
cuando con anterioridad se ha realizado estudios
estadísticos sobre la misma población. Si los datos
obtenidos por estos estudios se consideran confiables
se puede utilizar la desviación estándar encontrada por
ellos.
Estudio piloto. Consiste en aplicar un estudio previo a
una pequeña muestra de la población y en tomar como
DE la que se obtenga de esta pequeña muestra.
El error estándar de la media o de la proporción.
Consiste en aplicar el procedimiento visto en el tema
anterior.
La aproximación basada en rango. Para utilizar
este método es necesario conocer o tener una
estimación de los valores máximos y establece que,
suponiendo que la distribución es normal, dentro del
rango de + – 3 DE de la media se encuentran
prácticamente la totalidad de las observaciones de
una distribución (99.7%). De esta manera la distacia
entre el valor menor y el mayor debe ser, en teoría,
algo muy cercano a 6 DE. Se podría entonces
estimar la DE como una sexta parte del rango. Por
ejemplo supón que quieres estimar la DE de la
cantidad de cheques que expiden al mes los alumnos
de la universidad, supón que el mínimo de cheques
expedidos es de 2 y el máximo de 50, de esta
manera el rango sería de 48 (50-2). En este ejemplo
la estimación de la DE sería de 8 cheques, que se
obtiene de 48/6.
Supóngase que se realiza un estudio piloto y se
calcula que la desviación de la s es 3000:
E s
=
z n
200 3000
=
1.96 n
n = 864.36
Una formula de calculo mas adecuada para
determinar n es:
n= ( Z*s
E
)
Donde:
E es el error permisible
Z es el desvió formal asociado al grado de
confianza seleccionado
S es la desviación estándar de la muestra del
estudio.
Ejemplo:
Un estudiante de administración desea determinar la
cantidad media que perciben los empleados del
Municipio del Rimac. El error para estimar la media
es de $1,000, con un nivel de confianza del 95%. El
estudiante encuentra un informe en INEI que estima
la desviación estándar en $10,000. ¿Cuál es tamaño
requerido de la muestra?
Solución:
• n = ((1.96*$10,000)/$1,000)2
• n = 384.16, es decir 385
• Si se desea un nivel mayor de confianza, por ejemplo
del 99%, la muestra deberá ser mayor.
• n = ((2.58*$10,000)/$1,000)2
• n = 665.64, es decir 666 (el numero de la bestia)
Selección del Tamaño de la Muestra
para Proporciones
• El procedimiento que se describe arriba se puede
adaptar para el cálculo del tamaño dela muestra para
el cálculo de una proporción. También es necesario
identificar tres criterios:
• El nivel de confianza deseado.
• El margen de error que se puede tolerar.
• Un estimado de la proporción de la población. Esta
estimación se puede obtener por los mismo métodos
de la estimación de la media, aunque cuando no se
cuenta con información es común que se utilice 0.50
Selección del Tamaño de la Muestra
para Proporciones
• La fórmula que se utiliza en este caso es la siguiente:
Donde:
n = es el tamaño de la muestra
z = es el valor estándar normal que corresponde al
nivel deseado de confianza
P = es una estimación de la proporción de la población
E = es el máximo error permisible
Selección del Tamaño de la Muestra
para Proporciones