Trabajo No.3
INTRODUCCION i
1. Objetivos del muestreo 1
2. Ventajas del muestreo 1
3. Conceptos básicos 2
3.1. Muestra 2
3.2. Muestreo probabilístico 2
3.3. Muestreo no probabilístico 2
3.4. Población 3
3.5. Parámetro 3
4. Estadígrafo 3
5. Distribución muestral de la media 4
6. Error estándar de la media 8
7. Estimador sesgado y estimador insesgado 14
8. Tamaño óptimo de muestra 18
9. Estimación de parámetros 21
10. Muestreo aleatorio simple 23
11. Tabla de números aleatorios 24
12. Selección sistemática de una muestra 26
13. Aplicación de muestreo simple 26
14. Muestreo estratificado 35
CONCLUSIONES 47
RECOMENDACIONES 48
REFERENCIAS BIBLIOGRAFICAS 49
INTRODUCCION
Existen dos métodos a través de los cuales se puede obtener una muestra
de una población, estos son el muestreo no probabilístico y probabilístico. El
primero consiste en elegir elementos de una manera prestablecida, sin tomar
en cuenta la teoría de la probabilidad, por lo que no es posible conocer el
grado de confiabilidad que existe en este procedimiento. El muestreo
probabilístico está dedicado a estudiar métodos para selección y observación
de una fracción de la población con el objeto de llevar a cabo inferencias en
ella.
i
I MUESTREO ESTADÍSTICO
a) Menor costo;
b) Mayor rapidez tanto en obtener la información como en su
presentación;
c) Proporciona información más precisa porque el estudio se limita a
una parte de la población;
d) Necesita menos personal por lo tanto éstos pueden ser mejor
supervisados; y
1
e) Mejor calidad de la información.
3. Conceptos básicos
3.1. Muestra
Es una parte representativa de la población, el tomar una muestra no
representa realizar inferencia o inducción, esto dependerá del método de
selección de los elementos, del tamaño de la muestra, la variabilidad de los
elementos, etcétera. Por esa razón se distinguen las muestras probabilísticas
y las no probabilísticas.
2
3.3. Muestreo no probabilístico
Cuando no se da igual oportunidad a todos los elementos de la población de
ser incluidos en una muestra; en la selección de los elementos interviene el
criterio personal. También se le denomina muestreo de juicio.
3.4. Población
Conjunto total de los elementos a investigar, puede estar dada por personas,
elementos o cosas.
3.5. Parámetro
Es una medida estadística que identifica alguna característica de una
población, por ejemplo la suma total de la variable, promedio aritmético,
varianza, desviación estándar, etcétera.
4. Estadígrafo
3
1. Simbología principal
4
Si de una población se extraen todas las muestras posibles y se calcula a
cada una su promedio se tendrá una distribución muestral de la media.
POBLACIÓN
Si las muestra son grandes, n > 30, y mientras más aumenta la distribución
de la media tiende a formar una curva normal.
MUESTRA MUESTRA MUESTRA MUESTRA
5
medias de todas las muestras de tamaño “n” que es posible extrae de una
población siempre es igual a la verdadera media de la población.
Ejemplo:
Donde:
I= Factorial
Aplicando la fórmula:
6
1,2 2,3 3,4 4,5
1,4 2,5
1,5
Donde:
X= Media poblacional
X= Valores de variable
7
n= Número de elementos de una muestra.
8
Esta medida estadística mide el grado de dispersión delas medias
muéstrales de tamaño n, alrededor de la media poblacional; y se representa
por Ox cuado es estimado con los datos de una muestra se representa por
Sx. En otras palabras el error estándar de la media es una desviación
estándar dela distribución muestral de las medias.
9
Tomando los datos del ejemplo, el cálculo del error estándar dela media
puede calcularse sin necesidad de extraer todas las muestras posibles de
una población y que en la practicando se hace, se calcula así:
10
En la práctica no se extraen todas las muestras, solamente se toma una
muestra de tamaño n, entonces con la fórmula 64, conociendo la desviación
estándar no hay necesidad de extraer todas las muestras, se puede obtener
el error estándar de la media y es exactamente el mismo como si se
calculara con todas las muestras:
11
a. Factor de corrección finita
12
1,000,000-1 999,000
5 – 1 = 4 = 1.
5-1 4
Siempre que el muestreo es con reposición hay una población infinita, por
ejemplo si en una caja hay 5 números y cada vez que se saca uno se retorna
a la caja se pueden sacar muestra de cualquier tamaño.
N=2; NN = 52 =25
N=5; NN = 55 =3,125
¿De qué tamaño ha de ser N respecto a n, para ser grande? Para algunos
autores, sí n<0.05 N, para otros; sí n<0.10 N.
13
7. Estimador sesgado y estimador insesgado
14
La media aritmética muestral es una estimación insesgada de M puesto que
E (x) = M. (E(X) = valor esperado de la media)
Varianza sesgada:
Varianza Insesgada:
15
Demostración para verificar las varianzas muéstrales sesgada e insesgada:
Se tiene la población: 2, 4, 8 y 10. Extraer muestras tamaño 3 sin reemplazo
y calcular la varianza sesgada e insesgada.
b) Muestras tamaño 3:
2,4,8;2,4,10;2,8,10; y 4,8,10.
16
Se puede observar en el cuadro que la varianza modificada de la muestra
13.33 es igual a la varianza modificada de la población 13.33, por tanto: S2
es un estimador insesgado de Q2.
17
Por ejemplo para la primera muestra:
3.1
N y N
n-1 N-1
18
Se aproximan a 1 entonces se establece que S2 es una estimación
insesgada de cuando tanto la población como el tamaño de muestra son
grandes.
Donde:
19
Q2= Varianza de la población
Los niveles de confianza más usados son 95 y 99%, que les corresponden
los valores Z de 1.96 y 2.58 respectivamente. Sin embargo pueden usarse
otros, la manera de obtenerlos es la siguiente: para 95% de probabilidad
entonces 0.95/2= 0.4750, este valor de probabilidad se busca en la tabla de
área bajo la curva normal para encontrar el valor de Z que le corresponde.
(En este caso dada la probabilidad encontrar el valor de Z)
Ejemplo
20
Se desea seleccionar una muestra de una población de 30 casos, según una
investigación total realizada en una variable clave, la desviación estándar es
de Q=4, se desea estimar con una probabilidad de acertar del 95% y un error
absoluto de muestreo de Q2.00:
n= (1.96)2 (4)2 30
9. Estimación de parámetros
21
b) Estimación por intervalo de confianza dela media.
c) Estimación de un total
22
Donde: X = Total, o suma total de la variable.
23
11. Tabla de números aleatorios
24
punto de partida y la dirección en que se hará la selección en la tabla. Como
el número mayor es 600 se podría convenir en usar las 3 últimas cifras dela
derecha de la columna 7 y fila 1 de arriba hacia abajo. A continuación se
procede a seleccionar los elementos (En este caso empresas)
Los establecimientos que formarían la muestra son los identificados con los
números 179, 440, 468, 194 y 595, estos se marcan o chequean en el marco
muestral de lista. El número 179 que aparece en la fila 3 no se tomó en
cuenta pues ya fue seleccionado (Selección sin reemplazo), y los otros dos
números fila 2 y 6 porque caen fuera del marco muestral (982 y 602)
25
empresas es las ventas brutas, entonces se puede investigar el personal
ocupado, las compras, utilidades, etc.
26
Con este ejemplo de muestreo simple, se determinará el tamaño de muestra,
se seleccionará la muestra utilizando la tabla de números aleatorios, también
se aplicará la selección sistemática y se estimarán parámetrps.
27
Con esta información determinar:
28
Para 95% de probabilidad Z= 1.96, la desviación estándar es 4.92, población
N=47.
29
Con base a la muestra y con 95% de probabilidad de acertar se estima que
los impuestos pagados por los 47 contribuyentes ascienden a Q 28.12 miles.
30
e) Estimación del total poblacional
a. Estimación puntual
El total poblacional es otro de los parámetros que interesa estimar, en
este caso el monto del impuesto pagado por todos los contribuyentes;
el mono es igual a la sumatoria de todos los valores de la variable y
está dado por: X= N* X,
Donde: X=total poblacional estimado, X= promedio muestral,
N=tamaño de la población. Sustituyendo los datos se tiene: 47*28.12=
Q1,321.64 miles.
31
1,321.64 + 1.96 (1.60)
1,321.64-3.14=1,318.50
1,321.64=3.14
1,321.64+3.14=1324.78
32
En el caso en análisis se tiene: Ea = + 1.96 (1.60)= + 3.14.
gráficamente.
33
Con los mismos datos, seleccionar la muestra aplicando muestreo
sistemático y estimar puntualmente el promedio del impuesto pagado
con 95% de probabilidad.
Primera se encuentra el intervalo de selección, N/n, 47/8=5.87, por lo
que el intervalo de selección puede ser 5 por defecto o 6 por exceso.
Se selecciona un número al azar entre 01 a 47 como punto de
arranque, este resultó el 21, que queda seleccionado, segundo se
cuenta cada 6 hasta completar la muestra.
34
Con el 95% de probabilidad se estima que el verdadero promedio
poblacional se encuentra entre Q 24,239.00 y Q30,511.00.
35
cada estrato, se eligen los elementos con lo cual se garantiza que los
elementos en los diferentes estratos de la población queden adecuadamente
representados en la muestra.
a) Estimación puntual:
Donde:
36
h=Identificación del estrato, 1,2,3, ó A,B,C,D; ó grande, pequeño, mediano,
etc.
Donde:
M= Media poblacional
37
c) Estimación de un total
a. Estimación puntual
Donde:
38
14.1 Distribución de la muestra y estimación de parámetros
39
ESTRATO III
a) Afijación uniforme
La muestra se reparte por igual entre los estratos, tomando en cuenta
n= 8, se tiene : 8/3 2.66,
40
Segundo el resultado encontrado se multiplica por el número de
elementos en cada estrato.
Nh = fm * Nh
Donde:
n= Tamaño de la muestra
N= Tamaño de la población
41
NOTESE: que el estrato C tiene más elementos en virtud que su dispersión
es mayor.
42
Distribuir proporcionalmente la muestra, estimar con base en ella
puntualmente el promedio facturado para la población, estimar por intervalo
de confianza el promedio y el monto facturado.
43
b) Estimación puntual del promedio facturado
Se cuenta con los promedios muéstrales para cada uno de los estratos
definidos, se necesita calcular W, para cada estrato.
WA=Nh
X= 0.40*100+0.35*800+0.254*1,200.
44
Con base a la muestra se estima con una probabilidad del 75% de acertar
que el promedio del valor de las 2,000 facturas oscila entre Q 641.94 Y
Q648.05 miles.
45
46
CONCLUSIONES
47
RECOMENDACIONES
48
REFERENCIAS BIBLIOGRAFICAS
49