Está en la página 1de 20

Hernaldo Reinoso

Julio 2013
Anlisis Estadstico de Datos
UNIVERSIDAD DE CONCEPCION
Facultad de Ingeniera
Departamento de Ingeniera Industrial
Parte 1
Tcnicas de Muestreo
UNIVERSIDAD DE CONCEPCION
Facultad de Ingeniera
Departamento de Ingeniera Industrial
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
3
Bibliografa
R. L. Scheaffer, W. Mendenhall y L. Ott, Elementos de
Muestreo, Thomson, 6

Edicin, 2007.
(Traduccin de la 6

edicin en ingls)
Captulo 1
Introduccin
UNIVERSIDAD DE CONCEPCION
Facultad de Ingeniera
Departamento de Ingeniera Industrial
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
5
El Problema de Muestreo
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
6
El Problema de Muestreo
D
I
I
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
7
Poblacin
Elemento
Unidad de
Muestreo
Introduccin
Muestra: Conjunto de unidades seleccionadas de
un marco o de varios marcos.
Marco
Muestral
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
8
Tipos de Muestreo
Tipos de Muestreo
No probabilstico Probabilstico
Aleatorio Simple
Estratificado
Sistemtico
Por Conglomerado
Por conveniencia
Por juicio
Por cuotas
Bola de Nieve
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
9
Muestreo Probabilstico
Muestreo Aleatorio Simple (MAS)
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
10
Muestreo Probabilstico
Muestreo Aleatorio Estratificado (MAE)
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
11
Muestreo Sistemtico (MS) (1 de 5)
Muestreo Probabilstico
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
12
Muestreo Sistemtico (MS) (1 de 6)
Muestreo Probabilstico
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
13
Muestreo por Conglomerados (MC)
Muestreo Probabilstico
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
14
Muestreo por Conglomerados Bietpico
Muestreo Probabilstico
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
15
Errores de Muestreo
Errores en el proceso
de muestreo
Error Muestral Error no Muestral
Error del diseo
muestral
Error de
Medicin
Marco Muestral
Poblacin
Seleccin
Sustitucin de
unidades de muestreo
Error del
entrevistador
Error de
procesamiento
No respuesta
Sesgo de
respuesta
Muestreo Probabilstico
Captulo 2
Muestreo Aleatorio Simple
UNIVERSIDAD DE CONCEPCION
Facultad de Ingeniera
Departamento de Ingeniera Industrial
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
17
Muestreo Aleatorio Simple (MAS)
Seleccin de una muestra de tamao n de una
poblacin de tamao N
Cada una de las muestras posibles tamao n,
tiene la misma probabilidad de ser seleccionada.
A la muestra as obtenida se le denomina muestra
aleatoria simple (mas).
El nmero de muestras posibles es:
( )
!
! !
N
n
N
N
C
n
n N n
| |
= =
|

\ .
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
18
Muestra
Poblacin
1

n
i
i
y
y
n

=
= =

1
N
i
i
y

N

=
=

Estimacin de la Media Poblacional


Propiedad
( )
E y

=
Ejemplo: Verifique esta propiedad dada la poblacin
ficticia {1, 1, 9, 9}, y muestra aleatorias simples de
tamao n = 2.
Muestreo Aleatorio Simple (MAS)
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
19
Muestra
Poblacin
( )
2
1
1
n
i
i
y - y
s
n -
=
=

( )
2
2
1
1
N
i
i
y -
S
N

=
=

Estimacin de la Varianza Poblacional


Propiedad
Ejemplo: Verifique esta propiedad dada la poblacin
ficticia {1, 1, 9, 9}, y muestra aleatorias simples de
tamao n = 2.
( )
2 2
E s S =
Muestreo Aleatorio Simple (MAS)
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
20
Muestra Poblacin
( )
2
1
1
n
i
i
y - y
s
n -
=
=

Propiedades
( )
2
2 1
N
i
i
y -

N

=
=

( )
2 2 2
a)
- 1
N
E s S
N
= =
2 2 2 2
1
b) o
1
N - N
S S
N N
= =

MAS: Estimacin de la varianza poblacional


Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
21
Intervalos de Confianza para la Media
Intervalo de confianza (IC) para la media poblacional es:
donde
( )
1
2
y z V y y EE


cuyo estimador es:
( )
2
S N - n
V y
n N
| |
=
|
\ .
( )
2

s N - n
V y
n N
| |
=
|
\ .
Muestreo Aleatorio Simple (MAS)
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
22
Ejemplo: El jefe de un taller desea estimar el tiempo
promedio que un operario necesita para ejecutar una
tarea. El taller tiene 100 operarios. Se seleccion
aleatoriamente 9 operarios para ejecutar la tarea.
Se registr el tiempo de ejecucin con los siguientes
resultados (en minutos): 4.2, 5.1, 7.9, 3.8, 5.3, 4.6, 5.1,
9.7 y 4.1. (Media = 5.53, Desviacin Estndar = 1.97)
a) Estimar, mediante un intervalo de 95% de confianza,
el tiempo medio de ejecucin de la tarea.
b) D una un cota para el error de estimacin
MAS: Estimacin de la media poblacional
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
23
Estimacin del Total Poblacional
Propiedades
( )
a) E =
( ) ( ) ( )
2
b) V V Ny N V y = =
Muestra Poblacin
N y =
1
N
i
i
N y
=
= =

Intervalo de confianza:
( )
1
2
z N V y

Muestreo Aleatorio Simple (MAS)


Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
24
( )
2
1 1
2 2
-
- 1
N n
EE B z V y B z B
n N


| |

|
\ .
Tamao de la Muestra
2 2
1 1
2 2
2 2
1 1
2 2
1 1 1
1
z z S
B B
n
z S z S
N

N B N B N




| | | |
| |
| |
| |
\ . \ .
=
| | | |
| | | |
| |
+ +
| |
| |
\ . \ .
| |
\ . \ .
Muestreo Aleatorio Simple (MAS)
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
25
Criterio: Algunos sugieren los siguiente:
a) Estimar S
2
por s
2
de una muestra piloto.
b) Primero calcular
2
1
2
0
z s
n
B

| |
|
=
|
|
\ .
0 0
0
y si 0.05 , calcular
1
n n
n
n
N

N
> =
+
MAS: Tamao de la muestra
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
26
Ejemplo: Una empresa de distribucin de agua potable
quiere tomar una muestra de n medidores de agua para
estimar el consumo promedio (m
3
) diario por casa. El
nmero de medidores registrados por la empresa es
101500. Para realizar el estudio se dispone de 150 mil
pesos. Los costos de realizacin del estudio incluyen un
costo fijo de 50 mil pesos ms 350 pesos por la lectura de
cada medidor. No se conoce la desviacin estndar de la
poblacin pero se estima que el consumo diario vara entre
50 y 200 m
3
. Se desea que la precisin en la estimacin
de la media sea de 2 m
3
con un 95% de confianza.
a) Calcular el tamao muestral
b) Evale la precisin correspondiente al tamao
muestral calculado.
MAS: Tamao de la muestra
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
27
Dos dentistas A y B hicieron una encuesta sobre el estado de
los dientes de 200 nios en un colegio. El dentista A tom una
muestra aleatoria simple de 20 nios y cont el nmero de
dientes con caries de cada nio con los siguientes resultados:
Ejercicio
Ndientes con caries / nio 0 1 2 3 4 5 6 7 8 9 10
Nnios 8 4 2 2 1 1 0 0 0 1 1
El dentista B, usando la misma tcnica dental, examin los
200 nios, registrando slo aquellos que no tenan dientes
con caries, encontrando 60 nios en esta situacin.
a) Estimar el nmero total de dientes con caries usando slo
los resultados del dentista A.
b) Repetir a) pero usando los resultados de ambos dentistas
MAS: Tamao de la muestra
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
28
Estimacin de una Proporcin Poblacional
1 si la observacin posee el atributo
0 si no
i
y

Objetivo: estimar la fraccin de elementos de una poblacin


que poseen un determinado atributo de inters.
Ejemplo: la fraccin artculos no conformes en un lote.
1 si el artculo es defectuoso
0 si no
i
i
y

Objetivo: estimar la fraccin de artculos defectuosos


en el lote
Muestreo Aleatorio Simple
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
29
( )

1
pq N n
V p
n N
| |
=
|

\ .

1 q p = y
Muestra
Poblacin
Varianza del estimador de p
donde
1

n
i
i
y
y p
n
=
= =

1
N
i
i
y
p
N
=
=

( )

1
pq N n
V p
n N
| |
=
|

\ .
1 q p =
MAS: Estimacin de una proporcin poblacional
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
30
2
1
2
2
1
2
1 1
z
p q
B
n
z
N
p q
N B N

| |
|
|
|
\ .

| |
| |
|
+
|
|
\ .
|
\ .
( )
1
2

EE z V p B

=
Intervalo de confianza para p
( )
1
2


p z V p

( )
1
2

p z V p

Tamao de la muestra
MAS: Estimacin de una proporcin poblacional
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
31
Algunos sugieren el siguiente criterio:
a) Estimar p a partir de una muestra piloto
b) O bien, utilizar p = 0.5, lo cual maximiza el
producto pq.
c) Considerar
d) Primero calcular
1
1
N

N

=
2
1
2
0
z
n pq
B

| |
|
=
|
|
\ .
0 0
0
y si 0.05 , calcular
1
n n
n
n
N

N
> =
+
MAS: Tamao Muestral
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
32
En un departamento de Ingeniera Industrial de una
Universidad se va a aplicar una encuesta para determinar el
porcentaje de alumnos partidarios de que su carrera acorte
su duracin en un semestre. El departamento tiene 2000
alumnos.
a) A cuntos alumnos habra que aplicar la encuesta para
tener un 95% de confianza de no cometer un error mayor
que 4% en la estimacin?
b) Su resultado sigue siendo vlido si el nmero de
alumnos de la facultad fuera 300?
c) Si finalmente, y por razones de tiempo, la encuesta se
aplica a slo 100 estudiantes, cul es el impacto en la
precisin del estudio?
Ejemplo:
MAS: Tamao Muestral
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
33
Una empresa dedicada a estudios de opinin pblica quiere
estimar el porcentaje de votos que obtendra cada uno de los
dos candidatos en una eleccin presidencial en un pas con
10 millones de habitantes. Con este fin quiere desarrollar una
encuesta telefnica en la capital del pas, en la cual la
pregunta relevante es: si la eleccin fuera el prximo
domingo, por quin votara usted?. La encuesta anterior
mostr un 30% a favor del candidato A.
a) Si la empresa desea un error de estimacin de no ms de
5%, es suficiente una muestra aleatoria simple de 600
personas (obtenidas de la gua telefnica) para estimar la
votacin que obtendra el candidato A, con un 95% de
confianza?
b) Qu crticas le hara a este diseo muestral?
MAS: Tamao Muestral
Otro ejemplo:
Captulo 3
Muestreo Aleatorio Estratificado
UNIVERSIDAD DE CONCEPCION
Facultad de Ingeniera
Departamento de Ingeniera Industrial
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
Muestreo Aleatorio Estratificado: MAE
L : Nmero de estratos
N
i
: Tamao del estrato i, i = 1, 2, , L
N = N
1
+ ... + N
L
n
i
: Tamao de la muestra del estrato i, i = 1, 2, , L
n = n
1
+ ... + n
L
Estrato i N
i
n
i
1
2
L = 3
N
1
N
2
N
3
n
1
n
2
n
3
N n
n
1
n
2
n
1
N
1
N
2
N
3
35
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
36
( )
2 2
2 2
2
1 1
1

1 1
L L
i i i i
st i i
i i
i i i i
s n s n
V y N - W -
N n N n N
= =
| || | | || |
= =
| | | |
\ .\ . \ .\ .

Muestra
Poblacin
1 1
1
L L
st i i i i
i i
y N y W y
N
= =
= =


Intervalo de confianza para
( )
1
2
st st
y z V y

n
1
n
2
n
1
N
1
N
2
N
3
Muestreo Aleatorio Estratificado: MAE
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
37
Una empresa publicitaria est interesada en determinar
cunto debe enfatizar la publicidad televisiva en una
determinada comuna, y decide realizar una encuesta por
muestreo para estimar el nmero promedio de horas por
semana que se ve TV en los hogares de la comuna. sta
comprende dos pueblos: A y B, adems de un rea rural C.
El pueblo A rodea una fbrica, y la mayora de los hogares
son de trabajadores con nios en edad escolar. El pueblo B
es un suburbio exclusivo de una ciudad vecina y consta de
habitantes ms viejos con pocos nios. Existen 155 hogares
en el pueblo A, 62 en el pueblo B y 93 en el rea rural C.
MAE: Ejemplo
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
38
Suponga que la empresa tiene tiempo y dinero para
encuestar 40 hogares que distribuye de la siguiente
manera: 20 en A, 8 en B, y 12 en C. Se seleccionan
aleatoriamente estos hogares y se entrevistan. Los
resultados, con mediciones del tiempo que se ve TV en
horas por semana se muestran en la tabla a continuacin.
Estime la media y el total poblacional. En cada caso d
una cota para el error de estimacin.
Estrato i n
i
N
i
Media
Muestral
Varianza
Muestral
1
2
3
20
8
12
155
62
93
33.900
25.125
19.000
35.358
232.411
87.636
MAE: Ejemplo (continuacin)
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
39
Tamao de la Muestra
( )
( )
( )
1
2
2
1
2
1
2
2













st
s
st
t
EE B z V y B
B
V y
O bien V y D
B
donde D
z


z


| |
|

|

| |
|
=

\
.
.
|
|
|
\
Muestreo Aleatorio estratificado
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
40
( )
2
2
1
L
i i i i
st
i
i i
N S N - n
V y D
N n N
=
| |
| |
=
| |
\ .
\ .

o y
i i
i i i i
n N
w n nw W
n N
= = =
Considerando
Entonces
2 2 2 2 L L
i i
i 1 i 1
i i
2 2 2 2
1 1
1

1
1
i i
L L
i i i i
i i
i i
W S W S
w D w
n
W S W S
D
N D N
= =
= =
=
+ +


MAE: Tamao de la muestra
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
41
2 2
i i
s S
Haciendo
Entonces
2 2
1
2 2
1
1
1
1
n
i i
i
i
L
i i
i
i
W s
D w
n
W s

D N
=
=

MAE: Tamao de la muestra


Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
42
0
0
2
0
1

1
1
L
i i
i
n
n
n

N
n W s
D
=

+
=

Asignacin proporcional
w
i
= W
i
Muestras de igual tamao
n
i
= n/L
0
2 2
1
2 2
0
1
1
1
L
i i
i
i
L
i i
i
n
n
W s

D N
L
n W s
D
=
=

+
=

MAE: Tamao de la muestra


Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
43
Ejemplo: Reconsideremos el ejemplo anterior. Una
encuesta anterior sugiere que las varianzas de los
estratos son aproximadamente 25, 225 y 100,
respecti vamente. Se desea esti mar l a medi a
poblacional usando, primero muestras de igual
tamao y, luego, usando asignacin proporcional.
a) Obtener el tamao de la muestra para obtener un
lmite en el error de estimacin igual a 2 horas.
b) Repita a) si se quiere estimar el total poblacional
con un error de estimacin de no ms de 400
horas.
MAE: Tamao de la muestra
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
44
Asignacin ptima
a) Minimizar la varianza del estimador dado un costo
(presupuesto) de obtencin de la muestra.
b) Minimizar el costo de tomar la muestra dado un
valor D de la varianza del estimador.
Funcin de Costo
0
1
L
i i
i
C c c n
=
= +

Dos tipos de problemas:
MAE: Tamao de la muestra
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
45
a) Minimizar varianza sujeta a costo
( )
2 2
1
0
1
Minimizar 1
Sujeta a
L
i i i
st
i
i i
L
i i
i
W S n
V y -
n N
c n c C
=
=
| |
=
|
\ .
+ =

Usando multiplicadores de Lagrange se obtiene:


( )
0
1
1
L
i i
i
i
L
i i i
i
W S
C - c
c
n
W S c
=
=
=

( )
0
1
i i
i
i L
i i i
i
W S
C - c
c
n
W S c
=
=

MAE: Tamao de la muestra Asignacin ptima


Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
46
b) Minimizar costo sujeto a varianza
Usando multiplicadores de Lagrange se obtiene:
1 1
2 2
1
L L
i i
i i i
i i
i
L
i i
i
i
W S
W S c
c
n
W S
V
N
= =
=
=
+

1
i i
i
i L
i i
i
i
W S
c
n n
W S
c
=
=

0
1
2 2
1
Minimizar
Sujeto a 1
L
i i
i
L
i i i
i
i i
C c c n

W S n
- V
n N
=
=
= +
| |
=
|
\ .

MAE: Tamao de la muestra Asignacin ptima


Ejemplo: c
1
=c
2
=9, c
3
=16,
S
1
=5, S
2
=15, S
3
=10
Cota para EE = 2 horas
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
47
Una firma consultora de estudios de mercado dispone de un
presupuesto de $500000 para realizar una encuesta con el fin de
estimar la media poblacional de una cierta caracterstica de
inters. Ha clasificado la poblacin en dos estratos: el estrato 1
formado por los hogares con telfono y el estrato 2 formado por
los hogares sin telfono. Se sabe que slo el 20% de los hogares
no tienen telfono. Las entrevistas por telfono cuestan $144 por
hogar. Si slo los hogares sin telfono son entrevistados
personalmente el costo de cada entrevista es de $1600. En
cambio, si todas las entrevistas se realizan personalmente, el
costo de cada entrevista disminuye a $900 cada una, por
economas de escala. Suponga que la desviacin estndar del
estrato 1 es aproximadamente la mitad de la desviacin estndar
del estrato 2. Por otra parte los costos fijos ascienden a $140000.
El objetivo es minimizar la varianza del estimador
Ejercicio
MAE: Tamao de la muestra Asignacin ptima
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
48
a) Calcule el tamao de la muestra si todos los hogares son
entrevistados personalmente.
b) Calcule el tamao de la muestra si todos los hogares con
telfono son entrevistados por telfono y los hogares sin
telfono son entrevistadas personalmente?
c) Si el presupuesto disminuye en $5000, la varianza del
estimador aumenta o disminuye? Por qu? Explique breve y
rigurosamente (sin hacer clculos) cmo determinar la
magnitud el aumento o disminucin, sin que haya que rehacer
clculos.
d) Reconsidere la parte a). Se sabe que la poblacin consta de
500 hogares. Cambia su respuesta? Justifique.
e) Repita b) pero ahora suponga que el objetivo es estimar la
diferencia entre las medias de los estratos minimizando la
varianza total con el presupuesto disponible. Cmo asignara
una muestra de 400 hogares? Atencin: Debe deducir las
frmulas. Ignore la cpf.
MAE: Tamao de la muestra Asignacin ptima - Ejercicio
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
49
Estimacin de una Proporcin
( ) ( )
2 2
1 1



1
L L
i i i i
st i i i
i i
i i
N n p q
V p W V p W
N n
= =
| || |
= =
| |

\ .\ .

i
p
Muestra Poblacin
1

L
st i i
i
p W p
=
=

i
p
p
( )
1
2
st st
y z V y

Intervalo de confianza para


Muestreo Aleatorio Estratificado
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
50
Ejemplo: La empresa publicitaria del ejemplo,
j unt o con est i mar el nmero promedi o de
horas semanales que se ve TV, quiso estimar la
proporcin p de hogares que ven el programa X,
usando la misma muestra estratificada aleatoria.
Los resultados fueron que dicho programa lo ven
16 (de 20) hogares en el pueblo A, 2 (de 8) en el
pueblo B, y 6 (de 12) en el rea C. Calcule una
cota para el error de estimacin de la proporcin p
MAE: Estimacin de una proporcin
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
51
Tamao Muestral
2
1
2
1
2
/ 2

L
i i i
i
i
L
i i i
i
i
i
N p q
w
n
N D N p q
n B
donde D y w
z n

=
=
=
+
| |
= =
|
\ .

MAE: Estimacin de una proporcin


Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
52
Si los W
i
son conocidos, entonces:
1 1 2 2 3 3
1
L
st i i
i
y W y W y W y W y
=
= = + +

n
1
n
2
n
3
W
1
W
2
W
3
1
y
2
y
3
y
MAS de
tamao n
Se estratifica
esta MAS
Muestreo Aleatorio Estratificado
Postestratificacin
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
53
Considrese una MAS con n = 100 de una poblacin
donde la proporcin de mujeres y hombres es igual.
La medicin de inters es el peso de los encuestados
y el objetivo es estimar el peso promedio de la poblacin
La muestra dio la siguiente informacin:
Hombres Mujeres
n
i
Media muestral
20
180
80
110
124 y =
Como los hombres estn sub
representados, la media muestral
de 124 libras parece baja.
Esta estimacin puede ajustarse
calculando:
( ) ( )
1 1 2 2
0.5 180 0.5 110 145
st
y W y W y = + = + =
MAE: Postestratificacin - Ejemplo
'
3
n
1
180 y =
2
110 y =
n
1
= 20
W
1
W
2
E
1
E
2
n
2
= 80
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
54
Notar que los n
i
son aleatorios, por lo tanto la muestra no
es una muestra estratificada de acuerdo a la definicin.
( )
, 1, 2, ... ,
i i
E n nW i L = =
Supuesto: Los W
i
son conocidos
Sin embargo, si W
i
es conocido y si n
i
20 para cada
estrato, este mtodo es tan preciso como la estratificacin
con asignacin proporcional.
Los n
i
son aleatorios con
MAE: Postestratificacin
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
55
Adems
Se puede obtener una aproximacin de la varianza
reemplazando 1/n
i
por su valor esperado en:
( ) ( )
2 2
2
1 1
1

1
L L
p st i i i i
i
i i
N n
V y W s W s
Nn n
= =

= +

2 2
1 1 1
i
i i i
W
E
n nW n W
| |
+
|
\ .
Con lo que se obtiene
( )
2
2
1

L
i i i
st i
i
i i
s N n
V y W
n N
=
| |
=
|
\ .

MAE: Postestratificacin
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
56
Mayoristas Minoristas
n
i
Media muestral
Desviacin estndar
70
520
210
30
280
90
Ejemplo: Una gran compaa sabe que el 40% de sus
cuentas son mayoristas y el 60% minoristas. Sin
embargo es difcil revisar los registros para identificar
estas cuentas. Un auditor desea tomar una muestra de
100 de estas cuentas con el fin de estimar su valor
promedio. Una MAS dio un 70% de mayoristas y un
30% de minoristas. Los resultados fueron los siguientes:
Estimar y d una cota para el error de estimacin.
MAE: Postestratificacin
( ) ( ) Omitiendo cpf

R: 376, 2 30
st st
y V y = =
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
57
Muestreo Doble
Los W
i
son desconocidos
Fase 1: MAS grande para estratificar (tamao: n)
Fase 2: MAS de cada estrato de la muestra, de la cual
se calcula,
y
i i
y s
n
1
n
2
n
3
W
1
W
2
W
3
1
y
2
y
3
y
'
2
n
'
1
n
MAS grande
de tamao n
Se estratifica
esta MAS
'
3
n
Muestreo Estratificado Aleatorio
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
58
Ejemplo: En una investigacin de mercados se tom una
muestra de 141 personas y se clasificaron de acuerdo a
si eran profesionales universitarios o no. De stos, 57
eran profesionales (estrato 1) y 84 no (estrato 2). Luego,
con el fin de estimar los ingresos medios de sus familias,
se tom una muestra de 11 personas del estrato 1 y 12
del estrato 2, obteniendo un ingreso medio mensual de
5853 dlares en el estrato 1 y de 1681 dlares mensuales
en el estrato 2. Las desviaciones estndar muestrales
fueron 50 y 15, respectivamente.
MAE: Muestreo Doble
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
'
3
n
W
1
W
2
1
5853
50
y
s
=
=
2
1681
15
y
s
=
=
'
2
84 n =
'
1
57 n =
n
1
= 11
E
1
E
2
n
2
= 12
59
Estrato i
Muestra
inicial
Segunda
muestra
Media
Muestral
Desviacin
Estndar
1: Prof. Univ
2: No
57
84
11
12
5383
1681
50
15
MAE: Muestreo Doble Continuacin ejemplo
' 141 n =
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
60
'
'
proporcin de elementos en el estrato , 1,...,
'
i
i
n
w i i L
n
= = =
Entonces, suponiendo aleatoriedad en la fase 1,
( )
'
i i
E w W =
Sea,
En la fase 2, se extraen aleatoriamente n
i
elementos de
los n
i
identificados como pertenecientes al estrato i
De estos n
i
se calculan
i i
y y s
MAE: Muestreo Doble
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
61
Con esto se puede construir el siguiente estimador para la
media poblacional
'
' '
1 1
'
L L
i
st i i i
i i
n
y w y y
n
= =
= =

Si en la fase 2, las fracciones de muestreo n
i
/N
i
, son
todas pequeas y N es grande, un estimador de la
varianza es, aproximadamente,
Si n es grande, entonces w
i
/n es despreciable y se tiene:
( )
( )
2
' '
' 2
' ' 2
1
'

' 1 ' '


L
i i st
i i
st i
i
i
w y y
w s n
V y w
n n n n
=
(

| |
(
= +
|
(
\ .

( )
( )
2
' '
2
' ' 2
1

'
L
i i st
i
st i
i
i
w y y
s
V y w
n n
=
(

(
= +
(

MAE: Muestreo Doble


Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
62
Ejemplo: En una investigacin de mercados se tom una
muestra de 141 personas y se clasificaron de acuerdo a
si eran profesionales universitarios o no. De stos, 57
eran profesionales (estrato 1) y 84 no (estrato 2). Luego,
con el fin de estimar los ingresos medios de sus familias,
se tom una muestra de 11 personas del estrato 1 y 12
del estrato 2, obteniendo un ingreso medio mensual de
5853 dlares en el estrato 1 y de 1681 dlares mensuales
en el estrato 2. Las desviaciones estndar muestrales
fueron 50 y 15, respectivamente. Estime el ingreso medio
mensual de la poblacin y d una cota para el error de
estimacin.
MAE: Muestreo Doble
Captulo 4
Muestreo Sistemtico
UNIVERSIDAD DE CONCEPCION
Facultad de Ingeniera
Departamento de Ingeniera Industrial
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
64
Muestra Sistemtica 1-de-cada-k: Muestra obtenida al
seleccionar, aleatoriamente, un elemento de los primeros k
elementos del marco muestral y despus cada k-simo
elemento.
N =93
n = 11
(o 12)
k = 8
Muestreo Sistemtico
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
65
k = Intervalo de muestreo
93
11.625 11
8
o 1 11 1 12
N
n
k
N
k
( (
= = = = (

( (

(
+ = + =
(

93
8.4545 8
11
N
k
n
( (
= = = = (

( (

Tamao de la muestra
Muestreo Sistemtico
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
66
Si N es conocido
Determinar el tamao muestral n como en MAS
Entonces
N
k
n
(
=
(

Tamao de la Muestra
Si N es desconocido, habr que aproximar un tamao
de muestra n, y luego suponer un valor de k que sea
necesario para obtener ese tamao de muestra
Muestreo Sistemtico
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
67
( )
( )
2
2

sy
sy sy
s N n
V y
n n
y z V y

| |
=
|
\ .

Estimacin

Muestra Poblacin
1

n
i
i
sy
y
y
n

=
= =

Muestreo Sistemtico
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
68
( ) ( )
2
1 1
sy
V y n
n

( = +

: medida de la correlacin entre los pares de elementos
de la misma muestra sistemtica.
MS versus MAS
( ) ( )
( ) ( )
( ) ( )
Poblacin aleatoria 0
Poblacin ordenada 0
Poblacin peridica 0
sy mas
sy mas
sy mas
V y V y
V y V y
V y V y



> >
Muestreo Sistemtico:
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
69
Ejercicio (Certamen 1, 2009 2)
Dada la siguiente poblacin:
{5, 9, 1, 1, 6, 10, 2, 2, 4, 8, 0, 0}
a) Considere dos tipos de muestreo: Un MAS de 3
unidades y un MS 1-de-cada-4. Compare la precisin
de estos dos muestreos si el objetivo es estimar la
media poblacional. A qu se debe la diferencia?
b) Ordenar la poblacin anterior de tal manera que la MS
1-de-cada-4 sea equivalente a una muestra por estratos.
Sin calcular la varianza del estimador, diga como es la
precisin de esta MS comparada con la MS de la parte a).
Justifique.
Muestreo Sistemtico
Captulo 5
Muestreo por Conglomerados
UNIVERSIDAD DE CONCEPCION
Facultad de Ingeniera
Departamento de Ingeniera Industrial
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
71
Muestreo por Conglomerados )MC)
C
1
C
2
C
3
C
4
C
5
C
6
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
72
Muestreo por Conglomerados
N : Nmero de conglomerados en la poblacin
n : Nmero de conglomerados en la muestra
m
i
: Tamao del conglomerado i (i = 1, 2, , N)
En el ejemplo: N = 6 y supongamos que n = 2
Conglomerado i
Nmero de casas
(Familias) (m
i
)
1
2
3
4
5
6
13
11
9
10
38
19
Total 100
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
73
1
: tamao promedio de los conglomerados
en la muestra
n
i
i
m
m
n
=
=

1
: Tamao de la poblacin
N
i
i
M m
=
=

: Tamao promedio de todos los
conglomerados en la poblacin
M
M
N
=
En el ejemplo:
6
1
100
i
i
M m
=
= =

100
16.67
6
M
M
N
= = =
2
1
51
21.5
2 2
i
i
m
m
=
= = =

Muestreo por Conglomerados


Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
74
1
1
n
i
i
n
i
i
y
y
m
=
=
=

Muestra Poblacin
My =

Media:
Total:
y
i
= Total poblacional del i-simo conglomerado
( )
( )
2
1
2

con
1
n
i i
i
y y m
N n
V y m M
n NnM
=

| |
=
|

\ .

Muestreo por Conglomerados


Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
75
En el ejemplo: Ingresos totales por mes ($ millones)
1
1
114
2.235
51
n
i
i
n
i
i
y
y
m
=
=
= = =

300
3
100
= =
Muestreo por Conglomerados
Conglomerado i
Nmero de casas
(Familias) (m
i
)
Ingreso total por
Conglomerado (y
i
)
1
2
3
4
5
6
13
11
9
10
38
19
40
55
37
43
74
51
Total 100 300
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
76
Tamao de la Muestra
( )
( )
2
1
2

1

n
i i
i
y y m
N n
V y
n NnM
=

| |
=
|

\ .

Se sabe que
O sea,
( )
( )
2
2 2 1
2

1

n
i i
i
c c
y y m
N n
V y s donde s
n NnM
=

| |
= =
|

\ .

La varianza real es aproximadamente:


( )
2
2

c
N n
V y
NnM

| |
=
|
\ .
Muestreo por Conglomerados
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
77
Estimar
2 2
con , y
con
c c
s
M m

El tamao muestral est dado por:


2
2
2
1
2
c
c
N BM
n con D
z ND

| |
|
= =
|
+
|
\ .
Muestreo por Conglomerados: Tamao de la muestra
Hernaldo Reinoso, Departamento de Ingeniera Industrial, Universidad de Concepcin
78
Ejemplo: En relacin con el ejemplo anterior, calcule
el tamao muestral necesario para estimar la media
poblacional con una cota para el EE de $ 0.4 millones,
con un 95% de confianza. Considere la muestra de
n = 2 como una muestra preliminar.
B =
2 2
2 2
c c
c c
N Ns
n
ND ND s

= = =
+ +
1
2
2 z

=
2 2
1 1
2 2
BM Bm
D
z z


| | | |
| |
= = =
| |
| |
\ . \ .
( )
2
2 1
1

n
i i
i
c
y y m
s
n
=

= =

Muestreo por Conglomerados: Tamao de la muestra

También podría gustarte