Muestreo Estadistica

DPTO.
MTODOS CUANTITATIVOS PARA LA ECONOMA Y LA EMPRESA

UNIVERSIDAD DE GRANADA
TCNICAS CUANTITATIVAS 3
Grado en Marketing e Investigacin de Mercados
MUESTREO
Teora y ejercicios.
NDICE
1. Muestreo aleatorio simple. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.0 Definiciones y conceptos bsicos . . . . . . . . . . . . . . . . . . . . . . .
1.1 Seleccin de una muestra aleatoria simple. Nmeros aleatorios. . . . . . . .
1.2 Muestreo aleatorio simple en poblaciones infinitas. . . . . . . . . . . . . .
1.2.1 Media, varianza y proporcin muestrales: Propiedades. Error de
estimacin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.2 Estimacin puntual. Intervalos de confianza. Contrastes de hiptesis.
1.2.3 Determinacin del tamao muestral. . . . . . . . . . . . . . . . . .
1.3 Muestreo aleatorio simple en poblaciones finitas. . . . . . . . . . . . . . .
1.3.1 Estimacin de la media, proporcin y total poblacionales. . . . . . .
Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
11
12
14
14
17
19
2. Muestreo aleatorio estratificado. . . . . . . . . . . . . . . . . . . . . . . . . . .

2.1 Seleccin de una muestra aleatoria estratificada. . . . . . . . . . . . . . . .
2.2 Estimacin de la media, proporcin y total poblacionales. . . . . . . . . . .
2.3 Determinacin del tamao muestral. . . . . . . . . . . . . . . . . . . . . .
2.4 Asignacin de la muestra. . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.4.1 Asignacin ptima. . . . . . . . . . . . . . . . . . . . . . . . . . .
2.4.2 Asignacin de Neyman. . . . . . . . . . . . . . . . . . . . . . . . .
2.4.3 Asignacin Proporcional. . . . . . . . . . . . . . . . . . . . . . . .
2.5 Estratificacin despus de seleccionar la muestra. . . . . . . . . . . . . . .
Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
26
26
27
30
31
31
32
32
38
40
3. Muestreo con informacin auxiliar. . . . . . . . . . . . . . . . . . . . . . . . .

3.1 Introduccin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2 Estimacin de razn. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.1 Estimacin de la media y total poblacionales. . . . . . . . . . . . .
3.3 Estimacin de regresin. . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.4 Estimacin de diferencia. . . . . . . . . . . . . . . . . . . . . . . . . . . .
50
50
51
52
55
56
57
59
59
59
61
62
4. Muestreo sistemtico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1 Seleccin de una muestra sistemtica. Usos. Ventajas. . . . . . . . . . . . .
4.3 Comparacin con el muestreo aleatorio simple: Poblaciones ordenadas,
aleatorias y peridicas. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
68
68
69
5. Muestreo por conglomerados. . . . . . . . . . . . . . . . . . . . . . . . . . . .

5.1 Necesidad y ventajas del muestreo por conglomerados. . . . . . . . . . . .
5.2 Formacin de los conglomerados. Conglomerados y estratos. . . . . . . . .
77
77
77
77
82
5
5
7
8
72
73
74
83
Relacin de Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
93
Muestreo aleatorio simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
93
Muestreo aleatorio estratificado . . . . . . . . . . . . . . . . . . . . . . . . . .
94
Muestreo con informacin auxiliar . . . . . . . . . . . . . . . . . . . . . . . .
99
Muestreo sistemtico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
Muestreo por conglomerados . . . . . . . . . . . . . . . . . . . . . . . . . . .
105
Formulario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Muestreo aleatorio simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Muestreo aleatorio estratificado . . . . . . . . . . . . . . . . . . . . . . . . . .
Muestreo con informacin auxiliar . . . . . . . . . . . . . . . . . . . . . . . .
Muestreo por conglomerados . . . . . . . . . . . . . . . . . . . . . . . . . . .
111
111
113
115
118
1. Muestreo aleatorio simple.

1.0 Definiciones y conceptos bsicos.
1.1 Seleccin de una muestra aleatoria simple. Nmeros aleatorios. Rutas aleatorias.
1.2 Muestreo aleatorio simple en poblaciones infinitas.
1.2.1 Media, varianza y proporcin muestrales: Propiedades. Error de estimacin.
1.2.3 Determinacin del tamao muestral.
1.3 Muestreo aleatorio simple en poblaciones finitas.
1.3.1 Estimacin de la media, proporcin y total poblacionales.
1.0 Definiciones y conceptos bsicos

Uno de los objetivos fundamentales de la estadstica es hacer inferencia acerca de una
poblacin con base en la informacin contenida en una muestra representativa.
Una muestra representativa sera una versin a escala reducida de la poblacin, que
reflejara cada una de las caractersticas de toda la poblacin. Para precisar el concepto de
muestra representativa necesitamos una serie de definiciones previas que ilustraremos
apoyndonos en el siguiente ejemplo: supongamos que en cierta ciudad se quiere realizar una
encuesta telefnica con el objetivo de conocer la proporcin de votantes que apoyan al
gobierno municipal.
Un elemento de muestreo es un objeto en el que se toman las mediciones. En nuestro
ejemplo un elemento de muestreo es un votante y la medicin que se toma es si apoya o no al
gobierno municipal.
La poblacin objetivo es el conjunto de elementos y caractersticas que deseamos estudiar.
Una muestra es un subconjunto de la poblacin. Cuando en lugar de sobre una muestra se
toman mediciones sobre todos los elementos de la poblacin, lo denominamos censo.
La poblacin muestreada es la coleccin de todos los elementos posibles que podran
seleccionarse para la muestra.
Las unidades de muestreo son conjuntos (no solapados) de elementos de la poblacin que
cubren la poblacin completa. Por ejemplo, podramos querer estudiar a las personas, pero no
tenemos una lista de los telfonos de todos los individuos que pertenecen a la poblacin
objetivo. En vez de esto, las familias sirven como unidades de muestreo y los elementos son
los individuos que viven en una familia.
El marco de muestreo es la lista de las unidades de muestreo.
Por ejemplo, para las encuestas telefnicas, el marco de muestreo puede ser una lista de todos
los nmeros de telfono fijos de la ciudad. La diferencia entre el marco y la poblacin deber
5
ser pequea para permitir que se hagan inferencias acerca de la poblacin basndose en una
muestra obtenida del marco.
La cantidad de informacin contenida en una muestra se controla por medio del nmero de
datos muestrales y por el mtodo usado para seleccionar los datos muestrales. Los mtodos de
muestreo ms utilizados son:
1. Muestreo aleatorio simple.
2. Muestreo aleatorio estratificado.
3. Muestreo sistemtico.
4. Muestreo por conglomerados.
Nuestro objetivo a lo largo de la asignatura ser conocer o investigar alguna caracterstica de

la poblacin, por ejemplo, estudiaremos la audiencia televisiva de un programa, la intencin
de voto en un pas, ... Claramente la recogida de informacin sobre toda la poblacin resultara
cara y lenta. Por ello es preferible utilizar un subconjunto pequeo de la poblacin, la muestra.
El error de muestreo es el que surge al considerar una muestra y no examinar toda la
poblacin. El error de muestreo puede ser controlado y medido mediante el diseo de la
muestra.
Otro tipo de errores, ms difcil de controlar, pueden ocurrir en la encuesta. Estos errores se
llaman errores de no muestreo. En muchas encuestas, el error de muestreo cometido para esa
encuesta puede ser despreciable en comparacin con los errores que no son de muestreo.
Los errores de no muestreo ms comunes son:
1. Sesgo de seleccin. Este error ocurre cuando alguna parte de la poblacin objetivo no
est en la poblacin muestreada. Una muestra as obtenida no es representativa de la
poblacin objetivo.
2. Sesgo de medicin. El sesgo de medicin ocurre cuando los datos observados difieren
del valor verdadero, por ejemplo:
-
Las personas no dicen la verdad.
No siempre comprenden las preguntas.
La formulacin y el orden de las preguntas pueden tener un gran efecto sobre las
respuestas obtenidas
3. No respuesta. La no respuesta de un individuo seleccionado para formar parte de la

muestra puede causar un sesgo en los datos muestrales similar al sesgo de seleccin.
Puede ocurrir que las personas que respondan no representen a la poblacin objetivo.
Los errores de no muestreo deben controlarse con acciones como:
6
1. Reentrevistas.
2. Recompensas e incentivos.
3. Entrevistadores adiestrados.
4. Verificacin de datos
Son muchas las razones para el uso del muestreo, entre otras destacamos:
(a) Evitar la destruccin de la poblacin. En algunos casos, por ejemplo en el control de
calidad, la observacin de los elementos lleva a su destruccin.
(b) Rapidez. Los datos se pueden reunir ms rpido, de modo que las estimaciones se
pueden publicar de una manera programada. Por ejemplo las elecciones.
(c) Economa y precisin. El muestreo puede proporcionar informacin fiable con costes
mucho menores que los de un censo. Un censo completo necesita muchas personas en
la recoleccin de los datos y debido a su complejidad se pueden cometer muchos
errores. En una muestra, se puede dedicar ms atencin a la calidad de los datos y
realizar un seguimiento de quienes no contestan la encuesta.
1.1 Seleccin de una muestra aleatoria simple. Nmeros aleatorios. Rutas aleatorias.
Si cada muestra posible de tamao n tiene la misma probabilidad de ser seleccionada, el
procedimiento de muestreo se denomina muestreo aleatorio simple y a la muestra as
seleccionada se le llama muestra aleatoria simple.
La condicin de que cada muestra tenga la misma probabilidad de ser seleccionada equivale a
que cada elemento tenga la misma probabilidad de pertenecer a la muestra. Para ello la
seleccin de cada elemento de la muestra se debe hacer con un sorteo completamente
aleatorio. Para facilitar la obtencin de los resultados de ese sorteo aleatorio existen lo que se
conoce como tablas de nmeros aleatorios que suelen aparecer en un apndice al final de
muchos libros de estadstica. Cada vez ms, estas tablas de nmeros aleatorios son sustituidas
por la generacin de nmeros aleatorios mediante programas de ordenador (Excel, SPSS,...).
Para asociar el valor de esos nmeros aleatorios con los elementos de la poblacin
necesitamos que sta est numerada, en caso contrario deberamos formar una lista y
numerarla. Esto ltimo, en muchos casos, no es tan sencillo. Una alternativa a la formacin de
una lista numerada para la seleccin mediante nmeros aleatorios de los elementos de la
muestra es el mtodo de las rutas aleatorias. Segn este mtodo cada nmero aleatorio o
grupo de nmeros aleatorios describe el camino hasta el elemento de la muestra. Veamos
cmo se aplicara este mtodo con un sencillo ejemplo:
7
Se ha seleccionado el nmero aleatorio 11071032, las dos primeras cifras (11) indican el
distrito de la ciudad, las dos siguientes (07) la calle del distrito, las dos siguientes (10) el
nmero de la calle, la siguiente (3) la planta del edificio y la ltima (2) la letra B de dicha
planta.
En muchos casos para llevar a cabo este procedimiento se recurre a la gua telefnica,
sobretodo si la entrevista es por telfono, as el nmero aleatorio 7836 podra interpretarse
como que se selecciona la pgina 78 de la gua y dentro de sta al abonado del telfono que
aparece en el lugar 36 de dicha pgina.
EL NMERO TOTAL DE ELEMENTOS QUE FORMAN UNA MUESTRA TIENE

MENOS IMPORTANCIA QUE EL PRINCIPIO DE SELECCIN ALEATORIA. Utilizar
un mtodo ms sencillo para seleccionar la muestra, con el que fcilmente se obtengan
muchas observaciones, no garantiza una mejor informacin que una muestra aleatoria
simple con muchos menos datos.
1.2 Muestreo aleatorio simple en poblaciones infinitas.

Supongamos que la caracterstica en estudio de la poblacin est representada por la variable
Y (con media y varianza 2), una muestra aleatoria simple de tamao n estar representada
por n variables: Y1,..., Yn, independientes e idnticamente distribuidas (i.i.d.).
Nota: observaciones en poblaciones infinitas y tambin en poblaciones finitas, si se hacen con
reemplazamiento, nos conducen a variables i.i.d.
1.2.1 Media, varianza y proporcin muestrales: Propiedades. Error de estimacin.

Como estimador de la media de la poblacin, , se utiliza la media muestral, y .
y=
1 n
yi
n i =1
Un valor aislado y del estimador revela poco acerca de la media poblacional, deberamos
evaluar tambin su bondad.
Este estimador tiene propiedades deseables como ser insesgado y tener mnima varianza
( )
E y =
( )
V y =
2
n
Como estimador de la varianza de la poblacin, 2 , se utiliza la cuasivarianza muestral, S 2 .

S2 =
1 n
yi y
n 1 i =1
que tambin tiene la propiedad de ser insesgado

E (S2 ) = 2
de forma que la varianza de la media muestral se estima de forma insesgada por

V ( y) =
S2
n
Cuando las variables Y, Y1, ..., Yn son dicotmicas o binomiales, slo toman dos valores (0 y
1), su media representa una proporcin que se nota como p y el estimador de la misma, la
proporcin muestral, por p
p=
1 n
yi
n i =1
yi = 0, 1
Este estimador, como media muestral que es, tiene las mismas propiedades mencionadas
antes.
La varianza de la poblacin es en este caso 2 = pq , donde q=1-p. Como antes, el estimador
insesgado de la varianza es la cuasivarianza muestral que para este tipo de variables es igual a
S2 =
n
pq
n 1
Si conocemos ms caractersticas de las variables aleatorias Y, Y1,..., Yn, conoceremos ms

propiedades de la media muestral, aparte de las ya mencionadas. As,
Y N ( , 2 )
si
2 conocida
N (0,1)
n
Y N ( , 2 )
si
2 desconocida
y
tn 1 N (0,1)
S
n
(en la prctica, para n > 30,
tn 1 N (0,1))
Y cualquier distribucin, por el Teorema Central del Lmite, cuando n
si
y
N (0,1)
S
n
(en la prctica, para n>30)
un caso particular del anterior es Y B (1, p ) , variable dicotmica, donde = p
p p
pq
n
p p
n pq
n 1 n
p p
N (0,1)
pq
y= p
(en la prctica, para n>30)
n 1
Todo lo anterior puede resumirse diciendo que la media muestral (de variables numricas, y ,
o dicotmicas, p ) sigue una distribucin Normal o se puede aproximar por ella si el tamao
de la muestra es suficientemente grande. De forma que podemos conocer la probabilidad de
que dicha variable tome determinados valores, por ejemplo (tomando una de las anteriores
expresiones de la media muestral tipificada, siendo vlido lo que sigue tambin para las otras)
y
P 1, 96
1, 96 = 0,95
o en un caso ms general
y
P Z
Z = 1
2
2
n
=nivel de significacin
1-=nivel de confianza
Para un nivel de confianza del 95% (el ms habitual) se suele redondear el anterior valor
1,962.
De las probabilidades anteriores se puede hacer dos lecturas. La primera:
P 2
y 2
= 0, 95 P y 2
= 0, 95
n
n
n
En esta expresin aparecen valores y expresiones fundamentales en las tcnicas de estimacin:

1-=0,95= nivel de confianza del 95%.
y = error de estimacin o diferencia entre la estimacin que hacemos, y , y el verdadero

valor del parmetro que se quiere estimar, .
2
= cota o lmite para el error de estimacin, es el mximo error de estimacin que se
puede estar cometiendo, con una confianza del 95%. En la prctica, es desconocida y se
estima por S .
10
La segunda lectura:
Py 2
y+2
= 0, 95
n
n
expresa la confianza que tenemos de que el verdadero valor del parmetro se encuentre
entre los extremos del intervalo y 2

,y+2
.
n
n
Todo lo anterior se puede asegurar si el estimador sigue una distribucin Normal (si el tamao
de la muestra es suficientemente grande, n>30, est garantizado). Pero qu ocurre si no es as.
En ese caso la desigualdad de Tchebychev nos da la respuesta.
La desigualdad de Tchebychev asegura que si X es una variable aleatoria con media
E ( X ) = y varianza V ( X ) = 2 , sea cual sea su distribucin de probabilidad
P X k 1
1
k2
Aplicando lo anterior a la media muestral para k=2 se obtiene
P y 2
1 4 = 0, 75
n
resultado parecido al que obtenamos anteriormente
P y 2
= 0, 95
n
salvo que en este caso lo ms que podemos asegurar es que dicha probabilidad es mayor que
0,75.

Cuando estimamos el valor de un parmetro poblacional con el valor que ha presentado en una
determinada muestra el estimador asociado, hacemos una estimacin puntual.
Si dicha estimacin puntual se acompaa de un margen de error (lmite para el error de
estimacin) y de una medida de la certidumbre que se tiene en tal estimacin (nivel de
confianza), hablamos de intervalo de confianza. Por ejemplo, utilizando muestras grandes, el
intervalo de confianza para la media poblacional con un nivel de confianza del 95% es
S
S
,y+2
y2
n
n
11
En ocasiones se quiere contrastar con los valores observados en una muestra la posibilidad de
que el verdadero valor de un parmetro de la poblacin sea un valor dado, por ejemplo, se
quiere contrastar la hiptesis nula H 0 : = 0 con un nivel de significacin del 5%. Lo
anterior equivale a comprobar si
0 y 2
S
S
,y+2
n
n
en cuyo caso se aceptara la hiptesis nula, rechazndose en caso contrario.

Si se fija de antemano el mximo error de estimacin que estamos dispuestos a aceptar en una
estimacin, 2
= B , la cantidad de informacin necesaria para conseguirlo depende del
tamao de la muestra segn la siguiente expresin

4
2
n
= B2 n =
2
B2
4
2
D
, D=
B2
4
En la prctica la varianza poblacional 2 es desconocida. Si disponemos de S 2 de un estudio

anterior podemos obtener el valor de n sustituyendo en la anterior expresin 2 por S 2 .
Si no se dispone de informacin previa para estimar la varianza podemos usar que en variables
Normales el rango de la muestra es aproximadamente cuatro veces su desviacin tpica
R
R2

16
2
La proporcin poblacional p es la media de una variable dicotmica ( Y B (1, p ) ,

E (Y ) = p , V (Y ) = pq ), luego el problema de determinar el tamao muestral se hace de forma
anloga sustituyendo 2 por pq
n=
pq
,
D
D=
B2
4
En la prctica p se desconoce. Una aproximacin se obtiene reemplazndolo por el valor

estimado p obtenido en muestras preliminares. Si no se cuenta con informacin anterior,
suponiendo p =
1
se obtiene un tamao muestral conservador (mayor que el requerido para
2
obtener la cota del error de estimacin fijada).
12
Ejemplo 1.1. Un hipermercado desea estimar la proporcin de compras que los clientes pagan
con su Tarjeta de Compras. Durante una semana observaron al azar 200 compras de las
cuales 35 fueron pagadas con la tarjeta.
a) Estime con un intervalo de confianza la proporcin de compras pagadas con dicha tarjeta.
b) Cuantas compras deberan observarse para estimar, con un error inferior al 3%, la
proporcin de compras pagadas con la tarjeta? (Consideren los datos anteriores como una
muestra previa)
c) Si no se tuviera ninguna informacin acerca de los clientes que utilizan la tarjeta, cuntas
compras deberamos observar para asegurar que la anterior estimacin se realiza con un
error inferior al 3%.
d) Este mismo hipermercado desea estimar tambin el valor medio de las compras
realizadas con su Tarjeta de Compras. Basndose en los anteriores datos se observa que
el valor total de las compras hechas con la tarjeta fue de 5.600 (siendo la cuasivarianza
de los datos 625). Estime el valor medio de las compras pagadas con la tarjeta y el error
de estimacin asociado.
Solucin:
a)
p=
1 n
35
yi =
= 0,175
n i =1
200
q = 1 0,175 = 0,825
n = 200
V ( p) =
pq
= 0, 000726
n 1
p (12,11% , 22,89% )
B = 2 V ( p) = 0,0539
b)
B = 0, 03
D=
B2
= 0, 000225
4
n=
pq
= 641, 6 642
D
c)
B = 0, 03
D=
B2
= 0, 000225
4
p = q = 0,5
n=
pq
= 1111,1 1112
D
d)
n = 35
S 2 = 625
V ( y) =
S 2 625
=
= 17,8571
n
35
y=
1 n
5600
yi =
= 160
n i =1
35
B = 2 V ( y ) = 8, 45
13
1.3 Muestreo aleatorio simple en poblaciones finitas.

Suponemos que la poblacin es finita, tiene N elementos, y adems que la muestra se
selecciona sin reemplazamiento (lo que suele ser habitual, en caso contrario estaramos ante
el mismo modelo que el muestreo aleatorio simple en poblaciones infinitas con variables
i.i.d.)
1.3.1 Estimacin de la media, proporcin y total poblacionales.
(A) Estimacin de la media poblacional.

Para estimar la media poblacional, , se utiliza la media muestral
1 n
yi
n i =1
Este estimador es insesgado y su varianza decrece conforme crece el tamao de la muestra
=y=
( )
E y =
( )
V y =
2 N n
n N 1
En este tipo de muestreo la cuasivarianza muestral no es un estimador insesgado de la

varianza de la poblacin
E (S2 ) =
N
2
N 1
N 1 2
E
S =2
N
De lo anterior se sigue que la varianza de la media muestral puede ser estimada

insesgadamente por
2
N 1 2 1 N n S N n
V y =
S
=
N
n N 1 n N
( )
S2
expresin igual a la del caso de poblaciones infinitas, V ( y ) =
, salvo el coeficiente
n
N n
que se denomina coeficiente corrector para poblaciones finitas (c.p.f.).

N
N n
En la prctica el coeficiente c.p.f. suele despreciarse si est prximo a 1,
0, 95 o lo
N
que es equivalente si n 5% N . En muchos casos N no est claramente definido o se
N n
desconoce, pero si N se supone suficientemente grande el c.p.f. se omite,
1.
N
Para calcular el lmite para el error de estimacin , con un 95% de confianza, se halla
2 V ( y ) . Igual que en el caso de poblaciones infinitas, se habla de un nivel de confianza del

14
95% cuando trabajamos con el coeficiente 1,962. Pero en algunos casos, segn la
desigualdad de Tchevychev, slo se puede asegurar que este nivel es mayor que un 75%.
(B) Estimacin del total poblacional.

Para estimar el total poblacional, , dado que =
= N y =
N
n
= N utilizaremos el estimador
y
i =1
Para hallar su varianza usamos que V (kX ) = k 2V ( X ) , por tanto:

Varianza estimada de
S2 N n
S2
V ( ) = V ( N y ) = N 2 V ( y ) = N 2
= N ( N n)
n N
n
Como en el caso de la media, el lmite para el error de estimacin con una confianza del 95%
est dado por 2 V ( ) . Valiendo comentarios anlogos a los hechos anteriormente.
En lo sucesivo se dar el valor de la varianza del estimador para los distintos tipos de
muestreo, omitindose, para no repetirnos ms, la referencia al lmite para el error de
estimacin.
Ejemplo 1.2. Un auditor examina las cuentas abiertas con diferentes clientes de una empresa.
Suponga que existen 1.000 cuentas de las cuales se examinan 300. La media muestral de las
cuentas fue y = 1.040 y la cuasivarianza muestral es S2=45.0002. Estime el promedio de la
deuda y el total de la deuda por cobrar para las 1.000 cuentas abiertas con un intervalo de
confianza al 95%.
Solucin:
S n21 N n 45000 1000 300
V ( y) =
=
= 105
n
N
300
1000
2 V ( y ) = 2 105 = 20, 49
(1.040 20, 49 ) = (1.019,51 , 1.060, 49 )

= N y = 1000 1040 = 1.040.000
2 V ( ) = N 2 V ( y ) = 1000 20, 49 = 20.490 (valor exacto 20.493,9)
(1.040.000 20.490 ) = (1.019.510 , 1.060.490 )
15
(C) Estimacin de la proporcin poblacional.

Para estimar la proporcin poblacional p , dado que se trata de una media usaremos la media
muestral con la siguiente notacin en este caso
p=
1 n
yi
n i =1
yi = 0, 1
su varianza estimada, teniendo en cuenta que S 2 =

V ( p) =
n pq
, es igual a
n 1
S2 N n
pq N n
=
n N
n 1 N
Para estimar el total poblacional de una variable dicotmica usamos

pq
V ( ) = V ( N p ) = N 2 V ( p ) = N ( N n)
n 1
= N p
Ejemplo 1.3. Se toma una muestra aleatoria simple de 100 estudiantes de un centro con 900
estudiantes para estimar
La proporcin que votarn a un determinado representante de centro.
La proporcin de ellos que tienen algn tipo de trabajo.

(i = 1,...,100) las respuestas del i-simo estudiante seleccionado ( yi = 0 cuando
Sean yi , zi
responden NO, yi = 1 cuando responden SI, anlogamente para zi ).

100
yi = 70
Segn la muestra
i =1
100
z
i =1
= 25
Usando los datos de la muestra, estime p1 (proporcin de estudiantes que votarn a un

determinado representante), p2 (proporcin de estudiantes con algn tipo de trabajo), 2
(nmero de estudiantes con algn tipo de trabajo) y los lmites para los errores de estimacin
correspondientes.
Solucin:
100
p1 =
V ( p1 ) =
yi
i =1
100
100
= 0, 70 (70%)
p1 q 1 N n
= 0,0018855
n 1 N
2 V ( p1 ) = 0, 0868 (8, 68%)
2 = N p 2 = 900 0, 25 = 225
16
p2 =
z
i =1
100
V ( p2 ) =
= 0, 25 (25%)
p 2 q 2 N n
= 0, 0016835
n 1 N
2 V ( p 2 ) = 0, 0821 (8, 21%)
2 V ( 2 ) = 900 0, 0821 = 73,89

El nmero de observaciones necesarias para estimar con un lmite para el error de
estimacin de magnitud B se obtiene resolviendo 2 V ( y ) = B
( )
2 V ( y) = B V y =
V ( y) =
2 N n
n N 1
=D n=
B2
=D
4
N 2
( N 1) D + 2
Para estimar el total poblacional con un lmite para el error de estimacin B, dado que
B2
2 V ( ) = N 2 V ( y ) = B , se llega a la misma expresin de n pero con D =

4N 2
Habitualmente la varianza poblacional 2 es desconocida. Si disponemos de S 2 de un estudio
anterior podemos obtener el valor de n sustituyendo en la anterior expresin 2 por S 2 .
Si no se dispone de informacin previa para estimar la varianza podemos usar que en variables
Normales el rango de la muestra es aproximadamente cuatro veces su desviacin tpica
R
R2

16
2
La proporcin poblacional p es la media de una variable dicotmica ( Y B (1, p ) ,

E (Y ) = p , V (Y ) = pq ), luego el problema de determinar el tamao muestral se hace de forma
anloga sustituyendo 2 por pq, obtenindose
n=
Npq
( N 1) D + pq
D=
B2
(para la proporcin)
4
D=
B2
(para el total)
4N 2
En la prctica p se desconoce. Una aproximacin al mismo se obtiene reemplazndolo por el

valor estimado p obtenido en encuestas preliminares. Si no se cuenta con informacin
anterior, suponiendo p =
1
se obtiene un tamao muestral conservador (mayor que el
2
requerido para obtener la cota del error de estimacin fijada).
Ejemplo 1.4. Encuentre el tamao de la muestra necesario para estimar el valor total de 1.000
cuentas por cobrar con un lmite para el error de estimacin de 10.000. Aunque no se cuenta
17
con datos anteriores para estimar la varianza poblacional, se sabe que la mayora de las
cuentas caen dentro del intervalo (600, 1.400).
Solucin:
D=
B2
10.0002
=
= 25
4 N 2 4 1.0002
n=
4 800 200 2 40.000
N 2
= 615, 62 616
( N 1) D + 2
Si se realizan dos mediciones (o ms) sobre cada elemento de la muestra, se calcularn los
tamaos muestrales que satisfacen los lmites para el error de estimacin fijados para cada
estimacin y finalmente el mayor de los dos ser el tamao de la muestra que satisface ambos
lmites.
Ejemplo 1.5. Los alumnos de TC3 de una facultad con 3.000 estudiantes desean realizar una
encuesta para determinar la proporcin de estudiantes que estn a favor de hacer los exmenes
en sbado con un lmite para el error de estimacin del 10%. La informacin previa disponible
indica que el 60% preferan los exmenes en sbado. Tambin se quiere estimar la proporcin
de estudiantes que apoyan al equipo decanal con un error de estimacin del 5%. Determnese
el tamao muestral que se requiere para estimar ambas proporciones con los lmites de error
especificados.
Solucin:
p1 = proporcin de estudiantes que prefieren los exmenes en sbado.

D1 =
n1 =
B12 (0,10)2
=
= 0, 0025
4
4
Np1q1
3.000 0, 60 0, 40
=
= 93, 05 94
( N 1) D1 + p1q1 (2.999 0, 0025) + (0, 60 0, 40)
p2 = proporcin de estudiantes que apoyan al equipo decanal.

D2 =
n2 =
B22 (0, 05)2

=
= 0, 000625
4
4
Np2 q2
3.000 0,50 0, 50
=
= 353, 04 354
( N 1) D2 + p2 q2 (2.999 0, 000625) + (0,50 0, 50)
para cumplir con ambos objetivos habra que tomar n=354 con lo que el lmite para el error de
la estimacin de p1 disminuira (con un 95% de confianza) hasta:
2 V ( p1 ) = 2
18
p1 q 1 N n
0, 60 0, 40 3.000 354
=2
= 0, 0489 ( 4,9%)
n 1 N
353
3.000
o bien la cota del error de estimacin del 10% se tiene con un nivel de confianza mucho
mayor
V ( p1 ) = z
0, 60 0, 40 3.000 354
p1 q 1 N n
= z
= 0,10
2
n 1 N
353
3.000
z 0, 02445 = 0,10
z = 4, 09
buscando en la tabla de la Normal (o con ayuda de la hoja de clculo Excel, ...) la probabilidad
comprendida entre (-4,09 , 4,09), se obtiene 0,99995684, es decir, prcticamente un nivel de
confianza del 100%.
EJERCICIOS RESUELTOS
1. Se selecciona una m.a.s. de 9 compras de clientes de un centro comercial para estimar el
valor medio de las compras por cliente.
VALOR en
33,5 32
52
43
40
41
45
42,5
39
a) Obtener un intervalo de confianza para el valor medio de las compras.

b) Podemos aceptar que la compra media es de 45?
c) Qu tamao muestral deberamos tomar para que el LEE sea de 2?
SOLUCIN:
a) = y =
S2 =
33, 5 + ... + 39
= 40,89
9
1
2
2
( 33,5 40,89 ) + ... + ( 39 40,89 ) = 35, 67
9 1
( )
S2
= 3,963
V y =
n
( )
B = 2 V y = 3, 98
( 40,89 3,98 ; 40,89 + 3,98) = ( 36,91; 44,87 )

b) No, porque 45 ( 36,91; 44,87 )
c) n =
2
B2
4
S 2 35, 67
=
= 35, 67 36 compras
B2
1
4
2. Se han entrevistado 1.000 vecinos, elegidos aleatoriamente entre los ms de cien mil
habitantes de una ciudad para conocer su opinin sobre los nuevos impuestos municipales.
655 manifestaron su opinin desfavorable. Estime la proporcin de vecinos que estn en
19
contra de los nuevos impuestos y establezca el lmite para el error de estimacin. Se

puede afirmar que la mayora de los habitantes estn en contra?
SOLUCIN:
p=
V ( p) =
655
= 0, 655
1.000
p = 65,5%
pq 0, 655 (1 0, 655)
=
= 0, 0002262012
n 1
999
2 V ( p) = 0, 0301 3, 01%
(65,5% 3, 01% , 65, 5% + 3, 01%) = (62, 49% , 68, 51%)
p (62, 49% , 68,51%)
habitantes estn en contra
p > 50% s se puede afirmar que la mayora de los
3. El Centro de Estadstica desea estimar el salario medio de los trabajadores de los

invernaderos de una regin. Se decide clasificarlos en dos estratos, los que poseen contrato
fijo y los que tienen un contrato temporal. El salario de los contratos fijos est
comprendido entre los 1.200 y 2.200 euros mensuales, el salario de los contratos
temporales est comprendido entre 500 y 1.700 euros mensuales. Cul debe ser el tamao
muestral total y su asignacin para que se estime el salario medio de los contratos fijos con
un error inferior a 100 y el salario medio de los contratos temporales con un error inferior
a 120?`
SOLUCIN:
Ri
2.200-1.200=1000
1.700-500=1.200
n1 =
n2 =
12
D1
22
D2
12
2
1
B
4
22
2
2
B
4
Ri
i
4
250
300
i2
62.500
90.000
62.500 62.500
=
= 25
10.000
100 2
4
4
90.000 90.000
=
= 25
14.400
120 2
4
4
n = n1 + n2 = 50
4. Entre todas las oficinas bancarias de una pequea ciudad se tienen concedidos 2000
prstamos hipotecarios. Existen razones para pensar que el prstamo hipotecario de menor
20
cuanta es de algo ms de 1200 euros, siendo de casi 11000 euros el de mayor cuanta.
cul es el tamao muestral necesario para estimar estos dos parmetros:
-
la cuanta media de los prestamos cometiendo un error de estimacin menor de 400

euros y
la proporcin de prstamos pendientes de amortizar ms de la mitad de la deuda

cometiendo un error mximo del 5%?
SOLUCIN:
N = 2.000
R = 11.000 1.200 = 9.800
D=
n=
R
= 2450 2 6.002.500
4
B 2 4002
=
= 40.000
4
4
N 2
= 139, 65 140
( N 1) D + 2
B 2 0.052
=
= 0, 000625
4
4
Npq
n=
= 333, 47 334
( N 1) D + pq
D=
p = q = 0,5
Para conseguir estimar los dos parmetros con los niveles de error especificados
necesitamos un tamao muestral igual al mximo de 140 y 334. n = 334 .
5. Se desea estimar el salario medio de los empleados de una empresa y la proporcin de

empleados que apoyan a la actual directiva. La empresa tiene 110 empleados y se sabe que
el salario est comprendido entre los 1500 y 1800 euros mensuales. Cul debe ser el
tamao muestral para que al estimar el salario medio la cota de error se site en 10 euros y
al estimar la proporcin de los que apoyan a la actual directiva el error mximo cometido
sea del 2%?
SOLUCIN:
N = 110 R = 1.800 1.500 = 300
D=
R
= 75 2 5625
4
B 2 102
=
= 25
4
4
N 2
n=
= 74,1 75
( N 1) D + 2
D=
B 2 0.022
=
= 0, 0001
4
4
21
p = q = 0,5
n=
Npq
= 105, 4 106
( N 1) D + pq
6. Una empresa de trabajo temporal quiere investigar las necesidades de empleo de las
empresas de un pueblo. Para ello decide seleccionar una muestra de 5 de las 25 inscritas en
el registro mercantil. El nmero de bajas en el ltimo ao, el nmero de empleados y la
respuesta de cada empresa sobre si utilizara los servicios de la empresa de trabajo
temporal fueron los siguientes:
Empresa Bajas Empleados Respuesta
1
1
7
Si
2
2
15
No
3
9
85
Si
4
0
3
No
5
2
12
No
a) Estime el nmero de bajas en el ltimo ao en las empresas del pueblo. Calcule el
lmite para el error de estimacin.
b) Estime el nmero de empresas que usaran los servicios ofertados. Calcule el lmite
para el error de estimacin.
SOLUCIN:
a) N = 25
n=5
14
= 2,8 = N y = 70
y=
5
S2
12, 7
= 25 20
= 1270
V ( ) = N ( N n)
n
5
B = 2 V ( ) = 71, 2741
Nota: este apartado podr resolverse de otra forma cuando estudiemos el muestreo por
conglomerados. Vase ejercicio 10 de la relacin del captulo 6)
b)
2
= 0, 4 = N p = 10
5
pq
0, 24
V ( ) = N ( N n)
= 25 20
= 30
n 1
4
B = 2 V ( ) = 10,9545
p=
7. El consumo medio de combustible de los taxis de una ciudad es 5.6 litros cada 100 Km.
Puesto que se considera que el consumo es demasiado elevado, en 600 taxis se monta un
dispositivo para disminuirlo. Pasado cierto tiempo se toma una muestra aleatoria de 20
22
taxis, elegidos entre los 600 que colocaron el dispositivo. El consumo en litros de
combustible por cada 100 Km. se recoge en la siguiente tabla
Taxi n Consumo Taxi n Consumo Taxi n Consumo Taxi n Consumo
1
5.4
6
6.3
11
3.6
16
5.4
2
5.5
7
5.4
12
6.7
17
4.8
3
6.9
8
5
13
5.2
18
4.7
4
3.9
9
4.5
14
5.1
19
5.8
5
4.5
10
4.4
15
5.4
20
6.2
a) Estmese mediante un intervalo de confianza la proporcin de taxis con un consumo
inferior a 5.6 litros/100 Km.
b) Cuantos taxis deben observarse para estimar la anterior proporcin con un error
menor o igual que un 10%?
SOLUCIN:
a) 15 de los 20 taxis no superan el consumo de 56 litros/100 Km, por tanto
p=
15
= 0 '75
20
V ( p) =
pq N n 0 '75 0 ' 25 580

=
= 0 '00954
n 1 N
19
600
2 V ( p) = 0 '1953
( 0 '75 0 '1953 , 0 '75 + 0 '1953) = ( 0 '5547 , 0 '9453)

b) B = 0 '10
D=
( 0 '10 )
n=
( 55'47% , 94 '53% )
= 0 '0025
Npq
600 0 '75 0 '25
=
= 66 '77 67
( N 1) D + pq ( 599 0 '0025 ) + ( 0 '75 0 '25)
8. Una muestra aleatoria simple de 6 deudas de clientes de una farmacia es seleccionada para
estimar la cantidad total de deuda de las 100 cuentas abiertas. Los valores de la muestra
para estas seis cuentas son los siguientes:
Dinero adeudado ()
35,50
32,00
43,00
41,00
44,00
42,50
Estime el total del dinero adeudado y establezca un lmite para el error de estimacin.
23
SOLUCIN:
yi2
1260,25
1024,00
1849,00
1681,00
1936,00
1806,25
yi
35,50
32,00
43,00
41,00
44,00
42,50
n
y
i =1
= 238,00
i =1
= N y =
2
i
N
n
= 9556,50
y
i =1
100
238=3966,6
6
2
S2 =
1 n
yi y
n 1 i =1
yi
n
yi2 i =1
1
2382
n
= i =1
= 9556,50
= 23,1667
n 1
5
6
2
S
23,1667
2 V ( ) = 2 N ( N n)
= 2 100(100 6)
= 381, 02
n
6
Los anteriores clculos que se han realizado a mano o con ayuda de una calculadora bsica
se simplifican notablemente si utilizamos una calculadora cientfica de uso comn. Estas
calculadoras nos proporcionan los valores de un grupo de funciones estadsticas
n = sx
n = sx = desviacin tpica
n 1 = Sx
de forma inmediata.
n 1 = S x = cuasidesviacin tpica
9. En un estudio sociolgico, realizado en una pequea ciudad, se hicieron llamadas

telefnicas para estimar la proporcin de hogares donde habita por lo menos una persona
mayor de 65 aos de edad. La ciudad tiene 5000 hogares, segn la gua de telfonos ms
reciente. Una muestra aleatoria simple de 300 hogares fue seleccionada de la gua. Al
terminar la investigacin de campo, de los 300 hogares muestreados, en 51 habita al
menos una persona mayor de 65 aos. Contraste la hiptesis de que en el 25% de los
hogares de esa ciudad habita al menos una persona mayor de 65 aos.
SOLUCIN: N=5000, n=300

p=
24
51
pq N n
= 0,17 q = 1 p = 0,83 V ( p ) =
= 0, 00044359197 2 V ( p ) = 0, 0421
300
n 1 N
25% (17% 4, 21% ) = (12, 79%, 21, 21% )
luego se rechaza la hiptesis de que en el 25% de los hogares de esa ciudad habita al
menos una persona mayor de 65 aos.
10. El gerente de un taller de maquinaria desea estimar el tiempo medio que necesita un
operador para terminar una tarea sencilla. El taller tiene 45 operadores. Se seleccionaron
aleatoriamente 5 operadores y se les tom el tiempo. Los resultados obtenidos son los
siguientes:
Tiempo(minutos) 4,2 5,1 7,9 3,8 5,3
Se puede aceptar la hiptesis de que el tiempo medio que necesitan los operarios del
taller para terminar dicha tarea es inferior a 6 minutos?
SOLUCIN: (con las funciones del modo SD de la calculadora )
N=45, n=5
y=
1 n
yi = 5, 26
n i =1
S2 =
1 n
yi y
n 1 i =1
= 2, 563
S2 N n
= 0, 4556
2 V ( y ) = 1,35 Intervalo de confianza : ( 3,91 min ., 6, 61 min .)
n N
Valores mayores e igual a 6 minutos pertenecen al intervalo de confianza, por tanto no
V ( y) =
podemos aceptar esa hiptesis.
11. Con objetivos benficos, una asociacin filantrpica ha solicitado firmas para una peticin
en 700 hojas. Cada hoja tiene espacio suficiente para 40 firmas pero en muchas de las
hojas se ha obtenido un nmero menor. Contando el nmero de firmas por hoja en una
muestra aleatoria de 50 hojas se han observado los siguientes resultados:
50
Yi = 1.450;
i =1
50
i =1
= 54.496
Cul sera la previsin ms optimista y ms pesimista en cuanto al nmero total de firmas

recogidas para la peticin?
SOLUCIN: N=700, n=50

2
y=
1 n
1450
yi =
= 29
n i =1
50
= N y = 20.300
yi
n
yi2 i =1
n
S 2 = i =1
= 254
n 1
2
S
V ( ) = N ( N n)
= 2.311.400
n
B = 2 V ( ) = 3.040, 66
( 20.300 3.040, 66 ) = (17.259,34 , 23.340, 66 )

Previsin ms optimista: 23.340
Previsin ms pesimista: 17.259
25
2. Muestreo aleatorio estratificado.

2.1
2.2
2.3
2.4
Seleccin de una muestra aleatoria estratificada.

Estimacin de la media, proporcin y total poblacionales.
Determinacin del tamao muestral.
Asignacin de la muestra.
2.4.1 Asignacin ptima.
2.4.2 Asignacin de Neyman.
2.4.3 Asignacin Proporcional.
2.5 Estratificacin despus de seleccionar la muestra.
2.1 Seleccin de una muestra aleatoria estratificada.

Una muestra aleatoria estratificada se obtiene mediante la separacin de los elementos de la
poblacin en conjuntos que no presenten interseccin, llamados estratos, y la seleccin
posterior de una muestra aleatoria simple en cada estrato.
Los estratos deben formarse de manera que los elementos de cada estrato sean lo ms
homogneos que se pueda entre s (ms homogneos que el conjunto de la poblacin) y las
diferencias entre un estrato y otro sean las mayores posibles. Esta forma de construir los
estratos conduce a muestras con poca variabilidad entre las mediciones que producirn
pequeas varianzas de los estimadores y por tanto menores lmites para los errores de
estimacin que con otros diseos de la muestra.
Otras ventajas adicionales que presenta este tipo de muestreo son las siguientes:
A veces los estratos se corresponden con zonas compactas bien definidas con lo que se
reduce el coste de la muestra.
Adems de las estimaciones para toda la poblacin, este muestreo permite hacer
estimaciones de los parmetros poblacionales para los estratos.
Antes de continuar fijemos la notacin que va a utilizarse (a la izquierda para la poblacin, a

la derecha para la muestra):
L = nmero de estratos
N = tamao de la poblacin
n = tamao de la muestra
N i = tamao del estrato
ni = tamao de la muestra del estrato i
N = Ni
n = ni
i = media poblacional del estrato i
y i = media muestral del estrato i
i =1
i = total poblacional del estrato i
26
i =1
i2 = varianza poblacional del estrato i
Si2 = cuasivarianza muestral del estrato i
pi = proporcin poblacional del estrato i
p i = proporcin muestral del estrato i
ci = coste de una observacin del estrato i
2.2 Estimacin de la media, proporcin y total poblacionales.

En cada estrato se ha realizado un muestreo aleatorio simple, sabemos que en cada estrato
L
i =1
i =1
N i y i es un estimador insesgado del total i , estimaremos = i por st = N i y i

media poblacional =
mediante y st =
1
N
y la
N
i =1
yi
y st y en general ( y = media muestral de las n observaciones)
NOTA:
st en general ( = N y = estimador del total segn un m.a.s.)
Varianza estimada de y st
1 L 2
1 L 2 Si2 N i ni
N
V
(
y
)
=
Ni n N
i
i
N 2 i =1
N 2 i =1
i
i
Se obtiene aplicando que la varianza de la suma de variables independientes es la suma de
V ( y st ) =
sus varianzas y que V (kX ) = k 2V ( X ) .
Varianza estimada de st
L
S2 N n
V ( st ) = N 2 V ( y st ) = N i2 i i i
ni N i
i =1
En el caso de variables dicotmicas los estimadores de la proporcin y total poblacionales as

como sus varianzas toman valores similares a los anteriores, salvo las diferencias de notacin
ya comentadas en la leccin anterior.
Estimador de la proporcin poblacional p

p st =
1
N
N
i =1
pi
Varianza estimada de p st
V ( p st ) =
1
N2
Ni2 V ( pi ) =
i =1
1
N2
Ni2
i =1
pi q i N i ni
ni 1 N i
27
Estimador del total poblacional

L
st = N p st = N i pi
i =1
Varianza estimada de st
L
p q N n
V ( st ) = N 2 V ( p st ) = N i2 i i i i
ni 1 N i
i =1
Ejemplo 2.1. Se est interesado en determinar la audiencia de la publicidad televisiva en una

cadena local de un municipio, se decide realizar una encuesta por muestreo para estimar el
nmero de horas por semana que se ve la televisin en las viviendas del municipio. ste est
formado por tres barrios con diferentes perfiles socio-culturales que afectan a la audiencia
televisiva. Hay 210 hogares en el barrio A, 84 en el barrio B y 126 en el barrio C. La empresa
publicitaria tiene tiempo y dinero suficientes para entrevistar 30 hogares y decide seleccionar
muestras aleatorias de tamaos: 15 del barrio A, 6 del barrio B, y 9 del barrio C.
Se seleccionan las muestras aleatorias simples y se realizan las entrevistas. Los resultados,
con mediciones del tiempo que se ve la televisin en horas por semana, se muestran en la
siguiente tabla:
BARRIO A
36
34
26
39
38
32
38
37
29
28
41
35
29
37
41
BARRIO B
20
25
30
14
41
39
BARRIO C
14
22
15
17
21
11
20
14
24
Estime el tiempo medio que se ve la televisin y el lmite para el error de estimacin, en horas por
semana, para:
a) Los hogares del barrio A.
b) Los hogares del barrio B.
c) Los hogares del barrio C.
d) Todos los hogares
Solucin: en primer lugar se calculan las medias y cuasivarianzas muestrales en cada estrato
y1 = 34, 67 horas / semana
y 2 = 28,17 h / s
y 3 = 17, 56 h / s S12 = 23, 24 S 22 = 112,57 S32 = 19, 28
y = 28, 23
S 2 = 92, 74
A partir de estos valores calculamos las varianzas de los estimadores de la media en cada
estrato y los lmites para los errores de dichas estimaciones
N1 = 210 N 2 = 84 N 3 = 126 N = N1 + N 2 + N 3 = 420
28
n1 = 15 n2 = 6 n3 = 9 n = n1 + n2 + n3 = 30
S12 N1 n1
V ( y1 ) =
= 1, 44
n1 N1
S 22 N 2 n2
V ( y2 ) =
= 17, 42
n2 N 2
S32 N 3 n3
V ( y3 ) =
= 1, 99
n3 N 3
2 V ( y1 ) = 2, 40 h / s
2 V ( y 2 ) = 8,35 h / s
2 V ( y 3 ) = 2,82 h / s
Para el conjunto de todos los hogares el estimador de la media es
1 3
Ni y i = 28, 23 h / s
N i =1
y la varianza de este estimador la podemos calcular basndonos en las varianzas de los
y st =
estimadores de la media en cada estrato mediante

1
V ( y st ) = 2
N
N
i =1
2
i
V ( y i ) = 1, 24
o, si se prefiere, utilizando
1 3 2 Si2 N i ni
Ni n N
N 2 i =1
i
i
el error para la estimacin de la media para todos los hogares est dado por
V ( y st ) =
2 V ( y st ) = 2, 22 h / s
Ejemplo 2.2. En el caso anterior, tambin se desea saber qu proporcin de hogares ven un
determinado programa, para decidir la conveniencia de insertar un anuncio en los intermedios
del mismo. La respuesta a la pregunta de si ven dicho programa en los hogares de la muestra
anterior se recoge a continuacin:
BARRIO A
BARRIO B BARRIO C
SI
NO
SI
SI
SI
NO
SI
SI
SI
SI
NO
SI
SI
NO
NO
NO
SI
SI
SI
NO
SI
NO
SI
NO NO
SI
NO
NO
SI
SI
Estime con un intervalo de confianza la proporcin de hogares del municipio donde se ve el
programa.
Solucin: en primer lugar se calculan las proporciones muestrales en cada estrato

p1 =
7
= 0, 4667
15
p2 =
5
= 0,8333
6
p3 =
6
= 0, 6667
9
La estimacin puntual de la proporcin de hogares del municipio donde se ve el programa es

1 3
Ni pi = 0, 60
N i =1
la varianza y error de estimacin asociados son
p st =
V ( p st ) =
1
N2
N
i =1
2
i
pi q i N i ni
= 0, 00748
ni 1 N i
2 V ( p st ) = 0,173
29
y el intervalo de confianza expresado en porcentajes es
( 60% 17,3% ) = ( 42, 7%, 77,3% )

2.3 Determinacin del tamao muestral.
El tamao muestral para conseguir un lmite para el error de estimacin de la media, B, viene
dado por 2 V ( y st ) = B donde V ( y st ) =
1
N2
N
i =1
2
i
i2 N i ni
ni N i 1
No podemos despejar el valor de todos los ni de una sola ecuacin a menos que conozcamos
la relacin entre los ni y n . Hay diversas formas de asignar el tamao muestral n en los
diferentes estratos
(problema de la asignacin de la muestra que estudiaremos a
continuacin), sustituyendo ni = ni en V ( y st ) se puede despejar n en funcin de los i

obteniendo el tamao muestral aproximado que se requiere para estimar con un lmite para
el error de estimacin B.
L
n=
i =1
N i2 i2
N 2 D + N i i2
i =1
B
D=
4
B2
y la misma expresin vale para el total tomando D =
.
4N 2
Al igual que en el m.a.s. para poder usar la anterior ecuacin necesitamos conocer las
varianzas poblacionales de los estratos o valores aproximados de ellas, para lo cual se pueden
usar las cuasivarianzas muestrales de una muestra previa o basarnos en el rango de variacin
de las observaciones dentro de cada estrato.
En el caso de variables dicotmicas se obtiene una expresin similar, teniendo en cuenta que
en este caso particular i2 = pi qi
L
n=
i =1
N i2 pi qi
N 2 D + N i pi qi
i =1
D=
30
B2
B2
(para estimar p) y la misma expresin vale para el total tomando D =
.
4
4N 2
2.4 Asignacin de la muestra.

Hay diversas formas de asignar el tamao muestral n en los distintos estratos.
El objetivo del diseo de una encuesta por muestreo es proporcionar estimadores con varianza
pequea (por tanto, pequeo error de estimacin) al menor coste posible.
El mejor esquema de asignacin est influido por:
El nmero total de elementos en cada estrato.
La variabilidad de las observaciones en cada estrato.
El coste de obtener una observacin en cada estrato.
2.4.1 Asignacin ptima.

La asignacin que minimiza el coste para un lmite para el error de estimacin fijado, B, se
denomina asignacin ptima y est dada por
N j j
cj
j =
i =1
N i i
ci
sustituyendo los j en la expresin que obtenamos antes para n se tiene el tamao total de la
muestra segn la asignacin ptima
L
Ni i ci
i =1
n=
i =1
Ni i
ci
N 2 D + N i i2
i =1
En el caso dicotmico las anteriores expresiones toman los valores

pjq j
cj
Nj
j =
N
i =1
N
n=
i =1
pi qi
ci
L
pi qi ci
i =1
pi qi
ci
N 2 D + N i pi qi
i =1
B2
B2
D=
(para estimar la media o p), D =
(para estimar el total).
4
4N 2
31
En algunas ocasiones interesa encontrar la asignacin que minimiza el error de estimacin

para un coste total fijo de obtencin de la muestra, C. En este caso la asignacin ptima
tambin es la respuesta y el tamao total de la muestra, n, viene dado por:
N i i
ci
C
n=
i =1
N
i
i =1
ci
Anlogamente para el caso dicotmico sustituyendo i =
pi qi .
2.4.2 Asignacin de Neyman.

Cuando los costes de observacin de cada estrato son los mismos, las expresiones de la
asignacin ptima se simplifican y transforman en:
Caso numrico
N j j
j =
N
i
i =1
( N )
L
n=
i =1
N 2 D + N i i2
i =1
Caso dicotmico
j =
N j pjqj
L
N
i =1
( N
pi qi
2
n=
i =1
pi qi
N 2 D + N i pi qi
i =1
A este tipo de asignacin se le denomina de Neyman que coincide con la asignacin ptima
solamente cuando los costes de observacin son iguales en todos los estratos. Esta asignacin
se utiliza an cuando los costes de observacin no son idnticos, a veces, sencillamente no se
conocen.
2.4.3 Asignacin Proporcional.

Si adems de los costes, coincide el valor de las varianzas en cada uno de los estratos, las
expresiones de la asignacin ptima y de Neyman se simplifican y reducen a
32
Caso numrico
Nj
j =
n=
N
i
i =1
ND +
1
N
2
i
N
i
i =1
2
i
Caso dicotmico
Nj
j =
n=
N pq
i
i =1
ND +
1
N
i i
N pq
i =1
i i
La asignacin Proporcional puede y suele utilizarse cuando las varianzas y costes de

observacin no son iguales para cada estrato, por la simplicidad de los clculos y por las
ventajas que presenta frente a los anteriores tipos de asignaciones:
Cuando se utiliza la asignacin Proporcional el estimador y st coincide con la media muestral
de la muestra que rene a todas las muestras de cada estrato, y st = y (anlogamente para p st
y el total).
Cuando se observa ms de una variable en cada unidad muestral para estimar ms de un
parmetro poblacional aparecen complicaciones en la asignacin y determinacin del tamao
muestral. Con la asignacin Proporcional y tomando como n el mximo de los valores
encontrados para cada estimacin se resuelve el problema como puede verse en el siguiente
ejemplo:
En la asignacin ptima y en la de Neyman los i dependen de las varianzas y pueden ser
distintos de una variable a otra
1 estimacin: n = 100 1 = 0,10 n1 = 10 2 = 0,90 n2 = 90
2 estimacin: n = 40 1 = 0,50 n1 = 20 2 = 0,50 n2 = 20
An tomando el mayor de los tamaos muestrales (100) y pasando la encuesta a 10 individuos
del estrato 1 y 90 del estrato 2 no tenemos garantizado que se satisfaga el error de estimacin
fijado para la segunda estimacin que necesita al menos 20 individuos de cada estrato.
33
En la asignacin Proporcional no ocurre lo anterior pues los j =
Nj
N
son iguales para todas
las variables al no depender de sus varianzas, as si en dos estimaciones para los niveles de
error requeridos tenemos lo siguiente
1 estimacin: n = 100 1 = 0,30 n1 = 30 2 = 0, 70 n2 = 70
2 estimacin: n = 40 1 = 0,30 n1 = 12 2 = 0, 70 n2 = 28
tomando como n el mximo de los dos (y en general para k variables), se tiene garantizado
que se cumple con los lmites para el error fijados para todas las estimaciones.
Ejemplo 2.3 Continuando con el ejemplo 2.1

a) Qu tipo de asignacin se ha utilizado?
Debido a los traslados necesarios no cuesta lo mismo obtener una observacin en un barrio
que en otro. Se estima que el coste de una observacin del barrio A es de 1, 9 para el barrio
B y 4 para el barrio C.
b) Cuntos hogares deberan entrevistarse para estimar el nmero medio de horas a la
semana que se ve la televisin en los hogares del municipio con un error inferior a 1
hora. (Tmese los anteriores datos como una muestra previa para estimar los
parmetros necesarios).
c) Supngase que se tiene slo 600 para gastar en el estudio, determine el tamao de la
muestra y la asignacin que minimizan el error de estimacin. (Como en el apartado
anterior, tmese los datos de la tabla como una muestra previa para estimar las
varianzas de los estratos).
Solucin:
a) Podemos comprobar que se cumple ni =
ni N i
=
n N
Ni
N
n i = i i
N
N
o equivalentemente que
i
15 210
=
= 0, 5
30 420
6
84
=
= 0, 2
30 420
9 126
=
= 0, 3
30 420
luego la asignacin utilizada ha sido la Proporcional.

b) Segn los datos anteriores estimamos las varianzas de cada estrato por
2
1 = S12 = 23, 24
34
2 = S22 = 112,56
3 = S32 = 19, 28
D=
Ni
ci
N i i ci
210
84
126
420
4,8208
10,6094
4,3909
1
3
2
1012,368
2673,5688
1106,5068
4792,4436
N i i
ci
1012,368
297,0632
276,6267
1586,0579
N i i2
4880,4
9455,04
2429,28
16764,72
B2 1
= = 0, 25
4 4
3
N
n=
i =1
Ni i
ci
ci
i =1
N 2 D + N i i2
4792, 4436 1586, 0579

= 124,89
( 4202 0, 25) + 16764, 72
i =1
N1 1
c
1 = 3 1 = 0, 6383
N i i
ci
i =1
n1 = n1 = 79, 71 80
2 = 0,1873
n2 = n2 = 23,39 24
3 = 0,1744
n3 = n3 = 21, 78 22
n = 80 + 24 + 22 = 126
c) En el supuesto de que se disponga slo de 600 para realizar el estudio
N i i
ci
600
n=
i =1
N
i =1
ci
600 1586, 0679

= 198,57
4792, 4436
y la asignacin de la muestra en cada estrato est dada por la asignacin ptima

n1 = 0, 6383n = 126, 75 126
n2 = 0,1873n = 37,19 37
n = 126 + 37 + 34 = 197
n3 = 0,1744n = 34, 63 34
o bien resolviendo la ecuacin

c1n1 + c2 n2 + c3 n3 = 600
donde ni = i n
c11n + c22 n + c33 n = 600
n=
600
600
=
= 198,57
c11 + c22 + c33 3, 0216
A partir de n se obtienen los ni = i n segn la asignacin ptima.
35
Ejemplo 2.4 Continuando con el ejemplo 2.2

a) Cuntos hogares deberan entrevistarse si se quisiera hacer dicha estimacin con un
error inferior al 5%. (Supngase que se realiza la entrevista por telfono y el coste de
las observaciones es el mismo para todos los casos al no ser necesarios los traslados.
Tmese los anteriores datos como una muestra previa para estimar los parmetros
necesarios)
b) Respndase a la pregunta anterior pero suponiendo que no se tiene ninguna
informacin previa sobre la proporcin de hogares donde se ve el programa.
Solucin: a)
Ni
pi
qi
N i pi qi
N i pi qi
210
84
126
420
0,4667
0,8333
0,6667
0,5333
0,1667
0,3333
52,2671
11,6685
27,9986
91,9342
104,7669
31,3075
59,3955
195,4699
B 2 0, 052
D=
=
= 0, 000625
4
4
( N
n=
i =1
pi qi
N 2 D + N i pi qi
195, 46992
= 188,98
( 4202 0, 000625) + 91,9342
i =1
n1 = n1 = n
N1 p1q1
= 188,98
N
i =1
anlogamente n2 = 30, 27 31
pi qi
104, 7669
= 101, 29 102
195, 4699
n3 = 57, 42 58
n = 102 + 31 + 58 = 191
b)
Ni
210
84
126
420
pi
0,5
0,5
0,5
qi
0,5
0,5
0,5
N i pi qi
52,5
21
31,5
105
n=
n1 = 204,878
N pq
i =1
1
ND +
N
i i
N pq
i =1
i i
105
105
( 420 0, 000625 ) +
420
210
= 102, 439 103 anlogamente n2 = 40,98 41
420
n = 103 + 41 + 62 = 206
36
= 204,878
n3 = 61, 46 62
El muestreo estratificado no siempre conduce a un estimador con menor error de

estimacin, esto suele ocurrir cuando los estratos no estn formados por elementos
suficientemente homogneos. Muchas veces es debido a que predomina el deseo de obtener
estimaciones en cada estrato (por ejemplo, en un estudio regional tambin se quieren obtener
estimaciones a nivel provincial) frente al objetivo de minimizar los errores de los estimadores.
Este problema queda bien ilustrado con el siguiente ejemplo.
Ejemplo 2.5 Un distribuidor de productos de limpieza desea conocer el consumo por hogar
durante un ao de un determinado producto en una comarca formada por cuatro municipios.
Para estimar de paso tambin el consumo en cada municipio decide usar muestreo
estratificado tomando cada municipio como un estrato. Se sabe que el 20% de la poblacin de
la comarca vive en el municipio 1, el 30% en el municipio 2, el 25% en el municipio 3 y el
25% restante en el municipio 4. El distribuidor tiene medios suficientes para controlar y
obtener datos sobre el consumo anual de 20 hogares.
Dado que no tiene informacin previa respecto a las varianzas de los estratos y porque el coste
del muestreo es el mismo en cada municipio, decide aplicar asignacin Proporcional, la cual
conduce a
N1
= 20 0, 20 = 4 de forma similar n2 = 6 n3 = 5 n4 = 5 .
N
Obteniendo los resultados de la tabla siguiente (consumo expresado en euros).
n1 = n
Estrato 1
470
510
500
550
y1 = 507,5 S12 = 1091,67
Estrato 2
490
500
470
520
550
500
y 2 = 505 S22 = 750
Estrato 3
540
480
500
470
470
Estrato 4
450
560
460
440
580
y 3 = 492 S32 = 870 y 4 = 498 S42 = 4420
Estime el consumo anual medio por hogar y fije un lmite para el error de estimacin.
Solucin:
y st =
1
N
N1
= 0, 20
N
i =1
i =1
Ni y i =
N2
= 0,30
N
N3
= 0, 25
N
N4
= 0, 25
N
Ni
y i = ( 0, 20 507, 5 ) + ( 0,30 505 ) + ( 0, 25 492 ) + ( 0, 25 498 ) = 500,5
N
Obsrvese que cuando se utiliza la asignacin Proporcional y st = y , efectivamente

y=
1 20
10010
yi =
= 500,5
n i =1
20
37
En la siguiente expresin consideramos los coeficientes correctores para poblaciones finitas en

cada estrato iguales a la unidad
1
V ( y st ) = 2
N
4
2
N i Si2
Si2 N i ni
N i2 Si2
N
= 2
=
=
ni N i
ni
i =1
i =1 N
i =1 N ni
4
2
i
1091, 67
2 750
2 870
2 4420
= 0, 202
+ 0, 30
+ 0, 25
+ 0, 25
= 88, 29
4
6
5
5

2 V ( y st ) = 18, 79
Supongamos que el distribuidor hubiera decidido tomar una muestra aleatoria simple de 20
hogares, los mismos 20 de la tabla anterior, entonces el estimador de la media hubiera sido
y=
1 20
yi = 500, 5
n i =1
que coincide con el estimador del muestreo estratificado por las razones mencionadas
anteriormente, pero la varianza estimada y error de estimacin asociados tomaran los valores
S n21 = 1520, 79
V ( y) =
S n21 N n 1520, 79
=
= 76, 04
n
N
20
, se supone
N n
1
N
2 V ( y ) = 17, 44
Se observa que el error de estimacin es menor en el caso del muestreo aleatorio simple, esto
es debido a que el distribuidor no tuvo en cuenta que el consumo vara mucho dentro del
cuarto municipio. Pudo haber obtenido un error menor si hubiera estratificado en base al
tamao de las familias u hogares, esto es, colocando los hogares pequeos en un estrato, los
medianos en otro, ..., es decir, formando los estratos con hogares que tengan un consumo
similar.
2.5 Estratificacin despus de seleccionar la muestra.

A veces no se sabe a qu estrato pertenece un dato hasta que no se observa (por ejemplo,
estratos segn sexo y entrevista telefnica).
Supngase una muestra aleatoria simple de n personas para una encuesta. La muestra puede
ser dividida en n1 masculinos y n2 femeninos despus de que ha sido realizada. Entonces en
lugar de usar y para estimar , podemos usar y st siempre que
Ni
sea conocido para todo i.
N
Obsrvese que en esta situacin los ni son aleatorios, ya que varan de una muestra a otra
aunque n sea fijo. Luego esto no es una muestra aleatoria estratificada en pleno sentido, pero
38
si
Ni
es conocido y ni 20 i , entonces este mtodo de estratificar despus de la seleccin
N
es casi tan exacto como el muestreo aleatorio estratificado con asignacin Proporcional. Este
mtodo no debe usarse si
Ni
o una buena aproximacin de su valor se desconocen.
N
Ejemplo 2.6 En una ciudad se sabe que el 30% de los hogares tienen calefaccin elctrica. Al
realizar una encuesta sobre el consumo de energa (valor en euros de la factura bimensual) se
obtuvieron los siguientes resultados:
Tipo Calefaccin N casas Valor total de las facturas desviacin tpica muestral
Elctrica
60
5730
200
No elctrica
40
2080
90
Obtenga una estimacin del valor medio de la factura de electricidad en la ciudad y el lmite
Solucin: Ya que la proporcin observada de facturas de hogares con calefaccin elctrica
(0,60=60/100) est muy alejada de la proporcin verdadera (0,30), es conveniente la
estratificacin despus de que se ha seleccionado la muestra aleatoria simple. Adems el
procedimiento se justifica pues tanto n1 como n2 superan 20.
y1 =
y st =
1
N
5730
= 95,5
60
i =1
i =1
Ni y i =
1
V ( y st ) = 2
N
y2 =
2080
= 52
40
Ni
y i = (0, 30 95,5) + (0, 70 52) = 65, 05
N
2
Si2 N i ni
N i2 Si2 N i ni
N
= 2
ni N i
ni N i
i =1
i =1 N
2
2
i
omitiendo el coeficiente corrector por poblaciones finitas se tiene

2
V ( y st ) =
i =1
2
2
2
N i Si2
N i2 Si2
2 200
2 90
=
=
0,30
+
0,
70

= 159, 225
N 2 ni
ni
60
40
i =1 N
2 V ( y st ) =25,24
A veces este mtodo de estimacin se utiliza para ajustar por no respuesta. Por ejemplo, si
muchos de quienes no respondieron a una muestra aleatoria simple son varones, entonces la
proporcin de varones en la muestra va a ser pequea, y se podra conseguir un estimador
ajustado mediante la estratificacin despus del muestreo.
39
As, en este ejemplo la baja representacin en la muestra de facturas sin calefaccin elctrica y
la alta de facturas con calefaccin elctrica conducen a una sobreestimacin del valor medio
de las facturas si se utiliza muestreo aleatorio simple y no se ajusta la estimacin de la media
con la estraficacin despus de seleccionar la muestra:
y=
5730 + 2080 7810

=
= 78,10
60 + 40
100
Con el muestreo aleatorio simple sobrevaloraramos el consumo medio de electricidad por

hogar (78,10>>65,05).
1. Un analista de la opinin pblica tiene un presupuesto de 20.000 euros para realizar una
encuesta sobre el nmero medio de coches por hogar. Se sabe que de los 10.000 hogares
de la ciudad, 9.000 tienen telfono. Las entrevistas por telfono cuestan 10 euros por hogar
llamado y las entrevistas personales cuestan 30 euros por hogar visitado. Suponga que las
varianzas en los estratos con y sin telfono son iguales. Con el objetivo de minimizar el
lmite de error de estimacin Cuntos hogares deben ser entrevistados en cada estrato si
los hogares que cuentan con servicio telefnico son entrevistados por telfono y los
hogares sin telfono son entrevistados personalmente?
SOLUCIN:
L
C
n=
i =1
N i i
ci
N
i =1
Ni
9.000
1.000
10.000
ci
C
=
i =1
N i
ci
C
=
N
i =1
ci
10
30
ci
i =1
Ni
ci
N i ci
i =1
Ni
ci
2.846,05
182,574
3.028,624
Ni
ci
C
=
i =1
N
i =1
ci
20.000 3.028, 624

= 1784,81
33.937, 726
N i ci
28.460,5 2.846,05/3.028,624=0,9397
5.477,226 182,574/3.028,624=0,0603
33.937,726
n1 = n1 = 1.784,81 0,9397 = 1677, 2 1677

n2 = n2 = 1.784,81 0, 0603 = 107, 59 107
n = n1 + n2 = 1784
40
1,0000
O bien
c1n1 + c2 n2 = 20.000
c11n + c22 n = 20.000
9, 397 n + 1,809n = 11, 206n = 20.000
20.000
= 1.784,8 = n
11, 206
Y a partir de n se obtienen n1 y n2 como antes.
2. Se desea conocer el nmero de fines de semana que las familias de una gran ciudad salen
fuera de ella. Se sabe que el 425% de las familias tienen de 0 a 2 hijos, el 30% tienen de 3
a 5 hijos y el 275% tienen ms de 5 hijos. Se realiz un muestreo segn el nmero de
hijos y se pregunt a las familias sobre los fines de semana que pasan fuera, obtenindose
los siguientes datos:
Nmero de hijos ni
yi
S i2
i =1
0-2
25 239 6076
3-5
19 174 6301
Mas de 5
16 78
7824
Estimar el nmero medio de fines de semana que las familias pasan fuera de la ciudad y
dar el lmite de error de estimacin. Omitir el corrector por poblacin finita.
SOLUCIN:
y1 =
y st =
Si
1
N
239
= 9,56
25
i =1
i =1
Ni y i =
y2 =
174
= 9,16
19
y3 =
78
= 4,87
16
Ni
y i = ( 0, 425 9, 56 ) + ( 0, 30 9,16 ) + ( 0, 275 4,87 ) = 8,15
N
N i ni
1
= 1 V ( y st ) = 2
Ni
N
Si2 N i ni
1
N
= 2
ni N i
N
i =1
L
2
i
2
L
L
Si2
N i2 Si2
N i Si
N
= 2
=
=
ni
ni
i =1
i =1 N
i =1 N ni
L
2
i
60, 77
2 63, 01
2 78, 24
= 0, 4252
+ 0,30
+ 0, 275
= 1,107
25
19
16
2 1,107 = 2,1
3. Una compaa de autobuses est planeando una nueva ruta para dar servicio a cuatro
barrios. Se tomaron muestras aleatorias de hogares en cada barrio y se solicit a los
miembros de la muestra que valorasen en una escala de 1 (totalmente opuesto) a 5
(totalmente a favor) su opinin sobre el servicio propuesto. Los resultados se resumen en la
tabla adjunta:
41
Barrio
1
2
3
4
N i 240 190 350 220
ni
25 25 25 25
y i 3,5 3,6 3,9 3,8
S i 0,8 0,9 1,2 0,7
a) Halle un intervalo de confianza para la opinin media de los hogares que dispondrn del
nuevo servicio.
b) Si se asigna la muestra de 100 hogares de la mejor forma, determine cuntos
perteneceran al barrio 3. (Suponga iguales los costes de observacin)
SOLUCIN:
a)
L
N = N i = 1000
y st =
i =1
1
N
Ni y i =3, 725
i =1
B = 2 V ( y st ) = 0,1973
b)
n3 = n3 = 100
N 3 3
= 100
N
i =1
V ( y st ) =
1
N2
Ni2
i =1
Si2 N i ni
= 0, 00973
ni N i
( 3,5277 , 3,9223)
350 1, 2
=
(240 0,8) + (190 0,9) + (350 1, 2) + (220 0, 7)
= 100 0, 4482 = 44,82 45

4. Una empresa especializada en seguros est pensando en ofrecer sus servicios a las
empresas de los polgonos industriales de una ciudad. Para ajustar sus tarifas desea estimar
el gasto en pequeas reparaciones de mantenimiento (objeto del seguro) de dichas
empresas. Se clasifican las empresas en funcin de su tamao. El nmero de empresas de
cada tipo, el coste de obtencin de esta informacin en cada empresa as como los valores
mnimos, medios y mximos de un estudio similar hecho hace dos aos se expresan en la
siguiente tabla (los costes y gastos estn expresados en euros)
Tipo de
Nmero de
Costes de
Gastos de reparacin
empresa
empresas
observacin
Mnimo
Media
Mximo
A
100
16
400
500
600
B
500
9
240
300
360
C
700
4
70
100
130
Si la empresa de seguros dispone de hasta 600 para llevar a cabo la estimacin, cuntas
empresas de cada tipo tiene que observar para conseguir que sea mnimo el error de
estimacin asociado?
SOLUCIN:
La asignacin que minimiza la cota del error de estimacin para un coste fijo es la
asignacin ptima.
42
Usamos que R4 y por tanto estimamos que

Ni
ci
100 16
500 9
700 4
600 = 16n1 + 9n2 + 4n3
Ri
ci
4
3
2
R
.
4
N i i
ci
600-400 50
360-240 30
130-70 15
1250 01087
5000 04348
5250 04565
11500
1
600 = 17392n + 39132n + 1826n = 74784n
( ni = in )
n = 600/74784 = 80231
n1 = 1n = 872 8
n2 = 2n = 3488 34 n3 = 3n = 3663 36
C = (168) + (934) + (436) = 578 < 600
pero
C = (169) + (935) + (437) = 607 > 600
5.
En una poblacin compuesta por aproximadamente igual nmero de hombres que de

mujeres se desea estimar el gasto medio mensual por habitante en ocio. Se lleva a cabo la
encuesta por telfono mediante una muestra aleatoria simple de 500 nmeros de telfono
del citado municipio. Despus de obtenidos los datos se observa que slo 100 de los
encuestados fueron hombres y el resto mujeres. Por ello se decide llevar a cabo una
estratificacin despus de seleccionar la muestra obtenindose los siguientes datos
Ni
HOMBRES
2.500
MUJERES
2.700
ni
100
400
yi
120
250
9.000
16.000
Si2
Estime la media poblacional de gasto mensual en ocio y su cota de error, mediante
muestreo aleatorio estratificado despus de seleccionar la muestra.
SOLUCIN:
Ni
ni
2.500
2.700
5.200
Si2
yi
100
400
500
120
250
9.000
16.000
y st =
1
V ( y st ) = 2
N
Ni y i
1
N
300.000
675.000
975.000
N y
i =1
2
i
0,96
0,85185
N i2
Si2 N i ni
ni N i
540.000.000
248.399.460
788.399.460
975.000
= 187, 5
5.200
Si2 N i ni 788.399.460
N
=
= 29,16
ni N i
5.2002
i =1
L
N i ni
Ni
2 29,16 = 10,8
43
6.
En una poblacin compuesta por aproximadamente igual nmero de hombres que de

mujeres se desea estimar la proporcin de individuos que ven un determinado programa
de televisin. Se lleva a cabo la encuesta por telfono mediante una muestra aleatoria
simple de 300 nmeros de telfono. Despus de obtenidos los datos se observa que slo
50 de los encuestados fueron hombres y el resto mujeres. Por ello se decide llevar a cabo
una estratificacin despus de seleccionar la muestra obtenindose los siguientes datos
HOMBRES
MUJERES
Encuestados
50
250
Ven el programa
12
130
Estime la proporcin de la poblacin que ven el programa de televisin y su cota de error,
mediante muestreo aleatorio estratificado despus de seleccionar la muestra.
SOLUCIN:
12
= 0, 24
50
p1 =
p st =
1
N
i =1
i =1
Ni pi =
p2 =
130
= 0,52 q i = 1 p i
250
Ni
p i = ( 0, 50 0, 24 ) + ( 0,50 0,52 ) = 0,38 p st = 38%
N
N i ni
=1
Ni
2
L
L
1 L 2 p i q i N i ni
1 L 2 p i q i
N i2 p i q i
N i p i q i
V ( p st ) = 2 N i
= 2 Ni
=
=
=
N i =1
ni 1 N i
N i =1
ni 1 i =1 N 2 ni 1 i =1 N ni 1
0, 24 0, 76
2 0,52 0, 48
= 0,502
+ 0,50
= 0, 0011812146
49
249
Si
2 V ( p st ) = 0, 0687 6,87%
7.
Una corporacin desea estimar el nmero total de horas perdidas debido a accidentes de
sus empleados, en un determinado mes. Ya que los obreros, tcnicos y administrativos
tienen diferentes tasas de accidentes, la corporacin decide usar muestreo estratificado,
formando con cada grupo un estrato. Datos de aos previos sugieren las cuasivarianzas
mostradas en la siguiente tabla para el nmero de horas perdidas por empleado en los tres
grupos, y de datos actuales se obtienen los tamaos de los estratos. No habiendo
diferencia entre los costes de observacin de cada grupo, determine la mejor asignacin
para una muestra de 40 empleados.
44
Obreros
Tcnicos
Administrativos
Si2
36
25
Ni
132
92
27
SOLUCIN:
Ni
132
i Si
N i i
792
i
792
1.333
= 0,5941
= 0,3451
1.333
81
= 0, 0608
27
3
81
1.333
1.333
1
Donde se ha aplicado la asignacin de Neyman al ser los costes de observacin iguales:
92
j =
N j j
N
i
460
460
n1 = 40 0,5941 = 23,8 24
n2 = 40 0, 3451 = 13,8 14
i =1
8.
n3 = 40 0, 0608 = 2, 4 2
n = 40
Se dispone de la siguiente informacin sobre tamaos poblacionales de los estratos, costes

de observacin y estimaciones de las proporciones
Tamao del estrato Coste de observacin Proporciones en %
ESTRATO 1
5000
9
90
ESTRATO 2
2000
25
55
ESTRATO 3
3000
16
70
Determine la mejor asignacin para una muestra de 200 observaciones.
SOLUCIN:
Ni
ci
q i
pi
p i q i
N i p i q i
ci
5.000
0,90
0,10
0,3
500
2.000
0,55
0,45
0,4975
199
3.000
0,70
0,30
0,45826
343,695
1.042,695
500
1.042, 695
= 0, 4795
= 0,1909
1.042, 695
343, 695
= 0,3296
1.042, 695
1
199
Donde se ha aplicado la asignacin ptima:

Nj
j =
N
i =1
9.
p jq j
n1 = 200 0, 4795 = 95,9 96
cj
n2 = 200 0,1909 = 38, 2 38
pi qi
ci
n3 = 200 0,3296 = 65,9 66

n = 200
La produccin de piezas de una factora se realiza en dos mquinas. El 40% de las piezas
las produce la mquina A y el 60% restante la mquina B. Se les pas control de calidad a
200 piezas; 67 producidas por la mquina A y dos de ellas resultaron defectuosas; las 133
restantes procedan de la mquina B, siendo 6 de ellas defectuosas. Estimar la proporcin
de piezas defectuosas de la factora y dar el lmite de error de estimacin. Omita el
coeficiente corrector por poblacin finita.
45
SOLUCIN:
p=
Estrato
Ni
ni
pi
A
B
0.40 N
0.60 N
N
67
133
200
2/67=0.030
6/133=0.045
p i q i
ni 1
0.000441
0.000326
1
( ( 0.40 N 0.030 ) + ( 0.60 N 0.045) ) = ( ( 0.40 0.030 ) + ( 0.60 0.045) ) = 0.039
N
( )
( 3.9% )
1
0.402 N 2 0.000441) + ( 0.602 N 2 0.000326 ) =
2 (
N
= ( 0.402 0.000441) + ( 0.602 0.000326 ) = 0.000188
V p =
B = 2 0.000188 = 0.0274
( 2.74% )
10. Para la comercializacin de un producto se le clasifica, atendiendo al calibre, en tres

categoras: pequea, mediana y grande. Un establecimiento dispone de 300 piezas
pequeas, 500 medianas y 200 piezas grandes. Para estimar el peso total de producto
almacenado se decide tomar una muestra aleatoria que contenga piezas de todas las
categoras, resultando
Categora N de piezas Peso en gramos
Pequea 5
12, 14, 12, 15, 12
Mediana 6
16, 22, 24, 20, 20, 18
Grande
4
30, 33, 31, 34
Considerando los anteriores datos como una muestra previa, obtenga el nmero de
unidades que cada categora debe aportar a la muestra para que el error en la estimacin
del peso total no supere el medio kilo.
SOLUCIN:
Peso en gramos
(con las funciones del modo SD de la calculadora )
12, 14, 12, 15, 12
S1 = 1, 4142
S12 = 2
16, 22, 24, 20, 20, 18 S 2 = 2,8284
S 22 = 8
30, 33, 31, 34
46
S3 = 1,8257
S32 = 3, 3333
Ni
N i i
2
i
N i
j =
2
i
N j j
i =1
300
500
200
1,4142
2,8284
1,8257
2
8
3,3333
N = 1000
424,26
1414,2
365,14
600
4000
666,66
2203,6
5266,66
n=
13, 79 14
45,99 46
11,87 12
n = 72
( N )
i =1
0,1925
0,6418
0,1657
B2
250.000
D=
=
= 0, 0625
2
4N
4.000.000
ni = 71, 66i
= 71, 66
N D + N i
2
i =1
2
i
11. Una inspectora de control de calidad debe estimar la proporcin de circuitos integrados de
ordenador defectuosos que provienen de dos diferentes operaciones de ensamble. Ella
sabe que de entre los circuitos integrados que van a ser inspeccionados, 60% procede de
la operacin de ensamble A y 40% de la operacin de ensamble B. En una muestra
aleatoria de 100 circuitos integrados resulta que 20 provienen de la operacin A y 80 de la
operacin B. De entre los circuitos integrados muestreados de la operacin A, 2 son
defectuosos. De entre las piezas muestreadas de la operacin B, 16 son defectuosas.
a. Considerando nicamente la muestra aleatoria simple de 100 circuitos
integrados, estime la proporcin de los defectuosos en el lote, y establezca un
b. Estratifique la muestra, despus de la seleccin, en circuitos integrados
provenientes de la operacin A y B, estime la proporcin de los defectuosos en
la poblacin, y fije un lmite para el error de estimacin.
c. Qu respuesta encuentra ms aceptable? Por qu?
SOLUCIN:
a. p =
18
pq
= 0,18 (18%) V ( p ) =
= 0, 001491 2 V ( p ) = 0, 0772
100
n 1
b. p st =
1
N
i =1
i =1
Ni pi =
1
V ( p st ) = 2
N
Ni
2
16
p i = 0, 60 + 0, 40 = 0,14
N
20
80
L
L
p i q i N i ni
N i2 p i q i
N
=
=
2
ni 1 N i
i =1
i =1 N ni 1
i =1
= ( 0, 60 )
2
i
( 7, 72% )
(14% )
2
N i p i q i
=
N ni 1
0,10 0,90
2 0, 20 0,80
+ ( 0, 40 )
= 0, 00203
19
79
2 V ( p st ) = 0, 0901
( 9, 01% )
47
c. Aunque en el conjunto de la poblacin hay ms elementos que proceden de A (60%)

que de B (40%), la muestra global no representa adecuadamente este hecho,
predominando los elementos de B (80) frente a los de A (20), esto ocasiona que en el
apartado a. la estimacin est sesgada hacia el valor de B ( p 2 = 0, 20 ) frente al de A
( p1 = 0,10 ). En el apartado b.
este hecho se corrige dando a p1 y p 2 las
ponderaciones 0,60 y 0,40 respectivamente para estimar p.
12. Una cadena de restaurantes tiene 100 establecimientos en Madrid, 70 en Barcelona y 30

en Sevilla. La direccin est considerando aadir un nuevo producto en el men. Para
contrastar la posible demanda de este producto, lo introdujo en el men de muestras
aleatorias de 10 restaurantes de Madrid, 5 de Barcelona y 5 de Sevilla. Usando los ndice
1, 2 y 3 para designar Madrid, Barcelona y Sevilla, respectivamente, las medias y las
desviaciones tpicas muestrales del nmero de pedidos de este producto recibidos por
restaurante en las tres ciudades durante una semana fueron:
y1 = 21, 2
S1 = 12
y2 = 13, 3
S 2 = 11
y3 = 26,1
S3 = 9
a. Estimar el nmero medio de pedidos semanales por restaurante para los

restaurantes de la cadena. Dar un lmite del error de estimacin.
b. Determinar el tamao muestral y la asignacin para repetir el estudio anterior
cometiendo un error inferior a 3 pedidos.
SOLUCIN:
a. y st =
V ( y st ) =
1
N
N y
i
i =1
1
N2
Ni2
i =1
3834
= 19,17 pedidos / semana
200
Si2 N i ni
= 6, 2965
ni N i
2 V ( y st ) = 5, 02 pedidos / semana
b.
Ni
2
i
N i i
N i
2
i
j =
N j j
N
i =1
100
70
30
N = 200
48
12
11
9
144
121
81
ni = 43, 52i
1200
770
270
14400
8470
2430
0,5357
0,3438
0,1205
2240
25300
23, 31 24
14,96 15
5, 24 6
n = 45
( N )
L
D=
B2 9
= = 2, 25
4 4
n=
i =1
= 43,52
N D + N i
2
i =1
2
i
13. De una ciudad con 350 casas, se sabe que 164 de ellas tienen calefaccin elctrica. Al
realizar una encuesta sobre el consumo de energa (en kilovatios-hora) se obtuvieron los
siguientes resultados:
Tipo Calefaccin N casas Media muestral Cuasivarianza muestral
Elctrica
24
972
202,396
No elctrica
36
463
96,721
a. Obtenga una estimacin del nmero medio de kilovatios-hora utilizado en la
ciudad. D un lmite para el error de estimacin.
b. Obtenga una estimacin del nmero medio de kilovatios-hora utilizado por las
casas que no tienen calefaccin elctrica. D un lmite para el error de
estimacin.
SOLUCIN:
a.
Ni
164
186
350
ni
24
36
Si2
yi
972
463
202,396
96,721
y st =
V ( y st ) =
Ni y i
1
N2
1
N
L
N y
i
i =1
Ni2
i =1
159.408
86.118
245.526
N i ni
Ni
0,854
0,806
Si2 N i ni
N
ni N i
193.699,13
74.925,32
268.624,45
2
i
245.526
= 701, 50
350
Si2 N i ni 268.624, 45
=
= 2,19
ni N i
3502
2 2,19 = 2,96
b.
y 2 = 463
V ( y2 ) =
S 22 N 2 n2 96, 721 186 36

=
= 2,17
n2 N 2
36
186
2 2,17 = 2, 94
49
3. Muestreo con informacin auxiliar.

3.1 Introduccin.
3.2 Estimacin de razn.
3.2.1 Estimacin de la media y total poblacionales.
3.3 Estimacin de regresin.
3.4 Estimacin de diferencia.
3.1 Introduccin.
Si entre dos variables existe una fuerte relacin es posible utilizar la informacin auxiliar
que tengamos de una variable, como puede ser la media o el total poblacional, para estimar la
media o el total de la otra variable.
Notaremos por
Y Variable bajo estudio
X Variable que proporciona la informacin auxiliar
De las que tomaremos una muestra constituida por n pares de datos:
(x1 , y1 ),..., ( x n , y n )
A partir de los datos muestrales se puede estimar la relacin existente entre ambas
variables.
Pueden utilizarse distintos diseos de muestreo en la estimacin con informacin auxiliar.
Aqu suponemos que se emplea el muestreo aleatorio simple.
La estimacin con informacin auxiliar es importante cuando se pretende estimar el total sin
conocer el nmero de elementos de la poblacin pero s el valor total de la variable que
proporciona la informacin auxiliar.
Poe ejemplo, debido a que existe una fuerte relacin entre renta y ahorro, se puede estimar el
valor total de los ahorros de los individuos de una poblacin si se conoce el valor total de las
rentas de dichos individuos. As, si se sabe que por trmino medio el 10% de la renta se dedica
al ahorro y se conoce la renta total, el ahorro total se estima igual al 10% de la renta total.
Observemos que la estimacin del total de ahorro se ha llevado a cabo sin necesidad de
conocer el nmero de individuos de la poblacin, N.
50
Dependiendo de la relacin entre las variables X e Y utilizaremos:
Estimadores de razn ( y = bx o con otra notacin
y = rx )
Estimadores de regresin ( y = a + bx )
Estimadores de diferencia ( y = a + x o con otra notacin
y = d + x)
Estos estimadores slo se deben utilizar si entre las dos variables existe una fuerte relacin
lineal positiva, rxy >
1
.
2
3.2 Estimacin de razn

Dada una poblacin de tamao N en la que se consideran las variables X e Y , se define la
razn como el cociente:

R=
y
x
Es decir, la proporcin del total de Y respecto del total de X . Puesto que y = N y y
x = N x , obtenemos
R=
N Y Y
=
N X X
De estas definiciones se deduce que
y = R x
y = R x
Por tanto, si se conocen los valores de la media y el total de la variable X , para estimar la
media y el total de Y slo hay que estimar el valor de R (que notaremos como R = r ):
y = r x
y = r x
Puesto que la razn R es el cociente entre las medias poblacionales, tomando una muestra
aleatoria simple:
( y1 , x1 ) ,..., ( yn , xn ) ,
podemos estimar R tomando el cociente entre las
medias muestrales:
ESTIMADOR DE LA RAZN:
VARIANZA ESTIMADA DE r :
1 n
yi
y n
i =1
r= =
=
x 1 n
xi
n i =1
y
i =1
n
x
i =1
1 S2 N n
1 n
2
V (r ) = 2 r
,
( yi rxi )2
S
=
r
x n N
n 1 i =1
51
3.2.1 Estimacin de la media y el total poblacionales

Hemos de suponer que entre X e Y existe una alta correlacin lineal positiva y que el
modelo lineal, donde X es la variable explicativa e Y la explicada, pasa por el origen,
( y = bx,
en este contexto se nota b = r dado su significado, y = rx )
ESTIMADOR DE LA MEDIA:
y = r x
Para estimar y necesitamos conocer el verdadero valor de x . No vale la estimacin
x x
VARIANZA ESTIMADA DE y :
S2 N n
V ( y ) = x2V (r ) = r
n N
ESTIMADOR DEL TOTAL:
y = r x
2 S2 N n
S r2
VARIANZA ESTIMADA DE y : V (y ) = x2V ( r ) = x2 r
=
N
N
n
(
)
x n N
n
Si
x y N son desconocidos no podemos utilizar la expresin anterior. Entonces si
N n
= 1 y aproximando x por x se tiene
N
2 S2
V ( y ) x2 r
x n
Comentarios sobre estos estimadores:
Son estimadores sesgados.
Cuando N es desconocido y si estimamos que n 5% N , es decir que

entonces
N n
0,95 ,
N
N n
1 . (Vase ejercicio resuelto 4)
N
De la relacin x =
x
N
, se sigue que conociendo dos de estos elementos se puede
3840
calcular el tercero. (Vase ejemplo 3.1: = x =
= 5,12 ha / socio )
x N
750
A la hora de estimar el total, aunque conozcamos el tamao de la poblacin, cuando

existe una fuerte correlacin entre las variables, se comporta mejor el muestreo con
informacin auxiliar ( y = r x ) que el muestreo aleatorio simple ( = Ny ) . (Vase

ejemplo 3.5)
52
Ejemplo 3.1
Mediante una tasacin previa se desea estimar la produccin media y la produccin total de
los 750 socios de una cooperativa agrcola. Se sabe que el total de superficie plantada es de
3840 hectreas. Se realiz un sorteo entre los socios para elegir a 20 de ellos a los que se les
pregunt por la superficie plantada y se les tas su produccin. Los resultados fueron:
Superficie Produccin
3,7
12
4,3
14
4,1
11
5
15
5,5
16
3,8
12
8
24
5,1
15
5,7
18
6
20
3
8
7
20
5,4
16
4,4
14
5,5
18
5
15
5,9
18
5,6
17
5
15
7,2
22
Estime la produccin media y total mediante los estimadores de razn y muestreo aleatorio
simple. Calcule sus respectivos lmites para el error de estimacin y comprelos.
Solucin
Y = " produccin (toneladas, tm)"

X = "superficie plantada (hectreas, ha)"
xi
yi
xi2
yi2
xi yi
3,7
4,3
4,1
5
5,5
3,8
8
5,1
5,7
6
3
7
12
14
11
15
16
12
24
15
18
20
8
20
13,69
144
44,4
18,49
196
60,2
16,81
121
45,1
25
225
75
30,25
256
88
14,44
144
45,6
64
576
192
26,01
225
76,5
32,49
324
102,6
36
400
120
64
24
49
400
140
53
5,4
4,4
5,5
5
5,9
5,6
5
7,2
105,2
TOTALES
16
14
18
15
18
17
15
22
320
29,16
256
86,4
19,36
196
61,6
30,25
324
99
25
225
75
34,81
324
106,2
31,36
289
95,2
25
225
75
51,84
484
158,4
581,96
5398
1770,2
Del enunciado y de la tabla anterior obtenemos:

n = 20
n
i =1
= 105, 2
y
i =1
y=
1 n
320
yi =
= 16
n i =1
20
x
i =1
1 n
105, 2
xi =
= 5, 26
n i =1
20
1 n
xi x
n i =1
= 320
x=
sxy =
x = 3840 ha
N = 750 socios
sx2 =
s y2 =
2
i
= 581, 96
i =1
1 n
xi x
n i =1
1 n
yi y
n i =1
2
i
= 5398
x y
i =1
= 1770, 2
2
1 n 2
581,96
xi x =
5, 26 2 = 1, 4304
n i =1
20
2
1 n 2
5398
yi y =
16 2 = 13,9
n i =1
20
2
( 5, 26 16 ) = 4, 35
)( y y ) = 1n x y x y = 1770,
20
n
i =1
Si queremos calcular las cuasivarianzas a partir de las varianzas:

S x2 =
n 2 20
s x = 1, 4304 = 1,5057
n 1
19
S y2 =
n 2 20
s y = 13,9 = 14, 6316
n 1
19
y hallando las races cuadradas obtenemos las desviaciones tpicas
(s , s )
x
y las
cuasidesviaciones tpicas ( S x , S y ) .
Los anteriores clculos que se han realizado a mano o con ayuda de una calculadora bsica se
simplifican notablemente si utilizamos una calculadora cientfica de uso comn. Estas
calculadoras nos proporcionan los valores de un grupo de funciones estadsticas de forma
inmediata:
n n = s x = desviacin tpica
La relacin entre las variables es alta, rxy =
s xy
sx s y
n 1 = S x = cuasidesviacin tpica
4,35
= 0, 9756 . Esto, junto con la
1,196 3, 728
informacin auxiliar que disponemos de la variable X, justifica el uso de estimadores de
54
razn. Por otra parte, dado el contexto, es lgico que la relacin pase por el origen (a 0 ha de
superficie le corresponde una produccin de 0 tm).
20
r=
y
i =1
20
x
i =1
320
= 3,042 tm/ha
105, 2
y = r x = 3, 042 3840 = 11680,6 tm
3840
= x =
= 5,12 ha / socio
x
750
y = r x = 3, 042 5,12 = 15,57 tm/socio

Sr =
2
20
1 20
1 20 2 2 20 2
2
y
+
r
x
2
r
xi yi
( yi rxi ) =
i
i
n 1 i =1
n 1 i =1
i =1
i =1
Sr2 N n
V (y ) =
= 0, 0344
n N
B = 2 V ( y ) = 0,37 tm/socio
2
2 S2 N n
2 Sr N n
V (y ) = x2 r
=
N
= 19326,75
x n N
n N
=0, 706
B = 2 V (y ) = 278,04 tm
B = 750 B = 750 0,37 = 277,5 tm (los dos procedimientos no coinciden por simples
errores de redondeo en el valor de B ).
A continuacin lo estimaremos utilizando muestro aleatorio simple:
y=
320
= 16 tm / socio
20
S 2 N n 14, 63 750 20
V y =
= 0, 712
n N
20 750
( )
B = 2 0, 712 = 1, 69 tm / socio
= Ny = 750
320
= 12000 tm
20
S2 N n
2 14,63 750 20
V ( ) = N 2
= 750
= 400539,47
n N
20 750
B = 2 400539, 47 = 1265,76 tm o B = 750 B

Observemos que el lmite del error de estimacin, tanto para la media como para el total, es
mucho mayor que el cometido utilizando estimadores de razn.
3.2.2 Determinacin del tamao muestral

Tamao muestral mnimo para que la estimacin de la razn, la media y el total no supere una
cota de error B
55
N r2
n= 2
r + ND
donde para estimar:
la razn:
D=
B 2 x2
4
la media:
D=
B2
4
el total:
D=
B2
4N 2
Comentarios:
r2 se estima utilizando una muestra previa: r2 = S r2 .
Si x es desconcocido, x2 = x 2
Ejemplo 3.2 (continuacin del ejemplo 3.1)

Supongamos que queremos reducir el lmite para el error de estimacin de la media a 0,25
tm/socio y el del total no debe superar las 200 tm a cuntos socios se les debe tasar su
produccin antes de realizar una nueva estimacin?
Solucin
MEDIA: n =
TOTAL: n =
N r2
2
B
4
r2 + N
N r2
r2 + N
B2
4N 2
750 0, 706
= 42,6 43 socios
0, 252
0, 706 + 750
N r2
750 0, 706
=
= 37, 7 38 socios
2
B
2002
2
r +
0, 706 +
4N
4 750
Necesitamos al menos 43 socios para cumplir con ambos niveles de error.
3.3 Estimacin de regresin

El uso del estimador de razn es ms efectivo cuando la relacin entre las variables X e Y es
lineal y pasa por el origen de coordenadas (en este caso proporciona estimadores insesgados).
En caso de relacin lineal que no pase por el origen de coordenadas es preferible utilizar
estimadores de regresin.
En el modelo lineal simple Y = a + bX , el mtodo de mnimos cuadrados permite estimar a y
b de la siguiente forma:
56
s
b = xy2 =
sx
( y
i =1
y )( xi x )
( x x )
i =1
a = y bx
donde
s x2 =
1 n
1 n 2
2
x
x
=
xi x 2
(
)
i
n i =1
n i =1
s xy =
1 n
1 n
=
x
x
y
y
(
)(
)
i
xi yi x y
i
n i =1
n i =1
yL = a + b x = y bx + b x = y + b ( x x )
Para estimar yL necesitamos conocer el verdadero valor de x . No vale la estimacin
x x
S2 N n
VARIANZA ESTIMADA DE yL : V ( yL ) = L
n N
siendo S L2 la varianza residual en el modelo lineal simple:
S L2 =
1 n
yi ( y + b ( xi x ) )
n 2 i =1
2
n 2 s xy
n 2
s
s y (1 rxy2 )
=
y
2
n2
sx n 2
yL = N yL
En este caso para estimar el total es necesario conocer el tamao de la poblacin N. No

se puede estimar como yL = a + b x ya que la recta de regresin no pasa por el punto
, y ) .
VARIANZA ESTIMADA DE yL :
V ( yL ) = N 2V ( yL )
Ejemplo 3.3
Para un grupo de 1000 pequeos establecimientos se desea realizar un estudio sobre las ventas
diarias. Se tiene informacin de que, por trmino medio, el gasto en publicidad es de 5 euros.
Se elige al azar una muestra de 18 establecimientos y se toman datos de su gasto en publicidad
y ventas diarios. Los resultados son:
57
Gastos Ventas
3,7
120
4,3
140
4,1
135
5
150
5,5
160
3,8
120
8
160
5,1
150
5,7
125
6
130
0
80
7
150
5,4
150
4,4
120
5,5
140
5
150
5,9
150
6,6
170
Estime el total de ventas diarias y la media utilizando estimadores de regresin. Obtenga el
Solucin
Notamos Y = " ventas diaria (euros)" ;
n = 18 establecimientos
X = " gastos diarios en publicidad (euros)"
N = 1000 establecimientos
x = 5
Tal y como se explic en la resolucin del ejemplo 3.1 obtenemos:
x = 5, 0556
y = 138,889
sx = 1, 6375 sx2 = 2, 6814
s y = 20,314 s 2y = 412,654
sxy = 27, 7284
La relacin entre las variables es fuerte: rxy = 0,8336 .
b=
s xy
s
2
x
27,7284
= 10,341
2,6814
yL = y + b ( x x ) = 138,889 + 10, 341( 5 5,0556) = 138, 314

yL = N yL = 138314
S L2 =
n 2
s y (1 rxy2 ) = 141, 6
n2
B = 2 V ( yL ) = 5,56
58
S2 N n
V ( yL ) = L
= 7, 73
n N
B = N B = 1000 5,56 = 5560

Tamao muestral mnimo necesario para que al estimar la media y el total poblacionales la
cota de error no supere el valor B
n=
N L2
L2 + ND
donde para estimar:
la media: D =
el total:
D=
B2
4
B2
4N 2
L2 se estima utilizando una muestra previa: L2 = S L2

Se quiere repetir el estudio anterior de forma que el error para la estimacin del total no supere
los 1000 euros cul debe ser el tamao muestral?
Solucin
n=
N L2
L2 + N
B
4N 2
1000 141, 6
= 361, 6 362 establecimientos.
1000 2
141, 6 + 1000
4 1000 2
3.4 Estimacin de diferencia

El uso del estimador de diferencia tiene un buen comportamiento (cota de error ms baja)
cuando la relacin entre las variables es lineal y la pendiente del modelo es uno.
(y =a+x
y = y + ( x x) a = y x = d
Comnmente se emplea en procedimientos de auditora.
yD = y + ( x x ) = x + d
d = yx
Para estimar yD necesitamos conocer el verdadero valor de x . No vale la estimacin
x x
S D2 N n
VARIANZA ESTIMADA DE yD : V ( yD ) =
n N
59
2
2
1 n
1 n
(
(
)
)
(
y
x
+
d
=
d i d ) , donde d i = y i xi , por tanto S D2 es la
i
i
n 1 i =1
n 1 i =1
cuasivarianza de los d i .
S D2 =
yD = N yD
En este caso para estimar el total es necesario conocer el tamao de la poblacin N. No

se puede estimar como yL = y + ( x x ) = x + d por anlogas razones a las expuestas
en el estimador de regresin.
VARIANZA ESTIMADA DE YD : V ( yD ) = N 2V ( yD )
Ejemplo 3.5
Para un grupo de 200 establecimientos se desea realizar un estudio sobre el gasto diario. Se
tiene informacin de que los ingresos medios diarios son de 500 euros. Se elige al azar una
muestra de 10 establecimientos y se toman datos de ingresos y gastos, obtenindose:
X=Ingresos Y=Gastos
470
405
650
585
710
650
300
240
475
410
505
435
610
550
380
320
540
480
520
460
Estime el gasto medio y el gasto total diario para los 200 establecimientos utilizando muestreo
aleatorio simple, estimadores de razn, regresin y diferencia. Obtenga el lmite para el error
de estimacin en cada caso.
Solucin
Y = "gasto diario (euros)"
Denotamos
"
X = "ingresos diarios (euros)
n = 10 establecimientos
N = 200 establecimientos
x = 500
Tal y como se explic en la resolucin del ejemplo 3.1 obtenemos:

x = 516
y = 453,5
s x = 115, 797
s x2 = 13409
s y = 115,738
s 2y = 13395,3
60
S y2 = 14883,7
s xy = 13396,5
La relacin entre las variables es muy fuerte: rxy = 0,99958
rxy2 = 0,99916 .
MUESTREO ALEATORIO SIMPLE
= y = 453,5
= Ny = 90700
) = S N n = 1413,94
V(
n N
ESTIMADORES DE RAZN
2
y
r=
y
= 0,879
x
Sr =
2
) = 75,20
B = 2 V(
x = 200 x = 100000
B = 200 B =15040,97
y = r x = 87900
y = r x = 439,5
n
1 n
1 n 2 2 n 2
2
y
rx
=
y
+
r
x
2
r
xi yi
(
)
i i n 1
i
i
n 1 i =1
i =1
i =1
i =1
S2 N n
V ( y ) = r
= 21, 63
n N
= 227, 717
B = 9,3
B = N B =1860
ESTIMADORES DE REGRESIN
s
13.396,5
b = xy2 =
= 0,99907
sx
13.409
yL = y + b ( x x ) = 437,515
n 2
S =
s y (1 rxy2 ) = 14,05
n2
S L2 N n
V ( yL ) =
= 1,33
n N
2
L
B = 2, 3104
yL = N yL = 87.503
B = NB = 462, 09
ESTIMADORES DE DIFERENCIA
d = 62,5
yD = x + d = 437,5
yD = N yD = 87500
(con la calculadora hallamos n 1 sobre las diferencias d i y lo elevamos al cuadrado)
1 n
S =
di d
n 1 i =1
2
D
S2 N n
V ( yD ) = D
= 1,1875
n N
= 12, 5
B = 2 V ( yD ) = 2,179
B = NB = 435,8899

Tamao muestral mnimo necesario para que la estimacin no supere un cota de error B al
estimar la media y el total poblacionales
n=
N D2
D2 + ND
61
donde para estimar:
la media: D =
el total:
D=
B2
4
B2
4N 2
D2 se estima utilizando una muestra previa: D2 = S D2

Ejemplo 3.6 (continuacin ejemplo 3.5)
Se quiere repetir el estudio anterior utilizando un estimador de diferencia y cometiendo un
error como mximo de 300 euros al estimar el total cul debe ser el tamao muestral?
Solucin
N D2
200 12,5
n=
=
= 20 establecimientos
2
300 2
B
2
D + N
12, 5 +
4N 2
4 200
1. En una poblacin de 500 hogares, para la que es conocido que el gasto total general
durante un ao es de 15000000 , se quiere estimar el gasto total en alimentacin durante
un ao, para lo que se obtiene una muestra aleatoria simple de 4 hogares que proporciona
los siguientes valores anuales en :
Gasto en alimentacin 12500 15000 10000 17500
Gasto general
24000 31000 20000 36000
Estime con un estimador de razn el total de gasto en alimentacin mediante un intervalo

de confianza.
SOLUCIN (trabajaremos en cientos de euros)

xi
yi
xi yi
xi2
yi2
240 125 57600 15625 30000
310 150 96100 22500 46500
200 100 40000 10000 20000
360 175 129600 30625 63000
1110 550 323300 78750 159500
62
N = 500 n = 4 r =
y
i =1
n
x
i =1
550
= 0, 4955 y = r x = 0, 4955 150000 = 74325 cientos de
1110
y = 7432500
2
n
1 n
1 n 2 2 n 2
62, 2
S =
y
+
r
x
2
r
xi yi =
= 20, 73
( yi rxi ) =
i
i
n 1 i =1
n 1 i =1
3
i =1
i =1
2
r
S
V ( y ) = N ( N n) r = 1285, 4667
2 V ( y ) = 2267,568
n
y ( 72057, 432 ; 76592,568) en cientos de
Para expresarlo en hay que multiplicarlo por cien.
2. Un trabajador social quiere estimar la ratio personas/habitacin en un determinado barrio.
El trabajador social selecciona una muestra aleatoria simple de 25 viviendas de las 275 del
barrio. Sea x el nmero de personas en cada vivienda e y el nmero de habitaciones por
vivienda. A partir de los datos siguientes:
x = 9,1;
25
xi2 = 2240;
y = 2, 6;
i =1
25
yi2 = 169;
i =1
25
x y
i =1
= 522
Estime la razn personas/habitacin en el barrio y establezca el lmite para el error de

estimacin con una confianza del 95%.
SOLUCIN (los papeles de las variables x e y deben permutarse en las expresiones

del formulario)
n
N = 275 n = 25 r =
x
i =1
n
i =1
2
S r2 =
2
x
= 3,5 pers. / hab. y2 y = 2, 62 = 6, 76
y
n
1 n
1 n 2 2 n 2
ry
=
x
+
r
y
2
r
xi yi = 27,34375
( i i)
i
i
n 1 i =1
n 1 i =1
i =1
i =1
V (r ) =
1 ( N n) S r2
= 0,1471
y2 N
n
2 V (r ) = 0, 767
3. Se desea estimar el agua utilizada en la presente campaa por una comunidad de riego
constituida por 250 parcelas. Se seleccionan al azar 10 parcelas cuyo tamao y metros
cbicos utilizados en riego aparecen en la siguiente tabla
m3
600
1800
750
900
1100
1400
950
700
1000
720
Hectreas
50
150
60
70
100
120
80
60
90
60
63
Estime la media de m3 /hectrea que utiliza la comunidad de regantes y la cota del error de
dicha estimacin.
SOLUCIN:
Y = consumo de m3 de agua,
X = tamao de la parcela en hectreas
xi
xi2
yi
50
150
60
70
100
120
80
60
90
60
840
600
1800
750
900
1100
1400
950
700
1000
720
9920
2500
22500
3600
4900
10000
14400
6400
3600
8100
3600
79600
yi2
360000
3240000
562500
810000
1210000
1960000
902500
490000
1000000
518400
11053400
xi yi
30000
270000
45000
63000
110000
168000
76000
42000
90000
43200
937200
r=
y
i =1
n
x
i =1
9920
= 11'81 m3 / hectarea
840
n
1 n
1 n 2 2 n 2
2
y
rx
=
y
+
r
x
2
r
xi yi =
(
)
i
i
i
i
n 1 i =1
n 1 i =1
i =1
i =1
1
= (11053400 + 11102297 '56 22136664 ) = 2114 '84
9
S r2 =
840
= 84
10
1 N n S r2
1 240 2114 '84
V (r ) = 2
= 2
= 0 '02877
x N n 84 250 10
x = x =
2 V (r ) = 0 '3392
4. Se desea estimar el consumo mensual de una ciudad. Se sabe que los ingresos en dicha
ciudad, va declaracin de la renta, ascienden a 1502530 euros mensuales. Se realiza una
encuesta entre 12 hogares elegidos al azar y los resultados de renta y consumo se recogen
en esta tabla.
Renta Consumo
1702,44
1204
1339,56
1000
981,06
800
2537,04
1800
64
1519,85
1200
3080,19
2600
1502,53
1080
1702,87
1240
1402,36
1000
1803,04
1400
2053,46
1484
3005,06
2000
Estime el consumo total mensual para todos los hogares de la ciudad mediante el
estimador de razn. Obtenga el lmite para el error de estimacin.
SOLUCIN:
Denotemos por
Y = consumo mensual
X = ingresos mensuales
De la informacin muestral obtenemos

n = 12
12
y
i =1
= 16808 euros
12
x
i =1
= 22629, 46 euros
y como informacin auxiliar sabemos que x = 1502530 euros.

Podemos comprobar que el coeficiente de correlacin lineal es alto, rxy =
s xy
sx s y
= 0,9677 .
Esto junto con la informacin auxiliar nos permite utilizar muestreo con informacin
auxiliar, en concreto utilizaremos estimadores de razn.
12
r =
i =1
12
yi
xi
i =1
= 0, 7 42 7
y = r x = 1 1 1 6 0 0 2 , 0 7
2 S N n
Para calcular V (Y ) = x2 r
tenemos en cuenta que:
x n N
2
No conocemos N , pero en la ciudad hay muchos hogares, observando

estimamos que n < ( 5% N )
12
x < ( 5% )
i =1
N n
1
N
x = x = 1885, 79
Sr =
2
12
1 12
1 12 2 2 12 2
2
y
rx
=
y
+
r
x
2
r
xi yi
( i i ) n 1
i
i
n 1 i =1
i =1
i =1
i =1
V (Y ) = 871825002, 67
= 16479, 7
B = 2 V (Y ) = 59053,37
5. Las diferencias entre ingresos y gastos, en 5 de las 250 oficinas que tiene abiertas una
agencia de seguros, en el presente mes, han sido (en euros)
65
570
721
650
650
569
Este mes el gasto medio para el conjunto de todas las oficinas ha sido 12764 euros, estime
el total de ingresos y el lmite para el error de estimacin.
SOLUCIN:
N=250, n=5, x = 12764 , X=gastos, Y=ingresos
(con las funciones del modo SD de la calculadora ) :
yD = x + d = 13396
d = 632
S D2 = 4095,5
yD = N yD = 3349000
2
S D2
2 N n SD
V ( yD ) = N
= N ( N n)
= 50169875 2
N n
n
2 V ( yD ) = 14166,14
6. Una cadena de electrodomsticos est interesada en estimar el total de ganancias por las
ventas de televisores al final de un periodo de tres meses. Se tienen cifras del total de
ganancias de todas las tiendas de la cadena para ese mismo periodo de tres meses
correspondiente al ao anterior, ese total es de 128200 . Una muestra aleatoria simple de
5 tiendas es seleccionada de las 123 tiendas de la cadena resultando los datos de la
siguiente tabla:
Oficinas Datos de 3 meses del ao anterior Datos de 3 meses del ao actual
1
550
610
2
720
780
3
1500
1600
4
1020
1030
5
620
600
Usando un estimador de razn, estime el total de ganancias con un intervalo de confianza.
SOLUCIN:
N=123, n=5, x = 128200 , X=ganancias del ao anterior, Y=ganancias del ao actual
5
x = 882
i =1
= 4410
yi = 4620
y = 924
i =1
x
i =1
y
i =1
xi yi
335500
561600
2400000
1050600
372000
= 4495700
2
i
2
i
= 4961400
r=
y
i =1
n
x
i =1
66
y
= 1, 047619
x
y = r x = 134304, 76
x y
i =1
Sr =
2
5
1 5
1 5 2 2 5 2
2
y
rx
=
y
+
r
x
2
r
xi yi
(
)
i i n 1
i
i
n 1 i =1
i =1
i =1
i =1
= 1640, 25
= 4719700
S
V ( y ) = N ( N n ) r = 4761314, 071
n
2 V ( y ) = 4364, 09
y (129940, 67 , 138668,85 )
7. Una agencia de publicidad est interesada en el efecto de una nueva campaa de

promocin regional sobre las ventas totales de un producto en particular. Una muestra
aleatoria simple de 5 tiendas es seleccionada de 452 tiendas regionales en las cuales se
vende el producto. Los datos de las ventas trimestrales son obtenidos para el periodo
actual de tres meses y para el periodo de tres meses previo a la nueva campaa.
Tienda Ventas antes de Ventas
la campaa actuales
1
208
239
2
400
428
3
440
472
4
259
276
5
351
363
Usando los anteriores datos para estimar los parmetros necesarios, determine el tamao
de la muestra para estimar y con un lmite para el error de estimacin de 2000,
cuando se utiliza el estimador de razn.
SOLUCIN:
N=452, n=5, X=ventas antes de la campaa, Y=ventas actuales
x = 331, 6
xi2 = 587146
i =1
y = 355, 6
y
i =1
i =1
= 1778
xi yi
49712
171200
207680
71484
127413
xi = 1658
y
i =1
2
i
= 671034
r=
y
i =1
5
x
i =1
Sr =
2
D=
y
= = 1, 072376
x
x y
i =1
= 627489
5
1 5
1 5 2 2 5 2
2
y
rx
=
y
+
r
x
2
r
xi yi
(
)
i i n ' 1
i
i
n ' 1 i =1
i =1
i =1
i =1
= 109, 4775
2
B2
= 4,8947 r = S r2 = 109, 4775
2
4N
n=
N r2
= 21,3 22
ND + r2
67
4. Muestreo sistemtico.
4.1 Seleccin de una muestra sistemtica. Usos. Ventajas.
4.3 Comparacin con el muestreo aleatorio simple: Poblaciones ordenadas, aleatorias
y peridicas.
4.1 Seleccin de una muestra sistemtica. Usos. Ventajas.

En el muestreo sistemtico los elementos de la poblacin se enumeran, o se ordenan. Una
muestra sistemtica de 1 en k es la que se extrae de la siguiente forma:
1. Se selecciona aleatoriamente un elemento (llamado punto de inicio o pivote) de los
primeros k elementos de la poblacin.
2. Despus se seleccionan cada k -simo elemento hasta conseguir una muestra de
tamao n .
k se toma como el nmero entero menor o igual que el cociente
N
:
n
N
.
n
Nos podemos encontrar con las siguientes situaciones:

1. k =
2.
N
entero. Entonces se obtienen exactamente n observaciones.
n
N
N
no es entero. Por ejemplo si N = 103 y n = 5 , entonces
= 20,6 y tomamos
n
n
k = 20 . Segn el punto inicial nos podemos encontrar con:
a. Si elegimos, por ejemplo, el 2 como punto inicial, obtendramos:

2, 22, 42, 62, 82, 102
Al dividir la poblacin en 5 intervalos de 20 elementos, sobran 3. Podramos
elegir tambin el 102 y la muestra sera de tamao 6.
b. Si se elige, por ejemplo, la observacin 18 como la inicial, obtendramos una

muestra de tamao 5:
18, 38, 58, 78, 98
3. N es desconocido. En este caso, la decisin sobre el valor de k se tomar de forma
que se asegure el nmero mnimo deseado de elementos de la muestra. N se estima
por defecto, as k ser menor de lo necesario y, por tanto, el tamao muestral ser
mayor o igual de lo requerido.
68
Ventajas del muestreo sistemtico frente al muestreo aleatorio simple:
En la prctica el muestreo sistemtico es ms fcil de llevar a cabo y est expuesto a

menos errores del encuestador.
En el muestreo aleatorio simple podra ser un problema si dos nmeros aleatorios fueran
consecutivos o muy prximos. Por ejemplo, sera difcil escoger una muestra aleatoria
simple de personas entre las que entran a un supermercado. Al seleccionar las personas
al azar podramos encontrarnos que no hemos acabado de hacer la encuesta a un cliente
cuando el siguiente a encuestar ya ha pasado. Pero s sera fcil coger 1 de cada 20
personas que pasen hasta completar la muestra.
Frecuentemente, con igual tamao de muestra, el muestreo sistemtico proporciona

mejor informacin que el muestreo aleatorio simple. Esto se debe a que la muestra
sistemtica se extiende uniformemente a lo largo de toda la poblacin, mientras que en
el muestreo aleatorio simple puede ocurrir que un gran nmero de observaciones se
concentre en una parte de la poblacin y descuide otras.
Por ejemplo, supongamos que en una fbrica los primeros 3000 motores se fabrican
correctamente y los ltimos 3000 son defectuosos por un desajuste en la lnea de
montaje. Una muestra aleatoria simple podra seleccionar un gran nmero o incluso
todos del mismo grupo, dando una mala estimacin de la proporcin de defectuosos. El
muestreo sistemtico, en cambio, selecciona el mismo nmero de motores de ambos
grupos, dando una estimacin mejor. En este caso, donde en cierta medida hay un
orden en la poblacin, el muestreo sistemtico es mejor que el muestreo aleatorio
simple.
Usos:
Este tipo de muestreo es muy utilizado por los planes de muestreo para el control de calidad
dentro del proceso de fabricacin, los auditores cuando se enfrentan a largas listas de apuntes
para comprobar y los investigadores de mercados cuando se enfrentan a personas en
movimiento.
4.2 Estimacin de la media, proporcin y el total poblacionales
= ysy =
ESTIMADOR DE LA MEDIA POBLACIONAL:

1 i k
1 n
yi +( j 1) k
n j =1
i=punto de inicio o pivote
69
S2 N n
(
)
V y sy =
n N
VARIANZA ESTIMADA DE y sy :
Comentarios.
-
Si se desconoce el tamao poblacional por su gran magnitud, entonces
Cuando N no es mltiplo exacto de n , el estimador es sesgado.
N n
1.
N
Como puede observarse, la varianza del estimador de la media se estima igual que en el
muestreo aleatorio simple (vase 4.3 Comparacin con el muestreo aleatorio simple). Aunque
las varianzas de los estimadores no son realmente iguales, stas son:
V (y) =
2 N n
n N 1
V ( y sy ) =
2
n
[1 + (n 1) ]
donde = coeficiente de correlacin entre los elementos de una muestra sistemtica.
El tamao poblacional se desconoce en muchas situaciones prcticas en las que se usa el

muestreo sistemtico. Cuando N es conocido tambin se puede estimar el total poblacional.
ESTIMADOR DEL TOTAL POBLACIONAL:
= Ny sy
VARIANZA ESTIMADA DE :
2
2
2 S N n
V ( ) = N V ( y sy ) = N
n N
Ejemplo 4.1
Los funcionarios de un museo estn interesados en el nmero total de personas que visitaron
el lugar durante un periodo de 180 das cuando una costosa coleccin de antigedades estuvo
en exhibicin. Puesto que el control de visitantes en el museo cada da es muy costoso, los
funcionarios decidieron obtener estos datos cada diez das. La informacin de esta muestra
sistemtica de 1 en 10 se resume en esta tabla
Da N personas que visitan el museo

3 160
13 350
23 225
173 290
18
yi = 4868
i =1
18
yi2 = 1321450
i =1
Use estos datos para estimar el nmero total de personas que visitaron el museo durante el
periodo especificado y el lmite para el error de estimacin.
70
Solucin
= Nysy = 180
N = 180
4868
= 48680 visitantes
18
4868 )
(
1321450
n
= 289, 79
S2 =
n 1
S2 N - n
V ( ) = N 2
= 469461,18
n N
B = 1370,34
Como en el muestreo aleatorio simple, las propiedades del estimador de la proporcin son
anlogas a las propiedades de la media muestral:
ESTIMADOR DE LA PROPORCIN POBLACIONAL: p sy =

1 i k
1 n
yi+( j 1) k
n j =1
i=punto de inicio o pivote
V ( p sy ) =
VARIANZA ESTIMADA DE p sy :
, yi = 0, 1
p sy q sy N n
n 1 N
Notemos, de nuevo, que las varianzas estimadas son iguales a las del muestreo aleatorio
simple.
Ejemplo 4.2
La Guardia Civil de Trfico est interesada en la proporcin de automovilistas que llevan el
permiso de conducir. Se instala un puesto de control en una carretera nacional y se detiene un
conductor de cada siete. Use los datos de la tabla adjunta para estimar la proporcin de
conductores que portan su licencia. Establezca un lmite para el error de estimacin. Suponga
que 2800 autos pasan por el puesto de verificacin durante el periodo de muestreo.
Automvil Respuesta
1
1
8
1
15
0
2794
1
400
yi = 324
i =1
Solucin
p sy = y sy =
324
= 0,81
400
71
p q N n 0,81(1 0,81) 2800 400

V ( p sy ) = sy sy
=
= 0,000330612
n 1 N
400 1 2800
B = 0, 0364
Si la estratificacin de la poblacin fuese ventajosa, el muestreo sistemtico puede utilizarse

dentro de cada estrato en lugar del muestreo aleatorio simple, aplicndose las frmulas del
muestreo aleatorio estratificado, anlogamente a como se han utilizado las del muestreo
aleatorio simple para aproximar el comportamiento del muestreo sistemtico.
4.3 Comparacin con el muestreo aleatorio simple: Poblaciones ordenadas, aleatorias y

peridicas
Veamos bajo qu condiciones la varianza estimada de los estimadores en el muestreo
sistemtico se puede suponer igual a la del muestreo aleatorio simple.
Segn las expresiones
V (y) =
2 N n
n N 1
stas sern similares cuando
V ( y sy ) =
2
n
[1 + (n 1) ]
N n
1 y 0 , pero en otros casos no.
N 1
Distinguimos los siguientes casos:
A. Poblacin ordenada ( 0)
Una poblacin es ordenada cuando los elementos que la constituyen estn ordenados
de acuerdo a los valores, crecientes o decrecientes, de una determinada caracterstica.
En este caso es preferible el uso del muestreo sistemtico, ya que la muestra se
extiende uniformemente a lo largo de toda la poblacin:
V ( y sy ) V ( y )
Por ejemplo, en una lista de cuentas por cobrar que estn ordenadas de mayor a menor
cantidad, las estimaciones de una muestra sistemtica tendran en general una varianza
menor que las de una muestra aleatoria simple (es posible que sta ltima contenga
solo cantidades grandes o cantidades pequeas).
Al utilizar las varianzas estimadas de los estimadores del muestreo aleatorio simple en
el muestreo sistemtico conseguimos una estimacin conservadora del error (mayor
que el error real que cometemos en el muestreo sistemtico).
72
B. Poblacin aleatoria ( 0)
Se dice que una poblacin es aleatoria cuando sus elementos estn ordenados al azar.
En este caso es indiferente el uso del muestreo aleatorio simple y el muestreo
sistemtico ya que
V ( y sy ) V ( y ) .
Por ejemplo, en una lista de estudiantes por orden alfabtico, la estimacin de sus
calificaciones sera similar con ambos muestreos ya que las calificaciones no dependen
del apellido del estudiante.
C. Poblacin peridica ( 0)
Una poblacin es peridica cuando los valores de la variable objeto de estudio tienen
una variacin cclica. En este caso es preferible el muestreo aleatorio simple dado que
V ( y sy ) > V ( y ) .
Por ejemplo:
a. Supongamos que tenemos una lista en la que los nombres de mujeres y
hombres se alternan. Una muestra sistemtica con k par proporcionara solo
una lista de mujeres o de hombres.
b. Ventas diarias de un supermercado a partir de una muestra sistemtica con
k = 7.
Para evitar este problema, el investigador puede cambiar varias veces el punto de
inicio aleatorio. Esto tiene el efecto de mezclar los elementos de la poblacin y
comportarse como una poblacin aleatoria, en cuyo caso el uso de las expresiones del
muestreo aleatorio simple en el muestreo sistemtico estara justificado.
4.4 Determinacin del tamao muestral

El tamao muestral requerido para estimar la media poblacional con un lmite B para el error
de estimacin se obtiene de las expresiones del muestreo aleatorio simple. Lo que conduce a
obtener muestras ms grandes de las necesarias en poblaciones ordenadas y muestras ms
pequeas en poblaciones peridicas (si no se mezclaran los elementos cambiando el punto de
inicio). En poblaciones aleatorias no tendremos problemas.
73
Tamao muestral requerido para estimar y con un lmite B para el error de estimacin
B2
4 para estimar la media
con D =
2
B para estimar el total
4 N 2
N 2
n=
( N 1) D + 2
Tamao muestral requerido para estimar p y con un lmite B para el error de estimacin
n=
B2
4 para estimar p
con D =
2
B para estimar el total
4 N 2
Npq
(N - 1)D + pq

En un nuevo control, la Guardia Civil de Trfico espera que pasen unos 5000 automviles por
el puesto de verificacin. Determine el tamao de muestra y k para estimar p con un error
inferior al 2%.
Solucin
p = 0,81
n=
q = 1 p = 0,19
Npq
5000 0,81 (1 0,81)
=
= 1176,97 1177 automviles
2
B
0, 02 2
( N 1)
+ pq (5000 1)
+ ( 0,81 (1 0,81) )
4
4
Si tomramos k=5 n =
N
= 4, 25
n
5000
5000
= 1000 . Tomando k=4 n =
= 1250 1177 .
5
4
1. La gerencia de una compaa privada con 2000 empleados est interesada en estimar la
proporcin de empleados que estn a favor de una nueva poltica de inversin. Una muestra
sistemtica de 1 en 10 es obtenida de los empleados que salen del edificio al final de un da
de trabajo (las respuestas a favor se han representado como 1)
74
Empleado Respuesta
muestreado
3
1
13
0
23
1
1993
1
200
y
i =1
= 110
Se quiere volver a repetir el anterior estudio pero con un error de estimacin inferior al 5%
(considerando la muestra anterior como una muestra previa para estimar los parmetros
necesarios). Qu tipo de muestra sistemtica deber obtenerse? (indique n y k).
SOLUCIN
110
0, 052
= 0,55 q = 1 p = 0, 45 D =
= 0, 000625
200
4
Npq
N
n=
= 330, 7 331
k = 6, 04 k = 6
( N 1) D + pq
n
N = 2000
p=
2. Un auditor se enfrenta a una larga lista de 1000 cuentas por cobrar de una empresa. El
valor de cada una de estas cuentas no suele superar los 21000. El auditor quiere estimar
el valor total de las deudas por cobrar con un error inferior a 1000000 y con una
confianza del 95%. Para ello decide tomar una muestra sistemtica de 1 en k . Determine
el valor de k.
SOLUCIN
21000 2
1000000 2
=
27562500
D
=
= 250000
42
4 1000 2
N 2
N
n=
= 99,39 100 k = = 10
2
( N 1) D +
n
N = 1000 R = 21000 2
3. La tabla anexa muestra el nmero de nacimientos y la tasa de natalidad por cada 1000
individuos para Estados Unidos durante seis aos seleccionados sistemticamente.
Ao Nac.Masculinos Nac.Femeninos Total de Nac. Natalidad
1955 2073719
1973576
4047295
26,0
1960 2179708
2078142
4257850
23,7
1965 1927054
1833304
3760358
19,4
1970 1915378
1816008
3731386
18,4
1975 1613135
1531063
3144198
14,6
1980 1852616
1759642
3612258
15,9
Estime el nmero medio de varones nacidos por ao para el periodo 1955-1980, y
establezca un lmite para el error de estimacin.
SOLUCIN
Desde 1955 hasta 1980, ambos inclusive, hay 26 aos. N = 26 .
75
= ysy =
1 n
1
yi = 11.561.610 = 1.926.935
6
n i =1
S 2 = 37913412871,20
(con las funciones estadsticas en el modo SD de la calculadora)
S2 N n
V ( ysy ) =
= 4860693957,85
n N
B = 139437,35
4. La seccin de control de calidad de una empresa usa el muestreo sistemtico para estimar
la cantidad media de llenado en latas de 33cl que salen de una lnea de produccin. Los
datos de la tabla adjunta representan una muestra sistemtica 1 en 300 de una produccin
diaria de 1800 latas.
Cantidad de llenado en cl
33 32,5 33,5 33 32 31
Determine el tamao de la muestra y k para estimar el contenido medio de las latas con un
error de estimacin inferior a 0,42cl, considerando la muestra anterior como una muestra
previa para estimar los parmetros necesarios.
SOLUCIN:
N=1800
n=6
(con las funciones estadsticas del modo SD de la calculadora ) : S n2'1 = 0,8
D=
B2
= 0, 0441
4
n=
N 2
= 17,97 18
( N 1) D + 2
k=
2 = Sn2'1
1800
= 100
18
5. Los funcionarios de cierta sociedad profesional desean determinar la proporcin de

miembros que apoyan varias enmiendas propuestas en las prcticas de arbitraje. Los
funcionarios tomaron una muestra sistemtica de 1 en 10, a partir de una lista en orden
alfabtico de los 650 miembros registrados, obteniendo que 47 estaban a favor de los
cambios propuestos. Se quiere repetir el estudio anterior con un error de estimacin
inferior al 5%. Considerando la muestra anterior como una muestra previa para estimar los
parmetros necesarios, qu tipo de muestra sistemtica deber obtenerse? (indique n y k).
SOLUCIN:
N=650
B = 0, 05
n=
76
n=65
D=
p=
47
= 0, 7231
65
q = 1 0, 7231 = 0, 2769
B2
= 0, 000625
4
Npq
= 214,8 215
( N 1) D + pq
650
= 3, 02
215
k =3
5. Muestreo por conglomerados.

5.1
5.2
5.3
5.4
Necesidad y ventajas del muestreo por conglomerados.

Formacin de los conglomerados. Conglomerados y estratos.
Estimacin de la media, proporcin y total poblacionales.
Determinacin del tamao muestral.
5.1 Necesidad y ventajas del muestreo por conglomerados.

Una muestra por conglomerados es una muestra aleatoria en la cual cada unidad de muestreo
es una coleccin (o conglomerado) de elementos.
El muestreo por conglomerados es til para obtener informacin en las siguientes situaciones:
Es complicado disponer de una lista de los elementos de la poblacin, mientras que es
fcil lograr un marco que liste los conglomerados. (Alumnos que asisten a clase =
elemento,
aulas = conglomerados)
El coste de obtencin de las observaciones es menor debido al agrupamiento de los

elementos.
5.2 Formacin de los conglomerados. Conglomerados y estratos.

Los elementos de un conglomerado deben ser diferentes entre s, as una muestra con pocos
conglomerados recogera gran cantidad de informacin sobre el parmetro poblacional. Si los
elementos dentro de un conglomerado presentan caractersticas similares, tomar varias
observaciones dentro de un conglomerado no aporta ms informacin.
Recordemos que los estratos deban ser tan homogneos como fuera posible y diferir tanto
como se pudiera uno de otro con respecto a la caracterstica que est siendo esudiada. Los
conglomerados, sin embargo, deben ser tan heterogneos dentro de ellos como sea posible y
muy similar uno a otro para que el muestreo por conglomerados est indicado y proporcione
buenos resultados.
Una vez especificados los conglomerados, se selecciona una muestra aleatoria simple de
conglomerados.

Vamos a utilizar la siguiente notacin:
N = conglomerados en la poblacin.
mi = elementos en el conglomerado i
n = conglomerados en la muestra.
yi = suma de las observaciones en el conglomerado i
77
M = mi = elementos en la poblacin (con frecuencia es desconocido)

i =1
m = mi = elementos en la muestra
i =1
1 N
mi = tamao medio de los conglomerados de la poblacin (con frecuencia es desconocido)
N i =1
1 n
m = mi = tamao medio de los conglomerados de la muestra (se utililza para estimar M ).
n i =1
M=
(A) Estimacin de la media.

El estimador de la media poblacional es la media y ,
n
1 n
= y = yi =
m i =1
y
i =1
n
m
i =1
La media y tiene la forma de un estimador de razn, por lo que la varianza estimada de y

toma la forma de la varianza de un estimador de razn.
V ( y) =
1 N n S c2
2
N n
M
donde Sc2 =
1 n
yi ymi
n 1 i =1
( M es estimado por m , si se desconoce)

La varianza estimada es sesgada y sera un buen estimador de V ( y ) si n es grande ( n 20 ).
El
sesgo
desaparece
cuando
los
tamaos
de
los
conglomerados
son
iguales
( m1 = m2 = ... = mN ).
Notas:
La
expresin
de
V ( y) =
1 N n S c2
2
N n
M
no
se
suele
simplificar
como
N ( N n ) Sc2
V ( y) =
para poder calcularla fcilmente cuando N y M sean desconocidos.
M2
n
A veces N no se conoce debido a su gran tamao y
N n
se aproxima por 1. Si M es
N
desconocido M debe ser estimada por m .
Si la variable que estamos estudiando es dicotmica, hablaremos de la proporcin

poblacional p y de la proporcin muestral p . En este caso al nmero total de elementos
78
en el conglomerado i que poseen la caracterstica de inters se nota como ai en lugar de

yi como es habitual en variables numricas. As tendremos que
n
p=y=
a
i =1
n
m
i =1
Salvo esta diferencia en la notacin, todo lo anteriormente expuesto para variables

numricas es vlido para variables dicotmicas.
(B) Estimacin del total.

De la relacin entre la media y el total poblacional =
se sigue que = M , siendo el
estimador del total poblacional
= M y
y la varianza estimada del mismo
S2 M 2 S2
V ( ) = M 2 V ( y ) = N ( N n) c 2 c
n
m n
(sea cual sea el valor de M, ste no afecta a la varianza ni al error del estimador, aunque s al
valor del estimador del total)
Como en la estimacin del total con un estimador de razn, cuando M es desconocida y se

estima por m y
N n
se aproxima por 1 debido al gran tamao de N, la varianza del
N
estimador del total se aproxima por
M 2 Sc2
.
2
n
m
(C) Estimacin del total cuando se desconoce el tamao de la poblacin.

Frecuentemente el nmero de elementos en la poblacin no es conocido en problemas donde
se aplica el muestreo por conglomerados. En ese caso no podemos utilizar el estimador del
total = M y , debemos construir un estimador del total que no dependa de M . La cantidad
yt =
1 n
yi , es el promedio de los totales de los conglomerados de la muestra y un estimador
n i =1
insesgado del promedio de los N totales de los conglomerados de la poblacin. Por el mismo
razonamiento empleado en el muestreo aleatorio simple, N y t es un estimador insesgado de la
suma de los totales de todos los conglomerados, o equivalentemente del total poblacional .
79
En resumen
t = N y t
2
S
V ( t ) = N 2 V ( y t ) = N ( N n) t
n
N n St2
V ( yt ) =
N n
donde
St2 =
1 n
yi y t
n 1 i =1
yt =
1 n
yi
n i =1
Si existe una gran variacin entre los tamaos de los conglomerados y adems los tamaos
estn altamente correlacionados con los totales de los conglomerados, la varianza de t = N y t
es generalmente mayor que la varianza de = M y . Esto es debido a que el estimador
t = N y t no usa la informacin proporcionada por los tamaos de los conglomerados, mi , y

por ello puede ser menos preciso.
Cuando los tamaos de los conglomerados son iguales, los dos estimadores del total
coinciden, adems el estimador de la media, y , es un estimador insesgado de la media
poblacional y tambin es insesgado el estimador de su varianza, V ( y ) (lo mismo vale para el
total).
Ejemplo 5.1 En una ciudad se quiere estimar la proporcin de hogares interesados en contratar
el sistema de televisin digital, para lo cual se considera la ciudad dividida en 200 manzanas de
viviendas. Se extrae una muestra piloto de 5 manzanas y se interroga a cada familia acerca de
si estara interesada en contratar la televisin digital. Los datos de la encuesta se encuentran en
la tabla:
Manzana N hogares en la manzana N hogares interesados
1
8
2
2
7
2
3
9
3
4
6
3
5
5
3
a) Estime la proporcin de hogares interesados en contratar el sistema de televisin
digital. Calcule el lmite para el error de estimacin.
b) Con un intervalo de confianza estime el nmero de hogares interesados en
contratar dicho sistema.
c) Responda al apartado b) suponiendo que el nmero de hogares en la ciudad es
1500.
80
SOLUCIN
Aunque en un caso de variables dicotmicas como ste se suele usar en los textos la
notacin ai en lugar de yi , utilizaremos esta ltima para unificar la notacin a emplear en el
muestreo por conglomerados, tanto para variables numricas como dicotmicas.
a)
N=200
mi
yi
mi2
yi2
mi yi
8
7
9
6
5
35
2
2
3
3
3
13
64
49
81
36
25
255
4
4
9
9
9
35
16
14
27
18
15
90
n=5
n
p=y=
y
i =1
n
m
i =1
Sc2 =
13
= 0,3714
35
p = 37,14%
1 n
yi ymi
n 1 i =1
n
n
2
1 n 2
3,3222
y
2
y
y
m
+
y
mi2 =
= 0,8306
i
i i
n 1 i =1
4
i =1
i =1
Ya que M es desconocido, M debe ser estimada por m

m=
1 n
35
mi =
= 7 hogares / manzana
n i =1
5
V ( y) =
1 N n S c2
= 0, 003305
2
m N n
yt =
b)
1 n
13
yi = = 2, 6
n i =1
5
(y y )
n
S =
2
t
i =1
n 1
2 V ( y ) = 0,115
11,5%
t = N y t = 520
2
1 n
yi
n i =1
= i =1
= 0, 3
n 1
n
2
i
N ( N n) St2
V ( t ) =
= 2.340
n
( 423, 25 ; 616, 75)
2 V ( t ) = 96, 75
c)
= M y = 557,14
M=
1500
= 7,5
200
V ( y) =
1 N n Sc2
= 0, 0028795
2
N n
M
Obsrve que al conocer M , la estimacin de V ( y ) es diferente de la obtenida en a).
V ( ) = M 2 V ( y ) = 6478,8
2 V ( ) = 160,98
( 396,16 ; 718,12 )
81
El lmite para el error de estimacin es ms pequeo en b) que en c), debido a que los tamaos
de los conglomerados no estn correlacionados con los totales de los conglomerados
( rmy2 = 0, 08 ). En otras palabras, los tamaos de los conglomerados proporcionan poca
informacin sobre los totales de los conglomerados.

Supongamos que los conglomerados ya estn formados y vamos a seleccionar el nmero de
conglomerados n para conseguir un determinado lmite para el error de estimacin B
N c2
n=
ND + c2
donde c2 se estima mediante Sc2 =
B2 M
D=
4
1 n
yi ymi
n 1 i =1
para la estimacin de la media y D =
de una muestra previa, siendo
B2
para la estimacin del total.
4N 2
Habitualmente el tamao promedio de los conglomerados de la poblacin M no se conoce y

tiene que estimarse por el tamao medio m de los conglomerados de una muestra previa.
Cuando se utiliza N y t para estimar el total, el nmero de conglomerados en la muestra para

obtener un determinado lmite para el error de estimacin B viene dado por
n=
D=
N t2
ND + t2
B2
1 n
2
2
y
se
estima
mediante
S
=
yi y t
t
t
4N 2
n 1 i =1
de una muestra previa.
Ejemplo 5.2 Suponiendo que los datos del ejemplo 5.1 representan una muestra previa, cmo
debe tomarse una nueva muestra para estimar la proporcin poblacional del apartado a) con un
lmite para el error de estimacin del 1%.
SOLUCIN
S = 0,8306
2
c
1 n
35
M m = mi =
=7
n i =1
5
n=
82
N c2
= 154, 4 155
ND + c2
B2 M
0, 012 7 2
D=
=
= 0, 001225
4
4
1. Con motivo del cuarto centenario del Quijote, el Ministerio de Cultura desea estimar el
nmero de libros comprados cada mes en una localidad. Se selecciona una localidad con
6200 hogares agrupados en 700 manzanas de viviendas. Se tiene una encuesta piloto en la
cual se seleccion una muestra de 4 manzanas y se entrevistaron a todas las familias,
obtenindose los siguientes resultados:
manzana
1
2
3
4
Determine, usando los datos
libros comprados cada mes por familia

1 2 1 0 3 2 1 0 1 2
1 0 2 2 0 0 1 3
2 1 1 1 1 0 2 1 2 2 2
1 1 0 2 1 0 3
de la encuesta piloto, cuntas manzanas debe tener una nueva
muestra si se quiere estimar los libros comprados cada mes con un error de estimacin
inferior a 140 unidades.
SOLUCIN
mi
yi
10
8
11
7
36
13
9
15
8
45
mi2
yi2 mi yi
100 169
130
64 81
72
121 225
165
49 64
56
334 539
423
n
M = 6200 N = 700
y=
y
i =1
n
m
i =1
c2 Sc2 =
1 n
yi ymi
n 1 i =1
n=
2.
= 1, 25 D =
B2
= 0, 01
4N 2
n
n
2
1 n 2
2
y
+
y
m
2
y
mi yi = 1,125
i
i
n 1 i =1
i =1
i =1
N c2
= 96,92 97
ND + c2
Una industria est considerando la revisin de su poltica de jubilacin y quiere estimar la

proporcin de empleados que apoyan la nueva poltica. La industria consta de 57 plantas.
Se selecciona una muestra aleatoria simple de 5 plantas y se obtienen las opiniones de los
empleados en estas plantas a travs de un cuestionario. Los resultados se presentan en esta
tabla:
83
Planta N empleados N empleados que apoyan la nueva poltica

1
51
42
2
62
53
3
49
40
4
73
45
5
101
63
a. Estime la proporcin de empleados en la industria que apoyan la nueva poltica de
jubilacin y establezca un lmite para el error de estimacin.
b. La industria modific su poltica de jubilacin despus de obtener los resultados de la
encuesta. Ahora se quiere estimar la proporcin de empleados a favor de la poltica
modificada Cuntas plantas deben ser muestreadas para tener un lmite del 5% para el
error de estimacin? Use los datos anteriores para aproximar los resultados de la nueva
encuesta.
SOLUCIN:
a) N = 57
n=5
mi
yi
51
62
49
73
101
336
42
53
40
45
63
243
mi2
2601
3844
2401
5329
10201
24376
yi2
1764
2809
1600
2025
3969
12167
mi yi
2142
3286
1960
3285
6363
17036
p=
y
i =1
n
m
i =1
Sc2 =
1 n
yi pmi
n 1 i =1
243
= 0, 7232 p = 72,32%
336
n
2 n
1 n 2
2
p
y
m
+
p
mi2 = 68, 7
i
i i
n 1 i =1
i =1
i =1
336
M m =
= 4515,84
5
1 N n Sc2
V ( p) = 2
= 0, 00278
N
n
M
b)
2
2 V ( p) = 0,1054 10,54%
B2 M
0, 052 4515,84
D=
=
= 2,8224
4
4
S
2
c
2
c
N c2
n=
= 17, 06 18
ND + c2
3. Un socilogo quiere estimar el ingreso medio por persona en cierta ciudad pequea donde
no existe una lista disponible de adultos residentes. Por esta razn para el diseo de la
encuesta utiliza muestreo por conglomerados. Se divide la ciudad en bloques rectangulares
y el socilogo decide que cada bloque rectangular va a ser considerado como un
conglomerado. Los conglomerados son numerados del 1 al 415. El investigador tiene
84
tiempo y dinero suficientes para hacer un muestreo de 25 conglomerados y entrevistar a

cada hogar dentro de cada uno. Se seleccionan aleatoriamente 25 conglomerados y se
realizan las entrevistas, obtenindose estos datos:
Conglomerado (i) N de residentes (mi)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
8
12
4
5
6
6
7
5
8
3
2
6
5
10
9
3
6
5
5
4
6
8
7
3
8
151 residentes
Ingreso total por

conglomerado en (yi)
96000
121000
42000
65000
52000
40000
75000
65000
45000
50000
85000
43000
54000
49000
53000
50000
32000
22000
45000
37000
51000
30000
39000
47000
41000
1329000
a) Estime el ingreso medio por persona en la ciudad y establezca un lmite para el error de
estimacin.
b) Estime el ingreso total de todos los residentes de la ciudad y el lmite para el error de
estimacin, suponiendo que M es desconocido.
c) Suponiendo que existen 2500 residentes en la ciudad, estime el ingreso total de todos los
residentes de la ciudad mediante un intervalo de confianza.
NOTA: Repetir este ejemplo con todos los mi iguales (por ejemplo, mi = 6 i ,
supongamos conocido M = 6 415 = 2490 ) y estime el total por los dos mtodos
estudiados = M y t = N y t . Observe como coinciden las dos estimaciones as como

la varianza del estimador y el lmite para el error de estimacin.
85
d) Tomando los anteriores datos como una muestra previa, cmo debe tomarse la muestra en
una encuesta futura para estimar el ingreso promedio por persona con un lmite para el
error de estimacin de 500.
SOLUCIN:
a) (este ejemplo no se puede resolver con una calculadora de 10 dgitos de forma exacta
por la dificultad de trabajar con cantidades muy grandes)
n=25
N=415
n
=y=
y
i =1
n
m
i =1
1329000
= 8801,32 / residente
151
yi2 = 960002 + ... = 82039000000
i =1
i =1
2
i
= 82 + ... = 1047
y m = ( 96000 8) + ... = 8403000

i =1
Sc2 =
1 n
yi ymi
n 1 i =1
n
n
2
1 n 2
15227502247
y
2
y
y
m
+
y
mi2 =
= 634501213, 40
i
i i
n 1 i =1
24
i =1
i =1
Ya que M es desconocido, M debe ser estimada por m ,

m=
1 n
151
mi =
= 6, 04 residente / bloque
n i =1
25
V ( y) =
1 N n Sc2
= 653785,19
2
N n
M
2 V ( y ) = 1.617,14
b)
yt =
1 n
1329000
yi =
= 53160 / bloque
n i =1
25
2
1 n
1
y yi
82039000000 (1329000) 2
n i =1
25
= i =1
=
=
n 1
24
n
St2 =
1 n
yi y t
n 1 i =1
2
i
11389360000
= 474556666, 6
24
2
S
V ( t ) = N ( N n) t = 3072279860000
n
86
t = N y t = 22061400
2 V ( t ) = 3505584, 04
c)
N = 415
n = 25
M=
Sc2 = 634501213, 40
2500
= 6, 0241
415
V ( y) =
= M y = 22003311, 26
1 N n S c2
= 657240,9482
2
N n
M
V ( ) = M 2 V ( y ) = 4107755926250
2 V ( ) = 4053519,92
(17949791,34 ; 26056831,18 )
Como puede observarse el lmite para el error de estimacin es ms pequeo en b) que en
c) debido a que los tamaos de los conglomerados no estn altamente correlacionados con
los totales de los conglomerados en este ejemplo ( rmy2 = 0, 0919 ). En otras palabras, los
tamaos de los conglomerados proporcionan poca informacin referente a los totales de
los conglomerados.
2
d)
S = 634501213, 40
2
c
n=
B2 M
5002 6, 04 2
D=
=
= 2280100
4
4
N c2
= 166,58 167
ND + c2
4. Una empresa de trabajo temporal quiere investigar las necesidades de empleo de las
empresas de un pueblo. Para ello decide seleccionar una muestra de 10 de las 85 inscritas
en el registro mercantil. El nmero de bajas en el ltimo ao, el nmero de empleados y la
respuesta de cada empresa sobre si utilizara los servicios de la empresa de trabajo
temporal fueron los siguientes:
Empresa Bajas Empleados Respuesta
1
1
7
Si
2
2
15
No
3
9
85
Si
4
0
3
No
5
2
12
No
6
0
8
No
7
1
21
Si
8
0
4
No
9
4
35
No
10
6
92
Si
(a) Estime el nmero de bajas en el ltimo ao en las empresas del pueblo y el lmite del
error de estimacin.
(b) Estime la proporcin de empresas que usaran los servicios ofertados y el lmite del
error de estimacin.
87
SOLUCIN:
a) Se trata de un muestreo por conglomerados (cada empresa es un conglomerado) donde
no se conoce el nmero total de empleados para toda la poblacin, por tanto para estimar
el total consideraremos un muestreo aleatorio simple tomando como elementos muestrales
las empresas.
(y y )
yi
1
2
9
0
2
0
1
0
4
6
25
2,25
0,25
42,25
6,25
0,25
6,25
2,25
6,25
2,25
12,25
80,5
t = 85 2,5 = 212,5 bajas
25
= 2,5 bajas / empresa
10
80,5
85 10 8,94
2
St =
= 8,94 V ( y t ) =
= 0, 7892157 V ( t ) = 852 V ( y t ) = 5702, 08
9
85 10
yt =
B = 2 5702.08 = 151, 02 bajas

b)
p=
V ( p) =
4
= 0, 40 (40%)
10
85 10 0, 4 0, 6
= 0, 02353
85
10 1
B = 2 0, 02353 = 0,3068 (30, 68%)
5. Se disea una encuesta econmica para estimar la cantidad media gastada en servicios por
hogar de una ciudad formada por 3600 hogares. Se selecciona una muestra aleatoria de 3
barrios de la ciudad de un total de 60. Los entrevistadores obtienen el gasto en servicios
de cada hogar en los barrios seleccionados; los gastos totales se muestran en esta tabla:
Barrio N hogares Cantidad total gastada en servicios ()
1
55
2210
2
60
2390
3
63
2430
Estime la cantidad media de gastos en servicios por hogar en la ciudad y el lmite para el
error de estimacin.
88
SOLUCIN:
mi yi
121550
143400
153090
n
m y
i =1
N = 60
n
n=3
M=
mi = 178
3600
= 60
60
mi2 = 10594
i =1
= 418040
yi = 7030
i =1
i =1
i =1
2
i
= 16501100
y==
y
i =1
n
m
i =1
Sc =
2
1 n
yi ymi
n 1 i =1
V ( y) =
= 39, 49
n
n
2
1 n 2
2
y
+
y
m
2
y
mi yi
i
i
n 1 i =1
i =1
i =1
1 N n Sc2
= 0, 23
2
N n
M
= 2612,04
2 V ( y ) = 0,96
6. En un proceso de control del volumen envasado por una fbrica de bebidas se eligen 3 de
los 40 paquetes envasados en una hora, cada uno de los cuales contiene 4 envases, y se
mide el volumen que cada envase contiene. Las observaciones se presentan en la tabla
adjunta:
Paquete n Volumen envasado en cl
1
33,5 32,5 31 34
2
32,5 32
33 32,5
3
30,5 33
33 33,5
Estime el volumen medio de los envases y la cota del error de estimacin.
SOLUCIN:
N=40, n=3,
mi
4
4
4
yi
131
130
130
mi yi
524
520
520
3
m y
i
= 1564
i =1

M =m=4
mi = 12
i =1
y t = 130,33
yi = 391
i =1
2
i
i =1
3
y
i =1
2
i
= 48
= 50961
89
y==
y
i =1
3
m
i =1
Sc =
yt
= 32,5833 cl
m
1 3
yi ymi
n 1 i =1
V ( y) =
3
3
2
1 3 2
2
y
+
y
m
2
y
mi yi
i
i
n 1 i =1
i =1
i =1
1 N n Sc2
= 0, 006423
2
N
n
M
= 0,3333
2 V ( y ) = 0,1603 cl
7. Un fabricante de sierras quiere estimar el coste medio de reparacin mensual para las
sierras que ha vendido a ciertas industrias. El fabricante no puede obtener un coste de
reparacin para cada sierra, pero puede obtener la cantidad total gastada en reparacin y el
nmero de sierras que tiene cada industria. Entonces decide usar muestreo por
conglomerados, con cada industria como un conglomerado. El fabricante selecciona una
muestra aleatoria simple de 5 de 100 industrias a las que da servicio. Los datos sobre coste
total de reparaciones por industria y el nmero de sierras son:
Industria N sierras Costo total de reparacin
para el mes pasado ()
1
3
50
2
7
110
3
11
230
4
9
140
5
2
60
Estime el coste medio de reparacin por sierra para el mes pasado y el lmite para el error
de estimacin.
SOLUCIN: N=100
n=5
mi yi
150
770
2530
1260
120
n
m y
i =1
= 4830
M = m = 6, 4
m
i =1
y t = 118
90
= 32
yi = 590
i =1
2
i
i =1
n
y
i =1
2
i
= 264
= 90700
y==
i =1
5
yt
= 18, 4375
m
i =1
Sc =
1 n
yi ymi
n 1 i =1
V ( y) =
n
n
2
1 n 2
2
y
+
y
m
2
y
mi yi
i
i
n 1 i =1
i =1
i =1
1 N n Sc2
= 2, 7116
2
N
n
M
= 584, 57
2 V ( y ) = 3, 2934
8. Un peridico quiere estimar la proporcin de votantes que apoyan a cierto candidato A. Ya

que la seleccin y entrevista de una muestra aleatoria simple de votantes registrados es
muy costosa, se utiliza muestreo por conglomerados, con distritos como conglomerados.
Se selecciona una muestra aleatoria de 5 distritos de un total de 495. El peridico quiere
hacer la estimacin el da de la eleccin, pero antes de que se haya hecho el recuento final
de los votos. Los reporteros son enviados a los lugares de votacin de cada distrito en la
muestra, para obtener la informacin pertinente directamente de los votantes. Los
resultados se muestran en la tabla:
N votantes N votantes que apoyan A
1290
680
1170
631
840
475
1620
935
1381
472
Estime la proporcin de votantes que apoyan al candidato A y el lmite para el error de

estimacin.
SOLUCIN:
N=495
n=5
mi yi
877200
738270
399000
1514700
651832
n
m y
i =1
= 4181002
M = m = 1260, 2
m
i =1
y t = 638, 6
= 6301
yi = 3193
i =1
2
i
i =1
n
y
i =1
2
i
= 8270161
= 2183195
91
p==
y
i =1
5
m
i =1
Sc =
2
yt
= 0,506745
m
( 50, 67% )
1 n
yi ymi
n 1 i =1
V ( p) =
92
n
n
2
1 n 2
2
y
+
y
m
2
y
mi yi
i
i
n 1 i =1
i =1
i =1
1 N n Sc2
= 0, 00216573
2
N
n
M
2 V ( y ) = 0, 0930748
= 17372,505
( 9,31% )
RELACIN DE EJERCICIOS
1. Muestreo Aleatorio Simple
1. Un dentista est interesado en la efectividad de una nueva pasta dental. Un grupo de 1.000
nios de escuela particip en el estudio. Los registros de un estudio anterior mostraron que
haba un promedio de 2,2 caries cada seis meses para el grupo. Despus de un ao de
iniciado el estudio, el dentista muestre 10 nios para determinar cunto haban
progresado con la nueva pasta dental. Usando los datos de la siguiente tabla:
Nmero de caries
en seis meses
1
0
2
4
3
2
4
3
5
2
6
0
7
3
8
4
9
1
10
1
Se puede decir que la incidencia media de las caries ha disminuido?
Nio
Solucin: 2,2 (1,06, 2,94) No

2. Un psiclogo desea estimar el tiempo de reaccin medio para un estmulo en 200
pacientes de un hospital especializado en trastornos nerviosos. Una muestra aleatoria
simple de 20 pacientes fue seleccionada, y fueron medidos sus tiempos de reaccin, con
los resultados siguientes: y = 2,1 segundos y S = 0,4 segundos. Estime la media poblacional
y establezca un lmite para el error de estimacin.
Solucin: = 2,1; B = 0,1697
3. En un estudio sociolgico, realizado en una pequea ciudad, se hicieron llamadas
telefnicas para estimar la proporcin de hogares donde habita por lo menos una persona
mayor de 65 aos de edad. La ciudad tiene 621 hogares, segn la gua de telfonos ms
reciente. Una muestra aleatoria simple de 60 hogares fue seleccionada de la gua. Al
terminar la investigacin de campo, de los 60 hogares muestreados, en 11 habita al menos
una persona mayor de 65 aos. Estime la proporcin poblacional y establezca un lmite
Solucin: p = 0,1833; B = 0,0958
93
4. Un investigador est interesado en estimar el nmero total de rboles mayores de un cierto

tamao especfico en una plantacin de 1.500 acres. Esta informacin se utiliza para
estimar el volumen total de madera en la plantacin. Una muestra aleatoria simple de 100
parcelas de 1 acre fue seleccionada, y cada parcela fue examinada en relacin con el
nmero de rboles de tamao grande. La media muestral para las 100 parcelas de 1 acre fue
y = 25,2
rboles, con una cuasivarianza muestral de S 2 = 136 . Estime el nmero total de
rboles de tamao grande en la plantacin. Establezca un lmite para el error de estimacin.

Solucin: = 37.800; B = 3.379,9408
5. Usando los datos del ejercicio anterior, determine el tamao de muestra requerido para
estimar el nmero total de rboles grandes en la plantacin, con un lmite para el error de
estimacin de 1.500 rboles.
Solucin: n = 399,413 400
6. Una muestra aleatoria de 30 familias fue extrada de una zona de cierta ciudad que contiene
14.848 familias. El nmero de personas por familia en la muestra obtenida fue el siguiente:
5 6 3 3 2 3 3 3 4 4 3 2 7 4 3
5 4 4 3 3 4 3 3 1 2 4 3 4 2 4
Estimar el nmero total de personas en la zona, construyendo un intervalo de confianza al
95%.
Solucin: (44.842,09, 58.104,04 )
n = 66, 77 67
2. Muestreo Aleatorio Estratificado

1. Una gran empresa sabe que el 40% de las facturas que emite son al por mayor y el 60% al
por menor. Sin embargo, identificar las facturas individuales sin consultar un archivo es
complicado. Un auditor desea muestrear 100 de sus facturas para estimar el valor medio
de las facturas de la empresa (Nota para estimar el total necesitaramos conocer N). Una
muestra aleatoria simple present 70 facturas al por mayor y 30 al por menor. Los datos
son separados en facturas al por mayor y al por menor despus del muestreo, con los
siguientes resultados en :
Por mayor
Por menor
Valor total facturas=36400
Valor total facturas=8400
n1 = 70
94
y1 = 520 S1 = 210
n2 = 30
y 2 = 280 S2 = 90
Estime el valor medio de las facturas de la empresa, y fije un lmite para el error de
estimacin.
Solucin:
yst = 376; B = 28,14
2. De las 1.395 universidades de Estados Unidos, 364 imparten estudios universitarios de

dos aos y 1.031 estudios universitarios de cuatro aos. Se recogieron de manera
independiente, una muestra aleatoria simple de 40 universidades con estudios de dos aos
y otra de 60 con estudios de 4 aos. Las medias muestrales y las desviaciones tpicas del
nmero de estudiantes matriculados el pasado ao en asignaturas de estadstica aparecen a
continuacin.
Carreras de 2 aos Carreras de 4 aos
Media
154,3
411,8
Desviacin tpica
87,3
219,9
a) Estimar el nmero total de estudiantes matriculados en asignaturas de estadsticas. Dar

un lmite de error de estimacin.
b) En el estudio del ejercicio anterior, se investig tambin en qu proporcin de las
universidades la asignatura de estadstica para economistas era impartida por
miembros del departamento de economa. En la muestra se hall que en 7 de las
universidades con carreras de dos aos y en 13 de las que tienen carreras de cuatro
aos suceda esto. Estimar la proporcin de universidades en las que esta asignatura es
impartida por profesores del departamento de economa. Dar un lmite de error de
estimacin.
Solucin:
(a) st = 480.731; B = 57.594,84 (b) p st = 0,2058; B = 0,0826
3. Una universidad tiene 152 profesores ayudantes, 127 profesores asociados y 208
profesores titulares. Una reportera del peridico de los estudiantes quiere averiguar si los
profesores estn realmente en sus despachos durante las horas de tutoras. Decide
investigar muestras de 40 profesores ayudantes, 40 asociados y 50 titulares. Algunos
estudiantes voluntarios llamaron a la puerta de los profesores de la muestra durante sus
horas de tutoras. Se hall que 31 de los profesores ayudantes, 29 de los asociados y 34 de
los titulares se encontraban realmente en sus despachos. Hallar un intervalo de confianza
para la proporcin de profesores que permanecen en sus despachos durante las horas de
tutoras.
Solucin:
p st = 0,7214; B = 0,0685
4. Un auditor quiere estimar el valor medio de las facturas por cobrar de una compaa. La
poblacin se divide en cuatro estratos que contienen 500, 400, 300 y 200 facturas,
95
respectivamente. Basndose en una experiencia previa, se estima que las desviaciones

tpicas en estos estratos son de 15, 20, 30 y 40 euros, respectivamente. Determinar el
tamao muestral y la asignacin para estimar el valor medio de las facturas por cobrar
cometiendo un error de como mucho 5 euros.
Solucin:
n1 = 18,59; n 2 = 19,83; n3 = 22,31; n 4 = 19,83; n = 80,55
5. Un ayuntamiento est interesado en ampliar las instalaciones de un centro de atencin

diurna para nios. Se va a realizar una encuesta para estimar la proporcin de familias con
nios que utilizarn las instalaciones ampliadas. Las familias estn dividas en aquellas que
en la actualidad usan las instalaciones y las que an no la usan. Aproximadamente el 90%
de los que usan las instalaciones y el 50% de los que no las usan van a utilizar las nuevas
instalaciones. Los costos por efectuar la observacin de un cliente actual es de 4 y de 8
para uno que no lo es. Registros existentes nos dan que existen 97 familias que en la
actualidad utilizan las instalaciones y 145 que no lo hacen.
a) Encuentre el tamao muestral aproximado y la asignacin necesaria para estimar la
proporcin poblacional con un lmite de 0,05 para el error de estimacin.
b) Suponga que el costo total de muestreo se fija en 400 . Elija el tamao de la
muestra y la asignacin que minimiza la varianza del estimador para este costo fijo.
Solucin: (a) n1 = 47; n2 = 83; n = 130 (b) n1 = 22;
n2 = 39; n = 61
6. En un centro escolar se quiere realizar una encuesta para conocer la proporcin de padres
que estaran dispuestos a participar en actividades. Se quiere estimar la proporcin de
padres tanto a nivel global como para cada grupo de edad de los alumnos por lo que se
decide estratificar segn la edad de los alumnos. A partir de la informacin proporcionada
por la siguiente tabla, obtener el nmero ptimo de padres que, de cada estrato, hay que
encuestar para que la proporcin de participacin de los padres con hijos de edades entre 6
y 8 aos sea estimada con un error menor o igual al 10%. (Suponemos que cada padre
tiene un solo hijo en el centro)
Aos
Alumnos
matriculados
150
130
120
100
Porcentaje de participacin en aos

anteriores
40%
30%
25%
20%
Coste de encuestar a un
elemento
4
9
16
25
4-6
6-8
8-12
12-14
Sol. n = 200,3; n1 = 94,84 95; n 2 = 51,27 52; n3 = 33,53 34; n 4 = 20,65 21 n = 202
7. El coste de transportar mercancas en avin depende del peso. Un determinado embarque

de una fbrica consista en las mquinas producidas por la citada fbrica a lo largo de las
dos ltimas semanas. Se decide estratificar basndose en las semanas, con el fin de
96
observar si existe variacin semanal en la cantidad producida. Las muestras aleatorias

simples de los pesos (en kilos) de las mquinas transportadas en el embarque, para las dos
semanas, mostraron las siguientes mediciones:
Semana A Semana B
58,3
59,2
60,4
60,1
59,3
59,6
58,7
59,2
59,1
58,8
59,6
60,5
a. Estimar el peso total del embarque de maquinaria, sabiendo que el nmero total de
mquinas producidas ha sido de 162 en la semana A y de 170 en la semana B.
b. Obtenga un intervalo de confianza para el peso total del embarque de maquinaria.
c. Determinar el tamao de la muestra y su asignacin, en el caso de que se quiera
estimar el peso total del embarque, con un lmite para el error de estimacin de 50
kg. Las dispersiones en los pesos se suponen diferentes de una semana a otra.
Considere las muestras anteriores como muestras previas para estimar los
parmetros necesarios.
Solucin: (a) = 19.722,13
(b) (19.593'71, 19.850'56)
(c) n = 65,67; n1 = 34,37 35; n 2 = 31,30 32 n = 67

8. Una cadena de almacenes est interesada en estimar la proporcin de cuentas no cobradas.
La cadena est formada por 4 almacenes, siendo el coste de muestreo igual para todos. Se
usa muestreo aleatorio estratificado, con cada tienda como un estrato.
Estrato I Estrato II Estrato III Estrato IV
N 3 = 93
N 4 = 25
N cuentas por cobrar N 1 = 65 N 2 = 42
n1 = 14
n2 = 9
n3 = 21
n4 = 6
Tamao muestra
N cuentas no cobradas 4
2
8
1
a. Estime la proporcin de cuentas no cobradas para la cadena y fije un lmite para el
error de estimacin.
b. Utilice los datos anteriores para determinar la asignacin y el tamao de la muestra
necesarios para estimar la proporcin de cuentas no cobradas, con un lmite del
error de estimacin del 5%.
Solucin: (a) p = 0,30; B = 0,1173
(b) n = 132,30; n1 = 38,35 39; n 2 = 22,80 23; n3 = 58,98 59; n 4 = 12,17 13 n = 134
9. Una escuela desea estimar la calificacin media que puede obtener en el examen final de
matemticas en este curso. Los estudiantes de la escuela se agrupan en tres estratos segn
el tipo de aprendizaje, clasificado como N=Normal, A=Avanzado, L=Lento. En el
97
presente curso, la distribucin de los alumnos segn el tipo de aprendizaje es 50 normal,

30 avanzado y 20 lento, la calificacin media de los estudiantes segn el tipo de
aprendizaje fue en el primer examen parcial: 75 para el normal, 89 para el avanzado y 70
para el lento, con unas cuasivarianzas de 80, 30 y 40 respectivamente.
Para actualizar esta informacin, se tom una muestra aleatoria de estudiantes, se les hizo
el examen final de matemticas y se obtuvieron las siguientes calificaciones (entre
parntesis, el tipo de aprendizaje de cada estudiante):
70(L) 88(A) 72(N) 85(N) 90(N) 82(A) 61(N) 92(N) 65(L) 87(A)
91(A) 81(N) 79(N) 63(L) 82(N) 75(N) 78(A) 71(L) 61(L)
Se pide:
a. Estime la calificacin media en el examen final de matemticas. De una medida del
error de estimacin.
b. Qu ocurre si no se tiene en cuenta el tipo de aprendizaje? Compare los resultados
de ambos mtodos de estimacin, as como determine la ganancia en precisin.
c. Se desea mejorar la estimacin de la nota media del examen final en matemticas,
teniendo en cuenta ms informacin. Usando estos resultados como muestra
previa, qu tamaos muestrales en cada estrato son necesarios para un error
mximo admisible de 2 puntos, utilizando asignacin Proporcional.
d. Estime, con un intervalo de confianza, el nmero de estudiantes con aprendizaje
normal que han superado los 80 puntos. Si se pudiera planificar de nuevo la
muestra, qu tamao de muestra sera necesario para que esta misma estimacin
tuviera un error mximo admisible de 10 estudiantes?
Solucin: (a) = 78,59; B = 3, 21
(b) = 77,53; B = 4,25
(c) n = 36,31; n1 = 18,15 19; n 2 = 10,89 11; n3 = 7,26 8 n = 38

(d) (11,87, 43,69); n = 16,8 17
10. Se desea estimar el salario medio de los empleados de una empresa. Se decide
clasificarlos en dos estratos: los que tienen contrato fijo y los que poseen un contrato
temporal. Los primeros son 143 y su salario vara entre 1500 y 2500 euros mensuales. Los
contratos temporales son 320 y su salario est comprendido entre 700 y 1800 euros
mensuales. Cul debe ser el tamao de la muestra y su asignacin para que al estimar el
salario medio mensual el error de estimacin sea inferior a 100 euros?
Solucin: Neyman n = 26,91
98
n1 = 7, 77 8
n2 = 19,14 20 n = 28
3. Muestreo con informacin auxiliar

1. Una encuesta de consumo fue realizada para determinar la razn de dinero gastado en
alimentos sobre el ingreso por ao, para las familias de una pequea comunidad. Una
muestra aleatoria de 14 familias fue seleccionada de entre 150. Los datos de la muestra se
presentan en la siguiente tabla:
Familia Ingreso Total Gasto en alimentos
1
25100
3800
2
32200
5100
3
29600
4200
4
35000
6200
5
34400
5800
6
26500
4100
7
28700
3900
8
28200
3600
9
34600
3800
10
32700
4100
11
31500
4500
12
30600
5100
13
27700
4200
14
28500
4000
Estime la razn poblacional, y establezca un lmite para el error de estimacin.
Solucin: r = 0,1467; B = 0,0102
2. El ingreso nacional para 1981 ser estimado con base en una muestra de 10 sectores
industriales que declaran sus ingresos de 1981 antes que las 35 restantes. (Existen 45
sectores industriales que se utilizan para determinar el ingreso nacional total). Se dispone
de los datos del ingreso de 1980 para los 45 sectores industriales y los totales son 2.174,2
(en miles de millones). Los datos se presentan en la tabla adjunta:
Industria
1980
Producto de fbricas textiles
13,6
Productos qumicos y relacionados 37,7
Madera aserrada y lea
15,2
Equipo elctrico y electrnico
48,4
Vehculos y equipo
19,6
Transporte y almacenaje
33,5
Banca
44,4
Bienes Races
198,3
Servicios de Salud
99,2
Servicios de Educacin
15,4
(a) Encuentre el estimador de razn del ingreso total de
1981
14,5
42,7
15,1
53,6
25,4
35,9
48,5
221,2
114,0
17,0
1981, y establezca un lmite

99
(b) Encuentre el estimador de regresin del ingreso total de 1981, y establezca un

(c) Encuentre el estimador de diferencia del ingreso total de 1981, y establezca un
(d) Cul de los tres mtodos es el ms apropiado en este caso?Por qu?
Solucin: (a) Y = 2.433,30; B = 45,95 (b) YL = 2.432,91; B = 48,64
(c) Y = 2.455,90; B = 180,07
3. Se desea conocer las ventas medias (en euros / habitante) en este ao de un determinado
producto en un municipio formado por un pueblo A con 291 habitantes y un pueblo B con
200 habitantes. Se sabe que las ventas medias en ese municipio el ao pasado fueron de
170 euros / habitante. Tomamos una muestra aleatoria de 4 habitantes del pueblo A y otra
de 3 habitantes del pueblo B para los que se conoce su consumo del producto bajo estudio
(expresado en euros), este ao (Y) y el ao pasado (X):
Pueblo A Pueblo B
xi yi xi yi
204 210 137 150
143 160 189 200
82 75 119 125
256 280
a. Sin hacer distincin entre pueblos, estime las ventas medias para este ao
utilizando un estimador de razn. D un lmite para el error de estimacin.
b. Qu se obtiene si no se tiene en cuenta los datos del ao pasado pero si el
pueblo?
c. Qu se obtiene si no se tiene en cuenta los datos del ao pasado ni se hace
distincin entre pueblos?
d. Compare los estimadores que se obtienen en cada caso justificadamente.
Solucin: (a) = 180,53; B = 5,69 (b) = 171,91; B = 53,81 (c) = 171,43; B = 49,53
(d) La mejor estimacin es en la que se usa el estimador de razn, por la fuerte relacin
entre las variables. El muestreo estratificado se comporta mal porque los estratos no son
homogneos.
4. Se est investigando la eficacia de una nueva dieta alimenticia en la crianza de conejos.
Los investigadores piensan que hay razones para creer que el comportamiento es diferente
dependiendo de la zona de crianza. Por este motivo, deciden formar estratos observndose
el peso de los conejos antes de introducir la nueva dieta (X) y el peso resultante al cabo de
un mes de tratamiento (Y). Se obtuvieron los siguientes resultados:
N 1 = 80;
100
N 2 = 60;
N 3 = 40; n1 = 10; n 2 = 8; n3 = 6
Zona A Zona B Zona C

X
3,2 4,1 3,1 3,9 2,8 3,8

3,0 4,0 3,0 4,0 2,9 3,7
2,9 4,1 3,1 3,8 2,9 3,8
2,8 3,9 3,2 4,0 3,0 3,6
3,1 3,7 3,0 3,8 3,1 3,8
3,2 4,1 3,2 4,1 3,0 3,7
2,9 4,2 2,9 3,7
2,8 4,0 3,0 3,8
3,1 3,9
2,8 3,8
a. Estimar el peso medio estratificado de los conejos al principio y al final del
tratamiento. Dar una estimacin del error.
b. Si se le permite un error de estimacin de 0,01 para estimar el peso medio
estratificado al final del tratamiento, cules deben ser los nuevos tamaos
muestrales? Usar asignacin Proporcional.
c. Sabiendo que el peso medio de los conejos antes de introducir la nueva dieta era de
3,2 kilogramos, estimar el peso medio de los conejos al final del tratamiento
utilizando un estimador de razn. Dar el lmite de error de estimacin.
d. Estimar el peso medio de los conejos al final del tratamiento utilizando muestreo
aleatorio simple. Comentar los resultados.
Solucin: (a) x = 3,0008; B = 0,0516; y = 3,8944; B = 0,0523
(b) n = 144,4; n1 = 64,2 65; n 2 = 48,15 49; n3 = 32,1 33 n = 147
(c) y = 4,1467; B = 0,0793
(d) = 3,8875; B = 0,0617
5. En una escuela de 560 alumnos, se desea estimar la calificacin media que puede
obtenerse en el examen final de matemticas en el curso 00/01. Se toma como informacin
auxiliar la calificacin de los mismos alumnos en el examen final de matemticas del
curso 99/00 con una nota media de 75. A partir de una muestra aleatoria de estudiantes
para los cuales se observ la nota del examen final en el curso 00/01 y la calificacin de
dicho alumno en la prueba correspondiente al curso 99/00. Los resultados fueron los
siguientes:
101
Nota curso Nota curso

99/00
00/01
80
87
78
65
98
86
45
47
61
67
83
94
79
67
56
67
Estimar la calificacin media del curso 00/01 utilizando como informacin auxiliar la
calificacin obtenida en el curso 99/00 mediante un estimador de razn. Dar una
estimacin del error de muestreo.
Solucin: y = 75; B = 7,45
6. Un director de recursos forestales est interesado en estimar el nmero de abetos muertos
por una plaga en una zona de 300 hectreas. Usando una fotografa area, el director
divide la zona en 200 parcelas de hectrea y media. Se toma una muestra aleatoria de 10
parcelas. El nmero total de abetos muertos, obtenidos segn la cantidad en fotografa es
4200.
Parcela
Cantidad en fotografa 12 30 24 24 18 30 12 6
Cantidad en terreno
10
36 42
18 42 24 36 24 36 14 10 48 54
a. Estime la razn poblacional y obtenga su intervalo de confianza.

b. Estime el nmero total de abetos muertos en el rea de 300 hectreas y fije un
c. Cul ha de ser el tamao de la muestra necesario para estimar el total de abetos
muertos, con un lmite de error de estimacin de 200 abetos?
Solucin: (a) r = 1,3077; (1'2057, 1'4097) (b) y = 5.492,31; B = 428,44 ) (c) n = 38,9 39
7. De una poblacin de 40 hogares, para la que es conocido que el gasto total general durante
un periodo de un ao, en general, es de 12.000.000 um., se obtiene una muestra aleatoria
simple de tamao 4 que proporciona los siguientes valores anuales (en um):
Gasto en alimentacin 125000 150000 100000 175000
a. Estimar el gasto total en alimentacin para los 40 hogares mediante un intervalo de
confianza.
b. Supongamos que de esos 4 hogares tenemos tambin los valores anuales de su
gasto general (en um):
102
Gasto General 250000 300000 200000 350000

Antes de calcular otro estimador, obtendramos mejores resultados si
utilizamos esta informacin auxiliar?Por qu?
c. Estimar mediante un estimador de razn el total de gasto en alimentacin,
utilizando la informacin auxiliar del apartado b.
d. Corroborar la respuesta del apartado b indicando qu estimador es mejor, el del
apartado a o el del apartado c.
Solucin: (a) (4.275.255, 6.724.744) (b) = 1 (c) y = 6.000.000 (d) B = 0 (lmite del error de
estimacin del apartado (c)
8. En una universidad se realiz una prueba de conocimientos matemticos antes del ingreso
a 486 estudiantes. Se consideraron dichas calificaciones como una variable auxiliar de la
variable calificacin final en clculo. Teniendo en cuenta que 291 eran chicos y las
calificaciones medias del examen previo fueron de 47 para los chicos y 52 para las chicas,
a partir de los datos de la tabla siguiente, se pide:
CHICOS
CHICAS
Examen previo Examen de clculo Examen previo Examen de clculo
39
65
57
92
43
78
47
89
21
52
28
73
64
82
75
98
34
56
52
75
a. Sin tener en cuenta el sexo, estima la calificacin media en el examen final de
clculo utilizando un estimador de razn. De una medida del error de estimacin.
b. Qu ocurre si no se tiene en cuenta la informacin auxiliar pero si el sexo?
c. Qu ocurre si no se tiene en cuenta la informacin auxiliar ni el sexo?
d. Compare los estimadores que se obtienen en cada caso justificadamente.
Solucin: (a) y = 80,97; B = 10,54 (b) = 73,76; B = 9,5 (c) = 76; B = 9,46
4. Muestreo Sistemtico
1. La seccin de control de calidad de una empresa usa el muestreo sistemtico para estimar
la cantidad media de llenado en latas de 12 onzas que sale de una lnea de produccin. Los
datos de la tabla adjunta representan una muestra sistemtica 1 en 50 de la produccin de
un da.
103
Cantidad de llenado (en onzas)

12,00 11,97 12,01 12,03 12,01 11,80
11,91 11,98 12,03 11,98 12,00 11,83
11,87 12,01 11,98 11,87 11,90 11,88
12,05 11,87 11,91 11,93 11,94 11,89
11,72 11,93 11,95 11,97 11,93 12,05
11,85 11,98 11,87 12,05 12,02 12,04
a. Estime , y establezca un lmite para el error de estimacin. Suponga que N=1.800.
b. Determinar el tamao de muestra requerido para estimar dentro de 0,01 unidades.
Solucin: (a) sy = 11,94; B = 0,0259 (b) n = 217,1 218
2. Los funcionarios de cierta sociedad profesional desean determinar la proporcin de
miembros que apoyan varias enmiendas propuestas en las prcticas de arbitraje. Los
funcionarios toman una muestra sistemtica de 1 en 10, a partir de una lista en orden
alfabtico de los 650 miembros registrados. Sea y i = 1 si la i-sima persona muestreada
favorece los cambios propuestos e y i = 0 si se opone a los cambios. Use los siguientes
datos de la muestra para estimar la proporcin de miembros en favor de los cambios
propuestos. Establezca un lmite para el error de estimacin.
65
y i = 48
i =1
Solucin: p sy = 0,7385; B = 0,1042

3. La tabla anexa muestra el nmero de nacimientos y la tasa de natalidad por cada 1000
individuos para Estados Unidos durante seis aos seleccionados sistemticamente.
(a) Estime el nmero medio de varones nacidos por ao para el periodo 1955-1980, y
establezca un lmite para el error de estimacin.
(b) Estime la tasa media anual de natalidad para el periodo 1955-1980, y establezca un
(c) Cree usted que el muestreo sistemtico es mejor que el muestreo aleatorio simple
para los problemas de los apartados (a) y (b)?Por qu?
Ao Nac.Masculinos Nac.Femeninos Total de Nac. Natalidad
1955 2.073.719
1.973.576
4.047.295
26,0
1960 2.179.708
2.078.142
4.257.850
23,7
1965 1.927.054
1.833.304
3.760.358
19,4
1970 1.915.378
1.816.008
3.731.386
18,4
1975 1.613.135
1.531.063
3.144.198
14,6
1980 1.852.616
1.759.642
3.612.258
15,9
Solucin: (a) sy = 1.926.935; B = 139.437,35 ; (b) sy = 19,67; B = 3,17 ;
(c) Si. Observando la tendencia de las muestras se puede decir que las poblaciones en
estudio estn ordenadas de forma decreciente.
104
4. En la tabla anexa se presentan los datos sobre las tasas de divorcio (por cada 1000
personas) en Estados Unidos para una muestra sistemtica de los aos de 1900-1980.
Estime la tasa media anual de divorcios para tal periodo y establezca un lmite para el
error de estimacin. Es en este caso el muestreo sistemtico mejor o peor que el muestreo
aleatorio simple?Por qu?
Solucin: sy
Ao Tasa Ao Tasa
1900 0,7 1945 3,5
1905 0,8 1950 2,6
1910 0,9 1955 2,3
1915 1,0 1960 2,2
1920 1,6 1965 2,5
1925 1,5 1970 3,5
1930 1,6 1975 4,8
1935 1,7 1980 5,2
1940 2,0
= 2,26; B = 0,57 . Mejor, se observa, en general, una tendencia creciente en
los datos de la muestra, aunque se rompa ese orden parcial en los aos 1945-1955.
6. Muestreo por Conglomerados.

1. Un fabricante de sierras quiere estimar el coste medio de reparacin mensual para las
sierras que ha vendido a ciertas industrias. El fabricante no puede obtener un coste de
reparacin para cada sierra, pero puede obtener la cantidad total gastada en reparacin y el
nmero de sierras que tiene cada industria. Entonces decide usar muestreo por
conglomerados, con cada industria como un conglomerado. El fabricante selecciona una
muestra aleatoria simple de 20 de 96 industrias a las que da servicio. Los datos sobre coste
total de reparaciones por industria y el nmero de sierras son:
Industria N sierras Costo total de reparacin
para el mes pasado ()
1
3
50
2
7
110
3
11
230
4
9
140
5
2
60
6
12
280
7
14
240
8
3
45
9
5
60
10
9
230
11
8
140
105
12
6
130
13
3
70
14
2
50
15
1
10
16
4
60
17
12
280
18
6
150
19
5
110
20
8
120
a. Estime el costo medio de reparacin por sierra para el mes pasado, y establezca un
b. Estime la cantidad total gastada por las 96 industrias en la reparacin de sierras.
Establezca un lmite para el error de estimacin.
c. Despus de verificar sus registros de ventas, el fabricante se percata de que ha vendido
un total de 710 sierras a esas industrias. Usando esta informacin adicional, estime la
cantidad total gastada en reparacin de sierras por estas industrias, y establezca un
Solucin: (a) = 19,73; B = 1,78 (b) = 12.312; B = 3.175,07
(c) = 14.008,85; B = 1.110,78
2. Se disea una encuesta econmica para estimar la cantidad media gastada en servicios
para los hogares en una ciudad. Ya que no se encuentra disponible una lista de hogares, se
usa muestreo por conglomerados, con barrios formando los conglomerados. Se selecciona
una muestra aleatoria de 20 barrios de la ciudad de un total de 60. Los entrevistadores
obtienen el gasto en servicios de cada hogar en los barrios seleccionados; los gastos totales
se muestran en esta tabla:
Barrio N hogares Cantidad total gastada en servicios ()
1
55
2210
2
60
2390
3
63
2430
4
58
2380
5
71
2760
6
78
3110
7
69
2780
8
58
2370
9
52
1990
10
71
2810
11
73
2930
12
64
2470
13
69
2830
14
58
2370
15
63
2390
16
75
2870
17
78
3210
106
18
51
2430
19
67
2730
20
70
2880
a. Estime la cantidad media de gastos en servicios por hogar en la ciudad y establezca un
b. En la encuesta anterior se desconoce el nmero de hogares en la ciudad. Estime la
cantidad total gastada en servicios por todos los hogares de la ciudad y establezca un
c. La encuesta econmica se va a llevar a cabo en una ciudad vecina de estructura
similar. El objetivo es estimar la cantidad total gastada en servicios por los hogares de
la ciudad, con un lmite de 5.000 para el error de estimacin. Use los datos anteriores
para encontrar el nmero aproximado de conglomerados que se necesitan para obtener
ese lmite.
Solucin: (a) = 40,17; B = 0,64 (b) = 157.020; B = 6.927,88 (c) n = 29,4 30
3. Un inspector quiere estimar el peso medio de llenado para cajas de cereal empaquetadas
en una fbrica. El cereal est en paquetes que contienen 12 cajas cada uno. El inspector
selecciona aleatoriamente 5 y mide el peso de llenado de cada caja en los paquetes
muestreados, con los resultados (en onzas) que se muestran:
Paquete
Onzas de llenado
1
16,1 15,9 16,1 16,2 15,9 15,8 16,1 16,2 16,0 15,9 15,8 16,0
2
15,9 16,2 15,8 16,0 16,3 16,1 15,8 15,9 16,0 16,1 16,1 15,9
3
16,2 16,0 15,7 16,3 15,8 16,0 15,9 16,0 16,1 16,0 15,9 16,1
4
15,9 16,1 16,2 16,1 16,1 16,3 15,9 16,1 15,9 15,9 16,0 16,0
5
16,0 15,8 16,3 15,7 16,1 15,9 16,0 16,1 15,8 16,0 16,1 15,9
Estime el peso medio de llenado para las cajas empaquetadas por esta fbrica, y establezca
un lmite para el error de estimacin. Suponga que el nmero total de cajas empaquetadas
por la fbrica es lo suficientemente grande para que no se tome en cuenta la correccin por
poblacin finita.
Solucin: = 16,0050; B = 0,0215
4. Un peridico quiere estimar la proporcin de votantes que apoyan a cierto candidato A en
una eleccin estatal. La seleccin y entrevista de una muestra aleatoria simple de votantes
registrados es muy costosa por lo que se utiliza muestreo por conglomerados. Se
selecciona una muestra aleatoria de 50 distritos (conglomerados) de un total de 497 que
tiene el estado. El peridico quiere hacer la estimacin el da de la eleccin, pero antes de
que se haya hecho la cuenta final de los votos. Es por eso que los reporteros son enviados
a los lugares de votacin de cada distrito en la muestra, para obtener la informacin
pertinente directamente de los votantes. Los resultados se muestran en esta tabla:
107
N votantes N votantes A N votantes N votantes A N votantes N votantes A

1290
680
1893
1143
843
321
1170
631
1942
1187
1066
487
840
475
971
542
1171
596
1620
935
1143
973
1213
782
1381
472
2041
1541
1741
980
1492
820
2530
1679
983
693
1785
933
1567
982
1865
1033
2010
1171
1493
863
1888
987
974
542
1271
742
1947
872
832
457
1873
1010
2021
1093
1247
983
2142
1092
2001
1461
1896
1462
2380
1242
1493
1301
1943
873
1693
973
1783
1167
798
372
1661
652
1461
932
1020
621
1555
523
1237
481
1141
642
1492
831
1843
999
1820
975
1957
932
a. Estime la proporcin de votantes que apoyan al candidato A, y establezca un lmite
b. El peridico quiere realizar una encuesta similar durante la siguiente eleccin. Cmo
de grande debe ser la muestra para estimar la proporcin de votantes a favor de un
candidato similar con un lmite del 5% para el error de estimacin?
Solucin: p = 0,5701; B = 0,0307 (b) n = 20,1 21
5.
Un empresario quiere estimar el nmero de tubos de dentfrico usados por mes en una
comunidad de 4000 hogares divididos en 400 bloques. Se selecciona una muestra aleatoria
simple de 4 bloques que proporciona los siguientes resultados:
Bloque
tubos gastados por hogar
1
1 2 1 3 3 2 1 4
2
1 3 2 2 3 1 4 1 1
3
2 1 1 1 3 2 2
4
1 1 3 2 1 5 1 3
Estime de distintas formas el nmero total de tubos gastados, obtenga el lmite para el
error de estimacin en cada caso y comente los resultados.
Solucin:
Muestreo por conglomerados = 8000; B = 562,85 Muestreo aleatorio simple
= 6400; B = 1077,78
6.
En un proceso de control del volumen envasado por una fbrica de bebidas se eligen 5 de
los 40 paquetes que tiene la fbrica, cada uno de los cuales contiene 4 envases, y se mide
el volumen que cada envase contiene. Las observaciones se presentan en la tabla adjunta:
108
Paquete n Volumen envasado en cm3

1
33
32,5 31,7 34,2
2
32
32,6 33,8 32,5
3
30,9 33,1 33
33,4
4
34,1 33,1 32,5 33,2
5
32
32,1 32,6 33,6
Estime el volumen medio por envase y dar la cota de error de estimacin.
Solucin: = 32,80; B = 0,22
7. Cierto tipo de tableros posee 12 microcircuitos cada uno. De un pedido de 50 tableros se
seleccionan 10 de ellos para su estudio. El nmero de microcircuitos defectuosos por
tablero fue
2 0 1 3 2 0 0 1 3 4
Estime la proporcin de microcircuitos defectuosos en la poblacin y establezca una cota
Solucin: p = 0,1333; B = 0,0674
8. En una pequea ciudad se quiere estimar el nmero total de horas diarias que sus residentes
dedican a ver el programa ``Gran Hermano'', emitido las 24 horas del da por un canal
Digital. Dicha ciudad est dividida en 200 manzanas de viviendas. Se extrae una muestra
aleatoria simple de 10 manzanas, y se interroga a cada familia acerca de si estn conectados
a Va Digital y cuntas horas ven el programa. Los datos de la encuesta se encuentran en la
siguiente tabla:
Manzana N hogares con N total horas que
canal Digital
ven programa
1
8
13
2
7
13
3
9
14
4
6
13
5
5
0
6
9
10
7
6
6
8
8
14
9
9
16
10
6
4
a. Estimar el nmero total de horas que se ve el programa ``Gran Hermano'' a travs
de Canal Digital.
b. Obtener un intervalo de confianza para el nmero total de horas.
c. Determinar cuntas manzanas se deberan muestrear para estimar el total
poblacional, con un lmite para el error de estimacin de magnitud 20. Considere la
muestra anterior como una muestra previa para estimar los parmetros necesarios.
Solucin: (a) = 2060 ; (b) (1415,30, 2704,70) (c) n = 196,4 197
109
9. En un municipio de 5000 familias se pretende estimar el porcentaje de las que poseen

ordenador. Se consideran 1000 conglomerados de 5 familias cada uno, y se elige una
muestra aleatoria de 10 conglomerados, en los que el nmero de familias con ordenador es:
2 1 5 3 0 1 4 3 5 0
Estimar la proporcin de familias que poseen ordenador y la varianza del estimador usado
para estimar dicha proporcin.
Solucin: p = 0,48; V ( p ) = 0,0143
10. Se desea conocer la proporcin de empleados de una empresa que no estn dispuestos a
trasladarse a una nueva planta de produccin. Realizada una encuesta a los empleados de 5
factoras elegidas al azar entre las 50 que tiene la empresa, los resultados han sido:
Factora N empleados Dispuestos
1
250
225
2
190
175
3
210
190
4
400
350
5
150
120
Estimar la proporcin de empleados que no estn dispuestos a trasladarse a la nueva
factora. Obtenga una estimacin de la varianza del estimador empleado.
Solucin: p = 0,1167; V ( p ) = 0,0002
11. Un gran embarque de mariscos congelados es empaquetado en cajas, conteniendo cada una
24 paquetes de 5 kilos. Hay 100 cajas en el embarque. Un inspector del gobierno determina
el peso total de mariscos daados para cada una de las 5 cajas muestreadas. Los datos son:
9 6 3 10 2
a. Estime el peso total de mariscos daados en el embarque y establezca un lmite
b. Determine el tamao de la muestra necesario para estimar el peso total de mariscos
daados en el embarque, con un lmite de error de 275.
Solucin: (a) = 600; B = 308, 22 (b) n = 6, 20 7
110
FORMULARIO de MUESTREO
(95% de confianza, z=2)
MUESTREO ALEATORIO SIMPLE EN POBLACIONES INFINITAS.

MEDIA
y=
ESTIMADOR
VARIANZA
MUESTRAL
s2 =
(apenas se utiliza en muestreo)
CUASIVARIANZA
MUESTRAL
S2 =
1 n
yi
n i =1
1 n
yi y
n i =1
1 n
yi y
n 1 i =1
2
1 n 2
yi y
n i =1
yi
n
yi2 i =1
n
= i =1
n 1
V ( y) =
B
LIMITE DEL ERROR
DE ESTIMACIN
2 V ( y) = 2
n=
2
B2
4
2
D
1 n
yi ,
n i =1
s2 =
1 n
yi y
n i =1
yi = 0, 1
S2 =
S
n
1 n
yi y
n 1 i =1
= pq
n pq
n 1
pq
n 1
2 V ( p) = 2
D=
V ( p) =
pq
n 1
pq
pq
p2
, p+2
n 1
n 1
S
S
, y+2
y2
n
n
INTERVALO DE
CONFIANZA
p=
S2
n
VARIANZA DEL
ESTIMADOR
TAMAO MUESTRAL
PROPORCION
B2
4
n=
pq pq
=
B2
D
4
D=
111
B2
4
MUESTREO ALEATORIO SIMPLE EN POBLACIONES FINITAS.

MEDIA
TOTAL
y=
ESTIMADOR
1 n
yi
n i =1
= N y =
V ( y) =
VARIANZA DEL
ESTIMADOR
B
LIMITE DEL ERROR
DE ESTIMACIN
112
i =1
S2 N n
n N
V ( p) =
2 V ( ) = N 2 V ( p)
( 2 V ( ) , + 2 V ( ) ) =
= ( N ( y 2 V ( y ) ) , N ( y + 2 V ( y ) ))
B2
D=
(media )
4
B2
D=
(total )
4N 2
pq N n
n 1 N
2 V ( p)
2 V ( ) = N 2 V ( y )
N 2
( N 1) D + 2
yi = 0, 1
pq
V ( ) = N 2 V ( p ) = N ( N n)
n 1
2 V ( y)
V ( y) , y + 2 V ( y )
1 n
yi
n i =1
= N p
n=
TAMAO
MUESTRAL
N
n
p=
S
V ( ) = N 2 V ( y ) = N ( N n)
n
(y 2
INTERVALO DE
CONFIANZA
PROPORCION
TOTAL
(p 2
( 2
= (N ( p 2
n=
V ( p) , p + 2 V ( p)
V ( ) , + 2 V ( ) =
) (
V ( p) , N p + 2 V ( p)
Npq
( N 1) D + pq
B2
( proporcion)
4
B2
D=
(total )
4N 2
D=
))
MUESTREO ALEATORIO ESTRATIFICADO: ESTIMACIN.
MEDIA
TOTAL
y st =
ESTIMADOR
1
N
i =1
i =1
Ni y i =
PROPORCION
TOTAL
Ni
yi
N
p st =
VARIANZA DEL
ESTIMADOR
1
N2
L
=
i =1
N
i =1
Ni2
i =1
2
i
i =1
i =1
Ni pi =
Ni
pi
N
st = N p st = Ni pi
i =1
1
N2
st = N y st = N i y i
V ( y st ) =
1
N
i =1
V ( yi ) =
Si2 N i ni
=
ni N i
2
N i Si N i ni

N ni N i
2
L
S2 N n
V ( st ) = N 2 V ( y st ) = Ni2 i i i
ni Ni
i =1
V ( p st ) =
1
N2
N
i =1
V ( pi ) =
2
i
p i q i N i ni
=
ni 1 N i
i =1
2
L
N p q N n
= i i i i i
ni
Ni
i =1 N
=
1
N2
Ni2
L
p q N n
V ( st ) = N 2 V ( p st ) = N i2 i i i i
ni 1 N i
i =1
MUESTREO ALEATORIO ESTRATIFICADO: TAMAO MUESTRAL.

MEDIA
TOTAL
L
FORMULACIN
GENERAL
(error fijo B)
n=
i =1
PROPORCION
TOTAL
N i2 i2
N 2 D + N i i2
i =1
n=
i =1
N i2 pi qi
N 2 D + N i pi qi
i =1
113
MUESTREO ALEATORIO ESTRATIFICADO: ASIGNACIN MUESTRAL.

MEDIA
TOTAL
(error fijo B)
L
N
n=
i =1
PROPORCION
TOTAL
(error fijo B)
Ni i
ci
ci
i =1
N 2 D + N i i2
N
n=
i =1
i =1
n=
(coste fijo C)
N i i
ci
i =1
i =1
n=
ci
i =1
N
i =1
N j j
i =1
i =1
n=
N D + N i
i =1
j =
2
i
N j j
i
i =1
ASIGNACIN
PROPORCIONAL
(error fijo B)
i =1
1
N
j =
114
Ni i2
pi qi
ci
i =1
pi qi
N 2 D + N i pi qi
N j p jqj
L
pi qi
n=
N pq
Nj
i =1
ND +
i =1
1
N
j =
B2
(media )
4
B2
D=
(total )
4N 2
D=
( N
i =1
Ni i2
ND +
i =1
n=
j =
cj
ASIGNACIN DE
NEYMAN
(error fijo B)
pjq j
i =1
( N )
L
n=
j =
N i i
ci
pi qi ci
Nj
cj
j =
pi qi
ci
C Ni
i =1
N 2 D + N i pi qi
(coste fijo C)
i =1
ASIGNACIN
PTIMA
pi qi ci
i i
N pq
i =1
i i
Nj
N
B2
( proporcion)
4
B2
D=
(total )
4N 2
D=
pi qi
ci
ESTIMACIN DE RAZN.
MEDIA
TOTAL
RAZN
y = rx
ESTIMADOR
r=
y
i =1
n
x
i =1
y
=
x
y = r x
S r2 =
VARIANZA
RESIDUAL
1 n
2
( yi rxi )
n 1 i =1
V ( y ) = x2 V (r ) =
VARIANZA DEL
ESTIMADOR
1 N n Sr2 1 N n Sr2
V (r ) = 2
x N n x2 N n
n=
TAMAO
MUESTRAL
N r2
ND + r2
N n S r2
N n
N n Sr2 x2 Sr2
V ( y ) = x2V (r ) = N 2
N n x2 n
r = Sr2 de una muestra previa

B 2 x2
( para estimar R)
4
B2
D=
( para estimar y )
4
B2
D=
( para estimar y )
4N 2
D=
115
ESTIMACIN DE REGRESIN.
MEDIA
TOTAL
sx2 =
1 n
xi x
n i =1
VARIANZA, COVARIANZA Y
1 n
COEF. DE CORRELACIN
sxy = xi x
MUESTRALES
n i =1
r =
2
xy
)(
2
1 n 2
xi x
n i =1
yi y =
(anlogamente para la variable Y)
1 n
xi yi x y
n i =1
sxy2
sx2 s y2
( x x )( y
n
yL = y + b( x x)
ESTIMADOR
b=
sxy
sx2
i =1
( x x)
n
i =1
yL = N yL
VARIANZA RESIDUAL
( (
1 n
S =
yi y + b( xi x)
n 2 i =1
2
L
))
2
n 2 s xy
=
sy 2
n 2
sx
n 2
s y (1 rxy2 )
=
n2
S L = S L2
ERROR TPICO DE
ESTIMACIN
V ( yL ) =
VARIANZA DEL
ESTIMADOR
N n S L2
N n
V ( yL ) = N 2 V ( yL )
n=
TAMAO MUESTRAL
N L2
ND + L2
B2
D=
4
116
L = S L2 de una muestra previa
( para estimar y )
B2
D=
4N 2
( para estimar y )
ESTIMACIN DE DIFERENCIA.
MEDIA
TOTAL
yD = y + ( x x) = x + d
d = yx
ESTIMADOR
yD = N yD
VARIANZA RESIDUAL
S D2 =
1 n
yi ( xi + d )
n 1 i =1
V ( yD ) =
VARIANZA DEL
ESTIMADOR
1 n
di d
n 1 i =1
di = yi xi
N n S D2
N n
V ( yD ) = N 2 V ( yD )
n=
N D2
ND + D2
D=
B2
4
D = S D2 de una muestra previa
TAMAO MUESTRAL
( para estimar y )
D=
B2
4N 2
( para estimar y )
117
MUESTREO POR CONGLOMERADOS.

MEDIA o PROPORCIN
TOTAL (M conocido)
TOTAL
=y=
ESTIMADOR
y
i =1
n
m
i =1
1 n
y
=
yi
t
n i =1
t = N y t
= M y
V ( y) =
VARIANZA
DEL
ESTIMADOR
1 N n Sc2
2
N n
M
2
S
V ( ) = M 2 V ( y ) = N ( N n) c
n
Sc2 =
(
n 1
n
yi ymi
i =1
n=
TAMAO
MUESTRAL
S
V ( t ) = N 2 V ( y t ) = N ( N n) t
n
N c2
ND + c2
St2 =
B2 M
D=
4
B2
D=
4N 2
yt
i =1
c = Sc2
(y
n 1
n
de una muestra previa
n=
N t2
ND + t2
t = St2
de una muestra previa
(media)
D=
B2
4N 2
(total )
(total )
NOTACIN:
N = conglomerados en la poblacin (habitualmente conocido)
mi = elementos en el conglomerado i
n = conglomerados en la muestra
yi = suma de las observaciones del conglomerado i
M = mi = elementos en la poblacin
(habitualmente desconocido)
i =1
m = mi = elementos en la muestra
i =1
1 N
M
mi =
= tamao medio de los conglomerados de la poblacin (habitualmente desconocido)
N i =1
N
1 n
m
m = mi = = tamao medio de los conglomerados de la muestra . Este valor m se usa para estimar el anterior, M .
n i =1
n
M=
118

Muestreo Estadistica

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Muestreo Estadistica

Cargado por

Copyright:

Formatos disponibles

DPTO.

MTODOS CUANTITATIVOS PARA LA ECONOMA Y LA EMPRESA

2. Muestreo aleatorio estratificado. . . . . . . . . . . . . . . . . . . . . . . . . . .

3. Muestreo con informacin auxiliar. . . . . . . . . . . . . . . . . . . . . . . . .

5. Muestreo por conglomerados. . . . . . . . . . . . . . . . . . . . . . . . . . . .

1. Muestreo aleatorio simple.

1.0 Definiciones y conceptos bsicos

Nuestro objetivo a lo largo de la asignatura ser conocer o investigar alguna caracterstica de

Las personas no dicen la verdad.

No siempre comprenden las preguntas.

3. No respuesta. La no respuesta de un individuo seleccionado para formar parte de la

EL NMERO TOTAL DE ELEMENTOS QUE FORMAN UNA MUESTRA TIENE

1.2 Muestreo aleatorio simple en poblaciones infinitas.

1.2.1 Media, varianza y proporcin muestrales: Propiedades. Error de estimacin.

Como estimador de la varianza de la poblacin, 2 , se utiliza la cuasivarianza muestral, S 2 .

que tambin tiene la propiedad de ser insesgado

de forma que la varianza de la media muestral se estima de forma insesgada por

Si conocemos ms caractersticas de las variables aleatorias Y, Y1,..., Yn, conoceremos ms

(en la prctica, para n > 30,

Y cualquier distribucin, por el Teorema Central del Lmite, cuando n

(en la prctica, para n>30)

un caso particular del anterior es Y B (1, p ) , variable dicotmica, donde = p

(en la prctica, para n>30)

De las probabilidades anteriores se puede hacer dos lecturas. La primera:

En esta expresin aparecen valores y expresiones fundamentales en las tcnicas de estimacin:

y = error de estimacin o diferencia entre la estimacin que hacemos, y , y el verdadero

= cota o lmite para el error de estimacin, es el mximo error de estimacin que se

entre los extremos del intervalo y 2

Aplicando lo anterior a la media muestral para k=2 se obtiene

resultado parecido al que obtenamos anteriormente

1.2.2 Estimacin puntual. Intervalos de confianza. Contrastes de hiptesis.

en cuyo caso se aceptara la hiptesis nula, rechazndose en caso contrario.

1.2.3 Determinacin del tamao muestral.

= B , la cantidad de informacin necesaria para conseguirlo depende del

tamao de la muestra segn la siguiente expresin

En la prctica la varianza poblacional 2 es desconocida. Si disponemos de S 2 de un estudio

La proporcin poblacional p es la media de una variable dicotmica ( Y B (1, p ) ,

En la prctica p se desconoce. Una aproximacin se obtiene reemplazndolo por el valor

obtener la cota del error de estimacin fijada).

1.3 Muestreo aleatorio simple en poblaciones finitas.

1.3.1 Estimacin de la media, proporcin y total poblacionales.

(A) Estimacin de la media poblacional.

En este tipo de muestreo la cuasivarianza muestral no es un estimador insesgado de la

De lo anterior se sigue que la varianza de la media muestral puede ser estimada

que se denomina coeficiente corrector para poblaciones finitas (c.p.f.).

2 V ( y ) . Igual que en el caso de poblaciones infinitas, se habla de un nivel de confianza del

(B) Estimacin del total poblacional.

Para hallar su varianza usamos que V (kX ) = k 2V ( X ) , por tanto:

(1.040 20, 49 ) = (1.019,51 , 1.060, 49 )

(1.040.000 20.490 ) = (1.019.510 , 1.060.490 )

(C) Estimacin de la proporcin poblacional.

su varianza estimada, teniendo en cuenta que S 2 =

Para estimar el total poblacional de una variable dicotmica usamos

La proporcin que votarn a un determinado representante de centro.

La proporcin de ellos que tienen algn tipo de trabajo.

responden NO, yi = 1 cuando responden SI, anlogamente para zi ).

Usando los datos de la muestra, estime p1 (proporcin de estudiantes que votarn a un

2 V ( p1 ) = 0, 0868 (8, 68%)

2 V ( p 2 ) = 0, 0821 (8, 21%)

2 V ( 2 ) = 900 0, 0821 = 73,89

1.3.2 Determinacin del tamao muestral.

2 V ( ) = N 2 V ( y ) = B , se llega a la misma expresin de n pero con D =

La proporcin poblacional p es la media de una variable dicotmica ( Y B (1, p ) ,