Está en la página 1de 37

UNIVERSIDAD NACIONAL AGRARIA LA MOLINA

Departamento de Estadstica e Informtica


Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
1
Captulo I

MUESTREO POR CONGLOMERADOS

La mejor cosa sobre ser un estadstico es que se llega a jugar en el patio
trasero de todos
John Tukey

Introduccin
En un estudio de investigacin se puede seleccionar grandes unidades de
muestreo las cuales contienen a otras unidades de muestreo ms pequeas.
Tal es el caso de lotes de produccin que por lo general estn compuestos por
cajas de un producto y dentro de las cajas se encuentra el producto a evaluar.
El investigador estar interesado en muestrear el producto pues al quedarse
solo en la seleccin de las cajas no podra dar un veredicto final sobre la
calidad del producto.
En una situacin, como la descrita anteriormente es til el muestreo por
conglomerados.
El muestreo por conglomerados se puede llevar a cabo en una o varias etapas.
Continuando con el ejemplo del lote de produccin, la seleccin de los
productos lo podemos realizar de dos maneras:
Primero se puede seleccionar una muestra aleatoria de cajas y
posteriormente analizar a todos los productos de las cajas seleccionadas;
en este caso se estara aplicando un muestreo por conglomerados en una
etapa. O tambin,
Primero se selecciona una muestra aleatoria de cajas y luego algunos
productos elegidos al azar de las cajas seleccionadas; en este caso se
estara aplicando el muestreo por conglomerados en dos etapas.
Sin embargo, vale la pena recalcar que no solo esta seleccin se puede hacer
en dos etapas, sino generalizarse en k-etapas. Esto depender de cuantas
selecciones previas de unidades de muestreo se tengan que realizar antes de
seleccionar la unidad de muestreo final.
El muestreo por conglomerados es utilizado cuando el costo de obtener un
marco muestral que liste a todas las unidades muestrales es muy alto, o si el
costo por obtener observaciones se incrementa con la distancia que separa los
elementos. Tambin, es utilizado cuando es difcil conseguir el listado de todos
los productos, pero es ms sencillo conseguir el listado de todas las cajas que
contienen a los productos.
En esta primera parte se realizar una seleccin aleatoria simple de las
unidades de muestreo en una o en las dos etapas. Sin embargo, el muestreo
por conglomerados se puede combinar con otros diseos como el Muestreo
Estratificado, dando lugar a lo que se conoce como el estudio de Muestras
Complejas que ser desarrollado posteriormente.
El objetivo del presente capitulo es presentar la metodologa del muestreo por
conglomerados en una etapa y las expresiones matemticas que permitan
obtener las estimaciones para la media y la proporcin.


UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
2
1. Usos del muestreo por conglomerados
El muestreo por conglomerados puede ser utilizado en diversas disciplinas,
para estimar la media o proporcin de variables de inters. As por ejemplo se
tiene en:
Investigacin de mercados: Seleccionando manzanas, dentro de ellas
viviendas y finalmente hogares.
Control de calidad: Para realizar inspecciones de lotes de produccin, se
selecciona un lote, posteriormente los productos para finalmente estimar
algunas caractersticas del mismo.
Educacin: Seleccionando colegios, para posteriormente seleccionar a todos o
algunos de los estudiantes.
En salud: Seleccionando hospitales, posteriormente los pacientes dentro de
cada hospital.
En la industria forestal: Se puede realizar inspecciones a algunos lotes de
madera y dentro ellos los tablones ya cortados para determinar algunas de las
caractersticas de la madera que ser vendida.
Electrnica: Cuando se desea analizar un tablero de circuitos fabricado para
una computadora, este forma un conglomerado de semiconductores para
prueba.
Agronoma: Un naranjo forma un conglomerado de naranjas para la
investigacin de infestacin de insectos.
Industria automotriz: Los neumticos de un automvil podran formar un
conglomerado para estudios de uso y seguridad.

2. Ventajas y Desventajas
Ventajas
No se necesita un marco muy especfico como el caso del muestreo aleatorio
simple o estratificado.
En un muestreo aleatorio simple o muestreo irrestrictamente aleatorio es
necesario disponer de una lista de todos los elementos de la poblacin (marco
muestral) y si se trata de muestreo aleatorio estratificado son necesarias listas
de cada subpoblacin o estrato.
En la prctica no suele disponerse de tales listas, salvo en casos particulares
(por ejemplo en el llamado muestreo de archivos). Adems el contar con todo
ese listado resultara muy costoso, difcil o excesivamente prolongado la
confeccin del listado. Por lo tanto es preferible la divisin previa de la
poblacin en conglomerados o reas, de los cuales se selecciona cierto
nmero, para lo cual solo necesitamos disponer de la lista de los
conglomerados.
La divisin previa de la poblacin en conglomerados o reas convenientes, de
las cuales se selecciona un cierto nmero de conglomerados para la muestra,
hace que sea necesario solo un marco de conglomerados que es mas fcil de
conseguir y ms barato.

Se pueden utilizar como marco muestral divisiones territoriales ya establecidas
por necesidades administrativas para la cual ya existe informacin. Esto
tambin porque la poblacin podra estar muy dispersa geogrficamente o
aparecer en conglomerados naturales.
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
3
Es muy frecuente que los conglomerados estn definidos como reas o
partes bien delimitadas del terreno, de modo que todas las unidades ltimas
correspondientes al rea sean las que constituyen el conglomerado. De aqu
que se encuentre generalizado la denominacin de muestreo por reas para
designar al muestreo por conglomerados.

Se ahorra tiempo y dinero ya que la concentracin de unidades disminuye la
necesidad de desplazamiento.

Los diseos de muestrales: aleatorio simple, estratificado, sistemtico y de
conglomerados pueden combinarse dando lugar a lo que se denomina como
diseo muestral complejo. As, por ejemplo se pueden estratificar los
conglomerados, obtener una muestra de ellos, y dentro de los conglomerados
muestrales obtener una muestra sistemtica de unidades elementales.

Desventajas
Menor precisin en las estimaciones, debido a que aunque lo ideal es que haya
heterogeneidad dentro, siempre va a existir un cierto grado de homogeneidad
inevitable dentro de los conglomerados.
Segn el diseo muestral de estratificacin, se trata de conseguir
homogeneidad dentro de los estratos y heterogeneidad entre los estratos con
respecto a la caracterstica que se est midiendo. En el diseo muestral de
conglomerados, los conglomerados debern ser homogneos entre
conglomerados y heterogneos dentro de los conglomerados.
Mientras que, por lo general, la estratificacin aumenta la precisin en relacin
con el muestreo aleatorio simple, el muestreo por conglomerados, con
frecuencia, la disminuye.
En un muestreo estratificado la varianza de la estimacin de la media (o
proporcin) depende de la variabilidad de los valores dentro de los estratos.
Para una mayor precisin, los elementos dentro de cada estrato deben tener
valores similares, pero las medias (o proporciones) por estrato deben diferir
entre s lo ms posible.
En un muestreo por conglomerados la varianza de la estimacin de la media (o
proporcin) depende principalmente de la variabilidad que existe entre las
medias (o proporciones) de los conglomerados.
Para una mayor precisin, los elementos dentro de cada conglomerado deber
ser heterogneos y las medias (o proporciones) por conglomerados debe ser
similares entre s.

La eficiencia de este tipo de muestreo disminuye al aumentar el nmero de los
conglomerados, cuando en realidad este tipo de muestreo es ms til en caso
de poblaciones muy numerosas en las que se puedan construir conglomerados
grandes.

Uno de los ms grandes errores cometidos por los investigadores que usan
encuestas consiste en analizar una muestra por conglomerados como si fuese
una muestra aleatoria simple.


UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
4
3. Forma de seleccin de una muestra por conglomerados
Aunque las unidades que nos interesan no se seleccionan directamente, la
probabilidad de seleccionar un conglomerado y cada unidad dentro del mismo
es conocida de antemano; por lo tanto, el muestreo por conglomerados
satisface el criterio de muestreo probabilstico.
La primera tarea en un muestreo por conglomerados es especificar los
conglomerados apropiados a ser seleccionados.
Los elementos dentro de un conglomerado estn frecuentemente juntos
fsicamente, por lo que tienden a presentar caractersticas similares. Dicho de
otra manera la medida de un elemento del conglomerado puede estar
altamente correlacionada con la de otro elemento. Entonces la cantidad de
informacin acerca de un parmetro poblacional puede no incrementarse
sustancialmente al tomar nuevas medidas dentro de un conglomerado. Ya que
las mediciones cuestan dinero, un experimentador podra desperdiciar
presupuesto si es que selecciona un conglomerado de gran tamao.
Sin embargo, puede ocurrir situaciones en las cuales los elementos dentro de
un conglomerado son muy diferentes entre si. En tales casos una muestra que
contenga a pocos conglomerados de gran tamao puede producir una
estimacin muy buena.
El problema de elegir un nmero de conglomerados apropiados puede ser aun
ms complicado cuando se dispone de conglomerados de tamaos muy
distintos. Las encuestas piloto pueden ayudar a solucionar este tipo de
problema.
Una vez que los conglomerados han sido especificados se debe conformar un
marco que liste a todos los conglomerados de la poblacin. Posteriormente se
selecciona una muestra irrestricta aleatoria de conglomerados de este marco,
siguiendo cualquiera de los procedimientos vistos para el MAS.

En el diseo de una muestra, el muestrista tiene que decidir cuantas etapas de
muestreo se deben usar. Adems, en cada etapa, tiene que determinar la
unidad de muestreo, con lo cual se podran usar cualquiera de los siguientes
planes:
Tomar una muestra aleatoria simple, sistemtica o estratificada de unidades
muestrales (conglomerados). Para posteriormente seleccionar a todos o
una muestra aleatoria de los elementos que conforman dicho
conglomerado.
Usar mapas para subdividir la regin a estudiarse en segmentos
(conglomerados) de reas pequeas. Se puede seleccionar una muestra de
estos segmentos y dentro de los segmentos se podra se podra
seleccionar a todos los elementos que los conforman o a una muestra de
ellos. Usualmente cuando se utilizan mapas la divisin de los segmentos se
basan en aspectos geopolticos.

Cuando se usa el submuestreo, el conglomerado seleccionado inicialmente se
llama la unidad de primera etapa o la unidad primaria de muestreo (UPM) y la
unidad de submuestreo se llama la unidad de segunda etapa o unidad
secundaria de submuestreo (USM).


UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
5
4. Muestreo por conglomerados
Sea una poblacin finita con M unidades elementales agrupadas en N
unidades llamadas conglomerados o unidades primarias de muestreo (UPM),
de tal manera que no existe solapamiento entre los conglomerados y que estos
contengan a la poblacin en estudio. Consideremos como unidad de muestreo
el conglomerado y extraemos de la poblacin una muestra de n
conglomerados a partir de la cual estimaremos los parmetros poblacionales.
El nmero de unidades elementales en un conglomerado se denomina tamao
del conglomerado. Los conglomerados pueden ser de igual o de distinto
tamao y han de ser lo mas heterogneos posible dentro de ellos y lo mas
homogneo posible entre ellos.
Una muestra por conglomerados es una muestra aleatoria en la cual cada
unidad de muestreo es una coleccin o conglomerado de elementos.
En muestreo por conglomerados se considera un grupo de unidades
elementales como conglomerado por lo que pueden ocurrir los siguientes casos
(asumiendo que la probabilidad de que los conglomerados puedan ser
elegidos es la misma):

1. Muestrear todas las unidades del conglomerado (Muestreo Monoetpico)
Considerando que los conglomerados son de igual tamao.
Ejemplo:
Se cuenta con un lote de 50 cajas y dentro de cada caja hay 5 chocolates.
Se seleccionan al azar 6 cajas y de las cajas seleccionadas se inspeccionan
todos los chocolates.

Considerando que los conglomerados son de diferente tamao.
Ejemplo
En el presente semestre se han abierto 10 secciones del curso de
Estadstica General y en cada seccin hay diferentes cantidades de
alumnos matriculados. Se quiere hacer un estudio de opinin, para lo cual
se seleccionan al azar 4 secciones y de cada seccin seleccionada se
entrevistan a todos los alumnos.

2. Muestrear parte de las unidades del conglomerado (Muestreo Bietpico)
Considerando que los conglomerados son de igual tamao.
Ejemplo:
Se cuenta con un lote de 50 cajas y dentro de cada caja hay 5 chocolates.
Se seleccionan al azar 6 cajas y de cada una de las cajas seleccionadas se
inspeccionan al azar 3 chocolates.

Considerando que los conglomerados son de diferente tamao.
En el presente semestre se han abierto 10 secciones del curso de
Estadstica General y en cada seccin hay diferentes cantidades de
alumnos matriculados. Se quiere hacer un estudio de opinin, para lo cual
se seleccionan al azar 4 secciones y de cada seccin seleccionada se
entrevistan al 10% de los alumnos.

Cuando hay ms de dos etapas de muestreo se denomina muestreo
multietpico.
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
6
5. Notacin del Muestreo por Conglomerados
La notacin general que utilizaremos en este captulo y en el siguiente se
presenta a continuacin:
N : Nmero total de conglomerados.
n : Nmero de conglomerados seleccionados en la muestra.
i
M : Nmero de unidades elementales por conglomerado o Unidad Secundaria
de Muestreo (USM). i=1,, N.
En el caso del muestreo por conglomerados de igual tamao se considera
en lugar de
i
M a M dado que es un valor constante o fijo.
En el caso del muestreo por conglomerados de diferente tamao M es
variable
i
m : Nmero de unidades elementales en el conglomerado seleccionado o
Unidad Secundaria de Muestreo (USM). i=1,, n.
En el caso de muestreo por conglomerados de igual tamao se considera
en lugar de
i
m a m dado que es un valor constante o fijo.
1
N
i
i
M
M
N
=
=

Tamao promedio del conglomerado.
1
n
i
i
M
M
n
=
=

Tamao promedio de conglomerado en la muestra.
1 =
=

N
i
i
M M : Nmero total de unidades elementales en la poblacin. Tamao de
la poblacin.
En el caso de muestreo por conglomerados de igual tamao M NM =
Si se desconoce M se puede estimar por = M NM
1 =
=

n
i
i
m m : Nmero total de unidades elementales en la muestra. Tamao de la
muestra
En el caso de muestreo por conglomerados de igual tamao m nM =
En el caso de muestreo por conglomerado en una etapa =
i i
m M , es decir
1 =
=

n
i
i
m M dado que sern considerados todos los elementos del
conglomerado seleccionado.
n
f
N
= La fraccin de muestreo







UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
7
MUESTREO MONOETPICO DE CONGLOMERADOS

En el muestreo por conglomerados en una etapa todos los elementos que
componen un conglomerado (unidad primaria de muestreo o UPM) conforman
la muestra.
El muestreo por conglomerados en una etapa se utiliza en muchas encuestas
donde el costo de muestreo de las unidades secundarias es despreciable en
relacin con el costo de muestreo de las unidades primarias.
Por ejemplo, en las encuestas educativas, una unidad primaria natural es el
saln de clase, con frecuencia todos los estudiantes de un determinado saln
se incluyen como unidades secundarias, pues se requiere de apenas un ligero
costo adicional para dar el cuestionario a todos los estudiantes de saln en
lugar solo de algunos cuantos.
Para el muestreo por conglomerados en una etapa se pueden considerar dos
casos:
1. Los conglomerados tengan el mismo tamao y
2. Los conglomerados tengan diferentes tamaos. Sin embargo, el primero es un
caso particular del segundo.

1. Conglomerados con el mismo tamao M
En la mayora de estudios sociales se pueden formar conglomerados de
diferentes tamaos, sin embargo en estudios agrcolas e industriales se
presentan conglomerados de igual tamao.
La poblacin
1 2
, , ,
NM
y y y es agrupada en N conglomerados naturales o
artificiales conteniendo cada uno igual nmero de unidades de anlisis M .

Podemos tener el siguiente esquema para representar a todos los elementos
de la poblacin agrupados en N conglomerados:

Conglomerados
Nmero de Unidades
1 2 3
M
1
11
y
12
y
13
y
1M
y
2
21
y
22
y
23
y
2M
y
3
31
y
32
y
33
y
3M
y

N
1 N
y
2 N
y
3 N
y
NM
y

Donde:
ij
y : Es el valor de la variable objetivo correspondiente a la j-sima observacin
perteneciente al i-simo conglomerado

Aqu se utiliza M como el tamao de los conglomerados solo con el fin de no
utilizar ms elementos de notacin. Dado que algunos textos refieren a este
valor como simplemente
i
M .

UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
8
La idea es seleccionar una muestra n de conglomerados y analizar todos las
unidades que presenta ese conglomerado con lo cual tendramos

Conglomerados
Muestreados
Nmero de Unidades
1 2 3
M
1
11
y
12
y
13
y
1M
y
2
21
y
22
y
23
y
2M
y
3
31
y
32
y
33
y
3M
y

n
1 n
y
2 n
y
3 n
y
nM
y

Especficamente en esta seccin se debe tener en cuenta las siguientes
notaciones:
N: Nmero total de conglomerados.
M : Tamao del conglomerado.
M NM = : Nmero total de elementos en la poblacin.
n: Nmero de conglomerados seleccionados.
m nM = : Nmero total de elementos seleccionados.

Por ejemplo:
Se tiene un lote de N=80 cajas de chocolates; cada caja de tiene M =20
chocolates. Se quiere inspeccionar una muestra de n=10 cajas y todos los
elementos que contiene cada caja.
Se puede deducir que hay un total de M=(80)(20) =1600 chocolates y se van a
inspeccionar m=(10)(20)=200 chocolates.

1.1 Ventajas y Desventajas
Ventajas
Al ser los conglomerados de igual tamao, las estimaciones son
insesgadas.
Requiere solo un marco actualizado de UPM.
El padrn de USM (y por lo tanto de las unidades de anlisis) solo ser
construido para una UPM seleccionada.

Desventajas
Si los conglomerados son muy homogneos, los coeficientes de correlacin
dentro de las UPM son positivos y altos.
Si los conglomerados son muy grandes, (valores de M altos) esto hace que
se incremente el Efecto del Diseo (EFD).
Si los conglomerados son muy grandes cabe la existencia de una alta
variabilidad de la media, debido a que los promedios por conglomerado
pueden ser muy variables.




UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
9
1.2 Estimacin de la media, el total, la proporcin y el total de clase
Para estimar la media poblacional
El estimador de la media poblacional y su varianza son:

1 1 1
1
n n n
i i i
i i i
cong
y y y
y y
n m nM
= = =
= = = =


donde
M
j
j i
i
y
y
M
=
=


Su varianza es estimada mediante:
( )
( )
2
1
1
n
cong
S
V y f
n
=
donde
( )
2
2 1
1
n
i
i
n
y y
S
n
=

=

y
n
f
N
=
La expresin de
( )
1 cong
V y puede ser expresada como:
( )
( )
( )
( )
2
1
1
1
1
n
i
i
cong
y y
f
V y
n n
=



Un lmite de confianza puede ser obtenido mediante:

1 1 1 2 cong cong
IC y Z V y


Para estimar el total poblacional
1 1
1 1
1
n n
i i n
i i
i cong cong
i
y y
N
y M y NM NM y
n n nM

2
1 1 cong cong
V y M V y

Un lmite de confianza puede ser obtenido mediante
1 1 1 2 cong cong
IC y Z V y

Para estimar la proporcin poblacional
El estimador de la proporcin poblacional y su variancia es:
1
1
n
i
i
cong
p
p
n
=
=


donde
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
10
M
ij
j i
i
a
p
M
=
=



1 int -
0 int -
ij
si el elemento j presenta la caracterstica de ers en el i esimo conglomerado
a
si el elemento j no presenta la caracterstica de ers en el i esimo conglomerado



La expresin de
( )
1 cong
V p puede ser obtenida mediante:
( )
( )
( )
( )
2
1
1
1
1
1
=

n
i cong
i
cong
p p
f
V p
n n


Un lmite de confianza puede ser obtenido mediante
1 1 1 2 cong cong
IC p Z V p


Para estimar el total de clase
1
1
cong
cong
A Mp
2
1
1
cong
cong
V A M V p
Un lmite de confianza puede ser obtenido mediante
1 1
1 2
cong cong IC A A Z V A

Ejemplo 1
Se realiza el control de calidad de 10 cajas seleccionadas al azar de un total de
200 producidas y se inspecciona todos los elementos de las cajas
seleccionadas. Los datos sobre los pesos (en gr.) se presentan en la siguiente
tabla:
Caja Cantidad de
elementos
Peso total
de la caja
Elementos con
peso superior al
especificado
1 12 601.3 3
2 12 600.8 4
3 12 601.2 2
4 12 599.6 3
5 12 600.4 2
6 12 600.1 1
7 12 598.2 0
8 12 597.9 4
9 12 601.3 1
10 12 600.2 2

UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
11
Estime la media y su error estndar.
( )( )
1
6001
50.0083
10 12
cong
y y = = =
( )
( )
2
10 0.01032
1 1 0.000981
200 10
| |
= = =
|
\ .
n
S
V y f
n

Error estndar = 0.000981 0.03131

50.0083 1.96 0.000981 49.95;50.07 IC
El intervalo que va de 49.95 a 50.07 gr. brinda un 95% de confianza de
contener al peso promedio de los elementos dentro de las cajas.

Estime la proporcin de elementos con un peso superior al especificado y
su error estndar
( )
1
1
1
3 4 2
12
0.1833
10
n
i
i
cong
a
p
n
=
+ + +
= = =



( )
( )
( )
( )
2
1
^
1
1
1 10 0.012
1 0.0011
1 200 10
n
i
cong
i
cong
a p
f
V p
n n
=

| || |
= = =
| |

\ .\ .


Error estndar = 0.0011 0.034

0.183 1.96 0.0011 0.117;0.25 IC

El intervalo que va de 0.117 a 0.25 brinda un 95% de confianza de contener a
la proporcin de elementos con un peso superior al especificado.

Ejemplo 2
En un internado se tiene un total de 100 habitaciones donde duermen 4
estudiantes en cada una de ellas. Un estudiante quiere estimar los ingresos
semanal promedio (en miles de soles) de sus padres de sus compaeros de
dormitorio.
En lugar de obtener una lista de todos los alumnos que pertenecen al internado
y realizar una muestra aleatoria simple, observa que elige al azar 5 cuartos y
pregunta a cada estudiante de la habitacin sobre el ingreso semanal promedio
de su padre. Los resultados son los siguientes:

Persona
Cuarto
1 2 3 4 5
1 3.08 2.36 2.00 3.00 2.68
2 2.60 3.04 2.56 2.88 1.92
3 3.44 3.28 2.52 3.44 3.28
4 3.04 2.68 1.88 3.64 3.20
Total 12.16 11.36 8.96 12.96 11.08
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
12
Estime los ingresos semanal promedio de los padres de los estudiantes y su
error estndar.
1
2.826
cong
y =
( )
( )
2
1
1 0.0268 = =
n
cong
S
V y f
n

Error estndar = 0.0268 0.163

2.826 1.96 0.163 2.505;3.147 IC

El intervalo que va de 2.505 a 3.147 gr. brinda un 95% de confianza de
contener al ingreso semanal promedio de los padres de los estudiantes.

Estime un intervalo del 95% de confianza para la proporcin de padres con un
ingreso semanal superior a 3000 soles.


1.3 El coeficiente de correlacin intraconglomerados y el Efecto del Diseo
(EFD)

En el muestreo por conglomerados en una etapa, la variabilidad de los
estimadores insesgados
1 cong
y o
1 cong
p depende de la variabilidad que exista
entre los conglomerados.
Si se utiliza la descomposicin de la variabilidad se cumple que
2

n
CM Entre conglomerados MS es decir
2

n
CM Entre conglomerados
S
M
.
A continuacin se presenta el anlisis de varianza para la descomposicin de la
variabilidad de todos los conglomerados
Fuente GL Suma de Cuadrados Cuadros
Medios
Entre
Conglomerados
(UPMs)
N-1
( )
2
. 1
1 1
N M
i cong
i j
SCEC y y
= =
=

CMEC
Dentro de
Conglomerados
(UPMs)
( )
1 N M
( )
2
.
1 1
N M
ij i
i j
SCDC y y
= =
=

CMDC
Total
NM -1 ( )
2
1
1 1
N M
ij cong
i j
SCT y y
= =
=


2
S

En general, si trabajamos con una muestra de conglomerados se tendra lo
siguiente:





UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
13
FV GL CM
Entre conglomerados (EC) n-1
2
n
CMEC MS
Dentro de los conglomerados (DC)
( )
1 n M = m-n
2
M
CMDC S
Total
nM -1= m-1
2
S

Se puede deducir que para el caso del estimador del total mediante muestreo
por conglomerados se cumple que:
( ) ( )
^ ^ ^
2
2 2 2
1 1
1 1 1
cong cong
n CMEC n CMEC n MCMEC
V y M V y M NM N
N N N n nM nM
| | | | | | | |
= = = =
| | | |
\ . \ . \ . \ .

Si CMEC/CMDC es grande, entonces el muestreo por conglomerados reduce
la precisin. Para que esto suceda, el CMEC debe ser relativamente grande,
pues mide la variabilidad de un conglomerado a otro. Con frecuencia, los
elementos de conglomerados distintos varan ms que los elementos en el
mismo conglomerado, pues conglomerados distintos tienen medias diferentes.
Si los conglomerados son relativamente homogneos CMDC ser pequeo.
Cuando por fines prcticos se desea comparar el muestreo por conglomerados
con el muestreo aleatorio simple, se tiene que en lugar de tomar una muestra
de n conglomerados y en cada uno de ellos muestrear todos los M elementos
que lo componen se desean muestrear nM unidades muestrales.
La varianza del total mediante un MAS se tendra:
( ) ( )
2 2 2
^ ^ ^
2
2 2 2
1 1 1
MAS MAS
nM S nM S n MS
V y M V y M NM N
M M N n NM nM
| | | |
| | | |
= = = =
| | | |
\ . \ .
\ . \ .

Al comparar esta expresin con la anterior si CMEC>S
2
, entonces el muestreo
por conglomerados es menos eficiente que el muestreo aleatorio simple.
El cociente
2
CMEC
S
podra estimar el incremento de la varianza debido al utilizar
un muestreo por conglomerados en lugar de un muestreo aleatorio simple.

Sin embargo, el total del cuadrado de la media de la muestra no se debe usar
para estimar S
2
cuando n es pequea. Estos datos se reunieron como una
muestra por conglomerados y por lo tanto, no reflejan de manera adecuada la
variabilidad de un conglomerado a otro.
En vez de esto debemos multiplicar las estimaciones insesgadas de CMEC y
CMDC por los grados de libertad de la tabla de anlisis de varianza de la
poblacin para estimar la suma de cuadrados de la poblacin. Primero,
estimamos las cantidades SCEC y SCDC para la poblacin y luego las
sumamos para estimar SCTo=S
2


a) El coeficiente de correlacin intraconglomerados
El coeficiente de correlacin intraconglomerados se define como el coeficiente
de correlacin lineal (Coeficiente de correlacin de Pearson) entre todos los
pares de observaciones que se puedan formar dentro de un conglomerado
Este coeficiente es una medida de homogeneidad en el interior (dentro) de los
conglomerados, es decir nos dice que tan similares son los elementos del
mismo conglomerado. Evidentemente interesa que el coeficiente de
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
14
homogeneidad intraconglomerados sea los mas pequeo posible, ya que en
muestreo por conglomerados lo ideal es heterogeneidad dentro de los
conglomerados.
En trminos de las cantidades de la tabla de anlisis de varianza el coeficiente
de correlacin intraconglomerados se puede escribir como:
1
1
M SCDC
SCTo M

Como 0 1 SCDC SCTo implica que:
1
1
1 M

En la prctica suele ocurrir que los elementos de cada conglomerado tienen
cierto parecido entre si aunque se intente que sean lo mas heterogneos
posibles, con lo cual la correlacin es positiva y menor la precisin en el
muestreo por conglomerados que en el aleatorio simple. Este problema ya
haba sido citado en la parte introductoria como una de las desventajas del
muestreo por conglomerados.
Si los conglomerados aparecen de manera natural en la poblacin usualmente
el coeficiente de correlacin es positivo. Los elementos dentro del mismo
conglomerado tienden a ser mas similares que los elementos elegidos al azar
entre la poblacin. Esto pues ocurrir debido a que los elementos de un
conglomerado comparten un ambiente similar.
Si el coeficiente de correlacin intraconglomerado es positivo, el muestreo por
conglomerado es menos eficiente que el muestreo aleatorio simple.
Es raro que un coeficiente de correlacin intraconglomerados resulte negativo,
sin embargo esto puede ocurrir en algunas muestras sistemticas o en
conglomerados artificiales. Si el coeficiente de correlacin intraconglomerados
es negativo los elementos que estn dentro de un conglomerado se dispersan
ms de lo que se dispersara un grupo elegido al azar.
Si el coeficiente de correlacin intraconglomerado es negativo, el muestreo por
conglomerados es ms eficiente que el muestreo aleatorio simple.
Es importante resaltar que el coeficiente de correlacin intraconglomerados
est definido como una medida de homogeneidad para conglomerados del
mismo tamao. Una medida alternativa que se puede usar para analizar la
homogeneidad es el
2
a
R . Este coeficiente puede ser estimado de la siguiente
manera:
2
2
2 2
1 1
M
a
S
CMDC
R
S S

Donde:
2 2
2
1 1
n
M
MS M S CMEC M CMDC
S
M M

El valor de
2
S obtenido como CMTotal del Anlisis de Varianza se le conoce
como estimador ingenuo, mientras que S
2
de la expresin anterior es un
estimador insesgado de la varianza.

En resumen si:
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
15
2
0
a
o R El muestreo por conglomerados es menos eficiente que el
muestreo aleatorio simple.
2
0
a
o R El muestreo por conglomerados es equivalente al muestreo
aleatorio simple.
2
0
a
o R El muestreo por conglomerados es ms eficiente que el muestreo
aleatorio simple.


b) Efecto del Diseo
En algunas ocasiones es de inters medir la variabilidad que se puede obtener
si se utiliza el muestreo por conglomerados en lugar del muestreo aleatorio
simple.
El efecto del diseo mide el incremento o disminucin de la variabilidad al
utilizar un diseo muestral 1 en lugar de utilizar otro diseo muestral 2.
Para comparar el efecto que se tiene al utilizar el muestreo por conglomerados
en lugar del muestreo aleatorio simple este puede ser estimado mediante la
siguiente expresin:
1 1 EFD M

2 2
2 2
n n
S n MS
EFD
S S nM


De lo anterior se puede deducir que:
1 EFD El muestreo por conglomerados es peor que el muestreo aleatorio
simple.
1 EFD El muestreo por conglomerados es equivalente al muestreo
aleatorio simple.
1 EFD El muestreo por conglomerados es mejor que el muestreo aleatorio
simple.

La varianza estimada de la media puede ser aproximada en trminos del
coeficiente de correlacin o del efecto del diseo
2
2
1 1 1
1
cong
f S M
S EFD
V y f
nM nM

S
2
es el estimador insesgado de la varianza

Por otro lado, si el Muestreo Aleatorio Simple es ms preciso se puede
determinar el tamao de muestra necesario en un Muestreo Aleatorio Simple
para que ambos diseos sean equivalentes, mediante la siguiente expresin:
MSA
nM
m
EFD

Si desea disminuir la variabilidad en un muestreo por conglomerados, se podra
incrementar la seleccin de conglomerados en la muestra, esto se puede
conseguir mediante la siguiente expresin:
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
16
2
0
n
S
n
V

Donde
V
0
: Es la nueva varianza requerida
Si 0.05
n
f
N
se debe realizar un ajuste a la cantidad de conglomerados a
seleccionar de la siguiente manera:
1
ajus
n
n
n
N


Ejemplo 2 (continuacin)
El coeficiente de correlacin se calculara de la siguiente manera:
FV SC CM
Entre conglomerado 2,25568 0,56392
Dentro de los conglomerado 2,77560 0,18504
Total 5,03128 0,26480

Con el coeficiente de correlacin intraconglomerado para conglomerados de
igual tamao
4 2.775
1 1 0.2644
4 1 5.031 1
M SCDC
SCTo M

2
1
0.5639 4 1 0.1850
0.2797
4
CMEC M CMDC
S
M

Con el coeficiente de correlacin intraconglomerado para conglomerados
general
2
2
0.185
1 1 0.3386
0.2797
a
CMDC
R
S

Tanto como
2
a
R son mayores a cero con lo cual se podra argumentar que el
muestreo por conglomerados es menos eficiente que el muestreo aleatorio
simple.

Para la estimacin del EFD, se utilizara en este caso el coeficiente de
correlacin intraconglomerado para conglomerados de igual tamao
1 1 1 0.2644 4 1 1.793 EFD M
El EFD es superior a 1 lo que indica que el muestreo por conglomerados es
peor que el muestreo aleatorio simple.

2
0.3395 1.793
1 1 0.05 0.0289
5 4
cong
S EFD
V y f
nM

Como puede observar este valor se aproxima a
( )
0.0268 V y =

UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
17
Ejemplo 3
En una cuenca ganadera compuesta por 800 establos lecheros se los agrupa
en 160 asociaciones de ganaderos, de forma que cada una de ellas tenga 5
establos lecheros contiguos. Con el fin de estimar el promedio de vacas en
ordeo por establo de la cuenca, una Muestra Aleatoria Simple de 10
asociaciones fue elegida, y dentro de cada asociacin se visit a los 5 establos.
Los resultados obtenidos fueron:


Asociacin Nmero de
establos
Nmero de vacas en ordeo en los
establos de la muestra
i
y
1 5 4 6 8 9 5 6.4
2 5 0 7 1 3 6 3.4
3 5 1 2 4 6 5 3.6
4 5 9 5 3 2 2 4.2
5 5 9 6 6 7 5 6.6
6 5 4 0 7 9 0 4.0
7 5 6 6 5 4 5 5.2
8 5 4 6 8 9 5 6.4
9 5 3 8 8 9 9 7.4
10 5 2 7 3 5 5 4.4

Intervalo de confianza para nmero promedio de vacas por establo
1
6.4 4.4
5.16
10
cong
y
+ +
= = vacas por establo
Existen diferentes formas de calcular la varianza del promedio dependiendo
como se calcula
2
n
S
( )
( )
2
1
10 2.0604
1 1 0.1932
160 10
| |
= = =
|
\ .
n
cong
S
V y f
n

Donde:
( )
2
2 1
1
n
i
i
n
y y
S
n
=

=

o
2

n
CM Entre Conglomerados
S
M

2
10.3
2.06
5
n
S
Por lo tanto el error estndar es la raz del anterior resultado, obtenindose
1.435

Un intervalo de confianza estara dado por:
IC() = [5.16 1.96(0.439)] = [3.47; 6.85]

One-way ANOVA:
Fuente GL SC CM
Entre Conglomerados 9 92.72 10.30
Dentro de Conglomerados 40 242.00 6.05
Total 49 334.72 6.83
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
18
Coeficiente de Correlacin Intraconglomerados
Con el coeficiente de correlacin intraconglomerados para conglomerados de
igual tamao, podramos establecer dos posibles estimaciones:
Primero, a partir de los datos de la muestra:
5 242
1 1 0.096
5 1 334.72 1
M SCDC
SCTo M


Segundo a partir de la estimacin de los totales de las sumas de cuadrados,

FV SC GL CM
Entre conglomerados 1638.05333 159 10.3022222
Dentro de los conglomerados 3872 640 6.05
Total 5510.05333 799 6.8961869

5 3872
1 1 0.1216
5 1 5510.053 1
M SCDC
SCTo M

Esta estimacin se debe utilizar cuando el tamao de muestra (nmero de
conglomerados seleccionados n) es pequeo. Como se puede apreciar se
recalculan las sumas de cuadrados a partir de los valores de M y N.

Coeficiente de correlacin intraconglomerados general
Se puede calcular de tres maneras, dependiendo del clculo de S
2
:
2
2
2
1
M
a
S
R
S

Utilizando el estimador ingenuo
S
2
= 6.83
2
6.05
1 0.1142
6.83
a
R

Utilizando el estimador insesgado
2 2
2
1
10.3 4 6.05
6.9004
5
n
M
MS M S
S
M

2
6.05
1 0.1232
6.9004
a
R
Utilizando el estimador corregido por totales
S
2
= 6.89
2
6.05
1 0.1227
6.83
a
R

Al ser positivo el coeficiente de correlacin intraconglomerados, incrementar la
varianza del estimador.

El efecto del diseo.
Con el primer resultado del coeficiente de correlacin intraconglomerados
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
19
1 1 1 0.096 5 1 1.385 EFD M

Con el segundo resultado del coeficiente de correlacin intraconglomerados
1 1 1 0.1216 5 1 1.486 EFD M

El efecto del diseo indica que al muestrear grupos de 5 establos, la varianza
del estimador se increment en 1.385 veces(o 1.486) respecto a una muestra
aleatoria simple de 50 establos.
Como en este caso parecera ser mas preciso un Muestreo Aleatorio Simple, el
tamao de muestra necesario para este tipo de diseo con el fin de ser
equivalente al muestreo por conglomerados seria:

10 5
36.1 37
1.385
MSA
nM
m
EFD
establos (con el primer resultado del EFD)


( ) 10 5
33.6 34
1.486
MSA
nM
m
EFD
= = = ~ establos (con el segundo resultado del EFD)


Si se desea reducir la variabilidad a un 5% Cuntos conglomerados serian
necesarios?
El coeficiente de variabilidad con la informacin muestral es:
1
0.1932
100% 8.5%
5.16
cong
cv y

Si se quiere reducir al 5% se tendra:
0
0
0.05 0.0666
5.16
V
V
2.0604
30.95 31
0.0666
n asociaciones

Como
30.95
0.19 0.05
160
n
N
se debe realizar un ajuste a la cantidad de
conglomerados a seleccionar de la siguiente manera:
30.95
25.937 26
1 0.19
1
ajus
n
n
n
N
asociaciones
Por lo tanto se requieren 26 asociaciones (conglomerados) es decir 130
establos (unidades de anlisis).




UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
20
Si ahora se considera como xito encontrar un establo con 5 o ms vacas en
ordeo.

Asociacin Nmero de
establos
Nmero de vacas en ordeo en los
establos de la muestra
i
p
1 5 0 1 1 1 1 0.8
2 5 0 1 0 0 1 0.4
3 5 0 0 0 1 1 0.4
4 5 1 1 0 0 0 0.4
5 5 1 1 1 1 1 1.0
6 5 0 0 1 1 0 0.4
7 5 1 1 1 0 1 0.8
8 5 0 1 1 1 1 0.8
9 5 0 1 1 1 1 0.8
10 5 0 1 0 1 1 0.6
Calcule:
a) La proporcin de establos con 5 o ms vacas en ordeo y su error estndar.
1
0.8 0.6
0.64
10
cong
p
+ +
= =
( ) ( )
2
1
10 0.052
1 1 0.0048
160 10
n
cong
S
V p f
n
| |
= = =
|
\ .

( )
1
0.0048 0.069
cong
EE p = =

b) El efecto del diseo.
FV SC GL CM
Entre conglomerados 2.32 9 0.25777778
Dentro de los conglomerados 9.2 40 0.23
Total 11.52 49 0.23510204
5 9.2
1 1 0.0017
5 1 11.52 1
M SCDC
SCTo M

1 1 1 0.0017 5 1 1.007 EFD M

c) El tamao de muestra para que el muestreo por conglomerados sea
equivalente al MAS.
10 5
49.6 50
1.007
MSA
nM
m
EFD

d) El nmero de conglomerados a seleccionar si se desea reducir la variabilidad
en un 6%.
0
0
0.06 0.0015
0.64
V
V
0.052
34.96 35
0.0015
n
34.96
28.69 29
1 0.19
1
ajus
n
n
n
N

UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
21
2. Conglomerados de distinto tamao
La poblacin
1 2
, , ,
NMi
y y y es agrupada en N conglomerados naturales o
artificiales conteniendo cada no necesariamente igual nmero de unidades de
anlisis. La cantidad de elementos de i-simo conglomerado ser denotado por
i
M
Podemos tener el siguiente esquema:

Conglomerado
Nmero de Unidades
1 2 3
i
M
1
11
y
12
y
13
y
1
1M
y
2
21
y
22
y
23
y
2
2M
y
3
31
y
32
y
33
y
3
3M
y

N
1 N
y
2 N
y
3 N
y
N
NM
y

Donde:
ij
y : Es el valor de la variable objetivo correspondiente a la j-sima observacin
perteneciente al i-simo conglomerado

La idea es seleccionar una muestra n de conglomerados y analizar todos las
unidades que presenta ese conglomerado con lo cual tendramos

Conglomerados
Muestreados
Nmero de Unidades
1 2 3
i
M
1
11
y
12
y
13
y
1
1M
y
2
21
y
22
y
23
y
2
1M
y
3

n
1 n
y
2 n
y
3 n
y
n
nM
y

Especficamente en esta seccin se debe tener en cuenta las siguientes
notaciones:
N: Nmero total de conglomerados.
n: Nmero de conglomerados seleccionados.
M
i
: Nmero de total de elementos en el conglomerado i (tamao del
conglomerado i).
1
N
i
i
M M
=
=

: Nmero total de elementos en la poblacin.


UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
22
1
N
i
i
M
M
N
=
=

: Tamao promedio del conglomerado, que puede ser estimado
mediante
1
n
i
i
M
m
n
=
=

.
1
n
i
i
m M
=
=

: Nmero total de elementos seleccionados.



Por ejemplo:
En este semestre se han abierto 10 secciones del curso de Estadstica
General, con los siguientes nmeros de alumnos matriculados

Seccin A B C D E F G H I J Total
N de
alumnos
38 49 60 52 46 49 30 47 56 58 485
Se seleccionan al azar 3 secciones (C, G y J), entonces:
Se tiene que de N=10 secciones; cada seccin tiene su propio tamao (M
1
=60,
M
2
=30 y M
3
=58), se seleccionan n=3 secciones y se entrevistan a todos los
estudiantes de cada seccin.
Se puede mencionar que hay un total de M=485 estudiantes y se van a
entrevistar a m=60+30+58=148 estudiantes. Cada seccin tiene en promedio
m =148/3= 49. 3 estudiantes por seccin y segn el total poblacional se
tendran M = 485/10=48.5 estudiantes por seccin


2.1 Estimacin de la media, el total, la proporcin y el total de clase
Si los conglomerados no varan mucho en tamao
Se pueden utilizar las frmulas vistas en el caso anterior tanto para la
media, total, proporcin y total de clase.
Al estimador de la media se le conoce como estimador promedio de
promedios.

Si los conglomerados varan mucho en tamao (el estimador de razn)
Si los tamaos de los conglomerados son significativamente distintos, un
estimador sesgado de la media es el estimador de razn (o de proporcin):
Este estimador se obtiene de la idea de que los totales y
i
se encuentran
correlacionados con M
i
.
Es un estimador bastante sesgado si los valores de
i
M varan mucho de un
conglomerado a otro.

Para estimar la media poblacional
1 1
2
1 1
n n
i i i
i i
cong n n
i i
i i
M y y
y
M M
= =
= =
= =



UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
23
:
i
y Es el total de todas las observaciones el i-simo conglomerado

Su varianza es estimada mediante:
( )
( )
( )
( )
( )
( )
( )
2 2
2
2 2
1 1
2 2 2
1
1
1
1
= =

= =


n n
i i i i cong cong
i i
cong
M y y y M y
f
V y f
n
nM n nM


Un lmite de confianza puede ser obtenido mediante
2 2 1 2 cong cong
IC y Z V y

Para estimar el total poblacional
2 2 cong cong
y M y
2
2 2 cong cong
V y M V y
Un lmite de confianza puede ser obtenido mediante
2 2 1 2 cong cong
IC y Z V y

Para estimar la proporcin poblacional
El estimador de la proporcin poblacional y su varianza es:
1
2
1
n
i
i
cong n
i
i
a
p
M
=
=
=


Donde:
i
a : Es el total de elementos que presentan la caracterstica de inters en
el i-simo conglomerado
Su varianza es estimada mediante:
( ) ( )
( )
( )
2
2
2
1
2 2
1
1
=

=

n
i i cong
i
cong
M p p
V p f
nM n


Un lmite de confianza puede ser obtenido mediante
2 2 1 2 cong cong
IC p Z V p

Para estimar el total de clase
2
2
cong
cong
A Mp
2
2
2
cong
cong
V A M V p
Un lmite de confianza puede ser obtenido mediante
2 2
1 2
cong cong IC A A Z V A
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
24
Existe una forma adicional de estimacin de la media que es conocida
como el promedio ponderado de promedios. Este es un estimador
insesgado, pero requiere que se conozca el valor de M (total de
elementos de la poblacin) y el tamao promedio de los conglomerados.
Sin embargo, es poco preciso debido a que la variabilidad en los
tamaos de
i
M pueden afectar sustancialmente la variabilidad del
estimador.
Para estimar la media poblacional
El estimador de promedio ponderado de promedios es:
1
3
n
i i
i
cong
N M y
y
nM


y su varianza es estimada mediante

2
2
2
3 2 2
1
3 2
1
3
1 1
1 1
n
i i
n
cong
i
i
cong
i
cong
M y
ny
y
M ny
M
V y f f
n n n n


Un lmite de confianza puede ser obtenido mediante
3 3 1 2 cong cong
IC y Z V y

Para estimar la proporcin poblacional
El estimador de promedio ponderado para estimar la proporcin es:
1
3
n
i i
i
cong
N M p
p
nM


y su varianza es estimada mediante

2
2
3 2
1
3
1
1
n
i i
cong
i
cong
M p
np
M
V p f
n n


Un limite de confianza puede ser obtenido mediante
( )
( )
( )
^
3 3 1 2 cong cong
IC p Z V p
o
t

=

En algunas situaciones es difcil obtener el valor de M (total de
elementos de la poblacin), por lo que no se podra utilizar el estimador
promedio ponderado de promedios y no se podra estimar el total bajo
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
25
los otros estimadores vistos anteriormente. En tales situaciones la
estimacin del total podra ser obtenido mediante

1
n
i cong
i
N
y y
n


y
i
: Es el total de los elementos en el i-esimo conglomerado

y su varianza seria estimada por
( )
( )
2
2
1 1 2
1
1
= =
| | | |

| |
| | \ .\ .
=
|

\ .

n n
i i
i i
cong
y y
n N n
V y N
Nn n


Para el caso del total de clase de igual manera puede ser estimado
mediante la siguiente expresin

1
n
cong
i
i
N
A a
n


y su varianza seria estimada por
( )
2
2
2 1 1
1
1
n n
i i
i i
cong
a a
n N n
V A N
Nn n
= =
| |
| |

| |
| |
| | \ .
\ .
=
| |

\ .
\ .


Ejemplo 4
Se realizan entrevistas a cada uno de los residentes de 25 bloques de
viviendas seleccionados al azar de un total de 415 bloque existentes. Los datos
sobre sus ingresos anuales (en nuevos soles) y la cantidad de arrendatarios se
presentan en la siguiente tabla:

Bloque Cantidad
de
Residentes
Total de
ingresos
Cantidad de
arrendatarios
Bloque Cantidad
de
Residentes
Total de
ingresos
Cantidad de
arrendatarios
1 8 96000 4 14 10 49000 5
2 12 121000 7 15 9 53000 4
3 4 42000 1 16 3 50000 1
4 5 65000 3 17 6 32000 4
5 6 52000 3 18 5 22000 2
6 6 40000 4 19 5 45000 3
7 7 75000 4 20 4 37000 1
8 5 65000 2 21 6 51000 3
9 8 45000 3 22 8 30000 3
10 3 50000 2 23 7 39000 4
11 2 85000 1 24 3 47000 0
12 6 43000 3 25 8 41000 3
13 5 54000 2
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
26
a) Utilice los estimadores 1 y 2 para:
Estimar la media del ingreso anual y su error estndar.

Estimadores Medias Varianzas CV
1 cong
y
10457.65 2220619.616 14.25%
2 cong
y
8801.325 653785.1944 9.19%

Estime el total del ingreso anual
Se puede estimar M por
1
n
i
i
M
M
n
=
=


151
6.04
25
M = = ( ) 415 6.04 2506.6 2507 M NM = = = ~
Estimadores Total
1 cong
y
26217328,55
2 cong
y
22064921775

Estime la proporcin de residentes arrendatarios y su error estndar
Estimadores Proporcin Varianzas CV
1 cong
p
0,461 0,00088573 6,45%
2 cong
p
0,477 0,00054667 4,90%
Estime el total de residentes arrendatarios y su error estndar.
Estimadores Total
1 cong A
1156
2 cong A
1195

Para la proporcin de residentes arrendatarios

b) Halle el coeficiente intraconglomerados y el EFD.

c) Estime el tamao de muestra que seria necesario utilizar en un muestreo
aleatorio simple.

Ejemplo 5
En una cuenca ganadera compuesta por 800 establos se los agrupa en 160
asociaciones, de tal forma que en promedio se tengan 5 establos lecheros
contiguos. Con el fin de estimar el promedio de vacas en ordeo por establo de
la cuenca. Una muestra simple aleatoria de 10 asociaciones fue seleccionada y
para cada una de ellas se visitaron los establos que la conforman. Los
resultados obtenidos fueron:


UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
27
Asociacin
Nmero
de
establos
Nmero de vacas en ordeo
i
y
1 5 4 6 8 9 5 6.40
2 4 0 7 1 3 2.75
3 7 1 2 4 6 5 6 4 4.00
4 4 9 5 3 2 4.75
5 3 9 6 6 7.00
6 5 4 0 7 9 0 4.00
7 6 6 6 5 4 5 4 5.00
8 5 4 6 8 9 5 6.40
9 4 3 8 8 9 7.00
10 5 2 7 3 5 5 4.40
Total 48

M
800

M 5
N 160 S
2
n
2,124
n 10 m 48
f 0,063


a) Estime el nmero promedio de vacas en ordeo por establo, su error
estndar y coeficiente de variacin, mediante los diferentes mtodos
estudiados.
Estimador Promedio Varianza EE CV
1 5,170 0,199 0,446 8,63%
2 5,063 0,152 0,390 7,70%
3 4,860 0,174 0,417 8,59%

b) Estime el total de vacas en ordeo en la cuenca, su error estndar y
coeficiente de variacin, mediante los diferentes mtodos estudiados.
800 M =
cong cong
y M y =
( ) ( )
2
cong cong
V y M V y =
Estimador Total Varianza
1 4136,000 127440
2 4050,000 97352,0833
3 3888,000 111493,333
El error estndar y el coeficiente de variacin son los mismos que los de la
media.

c) En base al estimador promedio de promedios, estime:
El coeficiente intraconglomerado.
2 2
2
1
9.08 4.8 1 5.97
6.623
4.8
n
M
MS M S
S
M

UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
28
2
2
5.97
1 1 0.097
6.623
a
CMDC
R
S

El Efecto del Diseo.

1 1 1 0.097 4.8 1 1.371 EFD M

El tamao de muestra equivalente si se usara un Muestreo Simple
Aleatorio.
10 4.8
35.01 36
1.37
MSA
nM
m
EFD

La cantidad de conglomerados a seleccionar si se quiere reducir la
variabilidad a un 3%.
0
0
0.03 0.0241
5.17
V
V
2.124
88.29
0.0241
n Como
88.29
0.55 0.05
160
n
N

88.29
56.89 57
1 0.55
1
ajus
n
n
n
N


3. Tamao de muestra
La cantidad de informacin en una muestra por conglomerados es afectada por
dos factores el nmero de conglomerados y el tamao relativo de los
conglomerados.
Para estimar el tamao de muestra vamos a suponer que el tamao del
conglomerado ha sido elegido y vamos a considerar nicamente el problema
de seleccionar n conglomerados.

3.1 Para estimar la media poblacional
Se sabe que la varianza estimada de
2 cong
y es
( )
( )
( )
( )
2
2
2 1
2 2 2
1
1
=


= =

n
i i cong
i
c cong
y M y
f
N n
V y S
n
nM NnM

La varianza real de
2 cong
y es aproximadamente
( )
2
2 2
o
| |
=
|
\ .
c cong
N n
V y
NnM


Donde
2
c
o es la cantidad poblacional estimada de
2
c
S . Debido a que no
conocemos
2
c
o , la eleccin del tamao de muestra resulta complicada.
Eliminamos esta dificultad utilizando
2
c
o disponible de una encuesta previa o
una muestra preliminar de ' n elementos (muestra piloto). Por lo tanto como se
dedujo el tamao de muestra en el caso del muestreo aleatorio simple se tiene:
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
29
2 1 2 cong
e Z V y
2
2 2
2 2 2 2
2 2 2
1 2
1
c
c c
e N n N n NM N NM
D D D
Z n n
NnM


2 2
2 2
2
2 2
1
c
c c
NM D N NM N
D
n n


2
2
2 2
c
c
N
n
NM D

Donde
2
c
o puede ser estimado por
2
c
S

Ejemplo (Cont. Ejemplo 4)
Suponga que la informacin que se encuentra en el ejemplo 4 representa una
muestra preliminar de ingresos en la ciudad Qu tan grande debe tomarse la
muestra en una encuesta futura para estimar el ingreso promedio por persona
con un margen de error de $500 y un nivel de confianza del 95%?

( )
( )
2
2
2 1
15227502247
634479260
1 24
n
i i cong
i
c
y M y
S
n
=

= = =


Reemplazando en la expresin:
2
2
415 634479260
162.56 163
500
415 6.04 634479260
1.96
n conglomerados

3.2 Para estimar el total poblacional
Siguiendo la misma idea para encontrar una expresin para estimar el total se
tiene:
2 2
2 2
c
c
N
n
D N


3.3 Para estimar la proporcin poblacional
De igual manera como se estima el tamao de muestra para la media
2
2
2 2
c
c
N
n
NM D

Aqu
2
c
o es estimado por
2
c
S el cual es calculado de la siguiente manera:

( )
( )
2
2
2 1
1
n
i i cong
i
c
a M p
S
n
=

=


UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
30
Ejercicios Propuestos

1. Mencione otras 3 reas o disciplinas donde se puede hacer uso del muestreo
por conglomerados. Indique como realizara la seleccin de los elementos.

2. Encuentre una expresin bajo un margen de error y un nivel de confianza para
calcular el tamao de muestra cuando se desea estimar el total y no se conoce
el valor de M .

3. Los comercios solicitan frecuentemente a los contadores la realizacin de
inventarios. Ya que un inventario completo es costoso a travs del muestreo se
pueden realizar inventarios cada cuatro meses. Supngase que una empresa
abastecedora de artculos de plomera desea un inventario para muchos
artculos en existencia. La obtencin de una muestra aleatoria de artculos es
muy difcil, sin embargo, los artculos se encuentran dispuestos en anaqueles y
la seleccin de una muestra aleatoria de anaqueles es relativamente fcil,
considerando a cada anaquel como un conglomerado de artculos. Si una
empresa abastecedora coloca 40 productos por anaquel y selecciona una
muestra aleatoria de 10 anaqueles de un total de 48 obteniendo los siguientes
resultados:

Anaquel
Nmero de
artculos
Cantidad
total en $
Nmero de artculos
con un precio
superior a $3
1 40 83 3
2 40 62 2
3 40 45 4
4 40 112 5
5 40 96 4
6 40 58 4
7 40 75 3
8 40 58 2
9 40 67 3
10 40 80 5

a) Halle la media, su error estndar y coeficiente de variacin de la
cantidad promedio (en $) con la que se cuenta en inventario
b) Halle el total, su error estndar y coeficiente de variacin de la cantidad
(en $) con la que se cuenta en inventario.
c) Halle la proporcin, su error estndar y coeficiente de variacin del
nmero de artculos con un precio superior a $3
d) Halle el total, su error estndar y coeficiente de variacin del nmero de
artculos con un precio superior a $3.

4. Con el fin de mejorar el servicio telefnico, el ejecutivo de cierta compaa
quiere estimar el tiempo promedio (en minutos) de las llamadas telefnicas que
se realizan durante la hora de trabajo y la proporcin de llamadas que son
hechas a celular.
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
31
La compaa cuenta con un total de 12 departamentos los cuales pueden ser
considerados como conglomerados. Se seleccionaron al azar 6 departamentos
y para cada departamento del total de llamadas realizadas durante la hora de
trabajo se seleccionaron algunas de las llamadas realizadas, contabilizndose
sus tiempos y la cantidad de llamadas hechas a celular. Los resultados son
presentados en la siguiente tabla:
Dep. M
i
m
i
Tiempo de la llamada (en minutos) a
i

1 22 11 1.3 1.8 2.6 3.0 3.5 4.6 1.6 6.2 1.8 4.3 2.9 6
2 24 12 2.2 6.3 4.5 1.9 5.2 3.2 4.2 5.1 3.3 4.6 3.6 3.0 2
3 28 14 4.1 5.2 1.9 2.5 4.2 3.6 2.5 2.9 4.6 2.6 4.6 4.1 3.1 2.5 4
4 20 10 3.9 6.6 2.5 1.9 2.8 5.6 3.6 4.6 2.5 8.1 5
5 26 13 6.5 4.5 6.3 4.6 1.2 8.2 3.6 4.1 5.6 4.6 4.6 4.9 3.7 3
6 18 9 1.9 4.8 3.4 7.9 4.6 6.4 4.9 5.8 6.3 1

a) Halle el tiempo promedio de las llamadas realizas, su error estndar y
coeficiente de variabilidad. Utilice el estimador promedio de promedios, de
razn y promedio ponderado de promedios.

b) De los tres estimadores utilizados en la pregunta anterior Cul es el que
presenta menor variabilidad?

c) Use el estimador seleccionado en la pregunta anterior para hallar:
El coeficiente de correlacin intraconglomerados.
El efecto del diseo.
El tamao de muestra equivalente si se desea utilizar el muestreo aleatorio
simple.
El nmero de conglomerados necesarios si se desea reducir la variabilidad
a 2%.

d) Halle la proporcin de llamadas realizas a celular, su error estndar y
coeficiente de variabilidad. Utilice el estimador promedio de proporciones, de
razn y promedio ponderado de proporciones.

e) De los tres estimadores utilizados en la pregunta anterior Cul es el que
presenta menor variabilidad?

f) Use el estimador seleccionado en la pregunta anterior para hallar:
El coeficiente de correlacin intraconglomerados.
El efecto del diseo.
El tamao de muestra equivalente si se desea utilizar el muestreo aleatorio
simple.
El nmero de conglomerados necesarios si se desea tener una variabilidad
del 8%.

One-way ANOVA

Source DF SS MS F P
Factor 5 1.661 0.332 1.62 0.169
Error 63 12.948 0.206
Total 68 14.609
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
32
Caso: Hospitales Mi Salud (simplificado)
El Ministerio de Salud decide hacer un estudio para estimar el gasto promedio
(en cientos de nuevos soles) en medicinas (no cubiertas por el hospital) que un
paciente realiza luego de una operacin de alto riesgo y la proporcin de
mujeres que tienen operaciones de alto riesgo.
Se sabe que en la actualidad existen 80 hospitales donde se pueden realizar
operaciones de alto riesgo. Se seleccionan aleatoriamente 6 hospitales y en
cada uno se entrevistan a todos los pacientes que se encuentran en el hospital
que se encuentran en descanso luego de una operacin de alto riesgo. Los
resultados se presentan a continuacin:

Hospital
Total de
pacientes
Gasto Total de
los pacientes
Nmero de
pacientes mujeres
1 12 30.0 2
2 14 37.8 6
3 16 46.4 4
4 18 46.8 7
5 11 27.5 2
6 15 35.0 5

6
2
1 1
586.67
Mi
ij
i j
y
= =
=


Asumiendo que el gasto en medicinas (en cientos de nuevos soles) no
cubiertas por el hospital de los pacientes luego de una operacin de alto riesgo
se distribuyen normalmente.
a) Utilice el estimador de razn para hallar un intervalo del 95% de confianza
para el gasto medio en medicinas. Interprete su resultado.

b) Entre los estimadores vistos en clase Cul cree Ud. que debera utilizarse
para estimar el gasto promedio en medicinas (en cientos de nuevos soles)
no cubiertas por el hospital de los pacientes luego de una operacin de alto
riesgo.

c) En base al estimador considerado como el mejor en la pregunta anterior
halle el coeficiente de correlacin intraconglomerados, el efecto del diseo y
el tamao de muestra equivalente si se hubiese utilizado un muestreo
aleatorio simple. Interprete sus resultados.

d) Utilice el estimador promedio de promedios para hallar un intervalo del 95%
de confianza para la proporcin de mujeres que tienen operacin de alto
riesgo. Interprete su resultado.

e) Considere la informacin de la tabla como informacin preliminar para hallar
la cantidad de conglomerados a seleccionar para un nuevo estudio si se
desea estimar la proporcin de mujeres que tienen operaciones de alto
riesgo a un nivel de confianza del 95% y con un margen de error del 6%.


UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
33
Caso: Hospitales Mi Salud (Con todos los datos)
El Ministerio de Salud decide hacer un estudio para estimar el gasto promedio
(en miles de nuevos soles) en medicinas no cubiertas por el hospital que un
paciente realiza luego de una operacin de alto riesgo y la proporcin de
mujeres que tienen operaciones de alto riesgo.
Se sabe que en el pas existen 40 hospitales donde se pueden realizar
operaciones de alto riesgo. Dado que muchos de ellos se encuentran alejados
unos de otros, los hospitales pueden ser considerados como conglomerados.
Se decide seleccionar aleatoriamente 6 hospitales y en cada uno de ellos
entrevistar a todos los pacientes que se encuentran en reposo luego de su
operacin de alto riesgo
En el marco muestral mostrado en el anexo se presenta:
G: Gasto (en miles de nuevos soles) en medicinas no cubiertas por el hospital
que un paciente realiza luego de una operacin de alto riesgo
S: Gnero del paciente 0: Mujer 1: Hombre
Utilice la dcima columna para la seleccin de los conglomerados
Asumiendo que el gasto en medicinas (en miles de nuevos soles) no cubiertas
por el hospital de los pacientes luego de una operacin de alto riesgo se
distribuyen normalmente.
f) Utilice el estimador promedio de promedio para hallar un intervalo del 95% de
confianza para el gasto medio en medicinas no cubiertas por el hospital luego
de una operacin de alto riesgo.

g) Utilice el estimador de razn para hallar un intervalo del 95% de confianza para
el gasto medio en medicinas no cubiertas por el hospital luego de una
operacin de alto riesgo.

h) Halle el coeficiente de correlacin intraconglomerados, el efecto del diseo y el
tamao de muestra equivalente si se hubiese utilizado un muestreo aleatorio
simple. Asimismo, determine el nmero de conglomerados necesarios a
seleccionar si se desea reducir la variabilidad a un 1%.

i) Utilice el estimador promedio de promedios para hallar un intervalo del 95% de
confianza para la proporcin de mujeres que tienen operacin de alto riesgo.

j) Utilice el estimador de razn para hallar un intervalo del 95% de confianza para
la proporcin de mujeres que tienen operacin de alto riesgo.

k) Halle el coeficiente de correlacin intraconglomerados, el efecto del diseo y el
tamao de muestra equivalente si se hubiese utilizado un muestreo aleatorio
simple. Asimismo, determine el nmero de conglomerados necesarios a
seleccionar si se reducir la variabilidad a un 3%

l) Considere la informacin de la tabla como informacin preliminar para hallar la
cantidad de conglomerados a seleccionar para un nuevo estudio si se desea
estimar la proporcin de mujeres que tienen operaciones de alto riesgo a un
nivel de confianza del 95% y con un margen de error del 6%.


UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
34
Hospital Variable 1 2 3 4 5 6 7 8 9 10 11 12 Total
1
G 3.5 3.9 2.5 1.8 2.6 2.8 3.2 2.1 2.9 25.3
S 1 1 1 0 0 1 0 1 0
2
G 2.3 2.3 2.4 3.5 2.9 2.5 2.2 3.0 1.8 1.7 2.1 26.6
S 1 0 0 0 0 1 1 0 0 1 1
3
G 2.9 2.9 2.2 2.8 2.7 2.0 1.9 2.1 2.4 21.9
S 0 1 1 1 1 0 0 1 1
4
G 2.6 2.3 2.2 2.3 2.5 2.1 2.9 3.3 2.6 2.7 1.5 27.1
S 0 0 0 0 1 1 1 0 0 0 0
5
G 2.0 1.4 2.9 2.1 2.2 2.4 2.5 3.1 1.8 20.3
S 1 1 1 0 0 1 1 1 0
6
G 2.3 2.5 2.4 2.1 2.5 2.4 2.5 2.3 2.0 2.7 1.6 25.3
S 1 0 0 0 0 0 1 1 1 1 1
7
G 3.1 2.2 2.2 2.6 2.4 3.8 3.1 3.3 1.7 24.3
S 0 0 0 0 1 1 1 1 1
8
G 2.6 1.7 3.1 3.1 3.5 3.1 2.3 1.8 21.2
S 0 1 1 1 1 1 1 1
9
G 1.9 3.3 2.5 3.3 2.3 2.0 2.0 2.1 2.3 2.9 2.7 27.3
S 1 1 0 0 0 1 0 0 1 0 1
10
G 2.4 2.6 1.6 2.6 3.0 2.1 1.7 2.3 2.7 21.0
S 1 0 0 1 1 0 1 1 1
11
G 2.4 2.8 2.5 1.8 2.0 2.3 2.8 2.6 2.3 2.9 24.7
S 1 1 0 0 0 1 0 0 1 1
12
G 1.3 3.2 2.5 1.5 2.2 2.6 2.5 2.3 1.9 2.4 3.4 25.7
S 1 1 0 0 0 0 0 1 1 1 1
13
G 2.9 1.7 3.4 1.8 2.6 2.9 2.1 2.3 2.3 22.0
S 1 0 0 0 0 1 1 1 1
14
G 2.4 2.5 2.3 2.5 3.1 2.0 2.3 3.0 3.2 23.2
S 0 0 1 0 0 0 0 1 1
15
G 2.6 3.0 1.9 1.8 3.1 2.8 2.9 3.0 2.5 23.4
S 1 1 1 1 1 0 0 0 0
16
G 3.3 1.6 1.5 1.6 2.4 2.6 3.0 2.4 2.5 2.4 23.4
S 1 0 0 0 0 0 1 1 1 1
17
G 2.7 2.5 2.6 2.2 3.3 2.8 3.7 3.1 2.2 2.0 27.2
S 1 1 1 1 1 0 0 0 0 0
18
G 3.3 2.9 2.5 1.9 2.7 2.7 2.9 2.3 2.4 2.5 26.0
S 0 0 0 0 1 1 1 1 1 0
19
G 2.6 2.8 2.6 2.3 2.6 2.0 1.9 2.7 1.4 20.9
S 0 1 1 1 0 0 0 0 0
20
G 3.1 3.0 2.7 2.9 3.4 2.8 2.5 1.9 2.7 25.1
S 1 1 0 0 0 1 1 0 0
21
G 2.2 2.7 2.5 2.7 2.7 1.1 2.3 3.1 2.7 3.0 1.8 26.8
S 0 0 1 1 1 0 0 0 0 0 1
22
G 2.8 2.3 2.7 2.3 3.4 2.8 4.2 2.4 3.4 2.9 1.9 31.2
S 0 1 0 1 0 0 1 1 1 1 1
23
G 2.3 3.0 2.4 3.3 2.1 2.9 2.7 3.1 21.8
S 0 0 0 1 1 1 1 0
24 G 2.0 1.6 1.9 2.2 3.0 2.9 3.0 3.0 19.7
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
35
S 0 0 0 1 1 1 1 1
25
G 2.1 2.6 2.7 2.4 2.8 3.3 2.6 2.1 2.0 22.6
S 1 1 1 0 0 0 0 0 0
26
G 3.3 2.7 1.6 2.1 1.9 1.8 1.8 2.5 3.5 21.2
S 1 1 0 0 0 1 1 0 0
27
G 2.1 1.6 2.7 2.0 2.2 1.6 2.6 3.1 2.4 20.3
S 0 0 1 0 0 0 1 0 1
28
G 1.7 2.2 1.7 1.5 2.9 2.6 2.4 3.0 2.3 3.4 23.6
S 1 0 0 0 0 0 1 1 1 1
29
G 2.3 2.9 2.2 2.6 2.4 2.5 1.8 3.0 2.1 2.9 2.5 27.1
S 1 1 1 1 1 0 0 0 0 0 0
30
G 2.6 1.9 3.1 2.1 2.4 2.9 1.4 1.7 1.5 19.7
S 0 0 0 0 0 0 1 1 1
31
G 2.4 2.7 2.2 3.2 0.9 2.1 2.5 2.4 3.0 3.4 24.6
S 1 1 1 1 1 1 0 0 0 0
32
G 3.7 2.5 2.3 2.1 2.3 3.0 3.0 2.3 2.3 2.5 26.0
S 0 0 0 1 1 1 1 0 0 0
33
G 2.5 2.2 1.5 2.9 2.1 2.2 2.3 2.2 3.2 2.3 23.5
S 1 0 0 1 0 0 1 0 1 0
34
G 1.8 1.7 2.4 2.2 2.6 3.4 2.1 3.0 2.4 2.8 24.6
S 0 0 0 1 1 1 1 0 0 1
35
G 2.3 3.0 2.7 3.5 2.8 1.8 2.3 2.2 2.1 2.3 2.5 27.6
S 1 0 0 0 1 0 0 1 0 0 1
36
G 2.6 2.7 3.0 1.3 2.6 3.4 2.1 2.3 3.3 23.2
S 1 0 0 0 0 1 0 0 1
37
G 2.3 2.3 2.8 2.2 2.8 2.7 2.8 2.8 2.7 2.4 2.7 28.5
S 0 0 1 0 1 1 0 1 0 0
38
G 2.4 1.9 2.9 2.8 2.4 2.4 1.7 3.0 2.2 2.7 24.4
S 1 1 1 0 0 0 0 0 1 1
39
G 1.9 2.4 2.1 2.6 2.0 2.1 2.2 3.5 2.3 2.4 23.6
S 0 0 0 0 0 0 1 1 1 1
40
G 2.4 3.2 3.2 2.6 3.1 3.5 3.2 2.7 2.1 2.9 29.0
S 0 0 0 1 1 0 1 0 0 0

Caso: Capacitacin Docente
El Ministerio de Educacin ha desarrollado un programa de capacitacin
docente, con la finalidad de que los profesores que laboran en colegios
pblicos puedan adquirir nuevos conocimientos de diversas reas y desarrollar
nueva metodologa de enseanza.
El primer plan piloto consisti en capacitar a un total de 175 profesores
provenientes de diferentes colegios que ensean diversas materias. Estos
profesores fueron distribuidos en 20 salones para aplicarles un examen de
entrada.
Lus Paz es el encargado de la capacitacin docente y desea estimar la nota
promedio de entrada y el total de docentes de nivel primario que asisten a la
capacitacin. Como el desconoce de los diseos muestrales contrata a un
alumno del curso de Muestreo II quien le comenta que las aulas pueden ser
consideradas como conglomerados y le sugiere seleccionar al azar 5 aulas y
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
36
muestrear a todos los profesores que se encuentran en ellas. Lus Paz le
facilita el listado de todas las aulas al estudiante y este decide elegir las aulas
empezando con la columna 7 de la tabla de nmeros aleatorios.
Los datos se presentan en el Anexo, donde:
N: Nota en la prueba de entrada.
A: Nivel de enseanza. 1: Primaria 2: Secundaria
En base a la informacin muestreada
a) Halle e interprete un intervalo del 97% de confianza para la nota promedio
obtenida en el examen de entrada. Utilice el estimador de razn.
b) Halle e interprete un intervalo del 97% de confianza para la nota promedio
obtenida en el examen de entrada. Utilice el estimador ponderado
c) De los estimadores vistos en clase Cul escogera Ud. para estimar el total de
docentes de nivel primario que asisten a la capacitacin? Sustente su
respuesta.
Segn la decisin propuesta en la pregunta anterior, halle:
El coeficiente de correlacin intraconglomerados. Interprete
El efecto del diseo. Interprete
El tamao de muestra equivalente si se hubiese utilizado un M.A.S.
El nmero de conglomerados necesarios a seleccionar si se desea reducir
la variabilidad a un 3%.
d) Considere la informacin proveniente de las 5 aulas como informacin
preliminar para hallar la cantidad de conglomerados necesarios a seleccionar
para un nuevo estudio si se desea estimar el total de docentes de nivel primario
que asisten a la capacitacin con un nivel de confianza del 97% y con un
margen de error del 6%.

Aula Variable 1 2 3 4 5 6 7 8 9 10
1
N 14.0 12.1 17.7 5.7 15.8 14.7 10.2 14.2
A 2 1 1 1 2 1 1 2
2
N 13.7 16.5 8.5 11.1 14.1 18.1 8.2 14.6 9.7 16.9
A 1 1 1 2 1 2 2 1 1 2
3
N 16.7 17.3 12.6 11.5 11.8 18.9 17.0 9.9 14.8
A 2 2 1 2 2 1 2 2 1
4
N 15.2 5.6 16.4 12.2 13.4 3.8 11.0
A 2 2 2 2 1 2 1
5
N 15.2 5.6 16.4 12.2 13.4 3.8 11.0 15.7 17.2 10.7
A 2 2 2 2 1 2 1 2 1 2
6
N 10.0 3.0 16.8 11.2 7.5 14.8 12.3 10.7
A 1 2 1 2 2 1 1 1
7
N 6.5 13.6 12.0 11.9 9.0 9.9 15.1 12.5 4.1
A 2 1 1 1 2 2 1 2 1
8
N 15.5 15.0 8.2 19.4 9.8 15.2 7.3 11.3 17.4
A 1 2 1 2 1 2 2 1 2
9
N 15.4 7.6 8.7 12.8 15.7 11.5 5.8 8.7 14.0 11.1
A 1 2 1 2 2 2 2 1 2 2
10
N 10.5 15.4 15.3 15.1 6.1 14.3 17.2 3.6 15.1
A 1 2 2 2 2 1 1 2 2
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Tcnicas de Muestreo II

Mg Sc Jaime Carlos Porras Cerrn
37
11
N 12.2 18.4 15.5 7.9 13.5 12.5 12.7 16.3 18.3
A 1 2 1 2 1 2 1 2 2
12
N 17.8 10.6 14.7 19.6 13.3 13.7 17.8 6.2
A 2 2 2 1 1 2 1 1
13
N 15.9 17.4 13.3 15.6 10.2 14.5 8.8 16.6 8.0 12.3
A 1 1 1 1 2 1 1 2 1 2
14
N 9.1 7.4 10.5 12.4 13.8 10.6 12.6 8.4
A 1 1 1 1 2 1 2 2
15
N 7.9 11.7 9.6 9.0 13.3 17.0 12.7 9.2 17.4
A 2 2 2 1 1 2 2 2 1
16
N 16.6 9.9 14.9 14.3 14.6 10.1 13.2 7.8 13.1 13.2
A 1 1 2 1 2 2 2 2 2 2
17
N 13.2 11.9 9.0 6.8 11.5 9.1
A 1 1 2 1 2 1
18
N 7.9 11.7 9.6 9.0 13.3 17.0 12.7 9.2 17.4
A 2 2 2 1 1 2 2 2 1
19
N 13.2 7.8 13.1 13.2 13.2 11.9 9.0 6.8
A 2 2 2 2 1 1 2 1
20
N 10.6 12.6 8.4 7.9 11.7 9.6 9.0 13.3 17.0
A 1 2 2 2 2 2 1 1 2