Está en la página 1de 200

UNIVERSIDAD AUTNOMA CHAPINGO

DIVISIN DE CIENCIAS FORESTALES





MTODOS DE MUESTREO


TESIS

Que como requisito parcial para
Obtener el Ttulo de:



LICENCIADO EN ESTADSTICA




PRESENTA:

ROXANA IVETTE ARANA OVALLE





Chapingo, Texcoco, Edo. de Mxico
Junio, 2003




1

Esta tesis titulada Mtodos de Muestreo fue realizada por Roxana Ivette Arana Ovalle
bajo la direccin del Dr. Hugo Ramrez Maldonado y asesorada por el Dr. Gerardo
Terrazas Gonzlez y el Ing. Carlos Francisco Romahn de la Vega. Ha sido revisada y
aprobada por el siguiente Comit Revisor y J urado Examinador para obtener el ttulo de
Licenciado en Estadstica.





PRESIDENTE ___________________________________
Dr. Hugo Ramrez Maldonado





SECRETARIO ___________________________________
Dr. Gerardo Terrazas Gonzlez





VOCAL ___________________________________
Ing. Carlos Francisco Romahn de la Vega





SUPLENTE ___________________________________
Dr. Francisco Zamudio Snchez





SUPLENTE ___________________________________
M.C. Efran Velzquez








Chapingo, Texcoco, Edo. de Mxico, J unio del 2003.
2
NDICE


CAPTULO 1. CONCEPTOS BSICOS DE ESTADSTICA YPRELIMINARES
MATEMTICOS

Qu es la estadstica y para qu sirve?........................................................................217
Estadstica Descriptiva...............................................................................................
Ordenamiento, Clasificacin y Frecuencia...................................................................
Medidas de Tendencia Central......................................................................................
Medidas de Dispersin..................................................................................................
Anlisis Terico de los Estimadores .........................................................................
Distribucin de Probabilidades..................................................................................
Distribuciones Discretas................................................................................................
Distribuciones Continuas...............................................................................................

CAPTULO 2 ASPECTOS GENERALES
DEL MUESTREO
Introduccin..................................................
..............................................................
Qu es una Medicin? ................................................................................................
Variables.......................................................................................................................
Poblacin y Muestra.....................................................................................................
Parmetros y Estimadores.............................................................................................
Tamao del Error de Estimacin..................................................................................
Marco de Muestreo.......................................................................................................
Pasos a seguir para el Diseo de una Encuesta.............................................................

CAPITULO 3 MUESTREO ALEATORIO
SIMPLE
Introduccin..................................................
...............................................................
Seleccin de la Muestra
Por qu usamos muestreo aleatorio simple? ...............................................................
Qu tipo de muestreo simple aleatorio debo utilizar?..................................................
Obtencin de una Muestra Aleatoria Simple............................................................
Cmo seleccionamos la muestra?.................................................................................
Dnde Proceso mis Datos?...........................................................................................
Estimacin de la Media y del Total de la Poblacin.................................................
Estimador de la Media Poblacional ...........................................................................
Estimador del Total Poblacional ................................................................................
Cules son esas caractersticas que hacen atractivo a un estimador?...........................
3
Estimacin de la Varianza de la Poblacin................................................................
Estimador de la Varianza de la Media...........................................................................
Estimador de la Varianza del Total...............................................................................
Estimacin del Intervalo de Confianza de la Media y del Total .............................
Intervalo de confianza para la estimacin de la media de la poblacin .......................
Intervalo de confianza para la estimacin del total de la poblacin .............................
Precisin Relativa........................................................................................................
Clculo del Tamao de la Muestra............................................................................
Qu significa Circularidad?..........................................................................................
Hasta donde puedo equivocarme?................................................................................
Tamao muestral requerido para estimar ...................................................................
Tamao muestral requerido para estimar ...................................................................217
Estimacin de una Proporcin Poblacional..............................................................
Estimador de la proporcin de la poblacin P ..............................................................
Estimacin de la Varianza de la Poblacin....................................................................
Media y Varianza del Estimador de P............................................................................
Clculo del Intervalo de Estimacin de la Proporcin P de la Poblacin......................
Intervalo de confianza para la estimacin de la proporcin de la poblacin..................
Varianza Acotada en la Estimacin de una Proporcin..................................................
Tamao muestral requerido para estimar P ...................................................................
APENDICE. Revisin
Terica.....................................................................................
APNDICE II. Hoja de Clculo..................................................................................

CAPITULO 4. MUESTREO
ESTRATIFICADO.......................................
..............
Introduccin..................................................
................................................................
Caractersticas del Muestreo Aleatorio Estratificado (MAE)..................................
Cundo debo utilizar MAE?.........................................................................................
Notacin..........................................................................................................................
Cmo seleccionar una muestra aleatoria
estratificada?.................................................
Estimacin de la media y el total poblacional............................................................
Estimacin de la Media Poblacional
st
.........................................................................
Estimacin de la Varianza de
st
Estimador del Total Poblacional.....................................................................................
y ...................................................................................
Varianza Estimada del Estimador del Total
Poblacional................................................
4
Clculo del Tamao de la
Muestra.........................................................
.....................
Tamao de Muestra Aproximado que se requiere para estimar
y .............................
Asignacin Proporcional...........................................................................
Asignacin Neyman.......................
.......................
.................................................................................
Estimacin de la Proporcin Poblacional...................................................................
Asignacin
ptima..........
......................
......................
......................
......................
........
Tamao de Muestra para Estimar una
Proporcin.........................................................
Asignacin Proporcional..................................................................................................
Asignacin ptima..........................................................................................................
Asignacin
Neyman..............................................................................................
Seleccin de Estratos......................................................................................................
Cmo delimitar mis estratos?.........................................................................................
Con base en qu delimitara mis estratos?......................................................................
Comparacin del muestreo Aleatorio Simple con el Estratificado.............................
5
APENDICE. Revisin
Terica.......................................................................................
APNDICE II. Hoja de Clculo....................................................................................

CAPITULO 5. MUESTREO RAZN, REGRESIN Y DIFERENCIA
Introduccin....................................................................................................................
Estimador de una Razn Poblacional...........................................................................
Razn Poblacional R.........................................................................................................
Estimador de la Razn Poblacional r...............................................................................
Varianza del estimador de la Razn Poblacional r..........................................................
Intervalo de confianza de r.............................................................................................
Estimador de Razn de la Media y el Total Poblacional
..........................................
Estimador de Razn de una Media Poblacional.........................................................
Varianza Estimada
de ...................................................................................................217
Y

Estimador del Total Poblacional........................................................................................


Varianza Estimada del Y

..................................................................................................
Seleccin del Tamao de Muestra...................................................................................
R Tamao de muestra requerido para estimar ...................................................................
Tamao de muestra requerido para estimar
y
.................................................................
Tamao de muestra requerido para estimar
y
....................................................................
En qu caso utilizaramos es .............................................. timacin de razn?............
Estimador de
Regresin......................................................
................................................
Estimador de Regresin de una Media Poblacional

yL
.........................................................
Varianza estimada del estimador
..................................................................................
YL
Estimador de Regresin para un Total

Poblacional.............................................................
Estimador de
Diferencia....................................................................................................
Estimador de Diferencia de una Media Poblacional
YD
.....................................................
ianza Estimada del Var Estimador de
YD

PNDICE II. Hoja de


..............................................................................
APENDICE. Revisin
Terica.............................................................................................
A
Clculo.........................................................................................

6
CAPITULO 6. MUESTREO
SI

STEMTICO..................................................................
seleccionar una muestra

...................................................................
.....................................................
.......
Varianza Estimada
Introduccin.......................................................................................................................
..
Cmo
sistemtica?....................................................................
Poblacin
Aleatoria..................................................................................................................
Poblacin
Ordenada............................................
Poblacin Cclica Peridica.........................................
Estimacin de la Media y el Total
Poblacional...........................................................
Estimacin de la Media de la Muestra
Sistemtica...........................................................
de

Est Poblacional
de
......................................................................................................
imador del Total
........................................................................................
Varianza Estimada
sY


P ........
..................................................................
.................................................................
...........................
Muestreo Sistemtico con
Est as Sistemticas
...................................................................................................
Estimacin de una Proporcin
Poblacional.....................................................................
Proporcin Poblacional Estimador de la
......................................................................
Varianza Estimada de P...................................
Seleccin del Tamao de Muestra....................
Tamao de Muestra Requerido para Estimar
.........................................
Tamao de Muestra Requerido para Estimar
P......................................................................
Repeticiones..................................................
.........................
imacin de la Media para Muestr
Replicadas..............................
a Varianza Estimad

de
Total
........................................................................................................
Estimacin del
sY
......................................................................................................
de Varianza Estimada
sY
......................................................................................................
COMENTARIOS...............................................................................................................
7
APNDICE II. Hoja de
REO POR CONGLOMERADOS EN UNA ETAPA
.................................
Qu puede ser un conglomerado?................................................................................
estreo Estratificado.......................................................................
...........................
Clculo........................................................................................


CAPITULO 7. MUEST
Introduccin.....................................................................................
217
Comparacin con Mu
Acerca del Tamao del Conglomerado ................................................
Notacin..............................................................................................................................
Estimacin de una Media y un Total Poblacional...........................................................
Estimador de la Media
.................................................................. Poblacional...................
Varianza Estimada de
....................................................................................................
c
y
Estimador del Total
Poblacional.........................................................................................
Varianza Estimada de

c
....................................................................................................
Qu pasa cuando desconozco el tamao de la poblacin M? ...................................................
Estimador del Total Po lacional...................................................................................... b ..
amao Aproximado Requerido para Estimar ..............................................................
Varianza Estimada de

c
.....................................................................................................
Determinacin del Tamao de Muestra..........................................................................
T
Tamao Aproximado Requerido para Estimar usando
c
y M .........................................
N ............................................ Tamao Aproximado Requerido para Estimar usando
Cmo estimar una proporcin poblacional?...............................................................
... Estimador de la Proporcin Poblacional......................................................................

..
.
..................
..............
.................................
Varianza estimada de p .................................................................................................
c

Tamao Aproximado Requerido para Estimar


c
p ....................................................
COMENTARIOS.............................................................................................................
APNDICE II. Hoja de Clculo....................................................................................

CAPITULO 8. MUESTREO POR CONGLOMERADOS EN DOS ETAPAS
Introduccin.....................................................................................................................
Comparacin con otros muestreos...............................................................................
Notacin.........................................................................................................
Estimacin de una Media
Estimador de la Media Poblacional..............................................
y un Total Poblacional..........................................
Estimador de la Varianza de
c
y
2
...................................................................................
Estimador del Total Poblacional....................................................................................
arianza Estimada de .............................................................................................
Qu pasa cuando desconozco el tamao de la poblacin?..........................................

c 2
V
8
Estimador de Razn de la Med ...........................................
arianza Estimada de
ia Poblacional....................
V
r
y
2
................................................................................................
ar ...........................................................
lculo........................................................................................
IBLIOGRAFA...............................................................................................................
.
Determinacin del Tamao de la Muestra....................................................................
Tamao de m aproximado requerido para estimar .........................................................
Tamao de n aproximado requerido para estim
APNDICE II. Hoja de
C
B
..


9
AGRADECIMIENTOS
i hogar durante siete aos y por la que
uardo un profundo cario y respeto.
l Dr. Hugo Ramrez Maldonado quien ha sido una persona muy importante en mi
rmacin profesional y que ha dedicado su valioso tiempo a la elaboracin de este
el apoyo y sus valiosas aportaciones a este texto.
l Ing. Romahn de la Vega por el apoyo en la formacin de los alumnos de estadstica.
ancisco Zamudio por el que guardo un gran cario, y al que considero un
migo. Le agradezco por todo lo que aprend dentro del aula para ser una profesional y
bre todo una persona diferente.
todos mis profesores de la Licenciatura en Estadstica por el empeo que pusieron en
mis compaeros y en m para ayudarnos a forjar nuestro futuro.






A la Universidad Autnoma Chapingo que fue m
g



A
fo
material.


Al Dr. Gerardo Terrazas a quien considero un profesor muy valioso por su empeo y
dedicacin en nuestra formacin y por la amistad que al mismo tiempo nos brinda. Le
agradezco



A
De igual manera le agradezco su apoyo en la elaboracin de este texto.



Al Dr. Fr
a
so


A
10
DEDICATORIA
mis padres por ayudarme a lle
i hermano Miguel qui do cerca de m y a quien
uiero entraablemente.
n ,
oiss y Nohem.
mis amigos y compaeros de trabajo que con su poyo me hacen ms divertido el da a
rle
ocorro.
Catherine en quien encontr apoyo y cario en muchos momentos difciles.
ero sobre todo a Dios Padre con el que siempre he contado y que alimenta mi alma y


A gar hasta aqu.


A m en es el ser que siempre ha esta
q


A mis amigos a quienes quiero como hermanos, Adriana, Fernando, Marcos, M ica
M

A
da: Alex, Aura, Enrique, David, Doris, Luis, Mariana, Paulo, Ricardo, Sca tt, y
S

A


A Sandy Saltamontes por todo su amor, apoyo y entrega en estos aos.


P
corazn.






11




INDICE GENERAL



PRIMERA PARTE

edicatoria.


ii
esum
ntecedentes.. 4
esultados y Discusin. 7
iteratura Citada 8

Agradecimientos.


i
D
ndice General iii


R en.


iv
Summary


v
Introduccin


1
A


Objetivos


5
Materiales y Mtodos


6
R


L


12
SEGUNDA PARTE
todos de Muestreo 9
RESUMEN
El texto pretende ser un apoyo para los estudiantes de un primer curso de
En principio el texto est diseado para explicar las tcnicas de muestreo de una
anera
con ayuda de ejemplos prcticos, de esta manera se busca que el
lumno se interese en el uso de estas tcnicas y su aplicacin en problemas de su
specialidad. En este sentido, se incluye un apndice prctico que le ayudar a manejar
s datos en una hoja de clculo.
Por otro lado y para los alumnos interesados en profundizar en el tema, se
cluye un apndice terico en donde se encuentra la derivacin de algunos de los
stimadores vistos a lo largo del captulo.
El texto est escrito en un lenguaje amigable para poder interesar a los alumnos
n su estudio.

alabras Claves: Estudiantes de especialidades en Ciencias Biolgicas, primer curso de
muestreo, tcnicas de muestro, apndice prctico, apndice terico.



M



Despus del estudio de las necesidades de una poblacin particular de
estudiantes, en este caso con Especialidad en Ciencias Biolgicas, surge la idea de
disear un texto que se apegue al mximo a sus necesidades.

muestreo. Presentado las tcnicas bsicas, as como sus correspondientes estimadores.


m sencilla, guiando al lector desde el principio paso a paso hasta llegar a los
resultados esperados,
a
e
su


in
e

e








P
13



SUMMARY
The present Textbook emerge from an analysis of texts needs on a population of
iological Science Students
The aim of this book is to describe sampling methods through detail but clear
ep by step explanations; practical examples are used as complementary material on
ach chapter so the students attention will always be kept. An included spreadsheet
elps the reader to solve data management issues.
Besides, for those who are looking for more detail on how the studied estimators
ere reached a theoretical annex is included at the end of each chapter.
The text was written on a kind language cause as explained before it is intended
r college students.












Key Words: Biological Science Students, First Sampling Curse, Sampling Methods,
Spreadsheet, Theoretical Annex.








B


st
e
h


w


fo





14






























15
INTRODUCCIN

Las necesidades de la sociedad se satisfacen mediante el uso de los recursos. Estos
recursos pueden ser de naturaleza muy diversa: la tierra cultivable, el agua, el clima, el
personal laboral, los procesos, la decisin de consumidores o de votantes, el volumen de
madera en un bosque; en pocas palabras, prcticamente de cualquier origen imaginable.
Para la administracin de recursos siempre es necesario conocer la magnitud de
alguna o varias de las caractersticas de ellos. En el caso de la tierra cultivable, sus
caractersticas pueden ser el rea, la fertilidad, la profundidad del suelo entre muchas otras.
Para el agua puede ser de inters saber su volumen, su calidad y/o su distribucin durante el
ao. Para el caso del clima generalmente son de inters las temperaturas, los vientos, la
humed
e stos en el terreno, etctera. Es decir, para
cada ti
cuantificar el logro de la
conserv
servacin mediante un
uso su
ad relativa, la precipitacin, etctera. Para el personal laboral puede importar el
nmero, sus edades, su nivel de escolaridad, entre otras caractersticas. En los procesos
sera de utilidad determinar su eficiencia y sus demandas de insumos para operar, por
ejemplo; en el caso de consumidores o votantes ser relevante saber su nmero y los
factores que pueden influir en sus decisiones. Para administrar la produccin de madera de
un bosque es importante conocer su superficie, su productividad, las especies y
dimensiones de los rboles, la distribucin d
po de recurso pueden ser pocas o muchas las caractersticas relevantes para su
administracin y la determinacin de la magnitud de ellas es necesaria para formular
adecuadamente cualquier intencin de su administracin.
Entre los recursos naturales son de particular importancia los renovables, ms an
en la actualidad, porque se pretende su conservacin. Para poder
acin es imprescindible conocer alguna magnitud de esos recursos. As, si stos
estn en uso es posible dimensionar en que medida se logra su con
stentable, fincado en su propiedad de ser renovables. De otra forma, aunque en el
presente no estn en uso, es necesario conocer alguna magnitud para vigilar su
comportamiento natural, que puede ser afectado por el uso de otros recursos aun en
localidades diferentes, o por factores ajenos a la accin del hombre o no identificables. En
cualquier caso, es necesario conocer nmeros que describan o sumaricen las dimensiones
de las caractersticas del recurso.
1
La intencin de dimensionar una caracterstica no es privativa de la investigacin o
del trabajo tcnico. En la vida cotidiana la necesidad de cuantificar o calificar sucede con
vasta fr
rencias, la oferta educativa, los costos involucrados,
las ex
ro tambin podra proponerse que la fuerza laboral est
constituida por cuadrillas de obreros, cada una compuesta por un cierto nmero de obreros
definid
est constituida por la acumulacin de la biomasa viva existente en cada
nidad de superficie del terreno, digamos de un metro cuadrado.
En los dos ejemplos anteriores la totalidad del recurso es la misma en cada caso,
ero las partes constitutivas han sido definidas de manera diferente.
En otro ejemplo, al considerar que el recurso de inters es la totalidad de caa de
zcar que durante una zafra habr de ser procesada en un ingenio, las partes constitutivas
ueden ser cada una de las caas, lo cual es correcto pero muy poco conveniente; una
efinicin ms apropiada de las partes constitutivas puede proponer que sean cada una de
s cargas de caa que sern transportadas por camin, si toda la caa es transportada al
genio de esa manera. Otra forma de definir las partes constitutivas puede proponer que
ecuencia, una persona que va a adquirir algn bien, toma una decisin determinando
la calidad de las diferentes opciones ofertadas en el mercado y la cantidad de acuerdo a una
estimacin del consumo que har de ese bien. Un estudiante decide la carrera que estudiar
considerando sus habilidades, sus prefe
pectativas de empleo, etc. En todos los casos se hace necesario determinar
dimensiones o magnitudes y con base en esa informacin se toman diversos cursos de
accin, pero generalmente no se cuenta con la totalidad de la informacin existente sino
solamente con una fraccin de ella, es decir, una muestra.
El recurso que se pretende evaluar puede considerarse compuesto por partes cuya
acumulacin constituye la totalidad del recurso. Esas partes pueden existir de manera
natural o ser definidas convenientemente. Por ejemplo, la fuerza laboral de una fbrica
puede ser la totalidad de obreros con que cuenta y las partes que la constituyen podran ser
cada uno de los obreros; pe
o de manera adecuada para la fbrica.
Si el recurso de inters es la biomasa que existe en un terreno determinado, las
partes constitutivas pueden ser los organismos que estn presentes en el terreno y su
acumulacin constituye la totalidad de recurso; pero tambin se puede considerar que la
totalidad de ste,
u
p
a
p
d
la
in
2
sean los volmenes de caa prov de los predios cuya produccin
oso o no leoso, etc.
La informacin sobre las cantidades y calidades de un recurso para tomar una
La cantidad total de un recurso formalmente la denominaremos poblacin, y una
parte d


enientes de cada uno
constituir el abastecimiento total para el ingenio durante esa zafra.
Como se mencion arriba, en cada recurso puede hacerse la determinacin de
diversas dimensiones. Por ejemplo, en el caso de la biomasa viva puede ser de inters su
volumen medido en unidades cbicas, su peso medido en kilogramos, su volumen
clasificado en le
decisin pueden ser obtenidas mediante una evaluacin exhaustiva, esto es, cuantificar o
calificar todo el recurso. Sin embargo, en la mayora de las circunstancias no es posible o
conveniente hacer la evaluacin exhaustiva; en tales casos la evaluacin se hace solamente
en una parte del recurso. Al hacer la evaluacin en solamente una parte de la totalidad del
recurso se espera que las determinaciones hechas tambin pertenezcan a la totalidad, as
implcitamente se acepta esa suposicin, aunque siempre se corre el riesgo de que tal
suposicin no sea totalmente cierta. El objetivo sustantivo de las tcnicas de muestreo es
darle objetividad a ese riesgo.

e ese total constituye una muestra. As, las mediciones se hacen en la muestra y se
espera que los valores obtenidos correspondan tambin a la poblacin. Los valores de
inters de la poblacin los denominamos parmetros y los correspondientes en la muestra
son estimadores.










3
ANTECEDENTES
Las preguntas que planteamos en cuanto a muestreo fueron, Es necesario que
studiantes de especialidades biolg las tcnicas de muestreo, Que tan
te brindar estas tcnicas
stadsticas a alumnos de licenciatura?, Que tan profundo deber ser el conocimiento de
esta

Contestando estas preguntas podemos decir que existen varios libros ya antiguos
que nos presentan las principales tcnicas, sin embargo la mayora de estos o abundan en la
teor a mayora de los textos hechos
recientemente describen las principales tcnicas de muestreo pero generalmente tienen un
enfoque totalmente administrativo.Esto resulta curioso, pues es precisamente en las ciencias
bio
alternat
especia ermita conocer de una manera amigable y actual las
cnicas de muestreo.
licencia
cuantif nmenos y justificar de una manera tcnica estas aseveraciones, por
sto es necesario que los estudiantes conozcan este tipo de tcnicas que le ayudarn en este
roceso y se sembrar el inters de aplicarlas en su especialidad.
idad del estudio de las tcnicas de muestreo, podemos
observar que existen varios textos que van desde el anlisis terico de los estimadores hasta
otros donde se presentan tan slo los estimadores, en este rango existen pasos intermedios
on e se presentan diferentes combinaciones entre teora y prctica, es importante tener en
uenta estos dos aspectos, por un lado ofrecer una opcin calibrada para estudiantes que
ecesitan poner estos conocimientos en prctica y por otro lado una parte terica que les
ermita profundizar en el anlisis de los estimadores a los que lo consideren necesario o
teresante.


e icas conozcan
accesible son actualmente para ellos estas?, Es importan
e
s tcnicas?
a o presentan un lenguaje poco actual, por otro lado l
lgicas donde originalmente se desarrollaron estas tcnicas, este texto busca ser una
iva para estudiantes de un primer curso de muestreo de cualquiera de las
lidades de la UACh que les p
t

En cuanto a la importancia del conocimiento de estas tcnicas por alumnos de
tura, podemos decir que es en este nivel donde se empieza a querer medir o
icar ciertos fe
e
p

En cuanto a la profund
d d
c
n
p
in
4

se persiguen son,
fiables que podemos aceptar que estiman correctamente a sus
rrespondientes parmetros.
Exponer las frmulas adecuadas para calcular de qu tamao debe ser una muestra
texto ha sido escrito para poder ser un material de apoyo para un primer curso de
muestreo de licenciatura.



OBJETIVOS

Los objetivos centrales que en este libro

Presentar las formas adecuadas de seleccionar una muestra, lo que denominaremos
diseos de muestreo, considerando las caractersticas de las poblaciones de inters.


Exponer las frmulas para calcular los estimadores.


Presentar la manera de relacionar los estimadores con los parmetros, obteniendo
indicadores con
co


para que se satisfagan exigencias preestablecidas sobre la calidad de los
estimadores.


El









5
MATERIALES Y MTODOS

os los programas analticos de los cursos de mtodos de muestreo, para
con
stimadores
dim s una explicacin breve sobre su derivacin e incluimos un ejemplo para cada
esti
guaje utilizado durante el desarrollo de los captulos es sencillo y pretende
spirar confianza al lector.
Decidimos que la presentacin de los estimadores y los ejemplos de la utilizacin de
stos se presentarn sin profundizar en aspectos tericos. Ya que consideramos conveniente
cluir la parte terica al final de la introduccin de los estimadores para evitar complejidad
los que no lo consideren necesario y por otro lado, darles un sustento terico a los que lo
ecesite.
Por ltimo construimos una hoja de clculo en excel que tiene programados los
stimadores correspondientes a cada diseo de muestreo y que es capaz de resolver algunos
jemplos prcticos.


Revisam
struir el la de nuestro texto con los temas necesarios en el orden correspondiente y de
esta manera cubrir todo el programa.

Al mismo tiempo revisamos varios temarios de textos referentes a los mtodos de
muestreo y los temas que resultaron complementarios los tomamos para as finalmente
tener la estructura final de nuestro texto.

Para desarrollar los temas, primero introducimos al estudiante en los aspectos generales
del muestreo, y posteriormente dividimos en captulos. En cada captulo incluimos una
explicacin sobre el diseo de muestreo al que nos referimos y antes de dar los e
o
mador presentado.

El len
in


e
in
a
n


e
e





6
RESULTADOS Y DISCUSIN


muestreo para
r
apropiado para otras disciplinas. No se supone un conocimiento amplio sobre matemticas
probabilidad, y por lo tanto tampoco abunda en demostraciones formales. Sin embargo, se
han inc ser
rimer curso sobre mtodos de muestreo para estudiantes de la carrera de
de
s resu e incluye un disquete que contiene
ojas de clculo diseadas para calcular estimadores en los diferentes diseos de muestreo

tes de
licenci ura y que este pretende ser un facilitador en la enseanza de las tcnicas de

Este texto ha sido escrito para que sea de utilidad en un primer curso de
estudiantes de licenciatura, preponderantemente en ciencias biolgicas aunque tambin se
o
luido algunos conceptos bsicos de teora con la intencin de que tambin pueda
utilizad en un p o
estadstica. Por esto, al final de cada captulo se incluye una breve explicacin terica
ltados que se presenten. Por otro lado, tambin s lo
h
y un apndice prctico al final de cada captulo para el uso de esta herramienta.
Podemos decir que el texto puede ser una opcin ms para los estudian
at
muestreo.





















7



LITERATURA CITADA
ZORIN, F.1967. Curso de Muestreo y Aplicaciones. Ed. Aguilar. Madrid.
OCHRAN, W.1980. Tcnicas de Muestreo. Ed. Compaa Editorial Continental.
Harvard University
GONICK, L. and SMITH, W. 1993. The Cartoon Guide os Statistics.De. Harper
erennial.USA.

HANSEN, M.,HURWITS, W. and MADOW, W. 1953. Sample Survey Methods and
Theory. Ed. J ohn Wiley & Sons. Canada. Vol 1.


HANSEN, M.,HURWIT rvey Methods and
Theory. Ed. J ohn


INFANTE, S. y ZRATE G. 1988. Mtodos Estadsticos. Ed. Trillas. Mxico. D.F.


KISH, Leslie.
OHR, S.2000.Muestreo. Diseo y Anlisis, Ed. International Thomson. Arizona.
CHREUDER, H., GREGOIRE, T. y WOOD, G. 1993. Sampling Methods for
Multiresource Forest Inventory. Ed. J ohn Wiley & Sons. Canada.
SHIVER, B. and BORDERS, B. 1996. Sampling Technics for Forest Resource
Inventory. Ed. J ohn Wiley & Sons. Georgia.

SUKHAME, P. and SUKHAME, B. 1954. Sampling Theory of Surveys with
Applications. Iowa Sate University. USA.

THOMPSON, S.1992. Sampling. Ed. J ohn Wiley & Sons. Pennsylvania.

WOODROOFE, M. 2000. Probabilidad con aplicaciones.Universidad de Michigan.
Mxico.

YAMANE, Taro. 1967. Elementary Sampling Theory. Ed. Pretice-Hall.New York
University.
A

C


P
S, W. y MADOW, W. 1953. Sample Su
Wiley & Sons. Canada. Vol 2.
1975. Muestreo de Encuestas. Ed. Trillas. Mxico D.F.


L


S


8














SEGUNDA PARTE


MTODOS DE MUESTREO








9
NDICE

CAPTULO 1. CONCEPTOS BSICOS DE ESTADSTICA YPRELIMINARES
1
1
1
2
UESTREO
....
tervalo de confianza para la estimacin del total de la poblacin ......................... 41
recisin Relativa.................................................................................................... 42
..... 42

MATEMTICOS
Qu es la estadstica y para qu sirve?........................................................ 1
Estadstica Descriptiva........................................................................................... 1
Ordenamiento, Clasificacin y Frecuencia.. 2
Medidas de Tendencia Central..................................................................................... 5
Medidas de Dispersin................................................................................................. 7
Anlisis Terico de los Estimadores ....................................................................
Distribucin de Probabilidades................................................................................
0
4
Distribuciones Discretas.............................................................................................. 9
Distribuciones Continuas............................................................................................. 3

CAPTULO 2 ASPECTOS GENERALES DEL M
Introduccin.......................................................................................................... 22
Qu es una Medicin? .......................................................................................... 24
Variables.................................................................................................................. 24
Poblacin y Muestra................................................................................................ 24
Parmetros y Estimadores.......................................................................................... 25
Tamao del Error de Estimacin................................................................................ 26
Marco de Muestreo..................................................................................................... 27
Pasos a seguir para el Diseo de una Encuesta........................................................... 28

CAPITULO 3 MUESTREO ALEATORIO SIMPLE
Introduccin............................................................................................................. 31
Seleccin de la Muestra... 32
Por qu usamos muestreo aleatorio simple? ........................................................... 32
Qu tipo de muestreo simple aleatorio debo utilizar?......................................... 32
Obtencin de una Muestra Aleatoria Simple...................................................... 33
Cmo seleccionamos la muestra?.............................................................................. 33
Dnde Proceso mis Datos?...................................................................................... 34
Estimacin de la Media y del Total de la Poblacin.............................................. 34
Estimador de la Media Poblacional ...................................................................... 34
Estimador del Total Poblacional ......................................................................... 35
Cules son esas caractersticas que hacen atractivo a un estimador?....................... 35
Estimacin de la Varianza de la Poblacin............................................................ 38
Estimador de la Varianza de la Media................................................................... 38
Estimador de la Varianza del Total........................................................................ 39
Estimacin del Intervalo de Confianza de la Media y del Total ...................... 40
Intervalo de confianza para la estimacin de la media de la poblacin ................... 41
In
P
Clculo del Tamao de la Muestra................................................................
Qu significa Circularidad?.................................................................................... 43
Hasta donde puedo equivocarme?.......................................................................... 44
10
Tamao muestral requerido para estimar .................................................................. 45
Tamao muestral requerido para estimar ................................................................... 45
Estimacin de una Proporcin Poblacional.......................................................... 46
Estimador de la proporcin de la poblacin P ............................................................. 47
Estimacin de la Varianza de la Poblacin...................................................................

.

.
48
Media y Varianza del Estimador de P.......................................................................... 49
Clculo del Intervalo de Estimacin de la Proporcin P de la Poblacin..................... 50
Intervalo de confianza para la estimacin de la proporcin de la poblacin................ 50
Varianza Acotada en la Estimacin de una Proporcin................................................ 50
Tamao muestral requerido para estimar P ................................................................. 51
APENDICE. Revisin Terica.................................................................................. 52
APNDICE II. Hoja de Clculo................................................................................ 58

CAPITULO 4. MUESTREO ESTRATIFICADO
Introduccin................................................................................................................. 61
62 Caractersticas del Muestreo Aleatorio Estratificado (MAE)................................
Cundo debo utilizar MAE?........................................................................................ 62
Notacin........................................................................................................................
Cmo seleccionar una muestra aleatoria estratificada?...............................................
62
64
Estimacin de la media y el total poblacional........................................................... 64
Estimacin de la Media Poblacional ....................................................................
st
.. 65
Estimacin de la Varianza de
st
y .............................................................................
stimador del Total Poblacional...................................................................................
65
E 66
Varianza Estimada del Estimador del Total Poblacional.............................................. 67
Asignacin Proporcional...............................................................................................
81
. .
100
. ...1
Clculo del Tamao de la Muestra............................................................................ 69
Tamao de Muestra Aproximado que se requiere para estimar y ........................... 71
Asignacin Proporcional............................................................................................... 71
Asignacin ptima........................................................................................................ 72
Asignacin Neyman...................................................................................................... 73
Estimacin de la Proporcin Poblacional................................................................. 76
Tamao de Muestra para Estimar una Proporcin........................................................ 80
80
Asignacin ptima........................................................................................................
Asignacin Neyman.............................................................................................. 81
Seleccin de Estratos.. ............................................................................................... 82
Cmo delimitar mis estratos?...................................................................................... 83
Con base en qu delimitara mis estratos?................................................................... 83
Comparacin del muestreo Aleatorio Simple con el Estratificado......................... 85
APENDICE. Revisin Terica................................................................................... 86
APNDICE II. Hoja de Clculo................................................................................ 96


CAPITULO 5. MUESTREO RAZN, REGRESIN Y DIFERENCIA
Introduccin. ................................................................................................................
Estimador de una Raz n Poblacional........................................................................
99
Razn Poblacional R.. ................................................................................................ 00
11
Estimador de la Razn blacional r............................................................................1 Po
stimador de Razn de la Media y el Total Poblacional ........................................ 103
103
01
Varianza del estimador de la Razn Poblacional r....................................................... 101
Intervalo de confianza de r........................................................................................... 101
E
Estimador de Razn de una Media Poblacional......................................................
Varianza Estimada de

Y
.............................................................................................
103
Estimador del Total Poblacional...................................................................................

105
Varianza Estimada del Y ............................................................................................
106
Seleccin del Tamao de Muestra............................................................................. 107
Tamao de muestra requerido para estimar R .............................................................. 107
Tamao de muestra requerido para estimar
y
.......................................................... 108
Tamao de muestra requerido para estimar
y
........................................................... 108
En qu caso utilizaramos estimacin de razn?.................................................... 109
Estimador de Regresin.............................................................................................. 110
Estimador de Regresin de una Media Poblacional
yL
............................................. 111
Varianza estimada del estimador

YL
.........................................................................
111
Estimador de Regresin para un Total Poblacional..................................................... 113
Estimador de Diferencia............................................................................................. 113
Estimador de Diferencia de una Media Poblacional
YD
............................................ 113
Varianza Estimada del Estimador de
YD
...................................................................

....
oblacin Ordenada...................................................................................................... 128
.. 129
114
APENDICE. Revisin Terica................................................................................... 116
APNDICE II. Hoja de Clculo................................................................................ 123

CAPITULO 6. MUESTREO SISTEMTICO
Introduccin.................................................... ......................................................... 126
Cmo seleccionar una muestra sistemtica?.......................................................... 127
Poblacin Aleatoria....................................................................................................... 128
P
Poblacin Cclica Peridica.....................................................................................
Estimacin de la Media y el Total Poblacional......................................................... 130
Estimacin de la Media de la Muestra Sistemtica.................................................. 130
Varianza Estimada de

..............................................................................................
130
Estimador del Total Poblacional ................................................................................ 132
Varianza Estimada de sY

. ...

..

.... ...................................................................................
132
Estimacin de una Proporcin Poblacional.............................................................. 134
Estimador de la Proporcin Poblacional P.................................................................... 134
Varianza Estimada de P................................................................................................ 134
Seleccin del Tamao de Muestra............................................................................. 136
Tamao de Muestra Requerido para Estimar .......................................................... 136
Tamao de Muestra Requerido para Estimar P............................................................ 136
Muestreo Sistemtico con Repeticiones..................................................................... 137
Estimacin de la Media para Muestras Sistemticas Replicadas...................... 138
12
Varianza Estimada de

.............................................................................................
stimacin del Total
138
............................................................................................. 140
sY
E
Varianza Estimada de
sY
............................................................................................ 140
OMENTARIOS........................................................................................................ 142
PNDICE II. Hoja de Clculo................................................................................ 143
APITULO 7. MUESTREO POR CONGLOMERADOS EN UNA ETAPA
troduccin................................................................................................................ 145
Qu p conglomerado?............................................................................ 146
ompa Muestreo Estratificado................................................................ 146
Acerca del Tamao del Conglomerado .................................................................... 147
Notacin........................................................................................................................ 147
Estimacin de una Media y un Total Poblacional.................................................... 148
Estimador de la Media Poblacional............................................................................... 149
Varian de
C
A

C
In

C
uede ser un
racin con
za Estimada


c
y ............................................................................................
149
Estimador del Total Poblacional................................................................................... 151
Varianza E ........ 151
Qu pasa cuando desconozco el tamao de la poblacin?.......................................... 153
Estimador del Total Poblacional................................................................................... 153
Varianza Estimada de .............................................................................................
153
Determinacin del Tamao de Muestra.................................................................... 155
Tamao Aproximado Requerido para Estimar ......................................................... 156
Tamao Aproximado Requerido para Estimar usando
stimada de .........................................................................................

c
y M ....................................
156
Tamao Aproximado Requerido para Estimar usando N ......................................
157
Cmo estimar una proporcin poblacional?......................................................... 158
Estimador de la Proporcin Poblacional....................................................................... 158
Varianza estimada de ............................................................................................
158
Tamao Aproximado Requerido para Estimar ....................................................
160
COMENTARIOS........................................................................................................ 160
APNDICE II. Hoja de Clculo................................................................................ 161

CAPITULO 8. MUESTREO POR CONGLOMERADOS EN DOS ETAPAS
Introduccin................................................................................................................. 163
Comparacin con otros muestreos............................................................................. 165
Notacin........................................................................................................................ 166
Estimacin de una Media y un Total Poblacional.................................................... 166
Estimador de la Media Poblacional........................................................................... 167
Estimador de la Varianza de

c
p

c
p
c
y
2
................................................................................ 167
Estimador del Total Poblacional.................................................................................. 170
Varianza Estimada de
r
y
2
........................................................................................... 170
Qu pasa cuando desconozco el tamao de la poblacin?..................................... 171
Estimador de Razn de la Media Poblacional........................................................ 171
13
r
y
2
Varianza Estimada de .......................................................................................... 172
Determinacin del Tamao de la Muestra............................................................... 174
Tamao de m aproximado requerido para estimar ................................................. 175
amao de n aproximado requerido para estimar ................................................... 175
PNDICE II. Hoja de Clculo................................................................................ 176
........................ 178


1

C
T
A
BIBLIOGRAFA...............................................................................










APTULO




CONCEPTOS BSICOS DE ESTADSTICA
14



QU ES LA ESTADSTICA Y PARA QU SIRVE?
Aunque al intentar una definicin siempre se corre el riesgo de incurrir en
proposiciones demasiado generales, que son vagas, o en otras demasiado especficas que
resultan insuficientes o restrictivas, suele ser conveniente aceptar alguna definicin que al
menos siente un lugar comn de referencia. Existen numerosas definiciones en la literatura
relacionada con la estadstica. En lugar de hacer acopio de diversas definiciones y darnos a la
tarea de compararlas, sealando su vaguedad o insuficiencia, aceptaremos la siguiente,

Definicin
Estadstica
La estadstica es la ciencia de la recopilacin, clasificacin, presentacin e
interpretacin de datos (J ohnson, 1996).

La estadstica sirve para,
1. Describir a un conjunto de objetos mediante el anlisis de algunos de sus elementos.
2. Tomar decisiones sobre opciones diversas con informacin parcial contenida en un conjunto de datos.
3. Predecir el comportamiento de una medida o caracterstica, en condiciones no observadas.

Los usos y aplicaciones son innumerables; sin embargo estas se pueden resumir en algunos de los
puntos anteriores con la finalidad de llevar a cabo inferencias sobre la poblacin (estimacin y pruebas de
hiptesis).

ESTADSTI
mo se me n, uno d objetivos de l dstica es terpretaci e datos,
es decir, obtener la informacin que ellos contienen. Un conjunto de datos en forma de un
listado tiene utilidades muy importantes y diversas, pero tambin tiene limitacione cuanto
a poder comunicar la informacin. Enseguida revisar s algunas tcnicas que nos permitan
leer e interpretar m ilmente la informacin contenida en un conjunto de datos.

ORDENAMIENTO, CLASIFICACIN Y FRECUENCIA
proceso in puede ser el denamiento e los valores de acuerdo a su magnitud de manera
crecie decreciente a actualidad programas de cmputo muy eficientes y sencillos de manejar
para realizar esta tarea.
biendo orde os datos se puede observar r q de y
calcular el rango amplitud que es l difere ia res.
mbin ser p inar l es el valor qu pa la posicin l en l sta or , si el
nmero de valores es im ser el valor upa exactam a po in c el nmero es par ser el
prome e los dos va centrales; es lor, para el que itad d os val on me res y l mitad
son m s, se llama m a.
niendo orde os valores t bin ser fcil inar se rep cada uno, al valor
que se e un mayor veces se le llama moda. P n hab o alores e teng ayor
frecue ada uno, as onjunto de d calificar c unimo l, bim multimodal, e , que
tienen dos o mucha das.
ra accin qu de ser conv para obten a informaci conj de v es la
clasifi n, sta cons ncluir ca valor en una c depen ndo agn . Est n es
frecue ente usada para trabajar con informacin relativa metros de rb edido cent . As,
por ej omando cl 5 en 5 los ores 12, 13, 14 , 18 , pue ignarse a las cl 0, 15,
15, 15 20, 20, resp mente. De e anera se pierd ta pre in e alore ro se ganar
la pos ad de resum formacin. a una de las cla el eje lo tie ites d se, u rior y
CA DESCRIPTIVA
e los n d Co a esta ncio la in
s en
emo
s fc
Un icial or d
nte o . En l existen
Ha nado l fcilmente el valo ms pe ueo y el
eso d
m
os lo
s gran
o , a nc entre s va
Ta osible determ cua e ocu centra a li denada
par que oc ente l sic entral, si
dio d lores e va la m e l ores s no a otra
ayore edian
Te nados l am determ cuantas veces ite
repit nmero de uede er dos ms v qu an la m
ncia c el c atos se omo da odal o s decir
una, s mo
Ot e pue eniente er ciert n del unto alores
caci iste en i da lase die de su m itud a opci
ntem a di oles m s en metros
emplo t ases de val , 15, 16 , 22 den as ases 1
, 15, ectiva sta m e cier cis n los v s pe puede
ibilid ir la in Cad ses d mp ne lm e cla no infe

otro superior, el valor central de la clase se denomina marca de clase; por ejemplo, la primera clase expuesta
tiene como lmite inferior 7.5 cm, el superior es 12.4 cm y la marca de clase es 10 cm, etctera.
Una clas s los lores s e hacer un pamiento para marca e clase tar la
frecuencia ab uta p e, est el nmero de valores q edan i uido da cla
El ra o, la a y la moda s en determi mbin ara la s, au e se h rdido
cierta precisin existen frmulas q permi catarla au totalmente.
La c ifica su s lamiento de frecuen iten trodu gunas ociones tiles. La
fre ia, es decir e ero d lores da clase ncluye, dividida entre el nmero total de valores, se
de frecuencia relativa y v de c no; natu ente, la suma de todas las frecuencias relativas es
no. La suma de la frecuencia, absoluta o relativa de una clase, ms las frecuencias, absolutas o relativas,
orrespondientemente, de las clases menores se llama frecuencia acumulada, absoluta o relativa, la frecuencia
a es
un
ecuencia re la frecu lativa acu nen una in trminos de
probabili La frecuencia relativa de un es una apro acin de la prob de que un valor
cualquiera proveniente de conjunto pertenezca a esa clas modo semejante, la frecuencia relativa
acumulad e una clase lo es de la proba e que un v cualquiera prove e ese conjunto de
p nezca a esa clase a una menor
n transversal del
tronco del rbol a una altura de 1.30m) medidos en centmetros que se muestran en el Cuadro 1. La primera
columna contiene los datos originales, la segunda los muestra ordenados de menor a mayor, la tercera columna
muestra la categora a la que pertenecen teniendo categoras de 5cm de amplitud y marca de clase en mltiplos de
5cm, de la cuarta columna a la octava se incluyen los valores observados, su frecuencia absoluta y la frecuencia
relativa. En el Cuadro 2 se muestran las clases o categoras observadas, la frecuencia absoluta y relativa, as como
stas acumuladas, las que tambin se muestran en forma grfica en las Figuras 1 y 2.
Cuadro 1. Datos de dimetro normal de 35 rboles
Datos originales de
dimetro
(cm)
Datos ordenados
crecientemente
(cm)
Clase o categora
(cm)
vez ificado va e pued agru cada d y ano
sol or clas o es ue qu ncl s en ca se.
ng median e pued nar ta p s clase nqu aya pe
ue ten res nque no
las cin y ea cia perm in cir al n
cuenc l nm e va que ca i
ralm nomina ara ero a u
u
c
acumulada absoluta de la clase ms grande es el nmero total de valores y su frecuencia acumulada relativ
o.
La fr lativa y encia re mulada tie terpretacin en
dad. a clase xim abilidad
ese e. De
a d bilidad d alor niente d
valores
E
erte o .
jemplo. Ordenamiento, clasificacin y frecuencias
Los 35 rboles de una parcela tienen los dimetros normales (es el dimetro de la secci
16.3 13.2 15
23.5 16.3 15
18.9 17.8 20
20.3 18.7 20
21.0 18.7 20
21.5 18.9 20
20
20
24.1 19.6 20
18
21.9 20
19.6 22.4 20
18.7 22.4 20
23.8 22.4 20
22.4 22.4 20
26.3 22.4 20
22.4 23.1 25
22.4 23.2 25
25.8 23.2 25
23.2 23.2 25
24.3 23.5 25
23.2 23.6 25
25.1 23.8 25
19.6 24.1 25
18.7 24.3 25
28.9 18.9
23.6 19.6
.9 20.3 20
17.8 20.4 20
21.9 21.0 20
20.4 21.5 20
23.2 21.6 20
26.5
Datos originales de
dimetro
(cm)
Datos ordenados
crecientemente
(cm)
Clase o categora
(cm)
22.4 24.5 25
13.2 25.1 25
21.6 25.8 25
22.4 26.3 25
23.1 26.5 25
24.5 28.9 30



Valores
observados
(cm)
Frecuencia
absoluta
Frecuencia
relativa
Frecuencia
absoluta
acumulada
Frecuencia
Relativa
Acumulada
13.2 1 0.029 1 0.029
16.3 1 0.029 2 0.057
17.8 1 0.029 3 0.086
18.7 2 0.057 5 0.143
18.9 2 0.057 7 0.200
19.6 2 0.057 9 0.257
20.3 1 0.029 10 0.286
20.4 1 0.029 11 0.314
21.0 1 0.029 12 0.343
21.5 1 0.029 13 0.371
21.6 1 0.029 14 0.400
21.9 1 0.029 15 0.429
22.4 5 0.143 20 0.571
23.1 1 0.029 21 0.600
23.2 3 0.086 24 0.686
23.5 1 0.029 25 0.714
2

Valores
vados
(cm)
Frecuencia
absoluta
Frecuencia
relativa
Frecuencia
absoluta
acumulada
Frecuencia
Relativa
Acumulada
obser
23.6 1 0.029 26 0.743
23.8 1 0.029 27 0.771
24.1 1 0.029 28 0.800
24.3 1 0.029 29 0.829
24.5 1 0.029 30 0.857
25.1 1 0.029 31 0.886
25.8 1 0.029 32 0.914
Valores
observados
(cm)
Frecuencia
absoluta
Frecuencia
relativa
Frecuencia
absoluta
acumulada
Frecuencia
Relativa
Acumulada
26.3 1 0.029 33 0.943
26.5 1 0.029 34 0.971
28.9 1 0.029 35 1.000
Nmero
de datos 35 1.000



Cuadro 2
Clase
. Datos de dimetro de 35 rboles mostrados en el Cuadro 1, ahora agrupados en categoras.
o categora
(cm)
Frecuencia
absoluta
Frecuencia
relativa
Frecuencia absoluta
acumulada
Frecuencia relativa
acumulada
15 2 0.0571 2 0.0571
20 18 0.5143 20 0.5714
0.9714
30 1 0.0286 35 1.0000
25 14 0.4000 34

Representacin grfica de las frecuencias y de las frecuencias acumuladas
Frecuencia Absoluta Figura 2. Frecuencia Relativa
l menor valor es de 13.2 y el mayor de 28.9cm, por lo que
el rango de valores es de 15.7cm; en las columnas cuarta y quinta se puede leer que el valor ms frecuente o la
moda es de 22.4cm con cinco valores en su frecuencia. Informacin que no era tan fcilmente identificable en la
primera columna.








Figura 1.

En cuanto a las estadsticas descriptivas que podemos calcular est el rango, observando en la segunda
columna del Cuadro 1 se aprecia inmediatamente que e





0
5
30 15
10
15
20
25
30
35
40
25 20
Frecuencia
absoluta
frecuencia
absoluta
acumulada
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
30 15 25 20
Frecuencia
elativa r
frecuencia
relativa
acumulada
3




MEDIDAS
Al te cul puede ser el centro de la distribucin o
valor tpico, u er esto se denomina una medida de tendencia central. Las tres medidas
pleadas son la media, la mediana y la moda, stas son funciones que se
r en un conjunto de datos, por ello existen para una poblacin y tambin para una muestra, es decir
pueden s
DE TENDENCIA CENTRAL
ner un conjunto de datos, suele ser de inters saber
n valor que tienda a satisfac
s comnmente em de tendencia central m
pueden defini
er parmetros o estimadores. Esto es, los valores poblacionales de estos indicadores (los parmetros) se
estiman con los valores muestrales (estimadores). La media es la ms usada de ellas, a continuacin ser
introducida.
Media
Es un promedio de un conjunto de valores, y se representa por
Y
cuando se hace referencia a una
poblacin cuyos elementos se simbolizan por y, y por y , cuando la media se refiera a una muestra de esa
poblacin. Se les denominarn media poblacional y media muestral respectivamente.
Empleando la simbologa ya expuesta, la media de la poblacin es,
N
Y
y para una muestra ser,
y
i
i
N
=
=
1

n
y
y
i
i
n

=
s del conjunto poblacin y n el tamao de
no siempre se escriben, ya que el
propio cont ario anotarlos para evitar una posible
confusin;
Es i da slo para una poblacin finita,
es, la generalizacin la veremos ms adelante al tratar el
valor esperado.
jemplo
os la media muestral del dimetro de los rboles, usando los datos del Cuadro 1.
ustituy
=
1

En donde N significa el nmero de elemento
la muestra. Los lmites de la sumatoria y el subndice de
exto los define, aunque en ocasiones es neces
en el presente texto generalmente no se usarn a menos que sea conveniente.
mportante hacer notar que esta definicin est da
discreta y con valores equiprobabl
tema de

E
Obtengam
S endo la frmula se tiene lo siguiente,
985 21
35
5 24 1 23 4 22 9 18 5 23 3 16
.
. . . . . .
y =
+ + + + + +
=
L


En una tabla de frecuencias, la media aritmtica se calcula suponiendo que todas las observaciones en
ase son iguales a su valor medio ( , por lo que la contribucin de la i-sima clase a la suma es . Por
edia se calcula por la ecuacin,
i
v )
i i
v f una cl
lo tanto, la m

=
=
k
v f y
1

i
i i
n
1
4

equivalentemente,

=
k
i i
v p y
= i 1
recuencia absoluta de la i-sima clase

La mediana como ya se mencion, es el valor que divide a los datos en mitades, una
es o iguales a la mediana y otra con aquellas menores o
ser la
mediana; si n es un nmero par, hay dos valores centrales, y la mediana debe tomarse como la
e estos dos valores.
ulada hasta ella, son
respectivamente menor que, y mayor o igual que 0.5.
b)
donde, f
i
: F
v
i
: Valor medio de la i-sima clase
p
i
: Frecuencia relativa de la i-sima clase
k: El nmero de clases
Mediana
con todas las observaciones mayor
iguales a ella. Para conjuntos de datos asimtricos (que tienen muchos datos pequeos y pocos
grandes o viceversa), es mejor medida de tendencia central que la media.
La mediana (Me) de un conjunto de n datos, ordenados de menor a mayor, es el
nmero central en el arreglo. Si n es un nmero non, solo hay un valor central y ese
media d
Para calcular la mediana en una tabla de frecuencias se procede de la siguiente manera,
a) Localice la clase de la mediana, que es la clase en que la frecuencia relativa acumulada
hasta la clase que le precede y la frecuencia relativa acum
La mediana se calcula mediante la siguiente ecuacin,
( )( )
d
c a b
a Me

+ =
5 . 0

donde, r de la clase de la mediana.
b: Lmite superior de la clase de la mediana.
con mayor
frecuencia. Si es un valor nico decimos que la distribucin de frecuencias es unimodal, si se
tienen dos o ms valores con la misma frecuencia mxima, decimos que la distribucin es
bimodal y as sucesivamente.
a: Lmite inferio
c: Frecuencia relativa acumulada hasta la clase que precede a la de la mediana.
d: Frecuencia relativa de la clase de la mediana.
Moda
Esta medida de tendencia central es poco usada, ya que puede ocurrir que no exista
o que no sea un valor nico.


La moda (Mo) de un conjunto de datos es el valor (si existe) que ocurre
5


Ejemplo
Del Cuadro 1, podemos observar que el valor que se repite m veces es 22.4cm, por
lo tanto esta es la media de los datos.
a

la mediana tienen las mismas unidades que los
datos, es decir, si los datos estn expresados en centmetros, cualquiera de stas tambin lo
estarn.

n la seccin anterior discutimos las medida ue describen el centro de una distribucin de
n, puesto que por otro lado
Existen varios parmetros y
stimadores que miden esta caracterstica, tales como: el rango o amplitud, la desviacin media, la varianza, la
esviacin estndar y el coeficiente de variacin, los cuales describiremos brevemente a continuacin.

l valor ms grande y el ms chico, esta medida de dispersin es la ms fcil de
obtener, a presencia e valores extremos de
poca fre
Ejemplo
etros.
alor mximo: 28.9 cm
Podemos darnos cuenta que al medir una misma caracterstica en diferentes individuos
de la misma poblacin encontramos variacin entre ellos. Tener conocimiento sobre esta
variaci bservar
n, pues nos da una idea de la dispersin de los valores unitarios individuales con
ferencia a su media; una varianza grande indica una amplia dispersin, por consiguiente una
ca dispersin.
s de
total de desviaciones.
s
En una tabla de frecuencias, la moda se define como la marca de clase de la clase cuy
frecuencia tiene el valor numrico mayor, la cual recibe el nombre de clase modal, y se
obtiene promediando el lmite superior e inferior de dicha clase, o sea la marca de clase.

Ejemplo
Del Cuadro 2, podemos observar que la clase con mayor frecuencia es la 20.
Ntese, que tanto la media, la moda y
MEDIDAS DE DISPERSION
E s q
frecuencias. Sin embargo, stas no son suficientes para caracterizar una distribuci
debemos tomar en cuenta la variabilidad que existe en nuestro conjunto de datos.
e
d
Rango
Es la diferencia entre e
sin embargo es poco utilizada debido a que es muy influenciable por l d
cuencia, lo que conduce a apreciaciones errneas, ya que por lo general se piensa que cuanto mayor es el
rango, mayor es la dispersin de los datos.

Nuevamente de los datos del Cuadro 1, podemos obtener el rango de los dim

V
Valor mnimo:13.2 cm
Rango =(28.9-13.2) cm
=15.7 cm

Varianza
n, ayuda a dar estimaciones confiables sobre la caracterstica que deseamos o
de la poblaci
re
varianza pequea seala po
La varianza poblacional, o cuadrado medio se define como la suma los cuadrado
las desviaciones de cada observacin con respecto a la media (la observacin menos el valor
esperado, es decir las distancias) dividida por el nmero
6

Para una poblacin finita, equiprobable de N individuos, la varianza se expresa as,
( ) ( ) ( )
( )
N
x
N
x x x
N
i
i
N

=
cer toda la poblacin en cuestin, nunca llegamos a conocer la
arianza de la poblacin, por lo que tenemos que hacer su estimacin a partir de una muestra,
ara esto utilizamos la siguiente expresin,

=
+ + +
=
1
2
2 2
2
2
1 2
...


A menos de cono
v
p
( ) ( ) ( )
( )
1
1
...
1
2
2 2
2
2
1 2

+ + +
=

=
n
x x
n
x x x x x x
s
n
i
i
n

Ejemplo
Deseamos saber la variabilidad del peso de biomasa verde (kg), para los siguientes
atos,
Peso de biomasa verde (kg): 3, 4, 8, 9.
d
Kg
y
4
=

6
24
=
Sustituyendo en la frmula anterior obtenemos el siguiente resultado,
( ) ( ) ( ) ( )
Kg .
- - - -
s
6 4 6 3
2 2 2 2
2
+ + +
=
6666 8
1 4
6 9 6 8
=


6666 Kg.


Por lo tanto la variabilidad en el peso de biomasa verde es 8.



Desviacin Estndar
Esta se define como la raz cuadrada positiva de la varianza, es decir,
2
s s = .
La desviacin estndar al igual que el rango, tiene las mismas unidades que la media, en tanto que la
varianza tiene esas unidades al cuadrado, por lo cual la primera resulta ser la ms usada.

Ejemplo
As del ejemplo anterior, obtenemos la desviacin estndar de la siguiente manera,
Kg 9439 . 2 6666 . 8 =

Desviacin Absoluta Media
7

La desviacin absoluta media (D.M.) de un grupo de observaciones se define como la
suma de los v b esviaciones con respecto a su media, dividida por el
mero de ellas, la ecuacin que la representa es la siguiente,
alores a solutos de sus d
n

=
=
n
y y M D
1
. .

i
i
n
1
La desviacin media es una medida de dispersin que es til para propsitos
des
El coeficiente de variacin (C.V.) es una medida de la dispersin relativa de un
junto de datos ue se obtiene dividiendo la desviacin estndar del conjunto entre su media
aritmtica, la ecuacin que la representa es la siguiente,
criptivos.

Coeficiente de Variacin
con q
100 ) .( . =
y
s
y V C
y

Tal como la desviacin estndar y la media estn en las unidades originales, el C.V. es
una medida independiente de las unidades de medicin, consecuentemente el C.V. es la
tidad ms adecuada para comparar la variabilidad de dos conjuntos de datos, aun cuando
estn en diferentes unidades. En el rea de investigacin donde se tienen datos de
ntos previos este coeficiente es muy usado para evaluar la precisin de un
xperimento, comparando el C.V. del experimento en cuestin con los valores del mismo en
.








n
i
i n
y y
1
2
...
tambin pueden ser combinadas con la sumatoria, por ejemplo si lo que
se desea su ar es el cuadrado de cada dato la simbologa apropiada es,
i
i n
y y y y
1
2 1
...
can
experime
e
experiencias anteriores







ANLISIS TERICO DE LOS ESTIMADORES
Operador sumatoria y otros smbolos
Algunos parmetros y estimadores incluyen en su definicin la suma de varios valores o datos. Si se
simboliza por y
i
a cualquiera de esos datos, digamos el i-simo de ellos, y se tienen n datos, la suma de estos
datos se simboliza empleando el Operador Sumatoria (),

=
= + + + y y
1
Otras operaciones matemticas
m

=
= + + +
n
2 2 2 2
8

El subndice seala una etiqueta que identifica a cada uno de los datos cuando stos aparecen en una
lista. Es importante notar qu el subndice puede ser cualquier letra, convencionalmente se emplean las
intermedias del alfabeto, minsculas como la i, j, k, etc., aun los mismos datos pueden ser referidos por
s. ems, un smbolo de dato, y, puede tener mas
o sentidos de clasificacin como puede ser el caso de
una matriz que tiene renglones y columnas, como , donde i puede ser el rengln y j la
columna
Ahora se exponen ejemplos de cierta complejidad en el uso de la sumatoria y subndices. En los ejemplos, i
puede tomar valores entre 1 y n, mientras que puede ser cualquier valor.

a) , donde r es un nmero entero mayor que 1 y menor que n

Ejemplo
)
onde =cualquier valor

b) donde k pertenece a los nmeros reales y es una constante



Si supones que necesitas saber cunto suma la serie de nmeros consecutivos que van de 1 a 10, podras
hacer un clculo mental o con una calculadora para conseguir la respuesta, pero, si tuvieras que hacer el clculo
de la serie que va de 1 a 100 a 1000?, podras usar la siguiente frmula cuyo valor depende de n y est dado
por,
c)
e
subndices diferentes para indicar las operaciones apropiada Ad
e un subndice cuando los datos tienen ms de dos criterios d
ij
y una tabla o
; si existen mas de dos criterios de clasificacin de los datos podrn haber ms de dos subndices para
identificar apropiadamente cada dato.
En otras ocasiones se emplear un subndice con algn otro smbolo, tal vez el de un parmetro o de un
estimador, para representar que ese smbolo pertenece al objeto identificado con la etiqueta que se usa como
subndice.
i
y

= + = =
+ =
r
i
n
r i
i i
n
i
i
y y y
1 1 1
( ) (

= =
=
+ =
+ + + + =
2
1
5
3
5 4 3 2 1
5
1
i i
i i
i
i
y y
y y y y y y
d
i
y

= =
=
n
i
i
n
i
i
y k ky
1 1

( )
2
1
1
+
=

=
n n
i
n
i

Ejemplo
( )
( )
500 , 500
2
1001000
2
1 1000 1000
55
2
110
2
1 10 10
1000
1
10
1
= =
+
=
= =
+
=

=
=
i
i
i
i


Y si lo que necesitaras es sumar el cuadrado de esta misma serie de nmeros, podras utilizar la siguiente
frmula,
d)
( )
6
) 1 2 ( 1
1
2
+ +
=

=
n n n
i
n
i

Ejemplo
9

( )( )
( )( )
500 , 833 , 333
6
000 , 001 , 003 , 2
6
1 2000 1
385
6 6
1
= =
= i
10
1000 1000
1000
2
=

i
2310 1 20 1 10
= =
+ +
+ +



s,
a
n un grupo de personas se desea investi ar si estas fuman o no, en este caso
definir a.
1.
erado o esperanza matemtica, E(Y), a la media de los datos de una
poblacin que es simplemen osibles valores, cuando se usan
las pro
a aleatoria Y, y f(y) es la
funcin de densidad de probabilidad.
i 1
Donde ) es la probabilidad de que ocurra el valor .

a empresa necesita saber la ganancia promedio que obtendr si vende un nuevo tipo
de com a a
o de
10
10
2
=

i
1 = i
Variable Aleatoria (v.a.)
El concepto de variable aleatoria se relaciona con todos los resultados posibles que
puede tomar una variable en estudio. A dicho conjunto se le denomina espacio muestral, a
una variable aleatoria Y es una funcin que va del espacio muestral a los nmeros reales o
un subconjunto de este bajo un experimento aleatorio.

Ejemplo
E g
emos como S= {si, no} al grupo de personas y sea B el evento de que la persona fum
Entonces definiremos la funcin Y, la variable aleatoria como sigue,

= no s si 0
Esta variable es conocida como la indicadora del conjunto {s} y slo toma los valores 0
Valor Esperado
lamemos valor esp

=
=
s s si
B Y
1
) (
L
te el promedio ponderado de los p
babilidades como factor de ponderacin.

As tenemos la siguiente definicin,
Para variables continuas,
[ ] dy y f y Y E
b
a

= ) (
Donde a y b son los lmites superior e inferior del r ngo de la variable
Para variable discretas,
[ ]

=
n
i i
y P y Y E ) (
=
(
i
y P
i
y
Ejemplo
Un
putadora. Si la probabilidad que una persona adquiera el nuevo tipo de computador
un costo de $18,000 es 0.4 y la probabilidad que adquiera el modelo ya existente a un cost
$10,000 es 0.6 Cul sera la ganancia esperada?.
Diseo de Encuestas 11

Por lo tanto la ganancia esperada de la empresa es $13,200.
o
n
r del estimador. Este valor, juega un
papel m
de que una variable aleatoria tome
un valor s la desviacin
que la unidad, menos uno dividido entre el cuadrado de k. Esto es,
a E(W)= a su esperanza matemtica y por S(W) a su desviacin
estndar
Aplicando la fr ula anterior, m
Sea Y el valor de venta,
E(Y) =18,000(0.4)+10,000(0.6)
=13,200

Desigualdad de Chebyshev
Cmo estimamos?
En la mayora de los casos nos interesa acompaar cualquier estimacin de un parmetr
poblacional (puntual), con alguna medida de dispersin del mismo. Como veremos nuestra estimaci
numrica siempre ir acompaada de lo que se llama error estnda
uy importante en la inferencia estadstica, ya que multiplicado por algn valor y despus sumado
y restado al estimador, nos dar lmites de confianza superior e inferior. Para aclarar este concepto
recordamos la desigualdad de Chebyshev, que dice La probabilidad
que difiera en valor absoluto de su esperanza matemtica menos que k vece
estndar de dicha variable, es mayor
llamando a W a la variable aleatoria,
,
( )
2
1
) ( ) (
k
W kS W E W p
De esta manera se puede ver que la desviacin estndar es una buena medida de l
acin, puesto que utilizando la anterior desigualdad sabemos que la probabilidad de que se
a
concentr
obtenga aleatoriamente un valor exterior al intervalo es cu do mucho igual a 1/k
2
.
y
ilidad de W, ya que es vlido para toda variable aleatoria, discreta o continua.
ualdad, as como la variante Camp-Meidell, es til en control de calidad
industrial moderno, ya que nos da la proporcin que que r fuera de k de la calidad media y que
por lo tanto no es aceptada.
Teorema Central del Lmite
dstica el Teorema Central del Lmite es de gran importancia, ya que en l descansan gran
parte de los mtodos estadsticos. Este teorema provee una aproximacin efectiva simple a probabilidades
determinadas por sumas de variables aleatorias independientes y explica la gran importancia de la
distribucin normal en la teora de probabilidades. Su enunciado preciso es el siguiente: Sean Y
1
, Y
2
, ...,
Y
n
una muestra aleatoria de una funcin de probabilidades
an
Este teorema nos proporciona una relacin entre la desviacin estndar la distribucin de
probab
La desigualdad de Chebyshev tiene gran utilidad en la teora moderna de la probabilidad, debido
a su generalidad. Esta desig
da po

En esta
( ) y f
Y
edi
(es decir variables aleatorias
independientes e idnticamente distribuidas), con m a
Y


y varianza . Sea
2
Y

( )
n n
Y Y Y Y + + + = L
2 1
1
un tamao de muestra N, l
la media aritmtica de las variables aleatorias que integran la muestra. Para
a distribucin de la variable aleatoria Y es aproximadamente normal con
media
Y
y varianza, es decir,
( )
n Y
Y
N Y
2
,

cuando n
De acuerdo con el resultado anterior y estandarizando la variable aleatoria, la
e como, expresin puede escribirs
( )
( ) 1 , 0 N
Y
Y


Y n
tra grande, la distribucin
de
El Teorema Central del Lmite establece que para un tamao de mues
Y es aproximadamente normal independientemente de la funcin de probabilidades de la variable
Y. aleatoria
Para casi todas las poblaciones, la distribucin del muestreo de Y es aproximadamente normal
si el m estr l azar es lo suficientemente grande, pero, qu significa una muestra
suficientemen pender de la naturaleza de la poblacin muestreada y del grado de
aproximacin bucin normal.
u eo simple a
te grande?, esto de
requerida a la distri
11
Diseo de Encuestas 12
Cuando la poblacin muestreada es una distribucin de probabilidades normal,
no se r lizamos otro teorema que
establece,
Si la poblacin muestreada es una distribucin e probabilidades normal, la distribucin de
probabil ades de
equiere el Teorema Central del Lmite. En este caso, uti
d
Y id es exactamente normal para cualquier tamao de muestra.
uestreada, el Teorema Central del
Lmite, s dice la naturaleza de la distribucin del muestreo de
Puesto que a menudo no conocemos el tipo de poblacin m
Y no para una muestra razonablemente
grande, al margen del tipo de distribucin que siga la poblacin.



DISTRIBUCIN DE PROBABILIDADES
Un muestreo aleatorio sirve para retratar de manera fiel la distribucin
probabilstica de la variable bajo estudio, pero no es quien la induce. Una distribucin
n de distribucin de probabilidad. Toda probabilidad es no negativa y no
ayor q obabilidades es uno.
ene la misma probabilidad de ocurrencia.
Es de gran importancia en el muestreo.
Una variable aleatoria Y tiene distribucin uniform ncin de probabilidades es,
probabilstica es inducida por un experimento aleatorio.
A una funcin que asigne una probabilidad de ocurrencia o aparicin a cada valor de una
oblacin se le llama funci p
m ue uno, adems la suma de todas las pr
A continuacin haremos un repaso de las funciones de probabilidad ms usadas.
Distribuciones Discretas
Uniforme Discreta
Es aquella que describe el comportamiento probabilstico de un experimento en
que cada uno de los posibles resultados ti
e discreta si su fu

=
= = =
rma de otra fo
n y
n
y Y y f
Y
0
,..., 1
1
) Pr( ) (
Donde n es el nmero total de resultados posibles en el experimento, y los son los valores que
i una variable aleatoria discreta tiene distribucin de probabilidades uniforme en los primeros n
enteros positivos, entonces,
i
y
toma.
S

12
1
] [
2
1
] [
2

=
+
=
n
y E

en general todos los momentos dependen del
par r
Demostracin,
n
y Var
Podrs notar que la media y la varianza y
met o n.
2
) 1 (
2
) 1 ( 1 +
=
n n
) ,... 2 1 (
1
1
] [
0
+
=
+ + + =
=

=
n
n
n
y y E
n
y

n
n

12
Diseo de Encuestas 13

En cuanto a la varianza,
( )
( )
12
=
1
2 6
2

=
n
1 ) 1 2 )( 1 (
2
+ + + n n n
] [ ] [ ] [
)
1
] [
2 2
2
0
2 2
=
=

=
y E y E y Var
n
n
y y E
n
y
s posibles denominados xito (E) y fracaso
l o el conjunto de resultado posibles.
b) La probabilidad de que ocurra el evento {E} es p, ( 0 p 1). Por lo que,

P ({E})= p
P ({F})= 1- p =q

De manera general la funcin de probabilidades puede escribirse,
rm de otra fo 0

=
+
1 1 1 0 1
) 1 ( 1 )

6
) 1 2 )( 1 ( 1 + +
=
n n n
n

,... 2 1 (
1
2 2
+ + + =
n
Distribucin Bernoulli
El modelo probabilstico Bernoulli tiene las siguientes caractersticas,
a) El espacio muestral solamente contiene dos resultado
(F). Esto es, S={E, F}, donde S es el espacio muestra

=
=

y p p
y f
y y
Y
0 , 1 ) 1 (
) (
1
a

La esperanza de una variable aleatoria Bernoulli se obtiene,

[ ] p Y E =
0
1 ( 0
[ ] p Y E
p p p
[ ] [ ]
( )
( )
[ ] pq Y Var
p p
p p
p p p p p Y Var
=
=
=
+ =

1
) 1 ( 1 ) 1 ( 0
2
2 1 1 1 0 1 0

El parmetro de la distribucin es p, por lo que para cada posible valor de p entre cero y uno se
ene una funcin de probabilidades diferente, y una vez dado el valor de p las probabilidades quedan

istribucin Binomial (n, p)
muestral est constituido por las secuencias de xitos y
fracasos
y
y
0
onde
y es el n
oulli (p) independientes, es decir,
ti
unvocamente determinadas.
D
En este modelo probabilstico, el espacio
que resultan de n repeticiones independientes de un experimento cuyo modelo probabilstico es
Bernoulli con probabilidad p igual para todas las repeticiones. Contiene

n
n
n
2 elementos, d
=
mero de xitos. As que una variable aleatoria binomial (n, p) se puede ver como la suma de n
variable aleatoria Bern
13
Diseo de Encuestas 14

=
=
n
j
j
X y
1
(1)

donde,
) (p Bernoulli X
j

j X 1 = ntes independie son n
j
,..., 2 ,

su funcin de probabilidad esta dada por,

Sus parmetros son n y p, donde n es un entero positivo y 0 p 1.

y
( )

=

rma de otra fo
n y p p
y
n
y f
y n y
Y
0
..., 2 , 1 ) 1 (

[ ] np y E =
[ ] npq y Var =
p q =1 Donde
Demostracin,
1) Utilizando la expresin (1) se puede ver que,
n
j
j

=

=1
] [

p np
X Var y Var
n
j
=
=

[ ]
np
X E
1 i
j
=
=

=

y
X E y E
n

1 i
) 1 (
] [ ] [
=
independencia de las
2) (Opcional). Utilizando la funcin generatriz de momentos obtenemos,
[La funcin generatriz es una nocin de uso muy comn para el estudio de una distribucin].
,
j
X usando la
( ) ( ) ( ) ( )
( )

= = =
n
i
y n
y
t
y n y
n
i
ty ty ty
Y
q p e
y
n
p p
y
n
e e E e E t M
1
1
1

Y utilizando la propiedad del binomio de Newton
( )
n
t
p e = q +
cto a t, la expresin anterior y sobre el resultado haciendo
t=0 podemos obtener el primer momento, es decir, la esperanza.

Distribucin Poisson
Un modelo probabilstico Poisson tiene las siguientes caractersticas:
1. El espacio muestral se genera por un nmero muy grande de repeticiones de un experimento cuyo
modelo probabilstico es Bernoulli, con probabilidades muy pequeas de xito. Las repeticiones del
exp imento Bernoulli se realizan en cada uno de los puntos de un intervalo de tiempo o espacio.
2. El nmero de xitos en el intervalo I
j
es independiente del nmero de xitos en el intervalo I
k,
donde I
j

I
k
=, es decir, son conjuntos ajenos.
Derivando, con respe
er
14
Diseo de Encuestas 15
3. La probabilidad de que se tenga dos o ms xitos en el mismo punto del intervalo es cero.
4. El nmero promedio de xitos en un intervalo es una constante , que no cambia de intervalo a
intervalo.
Su funcin de probabilidades est dada por,

=
=
= =

0,1,2... y
e
y Y P y f
y
Y

) ( ) (


forma de otra 0
y!
l parmetro de la distribucin Poisson es , el nmero promedio de xitos por intervalo. Su
media y za estn dadas por,

E
su varian

=
=
] [
] [
Y Var
Y E

Es importante hacer notar que tanto el estimador de la media como el de la varianza son el
mismo.
ratriz d Utilizando la funcin gene e momentos,
< < =
=

e e
t
e
=
=

e
y
e
y 0
) (
!

=

t e
e
y
e t M
t
e
y
y
) 1 (
0
!
) (

y y
1

Y

t
1

Para obtener el primero momento, derivaremos la expresin anterior,


= ) ( log ) (
Y
t M t
= ) 1 (
t
e
= =

= = ) 0 ( ' '
2


) 0 ( '
eatoria cuya funcin de probabilidades es
mento
Bernoulli que son necesarias para obtener k xitos.
Una variable aleatoria Y ti
probabilidades es,
edia y varianza son,
Distribucin Binomial Negativa
El espacio muestral de una variable al
binomial negativa se genera por las repeticiones independientes de un experi
ene la distribucin binomial negativa si su funcin de

( )

+ =

=

otra forma de 0
r r y p p
r
y
y f
r y r
Y

,... 1 , ) 1 (
1
1


Donde r es el nmero de xitos que se desean y p es la probabilidad de xito en cada intento. Los
parmetros de la distribucin son r y p.
Su m
15
Diseo de Encuestas 16
2
] [
] [
p
r
y E =
p
rq
y Var =















Distribu
istribucin Uniforme Continua
a variable aleatoria uniforme o rectangular y es continua y tiene probabilidad constante sobre el
recorrido



ciones Continuas
D
L
2 1
< < y , con discontinuidades en los extremos y=
1
y y=
2
. Esta funcin es homloga a
la Uniforme Discreta, se dice que una variable aleatoria Y tiene una distribucin Uniforme Continua si su
funcin de densidad de probabilidades es,

( )


=
forma de otra 0
y
y f
Y
2 1
1 2

1


Donde
1
y
2
son dos nmeros reales tales que
1
<
2
.
Fi

La me

gura 3. Funcin de densidad Uniforme
dia y la varianza son,
( )
12
] [
2
] [
2
1 2
2 1

=
Y Var
Y E

1

2
f(x)
x
16
Diseo de Encuestas 17
Distribucin Normal
Esta distribucin tiene gran un modelo adecuado para una gran
iversida
importancia debido a que es
d d de situaciones en la naturaleza y tambin por su sobresaliente papel en la teora estadstica,
puesto que sirve como punto de partida para el desarrollo de muchas tcnicas de inferencia. Es importante
mencionar que debido a que la distribucin normal es continua, solamente pueden calcularse
probabilidades para intervalos en el espacio muestral de Y, ya que para cualquier posible valor k de Y,
P(Y=k)=0. Decimos que una variable aleatoria Y se distribuye como normal si su funcin de densidad
es,
( )
( )

=
orma de otra f 0
y f
Y

2
2


y
y
e
1
2
2
2
1
-



donde,
( )
( ) 0
2 2
=
> =
Y E < < =

e 71828 . 2
Y Var

14159 . 3 =
Debe notarse que y
2
son los parmetros de la distribucin, es decir ( )
2
~ Y N .

Distribucin Normal Estndar
2
Sea Y una variable aleatoria distribuida N ( , ),
Definamos la siguiente variable aleatoria,


=
Y
Z la cual tiene distribucin N (0, 1).
Su funcin de densidad es,
( )
( )

z
z
e
1
2
2
1
-

= z f
Z 2

forma otra de 0
La importancia de esta funcin de densidad de poblacin es que, las
probabilidades en cualquier miembro de la familia, o sea cualquier normal pueden
calcularse en la normal estndar. La ventaja estriba en que tiene media 0 y varianza 1.
El resultado de la integracin se obtiene en tablas de la normal estndar o en un software
estadstico.

Distribucin J-cuadrada
Esta distribucin surge como la suma de cuadrados de variables aleatorias independientes
i
Z ,
cada una con distribucin normal estndar, el nmero de variables independientes en la suma son los
grados de libertad y este es el parmetro de distribucin.
u funcin de densidad es la siguiente, S
( )
( )
( )

=

forma otra
y
y
v
y f
y
Y
0
0 e
2 2 2
1
2
1
-
1 2 v

donde v una constante de integracin y (v/2) es la funcin gamma de v/2, definida por, es
17
Diseo de Encuestas 18
1 2 3 )... 2 )( 1 (
0
=

k k k dx e x
x k
, esta integral es llamada k+1 y se puede escribir como (k+1) la
cual tam in es una constante de integracin y el parmetro v son los grados de libertad.
u varianza y su media son,
b

S
[ ]

v Y Var
v Y E
2 =
=


istribucin t-Student
a distribucin t es simtrica con media cero y de forma muy semejante a la normal estndar. Si
Z es una variable N (0, 1), y si J-cuadrada ~
2
(v) y es independiente de Z, entonces la variable aleatoria
definida por,
t
D
L
=
v
Z
/
2


tiene una distribucin t-student con v grados de libertad. Esta definicin est dada para
una poblacin finita discreta con valores equiprobables, la generalizacin la veremos
ms adelante al tratar el tema de valor esperado.

Su funcin de densidad es la siguiente,

( )
( ) [ ]
[ ]
( )

+
+
=
+
rma de otra fo
t
m
t
m
m
m
t f
m
T
0
1
! 2 /
! 2 / 1 1
2 / 1
2



F de Fisher
Sean
2
(m) y
2
(n) dos variables aleatorias distribuidas como J-cuadrada con m y n grados de
libertad respectivamente. Entonces, la variable aleatoria F definida como,
F
m
n
m
n
=

2
2
/
/

F con m y n grados de libertad.
SPECTOS GENERALES DEL MUESTREO
Tiene la distribucin


APTULO 2


A

C
18
Diseo de Encuestas 19

INTRODUCCIN
Las tcnicas de muestreo tienen su fundamento terico en la estadstica y la probabilidad. Como
en todas las reas del conocimiento, en el muestreo se ha generado o adoptado una terminologa
especfica para definir de manera apropiada los conceptos que se utilizan, por lo que es conveniente
revisar algunos de ellos, en particular de la estadstica, y presentar la simbologa que se emplea en las
treo. tcnicas de mues
Definicin
Conjunto
Es una coleccin de objetos definidos y distinguibles cuya nica propiedad indispensable es que
sean identificados como pertenecientes a dicho conjunto, a cada uno de los objetos que lo constituyen se
le llama elemento.

Por ejemplo todos los rboles de un predio pueden constituir un conjunto, tambin los
illas dentro de un saln de clases constituyen un conjunto. Cabe mencionar que no es un
requisito
describir el estado de un bosque o de una
l, para ello se toman mediciones en los rboles como la altura, el dimetro u otras
variable
arios y aun todos los elementos del primer conjunto pueden estar vinculados al mismo
emento del segundo conjunto, lo que no es vlido es que un elemento del primer conjunto est
inculado con ms de un elemento del segundo. Las funciones que comnmente abordaremos en este
xto son funciones matemticas, en las que los conjuntos son de nmeros y la regla de asociacin es una
emos mencionado que los elementos de inters para el muestreo son los valores medidos de los
n seleccionados del conjunto poblacin a los cuales se les denominadatos. Es decir un
specfico que tiene la caracterstica de inters en un elemento de la poblacin. Conviene
trmino dato, se puede referir a un valor realmente conocido o que se sabe que existe
pero que
observacin o ejecucin
del experimento. La determinacin del valor de la caracterstica es la medicin o la calificacin, la cual
algunas


estudiantes y las s
que los objetos sean de la misma naturaleza, aunque en la mayora de los casos que involucran
las tcnicas de muestreo los objetos suelen ser de la misma naturaleza, o al menos muy semejante.
Las tcnicas de muestreo se aplican directamente a conjuntos de objetos con valores medidos en
escalas continuas o discretas, la definicin formal de estas escalas se presentar en este captulo.

En alguna circunstancia pudiera ser de inters
plantacin foresta
s de inters. El conjunto de mediciones de estas variables medidas es el sujeto de aplicacin de las
tcnicas de muestreo. Otro ejemplo puede ser la determinacin de la calidad del aire en una ciudad, para
ello se toman mediciones de diferentes contaminantes, el conjunto de las mediciones del contaminante es
la variable a la que se aplican los conceptos del muestreo.
Otro trmino muy usado es funcin, matemticamente el concepto de funcin consta de tres
elementos, dos conjuntos y una regla que asocia o vincula a cada elemento del primer conjunto con uno y
solo uno de los elementos del segundo conjunto. Una lista de nombres y un grupo de estudiantes pueden
constituir una funcin si cada nombre de la lista le corresponde a uno y solo uno de los estudiantes.
tese que v N
el
v
te
ecuacin.

H
elementos que so
dato es el valor e
mencionar que el
an no ha sido determinado. En el contexto del presente trabajo se entender como un valor que
ya ha sido determinado.
El procedimiento que permite determinar un dato se denomina experimento. En este
procedimiento se incluyen dos aspectos: uno es la forma en que se decide la observacin o ejecucin y
otro en el que se hace la determinacin del valor de alguna manera.
En este texto ser de relevancia considerar la forma en que se decide la
veces representa un problema que puede implicar considerable dificultad y requerir tratamientos
especficos; precisamente este es el tema que abordaremos a continuacin.








19
Diseo de Encuestas 20






















QU ES UNA MEDICIN?
La medicin es una tarea en la que la estadstica no interviene directamente pero que influye de
manera importante en el xito del anlisis estadstico de los datos. Para hacer una medicin deben tenerse
presentes las tcnicas adecuadas. Entenderemos genricamente como m inacin del
c
plean tcnicas muy distintas a las requeridas para
e una con ro los mtodos estadsticos para
tos pudieran ser los mismos en ambos casos.

nas. Sin embargo, la comparacin entre tcnicas de
medici puede ser motivo de aplicacin de los mtodos estadsticos.


VARI BLES
na caracterstica que es determinada para cada uno de los elementos de una poblacin mediante
una medicin o una calificacin
La altura de los rboles es una que pertenece cada uno de los
rboles.
os reales son posibles, al menos tericamente ya que por limitaciones en los
medicin muchos de los valores en ese intervalo no pueden ser observados
cluir en este tipo de variables aquellas que son medidas en kilogramos,
centmet ms y ms el
instrumento de medicin.

de variables son los conteos, el nmero de
personas en un lugar, el nmero de libros en una biblioteca, etc.
s grupos y cada elemento pertenecera solamente a uno de esos grupos o clases.

POBL
edicin a la determ
valor de la cara terstica de inters.
Para medir la altura de rboles en pie se em
medir la longitud de las traqueidas de la madera d fera; pe
analizar dichos da
Las tcnicas de medicin pueden variar enormemente y es posible que algunas de ellas lleguen a
tener una gran complejidad para su realizacin. La instrumentacin, seleccin y validez de las tcnicas de
medicin son motivo de estudio de otras discipli
n
A
U
se entender como una variable.
variable, tambin lo es la especie a la
El peso de cada silla o de cada estudiante tambin es una variable.
Una variable continua, como su nombre lo indica es aquella en que todos los valores dentro de
un intervalo de los nmer
instrumentos de
prcticamente.
En general se pueden in
ros, etc., y cuya precisin puede ser incrementada indefinidamente afinando

Una variable discreta, se puede medir en una escala que no incluye a todos los posibles valores
en un intervalo de los nmeros reales. Un ejemplo de este tipo
Las variables por tributos permiten la clasificacin en funcin de que una cierta propiedad est
presente o no en el elemento que est siendo evaluado. La pertenencia a un grupo botnico es un ejemplo
de un atributo, podra haber un nmero variable de atributos, como tener varios grupos botnicos, lo que
permitira hacer diverso
ACIN Y MUESTRA
Ya se ha establecido que las tcnicas de muestreo, y en general los mtodos estadsticos, son
20
Diseo de Encuestas 21
aplicables a un conjunto de valores pertenecientes a un conjunto de datos. Propiamente, se le puede
denominar poblacin al conjunto de objetos tanto como al conjunto de valores. El segundo es una funcin
del primro, y aunque con frecuencia no se distinguen explcitamente, el contexto en que se usa el
trmino
e
poblacin deja clara la referencia. En este texto se usar la palabra poblacin para referirse al
conjunto de mediciones que se hacen de una caracterstica en todos y cada uno de los elementos del
conjunto de objetos.

Definicin
Poblacin y Muestra
Formalmente entenderemos como poblacin a un conjunto de valores y muestra a un
subconjunto de la poblacin.

El conjunto que incluye a todas las partes constitutivas de la totalidad de un recurso es una
poblacin. As, la poblacin es un conjunto de nmeros que tienen las unidades en que se hace la
medicin.

n general, en el anlisis no suelen incluirse las E unidades de medicin de los valores de una
variable
etros, etctera, por lo que, los resultados del anlisis pueden hacernos ms sentido,
que facilita enormemente la interpretacin.

Por ejemplo, si el recurso son los rboles presentes en un predio y la
carac est
constituida por todos los rboles, pero la poblacin a la que las tcnicas de muestreo se
referirn es al conjunto constituido por las alturas de esos rboles, alturas que estarn
denominadas p
ejemplo 24.5
poblacin.



PARMET
Definicin
, es decir estos se analizan simplemente como nmeros. Sin embargo, resulta sumamente
conveniente no olvidar que los valores de una poblacin siempre representan dimensiones fsicas como
peso, volumen, longitud, etctera, y que estas dimensiones son medidas en unidades como kilogramos,
etros cbicos, centm m
lo

terstica de inters es la altura promedio de ellos, la poblacin original
or el nmero que indica la dimensin y las unidades en que se mide, por
metros podra ser uno de los elementos constitutivos del conjunto
ROS Y ESTIMADORES

Parmetros
Sobre el conjunto poblacin se pueden definir funciones muy diversas como el valor ms
pequeo, el ms grande, el que ocupa la posicin central una vez que han sido ordenados ascendente o
descendentement el e, la suma de todos ellos despus de elevarlos al cuadrado, el valor que se repite
mayor n s ms, todas esas funciones son parmetros. Los parmetros suelen mero de veces y muchos otro
ser representados por letras griegas, como , , , en tanto que los estimadores generalmente se
simbolizan con otros caracteres especficos que oportunamente se introducirn.

Existe u
no tienen utilidad
los valores inclui
una casa, la suma


Definicin
n nmero infinito de parmetros para una poblacin dada; sin embargo, muchos de ellos
, en cambio otros manifiestan el inters de la evaluacin. Por ejemplo, la suma de todos
dos en una poblacin puede ser de inters si cada nmero representa el gasto de agua en
representa el gasto de agua en una localidad.
Estimadores
Las funciones que se pueden proponer como parmetros, tambin se pueden definir para el
conjunto muestra, y aun otras funciones adicionales, entonces reciben el nombre de estimadores a cada
21
Diseo de Encuestas 22
parmetro pueden corresponder uno o ms estimadores. Tambin existe un nmero infinito de
estimadores, pero solo algunos tienen inters prctico.
En algn
se ver mas adel
tener propiedade al del
parmetro es un
numrica. Mient
estimar los parm


TAMAO
ar que al plantear un anlisis es indispensable preguntarnos Cul es la
cant
muestreo, pues e
desprendan del a
Definire
sentido puede haber una confusin entre parmetros y estimadores. Sin embargo, como
ante, un parmetro puede tener vinculacin con ms de un estimador y esa vinculacin
s especficas que pueden ser ms o menos deseables. Una definicin gener
a funcin que describe el total o una parte de la poblacin, usualmente en forma
ras que un estimador es una funcin de datos disponibles (muestra) que se usa para
etros.
DEL ERROR DE ESTIMACIN
Es importante hacer not
idad de error tolerable?, el cual debe ser definido por la persona que utilizar los resultados del
s ella quien conoce el fenmeno en cuestin y lo delicado de las conclusiones que se
nlisis. A continuacin presentamos el concepto de error de estimacin.
mos a como el parmetro de inters y a

lmite de error de
como su estimador y especificaremos un
estimacin. Esto es, debemos especificar que y

cantidad menor q
difieran en valor absoluto en una
ue B, simblicamente escribimos,
B stimacin Error de e < =

-

Tambin
veces en muestre
puede escribirse
podemos establecer un nivel de probabilidad (1-), que especifique la fraccin de las
o repetido en que requerimos que el error de estimacin sea menor que B. Esta condicin
como,
[ ] = < 1 B stimacin Error de e P
Seleccionamos ) (
1 ,

=
n
t ; regularmente se asume ) (
1 ,
B

=
n
t B con =0.05 lo cual se justifica
l lmite central. Para fines prcticos 2
1 ,
por el teorema de =
n
t

por lo que ) ( 2

= B .

co con su probabilidad asociada (1-), nos ayuda a
com
proporcione la pr






El marc
las unidades de m

Definicin
La determinacin de un lmite especfi
parar diseos diferentes (mtodos de seleccin de la muestra) para determinar el procedimiento que
ecisin deseada al mnimo costo.

MARCO DE MUESTREO
o de muestreo, o marco muestral, est constituido por un listado, real o virtual, de todas
uestreo.
Unidades de Muestreo
Son colecciones de elementos de la poblacin que cubren la poblacin completa.

Hacer el listado parece una labor simple pero puede presentar dificultades para su obtencin,
adem
tareas particulare

Decimos
fsicamente la lis
generarlo y aunq
requiere dicho ma
s conviene apuntar que diferentes poblaciones pueden presentar caractersticas que demandarn
s para obtener el marco de muestreo.
que el marco de muestreo es real o virtual porque en ocasiones se puede tener
ta de todas las unidades, mientras que en otras bastara con tener la posibilidad de
ue no se genere fsicamente puede ser suficiente para lograr el objetivo para el que se
rco.
22
Diseo de Encuestas 23

Idealmen
muestral. En nidades muestrales son excluyentes entre s y exhaustivas sobre
la poblacin. atisface cabalmente esta condicin ideal y la aceptacin o no de su
insatisfaccin ndiciones en que se suscite.

En v s partes de la poblacin quedan incluidas en
alguna unida ecursos mediante parcelas de muestreo de forma
circular. Si l sentan una caracterstica distintiva del resto de la
oblacin, tal de ser considerada intrascendente y, partiendo de un marco de muestreo
ue no cubre cin, las inferencias todava se pueden aceptar como aplicables a la
oblacin. Sin embargo, en otras aplicaciones el hecho de no dar la oportunidad de que algunas partes de
la poblacin sean in plo, si esas partes
que son excluidas ti n alguna unidad de
muestreo, y por lo tanto en el marco, entonces las estimaciones sern sesgadas, o bien solamente sern
aplicables a la poblacin definida por el propio marco de muestreo. Si en las ciencias sociales se aplica
una encuesta por telfono a una cierta poblacin, debe quedar claro que los resultados solamente son
aplicables a la poblacin constituida por las personas en hogares que tienen telfono y no a las otras
personas a quienes la encuesta telefnica no puede aplicarse, ya que el tener o no tener telfono puede
representar una diferencia importante entre unos y otros.

Entenderemos que el marco de muestreo contiene una identificacin nica para cada unidad de
muestreo, como puede ser un nmero progresivo desde 1 hasta N, el nmero total de unidades en la
poblacin.




PASOS A SEGUIR PARA EL DISEO DE UNA ENCUESTA

Planteamiento de Objetivos
Al empezar a disear un plan de muestreo es importante que definas los objetivos, ya
que esto te permitir mantenerte en una lnea de investigacin sin perder tiempo con
detalles que te alejaran de los resultados esperados.

Poblacin Bajo Muestreo
Es importante que definas desde el principio las unidades que sern tomadas en cuenta
para el muestreo y establezcas reglas claras para que el encuestador las identifique al
momento de tomarlas para la medicin. Recuerda que la poblacin que se muestrea
debe coincidir con la poblacin sobre la cual se desea informacin.

Caractersticas de la Encuesta
Es conveniente cerciorarse que todos los datos son pertinentes a la encuesta y que no se
omiten datos esenciales. Particularmente en presencia de poblaciones humanas, existe la
tendencia a hacer un nmero excesivo de preguntas que no se analizan posteriormente,
debes tomar en cuenta que un cuestionario demasiado largo produce una baja general de
la calidad de las respuestas, tanto en las preguntas importantes como en las otras.

Grado de Precisin Deseado
Los resultados de una encuesta de muestreo siempre estn sujetos a un nivel de
incertidumbre porque slo se mide una parte de la poblacin. Esta falta de certeza se
puede reducir al tomar muestras ms grandes, es decir un mayor nmero de unidades
muestrales y emplear mejores dispositivos de medicin; sin embargo, esto suele costar
tiempo y dinero. En consecuencia, la especificacin del grado de precisin deseado es
un paso decisivo en la preparacin de la encuesta. Este paso es responsabilidad de la
persona que va a utilizar los datos ya que es quien suele entender la magnitud del error
tolerable de una encuesta para hacerla compatible con una buena decisin. Es el
profesional de la estadstica quien debe ayudar en esta etapa para lograr el propsito del
estudio.

te cada elemento de la poblacin debe estar incluido en una y slo en una unidad
ue las u este caso se dice q
No siempre se s
depende de las co
arias aplicaciones de muestreo no todas la
d muestral, como en evaluacin de r
as partes que quedan excluidas no pre
insuficiencia pue
a toda la pobla
p
q
p
cluidas en la muestra puede tener enorme trascendencia. Por ejem
enen algo que las hace distintas a las partes que si son incluidas e
23
Diseo de Encuestas 24
Mtodos de Medicin
Puede existir la posibilidad de escoger el mtodo de medicin y el mtodo de inspeccin
de la poblacin. Los datos acerca del estado de salud de una persona se puede obtener
de sus declaraciones, o de un examen mdico. La encuesta puede emplear un
cuestionario auto administrado, o un proceso de entrevista en la que los entrevistadores
simplemente leen un cuestionario prescrito, o bien, un proceso en el que se permite
mucha libertad en la forma y el orden de las preguntas. La inspeccin puede ser por
correo, por visitas personales, por telfono o por combinacin de los tres medios.
portante del trabajo preliminar es la construccin de las formas de registro
rn las preguntas y las respuestas. En cuestionarios sencillos a veces es
ger lo que ser la unidad
Existe actualmente, una gran variedad de planes para seleccionar una muestra. Por cada
plan considerado, se pueden hacer estimaciones del tamao de la muestra partiendo de
un conocimiento del nivel de precisin deseado. Los costos relativos y el tiempo
empleado para cada plan se comparan antes de tomar una decisin.

ajo. Un
mucho
valor. Se deben hacer planes para manejar las no-respuestas, es decir, la falla del
encuestador para obtener la informacin de ciertas unidades muestrales.

Resumen y Anlisis de los Datos
Despus de realizar la encuesta se deben editar los cuestionarios obtenidos, con la
ando menos desechar los datos que obviamente estn
isiones respecto al procedimiento de
ienes responden o de eliminacin de
de probabilidad es que se pueden hacer tales enunciados (de error esperado).


Una parte im
donde entra
posible precodificar las respuestas es decir, colocarlas de tal modo que se puedan
transferir rutinariamente a un equipo electrnico. De hecho para la construccin de
buenas formas de registro se necesita prever la estructura de las tablas de resmenes
finales que se utilizarn para obtener las conclusiones.

El Marco de Muestreo
Antes de seleccionar la muestra, debes dividir la poblacin en unidades de muestreo.
Estas deben cubrir la totalidad de la poblacin y no traslaparse en el sentido que todo
elemento de la poblacin pertenezca a una y solamente a una unidad. Algunas veces, la
unidad apropiada es obvia, en otras ocasiones, es posible esco
de muestreo. En el muestreo de los residentes de una ciudad, la unidad puede ser una
persona, los miembros de una familia o las personas que viven en una manzana. En el
muestreo de una cosecha agrcola la unidad puede ser un lote, una granja o un rea de
terreno cuya forma y dimensiones quedan a nuestra discrecin.

Seleccin de la Muestra

Encuesta Piloto
Es de gran utilidad probar el cuestionario y los mtodos de campo en pequea escala.
Esto casi siempre da por resultado mejoras al cuestionario y puede evitar otros
problemas que seran serios a mayor escala, por ejemplo, que el costo fuera mucho
mayor que el esperado.

rganizacin del Trabajo de Campo O
En encuestas extensas se encuentran muchos problemas de orden administrativo. El
personal debe recibir un entrenamiento sobre el propsito de la encuesta y los mtodos
de medicin que se emplearn, adems de supervisar adecuadamente su trab
procedimiento de verificacin anticipado sobre la calidad de las respuestas es de
esperanza de corregir errores o cu
equivocados. Habr necesidad de tomar ciertas dec
clculo en los casos de omisin de respuestas de qu
datos en el proceso de edicin. Despus se realizarn los clculos que conduzcan a las
estimaciones. Puede haber diferentes mtodos de estimacin para los mismos datos.
Una prctica aconsejable en la presentacin de los datos es informar la magnitud
esperada de error en las estimaciones ms importantes. Una de las ventajas del muestreo
Informacin Conseguida para Encuestas Futuras
Cuanta ms informacin de una poblacin se tenga inicialmente, ms fcilmente ser el
diseo de una encuesta que proporcione estimaciones adecuadas. Toda muestra obtenida
es una gua potencial de futuros muestreos, por los datos que revela sobre las medias,
24
Diseo de Encuestas 25
las desviaciones estndar y la naturaleza de la variabilidad de las medidas principales,
as como sobre los costos de obtencin de datos. Las prcticas de muestreo avanzarn
ms rpidamente si se prev lo necesario para reunir y registrar ese tipo de informacin.
Hay otro aspecto importante en el que una muestra completa facilita la obtencin de



otras posteriores. Un encuestador hbil aprende a reconocer los errores de ejecucin y a
evitar que se repitan.

APTULO 3
C

MUESTREO ALEATORIO SIMPLE
25




INTRODUCCIN

Al realizar una evaluacin por muestreo el inters es determinar, de la mejor manera, caractersticas de
los elementos que constituyen a una poblacin. Esto se logra analizando la informacin contenida en una muestra
extrada de la poblacin. La cantidad de informacin que la muestra aporta depende de su tamao, y de la
variabilidad existente entre los elementos de la poblacin, en cuanto a la caracterstica de inters. El evaluador
decide la forma de seleccionar la muestra y su tamao, con esto podr controlar la calidad de la informacin
proveniente de la muestra y la precisin requerida.
es Aunque en el caso ms frecuente de la aplicacin de un mu
caracte
treo se evalan varias
rsticas o variables en cada sujeto o unidad muestral, en el presente trabajo para efectos
pedaggicos, solamente seguiremos la evaluacin de una variable.
Teniendo la informacin que el anlisis de la evaluacin de la muestra nos produce, podemos hacer
inferencias sobre la poblacin. La validez de tales inferencias depende fundamentalmente del diseo de muestreo,
es decir, de la forma en que se obtuvo la muestra. Para que los principios de la probabilidad sean aplicables al
hacer la inferencia, es necesario que la seleccin de la muestra se haga mediante un diseo de muestreo
probabilstico. El trmino diseo tambin se usa como sinnimo de procedimiento o tcnica.



Definicin
Muestreo Aleatorio Simple (MAS)
Se denomina muestreo aleatorio simple, o completamente al azar, al diseo que
habiendo decidido q nte ue el tamao de la muestra ser de n unidades de muestreo (o simpleme
de tamao n), le asigna la misma probabilidad de ser la elegida a cada una de todas las
muestras posibles de ese tamao. Es decir cualquiera de las muestras distintas que podemos
obtener de la poblacin tendr la misma probabilidad de ser elegida.

Este d




SELECCIN DE LA MUESTR
Por
n sin reemplazo.

iseo es el ms sencillo que veremos en este texto, pero es el que nos dar las
bases para desarrollar diseos ms complicados, que estudiaremos ms adelante.

A
qu usamos muestreo aleatorio simple?
Si sabemos que cada posible muestra tiene la misma probabilidad de ser elegida, nos
preguntamos cuntas muestras posibles existen?. Para responder esta pregunta tendramos
que analizar dos posibilidades, la seleccin con reemplazo y la selecci
Definicin

1. Muestreo Aleatorio Simple con Reemplazo
En el muestreo con reemplazo si el tamao de la mestra es n y el cin es N, existen
n
N

u de la pobla
muestras diferentes; y el procedimiento de seleccin consiste en seleccionar una unidad que tiene la posibilidad
26

de ser incluida nuevamente en la muestra. Esta opcin genera frmulas de estimacin ms fciles, pero en la
prctica tiene poco sentido medir ms de una ocasin la misma unidad muestral, salvo en diseos especficos u
otros m p ricas n los supuestos en que se sustenta s elaborados en los que las comlicaciones te sugiere simplificar
su anlisis.

2. Muestreo Aleatorio Simple sin Reemplazo
En el muestreo sin reemplazo se pueden construir tantas muestras diferentes como combinaciones se
pueden hacer de N elementos de tamao n (
n N
C ), cantidad que se calcula por,
)! ( ! n N n
! N
C
n N
=
El procedimiento de integracin de la muestra difiere en que una vez seleccionada una unidad ya no es
considerada como elegible al continuar separando las unidades que se incluirn en la muestra. Esta opcin genera
frmulas un tanto ms elaboradas que el muestreo con reemplazo, pero tiene ms sentido en la prctica.

Qu tipo de muestreo simple aleatorio debo utilizar?
Conviene reiterar que la definicin de muestreo simple aleatorio prescribe igual oportunidad a cada
le, lo que hara suponer que todas las muestras posibles deberan configurarse antes de hacer la
to sera una tarea imposible de realizar en poblaciones grandes. Para tenerlo evidente
simplem
idad muestral tenga la misma
muestra posib
seleccin de una de ellas, es
ente calcula el nmero posible de muestras para una poblacin con 100 unidades muestrales y una
muestra de tamao 15, encontrars que
17
10 53338 . 2 muestras son posibles. Afortunadamente la
nte dejando que cada un prescripcin de la definicin se satisface simpleme
oportunidad de ser incluida en la muestra, esa probabilidad es N n , as pues, solamente necesitamos una
muestra.
Cuando el tamao de la poblacin (N) es muy grande con respecto al tamao de la muestra (n) y el
uestreo se lleva a cabo con reemplazo la probabilidad de que una unidad muestral sea elegida dos veces es muy
equea. De hecho la probabilidad de eleccin de cualquier unidad una sola vez tambin es muy pequea;
indique al c
niente aclarar el
IA SIMPLE
Cmo seleccionamos la muestra?
Para hacer la seleccin de las unidades muestrales que constituirn la muestra se parte del marco
uestral (definido en el captulo anterior). A cada unidad se le asigna una etiqueta que la identifique, por ejemplo
secutivos y la seleccin se puede llevar a cabo usando una tabla de nmeros aleatorios, la mayora de
textos so en tablas de nmeros aleatorios regularmente de 10,000 dgitos. Entrando sin ningn
orden a la tabl os nmeros ale orios ubicados consecutivamente, tantos como sean necesarios para
represen ero total de unidades m or ejemplo, si la poblacin tiene entre 10 y 100 unidades
ecesitaremos dos dgitos para representarlas (desde el 00 hasta el 99), si son entre 100 y 1,000 unidades
necesitarem
nmero to eno
con esa e
cualquier d
es decir n. amientos para elegir el punto de partida en la tabla de nmeros
aleatorio
cuerpo d
s
il hacerlo que explicarlo.
m
p
entonces, el muestreo aleatorio simple con reemplazo se aproxima al aleatorio simple sin reemplazo.
En lo sucesivo consideraremos el muestreo aleatorio simple sin reemplazo, a menos que se
una otra situacin expl itamente. Tambin es pertinente mencionar que este diseo
de muestreo recibe diferentes nombres, como muestreo simple al azar, muestreo
completamente aleatorio o muestreo irrestricto al azar. Por ello es conve
g
concepto cuando se usa una u otra denominacin.

OBTENCIN DE UNA MUESTRA ALEATOR

m
nmeros con
bre muestreo tien
a se eligen l at
tar el nm uestrales. P
n
ti
os tres dgitos (desde el 000 hasta el 999), y as sucesivamente. Si el nmero elegido es mayor que el
tal de unidades en el marco, no se toma en cuenta, si es igual o m r que ese total entonces la unidad
queta se incluye en la muestra. El proceso sigue anlogamente con el siguiente nmero ubicado en
ireccin en la tabla, hasta completar el nmero de unidades elegidas que deben constituir la muestra,
Tambin se proponen algunos refin
s; algunas tablas tienen encabezados numricos que identifican a las columnas y a los renglones en el
e la tabla, eligiendo azarosamente un punto en la tabla y los nmeros alrededor se usan para identificar
los encabezados de rengln y columna, coordenadas del punto definitivo en que se iniciar la seleccin de lo
nmeros aleatorios; afortunadamente es ms fc
27

En la actualidad muchas de las calculadoras manuales incluyen un generador de nmeros aleatorios, al
igual qu las hojas de clculo que operan en computadoras personales; stos son nmeros entre 0 y 1 con un
depende de la configuracin del dispositivo, de ese nmero se toma la cantidad de dgitos
convenie
An ncia de usar escalas de medicin
apropia a.
usada en toda la evaluacin.
Debes tener especial atencin cuando digos p r eva e caractersticas
cualitativas, como atributos. Al registrar colore mplo, podra asignars me color, el 2 a
otro, y as sucesivame . Por supu ue s nmeros no es cor hac ca, es decir, no
tendra ningn sentido sumar o multiplicarlos, ya que en realidad son simple gos s y no nmeros
en una escala. Puede da e el caso q que digos alguna m se a una escala, por
ejemplo colores o tonalidades vincu n e onda de la energa ada sos casos debes
tener cuidado de verifi e los c estn espaciados en una escala aritm
Tipos de Escalas Cuantitativa, C ardin Nomin
Algunas dime ones medi una mrica ruente en cierto con eden no serlo en
otro y podramos no da s un tratam num o. P emplo, al r el r el azimut de una
orientacin cardinal, umas o lo edi no ten ingn sen si un medida en
azimut tiene 0 y otra e 360, el edio sera 1 uando e idad rientaciones son
coincidentes ya que en azimut 0 y on e s y 180 la orientacin totalm uesta. Este es el
caso de dimensiones q e miden e las c
Cuando se us ste tipo de as, s er muy claro los an e se llevar a cabo, ya
que como se mencion todos los ador interpretarse acorde lema

Dnde Proces is Dat
omo ya h , o m por lo que los clculos
se pueden realizar todava ms fcilmente con la ayuda de una hoja de clculo o con un
uete de cmputo especializado para el anlisis estadstico como SAS (Statistical
Analysis System), SPSS (Statistical Package for the Social Sciences), Minitab, etc.


Estimacin de la Media y del Total de la Poblacin
riables cuantitativas, los parmetros que con mayor frecuencia interesa estimar son la
e
nmero de dgitos que
nte y se procede a hacer la seleccin como se explic para el caso de las tablas.

En Qu Medimos... Centmetros, Kilogramos, Metros
2
...?
tes de continuar es importante recordar la convenie
das a y za dim la magnitud naturale de la ensin que se eval Esa escala debe ser
se usan c ara el regist o de la luacin d
s, por eje e el n ro 1 a un
nte esto q obre esos recto er aritmti
s cdi
anera
o etiqueta
socien con rs ue aun solo sean c , de
lados co longitud d reflej , aun en e
car qu digos tica.
clica, C al, al
nsi das en escala nu cong texto, pu
rle iento rico correct or ej medi umbo o
las s s prom os pueden er n tido; a orientacin
tien prom de ambas 80, c n real ambas o
360 s quivalente es ente op
ue s n esca clicas.
an e escal e debe ten lisis qu pueden
, no estim es pueden al prob .
o m os?
C abamos mencionado ste es el dise s sencillo,
paq

Al evaluar va
media ( )
Y
o el total ( )
Y
de la variable Y para toda la poblacin. Estos parmetros tienen las siguientes
definiciones,

N
y
N
i
i
poblacin la de Media
Y
=
= = = (1)
= = = =

1
N y poblacin la de Total
N
i
i Y
=
(2)
omite el subn ont claro a qu variable se refiere.
Naturalmente al no tener acceso a t d trales, de donde proviene cada y
i
, se hace
necesario definir estimadores sobre los datos que s proporcionan las mediciones que se hacen en las unidades
de muestreo incluidas en la muestra. Los estimadores de y se ntinuacin.

1

dice En ocasiones se Y, ya que el c
odas las N unida
exto deja
e s s mue
no
dan a co
28

Estimador de la Media Poblacional
n
y
y
n
i
i
=

= =
1
(3)



Estimador del Total Poblacional
y N =

(4)


Estas expresiones se denominan estim res y una vez que se ejecutan usando los datos de
una muestra especfica, los valores que se obtienen se denominan estimadas. Los estimadores
tienen propiedades estadsticas, en camb estimadas son realizaciones de los estimadores,
los estimadores son variables aleatorias que tienen propiedades estadsticas derivadas de la
probabilidad.
Es favorable que los estimadores tenga nas propiedades estadsticas deseable. En esta ocasin
revisarem d dia y del total de la poblacin a saber,
insesgam cin.

Cules son esas caractersticas que hacen atractivo a un estimador?

ado
io las
n algu
os dos propiedades deseables en los estimadores
iento y consistencia, las cuales revisamos a continua
e la me

Definicin
Insesgamiento
Un estimador insesgado es aquel que en un nmero muy grande de estimaciones,
tiene un promedio que difiere muy poco del valor del parmetro.
Algebraicamente se representa como sigue,
( ) 0 =

= E sesgo



Es un estimador insesgado de . Esto implica que el promedio de las medias de todas las muestras
posibles es igual a la media de la poblacin. Otra manera ms formal, de expresar lo anterior es que la
esperanza matemtica de y es . Existen tantas es o muestras posibles haya, sin
embargo no sabremos cul de todas es la que hemos obtenido, por eso es que en torno a ella se desarrollan los
principio i r
y

timadas com
s de la probablidadpaa inferir sobre la media de la poblacin que desconocemos.
La verificacin de esta propiedad puede verificarse en el apndice (A).

Tambin es un estimador insesgado del total de la poblacin.


La verificacin de esta propiedad puede verificarse en el apndice (B).
Definicin


Consistencia


N n Cuando
29


media de la poblacin , y

es un ador consistente del


total poblacional . Esta propiedad implica que cuando el tamao de la mu gual al tamao de
la poblacin, es decir, n =N, el estimador es igual al parmetro. La stracin resulta casi
evidente por las definiciones de
Es un estimador consistente de la estim
estra es i
demo
y , y .
La consistencia y el insesgamiento, aunque parecen propiedades casi naturales, son importantes y
,

y

pueden no estar presentes en otros estimadores de la media y del total poblacional. Por esta razn, es que y y

res de y de ms utilizados.


taturas
s habitantes de una regin en
o aleatoriamente por el nmero
de paciente, o


son los estimado
Ejemplo. Es
El sector salud est interesado en saber la estatura promedio de lo
particular. De los datos de los registros de la clnica de salud de la regin, eligiend
obtuvims los siguientes 35 registros de la poblacin de 700 personas.
Cuadro1. Estaturas de los residentes de cierta comunidad
Observacin Estatura
(m)
Gnero Observacin Estatura
(m)
Gnero
1 1.65 Hombre 19 1.85 Hombre
2 1. 0 Hombre 20 1.65 Hombre
3 1.84 Hombre 21 1.78 Hombre
4 1.83 Hombre 22 1.75 Hombre
5 1.73 Hombre 23 1.75 Hombre
6 1.83 Hombre 24 1.88 Hombre
8
7 1.80 Hombre 25 1.53 Mujer
78 Hombre 28 1.70 Mujer
11 1.85 Hombre 29 1.58 Mujer
12 1.80 Hombre 30 1.75 Mujer
13 1.75 Hombre 31 1.70 Mujer
14 1.68 Hombre 32 1.73 Mujer
15 1.78 Hombre 33 1.73 Mujer
16 1.80 Hombre 34 1.57 Mujer
y
i
=61.13
8 1.85 Hombre 26 1.65 Mujer
9 1.80 Hombre 27 1.70 Mujer
10 1.
17 1.73 Hombre 35 1.70 Mujer
18 1.83 Hombre

Apl d ican o la ecuacin (3),
m y 75 . 1
35
13 . 61
= =
Lo que quiere decir que la estatura promedio de la poblacin localidad se estima que es 1.75m.


s
En el ejido de San Miguel s desea onocer d de hectreas que estn cultivadas con frijol pues
ente es suficiente para cubrir un contrato
con una empresa procesadora de frijoles en lata. Sabemos que en el ejido existen 205 ejidatarios que cultivan
frijol los ente la ocupan en su totalidad
de esa


Ejemplo. Ejidatario
e c la cantida
el lder de los ejidatarios quiere saber si la capacidad que tienen actualm
cuales tienen la misma cantidad de tierra cultivable, pero no necesariam
30

para sem

brar frijol, de estos ejidatarios tomamos una muestra de 20 y les preguntamos la cantidad de hectreas
que tienen sembradas con frijol, las respuestas se listan a continuacin.


Cuadro 2. Nmero de Has
por ejidatario
No. Ejidatario No. Ha
1 8.94
2 11.02
3 11.53
4 10.9
5 7.71
6 10.22
7 10.14
8 11.28
9 9.5
10 11.03
11 7.98
12 10.43
13 12.08
14 11.06
15 8.26
.19
16 8.44
17 7.87
18 13
19 11.85
20 10.53
203.96
Aplicando la ecuacin (4), obtenemos lo siguiente,
Has y N 59 . 090 , 2 ) 198 . 10 ( 205 = = =


Lo que significa que estimamos que 2,090 Has estn cultivas con frijol en el ejido de San Miguel.
Dado que

son variables aleatorias, es de inters conocer los estimadores de sus varianzas ya que
es fundamental que en nuestras estimaciones incluyamos la varianza que estas poseen, a continuacin mostramos
las varianzas de

bolizada por .
Con su in por s m

y explicamos detalladamente su importancia.



Estimacin de la Varianza de la Poblacin
Podemos mencionar que otro parmetro importante de la poblacin es la varianza sim
2

auxilio podrs hacer inferencias probabilsticas sobre la estimacin de la media; tamb isma
puede tener gran importancia pues refleja la variabilidad que existe entre los valores que puede tomar la variable
que se est analizando Este parmetro se define por la siguiente expresin,
( )
N
y
N
i
i
Y

=

= =
1
2
2 2

(5)
31

Al igual qu y tambin tiene su estimador el cual se obtiene con la muestra. Este estimador se
denotac
e


,
2

como sigue,
2
S on
( )
1
1
2
2 2

= =

=
n
y y
S S
n
i
i
Y
)
o y mencion, e o es se omite el subndice Y, que indica la variable sobre la que se
ado parmetro.
s
datos del ejemplo de las estaturas, y aplicando la frmula (6) obtenemos la varianza de los
(6
Com a se n ocasi n
efine el estim r o el d
Ejemplo. Estatura
Tomando los
datos,
( )
( ) ( )
2
2 2
35
2
74 . 1 y
i

1 2
0072 . 0
34
74 . 1 70 . 1 74 . 1 65 . 1
34
m S
i
Y
=
+ +
= =
=
L

Por el teorema central del lmite, la distribucin del estimador y es normal con los siguientes
parmetros.

stimador de la Varianza de la Media E

N
n N
y

=
2
2


n
y
y
=
(7)
Al no conocer los parme expresiones, recurrimos a utilizar sus
estimadores.
tros incluidos en estas
[ ] f
S
N n
S
y

=
2
(8)
n
donde
n N
S
y
y
y
y
=

= =

1
2
2

N
n
f =
La demostracin de este resultado se da en el apndice (C) del presente captulo.
Al factor ( ) N n N se le denomina correccin por poblacin finita, que tambin se puede expresar
omo c ( ) [ ] N n 1 , donde el cociente ( ) N n se denomina fraccin de muestreo ( ) f . La importancia del factor
de correccin se reduce a medida que la fraccin de muestreo se hace ms peque s decir, cuando la muestra
representa una proporcin menor de la poblacin. Por la reducc de esta magnitud, en ocasiones suele omitirse
si la fracci menor que 5%, esto es, si
a, e
in
( ) 05 . 0 < N n n de muestreo es .
os estimadores y recurriendo a las propiedades de la distribucin normal, podemos
establecer un intervalo alrededor de
Teniendo est
y que cubra cier de valores dada, teniendo
que el estimador
ta probabilidad de ocurrencia
y como base el hecho de se distribuye normalmente con los parmetros sealados, de los que
estar incluida en dicho intervalo.

Ejemplo. Estaturas
ahora tenemos estimadores. As, conociendo el intervalo fijado para la probabilidad indicada, podremos aseverar
con se nivel de probabilidad (confianza) que la media de la poblacin e
32

Aplicando la ecuacin (8) y tomando los datos del ejemplo de las estaturas, obtenemos la
varianza de la media muestral,
( )
00020 . 0
700 35
=

Para el total tambin son aplicables los argumentos expuestos. El estimador

35 700 0072 . 0
2


=
2


=
N
n N
n
S
S
y
y


del total se distribuye
normalmente con los siguientes parmetros.

Estimador de la Varianza del Total

= =
n N
N
N
y
2
2 2

N n

Nuevamente, al no conocer los parmetros incluidos en estas expresiones recurrimos a utilizar


sus estimadores.

(9)


=
= =


N
n N
n
S
N S
y N N
y
2
2 2


(10)
Este resultado se presenta en el apndice del captulo (D).

Claro est que estas expresiones pueden simplificarse algebraicamente.
A la desviacin estndar de los estimadores, o sea la raz cuadrada positiva de sus varianzas, por
convencionalismo se le conoce como error estndar, de la media y del total respectivamente.
El estimador expuesto anteriormente es insesgado y su demostracin se presenta en el apndice (E) del
presente captulo.

Tomando nuevamente el ejemplo de los ejidatarios que siembran frijol y aplicando la
ecuacin (10), obtenemos la siguiente estimacin,
Ejemplo.
Ejidatarios
33

( )
34
35 . 4629 =

Estimacin del Intervalo de Confianza de la Media y del Total de l
Poblacin
Debemos tener presente que lo que nos interesa estimar es la media o el total de la poblacin, es
, basndonos en la informacin que nos provee la muestra, esto es
9024 . 0
20
205
2
=
4413 . 2

n
a
decir
2
2 2

=
N
S
N S
y

N n

y ,
2
y
S ,

y
2

emos
e han
os en
ar, ya
os de
libertad; con esas dos piezas de informacin entramos a la tabla de
S que ya h
calculado.
Un intervalo de confianza se establece utilizando las propiedades de la distribucin de t que s
revisado anteriormente. El valor de t que debemos usar depende del nivel de confiabilidad que deseam
nuestra estimacin (o correspondientemente de la probabilidad de error () que estamos dispuestos a acept
que 1 menos la probabilidad de error es la confiabilidad), y del tamao de la muestra que nos indica los grad
( ) 2 , 1 n
t y leemos el valor correspondiente, o
e clculo.
=0.05, que
muestrales.
Existen argumentos ms elaborados que la mera lectura en la tabla de t, en los que no abundaremos, pero
frecuentemente se emp da de 95%, por eso algunos
autores no incluyen una tabla de t en sus textos, adems de que tanto las hojas de clculo, los paquetes de
cmputo uestro
por el
empleamos la funcin incluida en algunos programas de cmputo, en hojas d
Convencionalmente se ha adoptado como aceptable el nivel de confiabilidad de 95%,
conduce a un valor aproximado de t menor que 2 para tamaos de muestra mayores a 60 unidades
lea el valor de t =2 para tener una probabilidad aproxima
ya
para anlisis estadstico y aun algunas calculadoras manuales proporcionan los valores de t, en n
caso utilizaremos la expresin con el valor de t.
Un lmite en error en la estimacin de un parmetro bajo cierto nivel de probabilidad, se establece
producto del valor de t por la desviacin estndar del estimador (llamado error estndar).
Para el caso de la media de la poblacin, al sumar y restar este lmite
( )
( )
n
S t
2 , 1
estimacin puntual de la media (
y
a la
y ), se origina un intervalo que se presume incluir a la media de la pobla
con el nivel de probabilidad estipulado al obtener el valor de t.


cin






Intervalo de

Confianza para la estimacin de la media de la poblacin
( ) y n
S t y
2 , 1
(11)


donde
N n
y


n N
S
S

2
y
=

Ejemplo. Estaturas

35
lo de Utilizando la media y la varianza estimada del ejemplo de las estaturas y la ecuacin (11), el interva
confianza para un 95% de confiabilidad es como sigue,
( )
( ) 78 . 1 , 71 . 1
00020 . 0 3451 . 2 75 . 1

Lo que significa que se estima con un 95% de confiabilidad que la estatura promedio de los habitantes

e
de la localidad se encuentra entre 1.72 y 1.78m.

la poblacin, el intervalo se establec Anlogamente, para la estimacin del total de
como sigue,

Intervalo de Confianza pa la estimacin del total de la poblacin

ra

( )

2 , 1
S t y N
n

= (12)

donde


=
N
n N
n
S
N
N
n N
n
S
N S
y y
2 2
2



El intervalo de confianza es la referencia de mayor importancia al tener los resul
de un muestreo. El tamao del intervalo nos indica la precisin que se ha logrado
stimacin del parmetro de inters.
tados
en la
tervalo pequeo, pero su amplitud depende
r del estimador. Si deseamos ms confiabilidad el
la de
As el
p nza de
e
Por supuesto que siempre es deseable un in
del nivel de confiabilidad y del error estnda
intervalo tendra que ampliarse como resultado de una t ms grande (obsrvese en una tab
t). As que la mayor confiabilidad se paga con menor precisin.
Por su parte, el error estndar depende de la variabilidad en la poblacin y del tamao de la muestra.
tamao de la muestra es el factor que odemos manipular para lograr una precisin deseada ya que la varia

y por lo tanto el error estndar es cero cuando el tamao de la muestra es igual al de la poblacin.
N
n N
n
S
y

2

Cuando N=n
0
0
2
=
N n
S
y


Ejemplo. Ejidatarios
Utilizando el total y la varianza estimada del ejemplo de las tierras sembradas con frijol y la ecuacin (12), el
intervalo de confianza para un 95% de confiabilidad es como sigue,

( )
( ) 256 , 2 925 , 1

629 , 4 4334 . 2 090 , 2
q treas sembradas de frijol
n el
PRECISIN RELATIVA
Lo ue significa que se estima con un 95% de confiabilidad que el total de las hec
ejido de San Miguel se encuentra entre 1,925Has y 2,256Has. e


La amplitud del intervalo de estimacin puede verse abultada por la escala de medicin que se
evaluar la variable. Por otro lado, a veces es de inters comparar la variabilidad de dos variables que s
diferente naturaleza. Para atender adecuadamente las dos situaciones expuestas se puede recurrir a
ntervalo respecto a la dimensin del estimador, lo cu
use al
on de
una
al se puede lograr dividiendo el valor estandarizacin del i
del lmite de error de estimacin entre el estimador mismo.
Para el caso de la media, un lmite de error estandarizado respecto a esta es
( )
( ) y S t
y n 2 , 1
, y para el
total
( )

S t
n 2 , 1
(donde t como vimos anteriormente es el valor de la distribucin t de Student c
correspondiente nivel de confianza y grados de libertad n-1). Usando estos valores estandarizados pod
com
on su
ramos
s, o el parar cual es la precisin relativa a la que se ha llegado al estimar la media de dos variables diferente
total si fuera el caso.
36



CLCULO DEL TAMAO DE LA MUESTRA

Una pregunta cotidiana que te hars al iniciar un muestreo es,

Cuntas unidades muestrales debemos medir para que mis estimaciones sean adecuadas?

Esta cuestin ya fue introducida en una seccin anterior sealando que su discusin se
presentara mas adelante; este es el momento de hace esa discusin.
Com
rep la
representatividad pro ida en la
muestra po
por
rep
mu
ro la precisin de los
stimadores que producen, en tanto el tamao de la muestra sea mayor, mayor ser la
re
n anterior, ahora podemos frasear la pregunta en trminos ms
ceptables en el contexto del muestreo,
Qu pr

ino p
Con qu confiabilidad se desea establecer esa precisin?

Es decir, estamos preguntando de qu tamao mximo se desea el producto
r
nmente la pregunta referida se hace en trminos de lograr la
resentatividad de la muestra respecto a la poblacin. En muestreo
viene de seleccionar cada unidad muestral que ser inclu
r un mecanismo probabilstico, en este caso por la aleatoriedad. Esto es as
que con esa base se desarrollan los estimadores y podemos decir que tan
resentativa es una muestra de pocas unidades muestrales como otra que incluya
chas, siempre que ambas muestras hayan sido seleccionadas por el mismo
cedimiento aleatorio. La diferencia entre una y otra estriba en p
e
p cisi n de los estimadores.
Despus de la argumentaci
a

ecisin se desea en la estimacin de la media total poblacional?
pero no estar suficientemente expuesta la pregunta s reguntndonos tambin,


( )
y n
S t
, 1
.
Este
roduco de t y de n implcito en
y
S
p t depende del nivel de confiabilidad implcito en el valor la que a su
m
vez depende de N y
2

; de estos tres, los dos ltimos estn fuera de nuestro control, el tamao de la
poblacin es un nmero dado que no podemos modificar y la varianza de la poblacin es desconocida,
sola ente la podemos estimar por
y
S
, pero tampoco la controlamos pues es una caracterstica intrnseca

( )
y n
S t
, 1
al fenmeno de la p odu oblacin que estamos midiendo. As, finalmente, del pr cto solamente
podemos manipular el nivel de co i y el ta , y si el nivel de confiabilidad es
ado por una convencin, digamos 95%, solamente nos queda la n como medio para responder la
pregunta
para determinar la n que responda la peticin que se
establez
a menos a
Qu significa circularidad?
n, pero adems tambin necesitamos informacin sobre la
variabilidad que existe entre los valores de la caracterstica de inters en las unidades
de muestreo, naturalmente esta informacin no la conocemos hasta despus de hacer
algunas mediciones.
nfiab lidad mao de la muestra
d
.

Pero tenemos un problema circular, pues
ca necesitamos informacin acerca de la variabilidad de
2
y

, la que no puede ser estimada con


que dispongamos de informcin.
2
y
S


La decisin de qu tamao de muestra emplear en cada caso es un problema
circular, esto es, para decidirlo claramente es necesario tener informacin sobre el
tamao de la poblaci
37

La medicin puede llegar a ser un problema ya que muchas veces el objeto de estudio
es de difcil acceso, enseguida se analizan brevemente algunas circunstancias que es prudente tener en
uenta al considerar el c problema de la medicin.
es, antes de hacer la medicin es preciso
icultad si el rea de inters es grande o
inaccesi
e ean muy especializados, ms aun
brar para que operen correctamente. Cuando su
comportamiento es consistene, como un metro que solo mide 90 cm, el problema
ocasionado se puede corregir una vez detectado; pero si el comportamiento es
impredecible o no se identifica una falla consistente, se producirn mediciones
equivocadas contra las que el muestreo no ofrece una defensa.
Para romper esa circularidad se tienen varias opciones,

1. Contar con una estimacin de , obtenida de un trabajo similar previo.
. Emplear algn estimador de que se pueda generar de manera ms expedita que

discutiremos en torno a la tercera, teniendo presente que es la raz cuadrada de y es su
estimador.

Por las propiedades de la distribucin normal, recordamos que el intervalo comprendido en
Cuando se pretende una evaluacin de recursos natural
llegar a la unidad muestral, esto puede representar cierta dif
ble. Adems, es necesario contar con los instrumentos de medicin adecuados, que a veces son
muy especializados por lo que se puede requerir una capacitacin especfica del personal que har la
medicin.
Aun cuando los instrumntos de m
si lo son, se deben revisar o cali
e dicin no s

t

2
y
S
2
y
S
. 2. Hacer un muestreo preliminar (piloto) para calcular
2
y

2
y
S
. 3
Las dos primeras opciones nos entregan un valor con el cual trabajaremos en lo sucesivo, por ello
2

2
S


incluye aproximadamente 68% de rea bajo la curva y que
2
incluye aproximadamente el 95%.
As, si se puede estimar cuales son el valor menor y el may perados en la medicin y con ellos
se calcula el rango o amplitud, y se acepta la proposicin cluye aproximadamente el
95% de los valores posible en los datos, dividiendo ese ro tendremos una estimacin de ,
la que al elevarla al cuadrado se podra utilizar como en el desarrollo que enseguida se discutir.

Hasta donde puedo equivocarme?
El error de muestreo que se est dispuesto a aceptar debe ser establecido por una instruccin colateral
al proceso de muestreo, es decir, alguien con conocimientos sobre el fenmeno debe establecerla.
Digamos que ese error se desea de tamao B, que debe estar dado en las mismas unidades que la media,
entonces, partiremos de la expresin
or valor es
de que ese rango in
rango entre cuat

2
S

( ) B S t
y n
=
, 1
. Formalmente el siguiente desarrollo debe hacerse
en trminos de y no de , pero al final en virtud de que el parmetro no se puede conocer se
necesita usar el estimador por lo que de una vez se ha empleado al estimador.
2

2
S

=
n
S
t
y
1
2
2

=
N n
t B
2


N n
N n


=
n N
S
t B
y
2

n N
S
y
2
2
38

N
S
t
B
n
S
N
S
n
S
t
B
y y
y y
2
2
2
2
2 2
2
2
+ =

=

La ltima expresin se puede simplificar para llegar a la ecuacin siguiente.

Tamao muestral requerido para estimar con un error de estimacin B

( )
( )
( )
2
2 / , 1
2 2
2 2
=
N B
NS t
n
2 / . 1
1

+
n y M
y n
t S
(13)
N : Nmero de unidades muestrales en la poblacin.
S : Varianza estimada en la poblacin de inters.
aceptar.
tos a aceptar si los supuestos
2
y
M
B :El tamao del error de estimacin de la media que estamos dispuestos a
El valor de n cumplir con el error y precisin que estamos dispues
para calcular
2
S son apropiados. En estricto sentido, para calcular n requer
podemos lograr tambin tomando una muestra previa e ir verificando e
recordars de la seccin anterior a este fenmeno se le llama circularidad.
Ejemplo. Estaturas
Supongamos que deseamos saber cul es el tamao de muestra apro
estimacin de 0.015m (1.5cm) con respecto a la estimacin de la media, para
imos un valor de lo cual
l valor correcto de n, como
piado para tener un error de
el ejemplo de las estaturas,

2
S
( )( ) ( )
( ) ( ) ( )( )
96 . 140 =
Lo que
197 . 0
=
estimacin a la media verdadera
s 141 pacientes.
estra
stimacin de
ara obtener un estimador del total con el error tolerado para l, la expresin para el clculo de este
tamao se presenta a continuacin,
76 . 27
0072 . 0 50 . 5 699 015 . 0
0072 . 0 700 50 . 5
2
+
= n
significa que el nmero de unidades muestrales que deben constituir a la muestra para tener un
error cm 5 . 1 con 0.05 de probabilidad de no incluir en el intervalo de
e
De la misma manera que nos interesa saber cul es el tamao de muestra necesario para tener nu
la media con el error tolerado, es necesario saber cul es el tamao de muestra necesario e
p

Tamao muestral requerido para estimar con un error de esti

macin B
( )
( )
( )
2 2
, 1
2 2
2 3 2
, 1
2
2
1
y n T
y n
S t N B N
S N t
n

+
=
donde
N : Nmero de unidades muestrales en la poblacin.
2
y
S : Varianza estimada en la poblacin de inters.
:
T
B El tamao del error de estimacin del total poblacional que estamos dis
...(14)
puestos a aceptar.



Ejemplo. Ejidatarios
39

Ahora lo que nos interesara saber para el ejemplo de las tierras cultivadas con frijol sera, cul
el tamao apropiado de unidades muestrales incluido en la muestra para tener una confiabilidad del
5% en la estimacin del total poblacional, y un error de estimacin de =70m
es
T
B 9
( )( ) ( )
( )( ) ( )( ( ) )
49 . 77
140 , 607 , 1
886 , 545 , 124
44 . 2 205 8 . 4 70 1 205
2
=
=
+

Lo que sig
3
2
nifica que el nmero de unidades muestrales que deben constituir a la muestra para tener un
error
stimacin de una Proporcin Poblacional
Otra tarea que suele ser de inters al estudiar una poblacin es la determinacin de la proporcin
(P do caso
de quere orcin de personas en una poblacin que son analfabetas, o la proporcin que
poya a ltico o iniciativa gubernamental, o la proporcin de rboles de un bosque que
stn enfermos, etc. Debe notarse que en todos los e sta, es la medicin que se hace en
idad muestral, que puede se s o o; esto e solamente consideramos dos grupos
. En ocasiones son ms de dos grupos a los que pueden pertenecer las unidades muestrales; este
caso no lo consideraremos aqu, pero aun as se podra tener la posibilidad de anlisis si se considera que
una cierta es
determinado por la posesin
por atributos.
ocesamiento de los datos es
unidad de muestreo tiene el
. Para muchos atributos tal
especie vegetal, suponiendo
e esta pertenezca a un gnero
o
vivo o no a un rbol, o condicin en la que se presenta una gradualidad desde vivo hasta muerto. Es decir,
no es posible considerar estados intermedios, por lo que debe establecerse un criterio unvoco que nos
permita calificar al rbol como vivo o como muerto (no vivo) y nada ms.


Estimador de una Proporcin Poblacional P y su Relacin con el
as expuestas anteriormente
son aplicables, aunque ahora la simbologa conviene que se adecue al caso. Para esto, simbolicemos
po a la proporcin de la poblacin que pertenece a uno de los dos grupos definidos por tener o
no r el atributo evaluado en Y est definida por la siguiente expresin,
44 . 2 205 38 . 4
3
= n
70Has con 0.05 de probabilidad de no incluir en el intervalo de estimacin a la media verdadera
es 78 ejidatarios.

E
) de las unidades muestrales que pertenecen a uno de s grupos posibles. Por ejemplo, es el
r conocer la prop
cierto partido po a
e jemplos la respue
r n se debe a qu cada un
posibles
unidad muestral pertenece a uno de los grupos o no, teniendo as solamente una de dos posibl
respuestas excluyentes, o sea s o no.
Ya que para una unidad de muestreo el pertenecer a un grupo estara
o no de cierto atributo, a esta aplicacin tambin se le conoce como muestreo
Lo relativo a marco de muestreo, seleccin de la muestra y el pr
similar a lo expuesto para una variable continua.


Medicin
La medicin en este caso consiste simplemente en determinar si la
atributo que la hara pertenecer a la proporcin que se desea conocer
determinacin puede ser muy sencilla, por ejemplo pertenecer a una cierta
que el evaluador es capaz de diferenciar dicha especie de otras especies, o qu
o al otro, ya que solamente se reconoceran dos gneros, tener un color o no
ocasiones se presentan ciertas dificultades en esa determinacin. Por ejem
tenerlo, etc. Sin embargo, en
plo el caso de calificar com
Estimador de una Media Poblacional
Una manera fcil de introducir esta estimacin es aceptar que se trata de una variable Y que
solamente puede tomar los valores cero o uno. De esta manera las frmul
r
Y
P
tene ,
Y
P


Proporcin de la Poblacin

40

N
A
N
y
P P
N
i
i
Y
= = =

=1
(15)

Donde A es el nmero de unidades muestrales en toda la poblacin que pertenecen al grupo
efinido por la caracterstica de tener al atributo. Es claro que
i
y es igual a A ya que si la unidad de
uestreo tiene la caracterstica aporta un valor de uno y si no la tiene aporta un valor de cero.
d
m



Estimador de la Proporcin de la P

oblacin P
Si otra
la

Proporcin de la muestra
vez estamos considerando el caso de un muestreo, se entiende que no se puede tener acceso a
todas las N unidades de la poblacin, sino solamente a las n que constituyen la muestra. Empleando
informacin dada por la muestra definimos un estimador de la proporcin de la poblacin, simbolizado
por

p y definido por la siguiente expresin.

= p

n
a
i
i
= =
y
n

=

n
1
(16)
Similarmente a la definicin del parmetro, aqu

=
i
y a representa al nmero de unidades
de la muestra que tienen el atributo que se evala.
De una vez definamos el complemento de P, denominado por ( ) P Q = 1 para la poblacin y

q 1 estimador de Q.

Tomando los datos del Cuadro 1, podemos buscar la proporcin de hombres que existen en la
muestra, dando a esta caracterstica el valor de uno y cero de lo contrario, de esta forma aplicamos la
ecua n


p para la muestra, es decir,

q es un

Ejemplo. Estaturas
ci (16) para obtener la proporcin,
686 . 0 =
De es
35

ta forma podemos concluir que el 69% de los seleccionados son hombres y
el 3

Est
mos la varianza de la poblacin
usan l sarrollando un poco del algebra
implicad res de uno o cero.
24
=

p
1% mujeres.
imacin de la Varianza de la Poblacin
Para mantener cierta mecnica en la presentacin, ahora definire
do as mismas expresiones que en el caso de una variable continua, de
a por el hecho de que la variable solamente toma valo
41

( )
N
N
y
N

2

y
N
y
N
i
i
i
i
N

=
=

1
1 2
2

(17)
Haciendo la siguiente sustitucin, tenemos,

i
i
=
= =
1 2 2

Y
PQ
N
N
A
A
N
N
A
A
=

=
1
2
2

(18)
donde,
Representa el nmero de unidades en la poblacin que tienen el atributo que se


n muestreo necesitamos un estimador de este parmetro, que se
efine por la expresin que sigue,

=
=
N
i
i
y A
1

evala.

Naturalmente, por ser el caso de u
d
( )
1 1
1
1
1
2
2
1 2
1
2
2 2
1
1

= =

=

n
q n
n
n
a
a
n
n
a
a
n
y
n
S S
n
n
i
i
n
i
y
1
donde,
Representa el nmero de unidades en la muestra que tienen el atributo que se evala.


Estimacin de la Varianza y el Error Estndar del Estimador de la
Proporcin
Esta estimacin sigue un desarrollo paralelo a lo expuesto para una variable continua. As que
por obviar espacio, se presenta una forma ms breve.

y y
i

=
n
( 9)

y
i
i
p

=
=
n
i
i
y a
1
42

Existen otros desarrollos diferentes al que se sigue y el cual se conoce como aproximacin
usando la distribucin normal, el que implica una correccin que se ha omitido por su reducida
trascendencia prctica. As, tendramos que se distribuye normalmente con los siguientes parmetros.

p
Media y Varianza del Estimador de P


= p
P
(20)

N
n N
n
q p
N
n N
n
S
S
Y
p
1
2
2
(21)

La raz cuadrada positiva de la varianza del estimador se conoce como error estndar del
estimador de la proporcin.
Usando nuevamente el Teorema Central del Lmite, P tiene aproximadamente una distribucin
normal con media y varianza
o la
proporcin,

p p

.
Siguiendo con el ejemplo de las estaturas podemos aplicar la ecuacin (21) para btener
varianza estimada de la
( )( )
0060 . 0
700
35 700
34

p
31 . 0 69 . 0
2
=


= S


Clculo del Intervalo de Estimacin de la Proporcin P de la Poblacin
Recurriendo a los mismos argumentos que en el caso de una variable continua, vayamos
directamente a la expresin del intervalo de confianza de la estimacin.

Intervalo de confianza para la estimacin de la proporcin de la poblacin

( )

p
n
S t p
2

...(22)
donde,
, 1

n N q p
S


N n
p
1

Ejemplo.
staturas E
43

El clculo
n
del intervalo de confianza para el ejemplo de las estaturas, pero ahora estimando la
proporci de hombres en la poblacin lo calculamos aplicando la ecuacin (22) y la varianza
el ejemplo anterior,
obtenida en
( )( )
( ) 85 . 0 , 53 . 0
03 . 2 077 . 0 69 . 0

Lo que significa que la estimacin de la proporcin de hombres en la poblacin se encuentra
entre 53% y 85%, podemos afirmar esto con un 90% de confiabilidad.


Varianza Acotada en la Estimacin de una Proporcin
Como puede observarse en las expresiones de y de , existe el producto PQ , de
esas expresiones se puede apreciar que el tamao de la varianza depende de ese producto para u ao
de poblacin y de muestra constantes. Esto nos indica que las varianzas, de la poblacin y del estim or,
sern mximas cuando P sean iguales a 0.5, ya que entonces el producto mencionado tiene un valor
mximo.
Esta propiedad se puede emplear para suponer una varianza mxima antes de realizar el
igu
puede
2
y

2
p
S

q p
n tam
ad

p
muestreo, empleando 05 . 0 =

p para los clculos requeridos, as se tendrn resultados conservadores en


el sentido de que los resultados finales siempre sern ales o ms precisos que lo esperado.
Respecto al tamao de muestra requerido, se derivar la siguiente expresin.

Tamao muestral requerido para estimar

p con un lmite para el error de


estimacin B

( )
( )
2
2 1, n P
t B n
q p N
n
2
1

= (23)
donde,
El tamao del error de estimacin de la proporcin poblacional que estamos dispuestos a aceptar.

= p q 1
:
P
B

Ejemplo.
Estaturas
44

Supongamos que necesitamos estimar P
res que existen en la poblacin con un erro
para el ejemplo de las estaturas, es decir, la proporcin
de homb r de estimacin B=0.2, y una confiabilidad del 95%.
( )( )( )
( )( )
31 . 0 69 . 0 700
= n
3 . 196
33 . 0
73 . 149
13 . 4 2 . 0 34
2
=
=
Lo na ementos para tener un error de
estimacin de 0.2 en la estimacin de la pr orcin, con una probabilidad de 0.90 de
que la dia verdadera sea incluida en el intervalo de confianza.













APNDICE. Revisin Terica

Para comprobar los resultados expuestos en rrafos anteriores debemos conceptualizar varios
detalles del muestreo simple aleatorio.
En esta seccin abordaremos los conceptos cesarios para derivar los estimadores y sus
propiedades. Cabe destacar que en el muestreo tradi onal la parte aleatoria es la presencia o no de
una unidad en la muestra, lo cual es bsico para est diar la teora del muestreo.

Definicin

que significa que necesitamos seleccio r 197 el
op
me



p
ne
ci
u
Funcin I icadora nd
Sea A un evento cualquiera relacionado con una variable aleatoria Y. Entonces la funcin indicadora I
A
se
define como,

=
. . . 0
1
f o d
A el evento si ocurre
I
A

Ejemplo.
Estaturas
45

Es importante notar que el evento A ocurre rta probabilidad I
A
por lo que la funcin concie
indicadora I
A
tambin puede denotarse como,

A
bilidad con proba 1
=
A
A
ilidad con probab
I
- 1 0

Lo cual equivale a una v.a. Bernoulli

Las oria Bernoulli son muy tiles en la teora estadstica. A
ontinuacin damos algunas de ellas,
1.
propiedades de la variable aleat
c
( )
A A
I E =
( ) ( )
A A A
I V = 1 2.
3. Tambin podemos definir como una v.a. cuya esperanza
B A
I

( ) ( ) = = =
AB B A B A
I I E I E Probabilidad de que ocurra A y B y
( )
B A AB B A
I I V =

En muestreo, tradicionalmente el evento de inters es que la i-sima unidad de la poblacin aparezca
en la

s, lo se refiere a unidades que pueden o no pertenecer a la muestra.
n el presente captulo se asume un muestreo simple aleatorio, es decir,
2.
3. plazo, por lo tanto las probabilidades de,
a) Que una unidad quede en la muestra es n/N.
b) Que la unidad i y la unidad j queden en la muestra es
muestra.
s eventos A y B A
E
1. Cada unidad de la poblacin tiene la misma probabilidad de entrar en la muestra.
Cada muestra tiene la misma probabilidad de ser seleccionada.
El muestreo es sin reem
,
( )
( ) 1
1

N N
n n
.
c) Que la probabilidad de una muestra de tamao n sea seleccionada es
. Insesgamiento de

1

n
N
.
y A
Teorema. Un estimador insesgado de es

=
=
n
i
i
y
n
y
1
1
donde n=tamao de muestra en un muestreo
sin reemplazo.

emostracin D
Por definicin

=
N
I y
hora, sea I
i
el evento de que y
i
est en la muestra parai= 1, 2, , N

, entonces,
=
i
i i
n
y
1


A

46


[ ] ( )
( )
=
=
=
=
=

=
=
=
=
N
i
i
N
i
i
N
i
i i
N
i
i i
y
N
y
N
n
n
I E y
n
I y E
n
y E
1
1
1
1
1
1
1
1

y es insesgado


B. Insesgamiento de
Teorema. Un estimador insesgado de


es y N =

donde N=Es el nmero total de unidades


muestrales en un muestreo sin reemplazo.


Demostracin
Esta se deduce inmediatamente del teorema anterior,

[ ]

=
=
=

N
i
i
y
N
N
y N E E
1




C. Demostraremos la expresin de la varianza de y
y Teorema. Bajo un esquema de muestreo simple aleatorio sin reemplazo, la varianza de est dada por
la siguiente expresin.
( ) ( )
N
n N
n
S
f
n
S
y V

= =
2 2
1

Demostracin
Por definicin
( ) ( )
2

n
j i
j i j i
y y y y
2
1

n
i
n
E
2
2
1
2
2
1

=
=

=
=
j i
n
i
y
n
E
y E y V

47


( ) ( )
( )
( )
( )
( )
( ) ( )
( ) ( )
( )
( )
( )
( )
( ) ( )
( )
2
1
2
1
1 1
1

=

=
N n
N n n N
y
N nN
n N
N
i
i

2
2
2
2
1 1
2
1
1 1 1
1 1

+

=


= =
n N
y
n N
y
N N n
y
N nN nN
N
i
i
i
i
i
1
2
2 2
1 1
1 1 1 1
1


+

=
=
N nN N nN
n n
y y y
i
N N
N N
n
j i
j i
n
j i
i




continua
2

=
n
E
2
1
2
2
1 1
2
2
2
1
2
2
2
2
2
2
2 2
2
1
1 1 1
1
1 1 1
1 1
1

+ =

+ =

+ =

+ =




= = =
=
=
=
y y
N N
n
n
y
nN
y y
N N
n n
n
y
N
n
n
I I E y y
n
I E y
n
I I y y y I
n
E
N
i
i
N
i
i
N
i
i
N
j i
j i
N
i
i
N
j i
j i j i
N
j i
i i
j i
j i
j i
j i
i i
( )
( ) ( )
( f
S
1 = ) d q q l
N
N n
n
S
N
y
nN
n N
N n
n N
y
N nN
n N
y V
N
i
i
N
i
i
. . .
1
1 1
2
2
1
2
2
2
1
2

=
=


n

D. Estimador de la varianza del total
Usando este resultado es inmediato demostrar que el estimador del total poblacional

tiene
varianza ( ) f
n
S
N 1
2
2
ya que N =

.

Ahora probaremos que el estimador anterior es insesgado.


y E. Insesgamiento del estimador de la varianza de
En el estimador de la varianza inmediatamente llama la atencin que el denominador no es
milar al del parmetro, como fue el caso en el parmetro y el estimador de la media. Este cambio si
48

encuentra justificacin al perseguir que el estimador sea insesgado, es decir que la esperanza matemtica
de s

Teorema. Un est
2
S ea
2
.
imador insesgado de ( ) y V est dado por la siguiente expresin.
( )
( )
( )
( )

=
n
i
y y
f
y V
1

=

i
n n
1
1

Demostracin
Sumando y restando y en el argumento de la sumatoria, el valor esperado de ( ) y V , puede
expresarse como,

( ) [ ] ( )
( ) ( ) [ ]
( )
( )
( )
( )
( )
( )
( )
( )
( )
( ) ( )


=
= =
=
N
i
i i
n
i
n
i
i
i
y nV y I E
n n
f
n n
y
E f
n n
y
E f
n n
1
2
1 1
2
1
1
1
1
1
1
1
1


=

n
i
y y
E f y V E
2
1


continua
( ) [ ]
( )
( )
( ) ( ) ( )
( )
( )
( ) ( )
( )
( ) ( )
( )
( ) ( ) ( )
( )
( )
( )
( )
( ) y V
N n
=

1
y V
n N


=
1 1
y V
N
n N
N
N n
n
y N n
y nV
N
n
y
f
y nV I E y
n n
f
y V E
N
i
N
i
N
i
i i

=
1
1
1
1 1
1
1
1
2
2
1
2

m
inf n
estos resultados, podemos llegar a hacer las inferencias necesarias sobre la poblacin
onfianza. Para ello, sabemos que el error estndar de un estimador
y V f n f
N n N n n
i


=

=
1 1
1 1
1

n n
i

=
1
2
1
Puedes notar que S
2
no es un estimador consistente ya que al hacer n igual a N, el denominador del
esti ador todava es diferente en el parmetro y en el estimador, sin embargo se dice que es consistente
asintticamente, esto quiere decir que
2
S tiende a
2
cuando n tiende a N y sta tiende a un valor
i ito.

A partir de
como sera el calcular intervalos de c

es igual a la raz cuadrada de su varianza. Por lo tanto un intervalo de confianza con ( )% 1 de


nfiabilidad para co y , est dado por,
( )
( ) [ ] y EE
2
t y
n , 1

onde, d
( ) [ ]
( )
( )
( )

=
i
i
y y
n n
y EE
1
1

n
f 2 1
49

Con respecto al total se sigue el mismo razonamiento. Cabe hacer notar que dado que
N = y y N =

, tenemos que un estimador de


ado por, V estara d
( )
( )
( ) ( ) y V N y y
f N
V
n
i

=

2
2 1

n n
i=

1
2
1

var Esta ianza es la que usamos para inferencias sobre ,




EE t
n ) 2 ( , 1



En el caso de proporciones, se asume que 1 =
i
y si posee un atributo especfico y
i
y 0 =
i
y
si no lo posee. Entonces, sustituyendo estos valores es las expresiones anteriores, se obtienen los
estimadores y sus propied n p es la que se desea estimar en nuestro estudio. No
es difcil demo r que,

ades cuando una proporci
st ar
n
a
y
n
p
i
= =

1

n
n i =
donde, a =#de elementos que poseen el atributo
es un estimador insesgado de

p
N
A
P = con varianza,
( )


1 N n

1 n N p p
y se estima como

p V

N n 1
Adems


p V es un estimador insesgado de




p V
n N
p p 1

( ) P V .
Con respecto al I.C. se puede proceder de 2 maneras. La primera sera con una aproximacin a la
normal y la segunda con la distribucin binomial.
En el primer caso, el I.C. con un ( )% 1 de confianza, est dado por,


p EE t p
n ) 2 ( , 1


Para el segundo caso, debemos encontrar p y p tal que,


u l
( )


=
=

m
s n s
n

s
u u
p p
s
0
2 1
y
( )

n
m s
s n
l
s
l
p p
s
n
2 1
Cochran (1977) de las condiciones bajo las cuales la distribucin normal aproximando a la binomial, da
una razonable estimacin.





50







En cada hoja se nstru nes d uso pa principales estimadores. Para
ejemplificar este punto a continuacin presentamos algunos ejemplos vistos en el captulo, los
diferente tipo de informacin, segn
sea conveniente.
Es recomendable copiar la hoja de clculo y guardarla con otro nombre para evitar la prdida de
alguna frmula.












APNDICE II. Hoja de Clculo
El texto cuenta con un disquete que tiene un archivo en Excel con 7 hojas de clculo, cada una
con el nombre del diseo de muestreo que contiene las frmulas para calcular sus
correspondientes estimadores.






indican las i ccio e ra obtener los
cuales pueden variar por redondeo.


Es importante mencionar que estas hojas pueden usarse con














51

Ejemplo. Estaturas


Media
Intervalo de
Confianza

Como podrs darte cuenta los resultados son prcticamente los mismos que los
calculados anteriormente con las ecuaciones que presentamos a lo largo del captulo.

Ejemplo. Ejidatarios



52



En este caso lo que nos interesa estimar es un tot lacional, como puedes
observar, la misma hoja de clculo nos proporciona estas estimaciones y tambin
puedes calcular el tamao de muestra necesario para estimar el total con cierto lmite de
error.

ESTREO ALEATORIO
ESTRATIFICADO

APTULO 4
al pob





MU
C
Total
Intervalo de
Confianza
53

Estratificar por Gnero, Edad, Nivel de Estudios, etc.

INTRODUCCIN
estreo t io Simple es en principio una buena opcin para la
ealizacin de un muestreo, ya que representa una forma sencilla de obtener
n de cualquier
s puntos como el costo que nos implica un muestreo ni la
variabilidad que puede existir en muchas poblaciones vistas de esta manera. Por
esto el presente captulo intentar brindar otras opciones que respondan a estas
situaciones que se presentan en nuestro universo con la introduccin del muestreo
aleatorio estratificado. Este plan de muestreo trata de hacer an ms precisas las
estimaciones que podemos obtener con un diseo bsico de muestreo como el
el que se divide la poblacin
N individuos, en E subpoblaciones o estratos, con respecto a criterios que puedan ser
cada uno de estos estratos o subpoblaciones se realiza, un muestreo
leatorio simple con muestras respectivas de tamao n
h,
as que lamuestra de tamao n
s igual
h
h
n n
1



Definicin

El Mu Alea or
r
estimaciones de los parmetros necesarios para la caracterizaci
y como te habrs percatado, hasta el momento no hemos poblacin. Sin embargo,
tomado en cuenta alguno
aleatorio simple.

Un Muestreo Aleatorio Estratificado es aquel en
de
importantes en el estudio. Los estratos contienen N
1
, ..., N
E
unidades muestrales, de
manera que,

=
=
E
h
h
N N
1

Y en
a
e a,

E

=
=







Muestra aleatoria estratificada
Consiste en considerar categoras tpicas diferentes entre s
(estratos) que poseen gran respecto a alguna homogeneidad entre unidades muestrales
caracterstica, (se puede e , el municipio de stratificar, por ejemplo, segn la profesin
residencia, el gnero, el estado civil, etc.). Lo que se pretende con este tipo de muestreo
es asegurarse de que todos los estratos de inters estarn representados adecuadamente
en la muestra y que estos no presentarn traslapes. Cada estrato funciona
independientemente, pudiendo aplicarse dentro de ellos un muestreo aleatorio simple,
para elegir los elementos concretos que formarn parte de la muestra. En ocasiones las
54

dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado
de la poblacin, como tamao geogrfico, sexo, edades, etc.

ado cuando la poblacin es muy heterognea y las
limitan el tamao de la muestra. Si consideramos estas
cin y utilizamos el muestreo aleatorio simple sera
nes ficientemente precisas o el costo sera demasiado


Cundo debo utili r MAE?
Algunos motivos para util io estratificado en lugar de muestreo simple
aleatorio son,


) Si deseamos una
siderar a cada es
obtener
cierto cua ciones dentro de los estratos son homogneas.
cir el cost por observacin de la encuesta, mediante la estratificacin de
lementos de la es y fcilmente diferenciables.
tratificacin puede lle
s caracterstica
otacin
Para esta tcnica de mu nguir
cada elemento de la poblaci

Caractersticas del Muestreo Aleatorio Estratificado (MAE)

Este tipo de muestreo es utiliz
consideraciones de costo
caractersticas en una pobla
imposible obtener estimacio su
elevado.
Como ya mencionamos en el muestreo aleatorio estratificado la poblacin se
divide en subpoblaciones llamadas estratos de acuerdo a alguna semejanza a fin de
reducir considerablemente la variacin entre las mediciones en cada estrato, donde los
elementos en cada uno de stos no se traslapan y en su conjunto constituyen a toda la
poblacin. Una vez dividida la poblacin se realiza la seleccin de una muestra
aleatoria irrestricta para cada estrato, lo que nos permite la estimacin separada de
parmetros poblacionales dentro de cada uno de ellos.










za

izar muestreo aleator
1 cierta precisin en algn estrato, de esta manera podemos
trato como una poblacin.
un lmite para el error de estimacin ms pequeo, esto se
ndo las medi
con
2) Podemos
considera
3) Para
los e
o redu
poblacin en grupos convenient
4) La es
de la
varnos a obtener una mayor precisin en las estimaciones
s de la poblacin total.

N
estreo necesitamos una notacin adicional para disti
n. a
55


E Nmero de estratos en la poblacin

N tal de
h
des en

Nmero to

N
unidades muestrales en la poblacin
h
Nmero total de unidades en el estrato

n Nmero de
h
unida

y
la muestra en el estrato h
hi
Valor obtenido en la i-

W
sima unidad dentro del estrato h
h
= N
h
/N Ponderacin del estrato (tamao relativo del estrato)

f
h
= n
h
/N Fraccin de muestreo par
h
a el estrato h
h
n

n
i
h
y

=1
Media del Estrato h
hi
y
h
=
( )
1
h
n





Ejemplo. Horas de televisin
Si deseamos conocer la cantidad de horas promedio que cierto grupo de personas
en una
adultos en ese lugar y que el tiempo de hor
1
2

=

=
a en el estrato h
ciudad ven la televisin; debemos considerar que existen nios, jvenes y
as libres que tienen vara, entonces de
mane lacin e tres estratos, ya que es lgico afirmar
ilares y existe homogeneidad dentro de cada
mos entender que el nmero total de personas de nuestra
poblacin es la suma de los elementos en cada estrato.
trato, de esta forma existe homogeneidad entre

Cmo seleccionar una muestra aleatoria estratificada?
La seleccin de la muestra va a ser diferente para cada estrato ya que cada uno
tiene caractersticas y costos de medicin distintos por lo que e unidades
tambin ser diferente. Por ejemplo la muestra en el estrato debe ser mayor si este
mayor nmero de unidades o es muy variable en las caractersticas de sus
enor si el costo de la medicin es elevado. Antes
ser el error de
n
i
h hi
h
y y
s
h
Varianz
ra natural podemos dividir a la pob
strato son sim
n
que las tendencias en cada e
uno de ellos. Tambin pode
Otro ejemplo es el siguiente, si queremos conocer el dimetro promedio en los
rboles de cierto bosque donde existen especies diferentes, podemos considerar a los
rboles de una misma especie como un es
loselementos de cada estrato.

l nmero de
contiene
elementos, por el contrario va a ser m
de seleccionar una muestra es preciso considerar que tan grande debe
stimacin y de acuerdo con esto seleccionar el tamao de la muestra. e
56

En resumen, de un estrato dado se toma una muestra ms grande s,
1) El estrato es ms grande.
2) El estrato es ms variable internamente, es decir existe diferencia en los elementos
del estrato.
) El muestreo es ms barato en el estrato. 3
57

La determinacin del tamao de muestra y su alocacin, se discutirn posteriormente.

Estimacin de la media y el total poblacional
Estimador Puntual
Supongamos que ya hemos tomado nuestra muestra aleatoria estratificada, y
entonces nos preguntamos cmo debemos usarla para estimar nuestros principales
parmetros?, Es decir, contestarnos preguntas como cul es la media de nuestra
poblacin? o cul es el total?. Para esto utilizaremos la notacin presentada
ante cuanto a nuestros parmetros, definiremos a
h
como la media
pob i como el total verdadero para el estrato h. De esta manera resulta obvio
que
riormente, en
lac onal y a
h
E
L +
2
es igual a , que en nuestro caso es el total verdadero de la poblacin.

Para comprender la expresin que nos dar esta estimacin, debemos tomar en
cuenta algunas propiedades revisadas en
+
1
el captulo anterior tales como que h Y es un
estimador insesgado de
h
y que h Y N
es un estimador insesgado del total del estrato

=

=
h
N
i
hi h
y
1
, tal como en el muestreo aleatorio simple. Hasta aqu todo parece razonable,
tal como formar un estimador de , con la suma de los
h
y de esta manera podemos
construir un estimador para la media de la poblacin al dividir entre N, el cual hereda
la propiedad de insesgamiento. As pues, nuestro estimador luce de la siguiente manera,


Estimacin de la Media Poblacional
st

=
=
E
h
h h
st
y N
y
1

=
E
y W
h h
(1)
N

= h 1

Dado que cada estrato se maneja de manea independiente, las
h
y con h=1, 2, ...E
tambin son independientes. Por lo tanto la varianza de
st
y es la suma de las varianzas
de las medias de cada estrato y este estimador es insesgado.

Estimacin de la Varianza de
st
y

58

( )

+ + + =
E E st
y V N y V N y V N
N
y V
2
2
2
2
2 1
2
1
2
) ( ... ) ( ) (
1
) (

=
=

E
S W
2 2
= h
y h
h
1
Como te imaginars, el paso inmediato es la obtencin del intervalo de confianza d
s n N
2


+ +


=
E
h h
h
h
h h
h
h h h
h h h
E
E
E
E
E E
E
n
s
N
n N
W
n
N
n
s
N
n N
N
n
s
N
n N
N
N
1
2
2
1
2
2
2
1
1
1
1 1 2
1
2
2
1
...
1
K
e
nuestra estima captulo anterior, sin
embargo existe una clara diferencia, y esta radica en la obtencin del nmero de grados
de libertad que en este caso o efectivo de grados de libertad.
Si slo se dan algunos ca tr el procedimiento usual
para tomar en cuenta el err nado

E
h h h h
h h h
h
s
N
n N
N
N
n N N
2
2
2
1
2

cin, esta es una tarea similar a la vista en el
le llamamos nmer
grados de libertad para da es ato,
or de muestreo relacio a )
t
c (y onsiste en leer el valor
de t en las tablas de la t de Student, como lo hi e streo aleatorio simple. En
2
s
s
ue cimos n el m
este caso la distribucin de ) (
2
y s es en general demasiado co
st
mpleja, para permitir la
aplicacin estricta de este mtodo. A continuacin presentamos el mtodo aproximado
e asig d nacin de un nmero efectivo de grados de libertad a ) (
2
st
y s (Satterthwaite,
1946).

Nmero Efectivo de Grados de Libertad

h
h h
s g
1
2
=


=
E
h
h
h h
E
e
n
s g
n
1
4 2
2
1

donde,
(3)


=
h
h h
h h
n
n N
N g
2
1
2
2
1
) (
h
E
h
h st
s g
N
y s

=
=
y


Ahora si estamos en posibilidad de construir un intervalo de confianza para nuestro
estimador, la expresin que lo representa se escribe a continuacin,

Intervalo de Confianza para nuestro estimador
59


( )

=
=

1
=


=
E
y h n st
h
h
h
h h
E
h
h n st st st
h e
e
S W t y
n
s
N
n N
N
N
t y y V t y
2 2
,
2
1
2
2
,
2
2

(4)
h 1

Total Poblacional
Hasta este momento hemos revisado todo lo referente al estimador de la media de la

o el total de
personas que asisten a cierto cen
consumen cierto prod timadores del total, los
cuales son fcilmente derivados ores de la media.


Estimador del Total Pobl
poblacin, sin embargo, a veces puede no ser nuestro principal inters saber la media,
sino el total de la poblacin, por ejemplo, el total de madera de un bosque,
tro turstico o quiz la cantidad de personas que
ucto. A continuacin presentamos los es
de los estimad
acional

=
= =
st
st N N y N Ny
1
(5) =
E E
y + +
1
...
E
h
y
h 1

La varianza se deduce inmediatamente de la varianza de la media y hereda todas sus
ropiedades. Para la estimacin tanto de la varianza de la media como del total deben
xistir por lo menos dos observaciones en cada estrato.


p
e
Varianza Estimada del Estimador del Total Poblacional


= =

=

i i
i i
E
i
i st st
n
s
N
n N
N y V N y N V
2
1
1
2 2
) ( ) ( (6)

En
Int
el caso del intervalo de confianza utilizamos la varianza de la expresin (6) y los
grados efectivos de libertad de la expresin (3). De esta manera sabrs entre cules
valores se encuentra el total verdadero.

ervalo de confianza

E
h
h h h
n
n
s
N
n N
t
e
1
2
2
,

h
2
st
y N N (7).


Ejemplo. Bosque de Pino, Encino y Cedro.
i en tres estratos
Nos encontramos ante la situacin de muestrear un bosque para la estimacin del
volumen medio de madera por hectrea expresado en metros cbicos, de un bosque de
800 hectreas. Por medio de fotografas areas, la superficie se divid
60

que corresponden a los tres tipos principales de bosque, pinos, encinos y cedros. Se
conocan los lmites y la extensin total de cada tipo de bosque. Se seleccionaron al azar
y sin reemplazo en cada estrato diez sitios de un dcimo de hectrea cada uno. As las
observaciones se dividieron de la siguiente manera,

Cuadro 1. Bosque de Pino, Encino y Cedro.
No. Estrato Tamao Observaciones
1 Pino 3,200 sitios 16 14 17 18 17 22 14
19 20 16 =173
2 Encinos 1,400 sitios 15 18 23 20 22 16 22
25 24 24 =209
3 Cedros 3,400 sitios

12 15 9 6 5 8 8 7 6
10 =86
= 8,000

La estimacin de la media muestral por cada estrato es,
sitio m y
3
6 . 8 10 / 86 = =

sitio m y
sitio m y
3
3
2
3
1
9 . 20 10 / 209
3 . 17 10 / 173
= =
= =



Utilizando la frmula (1) obtenemos,
( )( ) ( )( ) ( )( )
sitio m
N
y N
y
h
h h
st
3
1
=

3
23 . 14
6 . 8 3400 9 . 20 1400 3 . 17 3200
=
+ +
8000
=
=


Las siguientes son las varianzas para cada estrato,

( )
( )
45 . 6
) 1 10 (
10
173
16 ... 14 16
2
2 2 2
2
1
=

+ + +
= s
similarmente,

2
2
= s


on la informacin anterior podemos obtener la varianza estratificada,
32 . 12
37 . 9
2
3
= s
C
Utilizando la frmula (2),
61

( )
( )
( )
[
309 . 0
562 , 796 , 19
8000
1
3400
10
1
1
37 . 9 3400
00 10 8000
1
2
2
2
=
=

= L
st
y V


a estimacin del intervalo de confianza es la siguiente,
]
0 32
1
10 45 . 6 3200
2


+ +

L
( ) [ ] 309 . 0 23 . 14
2
,

e
st n st
y V t y =

2
,

e
n
t


En este caso el nmero efectivo de grados de libertad utilizando la frmula (3), es 21,
con
025 . 0 , 21
05 . 0 t = =2.414

sustituyendo,
( )
( ) 57 . 15 89 . 12
556 . 0 ) 414 . 2 ( 23 . 14 556 . 0 ) 414 . 2 ( 23 . 14 +


El total poblacional estimado, es decir, el total de madera en el bosque, as como
su correspondiente intervalo de confianza, se obtienen con las frmulas (5) y (7)
respectivamente y son los siguientes,
3
860 , 113 ) 23 . 14 ( 000 , 8 m st = =



Su varianza,
( )
562 , 796 , 19
) 3093 . 0 ( 000 , 8
2
2
=
=
=


st
st y V N V

Y su intervalo de confianza es,

) 600 , 124 120 , 103 (
) 449 , 4 ( 414 . 2 860 , 113



Poblacin
N

Poblacin en cada
estrato
N
h

n
n

Muestra en un estrato h
n
h
Ahora es tiempo de planear cuntas unidades muestrales de
cada uno de los estratos sern incluidas en la muestra. A
Muestra en la poblaci
Clculo del Tamao de la Muestra
62

continuacin planteamos
blem
soluciones a las
ias que se
Cuando decides
e
debe tener una muestra debes tomar en cuenta varios factores, como
etro a estimar, el error muestral
admisible, la varianza poblacional y el nivel de confianza de la
inferencia. Adems, dependiendo de las estrategias de asignacin,
se puede resumir informacin ms especfica o adicional.

edades que nos
teresan, 6,000 acuden a colegios pblicos, 3,000 a colegios privados incorporados y 1,000 a
colegios privados no incorporados. Como estamos interesados en que en nuestra muestra estn
representados todos los tipos de colegio, realizamos un muestreo estratificado empleando
como variab
nacin o alocacin ms comunes,








Asignacin
imple

Proporcional










A cada estrato le corresponde igual nmero de unidades
Por ejemplo si empleamos una asignacin simple elegiramos
200 nios de cada tipo de centro. En s razonable
utilizar una asignacin proporcional pues hay bastante diferencia en el
ao, calculamos
la proporcin de cada uno de los estratos en la poblacin para poder
reflejarlo en la muestra.
este pro a y damos el tipo de muestreo, el parm
estrateg
planteen.



determinar el tamao qu
Ejemplo. Reforma educativa.
Supongamos que estamos interesados en estudiar el grado de aceptacin que la
implantacin de la reforma educativa ha tenido entre los padres de familia de una determinada
provincia. Para que tal efecto seleccionamos una muestra de 600 sujetos. Conocemos por los
datos del sistema escolar que de los 10,000 nios escolarizados en las
in
le de estratificacin el tipo de colegio. En este muestreo consideramos que cada
padre de familia solamente tiene un hijo en la escuela dada.
A continuacin mostramos los mtodos de asig











Asignacin Simple
muestrales.
S
este caso parece m
Optima

tamao de los estratos y puede ser factor de inters en el proceso de
estimacin.
Neyman

Asignacin Proporcional

Debido a que los estratos varan mucho en tam
63


Colegios
icos:
6000/10000=0.
60
Colegios
privados
rados:
3000/10000=0.30
Colegios privados no incorporados: 1000/10000=0.10
Para conocer el tamao de muestra en cada estrato, no tenemos ms
que multiplicar esa proporcin por el tamao muestral. Si n=600

Colegios pblicos: 0.60*600=360 sujetos
Colegios privados incorporados: 0.30*600=180 sujetos
Colegios privados no incorporados: 0.10*600= 60 sujetos
Anteriormente revisamos los elementos estadsticos que se deben tomar en cuenta para
btener un tamao de muestra preciso, sin embargo existen otros factores que son
les para tomar una decisin a este respecto, para este mtodo de asignacin
tambin se requiere informacin sobre,
El nmero total de elementos en cada estrato
La variabilidad de las observaciones dentro de cada estrato
El costo que representa muestrear cada unidad en un estrato

De aqu que podamos hacer algunas conclusiones, como que entre mayor sea el tamao
uestral en nuestros estratos, obtendremos informacin ms precisa, por lo que a estratos
randes le corresponden tamaos muestrales grandes. Tambin es fcil inferir que si en algn
stra mayor que en el
ue existe poca variabilidad.
Por ltimo es importante considerar que si el costo para obtener una observacin vara en
cada estrato, decidiremos tomar muestras pequeas en estratos donde el costo sea alto y
viceversa, todo esto con el fin de minimizar el costo total del muestreo. As debemos
onsiderar que la calidad de la informacin que obtengamos de nuestras estimaciones
n, ya que al incrementarse sta, nuestra varianza de la media
decrecer. Debemos tener claro que nuestro inters es obtener una cantidad fija de informacin
para estimar un parmetro poblacional, por lo que delimitaremos nuestro error en B
nidades e nuestro parmetro a estimar, lo que simblicamente se representa de la siguiente
rma,
pbl
incorpo
o
fundamenta
m
g
estrato tenemos gran variabilidad debe considerarse un tamao de mue
q
c
provendr directamente de
u d
fo
( ) y V t B
n ,
=
( ) y V : Varianza del estimador a evaluar
: Nivel de significancia

( ) ( )
2
, n
2
t B y V =
A continuacin se presenta la generalizacin de las frmulas de asignacin vistas
anteriormnte y la introduccin de otras.
Tamao de Muestra Aproximado que se requiere para estimar y
e

=
+
h h n M
s N t B N
1 h
,
) (

=
=
E
E
h
h h h
W s N
n
2 2 2 2
1
2 2
(8)
donde,
64

N
N
W
h
h
= ,
B
M
=Tamao del error que se desea aceptar en la estimacin de la media

= h
h h h
W s N
1
2 2
=
+
=
E
h
h h n T
E
s N t B
n
1
2 2
,
2
) (

(9)

B
T
=Tamao del error que se desea aceptar en la estimacin del to

tal


Asignacin Proporcional


h h
W n n * = (10)
n=Total de unidades muestrales necesarias para estimar la media (8) el total (9)
segn sea el caso.
W
h
=Proporcin asignada a cada estrato (segn importancia), o bien,

N
N
W
h
h
=




Ejemplo. Humectante labial
Supongamos que realizamos un estudio sobre la poblacin de estudiantes de una
universidad, en el que a travs de una muestra de 10 de ellos queremos obtener informacin
so de humectante labial.
imacin lo que procede es hacer un muestreo aleatorio simple, pero
en su lugar podemos reflexionar sobre el hecho de que el comportamiento de la poblacin con
respecto a este carcter no es hom
De modo que se repartan proporcionalmente ambos grupos el nmero total unidades
cluidas en la muestra, en funcin de sus respectivos tamaos (6 varones y 4 mujeres). Esto
s lo que se denomina asignacin proporcional.
sobre el u
En una primera aprox
ogneo, y atendiendo a l, podemos dividir a la poblacin en
dos estratos,

Estudiantes masculinos (60% del total);
Estudiantes femeninos (40% restante).

in
e
65

Si observamos con ms atencin, nos encontramos (salvo sorpresas de probabilidad
ducida) que el comportamiento de los varones con respecto al carcter que se estudia es muy
homogneo y diferenciado del upo e las
obre el carcter que estudiamos, ser muy
a en el grupo de los varones aunque en la muestra haya muy pocos (pequea varianza),
ientras que en el grupo de las mujeres habr mayor dispersin. Cuando las varianzas
ob
imple cierto nmero de
, de modo que se elegirn ms individuos en los grupos de mayor
s probablemente obtendramos mejores resultados estudiando una muestra de,
3 hombres
7 mujeres

Ahora nos referiremos al caso en el que se toma en cuenta el costo por muestrear en
ada estrato y la variabilidad en estos, a este tipo de asignacin se le llama asignacin ptima
uiente frmula,
re
gr d mujeres.

Por otra parte, con toda seguridad la precisin s
lt a
m
p lacionales son pequeas, con pocos elementos de una muestra se obtiene una informacin
ms precisa del total de la poblacin que cuando la varianza es grande. Por tanto, si nuestros
medios slo nos permiten tomar una muestra de 10 alumnos, ser ms conveniente dividir la
uestra en dos estratos, y tomar mediante muestreo aleatorio s m
individuos de cada estrato
ariabilidad. v
A
c
y se representa con la sig

Asignacin
ptim a

=
E
h h h
h
c s N
n n

=
h h h
c s N
1 h
(11)
n: Total de unidades muestrales necesarias para ar la media (8) el total (9) segn sea el
caso.
c
h
: Cos
estim
to por muestrear una unidad en el estrato h

Notemos que en este caso la ecuacin (8) para obtener n no es aplicable, ya que
debemos tomar en cuenta los costos por muestrear, as que nuestra nueva ecuacin es,
66


=
= =
+

=
E
h h n M
h h
E
h
h
E
h
h h h
s N t
c
B N
n
2 2
(
s N c s N
1 h
2 2
,
1 1
)

(12)
edia B
M
: Tamao del error de muestreo que se decide aceptar en la estimacin de la m
poblacional.
Cuando el caso sea estimar n para nuestro total poblacional, simplemente excluiremos el
trmino N
2
del denominador de la ecuacin anterior.

Notars que un caso particular de la asignacin ptima se da cuando el costo de muestrear
en los diferentes estratos es el mismo o cuando no lo sabemos, a esta particularidad se le
esenta es la siguiente,
Asignacin Neyman
denomina asignacin Neyman y la ecuacin que la repr

=
E
y
h
y
h
h
h
h
s N
s
n n
1 h
(13)

Es obvio que dado que no estamos tomando en cuenta el costo en este tipo de
u stra muestra total ser la ecuacin (8) para la asignacin, la ecuacin del tamao de n e
stimacin de la media y (9) para la del total. e




Ejemplo. Bosque de pino, eucalipto y cedro. (Asignacin Igual)
Nos encontramos en un rea forestal de 151 hectreas dividida en 3 estratos. De
experiencias anteriores tenemos disponible la siguiente informacin para cada estrato,
Cuadro 2. Bosque de pino, eucalipto y cedro.
Estrato N
h
S
2
Plantacin de Pino 610 3.9
Plantacin de Eucalipto 400 4.5
Plantacin de Cedro 500 3.5
Total 1,510
Le asignaremos la misma proporcin de muestro a cada estrato,
3333 . 0
3
1
3 2 1
= = = = W W W

Nuestro objetivo ser estimar el volumen de madera comercial en cada uno de los
estratos de las 151 hectreas con un error mximo de estimacin del volumen total en los tres
estratos de 400m
3.
Para esto primero calcularemos el tamao muestral para la estimacin del total, es decir
obtendremos n con la ecuacin (9),

67

68
El n te, umerador de nuestra ecuacin es el siguien
( ) ( ) ( )
790 , 952 , 8
33 . 0
5 . 3
27 . 0 40 . 0
1
=
= h h
W


500 5 . 4 400 9 . 3 610
2 2
3
+ + =

y h
s N
y
2
2 2
Ahora calculemos el denominador,
2
400
2
, 60
2
2

=
t
B
T

000 , 40 =

929 5 5 3 500 5 4 400 9 3 610
3
1
2
, ) . )( ( ) . )( ( ) . )( ( s N
h
y h
h
= + + =

=

Sustituyendo los valores anteriores en la ecuacin,

92 . 194
929 , 5 000 , 40
790 , 952 , 8
+
= n

=

Par
=



Ejemplo. Bosque de pino, eucalipto y cedro. (Asignacin Proporcional)
Cuadro 3. Bosque de pino, eucalipto
As que redondearemos a n=195

a la asignacin por estrato utilizaremos la ecuacin (10),
W n n
h h
=
= =
65
) 3333 . 0 ( 195 *

1,2 y 3 para h

y cedro
Estrato
h
N

2
h
s
2
h h
s N
h
W
Pino 610 3.9 2379 0.40
Eucalipto 400 4.5 1800 0.27
Cedro 500 3.5 1750 0.33
Total 1,510
Para obtener el
ste
tamao muestral total n, utilizaremos nuevamente la ecuacin (9), pero
en e




La asignacin para cada estrato es la siguiente,
caso nuestra W
h
cambia ya que estamos utilizando asignacin proporcional,

( )
( )
( ) 326 . 64 33 = . 0 195
630 . 52 . 0 195
97 . 77 40 . 0 195
1
=
= 27 =
3
2
= =
n
n
n


Redondea hic s para el caso de la asignacin total muestral, nuestra
asignacin por es a fi ente de uiente for
78
3
ndo como lo imo
tratos quedar nalm la sig ma,
53 64 = = = n n
2 1

Eje p
n
m lo. Bosque de pino, eucalipto y cedro. (Asignacin ptima)
Cuadro 4. Bosque de pino, eucalipto y cedro.
Estrato
h
N
h
c
2
h
s
2
h h
s N
h h h
c s N
h h h
c s N
Pino 610 2 3.9 2,379 1,704 852
Eucalipto 400 1 4.5 1,800 849 849
Cedro 500 3.5 1,750 810 1,080
Total 1, 3,362 2,780 510 5,929

Utilizando la ecuacin (12) co on asignacin ptima en el caso de estar
buscando el estimador del total pobl ona el valor de n,
rresp diente a la
aci l, obtenemos
[ ][ ] 362 , 3 780 , 2
55 . 203
929 , 5 000 , 40
=
+


Por lo tanto necesitamos muestrear 204 elementos en la poblacin para la estim
otal con un error tolerable de 400m
= n
acin
del t
cada
uno
El d
3
.
Ahora utilizando la ecuacin (11) encontraremos la asignacin que se le dar a
de los estratos,
enominador de nuestra ecuacin es el siguiente,
780 , 2
3
1
=

=

Y la

h
h
h h
c
s N

asignacin por estrato es,
25 . 79
780 , 2
080 , 1
204
780 , 2
3
=

=

n
Redondeando como lo hicimos para el caso de la asignacin total muestral, nuestras
asignaciones por estratos quedara finalmente de la siguiente forma,
n

50 . 62
852
204
1
=

= n
26 . 62
780 , 2
849
204
2
=

= n
79 62 63 = = =
3 2
n n
1
69

Ejemplo. Bosque de pino, eucalipto y cedro. (Asignacin Neyman)
Recordemos que e ignacin ptima, en donde los
costos se omiten. As que utilizando la frm a mos el tamao muestral, en este
ejemplo, como recordars, es 195.

La asignacin por estrato las obtendremos con la ecuacin (13).
ste a as caso es una particu
ul
laridad de l
(9) obtene
61.03
989 , 2
935
195
55.36
989 , 2
849
195
989 , 2
3
2
1
205 , 1
195
78.60
=

=

n
n

Asignacin

= n
=
=

As finalmente usaremos los siguientes tamaos muestrales para cada estrato,
79 =
1
n 61 55 = =
3 2
n n

A continuacin mostramos el resumen de los ejemplos anteriores,
Cuadro 5. Resumen
Mtodo de n n
1
N
2
n
3
Igual 195 65 65 65
Proporcional 195 78 53 64
Optima 204 63 62 79
Neyman 195 79 55 61


Estimacin de la Proporcin Poblacional
la
a satisfacer cierta precisin
n la estimacin de una variable continua para una poblacin que se ha estratificado. Ahora
rge la necesidad de hacer la estimacin de la proporcin de unidades muestrales que cuentan
on cierto atributo.
cara en saber cmo se manifiesta la
los estratos. En tal caso nos importara saber cul es la
C en el estrato h.
a siguiente aseveracin,
te del h-simo estrato y el xito consiste en tener
caracterstica C.
Parece ya estar resueltas las dudas acerca de la forma de estimar la media, el total,
varianza el intervalo de estimacin y el tamao de la muestra par
e
su
c
Es decir, supongamos que nuestro inters radi
caracterstica C en cada uno de
proporcin (p
h
) de unidades muestrales que tienen la caracterstica
De esta forma resulta evidente l

fracaso 0
Que representa el i-simo componen

=
xito
y
i h
1
,

la
70

71
La cual se comporta como u s ador de la proporcin de
la caracterstica de inters para el estrato k es,
na variable binomial, as el e tim

=
n
n
=
i h
y
p
,

Y su correspondiente varianza es,
i
h
st
n
1

=

p

h
h h
h
h h
p
N
n N
n
p
s
h 1
) 1 (
2

emos que p
h
es un estimador insesgado de p
h
de unidades muestrales y razonando
de la misma manera N
h*
p
h
tambin es un estimador insesgado del total en el estrato h que
a caracterstica C, de esta forma podemos observar que
Not


E
=
h h
p N es un buen cuentan con l
h 1
estimador del nmero total de la poblacin que cuentan con la caracterstica C.

Estimador de la Proporcin Poblacional


=
+ + =
E
h
h h
E E st
p N
N
p N p N
N
p
1
1 1
1
) (
1
L
(14)

=


=

+ + =
E
h
h h
E E st
p V N
N
p V N p V N
N
p V
1
2
2
2
1
2
1
2
) (
1
) ( ) (
1
) ( L
(15)

donde,


1
h h
n N


=


) (
h h h h
h
q p n N
p V

De la forma tradicional construimos u tiene la siguiente ecuacin, n intervalo que

1
1
1
2
2
,
h
h h
h
h h
E
h
h n st
n
q p
N
n N
N
N
t p

(16)

Ejemplo. rea forestal
E mero es una
a segundo es
un bosque natural de pinos maduros sobre una superficie de 50 hectreas. Una muestra
sistemtica
*
toma todos los 50-simos rboles de cada es queremos tomar en cuenta
dos los rboles que miden mas de 30cm de dimetro normal (dn), es decir,
Un rea forestal de110 hectreas fue dividida en dos estratos. l pri
plantacin de pinos de 38 aos de edad sobre una superficie de 60 hectre s y el
trato y
to


*
La estrategia de muestreo sistemtico se explica en el captulo 5 del texto

>
=
do de otro mo
cm si dm
y
i h
0
30 1
,

Un total de 352 rboles fueron muestre
obtuvo
ados en el estrato1 y 369 en el estrato 2 y se
la siguiente informacin,
Cuadro 6. rea forestal.
Estrato1 Estrato2
n =352 n =369
1 2
151
352
1
, 1
=
=
i
i
y 199
369
1
, 2
=
=
i
i
y

Haremos la estimacin de la proporcin de rboles con
as como la estimacin de s
dm >30cm en el estrato 1 y 2
u varianza,

=
n

= = =
1
1 1
,
1
429 . 0
352
151
i
i h
n
y
p

= = =
2
1 2
2 ,
2
p 539 . 0
369
199
n
i
h
n
y

Not u . Sin embargo puede ser estimado ya que la persona que ha
tomdo los datos, escogi un rbol despus de caminar pasando 49, as que si ningn rbol fue
ign
) 50 ( 352
2 2
=
=
e q e N
i
es desconocido
a
orado nuestra estimacin es la siguiente,
50 *
1 1
= n N
50 *
600 , 17
=
=
n N

) 50 ( 369 =
450 , 18
Por lo que nuestra fraccin muestral para el estrato 1 es,

02 . 0
600 , 17
1
= =
N
352
1
n

Lo cual es menor que 0.05, as que el factor de correccin por finitud puede ser
ign ad
As estro estimador para el estrato 1 y 2 es,
or o.
que la varianza de nu
00067521 . 0
1 369
) 539 . 0 1 ( 5399 . 0
00069789 . 0 =
1 352
) 429 . 1 1 ( 429 . 0
2
2
2
1
=

p
p
s
s

A continuacin se muestran los intervalos de confianza para cada estimador,


72

Estrato 1:
81) (0.377,0.4
264) 1.9667(0.0 0.429
) 00069789 . 0 ( 429 . 0
,

n
t

donde,

Estrato 2:
1.9667
10 . 0 , 352
= t
590) (0.4879,0.
60) 1.966(0.02 0.539
) 00067521 . 0 ( 539 . 0
,

n
t

donde,


El estimador de la proporcin poblacional utilizando la frmula (14) es,

1.966
10 . 0 , 369
= t
485297 . 0 =
varianza est dada por,
)) 539 . 0 ( 18450 ) 429 . 0 ( 17600 (
36050
1
+ =

st
p


La

001935 . 0
) 00067521 . 0 ( 18450 ) 00069789 . 0 ( 17600
36050
1
) (
2 2
2
+ =

st
p V

=



El I quedaran de la siguiente manera, .C. para el estimador poblacional
1833) 1.9667(0.0 0.485
) 0003363 . 0 ( 85
,

n
t

213) (0.449,0.5
4 . 0
don






de,
1.9667
10 . 0 , 721
= t
73

Tamao de Muestra para Estimar una Proporcin
En cuanto a la asignacin del tamao de muestra en este caso, se procede de manera
anloga a la asignacin vista en la seccin anterior, definiendo un lmite dado B de error de
estimacin, por lo que se utiliza una modificacin de la ecuacin (8) sustituyendo la
estimacin de nuestra desviacin estndar
h
por la varianza de la proporcin estimada, que es
p
h
q
h

Tamao aproximado que se requiere para estimar n, con un lmite B para el error de
.
estimacin

=
=
+
=
E
h h h n P
E
h
i h h i
q p N t B N
W q p N
n
1 h
2
,
2 2
1
2
) (

(17)
B
P
: Tamao del error de muestreo que se decide aceptar en la estimacin de la proporcin
poblacional.

Procediendo de manera anloga encontramos las diferentes asignaciones de muestra
sim ulas introducidas anteriormente.

Como podrs imaginar, este es el caso que se apega completamente a la estimacin del
tamao de muestra de una proporcin pues la proporcin va implcita en la frmula que se
presenta a continuacin y notars que es idntica a la utilizada en el muestreo e tificado
trad l.


Asignacin Proporcional
plemente realizando algunas modificaciones a las frm
stra
iciona

(18)

p
h
: Proporcin asignada a cada estrato (puede ser segn importancia).
*
*
h h
p n n =
N
N
p
h
h
=
*



ir el
gas or muestrear una unidad muestral
en da ormente en (11), con
la m la varianza por el trmino p
h
q
h.





Tal como en el muestreo estratificado tradicional, este tipo de asignacin busca reduc
to en la toma de la muestra tomando en cuenta el costo p
ca estrato; la frmula es prcticamente la misma que la vista anteri
odificacin de reemplazar
74

Asignacin ptima

=
h h h
c q p N
=
h
h
n n (19)
n: Nmero de unidades a muestrear.
c
h
: Costo por muestrear una unidad en el estrato h.
E
h h h h
c q p N
1 h


os diferentes estratos es el mismo o que
simplemente no conoceremos el costo por muestrear. Si es as, podremos omitir este dato y
utilizar la asignacin Neyman que se muestra a continuacin.

Existe el caso de que el costo por muestrear en l
Asignacin Neyman

=
h h h
q p N
n n (20)

=
E
h h h
h
q p N
1 h

Ejemplo. Green Peace
Green Peace quiere saber el dao que han hecho los desecho txicos de cierta empresa en dos
localidades cercanas, para esto, realiza una encuesta a los habitantes preguntando si desde la
inclusin de la fbrica ha visto afectada su salud. Sabemos por el censo de poblacin, cuantas
personas viven en las dos localidades y los resultados de la encuesta son los siguientes.

Cuadro 7. Green Peace
Muestra1 Muestra2
N 700 553
n 150 120
y 100 103
p 0.667 0.858
C
h
1 2
q 0.333 0.142
N
h
0.559 0.441

Aplicando la frmula (17), obtenemos el nmero total de elementos a muestrear para
tener un error de estimacin del total de 0.2.


72 . 620
33 . 235
41 . 074 , 146
=
= n

75


con
la confiabilidad deseada.

En cuanto a la particin por estrato, a continuacin se presenta para el caso de la
asignacin proporcional,
Lo que significa que necesitamos muestrear 621 elementos para tener la estimacin
95 . 273 441 . 0 * 621
77 . 346 559 . 0 * 621
2
1
= =
= =
n
n

Redondeando, tendramos que muestrear, 47
2 1
3 274 = = n n


Para el caso de la asignacin ptima, se muestra la distribucin a continuacin,

49 . 1 18
3721 . 0
1088 . 0
621
22 . 439
3721 . 0
2633 . 0
621
2
1
=

=
=

=
n
n

Redondeando, tendramos que muestrear, 182 439
2 1
= = n n


Por ltim

o, para la asignacin Neyman,
94 . 229
4172 . 0
1538 . 0
77 . 391
2633 . 0
621
1

=

= n
621
4172 . 0
2
=

=

n

edondeando, tendramos que muestrear, 230 391
2 1
= = n n R


Seleccin de Estratos
Ahora que sabemos como hacer estimaciones en cada uno de los estratos resulta
rzoso contestar cada una de las preguntas que puedan surgir acerca de la estimacin
stratificada, as que intentando agotar las dudas que puedas tener hasta el momento, nos
acemos algunos cuestionamientos, es decir, a veces es fcil delimitar los elementos que
orresponden a cada estrato, pero esto siempre es as?, definitivamente no, y como lo es en
stadstica cada problema es una nueva experiencia, la cual no necesariamente tiene
nicamente una respuesta y en donde debes de hacer uso de todas tus herramientas y sobre
do de un razonamiento lgico para llegar a la solucin ms satisfactoria. Sin embargo este
abajo puede resultar un poco complicado y tornarse desesperante en algunas ocasiones, por
que a continuacin se bosquejan algunas ideas que te pueden ayudar en esta labor.
fo
e
h
c
e

to
tr
lo
76




Qu hago cuando
Cmo delimitar mis estratos?
Debo estratificar despus de seleccionar mi muestra?
Cmo delimitar mis estratos?
A veces es una tarea bastante fcil, ya que como vimos en algunos ejemplos
nteriores, los estratos estn ya implcitos pues conocemos el comportamiento con base
antiguos registros, o a caractersticas fenotpicas; tambin podra ser con base en
uestra experiencia o simplemente a la naturaleza de los resultados que deseamos
btener. Este ltimo es un caso interesante ya que te estars preguntando.
Con base en qu delimitara mis estratos?. Una primera aproximacin sera en el
aso cuantitativo, el construirlos dado nuestro inters, es decir, muchas veces al
omento del diseo de nuestra evaluacin, sabemos los rangos que nos gustara
nalizar para obtener nuestras estimaciones. Pero tambin se puede dar el caso en el que
nemos el rango de salida de los datos y algunas frecuencias en categoras generales de
variable de inters o de alguna variable altamente correlacionada. Es aqu donde
odemos hacer uso del mtodo acumulativo de la raz cuadrada de la frecuencia, el
ual es muy sencillo y se explica a continuacin.

a
a
n
o
c
m
a
te
la
p
c

Mtodo Acumulativo de la Raz Cuadrada de la Frecuencia

1. Elegimos el nmero de estratos que deseamos obtener.
2. A nuestra variable de inters o en su defecto a una altamente correlacionada con
sta, le obtenemos su frecuencia por rango y con estos resultados formamos una
columna ms de resultados.
3. Formamos dos columnas ms, una constituida por la raz de las frecuencias y
otra por la raz acumulada de estas.
4. Dividimos la frecuencia acumulada final entre el nmero de estratos, este
resultado ser el ancho de nuestra clase (AC).
5. Utilizamos la siguiente ecuacin,
AC h AC
hi
* =

6. Ahora con nuestras marcas de clase por estrato, podemos delimitar estos, tan
solo eligiendo la raz de la frecuencia acumulada ms cercana a la marca de
clase, as cada estrato est
Donde h representa el estrato h, h= 1, 2, n
ar formado por todas las clases de nuestra variable
original que correspondan a nuestra marca de clase.


Ejemplo. Ventas.
frec y acostumbra clasificarlos en rangos de $2,000,
Cmo asignaras estas ventas en 3 estratos, es decir h =3?
El departamento de planeacin de una empresa desea estimar el promedio
semanal de venta de 445 vendedores, el departamento tiene informacin de
uencias de la ltima semana




77


Semanal Frecuencia
Cuadro 8. Ventas
Venta
Frecuencia
acumulada
Frecuencia

0- 8000 50 7.07 7.07
8001- 10000 60 7.75 14.82
1001- 12000 80 8.94 23.76
12001- 14000 100 10.00 33.76
14001- 16000 95 9.75 43.51
16001- 18000 60 7.75 51.25
Suma 445

Utilizando el mtodo de la raz cuadrada, encontramos el ancho de clase
aciendo la siguiente operacin AC = 51.l25/3=17.08, lo que nos dara el valor
proximado del primer estrato, eligiendo el nmero ms cercano en la columna de la
z de frecuencia acumulada, que en este caso sera 14.82, anlogamente obtendras el
gundo estrato, utilizando h=2, es decir, AC
2
=17.08*2 =34.16 y el valor ms cercano
ra 33.76. De esta forma nuestros estratos quedaran de la siguiente manera,
Estrato Venta $
h
a
ra
se
se
1 0-1000
2 1001-14000
3 14001-18000

Debo estratificar despus de seleccionar mi muestra?
Puede ocurrir que en algn caso no tengamos posibilidad de estratificar con
base en alguna variable clave ya que sta no ser identificada hasta despus de
haber tomado la muestra. Por ejemplo, al intentar deducir informacin sobre el tipo
de fauna de un determinado lugar; en donde sabemos que la muestra se tomar tan
solo por la observacin de los animales que pasen por ah, o cuando queramos
obtener informacin sobre el tipo de transporte que pasa por un puente, en fin,
podrs imaginarte diferentes ejemplos en los cuales nuestras n
h
sern variables y
tendremos que utilizar Y para estimar a siempre y cuando N
h
/N sea conocida.
Dadas las caractersticas anteriores de nuestras N
h
y a nuestra definicin de muestra
aleatoria estratificada, podemos deducir que no estamos hablando propiamente de
una muestra aleatoria estratificada, sin embargo con N
h
/N conocido y n
h
mayor que
20 para cada estrato, nuestro mtodo de estratificacin despus de tomar la muestra
resulta casi exacto.
Sin embargo debemos hacer notar que la varianza de un muestreo proveniente de
postestratificacin es ligeramente mayor que en uno previamente estratificado, todo
depender de la precisin de nuestras N
h
.
Debe tomarse en cuenta que la post-estratificacin es una estrategia de anlisis
distinta a las de estratificacin comn. Para mayores detalles ver Sukatme, et. al
(1995).

=
=
n
h
h
post
N
N
y
1
n
y




Ejemplo. Dinero gastado en comida
78

Supongamos que se desea estimar la cantidad promedio de gastos en comida de
las familias de cierta comunidad, de informacin anterior sabemos que la
distribucin de familias por tamao es de la siguiente manera,

Cuadro 9. Distribucin de familias
Nmero de personas
En la familia
Porcentaje
de familias
3 20
4 30
+5 50
Corrimos un muestro estratificado sobre cada tipo de familia y obtuvimos los
guientes resultados,

3 integrantes 4 integrantes 5 integrantes
si
000 , 5 $
1
= y
30
1
= n

000 , 7 $
1
= y
35
1
= n

000 , 9 $
35
1
1
=
=
y
n


Como podrs notar, el nmero de muestras tomadas para cada estrato son diferentes
a las reales en cada estrato, por lo que utilizando la frmula anterior podemos obtener
una estimacin ms acertada,
) 000 , 9 50 . 0 000 , 7 30 . 0 000 , 5 20 + +



Comparacin del muestreo Aleatorio Simple con el Estratificado
Una muestra aleatorio estratificada se obtiene al hacer un muestreo aleatorio
simple en cada uno de los estratos que contiene elementos similares en l. Las
principales ventajas que presenta sobre el aleatorio simple son,

1. Generalmente el estimador de la media poblacional presenta menor varianza.

2. El costo por muestrear y analizar es menor ya que en lugar de tomar
observaciones sobre toda la poblacional, slo las tomamos sobre los estratos, que son
ms pequeos.

3. Al final del anlisis tenemos estimaciones sobre el total poblacional y sobre los
estratos individuales.

En la seccin final del captulo se muestra un anlisis terico de estos puntos
comparativos entre el muestreo estratificado y el muestreo simple.




APNDICE. Revisin Terica

sumiremos los siguientes supuestos,
( )( ) ( )( ) ( )(
600 , 7 $
. 0
3
1
=
=

= h
post
y
A
79

En cada estrato se lleva a cabo un muestreo simple aleatorio, donde y
hi
es la
i-sima unidad del h-simo estrato, i=1, 2, , N

stamos interesados en la media y el total de la poblacin . Los que estn dados por,
E
h
h h
W
1
y
donde,
h
y h=1, 2, , E.
Los estratos son independientes, es decir, ninguna unidad de muestreo puede
pertenecer a dos estratos diferentes.

Parmetros
E

=
=
E
h
h h st
N
1

=
st
=

=
h
N
y
1

=
y
i
hi
h
h
N
1
N
N
W
j
=
Y su er ico
h
h h st
s W V
1
) (
donde,

h
medio se define como,
E
2 2
ror cuadrt

=
=
( )
1
1
2

=

=
h
N
i
h hi
h
N
y
s
h


Estimadores
Los estimadores y respectivas varianzas de y se presentan a continuacin,

Teorema. Los estimadores insesgados de y estn dados por,

=
=
E
h
h h st
y W y
1
y

=
E
h
h h
st y N
1

donde,

=
=
h
n
i
hi
h
h
y
n
y
1
1

Cuyas varianzas son,

=
=


=
E
h
y h
E
h h
h
h
h h
h st
h
s W
n
s
N
n N
W y V
1
2 2
1
2
2
) (
y

=

h
h
h
h h
E
h
h h
st
n
s
N
n N
N W V
2
2
1
2 2
) (

Demostracin
En el captulo anterior se demostr el insesgamiento de
h
y para
h
ya que en
cada estrato se lleva a cabo un muestreo simple aleatorio. Entonces,
80

( ) ( )

=
=
= =
=
E
h
h h
E
h
h h st
W
y E W y E
1
1

y

( )

E
h h
st y E N E

=
=
= =

E
h
h h
h
N
1
1


De la misma manera en el captulo anterior se demostr que la varianza de
h
y es,


=
E
h h
h
h
h h
st
n
s
N
n N
y V
1
2
2
) (

Por lo tanto, y por la independencia de estratos,

( )
( )

= =
=

=
h
st h
h
st h st
y V W y W V y V
1 1
)


E E
2 2
(


=
E
h h
h
h
h h
h
n
s
N
n N
W
1
2
2

=
=
E
h
y h
h
S W
1
2 2
Lo que demuestra la ecuacin (2) del captulo.

De la misma manera para el total,
( ) =

=

= =

E
i h
st h
E
i h
st h
st y V N y N V V
2
) (

h h h
E
h h
n
s
N
n N
W N
2
2
2 2

= h h h 1
Lo que demuestra la ecuacin (6) del captulo.
Usando los resultados probados en el apndice del captulo de muestreo simple
alea




torio podemos ver que los estimadores anteriores son insesgados.



Alocacin de la muestra

En la discusin del captulo, presentam trategias para la seleccin del
tamao de muestra y su divisin para los diferentes estrato.
o Alocacin ptima
os diferentes es
o ual
o Alocacin Proporcional
Alocacin Ig
81

o Alocacin Neyman

Las dos primeras no las discutiremos por su relativa sencillez. En cambio las dos
h
ue para una funcin de
osto C
y que asumiremos en el resto del captulo, es la
siguiente,
don
eseamos minimizar la
restantes representan un inters mayor en cuanto sus fundamentos tericos y las
revisaremos a detalle.
La estrategia en la alocacin ptima es la seleccin de n tal q
c se tenga la mxima precisin o para una precisin dada se tenga el mnimo
costo.
La funcin de costo ms comn

=
=
E
h
h h
n c C
1

de,
c
h
=costo por unidad de muestreo en el h-simo estrato.
) (
st
y V

Supngase un costo fijo C y d que est dada por,


=
E
h h
h
h
h h
h st
n
s
N
n N
W y V
1
2
2
2
) (
res de Lagrange, encontramos que con la restriccin C, la
funcin a derivar es,
Usando multiplicado

= =

h h h h
n N
1 1
As, la derivada con respecto a n


= +
E
h h
E
h h h
h st
n c
s n N
W C y V
2
2
) (
h
est dada por,
( ) 1
1
= =


E
h h
E
h h
h
s W s W
n
0
1
0 ) (
1 1
1 1
2
2 2
1 1
2
2 2
1
2 2
L

= +

/
=
=




= =
= =
= =
=
h
h
h
h
E
h
h
E
h
h
h h
E
h
h
h
h
h
h
h h
E
h
h h
h h
h h
h h st
c c
c
n
s W
c
n
N
N
s W
n c
n N
n N
s W C y V
n

1 =
E
h h


E
Es decir,

=
h
h h
c
s W

Esto lo interpretamos como que en un estudio con un costo fijo C
0
, la

h
h
n
1
E
) (
st
y V

es
mnima cuando n
h
es proporcional a

=
E
h
h
h h
c
s W
1
. Para la funcin de costo, entonces
tenemos,


82

E
h h h
s W c C
0


=
=
= =
=

= =
E
h
h h h
h
h
h h
E
h
h
E
h
h h
W c
C
C
c
s W
c n c C
1
0
1
0
1 1
1

Sustituyendo esta expresin en la ecuacin de n


h
(1), obtenemos,
s
1

= h
h h h
1

E
s W c

h h h 0

c s W C

=
h h h h
C s W s W
0
1
Dado que + + = L
2 1
lm

=
E
h
h h h
h h
s W c
c c
1


=
h
n

h
n
E
n n n n + , obtenemos fina ente que,

=

h
h h h
s W c
1
=

h 1

C n
0
La deduccin anteri mu xi que se tiene en un
estudio de costo fijo C
0
lo a ado por (2) donde
y c
h
fueron defin s an
Antes de pasar al caso donde se tiene una posicin fija y se desea minimizar el
costo, mostraremos el caso de alocacin Neyman, el cual es un caso particular del
anterior ya que se asume el mismo costo para todas las unidades de muestreo; es
dec

E
c s W

E
h h h

= (2)
or estra que la m ma precisin
, se gra con un tam o de muestra d
h h
s W ido teriormente.
ir E h c c
h
, , 2 , 1 L = = . Por lo tanto,

=
=
=
E
h h h 0

=
h h
E
h
h h
h h h
h
s W c
C c s W
s W c c
C c
n
1
0
Do
s W

h 1
nde ( ) n n c c + + n
E
+ = L
2 1
Y por lo tanto
83

=
=

=
E
h
E
h
h h
h h
s W
s W
c
C
n
1
1
0

Procedamos para el caso con varianza fija (precisin fija) y deseamos
minimizar el costo con la funcin de costo ( )
E E
n c n c n c c + + + = L
2 3 1 1
.


La funcin a optimizar est dada por,

2
1
2
1
E
h
h h
h
E
h
h h
s
N
n N
W n c V C

= =


+ = +
h
h h
n

ent

onces,
( )
( )
h
c


h h
h
h
h h
h
h
h h
h h
h h h
s W
n
c
s W
n
s W
n N

/
2 2
2
2
2 2
2
0 1





Sustituyendo esta expresin en
h
h h
h h
h
h h h
h
N
s W c
n N
n N
n
s W c
n
V C

/
+ =
=

+ =

+
2 2
2 2
0
1
0
h
n
c + =

) (
st
y V

, encontramos que,

( )
h h
h
h h h
s W
c
s W n
=

=

1 1
h
c
E
h h h
h h
E
h h h
h h
h h st
N n
s W
n N
n N
s W y V V

= =

= =
1 1
1
2 2
1
2 2
0

84

=
= =
h
h h h h h
c s W c s
1

=
=
=
= =
=
=
+
+
/
/

=
E
h
h h
E
E
h h
h h
E
h
h
h h
E
h
h h h h
h h h
h
E
h
h h
s W
N
V
N
s W
V
W
s
N s W
N s W
c
s W V
1
2
0
1
2 2
1
1
2
1
1
1
2 2
0
1
1


=
/ /
=
E
h h
E
h
h h h
s W
c s W
V
2 2
1
2 2
0

+ =
h h h h h
N
V
0


E
s W
c W
2
0
Ya que
N
W
N
N
N N
N
N
W
h
h
h
h
h
h
1 1
2 2
2 2
= = =

+
=

=
=
h
h h
h
h h h
h
h h
h
s W
N
V
c s W
c
s W
n
1
2
0
1
1


E

+
=

=
=
E
h
h
h
h h
s W V
c
n
2
1
1
1
(3)

E
= h
h h
h h h E
N
c s W
s W
1
0
Es e muestra neces el objetivo de V
0
de
pre

decir, el tamao d ario para lograr
cisin a mnimo costo, est dado por la ecuacin (3).
Para el caso de alocacin Neyman, la expresin se transforma a,

+
=

+
/
/
=

=
=
=
=
E
h
h h
E
h
h h h h
E
h
h h
E
h
h h h
h
h h
h
s W
N
V
s W s W
s W
N
V
c s W
c
s W
n
1
2
0
1
1
2
0
1
1
1

Y el tamao de muestra total es el siguiente,

=
=
=

+
=
E
h
E
h
h h
h
h h h h
h
s W
N
V
s W s W
n
1
1
2
0
1
1


E

Comparacin con Muestro Aleatorio Simple



85

Tomando un muestreo aleatorio simple de tamao n de una poblacin de tamao
N, el nmero esperado de unidades en el h-simo estrato es , y el costo
esperado es .
Por lo tanto
n W
h

=
=
E
h
h h
c W n C
1
0

E
h h
c W
=
=
C
n
0

h 1
Con esta ltima expresin podemos deducir que,
( )
2
0
1
1
s
N C
c W
E

y V
h
h h
st

=
=

Donde,
( ) (

)
N
E
N
j j
2 2
2
= = = =
= =
h i
ij
h i
st ij
y y y s
1 1 1 1

Notemos que
2
s puede rescribirse con dos componentes que seran,
E

( ) ( ) ( )
( ) (


= = =
= = = = =
+ =
+ =
E
h
E
h
h h
N
i
h ih
E
h
E
h
h h
N
i
st ih
E
h
N
i
ih
N y
y N y y y
h
h h
1 1
2
1
2
1 1
2
1
2
1 1
2



)
)
=
+
h h h h
N s
2 2

estratos entre Variacin estratos de dentro Variacin s + =
2

( ) (

=
E
N s N
2
1 1 ) (
h 1
( )
( )

= =

h h
N N
1 1
1 1
+ =
E
h
E
h
h
h
N
s
N
s
2 2 2

=
+ =
1
( )

E E
=

h 1
Donde,
h
h
h h h
W s W s
2
1
2 2

( )
1
1
N


N
W
h
h

as de los estimadores en las
diferentes alocaciones (sustituyendo las correspondientes a cada alocacin en
la

Ahora derivemos las expresiones para las varianz
n
h
'
( ) y Var
s
).

Alocacin Arbitraria
( )
2 2
1 1
h h
E
s W y V

= (1b)
1 h h h
N n
=

Alocacin ptima
( )

=
=

=
E
h
h h
E
h
h h h
OP
s W
N C
c s W
y V
1
2
0
2
1
1
(2b)
86

Alocacin Neyman
( )

=
=
h
h h N
s W
N C
y V
1 0
(3b)


= =

E
h
E
h
h h
E
h
h h
c s W s W
2 1 1
1

Alocacin Proporcional
( )

= =


=
E
h h
P
s W y V
2 1 1
1
(4b)

=

h
h h
h
E
h
E
h h
N C
c W s W
1 0
2

Cuando C c
h
= para E j L , 2 , 1 = y con
0
C nC = las expresiones (3b) y (4b) se
transforman a,
( )

= h
h h N
N n
1
=

=
E
E
h
h h
s W
s W
y V
2 1
1


y

( )

=

=
E
h
h h P
s W
N n
y V
1
2
1 1

Suponiendo valores de
h
N tal que
h
h
W
N
N

1
1
y
h
h
W
N
N

1
la expresin se
simplifica como,
( )

= =
+ =
E E
h
W s W s
2 2 2

h
h
h 1
h h
1
y por lo tanto,
( ) ( )

=

= =
=
h
h h
h
h h
h
W s W
N C
y V
1
2
1
2
0
1
1
(5b)

E E
E
h h
c W
Comparando (5b) con la expresin (4b) de alocacin proporcional, encontramos
que,

87

( ) ( ) ( )
( ) ( )
( ) ( )
( ) ( ) b W
N C
c W
N
c W
s W
N C
c W s W
c W
s W
N
W s W
N C
c W
y V y V
E
h
h h
E
h
h h
h h h
E
E
h
h h
h
h h
h
h h
E
h
h h
E E
E
h h
E
h h
E
h
h h
P
6
1
1
1
0
1
2
0
1
1 1 1 1
1
2
0
1 1
2
1
2 2 1
L
4 4 3 4 4 2 1
>
=
=
= = = =
=
= =
=
=

h h 1 1 0 = =

C
0
c W s W
E
h
h h
h
h h
1
2 1 1
2
= =

W s W W s W
C
E
h h
E
h h
E
h h
E
h
h h
h
h h
1
2 2 2 2
0
1 =

+ =
W s W
N
W s W
C
E E
E
h
h h
E
h
h h
E
h
h h
E
h
h h
h
h h
1
1
2
1
2
1
2
1
2
0
1
= = = =
=

=
0
4 4 3 4 4 2 1
>

=


Analizando la ecuacin 6b) odemo entre mayor sea la varianza entre
estratos mayor ser la ganancia en precisin con muestreo
proporcional, porque (6b)






( p s ver que
( )

=

E
h
h h
W
1
2

siempre es no-negativa.







88






















s
correspondientes estimadores.























APNDICE II. Hoja de Clculo

El texto cuenta con un disquete que tiene un archivo en Excel con 7 hojas de clculo, cada una
con el nombre del diseo de muestreo que contiene las frmulas para calcular su

89

En cada hoja se indican las instrucciones de uso para obtener los principales estimadores. Para
ejemplificar este punto a continuacin presentamos algunos ejemplos vistos en el captulo, los
cuales pueden variar por redondeo.






Es importante mencionar que estas hojas pueden usarse con diferente tipo de informacin, segn
sea conveniente.


Es recomendable copiar la hoja de clculo y guardarla con otro nombre para evitar la prdida de
alguna frmula.













90

Ejemplo. Bosque de Pino, Encino y Cedro



Como recordars, en este caso, nuestra intencin era estimar la media y el total
poblacional con sus correspondientes intervalos de confianza, observars que las
estimaciones son las mismas que calculamos anteriormente.


jemplo. Bosque de pino, eucalipto y cedro








E
91



En este caso, lo que necesitbamos era calcular los tamaos de muestra con las
diferentes alocaciones, este es un buen ejemplo para hacer notar las diferentes formas de
utilizar estas hojas, ya que para este ejemplo, no contbamos con los datos originales,
slo con algunos como los tamaos de los estratos y las varianzas de estos. Para este
ejercicio, tambin fue necesario indicar el costo por muestrear en cada estrato y el error
que podamos aceptar en nuestra estimacin.





APTULO 5
ESTIMACIN DE RAZON, REGRESIN Y
DIFERENCIA

C
92



INTRODUCCIN
En este captulo revisaremos ms que el diseo del muestreo, algunos mtodos de estimacin, los cuales
lacionan dos o ms variables, ya que algunas veces puedes encontrar que tu variable de inters Y est
lacionada con una o ms variables auxiliares X
i
. Por ejemplo, si tu variable de inters es el volumen de un rbol,
able auxiliar, o si te interesara saber el nmero de animales en un bosque,
nes de
La
tr r con
tamao de forma

ede
diferencia son ejemplos del uso de variables
uxiliares en la estimacin.
En este captulo te mostraremos primero el estimador de razn, basado en el hecho de que tanto Y como
X so x on este supuesto obtendremos una
lacin entre las dos variables a la que llamaremos R, y con su ayuda estimaremos los parmetros de inters.
En cuanto al estimador de regresin, como te imaginars, utiliza la tcnica usual de regresin de
mnimos cuadrados. Es deci a el hecho de que X est relacionada linealm lo utiliza para hacer
estimaciones. Tambin de nsiderar que en algunas ocasiones pue es enco una variable asociada
a nuestra variable de inters, en este caso le llamaremos estimacin por regresin mltiple y tambin utilizaremos
, el mtodo de regresin considerando un diseo basado en un muestreo simple al azar y despus
considerar os variantes.
Recuerda que el modelo de regresin por si solo describe una relacin entre las variables implicadas y
ue e nos
la
todo de diferencia es una variante del de regresin que fija a igualndolo a la
unidad, moviendo a
re
re
su dimetro podra servirte como vari
podras utilizar como variables auxiliares el rea del bosque, la altitud promedio, etc. En muchas estimacio
poblaciones humanas pueden serte de utilidad censos previos como variable auxiliar.
La informacin auxiliar puede ser usada en muestreo tanto en el diseo como en la estimacin.
estratificacin basada en el tipo de vegetacin o la altitud representa su uso en el diseo; mues ea
reemplazo con probabilidades proporcionales al tamao tamao de la parcela o l rbol- es otra
de utilizar informacin auxiliar en el diseo.
En cuanto al uso en la estimacin, analizamos la relacin que existe entre Y
i
y X
i
para producir
estimaciones ms precisas que con las estrategias que solo usan la variable Y. Algunas veces la variable X pu
ser conocida en toda la poblacin y en otras tan solo en las unidades incluidas en la muestra.
Los estimadores de razn, regresin y
a

n e tradas aleatoriamente tal como en un muestreo simple aleatorio. C
re

r, tom ente con Y y
bes co d ntrar ms de
primero
em

q uno de nuestros objetivos naturales es la prediccin sobre la variable Y, as que puede darse el caso qu
interese predecir la media o el total poblacional o simplemente el valor de Y en una unidad no incluida en
muestra.
El m
y hacia arriba o abajo por una diferencia que veremos ms adelante.
Es importante que observes que ni los estimadores de razn, ni los estimadores de
reg imp bajo los supuestos usuales de
egresin el estimador sea insesgado.
Estimador de una Razn Poblacional mediante una Muestra Aleatoria
Simple

Como ya hemos mencionado frecuentemente nos valemos de unas variables para
exp ayor
e medirlas nos representara un costo mayor que el de medir
lgu d . As pues, podemos construir relaciones que nos ayuden, a
s cuales les llamaremos razones.

Definicin
resi n son insesgados bajo muestreo s le aleatorio aunque
r
licar otras, ya sea porque estas ltimas son de difcil manejo, porque deseamos m
precisin o simplemente porqu
naestrechamente relaciona a a
la
Razn Poblacional (R)
Es la relacin que se establece entre dos variables, la cual podemos utilizar para obtener un estimador
poblacional.
99

Como usualmente se usa, propondremos a X como la variable independiente, de la cual ya tenemos informacin y
a Y como la variable dependiente de la cual nos interesa obtener estimadores.

Supn que los valores de X son conocidos para toda la poblacin y que existe una relacin razonable
1

ntre Y y X.
Tengamos en cuenta la siguiente notacin,

e

=
=
N
i
i X
x
1

N
X X
=
Lo que denota el total y la media poblacion riable X respectivamente, y con los cuales podrs
obtener
definiremos,
al de la va
los estimadores de razn de la variable Y.

En la poblacin
X Y
R =

Razn Poblacional R

N
i
y
i
x
= i 1
= i 1
(1)

=
N
R

As que tomando una muestra como en un o simple de tamao n de los valores de Y y
sus correspondientes valores asociados X, (es decir en ca d muestral se miden Y y X), definiremos el
estimador de razn poblacional, como s ,


muestreo aleatori
de da unida
igue
Estimador de la Razn Poblacional r

i
y

= i 1

=
n
i 1
=
i
x
r (2)
n

Como
ayuda a conoce
en los casos anteriores es muy importante el clculo de la varianza del estimador, ya que nos
r ms acerca de nuestra estimacin, este caso presenta una diferencia considerable a los casos
nteriores. As, la varianza estimada del estimador de razn es,

a

Varianza del estimador de la Razn Poblacional r


1
Se ver qu significa razonable en una seccin posterior.
100


2
2 r
s
x
nN

1
1
1
) (
n
i
i
n
i
i
n N
x
y
V r V

=
=

(3)
donde,

=
( )
1
1
2
2

=

=
n
rx y
s
n
i
i i
r


Unos de los aspectos importantes en el anlisis
confianza ya que es la manera correcta de presentar
de la informacin es la obtencin del el intervalo de
el resultado de nuestras estimaciones pues nos da la
referencia tanto de la medida de tendencia central com la de dispersin de los datos. o


Intervalo de c fianza de r

on
( )
2
2 , 1
1
2
r
x
n
s
x
nN
n N
t r



(4)



jemplo. Estrategia de ventas
Cierta empresa desea hacer una revisin importante en el negocio, para tomar la decisin necesita saber
el cambio en cuanto a ventas de este ao con respecto al ao pasado. Contamos con las ventas de ciertas semanas
tanto del ao pasado como del actual, las cuales se muestran a continuacin, adems debemos considerar que el
total de semanas para nuestro ejercicio es de N=52.
Cuadro1. Historial de ventas.
Semana Ao Anterior Ao Actual


E
1 133, 156,586,208 982,515
2 131,069,700
3 135,596,521
151,643,509
140,852,992
4 144,482,069 142,839,105
5 134,659,268 146,231,936
6 128,680,124 141,581,937
7 133,006,199 143,856,129
8 126,893,873 136,244,690
9 126,154,637 138,098,420
10 130,592,240 140,385,232
11 134,258,092 416,575
12 131,355,235 145,159,514
13 134,057,397 145,264,370
14 145,411,521 145,225,881
= 1,870,199,392 = 2,018,386,497
144,
101

= x 133,585,671 = x 144,170,464

cional o el cambio que existe entre las ventas del ao anterior y el
)
La razn pobla
actual lo podemos obtener con la ecuacin (2 .

08 . 1
392 , 199 , 870 , 1
97 , 386 , 018 , 2 4
=
= r

la o anterior a razn de 1.08, es decir,
8%.

p la sig nte manera,
Lo que significa que venta se ha incrementado con respecto al a
La varianza de esta estimacin, la podemos obtener a licando la ecuacin (3), de uie
( )( )
000137 . 0
10 699 . 4
10 785 . 1 52 14
) (
13
16

= r V

1 14 52
=


Y el intervalo de confianza con 90% de confiabilidad lo obtenemos con el resultado
anterior y la ecuacin (4),
( ) 1046 . 1 , 0539 . 1



Estimador de Razn de la Media y el Total
Poblacional
Algunas veces lo que te interesar es estimar la media o el total poblacional, pero desconoces el tamao
lo que utilizar el estimador de y N =

de la poblacin, por no te ser posible. Si conoces la relacin que existe


ntre el total de la variable auxiliar X y su media
x
X

, podrs estimar a N, en este caso utilizando la medida del e


tamao
X
, en vez de la poblacin N. Este mismo principio se utiliza en la estimacin de razn de la media
poblacional, como se muestra a continuacin.


Estimador de Razn de una Media Poblacional


( )
X
r =
X
n
i
i
n
i
i
Y
x
y

=
=

1
1
(5)

La por la
s
importantes en nuestro anlisis. A continuacin se muestra la ecuacin que la define.
varianza se calcula tan slo multiplicando la media poblacional de nuestra variable auxiliar
varianza de nuestro estimador de razn. Y como en los casos anteriores resulta ser una de las estimaciones m
102



Varianza Estimada de

Y



( )
2
2
r
s
nN

=
onde
2
r
s , es como se defini en (4)
X Y
n N
r V V

=



(6)
D

a medio y
analizar su eficiencia con otros estimadores. Un estim n puede ser ms preciso cuando es menor
ndo Y y X estn altamente correlacionadas y tiene una relacin lineal con ordenada al
origen. Esto se demuestra en el apndice terico.
Tambin puedes observar que la varianza tiende a tener valores grandes con muestras que tienen valores
grandes de
R es un estimador sesgado, lo que significa que sera de inters comparar su error cu drtico

2
r
ador de raz
que
2
. Lo cual se da cua
x y viceversa, por lo que el estimador ajustado es,

=

Y
X
Y
V
x
V

2
) (
o
(7)

Una aproximacin 100(1-)% para el intervalo de confianza de
Y
, basndonos en la
aproximacin normal est dada por,

( )


Y
V
2

n Y
t
, 1
(8)
Donde
( ) 2 , 1 n
t denota el punto 2 superior de la distribucin t-student con
grados de libertad.
n-1
La varianza ajustada alternativa

Y
V
o
ued su ida en la expresin (8).
Ejemplo. Compaa de autobuses
El dueo de una compaa de autobuses desea estimar la cantidad promedio de dinero gastado en el
l ao en la compra de la gasolina de su flota que cuenta con 700 camiones. En los registros
cuenta con todos los gastos del ao pasado por cada o de sus camiones, y de una muestra aleatoria obtuvo los
s camiones durante el primer cuarto del ao actual, los datos se resumen a continuacin,

N=700 n=50

Utilizando los datos anteriores y la ecuacin (5)

, p e ser stitu


primer cuarto de
un
gastos de 50 de su
22 3,658,050.
50
1
=

= i
i
y 75 3,653,379.
50
1
=

= i
i
x
( )
42 . 541 , 30
43 . 502 , 30
75 . 379 , 653 , 3
22 , 050 , 658 ,

3
=

=
Y


103


Lo que significa que el promedio de gasto en gasolina por camin es de 30,541.42
o del ao.
Donde
durante el primer cuart
X
se calcul como sigue,
700 .50 21,351,697 =
= N
X

30,502.43 =

La varianza de este estimador la obtenemos co l e, n la ecuacin (6) y es a siguient

( )( )
( )
16 3,782,836.
7.81 203,691,17
700 50
50 700
=


y
V

Donde
2
r
s puede calcularse como sigue,
7.81 203,691,17
49
712.60 9,980,867,
49
3,868.94 318,517,42 7,503.41 637,100,34 - 1,347.07 328,563,79
2
50
1 i
50
1
2 2
50
1
2 2
=
=
+
=
+ =

= = = i
i
i
i i i r
x r y x r y s

tenidas, se trata de valores grandes
por lo que sera conveniente utilizar el estimador ajustado de la varianza que es el que se
encuentra en la ecuacin (7) y se obtiene a continuacin,

Sin embargo, como podrs notar por las medias ob
( )
659,229.51
16 3,782,836.
73,067.60
30,502.43
2

o
) (
=

=
Y
V
Por lo tanto el

intervalo de confianza con un 90% de confiabilidad est dado por,
( )
( ) 32,173.05 28,909.79,
51 . 229 , 659 010 . 2 42 . 541 , 30

Lo q se encuentra entre 28,909 y 32,173 pesos.
sos lo que resulta de inters es la estimacin del total de la poblacin, como habamos
riormente, es interesante ver que la estimacin del total es posible obtenerla a travs del total
poblacional de la variable auxiliar y la estimacin de la razn. A continuacin presentamos las expresiones que
definen a sus estimadores.


ue significa que la media de la poblacin

En algunos ca
comentando ante
Estimador del Total Poblacional

104


( )
( )
X
X
n
i
i
n
i
i
Y
r
x
y

=
=

1
1
(9)

La varianza de nuestro estimador se obtiene tan slo multiplicando la varianza de nuestro estimador de la
media por el total al cuadrado de la varianza de la variable auxiliar.








Varianza Estimada del

Y


( ) ( )
( )
1
1
1
2
2
2


=
=

=

n
rx y
nN
n N
r V V
n
i
i i
X
X
X
Y


(10)



Por ltimo presentamos la expresin que define su correspondiente intervalo de confianza.

Intervalo de Confianza


( )
) (
2
, 1
Y
n
Y V t



(11)
En caso de desconocer N, podemos utilizar el sigu nte estimador, ie

( ) ( )
( )
1

1 1
1
2
2
2 , 1 2 , 1

=
rx y
n
i

n
x
n
t V t
i
i
X n
Y
n




Ejempl
dueo de la compaa de autobuses es saber la cantidad total
e dinero que gastar al trmino del primer cuarto del ao actual y la obtenemos con la
cuacin (9),
o. Compaa de autobuses
Ahora lo que le interesa al
d
e
105

( ) =

x
y r
( )(
21,378,993
5 . 697 , 351 , 21 002 . 1
=
= )
stimacin del dinero que el dueo gast es todos sus camiones durante el primer cuarto
el ao es $21,378,993.
a varianza del estimador la obtenemos con la ecuacin (10),

Es decir, que la e
d
L
( )
( )( )
( )
718,054.83 1,853,589,
7.81 203,691,17
30,502.43
1
50 700
50 700
993 , 378 , 21
2
=


y V


Por ltimo, el intervalo de confianza con un 90% de confiabilidad, se calcula como sigue,
( )
( ) .17 24,114,960 .70, 18,643,026
1,361,466 010 . 2 .44 21,378,993

Lo que se frasea como que con una confiabilidad del 90% puedo afirmar que el gasto total
de mi flota durante el primer cuarto del ao se encuentra entre $18,643,026 y $24,114,960.

Seleccin del Tamao de Muestra
Recodars de captulos anteriores que la precisin de la informacin extrada de una
muestra depende de la dispersin de los datos que la constituyen, sin embargo esto puede ser
controlado con la aplicacin de un diseo adecuado y del nmero de observaciones que
decidamos contener en la muestra.
Para seleccionar el tamao de la muestra n, utilizars el mismo procedimiento que en el muestreo simple
aleatorio, en este caso, para estimar
Y
,
Y
R con un error de B unidades. Es decir, determinamos el nmero
de observaciones requeridas para estimar una razn poblacional, con un lmite de error de estimacin de
magnitud B. Esto se logra estableciendo t
(/2)
desviaciones estndar del estimador de razn igual a B y despejando
n de esta expresin. Es decir, se resuelve la siguiente expresin,
( ) B r V t
n
=

2 ,
(12)
para n, donde es la varianza estimada de r, lo que resulta en l siguiente ecuacin,

) (r V

Tamao de muestra requerido para estimar R con un lmite


para el error de estimacin B

( )
2
2
2 , 1
2
r
n
r
t
B
N
N
n

(13)

106

Podrs notar que en este caso te encuentras con el parmetro , el cual probablemente aun no
conozcas. Si esto ocurre, debers hacer un muestreo preliminar y calcular con la ecuacin (4), as podrs
sustituir esta estimada en la ecuacin (13).
Ejemplo. Compaa de autobuses
upn que te gustara tener un error de estimacin de 0.1 en el estimador de la razn, el
tam gue,
2
r

2
r

S
ao requerido para este error de estimacin lo obtenemos con la ecuacin (13) como si
( )( )
( )( )
5 . 78
81 . 177 , 691 , 203
43 . 502 , 30 1 . 0
700
81 . 177 , 691 , 203 700
2
+

= n
010 . 2

=

Lo que significa que con 79 unidades en la muestra tenemos un error de estimacin con
respecto al estimador de razn de 0.1 con un 90% de confiabilidad.

El clculo del tamao de muestra requerido para estimar la media y el total se hace de manera anloga, a
los casos de anteriores, y se expresa con las siguientes frmulas.

Tamao de muestra requerido para estimar
y
con un lmite para el error de estimacin B

( )
2
2
2 , 1
2
r
n
r
t
B
N
N
n

(14)


Ejemplo. Compaa de autobuses
Ahora supn que el dueo de la compaa de autobuses no est conforme con el
intervalo de confianza obtenido para la media estimada, pues necesita tener mayor control
sobre los gastos de su empresa y el lmite de error que puede tolerar es de $1,500, as que el
tamao requerido para este error de estimacin lo obtenemos con la ecuacin (13) como sigue,



( )( )
( )
16 . 240
81 . 177 , 691 , 203
010 . 2
1500
700
81 . 177 , 691 , 203 700
2
=
+

= n

Es decir, el nmero de unidades necesarias en la muestra para tener un error de estimacin de $1,500 con
respecto a la media estimada es 240.






Tamao de muestra requerido para estimar
y
con un lmite para el error de estimacin de magnitud
B

107

108
( )
2
2
2 , 1
2
2

=
n
t N
B
N
N
n (15)



Ejemplo. Compaa de autobuses.
Ahora supongamos que el dueo de la compaa de autobuses est interesado en obtener el tamao de
muestra necesario para tener un error de estimacin de $2,000,000 con respecto al total estimado,

( )( )
( )
( )( )
08 . 88
81 . 177 , 691 , 203
01 . 2 700
000 , 000 , 2
700
81 . 177 , 691 , 203 700
2
=
+

= n


Por lo tanto son necesarias 88 unidades muestrales para tener un error de estimacin de
$2,000,000.


En qu caso utilizaramos estimacin de razn?
Ya hemos mencionado algunas situaciones en las que la estimacin por razn es utilizada, a continuacin
listamos algunas otras.
1. Cuando necesitamos estimar una razn. Por ejemplo, si te interesa saber la velocidad promedio para llegar
en auto a cierto destino, utilizaramos su equivalente que es la razn entre la distancia y el tiempo; otro
ejemplo sera relacionar el ingreso per cpita de las familias de un cierto estado, o el incremento promedio
del ao anterior contra el ao actual del precio de ciertos productos, etctera.
2. Puede darse el caso de que necesites estimar un total poblacional, pero desconoces N, ya sea porque es
difcil medirla o porque resultara muy costoso. Esto se soluciona si conocemos el total de su variable
aux i nos
r una
n,
iliar el cual puede ser fcil de medir y lo utilizamos en el estimador de razn. Por ejemplo s
interesara saber, el nmero de peces que miden alrededor de 17cm en cierto estanque, podramos toma
muestra y obtener la proporcin de peces del tamao requerido en la muestra y multiplicarlos por la raz
x
x


que estima la cantidad total de peces en la redada, donde X es la variable peso.

3. Tambin se utiliza para aumentar la precisin de las estimaciones ya que si las variables
X y Y estn relacionas linealmente a travs del origen y su correlacin
0.5. En forma grfica se vera as,






4. Frecuentemente se usa para ajus de la muestra de modo que reflejen
totales demogrficos, por ejemplo, una universidad cuenta con 4,000 estudiantes de donde


tar las estimaciones
Y
X
Y
X

se extrae una muestra aleatoria de 400 estudiantes que contiene 240 mujeres y 160
hom 84 de las mujeres y 40 de los hombres de la muestra planean seguir la
carr ial. Si slo se utiliza la informacin de l simple, tu
esti

bres, dond
era magister
maras que,
e
a muestra aleatoria
1240
400
124
4000 =
estudiantes planean ser maestros. Si sabemos que la universidad tiene 2700 mujeres y 1300
hombres, una mejor estimacin de la cantidad de estudiantes que planean seguir la carrera
magisterial sera,
1270 1300
160
40
2700
240
84
= +
Este ltimo ejemplo refleja adems de la estimacin de razn una variante en el diseo del muestreo,
notars que es una especie de estratificacin por gnero.
r estimacin de razn, en caso de presentarse ausencia de respuestas, por no ser
posible medirlas u obtenerlas, aprovechando la relacin existente entre Y y X.
.
adas
. Sin
e dos
ades
una
se
s de
tes
e de inters y, al
valor x tados
.
que
Donde el valor de denota la pendiente y el valor de la ordenada al origen de la lnea que se ajusta por
mtodo de mnimos cuadrados. As que sustituyendo el valor de , el estimador puede escribirse as,

5. Tambin puedes utiliza

Estimador de Regresin
Como estudiaste en la seccin anterior, existen relaciones entre las variables que pueden ser utiliz
para obtener un resultado ms preciso o simplemente para facilitarnos el estudio del fenmeno en cuestin
embargo el mtodo de razn resulta apropiado cuando existe una relacin lineal y a travs del origen entr
variables, lo cual no siempre ocurre, por lo que abriremos aun ms nuestro espectro de posibilid
introduciendo un estimador de regresin de la media
y
. En este caso tambin debemos conocer alg
informacin de nuestra variable auxiliar X como su media poblacional
x
. Para diferenciar los parmetros que
estimarn utilizaremos el subndice L.
El estimador que se propone a continuacin supone que los valores de X son conocidos y fijo
antemano, mientras que los de la variable Y son variables aleatorias y que conocemos sus correspondien
valores en la variable X.
Supongamos que la i-sima unidad en la poblacin est asociada al valor y de la variabl
i
i
de una variable auxiliar, para i=1,...,N. La media y el total poblacional de los valores de Y son deno
por y respectivamente. La media y el total poblacional de X sern denotados como al inicio del captulo

Para expresar los estimadores, supondremos que existe una muestra aleatoria simple de tamao n y
existe una relacin lineal entre Y y X.
El estimador de regresin de la media de una poblacin se ve as,
x L


+ =

el



Estimador de Regresin de una Media Poblacional
yL


( ) x y
X YL
+ =

(16)

109

donde,
( )( )

( )


i
x x
(17)


n
i i
x x y y
=
=
n
i
2
1

= i 1

A c ayor

ontinuacin presentamos el estimador de la varianza de
YL
el cual nos ayudar a tener m
informacin de la poblacin en cuestin.

a estimada del Varianz estimador

YL


( ) ( )


= =

n
i
n
i
i i YL
x x y y
n Nn
n N
V
1 1
2
2
2
2
1
(18)

As que un intervalo de aproximadamente (1-)100% de confianza construido de la forma comn es
dado por,

Intervalo de Confianza del estimador de


YL



( )

yL n yL
V t
2 , 2


(19)
Donde
( ) 2 , 2 n
t es el punto /2 superior de la distribucin t-Student con n -2 grados de libertad.
El teorema central del lmite para el estimador de regresin para una poblacin finita, en el cual se
el procedimiento para obtener el anterior intervalo de confianza es dado en Scott y Wu (1981). Sin emb
estudios empricos de estimadores de regresin y razn para poblaciones reales con muestras de n =32 hecho
Royall y Cumberland (1985) muestran que las probabilidades reales cubiertas, usando el estimador de la var
estndar son tan buenas como las propuestas alternativas, y podran ser substancialmente menores que el niv
confianza nominal. En un estudio terico subsecuente, Deng y Wu (1987) comparan estimadores de varianza
alternativos y proponen que diferentes estimadores son usados dependiendo si el propuesto est estiman
error cuadrado medio o construyendo un intervalo de confianza.
basa
argo,
s por
ianza
el de

do el
Ejemp
e los
ro el
, hay
Para
cador
o)
que
edia poblacional es igual a 5.0gm. Debes tomar en cuenta que el muestreo se basa en una
roducc tra se

lo. Anlisis de calidad
T eres el gerente de calidad de una planta productora de jeringas y deseas obtener fcilment
indicadores de confiabilidad sobre un tubo de vidrio que es cortado por una mquina automticamente, pe
proceso de medir la longitud de cada tubo de que sale de la mquina cortadora sera muy caro. Sin embargo
una forma rpida de hacerlo, al mismo tiempo de ser una forma menos cara y ligeramente menos precisa.
esto se sabe que existe una relacin clara entre dos indicadores, es decir que podemos predecir el indi
deseado (indicador 2=longitud del tubo) con un indicador del cul ya sabemos sus datos (indicador 1=pes
pues se calcula por medio de una bscula que tiene la mquina a la salida de la banda de produccin, por lo
sabemos que su m
p in de 100 tubos de vidrios que son los correspondientes a un lote estndar. Los datos de la mues
dan a continuacin,

110

Cuad
dicador 1
(gm)
Indicado
ro 2. Indicadores de calidad
In r 2
(cm)
( )( )

=

n
i
i i
x x y y
1
( )

=

n
i
i
x x
1
2
4.10 2.10 0.47 2.85
2.20 1.50 3.15
12.88
2.70 1.70 2.09
9.54
6.00 2.50 0.03
0.04
8.50 3.00 1.69
7.35
4.10 2.10 0.47
2.85
9.00 3.20 2.64
10.31
8.00 2.80 0.93
4.89
7.50 2.50 0.21
2.93
= x 5.79
= y 2.38 =11.68 =53.65
Utilizando la frmula (16), podemos obtener el estimador de regresin, como sigue,
Donde se obtuvo con la ecuacin (17) y es como sigue,
( )
206 . 2
79 . 5 0 . 5 218 . 0 38 . 2
=
+ =

YL

218 . 0
65 . 53
68 . 11
= =


Para obtener el intervalo de confianza primero debemos saber la varianza que es fcilmente calculable
con la ecuacin (18), como sigue,
( )
( ) [ ]
0016 . 0
649 . 53 2176 . 0 656 . 2
7
1
9 100
9 100
2
=


YL
V

Por lo tanto el intervalo de confianza con una confiabilidad del 95% es,

( ) 2.321 2.090,



Extender la idea a estimar el total es muy sencillo. Esto se presenta a continuacin,
Estimador de Regresin Lineal para un Total Poblacional


( ) x N y N
N
x
yL
L
+ =
=



(20)
Donde su varianza se obtiene multiplicando la

varianza de por N
2
.
YL
111


Ejemplo. Anlisis de calidad
El mismo gerente del ejercicio anterior desea saber la cantidad total de metros de tubo de vidrio
que ha gastado en el ltimo lote estndar.
)
Lo que significa que produccin ha cortado un tubo de vidrio de 220.606cm.


Estimador de Diferencia
Por ltimo estudiaremos el mtodo de diferencia, el cual al igual que los dos anteriores utiliza una
variable auxiliar llamada que llamaremos X para estimar a la de inters Y, as pues los objetivos son los
mismos, es decir estimar una media o un total poblacional por medio de muestreo, ajustando el valor de
( )(
220.606
2.206 100
=
=

L

y hacia arriba o hacia abajo en una cantidad que depende de la diferencia

x
X
, tomando el
coeficiente igual a uno, por lo que este mtodo resulta aun ms fcil que el de regresin y algunas veces
el estimador resulta ser tan preciso como el de regresin. As, las frmulas siguientes resultan vlidas
siempre y cuando se utilice muestreo simple aleatorio.



Estimador de Diferencia de una Media Poblacional
YD



( )
d
x y
X
X YD
+ =
+ =


(21)
donde,
x y d =

A continuacin presentamos el estimador de la varianza que como podrs observar, se trata de una
adecuacin del de regresin.




Varianza Estimada del Estimador de

YD



( )
1
1
2


=

n
d d
n N
n N
V
n
i
i
YD
(22)
donde

i i i
x y d =
Por ltimo presentamos el intervalo de confianza el cual nos indica los lmites en los que se
encontrar nuestra estimacin.
Intervalo de Confianza de


YD


112


( )

YD n YD
V t
2 , 1
...(23)

Ejemplo. Anlisis de calidad
Con base a nuestra aseveracin acerca de que el estimador de diferencia estima igual de bien que
el de regresin, aplicaremos el mismo ejemplo que en la estimacin por regresin. A continuacin
aplicamos la frmula (21).

Y la varianza la obtenemos aplicando la ecuacin (22),


( )
59 . 1
79 . 5 5 38 . 2
=
+ =

YD


( )( )
( )
4164 . 0
11 . 4
9 100
9 100
=


yD
V

Por ltimo, el intervalo de confianza con una confiabilidad del 95% es como
aparece a continuacin,
( ) 114 . 3 062 . 0
4164 . 0 36 . 2 59 . 1

Es evidente que en este caso, resulta ms apropiado usar el estimador de regresin que el de
diferencia. Esto se debe a que es muy diferente a 1, cuando sucede esto, el estimador de regresin es
mejor que el de diferencia.
A continuacin presentamos un ejemplo en el que resulta ms apropiado el
estimador de diferencia.
Ejemplo. Productos de mayoreo
e productos a mayoreo desea saber el incremento que hacen sus
lien presa distribuye 1,000 productos y hace un muestreo de algunos de
llos para compara el precio de venta mayorista - intermediario (X) e intermediario - consumidor (Y), a
dro 3. Ventas mayorista
vs intermediario
Cierta empresa negociadora d
tes al consumidor final, esta em c
e
continuacin se muestran los datos,
Cua
( )

=

n
i
i
d d
1
2

X($) Y($)
2 2.5 0.0060
2.5 2.7 0.1427
3 3.6 0.0005
4.5 5 0.0060
5 5.6 0.0005
6.5 6.9 0.0316
7 7.4 0316
8 9 0.1783
0.
9 10 0.1783
= x 5.28
=5
= y 5.86 =0.0719


Aplicando nuevamente la ecuacin (21) obtendremos el estimado de diferencia.
( )
58 . 5
28 . 5 5 86 . 5
=
+ =

YD


Y la varianza,
113



( )( )
( ) 0719 . 0
9 100
9 100


yD
V

00727 . 0 =
Por ltimo, el intervalo de confianza con una confiabilidad del 90% es como
aparece a continuacin,
( ) 77 . 5 37 . 5
00727 . 0 36 . 2 58 . 5

De esta manera podemos afirmar que la media de la poblacin se encuentra entre $5.37 y $5.77.
Lo que significa que el incremento general que hacen los intermediarios a los clientes es
( ) % 5 . 11 100 5 77 . 5 = = I .






APNDICE. Revisin Terica

Estimador de Razn
Se supone que el total (por lo tanto la media) de la variable auxiliar es conocida.
Como definicin deR aceptamos la expresin siguiente,
X
Y
R

=
Donde,

=
y =
i
i Y
y
N

N
1
1

=
=
N
i
i X
x
N
1
1


Tambin se dio como el estimador de razn de
Y
a,
R
X Y
=
Para justificar esta parte, procedamos como sig

Deseam
ue,
os estimar
Y
el cual est dado por,


+ =
S i s i
i i Y
y y
y conocemos .
S

Sea
x
y
y
R
S i
i
= =

donde
x
S i
i

=
n
y y
1
y

=
=
n
i
i
x
n
x
=
i
n
i 1 1
1

Dado que creemos en la definicin de R, podemos asumir que esta se mantiene
con las partes no incluidas en la muestra. Es decir,

114

S i
i
x
Por lo tanto,

=
S i
i
y
R

=
S i
i
S i
S i
i
S i
x x
...(1b)
i i
y y
Nt cemos a


ada la
ese que


+ =
s i
i
s i
i Y
y y , de la que no cono

s i
i
y


D relacin en (1b),


=
S i
i
S i S i
i
s
i
x
y
Y adems sabemos que
estim

i
y x


=
S i
i x
S i
i
x x

El ador de
Y
es entonces,

= =


R
x
y
x
X
i
S i
i X
S i
i


y x y y x
y x
x
y x
S i
S i
i
S i
i
S i
i X
S i
i
S i
i
S i
i
S i
i
S i
i X
S i
i
S i
i
S i
i
S i

Si dividi

+ =

y
i Y

+ =

x
y
S i
i
=
mos entre N, entonces,

= R
X Y

115


Estimador de Regresin

Supongamos que queremos estimar el total
Y
usando una variable auxiliar X. Se asume que la
relacin entre X y est d Y ada por,
i i
x
i
y + + =
Tambin,
i i
x y + =
Si deseamos estimar el total
Y
como mencionamos, sabemos que,
Por lo que aprovechando la relacin existente entre y podemos estimar a
Supongamos que y se estiman con mnimos cuadrados usando la muestra. Es decir,
calculamo y y se sabe que,


+ =
S i S i
i i Y
y y

i
y
i
x ,

S i
i
y .
s

x y

=
Donde,

=
=
n
i
i
y
n
y
1
1
y

=
=
n
i
i
x
n
x
1
1

Ahora,
Entonces,
( )
( )

+ =
+ =

+ =

S i
i X
S i
i
n
S i
i
n
S i
i
x n N
x n N
x y




( )
( )
( ) ( )
( )
( ) x N y N
x N y N
x n x n N x N y N
x n n N x y n N y N
x n x y n N y N
x n N y
X
Y
X
X
X
X
S i
i X
S i
i
Y
+ =
=
+ + =
+ + =
+

+ =

+ + =










Dividiendo entre N,

( ) x y
X Y
+ =



El cual es el estimador de regresin de la media poblacional.
116








Propiedades
En esta parte discutiremos las propiedades de los estimadores de razn y regresin, incluyendo
fundamentalmente los valores esperados de las varianzas-


Estimador de Razn
El estimador de razn de est dado por,
Donde,

Y

X Y
R

=
X
Y
R

= y

=
=
N
i
i X
x
N
1
1
,
Entonces,

Lo que debemos obtener es el valor esperado de


R E E
X Y

R , para lograr encontrar el valor esperado de


. Esto se logra mediante una expansin en serie Taylor de
Y

R alrededor de los parmetros. Es decir,


x
y
R =


Entonces la expresin en serie de Taylor incluye las primeras y segundas derivadas de

R .
( )
2
1 .
x
y x
=


Por lo tanto,
( ) ( ) ( ) ( )( )
( ) ( )
( ) ( ) ( )
( ) ( ) ( ) [ ]
sesgo R
y Cov x Cov R x Cov R R
y Cov x Cov R x RCov R
y x Cov x Var R
y x x y
x
x E R E
XY
XY
X X
Y
X X
X
X
X
Y
Y X
X
Y
X
Y
+
+ =
+ =
+ + =

+ + =

2
2
2 2
2
2
3 2
,
1
0 0
1
2
2 1

[ ] sesgo sesgo R sesgo R
Y X X X
+ = + = + =

Y
es un estimador sesgado

117

Con respecto a la varianza, usaremos el mismo principio, slo que usaremos una aproximacin
de primer orden. Entonces, tomemos las primeras derivadas parciales de

R con respecto a x y y ,
( )
2
.
x
y
x
=

y
( )
x y
1 .
=


Entonces,
( ) ( )
Y
X
Y
X
X X
Y
y x R

+ =

2
1

Lo que implica,
( ) ( )
( ) ( )( ) ( )
2
4
2
3
2
2
2
2
2
1
1
Y
X
Y
Y X
X
Y
X
X X
Y
Y
X
Y
X
X X
Y
y y x x R
y x R

+ =


Lo que implica,
( ) ( ) ( ) y Var y x Cov x Var R Var R E
X
Y
X
Y
X X
Y
4
2
3 2
2
, 2
1

+ =



( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( )
[ ]
( )
( )

=
+ +

=
+ =
+ =

+ =

N
i
i i
y y x x
X
Y
X
Y
X
Y
X
Y
X
X
X Y
N N
Rx y
N n
S R RS S
N n
y Var R y x RCov x Var
y Var y x Cov x Var
y Var y x Cov x Var
R Var Var
1
2
2 2
2
2
2
4
2
3 2
2
2
1
1 1
1 1
, 2
, 2
, 2
1



Un estimador dond , est dado por, de


Y
Var e

= R
X Y

( )
( )

N
i
i i
Y
N N
Rx y
N n
Var
1
2
1
1 1

Donde,
x
y
R =




Estimador de Regresin
Para derivar la varianza del estimador de regresin podemos hacer una de las
funciones . Por definicin una funcin est dada por un estimador como sigue,


118

Las propiedades fundamentales de estas funciones son las siguientes,
0
1
=

E E ; y

+



1
2 2
1


Var
E E Var
. Para aplicarlas al estimador de regresin definamos las siguientes funciones
Y
Y Y
Y


=


X
X X
X


=


XY
XY XY
XY
S


=
2
2 2
2
X
X X
S
S
X


=
2
X
XY

= Adems, usamos la expresin alternativa de


Dado el estimador de regresin para el total
Y
, tenemos que,

+ =

X X Y YR
2
1
1


=
n
i
X i
X i
n
i
Y i
x
x y



Ahora usando las funciones , el estimador de regresin puede rescribirse como, YR

( )
( )
( )
( ) [ ]
X X X
S
XY
Y Y
YR
X

+
+
+
+ + =

1
1
1
1
2


Notemos que las componentes aleatorias de la ltima ecuacin son las s ' ya que
Y
, y
X
son parmetros.

Desarrollando la expresin, obtenemos,
( ) ( )( )
( )
2
1
1 1 1
X
XY XY
S
X X S X S
Y Y Y
YR



+
+ + +
+ + =



Lo que implica,
( ) ( )( )
( )
2
1
1 1 1
X
XY XY
S
X X S X S
Y Y Y
YR



+
+ + +
+ =


Elevando al cuadrado ambos trminos y haciendo el lgebra correspondiente obtenemos,
( ) ( L L
2 2 2
1 1 2
2 2 2 2 2
2
X X
XY
X
XY S
X X
S
S
S
S Y X Y X Y Y Y
YR + + + + + =

)
Tomando la esperanza de esta ltima expresin, encontramos,

119

120
( ) ( ) ( )
( )
[ ]
( )
( )
2 2
2 2 2
2 2
2
2 2
2
2
2 2 2 2 2
2
1
1
2
1
2
2
2
XY Y
X XY Y
X XY
Y
Y
Y
X
Y X
XY
Y X
Y
Y
Y
X X Y X Y X Y Y Y
YR
n
f N
n
f N
Var
Var Var
E E E E


=
+

=
+

=
+ =




Donde es el coeficiente de correlacin entre X y Y.
Un estimador natural de est dado por,
XY

YR Var
( )
( )
2 2
2
1
1
r s
n
f N
Var
Y
YR


Donde r=coeficiente de correlacin muestra, y,

2
1
2
1
1

=
n
i
Y i Y
y
n
s
















APNDICE II. Hoja de Clculo


El texto cuenta con un disquete que tiene un archivo en Excel con 7 hojas de clculo, cada una
con el nombre del diseo de muestreo que contiene las frmulas para calcular sus
correspondientes estimadores.







En cada hoja se indican las instrucciones de uso para obtener los principales estimadores. Para
ejemplificar este punto a continuacin presentamos algunos ejemplos vistos en el captulo, los
cuales pueden variar por redondeo.


Es importante mencionar que estas hojas pueden usarse con diferente tipo de informacin, segn
sea conveniente.


Es recomendable copiar la hoja de clculo y guardarla con otro nombre para evitar la prdida de
alguna frmula.



121


Ejemplo Razn. Compaa de autobuses




En este ejemplo necesitbamos estimar la media y el total poblacional de nuestra
poblacin, las dos estimaciones pueden ser estimadas por la hoja de clculo al mismo
tiempo y son las que aparecen en el cuadro anterior con sus correspondientes intervalos
de confianza, en este caso calculados con un 90% de confiabilidad.
Tambin encontraras los tamaos de muestra necesarios para estimar con un error
determinado.



122

123

Ejemplo Regresin. Anlisis de calidad


En este ejemplo calculamos el estimador de la media con su correspondiente intervalo de
confianza ayudndonos de la informacin de otra variable, tal y como lo explicamos a lo largo del
captulo. Tambin aparece una grfica que construimos con algunos de los estimadores para poder
visualizar la existencia de una relacin lineal.






APTULO 6



MUESTREO
SISTEMATICO






INTRODUCCIN

El fundamento terico que da sustento a los mtodos revisados
anteriormente es la forma aleatoria de seleccionar la muestra, la cual como te
habrs dado cuenta, implica un proceso un tanto complicado y costoso.
Es aqu donde entra el diseo de muestreo o de encuestas por muestreo
sistemtico, el cual es ampliamente utilizado pues representa una significativa
reduccin del proceso de seleccin de la muestra. Como veremos, este diseo
elimina la necesidad de desarrollar mtodos de aleatorizacin elaborados ya que
slo requiere fijar un intervalo y de ah recorrer la poblacin seleccionando las
unidades que se encuentren en el punto seleccionado del intervalo. Esto,
evidentemente facilita el trabajo de campo en el muestreo y reduce sustancialmente
los errores que se podran cometer en caso de hacer uso de un procedimiento ms
elaborado.
Tambin debemos observar el hecho de que en este mtodo se tiene la
certeza de cubrir la totalidad de la poblacin a analizar desde un inicio.
En el caso de un muestreo en superficie las unidades muestrales son tomadas
premeditadamente de un plano cartesiano imaginario, de donde seleccionamos las
unidades que pertenecern a nuestra muestra. De esta manera el tiempo que
consumirs y el costo de seleccin por unidad muestral ser menor.
En secciones posteriores, damos el fundamento necesario del muestreo
sistemtico.









Definicin
Muestra sistemtica
C
153

127
Es una muestra que se obtiene seleccionando una unidad muestral por cada
k unidades en una poblacin de tamao N. De esta manera, tomando el valor
apropiado de k, se dice que se tiene una muestra de 1 en k.
A este tipo de muestra la denotaremos como:
sY
y
Regularmente N es mltiplo de k y a cada conjunto de k unidades se le llama
grupo. Cabe sealar que existe el muestreo sistemtico cuando N no es mltiplo de
k.
La siguiente figura muestra el esquema de un muestreo sistemtico, donde N
es mltiplo de k.

Figura 1. Muestreo sistemtico
( ) ( ) ( )
( ) ( ) ( ) N nk
jk
k
k
k
= L
M
L
M
L
L
L
3
2

k n k n k n n
k j k j k j j
k k k
k k k
k Grupo
+ + +
+ + +
+ + +
+ + +
M M M M
M M M M
L
3 1 2 1 1 1
3 1 2 1 1 1
3 2 2 2 1 2 3
3 2 1 2
3 2 1 1
3 2 1
Son las unidades que seleccionamos de la poblacin para la muestra,
suponiendo
que se elige la unidad k aleatoriamente para comenzar.

Cmo seleccionar una muestra sistemtica?
Primero debers decidir el tamao del intervalo 1-en k unidades, luego
seleccionars aleatoriamente una unidad que se encuentre dentro del intervalo de la
primera hasta la k-sima unidad y as seguirs tomando los mltiplos de k, hasta llegar a
N. Pero surge una pregunta, cmo seleccionar una k adecuada?; en general para una
muestra sistemtica de n elementos en una poblacin de N, k debe ser menor o igual que
N/n; si no conocieras a N, entonces determinars un tamao de muestra n aproximado
para la encuesta y as estar en la posibilidad de obtener una k estimada.
Cuando no conocemos el tamao de la poblacin, puede darse un valor tentativo
de k; sin embargo, este podra ser muy grande, lo que nos proporcionara un tamao de
muestra menor que el requerido en el estudio. Esto no representara un problema si se
tuviera la posibilidad de tomar nuevamente la muestra y as seleccionar la k, que nos d
l tamao requerido. Sin embargo existen muchos casos en los que esto no es posible y
es necesario tener una precisin dada desde el principio de estudio. Esto hace difcil la
tarea de estimar un valor adecuado de k, y estar en tus manos la investigacin de la
mejor tcnica.
A continuacin damos conceptos relacionados con el muestreo sistemtico y su comparacin con
muestreo simple aleatorio.


128
Definicin
Poblacin Aleatoria
La llamaremos as cuando encontremos a las unidades muestrales ordenadas al azar dentro de la
poblacin. La muestra extrada de una poblacin aleatoria debe conservar un coeficiente de correlacin
aproximadamente igual a cero ( ) 0 ~
XY
, es decir, que si tenemos una N grande, la varianza de es
sY
y
aproximadamente igual a la varianza de y, de esta forma el muestreo sistemtico es equivalente al simple
aleatorio. A continuacin se muestra la figura que lo representa.

















Definicin
Poblacin
Ordenada
En este caso podemos encontrar a las unidades muestrales de la poblacin ordenadas de alguna
manera (crecien d o a cualquier otro esbozo. te o decreciente), lo cual puede ser de acuerdo a su magnitu
Este tipo de mu eficiente de correlacin menor o estras suelen ser heterogneas y generalmente con un co
igual a cero( ) 0
XY
. Si este fuese el caso y tuvieses una N lo suficientemente grande encontraras que:
( ) ( ) y V y V
sy
, de lo que podras deducir que una muestra sistemtica ordenada proporciona ms
informacin que una muestra simple aleatoria por unidad de costo.
A continuacin se muestra la figura que lo presenta





Fig 2. Dispersin del
M d M t d
Y

XY
~0
X

129

XY
<=0






Definici




n
Poblacin Cclica Peridica
El ordenamiento qu nta en las situaciones en las e observars en este caso es de tipo peridico y se prese
que se tiene un orde a tendencia, como los das de namiento implcito, es decir, que se repite con la mism
la semana, los meses d ltivo, etc. el ao, las crisis econmicas, los surcos o melgas en un cu
El principal pr radica en extraer una muy oblema de las muestras extradas de este tipo de poblacin
sesgada, ya que si elegim era en el mismo lugar del os un tamao k demasiado pequea que siempre cay
intervalo obtendras la caracterizacin de esa parte del ciclo y no de la poblacin total. Por esto la relacin
entre varianzas es la siguiente: ( ) ( ) y V y V
sy
, lo que quiere decir que en este caso la varianza del
muestreo simple aleatorio es menor que la de la muestra sistemtica, por lo que es mejor utilizar el
primero por ser ms preciso, sin embargo si tomaras un valor de k ms grande que lograra romper el ciclo,
los resultados sern ms alentadores. A continuacin se muestra la figura que la representa.

















Estimacin de
la Media
y el
Total
Y
Fig 3. Dispersin del
M d M t d
X
Y
Fig 4. Dispersin del
M d M t
X

Poblacional
Ya teniendo nuestra muestra de estudio, el objetivo ser caracterizar a la poblacin, por medio de una
muestra estimando los parmetros de mayor inters que son la media y el total poblacional. As que
despus de haber seleccionado la muestra de acuerdo a lo anteriormente establecido, procederemos a
estimar los parmetros con sus correspondientes varianzas estimadas y por ltimo sus intervalos de
confianza.

Estimacin de la Media de la Muestra Sistemtica

n
y
y
n
i
i
sY

= =
1
(1)

A continuacin presentamos el estimador de su varianza que es de gran
importancia, ya que nos permitir medir la dispersin de nuestra muestra y como ya
vimos en la seccin anterior es el punto de comparacin con el muestreo simple
aleatorio.
Varianza Estimada de

N
n N
n
s
y V
sY
2
) ( (2)

Un estimador que resulta de mucha importancia es el del intervalo de
confianza, ya que nos permite situar nuestra estimacin dentro de lmites que se
encuentra en la misma escala de los datos originales.

Intervalo de Confianza de


( )


N
n N
n
s
t y
n sY
2
2 , 1
(3)
Donde
sY
y es la media de la muestra sistemtica

Podrs notar que la estimacin de la varianza es la misma que la presentada
en el muestreo simple aleatorio, sin embargo las varianzas poblacionales no son las
mismas. As la varianza verdadera del estimador de la media de una muestra
sistemtica es,
( ) [ ]
XY sY
n
n
y V

1 1 ) (
2
+ = (4)
Observars que en este caso aparece la medida de correlacin
XY
, la cual
nos indica la relacin que existe entre los elementos de la muestra. As pues, el
muestreo sistemtico estar muy ligado a este indicador ya que si
XY
es cercano a
130

uno, quiere decir que los elementos estn estrechamente relacionados y esto nos
producir una mayor varianza de la media que en el muestreo simple aleatorio, por
lo que este ltimo ser el mas indicado. En el caso contrario, si
XY
es cercano a
cero, nuestra estimacin por muestreo sistemtico es la ms recomendada ya que
en este caso la varianza es aproximadamente igual al muestreo simple aleatorio.

Ejemplo. Compaa de transportes
El dueo de una compaa de transportes
vendiendo su proveedor es de la calidad especificada a los 3 meses de haberlo
suministrado a los vehculos; uno de los pr
ningn momento estn todos los automotores en la central, por lo que hacer un
muestreo simple aleatorio podra representarn
decidido tomar un muestreo sistemtico, seleccionando cada k vehculos segn su
llegada a la central, sabemos que la compaa cuenta con 1,200 vehculos y nos
interesa muestrear 60 de ellos y a cada uno de ello ceite
para medir sus grados Poise (que es la viscosidad) en el laboratorio, cabe
mencionar que el mtodo de medicin es complicado pues se toman diferentes
variables en cuenta, por otro lado, segn especificaciones el aceite debe estar entre
0.5 y 0.7 grados Poise dependiendo del vehculo,
A continuacin elegimos nuestra k.
desea saber si el aceite que le est
incipales inconvenientes es que en
os algunos problemas, por esto se ha
s sacarle una muestra de a
20
60
200 , 1
= = =
n
N
k
Lo que quiere decir que debemos muestrear cada 20 elementos, eligiendo
aleatoriamente el primer elemento entre los primeros 20. Los datos los damos a
continuacin,
Cuadro 1. Grados Poise
No. de Muestra Grados Poise
Auto No.2 0.5342
Auto No.22 0.6340
Auto No. k-simo
.
.
.
0.6780
Auto No. 1,142 0.7128

=33.9538

2
=0.0935
En el cuadro anterior el nmero elegido aleatoriamente dentro de los
primeros 20 nmeros fue el 2, de ah en adelante se eligi 1 en 20.
Aplicando los datos de la tabla en la ecuacin (1), obtenemos la estimacin
de la media,
5659 . 0
60
953 . 33
=
=
sY
y

Lo que significa que el promedio de grados Poise que el aceite de los
vehculos de la compaa tienen despus de 3 meses es de 0.5659.
131


La estimacin de la varianza la obtendremos con la ecuacin (2) como sigue,
0015 . 0
200 , 1
60 200 , 1
60
0935 . 0
) (
=

sY
y V

As que el intervalo de confianza para la estimacin de la media, se obtiene
fcilmente con la ecuacin (3),
( )
( ) 6429 . 0 , 4889 . 0
0015 . 0 0010 . 2 5659 . 0

Con lo que podemos decir con un 90% de confiabilidad que la media se
encuentra entre 0.4889 y 0.6429 grados Poise. Por lo que se puede tomar la decisin
de dejar de consumir el aceite del proveedor ya que no cumple las especificaciones
de calidad requeridas.
Hasta aqu hemos revisado el estimador de la media poblacional y sus
correspondientes estimadores, a continuacin se presenta el estimador del total,
que como podrs notar, es una adecuacin del estimador de la media.

Estimador del Total Poblacional

sY
sY y N =

(5)

Su correspondiente estimador de la varianza lo obtenemos multiplicando el
estimador de la varianza de la media por N
2
, como se muestra a continuacin,

Varianza Estimada de

sY

N
n N
n
s
N V sY
2
2
) ( (6)

La correspondiente construccin del intervalo de confianza se hace de la
manera habitual, sumando y restando el error de estimacin.

Intervalo de Confianza

sY


( )

N
n N
n
s
N t
n
sY
2
2
2 , 1
(7)

En el siguiente ejemplo mostraremos la estimacin del total con muestreo
sistemtico.


132


Ejemplo. Evento masivo
El gobierno federal desea saber la cantidad total de personas que llegarn a
cierto evento masivo gratuito en automvil donde no se expiden boletos de entrada ,
para tomar las medidas de seguridad necesarias. La forma para tomar la medicin
es mediante un muestreo sistemtico, haciendo un conteo sobre los pasajeros por
auto que van entrando al concierto, el gobierno desea hacer un muestreo sobre 100
autos y sabemos que el cupo mximo de autos de tamao promedio es de 2,500.
25
100
500 , 2
= = k
Lo que quiere decir que debemos muestrear cada 25 elementos, los datos los
encontramos a continuacin,
Cuadro 2. Personas por auto
No. de Muestra No. de Personas
Auto No.1 4
Auto No.15 7
Auto No. k-simo
.
.
.

.
.
.
Auto No. 1,985 5

= 562
Aplicando los datos de la tabla en la ecuacin (1), obtenemos la estimacin
de la media,
62 . 5
100
562
= =
sY
y
El total es fcil de obtener si multiplicamos la estimacin anterior por el
nmero de autos esperados en total,
Con lo que podemos decir que esperando un lleno total, habr 14,050
personas que lleguen en automvil al evento. La varianza la obtenemos a
continuacin,
( )
050 , 14
62 . 5 500 , 2
=
=

sY


600 , 159
500 , 2
100 2500
100
66 . 2
500 , 2 ) (
2
=

sY
V

( )( )
( ) 7 . 842 , 14 , 3 . 257 , 13
600 , 159 98 . 1 050 , 14

Lo que significa que con un 90% de confiabilidad podemos decir, que el
total de personas en el evento variar entre 158,807 y 160,393.


133



Estimacin de una Proporcin Poblacional
Al igual que en mtodos anteriores, podrs encontrarte ante la situacin de
querer estimar una proporcin. Es decir, que tu objetivo sea slo estimar la
frecuencia de cierta caracterstica C en particular. De esta forma daremos el valor
de 1 a la observacin que posea la caracterstica de inters y 0 si no es as. No es
difcil justificar que la variable medida tiene una distribucin binomial con
parmetros (n,p), donde n representa el tamao de la muestra y p la proporcin o
frecuencia relativa de xitos en las n observaciones. Las ecuaciones que
presentaremos a continuacin son idnticas a las expuestas en la seccin dedicada a
proporciones en el captulo de muestreo simple aleatorio y heredan las propiedades
estadsticas. Sin embargo, las varianzas de las poblaciones no necesariamente son
las mismas en ambos casos, pero si nos referimos a una muestra sistemtica
proveniente de una poblacin aleatoria con un tamao poblacional grande, las
varianzas pueden llegar a ser las mismas.

Estimador de la Proporcin Poblacional p


n
y
y p
n
i
i
sY sY

= =
1
(8)

La varianza de este estimador es la que se presenta a continuacin.

Varianza Estimada de p



N
n N
n
q p
p V
sY sY
sY
1
(9)
Donde

sY sY
p q = 1
Por ltimo para este estimador presentamos el del intervalo de confianza,
que nos indica los lmites en los que se encontrar nuestra proporcin.
Intervalo de Confianza



( )

N
n N
n
q p
t p
sY sY
n sY
1
2 , 1
(10)



134




Ejemplo. Estudio de mercado
Una empresa que se dedica a hacer estudios de mercado, necesita estimar la
aceptacin de cierto producto para adultos en un municipio. Por otro lado en el
mismo municipio se realizan elecciones, as que la empresa considera que la
concentracin de personas que se darn cita es las indicadas para realizar la
encuesta sobre el producto. La encuesta busca saber si el producto le gusta o no le
gusta al consumidor por lo que slo har esta pregunta, dando el valor de 1 si la
respuesta es s, y 0 si la respuesta es no. El estadstico de esta empresa decidi hacer
un muestreo sistemtico, seleccionando a una de cada k personas que salen de las
urnas para preguntarles su opinin. Se sabe gracias a la lista nominal cuantas
personas tiene la posibilidad de votar, (en este caso son 1,000 personas) y la
empresa decide muestrear al 5% de los votantes de las 10 casillas pues es una
encuesta sencilla que no representa demasiados costos.
As que al final de la jornada electoral la empresa cuenta con los siguientes datos,

Cuadro 3. Estudio de mercado
No. Votante Opinin
1 1
2 0
.
.
.
.
.
.
50 1
=33

As que la estimacin de la opinin de la poblacin se obtiene con la ecuacin
(1), de la siguiente manera,
66 . 0
50
33
= =

sY
p
Lo que quiere decir que al 66% de la poblacin les gusta el producto.
La varianza de esta estimacin la calculamos con la ecuacin (2) y es la
siguiente,
( )( )
( )( )
0043 . 0
9500 . 0 0045 . 0
000 , 1
50 000 , 1
50
34 . 0 66 . 0
) (
=
=


=

sY
p V

Por ltimo, es importante estimar en qu rango se puede mover esta
estimacin. Es decir, el intervalo de confianza, el cual se obtiene con la ecuacin (3)
y se presenta a continuacin,
( )( )
( ) 7912 . 0 , 5288 . 0
0653 . 0 0096 . 2 6600 . 0

135

Con lo que podemos decir con un 90% de confiabilidad que la proporcin de
personas a los que les gusta el producto se encuentra entre el 59% y el 72% de
aceptacin.

Seleccin del Tamao de Muestra
Para la determinacin del nmero de observaciones que necesitas integrar a tu muestra para
estimar a , debes proceder como en captulos anteriores, primero eligiendo un valor B que es el error
mximo que estamos dispuestos a aceptar en nuestras y lo igualars al producto de un valor de t con sus
correspondientes grados de libertad por la desviacin estndar de dicho estimador, como se representa a
continuacin,
( )
( )
sY n
y V t B
2 , 1
= (11)
Despejando n de esta ecuacin, obtendrs lo siguiente,
136



Tamao de Muestra Requerido para Estimar

( )
( )
( )
2
2
2 , 1
2
2
1

+
=

N
t
B
N
n
n
(12)
Donde la varianza poblacional la podemos sustituir por la muestral, para fines
2

prcticos.


Tomemos el ejemplo de la compaa de transportes
( )( )
( )
( )
6 . 82
200 , 1
0010 . 2
065 . 0
. 0 200 , 1
2
2
0935 . 0 1
0935
=
+
= n
Lo que significa que el tamao necesario de muestra para un error de 0.065 grados Poise es de 83
elementos.

Cuando nuestro objetivo es estimar p, el tamao de muestra se puede estimar con la siguiente
ecuacin.


Tamao de Muestra Requerido para Estimar p

( )
( )
( ) pq N
t
B
Npq
n
n
+
=

1
2
2 , 1
2

(13)


Ejemplo. Estudio de mercado
Tomando el ejemplo del estudio de mercado sobre la opinin de cierto producto, podemos
utilizar la ecuacin (13) para estimar el tamao de la muestra para tener un error de 0.04 en la estimacin
de la proporcin con una confiabilidad del 90%,

( )( )( )
( )
( )
( ) ( )( )
61 . 359
6240 . 0
400 . 224
34 , 0 66 . 0 1 000 , 1
0096 . 2
04 . 0
34 . 0 66 . 0 000 , 1
2
2
=
=
+
= n

Lo que significa que si muestreamos a 360 personas, estamos asegurando tener tan
slo un error de 0.04 con un 90% de confiabilidad.
En el caso anterior ya contbamos con una estimacin y con una primera aproximacin de n,
pero generalmente no contars con esta informacin por lo que como primera aproximacin podras
tomar el valor de p=0.5 y el de t=2.0096, tu resultado sera el siguiente,
Ejemplo. Compaa de transportes.

p
137

( )( )( )
( )
( )
( ) ( )( )
8522 . 384
6496 . 0
000 . 250
5 . 0 5 .' 0 1 000 , 1
0096 . 2
04 . 0
5 . 0 5 . 0 000 , 1
2
2
=
=
+
= n

Los tamaos muestrales no son muy diferentes, por lo que se puede usar la segunda opcin
cuando p es desconocida.

Muestreo Sistemtico con Repeticiones
A lo largo del captulo hemos hecho notar las implicaciones que trae no utilizar una muestra aleatoria
y mostramos el caso de que nuestra poblacin sea aleatoria, sin embargo, te dars cuenta que esto no
siempre ocurre, por lo que a continuacin te presentamos el muestreo sistemtico con repeticiones o
replicado para estimar la varianza de la media, el cual utiliza el mismo principio que el sistemtico simple
y como su nombre lo ndica utiliza rplicas, es decir, recorrers la poblacin tomando varias muestras
sistemticas al mismo tiempo, las cuales tendrn un punto de inicio k diferente. Se explica a detalle a
continuacin.
1. Nos encontramos con una poblacin que contiene N elementos que podemos numerar
consecutivamente, de donde seleccionaremos una muestra de tamao n.
2. Obtenemos
n
N
k = y seleccionamos aleatoriamente un nmero entre 1 y k como nuestro
anterior icio. De este construirs la siguiente punto de in k n k
s
= que ser nuestro nuevo
tamao de intervalo, es decir, ahora muestrearemos elementos de 1 en k ,
bserva
donde n
s
representa
el nmero de rplicas que utilizaras en el diseo. Frecuentemente se usan 10 ya que estas son
suficientes para obtener estimaciones satisfactorias para la varianza. O rs que el valor de
se construye de tal manera que al final tendremos el mismo nmero de mediciones que
obtendras con una sola muestra sistemtica de 1 en k, por lo que muestrear con rplicas no
representa un costo mayor.
3. Finalmente seleccionaremos n
s
nmeros aleatorios entre uno y
k
k los cuales sern los puntos de
inicio para cada una de las muestras, de ah recorreremos la poblacin de en para cada
una de estas, hasta llegar al ltimo elemento de N, en este momento tendremos n
*
e entos para
cada rplica, donde se cumplir que y n representa el nmero de unidades muestrales
que se incluyen en una muestra sistemtica sin repeticiones.

A continuacin se muestran los estimadores de la media y el total para este tipo de
muestras.

k k
lem
*
n n n
s
=
Estimacin de la Media para Muestras Sistemticas Replicadas

= =
s
n
i
s
i
sY
n
y
y
1
(14)

Podrs notar que la varianza de este estimador es ligeramente diferente al que habamos
presentado anteriormente, la expresin es la siguiente.


Varianza Estimada de



138

( ) 1
) (
1
2


=

=

s s
n
i
i
sY
n n
y
N
n N
y V
s

(15)


El intervalo de confianza se construye de la manera habitual.
Intervalo de Confianza

( ) ( )
sY n sY
y V t y

2 , 1
(16)

Donde n es el tamao total de muestra.






Ejemplo. Calidad del servicio.
Una empresa desea conocer la opinin de sus clientes
acerca de sus servicios; para esto realiza una encuesta de
opinin sobre los 1,000 clientes y cree suficiente muestrear a
70 de estos. Las respuestas de los clientes van de uno en uno
hasta cinco donde 1=muy mal servicio y 5=muy buen servicio.
Es importante mencionar que cada cliente tiene un nmero
consecutivo que lo identifica y la empresa cuenta con un
listado, sobre el cual se seleccionar sistemticamente.
El tamao de k lo obtenemos a continuacin,
2 , 14
70
000 , 1
=
= k

Co =10 n
s
n
( )
140
14 10
=
= k

Seleccionaremos aleatoriamente 10 nmeros entre 1 y 140
2, 25, 67, 123, 122, 5, 80, 98, 62, 135
Los resultados del muestreo se exponen a continuacin donde los nmeros entre parntesis
representa al nmero de cliente seleccionado, y la cantidad que aparece a continuacin es la calificacin
que otorgaron a la empresa,


Cuadro 4. Encuesta de calidad del servicio.
1ra.
Muestra
2da.
Muestra
3ra.
Muestra
4ta.
Muestra
5ta.
Muestra
6ta.
Muestra
7ma.
Muestra
sY
y
(2) 1 (142)2 (282)4 (422)3 (562)5 (702)4 (842)1 2.8571
(5)3 (145)3 (285)4 (425)3 (565)3 (707)4 (845)2 3.1429
(25)2 (165)5 (305)5 (445)4 (585)4 (725)2 (865)5 3.8571
(62)5 (202)5 (342)2 (482)5 (622)5 (762)3 (902)3 4.0000
139

(67)5 (207)4 (347)2 (487)1 (627)5 (767)2 (907)3 3.1429
(80)3 (220)2 (365)3 (500)2 (640)1 (780)1 (920)4 2.2857
(98)2 (238)1 (378)1 (518)2 (658)2 (798)5 (938)2 2.1429
(122)4 (262)1 (402)5 (542)5 (682)3 (822)4 (962)4 3.7143
(123)5 (263)3 (403)4 (543)3 (683)4 (823)5 (963)5 4.1429
(135)4 (275)3 (415)2 (555)4 (695)5 (835)5 (975)5 4.0000
=33.2857
() Es el nmero que corresponde al elemento de la poblacin que ser seleccionado en esa
muestra, bajo la premisa de que todos los elementos de la poblacin tienen una etiqueta.


As la calificacin promedio la obtenemos a continuacin,


3285 . 3
10
2857 . 33
=
=
sY
y



La varianza de la estimacin de la media se calcula como sigue, aplicando la
ecuacin (15),

0005 . 0
90
0531 . 0
000 , 1
70 000 , 1
) (
=

sY
y V

Por lo tanto el intervalo de confianza con 90% de confiabilidad es,
( )
( ) 3752 . 3 , 2818 . 3
0005 . 0 9949 . 1 3285 . 3

Lo que significa que la calificacin del servicio se encuentra entre 3.28 y 3.38 puntos.

A continuacin presentamos los estimadores del total de una muestra sistemtica replicada.

Estimacin del Total
sY
para Muestras Sistemticas Replicadas

= =
s
n
i
s
i
sY sY
n
y
N y N
1
(17)

La varianza de este estimador se presenta a continuacin.

Varianza Estimada de
sY



( ) 1
) (
1
2
2


=

=


s s
n
i
i
sY
n n
y
N
n N
N V
s

(18)

Por ltimo a continuacin se encuentra la expresin que calcula el intervalo
de confianza del estimador del total.

Intervalo de Confianza

140

( )

sY n sY
V t
2 , 1
(19)

Ejemplo. Calidad del servicio.
La misma empresa que hizo la encuesta de calidad del servicio incluy en el
cuestionario la pregunta de cunto invertira su cliente el ao prximo, hoy se
preguntan cunto percibirn de ingresos el prximo ao, por lo que tomarn la
misma muestra vista en el ejemplo anterior y buscarn la respuesta del dinero que
invertirn, las respuestas se encuentran a continuacin,


Cuadro 5. Encuesta de calidad del servicio (inversin).
1ra.
Muestra
2da.
Muestra
3ra.
Muestra
4ta.
Muestra
5ta.
Muestra
6ta.
Muestra
7ma.
Muestra sY
y
(2) 2,000 (142)2,800 (282)4,800 (422)3,200 (562)5,600 (702)4,900 (842)2,500 3,685.7
(5)4,000 (145)4,500 (285)4,600 (425)3,600 (565)3,500 (707)4,500 (845)2,900 3,942.8
(25)3,000 (165)5,000 (305)4,000 (445)3,000 (585)4,700 (725)2,800 (865)5,o00 3,928.5
(62)5,000 (202)3,000 (342)2,500 (482)5,300 (622)5,900 (762)3,700 (902)3,800 4,171.4
(67)6,000 (207)2,500 (347)2,800 (487)3,500 (627)5,800 (767)2,900 (907)3,500 3,857.1
(80)4,500 (220)3,400 (365)3,200 (500)2,700 (640)3,000 (780)3,000 (920)4,900 3,528.5
(98)2,850 (238)5,500 (378)3,800 (518)2,900 (658)2,800 (798)5,700 (938)2,800 3,764.2
(122)3,500 (262)3,000 (402)3,500 (542)4,000 (682)3,700 (822)4,900 (962)4,500 3,871.4
(123)3,000 (263)4,100 (403)2,000 (543)3,500 (683)4,700 (823)3,000 (963)4,000 3,471.4
(135)3,900 (275)4,500 (415)2,700 (555)4,900 (695)2,800 (835)3,300 (975)4,500 3,757.1
=37,978.5
() Es el nmero que corresponde al elemento de la poblacin que ser seleccionado en esa muestra, bajo
la premisa de que todos los elementos de la poblacin tienen una etiqueta.
La estimacin del total de ingresos que percibir la compaa el ao prximo la obtenemos con
la ecuacin (17) como se muestra a continuacin,
857 , 797 , 3
10
978 , 37
* 1000
=
=

sY


La varianza de esta estimacin es la siguiente,
373 , 747 , 43
90
04 . 47
000 , 1
70 000 , 1
000 , 1 ) (
2
=


=

sY
V

Y el intervalo en donde se sita la estimacin es el siguiente,
( )
( ) 052 , 811 , 3 662 , 784 , 3
373 , 747 , 43 99 . 1 857 , 797 , 3

Lo que significa que la empresa percibir ingresos de entre $3,784,662 y
$3,811,052.










141







COMENTARIOS


El muestreo sistemtico puede ser una excelente alternativa para sustituir
al simple aleatorio, y algunas veces es ms preciso, pero esto depende de las
caractersticas de la poblacin a analizar, por lo que es necesario conocer
algo sobre la estructura de la poblacin.

El muestreo sistemtico generalmente resulta ms simple y barato al
momento de seleccionar la muestra.


El muestreo sistemtico es preferible cuando la poblacin est ordenada, ya
que tienes la seguridad de recorrer todos los elementos de la poblacin y
tener una muestra representativa de esta, pero si la muestra es aleatoria los
resultados son equivalentes al muestreo simple aleatorio.

Debes tener cuidado al momento de tener una poblacin peridica ya que
puede ocurrir que al elegir el tamao de nuestra k, nuestras unidades
muestrales siempre caigan en un lugar del ciclo y dejen la otra parte de este,
por lo que nuestra poblacin no sera representada por nuestra muestra.

Es importante hacer notar que t puedes hacer un muestreo sistemtico en
un diseo estratificado, de razn o por conglomerados.




















142

143










APNDICE II. Hoja de Clculo


El texto cuenta con un disquete que tiene un archivo en Excel con 7 hojas de clculo, cada una
con el nombre del diseo de muestreo que contiene las frmulas para calcular sus
correspondientes estimadores.






En cada hoja se indican las instrucciones de uso para obtener los principales estimadores. Para
ejemplificar este punto a continuacin presentamos algunos ejemplos vistos en el captulo, los
cuales pueden variar por redondeo.


Es importante mencionar que estas hojas pueden usarse con diferente tipo de informacin, segn
sea conveniente.


Es recomendable copiar la hoja de clculo y guardarla con otro nombre para evitar la prdida de
alguna frmula.
















Ejemplo. Compaa de transportes




En este ejemplo lo que nos interesa es estimar la media poblacional y los
limites de confianza de esta, podrs observar que la hoja es prcticamente la
misma que en muestreo simple aleatorio, la diferencia radica en la seleccin de la
muestra.




144
175 Conceptos Bsicos de Estadstica



APTULO 7


MUESTREO POR
CONGLOMERADOS EN UNA
ETAPA





INTRODUCCIN
En tu estudio por el diseo de encuestas habrs notado que existen
diferentes formas de estimar un parmetro y que el utilizar una u otra representa
menor o mayor costo, precisin, facilidad de manejo y algunas veces resulta hasta
absurdo intentar aplicar alguna de ellas en una poblacin con ciertas
caractersticas. Es por esto, que a continuacin presentamos otro diseo de
muestreo, el cual te proporcionar otras herramientas que seguramente te sern de
utilidad.
Tambin te habrs percatado que lo que en principio hace la diferencia
entre los diseos de encuestas es la forma de definir nuestra unidad muestral. El
muestreo por conglomerados a diferencia de los anteriores, presenta unidades
muestrales en las que es s, no haremos propiamente la medicin y las cuales estn
constituidas por varios elementos, es en estos en los que haremos la medicin. Este
es el principio del diseo.


Definicin
Muestra por Conglomerados
Se le denomina as a la muestra obtenida aleatoriamente (de la misma forma
que en el muestreo simple aleatorio) y a las unidades obtenidas les llamaremos
conglomerados, los cuales son grupos o colecciones de elementos sobre los que se
har la medicin o revisin de la caracterstica de inters.


Como sabemos, si deseamos hacer una seleccin aleatoria de elementos,
debemos contar con el marco de muestreo, para despus hacer el sorteo. Tal como
hemos observado esto puede tornarse complicado o imposible y hacerlo representa
un costo que se incrementa al tomar mediciones que se encuentran separadas entre
s por una gran distancia fsica. En el muestreo por conglomerados, este costo se
reduce, ya que al levantar la informacin de elementos contiguos o muy cercanos
entre s se evita el gasto de traslado.



C


Qu puede ser un conglomerado?
Hasta aqu ya tendrs una idea general del diseo pero podras estarte
preguntando la forma de decidir qu caractersticas debe reunir nuestra unidad
muestral o conglomerado. As, por ejemplo, podemos tener el caso de una
poblacin que comprende un municipio y deseamos conocer cierto parmetro. Bajo
esta situacin podemos decidir que nuestros conglomerados sean manzanas,
colonias o barrios. La decisin se toma de acuerdo a la precisin que deseas, por la
informacin disponible, por los objetivos que necesitas cumplir o por cualquier
criterio que sea de inters para el investigador. Si se tratara de un bosque
podramos elegir sitios de cierta superficie como conglomerados o en el caso de la
evaluacin nacional de salud, elegiramos hospitales, etc.
Una encuesta por conglomerados puede ser de cajas que contienen
productos terminados. En este caso todos los conglomerados contienen el mismo
nmero M de productos terminados o elementos, debido a la uniformidad del
proceso de produccin y empaque. As pues diremos que los conglomerados son de
tamao homogneo. Pero es evidente que casos con estas caractersticas no son los
mas frecuentes y que en general encontraremos conglomerados de tamaos
desiguales; es decir, las colonias no tienen el mismo nmero de habitantes, los sitios
tampoco contendrn el mismo nmero de rboles, etc. Pero gracias a las tcnicas de
muestreo probabilstico no hay de que preocuparse pues cubren estas posibilidades.
En el diseo de muestreo los conglomerados, estos se eligen aleatoriamente y lo que
interesa son los elementos dentro de ellos; adems todos estos elementos quedarn
automticamente seleccionados al elegir el conglomerado en la muestra, es decir,
cada conglomerado elegido en la muestra ser censado.
Comparacin con Muestreo Estratificado
Quiz tengas la sensacin de que el muestreo por conglomerados te recuerda
al muestreo estratificado, pues tambin se trata de agrupaciones de elementos de la
poblacin, y aunque a primera vista podramos asumirlo as, se trata en esencia de
algo muy diferente. Esto radica en la forma de seleccionar la muestra, lo que se
muestra claramente en el siguiente cuadro.
Cuadro 1.Comparacin Muestreo por Conglomerados vs Estratificado
Muestreo Estratificado Muestreo por Conglomerados
1. Generalmente nos da ms precisin
en relacin con muestreo simple
aleatorio.
1. Generalmente nos da menos
precisin en relacin con muestreo
simple aleatorio.
2. Para una mayor precisin los
estratos deben contener elementos
que sean lo ms homogneo posible
entre ellos.
2. Para una mayor precisin los
conglomerados deben contener
elementos que sean lo ms
heterogneo posible entre ellos.
3. Para una mayor precisin la
diferencia entre estratos debe ser
considerable.
3. Para una mayor precisin los
conglomerados deben ser muy
similares.
4. La varianza de la estimacin de la
media depende de la variabilidad de
los valores dentro del estrato.
4. La varianza de la estimacin de la
media depende de la variabilidad
que existe entre las medias de los
conglomerados.
146

147
Grficamente la extraccin de la muestra la veramos como se muestra enseguida,
Figura 1. Comparacin grfica de muestreo estratificado vs conglomerados.


Acerca del Tamao del Conglomerado
Es importante hacer notar que mientras el conglomerado sea de un tamao
moderado o de tal naturaleza que las observaciones (observacin j en el
conglomerado i) puedan obtenerse con relativa facilidad. El esquema puede
aplicarse sin mayores problemas; sin embargo, no es difcil imaginar situaciones
tales en las que el conglomerado elegido es de tamao o de naturaleza tal que el
tratar de introducir un censo en l resulta ser una tarea irrealizable en trminos
prcticos. Por ejemplo, si los conglomerados elegidos son conjuntos de viviendas de
120 manzanas y dentro de ellas deben ser elegidos todos los nios menores de 6
aos, el conjunto a censar sera demasiado grande, o si el conjunto fuera un
archivero, existiendo dentro de l miles de hojas y fuera necesario calcular
estimaciones a nivel de hoja; es razonable pensar que no es apropiado el esquema
de muestreo por conglomerados en una etapa.


Notacin
Como te habrs dado cuenta, en este diseo de muestreo existen diferentes
tipos de unidades, por esto, es importante contar con una notacin para
diferenciarlas, la cual ser la siguiente.

Unidades Primarias

N Nmero de conglomerados en la poblacin

n Nmero de conglomerados seleccionados de una muestra simple
aleatoria




Extraemos una muestra
aleatoria de cada
Extraemos una muestra
aleatoria simple de
ij
y



Notacin continuacin
Unidades Secundarias

M
i
Nmero de elementos en el conglomerado, i = 1, 2, ..., N

M Nmero de elementos en la poblacin

=
=
N
i
i
M M
1

M Tamao promedio del conglomerado en la muestra

Total del conglomerado i,

j-sima observacin en el i-simo conglomerado.

Estimacin de una Media y un Total Poblacional
Ya hemos hecho notar que el muestreo por conglomerados es ampliamente
usado cuando el costo de muestrear unidades primarias es despreciable en relacin
con el censo de unidades secundarias. Pero te dars cuenta que la seleccin
primaria de elementos que estarn en la muestra sigue el mismo procedimiento que
en el muestreo simple aleatorio, por lo que los estimadores de la media y el total
se obtienen de manera similar. Sin embargo, es importante que observes que los
datos que nos proporciona el muestreo por conglomerados nos permiten obtener
estimaciones a diferentes niveles de la poblacin. Es decir, si se realiza una encuesta
sobre sitios para estimar la cantidad de madera de los rboles en el sitio, las
observaciones individuales son los volmenes por rbol dentro del sitio,
i
y
ij
y
ij
y
i
es el
volumen total del sitio (para un conglomerado incluido en la muestra, pues se
realiza la medicin a todos los rboles del sitio), es el volumen total de la
poblacin y es el volumen promedio, por mencionar algunas estimaciones.
Es por esto que, antes de mostrarte los principales estimadores, te
presentaremos algunos que seguramente te sern de utilidad y permitirn
facilitarte el manejo de datos.


Nivel Primario o Conglomerado (cantidades de poblacin)
Total en la unidad primaria o conglomerado i,

Total de la Poblacin

=
=
i
M
j
ij i
y y
1


= = =
= =
N
i
M
j
ij
N
i
i
i
y y
1 1 1

148
149 Conceptos Bsicos de Estadstica




Nivel Secundario (cantidades de poblacin)
Media de la Poblacin en la unidad primaria i
i
i
M
j i
ij
iD
M
y
M
y
y
i
= =

=1


Donde D simbolizar de aqu en adelante las unidades secundarias y
recordamos que M
i
se refiere a todas las unidades que contiene el conglomerado i.
Pudiera darse el caso de que se seleccione solo una parte del conglomerado
digamos M
i
unidades lo cual nos lleva al diseo de muestreo que se presenta en el
captulo siguiente. Es evidente que si sustituyes N por n obtendrs la estimacin de
la media muestral para la unidad primaria i.

A continuacin se presentan los estimadores suponiendo que contamos con
una muestra aleatoria de n conglomerados y que cada uno contiene M
i
elementos.

Estimador de la Media Poblacional

=
=
=
n
i
i
n
i
i
c
M
y
y
1
1
(1)

La varianza de este estimador es de gran utilidad al momento de querer
conocer la dispersin de los datos y para saber la precisin de nuestra estimacin.
Esta se muestra en la siguiente expresin.

Varianza Estimada de
c
y

( )
( )
1
1
2
2


=

=

n
M y y
M Nn
n N
y V
n
i
i c i
c
(2)

Al conocer el estimador de la varianza de
c
y , estamos en posibilidad de
calcular su correspondiente intervalo de confianza, el que nos dar los lmites en
los que se encuentra nuestra estimacin. La expresin que lo estima es la siguiente.

Intervalo de Confianza de
c
y

( )
( )
c n c
y V t y

2 , 1
(3)

La varianza obtenida en la ecuacin anterior es sesgada y puede ser mejor
en cuanto n sea grande y el sesgo desaparecera si los tamaos de los
conglomerados fuesen iguales.

Ejemplo. Calidad de jeringas.
El departamento de calidad de una fbrica de jeringas desea hacer un
estudio de calidad sobre la longitud de las jeringas que est produciendo una
mquina con nueva tecnologa; la longitud debe ser de 76mm pudiendo variar
desde 74.5mm hasta 77.5mm. Podrs imaginarte que es muy importante que esta
especificacin se cumpla, ya que se trata de un producto que se usa directamente
en seres humanos.
150

Las jeringas estn acomodadas en charolas de 1,000 piezas y un lote cuenta
con 30 charolas.
La unidad primaria en este caso es la charola y las unidades secundarias
sobre las que haremos las mediciones son las jeringas, a continuacin se muestran
las mediciones que se hicieron sobre 3 de las charolas
Cuadro2. Longitud de jeringas.
Conglomerado
= mm)
ij
y (
Charola 1 1,000 75,996.29
Charola 2 1,000 75,991.28
Charola 3 1,000 75,994.98
Total 3,000 227,982.55

Para obtener la longitud promedio del lote de jeringas utilizamos la
ecuacin (1) de la siguiente manera,
75.99
000 , 3
55 . 982 , 227
=
=
c
y

Lo que significa que la longitud de las jeringas de ese lote es en promedio de
75.99mm.
En cuanto a la varianza de esta estimacin, la obtenemos con la ecuacin
(2).
( )
( )( )( )
( ) ( )
000002 . 0
2
99 . 994 , 75 98 . 994 , 75 99 . 994 , 75 28 . 996 , 75
000 , 1 3 30
3 30
2 2
2
=
+ +

L
c
y V

Donde,
( )
735 . 6
2
47 . 13
2
60
1
= =

= i
i i
M y y

El intervalo de 95% de confianza donde de encuentra nuestra estimacin lo
obtenemos con la ecuacin (3) y es el siguiente,
( )
( ) 76.00 75.99,
000002 . 0 2054 . 6 99 . 75


Lo que nos dice que nuestro lote est dentro de las especificaciones de longitud
requeridas.
Como en los diseos de encuestas anteriores, el total de la poblacin puede ser
conocido tan solo multiplicando la media que obtuvimos en la ecuacin (1) por M
que denota el nmero total de elementos en la poblacin y el estimador es el
siguiente,

Estimador del Total Poblacional

= =

=
=

n
i
i
n
i
i
c c
M
y
M y M
1
1
(4)

151


La estimacin de la varianza del total, te podr dar idea acerca de la
precisin que puedes obtener de tus estimaciones, a continuacin aparece la
expresin para su estimacin.
Varianza Estimada de


c


( )
1
1
2
2


=

n
M y y
Nn
n N
N V
i
i c i
c
n
(5)


La expresin para calcular los lmites de la estimacin del total poblacional,
se presenta a continuacin.
Intervalo de Confianza para


c

( )

c n c
V t
2 , 1


(6)

Ejemplo. Plantacin forestal
El dueo de una plantacin forestal necesita estimar el volumen de madera
en m
3
que tiene su plantacin, lo que ha pensado es hacer un muestreo por
conglomerados, para esto divide la plantacin en 600 sitios de los cuales muestrea
todos los elementos de 60 de ellos, en este caso nuestras unidades primarias (los
conglomerados) son los sitios y las unidades secundarias son los rboles.







Cuadro 3. Metros cbicos de madera por sitio.
C M
i
y
i
( )
i i
M y y

C M
i
y
i
( )
i i
M y y
C M
i
y
I

( )
i i
M y y

1 508 1,709 21 558 2,440 41 657 1,722 40,354 116,806 559,478
2 302 1,075 3,605 22 598 2,005 59,136 42 653 2,653 39,116
3 693 3,087 232,122 23 532 2,057 3,202 43 667 3,092 340,980
4 598 1,729 270,326 24 599 2,562 95,866 44 608 2,153 17,801
5 459 1,497 52,182 25 607 1,853 184,711 45 548 1,883 31,427
6 695 2,725 12,461 26 609 2,698 166,849 46 657 1,650 672,735
7 476 2,143 124,747 27 640 3,066 435,639 47 506 2,266 132,251
8 675 2,945 165,864 28 659 1,948 280,884 48 499 2,478 362,374
9 432 1,355 72,390 29 589 1,942 74,202 49 449 2,151 214,077
10 567 2,267 18,143 30 674 2,413 14,654 50 543 1,851 36,359
11 657 2,724 64,548 31 508 1,870 1,625 51 558 1,309 623,307
12 650 2,537 8,633 32 302 987 21,922 52 598 1,881 134,888
13 667 3,284 602,485 33 693 3,258 425,698 53 532 2,324 104,934
14 598 2,370 14,876 34 598 2,700 203,836 54 599 2,766 264,419
15 548 2,026 1,220 35 459 1,750 570 55 607 2,142 19,751
152

16 657 1,987 233,559 36 583 2,007 34,425 56 609 1,968 103,744
17 508 1,479 185,644 37 476 1,231 312,704 57 640 1,842 318,169
18 499 1,668 43,390 38 675 2,701 26,483 58 659 2,862 147,431
19 549 2,163 9,734 39 432 1,669 1,987 59 589 1,951 69,507
20 543 2,463 177,559 40 567 1,904 52,150 60 674 2,447 7,611
= 34,491 129,685 9,047,553
C. Nmero del conglomerado

De aqu podemos estimar la media fcilmente con la ecuacin (1) de la
siguiente manera,
76 . 3
491 , 34
=

c

s indica que
685 , 129

= y
El resultado anterior no el volumen de madera por unidad de
muestreo secundaria es de 3.76 m
3
.

Para obtener el total de m
3
de madera que hay en la plantacin utilizamos la
ecuacin (4) de la siguiente manera,
( )
983 , 315 , 1
76 . 3 000 , 350
=
=
Lo que significa que en total la plantacin cuenta con 1,315,983
=

c c
y M
m
3
,
Esto sabiendo que M=350,000, ms adelante veremos el caso en el que
desconocemos a M.
La varianza de la estimacin del total poblacional la obtenemos con la
ecuacin (5) y se muestra a continuacin,

Donde,
( )
348 , 153
59
553 , 047 , 9
59
1
= =
= i

El intervalo de confianza con un 90% de confianz
iente manera,
60

i i
M y y
a se construye con la
ecuacin (6) de la sigu
( ) 565 , 373 , 1 402 , 258 , 1
Lo que significa que nuestra estimacin del vo
m
3
.
083 , 081 , 828 001 . 2 983 , 315 , 1

lumen total de madera en la
plantacin, oscila entre 1,258,402 y 1,373,565

Qu pasa cuando desconozco el tamao
de la poblacin M?
Con la informacin anterior, eres capaz de encontrar una media, un total, o
una estimacin del intervalo de confianza para el total poblacional, sin embargo, es
importante que notes que para utilizar las expresiones dadas anteriormente debes
conocer M, lo cual a veces no ser un trabajo posible o resultar demasiado difcil,
153

por lo que a continuacin te proporcionaremos un estimador donde no es necesario
el conocimiento de M.
Para esto, definiremos la siguiente expresin como el promedio de los
totales de los conglomerados muestreados,

= =
= =
i
i
i
i
n
y
n
1 1

El cual hereda la propiedad de insesgamiento, por lo que
n n
1 1
N tambin es un
estimador insesgado del total de la poblacin. Es as como podemos obtener el
siguiente estimador.

Estimador del Total Poblacional

=
= =
i
i c
y
n
N
1

n
N
(7)

La varianza de este estimador nos indica la precisin del estimador, en este
caso es prcticamente igual a la de la ecuacin (5) la diferencia radica en la
utilizacin de en lugar de
i c
M y .
Varianza Estimada de

c

( )
( )
1
1 2


=

=

n
y
Nn
n N
N N V
i
i
i


2
n
(8)

El intervalo de confianza para este estimador, es el que presentamos a
continuacin el cual se construye de la manera habitual.


Intervalo de Confianza para


c

( )

c n c
V t
2 , 1


(9)


Ejemplo. Plantacin forestal
Tomando el ejemplo anterior, sabemos que N= 600, aplicamos la ecuacin
(7),
( )
1,296,845
129,685
60
=
=
c


e en total existen 1,296,
600

Lo que quiere decir, qu 845m


3
de madera en la
plantacin.
Donde,
154

4 . 161 , 2
60
129,685
= =
La varianza y el intervalo de confianza los obtenemos con la ecuacin (8) y
(9) respectivamente, como se muestra a continuacin,

( )
( )( )
( )
4 . 049 , 262 , 567 , 1
234 , 290
60 600
60 600
600
2
=

N V


Donde,
( )
234 , 290
59
789 , 123 , 17
59
60
1
= =

= i
i
y


( )
( ) 062 , 376 , 1 628 , 217 , 1
049 , 26 , 567 , 1 001 . 2 845 , 296 , 1

Lo que significa que nuestra estimacin del volumen total de madera en la
plantacin, oscila entre 1,217,628 y 1,376,062m
3
.
Es importante notar que la estimacin obtenida anteriormente y la que
obtuvimos con el estimador cuando conocemos M, son muy congruentes.








Determinacin del Tamao de Muestra
Sabemos que la precisin de nuestro diseo de muestreo depende del tamao de la muestra y del
modo en que est conformada. As pues, en el diseo por conglomerados se busca exactamente la
situacin inversa al diseo estratificado ya que formaremos conglomerados que sean homogneos entre
ellos, pero que en su interior mantengan una marcada heterogeneidad. Es decir, que haya muchos valores
por arriba de la media general y otros muchos por debajo de ella, de tal forma, el diseo resultar ms
preciso que una seleccin aleatoria de elementos o tan preciso como ella. Sin embargo algunas veces te
encontrars en el caso de que los conglomerados ya estn definidos por algn esquema y no te sea posible
construirlos de alguna forma que hiciera el diseo ms eficiente, lo cual representa una desventaja en
cuanto a precisin. Por otro lado, esta condicin tambin puede representar una ventaja ya que al utilizar
un muestreo por conglomerados, no requerimos de un marco de muestreo de elementos.
Notars que a diferencia de los anteriores diseos, una muestra por conglomerados tambin ser
definida por el tamao relativo de los conglomerados. Adems recordars que el tamao del lmite para el
error de estimacin depende fuertemente de la variacin entre los totales de conglomerados, es as que
confirmamos que para obtener lmites pequeos de error de estimacin debemos seleccionar
conglomerados con la menor variacin posible entre estos totales.
Supondremos el tamao del conglomerado es fijo y nos interesa saber el nmero n de conglomerados
a seleccionar. De la misma manera que en diseos anteriores, al no conocer o el tamao promedio
2
c

M del conglomerado, la decisin del nmero de conglomerados necesarios para conseguir una cantidad
especfica de informacin concerniente a un parmetro poblacional se complica. Si este fuera el caso,
os los correspondientes estimadores de y usarem
2
c
M que podran estar disponibles en encuestas
previas o en todo caso obtenerse al cabo de una encuesta piloto seleccionando una muestra preliminar
155

digamos n y con esta informacin posteriormente hacer una estimacin del tamao de muestra n.
Entonces, procediendo de manera anloga a los diseos anteriores, igualamos

) (
2 , 1

V t
n
que
es el error asociado a nuestro estimador, a un lmite de error de estimacin que llamaremos B,
B V t
n
=

) (
2 , 1


Donde representa el estimador del parmetro de nuestro inters.

De la expresin anterior despejamos n de la varianza hasta llegar a la siguiente ecuacin,






Tamao Aproximado Requerido para Estimar



( )
( )
2
2
, 1
2
2
2
2
c
n
c
t
B
M N
N
n

+
=

(10)
Dond es estimada por e
2
c

( )
1
1 2

=

=
n
M y y
s
n
i
i i
c


Ejemplo. Calidad de J eringas
Supongamos que el gerente de calidad de la fbrica de jeringas necesita
obtener el tamao de muestra necesario para tener un error de estimacin de
0.005mm con un 95% de confiabilidad.
Aplicando la frmula (10) con los datos del cuadro (2) obtenemos lo siguiente,
( )( )
( )( )
71 . 7
7353 . 6
620
005 . 0
1000 30
7353 . 6 30
2
2
2
=
+
= n

Lo que significa que tenemos que muestrear 8 conglomerados, en este caso
charolas, para tener un error de estimacin de 0.005mm con un 95% de
confiabilidad.

Para determinar el tamao de muestra con base a
c
, se procede de forma
similar a la anterior dado que ) ( ) (
2
y V M y M V = . As que utilizando este resultado,
es fcil llegar a la siguiente ecuacin,

Tamao Aproximado Requerido para Estimar usando
c
y M

156

( )
2
2
, 1
2
2
2
c
n
c
t N
B
N
n

+
=

(11)

Dond es estimada por e
2
c

( )
1
1 2

=

=
n
M y y
s
n
i
i i
c







Ejemplo. Plantacin forestal
Tomando el ejemplo del volumen de madera de la plantacin forestal, para calcular el nmero de
muestras necesarias para tener un error de estimacin de 10,000m
3
, en este caso sabemos que N =600 y
conocemos el tamao de M.

( )( )
( )( )
8 . 388
348 , 153
001 . 2 600
000 , 10
348 , 153 600
2
2
=
+
= n

Es decir, necesitamos muestrear 389 sitios para tener un error de estimacin de 10,000m
3
con un
90% de confiabilidad.

Para el caso donde el tamao poblacional M es desconocido, y usaste la
estimacin N
c
=

, puedes utilizar la frmula anterior simplemente cambiando


de
2
c
) (
c
y M V

por de
2
t
) ( N V

, como se muestra a continuacin,



Tamao Aproximado Requerido para Estimar usando N

( )
2
2
, 1
2
2
2
t
n
t
t N
B
N
n

+
=

(12)
Dond es estimada por e
2
t
) ( N V


( )
1
1 2

=

=
n
y
s
n
i
i
i
t



Ejemplo. Plantacin forestal (cuando desconocemos M)
Nuevamente tomemos el caso de la plantacin forestal, pero suponiendo que no conocemos el
tamao de los conglomerados, para calcular el nmero de muestras necesarias para tener un error de
estimacin de 10,000m
3
de madera, en este caso sabemos que N =600 pero desconocemos el tamao de
M.

157

( )( )
( )( )
2 . 466
234 , 290
001 . 2 600
000 , 10
234 , 290 600
2
2
=
+
= n

Es decir, necesitamos muestrear 466 conglomerados para tener un error de estimacin de
10,000m
3
de madera con un 90% de confiabilidad.


Cmo estimar una proporcin poblacional?
La estimacin de una caracterstica G especfica de la poblacin muchas
veces resulta el objeto de nuestra investigacin, es decir, nos encontramos ante
situaciones donde queremos conocer: cul es la proporcin de rboles que tienen
cierta enfermedad, o la preferencia a cierto partido poltico, la aceptacin a cierta
norma ecolgica?, etc. Por esto en esta seccin introducimos los estimadores de
proporcin para un muestreo por conglomerados, en donde podrs notar que
usamos la ecuacin (1) que nos proporciona la media estimada, con la variante de
que ahora reemplazamos por , con esta ltima definida como sigue,

Donde G es la caracterstica de inters y,



i
y
i
a

=
=

=
G y si
G y si y y
a
ij
ij
n
i
ij i
i
0
1

=
no 0
si 1
y
ij

=
=
n
i
ij i
y a
1

Estimador de la Proporcin Poblacional

=
=

=
n
i
i
n
i
i
c
M
a
p
1
1
(13)

La estimacin de la varianza de la proporcin poblacional, te podr dar
idea acerca de la precisin que puedes obtener de tus estimaciones, a continuacin
aparece la expresin para su estimacin.

Varianza estimada de

c
p

1
1
2
2


n
M p a
M Nn
n N
p V
n
i
i c i
c
(14)

158

159
La expresin para calcular los lmites de la estimacin de la proporcin
poblacional, se presenta a continuacin.





Intervalo de Confianza para

c
p

( )


c i n c
p V t p
2 , 1 .
(15)
La varianza obtenida en la ecuacin anterior es sesgada y puede ser mejor
en cuanto n sea grande y el sesgo desaparecera si los tamaos de los
conglomerados fuesen iguales.
Ejemplo. Prueba de producto
Cierta empresa desea realizar una prueba de sabor de un nuevo dulce para
nios que quiere sacar al mercado. Para esto realiza una encuesta en una escuela
primaria, la cual tiene 20 salones de clases y la empresa decide hacer un muestreo
por conglomerados en una etapa seleccionando al azar 4 salones. Para hacer sobre
ellos su prueba de sabor a cada alumno. El producto se da a probar y
posteriormente pregunta al alumno si le gusto, calificando la respuesta s con uno y
la respuesta no con cero.
En este caso 6316 . 0
3
3
1
2
=

i
i i
M p a
.
Cuadro 4. Prueba de producto.
Conglomerado
i
M

=
n
i
i
a
1

Saln 1 17 9
Saln 2 25 13
Saln 3 20 11
Saln 4 18 11
Total 80 44
Con la ecuacin (13) podemos calcular la proporcin de personas a quienes
les gust el producto, como se muestra a continuacin,
55 . 0
80
44
=
=

c
p

La varianza de esta estimacin se calcula con la ecuacin (14) como sigue,
( )( )( )
( )
000315 . 0
6316 . 0
20 4 20
4 20
2
=


c
p V

Por ltimo un intervalo de confianza con un 90% de confiabilidad , lo
obtenemos con la ecuacin (15), se muestra a continuacin,
( )
( ) 6065 . 0 4934 . 0
000315 . 0 1824 . 3 5500 . 0


160
Lo que significa que con un 90% de confiabilidad nuestra estimacin se
encuentra entre 0.5 y 0.6.
La determinacin del tamao de muestra para una proporcin poblacional de
hace de manera anloga a la de ocasiones anteriores, con un lmite de B unidades
para el error de estimacin, reemplazando a
i
y por
i
a y a
c
y por

c
p .

Tamao Aproximado Requerido para Estimar

c
p

( )
2
, 1
2
2
2
2
c
n
c
t
B
M N
N
n

+
=

(16)
Donde
2
c
es estimada por,
1
) (
1
2


=

=


n
m p a
s V
n
i
i i
c
(17)


Ejemplo. Prueba de producto
Tomando el ejemplo anterior, podemos calcular el nmero de muestras
necesarias para obtener un error mximo de estimacin de 0.05 con un 90% de
confiabilidad, lo cual se muestra a continuacin,
( )( )
( )( )
84 . 4
6316 . 0
1824 . 3
05 . 0
20 20
6316 . 0 20
2
2
2
=
+
= n

Es decir, necesitamos muestrear 5 salones para tener un error de estimacin de
0.05.



COMENTARIOS
Es importante recordar que en este diseo de muestreo las unidades muestrales son grupos de
elementos.
El muestreo por conglomerados es recomendable cuando se desea minimizar el costo por unidad
muestreada cuando.
Como en otros diseos de muestreo, el diseo por conglomerados puede ser una combinacin
con otros diseos por ejemplo en el estratificado.








161





APNDICE II. Hoja de Clculo


El texto cuenta con un disquete que tiene un archivo en Excel con 7 hojas de clculo, cada una
con el nombre del diseo de muestreo que contiene las frmulas para calcular sus
correspondientes estimadores.






En cada hoja se indican las instrucciones de uso para obtener los principales estimadores. Para
ejemplificar este punto a continuacin presentamos algunos ejemplos vistos en el captulo, los
cuales pueden variar por redondeo.


Es importante mencionar que estas hojas pueden usarse con diferente tipo de informacin, segn
sea conveniente.


Es recomendable copiar la hoja de clculo y guardarla con otro nombre para evitar la prdida de
alguna frmula.















Ejemplo. Calidad de jeringas


162


En este ejemplo se estimo la media poblacional y su correspondiente
intervalo de confianza, el total estimado tambin se despliega en el cuadro anterior
pero no en necesario para efectos prcticos.



APITULO 8


MUESTREO POR CONGLOMERADOS EN DOS ETAPAS

C
163 Conceptos Bsicos de Estadstica



INTRODUCCIN
Como te imaginars, el muestreo por conglomerados en dos etapas es en
esencia muy parecido al de una etapa y tambin busca facilitar el manejo de los
datos para reducir el costo de operacin. Adems te proporciona mas ideas que
te podrn ayudar a decidir el diseo mas adecuado para medir el fenmeno en
cuestin.
La diferencia entre el muestreo por conglomerados de una y dos etapas,
radica en la forma de seleccionar las unidades secundarias; la definicin formal
se muestra a continuacin,

Definicin
Muestra por conglomerados en dos etapas
La muestra por conglomerados en dos etapas, la obtenemos,
1. Eligiendo una muestra aleatoria simple de n unidades primarias de entre una
poblacin de N (como en muestreo por conglomerados en una etapa).
2. Eligiendo una muestra aleatoria simple de unidades secundarias dentro de
cada unidad primaria muestreada.

En este muestreo encontramos dos principales ventajas, la primera es que no
tenemos que hacer el proceso de aleatorizacin a cada elemento de la poblacin,
lo cual puede ahorrarnos una tarea muy complicada, en segundo lugar, si se
trata de unidades que se encuentran geogrficamente separadas, puede
ahorrarnos costos en transportacin para la toma de la muestra.

Te estars preguntando qu caractersticas debe tener nuestra unidad
muestral o conglomerado. En general, este muestreo es muy til cuando se trata
de poblaciones con muchos elementos, como municipios, unidades
habitacionales; en la industria puede resultar muy til cuando necesitamos
muestrear cientos de unidades que vienen empacadas en cajas para validar su
calidad o cuando se trata de productos que tienen varios componentes. Por
ejemplo, podras enfrentarte a la situacin de tener que saber la validez de las
facturas que genera en toda la semana una empresa muy grande que realiza
operaciones en todo el pas. Como te imaginars esto se tiene que hacer en el
menor tiempo para reaccionar rpidamente a cualquier fraude, tambin al
menor costo pues es un trabajo que se realiza semanalmente y que generalmente
no presenta muchos riesgos. Con estas necesidades podramos ejecutar un
muestreo por conglomerados en dos etapas, tomando los paquetes de facturas
como conglomerados, marcndolos por su hora de llegada a la agencia
corporativa. As seleccionaremos primero aleatoriamente los paquetes de
facturas y posteriormente seleccionaremos aleatoriamente entre todas las
facturas del paquete. Es importante tomar en cuenta que en este ejemplo no se
necesita demasiado control sobre el proceso, pues segn experiencias anteriores
es poco probable cometer un fraude de este tipo, sin embargo es indispensable
realizar esta inspeccin.

164
Como ya mencionamos este diseo puede aplicarse en poblaciones muy
grandes por ejemplo en el estudio de las hojas de un archivero, o los nios de
cierta edad en un municipio, ya que la medicin se hace slo en los elementos
que sean seleccionados al azar dentro de un conglomerado los cuales fueron
casos destacados por razones obvias para aplicar el diseo de muestreo del
captulo anterior.
































Comparacin con otros muestreos
Podrs encontrar similitudes entre este muestreo, el estratificado y el
conglomerado en una etapa, pues todos agrupan los datos de acuerdo a una

165
caracterstica semejante entre ellos, por ejemplo, el muestreo estratificado forma
estratos que difieren notablemente entre ellos y dentro de cada estrato se obtiene
una muestra aleatoria, en el caso del muestro por conglomerados en una etapa,
se trata de obtener grupos de elementos muy similares entre ellos, los cuales son
elegidos aleatoriamente para despus muestrear todos los elementos del grupo o
conglomerado, por ltimo, el conglomerado en dos etapa usa el mismo principio
que el de una, pero en lugar de elegir todos los elementos del conglomerado, se
relaciona tan solo una muestra aleatoria.

Diagrama 1. Comparacin de muestreos por conglomerados.
Muestreo por Conglomerados en una
Etapa
Muestreo por Conglomerados en dos
Etapas
Poblacin de N unidades
primarias
Extraemos una muestra
aleatoria simple de n
Poblacin de N unidades
primarias
Extraemos una muestra
aleatoria simple de n
Analizamos todas las
unidades secundarias en las
id d i i
Extraemos una muestra
aleatoria simple de m
id d d i l

166
Notacin
Como te habrs dado cuenta, en este tipo de muestreo existen diferentes
tipos de unidades, por esto, es importante contar con una notacin para
diferente, la cual ser la siguiente,


Unidades Primarias
N Nmero de conglomerados o unidades primarias en la poblacin

n Nmero de conglomerados seleccionados de una muestra simple
aleatoria


Unidades Secundarias:
i
M Nmero de unidades secundarias en el conglomerado i

i
m Nmero de unidades secundarias seleccionadas en una muestra
aleatoria del conglomerado i

=
=
N
i
i
M M
1
Nmero de unidades secundarias en la poblacin

N
M
M = Tamao de conglomerado promedio en la poblacin

=
=
i
m
j
ij
i
i
y
m
y
1
1
Media muestral para el i-simo conglomerado

ij
y j-sima unidad secundaria en el i-simo conglomerado.

Estimacin de una Media y un Total Poblacional
Recordemos que el muestreo por conglomerados en una etapa es usado
cuando resulta menos costoso hacer un censo de unidades secundarias contiguas
que hacer un muestro aleatorio sobre toda la poblacin. La misma situacin
ocurre con el muestreo por conglomerados en dos etapas. Con la ventaja de
hacer ms econmico el costo de muestrear, ya que en lugar de hacer un censo
en cada unidad primaria o conglomerado, se toma una muestra aleatoria. Pero
la seleccin de unidades primarias se hace como en el muestreo aleatorio simple
por lo que la media y el total se obtienen de la misma manera que en el
muestreo en una etapa. Esto sugiere en principio podemos usar el estimador de
visto en el captulo anterior que es un estimador insesgado.

=
=
n
i
i
y
n
N
1


167
Procediendo como en casos anteriores, podemos estimar a , dividiendo
la ecuacin anterior entre M, la cual hereda la propiedad de estimador
insesgado; sin embargo an no podemos obtener el estimador en el muestreo en
dos etapas, pues no conocemos los totales de los conglomerados
i
y . Sin embargo,
esto no nos debe preocupar ya que estos pueden ser fcilmente estimados,
sustituyndolos por
i i
y M , el cual tambin es un estimador insesgado del total.
A continuacin se presentan los estimadores suponiendo que contamos
con una muestra aleatoria de n conglomerados que contienen MB
i
B elementos cada
uno de ellos.

Estimador de la Media Poblacional


n
y M
M
N
y
n
i
i i
c

=
1
2
(1)

La varianza de este estimador es de gran utilidad al momento de querer
conocer la dispersin de los datos y para saber la precisin de nuestra
estimacin. Esta se muestra en la siguiente expresin.

Estimador de la Varianza de
c
y
2


( )


=

=

i
i
i
i i
n
i
i b c
m
s
M
m M
M
M nN
s
M n
N
n N
y V
2
1
2
2
2
2 2
1 1
(2)
Donde,
1
1
2
2


=

=

n
M y M
s
n
i
i i
b


( )
n i
m
y y
s
i
m
j
i ij
i
i
K , 2 , 1
1
1
2
2
=

=

=


Al conocer el estimador de la varianza de
c
y
2
, estamos en posibilidad de
calcular su correspondiente intervalo de confianza, el que nos dar los lmites en
los que se encuentra nuestra estimacin. La expresin que lo estima es la
siguiente.

Intervalo de Confianza para
c
y
2



( )
( )
c n c
y V t y
2 2 , 1 2


(3)
Como hicimos en muestreo simple aleatorio, podemos obtener un estimador
insesgado, multiplicando el estimador insesgado de la media poblacional
obtenido en la ecuacin (1) por el nmero de elementos en la poblacin.


168

Ejemplo. Investigacin de productividad de maz.
Un centro de investigacin desea saber la cantidad de maz que produce
una planta de una nueva variedad con la que estn experimentando. Para esto
cuentan con 40 campos donde plantaron la nueva variedad en una melga de
experimentacin que mide 1m X 100m, donde las semillas se plantaron a una
distancia de 1m una de otra. Han decido que aplicarn un muestreo por
conglomerados en dos etapas. En este caso se seleccionaron al azar 15 unidades
primarias (que son las melgas donde cultivan la nueva variedad de maz) y
tambin al azar las unidades secundarias sobre las que se har la observacin
(las plantas que estn dentro de las melgas). Hay que tomar en cuenta que
aunque se sembraron 8,000 semillas, no todas llegaron a desarrollarse y que en
general se toma un 8% de mortandad por lo que M=7,200 plantas.



















Diagrama 2. Diseo de plantacin en una melga

Despus de hacer las mediciones, contamos con los siguientes datos,










1m
100m
1m
.
.
.
100m

169
Cuadro 1. Investigacin de productividad de maz
Conglomerado MB
i
B mB
i
B
i
y (kg)
i i
y M
2
i
s
2
b
s (*)
1 194 16 9.45 0.590 114.55 0.00266 134.185 5.740
2 200 16 9.75 0.610 121.90 0.00329 358.579 7.565
3 175 14 7.47 0.533 93.33 0.00279 92.838 5.610
4 163 13 6.44 0.495 80.72 0.00299 494.829 5.620
5 181 14 7.73 0.552 99.98 0.00249 8.926 5.378
6 171 14 7.33 0.524 89.57 0.00269 179.483 5.154
7 197 16 9.68 0.605 119.13 0.00239 261.454 5.321
8 186 15 8.50 0.567 105.40 0.00259 5.912 5.487
9 175 14 7.47 0.533 93.33 0.00399 92.838 8.024
10 192 15 8.79 0.586 112.45 0.00318 90.033 7.196
11 174 14 7.47 0.533 92.80 0.00284 103.400 5.646
12 173 14 7.40 0.529 91.44 0.00332 132.842 6.527
13 185 15 8.50 0.567 104.83 0.00289 3.477 6.054
14 187 15 8.57 0.571 106.85 0.00239 15.121 5.119
15 197 16 9.60 0.600 118.20 0.00254 231.996 5.658
Suma 2,750 221 1,544.53 2,205.913 90.099
Promedio 183.33

En base a los datos de la tabla anterior y aplicando la ecuacin (1)
obtenemos el estimador del promedio,

572 . 0
15
53 . 544 , 1
200 , 7
40
2
=

=
c
y

Lo que significa que el promedio de granos de maz por planta es de
0.56192kg.

La obtencin de la varianza la calculamos con la ecuacin (2), de la
siguiente manera,
( )
( )( ) ( )( )( )
( )
000207265 . 0
10 63423 . 4 000207265 . 0
099 . 90
180 40 15
1
14
9 . 205 , 2
180 40
1
40
15 40
6
2 2 2
=
+ =
+

c
y V

Donde (*) es

=
i
i
i
i i
n
i
i
m
s
M
m M
M
2
1
2


Finalmente el intervalo de confianza con un 90% de confiabilidad es el
siguiente,
( )
( ) 6029 . 0 5412 . 0
000207265 . 0 14478 . 2 572047 . 0

Como en los diseos de encuestas anteriores, el total de la poblacin puede
ser conocido tan solo multiplicando la media que obtuvimos en la ecuacin (1)

170
por M que denota el nmero total de elementos en la poblacin y el estimador es
el siguiente,

Estimador del Total Poblacional

= =

=

n
y M
N y M
n
i
i i
c c
1
2 2
(4)

La estimacin de la varianza del total, te podr dar idea acerca de la
precisin que puedes obtener de tus estimaciones, a continuacin aparece la
expresin para su estimacin.
Varianza Estimada de

c 2


( )


=
=

n
i
i
i
i
i i
i b
c
m
s
M
m M
M
n
N
s
n
N
N
n N
y V M V
1
2
2 2
2
2
2

(5)

La expresin para calcular los lmites de la estimacin del total
poblacional, se presenta a continuacin.

Intervalo de Confianza para

c 2


( )

c n c
V t
2 2 , 1 2


(6)

Ejemplo. Productividad de maz.
Ahora el mismo centro de investigacin del ejemplo anterior quisiera saber
cul es la cantidad total de maz cosechado en todos sus centros de investigacin.

( )
( )( )
74 . 118 , 4
97 . 102 40
15
53 . 544 , 1
40
2
=
=


La cantidad total de maz cosechada en las 40 melgas de los centros de
investigacin es de 4.12 toneladas. Lo que nos indica que en 1Ha la produccin sera
aproximadamente de 10.29 Ton lo que es una muy buena productividad, por lo que
esta variedad sera ampliamente recomendada.

171
La varianza de esta estimacin la calculamos multiplicando la varianza de la estimacin de la
media por el nmero de unidades secundarias al cuadrado.

( ) [ ]
6 . 744 , 10
000207265 . 0 200 , 7
2
=
=


V

El intervalo de confianza con un 90% de confiabilidad es el siguiente,

( )
( ) 06 . 341 , 4 42 . 896 , 3
6 . 744 , 10 1447 . 2 74 . 118 , 4

Lo que significa que la estimacin de la produccin de maz en las melgas de investigacin
puede variar entre 3.9 Ton y 4.3 Ton.



Qu pasa cuando desconozco el tamao
de la poblacin?
Con las ecuaciones anteriores debes conocer el total poblacional para poder aplicar las
ecuaciones. Sin embargo, esto puede resultar complicado si desconocemos el total de elementos en la
poblacin M. Afortunadamente el valor de M puede ser fcilmente estimado con la siguiente
expresin,
N
M
M =


Ahora bien, si reemplazamos M por

M en la ecuacin (1), obtenemos un


estimador que tiene caractersticas de un estimador de razn. De aqu que exista
la estrategia de estimacin con un estimador de razn para los parmetros
deseados. A continuacin se muestran los estimadores,


Estimador de Razn de la Media Poblacional

=
=
=
n
i
i
n
i
i i
r
M
y M
y
1
1
2
(7)


La estimacin de la varianza de la razn poblacional, te podr dar idea
acerca de la precisin que puedes obtener de tus estimaciones, a continuacin
aparece la expresin para su estimacin.



172

Varianza Estimada de
r
y
2

( )


=

=

i
i
i
i i
n
i
i r r
m
s
M
m M
M
M nN
s
M n
N
n N
y V
2
1
2
2
2
2 2
1 1
(8)
Donde,
( )
1
1
2
2
2
2

=

=
n
y y M
s
n
i
c i i
r

( )
n i
m
y y
s
i
m
j
i ij
i
i
K , 2 , 1
1
1
2
2
=

=

=


La expresin para calcular los lmites de la estimacin de la razn
poblacional, se presenta a continuacin.

Intervalo de Confianza para
r
y
2


( )
( )
r n r
y V t y
2 2 , 1 2


(9)

Ejemplo. Contenido de humedad
El gerente de recepcin de materias primas de una empresa de alimentos,
necesita saber la cantidad de humedad del maz que est comprando ya que de
esto depende la calidad del producto final. El gerente recibe varios embarques al
da de diferentes proveedores y la mecnica consiste en determinar rpidamente
si el embarque es recomendable despus de analizar algunos de sus componentes
en el laboratorio para decidir aceptar o rechazar el embarque de maz, tomando
en cuenta que la especificacin indica que la humedad del maz no debe ser
menor de 55% y no debe ser mayor de 65%. De ser aceptado se meter a
produccin inmediatamente, de otra manera se regresar todo el embarque al
proveedor. Hay que tomar en cuenta que se les ha pedido a todos los
proveedores que los embarques lleguen en sacos de 50Kg cada uno, y la poltica
de la empresa es analizar el 7% del embarque pues se cree que esta medida es
suficiente para asegurar la calidad de todo el embarque.
El embarque que debe ser sometido a prueba ya est en la entrada del
almacn de materias primas. Segn la remisin del chofer, l transport 150
sacos de maz; ahora es necesario determinar si el embarque es aceptado o
rechazado.
Parece evidente que la forma ms sencilla de seleccionar la muestra que
ser sometida a pruebas en el laboratorio debe ser sistemtica pues agiliza la
seleccin y cubre toda la poblacin. Si este fuese el caso, el valor de k se
determinara como sigue,
15
10
150
= = k
Donde 10 representa aproximadamente el 7% de 150.

173
Sin embargo para este ejemplo supondremos una seleccin aleatoria, al
final del captulo hablaremos de las variantes de este diseo.
Despus de seleccionar aleatoriamente los sacos y analizarlos en el
laboratorio tenemos lo siguientes datos,
Cuadro 2 . Contenido de humedad.
Conglomerado
Saco
i
M
i
m
i
y
2
i
s
i i
y M
2
r
s
(*)
1 250 22 61.238 59.248 15,310 15,797 153,507
2 245 26 60.095 36.462 14,723 162,546 75,244
3 234 22 62.381 46.452 14,597 22,437 104,744
4 200 22 61.048 46.038 12,210 19,222 74,498
5 234 22 63.900 18.648 14,953 255,273 42,049
6 270 24 59.333 26.029 16,020 422,532 72,035
7 245 24 62.982 65.847 15,431 92,490 148,553
8 230 24 66.607 157.705 15,320 1,252,724 311,336
9 255 28 56.639 48.919 14,443 1,692,589 101,132
10 260 30 63.818 89.627 16,593 291,720 178,656
Suma 2,423 244 149,598 4,227,328 1,261,754
Donde,
i
M Nmero de mazorcas en el saco
i
m Nmero de mazorcas seleccionadas para hacer la medicin de humedad
i
y Promedio de la humedad que tienen las mazorcas del i-simo conglomerado.
2
i
s Varianza de la humedad que tienen las mazorcas del i-simo conglomerado.
(*) Es

=
i
i
i
i i
n
i
i
m
s
M
m M
M
2
1
2

El porcentaje de contenido de humedad en el embarque de maz lo
podemos calcular con la ecuacin (7) de la siguiente manera,
7408 . 61
423 , 2
149,598
2
=
=
r
y

La varianza es la siguiente,
( )
( )( ) ( )( )( )
( )
7610 . 0
0143 . 0 7467 . 0
19 1,261,754.
3 . 242 150 10
1
9
328 , 227 , 4
3 . 242 10
1
150
10 150
2 2 2
=
+ =
+

r
y V

Donde M la estimamos como sigue,
3 . 242
10
423 , 2
=
= M

Y el intervalo de confianza con un 95% de confiabilidad es el siguiente,
( )
( ) 0832 . 64 3985 . 59
7610 . 0 6850 . 2 7408 . 61


174
Lo que significa que el contenido de humedad del maz de ese embarque se
encuentra entre 59% y 64%, lo que significa que el embarque puede ser aceptado
ya que cumple con las especificaciones de calidad.

175
Determinacin del Tamao de la Muestra
Debes tomar en cuenta que las organizaciones privadas o gubernamentales que desean hacer una
encuesta a gran escala estn muy interesadas en que los resultados sean confiables, ya que son decisiones
muy importantes las que se tomarn con estos resultados y una inversin econmica muy considerable la
que destinarn.
As que al disear una encuesta por conglomerados, debes resolver algunos puntos como,
La precisin global necesaria
El nmero de unidades primarias que debemos seleccionar
El nmero de unidades secundarias que debes seleccionar por cada unidad primaria
La precisin necesaria y el tamao que deben tener las unidades primarias, son cuestiones que hemos
resuelto en los diseos anteriores, por lo que es el nmero de unidades primarias y secundarias es lo que
nos ocupar a continuacin y estas dependern una de otra.
Los valores que buscaremos son n y el de todas las mB
i,
By la mejor seleccin de estos valores
depende de dos fuentes de variacin, la que existe dentro de los conglomerados y la que hay entre ellos.
Como lo mencionamos anteriormente la determinacin del nmero de conglomerados y del nmero de
elementos dentro de ellos son variables dependientes, y la decisin se tomar con base a la fuente de
mayor variacin, por ejemplo, si las medias entre conglomerados varan mucho unas de otras y sus
mediciones son homogneas, entonces seleccionaremos muchos conglomerados de pocos elementos, pero
si las mediciones varan de manera considerable entre ellas y las medias entre conglomerados son
homogneas, entonces muestreamos pocos conglomerados con muchas mediciones en cada uno de ellos.

Considera que,
=
2
b
varianza entre las medias de conglomerados
=
2
w
varianza entre los elementos dentro de los conglomerados
Y que el costo total por muestrear est dado por,
2 1
nmc c C + =
Donde,
cB
1
B: Costo de muestrear cada unidad primaria
cB
2
B: Costo de muestrear cada unidad secundaria

Bajo estos supuestos, el valor de m que minimiza la varianza con un costo fijo, est dada por la
siguiente ecuacin,









Tamao de m aproximado requerido para estimar

2
2
1
2
c
c
m
b
w

= (10)
Donde
2
w
es estimada por,

=
=
n
i
i w
s
n
s
1
2 2
1

Donde
2
b
es estimada por,
m
s
y
n
s
w
n
i
i b
2
1
2
1
1

=

=


Donde

es estimada por,
c
y
2


176
Para conocer el nmero de unidades primarias que minimizarn la varianza, utilizars la
siguiente expresin.
Tamao de n aproximado requerido para estimar

+ =
m
n
w
b
c
2
2
2
1

(11)
Donde
2
2c
es estimada por ) (
2c
y V



Ejemplo. Humedad del maz
Utilizando el ejemplo del contenido de humedad podemos calcular el
tamao de muestra que minimiza la varianza como sigue,
( )
89 . 8
10
52 . 7
10 / 595
=
= m

Lo que significa que debemos muestrear 9 unidades primarias de cada
conglomerado seleccionado.
Donde,
( ) ( ) [ ]
52 . 7
224
5 . 59
74 . 61 82 . 63 74 . 61 23 . 61
9
1
2 2 2
=
+ + = L
b
s

Y el nmero total de conglomerados es el siguiente,
20 . 10
224
5 . 59
52 . 7
7610 . 0
1
=

+ = n

Por lo tanto, debemos muestrear 11 conglomerados o sacos de maz para asegurar
la calidad requerida.









APNDICE II. Hoja de Clculo


El texto cuenta con un disquete que tiene un archivo en Excel con 7 hojas de clculo, cada una
con el nombre del diseo de muestreo que contiene las frmulas para calcular sus
correspondientes estimadores.






En cada hoja se indican las instrucciones de uso para obtener los principales estimadores. Para
ejemplificar este punto a continuacin presentamos algunos ejemplos vistos en el captulo, los
cuales pueden variar por redondeo.

177


Es importante mencionar que estas hojas pueden usarse con diferente tipo de informacin, segn
sea conveniente.


Es recomendable copiar la hoja de clculo y guardarla con otro nombre para evitar la prdida de
alguna frmula.














Ejemplo. Contenido de humedad




178


Este ejemplo busca estimar la media poblacional con sus correspondientes
intervalos de confianza. Tambin puedes estimar el tamao de unidades a
muestrear para tener determinado error de estimacin tomando en cuenta el costo
por muestrear.
BIBLIOGRAFA
AZORIN, F.1967. Curso de Muestreo y Aplicaciones. Ed. Aguilar. Madrid.


COCHRAN, W.1980. Tcnicas de Muestreo. Ed. Compaa Editorial
Continental. Harvard University


GONICK, L. and SMITH, W. 1993. The Cartoon Guide os Statistics.De. Harper
Perennial.USA.


HANSEN, M.,HURWITS, W. and MADOW, W. 1953. Sample Survey
Methods and Theory. Ed. J ohn Wiley & Sons. Canada. Vol 1.


HANSEN, M.,HURWITS, W. y MADOW, W. 1953. Sample Survey Methods
and Theory. Ed. J ohn Wiley & Sons. Canada. Vol 2.


INFANTE, S. y ZRATE G. 1988. Mtodos Estadsticos. Ed. Trillas. Mxico.
D.F.


KISH, Leslie. 1975. Muestreo de Encuestas. Ed. Trillas. Mxico D.F.


LOHR, S.2000.Muestreo. Diseo y Anlisis, Ed. International Thomson.
Arizona.


SCHREUDER, H., GREGOIRE, T. y WOOD, G. 1993. Sampling Methods for
Multiresource Forest Inventory. Ed. J ohn Wiley &Sons. Canada.


SHIVER, B. and BORDERS, B. 1996. Sampling Technics for Forest Resource
Inventory. Ed. J ohn Wiley & Sons. Georgia.


SUKHAME, P. and SUKHAME, B. 1954. Sampling Theory of Surveys with
Applications. Iowa Sate University. USA.


THOMPSON, S.1992. Sampling. Ed. J ohn Wiley & Sons. Pennsylvania.

179


WOODROOFE, M. 2000. Probabilidad con aplicaciones.Universidad de
Michigan. Mxico.


YAMANE, Taro. 1967. Elementary Sampling Theory. Ed. Pretice-Hall.New York
University.

También podría gustarte