Está en la página 1de 60

UNIVERSIDAD DE LOS ANDES

FACULTAD DE CIENCIAS ECONMICAS Y SOCIALES


ESCUELA DE ESTADSTICA

CURSO DE MUESTREO

Prof. Elizabeth Torres Rivas


Mrida, Junio 2004

2
INDICE

INTRODUCCIN 3

TEMA 1. ORGANIZACIN DE UNA INVESTIGACIN POR MUESTREO DE


ENCUESTA 4

VENTAJAS MUESTREO VS. CENSO. (VENTAJAS MUESTREO VS. CENSO) 5


TIPOS DE ENCUESTA POR MUESTREO 5
DISEO DE ENCUESTAS 6
DISEO DE CUESTIONARIOS 6
CONCEPTUALIZACION Y DISEO DEL INSTRUMENTO 7
FORMATO DE PRESENTACIN DEL CUESTIONARIO 8
SECUENCIA Y ORDENAMIENTO DE LAS PREGUNTAS 10
REPRODUCCIN DEL CUESTIONARIO 10
TIPOS DE MUESTREO 13
TIPOS DE MUESTREO PROBABILSTICO 14

TEMA 2. MUESTREO ALEATORIO SIMPLE 16

PROBABILIDAD QUE TIENE UNA UNIDAD DE PERTENECER A LA MUESTRA


17
ESTIMACIN DE LA MEDIA Y EL TOTAL 19
ESTIMACIN DE LA MEDIA POBLACIONAL 21
ESTIMACION DEL TOTAL POBLACIONAL 23
FORMAS DE CALCULAR ESTIMACIONES DE 2 25
ESTIMACIN DE LA PROPORCIN P 25
VENTAJAS DEL MUESTREO ALEATORIO SIMPLE 29
DESVENTAJAS DEL MUESTREO ALEATORIO SIMPLE 29

TEMA 3. MUESTREO ESTRATIFICADO 29

RAZONES PARA ESTRATIFICAR 29


CMO SELECCIONAR UNA MUESTRA ALEATORIA ESTRATIFICADA? 30
ESTIMACIN DE LA MEDIA 30
ESTIMACIN DEL TOTAL 33
ASIGNACIN DE LA MUESTRA 38
TIPOS DE ASIGNACIN. 38

TEMA 4. MUESTREO POR CONGLOMERADOS 47

CMO SELECCIONAR UNA MUESTRA POR CONGLOMERADOS? 48


ESTIMACIN DE LA MEDIA POBLACIONAL 49
ESTIMACIN DEL TOTAL POBLACIONAL 50
ESTIMADOR DE LA PROPORCIN 53

BIBLIOGRAFA 55

2
INTRODUCCIN

En toda investigacin estadstica existe un conjunto de elementos sobre los que se toma
informacin. Este conjunto de elementos es lo que se denota con el nombre de poblacin o
universo estadstico. Cuando se toma informacin de todos y cada uno de los elementos de
dicha poblacin, decimos que se realiza un censo. Sin embargo, esto no siempre es posible,
ya sea porque es costoso, requiere mucho tiempo, o bien porque la toma de informacin
lleve consigo la destruccin de los elementos en cuestin, o que la poblacin tenga infinitos
elementos. Este problema hace que el investigador tome la informacin de una parte de la
poblacin, proceso que recibe el nombre de muestreo.

Toda sociedad requiere INFORMACIN toma de decisiones. Ya que la informacin


cuesta dinero, el investigador debe determinar que tanta informacin debe comprar.
Demasiado poca informacin le impide realizar buenas estimaciones, mientras que mucha
informacin ocasiona un despilfarro de dinero.

CARACTERSTICAS DE LA INFORMACIN

Suficiente
1. Calidad
Confiable

2. Oportuna (tiempo)

3. Bajo costo.

El objetivo de la mayora de las investigaciones estadsticas consiste en hacer


generalizaciones vlidas, con informacin muestral, acerca de poblaciones de las cuales
provienen las muestras.

Estadstica moderna es una teora de la informacin con la inferencia como su objetivo. El


medio para la inferencia es la MUESTRA.

Censo
Mtodo de bsqueda de informacin
Muestreo

Qu es el muestreo?. Es una tcnica inductiva para estimar totales o promedios. La


estimacin puede ser tan exacta como queramos al incrementar el tamao de la muestra.
Puede ser acompaada por un lmite de error de estimacin o bien expresada como un
intervalo de confianza.

3
Qu se pretende con el curso muestreo?

Objetivos del Curso:

1. Disear los instrumentos o cuestionarios de la encuesta.


2. Economa de adquirir una cantidad especfica de informacin.
3. Tipos de muestreo para cientficos, sociales, comercio, administracin, economa,
ciencias forestales. Los fsicos realizan EXPERIMENTOS, los otros realizan
ENCUESTAS.
4. Determinacin de tamaos de muestra con error especificado. El muestreo abarca 3
grandes reas.
4.1. Diseo de la muestra.
4.2. Determinacin de tamao de muestra.
4.3. Inferencias.

Con la investigacin por muestreo se persigue encontrar perfiles de la poblacin (medidas,


resumen, comportamientos del colectivo). No se persigue encontrar caractersticas
personales.

Justificacin

Se presenta de forma intuitiva una introduccin general a los mtodos de muestreo y


gradualmente, se va haciendo especial nfasis en los aspectos conceptuales y analticos.

Este curso es de particular inters para los alumnos de la Licenciatura de Estadstica, sobre
todo requisito fundamental para las asignaturas de Anlisis de Datos y Anlisis
Multivariante.

TEMA 1. ORGANIZACIN DE UNA INVESTIGACIN POR MUESTREO DE


ENCUESTA

La encuesta por muestreo es una metodologa que abarca ms all del muestreo
propiamente dicho, el cual consiste en el mtodo de seleccin de la muestra, determinacin
del tamao de muestra y la inferencia estadstica. La finalidad de una encuesta por
muestreo es obtener informacin para satisfacer una necesidad definida. La necesidad de
recopilar datos surge en todo campo de la actividad humana.

Ejemplo:
- Poblacin.
- Mano de obra.
- Agricultura.
- Industria.
- Comercio Interno.

4
Una investigacin por muestreo se puede dividir en 3 etapas bsicas:
1. Planificacin.
2. Recoleccin de la Informacin.
3. Anlisis de los resultados.

VENTAJAS MUESTREO Vs. CENSO.

a. Costo reducido (Los gastos son menores que los que se realizaran si le lleva a cabo
un censo).
b. Mayor rapidez (El muestreo emplea menos tiempo en recopilar y procesar los datos
que el censo).
c. Mayor exactitud. Se espera que una encuesta bien empleada produzca resultados ms
exactos que el censo. En el censo surgen ms errores por la complejidad y magnitud
del trabajo. El muestreo emplea personas de mayor calibre, es posible capacitarlos
mejor y supervisar su trabajo.
d. Estimar validamente el margen de error y decidir si los resultados son
suficientemente exactos. Un censo completo no revela el margen de incertidumbre al
cual est sometido. En poblaciones pequeas censo.

TIPOS DE ENCUESTA POR MUESTREO

Segn el objetivo que se persiga en la investigacin por muestreo, las encuestas se


clasifican en:

1. Descriptivas.
2. Analticas.
3. Exploratorias.

OBJETIVOS

Descriptivas: Permiten describir el comportamiento del fenmeno en estudio, es decir, con


ellas se puede conocer cierta informacin sobre grandes grupos. Ejemplo: nmero de
hombres que ven televisin.

Analticas: aquellas que permiten hacer comparaciones entre subgrupos de una poblacin
para averiguar si existen ciertas diferencias entre ellos y formular o verificar hiptesis sobre
sus causas. Se emplean tcnicas multivariantes.

Exploratorias: proporcionan un mecanismo de bsqueda cuando se est comenzando a


indagar sobre un tema particular. Sirven de base para estudios posteriores y requieren un
anlisis descriptivo.

5
DISEO DE ENCUESTAS

Formulacin del problema de investigacin.

Se refiere al planteamiento del problema a investigar, es decir, definir el qu, por qu, para
qu y cmo.

Definicin de Objetivos.

La primera tarea es fijar en trminos concretos los objetivos de la encuesta.

Cobertura: poblacin que se cubrir. Los objetivos de la encuesta deben definir la


poblacin que se quiere cubrir.

VARIABLES Y ATRIBUTOS INVOLUCRADOS EN LAS HIPTESIS.

Variable: funcin real valorada. Caracterstica que puede tomar diferentes valores.

Atributos: De acuerdo a los atributos la variable se clasifica en:

Cuantitativas Discretas
Continuas
Tipos de Variables
Cualitativas Nominal
o Categricas Ordinal

Escalas de Medicin.

- Nominal.
- Ordinal.
- Intervalo.
- Razn o proporcin.

DISEO DE CUESTIONARIOS

6
El cuestionario es una parte muy importante de la encuesta por muestreo. Habiendo
decidido cul es la informacin que se desea obtener, el problema de su presentacin
requiere considerable habilidad. Las preguntas deben ser claras, sin ambigedades y al
punto. Las preguntas vagas no proporcionan respuestas claras. Deben evitarse las
preguntas que orientes respuestas. Como stas podran depender en alguna medida del
ORDEN en que se hacen la preguntas, debe considerarse tambin su orden. Una pequea
prueba previa siempre es til para decidir sobre un mtodo efectivo para plantear las
preguntas. Todos trminos tcnicos que se utilizan debern ser definidos adecuadamente.
(Des Raj, 39).

Tipos de cuestionarios
Autoadministrado
Entrevistas
Por telfono, correo, personal > inspeccin

Tipos de Preguntas
Abiertas
Cerradas
Seleccin Mltiple
Seleccin dicotmica

Redaccin de las Preguntas

Debe ser clara, sin ambigedades. Es importante cuidar el lenguaje en relacin al pblico
que est dirigido la encuesta.

Debe ser en positivo la redaccin de la pregunta. Se recomienda que no contenga ms de 20


palabras. El nmero de preguntas esta asociado inversamente a la tasa de respuesta.

Preguntas referentes a temas sensibles.

Se debe evitar preguntas que induzcan respuestas y tambin, se debe tener cuidado si el
orden de la preguntas induce a las respuestas.

Prueba Piloto.

El objetivo fundamental de realizar una encuesta piloto es probar la validez, confiabilidad y


precisin del cuestionario o instrumento de medicin. Tambin, tiene como propsito,
determinar costos y tamao de muestra de la encuesta. Una vez probado el instrumento, se
determina la composicin final del cuestionario.

7
CONCEPTUALIZACION Y DISEO DEL INSTRUMENTO

En la investigacin por muestreo, esos conceptos deben ser convertidos en preguntas en un


cuestionario que permite la recoleccin de los datos empricos relevantes para analizar.
Lgica de Conceptualizacin.
Ejemplo: Estatus social puede ser definido por varios elementos: ingreso, prestigio
ocupacional, educacin, riqueza, poder, estatus familiar y valores morales.

Para permitir rigurosa investigacin, sin embargo, tales conceptos generales deben ser
especificados, esto es, deben ser reducidos para especificar, indicadores empricos.

Operacionalizacin.
Los conceptos son codificados generales de la experiencia y observaciones.

En ciencias tales conceptos toman la forma de variables que traen una coleccin de
atributos relacionados.

- Operacionalizacin es el proceso mediante el cual los investigadores especifican


observaciones empricas que pueden ser tomados como atributos contenidos dentro de un
concepto dado.

CALIDAD DE LA MEDICIN

Los elementos siguientes deben ser considerados en el diseo de la encuesta, a fin de


garantizar la adquisicin de informacin de calidad.
- Precisin
- Confiabilidad
- Validez:
Validez de Contenido
Validez de Constructo

FORMATO DE PRESENTACIN DEL CUESTIONARIO

El formato del cuestionario debe ser tan importante como la naturaleza y redaccin de las
preguntas. Una inapropiada presentacin del cuestionario puede conducir a respuestas
errneas.

Se debe evitar:
Cuestionarios demasiados largos, ya que el N de preguntas est asociado
inversamente a la tasa de repuesta.

8
Varias preguntas en una sola lnea.
Preguntas abreviadas.
Demasiadas pginas del cuestionario > que el entrevistado sienta que gasta poco
tiempo en responder el cuestionario.
Cuestionario muy comprimido en espacio son desastrosos.
Formatos para respuestas

[ ] Si ( ) Si 1. Si

[ ] No ( ) No 2. No

[ ] No sabe ( ) No sabe 3. No sabe

Preguntas Contingencia

A menudo en una encuesta, ciertas preguntas sern claramente relevantes solo para un
subconjunto de respondientes.

Pregunta de Contingencia: significa que la segunda pregunta es un contingente, cuya


respuesta depende de la primera.

El uso apropiado de estas preguntas puede facilitarle al respondiente la tarea de responder


el cuestionario y tambin puede mejorar la calidad de los datos producidos.

La segunda pregunta se debe evitar que comience Si..... condicionalmente porque puede
inducir a respuesta.

Estas segundas preguntas deben ser indentadas sobre el cuestionario, encerradas en cajas y
conectadas con la pregunta base a travs de flechas.

Preguntas Matriz.

Tpico caso es el de escala Likert.


A menudo, Ud. desear preguntar varias cuestiones que tengan el mismo conjunto de
categoras de respuesta.

Ejemplo:

17. Al lado de cada afirmacin que se presenta ms abajo, indique si Ud. est
completamente de Acuerdo (CA), Acuerdo (A), en Desacuerdo (D), Completamente en
Desacuerdo (CD) o Indeciso (I).
CA A D CD I

9
a. Este pas necesita ms leyes y orden [ ] [ ] [ ] [ ] [ ]
b. La poltica debe ser el desarme. [] [] [] [] []
c. Durante los disturbios se deben [] [] [] [] []
disparar perdigones a los saqueadores.

Existen algunos peligros inherentes al uso de este formato como: Los respondientes pueden
desarrollar algn patrn de respuesta.

Preguntas referentes a temas sensibles.

Se deben evitar las preguntas directas que comprometan la integridad fsica, emocional,
moral o espiritual del encuestado.

SECUENCIA Y ORDENAMIENTO DE LAS PREGUNTAS

El orden en el cual las preguntas son presentadas pueden afectar las respuestas, as como
toda la actividad de recoleccin. Por ejemplo, la presencia de una pregunta puede afectar
las respuestas dadas en las siguientes preguntas.

Algunos investigadores intentan este efecto "aleatorizando" el orden de las preguntas.

La solucin ms segura es la sensibilidad del problema. Se debe construir ms de una


versin del cuestionario que contenga diferentes ordenamientos de las preguntas.

El orden de las preguntas depende el tipo de cuestionario, si es autoadministrado o


entrevista. En el primer caso, usualmente es mejor comenzar el cuestionario con el conjunto
de preguntas ms interesantes. Las preguntas iniciales no deben ser amenazantes. Las
preguntas de identificacin se deben dejar por el final de la encuesta.

REPRODUCCIN DEL CUESTIONARIO

El mtodo de reproduccin del cuestionario es importante para el logro de xito del estudio,
un cuestionario ntidamente reproducido indicar a una alta tasa de respuesta y as,
proporcionara mejores datos.

Varios mtodos estn disponibles, y los cuales dependern de los recursos disponibles,
facilidades locales y tiempo.

INSTRUCCIONES

10
Cada cuestionario, si es autoadministrado o si es administrado por el encuestador, debe
contener instrucciones claras y comentarios introductorios donde sean apropiados.

Instrucciones Generales
Cada cuestionario autoadministrado debe comenzar con instrucciones bsicas para seguir su
completacin.
Introducciones
Si el cuestionario esta organizado de acuerdo al contenido de subsecciones, es til
introducir cada seccin oraciones cortas relacionadas con el contenido y propsito.

Instrucciones Especficas.
Algunas preguntas pueden requerir instrucciones especficas para facilitar la respuesta
apropiada. Caso de respuestas mltiples.

Instrucciones para el entrevistador


Proporcionar instrucciones claras en el lugar apropiado para los entrevistadores.

ETAPAS PRINCIPALES INVESTIGACIN POR MUESTREO

PLANEACIN Y EJECUCIN DE UNA ENCUESTA


a. Objetivos de la encuesta. Fijar en trminos concretos los objetivos de la encuesta. No
aclarar la finalidad de la encuesta disminuir su valor en ltima instancia.
b. Poblacin bajo muestreo: los objetivos de la encuesta deben definir la poblacin que
se quiere cubrir. La palabra poblacin se emplea para denominar el conjunto del que
se elige la muestra. Implica la definicin de lo que es poblacin y de sus elementos.
Evitar ambigedades. El encuestador debe ser capaz de decidir en el campo sin
demasiados titubeos si un caso dudosos pertenece o no a la poblacin.
La poblacin que se procura cubrir ser por lo general diferente de la que en realidad
es objeto de muestreo. Los resultados que se obtengan sern aplicados a la poblacin
muestreada.
Poblacin objetivo Poblacin muestreada

Pueden coincidir (es ms restringida)

c. El marco. Lista, mapa, que sirve como gua al universo que se cubrir, debe
examinarse que est libre de defecto y actualizada.
d. Unidad de muestreo. Para los propsitos de la seleccin de la muestra debe ser
posible dividir a la poblacin en unidades de muestreo.
e. Seleccin de la muestra objetivo del curso.

11
f. Informacin que se recopilar. Qu informacin se busca obtener debe ser
considerada en una de la primeras etapas de planeacin de a encuesta. Slo deben de
tenerse datos de inters para los propsitos de la encuesta. Un cuestionario demasiado
largo produce una baja general en la calidad de los resultados. Lo prctico es preparar
BOSQUEJOS de los cuadros que debe producir la encuesta, a s se eliminar
informacin no pertinente.
g. Grado de precisin deseado.

Resultados incertidumbre Muestra


Errores en las mediciones deseadas.
La falta de certeza se reduce al tomar muestras grandes y emplear mejores
dispositivos. Implica costos y tiempo. Es mejor especificar el grado de precisin
deseado.

h. Mtodo de obtener la informacin.


- Encuesta que emplea un cuestionario autoadministrado.
- Entrevistas.
- Encuestas con preguntas abiertas y/o cerradas.
- Encuestas por telfono, correo o visitas personales.

i. Referencia de tiempo y perodo de referencia.


- Referencia de tiempo (perodo al que pertenecern los resultados de la encuesta).
- Perodo de referencia: perodo para el cual se obtiene la informacin de las
unidades de muestreo.

j. Cuestionario u hoja de encuesta. Con funcin de la informacin a obtener definir


presentacin encuesta. Las preguntas deben ser claras y sin ambigedades y al punto.
Deben evitarse preguntas que orienten las respuestas. Orden de preguntas. Preguntas
control. Prueba piloto. Definir los trminos tcnicos adecuadamente. Cuestionarios
precodificados.
k. La capacitacin de los entrevistadores y supervisin, instrucciones detalladas en los
mtodos que se emplearn las mediciones.
l. Inspeccin de la informacin entregada. Control de calidad de la informacin.
m. Personas que se rehsan responder. Elaborarse procedimientos para tratar con quienes
no respondan.

PRESENTACIN Y ANLISIS DE DATOS. Dicho anlisis se realiza segn el


plan de tabulaciones diseado y las tcnicas estadsticas propuestas para cumplir con
los objetivos previstos en la investigacin.

12
INFORME Y PUBLICACIN DE RESULTADOS. En esta ltima etapa se
redacta el informe contentivo de los resultados de la investigacin por muestreo y se
ejecuta el plan de publicacin de los mismos.

CONCEPTOS GENERALES

Poblacin: es una coleccin de objetos acerca de los cuales deseamos hacer alguna
inferencia. Un conjunto finito o infinito de elementos.

Elemento o unidad elemental o unidad de observacin: objeto sobre el cual se realizan las
mediciones de la caracterstica. Es un objeto en el cual se toman las mediciones.

Unidades de muestreo: son colecciones no traslapadas de elementos de la poblacin que


cubran la poblacin completa. Otra definicin es: colecciones o grupos no solapados de
unidades elementales. Tambin es la unidad donde realizamos la muestra.

Ejemplo:
- Encuesta de Viviendas Unidad de muestreo: manzanas definidas de tal manera
que cada vivienda no pueda ser muestreada ms de una vez y que cada vivienda tenga
una oportunidad de ser seleccionada en la muestra.
- Encuesta sobre Ingreso Familiar Unidad de muestreo: vivienda.
- Proporcin de votantes que favorecieron la emisin de bonos Unidad de
muestreo: hogares. Unidad elemental: votantes.

En el muestreo de elementos cada unidad de muestreo contiene un solo elemento, por tanto,
la Unidad de muestreo = Unidad elemental.

Marco muestral: es una lista de todas las unidades de muestreo.

Muestra: es un subconjunto de la poblacin. Es una coleccin de unidades seleccionadas de


un marco o de varios marcos. En una poblacin infinita, una muestra aleatoria es una
sucesin de variables aleatorias independientes e idnticamente distribuidas.

POBLACIN OBJETIVO POBLACIN MUESTREADA


Poblacin que se pretende cubrir. Definida Es la poblacin de donde se extrae la
por los objetivos de la encuesta. Es la muestra, es ms restringida. Los
coleccin completa de observaciones que resultados que se obtengan sern
deseamos estudiar. aplicados a la poblacin muestreada.

13
TIPOS DE MUESTREO

1. Muestreo Probabilstico: Cuando de antemano se conoce la probabilidad asociada a


cada muestra posible.

2. Muestreo No Probabilstico: - Intencional u opintico


(representatividad subjetiva)
- Sin norma circunstancial o errtico
- a capricho o comodidad.
- por cuotas: a conveniencia adminis-trativa o
econmica.
- Juicio: el investigador emplea su propio juicio
para elegir la muestra.
Muestreo Aleatorio: Consiste en asignar a cada elemento poblacional una probabilidad no
nula, de ser seleccionado. Con este muestreo podemos hacer estimaciones de las
magnitudes de los errores de muestreo (valor estimado Valor poblacional ). Controlar la
precisin de las estimaciones muestrales dentro de ciertos lmites fijados con anticipacin y
con cierto grado de confianza.

TIPOS DE MUESTREO PROBABILSTICO

1) Muestreo Irrestricto Aleatorio.


2) Muestreo Estratificado.
3) Muestreo Sistemtico.
4) Muestreo por Conglomerados o por reas.
5) Muestreo Bietpico.
6) Muestreo Polietpico.
7) Muestreo Mixto.

CMO SELECCIONAR LA MUESTRA?. El objetivo del muestreo es estimar


parmetros de la poblacin, tales como media, el total y proporcin basndose en la
informacin contenida en la muestra.

Muestra

Muestreo Inferencia
Estimaciones Y , Y, total

14
Poblacin
Tamao de muestra controla la cantidad de
informacin a extraer

: Estimador. Medida estadstica que describe cierta caracterstica numrica


de una muestra, siendo una magnitud variable de una muestra a otra.

: Parmetro. Medida estadstica que describe cierta caracterstica numrica


de una poblacin y que se considera constante y desconocida.

Cmo podemos determinar cual procedimiento usar y el nmero de observaciones a


incluir en la muestra?. La respuesta depende de cuanta informacin se desee obtener. La
cantidad de informacin obtenida en la muestra depende del nmero de elementos
muestreados y de la cantidad de variacin en los datos. Debemos fijar un lmite para el
error de estimacin menor que B.

Error de estimacin = B = errores en el muestreo.


B e lmite de error de estimacin.


Pr e 1
El lmite de error de estimacin viene generalmente expresado en unidades de
e t = error mximo admisible. t es dado a funcin 1- ; 1- = coeficiente
confidencial.

El error de estimacin se debe a que una muestra no proporciona informacin completa


sobre una poblacin. Esta clase de error se llama error de muestreo, el cual puede ser
controlado por un diseo cuidadoso de la encuesta.

El margen de error dado en las encuestas es un expresin del error de muestreo, el cual
resulta al considerar una muestra y no al examinar toda la poblacin (Lohr, 2000, p. 15)

ERRORES AJENOS AL MUESTREO

Son aquellos que no se deben al muestreo, los cuales no se pueden atribuir a la variabilidad
entre las muestras (Lohr, 2000) e influyen en la validez y confiabilidad de las estimaciones.
Se pueden clasificar en:
a) Sesgos de estimacin: debido al uso inadecuado de un estimador. Cuando se utilizan
estimadores sesgados. Mal uso por parte del investigador.
b) Sesgos de seleccin: errores cometidos cuando el proceso de seleccin de la muestra
no es totalmente aleatorio; pues incluye elementos opinticos y errticos. Este ocurre
cuando alguna parte de la poblacin objetivo no est en la poblacin muestreada.

15
c) Sesgo de medicin: ocurre cuando el instrumento con el que se mide tiene una
tendencia a diferir del valor verdadero en alguna direccin. Este debe ser minimizado
en la etapa de diseo de la encuesta (Lohr, 2000).
d) Errores de observacin o de medida: son el resultado de la interaccin entre el
observador, el instrumento y el individuo medido (sustituciones fortuitas pueden
sesgar los resultados).
e) Errores por omisin: se refiere a la no respuesta, inaccesibilidad del elemento, o
prdida del dato.
f) Equivocaciones en el diseo de la encuesta.

Exactitud: se refiere a la magnitud de las desviaciones respecto a la media verdadera .


Precisin: se refiere a la magnitud de las desviaciones respecto a la media Y muestral.
TEMA 2. MUESTREO ALEATORIO SIMPLE

En una muestra aleatoria simple cada unidad o elemento de la poblacin tiene una
probabilidad de seleccin conocida; se emplea un mtodo aleatorio para elegir las unidades
a incluir en la muestra (Lohr, 2000). Los elementos o unidades podrn ser seleccionados de
dos formas: con o sin reposicin.

En el muestreo aleatorio simple con reemplazo o con reposicin una unidad o elemento se
puede incluir ms de una vez en la muestra; mientras en el muestreo sin reemplazo o sin
reposicin, todas las unidades en la muestra son distintas.

Una muestra aleatoria con reposicin, de tamao n obtenida de una poblacin de N


unidades, se puede pensar como la extraccin de n muestras independientes de tamao 1.
Cada unidad se extrae de la poblacin al azar, por ser la primera unidad muestreada, con
una probabilidad de 1/N, la cual se reemplaza en la poblacin, y siguiente unidad se
selecciona al azar con una probabilidad de 1/N. Este procedimiento se repite hasta que la
muestra contenga las n unidades y puede tener duplicados.

16
El muestreo aleatorio sin reemplazo o sin reposicin de poblaciones finitas se conoce con el
nombre de muestreo irrestricto aleatorio, el cual consiste en la seleccin de n elementos

1 n!N n!
sacados de una poblacin con N unidades, de modo que todas las muestras posibles

N SP )(
(distintas) de tamao n tengan la misma probabilidad de ser seleccionada N N! .

n
n
P S es la probabilidad de elegir cualquier muestra individual S de n unidades.

La probabilidad de la muestra tambin puede calcularse utilizando el clulo de


probabilidades:
n
1 seleccin probabilidad
N
n 1
2 seleccin probabilidad
N 1

Luego, la probabilidad de seleccin de una muestra P S es:

n (n 1) (n 2) 1 n (! N n)! 1
P( S ) . . . .
N (N 1) (N 2) (N n 1) N! N

n
Otra forma de calcularla es la que se presenta a continuacin. Sea la muestra
S u1 , u 2 ,..., u n , luego su probabilidad es una probabilidad condicional,

P S P u1 , u 2 ,..., u n n! P u1 , u 2 ,..., u n n! P u1 P u 2 / u1 P u 3 / u1u 2 ...P u n / u1u 2 ...u n 1

17
1 1 1 1 1 n! N n ! 1 1
P S n! n!
N N 1 N 2 N n 1 N! N! N! N

N n ! n! N n ! n

En el clculo anterior hemos supuesto que al no intervenir el orden en la colocacin de los


elementos, la muestra S u1 , u 2 ,..., u n contiene las n! posibles ordenaciones de dicho
conjunto.

PROBABILIDAD QUE TIENE UNA UNIDAD DE PERTENECER A LA MUESTRA

Se mencion que los elementos que formarn la muestra pueden ser seleccionados de dos
maneras:

1. Con reposicin: en este procedimiento los elementos pueden ser seleccionados varias
veces, y cada una de las n selecciones son independientes unas de otras, luego, la
probabilidad de que un elemento forme parte de la muestra es 1/N. Por lo tanto, la
probabilidad final de forme parte de la muestra de tamao n es:
1 1 1 n
. Este tipo de seleccin coincide con el muestreo de poblaciones
N N N N
infinitas.

2. Sin reposicin: las unidades pueden ser seleccionadas una sola vez. Recibe el
nombre muestreo irrestrictamente aleatorio, y la probabilidad que un elemento sea
escogido en la i-sima extraccin estar condicionada a la probabilidad de que no
haya sido escogido en los (i-1) sorteos anteriores, as cada seleccin y probabilidad
es:

1
1 seleccin probabilidad
N

1

N 1 1
2 seleccin probabilidad
N 1 N N

1

N 2 N 1 1
3 seleccin probabilidad
N 2 N 1 N N

1 N n 1 N 1 1
n seleccin probabilidad
N n 1 N n 2 N N

18
De all que la probabilidad de que un elemento sea seleccionado en cualquiera de las n
1
elecciones ser igual a y la probabilidad final de que un elemento sea incluido en la
N
n
muestra es i , aqu se aplica la sumatoria de las probabilidades de cada una de n
N
selecciones en las que puede ser elegido el elemento i en la muestra.

N N 1
Tambin podemos decir que de las muestras posibles, de ellas contienen un

n n 1
elemento particular, por tanto, su probabilidad es:
N 1

No. muestras favorables n 1 n
i
No. muestras posibles N N

n

Todo diseo muestral comprende las siguientes partes:

1. Mtodo de seleccin de la muestra.


2. Estimadores a utilizar y propiedades.
3. Determinacin del tamao de muestra.
4. Modificaciones al diseo bsico.

Forma de seleccionar una muestra irrestricta aleatoria

- La seleccin aleatoria garantiza:


a. Inferencias estadsticas vlidas.
b. Mejoramientos acumulativos a travs de la separacin y evaluacin objetivo de
sus fuentes de error.

- Tablas de nmero aleatorios.


- Computadora

Este mtodo de muestreo se usa en poblaciones suficientemente homogneas, es decir, cuya


varianza poblacional tienda a cero, exige disponer una lista enumerada de 1 a N y de all
mediante un experimento aleatorio seleccionar a cada uno de los n elementos de la muestra.
Dos factores afectan la cantidad de informacin contenida en la muestra y por tanto, la
precisin (tamao muestra y cantidad de variacin que se controla por el tipo de muestreo).

19
ESTIMACIN DE LA MEDIA Y EL TOTAL

Simbologa bsica:

yi = i - simo elemento de la muestra


N = total
ui = elemento genrico de la poblacin
n
y
y i media muestral
i 1 n

Suponga que y1, y2, ... , yn es una muestra irrestricta aleatoria (m.i.a) de una poblacin de
valores u1, u2, ... , uN,, (considere que yi la muestra aleatoria es de tamao uno).
n
y N
1
E ( yi ) i media poblacional E ( yi ) u i
i 1 N i 1 N

2 varianza poblacional
1 1 N 2 2 1 Yi
2

V Yi E Yi Yi Yi N Yi 2
2 2 2

N N i 1 N N

La varianza muestral es:


y
2
y 1 1 n 2 2
y i 2 y i y y y i n y
i 2 2
S 2

n 1 n 1 n 1 i 1
1 y 2


y i
2 i
S2
n 1 n

La Covarianza poblacional en el m.i.a. es 0


Cov( y i , y j ) E ( y i )( y j ) E y i y j y i y j 2 E y i y j 2
2
N
1 1 N
u i u j 2 u i
i j N ( N 1) N i 1
N
ui u j 2
1 i j 1 N
ui
N N 1 N i 1

u
N
ui ui ui
2 2
Como i
i 1 i j

20
2
N
N N
Entonces
i j
u u
i i u
i 1
i
i 1
ui
2

Sustituyendo en la covarianza se tiene

N
2

ui ui
2

Cov( y i , y j )
1 i 1


1
u
i
2

N N 1 N

1 1 ui
2

u i
2 1

N N 1 N N 1

1 ui
2
1
u i 2

N N ( N 1) N 1

1 1

2
ui
1
u i 2
N N 1 N ( N 1)

1 1 N 2

2
ui
N N 1 N 1

En definitiva, la covarianza queda igual,

Cov( y i , y j )
1
N ( N 1)
u i
2
N 2 1
N ( N 1)
ui 2 1 2
N 1

ESTIMACIN DE LA MEDIA POBLACIONAL

El estimador de la media es y
y i

Por definicin la varianza muestral es:


2
yi n y
2

entonces yi y 2
S
2
S 2

n 1 n 1

Consideremos que:
1) La media muestra es un estimador insesgado, es decir E ( y )

21
2 N n S2 N n
2) La varianza de la media es V ( y ) y su estimador es V ( y )
n N 1 n N
que tambin es insesgado.

Por definicin, el lmite de error de estimacin es e B t V ( y )

Ahora vamos a demostrar los 2 puntos anteriores:

1. La media muestra es un estimador insesgado, es decir E ( y)

Considere que yi es una muestra aleatoria es de tamao uno.


Por definicin la media muestral es y i al aplicar operador esperanza se tiene
y
n
n
yi
1
n
1 n N 1 1
E y E i 1 E y i u j n
n n i 1 n i 1 j 1 N n

2 N n
2. La varianza de la media es V ( y ) y su estimador es tambin insesgado, es
n N 1
decir que E V y V y .

A continuacin vamos a realizar un ejercicio para estimar la media y determinar el error de


estimacin.

Ejercicio 4.7: Una muestra irrestricta aleatoria de n = 100 medidores de agua es controlada
dentro de una comunidad para estimar el promedio de consumo de agua diario por casa,
durante un periodo estacional seco. La media y la varianza mustrales fueron y 12.5 y
S 2 1252 Si suponemos que hay N = 10.000 casas dentro de la comunidad, estime , el
promedio de consumo diario verdadero, y establezca un lmite para el error de estimacin.
(Mendenhall, pag. 68.)

Datos

n = 100, y 12.5 , S 2 1252 , N = 10000

Se pide estimar y B

22
S 2 N n 1252 10000 100
B 2 V y 2 2 2 * 3.52
n N 100 10000

El error de estimacin es B = 7.04

El intervalo de confianza para la Media Poblacional es:

y B y B; y B

Sustituyendo los valores obtenidos se tiene que el intervalo es:

12.5 7.04 ; 12.5 7.04 5.46 ; 19.54

Se puede interpretar los resultados de la siguiente manera: Se tiene por lo menos un 75 % de


confianza que el verdadero valor del promedio diario de consumo de agua se encuentre entre
5.46 y 19.54.

Como el tamao de la muestra es grande se puede emplear el teorema central del limite y
asumir que la media se aproxima a una normal. En este ejemplo, el error de estimacin es igual
a: B = 1.96 * 3.52 =6.8992; y el intervalo es (5.40 ; 19.60) el cual indica que tenemos un 95%
de confianza que el verdadero valor del consumo de agua promedio poblacional se encuentra
entre 5.40 y 19.60.

A continuacin vamos a estudiar la estimacin del total poblacional, sus varianzas y la


determinacin del tamao de muestra.
ESTIMACION DEL TOTAL POBLACIONAL

n
N yi
Ya sabemos que su estimador es
Ny i
n

La varianza poblacional del total estimado se obtiene al aplicar el operador varianza a la


definicin de dicho estimador, el cual queda igual a:

S2 N n 2 S
2
V N 2 N 1 f , donde f n / N es la fraccin de muestreo
n N n

La varianza estimada del total estimado es:


S 2 N n 2
2 S
V N 2 N 1 f
n N n

El limite para error de estimacin es B = e = 2 V o B t k V

23
Ejemplo 4.8: Usando los datos del ejercicio 4.7, estime el nmero total de galones de agua,
, usado diariamente durante el periodo seco. Establezca un lmite para el error de
estimacin. (Mendenhall, pag. 68.)

Solucin:

n =100 medidores, N=10000, y 12.5 , S2=1252

T Ny 10000 * 12.5 125000


V T V Ny N 2V y N 2
S2 N n

n N

2 1252 10000 100



V T 10000
100

100
1239.48 * 10000 1.239.480.000

2

V (T ) 123948 * 10 4 35206.25

B tk V (T ) 2 V (T ) 2 * 35206.25 70412.5

Intervalo de confianza para el total de galones de agua usado durante el periodo seco.
T B, T B 54587.5,195412.5
TAMAO DE LA MUESTRA PARA ESTIMAR LA MEDIA

Para determinar el tamao de la muestra se despeja n de B con varianza poblacional (4) o


varianza estimada (5)
2 N n
e B t V y t (4)
n N 1

S 2 N n
e B t V y t (5)
n N 1

despejando n de (4) se tiene que:


2 N n
2
e2
e t n 2 N 1 N n
2 2 2

n N 1 t

e2
n 2 N 1 n 2 N 2
t

Finalmente, el tamao de muestra queda igual a:

24
N 2 N 2
n n
e2 D N 1 2
2 N 1 2
t

TAMAO DE LA MUESTRA PARA ESTIMAR EL TOTAL

Por un procedimiento similar al de la media se determina el tamao de muestra para estimar


el total.

N 2 N 3 2 t2 N 2
n
N 1 2e 2 2 N 1 e t N N 1 D
2 2 2 2 2 2

t N

e2 B2
D t2 4
t2 N 2 t2 N 2

Tanto en el caso de muestras para estimar el total o la media se supone que el investigador
debe conocer 2

FORMAS DE CALCULAR ESTIMACIONES DE 2

La estimacin de la varianza poblacional 2 para calcular el tamao de muestra se puede


realizar a travs de:

1. Estudios anteriores.
2. Muestra piloto.
3. Usando el rango de la variable (dos desviaciones de la media)
rango de Y

4
4. Consideraciones prcticas acerca de la estructura poblacional.

ESTIMACIN DE LA PROPORCIN P

El investigador que realiza una encuesta por muestreo frecuentemente esta interesado en
estimar la proporcin de la poblacin que posee una caracterstica.

25
Ejemplo: proporcin de personas que opinan que el servicio de BIECI es bueno.

Las propiedades de son equivalentes a las de y en el muestreo irrestricto aleatorio.

Sea yi = 0 si el i-simo elemento seleccionado no posee la caracterstica especifica, y y i = 1


si las posee.

y i
p y es el estimador de p
n
PQ N n
La varianza poblacional de la proporcin es: V p
n N 1

p q N n
Varianza estimada de p es: V p
n 1 N

A continuacin vamos a demostrar: la varianza estimada de la proporcin V p :

y i
Sabemos que y p y i np
n

Sea la cuasivarianza:

yi y
2
2
y i ny 2 np np 2 n n
S
2
p (1 p) = n 1 pq y adems
n 1 n 1 n 1 n 1
S2 N n n
V y , sustituyendo S
2
pq se tiene
n N n 1

pq
n
N n pq N n
V y n 1 V p
esto es lo que queramos demostrar.
n N n 1 N
p q
n
N n p q N n
V y n 1 V p
es la varianza estimada de la proporcin.
n N n 1 N

El error de estimacin es:


e B t V ( p )

26
Ejercicio 4.5: Las autoridades de un parque estatal estn interesadas en la proporcin de
personas que acampan y que consideran que el espacio del rea disponible para acampar en
un terreno en particular es adecuado. Las autoridades decidieron tomar una muestra
irrestricta aleatoria de n = 30 de los primeros N = 300 grupos acampados que visitan el
campo. Sea y i 0 si jefe del i-simo grupo muestreado considera que el espacio del rea
disponible para acampar no es adecuado, y y i 1 si considera que es adecuado
(i=1,2,...,30). Use los datos de la tabla adjunta para estimar p, la proporcin de personas que
acampan y que consideran que el espacio del rea disponible para acampar es adecuado.
Establezca un limite para el error de estimacin (Mendenhall, pag. 67-68.)

Respuesta
Persona Muestreada yi
1 1
2 0
3 1
. .
. .
. .
29 1
30 1
30

y
i 1
i 25

27
Solucin:

y i 25 n = 30 N=300
y i 25
p 0.8333 y q 1 p 0.1667
30 30

p q N n 0.8333 0.1667 300 30


V p 0.00431103
n 1 N 30 1 300

El error de estimacin resulta igual a: B=2*0.065658=0.1313. Al calcular el intervalo de


confianza queda igual a (0.702 ; 0.9646).

TAMAO DE LA MUESTRA PARA ESTIMAR p

Sabemos que el tamao de muestra para estimar la media en el muestreo irrestricto


aleatorio es:
N 2 N 2
n 2
e D N 1 2
2 N 1 2

t k

Haciendo la varianza poblacional igual a 2 PQ y sustituyndola se tiene:

NPQ
n 2
e
N 1 PQ
t 2k

e t k V p

p q N n
V p
n 1 N

n0
n t 2 pq
n ; n0
1 0 e2
N

Ejemplo 4.6: Use los datos del Ejercicio 4.5 para determinar el tamao de muestra
requerido para estimar p con un lmite para el error de estimacin de magnitud B = 0.05.
(Mendenhall, Pag 68.)

28
Solucin:

y i 25 N = 300 n=? B = 0.05 = e t=2

y i 25
p 0.8333 y q 1 p 0.1667
30 30

NPQ 300 0.83333 0.1667


n 127.90 128
e2 0.05 2
N 1 2 PQ 300 1
2
0.83 0.17
t 4

MUESTREO CON PROBABILIDADES PROPORCIONALES


AL TAMAO

Sea i la probabilidad de que yi aparezca en la muestra.

1 n yi
El Estimador del total T es: Tpp
n i 1 i

yi
n
1
Varianza estimada del Tpp es: V Tpp
n n 1 i 1 i
Tpp

El limite para el error de estimacin es: tk V (Tpp )

Estimador de la media poblacional :

1 1 n yi
pp
Nn
T pp
Nn i 1 i

2
yi

n
1
Varianza estimada de pp es: V pp T pp
N n n 1 i 1 i
2

El limite para el error de estimacin es tk V pp

VENTAJAS DEL MUESTREO ALEATORIO SIMPLE

29
1) Las ventajas derivadas de realizar muestreo.
2) Es relativamente simple determinar la precisin de las estimaciones que se hacen a
partir de las observaciones muestrales.
3) Tiende a reflejar todas las caractersticas del universo, esto es, cuando el tamao de la
muestra crece, sta se hace cada vez ms representativa del universo o poblacin.

DESVENTAJAS DEL MUESTREO ALEATORIO SIMPLE

1) Suponemos un listado completo.


2) Si la poblacin es muy grande la numeracin demanda tiempo y trabajos que pueden
ser ahorrados si se emplea otro diseo muestral.
3) El tamao de n estratificado es mejor que el tamao de n aleatorio para el mismo
nivel de confiabilidad.
4) Costos mayores con la dispersin espacial de las unidades muestreadas.

TEMA 3. MUESTREO ESTRATIFICADO

En el muestreo aleatorio simple la varianza del estimador depende del tamao de la


muestra y de la dispersin de la variable en estudio. Si la poblacin es muy heterognea y
las consideraciones de costos limitan el tamao de la muestra, podra ser imposible obtener
una estimacin lo suficientemente precisa tomando una muestra aleatoria simple. Es decir,
el tamao de la muestra aumenta para una precisin dada. Pero, si podemos clasificar los
elementos de la poblacin en grupos (estratos)de manera que se reduzca la variacin de la
variable Y dentro de cada estrato, por tanto, puede hacerse una mejor estimacin.

Ejemplo: Cargos vacantes en las empresas.


Criterio de estratificacin: tamao de la empresa.

DEFINICIN: Una muestra aleatoria estratificada es la obtenida mediante la divisin de


la poblacin en subpoblaciones denominadas estratos, en la cual, dentro de cada estrato se
selecciona en forma independiente una muestra irrestricta aleatoria. Calculndose para cada
estrato sus estimadores y el estimador de la poblacin se calcula como una ponderacin
adecuada de las estimaciones por estrato.

RAZONES PARA ESTRATIFICAR

1) Aumentar la precisin de las estimaciones al disminuir la variacin dentro de los


estratos. La estratificacin puede producir un limite ms pequeo para el error de
estimacin que el que se producira con un muestreo aleatorio simple.
2) Disminuir los costos al estratificar y variar las fracciones de muestreo dentro de los
estratos.

30
3) Permitir definir los estratos como dominios de estudio y obtener estimaciones con
precisin conocida para los estratos.

CMO SELECCIONAR UNA MUESTRA ALEATORIA ESTRATIFICADA?

Dividir la poblacin en estratos de acuerdo a las razones para estratificar, ubicar cada
unidad muestral en su respectivo estrato, asignar el tamao muestral de cada estrato ni (de
L
modo que si los L estratos y n es el tamao de la muestra n
i 1
i n y seleccionar muestras

aleatorias simples en cada estrato de forma independiente.

La estratificacin se realiza de acuerdo a la distribucin de la variable en estudio o de


acuerdo a una variable X altamente correlacionada con la variable en estudio o de acuerdo a
un criterio de disminucin de los costos.

En general, la precisin aumenta con el nmero de estratos si estos estn bien elegidos,
pero no es conveniente aumentar mucho el nmero de estratos si tal aumento no compensa
las complicaciones de clculo y la disminucin del tamao de la muestra dentro de los
estratos.

NOTACIN

N = tamao de la poblacin.
L = nmero de estratos.
Ni = tamao del i-simo estrato i = 1,2,...,L
N = tamao de la muestra.

L L

Ni N
i
n
i 1
i n

Wi = Ni/N tamao proporcional del estrato i Wi 1


Wi = ni/n proporcin de la muestra en el estrato i wi 1

ESTIMACIN DE LA MEDIA

L
1
Para estimar la media poblacional el estimador es: y st
N
N yi
i i

ni
y ij
Sea yi la media muestral del i-simo estrato
j 1 ni

31
La Varianza poblacional de y st es:
1 L S i
2
1 1 L 2 N ni
L
V y st N i y i 2 N i V y i 2 N i i
2
V
N i 1 N i 1 N i 1 Ni ni

La Varianza estimada de y st es:


1 L S i
2
1 L
1 L N ni
V y st V 2
2
N i 2 i
2
N y
i i N V y i
ni
i
N i 1 N i 1 N i 1 Ni

Vamos a demostrar que la media es un estimador insesgado, es decir, E y st

El estimador y st es un estimador insesgado puesto que los y i son insesgados.


1 L 1 1 T
y st N i y i N i Yi Ti Y
N i 1 N N N

Tarea: Demostrar que la varianza estimada de y st es un estimador insesgado de V y st

Si las fracciones de muestreo ni/Ni son despreciables en todos los estratos entonces
1 L N i S i
2 2

V y st 2

N i 1 ni

Ejemplo 5.4: Se forma una comisin de Zonificacin para estimar el valor promedio de
avalo en un suburbio residencial de una ciudad. El uso de ambos distritos de votantes en el
suburbio como los estratos es conveniente porque se tienen disponibles listas separadas de
las viviendas en cada distritos. De los datos presentados en la tabla acompaante, estime el
valor promedio de avalo para todas las casas en el suburbio, y establezca un lmite para el
error de estimacin (ntese que se utiliz la asignacin proporcional). (Mendenhall, pag.
113-114.)
ESTRATO I ESTRATO II
N 1 110 N 2 168
n1 20 n 2 30
n1 n2

yi 240.000
i 1
y
i 1
i 420.000
n1 n2

yi2 2.980.000.000
i 1
y
i 1
2
i 6.010.000.000

Se pide determinar la media y el error de estimacin, es decir, y st ? y B ?

32
L
1
y st
N
N
i 1
i yi
ni

y ij
Sabemos que:
yi j 1

ni
ni
y 2

y ij 2
ny i
2
y 2
ij
ni
ij

S i2
j 1

ni 1 ni 1

240.000
y1 12.000
20

2.980.000.000 20 12.000
2
S
1
2
5.263.157,895
19

420.000
y2 14.000
30

6.010.000.000 30 14.000
2
S 22 4.482.758,62
29

1
y st 110 12.000 168 14000 13.208,63 es el valor promedio de valo para
278
todas las casas del suburbio.

1 L Si
2
2 N ni
La varianza estimada es: V y st 2 N i i al sustituir los valores
N i 1
Ni ni
respectivos tenemos:

1 2 110 20 526157.895 2 168 30 4482758.62


V y 110 110 168
278 2
20 168 30

V y 7853.52
El error de estimacin es: B t k V y 2 7853.52 560.48

Los lmites de confianza son: yB luego, en este ejemplo,

yB (13208.63-560.48; 13208.63+560.48)

33
El intervalo resultante es: (12648.15; 13769.11). Es decir que se estima que con por lo
menos un 75% de confianza el valor promedio de avalo para todas las casas en el suburbio
oscile entre 12648.15 y 13769.11$.

Como en este tipo de muestreo, las muestras en cada estrato son independientes, entonces
se puede realizar estimaciones separadas, as:

Estrato 1 Estrato 2
N n s
2
N 2 n2 s22
y1 t k 1 1 1
y 2 t k
N 1 n1 N 2 n2
12000 928.03 14000 700.69
(11071.97, 2928.03) (13299.31, 14700.69)

34
ESTIMACIN DEL TOTAL

L L L
1
El estimador del total es: Tst Ny st N Wi y i N N i y i N i y i
i N i i

La Varianza poblacional de Tst :

N ni S i2
L
V Tst V Ny st N 2V y st N i2 i
i Ni ni

La Varianza estimada de Tst :


S i2
N ni
L
V Tst V Ny st N 2V y st N i2 i

i Ni ni

Ejemplo 5.3: Para el Ejercicio 5.2 estime el nmero total de horas-hombre perdidas durante
el mes indicado y establezca un lmite para el error de estimacin. Use los datos de la tabla
acompaante, obtenida en una muestra de 18 obreros, 10 tcnicos y 2 administrativos.
(Mendenhall, pag. 113.)

I II III
(Obreros) (Tcnicos) (Administrativos)
8 24 0 4 5 1
0 16 32 0 24 8
7 4 4 8 12
9 5 8 3 2
18 2 0 1 8

35
Solucin:

Se desea estimar el nmero total de horas - hombre perdidas.

I II III
Obreros Tcnicos Administrativos
n1 18 n 2 10 n3 2
y1 8,8333 y 2 6,7 y 3 4,5
S 81,5588
1
2
S 50,4556
2
2
S 32 24,5
N1= 132 N1= 92 N3 = 27

36
L
Tst N i yi 132 8,8333 92 6,7 27 4,5
i 1

Tst 1903,8956 1903,9 Nmero total de horas hombres perdidas por accidente en un
mes determinado.

2 N ni S i2
L
V Tst N i i
i 1 Ni ni

2 132 18 81,5588 92 10 50,4556 2 27 2 24,5


132 92 2
27
132 18 92 10 27 2


V Tst 114 .515,61

B e t k V Tst e 2 114.515,61 2 338,402 676,803 676,8

Intervalo de confianza del Total Tst


Tst B
( 1903,9 676,8 )
El verdadero nmero total de horas perdidas por enfermedad est en el intervalo
1227,1 ; 2580,7

2 S1 N 1 n1
2

La estimacin separada del total para el estrato 1 es: T1 t k N1
n1 N1

(1165,996 2 68.183,157 )

(1165,996 552,24 )

643,76;1688,23

El lmite de error 552,24 es muy grande porque S 12 es grande y por tanto se obtiene una
estimacin deficiente.

Si se desea una estimacin para un estrato particular, la muestra del estrato debe ser lo
suficientemente grande para proporcionar un lmite razonable para el error de estimacin.

SELECCIN DEL TAMAO DE LA MUESTRA PARA ESTIMAR

37
Prefijados el error mximo admisible (precisin mnima del estimador) indicado por,
e t k V y . El coeficiente de confianza 1- determina el valor de t (acorde a la forma
de distribucin del estimador) y la variabilidad de la poblacin (paradoja de Friedman).

Si 1- t
x si n

En este diseo supones conocidos: N,N1,N2,.....,Nl,n, wi = ni/n


1

1 L N ni S i2 2
e t V y st t 2 N i2 i

N i 1 Ni ni

Para determinar el tamao de muestra se fija el nivel del error de estimacin que se est
dispuesto a cometer. Tambin, se supone que wi=ni/n para poder despejar n haciendo ni
=win y se sustituye:
2 N i wi n S i
2
2 1
L
N 2e2 L
N i2 S i2 L
2
e 2 t N i

2
N i S i2
N i N i wi n t i 1 wi n i 1
2
N 2e2 L
1 L N i2 S i
t2

i
N S
i i
2

n i wi

El tamao de la muestra aproximado para estimar es:


L
N i2 S i2

i 1 wi
n 2 2 L
N e
2
t

i 1
N i S i2

Como Wi = Ni/N y si dividimos ambos miembros por N2 tenemos:

1 L N i2 S i2 L
2 Si
2 L
2 Si
2


N 2 i 1 wi
i 1
Wi
wi

i 1
Wi
wi
n 2 2 2
2 es el tamao de muestra
N e 1 L e 1 L e 1
2 2

N t N i 1 2 N i S i
2
2

t N i 1 2 i i
N S2 2
t N
Wi S i2

aproximado para estimar la media.

El tamao de muestra para una poblacin que tiende a infinito es:


L 2 S i2 t2
n0 Wi 2

i w i e

38
V = (e/t)2 es una varianza especificada en funcin del margen de error, tambin se
denomina varianza anticipada.

L
S i2

i 1
w
wi
2
i

n L
1
V N i S i2
N i 1

L S2 t2 1 L S2
n0 Wi 2 i 2 Wi 2 i
i wi e V i 1 wi

luego, el tamao de muestra es:


n0
n
1 L
1
NV i 1
Wi S i2

TAMAO DE LA MUESTRA PARA EL TOTAL


(TAMAO APROXIMADO)

Este tamao de muestra se obtiene de igual forma, partiendo del error de estimacin para
estimar el total:

N ni S i2
L
e 2 T2V T t2 N i2 i si ni =nwi
i 1 Ni ni
e2 L S i2
N
i i i nw
N nw
t2 i 1 i

e 2 L N i2 S i2 N i S i2 nwi L N i2 S i2 L
N i Si
2
2
t i 1 nwi i 1 nwi i

e2 L 1 L N i2 S i2
Ni Si
2

t2 i 1 n i 1 wi

Despejando n se obtiene el tamao de muestra aproximado para estimar el total:

39
L
N i2 S i2 L
N i2 S i2

i 1 wi

i 1 wi
n
e2 L L

2
N i S i2 V N i S i2
t i 1 i 1

Ejemplo: A continuacin se realiza un ejemplo del clculo del tamao de muestra necesario
para determinar la Calidad de la Leche (variable: acidez). Suponga que se realiz una
muestra piloto y se obtuvo los siguientes datos:

ni Estratos Ni = Wi = Si2 Wi2Si2/wi wi =


fincas Ni/N ni/n
10 Urdaneta 13 0,194 1,676 0,133 0,476
3 Valera 7 0,1045 2,333 0,178 0,143
1 Escuque 3 0,0445 0 0 0,048
6 Bocon 32 0,4776 1,14 0,909 0,286
1 Trujillo 12 0,1791 0 0 0,048
N = 67 Wi 2 S i2 / wi 1,22

40
1 L Wi 2 S i2 1 L 1 1
V Wi S i2 1,22 1,113 0,041
n i 1 wi n i 1 21 67

L
Wi 2 S i2
i 1 wi 1,22
n 21 Fincas
1 L
1
V Wi S i 0,041
2
1,113
N i 1 67

ASIGNACIN DE LA MUESTRA

Se denomina asignacin o afijacin al reparto o distribucin del tamao de la muestra n


entre los diferentes estratos, es decir, la determinacin de los L valores n i de modo que ni +
n2 + .... + nl =n. Cada asignacin puede originar una varianza diferente al estimador,
nuestro objetivo es determinar un esquema de asignacin que aumente la precisin y
minimice los costos .

1) Los factores que influyen en la asignacin son:


2) El nmero total de elementos en cada estrato.
3) La dispersin en cada estrato y.
4) El costo de observacin en cada estrato.

TIPOS DE ASIGNACIN.

n
1. Igual ni
L
2. Optima.
3. Proporcional.

ASIGNACIN OPTIMA: en el muestreo estratificado los valores de los tamaos de la


muestra por estrato puede ser asignados con la finalidad de minimizar la variabilidad del
estimador para un costo fijo o para minimizar el costo para un valor especfico de la
varianza de la media V y st .

L
La funcin de costo fijo ms sencilla es C c0 ci ni . Dentro de cualquier estrato el
i 1

costo es proporcional al tamao de la muestra, pero el costo por cada unidad ci puede variar
entre los estratos.

41
Por tanto, C0 representa un costo general y ci el costo por unidad encuestada en el estrato i.
Sabemos que la varianza estimada de la media es:
1 L N ni S i2 l N i2 S i2 L N i S i2
V y st 2 N i2 i 2 2
N i 1 Ni ni i 1 N ni i 1 N

haciendo N i / N Wi obtenemos:
W 2S 2 1
V y st i i Wi S i2
ni N

Ahora, vamos a minimizar la varianza V y st sujeto a la restriccin c1 n1 + c2 n2 +.... +


cLnL = C - C0.

L
C 0 c1 ni C 0
i 1

Usando el mtodo de los multiplicadores de Lagrange debemos minimizar, la funcin:


W 2S 2 W 2S 2
ni i i i i ni c i c c 0
L L

i 1 ni i 1 Ni

Diferenciando con respecto a ni, en cada uno de L estratos, i = 1,2,....,L e igualando a


cero, las L ecuaciones obtenidas son:
Wi 2 S i2 Wi 2 S i2
2 ci 0 c i
ni ni2

Extrayendo la raz cuadrada,


Wi S i
ni (1)
ci

Sumando () sobre i se obtiene:


L
WS WS
i 1
ni i i
ci
n i i (2)
ci

haciendo el cociente de (1) y (2) para eliminar


ni Wi S i / c i ni Wi S i / ci
L L
n Wi S i n Wi S i i es un valor especfico del estrato.

i 1 ci

i 1 ci

42
Ni
S i / ci
ni N
Como wi = ni /n n
1 L Ni Si

N i 1 ci

ni N i S i / c i N i S i / ci
L ni n
Entonces n N i Si luego L
N i Si

i 1 ci

i 1 ci

Este resultado nos indica que en un estrato dado se debe tomar una muestra grande si:

El estrato es grande (Ni ).


El estrato es ms variable internamente.
El muestreo es mas barato en el estrato.

1.1 TAMAO DE LA MUESTRA PARA LA ASIGNACIN OPTIMA.

El tamao de muestra segn asignacin o afijacin optima, a su vez depende de:

a) Si la muestra es escogida para satisfacer un costo total C especifico, o


b) Para dar una varianza de y st especifica.

a) En el primer caso, Si el costo es fijo, entonces, se minimiza V y st . Quiere decir que


en la funcin de costos sustituimos el valor de ni .


L
L N i S i / ci
C c 0 ci ni C c 0 ci n l

N i S i / ci
i i 1

i 1


L L
C c0 N i S i / ci c i n N i S i / ci
i 1 i 1

L L
C c0 N i S i / ci n N i S i ci
i 1 i 1

43
L
C c0 N i S i / ci
i 1
Despejando n se tiene: n
N S
L

i i ci
i 1

b) Si la varianza se fija con anticipacin, al sustituir wi = ni /n en la frmula de la varianza


1 wi2 s i2 wi2 s i2
de la media V y st V w N o en la frmula de tamao
N i i

aproximado de la muestra, tenemos:

W
i 1
i
2
S i / wi
n L donde: V = e2/t2 es la varianza anticipada
1
V
N
W S
i 1
i

Sustituyendo

Wi S i / ci N i S i / ci
wi ni / n
W S N S nos queda
L L

i i / ci i i / ci
i 1 i 1

n
W S i i ci W S i i ci
1 L
V
N i 1
Wi S i2

para expresarla en trminos de Ni, se sustituye Wi = Ni /N

1
2
N S i i ci N S i i / ci N S ci N S / ci
n N
i i i i
L
L
1
V
N2
N i S i2
i 1
N 2V N i S i2
i 1

1.2 TAMAO DE LA MUESTRA, CASO DE COSTOS IGUALES POR ESTRATO


(ASIGNACIN DE NEYMANN)

En algunos problemas el costo para obtener informacin en cada uno de loa estratos es el
mismo, as C1 = C2 = ......= CL = C. Si los costos son conocidos se puede suponer que los
costos son iguales.

44
nN i S i Wi S i
ni n este tipo de asignacin se conoce como asignacin de
N i Si Wi S i
Neyman (asignacin ptima supuesta).

Ni Si
2
e2
En este caso n V
N 2V N i S i
2
t2

W S i i
2

n L
1
V
N
W
i 1
i S i2

1.3 TAMAO DE MUESTRA PARA COSTOS IGUALES, VARIANZAS IGUALES,


ASIGNACIN PROPORCIONAL.

Este mtodo de asignacin de la muestra se denomina asignacin proporcional porque los


tamaos de la muestra n1 ,n 2,......,nL, se distribuyen de acuerdo al peso del estrato en la
poblacin, por tanto:
1
Yst
N
N i y i Wi y i

N i ni
Wi
N n

Sea la definicin de varianza:


N ni S i2
V y st Wi 2V y i Wi 2 i
Ni ni

Al sustituir en trminos de los pesos de los estratos poblacionales,


2 NWi nWi S i
2 2
2 N n Si
Wi Wi
NWi ni N nWi

V y st
N n S i2 N n
Nn
Wi 2 Wi

Nn
Wi S i2

ni N i
Para determinar el tamao de muestra, hacemos wi Wi y luego al sustituir en
n N

45


N i S i / c i
ni n L S1 = S2 = ....... = SL y c1 = c2 = .... = cL

N i S i / ci
i 1
Ni
Se tiene ni n y el valor de N N
Ni i

Empleando la formula de tamao aproximado para estimar la media:

N S
2 2 2
N i S i / wi N i S i / Wi i i
n L
L
L
1
N V N i Si N 2V N i S i NV N S
2 2 2 2
i i
i 1 i 1 N i 1

si dividimos numerador y denominador por NV.


2
N i Si 1
N i Si
2
NV
Wi S i2
n L
L
V
1 1 L
N S N S
2 2
NV i i i i 1 Wi S i2
N i 1 1 i 1 NV i 1
1
N NV

n0
1 n
haciendo n0
V
Wi S i2 queda n
1 0
N

Esta asignacin puede utilizarse tambin cuando los costos y las varianzas no son iguales
(pero no son tomados en cuenta al momento de fijar los tamaos de la muestra), una ventaja
al usar esta descomposicin es que y S y .

Comparacin de la precisin del muestreo aleatorio estratificado con relacin al


muestreo irrestricto aleatorio.

Si se usa inteligentemente la estratificacin, es decir, si es el modelo de muestreo


adecuado, entonces, da como resultado una varianza ms pequea para el estimador que la
obtenida mediante muestreo aleatorio simple. Sin embargo, no es verdad que el muestreo
estratificado d siempre una varianza menor que en el muestreo aleatorio simple.

Para obtener la varianza S2 en el muestreo irrestricto aleatorio (m.i.a.), asumamos que


tenemos una poblacin estratificada y por tanto, la variacin total se divide en dos fuentes
de variacin: entre y dentro de los estratos.

46
Ni

Y Y Yij Yi N i Yi Y
L L L L
2 2 2
ij asumamos que YS Y
i 1 i 1 i 1 j 1 i 1

N 1 S 2 N i 1S i 2 N i Yi Y
L L

i 1 i 1

N i 1S i N i Yi Y
L L
2

i 1 i 1
S2
N 1
Sabemos que en el muestreo aleatorio simple sin reposicin la varianza de la media es:
S2
1 f S N n
2
Vram
n n N

Ahora, en el muestreo estratificado la varianza de la media es:

1 L S i
2
2 N ni
V y st 2 N i i
N i 1
Ni ni

Si en esta definicin realizamos las sustituciones de acuerdo al tipo de afijacin de la


muestra, obtendremos la varianza de la media segn ese tipo de asignacin o afijacin. Es
el caso de la afijacin proporcional, al sustituir los pesos de los estratos, se obtiene la
varianza proporcional, as:

N i ni
Wi wi
N n

V prop V Yst
1
n
W S 1Nn
i
f
N S
i
2
i i
2

La varianza de la media segn la asignacin ptima (Neymann) es:

Vopt V Yst
1
W S i i
2

1
W S i i
2 1
W S
i i
2

1
W S
i i
2

n n nN 2 N2

Expresada en trminos de los tamao de los estratos, es:


Vopt V Yst
1
N i S i 2 12 N i S i2
2
nN N

47
Teorema (Cochran): Vopt V prop V ran (tarea demostrar)

Se puede medir la eficiencia del diseo de muestreo estratificado utilizando el siguiente


cociente: Vprop / Vran = mide el efecto del diseo. Tambin se puede calcular con relacin a
la varianza ptima, es decir, Vop / Vran. Si el resultado es menor que 1 indica que es
eficiente, si es igual a 1 es preferible usar el muestreo aleatorio simple y si es mayor que 1
no es eficiente.

ESTIMACIN DE LA PROPORCIN p

Si queremos estimar la proporcin de unidades de la poblacin que posee una


caracterstica, la estratificacin ideal es dividir la poblacin en dos estratos, uno el de todas
las unidades que poseen la caracterstica y el otro, las que no lo poseen. Esto es en general
imposible por ello trataremos de construir estratos que la proporcin vare tanto como sea
posible de estrato a estrato. Sabemos que la proporcin p es un caso particular de y ,
para una variable dicotmica.

L
1
p S N 1 p i N 2 p 2 ... N L p L 1 N i p i
N N i 1

1 L
1 L
N i ni p i q i
V p S 2 N i V p i 2 N
2 2

ni 1
i
N i 1 N i 1 Ni

TAMAO DE LA MUESTRA PARA LA PROPORCIN

Las frmulas de calculo del tamao de la muestra para la proporcin son iguales a la de la
i q i
media excepto en que Si2 = p


2
N i p i q i / wi
n
e2 L es el tamao de muestra aproximado para estimar la proporcin.
N 2
2
N i p i q i
t i 1

Asignacin optima: que minimiza el costo para V p S dada o minimiza V p S para el


costo dado.

nN i p i q i / ci
ni L

Ni 1
i p i q i / ci

48
El tamao de la muestra para satisfacer un costo total C es:

c c0 N i p i q i / c i
n L

N
i 1
i p i q i / c i

El tamao de muestra ptimo que minimiza la varianza es:

1
2
N i p i q i ci N i p i q i / ci N p i q i ci N p i q i / ci
n N
i i
L
L
1
V
N2
N
i 1
i p i q i N 2V N i p i q i
i 1
2
e
donde V es la varianza anticipada.
t2

Si los costos son iguales, el tamao de muestra n ptimo (Neymann) es:

2
L
nN i p i q i N i p i q i
ni i 1
L
en este caso n
N
i 1
i p i q i e 2 L
N 2 2 N i p i q i
t i 1

Asignacin proporcional: se presenta cuando existen costos iguales y tambin las


varianzas de los estratos son iguales.
L

N p q
i i i
N n i
n i n i y
N e2 1 L
N 2
2
N i p i q i
t N i 1

TEMA 4. MUESTREO POR CONGLOMERADOS

Se caracteriza porque las unidades de muestreo contienen a dos o ms unidades primarias


(ltimas). La poblacin se subdivide en subpoblaciones y algunas de ellas, que
denominaremos conglomerados, pero no todas sern incluidas en la muestra.

El muestreo por conglomerados es similar al muestreo aleatorio simple, pero se diferencian


en que la unidad de muestreo es un conjunto de unidades primarias o elementales.

49
A diferencia con el muestreo estratificado, donde la poblacin tambin se subdivide en
subpoblaciones, pero siempre todos los estratos estn representados en la muestra.
Mientras que el muestreo estratificado es diseado y utilizado fundamentalmente con el
objeto de reducir la varianza de los estimadores, el muestreo por conglomerados es
utilizado debido a que muestrear directamente sobre las unidades primarias, el costo es
exageradamente alto.

Este muestreo es, en muchos casos, un muestreo efectivo para obtener la informacin
deseada a un menor costo, aunque el uso de los conglomerados conlleve en algunos casos a
una varianza mayor de los estimadores.

Los casos en los cuales se justifica la aplicacin de este diseo muestral son:

1) Donde existe un alto costo por la movilizacin o traslado entre las unidades
primarias; el muestreo por conglomerado permite disminuir las distancias; pues por lo
general, los conglomerados son reas fsicas o geogrficas, donde las unidades
primarias estn contiguas.
2) Cuando no existe lista de las unidades primarias (o ltimas) sobre los cuales hay que
tomar las observaciones, y el costo de levantar un marco muestral de estas unidades
es alto, en comparacin con el costo de muestrear sobre conglomerados, los cuales si
pueden disponer de un marco o directorio.
3) Para pequeas unidades donde puede ser difcil fijar con precisin sus limites, sin
embargo, puede ser posible y fcil, dividir con poblacin en unidades mayores y
luego muestrear y medir aquellas unidades mayores seleccionadas. Ejemplo:
animales.
4) Tambin, pueden existir consideraciones administrativos que jueguen papel
importante en la coleccin del diseo a utilizar.

La diferencia de objetivos entre estratificacin y conglomerados conduce a diferentes


criterios para establecer los conglomerados o los estratos. En contraste, con el estratificado,
la varianza del estimador se hace pequea al hacer el conglomerado, tanto como sea
posible, representativo de la diversidad de toda poblacin, y todas los conglomerados
deben ser en lo posible construidos de modo que sean lo ms semejante entre s. A
diferencia del muestreo estratificado, donde los estratos deben ser homogneos dentro de s
y heterogneos entre s.

CMO SELECCIONAR UNA MUESTRA POR CONGLOMERADOS?

50
Definir el conglomerado tipo (tamao del conglomerado). El nmero de elementos que
integran un conglomerado se denomina tamao. En la mayora de los mtodos por
conglomerados, los conglomerados son de tamaos diferentes unas de otras, los
conglomerados de igual tamao, rara vez se logran en la practica, pero se constituyen
una introduccin sencilla al estudio del mtodo por muestreo, y pueden resultar en
situaciones practicas donde las condiciones fueran las indicadas, tales como: procesos
de produccin (control de calidad).

El problema de elegir un tamao de conglomerado (mi) apropiado puede ser un proceso un


tanto complicado. El tamao ptimo de los conglomerados no es una caracterstica que
depende exclusivamente de la poblacin, sino tambin de la estructura de costos de la
investigacin. El tamao del conglomerado ptimo es aquel para el cual la varianza del
estimador es mnimo donde el costo de la investigacin o el costo de la encuesta es mnimo
dada la varianza. As, por ejemplo, el tamao del conglomerado se hace ms pequeo
cuando aumenta la duracin de la entrevista, cuando el traslado entre las unidades primarias
es barato, cuando la densidad del conglomerado es mayor y cuando el presupuesto del gasto
aumenta.

Formar el marco muestral, listando los conglomerados en los cuales se ha particionando


la poblacin. Resolviendo las imperfecciones que el marco pueda tener y garantizando
que todos las unidades primarias que estn en los conglomerados esta en uno y solo uno
de los conglomerados.
Seleccionar los conglomerados que van en la muestra utilizando un muestreo irrestricto
aleatorio.

Si hacemos un muestreo o encuestamos todas las unidades de los conglomerados


seleccionados, el muestreo se denomina muestreo por conglomerados Monoetpico.

Si en vez de entrevistar u observar a todos los individuos o unidades primarias del


conglomerado observado en la muestra a su vez tomamos muestras de estas unidades
primarias de los conglomerados seleccionados, el muestreo se denomina Bietpico, pues la
muestra se selecciona en dos etapas.

Este proceso se puede generalizar a ms de dos etapas y el muestreo se denomina


Polietpico.

Notacin:

N= nmeros de conglomerados en la poblacin


n= nmeros de conglomerados en la muestra
mi = nmeros de unidades elementales (primarias) en el i-simo conglomerado
N
M= mi Total de elementos en la poblacin.
i 1

51
M
M Tamao promedio del conglomerado en la poblacin
N
y i total del conglomerado i-simo
n

m i
Tamao promedio del conglomerado en la muestra.
m i

ESTIMACIN DE LA MEDIA POBLACIONAL

y i

Por definicin la media poblacional es: =


i 1
N

m
i
i

y i

Luego, la estimacin de la Media Poblacional es: y


i 1
n

m
i 1
i

Este estimador de la media tiene la forma de un estimador de razn, por lo tanto, la


varianza de la media tiene la forma de la varianza del estimador de razn, as:

y ym i i
2


N n
V ( y ) i

NnM n 1
Si se desconoce el total de elementos en la poblacin M, entonces, M puede ser estimado
n

con m i
m i

El lmite para el error de estimacin es:

N n
( y ym )
i i
2

e B t k V ( y ) t k 2
NnM n 1

52
Los lmites de confianza son: y e

En el muestreo por conglomerados Monoetpico distinguiremos dos casos:

1. Todos los conglomerados son de igual tamao.


2. Todos los conglomerados son de tamao diferentes

ESTIMACIN DEL TOTAL POBLACIONAL

El total poblacional puede ser determinado por M porque M denota el total de


elementos en la poblacin. Por lo tanto, as como en el muestreo aleatorio simple, el total
puede ser estimado por:
n

y i
My M i 1
n

m
i 1
i

La varianza estimada de My :
n

y ym i
2
i
N n
V My M 2V y N 2
i 1

Nn n 1

El lmite para el error de estimacin es:


n

y ym i
2
i
N n
e B t k V ( y ) t k N 2
i

Nn n 1

Observe que este estimador My es til solo cuando se conoce M el total de


elementos de la poblacin.

Sin embargo, a menudo ese nmero de elementos de la poblacin no se conoce, por tanto se
debe utilizar otro tipo de estimador, el cual no depende de M :

n
N
Ny t
n
y
i 1
i

donde:

N/n =factor de expansin

53
1 n
yt yi es el promedio de totales de conglomerado para la muestra seleccionada.
n i 1

La varianza estimada de Ny t :
n

y yt
2
i
N n
V Ny t N 2V y t N 2
i 1

Nn n 1

El lmite para el error de estimacin es:

y yt
2
i
N n
e B t k V ( Ny t ) t k N 2
i

Nn n 1

Este estimador tiene a menudo el inconveniente de ser poco preciso, pues por lo general,
las medias de los conglomerados varan poco y los mi varan mucho. En este caso el total
del conglomerado yi = mi y i , tambin varia mucho de unidad a unidad y entonces V es
muy grande, sin embargo, este estimador es a veces utilizado, pues tiene la ventaja de que
N
no es necesario conocer el tamao de la poblacin. M mi
i 1

Los estimadores de y poseen propiedades especiales cuando todos los tamaos de


los conglomerados son de igual tamao, es decir, m1 m 2 ... m N m :

1. El estimador y es un estimador insesgado de .

n 2

2. La varianza estimada N n
y ym i i
es un estimador insesgado de la
V y 2 i

NnM n 1
N 2

varianza poblacional N n
y ym i i
V y 2 i

NnM n 1
3. Los estimadores del Total Poblacional My y Ny t son equivalentes.

54
SELECCIN DEL TAMAO DE MUESTRA

1. Para estimar la Media Poblacional:

Por definicin el error de estimacin es:


N n 2
e B tk V y tk c t k V y , donde
Nn

N n N n
V y 2 c2 es la varianza poblacional y V y 2 S c2 es la varianza estimada.
NnM NnM
Al despejar de la formula del error de estimacin el valor de n, se tiene que el tamao de
muestra es:
N 2 c
n , donde
ND 2 c

e2
D 2 M 2 es la varianza anticipada
t

2. Para estimar el Total Poblacional. En este caso tenemos dos tipos de estimadores:

a. My

N 2 c
n , donde
ND 2 c

e2
D 2 2
t kN

b. Ny t

2
N t
n 2 , donde
ND t

55
e2
D 2 2
t kN

n 2

t2 , esta varianza es estimada por y i yt


que es la cuasivarianza de
S
t
2 i 1

n 1
totales de conglomerados en la muestra.

ESTIMADOR DE LA PROPORCIN

La proporcin es un parmetro muy frecuentemente estimado en las investigaciones por


muestreo.

La proporcin no es mas que la media de una poblacin dicotmica. El estimador usual en


la proporcin es el nmero de xitos en la muestra entre el total de la muestra.
n

a
i 1
i

Como estimador se utiliza p n donde ai es el total de xitos en el i-simo


m
i 1
i

conglomerado. Este estimador lo podemos considerar como un estimador de razn como el


de la media, visto anteriormente.

i ai p mi 2
N n 2
Y as, su varianza es V p c , donde:
NnM 2
c
2

N 1

N n 2
Y el estimador de la varianza de la proporcin es V p Sc
NnM 2

Donde:
n

a p mi
2
i
S c2 i

n 1

SELECCIN DEL TAMAO DE MUESTRA PARA ESTIMAR


LA PROPORCIN

Para obtener el tamao de muestra para estimar la proporcin se fija el error mximo
admisible e=B y el multiplicador de confianza t k .

56
Por definicin este error es:
B e t k V p
Al elevarlo al cuadrado se tiene:
e2 e2 N n 2
e 2 t k V p 2 V p 2
NnM c
2

tk tk

Al despejar se encuentra el tamao de muestra:


N c2 N c2
n 2
e ND c2
N M 2
2
c
t2

D= es la varianza anticipada

La varianza c puede ser estimada por S c o proviene de:


2 2

(a) Muestras pilotos.


(b) Censos anteriores, y
(c) De otras estimaciones.

57
BIBLIOGRAFA

Cochran, W. (1980) Muestreo. Trillas.

Lohr, Sharon. (2000) Muestreo: Diseo y Anlisis. International Thomson Editores,


Mxico.

Prez, Csar. (2000) Muestreo con aplicaciones informticas. Madrid.

Scheaffe, R., Mendenhall, W., y Ott, L. (1991) Elementos de Muestreo. Duxbury Press,
Boston.

58

También podría gustarte