Documentos de Académico
Documentos de Profesional
Documentos de Cultura
I. INTRODUCCIÓN
1. Objetivo:
Muchas veces nos interesa estudiar características o parámetros de una población,
tales como medias, totales, proporciones y varianzas. Un estudio de esta naturaleza
puede hacerse mediante una investigación de la totalidad de los elementos de la
población, lo que constituye un censo. En cambio el muestreo pretende estudiar
dichas características mediante información obtenida de una muestra o subconjunto
de la población.
4. Definiciones Básicas
a) Población: conjunto total de elementos, sujetos u objetos bajo estudio para los
cuales se desea estudiar alguna característica. Se supone que tenemos un listado
de la misma. La población puede ser:
1
• Finita, compuesta por N miembros. Ej. habitantes de Concepción; alumnos
de una Facultad de la UBB,
• Infinita, en este caso la población no es completamente observable. Por
ejemplo: los artículos que se producen mediante una máquina.
• Marcos Muestrales “de Lista”, son aquellos en los cuales las Unidades de
Muestreo se encuentran dispuestas en una lista o directorio. Un ejemplos
de este tipo de Marcos Muestrales es el que utiliza para las Encuestas
Industriales.
• Marcos de Áreas o Conglomerados. En realidad son también Marcos de
Listas aunque sus elementos son áreas geográficas. Estos marcos se
utilizan cuando no se dispone de otro Marco de Lista que sea completo.
Por ejemplo en las Encuestas de Hogares se comienza con un marco de
áreas geográficas puesto que no se cuenta con un marco actualizado de
viviendas particulares.
• Marcos Muestrales “Encestados” o “Encajados”. En estos casos, las
unidades de un Marco son, a su vez Marcos Muestrales las que permiten
alcanzar un Marco con las llamadas Unidades Últimas de Muestreo. En
otra palabras, la Población se encuentra particionada. Cada elemento de
esta partición constituye una unidad del Marco Muestral Primario a las
que llamaremos Unidades Primarias de Muestreo. Cada Unidad Primaria
puede a su vez estar particionada. Los elementos de cada partición de
Unidades Primarias son unidades de sendos Marcos Muestrales
Secundarios y a sus respectivas unidades se les llama Unidades
Secundarias de Muestreo. Estas Unidades Secundarias pueden o no estar
particionadas. Si lo están definiríamos Marcos Muestrales Terciarios con
2
Unidades Terciarias de Muestreo y así se podría continuar considerando
nuevos Marcos “encajados” en las Unidades de los Marcos Muestrales
previos. Las Unidades del último Marco Muestral considerado se llaman
Unidades Últimas de Muestreo. Un caso típico de estos marcos son los
utilizados en las Encuestas de Hogares.
3
Fracción del muestreo: proporción de unidades de la población contenidas en
n 2500
la muestra. f = = = 0, 05 , es decir se ha encuestado al 5% de la
N 50000
población.
4
Debido a que el trabajo de campo requiere una gran cantidad de personal para
cumplir diversas tareas (encuestadores, supervisores, digitadores, etc.) es
necesario elaborar cuidadosamente un programa de actividades, y establecer
líneas de autoridad.
i) Selección y entrenamiento del personal de campo
Debe seleccionarse y adiestrarse adecuadamente a quienes van a recoger la
información en terreno. Deben estar familiarizados con el instrumento de
medición, facilitar la obtención de respuestas pero evitar la introducción de
sesgos.
j) Prueba piloto
Esta prueba, que se basa en una pequeña muestra, es crucial para probar en la
práctica los instrumentos de medición, calificar a los encuestadores, y verificar
el manejo de las operaciones de campo.
k) Organización de la recolección de datos
Debido a que usualmente se genera una gran cantidad de información es preciso
elaborar un esquema para manejarla y construir una bases de datos, partiendo
con la recolección de estos en el trabajo de campo, hasta su análisis final,
pasando por la digitación y verificación de los datos. Es preciso que haya un
adecuado control dela calidad de los datos.
l) Análisis de los resultados y elaboración de conclusiones
Los resultados deben ser tabulados y analizados mediante técnicas estadísticas
apropiadas. A partir de esto se podrán elaborar las conclusiones y redactar el
informa final.
6. Errores en el muestreo
Resultan de disponer sólo de información de un subconjunto de la población total.
Tipos de errores:
a) Aleatorios, propios del muestreo: Son debidos al azar y al mecanismo
probabilístico. Una observación tiende a compensarse con otra. Estos errores se
pueden reducen aumentando el tamaño de la muestra.
b) Sistemáticos o ajenos al muestreo: No tienen que ver con el tipo de muestreo.
Para corregirlos se debe controlar la forma en que se obtiene la muestra.
Ejemplos de este tipo de error:
• debidos a la falta de respuesta a todo el cuestionario (ausencia de
encuestado) o a una parte del cuestionario (no responde o no sabe o no
contesta, ns/nc).
• mala o incorrecta definición de la población. Ejemplo elecciones USA en
1936
• respuestas falsas , erróneas o imprecisas: preguntas difíciles de entender o
que den a entender que una respuesta es mejor que otra.
• errores en la recolección, codificación, tabulación o elaboración de
los datos.
7. Tipos de muestreo
Atendiendo a las fases que hay en el proceso:
a) Unietápico. Ejemplo, seleccionar a alumnos de una lista.
5
b) Polietápico: En cada etapa se seleccionan las unidades muestrales. Ejemplo: Se
seleccionan aulas (unidad primaria), después, a partir de las aulas seleccionadas,
se seleccionan alumnos (unidad secundaria).
Además el muestreo puede hacerse:
a. Con reposición: tras cada elección el individuo vuelve a la población, pudiendo
haber elementos repetidos en la muestra.
b. Sin reposición: tras cada elección el individuo se elimina de la población Es
imposible que haya elementos repetidos en la muestra.
El muestreo también puede ser de tipo:
a. Probabilístico: Cuando cada elemento de la población tiene una probabilidad
conocida de ser seleccionado en la muestra.
b. No probabilístico: Cuando la probabilidad de selección de cada elemento es
desconocida. :
i. Muestreo por conveniencia (no aleatorio):
ii. Basado en juicio
iii. Por cuotas
iv. Bola de nieve
6
nh es el tamaño de la muestra en el estrato h ( n° de elementos en la muestra del
estrato h)
1 Nh
donde S = 2
h ∑
N h − 1 i =1
( yhi − Yh ) 2 es la cuasivarianza del estrato h
7
• Es recomendable sólo si confiamos en la aleatoriedad de los elementos del
conglomerado.
1. Notación y Definiciones
Sean:
y1 , y2 , , y N las observaciones de una variable y para los N elementos (individuos,
objetos, etc) que constituyen una población.
y1 , y2 , , yn los valores correspondientes en la muestra. Nótese que estos valores
son un subconjunto de los valores poblacionales que NO corresponden
necesariamente con los n primeros valores poblacionales.
Para representar características poblacionales usaremos letras mayúsculas mientras
que para las estimaciones muestrales usaremos letras minúsculas:
Media Y 1 N 1 n
Y = = ∑ yi y= ∑ yi
N N i =1 n i =1
Razón Y Y
R= = r=
∑y i
=
y
X X ∑x i x
Proporción A a
P= p=
N n
Varianza 1 N N −1 2
σ = ∑ ( yi − Y )2
2
σˆ 2 = s
N i =1 N
Cuasi-Varianza 1 N
N 1 n
S2 = ∑
N − 1 i =1
( yi − Y ) 2 =
N −1
σ2 s2 = ∑ ( yi − y )2
n − 1 i =1
8
Característica Estimador
Media: Y Yˆ = y
Total: Y Yˆ = Ny
Razón: R R̂ = r
Proporción: P P̂ = p
Varianza: σ2 N −1 2
σˆ 2 = s
N
Cuasi-varianza: S 2 1 n
Sˆ 2 = s 2 = ∑
n − 1 i =1
( yi − y ) 2
9
• La probabilidad de que una unidad poblacional dada forme parte de una
muestra de tamaño n, o de ser seleccionada en una muestra de tamaño n es:
⎛ N − 1⎞
⎜ ⎟
casos favorables ⎝ n − 1 ⎠ n
= = .
casos posibles ⎛N⎞ N
⎜ ⎟
⎝n ⎠
• El número de muestras en que puede aparecer un par ( yi , y j ) es
⎛ N − 2⎞
N −2Cn − 2 = ⎜ ⎟ . Esto es así debido a que hay N − 2 unidades adicionales
⎝n−2 ⎠
para completar el resto de la muestra y n − 2 lugares que llenar en la muestra.
Esto es, una vez fijados dos elementos, con las N − 2 unidades restantes se
⎛ N − 2⎞
pueden formar ⎜ ⎟ combinaciones para completar una muestra de
⎝n−2 ⎠
tamaño n. Por tanto cada par tiene la siguiente probabilidad de aparecer en las
muestras:
⎛ N − 2⎞
⎜ ⎟
casos favorables ⎝ n − 2 ⎠ n(n − 1)
= =
casos posibles ⎛N⎞ N ( N − 1)
⎜ ⎟
⎝n ⎠
1 1 ⎧⎪⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎫⎪
= ⎨⎜ ∑ yi ⎟ + ⎜ ∑ yi ⎟ + + ⎜ ∑ yi ⎟ ⎬
⎩⎝ i
N Cn n ⎪ ⎠1 ⎝ i ⎠2 ⎝ i ⎠ N Cn ⎪⎭
N −1 Cn −1 ( y1 + y2 + + yN ) = N −1 Cn −1 ∑ yi . Por lo tanto
i =1
10
⎛ N − 1⎞ ( N − 1)!
⎜ ⎟ N (n − 1)!( N − n ) ! 1 N
1 1⎧ N
⎫ ⎝ n −1 ⎠ 1
E( y ) = ⎨ N −1 Cn −1 ∑ yi ⎬ = ∑ i y = ∑ yi
N Cn n ⎩ i =1 ⎭ ⎛ N ⎞ n i =1 N! n i=1
⎜ ⎟ n !( N − n ) !
⎝n ⎠
1 N
= ∑ yi = Y
N i =1
Además para el estimador del total poblacional se tiene que
E (Yˆ ) = E ( Ny ) = NY = Y .
3.2. Insesgamiento de s 2
A continuación demostraremos que E ( s 2 ) = S 2 . Como
1 ⎛ n 2 ⎞
s2 = ⎜ ∑
n − 1 ⎝ i =1
yi − ny 2 ⎟
⎠
Luego:
1 ⎛ ⎛ n 2⎞ 2 ⎞
E (s 2 ) = ⎜ E ⎜ ∑ yi ⎟ − nE ( y ) ⎟ ,
n − 1 ⎝ ⎝ i =1 ⎠ ⎠
⎛N⎞
y como hay Cn = ⎜ ⎟ muestras, cada una de ellas con probabilidad
N
⎝n⎠
1/ N Cn , entonces
⎛ n ⎞ 1 ⎧⎪⎛ 2⎞ ⎛ 2⎞ ⎛ ⎞ ⎫⎪
E ⎜ ∑ yi2 ⎟ = ⎨⎜ ∑ yi ⎟ + ⎜ ∑ yi ⎟ + + ⎜ ∑ yi2 ⎟ ⎬
⎝ i =1 ⎠ N Cn ⎩⎪⎝ i ⎠1 ⎝ i ⎠2 ⎝ i ⎠ N Cn ⎭⎪
⎛ N − 1⎞
Pero como ya hemos establecido, cada yi ( yi2 ) aparece en N −1 Cn −1 = ⎜ ⎟
⎝ n −1 ⎠
muestras, entonces
⎛ N − 1⎞
⎜ ⎟
⎛ n 2 ⎞ N −1 Cn −1 N 2 ⎝ n − 1 ⎠ N 2 n N
E ⎜ ∑ yi ⎟ = ∑ yi = ∑ yi = N ∑y 2
⎛ N ⎞ i =1
i
⎝ i =1 ⎠ N Cn i =1 i =1
⎜ ⎟
⎝n ⎠
Por otro lado
11
1 ⎡⎛ n ⎞ ⎤ 1 ⎡ ⎛ n 2 n n ⎞⎤
2
E ( y ) = 2 E ⎢⎜ ∑ yi ⎟ ⎥ = 2 E ⎢⎜ ∑ yi + ∑∑ yi y j ⎟ ⎥
2
n ⎢⎣⎝ i =1 ⎠ ⎥⎦ n ⎢⎣⎝ i =1 i≠ j ⎠ ⎥⎦
1 1 ⎪⎧⎛ 2⎞ ⎛ 2⎞ ⎛ ⎞ ⎪⎫
= 2 ⎨⎜ ∑ yi ⎟ + ⎜ ∑ yi ⎟ + + ⎜ ∑ yi2 ⎟ ⎬
n N Cn ⎪⎩⎝ i ⎠1 ⎝ i ⎠2 ⎝ i ⎠ N Cn ⎪⎭
1 1 ⎧⎪⎛ n n ⎞ ⎛ n n ⎞ ⎛ n n ⎞ ⎪⎫
+ 2 ⎨⎜ ∑∑ i j ⎟ + ⎜ ∑∑ yi y j ⎟ +
y y + ⎜ ∑∑ yi y j ⎟ ⎬
n N Cn ⎪⎝ i ≠ j ⎠1 ⎝ i ≠ j ⎠2 ⎝ i≠ j ⎠ N Cn ⎭⎪
⎩
⎛ N − 1⎞
pero cada yi aparece en N −1 Cn −1 = ⎜ ⎟ muestras, mientras que cada par
⎝ n −1 ⎠
⎛ N − 2⎞
( yi , y j ) aparece en N −2 Cn − 2 =⎜ ⎟ muestras. Por lo tanto
⎝n−2 ⎠
1 1 ⎧ N N N
⎫
E( y 2 ) = ⎨ N −1 Cn −1 ∑ yi + N − 2 n − 2 ∑∑ yi y j ⎬
2
C
n2N n ⎩
C i =1 i≠ j ⎭
⎛ N − 1⎞ ⎛ N − 2⎞
⎜ ⎟ ⎜ ⎟
N −1 Cn −1 ⎝ n −1 ⎠ n N − 2 Cn − 2 ⎝ n − 2 ⎠ n(n − 1)
Pero = = ; = = , luego
N Cn ⎛N⎞ N N Cn ⎛N⎞ N ( N − 1)
⎜ ⎟ ⎜ ⎟
⎝n ⎠ ⎝n ⎠
1 ⎧n N
n(n − 1) N N ⎫ 1⎧1 N 2 (n − 1) N N ⎫
E( y 2 ) =
n2
⎨ ∑ yi2 + ∑∑
N ( N − 1) i ≠ j
yi j⎬
y = ⎨ ∑ i y + ∑∑
N ( N − 1) i ≠ j
yi y j ⎬
⎩N
i =1 ⎭ n ⎩ N i =1 ⎭
1 ⎧ ( N − 1) N 2 (n − 1) N N ⎫
= ⎨
n( N − 1) ⎩ N i =1
∑ yi + ∑∑ yi y j ⎬
N i≠ j ⎭
1 ⎧[( N − n) + (n − 1)] N 2 (n − 1) N N ⎫
=
n( N − 1) ⎩
⎨ ∑ yi + ∑∑ yi y j ⎬
N i =1 N i≠ j ⎭
1 ⎧⎪ ( N − n) N 2 ⎧1 N
1 N N ⎫⎪⎫
= ⎨
n( N − 1) ⎪⎩ N
∑ yi + (n − 1) ⎨ ∑ yi2 + ∑∑ y y i j ⎬⎬
i =1 ⎩N i =1 N i≠ j ⎭⎪⎭
1 ⎧ ( N − n) N 2 ⎫
= ⎨
n( N − 1) ⎩ N
∑i =1
yi + N (n − 1)Y 2 ⎬
⎭
Por lo tanto:
12