Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Técnicas de muestreo
Tema 1.
Técnicas de
muestreo
Así, p.ej., del universo de los estudiantes de la UCAB podría obtenerse la población
unidimensional constituida por los números que expresan sus edades, o la tridimensional
de sus edades, tallas y pesos. Corrientemente cuando no hay peligro de confusión, se usa
el término población en cualquiera de los dos sentidos anteriores. Una muestra es un
subconjunto del universo o población. En la práctica se seleccionan elementos del
universo para construir una muestra de personas o cosas y luego al medir u observar la(s)
característica(s) de estudio se tendrá(n) la(s) muestra(s) poblacional(es)
correspondiente(s). El proceso mediante el cual se seleccionan los elementos para
constituir la muestra se denomina muestreo.
Aleatorio Simple
Sistemático
Estratificado
Pr obabilístico
Conglomerados
Bietápico - Polietápico
Periódico - Control de Calidad
Opinático o Intencional
No Pr obabilístico Circuns tan cial - Estudio de Casos
Nunca una inferencia permitirá tener plena seguridad de lo afirmado con relación a
la población en estudio; sin embargo, se puede estimar el error y grado de confiabilidad
que merece nuestras estimaciones, siempre y cuando el muestreo sea probabilístico.
Puesto que la inferencia supone riesgo, es útil indicar en qué casos conviene obtener
muestras, en lugar de censos o investigaciones exhaustivas, de todos los elementos del
universo. La decisión óptima consiste en emplear recursos mínimos para obtener
determinada información. O bien en conseguir máxima información mediante recursos
prefijados. También puede decirse que se trata de minimizar la pérdida total, en la que se
incluyen, por una parte los recursos empleados (medidos si es posible en unidades
monetarias, e incluyendo tiempo, equipo, esfuerzos), y por otra, el “error” (alguna medida
de la desviación absoluta promedio esperada entre el valor verdadero desconocido y el
estimado) y la probabilidad de cometerlo.
Hay situaciones menos extremas, pero que se aproximan a las anteriores. Sin ser
estrictamente imposible el estudio de una población, puede serlo prácticamente por el
número de sus elementos. O bien puede ocurrir que la población sea aceptablemente
homogénea. O que los elementos investigados en las muestras no lleguen a inutilizarse,
pero si a disminuir su valor. Así ocurrirá siempre que haya que someter el elemento
estudiado a operaciones que puedan viciar su utilidad, o surgen inconvenientes de otros
géneros, como el desagrado de personas a los que se somete a excesivas encuestas. Aparte
de las expuestas anteriormente en dichos tres casos, existen otras razones que pueden
hacer ventajoso el muestreo. (1) Economía, (2) Mayor rapidez en la obtención de los
resultados.
Además del riesgo que lleva consigo toda muestra, conviene destacar otras
limitaciones del muestreo. Es obvio que no será posible utilizar muestras cuando se
necesita información sobre todos los elementos del universo. Tal es el caso de una elección
presidencial.
1. Finalidad
Referido al uso que se dará a la información que se obtenga una vez cuantificados los
objetivos específicos de la investigación. Es decir, responde a la pregunta ¿para qué?
2. Objetivos
Los objetivos generales indican el alcance del estudio en forma global. Los objetivos
específicos corresponden al desarrollo de los objetivos generales señalando sin
ambiguedades las características poblacionales a ser estimadas.
3. Cobertura
La cobertura horizontal se refiere al alcance geográfico donde se realizará el estudio.
La cobertura vertical fija los niveles de desagregación deseada de la información.
4. Período de Referencia
La mayoría de las investigaciones comprenden variables que cambian en el tiempo,
por ello es importante señalar el período en el cual fueron observadas las mismas.
5. Variables en Estudio
Deben definirse las variables a ser observadas en la investigación, indicando las
variables claves del diseño que servirán para los cálculos de los tamaños muestrales.
6. Antecedentes
Es de suma importancia disponer de investigaciones ya realizadas iguales o
similares a las que nos proponemos llevar a cabo ya que nos servirán para la
reducción de errores y estrategias computacionales y administrativas.
7. Recursos disponibles
Técnicos, físicos, financieros, de tiempo, marcos muestrales.
Con este supuesto, por ser equiprobables todas las muestras de n elementos, la
probabilidad de que un elemento del universo u forma parte de la muestra se puede
calcular así:
N −1
Número de Muestras de tamaño n que contienen a u n − 1 n
= =
Número total de Muestras de tamaño n N N
n
Son 15504 combinaciones de muestras posibles, de las que la estatura media que se
obtenga pueda variar.
Existen varios procedimientos para seleccionar una muestra aleatoria simple sin
reemplazo de tamaño n de un universo que contiene N elementos. Basta con garantizar
que cada elemento del universo tiene la misma probabilidad de ser seleccionado. En
primer lugar habrá que numerar todos los elementos del universo en forma consecutiva
desde el 1 hasta el N.
Método 2. Mediante el uso de una tabla de números aleatorios. El objeto de las tablas de
números aleatorios es facilitar la obtención de los elementos que han de constituir la
muestra, sin tener que usar bombos, cajas para bolas u otros utensilios más o menos
complicados, pero consiguiendo que el procedimiento de selección asigne a cada elemento
de la población la misma probabilidad de ser seleccionado. En todas estas tablas lo que se
trata de representar es el resultado de un experimento aleatorio, o muestreo aleatorio con
reemplazamiento, de una población constituida por los diez dígitos desde el cero hasta el
nueve. Claro es que por la reunión de cifras contiguas en las columnas y en las filas de la
tabla se obtendrían inmediatamente sucesiones de números que pudieran considerarse
como muestras de una población constituida por los cien números de dos cifras que van
del 00 al 99, por los mil de tres cifras del 000 al 999, etc.
Una vez numerados los N elementos del universo que van a ser objeto de selección
aleatoria para constituir la muestra de tamaño n, se toma una página cualquiera de la
tabla sin mirarla previamente para que no exista tendencia o sesgo en su designación, y
luego en dicha página, se toma, también a ciegas, un dígito cualquiera que servirá de
origen. Si hubiera que tomar varias muestras, se aconsejano partir siempre del mismo
origen. A continuación se van siguiendo las filas o columnas y se anotan los n primeros
números inferiores a N.
a. Si los datos deseados deben tener una precisión conocida en algunas subdivisiones
de la población, es aconsejable tratar cada subdivisión como una “población” por
derecho propio
b. Por conveniencia administrativa, puede ser necesario el uso de la estratificación;
así, por ejemplo, la agencia que realiza una encuesta, podría tener sucursales en el
campo, cada una de las cuales supervisaría la encuesta de una parte de la
población
c. Los problemas de muestreo pueden tener marcadas diferencias en diversas partes
de la población. Con poblaciones humanas, las personas que viven en instituciones
(como hoteles, hospitales, cárceles) se colocan en un estrato diferente de las que
viven en casas ordinarias, ya que otro método de muestreo es el apropiado para
cada una de estas dos situaciones. Al muestrear negocios, se podría tener una lista
de las grandes firmas que se deben colocar en un estrato diferente.Quizá algún tipo
de muestreo por áreas debe usarse para las firmas más pequeñas
c. Los datos recogidos. Es conveniente cerciorarse que todos los datos son
pertinentes a la encuesta y que no se omiten datos esenciales. Particularmente en
presencia de poblaciones humanas, existe la tendencia a hacer un número excesivo
de preguntas que no se analizan posteriormente.
x=
1
n ∑
i =1
xi .
T=
∑i =1
xi .
τ = Nx =
N
n ∑
i =1
xi .
Al igual que con la media muestral, se puede asimilar que la distribución del
estimador del total poblacional sigue una distribución normal dada por:
Nσ n 1 1
τ ∼ N Nµ, 1 − ⇒ τ ∼ N Nµ,Nσ − .
n N n N
Sc = +
1
n −1 ∑ i =1
(x − x i )2 .
En tal sentido
2
Sc S2c 2 Sc Zα 2
e= Zα 2 ⇒e =
2
Zα 2 ⇒ n = .
n n e
Población finita.
Intervalo de confianza para la media poblacional:
1 1 1 1
x−σ − Zα 2 ≤ µ ≤ x + σ − Zα 2
n N n N
1 1 1 1 1 1
−σ − Zα 2 ≤ µ − x ≤ σ − Zα 2 ⇒ µ − x ≤ σ − Zα 2
n N n N n N
Sc = +
1
n −1 ∑i =1
(x − x i )2 .
En tal sentido
S2c Z2α 2 N
1 1 21 1 2
e = Sc − Z α 2 ⇒ e = Sc − Z α 2 ⇒ n = 2
2
.
n N n N e N + S2c Z2α 2
Sc = +
1
n −1 ∑(x − x ) .
i =1
i
2
En tal sentido
S2c Z2α 2 N 2
1 1 2 21 1 2
e = NSc − Z α 2 ⇒ e = Sc N − Z α 2 ⇒ n = 2
2
.
n N n N e + S2c Z2α 2 N
Se recabaron firmas para una petición en 676 hojas. Cada hoja tenía espacio suficiente
para 42 firmas, pero en muchas de las hojas se recabó un número menor. Se contó el
número de firmas por hoja en una muestra al azar de 50 hojas (muestra del 7%
aproximadamente). Los resultados se muestran en la tabla 1.
xi 42 41 36 32 29 27 23 19 16 15
fi 23 04 01 01 01 02 01 01 02 02
yx 14 11 10 09 07 06 05 04 03 Total
fi 01 01 01 01 01 03 02 01 01 50
Tabla 1. Resultados para una muestra de 50 hojas de petición
donde xi es el número de firmas y fi es la frecuencia
a. Estime promedio de firmas por hojas con un intervalo de confianza del 90%.
Solución.
50
n = 50,
∑i =1
x i = 1471, x =
1471
50
≈ 29.42,
50
S2c =
1
n −1 ∑i =1
fi (x i − x)2 = 229 ⇒ Sc ≈ 15.13
b. Estime el número total de firmas para la petición con un intervalo de confianza del
80%.
Solución.
50
n = 50,
∑i =1
x i = 1471, τ = Nx =
(676)(1471)
50
≈ 19888,
50
S2c =
1
n −1 ∑i =1
fi (x i − x)2 = 229 ⇒ Sc ≈ 15.13
Solución.
Promedio de gastos semanales en alimentos por familia. Media muestral:
907.2
x= = 27.49 u.m.
33
Gasto semanal en alimentos por persona.
907.2
R̂1 = = 7.38 u.m. por persona
123
Porcentaje de ingreso que se gasta en alimento.
907.2
R̂ 2 = × 100 = 37.9%
2394
José Luis Quintero Análisis de Datos 19