Está en la página 1de 19

Estadística y Probabilidad

Unidad III
Muestreo

Enero 2023

Pedro Cango
Elementos del problema de muestreo
Contenido
1. Objetivos
2. Terminología
3. Cómo seleccionar la muestra: diseño de la
encuesta por muestreo
4. Clasificación de las técnicas de muestreo
5. Cálculo del tamaño de la muestra
1. Objetivo
El objetivo de las encuestas por muestreo consiste en realizar inferencias acerca de una
población a partir de la información contenida en una muestra seleccionada de esa
población.
La inferencia, toma la forma de estimar una media de la población, un total o una
proporción con un límite para el error de estimación.
¿Por qué realizar muestreo?
Cada observación o elemento tomado de la población contiene cierta cantidad de
información acerca del parámetro o parámetros de interés. Como la información cuesta
dinero, el experimentador tiene que determinar qué cantidad de información debe
comprar.
Muy poca información impide al experimentador realizar buenas estimaciones, mientras
que mucha información ocasiona un despilfarro de dinero.
La cantidad de información obtenida en la muestra depende del número de elementos
muestreados y de la cantidad de variación en los datos. Este último factor puede
controlarse, en cierta medida, por el método de selección de la muestra, el llamado
diseño de la encuesta por muestreo.
2. Términos técnicos
Un elemento es un objetivo sobre el que se toma una medición. Por ejemplo, un
elemento es un votante registrado en una provincia o país.
Una población es un conjunto de elementos sobre los que se desea realizar una
inferencia. Por ejemplo el conjunto de votantes de una provincia o país.
Las unidades de muestreo son conjuntos no solapados de la población que cubren la
población completa. Por ejemplo, una unidad de muestreo puede ser un votante
registrado en un país.
Un marco es una lista de unidades de muestreo. Por ejemplo, si se especifica como
unidad de muestreo al votante individual, una lista de todos los votantes registrados
puede servir como marco para una encuesta de opinión.
Téngase en cuenta que este marco no incluirá todos los elementos de la población,
dado que actualizar la lista diariamente es imposible. Sin embargo, la distancia entre
marco y población se espera que sea pequeña para poder hacer inferencias.
Una muestra es una colección de unidades de muestreo obtenidas a partir de un
marco o marcos.
3. Cómo seleccionar la muestra: diseño de la encuesta por
muestreo
Teniendo en cuenta el objetivo de muestreo, el investigador controla la cantidad de información contenida en la
muestra por medio del número de unidades de muestreo que incluye en la muestra y mediante el método
utilizado para seleccionar los datos muestrales.
¿Cómo se puede determinar qué procedimiento usar y el número de observaciones (unidades de
muestreo) a incluir en la muestra?
La respuesta depende de cuánta información se desee conseguir. Si es el parámetro de interés y es un estimador
de , es necesario especificar un límite para el error de estimación; es decir, se debe especificar que y difieran
en valor absoluto en una cantidad menor a .
Representando simbólicamente,

También es necesario definir la probabilidad, , que especifique la proporción de veces en muestreo repetido en
que se exige que el error de estimación sea menor que . Esta condición se puede establecer como

Normalmente, se seleccionará un valor de de dos desviaciones estándar del estimador y, por tanto, será
aproximadamente para la distribuciones en forma de campana de Gauss.
Después de obtener el límite específico con su probabilidad asociada , se pueden comparar diseños diferentes
para determinar el procedimiento que proporciona la precisión deseada con el mínimo coste.
4. Clasificación de las técnicas de muestreo

Técnicas de
muestreo

No
Probabilístico
probabilístico

Muestreo Muestreo por


Muestro por Muestreo por Muestreo por Muestreo de Muestreo Muestreo
aleatorio conglomerado
conveniencia juicio cuota bola de nieve sistemático estratificado
simple s

Proporcionado Desproporcionado
4.1. Técnicas de muestreo no probabilístico
El muestreo no probabilístico se basa en el juicio personal del investigador más que en la oportunidad de
seleccionar elementos de la muestra. El investigador puede decidir de manera arbitraria qué elementos incluir en
la muestra. La desventaja mas importante es que los estimados obtenidos del muestreo no probabilístico no son
extrapolables a la población.
Muestro por conveniencia
La selección de unidades de muestreo se deja principalmente al entrevistador. A menudo los encuestados se
seleccionan porque están en el lugar correcto en el tiempo apropiado. Por ejemplo: 1) estudiantes, grupos de
iglesia, miembros de organizaciones sociales, entrevistas a la gente en la calle.
La ventaja de esta técnica es que es menos costosa de todas las técnicas de muestreo y la que consume menos
tiempo. Sin embargo, a pesar de las ventajas, esta forma de muestreo tiene serias limitaciones. Hay muchas
posibles fuentes de sesgo por selección, incluyendo la autoselección del encuestado.
Muestreo por juicio
Esta técnica es una forma de muestreo por conveniencia en el que los elementos de población se seleccionan
con base en el juicio del investigador, el cual, empleando su juicio o experiencia, elige los elementos que se
incluirán en la muestra porque cree que son representativos de la población de interés o que son apropiados en
alguna otra forma. Ejemplo, en una investigación sobre proyectos de forestación en una parroquia incluyen:
presuntos líderes comunitarios.
El muestro por juicio es subjetivo y su valor depende por completo del juicio, experiencia y la creatividad del
investigador.
Muestreo por cuota
El muestreo por cuotas puede considerarse como un muestreo de juicio restringido a dos etapas.
La primera etapa consiste en desarrollar categorías de control o cuotas de elementos de la población. Para ello,
el investigador hace una lista de las características de control relevantes y determina la distribución de estas
características en la población objetivo. Estas pueden incluir sexo, edad, cultura (se identifican en base al
juicio).
La idea es que la proporción de elementos de la muestra contengan proporcionalmente las mismas
características que los elementos de la población.
En la segunda etapa, los elementos de muestra se seleccionan con base en la conveniencia o el juicio. Una vez
que se han asignado las cuotas existe bastante libertad para seleccionar los elementos que se incluirán en la
muestra.
Muestreo de bola de nieve
En el muestreo de bola de nieve se selecciona un grupo inicial de encuestados, generalmente al azar. Después
de ser entrevistados se les pide que identifiquen a otros que pertenecen a la población de interés. Los
encuestados subsecuentes se seleccionan con base en sus referencias. Este proceso se puede realizar en ondas,
obteniendo referencia de las referencias, lo que lleva, por lo tanto, a un efecto de bola de nieve.
Aunque el muestreo probabilístico se utiliza para seleccionar a los encuestados iniciales, la muestra final es no
probabilístico.
4.2. Técnicas de muestreo probabilístico
El muestreo probabilístico requiere que la aleatoriedad se integre en el diseño muestral, de forma que se
pueda evaluar las propiedades de forma probabilística. Si se dispone de aleatoriedad adecuada en la muestra,
es posible afirmar cosas como: “Nuestra estimación es insesgada y tenemos un 95% de confianza en que
nuestra estimación se encontrará dentro de dos puntos porcentuales alrededor de la proporción verdadera”.
Muestreo aleatorio simple (MAS)
Consiste en seleccionar un tamaño de muestra n de una población de tamaño N unidades de muestreo de
forma que cada muestra de tamaño n tenga la misma probabilidad de ser seleccionada.
El MAS tiene muchas características deseables: Es de fácil comprensión. Los resultados de muestra pueden ser
proyectados a la población objetivo. La mayoría de los métodos de deducción estadística asume que los datos
han sido recopilados por muestreo aleatorio simple.
Sin embargo, el MAS tiene al menos cuatro limitaciones:
- Es difícil construir un marco de muestreo que permita que se tome una muestra aleatoria simple
- El MAS puede dar por resultado muestras que son demasiado grandes o distribuidos en áreas geográficas
grandes, lo que incrementa el tiempo y el costo de la recopilación de datos.
- El MAS a menudo tienen menor precisión con más errores estándar que las otras técnicas de muestreo
probabilístico.
- El MAS puede no dar por resultado una muestra representativa, especialmente si el tamaño de muestra es
pequeño.
Muestreo sistemático
En el muestreo sistemático, la muestra es elegida al seleccionar un punto de inicio al azar y luego
eligiendo algún elemento en sucesión del marco de muestreo. El intervalo de muestreo se determina
al dividir el tamaño de la población N entre el tamaño de la población n y aproximarlo al digito más
cercano.
Por ejemplo, existen 100 000 elementos en la población y se desea una muestra de 1 000. En este
caso, el intervalo de muestreo, i, es 100. Se selecciona un número al azar entre 1 y el 100. Si, por
ejemplo, este número es 23, la muestra consiste en los elementos 23, 123, 223, 323, 423, 523, etc.
El muestreo sistemático es similar al MAS en que cada elemento de población tiene una probabilidad
de selección conocida y equitativa. Sin embargo, es diferente del MAS en que solo las muestras
permisibles de tamaño n que pueden determinarse tienen probabilidad conocida y equitativa de
selección. Las demás muestras de tamaño n tienen probabilidad cero de ser seleccionadas.
Si el ordenamiento de los elementos se relaciona con la característica de interés, el muestreo
sistemático incrementa representatividad de la muestra. Si el orden esta relacionada con el tamaño,
este garantiza la inclusión de empresas pequeñas y grandes, mismo que puede no suceder con el
MAS.
Muestreo estratificado
El muestreo estratificado es un proceso de dos pasos en el que la población se divide en
subpoblaciones o estratos. Los estratos tienen que ser mutuamente excluyentes y colectivamente
exhaustivos, por lo que cada elemento de la población debe asignarse a un único estrato, sin omitir
ningún elemento de la población.
A continuación, se seleccionan los elementos de cada estrato mediante un procedimiento aleatorio,
por lo regular el muestreo aleatorio simple (MAS). Aunque en teoría sólo debe emplearse el muestreo
aleatorio simple para seleccionar los elementos de cada estrato, en ocasiones se emplean el muestreo
sistemático y otros procedimientos de muestreo probabilístico.
Un objetivo importante del muestreo estratificado consiste en incrementar la precisión sin aumentar
el costo. Las variables utilizadas para dividir a la población en estratos se conocen como variables de
estratificación. Los criterios para la selección de esas variables incluyen homogeneidad (similitud),
heterogeneidad (diferencias), relación y costo. Dentro de un estrato, los elementos deben ser tan
homogéneos (similares) como sea posible, mientras que los elementos de los diferentes estratos
requieren ser tan heterogéneos (diferentes) como sea posible. Las variables de estratificación deben
tener una relación estrecha con las características de interés. Cuanto mejor se cumplan estos criterios,
mayor será la eficacia en el control de la variación externa al muestreo.
Las variables que suelen usarse para la estratificación incluyen características demográficas (como en
el ejemplo sexo, residencia), tipo de cliente, tamaño de la empresa o tipo de industria.
Muestreo por conglomerados
En el muestreo por conglomerados, la población meta se divide primero en subpoblaciones o conglomerados
mutuamente excluyentes y colectivamente exhaustivos. Luego, se selecciona una muestra aleatoria de
conglomerados con base en una técnica de muestreo probabilístico, como el MAS. Para cada conglomerado
seleccionado, se incluyen todos los elementos en la muestra, o se toma una muestra de elementos en forma
probabilística. Si se incluye en la muestra a todos los elementos del conglomerado seleccionado, el
procedimiento se denomina muestreo por conglomerados de una etapa. Si de cada conglomerado
seleccionado se extrae de manera probabilística una muestra de elementos, el procedimiento es un muestreo
por conglomerados de dos etapas.
El objetivo del muestreo por conglomerados es incrementar la eficiencia del muestreo mediante la reducción
de los costos. El objetivo del muestreo estratificado es incrementar la precisión. Con respecto a la
homogeneidad y heterogeneidad, los criterios que se utilizan para conformar los conglomerados son
exactamente los opuestos a los que se emplean para integrar los estratos. Los elementos dentro de un
conglomerado deben ser tan heterogéneos (diferentes) como sea posible, aunque los conglomerados deben
ser tan homogéneos (similares) como sea posible.
De manera ideal, cada conglomerado debe ser una representación a pequeña escala de la población.
En el muestreo por conglomerados, el marco de muestreo sólo se necesita para los conglomerados
seleccionados para la muestra. Una forma común de muestreo por conglomerados es el muestreo por área, en
el cual los conglomerados están formados por áreas geográficas como zonas, sectores, manzanas.
4.3. Elección entre el muestreo probabilístico y no
probabilístico
La elección entre muestras probabilísticas y no probabilísticas debe basarse en consideraciones como
la naturaleza de la investigación, la magnitud relativa de los errores de muestreo y factores
estadísticos y operacionales. Por ejemplo, en la investigación exploratoria, los hallazgos se consideran
preliminares y quizá no esté justificado el uso del muestreo probabilístico. Por otro lado, en la
investigación concluyente, donde el investigador quiere usar los resultados para estimar la
participación general en el mercado o total, se favorece el muestreo probabilístico.
Las muestras probabilísticas permiten la extrapolación estadística de los resultados a una población
meta.
Por otro lado, si los errores de muestreo son más importantes, es mejor utilizar el muestreo
probabilístico.
Desde un punto de vista estadístico, se prefiere el muestreo probabilístico por ser la base de las
técnicas estadísticas más comunes. Por lo general, es más costoso y requiere más tiempo que el
muestreo no probabilístico. En muchos proyectos de investigación, es difícil justificar el tiempo y los
gastos adicionales.
Por lo tanto, en la práctica, los objetivos del estudio establecen cuál será el método de muestreo que
se utilizará.
5. Cálculo del tamaño de la muestra
Parámetro: un parámetro es la descripción resumida de una característica o medida fija de una
población meta. Un parámetro denota el valor real que se obtendría si se realizara un censo en vez de
trabajar en una muestra.
Estadístico: un estadístico es una descripción resumida de una característica o medida de la muestra.
El estadístico de la muestra se utiliza como una estimación del parámetro de la población.
Corrección de la población finita: la corrección de la población finita (cpf) es la corrección de la
sobreestimación de la varianza del parámetro de la población, por ejemplo, una media o una
proporción, cuando el tamaño de la muestra es 10 por ciento o más del tamaño de la población.
Nivel de precisión: cuando se calcula el parámetro de la población usando el estadístico de la
muestra, el nivel de precisión es el tamaño deseado del intervalo que se estima. Es decir, la máxima
diferencia permitida entre el estadístico de la muestra y el parámetro de la población.
Intervalo de confianza: el intervalo de confianza es el rango dentro del que caerá el verdadero
parámetro de la población, suponiendo un determinado nivel de confianza.
Nivel de confianza: el nivel de confianza es la probabilidad de que un intervalo de confianza
incluya el parámetro de la población.
5.1. Distribución de muestreo
La distribución del muestreo es la distribución de los valores de una muestra
estadística, que se calculan para cada posible muestra que pueda extraerse de la
población meta dado un plan de muestreo específico. Suponga que se obtendrá
una muestra aleatoria simple de cinco plantas nativas de una población de 20.
Pueden obtenerse 15 504 diferentes muestras con tamaño de 5.
Una tarea importante en la investigación de mercados es el cálculo de
estadísticos, como la media y la proporción de la muestra, para usarlas luego en
la estimación de los correspondientes valores verdaderos de la población. Se
conoce como inferencia estadística al proceso de generalizar los resultados de la
muestra para los resultados de la población. En la práctica, se selecciona una
sola muestra de un tamaño predeterminado y se calculan sus estadísticos (como
la media y la proporción).
5.2. Determinación del tamaño de la muestra infinita para medias y
proporciones
5.2. Determinación del tamaño de la muestra para una población finita

Medias Proporciones
5.1. Ejemplos
1. Un investigador tiene la intención de recoger una muestra sistemática de
una población de 5000. El nivel de significancia es del 8%.
2. La administración de un restaurante local requiere determinar el
promedio mensual que gastan los hogares en restaurantes. Algunos
hogares en el mercado meta no gastan nada; en toto que otras gastan
hasta $ 300 al mes. La administración requiere tener una confianza del
95% en los resultados, y no quiere que el error exceda más o menos 5%.
a. ¿Qué tamaño de muestra debe usarse para determinar el gasto
promedio mensual de los hogares?
b. Después de realizar la encuesta se encontró que el gasto promedio
era de $90.30 y la desviación estándar era $45. Construya el intervalo
de confianza de 95%. ¿ Qué puede decirse a cerca del nivel de
precisión?

También podría gustarte