Está en la página 1de 19

TEMA 3

TEORÍA Y PRÁCTICA DEL MUESTREO


3.1. Conceptos básicos del muestreo
3.2. Tipos de muestreo: probabilístico y no probabilístico
3.3 Afijación de la muestra
3.4. Determinación del tamaño de la muestra y error de muestreo
1. CONCEPTOS BÁSICOS DE MUESTREO

• CONCEPTOS

En investigación comercial se realizan estudios sobre grupos de población (personas,


empresas, hogares, etc.) que, con frecuencia, son muy grandes. Resultaría muy caro
obtener la información de toda la población y por esta razón se utilizan técnicas de
muestreo que permiten seleccionar a una pequeña parte o muestra de la población
que se quiere estudiar. Sobre esta muestra se analizan las características que
interesan y, del resultado del análisis de la muestra, se trata de inferir o afirmar algo
de la población total. A través del tratamiento estadístico inferencial es posible, a
partir de la observación de una parte de la población (la muestra), hacer
generalizaciones acerca de la estructura, composición o comportamiento de las
poblaciones.

Si se quiere hacer un estudio fiable hay que cuidar mucho el método utilizado para la
elección de la muestra para que ésta represente, en la medida de lo posible, a la
población de la que se extrae. Si la muestra está mal elegida se pueden producir
errores no controlados, sesgos. Para que la muestra sea representativa, la selección
de los elementos de la muestra requiere unos requisitos que lo garanticen.

Algunos conceptos en el muestreo son:


Población (N)
Se denomina población o universo N a una colección finita o infinita de unidades de
las cuales se desea obtener una información. Las unidades de la población pueden
ser familias, empresas, personas, etc. En una población, se pueden medir distintas
características o clasificar los elementos de algún modo. Por ejemplo, se puede
medir la edad, el nivel de gasto, la posición, la actitud hacia un producto, la compra
mensual, etc.

Unidades de muestreo
Son los elementos de la población, que se encuentran disponibles para su selección
para la muestra.

Muestra (n)
Una muestra n es la selección de una parte de los elementos de la población N para,
a partir del estudio de esa parte, conocer las características del conjunto de la
población N.
La muestra n debe ser de algún modo representativa de la población. La
representatividad de la muestra queda garantizada con la elección correcta del
método de muestreo. Los métodos pueden ser probabilísticos o no probabilísticos.

Marco muestral Es la lista de elementos de donde se extrae cada una de las


unidades muestrales. Es un listado de las unidades de muestreo.
Censo
Un censo es la recogida exhaustiva de datos de todas y cada una de las unidades
(personas, cosas, etc.) que componen la población objeto de estudio. Censos y
muestras suelen utilizar el cuestionario como soporte de recogida de información.
Las ventajas del muestreo frente a un estudio censal son: su menor coste, la mayor
rapidez, un mayor control del proceso estadístico, requiere menos personas para el
trabajo de campo y se molesta menos a la población. Por el contrario, un muestreo
introduce posibles errores de estimación y de alcance, por lo que en determinados
niveles, la muestra puede no ser representativa.

• ETAPAS EN EL PROCESO DE MUESTREO


a) Definición de la población objetivo
b) Determinación del marco muestral
c) Selección del procedimiento de muestreo
d) Obtención de la muestra
2. TIPOS DE MUESTREO PROBABILÍSTICO Y NO PROBABILÍSTICO
Hay dos grandes tipos de muestreo: el probabilístico y el no probabilístico

En términos estrictos un muestreo probabilístico debería de cumplir los siguientes


requisitos:
1. Que sea posible enumerar la población de estudio.
2. Que se disponga de un procedimiento aleatorio de obtención de la muestra.
3. Que cada elemento de la población tenga una probabilidad conocida y no nula de
formar parte de la muestra.

• MUESTREO PROBABILÍSTICO
Este tipo de muestreo está basado en la Estadística. Los muestreos probabilísticos
son aquellos que se hacen aleatoriamente y todos los individuos de una población
tienen probabilidad de ser elegidos para formar parte de una muestra. Sólo estos
métodos de muestreo probabilístico nos aseguran la representatividad estadística de
la muestra extraída y permiten en rigor evaluar la representatividad de la misma. En
estos muestreos es posible calcular los errores de muestreo y la fiabilidad de las
estimaciones.
Aplicar un muestreo probabilístico es en general más caro que uno no probabilístico
y también es más lento y complicado.
 Tipos de muestreo probabilístico
Las opciones básicas son el muestreo aleatorio simple, el muestreo aleatorio
sistemático, el muestreo aleatorio estratificado y el muestreo aleatorio por
conglomerados.

A.Muestreo aleatorio simple (m.a.s.)


Consiste en censar la población N y hacer un listado con los elementos. Después se
extraen al azar los elementos que van a formar parte de la muestra n. La selección
de los elementos de la muestra se hace por medio de tablas de números aleatorios, u
otro procedimiento semejante, que garantice la aleatoriedad en la extracción de los
elementos.
En el m.a.s. la selección de los elementos de la muestra se hace en una sola etapa,
directamente y sin reemplazamiento en poblaciones o universos grandes, y con
reemplazamiento en poblaciones o universos pequeños.
Este método es el más sencillo y es fácil calcular los errores de muestreo. El
muestreo aleatorio simple se aplica especialmente en investigaciones sobre
poblaciones pequeñas con elementos identificables. Si las poblaciones son grandes
este método tiene muchas dificultades.
B. Muestreo aleatorio sistemático
Si suponemos los elementos de la población N, ordenados en un listado numerado, el
procedimiento comenzaría por hallar el coeficiente de elevación N/n (donde N es el
tamaño de la población y n el de la muestra que se quiere extraer). Después, se elige
al azar un número en el rango de 1 a N, que es el que indica el punto de arranque
(primer elemento de la muestra) de la selección de los elementos que van a formar
parte de la muestra. A partir de aquí, al número elegido al azar se le suma
sucesivamente el coeficiente de elevación, dando lugar a los siguientes números
(elementos) que van a formar parte de la muestra.
Con este procedimiento se simplifica la selección, pero se tiene el riesgo de
introducir sesgos en la muestra al elegir los elementos de forma periódica cuando la
población está ordenada en función de determinados criterios. Para evitar esto se
deberá desordenar, “barajar” la población antes de comenzar el proceso.
C. Muestreo aleatorio estratificado
Se trata de dividir o fraccionar la población en estudio en estratos. Se consideran los
estratos categorías diferentes entre sí, a la vez que los elementos de cada estrato
tengan homogeneidad respecto a alguna característica, como por ejemplo: se puede
estratificar por sexo, municipio de residencia, el estatus socioeconómico, etc.) Se
divide la población de acuerdo con las características a estudiar. En este muestreo
cada unidad de la población pertenece a un solo estrato o subdivisión, y el conjunto
de estratos es la población completa.
Se selecciona una muestra aleatoria de cada estrato, tratando de que todos los
estratos de la población queden representados. Cada estrato funciona
independientemente, pudiendo aplicarse dentro de ellos distintas formas de muestreo
-aleatorio simple u otro tipo-, para elegir los elementos concretos que formarán
parte de la muestra.
La estratificación, en la medida en que incluya en cada estrato a unidades
homogéneas entre sí y heterogéneas con relación a otros estratos, ayuda a reducir la
varianza de las estimaciones muestrales, y por esto mejora la precisión y reduce los
errores de muestreo. Por esta razón, para un error muestral dado será necesario un
número menor de elementos si se utiliza el muestreo estatificado que si se utiliza un
muestreo aleatorio simple.
Una ventaja de este método es que permite tratar de forma independiente cada
estrato, por lo que se pueden utilizar diferentes métodos de muestreo en cada
estrato, y hacer estimaciones por separado para las distintas subpoblaciones del
estudio (estratos). Además, facilita la realización del trabajo de campo.
En ocasiones es complicado aplicar este tipo de muestreo, porque exige un
conocimiento detallado de la población (distribución geográfica, sexo, edades,…) para
poder estratificar y desarrollar este procedimiento.
D. Muestreo por conglomerados
En este tipo de muestreo, las unidades muestrales no son los elementos (individuos o
cualquier otro), sino que son conglomerados de elementos, es decir, un conjunto de
elementos que se puede considerar una unidad.
Una vez definidos los conglomerados, la forma de operar para extraer la muestra
depende, entre otras cosas del tamaño del conglomerado. Cuando éste es pequeño,
se seleccionan los conglomerados por algunos de los tipos de muestreo descritos
hasta aquí, y dentro del conglomerado, se entrevista a todos sus componentes. Si los
conglomerados son grandes no se puede entrevistar a todos sus componentes, por lo
que hay que recurrir a un submuestreo dentro del conglomerado, por alguno de los
tipos de muestreo descritos.
El muestreo por conglomerados puede ser monoetápico o polietápico. El monoetápico
es aquel en el que la unidad del muestreo es el conglomerado y el polietápico es
aquel en el que la unidad final del muestreo no van a ser los conglomerados, sino
subdivisiones de estos.
El polietápico se utiliza cuando el conglomerado incluye muchos elementos y es difícil
entrevistar a todos sus componentes. También, cuando es necesario conseguir mayor
precisión de las estimaciones. En un muestreo polietápico hay varias etapas en el
muestreo y en cada una se selecciona un conglomerado de distinto nivel. En la
primera extracción se obtienen los primeros conglomerados del muestreo y las
siguientes son los conglomerados de segunda etapa y así sucesivamente. En la
última se extraen las unidades últimas de muestreo.
Un ejemplo: en un muestreo del total de población nacional se seleccionan en la
primera etapa municipios; en la segunda etapa, en cada municipio, se seleccionan
secciones censales y, en la siguiente etapa, se seleccionan calles en cada sección, y
así sucesivamente hasta seleccionar las últimas unidades del muestreo (individuos).
Cuando los conglomerados a muestrear son homogéneos internamente hay que
aumentar el número de conglomerados y tomar dentro de ellos pocas unidades. Si
por el contrario, los conglomerados son heterogéneos se seleccionan menos
conglomerados y más unidades dentro del conglomerado.
• MUESTREO NO PROBABILÍSTICO
En este tipo de muestreo la elección de la muestra NO es aleatoria por azar
estadístico, se hace de distintas formas: de forma cómoda (muestreo sin norma), o
bien, siguiendo algún criterio por parte del investigador. El muestreo no probabilístico
no se basa en ninguna teoría de la probabilidad y por tanto no se puede calcular el
error estadístico ni la confianza de las estimaciones. Este muestreo no tiene base
teórica y la precisión de las estimaciones depende del planteamiento del muestreo y
del control que el investigador tenga en el diseño y ejecución del proceso de
muestreo.
Los costes y la dificultad del diseño de estos muestreos son más reducidos.
Los muestreos no probabilísticos se utilizan bastante y son útiles, aunque para que
una muestra permita sacar conclusiones sobre la población de forma
verdaderamente eficaz deberá ser representativa estadísticamente y para ello se
debe recurrir a un muestreo probabilístico.
 Tipos de muestreo NO probabilístico
A.Muestreo por cuotas
Este muestreo no es probabilístico y, aunque en no se pueden calcular errores y
niveles de confianza, sí que se obtienen estimaciones muy aproximadas a la realidad,
sobre todo si se hace un buen diseño de la muestra.
Se basa generalmente en un buen conocimiento de las características de la población
y/o de los individuos más "representativos" para los fines de la investigación. A
menudo, se estratifica la población y después se calculan las cuotas. Por esta razón
tiene semejanzas con el muestreo aleatorio estratificado, pero no tiene selección
aleatoria de las unidades de la muestra como en un muestreo probabilístico.
En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de
elementos de la muestra (individuos) que reúnen unas determinadas condiciones. Por
ejemplo en una muestra de la población: cuota por sexo (200 mujeres y 200 hombres)
o cuota por edad (200 menos de 40 años y 200 de más de 40).
Una vez determinada la cuota se eligen los individuos que cumplan esas
características, sin realizar una selección por azar como las descritas en los
métodos probabilísticos. En la práctica consiste en facilitar al entrevistador la cuota,
es decir, la cantidad y el perfil de la persona que se desea entrevistar. De esta
manera, la selección aleatoria de unidades últimas de muestreo se sustituye por una
selección a criterio del investigador y el entrevistador, que deberá cumplir
determinados requisitos fijados en las cuotas. En muchos estudios se utilizan cuotas
de sexo y edad.
El muestreo por cuotas se puede utilizar en la última etapa de un probabilístico
polietápico.
B. Muestreo según criterio
El investigador elige la muestra según su criterio buscando las unidades más
“representativas” las de interés para el estudio.
C. Muestreo opinático o intencional
En este tipo de muestreo la selección de los elementos, no se hacen de forma
objetiva siguiendo criterios técnicos, sino según la voluntad, la intuición o la
experiencia del encuestador.
D.Muestreo casual o fortuito
Se usa en los casos en que no es posible seleccionar los elementos, y deben sacarse
conclusiones con los elementos que estén disponibles.
E. Muestreo por bola de nieve
Cada nueva unidad muestral es localizada por indicación de otra persona. Y así
sucesivamente, cada seleccionado indica otras personas que podrían formar parte de
la muestra.
3. AFIJACIÓN Y DESAGREGACIÓN DE LA MUESTRA

• AFIJACIÓN DE LA MUESTRA

La afijación de la muestra es la distribución de las unidades de muestreo entre los


distintos estratos en que se puede dividir la población objeto de estudio. Los tipos de
afijación son:

• Afijación simple: se distribuyen los elementos de la muestra asignando a cada


estrato el mismo número de elementos.
• Afijación proporcional: se distribuyen las unidades de la muestra en función del
peso relativo (%) de la población de cada estrato.
• Afijación óptima: en esta afijación se tiene en cuenta la homogeneidad o
heterogeneidad de la población y, además del peso de la población en cada
estrato (%). Si los elementos de un estrato son más homogéneos se puede tomar
una muestra más reducida.
• NIVEL DE DESAGREGACIÓN DE LA MUESTRA. DESAJUSTES Y PONDERACIONES.

En el diseño de la muestra es necesario prever si para los resultados del estudio


interesan solo datos globales, o si posteriormente será necesario desagregar la
muestra total para analizar los resultados en submuestras. A veces, se necesitan
muestras que permitan hacer estimaciones no sólo de la población total, sino sobre
distintas subdivisiones de la misma (por ejemplo: datos referidos a hombres y
mujeres por separado, o datos nacionales por Comunidad Autónoma.)

Un ejemplo:
Supongamos que queremos hacer un estudio en Cataluña con una muestra. El
tamaño de la muestra total necesario será distinto si esa muestra deberá
representar a todo el territorio, o bien si se pretende hacer un análisis desagregado
para cada una de las cuatro provincias.
El nivel de precisión será diferente para la muestra de cada provincia, en función del
tamaño de muestra que le corresponda a cada a una. Los errores de muestreo
aumentarán conforme las muestras sean menores. Si las submuestras por provincia
fueran demasiado pequeñas no se podrían hacer estimaciones con rigor.
DISTRIBUCION
% DE LA PROPORCIONAL DE
POBLACIÓN POBLACIÓN MUESTRA 1000
Barcelona 5.529.099 73,3% 733
Gerona 756.810 10,0% 100
Lérida 442.308 5,9% 59
Tarragona 811.401 10,8% 108
TOTAL 7.539.618 100% 1.000

Para solucionar este problema se puede:

a)aumentar la muestra Total para Cataluña, se modo que, al hacer una distribución
proporcional, las submuestras de las distintas provincias sean suficientes.

DISTRIBUCION
POBLACIÓN % DE LA PROPORCIONAL
CATALUÑA N POBLACIÓN MUESTRA n = 1000
Barcelona 5.529.099 73% 1460
Gerona 756.810 10% 200
Lérida 442.308 6% 120
Tarragona 811.401 11% 220
TOTAL 7.539.618 100% 2.000
b)hacer una afijación no proporcional y aumentar arbitrariamente la muestra en
aquellos estratos que interesa estudiar con más precisión. Después será
necesaria la ponderación de la muestra.
En el ejemplo del estudio en Cataluña si se toma una muestra de tamaño n=1000, si
está muestra se hiciera de forma proporcional, la distribución de los elementos de la
muestra por provincias sería:

% DE LA DISTRIBUCION PROPORCIONAL
POBLACIÓN POBLACIÓN DE MUESTRA 1000
Barcelona 5.529.099 73,3% 733
Gerona 756.810 10,0% 100
Lérida 442.308 5,9% 59
Tarragona 811.401 10,8% 108
TOTAL 7.539.618 100% 1.000

La muestra total (n=1000) tendría un error de muestreo de +/- 3,2% para un nivel de
confianza del 95.5% (K=2) y p=q=50%. Sin embargo, si se pretende analizar los datos
desagregados por provincias, la muestra de Lérida es tan sólo de 59 elementos, lo
que supone un error de +/- 13% para un nivel de confianza del 95.5% (K=2) y p=q=50%.
Este error es muy elevado y por esta razón se decide realizar una afijación de la
muestra (distribución) NO proporcional, de forma que las submuestras de cada
provincia sean mayores y tengan errores menores.
El investigador puede decidir distribuir la muestra de 1.000 por provincias, según su
interés. Por ejemplo del siguiente modo:
MUESTRA UTILIZADA
POBLACIÓN TOTAL NO PROPORCIONAL
Barcelona 5.529.099 550
Gerona 756.810 150
Lérida 442.308 150
Tarragona 811.401 150
7.539.618 1.000

En este ejemplo se han adjudicado a las provincias menores muestras de 150


elementos, cantidad más aceptable para hacer análisis de los resultados
desagregados por provincia.
La muestra total de 1000 ha quedado desproporcionada en este caso, y no representa
fielmente a la población de Cataluña, salvo que la ponderemos para reajustarla
porcentualmente a su estructura real.
Si en la distribución de una muestra, se desproporcionan las submuestras y después
se quieren tratar los datos conjuntamente hay que proceder a su ponderación para no
deformar las estimaciones.

Ponderar la muestra es devolver a cada submuestra (en el ejemplo la de cada


provincia) la proporcionalidad que tiene en la población total. Se puede ponderar por
medio de coeficientes de ponderación. Otra forma de ponderar es recurrir al sistema
de los elevadores N/n. Con esto conseguimos restituir las proporciones de la
muestra según la estructura de la población. Los programas informáticos de
tratamiento de ficheros de datos incluyen la opción ponderación de ficheros.
 ¿Cómo se calcularían los coeficientes?
Si en la población de Cataluña tomamos una muestra por provincias
desproporcionada (columna A), para ponderarla habrá que multiplicar la muestra de
cada provincia por su coeficiente de ponderación (columna D). El coeficiente se
obtiene dividendo el valor de la misma muestra proporcionada (columna C)) entre el
de la muestra que se haya tomado (columna A) en cada provincia.
Ejemplo: PONDERACION DE LA MUESTRA
A B C D E
DISTRIBUCION COEF. MUESTRA
POBLACIÓN MUESTRA DISTRIBUCIÓN % PROPORCIONAL DE PONDERACION PONDERADA
TOTAL UTILIZADA DE LA POBLACIÓN MUESTRA n=1000 C/A AxD
Barcelona 5.529.099 550 73% 733 1,333 733
Gerona 756.810 150 10% 100 0,669 100
Lérida 442.308 150 6% 59 0,391 59
Tarragona 811.401 150 11% 108 0,717 108
7.539.618 1.000 100% 1.000 1.000

También podría gustarte