Está en la página 1de 29

UNIVERSIDAD NACIONAL SAN CRISTÓBAL DE HUAMANGA

ESCUELA PROFESIONAL DE INGENIERÍA CIVIL


DEPARTAMENTO ACADÉMICO DE MATEMATICA Y FISICA
AREA ACADEMICA DE ESTADISTICA

I- PRACTICA PROGRAMADA DE ESTADISTICA Y PROBABILIDADES


DOCENTE: Ing. Guillermo Bernardino TAPIA CALDERON
DÍA Y HORA DE CLASES:
 lunes de 7 a 9 a.m.
 Miércoles de 7 a 9 a.m.
NOMBRES Y APELLIDO: Ronal ARONES HUANCAHUARI
CODIGO: 1618 D.N.I: 70 CELL: 941

AYACUCHO-PERÚ
2019
UNIVERSIDAD NACIONAL DE SAN CRISTOBAL DE HUAMANGA

DEDICATORIA

Dedico este trabajo a todos productores matemáticos del mundo, por el


esfuerzo y dedicación que le dan a su profesión y conocimiento a la sociedad
y sobre todo a los estudiantes de ciencias. Sin él aporte ellos el avance de
las matemáticas quedaría rezagado, más difícil el aprendizaje de los futuros
profesionales y también los avances tecnológicos de nuestra actualidad.

INGENIERIA CIVIL 2
UNIVERSIDAD NACIONAL DE SAN CRISTOBAL DE HUAMANGA

PRESENTACION

La presente monografía se elaboró con el objetivo de complementar nuestros conocimientos en tema


de estadística como futuros ingenieros civiles la aplicación del tema siempre estará presente en la
aplicación de costos y presupuestos y probabilidades para la buena ejecución de obras que ejecutemos
para el bien de la sociedad, y evitar riesgos y desastres en el proceso constructivo de la obra.
En énfasis hoy en día la corrupción es un mal que día a día arruina a cada generación ello conllevo a
muchos sucesos en nuestro país y tales casos son para muchos repudiables por el retraso que genera
en nuestro país. También conlleva a la mala ejecución de obras con presupuestos miseros y robos
enormes que talvez se invertiría en la educación ya que es la ultima coleta de la inversión de parte del
estado.
La estadística ayudaría a un mejor control del sistema en el ámbito económico.

Está dirigido a todos los estudiantes de ingeniería agrícola, minas, arquitectos y en especial a los
ingenieros civiles que siempre aplicaran cálculos para cada construcción de una obra donde cada
calculo es recesivo para la buena formación de la obra.

El propósito de la presente monografía es contribuir a la comunidad de ingenieros para prevenir y


crear obras duraderas y sin riesgos para la sociedad.

INGENIERIA CIVIL 3
UNIVERSIDAD NACIONAL DE SAN CRISTOBAL DE HUAMANGA

RESUMEN

En la presente monografía se explica sobre la Muestreo probabilístico y Muestreo no probabilístico.


Una de las ideas básicas en Estadística es el concepto de tipos de Muestreo. Para introducir dicho
concepto se recurre generalmente en: el estudio de la población a través de las distintas maneras de
estudiar una determinada población. El problema para la obtención de una muestra representativa es
necesario aplicar los distintos tipos de muestreo ya que una de ellas será la apropiada para el estudio
de dicha población de esa manera se tendrá un margen de error mínimo y también se ahorra tiempo y
dinero.

En la presente investigación se utilizaron libros de investigación recomendados por el docente y


también la consulta de alguna paginas web para un mejor entendimiento y autores, atreves de la
recolección de información por medios digitales. Opinión de expertos profesionales en el tema.

El análisis e interpretación de datos se realizaron con previos conocimientos ya estudiados con la


responsable del curso de Estadística también a través de fuentes audio visuales encontrado en las
redes explicados por profesionales en el tema de estadística.

El resultado de investigación es lo siguiente explicado de forma sencilla La derivada se puede usar


para valores increíblemente pequeños (infinitesimales), mientras que la diferencial solo se aplica
como una primera.
En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los
elementos de una población), se selecciona una muestra, entendiendo por tal una parte
representativa de la población.
El muestreo es por lo tanto una herramienta de la investigación científica, cuya función básica
es determinar que parte de una población debe examinarse, con la finalidad de hacer
inferencias sobre dicha población.
La muestra debe lograr una representación adecuada de la población, en la que se reproduzca
de la mejor manera los rasgos esenciales de dicha población que son importantes para la
investigación. Para que una muestra sea representativa, y por lo tanto útil, debe de reflejar
las similitudes y diferencias encontradas en la población, es decir ejemplificar las
características de ésta.
Los errores más comunes que se pueden cometer son:
1.- Hacer conclusiones muy generales a partir de la observación de sólo una parte de la
Población, se denomina error de muestreo.
2.- Hacer conclusiones hacia una Población mucho más grandes de la que originalmente se tomó
la muestra. Error de Inferencia.
En la estadística se usa la palabra población para referirse no sólo a personas si no a todos los
elementos que han sido escogidos para su estudio y el término muestra se usa para describir una
porción escogida de la población.

INGENIERIA CIVIL 4
UNIVERSIDAD NACIONAL DE SAN CRISTOBAL DE HUAMANGA

Contenido
INDICE Error! Bookmark not defined.
INTRODUCCION 6
I. TIPOS DE MUESTREO 6
1. MUESTREO PROBABILISTICO 7
a) Muestreo aleatorio simple 7
b) Muestreo aleatorio estratificados 8
c) Muestreo aleatorio conglomerado 12
d) Muestreo aleatorio sistemático 14
e) Muestreo estratificado bi-etapico 17
f) Muestreo estratificado tri-etapico 17
g) Muestreo estratificado poli-etapico 18
2. MUESTREO NO PROBABILISTICO 19
a) Muestreo por conveniencia o de voluntarios 19
b) Muestreo casual 21
c) Muestreo de cuotas 21
d) Muestreo de opinión 25
e) Muestro de expertos 26
f) Muestreo de bola de nieve 26
g) Muestreo de poblaciones móviles 28
II. CONCLUSION 28
III. REFERENCIAS BIBLIOGRAFICAS 29

INGENIERIA CIVIL 5
UNIVERSIDAD NACIONAL DE SAN CRISTOBAL DE HUAMANGA

INTRODUCCION

El análisis de un fenómeno, desde la perspectiva estadística, requiere del acopio de información o


datos científicos de la población que se estudia. Sin embargo, recaudar los datos de una población no
siempre es fácil, debido al elevado costo de un censo, a la dificultad que implica llegar a lugares
determinados o al simple hecho de que la población en cuestión no tenga un tamaño finito. La
alternativa a esta problemática consiste en utilizar una muestra, es decir, un subconjunto de la
población, para obtener resultados que nos ayuden a inferir, a partir de los estadísticos muestrales, los
parámetros de la población. El reto de este ejercicio está en obtener una muestra representativa de la
población con un tamaño suficiente, de manera que al hacer la inferencia de los parámetros de la
población obtengamos una estimación no sesgada y precisa. Dicha muestra parte de un conjunto de
supuestos y condiciones iniciales que determinan el problema de estudio.
La representatividad de una muestra, permite extrapolar y por ende generalizar los resultados
observados en ésta, a la población accesible (conjunto de sujetos que pertenecen a la población
blanco, que están disponibles para la investigación); y a partir de ésta, a la población blanco. Por
ende, una muestra será representativa o no; sólo si fue seleccionada al azar, es decir, que todos los
sujetos de la población blanco y accesible, tuvieron la misma posibilidad de ser seleccionados en esta
muestra y por ende ser incluidos en el estudio (técnica de muestreo probabilístico); y por otro lado,
que el número de sujetos seleccionados representen numéricamente a la población que le dio origen
respecto de la distribución de la variable en estudio en la población, es decir, la estimación o cálculo
del tamaño de la muestra. Es así como el análisis de una muestra permite realizar inferencias,
extrapolar o generalizar conclusiones a la población blanco con un alto grado de certeza (Dieterich,
1996); de tal modo que una muestra se considera representativa de la población blanco, cuando la
distribución y valor de las diversas variables se pueden reproducir con márgenes de error calculables.

I. TIPOS DE MUESTREO

INGENIERIA CIVIL 6
UNIVERSIDAD NACIONAL DE SAN CRISTOBAL DE HUAMANGA

1. MUESTREO PROBABILISTICO
a) Muestreo aleatorio simple
El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los
elementos que forman el universo y que por lo tanto están descritos en el marco muestral,
tienen idéntica probabilidad de ser seleccionados para la muestra. Sería algo así como
hacer un sorteo justo entre los individuos del universo: asignamos a cada persona un
boleto con un número correlativo, introducimos los números en una urna y empezamos
a extraer al azar boletos. Todos los individuos que tengan un número extraído de la urna
formarían la muestra. Obviamente, en la práctica, estos métodos pueden automatizarse
mediante el uso de ordenadores.

Dependiendo de si los individuos del


universo pueden ser seleccionados más
de una vez en la muestra, hablaremos
de M.A.S. con reposición o sin
reposición.
Si usamos reposición, el hecho de que
seleccione un individuo al azar para la
muestra no impediría que este mismo
individuo pudiese volver a ser
seleccionado en una siguiente
selección. Sería equivalente a decir que
cada vez que se extrae un número al azar de la urna, volvemos a colocar el número antes
de la siguiente extracción. Si por el contrario no usamos reposición, un individuo
seleccionado para la muestra una vez ya no entraría nuevamente en el sorteo.
La pregunta obvia es, ¿qué es mejor, usar reposición o no úsala? Es un simple problema
matemático. César Pérez López, en su libro "Muestreo Estadístico" (Pearson, 2005)
desarrolla de forma muy clara una comparación entre ambas técnicas. Tanto si lo
miramos desde el punto de vista de qué técnica genera estimaciones más precisas como
desde el punto de vista de qué técnica permite tener la misma precisión con menor tamaño
de muestra, se puede concluir que el muestreo aleatorio simple sin reposición siempre es
más eficiente.
Para poder observar este resultado, partimos de la siguiente expresión para el tamaño de
muestra en un M.A.S. sin reposición. La fórmula relaciona el tamaño de muestra
necesario cuando el universo es finito con el tamaño necesario cuando el universo es
infinito:

Donde n0 es el tamaño de muestra necesario para un universo infinito y N es el tamaño del universo
finito. Es posible demostrar que el tamaño de muestra cuando usamos reemplazo (nr) es siempre igual
al tamaño necesario para universo infinito (nr=n0). Si eso sucede, podemos afirmar que

INGENIERIA CIVIL 7
UNIVERSIDAD NACIONAL DE SAN CRISTOBAL DE HUAMANGA

Por lo tanto, el tamaño de muestra cuando no usamos reposición siempre es menor al necesario
si usamos reposición. Este resultado coincide con la intuición: si estamos empleando reposición y por
azar incluimos un individuo más de una vez en la misma muestra, el efecto es similar a reducir el
tamaño de la muestra ya que observo menor diversidad de individuos. Del mismo modo, si el universo
es infinito, ambos métodos coinciden, dado que la probabilidad de seleccionar al mismo individuo
dos veces en la misma muestra tiende a ser infinitamente pequeña.

 Beneficios del muestreo aleatorio simple


El desarrollo de la informática ha permitido que diseñar una muestra aleatoria simple sea
extremadamente rápido y fiable. La generación de números aleatorios mediante software
(estrictamente son números pseudo-aleatorios) es cada vez más fiable.

De esta forma, al usar M.A.S. nos aseguramos la obtención de muestras representativas, de manera
que la única fuente de error que va a afectar a mis resultados va a ser el azar. Y lo que es más
importante, este error debido al azar puede calcularse de forma precisa (o al menos acotarse).

 Inconvenientes del muestreo aleatorio simple


El único inconveniente del M.A.S. es la dificultad de llevarlo a la práctica en investigaciones reales.
Recordemos: al ser una técnica probabilística, es necesario un marco muestral con todos los
individuos y que todos ellos sean seleccionables para la muestra. Un requisito que difícilmente puede
cumplirse en la mayoría de estudios de mercado y opinión reales, lo que nos obligará a emplear otras
técnicas.

b) Muestreo aleatorio estratificados

Esta técnica, perteneciente a la familia de muestreos probabilísticos, consiste en dividir toda


la población objeto de estudio en diferentes subgrupos o estratos disjuntos, de manera que un
individuo sólo puede pertenecer a un estrato. Una vez definidos los estratos, para crear la
muestra se seleccionan individuos empleando una técnica de muestreo cualquiera a cada uno
de los estratos por separado. Si por ejemplo empleamos muestreo aleatorio simple en cada
estrato, hablaremos de muestreo aleatorio estratificado (M.A.E. en adelante). Del mismo
modo, podríamos usar otras técnicas de muestreo en cada estrato (muestreo sistemático,
aleatorio con reposición, etc.).
Los estratos suelen ser grupos homogéneos de individuos, que a su vez son heterogéneos
entre diferentes grupos. Por ejemplo, si en un estudio esperamos encontrar un
comportamiento muy diferente entre hombres y mujeres, puede ser conveniente definir dos
estratos, uno por cada sexo. Si la selección de estos estratos es correcta:
1. Los hombres deberían comportarse de forma parecida entre ellos.
2. Las mujeres deberían comportarse de forma muy similar entre ellas.
3. Hombres y mujeres deberían mostrar comportamientos dispares entre sí.

INGENIERIA CIVIL 8
UNIVERSIDAD NACIONAL DE SAN CRISTOBAL DE HUAMANGA

Si la anterior condición se cumple (estratos


homogéneos internamente, heterogéneos
entre sí) el uso del muestreo aleatorio
estratificado reduce el error muestral,
mejorando la precisión de nuestros
resultados al realizar un estudio sobre la
muestra.

Es relativamente habitual definir estratos de


acuerdo a algunas variables características
de la población como son la edad, sexo,
clase social o región geográfica. Estas
variables permiten dividir fácilmente la muestra en grupos mutuamente excluyentes y
con bastante frecuencia, permiten discriminar comportamientos diferentes dentro de la
población.

Tipos de muestreo estratificado


Dependiendo del tamaño que asignamos a los estratos, hablaremos de diferentes tipos de
muestreo estratificado. También se acostumbra a hablar de diferentes formas de "afijación" de
la muestra en estratos.

1. Muestreo estratificado proporcionado


Cuando seleccionamos una característica de los individuos para definir los estratos, suele
ocurrir que el tamaño de las subpoblaciones resultantes en el universo es diferente. Por
ejemplo, si queremos estudiar el tanto por ciento de la población que fuma en Perú y pensamos
que la edad puede ser un buen criterio para estratificar (es decir, pensamos que existen
diferencias importantes en el hábito de fumar dependiendo de la edad), podemos definir 3
estratos: menores de 20 años, de 20 a 44 años y mayores de 44 años. Es de esperar que al dividir
toda la población peruana en estos 3 estratos no resulten grupos de igual tamaño.
Efectivamente, si miramos datos oficiales, obtenemos: * Estrato
1 - Población Peruana menor de 19 años: 42,4 millones (41,0%)

* Estrato 2 - Población Peruana de 20 a 44 años: 37,6 millones (36,3%)

* Estrato 3 - Población Peruana mayor de 44 años: 23,5 millones (22,7%)

Si usamos muestreo estratificado proporcionado, la muestra deberá tener estratos que guarden las
mismas proporciones observadas en la población. Si en este ejemplo queremos crear una muestra de
1.000 individuos, los estratos tendrán que tener un tamaño como sigue:

Estrato Población Proporción Muestra

1 42,2 M 41,0 % 410

2 37,6 M 36,3 % 363

3 23,5 M 22,7 % 227

INGENIERIA CIVIL 9
UNIVERSIDAD NACIONAL DE SAN CRISTOBAL DE HUAMANGA

2. Muestreo estratificado uniforme


Hablaremos de una afijación uniforme cuando asignamos el mismo tamaño de muestra a todos los
estratos definidos, sin importar el peso que tienen esos estratos en la población. Siguiendo con el
ejemplo anterior, un muestreo estratificado uniforme definiría la siguiente muestra por estrato:

Estrato Población Proporción Muestra

1 42,2 M 41,0 % 334

2 37,6 M 36,3 % 333

3 23,5 M 22,7 % 333

Esta técnica favorece los estratos que tienen menos peso en la población, equiparándolos en
importancia a los estratos más relevantes. Globalmente, reduce la eficiencia de nuestra muestra
(menor precisión en los resultados), pero como contrapartida permite estudiar características
particulares de cada estrato con mayor precisión. En nuestro ejemplo, si queremos emitir alguna
afirmación específica sobre la población del estrato 3 (mayores de 44 años), podremos hacerlo con
menor nivel de error muestral si empleamos una muestra de 333 unidades que si lo hacemos con una
muestra de 227 (como ocurría en el muestreo estratificado proporcional).

3. Muestreo estratificado óptimo (respecto a la desviación estándar)


En este caso, el tamaño de los estratos en la muestra no guardará proporcionalidad con la población.
Por el contrario, se define el tamaño de los estratos proporcionalmente a la desviación estándar de las
variables objeto de estudio. Es decir, se toman estratos de mayor tamaño en los estratos con mayor
variabilidad interna para representar mejor en el total de la muestra los grupos poblacionales más
difíciles de estudiar.

Eficiencia de los diferentes muestreos estratificados


Las preguntas inevitables son: ¿cuándo conviene emplear la estratificación?, ¿qué tipo de
estratificación es más conveniente?

 El muestreo estratificado proporcional produce siempre menor o igual error muestral que
el muestreo aleatorio simple, es decir, es más preciso. La igualdad se produce cuando las medias
o las proporciones que estamos analizando son iguales en todos los estratos. Por lo tanto, la
estratificación produce más beneficio cuanto más diferentes sean los estratos entre sí.

 El muestreo estratificado óptimo es siempre igual o más preciso que el muestreo


estratificado proporcional. Ambos métodos son igual de precisos cuando las desviaciones típicas
dentro de cada estrato son iguales, en cuyo caso ambos métodos son totalmente equivalentes. Por
lo tanto, la estratificación óptima produce más beneficio cuantas más diferencias existan entre las
desviaciones dentro de cada grupo, situación en la que podremos reducir el tamaño muestral de
los grupos más homogéneos en beneficio de los más heterogéneos. Como contrapartida, es un
método más complejo y que requiere tener mucha información a priori de la muestra que
estudiamos, algo que normalmente no tenemos.

INGENIERIA CIVIL 10
UNIVERSIDAD NACIONAL DE SAN CRISTOBAL DE HUAMANGA

Tamaños de muestra requeridos por cada técnica


Vemos que la estratificación puede proporcionar beneficios. Si estas técnicas pueden emplearse
para estimar de forma más precisa ya sean medias (p.e. media de cigarrillos consumidos por los
fumadores de México) o proporciones (p.e. proporción de la población de México que fuma),
también pueden permitirnos reducir el tamaño de muestra requerido para lograr una estimación con
un nivel de error determinado.

La siguiente tabla resume el tamaño de muestra requerido al emplear cada técnica, en función del
error máximo que estamos dispuestos a aceptar y de las características del propio universo, que
consideraremos de tamaño infinito (si fuese finito, debe aplicarse un factor de corrección).

Para interpretar el cuadro anterior es necesario tener en cuenta lo siguiente:

 Z = Es la desviación del valor medio que aceptamos para lograr el nivel de confianza deseado. En
función del nivel de confianza que busquemos, usaremos un valor determinado que viene dado
por la forma que tiene la distribución de Gauss. Los valores más frecuentes son:
Nivel de confianza 90% -> Z=1,645

Nivel de confianza 95% -> Z=1,96

Nivel de confianza 99% -> Z=2,575

 L es el número de estratos en que particionamos la muestra y h es un índice que se refiere a un


estrato concreto. Por lo tanto, h puede variar entre 1 y L estratos.
 p es la proporción que buscamos en el total de la población (p.e. % de fumadores). Por lo tanto, (1-
p) es la proporción de la muestra complementaria, la que no cumple el criterio buscado (no
fumadores). Del mismo modo, ph es dicha proporción dentro de cada uno de los estratos.
 σ2 es la varianza que el dato buscado (en el caso de estimar medias) tiene en el total de la
población. Asimismo, σh2 es la varianza dentro de cada estrato.
 e es el margen de error aceptado.
 Wh es el peso que el estrato tiene en la muestra (tamaño del estrato respecto al total de la muestra).
Si hablamos de estratificación proporcional, cada Wh es igual a la proporción que ese estrato
representa en la población. Si hablamos de estratificación óptima, cada Wh se calcula en función
de la dispersión dentro de cada estrato.

INGENIERIA CIVIL 11
UNIVERSIDAD NACIONAL DE SAN CRISTOBAL DE HUAMANGA

Es posible demostrar a partir de las fórmulas anteriores que los diferentes métodos de
estratificación sólo reducen el tamaño de la muestra si los valores de p y σ varía entre estratos.
De lo contrario, todas las expresiones son equivalentes. Veamos un ejemplo: si tomamos la
expresión de tamaño de muestra requerido para estimar una media mediante un muestreo
estratificado óptimo (ignorando el parámetro Z en este caso)

y consideramos que todas las varianzas de los estratos son iguales (σh=σ) y que el tamaño de los
estratos es idéntico (Wh=1/L), el resultado que obtenemos es.

c) Muestreo aleatorio conglomerado

El muestreo por conglomerados es una técnica que aprovecha la existencia de grupos o


conglomerados en la población que representan correctamente el total de la población en
relación a la característica que queremos medir. Dicho de otro modo, estos grupos contienen
toda la variabilidad de la población. Si esto sucede, podemos seleccionar únicamente algunos
de estos conglomerados para realizar el estudio.
Podemos ver esta técnica desde otro punto de vista. Mientras que en todas las técnicas vistas
hasta ahora las unidades de muestreo coinciden con las unidades a estudiar (individuos), en
el muestreo por conglomerados las unidades de muestreo son grupos de unidades de estudio,
algo que puede resultar muy beneficioso en relación al coste del propio muestreo. A cambio,
es habitual obtener una menor precisión al usar esta técnica, causada por falta de
heterogeneidad dentro de los conglomerados.

El proceso de muestreo
El primer paso para aplicar esta técnica es definir los conglomerados. Se trata de identificar
una característica que permita dividir la población en grupos disjuntos (sin solapamiento) y
de forma exhaustiva (todos los individuos deben estar en un grupo), de tal manera que los

INGENIERIA CIVIL 12
UNIVERSIDAD NACIONAL DE SAN CRISTOBAL DE HUAMANGA

grupos no difieran entre sí en relación a aquello que queremos medir. Una vez hemos definido
estos conglomerados, seleccionaremos al azar algunos de ellos para estudiarlos.
Un criterio habitual para definir conglomerados es el geográfico. Por ejemplo, si queremos
estudiar qué proporción de la población argentina fuma, podemos dividir el total de la
población en provincias y seleccionar algunas de ellas para ser estudiadas. Si no tenemos
razones para pensar que el porcentaje de fumadores va a cambiar de una provincia a otra, esta
solución nos permitirá concentrar el esfuerzo de muestreo en un único entorno geográfico. Si
el estudio se va a hacer mediante entrevistas personales, esto representa un importante ahorro
de costes de desplazamientos.

Una vez definimos los conglomerados, el siguiente paso es seleccionar los conglomerados a
estudiar, ya sea mediante un muestreo aleatorio simple o sistemático.

Por último, una vez seleccionados los conglomerados a estudiar, podemos investigar a todos
los sujetos que forman parte de los mismos, o bien aplicar un nuevo proceso de muestreo
dentro del conglomerado, por ejemplo obteniendo una muestra mediante muestreo aleatorio
simple o sistemático. Si optamos por esta posibilidad, estaremos hablando de un muestreo
en dos etapas o bietápico: la primera etapa será la selección del conglomerado; la segunda,
la de individuos dentro del conglomerado. Si por el contrario estudiamos todos los individuos
del conglomerado, hablaremos de muestreo por conglomerados unietápico.
Muestreo estratificado y muestreo por conglomerados

La idea del muestreo por conglomerados recuerda a la del muestreo estratificado. En ambos
casos dividimos la población en grupos. Sin embargo, los principios detrás de ambas técnicas
son en cierto modo opuestos.
El muestreo estratificado es especialmente adecuado cuando los grupos (estratos) son muy
homogéneos internamente y muy diferentes entre sí. En ese caso, conviene asegurar que
tenemos representantes en nuestra muestra que provienen de todos los estratos. Por el
contrario, el muestreo por conglomerados es muy adecuado cuando los grupos en que
dividimos la población son muy similares entre sí, por lo que no hay gran diferencia entre
estudiar individuos de un grupo o de otro.

Es por ello que pese a que ambas técnicas dividen la población en estratos o conglomerados,
el proceso de selección de individuos es radicalmente diferente.

Ventajas y desventajas del muestreo por conglomerado


 La principal ventaja de esta técnica es de tipo operativa: seleccionar un conglomerado a
estudiar suele ser más fácil y económico que hacer una muestra aleatoria o sistemática.
Hemos visto por ejemplo que usar conglomerados geográficos puede representar un
importante ahorro en desplazamientos de personas.
Curiosamente, es habitual hacer estudios a través de Internet en los que se sigue pensando en
términos de estudiar sólo unas zonas geográficas, cuando en realidad a través de Internet no
obtenemos ningún beneficio operativo; al contrario, incurrimos en mayor riesgo de tener
menor precisión por diferencias entre las regiones estudiadas y el resto de la población. Esta
práctica es una herencia injustificada de técnicas que eran buenas en entrevistas personales,
pero que no lo son al usar otras metodologías.

 ✘ Como principal inconveniente, al usar muestreo por conglomerados corremos un riesgo


importante: que los conglomerados no sean realmente homogéneos entre ellos. En el ejemplo

INGENIERIA CIVIL 13
UNIVERSIDAD NACIONAL DE SAN CRISTOBAL DE HUAMANGA

anterior sobre fumadores en Argentina, podría suceder que en una de las provincias exista
más propensión a fumar, por ser una región más urbana, por razones culturales, etc.
Eficiencia del muestreo por conglomerados
¿Cómo podemos comparar esta técnica con otras vistas con anterioridad? Lo bien o mal que
va a funcionar esta técnica va a depender, de forma similar a como ocurría en el muestreo
estratificado, de la relación entre la varianza dentro y fuera de los conglomerados.
Esta relación se suele expresar con un coeficiente de correlación intraconglomerados
(δ), que se define como el coeficiente de correlación lineal entre todos los pares de valores
de la variable en estudio medidos sobre las unidades de los conglomerados y extendido a
todos los conglomerados. En definitiva, este coeficiente es una medida de la homogeneidad
en el interior de los conglomerados.
Cuanto menor sea el coeficiente de homogeneidad intraconglomerados δ, mayor eficiencia
arrojará el muestreo por conglomerados. Recordemos que lo ideal es que los conglomerados
sean tan heterogéneos como el total de la muestra, con el fin de que la selección de un
conglomerado concreto nos de la misma información que la selección de individuos al azar
del total de la población.
Si comparamos el muestreo aleatorio simple con el muestreo por conglomerados, es posible
demostrar que si δ=0 ambos métodos son equivalentes. Esta condición implica que los
conglomerados son exactamente tan heterogéneos como el total de la población. El peor caso
sería δ=+1 , mientras que el más favorable sería el de δ=-1/(M-1), donde M es el tamaño del
conglomerado. Sin embargo, normalmente δ va a ser siempre mayor que 0, ya que lo normal
es que las unidades de un conglomerado tengan cierto parecido entre sí.
Otra forma de ver el impacto de este problema es calcular el tamaño de muestra necesario al
emplear muestreo por conglomerados para lograr la misma precisión de un muestreo aleatorio
simple. Esta expresión es la que sigue:

nc = na (1 + (M-1) δ) donde nc es el tamaño de muestra en muestreo por conglomerados


y na es el tamaño de muestra que necesitaríamos en muestreo aleatorio simple. Por lo tanto,
el factor (1+(M-1) δ es la variación del tamaño de muestra que necesitamos debido al uso
de conglomerados. Normalmente será un incremento. Este factor se conoce como efecto de
diseño.

d) Muestreo aleatorio sistemático


El muestreo sistemático era muy popular en el pasado, antes de que la incorporación de la
informática hiciese trivial un problema que siempre había dado muchos quebraderos de
cabeza a los investigadores:
elegir individuos de forma
aleatoria dentro de una muestra.
En la medida en que los
ordenadores nos han facilitado
la tarea de generar números
aleatorios, este problema ha
desaparecido.

También se sigue
utilizando para seleccionar
individuos a lo largo del
tiempo. Por ejemplo, para estudiar la satisfacción de un servicio, podemos elegir

INGENIERIA CIVIL 14
UNIVERSIDAD NACIONAL DE SAN CRISTOBAL DE HUAMANGA

sistemáticamente encuestar a 1 de cada n clientes que nos visitan. En estas circunstancias, en


las que puede existir diferente varianza entre individuos en diferentes periodos de tiempo, el
muestreo sistemático puede ser incluso más preciso que el muestreo aleatorio puro.

¿En qué consiste el muestreo sistemático?

Es una técnica dentro de la categoría de muestreos probabilísticos - y que por lo tanto


requiere tener un control preciso del marco muestral de individuos seleccionables junto con
la probabilidad de que sean seleccionados - consistente en escoger un individuo inicial de
forma aleatoria entre la población y, a continuación, seleccionar para la muestra a cada
enésimo individuo disponible en el marco muestral.
El muestreo sistemático es un proceso muy simple y que sólo requiere la elección de un
individuo al azar. El resto del proceso es trivial y rápido. Los resultados que obtenemos son
representativos de la población, de forma similar al muestreo aleatorio simple, siempre y
cuando no haya algún factor intrínseco en la forma en que los individuos están listados que
haga que se reproduzcan ciertas características poblacionales cada cierto número de
individuos. Este suceso es realmente poco frecuente.

El proceso
De forma concreta, el proceso que seguiríamos en un muestreo sistemático sería el siguiente:

1. Elaboramos una lista ordenada de los N individuos de la población, lo que sería el marco
muestral.
2. Dividimos el marco muestral en n fragmentos, donde n es el tamaño de muestra que
deseamos. El tamaño de estos fragmentos será: K=N/n, donde K recibe el nombre de
intervalo o coeficiente de elevación.
3. Número de inicio: obtenemos un número aleatorio entero A, menor o igual al intervalo.
Este número corresponderá al primer sujeto que seleccionaremos para la muestra dentro del
primer fragmento en que hemos dividido la población.
4. Selección de los n-1 individuos restantes: Seleccionamos los siguientes individuos a
partir del individuo seleccionado aleatoriamente, mediante una sucesión aritmética,
seleccionando a los individuos del resto de fragmentos en que hemos dividido la muestra que
ocupan la misma posición que el sujeto inicial. Esto equivale a decir que seleccionaremos los
individuos:
A, A + K, A + 2K, A + 3K, ...., A + (n-1)K

Ejemplo
Supongamos que tenemos un marco muestral de 5.000 individuos y deseamos obtener una
muestra de 100 de ellos. Dividimos en primer lugar el marco muestral en 100 fragmentos de
50 individuos. A continuación seleccionamos un número aleatorio entre 1 y 50, para extraer
el primer individuo al azar del primer fragmento: por ejemplo el 24. A partir de este individuo,
queda definida la muestra extrayendo los individuos de la lista con intervalos de 50 unidades,
tal y como sigue:

24, 74, 124, 174, ..., 4.974

INGENIERIA CIVIL 15
UNIVERSIDAD NACIONAL DE SAN CRISTOBAL DE HUAMANGA

Propiedades del muestreo sistemático


 Ventajas
 Obtiene buenas propiedades de representatividad, similares a la de un muestreo aleatorio
simple o incluso superiores, pero de forma más rápida y simple, al evitar la necesidad de
generar tantos números aleatorios como individuos en la muestra.

 Respecto al muestreo aleatorio, el muestreo sistemático puede garantizarnos una selección


perfectamente equitativa de la población. Esto puede ser de utilidad si se distinguen
grupos dentro de universo, lo que nos podría evitar la necesidad de usar estratos. Si existe
diferente varianza entre los individuos de los fragmentos, este muestreo puede ser mejor
que el aleatorio. Lo veremos luego.

 Desventajas
Sólo existe la ya mencionada posibilidad de que el orden en que se han listado los candidatos
a la muestra tenga algún tipo de periodicidad oculta que coincida con el intervalo escogido
para generar la muestra sistemática. En este caso, podríamos generar una muestra sesgada.

Eficiencia del muestreo sistemático


El muestreo sistemático se ideó para mejorar las propiedades del muestreo aleatorio simple,
pero el grado de mejora es variable dependiendo de las propiedades del universo estudiado.
Para entender las propiedades de este muestreo, hay que tener en cuenta una cosa: si fijamos
el intervalo o coeficiente de elevación según el tamaño de la muestra que necesitamos, sólo
hay un elemento aleatorio dentro del proceso de muestreo: la unidad inicial que
seleccionamos del primer bloque de individuos. El resto queda fijado de antemano. Esto
equivale a decir que sólo tenemos k posibles muestras diferentes a obtener y que el muestreo
es simplemente escoger una de las k muestras disponibles.
Es posible demostrar que cuanto más supera la varianza dentro de las k posibles muestras que
podemos generar a la varianza poblacional, más precisión ganamos usando el muestreo
sistemático respecto al aleatorio simple. Lo anterior puede interpretarse diciendo que el
muestreo sistemático es más preciso que el aleatorio simple cuando la variabilidad dentro de
las posibles muestras es superior a la variabilidad dentro de las unidades de la población. La
precisión del muestreo sistemático coincide con la del aleatorio simple cuando ambas
variabilidades coinciden, y esto se da cuando la disposición de los elementos en la población
es totalmente aleatoria.

INGENIERIA CIVIL 16
UNIVERSIDAD NACIONAL DE SAN CRISTOBAL DE HUAMANGA

e) Muestreo estratificado bi-etapico

En este apartado se caracteriza el modelo de muestreo bi-etápico estratificado (Cochran,


página 386) para la estimación de parámetros asociados al estudio de variables cualitativas.
Una variable cualitativa es aquella que por su naturaleza al ser observada o medida no
produce como resultado un número siendo este simplemente un nombre; así por ejemplo la
condición de si trabaja o no para un encuestado puede representarse respectivamente por:
1=Si trabaja y 0=No trabaja; o por cualquier par de números que el investigador determine.
Al estudiar variables cualitativas el resultado de las mismas cuando se realiza una
investigación se representa por medio de una proporción o porcentaje como, por ejemplo:
“Porcentaje de jefes de hogar que trabajan”. El modelo bi-etápico hace referencia a que las
unidades objeto de estudio (población investigada) se encuentran agrupadas o sea formado
conjuntos de diferente cantidad de ellas (Ospina, pagina 191) como es el caso de los jefes de
hogar de una ciudad como Cali, para los cuales; cada uno de ellos pertenece a una vivienda,
la cual a su vez pertenece a un lado de manzana que en este caso llamaremos conglomerado.
Por otro lado, es sabido que el comportamiento de los consumidores depende del estrato
socioeconómico al cual pertenecen y en este sentido considerar el lado de manzana es de
suma utilidad ya que en las principales ciudades La Oficina de Planeación Municipal tiene
caracterizados todos los lados de manzana que componen la ciudad, estableciendo el estrato
socioeconómico al cual pertenece cada uno de ellos.
El modelo propuesto recoge entonces de un lado, la forma de presentación de las unidades
de estudio (grupos) y de otro la condición de comportamiento frente al consumo de un bien
en el sentido de que dicho comportamiento es más parecido entre los hogares que pertenecen
al mismo estrato socioeconómico y muy diferente entre hogares de diferente estrato. La
condición de bi-etápico hace referencia a que una vez seleccionado en forma aleatoria un
lado de manzana se procede a seleccionar en forma aleatoria una muestra de viviendas de
dicho lado; este procedimiento debe realizarse en la muestra de lados de manzana de cada
estrato socioeconómico.

f) Muestreo estratificado tri-etapico

Es un tipo de muestreo que se lleva acabo en tres etapas o se sortea en tres instancias.
Ejemplo: para la encuesta de una persona de una determinada provincia de huamanga se
sigue las siguentes etapas.
1. Sorteo de manzana de forma sistemática.
2. Se sortea sistemáticamente las viviendas dentro de la manzana sorteada
anteriormente.
3. Se sortea las personas habitantes dentro de la vivienda sorteada luego se encuesta a
la persona elegida según el sorteo sistemático que se realizó.

INGENIERIA CIVIL 17
UNIVERSIDAD NACIONAL DE SAN CRISTOBAL DE HUAMANGA

g) Muestreo estratificado poli-etapico

En el muestreo polietápico las unidades que finalmente componen la muestra se determinan


en etapas sucesivas. Se trata de un caso particular del muestreo por conglomerados, en el que
la unidad final de muestreo no son los conglomerados sino sub-divisones de éstos. Por tanto,
será interesante aplicarlo cuando los conglomerados contengan un elevado número de
individuos y resulte aconsejable hacer una selección entre ellos.
Si únicamente desarrolláramos dos etapas, el procedimiento consistiría en la selección de
conglomerados, en la primera etapa, y la selección de individuos en la segunda.
No obstante, el muestreo polietápico puede extenderse a más de dos etapas dando lugar a una
selección sucesiva de unidades de primera etapa son divisibles en unidades de segunda etapa,
éstas a su vez en unidades de tercera etapa y así hasta alcanzar las unidades que finamente
constituirán la muestra. Estas unidades finales no necesariamente han de ser los individuos.
En cada etapa, la selección de las unidades podrá hacerse siguiendo procedimientos de
muestreo aleatorio simple, sistemático o por estratos. Un ejemplo de muestreo polietápico
sería el que nos condujera a seleccionar una muestra de alumnos de Educación Infantil /
Preescolar de la ciudad de Sevilla de acuerdo con el siguiente proceso:

a. seleccionamos al azar 5 distritos municipales de Sevilla;


b. en cada distrito, seleccionamos 3 centros educativos;
c. en cada centro educativo elegiremos aleatoriamente uno de los grupos de
Educación Infantil/Preescolar,
d. finalmente, en cada grupo seleccionaremos 15 sujetos al azar, con lo que
habremos seleccionado una muestra total de 225 alumnos.

INGENIERIA CIVIL 18
UNIVERSIDAD NACIONAL DE SAN CRISTOBAL DE HUAMANGA

2. MUESTREO NO PROBABILISTICO
a) Muestreo por conveniencia o de voluntarios

Recordemos:
Hablamos de muestreo no probabilístico cuando no tenemos acceso a una lista completa de
los individuos que forman la población (marco muestral) y, por lo tanto, no conocemos la
probabilidad de que cada individuo sea seleccionado para la muestra.

La principal consecuencia de esta falta de información es que no podremos generalizar


resultados con precisión estadística.

El muestreo por conveniencia

Es una técnica comúnmente usada. Consiste en seleccionar una muestra de la población por
el hecho de que sea accesible. Es decir, los individuos empleados en la investigación se
seleccionan porque están fácilmente disponibles, no porque hayan sido seleccionados
mediante un criterio estadístico. Esta conveniencia, que se suele traducir en una gran facilidad
operativa y en bajos costes de muestreo, tiene como consecuencia la imposibilidad de hacer
afirmaciones generales con rigor estadístico sobre la población.
Por ejemplo, supongamos que queremos conocer la opinión de los estudiantes universitarios
chilenos acerca de la política. Una muestra probabilística requeriría acceder a un censo del
total de estudiantes de todas las universidades chilenas con el fin de seleccionar al azar un
grupo de individuos y encuestarlos. Una muestra por conveniencia podría consistir en
dirigirme a 3 universidades cercanas, simplemente porque están en la población en la que
reside el encuestador, y encuestar a unos cuantos individuos que acepten participar al salir de
las aulas por la mañana.

Las limitaciones de este tipo de muestreo son obvias. En el ejemplo anterior, podría suceder
que diferentes tipos de universidades correlacionen con estratos sociales y con opiniones
políticas. Es más, si seleccionamos estudiantes de 3 universidades concretas y
los encuestamos por la mañana, sus opiniones podrían ser diferentes de las de estudiantes del
turno de tarde (que tal vez trabajan al mismo tiempo que estudian).
¿Significa lo anterior que los resultados de una muestra por conveniencia son totalmente
irrelevantes, que no nos dicen nada de la población? No exactamente. Si tenemos buenas
razones para pensar que la selección por conveniencia no va a introducir sesgos respecto al
total de la población, los resultados que obtendré pueden ser una buena imagen del universo

INGENIERIA CIVIL 19
UNIVERSIDAD NACIONAL DE SAN CRISTOBAL DE HUAMANGA

estudiado. El problema es que no sabremos exactamente cómo de buena es esa imagen: no se


pueden usar herramientas estadísticas como el margen de error y el intervalo de
confianza para medir la precisión de los resultados. Los lectores del estudio tendrán que
confiar en los criterios de la selección hecha por el investigador.
Los estudios clínicos
No debemos ver el muestreo por conveniencia como un método inútil. De hecho, es habitual su uso
exitoso en muchos ámbitos. Por ejemplo, los estudios clínicos con voluntarios. En dichos estudios, se
solicita a personas con ciertas características físicas que acudan voluntariamente para formar parte de
algún tipo de investigación o incluso algún tratamiento. El investigador clínico que usa esta técnica
está considerando que cualquier individuo que cumpla con una cierta característica (por ejemplo, ser
diabético) va a ser representativo del universo. O dicho de otra manera, el hecho de que un individuo
vea o no vea la solicitud de voluntarios, acceda o no a participar, sea de una región o de otra, etc. no
va a afectar a sus resultados en el estudio.
A diferencia del ejemplo anterior sobre estudiantes chilenos, en el caso del estudio clínico el uso de
un muestreo por conveniencia parece apropiado y no hace pensar que se vayan a producir sesgos en
los resultados. La clave está en considerar si la "conveniencia" en la selección realmente va a
representar un sesgo.

Estudios piloto
Otro uso frecuente de este tipo de muestreo es la realización de un estudio piloto. Una muestra por
conveniencia en una fase inicial de un proyecto nos puede dar información sobre tendencias y
resultados que vamos a encontrar al usar una muestra probabilística. Esta información podemos
usarla para modificar el planteamiento del estudio antes de incurrir en una técnica de muestreo más
costosa.

Ventajas e inconvenientes
Dadas las características de este tipo de muestreo, sus pros y sus contras son evidentes:
 La principal virtud del muestreo por conveniencia... ¡es su conveniencia! Simple,
económico, rápido... Nos puede dar información valiosa en muchas circunstancias,
especialmente cuando no existen razones fundamentales que diferencien a los individuos que
tengo accesibles de los que forman el total de la población.
 El principal defecto, la falta de representatividad, la imposibilidad de hacer aseveraciones
estadísticas sobre los resultados y el riesgo de incurrir en sesgos debido al criterio de muestreo
empleado. En el peor de los casos, una muestra conveniente puede presentar un sesgo
sistemático respecto al total de la población, lo que produciría resultados distorsionados.

Margen de error y nivel de confianza


 Es un tema que tratamos en un post anterior. No es correcto usar muestreo por conveniencia
y expresar los resultados del estudio indicando un margen de error y un nivel de confianza.
Sin embargo, es algo que se suele hacer.
 Si optas por calcular ese margen de error, deberías indicar que no corresponde a la muestra
empleada, sino a una muestra del tamaño aleatoria simple de ese tamaño. Y, en cualquier
caso, siempre que usemos una muestra por conveniencia, deberíamos acompañar los
resultados con una descripción de cómo se ha obtenido dicha muestra para que el lector
valore qué credibilidad puede dar a los resultados.

INGENIERIA CIVIL 20
UNIVERSIDAD NACIONAL DE SAN CRISTOBAL DE HUAMANGA

b) Muestreo casual
Muestreo casual, fortuito o incidental. Es una modalidad del muestreo determinístico y
ocurre cuando el investigador selecciona directa e intencionadamente a los individuos de la
población.
Los criterios de selección suelen basarse generalmente en el conocimiento teórico sobre el
tema objeto de estudio.
Por ejemplo, cuando se entrevista a una de cada diez personas que pasan por una calle
cualquiera.
Por ejemplo, para estudiar el problemática del absentismo escolar, un investigador puede
seleccionar los alumnos de un centro educativo en una zona de trabajadores agrícolas
temporeros que suelen desplazarse en determinadas épocas del año, los alumnos situados en
una barriada marginal de una gran ciudad y los de un centro de zona residencial, dado que
por su conocimiento teórico del problema sabe que estos representan los diferentes tipos de
comportamientos en relación a la asistencia a clases.

c) Muestreo de cuotas
Esta técnica es la que suele usarse en investigación online a través de
paneles. Podemos ver el muestreo por cuotas como la versión no probabilística
del muestreo estratificado. Consta de tres fases:

1. Segmentación
En primer lugar, dividimos la población objeto de estudio en grupos de forma exhaustiva (todos los
individuos están en un grupo) y mutuamente exclusiva (un individuo sólo puede estar en un grupo),
de forma similar a la división en estratos empleada en el muestreo estratificado. Normalmente esta
segmentación se hace empleando alguna variable sociodemográfica como sexo, edad, región o clase
social.

2. Fijamos el tamaño de las cuotas


A continuación, fijamos el objetivo de individuos a encuestar para cada uno de estos grupos.
Normalmente definiremos estos objetivos de forma proporcional al tamaño del grupo en la población.
Por ejemplo, si hemos definido unos segmentos por sexo en una población en la que hay un 60% de
mujeres y un 40% de hombres, y queremos obtener una muestra de 1.000 personas, definiremos un
objetivo de 600 mujeres y 400 hombres. Estos objetivos se conocen como cuotas. En este ejemplo,
tendríamos una cuota por sexo de 600 mujeres y 400 hombres. En ocasiones se definen cuotas no
proporcionales a la población, por ejemplo, para poder profundizar en el análisis de un grupo
específico.

3. Selección de participantes y comprobación de cuotas


Por último, buscamos participantes para cubrir cada una de las cuotas definidas. En este punto es
donde nos alejamos de un muestreo probabilístico: en el muestreo por cuotas aceptamos que la
selección de individuos no sea aleatoria, puede ser una selección mediante muestreo por
conveniencia. Por ejemplo, en un estudio en el que hayamos definido una cuota de 100 personas
menores de 25 años y 100 personas de 25 o más años, podríamos salir a la calle y abordar a las
personas que encontramos a nuestro paso, preguntarles su edad y encuestarlas si no hemos cubierto
nuestro objetivo.

INGENIERIA CIVIL 21
UNIVERSIDAD NACIONAL DE SAN CRISTOBAL DE HUAMANGA

De acuerdo a la descripción anterior, la diferencia entre el muestreo estratificado y el muestreo por


cuotas está en la forma en que se seleccionan los participantes. En el muestreo
estratificado disponemos de una lista de posibles entrevistados, todos ellos con una cierta
probabilidad (conocida) de ser seleccionados. En el muestreo por cuotas no. Vamos obteniendo
candidatos a formar parte de la muestra de forma no aleatoria y vamos comprobando antes de
entrevistar si son válidos para el estudio (es decir, si puede formar parte de una de las cuotas definidas
o ya hemos excedido el objetivo). Cuando hay que descartar a un posible participante por efecto de
una cuota (es la mujer 101 cuando nuestra cuota es de 100 mujeres), hablamos de un individuo
descartado por ser quota-full.

La elección de variables
La pregunta que nos podemos plantear es: ¿qué variables escoger en un muestreo por cuotas?
¿cómo segmentar la población? Esta cuestión es un factor clave en esta técnica.

La finalidad de usar cuotas es lograr que la muestra sea lo más representativa posible del universo
estudiado. La idea es la siguiente: aunque estemos seleccionando individuos para la muestra de forma
no aleatoria, al menos garanticemos que dicha muestra guarda las mismas proporciones que el
universo en relación a algunas variables, como sexo y edad. Pero, ¿por qué sexo y edad? ¿por qué no
usar región? ¿o por qué no usar la altura y el peso de los individuos?
Las variables que usemos para definir cuotas en una muestra deberían cumplir dos condiciones:

(1) Que sean variables afectadas (es decir, sesgadas) por la forma no aleatoria en que seleccionamos
individuos para la muestra. Por ejemplo, en una encuesta telefónica tendemos a encontrar personas
de más edad que en una muestra aleatoria. Por lo tanto, debería añadir una cuota por edad.

(2) Que sean variables que influyan en el dato que quiero medir. En un estudio electoral, podemos
aceptar que sexo, edad y región influyen en la intención de voto. Nos interesa añadir cuotas sobre
estas variables.

Veamos los dos criterios anteriores en un ejemplo


concreto. Supongamos que queremos medir a través
de una muestra extraída de un panel online el tanto
por ciento de personas que fuman en una población .
¿Qué variables deberíamos seleccionar para definir
cuotas?

Siguiendo el primer criterio, seleccionaremos


variables que puedan aparecer distorsionadas por el
hecho de seleccionar a la muestra en un panel online respecto a la población general: por ejemplo, la
edad (en los paneles online suele haber mayor proporción de jóvenes) y la clase social (los páneles
tienen dificultades para captar personas de clases bajas, especialmente en América Latina).
Podríamos prescindir de cuotas por región geográfica por un doble motivo. En primero lugar, los
paneles online no suelen captar en una región concreta de un país, sino que captan a través de medios

INGENIERIA CIVIL 22
UNIVERSIDAD NACIONAL DE SAN CRISTOBAL DE HUAMANGA

online que son accesibles desde cualquier región. Podríamos aceptar por lo tanto que la variable
"región" no está afectada por la selección no aleatoria.
Si atendemos al segundo criterio (cuotas que puedan afectar al resultado medido), podríamos optar
por añadir una cuota de sexo: el hábito de fumar suele variar entre hombres y mujeres y, salvo que
trabajemos con un panel en el que nos garanticen que la composición por sexo es perfecta, es
recomendable controlar esta cuota también.

Muestreo por cuotas y representatividad


El uso de cuotas en un muestreo no probabilístico no nos va a permitir transformarlo en probabilístico.
Seguiremos sin poder calcular el margen de error y el nivel de confianza sobre los resultados. Es
decir, el uso de cuotas no permite medir el grado de precisión de nuestros resultados.

¿Significa esto que es lo mismo usar o no usar cuotas? ¿Es el muestreo por conveniencia es
equivalente al muestreo por cuotas? La respuesta es NO. El uso de cuotas pone cierto control a los
sesgos que pueden producirse por el método de selección empleado, nos garantiza que en una serie
de variables clave vamos a reproducir la composición de la población en nuestra muestra. El problema
es que, pese a que es una práctica común por parte de muchos investigadores, no vamos a poder
afirmar cuan representativa es nuestra muestra. Las cuotas mejoran la representividad, pero no
sabemos cuánto.
Pese a todo, el muestreo por cuotas es uno de los métodos de muestreo más populares y prácticamente
el único método viable cuando hacemos investigación online (salvo que contemos con un panel
probabilístico). Usar cuotas es un sistema efectivo y económico de obtener muestras que
proporcionan información relevante.

Ventajas e inconvenientes
La principal ventaja del muestreo por cuotas es que ofrece resultados útiles a un coste efectivo y, si
se han elegido correctamente las variables sobre las que segmentar, dichos resultados suelen ser
fiables.
Los principales inconvenientes son dos:
1. La imposibilidad de acotar el error que estamos cometiendo al usar este tipo de muestreo
2. El riesgo de obviar una cuota relevante en un estudio. Por ejemplo, si en un estudio electoral no
fijamos una cuota por regiones y resulta que la tendencia de voto es muy diferente en unas regiones
respecto a otras, los resultados globales estarán fuertemente distorsionados.

Errores frecuentes al usar cuotas en Internet


El muestreo por cuotas es muy popular. La mayor parte de estudios telefónicos y personales, ante la
falta de un marco muestral preciso (como podría ser un censo de población) emplean cuotas para
asegurar un nivel de representatividad
aceptable. Esta técnica también predomina en
estudios online a través de paneles. Sin
embargo, el medio online tiene sus
particularidades y es frecuente que algunos
investigadores no las tengan en cuenta,
limitándose a reproducir técnicas empleadas en
medios offline. Esta práctica puede producir
resultados de menor calidad y en algunos casos
mayores costes.

INGENIERIA CIVIL 23
UNIVERSIDAD NACIONAL DE SAN CRISTOBAL DE HUAMANGA

Algunos ejemplos:

Cuotas geográficas

En offline: la región del encuestado es una variable clave a controlar cuando se hacen encuestas
personales por razones obvias. Si los encuestadores están en una ciudad, todos los entrevistados serán
de esa ciudad. Es por ello que la región es una cuota clave. También es habitual limitar la muestra a
unas cuantas ciudades, las más importantes de cada país, para reducir el coste.
En online: la región no es tan importante ya que es normal encontrar personas de diferentes ciudades
en Internet sin incurrir en sobrecoste. Por ello, si el factor geográfico no es clave, podríamos no
controlar las cuotas geográficas. En caso de que fuese importante, podríamos fijar cuotas para obtener
respuesta de todas las regiones, no de unas pocas ciudades. De esta forma obtendría mejores datos y
a menor coste, ya que podríamos usar todo el panel para obtener resultados.
Cuotas por clase social
En offline: la clase social no suele considerarse una cuota clave en países europeos y
norteamericanos, o al menos no en todos los estudios. Las diferencias entre clases sociales existen
pero no son tan profundas como en ciertas regiones latinoamericanas, donde al recolectar los datos
mediante entrevista personal, las clases sociales bajas son muy simples de obtener mientras que las
altas son de difícil acceso.

En online... la clase social es más relevante que en offline, especialmente en países con una adopción
de Internet media o baja. Curiosamente, en estos países la situación en Internet es inversa a la
situación offline: es más fácil acceder a clases altas en Latinoamérica a través de Internet y es muy
difícil acceder a clases bajas.

Cuotas por sexo y edad


En offline: sexo y edad son
variable típicamente controladas mediante
cuotas. En campo personal no suelen dar muchos
problemas, mientras que en campo telefónico es
más sencillo acceder a mujeres que a hombres, y
a personas mayores que a jóvenes. Con la
irrupción del móvil el problema se ha agravado,
ya que los jóvenes apenas usan el teléfono fijo.
En online: ambas variables deben controlarse,
igual que en offline. Los paneles online acceden
más fácilmente a gente joven, especialmente en
la franja de los 20 a 35 años. También es habitual
que los paneles recluten más mujeres que hombres, porque son más demandadas para estudios de
mercado, por lo que es necesario controlar la variable sexo.

INGENIERIA CIVIL 24
UNIVERSIDAD NACIONAL DE SAN CRISTOBAL DE HUAMANGA

d) Muestreo de opinión
Muestreo de opinión o de juicio en este caso los sujetos se suelen seleccionar a base del
conocimiento y del juicio del investigador.
El investigador selecciona a los individuos a través de su criterio profesional, puede basarse en
la experiencia de otros estudios anteriores o en su conocimiento sobre la población y
comportamiento de esta frente de las características que se estudian.
Este tipo de muestreo se suele aplicar mas en campo de la política y el marketing.

Características
 se caracteriza este tipo de muestreo por un esfuerzo deliberado de obtener muestras
representativas mediante la inclusión en la muestra de sujeto supuestamente típicos.
 Aplica bien para estudios de pre-prueba o prueba piloto para instrumento. La idea se
centra en que el investigador elija la muestra por que los considera los más
representativos.
 El asunto critico es la objetividad. Que tanto se puede confiar en el juicio del investigador
al seleccionar una muestra.
 La muestra se elige sobre la base de conocimiento

Como utilizarlo
 Este tipo de muestreo es aconsejable cuando el responsable del estudio conoce estudios
anteriores similares o idénticos sabe con precisión que la muestra que utilizaron fue útil para
el estudio
 Si la población es muy reducida y conocida por el investigador.

Ventajas
 Se requiere de información o características muy específicas para seleccionar la muestra y
por lo tanto es más confiable (por cuotas)
 Se hace la selección de muestra de acuerdo al juicio del investigador, de esta forma es más
específico en buscar el tema que quiere conocer (por juicio)
 Selección de los casos más disponibles de acuerdo al tema a investigar (conveniencia)
 Este tipo de muestreo reduce costos y tiempo

Desventajas
 Difícil generalizar a otros sujetos
 Los resultados dependen de las características únicas de la muestra
 Mayor probabilidad de error debido al investigador o influencia del sujeto.
 No son representativas de ninguna población definida
 No tiene ningún sentido teórico generalizar a una población.

INGENIERIA CIVIL 25
UNIVERSIDAD NACIONAL DE SAN CRISTOBAL DE HUAMANGA

e) Muestro de expertos
El muestreo discrecional o muestreo por juicio de expertos es una técnica de muestreo no
probabilístico donde el investigador selecciona las unidades que serán muestra en base a su
conocimiento y juicio profesional.
El proceso consiste en elegir intencionalmente a dedo a los individuos de la población sobre la
base del conocimiento o juicio de la autoridad o investigador.
El muestreo por juicio es económico, practico y rápido; es subjetivo y su valor depende por
completo del juicio, la experiencia y creatividad del investigador.

Cuando se utiliza
Se utiliza cuando el numero limitado de individuos posee el rasgo de interés. Es la única técnica
de muestreo variable para obtener información de un grupo muy específico de personas.
También es posible utilizar el muestreo discrecional si el investigador conoce a un profesional o
autoridad fiable que el es capaz de reunir una muestra representativa.

f) Muestreo de bola de nieve

El muestreo por bola de nieve es una técnica de muestreo no probabilística en la que los individuos
seleccionados para ser estudiados reclutan a nuevos participantes entre sus conocidos. El nombre de
"bola de nieve" proviene justamente de esta idea: del mismo modo que una bola de nieve al rodar por
una ladera se va haciendo más y más grande, esta técnica permite que el tamaño de la muestra vaya
creciendo a medida que los individuos seleccionados invitan a participar a sus conocidos.

La bola de nieve se usa con frecuencia para acceder a poblaciones de baja incidencia y a individuos
de difícil acceso por parte del investigador. En proyectos en los que se quiere estudiar a un colectivo
muy específico (por ejemplo, personas aficionadas a la filatelia o coleccionismo de sellos), puede
resultar mucho más efectivo obtener una muestra a través de conocidos y amigos de los propios
coleccionistas, que mediante una selección puramente aleatoria, en la que una gran cantidad de
individuos candidatos a participar serían descartados. Supuestamente, es muy probable que un
coleccionista de sellos conozca a otros coleccionistas de sellos, lo que hace de esta técnica una forma
efectiva de muestrear un colectivo que de otra manera resultaría de difícil acceso para el investigador.

Por lo tanto, la bola de nieve funciona especialmente bien cuando el rasgo distintivo de la población
que queremos estudiar tiende a agrupar a dichos individuos, a favorecer su contacto social. Es algo
más habitual de lo que podría parecer a simple vista. Es obvio que coleccionistas, practicantes de un
deporte o aficionados a un tipo de música pueden cumplir con esta propiedad. Pero también aplica a
otros colectivos como pacientes de una enfermedad rara, por poner un ejemplo, ya que su

INGENIERIA CIVIL 26
UNIVERSIDAD NACIONAL DE SAN CRISTOBAL DE HUAMANGA

circunstancia personal facilita que estas personas entren en contacto con otras personas con el mismo
rasgo (por ejemplo, en la consulta del médico, en asociaciones, etc.).

Proceso
El proceso de creación de una muestra mediante bola de nieve se fundamenta en usar la red social de
unos individuos iniciales para acceder a un colectivo. Podríamos dividir este proceso en los siguientes
pasos:
1. Definir un programa de participación, en el que se describa el proceso por el que un individuo
invita o refiere a otros para que participen.
2. Identificar colectivos u organizaciones que puedan facilitar el acceso a unos individuos iniciales
que cumplan con el rasgo característico del estudio.
3. Obtener contactos iniciales y pedirles su participación. Esta parte sería similar a una técnica de
muestreo convencional, pero destinada a obtener un tamaño de muestra reducido.
4. Solicitar a los participantes, una vez finalizada la entrevista, el acceso a otros contactos.
5. Asegurar la diversidad de contactos mediante una correcta selección de los individuos iniciales y
promoviendo que la recomendación no se limite a contactos muy cercanos.

Tipos de muestreo bola de nieve


Básicamente podemos identificar dos tipos de muestreo bola de nieve:

1. Muestreo lineal: Cada individuo participante debe recomendar a otro individuo, de forma que la
muestra crece a un ritmo lineal.
2. Muestreo exponencial: Cada individuo debe invitar a participar a dos o más individuos. De esta
forma, cuanta más gente participa en el estudio, más gente se añade al mismo.

Ventajas e inconvenientes

 Las principales ventajas de esta técnica son:


 Permite muestrear a poblaciones de difícil acceso.

 Es un proceso económico y sencillo.

 Requiere poca planificación y pocos


recursos humanos: los propios sujetos
entrevistados hacen de mano de obra.

 Respecto a los inconvenientes:


 Falta de control sobre cómo se constituye la
muestra, ya que está en manos de los propios
encuestados y su criterio el seleccionar a
nuevos individuos.

 Como toda técnica no probabilística, la bola de nieve no garantiza representatividad ni


permite conocer el grado de precisión que ofrecerá.
 Esta técnica es especialmente sensible al sesgo de muestreo. Dado que los individuos
participantes se obtienen por invitación de individuos ya seleccionados, podría suceder que
todos los individuos compartan ciertas características o rasgos, independientemente del rasgo

INGENIERIA CIVIL 27
UNIVERSIDAD NACIONAL DE SAN CRISTOBAL DE HUAMANGA

objeto de estudio, por lo que el muestreo estaría accediendo sólo a un sub-grupo de la


población a estudiar. Este problema se pone especialmente de manifiesto si la selección de
individuos iniciales no es suficientemente diversa.

 Tamaño de muestra incontrolado: la técnica no permite fijar a priori con precisión el tamaño
de muestra que vamos a obtener.

Otras consideraciones
Sin duda, el principal problema de la bola de nieve es el riesgo de "sesgos de comunidad": accedemos
a un sub-grupo de individuos dentro de nuestro target y el reclutamiento de nuevos miembros no logra
salir de ese sub-grupo. El único remedio contra este mal es hacer una buena selección inicial de
individuos, que nos garantice que cualquier sub-grupo existente sea accesible en la red de contactos
de los individuos iniciales.
Cabe destacar que esta técnica muchas veces es la única posible cuando nos dirigimos a colectivos
reducidos en los que no es posible tener un marco muestral. Es por ello que muchos investigadores
trabajan en perfeccionar la técnica para corregir sus sesgos. En concreto, una de las técnicas más
prometedores en las que se trabaja se conoce como Respondent Driven Sampling, un sistema que trata
de corregir mediante un modelo matemático los posibles sesgos introducidos en la selección de
individuos.

g) Muestreo de poblaciones móviles

En el que la población total es estima de la proporción de individuos en la recaptura, que han sido
capturados de manera previa y fueron marcados.
Es decir, este tipo de muestreo utiliza métodos de captura y recaptura. Suele utilizarse en el
estudio de migraciones de población de animales.

II. CONCLUSION

Para el estudio de una población es necesario que el experto en el estudio sepa relacionar con
las distintas formas de muestreo para la obtención de un mejor resultado. También seria
bueno que dicho estudio lo realice con la participación de expertos que ya hayan realizado
dicho estudió por lo que las experiencias valen mucho en este tipo de estudios.

INGENIERIA CIVIL 28
UNIVERSIDAD NACIONAL DE SAN CRISTOBAL DE HUAMANGA

III. REFERENCIAS BIBLIOGRAFICAS

 William COCHRAN “Técnicas de muestreo”


 Leslie KISH “muestreo por encuesta”
 Jose CALZADA POENZA “Estadística general con énfasis en
muestreo”
 https://www.netquest.com/blog/es/muestreo-probabilistico-muestreo-
aleatorio-simple/
 https://www.questionpro.com/blog/es/muestreo-estratificado/
 https://www.netquest.com/blog/es/muestreo-probabilistico-muestreo-
conglomerados/

 https://www.netquest.com/blog/es/muestreo-sistematico/
 https://www.netquest.com/blog/es/muestreo-por-conveniencia/
 https://www.netquest.com/blog/es/muestreo-por-cuotas
 https://www.netquest.com/blog/es/muestreo-bola-nieve/
 https://prezi.com/d9txfkbr228d/muestreo-de-poblaciones-moviles/
 OTZEN, T. & MANTEROLA C. Sampling techniques on a population
study. Int. J. Morphol., 35(1):227-232, 2017.

INGENIERIA CIVIL 29

También podría gustarte