Está en la página 1de 33

Estadística inferencial

ESTADÍSTICA INFERENCIAL

JULIAN ANDRES LABRADOR GARCIA ID: 621597


ANGIE LORENA ORTIZ ID 622672

CORPORACIÓN UNIVERSITARIA MINUTO DE DIOS


ADMINISTRACIÓN EN SEGURIDAD Y SALUD EN EL TRABAJO
NEIVA – HUILA
2020

1
Estadística inferencial

ACTIVIDAD 2

ELABORADO POR:
JULIAN ANDRES LABRADOR GARCIA ID: 621597
ANGIE LORENA ORTIZ ID 622672

PRESENTADO A:
LUIS ARIEL NINCO NINCO
NRC: 9190

CORPORACIÓN UNIVERSITARIA MINUTO DE DIOS


ADMINISTRACIÓN EN SEGURIDAD Y SALUD EN EL TRABAJO
NEIVA – HUILA
2020

2
Estadística inferencial

TABLA DE CONTENIDO

Pag
1. Introducción…………… ………………………………………………..…………….….4
2. Objetivos………………………………………………………………………...……..….5
2.1. Objetivo general………………………………………………………………….….…5
2.2. Objetivos específicos…………………………………………………………….….…5
3. Marco teórico……………………………………………………………………...………6
4. Completar el cuadro con las definiciones y un ejemplo de cada uno………………8
4.1. TIPOS DE MUESTREO NO PROBABILISTICO
 a Juicio ……………………………………………………………………………….8
 por conveniencia …………………………………………………………………. 10
 voluntario ………………………………………………………………………… 13
4.2. TIPOS DE MUESTREO PROBABILISTICO
 Aleatorio Simple ………………………………………………………………… 17
 Sistemático …………………………………………………………………………20
 Estratificado ……………………………………………………………………….,23
 Por Conglomerados…………………………………………………………….….27
5. Conclusiones…………………………………………………………………………….31
6. Bibliografía……………………………………………………………..………..…….. 32

3
Estadística inferencial

1. INTRODUCCION

Desde hace mucho tiempo el hombre se ha visto obligado a desarrollar ciertas


técnicas para facilitarse de alguna forma sus actividades de conteo y así es como
surgió el Muestreo, el cual se desprende de la estadística, claro ahora ya se domina
y se explota en muchas áreas pero para llegar a este punto, hay un gran pasado,
donde distintas civilizaciones han experimentado a través del tiempo y cada una fue
aportando bases, hasta cierta época donde todos, como parte de una sociedad
planteamos como objetivo desarrollar estrategias para poder realizar mejor nuestras
actividades, en este caso todas las actividades que involucren el muestreo. Eso nos
ha permitido crecer juntos como civilización ya que todos aportamos ideas para
construir técnicas más complejas y por consecuencia más exactas.

El muestreo surge de la necesidad de conocer y prever las situaciones de ciertas


poblaciones, con pocos recursos económicos y en el caso de que la población fuese
muy extensa poder tomar una muestra y de ahí conocer las características de la
población seleccionada. Así es como surge el muestreo y conforme el tiempo pasa
se han ido modificando los métodos de aplicación de muestreo, para obtener datos
más verídicos de las poblaciones en estudio. Mucho de estas modificaciones se
deben también al desarrollo de nuevas herramientas, como la computadora.

En este trabajo podremos encontrar definiciones de los tipos del muestreo, para
poder comprender ¿cómo funcionan?, ¿para qué nos sirven? y ¿por qué son tan
importantes para nuestra sociedad?, además es una gran oportunidad de adquirir y
entender conceptos.

4
Estadística inferencial

2. OBJETIVOS

2.1. OBJETIVO GENERAL


Definir conceptos básicos de los tipos de muestreo y su aplicación a través de
ejemplos en diferentes contextos adquiriendo un aprendizaje significativo

2.2. OBJETIVOS ESPECÍFICOS


 Analizar el material suministrado desde la plataforma, con el fin de abordar y
comprender la temática actual.
 Adquirir conocimientos básicos de los tipos de muestreos.

5
Estadística inferencial

3. MARCO TEÓRICO
Uno de los problemas que se enfrenta cuando se hace estadística es la obtención
de datos. Los datos no ocurren, es necesario recolectarlos. Es importante obtener
datos con veracidad, puesto que estos nos darán los resultados y conclusiones
esperadas.
Partiendo de lo anterior es importante rescatar dentro de los tipos de muestra
conceptos como:
Una población es el conjunto de todos los elementos que interesan en un estudio.
El tamaño de la población, N, puede ser muy grande o incluso infinito.
Una muestra es un subconjunto observado de valores poblacionales que tiene un
tamaño muestral que viene dado por n.
Muestreo sesgado: Es el muestreo que produce valores que difieren
sistemáticamente de la población que está siendo muestreada. Este muestreo se
clasifica en dos tipos, muestra por conveniencia y ocurre cuando es posible acceder
fácilmente a los elementos de una población de la que se elige la muestra. Muestra
de voluntarios, consta de resultados colectados a partir de los elementos de la
población que contribuyen por su propia iniciativa.
Marco muestral: Es una lista de los elementos que pertenecen a la población de la
cual se obtendrá la muestra.
Muestra de juicio: Las muestras son elegidas con base en el hecho de que son
típicas. –
Muestra probabilística: Es la muestra en la que los elementos a seleccionar se
obtienen con base en la probabilidad. Cada elemento de una población tiene cierta
probabilidad de ser elegido como parte de la muestra.
Muestra aleatoria simple: Una muestra es seleccionada de modo que todos los
elementos de la población tienen la misma probabilidad de ser elegidos. Las
muestras aleatorias simples se obtienen por muestreo con reemplazo en una
población finita o por muestreo sin reemplazo en una población infinita.
Muestra sistemática: Muestra en la cual se selecciona todo k – èsimo elemento del
marco muestral, empezando con un primer elemento que se elige de manera
aleatoria. Para seleccionar una muestra sistemática al x%, primero se selecciona 1
elemento de los primeros x 100 elementos, y luego a partir de ahí se procede a
seleccionar todo x 100 - ésimo elemento hasta que se cuenta con el número de
datos que se desea tener en la muestra.
Muestra aleatoria estratificada: Muestra que se obtiene al estratificar el marco
muestral y luego seleccionar un número fijo de elementos de cada uno de los
estratos por promedio de una técnica de muestreo aleatorio simple.

6
Estadística inferencial

Muestra proporcional: Muestra que se obtiene al estratificar el marco muestral y


luego seleccionar de cada estrato un número de elementos en proporción al tamaño
de los estratos, por medio de una técnica de muestreo aleatorio simple.
Muestra por conglomerado: Muestra que se obtiene al muestrear algunas, pero no
todas, las subdivisiones, denominadas conglomerados, a menudo ocurren de
manera natural dentro de la población.

7
Estadística inferencial

4. COMPLETAR EL CUADRO CON LAS DEFINICIONES Y UN EJEMPLO DE


CADA UNO:

4.1. TIPOS DE MUESTREO NO PROBABILISTICO

 DELIBERADO, CRÍTICO O POR JUICIO


El muestreo deliberado, crítico o por juicio, es una técnica de muestreo no
probabilístico en la que los miembros de la muestra se eligen sólo sobre la base del
conocimiento y el juicio del investigador. Como el conocimiento del investigador es
instrumental en la creación de una muestra, hay posibilidades de que los resultados
obtenidos sean altamente precisos con un mínimo margen de error.
El proceso de selección de una muestra mediante el muestreo deliberado, crítico o
por juicio implica que los investigadores seleccionen cuidadosamente a cada
individuo para que forme parte de la muestra. El conocimiento del investigador es
fundamental en este proceso de muestreo, ya que los miembros de la muestra no se
eligen al azar.

¿Cuándo llevar a cabo un muestreo deliberado, crítico o por juicio?


8
Estadística inferencial

Este tipo de muestreo es más efectivo en situaciones en las que sólo hay un número
restringido de personas que poseen cualidades que un investigador espera de la
población objetivo. Los investigadores prefieren implementar el muestreo
deliberado, crítico o por juicio cuando sienten que otras técnicas de muestreo
consumirán más tiempo y confían en su conocimiento para seleccionar una muestra
para llevar a cabo la investigación.

Esta clase de muestreo se utiliza generalmente en situaciones en las que la


población objetivo está formada por individuos altamente intelectuales que no
pueden elegirse utilizando ninguna tipo de muestreo probabilístico o no
probabilístico. También se utiliza en situaciones en las que la muestra seleccionada
necesita ser aprobada o filtrada utilizando otros métodos de muestreo.

Por ejemplo, en situaciones en las que un investigador lleva a cabo un muestreo por
conveniencia para recolectar retroalimentación de los profesores sobre su
universidad, pero el hecho de que hay altas probabilidades de que los resultados
sean sesgados, los investigadores prefieren un muestreo deliberado, crítico o por
juicio para seleccionar a aquellos profesores que proporcionarán 100% de
retroalimentación sobre la universidad.

La selección de cada individuo de la muestra es un reto para el investigador. Es una


tarea tediosa seleccionar manualmente a los miembros de una muestra y
asegurarse de que no haya sesgos.

La autoridad que interviene en el proceso de selección no tiene por qué ser


necesariamente un “experto” en la materia, sino que debe cumplir determinadas
características que se esperan de una autoridad de este tipo de muestreo no
probabilístico. No se tiene en cuenta la formación o la experiencia laboral cuando se
nombra a las autoridades encargadas del proceso de selección.

El muestreo deliberado, crítico o por juicio se utiliza cuando hay limitaciones de


tiempo para la creación de la muestra y las autoridades involucradas preferirían
confiar en su conocimiento y no en otros métodos de muestreo. Pero, hay que tener
en cuenta el hecho de que un investigador puede o no ser competente para llevar a
cabo un proceso de muestreo eficaz. Esta es la única desventaja del muestreo
intencional. Cada investigador que asuma la responsabilidad de crear una muestra
utilizando el muestreo de expertos tendrá que estar extremadamente seguro de sus
propias habilidades y comprensión del tema.

Ejemplos de muestreo deliberado, crítico o por juicio

Aquí hay dos ejemplos distintos:

Considere un escenario en el que se desean entender los factores que llevan a una
persona a seleccionar el hacking ético como profesión. El hacking ético es una
habilidad que ha atraído recientemente a la juventud. Cada vez más gente lo
selecciona como profesión. Los investigadores que entiendan lo que es el hacking
ético podrán decidir quién debe formar la muestra para reconocerla como profesión.

9
Estadística inferencial

Es entonces cuando se implementa el muestreo deliberado, crítico o por juicio. Los


investigadores pueden filtrar fácilmente a aquellos participantes que pueden ser
elegibles para ser parte de la muestra de investigación.

Hay muchas tribus en el mundo que tienen sus propias creencias religiosas. Para
los investigadores que planean estudiar la cultura un país en particular, se aconseja
que seleccionen estratos utilizando un muestreo deliberado, crítico o por juicio, ya
que las creencias religiosas se consideran altamente sensibles. Debido a la
sensibilidad del tema, si se crean muestras de aquellos que tienen el conocimiento
apropiado y se lleva a cabo la investigación con esas muestras, los resultados serán
altamente precisos. Las técnicas de muestreo probabilístico a menudo producen
resultados alterados en tales casos.

Ventajas del muestreo deliberado, crítico o por juicio

Consume un tiempo mínimo de ejecución: En este enfoque de muestreo, la


experiencia de los investigadores es importante y no existen otras barreras debido a
las cuales la selección de una muestra resulta extremadamente conveniente.

Permite a los investigadores acercarse directamente a su mercado objetivo:


No hay criterios para seleccionar una muestra, excepto las preferencias del
investigador. Gracias a esto, puede comunicarse directamente con el público
objetivo de su elección y obtener los resultados deseados.

Resultados casi en tiempo real: Se puede realizar una encuesta o sondeo rápido
con la muestra utilizando un muestreo deliberado, crítico o por juicio, ya que los
miembros de la muestra poseerán el conocimiento y la comprensión acorde al tema.

 POR CONVENIENCIA

El muestreo por conveniencia es una técnica de muestreo no probabilístico y no


aleatorio utilizada para crear muestras de acuerdo a la facilidad de acceso, la
disponibilidad de las personas de formar parte de la muestra, en un intervalo de
tiempo dado o cualquier otra especificación práctica de un elemento particular.

10
Estadística inferencial

El investigador elige a los miembros solo por su proximidad y no considera si


realmente estos representan muestra representativa de toda la población o no.
Cuando se utiliza esta técnica, se pueden observar hábitos, opiniones, y puntos de
vista de manera más fácil.

Los investigadores utilizan técnicas de muestreo en situaciones en las que hay


grandes poblaciones para ser evaluadas, ya que, en la mayoría de los casos, es
casi imposible realizar pruebas a toda una población.

El muestreo por conveniencia es la técnica de muestreo que se utiliza de manera


más común, ya que es extremadamente rápida, sencilla, económica y, además, los
miembros suelen estar accesibles para ser parte de la muestra.

Esta técnica se utiliza cuando no existen criterios que deban considerarse para que
una persona pueda ser parte de la muestra. Cada elemento de la población puede
ser un participante y es elegible para ser parte de la muestra. Estos participantes
comúnmente dependen de la proximidad al investigador.

Por ejemplo, en una escuela a veces hay situaciones en las que un docente
selecciona las primeras dos filas para participar en la competencia, este es un tipo
de ejemplo en cuanto a la proximidad. O también otro ejemplo podría ser cuando
una ONG selecciona las 20 mejores ciudades para que presten sus servicios en
función de la proximidad de su base.

 ¿Cuándo se utiliza el muestreo por conveniencia?

El ejemplo más básico de donde se utiliza el método de muestreo de conveniencia


es cuando las empresas detienen a las personas en un centro comercial o en una
calle concurrida para distribuir sus folletos promocionales y hacer preguntas.

Las empresas utilizan el método de muestreo por conveniencia para recopilar


información sobre problemas críticos que deben abordarse casi de inmediato, o
cuando una marca está recopilando información sobre una característica o producto
en particular recién lanzado.

Durante las etapas iniciales de una investigación, los investigadores suelen preferir
utilizar el muestreo por conveniencia ya que con este método es más rápido y fácil
obtener resultados.

Incluso aunque muchos evitan implementar esta técnica, el muestreo por


conveniencia es clave en situaciones en las que un investigador pretende obtener
información en un lapso de tiempo más corto y sin invertir demasiado dinero.

Por ejemplo, si a un estudiante de marketing se le pide una tarea en la cual debe


obtener comentarios sobre el “alcance del marketing de contenido en el 2018”, este
crearía rápidamente una encuesta en línea y le enviaría un enlace a todos los
contactos de su teléfono para que estos la respondan y las compartan en sus redes

11
Estadística inferencial

sociales. Además es probable que le pida a sus compañeros que le ayuden a


responder su encuesta porque la necesita para su tarea. Este es un ejemplo clásico
del uso del método de muestreo por conveniencia.

Ventajas del muestreo por conveniencia

Método rápido para recopilar datos: Las reglas para reunir elementos o
participantes para la muestra son menos complicados en comparación con otros
métodos de investigación, como por ejemplo el muestreo aleatorio simple,
el muestreo estratificado o el muestreo sistemático. Debido a la simplicidad de este
tipo de muestreo, la recopilación de datos suele tomar un tiempo mínimo.

Económico al momento de crear muestras: El dinero y el tiempo invertido en


otros métodos de muestreo de probabilidad suelen ser mucho más altos en
comparación con el muestreo por conveniencia. Esto permite a los investigadores a
crear muestras con menos o incluso con ninguna inversión en un breve periodo de
tiempo.

Muestra fácilmente recolectada: Los investigadores pueden acceder fácilmente a


los elementos y, por lo tanto, es fácil recopilar miembros para la muestra.

Menos reglas: a diferencia de las técnicas de muestreo probabilístico, el muestreo


por conveniencia no requiere pasar por una lista de verificación para poderle dar
acceso a los miembros o a una población a ser parte de la muestra. En el caso de
este método de muestreo, la recopilación de información y de datos críticos es
mucho más simple.

Un ejemplo de uso de muestreo por conveniencia puede ser este: Imagina que los
voluntarios de la ONG necesitan realizar encuestas a mujeres pero no tienen acceso
a muchas, pero necesitan obtener los resultados lo más rápido posible, lo que los
voluntarios pueden hacer es ir a escuelas, universidades, oficinas, etc., y hablar con
las mujeres que estén presentes sin tener una lista en la mano.

¿Cómo reducir el sesgo en el muestreo por conveniencia?

La mejor manera de reducir el sesgo en el muestreo por conveniencia es


utilizándolo junto al muestreo probabilístico. La realidad es que el muestreo por
conveniencia suele estar sesgado, es por eso que el uso del muestreo de
probabilidad puede ser útil para tener el sesgo bajo control.

El muestreo por conveniencia y las técnicas de muestreo de probabilidad son


realmente buena para obtener una estimación más precisa. El aspecto de
probabilidad que se utiliza con el muestreo de conveniencia tendrá que ser lo
suficientemente potente como para superar el sesgo.

El sesgo puede hacer que toda una muestra sea inútil y definitivamente eso es lo
último que un investigador necesita, es por eso que te recomiendo hacer uso de
ambas técnicas de muestreo para obtener los resultados que estás buscando.

12
Estadística inferencial

¿Vas a iniciar una investigación? Te invito a crear tu primera cuenta gratuita de


encuestas online para conocer todo que puedes hacer utilizando QuestionPro.
Ejemplos

Uno de los ejemplos más comunes de muestreo de conveniencia se realiza


utilizando estudiantes voluntarios como sujetos de la investigación. Otro ejemplo es
el uso de sujetos que se han seleccionado de una clínica, una clase o una
institución ya que para el investigador es de fácil el acceso a estas instituciones. Un
ejemplo más concreto es la selección de cinco personas de una clase o incluso la
selección de los cinco primeros nombres de la lista de pacientes de una lista en una
institución médica.

En estos ejemplos, el investigador inadvertidamente excluye una gran proporción de


la población. Una muestra de conveniencia es o bien una selección de sujetos que
son accesibles para el investigador o una selección de personas que deseen
participar como voluntarios.

 VOLUNTARIADO
El muestreo voluntario es un tipo de muestreo no probabilístico, formado por
participantes seleccionados por el investigador. Sin embargo, este método produce
un sesgo de respuesta, ya que los miembros son auto-seleccionados. 

El proceso consiste en elegir a una persona para ser voluntaria de responder la


encuesta porque puede tener una opinión particularmente fuerte sobre el tema, por
conveniencia o por razones éticas. 

¿Cuáles son sus principales características y cómo saber si está entre los tipos de
muestreo que necesitas?

Características de un muestreo voluntario

A menudo, nos encontramos con encuestas en las redes sociales sobre asuntos
relacionados con el aborto, políticas de inmigración, igualdad de derechos, etc. No
se contacta directamente a los encuestados, ni se les insta a responder. Depende
de la voluntad del individuo y de su conocimiento sobre el tema para participar en el
estudio.  

Los factores que animan a una persona a responder una encuesta son, en su
mayoría, la facilidad de dar su respuesta, una opinión firme sobre el tema, razones
éticas, etc.

Un ejemplo de muestreo voluntario puede ser un sondeo a través de llamadas en un


programa de radio. Aquí, solo una parte de la población que escucha la emisora en
particular participa, por lo que las respuestas que son recolectadas no reflejan con
precisión los sentimientos de toda la población.

13
Estadística inferencial

Ventajas del muestreo voluntario

Entre las principales ventajas de un muestreo voluntario se encuentran las


siguientes:

Su cobertura: Ocurre cuando la mayoría de los miembros de la población no están


suficientemente representados en la muestra. Sólo las personas que siguen el
programa de entrevistas, el programa de radio, el programa de televisión o los que
pertenecen a la comunidad pueden participar en la encuesta.

Es posible que las personas que tengan una opinión diferente o neutral sobre el
tema no puedan participar en el estudio, ya que no siguen los programas de radio y
televisión.

Respuestas sesgadas: El sesgo de respuesta ocurre cuando los miembros de la


muestra son voluntarios seleccionados por ellos mismos, como muestras
involuntarias. Los encuestados tienden a responder a preguntas basadas en
opiniones firmes sobre el tema. 

Una buena muestra es representativa; es decir, cada punto de la muestra


representa los atributos de un número conocido de elementos de la población. El
resultado final de la encuesta puede no ser exacto.

Conoce sobre la importancia de una muestra representativa para una investigación


eficaz.

Fácil de recopilar datos: Encontrar encuestados para la encuesta es fácil, ya que


las personas que tienen una fuerte opinión sobre el tema tienden a comentar e
involucrarse, gracias a que motivación es alta con respecto al tema.

Errores en la calidad de los datos: Esto es evidente, las respuestas tenderán a


inclinarse hacia una idea específica, lo que compromete la calidad de los datos y
hace que la información recolectada sea sesgada e inutilizable. 

Usos del muestreo voluntario

El muestreo voluntario no es útil en casos donde el estudio es de gran importancia o


cuando hay que tomar grandes decisiones basadas en el resultado, ya que este solo
refleja un aspecto de toda la historia, por lo que es mejor aplicar un muestreo
aleatorio. 

Este método, sin embargo, puede ser utilizado por presentadores de programas de
televisión o de radio que deseen afirmar su opinión sobre temas específicos en los
que los voluntarios también tienden a inclinarse hacia la misma opinión que el
presentador.

14
Estadística inferencial

Las organizaciones utilizan este método como una herramienta de marketing para
anunciar sus productos. El muestreo voluntario puede aumentar potencialmente el
conocimiento de tu marca y convertir a tus clientes existentes tus defensores.

Factores a considerar al establecer un muestreo voluntario

En la mayoría de los casos, un muestreo voluntario dará respuestas sesgadas, el


cual también es causado por la incapacidad o ausencia de deseo de responder
correctamente a las preguntas. 

La razón es que los encuestados ya están a favor de un tipo específico de resultado


y responderán de acuerdo a él. Si eres un investigador que busca calidad y
respuestas variadas, evita siempre este método. Pero si es necesario adoptar este
enfoque, te damos algunos factores que debes tener en cuenta para evitar los
prejuicios en la medida de lo posible.

Mantén tus preguntas cortas y claras: La mitad de la batalla para evitar el sesgo
de respuesta se gana haciendo las preguntas correctas. Una pregunta claramente
entendida es más probable que sea contestada correctamente en comparación con
una pregunta larga y complicada.

Evita las preguntas tendenciosas: Al diseñar un cuestionario, evita hacer


preguntas hipotéticas y preguntas directas. 

Para la pregunta, “¿estás contento con el producto o servicio? en lugar de dar una
opción de sí/no, dales una variedad de opciones para capturar los datos con mayor
precisión. Los ejemplos de respuestas pueden ser: “Me gusta usar este
producto/servicio”, “Este producto/servicio satisface mis necesidades”, “Ojalá
pudiera sacar más provecho del producto/servicio”, “El producto/servicio está por
debajo de mis expectativas”.

No incluyas conceptos difíciles: Para obtener datos reales, desglosa y simplifica


las preguntas para el encuestado. Las preguntas largas causan fatiga y pueden no
captar el sentimiento real del encuestado.

Ofrece opciones de respuesta simples y claras: Al igual que con las preguntas
simples y directas, mantén las opciones de respuesta simples también. Los
encuestados tenderán a responder mejor a las preguntas si tienen ante sí opciones
fáciles de contestar.

Utiliza un lenguaje sencillo y preciso: Siempre evita el uso de lenguaje difícil o


técnico en las preguntas y opciones de respuesta. Tu encuestado elegirá la
respuesta más precisa basándose en su comprensión de la pregunta y la respuesta.

No influyas en las respuestas: Esto no añadirá ningún valor al estudio. Es posible


que recibas muchas respuestas en la encuesta, pero todas ellas estarán
influenciadas por tu enfoque y los datos capturados al final serán irrelevantes.

15
Estadística inferencial

Te mostramos cómo mejorar tu muestreo con estos consejos que tenemos para ti. 


 

Ventajas y desventajas del muestreo voluntario

VENTAJAS DESVENTAJAS
 Es una manera sencilla de realizar  No hay control sobre la muestra
un estudio  Los datos son inexactos
 Es barato  Las respuestas son sesgadas
 Los datos son fáciles de recopilar  No es aconsejable hacer
 Es de fácil acceso inferencias
 Requiere poco esfuerzo por parte  Favorece un cierto resultado
del investigador  Puede provocar crear una
 Tiene la posibilidad de encuesta imparcial
proporcionar información rica y  El resultado es influenciado
cualitativa por el investigador, lo cual afecta
 Mínimo esfuerzo requerido la fiabilidad del estudio
Una manera de asegurar que el muestreo voluntario tenga una oportunidad justa de
reflejar la población es aplicar la aleatoriedad. El método aleatorio más básico es el
muestreo aleatorio simple. Significa que cada miembro de la población tiene las
mismas oportunidades de ser elegido. 

En este método, se supera inmediatamente el problema de las respuestas


sesgadas. Aprenderás de ambos lados de la población, es decir, escucharás los
aspectos negativos y positivos del tema en cuestión. Esto te ayudará a entender
mejor el tema y a idear estrategias más precisas en comparación con las respuestas
voluntarias. 

Al configurar la encuesta, también puedes crear preguntas de filtro para identificar y


segregar a las personas que participan.

Aunque la adopción del muestreo voluntario tiene sus inconvenientes, la facilidad de


crear y desplegar encuestas no es costosa, por lo que se utiliza ampliamente.
Ejemplo:
Se desea conocer la opinión de los estudiantes de la carrera de administración de
empresas de la universidad Matías Delgado en cuanto a la calidad de la enseñanza
que se les brinda. Por lo que se lanza un anuncio diciendo que cierto día habrá una
reunión para aportar sus opiniones, y el que esté interesado en compartir su opinión
que se acerque al lugar indicado. A dicha reunión llegaron 40 estudiantes, se les
pasa una encuesta, preguntando si el personal docente está altamente capacitado
para las materias que se imparten, si el plan de estudio esta actualizado o necesita
actualizarse y si esta satisfecho con la enseñanza brindada.

16
Estadística inferencial

Se puede concluir que los alumnos de la carrera de administración de empresas, de


la universidad Matías Delgado, el 86% de ellos esta de acuerdo con que el personal
docente esta al mas alto nivel para impartir las catedras; el 23% considera que se
debe actualizar el plan de estudios, contra  un 77% que considera que es adecuado;
y el 81% de los alumnos se muestran satisfechos de la enseñanza brindada.

4.2. TIPOS DE MUESTREO PROBABILISTICO

 ALEATORIO SIMPLE
El muestreo aleatorio simple es una técnica de muestreo en la que todos los
elementos que forman el universo - y que por lo tanto están incluidos en el marco
muestral - tienen idéntica probabilidad de ser seleccionados para la muestra. El
proceso de muestreo que emplea esta técnica es equivalente a hacer un sorteo
entre los individuos del universo: asignamos a cada persona un boleto, introducimos
los boletos en una urna y empezamos a extraer boletos al azar. Todos los individuos
que tengan un boleto extraído de la urna formarían la muestra. Obviamente, en la

17
Estadística inferencial

práctica, estos métodos pueden automatizarse mediante el uso de programas


informáticos.

Dependiendo de si los individuos del universo pueden ser seleccionados más de


una vez en la muestra o no, hablaremos de muestreo aleatorio simple con
reposición o sin reposición
.
Si usamos reposición, el hecho de que seleccione un individuo al azar para la
muestra no impide que este mismo individuo pueda volver a ser seleccionado.
Siguiendo con el símil de la urna y los boletos, usar reposición equivale a
reintroducir los boletos de los individuos seleccionados para la muestra antes de
extraer el siguiente boleto.
Si, por el contrario, no usamos reposición, un individuo seleccionado para la
muestra ya no entraría nuevamente en el sorteo. Un individuo solo puede aparecer
una única vez en una muestra.

La pregunta obvia que puedes plantearte es, ¿qué es mejor, usar reposición o no
usala? Responderemos esta pregunta un poco más abajo, pero antes, revisemos
qué precisión logra el muestreo aleatorio simple con reposición para un tamaño de
muestra dado y, alternativamente, qué tamaño de muestra necesito para garantizar
cierta precisión. 

Error y tamaño de muestra en muestreo aleatorio simple con reposición

Supón el siguiente caso. Tienes una población grande de N individuos (supongamos


que de más de 100,000 individuos). Pones un boleto para cada individuo en una
urna. Extraes un boleto, anotas la identidad del individuo y reintroduces el boleto en
la urna. Repites el proceso n veces, hasta obtener una muestra de tamaño n en la
que un individuo podría aparecer varias veces. Esto es poco probable si N es muy
grande y n es mucho menor que N, algo habitual ya que usamos muestras para no
tener que analizar todo el universo.

Una muestra seleccionada de esta forma tiene una propiedad muy útil: la media de
cualquier variable que midamos en la muestra se parecerá a la media calculada en
el total de la población. Y se parecerá de una forma muy concreta: la media en la
muestra seguirá una distribución normal centrada en la media poblacional y con
varianza igual a la varianza poblacional dividida por el tamaño de la muestra n. Esta
relación entre muestra y población se conoce como teorema central del límite.
Tienes una explicación detallada en este otro post, pero te lo resumimos aquí:
gracias a esta propiedad (es decir, a que sabemos cómo se relaciona la media de la
muestra con la de la población) podemos calcular la probabilidad de que la media de

18
Estadística inferencial

la muestra esté dentro de un intervalo de valores. Y esto nos permite saber qué
error máximo vamos a tener cuando usamos la media de la muestra como
estimación de la media de la población. En concreto, se cumple que
e ≤ZNC 
σ√ n

donde:

- e es el error máximo que vamos a tener (máxima diferencia entre la media de la
muestra y la media de la población).
- ZNC es el valor crítico de corte de una distribución de probabilidad normal para
un nivel de confianza NC.
- σ es la desviación típica (=raiz de la varianza) de la variable que nos interesa en la
población.
- n es el tamaño de muestra.
Si invertimos esta expresión, podemos calcular qué tamaño de muestra n necesito
para garantizar que el error de estimación no supera el margen de error e con
un nivel de confianza NC.
n ≥ZNC2 
σ2 e2
¿Y si no reponemos?

Sabemos calcular el error y el tamaño de muestra para el muestreo con reposición,


pero, ¿cómo cambian ambos resultados si no repetimos individuos en la muestra?

Si podemos considerar que el universo es infinito o, al menos, mucho más grande


que el tamaño de la muestra, no cambia absolutamente nada. Piénsalo bien: si el
universo es muy grande, aunque usemos reposición, la probabilidad de que
escojamos dos veces al azar al mismo individuo es casi nula. Por lo tanto, usar
reposición o no usarla no da resultados diferentes.

Las diferencias entre ambos métodos se producen por lo tanto en situaciones en


los que el tamaño de la población es pequeño. En este caso, el muestreo sin
reposición toma ventaja. Intuitivamente es obvio: si el tamaño de la población es
muy pequeño (digamos 30 individuos) repetir individuos en una muestra es
malgastar una oportunidad de cubrir más información. En otras palabras, es
ineficiente.
Veamos de manera más formal este resultado. Es posible demostrar que en un
muestreo sin reposición, cuando el universo no se puede considerar infinito
(<100,000 individuos), el tamaño de muestra necesario para un determinado
margen de error es inferior al que necesitarías si el universo es infinito. En concreto,
el tamaño de muestra para un universo finito se relaciona con el tamaño de muestra
para universo infinito de la siguiente manera

n = 
ninfN ninf + (N-1)
donde ninf es el tamaño de muestra necesario para un universo infinito y N es el
tamaño del universo finito.

19
Estadística inferencial

Sabiendo que el tamaño de muestra cuando usamos reemplazo (nr) es siempre


igual al tamaño necesario para universo infinito (nr=ninf), podemos concluir que
n = 
ninfN ninf + (N-1)
 = 
nrN nr + (N-1)
 = 
nr nr/N+ (N-1)/N
 < nr
Por lo tanto, el tamaño de muestra necesario para acotar un mismo nivel de error es
siempre más pequeño no reponemos individuos en la muestra. Y, en definitiva, tanto
si lo miramos desde el punto de vista de qué técnica genera estimaciones más
precisas como desde el punto de vista de qué técnica permite tener la misma
precisión con menor tamaño de muestra, se puede concluir que el muestreo
aleatorio simple sin reposición siempre es más eficiente.
 
✔ Beneficios del muestreo aleatorio simple
El desarrollo de la informática ha permitido que diseñar una muestra aleatoria simple
sea extremadamente rápido y fiable, siempre que tengamos el marco muestral
necesario para ello, claro. La generación de números aleatorios mediante software
(estrictamente son números pseudo-aleatorios) es cada vez más fiable.

De esta forma, al usar muestreo aleatorio simple nos aseguramos la obtención


de muestras representativas, de manera que la única fuente de error que va a
afectar a mis resultados va a ser el azar. Y lo que es más importante, este error
debido al azar puede calcularse de forma precisa (o al menos acotarse). 
 ✔ Inconvenientes del muestreo aleatorio simple

El único inconveniente es la dificultad de llevarlo a la práctica en investigaciones


reales. Recordemos: al ser una técnica probabilística, es necesario un marco
muestral con todos los individuos y que todos ellos sean seleccionables para la
muestra. Un requisito que difícilmente puede cumplirse en la mayoría de estudios de
mercado y opinión reales, lo que nos obligará a emplear otras técnicas.

 SISTEMÁTICO

Siguiendo con nuestra serie de posts dedicados a las técnicas de muestreo y tras


examinar el muestreo estratificado, hoy echaremos un vistazo al muestreo
sistemático.

20
Estadística inferencial

El muestreo sistemático era muy popular en el pasado, antes de que la aparición de


los ordenadores hiciese trivial un problema que siempre había dado muchos
quebraderos de cabeza a los investigadores: elegir individuos de forma aleatoria
dentro de una muestra. En la medida en que los ordenadores nos han facilitado la
tarea de generar números aleatorios, este problema ha desaparecido.

También se sigue utilizando para seleccionar individuos a lo largo del tiempo. Por


ejemplo, para estudiar la satisfacción de un servicio, podemos elegir
sistemáticamente encuestar a 1 de cada n clientes que nos visitan. En estas
circunstancias, en las que puede existir diferente varianza entre individuos en
diferentes periodos de tiempo, el muestreo sistemático puede ser incluso más
preciso que el muestreo aleatorio puro.
 ¿En qué consiste el muestreo sistemático?

Es una técnica dentro de la categoría de muestreos probabilísticos - y que por lo


tanto requiere tener un control preciso del marco muestral de individuos
seleccionables junto con la probabilidad de que sean seleccionados - consistente en
escoger un individuo inicial de forma aleatoria entre la población y, a continuación,
seleccionar para la muestra a cada enésimo individuo disponible en el marco
muestral.

El muestreo sistemático es un proceso muy simple y que sólo requiere la elección


de un individuo al azar. El resto del proceso es trivial y rápido. Los resultados que
obtenemos son representativos de la población, de forma similar al muestreo
aleatorio simple, siempre y cuando no haya algún factor intrínseco en la forma en
que los individuos están listados que haga que se reproduzcan ciertas
características poblacionales cada cierto número de individuos. Este suceso es
realmente poco frecuente.
 
El proceso

De forma concreta, el proceso que seguiríamos en un muestreo sistemático sería el


siguiente:

1. Elaboramos una lista ordenada de los N individuos de la población, lo que sería


el marco muestral.
2. Dividimos el marco muestral en n fragmentos, donde n es el tamaño de
muestra que deseamos. El tamaño de estos fragmentos
será: K=N/n, donde K recibe el nombre de intervalo o coeficiente de elevación.
21
Estadística inferencial

3. Número de inicio: obtenemos un número aleatorio entero A, menor o igual al


intervalo. Este número corresponderá al primer sujeto que seleccionaremos para la
muestra dentro del primer fragmento en que hemos dividido la población.
4. Selección de los n-1 individuos restantes: Seleccionamos los siguientes
individuos a partir del individuo seleccionado aleatoriamente, mediante una sucesión
aritmética, seleccionando a los individuos del resto de fragmentos en que hemos
dividido la muestra que ocupan la misma posición que el sujeto inicial. Esto equivale
a decir que seleccionaremos los individuos:
A, A + K, A + 2K, A + 3K, ...., A + (n-1)K
 
Ejemplo

Supongamos que tenemos un marco muestral de 5.000 individuos y deseamos


obtener una muestra de 100 de ellos. Dividimos en primer lugar el marco muestral
en 100 fragmentos de 50 individuos. A continuación seleccionamos un número
aleatorio entre 1 y 50, para extraer el primer individuo al azar del primer fragmento:
por ejemplo el 24. A partir de este individuo, queda definida la muestra extrayendo
los individuos de la lista con intervalos de 50 unidades, tal y como sigue:

24, 74, 124, 174, ..., 4.974


 

Propiedades del muestreo sistemático

✔ Ventajas 
- Obtiene buenas propiedades de representatividad, similares a la de un muestreo
aleatorio simple o incluso superiores, pero de forma más rápida y simple, al evitar la
necesidad de generar tantos números aleatorios como individuos en la muestra.

- Respecto al muestreo aleatorio, el muestreo sistemático puede garantizarnos una


selección perfectamente equitativa de la población. Esto puede ser de utilidad si se
distinguen grupos dentro de universo, lo que nos podría evitar la necesidad de usar
estratos. Si existe diferente varianza entre los individuos de los fragmentos, este
muestreo puede ser mejor que el aleatorio. Lo veremos luego.

✘ Desventajas
- Sólo existe la ya mencionada posibilidad de que el orden en que se han listado los
candidatos a la muestra tenga algún tipo de periodicidad oculta que coincida con el
intervalo escogido para generar la muestra sistemática. En este caso, podríamos
generar una muestra sesgada.

 Eficiencia del muestreo sistemático

El muestreo sistemático se ideó para mejorar las propiedades del muestreo aleatorio
simple, pero el grado de mejora es variable dependiendo de las propiedades del
universo estudiado.

22
Estadística inferencial

Para entender las propiedades de este muestreo, hay que tener en cuenta una
cosa: si fijamos el intervalo o coeficiente de elevación según el tamaño de la
muestra que necesitamos, sólo hay un elemento aleatorio dentro del proceso de
muestreo: la unidad inicial que seleccionamos del primer bloque de individuos. El
resto queda fijado de antemano. Esto equivale a decir que sólo tenemos k posibles
muestras diferentes a obtener y que el muestreo es simplemente escoger una de las
k muestras disponibles.
Es posible demostrar que cuanto más supera la varianza dentro de las k posibles
muestras que podemos generar a la varianza poblacional, más precisión ganamos
usando el muestreo sistemático respecto al aleatorio simple. Lo anterior puede
interpretarse diciendo que el muestreo sistemático es más preciso que el aleatorio
simple cuando la variabilidad dentro de las posibles muestras es superior a
la variabilidad dentro de las unidades de la población. La precisión del muestreo
sistemático coincide con la del aleatorio simple cuando ambas variabilidades
coinciden, y esto se da cuando la disposición de los elementos en la población es
totalmente aleatoria.

 ESTRATIFICADO

Vimos en un post anterior la definición, las ventajas y los inconvenientes del


muestreo aleatorio simple. Hoy vamos a mostraros otra técnica un poco más
sofisticada: el muestreo estratificado.
Esta técnica, perteneciente a la familia de muestreos probabilísticos, antes de iniciar
el proceso de muestreo divide toda la población objeto de estudio en diferentes
subpoblaciones o estratos disjuntos, de manera que un individuo sólo puede
pertenecer a un estrato. Una vez definidos los estratos, la muestra se crea
seleccionando por separado individuos de cada estrato, empleando una técnica de
muestreo cualquiera. Si, por ejemplo, empleamos muestreo aleatorio simple en cada
estrato, hablaremos de muestreo aleatorio estratificado. Este es el caso más
habitual, pero del mismo modo podríamos usar otras técnicas de muestreo en cada
estrato (muestreo sistemático, aleatorio con reposición, etc.).

Los estratos suelen crearse a partir de grupos homogéneos de individuos, que a su


vez son heterogéneos entre diferentes grupos. Por ejemplo, si en un estudio
esperamos encontrar un comportamiento muy diferente entre hombres y mujeres,
puede ser conveniente definir dos estratos, uno por cada sexo. Si la selección de
estos estratos es correcta:

23
Estadística inferencial

1. Los hombres deberían comportarse de forma parecida entre ellos.


2. Las mujeres deberían comportarse de forma muy similar entre ellas.
3. Hombres y mujeres deberían mostrar comportamientos dispares entre sí.
Si la anterior condición se cumple (estratos homogéneos internamente,
heterogéneos entre sí) el uso del muestreo aleatorio estratificado reduce el error
muestral respecto a un muestreo aleatorio convencional, mejorando la precisión
de nuestros resultados.
Es relativamente habitual definir estratos de acuerdo a algunas variables
sociodemográficas de la población como son edad, sexo, clase social o región
geográfica. Estas variables permiten dividir fácilmente la muestra en grupos
mutuamente excluyentes y, con bastante frecuencia, permiten discriminar
comportamientos diferentes dentro de la población.

 Tipos de muestreo estratificado

Dependiendo del tamaño que asignamos a los estratos, hablaremos de


diferentes tipos de muestreo estratificado. También se acostumbra a hablar de
diferentes formas de "afijación" de la muestra en estratos.

1. Muestreo estratificado proporcionado


Cuando dividimos una población en estratos, es habitual que el tamaño de dichos
estratos sea diferente. Por ejemplo, si queremos estudiar el tanto por ciento de la
población que fuma en México y pensamos que la edad puede ser un buen criterio
para estratificar (es decir, pensamos que existen diferencias importantes en el
hábito de fumar dependiendo de la edad), podemos definir 3 estratos: menores de
20 años, de 20 a 44 años y mayores de 44 años. Es de esperar que al dividir toda la
población mexicana en estos 3 estratos no resulten grupos de igual tamaño.
Efectivamente, si miramos datos oficiales, obtenemos:

* Estrato 1 - Población Mexicana menor de 19 años: 42,4 millones (41,0%)

* Estrato 2 - Población Mexicana de 20 a 44 años: 37,6 millones (36,3%)

* Estrato 3 - Población Mexicana mayor de 44 años: 23,5 millones (22,7%)

Si usamos muestreo estratificado proporcionado, la muestra deberá tener


estratos que guarden las mismas proporciones observadas en la población. Si en
este ejemplo queremos crear una muestra de 1.000 individuos, los estratos tendrán
que tener un tamaño como sigue:
 
Muestra
Estrato Población Proporción
proporcional

1 42,4M 41,0% 410

2 37,6M 36,3% 363

3 23,5M 22,7% 227

24
Estadística inferencial

 
2. Muestreo estratificado uniforme 
Hablaremos de una afijación uniforme cuando asignamos el mismo tamaño de
muestra a todos los estratos definidos, sin importar el peso que tienen esos estratos
en la población. Siguiendo con el ejemplo anterior, un muestreo estratificado
uniforme definiría la siguiente muestra por estrato:
 
Muestra
Estrato Población Proporción
uniforme

1 42,4M 41,0% 334

2 37,6M 36,3% 333

3 23,5M 22,7% 333

Como puedes ver, el tamaño de la muestra es igual en todos los estratos (salvo
pequeñas diferencias debidas al redondeo necesario fruto de dividir 1,000 entre 3),
en lugar de seguir las proporciones de la población.
Esta técnica favorece los estratos que tienen menos peso en la población,
equiparándolos en importancia a los estratos más relevantes. Globalmente, reduce
la eficiencia de nuestra muestra (menor precisión en los resultados globales), pero,
como contrapartida, permite estudiar características particulares de todos los
estratos con una precisión mínima mayor. En nuestro ejemplo, si queremos emitir
alguna afirmación específica sobre la población del estrato 3 (mayores de 44 años),
podremos hacerlo con menos error muestral si empleamos una muestra de 333
unidades que si lo hacemos con una muestra de 227 (como ocurriría en el muestreo
estratificado proporcional).

3. Muestreo estratificado óptimo (respecto a la desviación estándar)


En este caso, el tamaño de los estratos en la muestra no guarda proporcionalidad
con la población. Por el contrario, se trata de optimizar el tamaño muestral de cada
estrato con el fin de reducir el margen de error global, teniendo en cuenta no solo el
tamaño de cada estrato en la población sino su desviación estándar.

Esta optimización lo que hace, básicamente, es dedicar más unidades de muestra


de las que corresponderían en un muestreo proporcional a aquellos estratos que
tienen más variabilidad y que por lo tanto son más difíciles de estimar.

La forma exacta en que se calcula el tamaño óptimo de muestra por estrato es un


tema un poco más técnico, pero tienes una explicación detallada en este post, por si
eres de los que les gusta la estadística.
 

Eficiencia de los diferentes muestreos estratificados

25
Estadística inferencial

Las preguntas inevitables son: ¿cuándo conviene emplear la estratificación?, ¿qué


tipo de estratificación es más conveniente?

El muestreo estratificado proporcional produce siempre menor o igual error muestral


que el muestreo aleatorio simple, es decir, es más preciso. La igualdad se produce
cuando las medias o las proporciones que estamos analizando son iguales en todos
los estratos. Por lo tanto, la estratificación produce más beneficio cuanto más
diferentes sean los estratos entre sí.

El muestreo estratificado óptimo es siempre igual o más preciso que el muestreo


estratificado proporcional. Ambos métodos son igual de precisos cuando las
desviaciones típicas dentro de cada estrato son iguales, en cuyo caso ambos
métodos son totalmente equivalentes. Por lo tanto, la estratificación óptima produce
más beneficio cuanto más diferencias existan entre las desviaciones dentro de cada
grupo, situación en la que podremos reducir el tamaño muestral de los grupos más
homogéneos en beneficio de los más heterogéneos. Como contrapartida, es un
método más complejo y que requiere tener mucha información a priori de la muestra
que estudiamos, algo que normalmente no tenemos (rara vez conocemos las
desviaciones típicas de los universos que vamos a investigar).
 Tamaños de muestra requeridos por cada técnica

Las técnicas de muestreo estratificado pueden emplearse para estimar de forma


más precisa parámetros de las poblaciones de interés, ya sean medias (p.e. media
de cigarrillos consumidos por los fumadores de México) o proporciones (p.e.
proporción de la población de México que fuma). Pero, inversamente, también
pueden permitirnos reducir el tamaño de muestra requerido para lograr una
estimación con un nivel de error determinado.

La siguiente tabla resume el tamaño de muestra requerido al emplear cada técnica,


en función del error máximo que estamos dispuestos a aceptar (e) y de las
características del propio universo. En estas fórmulas consideramos que el universo
es de tamaño infinito. Si fuese finito, debe aplicarse un factor de corrección.

Para interpretar el cuadro anterior es necesario tener en cuenta lo siguiente:

26
Estadística inferencial

- Z es el valor crítico de corte de una distribución normal para lograr un nivel de
confianza deseado. Tienes más información sobre el significado de Z aquí. Los
valores más frecuentes son:
Nivel de confianza 90% -> Z=1,645

Nivel de confianza 95% -> Z=1,96

Nivel de confianza 99% -> Z=2,575

- L es el número de estratos en que particionamos la muestra y h es un índice que


se refiere a un estrato concreto. Por lo tanto, h puede variar entre 1 y L estratos.
- p es la proporción que buscamos en el total de la población (p.e. % de fumadores).
Por lo tanto, (1-p) es la proporción  complementaria, la que no cumple el criterio
buscado (% de no fumadores). Del mismo modo, ph es dicha proporción dentro de
cada uno de los estratos.
- σ2 es la varianza del dato buscado (en el caso de estimar medias) en el total de la
población. Asimismo, σh2 es la varianza dentro de cada estrato.
- e es el margen de error aceptado.
- Wh es el peso que el estrato tiene en la muestra (tamaño del estrato respecto al
total de la muestra). Si hablamos de estratificación proporcional, cada Wh es igual a
la proporción que ese estrato representa en la población. Si hablamos de
estratificación óptima, cada Wh se calcula en función de la dispersión dentro de
cada estrato.

Es posible demostrar a partir de las fórmulas anteriores que los diferentes métodos
de estratificación sólo reducen el tamaño de la muestra necesaria si los valores
de p y σ varían entre estratos. De lo contrario, todas las expresiones son
equivalentes. Veamos un ejemplo: si tomamos la expresión de tamaño de muestra
requerido para estimar una media mediante un muestreo estratificado óptimo,
tenemos 
n = Z2 
(L∑h=1 wh σh )2 e2
Si consideramos que todas las varianzas de los estratos son iguales (σ h=σ) y que el
tamaño de los estratos es idéntico (Wh=1/L), el resultado que obtenemos es
n = Z2 
(L∑h=1 wh σh )2 e2
 = Z2 
(L∑h=1 (1/L)σ )2 e2
 = Z2 
((L/L)σ)2 e2
 = Z2 
σ2 e2

que coincide con el tamaño de muestra necesario para tener un error máximo e en
un muestreo aleatorio simple.

27
Estadística inferencial

 POR CONGLOMERADOS

Con este post dedicado al muestreo por conglomerados cerramos el primer gran
bloque de posts dedicados al muestreo probabilístico. A partir de la próxima
publicación abordaremos técnicas de muestreo no probabilístico, las más habituales
cuando hablamos de investigación online.

El muestreo por conglomerados es una técnica que aprovecha la existencia de


grupos o conglomerados en la población que representan correctamente el total de
la población en relación a la característica que queremos medir. Dicho de otro
modo, estos grupos contienen toda la variabilidad de la población. Si esto sucede,
podemos seleccionar únicamente algunos de estos conglomerados para conocer la
información de interés del total de la población.

Podemos ver esta técnica desde otro punto de vista. Mientras que en todas las
técnicas vistas hasta ahora las unidades de muestreo coinciden con las unidades a
estudiar (individuos), en el muestreo por conglomerados las unidades de muestreo
son grupos de unidades a estudiar (grupos de individuos), algo que puede resultar
muy beneficioso en términos de coste. A cambio, es habitual obtener una menor
precisión al usar esta técnica, causada por falta de heterogeneidad dentro de los
conglomerados.

El proceso de muestreo

El primer paso para aplicar esta técnica es definir los conglomerados. Se trata de
identificar una característica que permita dividir la población en grupos disjuntos (sin
solapamiento) y de forma exhaustiva (todos los individuos deben estar en un grupo),
de tal manera que los grupos no difieran entre sí en relación a aquello que
queremos medir. Una vez hemos definido estos conglomerados, seleccionaremos al
azar algunos de ellos para estudiarlos.

Un criterio habitual para definir conglomerados es el geográfico. Por ejemplo, si


queremos estudiar qué proporción de la población argentina fuma, podemos dividir
el total de la población en provincias y seleccionar algunas de ellas para ser
estudiadas. Si no tenemos razones de peso para pensar que el porcentaje de
fumadores va a cambiar de una provincia a otra, esta solución nos permitirá
concentrar el esfuerzo de muestreo en un único entorno geográfico. Si el estudio se
va a hacer mediante entrevistas personales, esto representa un importante ahorro
de costes de desplazamientos.

28
Estadística inferencial

Una vez definimos los conglomerados, el siguiente paso es seleccionar los


conglomerados a estudiar, ya sea mediante un muestreo aleatorio simple o
sistemático.

Por último, una vez seleccionados los conglomerados a estudiar, podemos


investigar a todos los sujetos que forman parte de los mismos, o bien aplicar un
nuevo proceso de muestreo dentro del conglomerado, por ejemplo obteniendo una
muestra mediante muestreo aleatorio simple o sistemático. Si optamos por esta
posibilidad, estaremos hablando de un muestreo en dos etapas o bietápico: la
primera etapa será la selección del conglomerado; la segunda, la de individuos
dentro del conglomerado. Si por el contrario estudiamos todos los individuos del
conglomerado, hablaremos de muestreo por conglomerados unietápico.

La idea del muestreo por conglomerados recuerda a la del muestreo estratificado.


En ambos casos dividimos la población en grupos. Sin embargo, los principios
detrás de ambas técnicas son en cierto modo opuestos.

El muestreo estratificado es especialmente adecuado cuando los grupos (estratos)


son muy homogéneos internamente y muy diferentes entre sí. En ese caso,
conviene asegurar que tenemos representantes en nuestra muestra que provienen
de todos los estratos. Por el contrario, el muestreo por conglomerados es muy
adecuado cuando los grupos en que dividimos la población son muy similares entre
sí, por lo que no hay gran diferencia entre estudiar individuos de un grupo o de otro.

Es por ello que pese a que ambas técnicas dividen la población en estratos o
conglomerados, el proceso de selección de individuos es radicalmente diferente.

Ventajas y desventajas del muestreo por conglomerados

✔ La principal ventaja de esta técnica es de tipo operativa: seleccionar un


conglomerado a estudiar suele ser más fácil y económico que hacer una muestra
aleatoria o sistemática. Hemos visto por ejemplo que usar conglomerados
geográficos puede representar un importante ahorro en desplazamientos de
personas.

Curiosamente, es habitual hacer estudios a través de Internet en los que se sigue


pensando en términos de estudiar sólo unas zonas geográficas, cuando en realidad
a través de Internet no obtenemos ningún beneficio operativo; al contrario,
incurrimos en mayor riesgo de tener menor precisión por diferencias entre las
regiones estudiadas y el resto de la población. Esta práctica es una herencia
injustificada de técnicas que eran buenas en entrevistas personales, pero que no lo
son al usar otras metodologías.

✘ Como principal inconveniente, al usar muestreo por conglomerados corremos un


riesgo importante: que los conglomerados no sean realmente homogéneos entre
ellos. En el ejemplo anterior sobre fumadores en Argentina, podría suceder que en
una de las provincias exista más propensión a fumar, por ser una región más
urbana, por razones culturales, etc.

Eficiencia del muestreo por conglomerados

29
Estadística inferencial

¿Cómo podemos comparar esta técnica con otras vistas con anterioridad? Lo bien o
mal que va a funcionar esta técnica va a depender, de forma similar a como ocurría
en el muestreo estratificado, de la relación entre la varianza dentro y fuera de los
conglomerados.

Esta relación se suele expresar con un coeficiente de correlación


intraconglomerados (δ), que se define como el coeficiente de correlación lineal entre
todos los pares de valores de la variable objeto de estudio, medidos sobre las
unidades de los conglomerados y extendido a todos los conglomerados. En
definitiva, este coeficiente es una medida de la homogeneidad en el interior de los
conglomerados.

Cuanto menor sea el coeficiente de homogeneidad intraconglomerados δ, mayor


eficiencia arrojará el muestreo por conglomerados. Recordemos que lo ideal es que
los conglomerados sean tan heterogéneos como el total de la muestra, con el fin de
que la selección de un conglomerado concreto nos de la misma información que la
selección de individuos al azar del total de la población.

Si comparamos el muestreo aleatorio simple con el muestreo por conglomerados, es


posible demostrar que si δ=0 ambos métodos son equivalentes. Esta condición
implica que los conglomerados son exactamente tan heterogéneos como el total de
la población. El peor caso sería δ=+1 , mientras que el más favorable sería el de δ=-
1/(M-1), donde M es el tamaño del conglomerado. Sin embargo, normalmente δ va a
ser siempre mayor que 0, ya que lo normal es que las unidades de un conglomerado
tengan cierto parecido entre sí.

Otra forma de ver el impacto de este problema es calcular el tamaño de muestra


necesario al emplear muestreo por conglomerados para lograr la misma precisión
de un muestreo aleatorio simple. Esta expresión es la siguiente:

nc = na (1 + (M-1) δ)

Donde nc es el tamaño de muestra en muestreo por conglomerados y na es el


tamaño de muestra que necesitaríamos en muestreo aleatorio simple. Por lo tanto,
el factor (1+(M-1) δ) es la variación del tamaño de muestra que necesitamos debido
al uso de conglomerados. Normalmente será un incremento. Este factor se conoce
como efecto de diseño.

Ejemplo

Se planea hacer una encuesta entre universitarios de primer curso de un pais. Se


quieren entrevistar 5.000 universitarios. Ante la imposibilidad de acceder (de
acuerdo con los costos) a un muestreo estratificado, se piensa en una muestra de
200 conglomerados de 25 alumnos, identificando el conglomerado con un grupo de
primer curso.

30
Estadística inferencial

CONLUSIONES

Con base a esta información se llega a la conclusión que el método que mayor
beneficio aporta es el de muestreo probabilístico puesto que sus resultados suelen
ser más representativos y los del muestreo no probabilístico se esfuerza en obtener
datos que efectivamente sea representativos.

En el muestreo no probabilístico deben de presentar sus características originales,


sus resultados son útiles si se hace un buen uso de ellos. En los métodos de
muestreo probabilísticos sus planteamientos teóricos resultan ser muy exigentes.

Estos métodos de muestreo resultan de gran importancia para realizar una


investigación en una población determinada puesto que si se quiere realizar dicha
investigación con mayor éxito en cuestión de resultados, entonces se tiene que
optar por una de estas dos técnicas, de igual manera estas técnicas requieren de un
menor tiempo y recursos.

El muestreo es por lo tanto una herramienta de la investigación cuya función


es determinar que parte de una población debe examinarse, con la
finalidad de hacer conclusiones sobre dicha población.

La muestra debe obtener una representación adecuada de la población,


en la que se represente de la mejor manera los rasgos esenciales de dicha
población que son importantes para la investigación. Para que una muestra sea
representativa, y por lo tanto útil, debe de reflejar las similitudes y diferencias
encontradas en la población, es decir ejemplificar las características de ésta.

Existen varios criterios para poder establecer el tamaño de una muestra, en principio
pueden ser criterios probabilísticos o no probabilísticos de acuerdo al nivel de
posibilidades que cada uno de los elementos tiene, de participar en la muestra,
dentro de un universo de trabajo dado.

31
Estadística inferencial

Gracias al muestreo podemos conocer a ciertas poblaciones sin importar su tamaño


ya que esta técnica solo toma una muestra y en base a ello se obtienen
conclusiones dando como un beneficio directo bajo costo y resultados de bajos
costos.

El muestreo es útil para la empresa, el gobierno, las industrias, etc. Ya que gracias a
esta técnica pueden conocer a las poblaciones de personas y así utilizar la
información obtenida para sus distintos fines.

Parece ser muy exagerado que la técnica de muestreo tenga tantos conceptos pero
hay que recordar que gracias a ellos podemos interpretar con mayor precisión los
resultados y cuando emitimos uno del mismo, podemos afirmar que nuestro margen
de error sea muy pequeño y nuestras predicciones sean correctas

 BIBLIOGRAFIA

https://prezi.com/ndgog6s0ra_g/muestreo-no-probabilistico-por-juicio/

https://www.questionpro.com/blog/es/muestreo-por-conveniencia/

https://explorable.com/es/muestreo-por-conveniencia

https://www.questionpro.com/blog/es/muestreo-voluntario/

https://www.netquest.com/blog/es/blog/es/muestreo-probabilistico-muestreo-
aleatorio-simple

https://www.netquest.com/blog/es/blog/es/muestreo-sistematico

https://www.gestiopolis.com/muestreo-probabilistico-no-probabilistico-resumen/

32
Estadística inferencial

33

También podría gustarte