Está en la página 1de 12

Guía de estudio.

Muestreo
Profesor Ricardo Montoya González

Bloque VI. Muestreo 2


Concepto de muestreo 2
Errores comunes en el muestreo 3
Tamaño de la muestra 3
Puntuación z 4
Factores para tomar en cuenta 5
Tipos de muestreo 6
Muestreo no probabilístico 7
Intervalos de confianza 8
Teorema del límite central 9
Fuentes de consulta 12

1
Bloque VI. Muestreo

Concepto de muestreo
En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos
los elementos de una población), se selecciona una muestra, entendiendo por tal
una parte representativa de la población.

El muestreo es el proceso mediante el cual se selecciona un grupo de


observaciones que pertenecen a una población. Esto, con el fin de realizar un
estudio estadístico, en otras palabras, es el procedimiento mediante el cual se
toman a ciertos individuos que pertenecen a una población que está siendo sujeto
de un análisis.

Es una herramienta de la investigación científica, cuya función básica es determinar


que parte de una población debe examinarse, con la finalidad de hacer inferencias
sobre dicha población.

Como se muestra en la imagen a continuación, la muestra debe lograr una


representación adecuada de la población, en la que se reproduzca de la mejor
manera los rasgos esenciales de dicha población que son importantes para la
investigación, es decir la muestra debe lograr representar a toda la población.

2
Errores comunes en el muestreo
 Hacer conclusiones muy generales a partir de la observación de sólo una
parte de la Población, se denomina error de muestreo.
 Hacer conclusiones hacia una Población mucho más grandes de la que
originalmente se tomó la muestra. Error de Inferencia.

En la estadística se usa la palabra población para referirse no sólo a personas si no


a todos los elementos que han sido escogidos para su estudio y el término muestra
se usa para describir una porción escogida de la población.

Tamaño de la muestra
El tamaño de la muestra se le conoce como aquel número determinado de sujetos
o cosas que componen la muestra extraída de una población, necesarios para que
los datos obtenidos sean representativos de la población.

El tamaño de la muestra es la cantidad de respuestas completas que tu encuesta


recibe, mientras más grande sea el tamaño de la muestra, más estadísticamente
significativo será.

Existen algunos términos necesarios de definir para poder aprender a calcular el


tamaño de la muestra, los cuáles se presentan a continuación:

 Tamaño de la población: La cantidad total de personas en el grupo que


deseas estudiar.
 Margen de error: Un porcentaje que te dice en qué medida puedes esperar
que los resultados de tu encuesta reflejen la opinión de la población general.
Entre más pequeño sea el margen de error, más cerca estarás de tener la
respuesta correcta con un determinado nivel de confianza.
 Nivel de confianza del muestreo: Un porcentaje que revela cuánta
confianza puedes tener en que tu población seleccione una respuesta dentro
de un rango determinado. Por ejemplo, un nivel de confianza del 95 %
significa que puedes tener una seguridad del 95 % de que los resultados
oscilarán entre los números x e y.

3
Para poder calcular el tamaño de la muestra de manera adecuada hay que utilizar
la siguiente fórmula:

𝑁 ⋅ 𝑧 2 ⋅ 𝑝 ⋅ (1 − 𝑝)
𝑇m = 2
ⅇ ⋅ (𝑁 − 1) + 𝑧 2 ⋅ 𝑝 ⋅ (1 − 𝑝)

Donde:

 𝑇m= Tamaño de la muestra


 𝑁= Tamaño de la población (total)
 𝑒= Margen de error (porcentaje expresado con decimales)
 𝑧= Puntuación z
 𝑝 =Probabilidad de que ocurra el evento estudiado
 (1−𝑝) = Probabilidad de que no ocurra el evento estudiado

Puntuación z
La puntuación z es la cantidad de desviaciones estándar que una proporción
determinada se aleja de la media. Presentada en la siguiente tabla:

Nivel de Puntuación z
confianza
deseado

80% 1.28

85% 1.44

90% 1.65

95% 1.96

99% 2.58

4
Factores para tomar en cuenta
Una vez que se ha encontrado el tamaño de la muestra hay algunos factores extras
que deben ser tomados en cuenta antes de definir el tamaño de la muestra. A
continuación, se presenta una tabla de los efectos que tienen las diferentes
variables en la precisión de los resultados de una investigación:

Si aumenta el valor Si disminuye el valor

Tamaño de la La precisión La precisión


población disminuye aumenta

Tamaño de la La precisión La precisión


muestra aumenta disminuye

Nivel de La precisión La precisión


confianza aumenta disminuye

Margen de La precisión La precisión


error disminuye aumenta

Ejemplo tamaño de muestreo

Calcular el tamaño para una población de 543,098 consumidores de una marca de


bebidas energéticas, donde el investigador asigna un nivel de confianza de 95% y
un margen de error de 3%. Donde se desconoce la probabilidad “p” del evento.

Solución

Lo primero que haremos será definir las variables dadas en el problema, es decir:

5
𝑁 = 543,098

𝑒 = 0.03

Nivel de confianza= 95% por lo tanto; z=1.96.

Al desconocerse la probabilidad de que el evento ocurra se asignará una

probabilidad del 50%, es decir, p es igual a 0.5.

Una vez que se tienen todas las variables se obtiene la siguiente expresión para
encontrar el tamaño de la muestra.

543,098 ⋅ 1.962 ⋅ 0.5 ⋅ (1 − 0.5)


𝑇m = = 1065.02
0.032 ⋅ (543,098 − 1) + 1.962 ⋅ 0.5 ⋅ (1 − 0.5)
Obteniendo así un tamaño de muestra de 1065.02, esto utilizando un nivel de
confianza del 95% y un margen de error del 3%

Tipos de muestreo
Existen diferentes criterios de clasificación de los diferentes tipos de muestreo,
aunque en general pueden dividirse en dos grandes grupos: métodos de muestreo
probabilísticos y métodos de muestreo no probabilísticos.

Muestreo probabilístico

Los métodos de muestreo probabilísticos son aquellos que se basan en el principio


de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la
misma probabilidad de ser elegidos para formar parte de una muestra y,
consiguientemente, todas las posibles muestras de tamaño n tienen la misma
probabilidad de ser seleccionadas. Sólo estos métodos de muestreo

probabilísticos nos aseguran la representatividad de la muestra extraída y son, por


tanto, los más recomendables. Dentro de los métodos de muestreo probabilísticos
encontramos los siguientes tipos:

6
 Muestreo aleatorio simple.
 Muestreo aleatorio sistemático.
 Muestreo aleatorio estratificado.
 Muestreo aleatorio por conglomerados.

Existen una serie de pasos y criterios para poder determinar si se debe utilizar el
muestreo probabilístico, los cuales se presentan a continuación:

1. Cuando se tiene que reducir el sesgo en el muestreo: este método de


muestreo se utiliza comúnmente cuando el sesgo debe ser mínimo.
2. Cuando la población es diversa: cuando el tamaño de la población es grande
y diversa, este método de muestreo es útil ya que ayuda a los investigadores
a crear muestras que representan completamente a la población.
3. Para crear una muestra precisa: el muestreo probabilístico ayuda a los
investigadores a crear una muestra precisa de su población. Los
investigadores pueden utilizar este método para crear un tamaño de muestra
preciso que les pueda ayudar a obtener datos bien definidos.

El muestreo probabilístico presenta algunas ventajas, como que es más rentable,


es simple y no es técnico, ya que este método de muestreo no requiere ningún
conocimiento técnico debido a la simplicidad con la que puede realizarse.

Muestreo no probabilístico
A veces, para estudios exploratorios, el muestreo probabilístico resulta
excesivamente costoso y se acude a métodos no probabilísticos, aun siendo
conscientes de que no sirven para realizar generalizaciones (estimaciones
inferenciales sobre la población), pues no se tiene certeza de que la muestra
extraída sea representativa, ya que no todos los sujetos de la población tienen la
misma probabilidad de ser elegidos. En general se seleccionan a los sujetos
siguiendo determinados criterios procurando, en la medida de lo posible, que la
muestra sea representativa.

7
En algunas circunstancias los métodos estadísticos y epidemiológicos permiten
resolver los problemas de representatividad aun en situaciones de muestreo no
probabilístico, por ejemplo, los estudios de caso-control, donde los casos no son
seleccionados aleatoriamente de la población.

Entre los métodos de muestreo no probabilísticos más utilizados en investigación


encontramos:

 Muestreo por cuotas.


 Muestreo intencional o de conveniencia.
 Bola de nieve.
 Muestreo Discrecional.

Para utilizar este tipo de muestreo hay que tomar en cuenta algunos factores, los
cuales se presentan a continuación:

1. Este tipo de muestreo se usa para indicar si existe un rasgo o característica


particular en una población.
2. Esta técnica de muestreo es ampliamente utilizada cuando los investigadores
realizan investigaciones cualitativas, estudios piloto o investigación
exploratoria.
3. El muestreo no probabilístico se usa cuando los investigadores tienen un
tiempo limitado para llevar a cabo la investigación o tienen limitaciones
presupuestarias.
4. El muestreo no probabilístico se realiza para observar si un tema en particular
necesita un análisis en profundidad. Mejora tu muestreo siguiendo estos
consejos.

Intervalos de confianza
Un intervalo de confianza es un rango de valores, derivado de los estadísticos de la
muestra, que posiblemente incluya el valor de un parámetro de población
desconocido. Debido a su naturaleza aleatoria, es poco probable que dos muestras
de una población en particular produzcan intervalos de confianza idénticos. Sin

8
embargo, si usted repitiera muchas veces su muestra, un determinado porcentaje
de los intervalos de confianza resultantes incluiría el parámetro de población
desconocido.

En el caso de la imagen anterior, la línea negra horizontal representa el valor fijo de


la media desconocida de la población, representada por la letra griega mu “µ”. Los
intervalos de confianza azules verticales que se sobreponen a la línea horizontal
contienen el valor de la media de la población. El intervalo de confianza rojo que
está completamente por debajo de la línea horizontal no lo contiene. Un intervalo de
confianza de 95% indica que 19 de 20 muestras (95%) de la misma población
producirán intervalos de confianza que contendrán el parámetro de población.

Ejemplo

Un fabricante desea saber si la longitud media de los lápices que produce es


diferente de la longitud objetivo. El fabricante toma una muestra aleatoria de lápices
y determina que la longitud media de la muestra es 52 milímetros y el intervalo de
confianza de 95% es (50,54). Por lo tanto, usted puede estar 95% seguro de que la
longitud media de todos los lápices se encuentra entre 50 y 54 milímetros.

Teorema del límite central


El teorema central del límite (TCL) es una teoría estadística que establece que, dada
una muestra aleatoria suficientemente grande de la población, la distribución de las
medias muestrales seguirá una distribución normal.

9
Además, el TCL afirma que a medida que el tamaño de la muestra se incrementa,
la media muestral se acercará a la media de la población. Por tanto, mediante el
TCL podemos definir la distribución de la media muestral de una determinada
población con una varianza conocida. De manera que la distribución seguirá una
distribución normal si el tamaño de la muestra es lo suficientemente grande.

El teorema central del límite tiene una serie de propiedades de gran utilidad en el
ámbito estadístico y probabilístico. Las principales son:

 Si el tamaño de la muestra es suficientemente grande, la distribución de las


medias muestrales seguirá aproximadamente una distribución normal. El TCL
considera una muestra como grande cuando el tamaño de esta es superior a
30. Por tanto, si la muestra es superior a 30, la media muestral tendrá una
función de distribución próxima a una normal. Y esto se cumple
independientemente de la forma de la distribución con la que estamos
trabajando.
 La media poblacional y la media muestral serán iguales. Es decir, la media de
la distribución de todas las medias muestrales será igual a la media del total
de la población.
 La varianza de la distribución de las medias muestrales será σ²/n. Que es la
varianza de la población dividido entre el tamaño de la muestra.

Que la distribución de las medias muestrales se parezca a una normal es


tremendamente útil. Porque la distribución normal es muy fácil de aplicar para
realizar contrastes de hipótesis y construcción de intervalos de confianza. En
estadística que una distribución sea normal es bastante importante, dado que
muchos estadísticos requieren este tipo de distribución. Además, el TCL nos
permitirá hacer inferencia sobre la media poblacional a través de la media muestral.
Y esto es de gran utilidad cuando por falta de medios no podemos recolectar datos
de toda una población.

El TLC Permite averiguar la probabilidad de que la media de una muestra concreta


esté en un cierto intervalo, así como, calcular la probabilidad de que la suma de los

10
elementos de una muestra se muestre en un cierto intervalo en un cierto intervalo y
por último también permite inferir la media de la población a partir de una muestra.

Si una población tiene media y desviación estándar y tomamos muestras de un


tamaño mayor a 30, la media de estas muestras sigue una distribución normal, dada
por:

𝜎
𝑁(𝜇, )
√𝑛
Donde:

 𝜎= Desviación estándar muestral


 𝜇 =Media muestral
 𝑛= Tamaño de la muestral

11
Fuentes de consulta
López, P. (2004). Población muestra y muestreo. Punto Cero v.09 n.08
Cochabamba 2004. Disponible en:
http://www.scielo.org.bo/scielo.php?script=sci_arttext&pid=S1815-
02762004000100012

Vargas, R. (2008). Estadística II. Programa de Administración Pública Territorial.


Colombia: Escuela Superior de Administración Pública. Disponible en:
http://www.esap.edu.co/portal/wp-content/uploads/2017/10/6-Estadstica-ii.pdf

Universidad de Sonora. (s/a). Muestreo. Disponible en:


http://www.estadistica.mat.uson.mx/Material/elmuestreo.pdf

12

También podría gustarte