Está en la página 1de 18

MUESTREO

Héctor Daniel Lerma González


Una pregunta frecuente cuando se realiza una investigación es ¿Cuántos elementos debo
tomar para que la muestra sea representativa? La pregunta que realmente desean formular
es ¿Cuánto debe ser el tamaño de la muestra? A través del estudio que realizaremos del
muestreo vamos a comprender que muestra representativa y tamaño de la muestra son dos
aspectos diferentes, aunque pueden estar relacionados.
Las personas que hacen esta pregunta, siempre solicitan la respuesta de inmediato, lo cual
no es posible. Calcular un tamaño de muestra implica la aplicación de varios conceptos
matemáticos que los domina una persona que maneja la estadística, junto con el
investigador quien manifiesta la precisión y el nivel de confianza que necesita en el estudio
que realice, puesto que tiene el conocimiento del tema a investigar y de las variables del
estudio; por consiguiente, se requiere la participación de los dos para poder calcularla.
El muestreo se utiliza para calcular (inferir) un parámetro de la población cuando no es
posible tomar todas las mediciones a la población. Por ejemplo, estimar el promedio de la
población a través de una muestra. Es lógico, que un valor calculado de una parte de la
población es muy difícil que sea igual al valor que se calcula con todos los elementos de la
población, en esta parte aparece la incertidumbre sobre ¿cómo puede obtener un promedio
igual o muy parecido al de la población a partir de una muestra?
Cuando se realiza un muestreo nunca se puede saber el valor exacto del promedio de la
población (μ) calculado a partir del promedio de la muestra. Pero, si se puede

obtener una aproximación a través de un intervalo de confianza (


) obtenido con los valores de la muestra: la media , la desviación estándar
(S) y el tamaño de la muestra (n). La Figura 1 muestra la relación entre los elementos de la
población y los de la muestra.

Figura 1. Relación entre la población y la muestra


En este curso vamos a estudiar algunos conceptos y cálculos fundamentales del muestreo,
entre ellos:
1. Población
2. Muestra
3. Muestra representativa
4. Selección aleatoria
5. Muestreo probabilístico
6. Marco muestral
7. Unidad de observación
8. Error de muestreo
9. Tipos de muestreo
10. Número de muestras posibles
11. Tamaño de la muestra
12. Error estándar
13. Teorema del límite central
14. Intervalo de confianza

1. POBLACIÓN

Es la totalidad de los elementos a estudiar. Se simboliza la cantidad de estos elementos con


la N (mayúscula). Sus parámetros se escriben con letras griegas, por ejemplo, la media
aritmética se simboliza por µ y la desviación estándar por σ; observe que son letras griegas.

Figura 2. Población según elementos y parámetros

La población de estudio la define el investigador según los objetivos que pretenda


desarrollar. Algunos ejemplos de población pueden ser:
El Grupo 1 de 70 semestre (enero- junio) de 2020, matriculado en el programa Ciencias del
Deporte y la Recreación de la Universidad Tecnológica de Pereira.
Los Grupos 1 y 2 de 70 semestre (enero- junio) de 2020, matriculados en el programa
Ciencias del Deporte y la Recreación de la Universidad Tecnológica de Pereira.
Todos los estudiantes de primer semestre (enero- junio) de 2020, matriculados en el
programa Ciencias del Deporte y la Recreación de la Universidad Tecnológica de Pereira.
Todos los estudiantes (enero- junio) de 2020, matriculado en el programa Ciencias del
Deporte y la Recreación de la Universidad Tecnológica de Pereira.
Todos los estudiantes de pregrado jornada diurna de la Universidad Tecnológica de Pereira
durante el primer semestre de 2020.

2. MUESTRA

La muestra es un subconjunto de la población, es decir, está compuesta por algunos


elementos de la población. Este número de elementos se simboliza con la letra “n”
(minúscula).
Se utiliza una muestra, en lugar de realizar los cálculos a todos los elementos de la
población, por varias razones, entre ellas el gran tamaño de la población, dispersión
geográfica, limitaciones técnicas o altos costos de la medición.
Los valores calculados en la muestra se denominan estadísticos. Son ejemplos de
estadísticos el promedio y la desviación estándar (s). Observe que para su notación
se utilizan letras latinas.
El muestreo tiene como objetivo seleccionar algunos elementos de la población (muestra)
para calcular los “Estadísticos” que estimen a los “Parámetros” correspondientes de la
población.
La muestra debe cumplir ciertos requisitos, ente ellos, tener un tamaño suficiente, ser
representativa de la población y los elementos deben ser seleccionados aleatoriamente, es
decir, al azar.

Figura 3. Población y muestra según parámetros y estadísticos


3. MUESTRA REPRESENTATIVA

Una muestra es representativa cuando puede considerarse un miniuniverso. Esto se da


cuando se cumplen estas 3 condiciones:
 Cuando contiene elementos con las características relevantes de la población. Por
ejemplo, si en la población hay mujeres y hombres, en la muestra debe haber mujeres y
hombres.

 La proporción de los elementos relevantes de la muestra debe ser la misma de la


población. Por ejemplo, si el universo está compuesto por 70% hombres y 30% de
mujeres, la muestra debe estar conformada por el 70% de hombres y el 30% de mujeres.

 Todos los elementos de la muestra deben pertenecer a la población. Un ejemplo sería, si


el estudio es sobre niños menores de 10 años en Pereira, no debe haber en la muestra
niños menores de 10 años de Dosquebradas. Si el estudio tiene como población a los
estudiantes de la Universidad Tecnológica de Pereira (UTP), no debe haber en la muestra
estudiantes de otras universidades.

El Cuadro 1 contiene un ejemplo de una muestra representativa de una población de 123


jugadores de varias modalidades deportivas.

Factorial
5!= 5*4*3*2*1= 120

5!= 5*4*3!

1!=1
0!=1

10!/8! = (10∗9∗8!)/8!
= 90

4. MUESTRA PROBABILÍSTICA

Es una muestra que cumple la condición de seleccionar aleatoriamente sus elementos. Lo


ideal garantiza que cada elemento de la población tenga la misma probabilidad de ser
seleccionado. Bajo esta condición, se puede aplicar los modelos matemáticos diseñados
para el muestreo.
5. MUESTRA NO PROBABILISTICA
En este caso, los elementos de la muestra son seleccionados según la conveniencia del
investigador (muestreo por conveniencia), o porque voluntariamente las personas se
ofrecieron para el experimento (muestreo por voluntarios). Por ejemplo, en esta pandemia
se están ofreciendo personas para probar la vacuna contra el coronavirus. En estos dos
casos no se aplican los cálculos para tamaño de muestra e intervalo de confianza.

6. MARCO MUESTRAL

Es el listado que contiene las unidades de observación, de donde pueden ser seleccionados
los elementos de la muestra (unidades muestrales). Dicho listado debe enumerarse, para
facilitar la elección al generar números aleatorios.
Pueden ser seleccionadas como unidades muestrales: viviendas, manzanas, personas, dedos
pulgares, ciudades, etc., eso lo define el investigador, según el objetivo del muestreo.

7. UNIDAD DE OBSERVACIÓN

Es el elemento al cual se le realiza la medición. La unidad muestral puede ser la misma


unidad de observación o estar compuesta por varias unidades de observación. Un ejemplo
del último caso es la selección de manzanas para la muestra como unidades muestrales,
pero realizar las mediciones a las personas que habitan en ellas, como unidades de
observación.

8. ERROR DE MUESTREO

Es la diferencia numérica entre el valor encontrado en la muestra y el valor del parámetro.


Para el cálculo de la muestra el investigador propone un error de muestreo determinado.
Figura 4. Curva normal según error de muestreo

9. TIPOS DE MUESTREO
Entre los muestreos probabilísticos se tienen: el muestreo irrestricto aleatorio, el
sistemático, el estratificado, el de conglomerados y los multietápicos.

9.1 MUESTREO ALEATORIO SIMPLE

En este muestreo todos los elementos de la muestra se seleccionan directamente del espacio
muestral y tienen una probabilidad igual y conocida de pertenecer a ella. Los elementos del
espacio muestral se enumeran y luego, mediante uno de los mecanismos de selección
aleatoria se sacan uno a uno los elementos que integrarán la muestra. Se recomienda este
muestreo cuando los elementos de la población son homogéneos.

Figura 5. Población según elementos para


seleccionar una muestra aleatoria simple

9.2 MUESTREO SISTEMÁTICO

En este caso, por lo general, los elementos de la población no se numeran debido a que hay
mucha cantidad de elementos en el espacio muestral. Este muestreo es muy parecido al
aleatorio simple.
Se tiene el número total de unidades de la población y cada cierta cantidad se selecciona
uno de estos elementos para la muestra. Ejemplo, se tiene una población de 1.000 historias
clínicas y una muestra de n=10. Se divide 10/1.000 = 1/100, esto significa que se escoge
una historia de cada 100.
La primera historia se saca aleatoriamente entre las primeras 100 historias. Para ello, se
genera un número aleatorio entre 1 – 100. Si esta primera historia fue, por ejemplo, la
número 50, las 10 historias para la muestra serán las correspondientes a los números: 50,
150, 250, 350, 450, 550, 650, 750, 850, 950; es decir, se selecciona la primera
aleatoriamente y el resto cada 100 historias. La Figura 6 muestra el caso donde la primera
historia seleccionada fue la número 50 y se van a seleccionar 10 muestras.
Figura 6. Muestreo sistemático según selección de elementos
9.3 MUESTREO ESTRATIFICADO

La población se divide en grupos o estratos y cada estrato es homogéneo. Un estrato es


diferente de los otros, pero sus propios elementos son homogéneos. Los estratos pueden ser
conformados teniendo en cuenta algunas características relevantes para el estudio, por
ejemplo, la característica género, es decir, se hace un estrato de mujeres y otro de hombres.
Es un tipo de muestreo que ayuda a la representatividad de la muestra.

Figura 7. Muestreo estratificado según estratos

9.3 MUESTREO POR CONGLOMERADOS

La población se subdivide en varios grupos o conglomerados, donde cada conglomerado


contiene elementos heterogéneos, es decir, diferentes. Se toma una muestra, pero las
unidades muestrales son conglomerados o parte de ellos, luego, se realizan las respectivas
mediciones a cada uno de los elementos seleccionados de cada conglomerado.

Figura 8. Muestreo por conglomerados según conglomerados


Por ejemplo, se realizará un estudio sobre consumo de psicoactivos en estudiantes de
secundaria en un colegio de1.200 estudiantes, donde hay 60 salones. La muestra al final
está compuesta de estudiantes, pero primero debo seleccionar los salones que van a
participar en el muestreo, cada conglomerado es un salón. Se seleccionan salones para la
muestra y se toma información de todos los estudiantes de cada salón.

9.4 MUESTREO MULTIETÁPICO

Es un muestreo más complejo debido al gran tamaño de la población. La unidad de


observación no se selecciona directamente, es necesario seleccionar otras unidades antes de
llegar a ella. Por ejemplo, se seleccionan primero manzanas, luego cuadras, luego casas y
luego las personas de la casa.
10. TAMAÑO DE LA MUESTRA

La muestra debe tener un número de elementos lo suficientemente grande, para alcanzar el


criterio de precisión que se desee respecto a la estimación de los parámetros.
Este es el tamaño de la muestra para estimar la media poblacional en un muestreo aleatorio
simple:
n0
Z2 σ2
n0 = 2 n = 1+ n0
d ( )
N

El tamaño de la muestra depende de la variabilidad de los valores de la población, del nivel


de confianza, de la precisión que se desee.
10 El tamaño de la muestra depende directamente de la variabilidad de los elementos
de la población (σ2). Si todos los elementos de la población son idénticos respecto a
determinada variable, solo se requiere uno de ellos como muestra; pero si son muy
distintos el tamaño de la muestra es grande. El tamaño de la muestra es directamente
proporcional a dicha variabilidad, la cual es representada por el valor de la varianza.

11 El tamaño de la muestra depende directamente del porcentaje de intervalos de


confianza que deseamos contengan a la media poblacional. Este nivel de confianza se
refleja en el valor de z, denominado “Coeficiente de confianza”. El valor más utilizado es
Z=2, el cual corresponde a un nivel de confianza del 95%. Este nivel del 95% se interpreta
de la siguiente manera: el 95 % de los intervalos contienen la media población, espero que
el mio sea uno de ellos, es decir, tengo 0.95 de probabilidad de que mi intervalo contenga
la media poblacional.

Figura 9. Intervalos de confianza que contienen la media poblacional


 El tamaño de la muestra es inversamente proporcional a la precisión que desee el
investigador, o sea, al error permisible (d). Si se quiere que el valor encontrado en la
muestra esté muy cerca del valor poblacional, el tamaño de la muestra debe ser grande. A
más precisión, más tamaño de muestra.

Para cada uno de los otros tipos de muestreo existen fórmulas específicas, con alguna
diferencia entre ellas, pero conservan los principios del muestreo aleatorio simple.

MUESTRAS POSIBLES
La cuestión es diseñar una sola muestra, pero…
¿Existe una sola muestra? ¿Cuántas muestras son posibles?

Figura 10. Muestras y sus respectivas medias

La realidad es que se selecciona una sola muestra de muchas posibles.

Contestemos, entonces la pregunta ¿Cuántas muestras son posibles?


Primero establezcamos las condiciones de la selección:
 El elemento seleccionado, no puede ser de nuevo seleccionado, esto asegura que
todos los elementos de la muestra son diferentes. Este proceso se le denomina
muestreo con población “Finita” o “Sin reemplazo”, es decir, el elemento
seleccionado no regresa a la población, por consiguiente, no puede ser de nuevo
seleccionado.

 No interesa el orden de selección de los elementos. Si el elemento A fue


seleccionado primero que el elemento B, no interesa, lo importante es que los dos
elementos son diferentes.

Bajo estas 2 condiciones, el número de muestras posibles es una combinatoria de n


elementos tomados de una población N.

N!
Combinatoria =
( N −n ) ! n !
Ejemplo:
Se desea realizar un estudio con el objetivo de estimar la fuerza promedio de 30 deportistas,
y el tamaño de la muestra es de 2 deportistas. ¿Cuántas muestras son posibles?

30! 30∗29∗28 ! 30∗29


= = = 435 parejas de deportistas
( 30−2 ) ! 2! ( 28 ! ) 2! 2

Las muestras posibles de tamaño 2 de una población de 30 personas son 435 muestras.
El espacio muestral sería tener cada una de las 435 muestras posibles con el par de números
identificados.
Hay que seleccionar una de ellas. Hay dos formas de hacerlo:
 Se enumeran todas las 435 muestras (marco muestral), se genera un número
aleatorio entre 1 y 435, con el número que resulte se selecciona la muestra.
Regularmente este trabajo es muy dispendioso, pues la mayoría de las veces las
muestras posibles suelen ser millones.

 La segunda manera es enumerar los 30 deportistas, del 1 – 30. Luego, se genera un


número aleatorio entre 1 – 30, con este número, seleccionamos el primer elemento
de la muestra; realizamos un procedimiento igual para obtener el segundo número.
Este procedimiento, también, es aleatorio y mucho más fácil.

TEOREMA DEL LÍMITE CENTRAL


EL PROMEDIO DE TODOS LOS PROMEDIOS DE LAS MUESTRAS
El promedio de todos los promedios de las muestras es igual al promedio de la población
(μ).
ERROR ESTÁNDAR
Error estándar es igual a la desviación estándar dividida por la raíz cuadrada del tamaño de
la muestra. Esta es su fórmula:

Figura 11. Curva normal con promedios de muestras y su error estándar

Es la desviación estándar de los valores de los promedios de las muestras. Observe que no
es un error, es una medida de variabilidad igual a la desviación estándar.
La desviación estándar tiene que ver los valores x
El error estándar tiene que ver con los valores
Figura 12. Comparación desviación estándar y error estándar

MUESTREO ALEATORIO SIMPLE


Es una muestra de tamaño n, extraída de una población de tamaño N, donde cada muestra
de tamaño n tiene la misma probabilidad de ser seleccionada.

DISTRIBUCIÓN MUESTRAL
Es la distribución de todos los valores posibles que puede asumir una estadística (el
promedio), calculados a partir de muestras del mismo tamaño, extraídas aleatoriamente de
la misma población.
La forma de construirla es:
 De una población finita de tamaño N, se extraen de manera aleatoria todas las
muestras posibles de tamaño n.

 Se calcula la estadística de interés, por ejemplo, el promedio ( ).

 Hacer una tabla con los valores de la estadística en estudio, su frecuencia absoluta y
relativa.

 Construir su forma funcional, generalmente, a través de una gráfica.

Ejemplo: construir la distribución de la media de la muestra


Se tiene una población de 5 niños con las siguientes edades (años):
 Variable: edad (años)
 Edades: 6, 8, 10, 12, 14
 Población N= 5
 Tamaño de muestra n= 2
 Muestras totales posibles= 25
 Muestras sin reemplazo, es decir, con población finita = 15
 µ = 10 años σ = 2 años

Factorial
5!= 5*4*3*2*1= 120

5!= 5*4*3!

1!=1
0!=1

10!/8! = (10∗9∗8!)/8!
= 90
Factorial
5!= 5*4*3*2*1= 120

5!= 5*4*3!

1!=1
0!=1

10!/8! = (10∗9∗8!)/8!
= 90

Gráfica 13. Niños según edad

1
Niños

0
Edad (años)

Figura 14. Promedios según muestras

4
Muestras

0
6 7 8 9 10 11 12 13 14 15
Promedios (años)
Figura 15. Promedios según muestras

Muestras
3

0
6 7 8 9 10 11 12 13 14
Promedios (años)

CONCLUSIONES

Cuando el muestreo se realiza a partir de una población que sigue una distribución normal,
la distribución de los promedios de la muestra tiene las siguientes propiedades:
La distribución de será normal.
El promedio de todos los promedios de todas las muestras será igual a la media poblacional
de la cual se extrajo.
La varianza de los promedios de las muestras será igual a la varianza de la población
dividida entre el tamaño de muestra.
La desviación estándar de los promedios de las muestras será igual a la desviación estándar
de la población dividida entre la raíz cuadrada del tamaño de muestra.
Factorial
5!= 5*4*3*2*1= 120

5!= 5*4*3!

1!=1
0!=1

10!/8! = (10∗9∗8!)/8!
= 90

TEOREMA DEL LÍMITE CENTRAL

“Dada una población de cualquier forma funcional no normal con un promedio μ


y una desviación estándar σ, la distribución muestral de calculada a partir de muestras
de tamaño n de dicha población, será casi normal con media (μ) y error estándar
igual a (σ /√ n) cuando la muestra es muy grande”.
En estadística se considera una muestra grande cuando es igual o mayor a 30 elementos.
n≥ 30.

CÁLCULO TAMAÑO DE LA MUESTRA

CASO 1
Se desea calcular el tamaño de la muestra para estimar la media poblacional de la fuerza de
80 jugadores de baloncesto. Se desea un nivel de confianza del 95%, un error permisible de
8 Kg, una muestra piloto de 15 deportistas dio una desviación estándar de 46 Kg2 ¿Cuántos
deportistas deben integrar la muestra?

n=

Tamaño población N= 80
Nivel de confianza NC= 95%
z: coeficiente de confianza Z= 2 Z2= 4
2
Desviación estándar muestra piloto S= 12 S= 144
Error permisible d= 3 d2= 9

n0= 64 n= 36

También podría gustarte