Documentos de Académico
Documentos de Profesional
Documentos de Cultura
¿Qué es un muestreo?
Una muestra o muestreo es un medio utilizado para inferir algo acerca de una población mediante
la selección de una parte de la misma.
Dentro del muestreo probabilístico, existen cuatro métodos para definir la muestra:
a) Muestreo Aleatorio Simple: Muestra en la que cada miembro de la población tiene la misma
probabilidad de ser incluido.
Para definir cuál debiese ser el tamaño óptimo de una muestra, debemos considerar tres factores
claves:
Es habitual leer en un artículo que hace referencia a los resultados del efecto de un medicamento de
prueba en un grupo de la población “…en el 75% de los casos, se presenta una mejoría, siendo el
margen de error del 6% y un nivel de confiabilidad del 95%”.
De la misma manera, asegurar que “tras un muestreo de las materias primas recepcionadas, el 93%
de ellas está en buen estado, con un error del 5% y un nivel de confianza del 97%”.
1
INFERENCIA ESTADÍSTICA
Finalmente, otro ejemplo, es…”el 60% de las mujeres afirma ahorrar habitualmente…, medido a partir
de una muestra representativa que considera el 98% de confiabilidad y un error del 5%”
El nivel de confianza indica la probabilidad de que los resultados de nuestra investigación sean
ciertos: un 95 % de confianza es lo mismo que decir que nos podemos equivocar con una probabilidad
del 5%.
Ese porcentaje permite identificar el valor estadístico Z considerando que la población se distribuye
normalmente, así por ejemplo para un nc de 0.95, Z será 1,96. Ese valor se encontrará en la tabla de
Distribución Normal Estándar N(0,1) y, si es del caso, se podrá obtener a partir de interpolaciones.
El error, se entiende como la media o el porcentaje que está generalmente sujeto a una variación
entre una muestra y otra. Estas variaciones en las posibles muestras de una estadística pueden,
teóricamente, ser expresadas como errores muestrales, sin embargo, normalmente, en la práctica el
error exacto es desconocido. En términos más concretos, es la cantidad en la que varía (suma y
resta) la media muestral como resultado que obtenemos preguntando a una muestra de la población
versus el que obtendríamos si le preguntáramos al total de ella. A menor error mayor muestra se
requiere.
Como parámetro aceptable de error muestral, suele utilizarse un valor que varía entre el 1% (0,01) y
9% (0,09), valor que queda a criterio del encuestador.
Donde:
n = tamaño de la muestra
N = tamaño de la población
Z= valor normal
E = máximo error permitido (nivel de precisión deseado)
p = proporcionalidad o nivel de heterogeneidad de la población
2
INFERENCIA ESTADÍSTICA
Por ejemplo, se desea medir la satisfacción de los asistentes al XVIII Congreso Nacional de
Tecnólogos Médicos realizado en la ciudad, el total de asistentes corresponde a 926 profesionales.
Considerando un nivel de confiabilidad del 95% y un error del 8%.
Donde:
n = tamaño de la muestra
Z= valor normal correspondiente al IC deseado
S = estimado de la desviación estándar de la población
E = máximo error permitido (nivel de precisión deseado)
Por ejemplo, un estudiante desea determinar el ingreso medio de los trabajadores del sector minero.
Se desea que el error al estimar la media sea no más de US$100, con un nivel de confianza del 95%
y una desviación estándar de US$1000. Calcule el tamaño de la muestra.
¿Qué ocurre si desea una confiabilidad del 99%?
La muestra también podrá considerar una proporción de la población en estudio, cuyo tamaño de
muestra óptimo estimado para una proporción será a partir de:
Donde:
n = tamaño de la muestra
p = proporción del universo que se desea considerar
S = estimado de la desviación estándar de la población
E = máximo error permitido
Por ejemplo, se desea conocer si la población compraría un sabor nuevo de una bebida de fantasía.
Se requiere que el cálculo considere un error que esté dentro del 0,10 de la proporción que se tome
de la población, con un nivel de confianza del 90% y sin estimación previa de la proporción de la
población. ¿Cuál es el tamaño de la muestra?
Al seleccionar sólo a una porción de la población en estudio (una muestra), obviamente nos vemos
enfrentados a la pérdida de representatividad. Así el error de muestreo corresponde a la diferencia
entre el valor estadístico de la muestra y su parámetro correspondiente de la población.
3
INFERENCIA ESTADÍSTICA
Error = (x – u)
Donde:
x= media de la muestra
u= media de la población
Suponga que las prendas fabricadas por cada uno de los 5 trabajadores de una empresa son:
97 – 103 - 96 – 99 y 105
Del ejemplo anterior, cada uno de los cálculos comprende una media muestral, por lo que conviene
calcular una media de ellas para estimar un valor más certero. Así esta distribución comprende una
DP que consta de todas las medias muestrales posibles de una población y su probabilidad de
ocurrencia. Sirve para organizar las medias muestrales para luego comparar la media poblacional
con la media de las medias muestrales.
Por ejemplo, se presenta la siguiente tabla de distribución para cinco socios de una compañía y el
tiempo que han dedicado a un proyecto conjunto. Si tuviese que determinar las medias considerando
el número de horas de sólo dos socios, tendría diez combinaciones posibles y cuatro medias
coincidentes, pudiendo entre ellas calcular un promedio o media de medias muestrales.
Socio Horas
Irarrazabal 22
Flores 26
Contreras 30
Aguirre 26
Madariaga 22
Donde:
σ = desviación poblacional
n = número de elementos de la muestra
4
INFERENCIA ESTADÍSTICA
Si no conoce la población o no es posible determinarla con precisión para calcular una muestra, es
posible utilizar el criterio de la Estimación Puntual, que corresponde a un valor, calculado a partir de
la información de muestro, que se emplea para estimar el parámetro de población, en palabras
simples, la estimación de una variable que determine a una muestra estimada, será el mismo valor
que estime para la población.
Ejemplos de estimaciones puntuales son media muestral, desviación estándar muestral, variancia
muestral o relación proporcional de la muestra.
Por ejemplo:
Se registra el número de defectos producidos durante un año por cinco trabajadores seleccionados al
azar. Los defectos observados fueron 12, 4, 7, 14 y 10, sin embargo, no se tiene el registro del total
poblacional (total de errores de conjunto de trabajadores).
Intervalo de Confianza:
Al calcular una estimación puntual, ésta podría no estar tan cerca de la realidad. Sin embargo, nos
podremos acercar a partir de definir un intervalo, que corresponde a una gama de valores obtenidos
a partir de datos de muestreo, de modo que el parámetro ocurre dentro de esa variedad a una
probabilidad específica. El intervalo dentro del cual se espera que esté un parámetro poblacional se
llama intervalo de confianza.
Los dos intervalos que más se utilizan, consideran un 95% y 99% de confiabilidad o confianza (con
desviación estándar de 1,96 y 2,58 respectivamente)
5
INFERENCIA ESTADÍSTICA
! Ejercicio:
Se selecciona una muestra aleatoria de 256 gerentes de nivel medio, para conocer estimaciones de
sus ingresos anuales. La media muestral corresponde a US$45.420 y la desviación estándar de
US$2.050.
1. A partir de la estimación puntual ¿Cuál debiese ser el ingreso medio estimado de todos los
gerentes de nivel medio (total de la población)?
2. Calcule el intervalo de confianza (95%) para la media de la población?
3. ¿Qué grado de confiabilidad está utilizando en esta estimación?
4. Interprete los datos
5. Determine intervalo de confianza con un 90%
Cuando hablamos de una “proporción”, diremos que corresponde a un conteo del número de éxitos
con relación al número total muestreado, donde el intervalo de confianza se representa:
! Ejemplo:
Suponga que 1600 de los 2000 trabajadores que se muestrean y que pertenecen al sindicado, dijeron
que aceptan poner a votación una propuesta de ajuste de horarios. Si se utiliza un nivel de confianza
de 0,95.
6
INFERENCIA ESTADÍSTICA
b) Si la propuesta requiere que un 75% esté de acuerdo, ¿con esta estimación podríamos decir que
se aprobaría la propuesta si votaran todos?