Apunte

INFERENCIA ESTADÍSTICA
MÉTODOS Y DISTRIBUCIÓN DE MUESTREOS

DISTRIBUCIONES MUESTRALES
¿Qué es un muestreo?
Una muestra o muestreo es un medio utilizado para inferir algo acerca de una población mediante
la selección de una parte de la misma.
Las principales razones que avalan su utilización son:
ü Naturaleza destructiva de ciertas pruebas

ü La imposibilidad física de revisar a toda la población
ü Altos costos de estudiar toda la población
ü Exceso de tiempo requerido para estudiar a toda la población
ü Resultados adecuados a través de la muestra.
Existen dos tipos de muestreo, la muestra probabilística y la muestra no probabilística.

En la primera de ellas, cada integrante de la población en estudio tiene una probabilidad conocida
de ser incluido en la muestra, lo contrario de la segunda en la que es absolutamente al azar lo que
implica que los resultados pueden estar sesgados (pueden no ser necesariamente representativos)
Dentro del muestreo probabilístico, existen cuatro métodos para definir la muestra:
a) Muestreo Aleatorio Simple: Muestra en la que cada miembro de la población tiene la misma
probabilidad de ser incluido.
b) Muestreo Aleatorio Sistémico: Los miembros de la población en estudio, deberán ser

ordenados (por ejemplo, alfabéticamente), para luego resolver al azar quienes conformarán
la muestra. Otra forma es seleccionar al azar el punto de inicio y a partir de él un k-ésimo
elemento de cada población.
c) Muestreo Aleatorio Estratificado: Una población es dividida en subgrupos o estratos y luego

de cada uno de ellas se selecciona una muestra al azar.
d) Muestreo por Gonglomeración: La población es subdividida en áreas menores, y algunas de

esas áreas se transforman en la muestra, enfocando los esfuerzos sólo en ellas.
¿CÓMO SELECCIONAR EL TAMAÑO DE MUESTRA ÓPTIMO?
Determinación de una muestra:
Para definir cuál debiese ser el tamaño óptimo de una muestra, debemos considerar tres factores
claves:
ü Nivel de confianza deseado.

ü El máximo error permisible por la investigación.
ü La variación en la población que se estudia.
Es habitual leer en un artículo que hace referencia a los resultados del efecto de un medicamento de
prueba en un grupo de la población “…en el 75% de los casos, se presenta una mejoría, siendo el
margen de error del 6% y un nivel de confiabilidad del 95%”.
De la misma manera, asegurar que “tras un muestreo de las materias primas recepcionadas, el 93%
de ellas está en buen estado, con un error del 5% y un nivel de confianza del 97%”.
1
Finalmente, otro ejemplo, es…”el 60% de las mujeres afirma ahorrar habitualmente…, medido a partir
de una muestra representativa que considera el 98% de confiabilidad y un error del 5%”
¿Qué quiere decir lo anterior?
Un nivel de confianza (nc), se entiende como la probabilidad de que el parámetro a estimar o

variable en análisis se encuentre en el intervalo de confianza de la población en estudio, y en ese
contexto los resultados a partir de una muestra sean representativos de dicho % de la población. Se
designa mediante 1 − α, y se suele tomar en tanto por ciento. Los niveles de confianza más usuales
son 95% y 99%.
El nivel de confianza indica la probabilidad de que los resultados de nuestra investigación sean
ciertos: un 95 % de confianza es lo mismo que decir que nos podemos equivocar con una probabilidad
del 5%.
Ese porcentaje permite identificar el valor estadístico Z considerando que la población se distribuye
normalmente, así por ejemplo para un nc de 0.95, Z será 1,96. Ese valor se encontrará en la tabla de
Distribución Normal Estándar N(0,1) y, si es del caso, se podrá obtener a partir de interpolaciones.
A mayor nivel de confianza, mayor tamaño de muestra se requerirá considerar.
El error, se entiende como la media o el porcentaje que está generalmente sujeto a una variación
entre una muestra y otra. Estas variaciones en las posibles muestras de una estadística pueden,
teóricamente, ser expresadas como errores muestrales, sin embargo, normalmente, en la práctica el
error exacto es desconocido. En términos más concretos, es la cantidad en la que varía (suma y
resta) la media muestral como resultado que obtenemos preguntando a una muestra de la población
versus el que obtendríamos si le preguntáramos al total de ella. A menor error mayor muestra se
requiere.
Como parámetro aceptable de error muestral, suele utilizarse un valor que varía entre el 1% (0,01) y
9% (0,09), valor que queda a criterio del encuestador.
Finalmente el nivel de heterogeneidad (p) muestra la variación o diversidad de la población en estudio

a partir de la proporción de individuos que poseen en la población la característica de estudio.
Si no se maneja información se considerará un 50%, definido como un nivel conservador además de

que matemáticamente el resultado de p(1-p) será el máximo alcanzado utilizando 0,5 è 0,5 (1-0,5) =
0,25
Existen diversas formas de calcular el tamaño óptimo de muestra, entre ellas:
Cálculo del tamaño muestral para una población determinada:
Donde:
n = tamaño de la muestra
N = tamaño de la población
Z= valor normal
E = máximo error permitido (nivel de precisión deseado)
p = proporcionalidad o nivel de heterogeneidad de la población
2
Por ejemplo, se desea medir la satisfacción de los asistentes al XVIII Congreso Nacional de
Tecnólogos Médicos realizado en la ciudad, el total de asistentes corresponde a 926 profesionales.
Considerando un nivel de confiabilidad del 95% y un error del 8%.
a) Determine a cuantos tecnólogos debe realizarle la encuesta.

b) ¿Qué ocurre si el error lo considera en un 6%?
c) ¿Qué pasa con el tamaño muestral si el aumenta el nivel de confiabilidad a un 97%?
Cálculo del tamaño de muestra de medias considerando dispersión:
Donde:
Z= valor normal correspondiente al IC deseado
S = estimado de la desviación estándar de la población
E = máximo error permitido (nivel de precisión deseado)
Por ejemplo, un estudiante desea determinar el ingreso medio de los trabajadores del sector minero.
Se desea que el error al estimar la media sea no más de US$100, con un nivel de confianza del 95%
y una desviación estándar de US$1000. Calcule el tamaño de la muestra.
¿Qué ocurre si desea una confiabilidad del 99%?
Cálculo del tamaño de muestra considerando proporción:
La muestra también podrá considerar una proporción de la población en estudio, cuyo tamaño de
muestra óptimo estimado para una proporción será a partir de:
Donde:
p = proporción del universo que se desea considerar
S = estimado de la desviación estándar de la población
E = máximo error permitido
Por ejemplo, se desea conocer si la población compraría un sabor nuevo de una bebida de fantasía.
Se requiere que el cálculo considere un error que esté dentro del 0,10 de la proporción que se tome
de la población, con un nivel de confianza del 90% y sin estimación previa de la proporción de la
población. ¿Cuál es el tamaño de la muestra?
DISTRIBUCIÓN DE MUESTREO DE MEDIAS MUESTRALES:
Al seleccionar sólo a una porción de la población en estudio (una muestra), obviamente nos vemos
enfrentados a la pérdida de representatividad. Así el error de muestreo corresponde a la diferencia
entre el valor estadístico de la muestra y su parámetro correspondiente de la población.
3
Matemáticamente el error es definido como:
Error = (x – u)
Donde:
x= media de la muestra
u= media de la población
¿Para que sirve determinar el error?, veamos el siguiente ejemplo:
Suponga que las prendas fabricadas por cada uno de los 5 trabajadores de una empresa son:
97 – 103 - 96 – 99 y 105
¿Cuál es la media de población si considera el total de los datos?

¿Cuál es la media si considera los primeros tres datos como muestra?
Ahora bien, ¿Cuál es la media si tomamos como muestra la producción del primero y último
trabajador?
¿Y si la muestra ahora la conforman el cuarto y último trabajador?
Del ejemplo anterior, cada uno de los cálculos comprende una media muestral, por lo que conviene
calcular una media de ellas para estimar un valor más certero. Así esta distribución comprende una
DP que consta de todas las medias muestrales posibles de una población y su probabilidad de
ocurrencia. Sirve para organizar las medias muestrales para luego comparar la media poblacional
con la media de las medias muestrales.
Por ejemplo, se presenta la siguiente tabla de distribución para cinco socios de una compañía y el
tiempo que han dedicado a un proyecto conjunto. Si tuviese que determinar las medias considerando
el número de horas de sólo dos socios, tendría diez combinaciones posibles y cuatro medias
coincidentes, pudiendo entre ellas calcular un promedio o media de medias muestrales.
Socio Horas
Irarrazabal 22
Flores 26
Contreras 30
Aguirre 26
Madariaga 22
Por lo tanto, diremos que:
ü La media de las medias muestrales es igual a la media poblacional, llamada también

Teorema del límite central.
ü Mientras que el error estándar o desviación estándar de la distribución muestral de las

medias es igual a la desviación poblacional dividida en la raíz cuadrada del tamaño de la
2
muestra (σ /n )
Desv. est. muestral =
Donde:
σ = desviación poblacional
n = número de elementos de la muestra
4
ESTIMACIONES PUNTUALES E INTERVALOS DE CONFIANZA
¿Siempre podrá conocer la población?
Si no conoce la población o no es posible determinarla con precisión para calcular una muestra, es
posible utilizar el criterio de la Estimación Puntual, que corresponde a un valor, calculado a partir de
la información de muestro, que se emplea para estimar el parámetro de población, en palabras
simples, la estimación de una variable que determine a una muestra estimada, será el mismo valor
que estime para la población.
Ejemplos de estimaciones puntuales son media muestral, desviación estándar muestral, variancia
muestral o relación proporcional de la muestra.
Por ejemplo:
Se registra el número de defectos producidos durante un año por cinco trabajadores seleccionados al
azar. Los defectos observados fueron 12, 4, 7, 14 y 10, sin embargo, no se tiene el registro del total
poblacional (total de errores de conjunto de trabajadores).
-¿Puede calcular la media muestral?

-A partir de la estimación puntual, ¿puede indicar la media poblacional?
Intervalo de Confianza:
Al calcular una estimación puntual, ésta podría no estar tan cerca de la realidad. Sin embargo, nos
podremos acercar a partir de definir un intervalo, que corresponde a una gama de valores obtenidos
a partir de datos de muestreo, de modo que el parámetro ocurre dentro de esa variedad a una
probabilidad específica. El intervalo dentro del cual se espera que esté un parámetro poblacional se
llama intervalo de confianza.
Los dos intervalos que más se utilizan, consideran un 95% y 99% de confiabilidad o confianza (con
desviación estándar de 1,96 y 2,58 respectivamente)
Intervalo de Confianza a partir de una media:
Los intervalos de confianza se calcularán de la forma:
Tal como se ve en la fórmula, aparece nuevamente el estadístico Z, el que es posible extraer de la

Tabla de Distribución Normal.
A partir de lo anterior, los intervalos de confianza de 95% y 99% quedan de la forma:
Gráficamente el Intervalo de Confianza de 95%:
5
Tabla: Distribución Normal è Valor Z: 1,96 (0,4750)
! Ejercicio:
Se selecciona una muestra aleatoria de 256 gerentes de nivel medio, para conocer estimaciones de
sus ingresos anuales. La media muestral corresponde a US$45.420 y la desviación estándar de
US$2.050.
1. A partir de la estimación puntual ¿Cuál debiese ser el ingreso medio estimado de todos los
gerentes de nivel medio (total de la población)?
2. Calcule el intervalo de confianza (95%) para la media de la población?
3. ¿Qué grado de confiabilidad está utilizando en esta estimación?
4. Interprete los datos
5. Determine intervalo de confianza con un 90%
¿Qué sucedería si utilizamos una proporción de la población?
Intervalo de Confianza considerando una proporción de la población:
Cuando hablamos de una “proporción”, diremos que corresponde a un conteo del número de éxitos
con relación al número total muestreado, donde el intervalo de confianza se representa:
Mientras que el error estándar de la proporción muestral:
! Ejemplo:
Suponga que 1600 de los 2000 trabajadores que se muestrean y que pertenecen al sindicado, dijeron
que aceptan poner a votación una propuesta de ajuste de horarios. Si se utiliza un nivel de confianza
de 0,95.
a) ¿Cuál es la estimación de intervalo para la proporción poblacional que estaría a favor?
6
b) Si la propuesta requiere que un 75% esté de acuerdo, ¿con esta estimación podríamos decir que
se aprobaría la propuesta si votaran todos?

Apunte

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Apunte

Cargado por

Copyright:

Formatos disponibles

INFERENCIA ESTADÍSTICA

MÉTODOS Y DISTRIBUCIÓN DE MUESTREOS

Las principales razones que avalan su utilización son:

ü Naturaleza destructiva de ciertas pruebas

Existen dos tipos de muestreo, la muestra probabilística y la muestra no probabilística.

b) Muestreo Aleatorio Sistémico: Los miembros de la población en estudio, deberán ser

c) Muestreo Aleatorio Estratificado: Una población es dividida en subgrupos o estratos y luego

d) Muestreo por Gonglomeración: La población es subdividida en áreas menores, y algunas de

¿CÓMO SELECCIONAR EL TAMAÑO DE MUESTRA ÓPTIMO?

Determinación de una muestra:

ü Nivel de confianza deseado.

¿Qué quiere decir lo anterior?

Un nivel de confianza (nc), se entiende como la probabilidad de que el parámetro a estimar o

A mayor nivel de confianza, mayor tamaño de muestra se requerirá considerar.

Finalmente el nivel de heterogeneidad (p) muestra la variación o diversidad de la población en estudio

Si no se maneja información se considerará un 50%, definido como un nivel conservador además de

Existen diversas formas de calcular el tamaño óptimo de muestra, entre ellas:

Cálculo del tamaño muestral para una población determinada:

a) Determine a cuantos tecnólogos debe realizarle la encuesta.

Cálculo del tamaño de muestra de medias considerando dispersión:

Cálculo del tamaño de muestra considerando proporción:

DISTRIBUCIÓN DE MUESTREO DE MEDIAS MUESTRALES:

Matemáticamente el error es definido como:

¿Para que sirve determinar el error?, veamos el siguiente ejemplo:

¿Cuál es la media de población si considera el total de los datos?

Por lo tanto, diremos que:

ü La media de las medias muestrales es igual a la media poblacional, llamada también

ü Mientras que el error estándar o desviación estándar de la distribución muestral de las

Desv. est. muestral =

ESTIMACIONES PUNTUALES E INTERVALOS DE CONFIANZA

¿Siempre podrá conocer la población?

-¿Puede calcular la media muestral?

Intervalo de Confianza a partir de una media:

Los intervalos de confianza se calcularán de la forma:

Tal como se ve en la fórmula, aparece nuevamente el estadístico Z, el que es posible extraer de la

A partir de lo anterior, los intervalos de confianza de 95% y 99% quedan de la forma:

Gráficamente el Intervalo de Confianza de 95%:

Tabla: Distribución Normal è Valor Z: 1,96 (0,4750)

¿Qué sucedería si utilizamos una proporción de la población?

Intervalo de Confianza considerando una proporción de la población:

Mientras que el error estándar de la proporción muestral:

a) ¿Cuál es la estimación de intervalo para la proporción poblacional que estaría a favor?

También podría gustarte