Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TEORIA DE MUESTREO
Estudia la relación entre una población y las muestras tomadas de ellas.
Es muy útil para estimar magnitudes desconocidas de una población, tales como media y varianza (llamadas a
menudo “parámetros de la población”) a partir del conocimiento de esas magnitudes sobre las muestras (llamados
estadísticos).
También es útil para determinar si las diferencias observadas entre dos muestras son debidas a variaciones
fortuitas o si son realmente significativas.
Para que las conclusiones en la Teoría de Muestreo y de la inferencia estadística sean válidas, las muestras deben
escogerse representativas de la población. Una forma de obtener una muestra representativa es mediante muestreo
aleatorio, en el que cada elemento de la población tiene la misma probabilidad de ser incluido en la muestra.
DISTRIBUCIONES DE MUESTREO
Considerando todas las posibles muestras de tamaño N. Para cada muestra se puede calcular un estadístico (media
o desviación típica) que variará de muestra en muestra, obteniéndose una distribución del estadístico que se llama
distribución de muestreo.
Suponga que se han seleccionado muestras aleatorias de tamaño 20 en una población grande. Se calcula la media
muestral x para cada muestra; la colección de todas estas medias muestrales recibe el nombre de distribución
muestral de medias, lo que se puede ilustrar en la siguiente figura:
Suponga que se eligen muestras aleatorias de tamaño 20, de una población grande, y se calcula la deviación
estándar de cada una. La colección de todas estas desviaciones estándar muestrales se llama distribución muestral
de la desviación estándar, y lo podemos ver en la siguiente figura:
Ejemplo:
Una población consta de los números: 0, 2, 4 y 6
Consideramos todas las posibles muestras de tamaño 2 que pueden tomarse con reposición (con reemplazo)
a) Hallar la media de la población
b) Hallar la desviación típica de la población
c) La media de la distribución de muestreo de medias
d) La desviación típica de la distribución de muestreo de medias (o sea, el error típico de medias)
0+2+4+6
𝜇= = 3,0
4
(0 − 3) + (2 − 3) + (4 − 3) + (6 − 3)
= = 2,236
4
c) La media de la distribución de muestreo de medias
0∙1+1∙2+2∙3+3∙4+4∙3+5∙2+6∙1
𝑥̅ = = 3,0
16
(0 − 3) ∙ 1 + (1 − 3) ∙ 2 + (2 − 3) ∙ 3 + (3 − 3) ∙ 4 + (4 − 3) ∙ 3 + (5 − 3) ∙ 2 + (6 − 3) ∙ 1
𝑠= = 1,58
16
𝝈
𝒙=µ y 𝒔=
√𝒏
En el caso del ejemplo anterior, aplicando estas fórmulas directamente obtendremos el mismo resultado:
𝜎 2,236
𝒙 = µ = 𝟑, 𝟎 y 𝑠= = = 1,58
√𝑛 √2
𝝈 𝑵−𝒏
𝒙=µ y 𝒔= ∙
√𝒏 𝑵−𝟏
Es esencial conocer los siguientes principios:
- Se observa en la gráfica que a medida que n es cada vez mayor, la distribución muestral se aproxima más
a una distribución normal
- Se observa en la gráfica que a medida que n es cada vez mayor, no importando la forma de la distribución
original de la población, la distribución muestral seguirá una distribución normal.
2. Si n 30 y la población original tiene una distribución normal, entonces las medias muestrales tienen una
𝝈
distribución normal con una media y una desviación estándar .
√𝒏
Es el valor de una variable aleatoria cuya función de distribución se aproxima a la de la distribución normal
estándar cuando 𝒏 → ∞
Ejemplos:
1.- Las estaturas de 3000 estudiantes de una universidad están normalmente distribuidas con media 1,73 m y
desviación típica de 0,08 m. Si se toman 80 muestras de 25 estudiantes cada una. ¿Cuáles serán la media y la
desviación típica esperadas de la resultante distribución de muestreo de medias, si el muestreo se hizo a) con
reposición y b) sin reposición?
Datos:
= 1,73 m
= 0,08 m
N = 3000
n = 25
a) Con reposición
𝜎 0,08
𝑥̅ = µ = 1,73 𝑚 y 𝑠= = = 0,016 𝑚
√𝑛 √25
a) Sin reposición
𝜎 𝑁−𝑛 0,08 3000 − 25
𝑥̅ = µ = 1,73 𝑚 y 𝑠= ∙ = ∙ = 0,016 𝑚
√𝑛 𝑁−1 √25 3000 − 1
2.- 500 balines de rolinera tiene un peso medio de 5,02 g y una desviación típica de 0,30 g. Hallar la probabilidad
de que una muestra al azar de 100 bolas de ese conjunto tenga un peso total (a) entre 4,96 y 5,00 g y b) más
de 5,10 g.
Datos de la Población:
= 5,02 g
p
= 0,30 g
N = 500
Datos de la Muestra:
4,96 x
n = 100 5,00 MUESTRA
a) p (4,96 ≤ x ≤ 5,00) = ?
Para hallar la probabilidad necesitamos determinar para la distribución de muestreo de medias, la media 𝒙 y
la desviación estándar s. Aplicamos las siguientes formulas por ser una población finita y muestreo sin
reposición:
𝐴( , , ) = 0,4868 y 𝐴( , , ) = 0,2704
b) p (x 5,10) = ?
Datos:
p
= 513,3 m2
= 31,5 m2
n = 40
p (510,0 ≤ x ≤ 520,0) = ?
x
510,0 520,0
=513,3
Llevamos los valores de x a unidades estándar
̅
𝑍=
/√
, , , ,
𝑍( , )= = - 0,66 y 𝑍( , )= = 1,34
, /√ , /√
𝐴( , , ) = 0,2454 y 𝐴( , , ) = 0,4099
4.- Una empresa eléctrica fabrica bombillos que tienen una duración que se distribuye aproximadamente en
forma normal, con media de 800 horas y desviación estándar de 40 horas. Encuentre la probabilidad de que
una muestra aleatoria de 16 bombillos tenga una vida promedio de menos de 775 horas.
Datos:
= 800 h
= 40 h
p
n = 16
p (𝑥̅ 775) = ?
800 x
775
Llevamos los valores de x a unidades estándar
̅
𝑍=
/√
𝑍( )= = - 2,50
/√
Buscando en la tabla este valor de Z, tenemos que:
𝐴( ) ,
La probabilidad de que la media de la muestra de 16 bombillos sea menor a 775 horas es de 0,62 %.
5.- Las estaturas de 1000 estudiantes están distribuidas aproximadamente en forma normal con una media de
174,5 centímetros y una desviación estándar de 6,9 centímetros. Si se extraen 200 muestras aleatorias de
tamaño 25 sin reemplazo de esta población, determine:
(a) El número de las medias muestrales que caen entre 172,5 y 175,8 centímetros.
(b) El número de medias muestrales que caen por debajo de 172 centímetros.
(a) El número de las medias muestrales que caen entre 172,5 y 175,8 centímetros.
Datos de la población:
N = 1000 p
= 174,5 cm
= 6,9 cm
Datos de la muestra
200 muestras
n = 25
Como se puede observar en este ejercicio se cuenta con una población finita y un muestreo sin reemplazo,
por lo que se tendrá que agregar el factor de corrección
𝑁−𝑛
𝑁−1
6.- Algunos pasajeros murieron cuando un taxi acuático se hundió en el Inner Harbor de Baltimore. Los hombres
suelen ser más pesados que las mujeres y los niños; por lo tanto, supongamos que al cargar un taxi acuático
la situación extrema es aquella en la que todos los pasajeros son hombres. En concordancia con los datos de
la National Health and Nutrition Examination Survey, suponga que los pesos de los hombres se distribuyen
normalmente, con una media de 172 libras y una desviación estándar de 29 libras.
a. Calcule la probabilidad de que, si se selecciona un hombre al azar, su peso sea mayor que 175 libras.
b. Calcule la probabilidad de que 20 hombres elegidos al azar tengan una media mayor que 175 libras (de
manera que su peso total exceda la capacidad segura de 3500 libras).
̅
𝑍( ) = = = 0,10
La probabilidad de que un hombre elegido al azar pese más de 175 libras es del 46 %
Solución b): Use utiliza el teorema del límite central, porque estamos trabajando con la media de una muestra
de 20 hombres y no con un solo hombre. Aunque el tamaño de la muestra no es mayor que 30, la población
original de hombres tiene una distribución normal, de manera que las muestras de cualquier tamaño producirán
medias distribuidas normalmente. Puesto que estamos trabajando con una distribución de medias muestrales,
debemos utilizar la fórmula:
̅
𝑍= = = 0,46
/√ /√
Si 𝒙 es la media de una muestra aleatoria de tamaño n tomada de una población normal que tiene media µ y
desviación típica , entonces:
𝑥̅ − 𝜇
𝑡=
𝑠/√𝑛
t es el valor de una variable aleatoria con distribución t y parámetro v = n – 1
Ejemplos:
1. El valor t con v = 14 grados de libertad que deja un área de 0,025 a la izquierda, y por tanto un área de 0,975
a la derecha. Buscando en la tabla t de Student es:
t0,975 = – t0,025 = – 2,145
Si se observa la tabla t de Student, el área sombreada de la curva está en la cola derecha, es por eso que tiene
que hacerse la resta de 1 – . La manera de encontrar el valor de t es buscar el valor de en el primer
renglón de la tabla y luego buscar los grados de libertad en la primera columna y donde se intercepten
y v se obtendrá el valor de t.
2. Un ingeniero químico afirma que el rendimiento medio de la población de cierto proceso en lotes es
500 gramos por milímetro de materia prima. Para verificar esta afirmación toma una muestra de 25 lotes
cada mes. Si el valor de t calculado cae entre – t0,05 y t0,05 ; queda satisfecho con su afirmación. ¿Qué
conclusión extraería de una muestra que tiene una media de 518 gramos por milímetro y una desviación
estándar de 40 gramos? Suponga que la distribución de rendimientos es aproximadamente normal.
Datos
= 500 g/mm 1– = zona de aceptación
# Lotes = 25
𝑥̅ = 518 g/mm
/2 /2 = zona de rechazo
s = 40 g/mm
– t0,05 t0,05
Solución:
Este es un valor muy por arriba de 1,711. Si se desea obtener la probabilidad de obtener un valor de t con
24 grados de libertad igual o mayor a 2,25 se busca en la tabla y es aproximadamente de 0,02. De aquí que es
probable que el fabricante concluya que el proceso produce un mejor producto del que piensa.
DISTRIBUCIONES DE MUESTREO DE PROPORCIONES
Si una población es infinita y la probabilidad de ocurrencia de un suceso (éxito) es p, mientras la probabilidad de
que no ocurra es q = 1 – p, tenemos una distribución de muestreo de proporciones cuya media y desviación típica
es:
𝒑∙𝒒 𝒑∙(𝟏 𝒑)
𝒙=𝒑 y 𝒔= =
𝒏 𝒏
Ejemplos:
1.- Hallar la probabilidad de que en 120 lanzamientos de una moneda (a) entre 40 % y 60 % sean caras y (b) 5/8 o
más sean caras.
(a) 𝒑 (𝟒𝟎 % ≤ 𝒙 ≤ 𝟔𝟎 %) = ?
N = 120 lanzamientos x
40 % 60 %
40 % de 120 es 48
48 72
60 % de 120 es 72
Método # 1: Como el número de caras es una variable discreta, podemos utilizar la aproximación normal a
la binomial.
𝑍( )= = - 2,19 y 𝑍( )= = 2,19
, ,
𝐴( ) = 0,4857 y 𝐴( ) = 0,4857
∙ ∙
𝑥̅ = 𝑝 = = 0,50 y 𝑠= = = 0,0456
𝐴( , , ) = 0,4857 y 𝐴( , , ) = 0,4857
𝟓
(b) 𝒑 (𝒙 ̅ ≥ ) = ?
𝟖
𝐴( , , ) = 0,4969
p = 46 % = 0,46
q = 1 – p = 0,54
n = 200
p (𝑥̅ 050) = ?
∙ ( , )∙( , )
𝑥̅ = 𝑝 = = 0,46 y 𝑠= = = 0,0352
𝐴( , , ) = 0,3729
p = 46 % = 0,46
q = 1 – p = 0,54
n = 1000
p (𝑥̅ 050) = ?
∙ ( , )∙( , )
𝑥̅ = 𝑝 = = 0,46 y 𝑠= = = 0,0158
𝐴( , , ) = 0,4943
p = 60 % (0,60) y q = 0,40 p
Datos de la Muestra:
n = 800 estudiantes
0,55 de 800 es 440 estudiantes
440 480
p (x 440) = ?
Método # 1: aproximación de la distribución normal a la binomial.
𝑍( )= = - 2,89
,
𝐴( ) = 0,4981
La probabilidad de que, al extraer una muestra de 800 estudiantes de esa universidad, la proporción de
estudiantes que fuman cigarrillos sea menor al 55 % es del 0,19 %.
Método # 2: Resolviendo mediante las fórmulas dadas para la Distribución de Muestreo de Proporciones
∙ ( , )∙( , )
𝑥̅ = 𝑝 = 0,60 y 𝑠= = = 0,0173
𝐴( ) = 0,4981