Está en la página 1de 16

DISTRIBUCIONES DE MUESTREO

TEORIA DE MUESTREO
Estudia la relación entre una población y las muestras tomadas de ellas.
Es muy útil para estimar magnitudes desconocidas de una población, tales como media y varianza (llamadas a
menudo “parámetros de la población”) a partir del conocimiento de esas magnitudes sobre las muestras (llamados
estadísticos).
También es útil para determinar si las diferencias observadas entre dos muestras son debidas a variaciones
fortuitas o si son realmente significativas.
Para que las conclusiones en la Teoría de Muestreo y de la inferencia estadística sean válidas, las muestras deben
escogerse representativas de la población. Una forma de obtener una muestra representativa es mediante muestreo
aleatorio, en el que cada elemento de la población tiene la misma probabilidad de ser incluido en la muestra.

DISTRIBUCIONES DE MUESTREO
Considerando todas las posibles muestras de tamaño N. Para cada muestra se puede calcular un estadístico (media
o desviación típica) que variará de muestra en muestra, obteniéndose una distribución del estadístico que se llama
distribución de muestreo.

Suponga que se han seleccionado muestras aleatorias de tamaño 20 en una población grande. Se calcula la media
muestral x para cada muestra; la colección de todas estas medias muestrales recibe el nombre de distribución
muestral de medias, lo que se puede ilustrar en la siguiente figura:
Suponga que se eligen muestras aleatorias de tamaño 20, de una población grande, y se calcula la deviación
estándar de cada una. La colección de todas estas desviaciones estándar muestrales se llama distribución muestral
de la desviación estándar, y lo podemos ver en la siguiente figura:

Ejemplo:
Una población consta de los números: 0, 2, 4 y 6
Consideramos todas las posibles muestras de tamaño 2 que pueden tomarse con reposición (con reemplazo)
a) Hallar la media de la población
b) Hallar la desviación típica de la población
c) La media de la distribución de muestreo de medias
d) La desviación típica de la distribución de muestreo de medias (o sea, el error típico de medias)

a) Hallar la media de la población

0+2+4+6
𝜇= = 3,0
4

b) Hallar la desviación típica de la población

(0 − 3) + (2 − 3) + (4 − 3) + (6 − 3)
= = 2,236
4
c) La media de la distribución de muestreo de medias

0∙1+1∙2+2∙3+3∙4+4∙3+5∙2+6∙1
𝑥̅ = = 3,0
16

d) La desviación típica de la distribución de muestreo de medias (o sea, el error típico de medias)

(0 − 3) ∙ 1 + (1 − 3) ∙ 2 + (2 − 3) ∙ 3 + (3 − 3) ∙ 4 + (4 − 3) ∙ 3 + (5 − 3) ∙ 2 + (6 − 3) ∙ 1
𝑠= = 1,58
16

DISTRIBUCIONES DE MUESTREO DE MEDIAS ( conocida)


Si una muestra aleatoria de tamaño n es extraída de una población con media µ y desviación típica , entonces 𝒙
(estadístico) es una variable aleatoria cuya distribución tiene como media µ.

- Para muestras de poblaciones infinitas o si el muestreo es con reposición:

𝝈
𝒙=µ y 𝒔=
√𝒏
En el caso del ejemplo anterior, aplicando estas fórmulas directamente obtendremos el mismo resultado:

𝜎 2,236
𝒙 = µ = 𝟑, 𝟎 y 𝑠= = = 1,58
√𝑛 √2

- Para muestras de poblaciones finitas o si el muestreo es sin reposición:

𝝈 𝑵−𝒏
𝒙=µ y 𝒔= ∙
√𝒏 𝑵−𝟏
Es esencial conocer los siguientes principios:

1. Para muestras de tamaño lo suficientemente grande ( n  30 ), la distribución de medias es aproximadamente


𝝈
normal, con media  y una desviación estándar (Éste es el lineamiento que suele utilizarse,
√𝒏

independientemente de la distribución de la población original).

- Se observa en la gráfica que a medida que n es cada vez mayor, la distribución muestral se aproxima más
a una distribución normal

- Se observa en la gráfica que a medida que n es cada vez mayor, no importando la forma de la distribución
original de la población, la distribución muestral seguirá una distribución normal.
2. Si n  30 y la población original tiene una distribución normal, entonces las medias muestrales tienen una
𝝈
distribución normal con una media  y una desviación estándar .
√𝒏

TEOREMA DEL LÍMITE CENTRAL


Si 𝒙 es la media de una muestra aleatoria de tamaño n extraída de una población que tiene media  y desviación
estándar , entonces:
𝑥̅ − 𝜇
𝑍=
𝜎/√𝑛

Es el valor de una variable aleatoria cuya función de distribución se aproxima a la de la distribución normal
estándar cuando 𝒏 → ∞

Ejemplos:
1.- Las estaturas de 3000 estudiantes de una universidad están normalmente distribuidas con media 1,73 m y
desviación típica de 0,08 m. Si se toman 80 muestras de 25 estudiantes cada una. ¿Cuáles serán la media y la
desviación típica esperadas de la resultante distribución de muestreo de medias, si el muestreo se hizo a) con
reposición y b) sin reposición?

Datos:
 = 1,73 m
 = 0,08 m
N = 3000
n = 25

a) Con reposición
𝜎 0,08
𝑥̅ = µ = 1,73 𝑚 y 𝑠= = = 0,016 𝑚
√𝑛 √25

a) Sin reposición
𝜎 𝑁−𝑛 0,08 3000 − 25
𝑥̅ = µ = 1,73 𝑚 y 𝑠= ∙ = ∙ = 0,016 𝑚
√𝑛 𝑁−1 √25 3000 − 1
2.- 500 balines de rolinera tiene un peso medio de 5,02 g y una desviación típica de 0,30 g. Hallar la probabilidad
de que una muestra al azar de 100 bolas de ese conjunto tenga un peso total (a) entre 4,96 y 5,00 g y b) más
de 5,10 g.

Datos de la Población:
 = 5,02 g
p
 = 0,30 g
N = 500

Datos de la Muestra:
4,96 x
n = 100 5,00 MUESTRA

a) p (4,96 ≤ x ≤ 5,00) = ?

Para hallar la probabilidad necesitamos determinar para la distribución de muestreo de medias, la media 𝒙 y
la desviación estándar s. Aplicamos las siguientes formulas por ser una población finita y muestreo sin
reposición:

𝜎 𝑁−𝑛 0,30 500 − 100


𝑥̅ = µ = 5,02 𝑔 y 𝑠= ∙ = ∙ = 0,027 𝑔
√𝑛 𝑁−1 √100 500 − 1

Llevamos los valores de x a unidades estándar


̅
𝑍=
, , , ,
𝑍( , )= ,
= - 2,22 y 𝑍( , )= ,
= - 0,74

Buscando en la tabla estos valores de Z, tenemos que:

𝐴( , , ) = 0,4868 y 𝐴( , , ) = 0,2704

 p (4,96 ≤ 𝑥̅ ≤ 5,00) = p (-2,22 ≤ Z ≤ -0,74) = 0,4868 – 0,2704 = 0,2164 = 21,6 %

b) p (x  5,10) = ?

Llevamos los valores de x a unidades estándar


, ,
𝑍( , )= ,
= 2,96

Buscando en la tabla este valor de Z, tenemos que: 𝐴( , , ) = 0,4985

 p (x  5,10) = p (Z  2,96) = 0,5 – 0,4985 = 0,0015 = 0,15 %


3.- Si una lata de galón de pintura cubre en promedio 513,3 m 2 con una desviación estándar de 31,5 m2. Calcular
la probabilidad de que el área media cubierta por una muestra de 40 latas se encuentre en un punto entre
510,0 y 520,0 m2.

Datos:
p
 = 513,3 m2
 = 31,5 m2
n = 40
p (510,0 ≤ x ≤ 520,0) = ?

x
510,0 520,0

 =513,3
Llevamos los valores de x a unidades estándar
̅
𝑍=
/√
, , , ,
𝑍( , )= = - 0,66 y 𝑍( , )= = 1,34
, /√ , /√

Buscando en la tabla estos valores de Z, tenemos que:

𝐴( , , ) = 0,2454 y 𝐴( , , ) = 0,4099

 p (510,0 ≤ 𝑥̅ ≤ 520,0) = p (-0,66 ≤ Z ≤ 1,34) = 0,2454 + 0,4099 = 0,6553 = 65,5 %

4.- Una empresa eléctrica fabrica bombillos que tienen una duración que se distribuye aproximadamente en
forma normal, con media de 800 horas y desviación estándar de 40 horas. Encuentre la probabilidad de que
una muestra aleatoria de 16 bombillos tenga una vida promedio de menos de 775 horas.

Datos:
 = 800 h
 = 40 h
p
n = 16
p (𝑥̅  775) = ?

800 x
775
Llevamos los valores de x a unidades estándar
̅
𝑍=
/√
𝑍( )= = - 2,50
/√
Buscando en la tabla este valor de Z, tenemos que:
𝐴( ) ,

 p (𝑥̅  775) = p (Z  775) = 0,5 – 0,4938 = 0,0062 = 0,62 %

La probabilidad de que la media de la muestra de 16 bombillos sea menor a 775 horas es de 0,62 %.

5.- Las estaturas de 1000 estudiantes están distribuidas aproximadamente en forma normal con una media de
174,5 centímetros y una desviación estándar de 6,9 centímetros. Si se extraen 200 muestras aleatorias de
tamaño 25 sin reemplazo de esta población, determine:
(a) El número de las medias muestrales que caen entre 172,5 y 175,8 centímetros.
(b) El número de medias muestrales que caen por debajo de 172 centímetros.

(a) El número de las medias muestrales que caen entre 172,5 y 175,8 centímetros.

Datos de la población:
N = 1000 p
 = 174,5 cm
 = 6,9 cm
Datos de la muestra
200 muestras
n = 25
Como se puede observar en este ejercicio se cuenta con una población finita y un muestreo sin reemplazo,
por lo que se tendrá que agregar el factor de corrección

𝑁−𝑛
𝑁−1

Llevamos los valores de x a unidades estándar


𝑥̅ − 𝜇
𝑍=
𝜎 𝑁−𝑛

√𝑛 𝑁−1
, , , ,
𝑍( , )= = - 1,47 y 𝑍( , )= = 0,95
, ,
∙ ∙
√ √

Buscando en la tabla estos valores de Z, tenemos que:


𝐴( , , ) = 0,4292 y 𝐴( , , ) = 0,3289

 p (172,5 ≤ 𝑥̅ ≤ 175,8) = p (-1,47 ≤ Z ≤ 0,95) = 0,4292 + 0,3289 = 0,7581 = 75,8 %


(b) El número de medias muestrales que caen por debajo de 172 centímetros.

Llevamos los valores de x a unidades estándar


, ,
𝑍(  )= = - 1,83
,

Buscando en la tabla este valor de Z, tenemos que:


𝐴( , , ) = 0,4664

 p (𝑥̅  172,0) = p (Z  -1,83) = 0,5 – 0,03364 = 3,36 %

6.- Algunos pasajeros murieron cuando un taxi acuático se hundió en el Inner Harbor de Baltimore. Los hombres
suelen ser más pesados que las mujeres y los niños; por lo tanto, supongamos que al cargar un taxi acuático
la situación extrema es aquella en la que todos los pasajeros son hombres. En concordancia con los datos de
la National Health and Nutrition Examination Survey, suponga que los pesos de los hombres se distribuyen
normalmente, con una media de 172 libras y una desviación estándar de 29 libras.
a. Calcule la probabilidad de que, si se selecciona un hombre al azar, su peso sea mayor que 175 libras.
b. Calcule la probabilidad de que 20 hombres elegidos al azar tengan una media mayor que 175 libras (de
manera que su peso total exceda la capacidad segura de 3500 libras).

Solución a) Debido a que estamos trabajando con un valor


individual de una población distribuida normalmente, buscamos
el área de la región sombreada en la figura. Utilizando la tabla,
convertimos el peso de 175 lb a su puntuación z
correspondiente:

̅
𝑍( ) = = = 0,10

Buscando el valor de Z , tenemos: 𝐴( ) = 0,0398

Por lo tanto, la región sombreada sería 𝐴(  ) = 0,5 − 𝐴( ) = 0,5 – 0,0398 = 0,4602

La probabilidad de que un hombre elegido al azar pese más de 175 libras es del 46 %
Solución b): Use utiliza el teorema del límite central, porque estamos trabajando con la media de una muestra
de 20 hombres y no con un solo hombre. Aunque el tamaño de la muestra no es mayor que 30, la población
original de hombres tiene una distribución normal, de manera que las muestras de cualquier tamaño producirán
medias distribuidas normalmente. Puesto que estamos trabajando con una distribución de medias muestrales,
debemos utilizar la fórmula:
̅
𝑍= = = 0,46
/√ /√

Si nos remitimos a la tabla, encontramos que z = 0,46


corresponde a un área a la izquierda de:
𝐴( ) = 0,1772

De manera que la región sombreada es 𝐴( ̅ ) = 0,5 − 𝐴( ) = 0,5 – 0,1772 = 0,3228


La probabilidad de que 20 hombres tengan un peso medio mayor que 175 libras es de 32,3 %

DISTRIBUCIONES DE MUESTREO DE MEDIAS ( desconocida)


En la sección anterior [(Distribuciones de Muestreo de Medias ( conocida)], se debe conocer la desviación
estándar de la población . Si n es grande, esto no plantea ningún problema aún cuando  sea desconocida, por
lo que en tal caso es razonable sustituirla por la desviación estándar muestra s.
𝑥̅ − 𝜇
𝑠/√𝑛
Sin embargo, muy poco se sabe de la distribución muestral exacta para valores pequeños de n, a menos de que
supongamos que la muestra proviene de una población normal, puede demostrarse que:

Si 𝒙 es la media de una muestra aleatoria de tamaño n tomada de una población normal que tiene media µ y
desviación típica , entonces:
𝑥̅ − 𝜇
𝑡=
𝑠/√𝑛
t es el valor de una variable aleatoria con distribución t y parámetro v = n – 1

En sentido esta fórmula no requiere conocimiento de  y suponemos que la población es normal.


Como se puede observar la forma de la distribución t es similar a la de una distribución normal (ambas tienen
forma de campana y son simétricas con respecto al origen).

Propiedades de las distribuciones t

1. La distribución t tiene media 0.


2. La desviación estándar está más dispersa que la curva normal estándar z, depende del parámetro v,
denominado número de grados de libertad.
3. A medida que v aumenta, la dispersión de la curva t correspondiente disminuye.
4. A medida que v   , la curva t se aproxima a la curva normal estándar,

Ejemplos:

1. El valor t con v = 14 grados de libertad que deja un área de 0,025 a la izquierda, y por tanto un área de 0,975
a la derecha. Buscando en la tabla t de Student es:
t0,975 = – t0,025 = – 2,145

Si se observa la tabla t de Student, el área sombreada de la curva está en la cola derecha, es por eso que tiene
que hacerse la resta de 1 – . La manera de encontrar el valor de t es buscar el valor de  en el primer
renglón de la tabla y luego buscar los grados de libertad en la primera columna y donde se intercepten 
y v se obtendrá el valor de t.
2. Un ingeniero químico afirma que el rendimiento medio de la población de cierto proceso en lotes es
500 gramos por milímetro de materia prima. Para verificar esta afirmación toma una muestra de 25 lotes
cada mes. Si el valor de t calculado cae entre – t0,05 y t0,05 ; queda satisfecho con su afirmación. ¿Qué
conclusión extraería de una muestra que tiene una media de 518 gramos por milímetro y una desviación
estándar de 40 gramos? Suponga que la distribución de rendimientos es aproximadamente normal.

Datos
 = 500 g/mm 1– = zona de aceptación

# Lotes = 25
𝑥̅ = 518 g/mm
/2 /2 = zona de rechazo
s = 40 g/mm

– t0,05 t0,05
Solución:

De la tabla encontramos que t0,05 para 24 grados de libertad es de 1,711.


Por tanto, el fabricante queda satisfecho con esta afirmación si una muestra de 25 lotes se encuentra en un
valor t entre –1,711 y 1,711.

Se procede a calcular el valor de t:


𝑥̅ − 𝜇 518 − 500
𝑡= = = 2,25
𝑠/√𝑛 40/√25

Este es un valor muy por arriba de 1,711. Si se desea obtener la probabilidad de obtener un valor de t con
24 grados de libertad igual o mayor a 2,25 se busca en la tabla y es aproximadamente de 0,02. De aquí que es
probable que el fabricante concluya que el proceso produce un mejor producto del que piensa.
DISTRIBUCIONES DE MUESTREO DE PROPORCIONES
Si una población es infinita y la probabilidad de ocurrencia de un suceso (éxito) es p, mientras la probabilidad de
que no ocurra es q = 1 – p, tenemos una distribución de muestreo de proporciones cuya media y desviación típica
es:

𝒑∙𝒒 𝒑∙(𝟏 𝒑)
𝒙=𝒑 y 𝒔= =
𝒏 𝒏

Ejemplos:

1.- Hallar la probabilidad de que en 120 lanzamientos de una moneda (a) entre 40 % y 60 % sean caras y (b) 5/8 o
más sean caras.

La probabilidad de cara es 𝑝 = y la de cruz es 𝑞 = 1 − 𝑝 =

(a) 𝒑 (𝟒𝟎 % ≤ 𝒙 ≤ 𝟔𝟎 %) = ?

N = 120 lanzamientos x
40 % 60 %
 40 % de 120 es 48
48 72
60 % de 120 es 72

Método # 1: Como el número de caras es una variable discreta, podemos utilizar la aproximación normal a
la binomial.

𝑥̅ = N ∙ p = 120 ∙ = 60 y s= 𝑁∙ 𝑝∙ 𝑞 = 120 ∙ ∙ = √30 = 5,48

Llevamos los valores de x a unidades estándar


̅
𝑍=

𝑍( )= = - 2,19 y 𝑍( )= = 2,19
, ,

Buscando en la tabla estos valores de Z, tenemos que:

𝐴( ) = 0,4857 y 𝐴( ) = 0,4857

 p (48 ≤ 𝑥̅ ≤ 60) = p (-2,19 ≤ Z ≤ 2,19) = 0,4857 + 0,4857 = 0,9714 = 97,1 %


Método # 2: Resolviendo mediante las fórmulas dadas para la Distribución de Muestreo de Proporciones

∙ ∙
𝑥̅ = 𝑝 = = 0,50 y 𝑠= = = 0,0456

Llevamos los valores de 40 % (0,40) y 60 % (0,60) a unidades estándar


̅
𝑍=
, , , ,
𝑍( , )= = - 2,19 y 𝑍( , )= = 2,19
, ,

Buscando en la tabla estos valores de Z, tenemos que:

𝐴( , , ) = 0,4857 y 𝐴( , , ) = 0,4857

 p (48 ≤ 𝑥̅ ≤ 60) = p (-2,19 ≤ Z ≤ 2,19) = 0,4857 + 0,4857 = 0,9714 = 97,1 %

𝟓
(b) 𝒑 (𝒙 ̅ ≥ ) = ?
𝟖

= 0,625 , 𝑥̅ = 0,50 y 𝑠 = 0,0456

Llevamos el valor de x a unidades estándar


̅
𝑍=
, ,
𝑍( , )= = 2,74
,

Buscando en la tabla estos valores de Z, tenemos que:

𝐴( , , ) = 0,4969

 p (𝑥̅ ≥ 0,625) = p (Z ≥ 2,74) = 0,50 – 0,4969 = 0,0031 = 3,1 %


2.- En unas elecciones uno de los candidatos obtuvo el 46 % de los votos. Hallar la probabilidad de que en un
muestreo de (a) 200 y (b) 1000 votantes elegidos al azar saliera mayoría a su favor, es decir más del 50 %.

(a) 200 votantes elegidos al azar saliera mayoría a su favor.

p = 46 % = 0,46
q = 1 – p = 0,54
n = 200
p (𝑥̅  050) = ?
∙ ( , )∙( , )
𝑥̅ = 𝑝 = = 0,46 y 𝑠= = = 0,0352

Llevamos el valor de x a unidades estándar


̅
𝑍=
, ,
𝑍(  , )= ,
= 1,14

Buscando en la tabla estos valores de Z, tenemos que:

𝐴( , , ) = 0,3729

 p (𝑥̅  0,50) = p (Z  1,14) = 0,50 – 0,3729 = 0,1271 = 12,7 %

(b) 1000 votantes elegidos al azar saliera mayoría a su favor.

p = 46 % = 0,46
q = 1 – p = 0,54
n = 1000
p (𝑥̅  050) = ?
∙ ( , )∙( , )
𝑥̅ = 𝑝 = = 0,46 y 𝑠= = = 0,0158

Llevamos el valor de x a unidades estándar


̅
𝑍=
, ,
𝑍(  , )= ,
= 2,53

Buscando en la tabla estos valores de Z, tenemos que:

𝐴( , , ) = 0,4943

 p (𝑥̅  0,50) = p (Z  2,53) = 0,50 – 0,4943 = 0,0057 = 0,57 %


3.- Se ha determinado que 60 % de los estudiantes de una universidad grande fuman cigarrillos. Se toma una
muestra aleatoria de 800 estudiantes. Calcule la probabilidad de que la proporción de la muestra de la gente
que fuma cigarrillos sea menor que 0,55.

p = 60 % (0,60) y q = 0,40 p

Datos de la Muestra:
n = 800 estudiantes
 0,55 de 800 es 440 estudiantes
440 480
p (x  440) = ?
Método # 1: aproximación de la distribución normal a la binomial.

𝑥̅ = N ∙ p = 800 ∙ 0,60 = 480 y s= 𝑁 ∙ 𝑝 ∙ 𝑞 = √800 ∙ 0,60 ∙ 0,40 = √30 = 13,86

Llevamos los valores de x a unidades estándar


̅
𝑍=

𝑍( )= = - 2,89
,

Buscando en la tabla este valor de Z, tenemos que:

𝐴( ) = 0,4981

 p (x  440) = p ( Z  2,89) = 0,5 – 0,4981 = 0,0019 = 0,19 %

La probabilidad de que, al extraer una muestra de 800 estudiantes de esa universidad, la proporción de
estudiantes que fuman cigarrillos sea menor al 55 % es del 0,19 %.

Método # 2: Resolviendo mediante las fórmulas dadas para la Distribución de Muestreo de Proporciones

∙ ( , )∙( , )
𝑥̅ = 𝑝 = 0,60 y 𝑠= = = 0,0173

Llevamos los valores de 0,55 y 0,60 a unidades estándar


̅
𝑍=
, ,
𝑍( , )= = - 2,89
,

Buscando en la tabla este valor de Z, tenemos que:

𝐴( ) = 0,4981

 p (x  0,55) = p ( Z  2,89) = 0,5 – 0,4981 = 0,0019 = 0,19 %

También podría gustarte