Está en la página 1de 5

Probabilidades y Estadística

DISTRIBUCIÓN MUESTRAL DE UN PROMEDIO MUESTRAL


(con varianza poblacional conocida)

El teorema del límite central es uno de los teoremas más importantes en Estadística, no sólo desde el punto de
vista teórico sino que también por su trascendencia en los métodos estadísticos. En esencia, este teorema
2
indica que si una población tiene varianza finita σ y media µ, sin importar cuál sea la distribución
original de la población, a medida que n aumenta, la distribución de la media de la muestra tiende a una
2
distribución normal con varianza σ /n y media µ. Lo anterior expresado en términos estadísticos es
equivalente a decir:

 
~ N  µ , σ n 
2 2
Si X ~ f ( x, µ, σ ) ⇒ X
n→∞ 

Al estandarizar esta variable, se tiene:


x−µ
= Z ~ N (0,1)
σ n→∞
n

Ejemplo: Una máquina vendedora de refrescos está programada para que la cantidad de refrescos que sirve
sea una variable aleatoria con una media de 200 mililitros y una desviación estándar de 15 mililitros. Cuál es la
probabilidad de que la cantidad media de refresco servido en una muestra aleatoria de 36 refrescos sea por lo
menos 204 mililitros

Solución:

µ = 200 σ = 15 n = 100 ¿ P( X ≥ 204) ?

 x − µ   204 − 200 
P( X ≥ 204) = 1 − P ( X < 204) = 1 − P Z < = 1 − P Z <
 σ n   15 36 
 
 4   4 
= 1 − P Z <  = 1 − P Z <  = 1 − P(Z < 1.6) = 1 − 0.9452 = 0.0548
 15 6   2.5 

Ejemplo: Una empresa eléctrica fabrica focos que tienen una duración que se distribuye aproximadamente en
forma normal, con media de 800 horas y desviación estándar de 40 horas. Encuentre la probabilidad de que una
muestra aleatoria de 16 focos tenga una vida promedio de menos de 775 horas.

Solución:

 x − µ   775 − 800 
P( X < 775) = P Z < = P Z < 

 σ n 
 40 4 
= P(Z < −2.5) = 0.0062

Edmundo Peña Rozas, Juan Garcés Seguel


Probabilidades y Estadística
2

La probabilidad de que la media de la muestra de 16 focos sea menor a 775 horas es de 0.0062.

Ejemplo:
Suponer que el número de barriles de petróleo producidos por un pozo durante un día es una variable aleatoria
no especificada, con media µ y varianza σ = 256 . Se observa la producción durante 64 días, en forma
2

aleatoria. Encontrar la probabilidad de que la media muestral esté a no más de cuatro barriles del verdadero
valor de la producción por día.
Solución:

Para n lo suficientemente grande, la distribución de X es aproximadamente normal con media µ y varianza


σ / n = 256 / 64 = 4 . Ahora, lo que se pide es obtener la probabilidad siguiente:
2

( )
P X − µ < 4 = P ( −4 < X − µ < 4 ) = P ( µ − 4 < X < µ + 4 )
   
 µ −4−µ X −µ µ +4−µ   4 4 
= P < <  = P <Z < =
 σ σ σ   σ σ 
   
 n n n   n n
 −4 4
= P < Z <  = P ( −2 < Z < 2 ) = 0.9544
 2 2
Es decir, la probabilidad de que la media muestral esté a no más de 4 barriles de la verdadera media
poblacional es 0.9544.

DISTRIBUCIÓN MUESTRAL DE UN PROMEDIO MUESTRAL


(con varianza poblacional desconocida)

Cuando la varianza de la población es desconocida, situación que se da con mucha frecuencia, es preciso
utilizar la información que nos provee la muestra respecto de este parámetro y estimar la desviación estándar,
utilizando alguna de las siguientes expresiones:

n k _
∑ ( x i − x) 2 ∑ ( x i − x) 2 ni
i =1 i =1
s2 = s2 =
n −1 n −1

En esta situación, el teorema central del límite puede ser expresado de la siguiente manera: “si una población
se distribuye normal con varianza desconocida y media µ, la distribución de la media de la muestra
tiende a una distribución t-Student con n-1 grados de libertad”. Lo anterior expresado en términos
estadísticos es equivalente a decir:
2
Si X ~ f ( x, µ, σ ) ⇒ X ~ t n−1
n→∞

Al estandarizar esta variable, se tiene:

Edmundo Peña Rozas, Juan Garcés Seguel


Probabilidades y Estadística
3
x−µ
= T ~ t n −1
s n →∞
n

Ejemplo: Un grupo de investigadores de cáncer de mama descubrió que el tamaño de estos se distribuye
normal con media 3,1 cm. Se toma una muestra aleatoria de 12 mujeres que padecían cáncer de mama. Esta
muestra arroja una desviación estándar de 0,5 cm. ¿Cuál es la probabilidad de que el tamaño promedio del
tumor de esta muestra fluctúe entre 3,2 y 3,5 cm?.

Desarrollo:

Sea X:”longitud del tumor” (cm)

X ~ N ( µ , σ 2 ) ⇒ X ~ N (3.1, σ 2 )

 x − µ 3.5 − 3.1   
P(3.2 ≤ x ≤ 3.5) = P ( x ≤ 3.5) − P ( x ≤ 3.2) = P ≤  − P x − µ ≤ 3.2 − 3.1 
 s n 0.5 12   s n 0.5 12 
   

= P (T ≤ 2.7713) − P (T ≤ 0.6928) ≈ 0.99 − 0.75 = 0.24

Por lo tanto, la probabilidad de que el tamaño promedio del tumor de esta muestra fluctúe entre 3,2 y 3,5 cm es
0,24.

DISTRIBUCIÓN MUESTRAL DE UNA VARIANZA MUESTRAL

2
En realidad la distribución Ji-cuadrado corresponde a la distribución muestral de s , es decir, si se extraen
todas las muestras posibles de una población normal y a cada muestra se le calcula su varianza, se obtendrá la
distribución muestral de la varianza.

2
Sea X una variable aleatoria distribuida según una Normal con media µ y varianza σ . Si medimos X en una
2
muestra aleatoria de n observaciones, la varianza muestral s de esa muestra es un valor de la variable
2
aleatoria S .

La teoría estadística demuestra que la variable aleatoria

n
∑ ( xi − x ) 2
(n − 1) s 2
i =1
~ χ n2−1 o equivalentemente ~ χ n2−1
σ 2
σ 2

Ejemplo: El nivel de colesterol sérico en una población de mujeres obesas se distribuye normal con media
245mg/100ml y una desviación estándar de 9,5mg/100 ml. Un investigador clínico toma una muestra aleatoria
de 15 de estas mujeres. ¿Cuál es la probabilidad de que la varianza del nivel de colesterol en esta muestra sea
2
inferior a 26 ( mg/100ml) ?.

Desarrollo:

Edmundo Peña Rozas, Juan Garcés Seguel


Probabilidades y Estadística
4
Sea X: “Nivel de colesterol sérico en población de mujeres obesas” (mg/100 ml)

X ~ N ( µ , σ 2 ) ⇒ X ~ N (245,9.5 2 )

 (n − 1) s 2 (15 − 1)26 
P( S 2 < 26) = P
 σ2
< 2
( )
 = P χ 2 ≤ 4.033 ≈ 0.005

 9 . 5 

Por lo tanto la probabilidad de que la varianza del nivel de colesterol sérico en esta muestra de 15 mujeres sea
2
inferior a 26 (mg/100ml) es aproximadamente 0,005.

Ejemplo: Suponga que los tiempos requeridos por una determinada línea de taxis colectivos de la ciudad de
Concepción para completar su recorrido tienen una distribución normal con desviación estándar σ=1.59
minutos. Si se elige al azar una muestra de 20 tiempos, encuentre la probabilidad de que la varianza muestral
sea mayor que 2.

Edmundo Peña Rozas, Juan Garcés Seguel


Probabilidades y Estadística
5
Desarrollo:

X ~ N ( µ , σ 2 ) ⇒ X ~ N ( µ ,1)
 (n − 1) s 2 (20 − 1)2   (n − 1) s 2 
P ( S 2 > 2) = 1 − P  ≤  = 1 − P  ≤ 23.90  = 1 − 0.8 = 0.2
 σ  σ
2 2
1.59  

Por lo tanto la probabilidad de que la varianza de los tiempos de la muestra sea mayor que 2 es de 0.2.

Ejercicios

1. Se sabe que la resistencia a la ruptura de cierto tipo de cuerda se distribuye normalmente con una media de
2
500 kilos y una varianza de 1600 Kg . Si se selecciona una muestra aleatoria de 100 cuerdas; determine la
probabilidad de que en esa muestra:
La resistencia media encontrada sea de por lo menos 490 Kg.
La resistencia media se mayor de 520 Kg.

2. La vida media de una máquina para hacer pastas es de siete años, con una desviación estándar de un año.
Suponga que las vidas de estas máquinas siguen aproximadamente una distribución normal, encuentre:
La probabilidad de que la vida media de una muestra aleatoria de 9 de estas máquinas caiga entre 6.4 y
7.2 años.
El valor de la media a la derecha del cual caería el 15% de las medias calculadas de muestras
aleatorias de tamaño nueve.

3. Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una población normal con
2
varianza σ =6, tenga varianza muestral:
Mayor que 9.1
Entre 3.462 y 10.745

Edmundo Peña Rozas, Juan Garcés Seguel

También podría gustarte