Está en la página 1de 10

Estadística para ingenieros. H.A. – L.R. – R.S.

DISTRIBUCIÓN DE ESTIMADORES OBTENIDOS DE POBLACIONES NORMALES

Vamos a comenzar a relacionar los conceptos probabilísticos estudiados en el


curso anterior a objeto de hacer inferencias acerca de los parámetros poblacionales a
partir de la información muestral. Con frecuencia en Estadística se tiene la necesidad de
deducir la distribución de probabilidad de una función, de una o más variables; este es el
objetivo nuestro pero comenzaremos bajo el supuesto que las muestras aleatorias son
extraídas de una población Normal.

El proceso de muestreo permite obtener información acerca de los parámetros de la


distribución de la población. Generalmente, se sabe el tipo de distribución que tiene la
población, pero se desconocen los parámetros.

Para hacer inferencias con respecto a los parámetros poblacionales, necesitamos


conocer la distribución de probabilidad para ciertos estadísticos de las variables
aleatorias en las muestras. Estas distribuciones de probabilidad representan modelos
para el comportamiento de las frecuencias relativas de los estadísticos para un muestreo
repetitivo y, por consiguiente, se les denomina distribuciones muestrales.

Def. La distribución de probabilidad de un estadístico se denomina Distribución


Muestral

DISTRIBUCIÓN DE PROBABILIDAD DE LA MEDIA MUESTRAL

Teorema 1. Sean X 1 , X 2 ,......., X n una muestra aleatoria extraída de una población


normal con media µ y varianza σ 2 . Entonces, la variable aleatoria X tiene
σ2
distribución normal con media µ y varianza .
n

Demostración: Se realizará mediante la función generadora de momentos:

t t t
x1 x2 xn t t t
M x (t ) = E (e ) = E (e
xt n
) ⋅ E (e n
) ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ E (e n
) = M x1 ( ) ⋅ M x 2 ( ) ⋅ ⋅ ⋅ ⋅ ⋅ ⋅M xn ( )
n n n
n
 µ t +σ 2 t2  σ 2 t2
n
  µt +
=  M xi ( ) 
t 2
= e n 2 n  = e
2 n
 n   
 
σ2
La f.g.m. desarrollada corresponde a la distribución normal, donde x ~ N (µ, )
n

Por la tanto, ()
E x =µ y V (X ) =
σ2
n
.

Ejemplo 1. La prueba WAIS (wechsler adult intelligence scale) es una prueba de


inteligencia para adultos. La distribución de los resultados de la prueba WAIS para
personas mayores de 16 años tiene distribución normal con media 100 y desviación
estándar 15.
Estadística para ingenieros. H.A. – L.R. – R.S. 2

a) ¿Cuál es la probabilidad de que un individuo escogido aleatoriamente tenga un


resultado de 105 o superior?
b) ¿Cuáles son la media y la desviación estándar del promedio X de los resultados
en la prueba WAIS de una muestra aleatoria de 60 personas?
c) ¿Cuál es la probabilidad de que el promedio de los resultados en la prueba
WAIS de una muestra aleatoria de 60 personas sea de 105 o superior?
Solución:
a) X: resultado de la prueba de inteligencia WAIS para personas mayores de 16
años.
X ~ N ( µ = 100, σ 2 = 225)
105 − 100
P( X ≥ 105) = P( Z > ) = 0.3707
15
[ ]
b) E X =100 y [ ]
V X = 3,75
105 − 100
c) P( X ≥ 105) = P ( Z > ) = 0.00494
15 / 60

Caso para dos muestras


Un problema en ingeniería es comparar el rendimiento promedio de dos
máquinas, es decir, comparar las medias correspondientes a dos muestras.

Consideremos dos variables aleatorias X 1 y X 2 correspondientes a dos poblaciones con


medias µ1 y µ12 y varianzas σ 21 y σ 2 2 . Si seleccionamos dos muestras aleatorias
de cada una de estas poblaciones de tamaños n 1 y n 2 , respectivamente. La variable
σ 12 σ 22
aleatoria X 1 − X 2 tiene por media µ x1 − x 2 = µ1 − µ 2 y varianza σ x21 − x2 = + .
n1 n2

Corolario 1. Si se sacan al azar muestras independientes de tamaños n 1 y n 2 de dos


poblaciones normales con medias µ1 y µ2 y varianzas σ 21 y σ 2 2 respectivamente,
entonces la distribución muestral de la diferencia de medias X 1 − X 2 está distribuida
σ 12 σ 22
normal de media y varianza: µ x1 − x 2 = µ1 − µ 2 y σ x21 − x2 = + .
n1 n2

Su estandarización es la siguiente: Z=
(x − x )− (µ − µ ) ~
1 2 1 2
N(0,1)
 σ 12
  σ 22 
   
 n  + n 
 1  2 

Ejemplo 2. Una muestra de tamaño n1 = 5 es obtenida aleatoriamente de una población


que tiene distribución normal con media µ1 = 50 y varianza σ 12 = 9 , y se registra la
media muestral x1 . Una segunda muestra aleatoria de tamaño n 2 =4 se selecciona,
independiente de la primera muestra, de una población diferente que también está
distribuida normalmente, con media µ 2 = 40 y varianza σ 22 = 4 y se registra la media
(
muestral x2 . Determine la probabilidad P x1 − x2 < 8,2 . )
Estadística para ingenieros. H.A. – L.R. – R.S. 3

Solución:
σ 12 σ 22
Según el corolario 1, µx = µ1 − µ 2 = 10 y σ x2 −x = + = 2,8 . Luego, la
1 −x 2 1 2 n1 n2

distribución de las diferencias de medias muestrales es x1 − x 2 ~ N (10,2.8) .

(
Así, P x1 − x 2 < 8,2 ) =1- 
P z >

8,2 − 10 
= 0.1401
 2,8 

Ejemplo 3. Cuantificar el error de estimación de medias poblacional y muestral.


Una máquina embotelladora puede regularse de tal manera que llene un promedio de µ
onzas por botella. Se ha observado que la cantidad de contenido que suministra la
máquina presenta una distribución normal con desviación estándar de 1.0 onza. De la
producción de la máquina un cierto día, se obtiene una muestra aleatoria de 9 botellas
llenas (todas fueron llenadas con las mismas posiciones del control operativo) y se
miden las onzas del contenido de cada una. Determinar la probabilidad de que la media
muestral se encuentre a lo más a 0,3 de onzas de la media real µ para tales posiciones
del control.

Solución:
Si x1 , x2 ,........, x9 representan las onzas de contenido a observaciones, se deduce que xi
presenta una distribución normal con una media µ y varianza σ 2 =1 para i=1,2,....,9.
Por tanto, x tiene una distribución normal con media µ y varianza 1/9.
( )
En lenguaje simbólico, queremos calcular: P x − µ ≤ 0,3 El desarrollo es el siguiente,

= P (− 0,3 ≤ x − µ ≤ 0,3) =
 0,3 x−µ 0,3 
P − ≤ ≤ 
 σ/ n σ/ n σ/ n 
 
 x−µ 0,3 
= P(− 0.9 ≤ z ≤ 0.9) = 1 – 2 P( Z > 0.9 ) = 0.6318
0,3
= P  − ≤ ≤
 1/ 9 σ/ n 1 / 9 

La probabilidad es sólo de 0,63 de que la media muestral diste a lo más en 0,3 de onza
de la media poblacional real.

De forma general, calcularemos el error absoluto de estimación (precisión de


estimación) de que el estimador de la media x muestral difiera del valor de media
poblacional µ en una cantidad pequeña ε .
Como todos los valores son conocidos podemos calcular la probabilidad usando la
distribución normal.

La probabilidad de que el estimador de la media muestral difiera del verdadero valor de


la media en a lo más una pequeña cantidad es:

( )  −ε
P x − µ ≤ ε = P ≤z≤
ε 

σ / n 
σ / n
Estadística para ingenieros. H.A. – L.R. – R.S. 4

Ejemplo 4. Un antropólogo quiere estimar la estatura promedio de los hombres de cierta


raza. Si se supone que la desviación estándar de la población es de 2,5 pulgadas y se
selecciona al azar a 100 hombres, encuentre la probabilidad de que la diferencia entre la
media de la muestra y la media verdadera de la población no exceda de 0,5 pulgadas.
Suponga que la estatura de los hombres tiene distribución normal.
Solución:
Definamos la v.a. X: estatura de los hombres. La distribución es X ≈ N ( µ , σ 2 = 6,25)
Aplicando la propiedad 3.1, se pide en notación simbólica cuantificar el error de
estimación
 
 x− µ 
(
P x − µ ≤ 0,5 = P)
 σ

0,5
2,5
 = P ( Z ≤ 2 ) = 1 – 2 P( Z > 2) = 0.954

 
 n 100 

Supongamos que la variable de interés es cuantitativa y queremos estimar el


valor medio poblacional µ de una muestra de tamaño n. Cuantificamos el error de
estimación e = X − µ de al menos un valor prefijado ε por la probabilidad

( )  −ε
P x − µ ≤ ε = P 
σ
≤z≤
σ
ε 
 ≤ 1 − α . Ahora, para α y ε dados, queremos
 / n / n
σ
determinar el tamaño muestral. Se puede obtener la expresión X − µ ≤ Z (α / 2) ⋅ .
n
ε
Tenemos que ≥ Z (α 2) donde Z (α 2) es el percentil (α 2) de la distribución
σ/ n
normal estándar. Despejando y considerando el mayor error se tiene el tamaño muestral
 z (α 2) ⋅ σ 
2
necesario, n ≥  
 ε 

Tamaño adecuado de una muestra aleatoria con distribución Normal


Si σ es conocida se fijan e y 1−α y se determina el valor del tamaño de muestra
n, dada por:
 Z (α / 2) ⋅ σ 
2
n= 
 e 

Ejemplo 5. Continuación del ejemplo 3. ¿Cuántas observaciones deben incluirse en la


muestra si se desea que x esté a lo más a 0,3 de onza de µ con una probabilidad de
0,95?

Solución:

( ) (
Ahora se pretende que P x − µ ≤ 0,3 = P − 0,3 ≤ x − µ ≤ 0,3 = 0,95 )
( )
Esto es, P − 0,3 n ≤ z ≤ 0,3 n = 0,95. Tenemos que P (− 1,96 ≤ z ≤ 1,96 ) = 0,95
Estadística para ingenieros. H.A. – L.R. – R.S. 5

y luego 0,3 n = 1,96, donde obtenemos n = 42,68.


Por lo tanto, deben incluirse n =43 observaciones para que x esté a lo más a 0,3 de onza
de µ con una probabilidad de 0,95.

DISTRIBUCIÓN DE PROBABILIDAD DE LA VARIANZA MUESTRAL

Def. Sean Z i , i = 1,....., k variables aleatorias independientes con distribución normal


k
N(0,1), entonces X = ∑ Z i2 tiene distribución Chi-Cuadrado con k grados de libertad.
i =1

Anotamos X ~ X k2 . Además, E(X ) = k y V ( X ) = 2k .

Por ejemplo, Para X ≈ X 152 se tiene E ( X ) = 15 ; V ( X ) = 30 y P ( X > 25) = 0.05 . La


figura muestra la distribución Chi-Cuadrado para k = 2, 4 y 6 grados de libertad.

La importancia de estos resultados se muestra en lo siguiente:


Considere X 1 , X 2 ,......., X n una muestra aleatoria extraída de una población
Xi − µ
normal con media µ y varianza σ 2 . La variable aleatoria Z i = tiene distribución
σ

normal N(0,1), y entonces ∑


n (xi − µ )2 ~ X n2
i =1 σ2
De lo anterior, se deduce el siguiente resultado importante:

Teorema 2. Sea X 1 , X 2 ,......., X n una muestra aleatoria extraída de una población normal
X ~ N (µ,σ 2 ) y denotemos Y =
(n − 1)S 2 . Entonces, la variable aleatoria Y tiene
σ2

distribución Chi-cuadrado con (n-1) grados de libertad. Las variables aleatorias de la


media x y la varianza s 2 son independientes.
Estadística para ingenieros. H.A. – L.R. – R.S. 6

Demostración. Escribamos la descomposición:

. Dividamos cada término de la igualdad por σ 2 ,


n n
∑(Xi − µ )2 = ∑(Xi − X ) 2 + n( X − µ ) 2
i =1 i =1
n n
∑(Xi − µ )2 ∑( Xi − X )2
i =1 i =1 n( X − µ )2 n( X − µ ) 2
= + . La expresión corresponde al cuadrado
σ 2
σ 2
σ 2
σ2
de una variable normal estándar con una distribución χ12 .
n
− µ )2
Por otra parte, W =
∑( Xi
i =1
sigue una distribución χ n2 . Así, W =
(n − 1)S 2 + n( X − µ )2
σ 2
σ2 σ2

Si multiplicamos por un parámetro real t, aplicamos la función exponencial a ambos


miembros, y tomamos esperanzas, teniendo en cuenta la independencia de la media y la
 (n −1)S 2 t 
varianza muestral, tenemos: E (e )  2 
tw
= E  e σ e tz  donde W y Z tienen distribuciones
 
 
chi-cuadrado con n y 1 grados de libertad, por lo que podemos escribir:
 (n −12)S 
2

1 1
E e σ =
t
;t < es la función generadora de momentos de una χ n2−1 y
  (1 − 2t )(n −1) / 2 2
 
en consecuencia: Y =
(n − 1)S 2 ~ χ n2−1 .
σ2

Observación:
La demostración que las variables aleatorias de la media x y la varianza s 2 son
independientes no la presentaremos en este curso. Por otro lado, el número de grados
de libertad del estadístico resultante disminuye en una unidad por cada parámetro que se
ha estimado.

Ejemplo 6. Una empresa de equipos computacionales, ha determinado que el precio de


costo de cada equipo es una variable aleatoria que se distribuye normal con media $500
y desviación estándar de $50
a) Si se toma una muestra aleatoria de 5 equipos, ¿cuál es la probabilidad de que el
costo promedio esté entre $521 y $540.
b) Considerando una muestra aleatoria de tamaño 10 del precio de costo, ¿cuál es la
probabilidad que la desviación estándar muestral sea inferior a $68,56?

Solución:
a) X: Precio de costo de equipos computacionales
X ~ N (500,2500)

(
P 521 < x < 540 = P ≤Z≤ )  521 − 500
 = P ( Z > 0.94 ) − P ( Z > 1,79 ) = 0,1369
540 − 500 
 50 / 5 50 / 5 

b) P(
(n − 1)S 2 ≤
9 ⋅ 68,562
(
) = 1 - P X 92 > 16,92 = 0.95 )
σ 2
502
Estadística para ingenieros. H.A. – L.R. – R.S. 7

Ejemplo 7. Suponga que una muestra de 10 neumáticos nuevos tuvieron una duración
promedio igual a 75.000 kilómetros con una varianza estimada igual a 32.000
kilómetros. Suponiendo normalidad, calcular la probabilidad de que el estimador S 2
exceda a la verdadera varianza σ 2 en un 36% o más.
Solución:
( )
Se pide P S 2 ≥ 1.36σ 2 = P(Y ≥ 12.24) = 0,20, donde Y ≈ X 92 . Se espera que en 20 de
cada 100 muestras ocurra este evento.

Ejemplo 8. Un fabricante de gasolinas mide el octanaje de su producto. A continuación


se presentan 30 datos obtenidos de una muestra aleatoria, tomada del proceso de
producción. Aplicar los teoremas 1 y 2, calculando una probabilidad para la media
muestral y otra para la varianza muestral, a partir de las observaciones.

86,98 86,90 86,94 87,11 86,80 87,02


87,10 87,13 86,92 87,04 86,92 87,13
87,10 86,91 87,03 86,91 87,05 86,95
86,94 86,92 87,16 87,08 87,13 86,84
86,81 86,83 87,19 86,81 86,98 86,97

Distribución t- Student
Sea W una variable aleatoria distribuida normal estándar y V otra variable aleatoria
W
distribuida Chi- cuadrado con n grados de libertad, formemos el cuociente T = ,
V n
donde T es una variable aleatoria con distribución t- Student , además, W y V son
independientes. Entonces, consideremos el caso particular, para una muestra con
distribución normal, es posible demostrar que x es independiente de S 2 , y por tanto
podemos formar una variable aleatoria con distribución t-Student de la siguiente forma:
W=
x−µ
~ N (0,1) y V=
(n − 1)S 2 ~ X n2−1 variables aleatorias independientes,
σ/ n σ2
x−µ
σ/ n x−µ
entonces T = = ~ t-Student con (n-1) grados de libertad
(n − 1)S 2 S/ n
σ 2 (n − 1)

La función de densidad de probabilidad de la variable t-Student y su gráfica es:

 n +1
Γ   n +1 
− 
 2   t2   2 
f (t ) = 1 +


 , t ∈ℜ
n  n 
Γ  nπ
2
Estadística para ingenieros. H.A. – L.R. – R.S. 8

Propiedades:
1. f(t) es simétrica con respecto al eje de la ordenada, E(t)=0, pero su varianza es
mayor que 1 lo que resulta ser más achatada y de colas más altas que la normal.
2. Existe una curva para cada (n-1) grados de libertad.
3. P(t ≤ t 0 ) = FT (t 0 ) se encuentra tabulada para los distintos grados de libertad.

La muestra aleatoria es sacada de una población normal, pero los parámetros µ y σ 2


son desconocidos. La estandarización de la v.a. es de la forma:

X −µ
T= ~ t (n − 1)
S n

Ejemplo 9. Sea X una variable aleatoria con distribución normal de promedio µ = 5,2 y
varianza desconocida. Se obtiene una muestra aleatoria de 10 individuos, obteniéndose
los siguientes resultados:
5,3 6,5 2,1 4,3 3,9 7,8 9,0 1,2 5,0 8,1

a) Calcular la probabilidad de que la media de la muestra exceda en 4,987.


 S2 
b) Calcular P ≤ 0,46 
σ 2 
 

Caso de dos muestras


Consideremos las varianza poblacionales σ 12 y σ 22 son desconocidas pero iguales y los
tamaños de muestras n1 y n 2 son pequeñas obtenidas de poblaciones normales. En este
caso, si σ 12 = σ 22 = σ 2 entonces

X 1 − X 2 − ( µ1 − µ2 )
Z= ~ N (0,1)
1 1
σ⋅ +
n1 n2

. Además: E (S p2 ) = σ 2
(n1 − 1) ⋅ S12 + (n 2 − 1) ⋅ S 22
y σ 2 puede ser estimado por S p2 =
n1 + n 2 − 2
( n1 − 1) ⋅ S12 (n2 − 1) ⋅ S 22
Sabemos que: Y1 = ~ ℵ(2n1 −1) , Y2 = ~ ℵ2( n 2 −1)
σ2 σ2
( n1 − 1) ⋅ S12 ( n2 − 1) ⋅ S 22
Luego se tiene Y = Y1 + Y2 = + ~ ℵ(2n1 + n 2 − 2 )
σ2 σ2

Se puede probar que si Z e Y son variables aleatorias independientes entonces:


Estadística para ingenieros. H.A. – L.R. – R.S. 9

Z X 1 − X 2 − ( µ1 − µ2 )
T= = ~ t ( n1 + n2 − 2)
Y 1 1
Sp ⋅ +
n1 + n2 − 2 n1 n2

Ejemplo 10. Se cree que un nuevo fertilizante aumentará la producción de un


determinado árbol frutal. Una muestra de la producción antes de aplicar el nuevo
fertilizante en kilos es 19.6,17.5,18.4,17.5,18,20,18.8,19.2 La producción de los
mismos árboles después de aplicar el nuevo fertilizante es
19.4,18.8,20.6,17.6,19.2,20.9,18.3,20.4 Suponga que las dos muestras de árboles son
independientes y que ambas muestras tienen la misma varianza. Entonces, el estimador
7 ⋅ 1.363 + 7 ⋅ 0.882
de la varianza muestral ponderada es S 2p = = 1.123.
14
En base a antecedentes históricos se sabe que la diferencia entre la media poblacional
después de aplicar el fertilizante y la media poblacional antes de aplicarla resulta ser 2.
Obtener el valor de k dada la siguiente expresión P (X 2 − X 1 ≥ k ) = 0,025

Distribución F- Fisher
Supongamos que se tienen dos muestras provenientes de dos distribuciones normales
con media y varianzas desconocidas.

Sean U ~ X n2 , V ~ X n2 variables aleatorias independientes, luego


1 2
U / n1
F= ~ f ( n1 , n2 ) con n1 grados de libertad en el numerador y n 2 grados de libertad
V / n2
en el denominador. Su función de densidad de probabilidad de la variable F- Fisher es

 n + n2 
Γ 1  n1  n +n
−  1 2


 2   n1 2  n1 X 
n1
 2 
−1
f ( x) =  X 1 +  , x>0
2

n  n n n2
Γ 1 Γ 2   2   
 2  2 

Propiedades
1
1. f 1−α (n1 , n 2 ) =
f α ( n 2 , n1 )

2. X ≈ F (n1 , n 2 ) , luego P( X ≤ f 1−α (n1 , n 2 ) ) = 1 − α , se encuentra tabulada.


Estadística para ingenieros. H.A. – L.R. – R.S. 10

3. Caso particular: Consideremos muestras provenientes de una distribución normal,


sabemos que: U =
(n1 − 1)S12 ~ X n2 −1 y V =
(n2 − 1)S2 2 ~ X n2 −1 y son independientes.
σ 12 1 σ 22 2

S 2σ 2
Por lo tanto, la siguiente expresión: F = 1 2 ~ F (n1 − 1, n2 − 1)
S 22σ12
( n1 − 1) ⋅ S12 ( n2 − 1) ⋅ S 22
~ ℵ(2n1 −1) , ~ ℵ(2n 2 −1)
σ 12 σ 22
Entonces

S12 ⋅ σ 22
F= ~ f (n1 − 1 , n2 − 1)
S 22 ⋅ σ 12

A continuación se presenta su representación gráfica para distintos valores de sus grados


de libertad.

También podría gustarte