Está en la página 1de 7

Pontificia Universidad Católica de Valparaíso Escuela de Ingeniería Industrial

Inferencia Estadística (EII 353) Ayudantía 2


Primer Semestre 2020
Distribución Normal

Distribución Normal
En la ayudantía anterior aprendimos sobre las características básicas de una v.a de distribución
normal. Ahora, aprenderemos sobre el empleo de muestras aleatorias y la comparación entre dos
poblaciones.

Tenemos que la v.a. seguirá una distribución normal de parámetros µ 𝑦 𝜎 2 , tal como se expresa a
continuación:
𝑋~ 𝑁 (µ, 𝜎 2 )

Cuando se tiene una muestra aleatoria de tamaño “n”, se debe redefinir la variable, pues ya no
trabajamos con cantidades “absolutas”, por decirlo de alguna manera, sino que con cantidades
“medias”. Estamos utilizando el promedio de estas observaciones.
Como redefinimos la variable, ahora llamada “𝑋̅” (en el curso es común escucharla como “equis
barra”), también debemos redefinir su distribución. Por propiedades, la media se mantendrá y su
varianza corresponde a la varianza de la distribución original dividida en el tamaño de la muestra. Por
lo tanto:
𝜎2
̅
𝑋~ 𝑁 (µ, )
𝑛

A partir de este punto, se trabaja exactamente igual que la distribución normal. Sin embargo, su
estandarización igualmente incluye cambios.

Estandarización de 𝐗̅
La función de la estandarización seguirá siendo la misma, es decir, nos permite calcular las
probabilidades accediendo a una tabla estandarizada. Lo único que cambia es la información que nos
pide.
𝑥̅ − 𝜇 𝑥̅ − 𝜇
𝑍= = 𝜎
𝜎 2
√ √𝑛
𝑛

Además, debemos indicar que Z (nuestra nueva v.a) sigue una distribución normal estándar, es decir,
que su media es 0 y su varianza es 1.
𝑍 ~ 𝑁 (0,1)

Comparación de dos poblaciones


Cuando tenemos dos poblaciones sobre las cuales debemos establecer comparaciones, se deben seguir
pasos similares a los mencionados más arriba.
Sea X una v.a que sigue una distribución normal de parámetros 𝜇𝑥 y 𝜎 2 𝑥 , y sea Y una v.a de
distribución normal con parámetros 𝜇𝑦 y 𝜎 2 𝑦 , tenemos:
𝑋~ 𝑁 (𝜇𝑥 , 𝜎 2 𝑥 ) 𝑒 𝑌~ 𝑁 (𝜇𝑦 , 𝜎 2 𝑦 )

Es importante mencionar que las variables son independientes entre sí. Si el enunciado no lo explicita,
debemos ponerlo como supuesto.

Nuevamente debemos redefinir las variables a 𝑋̅ e 𝑌̅, ya que estaremos trabajando con muestras
aleatorias de ambas poblaciones. Las m.a serán 𝑛𝑥 y 𝑛𝑦 , respectivamente.
Así, nos quedan:
𝜎2𝑥 𝜎2𝑦
𝑋̅~ 𝑁 (𝜇𝑥 , ) 𝑒 𝑌̅~ 𝑁 (𝜇𝑦 , )
𝑛𝑥 𝑛𝑦

Estandarización multivariable
La estandarización involucrará a ambas v.a y las convertirá en una nueva v.a normal estandarizada.

(𝑥̅ − 𝑦̅) − (𝜇𝑥 − 𝜇𝑦 )


𝑍=
𝜎2 𝜎2
√ 𝑥+ 𝑦
𝑛𝑥 𝑛𝑦

𝑍 ~ 𝑁 (0,1)
Nota: Esta estandarización es para calcular una probabilidad de tipo “𝑃 (𝑋̅ − 𝑌̅ ≤ 𝑎)”. Si desean
calcular “𝑃 (𝑌̅ − 𝑋̅ ≤ 𝑎)” se debieran invertir los elementos del numerador.

Cuando no trabajamos con muestras aleatorias pero sí con dos variables, es lo mismo que crear una
variable “𝑊 = 𝑋 − 𝑌", cuya esperanza sería 𝐸(𝑊) = 𝐸(𝑋 − 𝑌) = 𝐸(𝑋) − 𝐸(𝑌), y cuya varianza
sería 𝑉(𝑊) = 𝑉(𝑋 − 𝑌) = 𝑉(𝑋) + 𝑉(𝑌).

Ejercicio 1
Un grupo de investigadores se encuentra muy preocupado porque debido al calentamiento global y
su principal consecuencia, el cambio climático, la temperatura registrada durante un día del mes de
febrero de este año en la región de Valparaíso aumentó en un 3,6% respecto a la misma medición
efectuada en el 2002. Los investigadores buscan aportar con posibles soluciones para este fenómeno,
pero antes deben analizar información y no tienen conocimientos de probabilidades y estadísticas,
por lo que necesitan de su ayuda.
Si la temperatura registrada en un día de febrero de este año en la región se distribuye normal, con
una moda de 18,2 °C y una variabilidad de 0,6 °C:
a) Si se toma una muestra aleatoria de 12 días de febrero, ¿cuál es la probabilidad de que la
temperatura media sea de a lo más 18 °C?
b) Determine el tamaño de la muestra para que el 99,09% de las veces la temperatura media sea
de al lo menos 17 °C.
Ejercicio 2
Una empresa productora de bolsas biodegradables planea una estrategia de promoción para potencias
las ventas de su nuevo producto estrella, pero para eso debe considerar la cantidad vendida
semanalmente de los dos productos que ya tiene en el mercado, las bolsas negras y las bolsas
transparentes. La venta semanal de ambos tipos sigue una distribución normal, con una mediana de
12 [miles de unidades] y una varianza de 0,5 [miles de unidades 2 ], para las bolsas negras. Las bolsas
transparentes tienen una moda de 10 [miles de unidades] y una variabilidad de 0,3
[miles de unidades 2 ].
a) ¿Cuál es la probabilidad de que la diferencia de ventas entre las bolsas negras y transparentes
sea superior a 3 [miles de unidades] a la semana?
b) Si se desea evaluar una muestra aleatoria de 8 semanas para las bolsas negras y 10 semanas
para las bolsas transparentes, ¿cuál es la probabilidad de que la venta media semanal de las
bolsas transparentes supere la venta media de las bolsas negras?

Desarrollo ejercicio 1 (Lo que está escrito en cursiva son comentarios sobre cómo resolver los
ejercicios, mientras que lo escrito de forma normal corresponde a su desarrollo)

La resolución de la ayudantía 1 nos entregó la pauta tanto de la definición de la variable como de


su respectiva distribución.

Sea X: temperatura registrada en un día de febrero de este año en la región de Valparaíso [°C]
X~ N (18,2 ; 0,36)

a) Lo primero que debemos hacer es reconocer la existencia de la muestra aleatoria. Esto se debe
hacer en todos los ejercicios.

Se tiene una m.a (n=12), lo que equivale a 12 variables aleatorias independientes, idénticamente
distribuidas.

Para ahorrar tiempo, en los ejercicios es recomendable escribir lo siguiente:


m.a (12) ↔ 12 v.a iid

Como el enunciado nos habla de “temperatura media”, debemos redefinir la variable X.

Sea 𝑋̅: temperatura media registrada en “n” días de febrero de este año en la región de Valparaíso
[°C].
σ2
̅~ N (µ, )
X
n

0,36
̅~ N (18,2 ;
X ̅~ N (18,2 ; 0,03)
)↔X
12

La probabilidad que nos piden es 𝑃 (𝑋̅ ≤ 18), por lo que debemos estandarizar:
18 − 18,2
̅ ≤ 18) = P (Z ≤
P (X ) = P (Z ≤ −1,15)
√0,03

𝑍 ~ 𝑁 (0,1)

Hay que recordar que ahora debemos buscar el número obtenido en la tabla “Tabla Distribución
Normal Standard” del aula. Si aún no saben cómo buscar los valores, vean la Ayudantía 1.

̅ ≤ 18) = P (Z ≤ −1,15) = 0,1251


P (X

Tampoco debemos olvidar escribir la respuesta.

Por lo tanto, la probabilidad de que, en una muestra aleatoria de 12 días de febrero, la temperatura
registrada en la región de Valparaíso sea de a lo más 18 °C es de 0,1251.

b) En este enunciado nos piden realizar lo inverso a lo hecho en a). Nos dan:

̅ ≥ 17) = 0,9909
P (X

Sabemos que el número 99,09% fue sacado de la tabla como 0,9909, por lo que debemos escribir la
0,36
probabilidad en el formato estandarizado. En este caso, tenemos ̅X~ N (18,2 ; ), ya que no
n
conocemos a priori el tamaño de la muestra. De hecho, eso es lo que queremos calcular.

̅ ≥ 17) = 1 − P ( ̅
P (X X ≤ 17) = 0,9909

17 − 18,2
1−P(̅
X ≤ 17) = 1 − P Z≤ = 0,9909
√0,36
( n )

Sabemos que P ( Z ≤ a) = 1 − 0,9909 = 0,0091, por lo que debemos encontrar ese “a”.

En este caso, ubicamos primero la probabilidad 0,0091 en los números dentro de la tabla y a partir
de ella encontramos el valor “a”, que en este caso es igual a -2,36. Nos queda:
17 − 18,2
1−P Z≤ = 0,9909
√0,36
( n )

17 − 18,2
P Z≤ = 1 − 0,9909 = 0,0091
√0,36
( n )

17 − 18,2
P Z≤ = 𝑃 (𝑍 ≤ −2,36) = 0,091
√0,36
( n )

Si se dan cuenta, lo encerrado con verde corresponde al mismo número, por lo tanto, igualamos:

17 − 18,2
= −2,36
√0,36
n

A partir de este momento sólo nos queda despejar y obtendremos n.

17 − 18,2 0,36
=√
−2,36 n

−1,2 0,36
=√
−2,36 n

30 0,36
=√
59 n

900 0,36
=
3481 𝑛

0,36 ∗ 3481
𝑛= = 1,3924
900

Si obtenemos un n decimal, SIEMPRE debemos aproximar al entero superior. Por lo tanto, en este
caso será n = 2 [días].

En conclusión, para que el 99,09% de las veces la temperatura media sea de a lo menos 17 °C, se
necesita una muestra aleatoria de 2 días.
Desarrollo ejercicio 2

Como en todos los ejercicios, primero debemos definir las variables con sus respectivas
distribuciones.

Sean X: cantidad de bolsas negras vendidas semanalmente [miles de unidades] e Y: cantidad de bolsas
transparentes vendidas semanalmente [miles de unidades]. Con X e Y independientes.

X~ N (12 ; 0,5) e Y~ N (10 ; 0,3)

a) En este enunciado nos preguntan “𝑃 (𝑋 − 𝑌 ≥ 3)" y no nos presentan una muestra aleatoria, por
lo tanto, debemos hacerlo creando una nueva v.a, la que llamaremos “W”.

Sea W = X - Y, tenemos E(W) = E(X - Y) = E(X) - E(Y) = 12 - 10 = 2 [miles de unidades] y V(W)


= V(X – Y) = V(X) + V(Y) = 0,5 + 0,3 = 0,8 [miles de unidades2 ].

W~ N (2 ; 0,8)

Esto lo reemplazamos en la probabilidad que nos habían pedido:

𝑃 (𝑋 − 𝑌 ≥ 3) = 𝑃(𝑊 ≥ 3)

A partir de este momento, trabajamos como si se tratara de una normal de una variable, con W.

3−2
P (W ≥ 3) = 1 − P (W ≤ 3) = 1 − P (Z ≤ )
√0,8
𝑍 ~ 𝑁 (0,1)

P (W ≥ 3) = 1 − P (Z ≤ 1,12)

P (W ≥ 3) = 1 − 0,8686 = 0,1314

Por lo tanto, la probabilidad de que la diferencia de ventas entre las bolsas negras y transparentes sea
superior a 3 [miles de unidades] a la semana es de 0,1314.

b) En este caso sí nos presentan una muestra aleatoria, por lo que es necesario redefinir las variables
X e Y. Pero primero debemos reconocer las muestras aleatorias presentadas:

m. a(nx = 8) ↔ 8 v. a iid
m. a(ny = 10) ↔ 10 v. a iid

Sean 𝑋̅: venta media semanal de bolsas negras [miles de unidades] e 𝑌̅: bolsa media semanal de bolsas
transparentes [miles de unidades]. 𝑋̅ e 𝑌̅ son independientes.

0,5 0,3
̅~ N (12 ;
X ̅~ N (10 , )
) eY
8 10
El enunciado nos pide la probabilidad “𝑃 ( 𝑌̅ > 𝑋̅)”, lo que equivale a decir “𝑃 ( 𝑌̅ − 𝑋̅ > 0)”.

Tenemos:
𝑃 ( 𝑌̅ − 𝑋̅ > 0) = 1 − 𝑃 (𝑌̅ − 𝑋̅ ≤ 0)

Para calcular esta probabilidad, así como todas, debemos estandarizar. En este caso, debemos
invertir los elementos.

(𝑦̅ − 𝑥̅ ) − (𝜇𝑦 − 𝜇𝑥 )
𝑍=
𝜎2 𝜎2
√ 𝑥+ 𝑦
𝑛𝑥 𝑛𝑦

𝑍 ~ 𝑁 (0,1)

(0) − (10 − 12)


Z= = 6,58
√0,5 + 0,3
8 10

Z ~ N (0,1)
Nos quedó:
P(̅
Y−̅ ̅−̅
X > 0) = 1 − P (Y X ≤ 0) = 1 − P (Z ≤ 6,58)

P(̅
Y−̅
X > 0) = 1 − ≈1

P(̅
Y−̅
X > 0) ≈ 0

La probabilidad de que la venta media semanal de las bolsas transparentes supere la venta media de
las bolsas negras es aproximadamente 0.

También podría gustarte