Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Considérese dos muestras aleatorias de tamaño 𝑛𝑥 y 𝑛𝑌 de dos poblaciones independientes con función de densidad de
probabilidad Normal
𝑋𝑖 ~𝑁 𝜇𝑥 , 𝜎 2 , 𝑖 = 1,2, … , 𝑛𝑥 ; 𝑌𝑖 ~𝑁 𝜇𝑦 , 𝜎 2 , 𝑖 = 1,2, … , 𝑛𝑌
• Varianza conocida
𝜎2 𝜎2
𝑋 − 𝑌~𝑁 𝜇𝑥 − 𝜇𝑌 , +
𝑛𝑥 𝑛𝑌
o
1 1
𝑋 − 𝑌~𝑁 𝜇𝑥 − 𝜇𝑌 , 𝜎 2 +
𝑛𝑥 𝑛𝑌
Por lo tanto
𝑋 − 𝑌 − 𝜇𝑥 − 𝜇𝑌
~𝑁(0,1)
1 1
𝜎 𝑛 +𝑛
𝑥 𝑌
𝑛𝑥 − 1 𝑆𝑋2 𝑛𝑌 − 1 𝑆𝑌
2
2 ~𝜒 2𝑛𝑋−1 𝑦 2 ~𝜒 2𝑛𝑌 −1
𝜎 𝜎
𝑛𝑥 − 1 𝑆𝑋2 𝑛𝑌 − 1 𝑆𝑌2
+ ~𝜒 2𝑛
𝜎 2 𝜎 2 𝑋+𝑛𝑌 −2
Por lo tanto,
𝑋 − 𝑌 − 𝜇𝑥 − 𝜇𝑌
1 1
𝜎 𝑛 +𝑛 𝑋 − 𝑌 − 𝜇𝑥 − 𝜇𝑌 𝑋 − 𝑌 − 𝜇𝑥 − 𝜇𝑌
𝑥 𝑌
= =
𝑛𝑥 − 1 𝑆𝑋2 𝑛𝑌 − 1 𝑆𝑌2 1
𝑛𝑥 − 1 𝑆𝑋2 + 𝑛𝑌 − 1 𝑆𝑌2 1
+ 𝑛𝑥 − 1 𝑆𝑋2 + 𝑛𝑌 − 1 𝑆𝑌2 1
2 1 + 1
𝜎 2
𝜎2 𝜎2 𝜎 𝑛𝑋 + 𝑛𝑌 − 2 +
𝑛𝑥 𝑛𝑌
𝑛𝑋 + 𝑛𝑌 − 2 𝑛𝑋 + 𝑛𝑌 − 2 𝑛𝑥 𝑛𝑌
𝑋 − 𝑌 − 𝜇𝑥 − 𝜇𝑌 𝑋 − 𝑌 − 𝜇𝑥 − 𝜇𝑌
= = ~𝑡 𝑛𝑋 +𝑛𝑌 −2
1 1 1 1
𝑆𝑝2 + 𝑆𝑝 +
𝑛𝑥 𝑛𝑌 𝑛𝑥 𝑛𝑌
2
𝑛𝑥 −1 𝑆𝑋 + 𝑛𝑌 −1 𝑆𝑌2
Con 𝑆𝑝2 =
𝑛𝑋 +𝑛𝑌 −2
• Si la varianza es conocida y diferente
𝑋 − 𝑌 − 𝜇𝑥 − 𝜇𝑌
~𝑁(0,1)
𝜎𝑋2 𝜎𝑌2
𝑛𝑥 + 𝑛𝑌
Ejemplos:
El gerente de una refinería piensa modificar el proceso para producir gasolina a partir de petróleo crudo. El gerente
hará la modificación sólo si la gasolina promedio que se obtiene por este nuevo proceso aumenta su valor con
respecto al proceso en uso. Con base en un experimento de laboratorio y mediante el empleo de dos muestra
aleatorias de tamaño 12, una para cada proceso, la cantidad de gasolina promedio del proceso en uso, es de 𝑋 =
24.6 𝑐𝑜𝑛 𝑆𝑋2 = 2.3 y para el proceso propuesto fue de 𝑌 = 28.2 𝑐𝑜𝑛 𝑆𝑌2 = 2.7.
El gerente piensa que los resultados proporcionados por los procesos de producción son variables aleatorias que
tienen una función de densidad de proba Normal. Esto es, 𝑋𝑖 ~𝑁 𝜇𝑋 , 𝜎 2 ; 𝑌𝑖 ~𝑁 𝜇𝑌 , 𝜎 2 . Con base en la evidencia
mostrada, ¿debería adoptarse el nuevo proceso?
Solución:
Sabemos que 𝑋𝑖 ~𝑁 𝜇𝑋 , 𝜎 2 ; 𝑌𝑖 ~𝑁 𝜇𝑌 , 𝜎 2 , con varianza desconocida pero igual. Entonces, la variable aleatoria
𝑋 − 𝑌 − 𝜇𝑥 − 𝜇𝑌
𝑇= ~𝑡 𝑛𝑋 +𝑛𝑌 −2
1 1
𝑆𝑝 +
𝑛𝑥 𝑛𝑌
2
𝑛𝑥 −1 𝑆𝑋 + 𝑛𝑌 −1 𝑆𝑌2
Con 𝑆𝑝2 =
𝑛𝑋 +𝑛𝑌 −2
Supongamos que no hay diferencia en los dos tipos de proceso, esto es , que 𝜇𝑥 = 𝜇𝑌 . Entonces,
𝑋 − 𝑌 − 𝜇𝑥 − 𝜇𝑌 24.6 − 28.2 − 0
𝑇= = = −3.516
1 1 1 1
𝑆𝑝 + 2.508 +
𝑛𝑥 𝑛𝑌 12 12
Entonces,
𝑃 𝑇 ≤ 𝑡0 = 𝑃 𝑇 ≤ −3.516 = 0.00097
Definición 3.3. Sean X y Y variables aleatorias independientes que tienen función de densidad de probabilidad ji-cuadrada
con 𝑛𝑥 y 𝑛𝑌 grados de libertad, respectivamente,
𝑋
𝑛
𝐹= 𝑋
𝑌
𝑛𝑌
Se dice que tiene la distribución F con 𝑛𝑥 grados de libertad en el numerador y 𝑛𝑌 grados de libertad en el denominador.
Τ
𝑛 2 −𝑛 Τ2 − 𝑛𝑥 + 𝑛𝑌 Τ2
Γ 𝑛𝑥 + 𝑛𝑌 Τ2 𝑛𝑥 𝑋 𝑛𝑌 𝑌 𝑛𝑋 −1 Τ2
𝑛𝑋
𝐹 𝑓; 𝑛𝑥 , 𝑛𝑌 = 𝑓 1 + ( )𝑓 , 𝑓>0
Γ 𝑛𝑥 Τ2 Γ 𝑛𝑌 Τ2 𝑛𝑌
2𝑛𝑌2 𝑛𝑥 + 𝑛𝑌 − 2
𝑉𝑎𝑟 𝐹 =
𝑛𝑋 𝑛𝑌 − 2 2 𝑛𝑌 − 4
La función de densidad de probabilidad F tiene asimetría positiva para cualquiera valores de 𝑛𝑥 y 𝑛𝑌 , pero ésta va
disminuyendo conforme 𝑛𝑥 y 𝑛𝑌 toman valore cada vez más grandes.
1−𝛼
𝑓1−𝛼;𝑛𝑥 ,,𝑛𝑦
𝑓1−𝛼,𝑛𝑥 ,𝑛𝑦
𝑃 𝐹 ≤ 𝑓1−𝛼;𝑛𝑥 ,𝑛𝑦 = න 𝐹 𝑓; 𝑛𝑥 , 𝑛𝑦 𝑑𝐹 = 1 − 𝛼
0
𝑃 𝐹 ≤ 𝑓0.90;5,10 = 𝑃 𝐹 ≤ 2.52 = 0.90
La tabla solamente cuenta con los valores cuantiles 𝑓1−𝛼;𝑛𝑥 ,,𝑛𝑦 ¿Cómo encontrar los cuantiles para 𝛼 > 0.5?
𝑌
1 1 𝑛
𝐹´ = = = 𝑌
𝐹 𝑋 𝑋
𝑛𝑋 𝑛𝑋
𝑌
𝑛𝑌
Tiene una función de densidad de probabilidad F con 𝑛𝑌 y 𝑛𝑋 grados de libertad. Entonces
1 1
𝑃 𝐹 ≤ 𝑓1−𝛼;𝑛𝑥 ,𝑛𝑦 = 𝑃 >𝑓 = 1−𝛼
𝐹 1−𝛼;𝑛𝑥 ,𝑛𝑦
O
1 1
𝑃 ≤ =𝛼
𝐹 𝑓1−𝛼;𝑛𝑥 ,𝑛𝑦
1
Pero 𝐹´ = 𝐹 ~𝐹(𝑛𝑌 y 𝑛𝑋 )
Entonces,
1
𝑃 𝐹´ ≤ 𝑓´𝛼;𝑛𝑌 ,𝑛𝑋 = 𝛼 𝑐𝑜𝑛 𝑓´ = 𝑓
1−𝛼;𝑛𝑥 ,𝑛𝑦
1 1
𝑃 𝐹 ≤ 𝑓0.05;8,12 = 𝑃 𝐹 ≤ =𝑃 𝐹≤ = 𝑃 𝐹 ≤ 0.305 = 0.05
𝑓0.95;12,8 3.28
Regresando al problema de desarrollar una estadística apropiada para usarse en la formulación de inferencias con respecto a las
varianzas de dos poblaciones independientes con función de densidad de probabilidad Normal.
Sea 𝑋1 , 𝑋2 , … , 𝑋𝑛𝑥 una muestra aleatoria de una población con 𝑋𝑖 ~𝑁 𝜇𝑋 , 𝜎𝑋2 , 𝑖 = 1,2, … , 𝑛𝑥
Sea 𝑌1 , 𝑌2 , … , 𝑌𝑛𝑦 una muestra aleatoria de una población con 𝑌𝑖 ~𝑁 𝜇𝑌 , 𝜎𝑌2 , 𝑖 = 1,2, … , 𝑛𝑦
Recuerde que
𝑛𝑥 − 1 𝑆𝑋2 2 𝑛𝑌 − 1 𝑆𝑌2
2 ~𝜒 𝑛𝑋 −1 𝑦 2 ~𝜒 2𝑛𝑌−1
𝜎𝑋 𝜎𝑌
Entonces,
𝑛𝑥 − 1 𝑆𝑋2
𝜎𝑋2 𝑆𝑋2
𝑛𝑥 − 1 𝜎𝑋2
𝐹= 2 = 2 ~𝐹 𝑛𝑥 −1,𝑛𝑦 −−1
𝑛𝑌 − 1 𝑆𝑌 𝑆𝑌
𝜎𝑌2 𝜎𝑌2
𝑛𝑌 − 1
𝑆𝑋2
𝐹 = 2 ~𝐹 𝑛𝑥 −1,𝑛𝑦 −−1
𝑆𝑌
Ejemplo: La variación en el número de unidades diarias de cierto producto el cual manejan dos operadores X y Y, debe
ser la misma. Con base en muestras de tamaño 𝑛𝑥 = 16 y 𝑛𝑌 = 21 días, el valor calculado de las desviaciones estándar
muestrales es de 𝑆𝑥 = 7.88 y 𝑆𝑌 = 5.8 unidades. Si el número de éstos, manejados por los dos operadores, por día, son
variables aleatorias independientes que se encuentran aproximadas, en forma adecuada, por una función de densidad de
probabilidad Normal, ¿existe alguna razón para creer que las varianzas son iguales?
Solución:
𝑆𝑋2
𝐹 = 2 ~𝐹 𝑛𝑥 −1,𝑛𝑦 −−1
𝑆𝑌
Entonces,
𝑆𝑋2 7.88 2
𝑓= 2= = 1.84
𝑆𝑌 5.8 2
Por lo tanto,
𝑆𝑋2
𝑃 𝐹 > 𝑓0 = 𝑃 2 > 1.84 = 0.10
𝑆𝑌
Definición 3.2. Una sucesión de variables aleatorias 𝑋𝑛 , converge en probabilidad a una variable aleatoria X (que
podría degenerar en una constante c) cuando se cumple que
Y se denota por
𝑃
𝑋𝑛 →𝑋
Definición 3.3. Una sucesión de variables aleatorias 𝑋𝑛 , converge en media cuadrática a una variable aleatoria X (que
podría degenerar en una constante c) cuando se cumple que
2
lim 𝐸 𝑋𝑛 − 𝑋 =0
𝑛→∞
Teorema 3.6 Si 𝑋𝑛 es una sucesión de variables aleatorias tales que lim 𝐸 𝑋𝑛 = 𝑐 y lim 𝑉𝑎𝑟 𝑋𝑛 = 0, entonces
𝑛→∞ 𝑛→∞
𝑋𝑛 converge en media cuadrática a c
Demostración
𝐸 𝑋𝑛 − 𝑐 2 = 𝐸 𝑋𝑛 − 𝐸 𝑋𝑛 + 𝐸 𝑋𝑛 − 𝑐 2
2 2 2
= 𝐸 𝑋𝑛 − 𝐸 𝑋𝑛 + 2 𝐸 𝑋𝑛 − 𝐸 𝑋𝑛 𝐸 𝑋𝑛 − 𝑐 + 𝐸 𝑋𝑛 − 𝑐 = 𝑉𝑎𝑟 𝑋𝑛 + 𝐸 𝑋𝑛 − 𝑐
entonces
lim 𝐸 𝑋𝑛 − 𝑐 2 = 0
𝑛→∞
Demostración
𝐸 𝑋𝑛 −𝑐 2
𝑃 𝑋𝑛 − 𝑐 ≥ 𝜀 ≤ (Tchevychev)
𝜀2
Entonces
2
lim 𝐸 𝑋𝑛 − 𝑐
lim 𝑃 𝑋𝑛 − 𝑐 ≥ 𝜀 ≤ 𝑛→∞ =0
𝑛→∞ 𝜀2
Definición 3.4. Convergencia en distribución
Si 𝑋𝑛 ~𝐹𝑛 𝑥 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑎 𝑛 = 1,2, … y si para alguna función de distribución F(x)
lim 𝐹𝑛 𝑥 = 𝐹(𝑥)
𝑛→∞
Para todo valor de x para el cual F(x) es continua, entonces la sucesión 𝑋𝑛 se dice que converge en distribución
𝑑
a 𝑋~𝐹(𝑥) y se denota por 𝑋𝑛 →𝑋.
Ejemplo: Sea 𝑋1 , 𝑋2 , … , 𝑋𝑛 una muestra aleatoria de una distribución Uniforme, 𝑋𝑖 ~𝑈𝑛𝑖𝑓(0,1) , sea 𝑋(𝑛) =
𝑚á𝑥 𝑋1 , 𝑋2 , … , 𝑋𝑛 . Entonces
𝑛
𝐹𝑛 𝑥 = 𝑃 𝑋 𝑛 ≤ 𝑥𝑛 = 𝑃 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝑋𝑖 ≤ 𝑥𝑛 = 𝐹 𝑥𝑛 = 𝑥𝑛, 0<𝑥<1
0, 𝑠𝑖 𝑥 < 𝑐
𝐹 𝑥 =ቊ
1, 𝑠𝑖 𝑥 ≥ 𝑐
En otras palabras, F(x) es la función de distribución de una densidad discreta que asigna probabilidad 1 al valor x=c y cero
en otro caso.
Teorema 3.7. En una muestra aleatoria de una población con 𝐸 𝑋 = 𝜇 𝑦 𝑉𝑎𝑟 𝑥 = 𝜎 2 < ∞, la media muestral converge
𝑝
en probabilidad a la media poblacional 𝑋𝑛 →𝜇
Demostracón.
1 𝑛 1 𝑛 𝑛𝜎2 𝜎2
Tenemos que 𝐸 𝑋𝑛 = 𝐸 σ 𝑋 = 𝜇 y 𝑉𝑎𝑟 𝑋𝑛 = 𝑉𝑎𝑟 σ 𝑋 = =
𝑛 𝑖=1 𝑖 𝑛 𝑖=1 𝑖 𝑛2 𝑛
luego,
lim 𝐸 𝑋𝑛 = 𝜇 𝑦 lim 𝑉𝑎𝑟 𝑋𝑛 = 0
𝑛→∞ 𝑛→∞
𝑋−𝜇 𝑛 (𝑋 − 𝜇)
𝑍𝑛 = 𝜎 =
𝜎
𝑛
𝑋−𝜇 1 𝑋𝑖−𝜇 𝑡 𝑋𝑖 −𝜇
𝑡 𝜎 𝑡 𝑛 σ𝑛
𝑖=1 𝜎 𝑡 𝑋𝑖 −𝜇
𝑛 𝜎 𝑡
𝑌
𝑚𝑍𝑛 𝑡 = 𝐸 𝑒 𝑡𝑍𝑛 = 𝐸 𝑒 𝑛 =𝐸 𝑒 𝑛 𝑛
= 𝐸 Π𝑖=1 𝑒 𝑛 𝑛
= Π𝑖=1 𝐸 𝑒 𝑛 𝜎 𝑛
= Π𝑖=1 𝐸 𝑒 𝑛 𝑖 ,
𝑋𝑖 − 𝜇
𝑐𝑜𝑛 𝑌𝑖 =
𝜎
𝑛
𝑛 𝑡 𝑛 𝑡 𝑡
= Π𝑖=1 𝑚𝑌𝑖 = Π𝑖=1 𝑚𝑌 = 𝑚𝑌
𝑛 𝑛 𝑛
𝑡 2 3
𝑡 𝑌 𝑡 1 2 𝑡 1 3 𝑡
𝑚𝑌 =𝐸 𝑒 𝑛 𝑖 =𝐸 1+𝑌 + 𝑌 + 𝑌 +⋯
𝑛 𝑛 2! 𝑛 3! 𝑛
2 3
𝑡 1 𝑡 1 𝑡 𝑡2 𝜇3 𝑡 3 1 𝑡 2 𝑡 3 𝜇3
= 1 + 𝜇1 + 𝜇2 + 𝜇3 +⋯ = 1+ + +⋯ = 1+ + +⋯
𝑛 2! 𝑛 3! 𝑛 2𝑛 3! 𝑛3/2 𝑛 2 3! 𝑛
Entonces,
𝑛 𝑛
𝑡 1 𝑡 2 𝑡 3 𝜇3
𝑚𝑍𝑛 𝑡 = 𝑚𝑌 = 1+ + +⋯
𝑛 𝑛 2 3! 𝑛
Luego
𝑛 𝑛
𝑡 1 𝑡2 𝑡3 2 /2
lim 𝑚𝑍𝑛 𝑡 = lim 𝑚𝑌 = lim 1 + + +⋯ = 𝑒𝑡
𝑛→∞ 𝑛→∞ 𝑛 𝑛→∞ 𝑛 2 3! 𝑛
= 𝑚𝑍 𝑡 ; 𝑍~𝑁(0,1)
Recordar
𝑢 𝑛
lim 1 + = 𝑒𝑢
𝑛→∞ 𝑛
Ejemplo: Una compañía fabrica ligas de hule del número 18 y las empaca en paquetes de 200 ligas cada uno.
El peso de una liga individual es una variable aleatoria con distribución desconocida, pero se ha calculado
que la media es de aproximadamente ½ gramo, con una desviación estándar de 1/100 de gramo. Cada 50
paquetes de liga se empacan luego en una caja de cartón. Las cajas son trasportadas hacia almacenes de todo
el país para su comercialización. Determine el porcentaje de cajas cuyo contenido neto es de más de 5010
gramos.
Solución:
Se puede demostrar que la función de densidad de probabilidad normal es una forma limite de la Binomial cuando n es
grande y p no tiene un valor cercano a cero o a uno.
Teorema 3.9. Sea X una variable aleatoria Binomial con media 𝑛𝑝 y varianza 𝑛𝑝 1 − 𝑝 . La distribución de la variable
aleatoria
𝑋 − 𝑛𝑝
𝑌=
𝑛𝑝(1 − 𝑝)
tiende a la Normal estándar conforme el número de ensayos independientes 𝑛 → ∞.
La esencia del teorema 3.9 es que si X es una variable aleatoria Binomial, para la que el número de ensayos
independientes es suficientemente grande, se dice que X posee una función de densidad de probabilidad normal
aproximada con media 𝑛𝑝 y varianza 𝑛𝑝 1 − 𝑝 . De hecho la aproximación es adecuada tanto para 𝑛𝑝 > 5
cuando 𝑝 ≤ 1/2 como para 𝑛(1 − 𝑝) > 5 cuando 𝑝 > 1/2 . Esto es,
𝑎 − 𝑛𝑝 𝑏 − 𝑛𝑝
𝑃 𝑎≤𝑋≤𝑏 =𝑃 ≤𝑍≤
𝑛𝑝 1 − 𝑝 𝑛𝑝 1 − 𝑝
Ejemplo: Se sabe que 30% de los clientes de una tarjeta de crédito, a nivel nacional, dejan en cero su saldo
para no incurrir en intereses moratorios. Determinar la probabilidad, para un grupo de 150 tarjetahabientes,
de que:
a) De 40 a 60 clientes paguen sus cuentas, antes de incurrir en el pago de intereses
b) 30 clientes o menos paguen sus cuentas antes de incurrir en el pago de intereses.
Solución