Documentos de Académico
Documentos de Profesional
Documentos de Cultura
β1
β1
Uno de los supuestos básicos del modelo de regresión lineal clásico es el que los errores
tengan distribución normal con media cero y varianza 𝜎 2 , esto es:
𝑌𝑖 = 𝛽1 + 𝛽2 𝑋𝑖 + 𝑢𝑖
𝑌𝑖 = 𝑋𝛽 + 𝑢
Donde:
𝑢𝑖 ~N(0, 𝜎 2 );∀𝑖
Dado que los estimadores de MCO son combinaciones lineales de 𝑌𝑖 , entonces los estimadores
también seguirían esta distribución
̅𝟐
𝟏 𝐗
𝛃𝟏 ~𝐍 (𝛃𝟏 , 𝛔𝟐 ( + 𝟐 ))
𝐧 𝚺𝐱
𝛔𝟐
𝛃𝟐 ~𝐍 (𝛃𝟐 , ( ))
𝚺𝐱 𝟐
̂2 −𝛽2
𝛽 𝛼
𝑃𝑟 (−𝑧1−𝛼 < 2
< 𝑧1−𝛼 ) = (1 − 𝛼) 𝑑𝑜𝑛𝑑𝑒 ∶ 𝑧1−𝛼 𝑒𝑠 𝑒𝑙 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 1 − 2
2 √𝜎 ⁄ 2 2 2
𝛴𝑥
Función de
densidad de la
Área = (1 − 𝛼)
normal estándar
𝛼
Área=
𝛼 Área= 2
2
Entonces:
2 2
𝑃𝑟 (𝛽̂2 −𝑧1−𝛼 √𝜎 ⁄ 2 < 𝛽2 < 𝛽̂2 + 𝑧1−𝛼 √𝜎 ⁄ 2 ) = (1 − 𝛼)
2 𝛴𝑥 2 𝛴𝑥
Ejemplo: para 𝛼=0.05, los valores máximo y mínimo del intervalo de confianza al 95% para 𝛽2
serían:
𝜎 2
𝛽̂2 ± 𝑍0.975 √𝛴𝑥 2 𝑍0.975 = 1.96
Comprobación:
(𝒏 − 𝟐)𝒔𝟐
𝒙𝟐 = ~𝒙𝟐(𝒏−𝟐)
𝝈𝟐
𝑝 [𝑥 2 𝛼⁄2,(𝑛−2) ≤ 𝑥 2 ≤ 𝑥 2 1−𝛼⁄ ] = (1 − 𝛼)
2,(𝑛−2)
(𝑛 − 2)𝑠 2 (𝑛 − 2)𝑠 2
𝑝[ ≤ 𝜎2 ≤ ] = (1 − 𝛼)
𝑥 2 1−𝛼⁄ 𝑥 2 𝛼⁄2,(𝑛−2)
2,(𝑛−2)
Área = (1 − 𝛼)
𝛼
Área=
𝛼 Área= 2
2
Comprobación:
̂ 𝟐 − 𝜷𝟐
𝜷
𝑷𝒓 −𝒕𝟏−𝜶 (𝒏 − 𝟐) < < 𝒕𝟏−𝜶 (𝒏 − 𝟐) = (𝟏 − 𝜶)
𝟐 𝟐 𝟐
√𝒔 ⁄ 𝟐
𝜮𝒙
( )
Operando:
2 2
𝑃𝑟 (𝛽̂2 −𝑡1−𝛼 (𝑛 − 2)√𝑠 ⁄ 2 < 𝛽2 < 𝛽̂2 + 𝑡1−𝛼 (𝑛 − 2)√𝑠 ⁄ 2 ) = (1 − 𝛼)
2 𝛴𝑥 2 𝛴𝑥
𝛼
𝑑𝑜𝑛𝑑𝑒 𝑡 𝛼(𝑛−2) 𝑒𝑠 𝑒𝑙 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 1 − 2
1−
2
𝒔𝟐
̂ 𝟐 ± 𝒕 𝜶 (𝒏 − 𝟐)√
𝜷𝟐 ∈ 𝜷 𝟏−
𝟐 𝜮𝒙𝟐
𝟏 𝑿̅𝟐
̂ 𝟏 ± 𝒕 𝜶 (𝒏 − 𝟐)√𝒔𝟐 ( +
𝜷𝟏 ∈ 𝜷 )
𝟏−
𝟐 𝒏 𝜮𝒙𝟐
Prueba de hipótesis
Es un procedimiento a través de pruebas de hipótesis. Involucran la recolección de una muestra
y el uso de resultados muestrales para proporcionar evidencias y emitir conclusiones.
Hipótesis Nula 𝑯𝟎 : 𝜷𝟐 = 𝒂
Hipótesis alternativa 𝑯𝟎 : 𝜷𝟐 ≠ 𝒂
Al ser 𝜷𝟐 una variable aleatoria prácticamente nunca será igual al valor, salvo cuestión de
azar.
Intervalo aleatorio
• Rechazo 𝐻0
• No rechazo 𝐻0
• ERROR TIPO I
• ERROR TIPO II
Acepta la hipótesis a pesar que 𝑎 y 𝛽2 son valores muy lejanos (se acepta una hipótesis falsa)
Intervalos de confianza más anchos o más angostos
𝐻0
𝐻1 𝐻1
Región de rechazo Región de rechazo
Región de
aceptación
𝛼 𝛼
2 2
Estadístico t
T-student cuando 𝐻0 es cierta 𝜷𝟐 = 𝒂
• Condición de rechazo de 𝐻0
̂𝟐 − 𝒂
𝜷
|| || > 𝒕 𝜶 (𝒏 − 𝟐)
𝟏−
𝟐
̂(𝜷
√𝑽𝒂𝒓 ̂𝟐 )
• Condición de No rechazo de 𝐻0
̂𝟐 − 𝒂
𝜷
|| || < 𝒕 𝜶 (𝒏 − 𝟐)
𝟏−
𝟐
̂(𝜷
√𝑽𝒂𝒓 ̂𝟐 )
𝑌𝑖 = 𝛽1 + 𝛽2 𝑋𝑖 + 𝑢𝑖
𝑯𝟎 : 𝜷𝟐 = 𝟎
𝑯𝟏 : 𝜷𝟐 ≠ 𝟎
̂𝟐
𝜷
|𝒕| = || || > 𝒕𝟏−𝜶 (𝒏 − 𝟐)
𝟐
̂ ̂
√𝑽𝒂𝒓(𝜷𝟐 )
̂𝟐
𝜷
|𝒕| = || || < 𝒕 𝜶 (𝒏 − 𝟐)
𝟏−
𝟐
̂(𝜷
√𝑽𝒂𝒓 ̂𝟐 )
EL P-VALUE
Probabilidad o 𝒑 > 𝒕
𝛽̂
𝑝 − 𝑣𝑎𝑙𝑢𝑒 = 2 × 1 − 𝐹 || || , 𝑛 − 𝑘
̂ (𝛽̂)
√𝑉𝑎𝑟
[ ( )]
̂
𝜷
𝒑 − 𝒗𝒂𝒍𝒖𝒆 = 𝟐 × 𝑭 − || || , 𝒏 − 𝒌
̂(𝜷
√𝑽𝒂𝒓 ̂)
( )
Donde:
̂
𝛽
𝐹 (| | , 𝑛 − 𝑘)=Función de distribución acumulada de t-student
̂)
̂ (𝛽
√𝑉𝑎𝑟
𝑘 = 2 en el modelo bivariado
Función de 𝑷-value
densidad de la
variable aleatoria
𝛼
Área= 2
𝛼 Área= 2
EJERCICIO 1:
Decisión:
Como
|𝑡| = 10.092 > 2.3646 = 𝑡 𝛼(𝑛−2)
1−
2
=> 𝑆𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝑙𝑎 ℎ𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎 𝑐𝑜𝑛 5% 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑛𝑐𝑖𝑎
EJERCICIO 2:
i) Contraste de la hipótesis : 𝛽2
Hipótesis
𝐻0 : 𝛽2 = 0
𝐻1 : 𝛽2 ≠ 0
Estadístico t:
Decisión:
Como
|𝑡| = 14.509 > 2.228 = 𝑡0.95(10)
𝑡 𝛼(𝑛−2)
1−
2
Producción 1 2 3 4 5 6 7 8 9 10
Costo Total 193 226 240 244 257 260 274 297 350 420
𝑁° 𝑋 𝑌 𝑥 = 𝑋 − 𝑋̅ 𝑦 = 𝑌 − 𝑌̅ 𝑥2 𝑥𝑦 𝑌̂ 𝑒 𝑒2
1 1 193 -4.50 -83.10 20.25 373.95 186.40 6.60 43.56
2 2 226 -3.50 -50.10 12.25 175.35 206.33 19.67 386.78
3 3 240 -2.50 -36.10 6.25 90.25 226.27 13.73 188.60
4 4 244 -1.50 -32.10 2.25 48.15 246.20 -2.20 4.84
5 5 257 -0.50 -19.10 0.25 9.55 266.13 -9.13 83.42
6 6 260 0.50 -16.10 0.25 -8.05 286.07 -26.07 679.47
7 7 274 1.50 -2.10 2.25 -3.15 306 -32.00 1024.00
8 8 297 2.50 20.90 6.25 52.25 325.93 -28.93 837.14
9 9 350 3.50 73.90 12.25 258.65 345.87 4.13 17.08
10 10 420 4.50 143.90 20.25 647.55 365.80 54.20 2937.64
SUMA 55.00 2761.00 0.00 0.00 82.50 1644.50 2761.00 0 6202.53
PROMEDIO 5.50 276.10
𝛽1 = 166.4667
𝛽2 = 19.9333
Donde:
Numero de observaciones
n 10
Promedios (Medias):
∑ 𝑋𝑖 ∑ 𝑌𝑖
𝑋̅ = 𝑌̅ =
𝑛 𝑛
Media de x:
𝑋̅ 5.50
Media de y:
𝑌̅ 276.10
𝑥 = 𝑋 − 𝑋̅ 𝑦 = 𝑌 − 𝑌̅
Estimadores (Parámetros):
∑ 𝑥𝑦
𝛽̂1 = 𝑌̅ − 𝛽̂2 𝑋̅ 𝛽̂2 = 2
𝑥
𝑌̂ = 𝛽̂1 + 𝛽̂2 𝑋
Residuos:
𝑒 = 𝑌 − 𝑌̂ = 𝑦 − 𝛽̂2 𝑥
Estimador 𝑆 2 (𝐸𝑠𝑡𝑖𝑚𝑎𝑐𝑖𝑜𝑛 𝑑𝑒 𝜎 2 ):
∑ 𝑒2
𝑆2 =
𝑛−2
Varianza estimadas de 𝛽1 𝑦 𝛽2:
1 𝑋̅ 2 𝑆2
𝑣𝑎𝑟 (𝛽̂1 ) = 𝑆 2 (𝑛 + ∑ 𝑋 2 ) 𝑣𝑎𝑟 (𝛽̂2 ) = ∑ 𝑋 2
𝑖 𝑖
𝑆𝐶𝑇 = ∑ 𝑌 2 = ∑(𝑌 − 𝑌̅ )2
𝑆𝐶𝐸 = 𝛽̂2 ∑ 𝑋 2
Suma de cuadrados de los Residuos (SCR):
Hipótesis Hipótesis
𝐻0 : 𝛽1 = 0 𝐻0 : 𝛽1 = 0
𝐻1 : 𝛽1 ≠ 0 𝐻1 : 𝛽1 ≠ 0
Valor absoluto
del estadístico t Estadístico t
Decisión Decisión
𝐸𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑆 2
2
∑ 𝑒2
𝑆 = = 775.3167
𝑛−2
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑎
1 𝑋̅ 2 𝑆2
𝑣𝑎𝑟 (𝛽̂1 ) = 𝑆 2 ( + ∑ ) 𝑣𝑎𝑟 (𝛽̂2 ) = ∑
𝑛 𝑋𝑖2 𝑋𝑖2
𝑆𝐶𝑇 = ∑ 𝑌 2 = ∑(𝑌 − 𝑌̅ )2
𝑆𝐶𝐸 = 𝛽̂2 ∑ 𝑋 2
𝑆𝐶𝐸 = 32780.3667
𝑆𝑢𝑚𝑎 𝑑𝑒 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑟𝑒𝑠𝑖𝑑𝑢𝑜𝑠 (𝑆𝐶𝑅)
𝑆𝐶𝑅 = 6202.5333
𝑆𝐶𝑅 = ∑ 𝑒 2
𝜮𝑿𝒊 𝒀𝒊 = 𝟏𝟗𝟕𝟑. 𝟔𝟕 𝒏 = 𝟐𝟎
̅ = 𝟗. 𝟓𝟔
𝑿 ̅ = 𝟖. 𝟕𝟔𝟓
𝒀
SOLUCION:
𝑌 = 𝐷𝑒𝑚𝑎𝑛𝑑𝑎 𝑑𝑒 𝑎𝑙𝑖𝑚𝑒𝑛𝑡𝑜
𝑋 = 𝐼𝑛𝑔𝑟𝑒𝑠𝑜 𝑑𝑖𝑠𝑝𝑜𝑛𝑖𝑏𝑙𝑒
𝑌𝑖 = 𝛽1 +𝛽2 𝑋𝑖 + 𝜇𝑖
a)
∑ 𝑋𝑖
𝑋̅ = = 9.56 → ∑ 𝑋𝑖 = 191.20
𝑛
∑ 𝑌𝑖
𝑌̅ = = 8.765 → ∑ 𝑌𝑖 = 175.3
𝑛
𝑥𝑖 = 𝑋𝑖 − 𝑋̅
𝑦𝑖 = 𝑌𝑖 − 𝑌̅
∑ 𝑋𝑖 𝑌𝑖 + 𝑌̅ ∑ 𝑋𝑖 + 𝑋̅ ∑ 𝑌𝑖 + ∑ 𝑋̅𝑌̅
1973.67 = ∑ 𝑋𝑖 𝑌𝑖 + ∑ 𝑋̅𝑌̅
𝑛 𝑥𝑋̅𝑥 𝑌̅ = 1675.868
=> ∑ 𝑋𝑖 𝑌𝑖 = 297.802
∑ 𝑌𝑖 𝑋𝑖 297.802
𝛽̂2 = = = 0.883
𝑋𝑖2 337.308
𝛽̂1 = 𝑌̅ + 𝛽̂2 𝑋̅ = 8.765 − (0.883)(9.56) = 0.324 ,
𝐼𝑛𝑡𝑒𝑟𝑝𝑟𝑒𝑡𝑎𝑐𝑖𝑜𝑛:
𝛽1 (𝐼𝑛𝑡𝑒𝑟𝑐𝑒𝑝𝑡𝑜)
𝛽2 (𝑃𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒)
𝑆𝐶𝑅 14.0302
b) 𝑅 2 = 1 − 𝑆𝐶𝑇 = 1 − 277.0255 = 0.9494
= ∑ 𝑌𝑖2 − 2𝑌̅ ∑ 𝑌𝑖 + ∑ 𝑌̅ 2
= 1813.53 − 2(8.765)(175.3) + 20(8.765)2
= 277.0255
=> 𝑆𝐶𝑅 = 277.0255 − (0.883)2 (337.308) = 14.0302
=> 𝑆𝐶𝑇 = ∑ 𝑌𝑖2
Estimar la varianza de 𝜇
𝑉𝑎𝑟(𝜇) = 𝜎 2 = 𝑆 2 (𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙)
, 1 − 𝛼 = 0.95 ; 𝛼 = 0.05
−0.7269 ≤ 𝛽1 ≤ 1.3749
(𝑛 − 2)𝑆 2 2
(𝑛 − 2)𝑆 2
≤ 𝜎 ≤
𝑋 2 𝛼(𝑛−2) 𝑋 2 𝛼(𝑛−2)
1− 2 2
Contraste de la hipótesis: 𝛽2
Hipótesis
𝐻0 : 𝛽2 = 0
𝐻1 : 𝛽2 ≠ 0
Estadístico t:
𝛽̂2 | 0.883 | 0.883
|𝑡| = || || = = || || = |18.3681| = 18.3681
√𝑣𝑎𝑟 (𝛽̂2 ) | 𝑆 | 2
√ 0.7795
√ 337.308
∑ 𝑋𝑖2
Decisión:
Como
|𝑡| = 18.3681 > 2.101 = 𝑡 𝛼(𝑛−2)
1−
2
=> 𝑆𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝑙𝑎 ℎ𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎 𝑐𝑜𝑛 95% 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑛𝑐𝑖𝑎
X 3 5 6 4 2 7 8 9 10
Y 2 4 6 3 4 8 10 14 12
SOLUCION:
a) Estimador 𝑆 2
∑ 𝑒2
𝑆2 = = 2.9619
𝑛−2
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑎
𝑆𝐶𝑇 = ∑ 𝑌 2 = ∑(𝑌 − 𝑌̅ )2
𝑆𝐶𝑇 = 144.0000
𝑆𝑢𝑚𝑎 𝑑𝑒 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑒𝑥𝑝𝑙𝑖𝑐𝑎𝑑𝑎 𝑝𝑜𝑟 𝑙𝑎 𝑟𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛 (𝑆𝐶𝐸)
𝑆𝐶𝐸 = 𝛽̂2 ∑ 𝑋 2
𝑆𝐶𝐸 = 123.2667
𝑆𝑢𝑚𝑎 𝑑𝑒 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑜𝑠 𝑟𝑒𝑠𝑖𝑑𝑢𝑜𝑠 (𝑆𝐶𝑅)
𝑆𝐶𝑅 = 20.7333
𝑅 − 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜
𝑅 2 = 0.8560
𝑡1−𝛼 = 2.3646
2
𝑋 𝛼(𝑛−2) = 16.0128
1−
2
𝑋𝛼(𝑛−2) = 1.6899
2
Intervalos de confianza 𝛽1
𝐿𝐼 = −5.0318
𝐿𝑆 = 1.8318
Intervalos de confianza 𝛽2
𝐿𝐼 = 0.980
𝐿𝑆 = 1.9587
Intervalos de confianza 𝜎 2
𝐿𝐼 = 1.2948
𝐿𝑆 = 12.2692
c) Prueba de Hipótesis
Hipótesis Hipótesis
𝐻0 : 𝛽1 = 0 𝐻0 : 𝛽1 = 0
𝐻1 : 𝛽1 ≠ 0 𝐻1 : 𝛽1 ≠ 0
Valor absoluto
del estadístico t Estadístico t
|𝑡| = 1.1025 |𝑡| = 6.4512
Decisión Decisión