β1

EL SUPUESTO DE NORMALIDAD DE LOS ERRORES
Uno de los supuestos básicos del modelo de regresión lineal clásico es el que los errores
tengan distribución normal con media cero y varianza 𝜎 2 , esto es:
𝑌𝑖 = 𝛽1 + 𝛽2 𝑋𝑖 + 𝑢𝑖
𝑌𝑖 = 𝑋𝛽 + 𝑢
Donde:
𝑢𝑖 ~N(0, 𝜎 2 );∀𝑖
Con el cumplimiento del supuesto de normalidad se tiene la justificación teórica para la

utilización de pruebas estadísticas.
Una propiedad de la distribución normal es que cualquier función lineal de variables

normalmente distribuidas estará también normalmente distribuidas.
Dado que los estimadores de MCO son combinaciones lineales de 𝑌𝑖 , entonces los estimadores
también seguirían esta distribución
̅𝟐
𝟏 𝐗
𝛃𝟏 ~𝐍 (𝛃𝟏 , 𝛔𝟐 ( + 𝟐 ))
𝐧 𝚺𝐱
𝛔𝟐
𝛃𝟐 ~𝐍 (𝛃𝟐 , ( ))
𝚺𝐱 𝟐
Podemos construir intervalos de confianzas alrededor de los estimadores puntuales.
INTERVALOS DE CONFIANZA PARA LOS PARAMETROS ESTIMADOS

Estimación de intervalos: proceso mediante el cual calculamos intervalos basándonos en las
estimaciones puntuales.
Intervalo de confianza: rango de valores sobre el cual tenemos la confianza de que el

parámetro población posiblemente se encuentre en ese intervalo
Construyendo un intervalo para el parámetro 𝛽2 , estandarizado como:

̂2 −𝛽2
𝛽
𝑧= 2
~𝑁(0,1)
√𝜎 ⁄ 2
𝛴𝑥
Definimos un nivel de confianza de (1 − 𝛼) × 100%:
̂2 −𝛽2
𝛽 𝛼
𝑃𝑟 (−𝑧1−𝛼 < 2
< 𝑧1−𝛼 ) = (1 − 𝛼) 𝑑𝑜𝑛𝑑𝑒 ∶ 𝑧1−𝛼 𝑒𝑠 𝑒𝑙 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 1 − 2
2 √𝜎 ⁄ 2 2 2
𝛴𝑥
Función de
densidad de la
Área = (1 − 𝛼)
normal estándar
𝛼
Área=
𝛼 Área= 2
2
Entonces:
2 2
𝑃𝑟 (𝛽̂2 −𝑧1−𝛼 √𝜎 ⁄ 2 < 𝛽2 < 𝛽̂2 + 𝑧1−𝛼 √𝜎 ⁄ 2 ) = (1 − 𝛼)
2 𝛴𝑥 2 𝛴𝑥
Dado los valores 𝛼 podemos definir los intervalos
Ejemplo: para 𝛼=0.05, los valores máximo y mínimo del intervalo de confianza al 95% para 𝛽2
serían:
𝜎 2
𝛽̂2 ± 𝑍0.975 √𝛴𝑥 2 𝑍0.975 = 1.96
Pero 𝝈𝟐 no es un valor conocido por lo que usaremos en reemplazo el valor estimado 𝑠 2 , el

intervalo se construye en la distribución t-student con 𝑛 − 2 grados libertad.
Comprobación:
(𝒏 − 𝟐)𝒔𝟐
𝒙𝟐 = ~𝒙𝟐(𝒏−𝟐)
𝝈𝟐
𝑝 [𝑥 2 𝛼⁄2,(𝑛−2) ≤ 𝑥 2 ≤ 𝑥 2 1−𝛼⁄ ] = (1 − 𝛼)
2,(𝑛−2)
(𝑛 − 2)𝑠 2 (𝑛 − 2)𝑠 2
𝑝[ ≤ 𝜎2 ≤ ] = (1 − 𝛼)
𝑥 2 1−𝛼⁄ 𝑥 2 𝛼⁄2,(𝑛−2)
2,(𝑛−2)
Área = (1 − 𝛼)
𝛼
Área=
𝛼 Área= 2
2
Comprobación:
Definimos una variable aleatoria con distribución t-student, como:

̂ 𝟐 − 𝜷𝟐
𝜷
𝟐
√𝝈 ⁄ 𝟐 ̂ 𝟐 − 𝜷𝟐
𝜷
𝜮𝒙
= ~𝒕(𝒏−𝟐)
(𝒏 − 𝟐)𝒔𝟐⁄ 𝟐
√𝒔 ⁄ 𝟐
√ 𝝈𝟐 𝜮𝒙
𝒏−𝟐
Entonces:
̂ 𝟐 − 𝜷𝟐
𝜷
𝑷𝒓 −𝒕𝟏−𝜶 (𝒏 − 𝟐) < < 𝒕𝟏−𝜶 (𝒏 − 𝟐) = (𝟏 − 𝜶)
𝟐 𝟐 𝟐
√𝒔 ⁄ 𝟐
𝜮𝒙
( )
Operando:
2 2
𝑃𝑟 (𝛽̂2 −𝑡1−𝛼 (𝑛 − 2)√𝑠 ⁄ 2 < 𝛽2 < 𝛽̂2 + 𝑡1−𝛼 (𝑛 − 2)√𝑠 ⁄ 2 ) = (1 − 𝛼)
2 𝛴𝑥 2 𝛴𝑥
𝛼
𝑑𝑜𝑛𝑑𝑒 𝑡 𝛼(𝑛−2) 𝑒𝑠 𝑒𝑙 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 1 − 2
1−
2
Siendo los limites: inferior y superior del intervalo:
𝒔𝟐
̂ 𝟐 ± 𝒕 𝜶 (𝒏 − 𝟐)√
𝜷𝟐 ∈ 𝜷 𝟏−
𝟐 𝜮𝒙𝟐
En el cado del parámetro 𝜷𝟏 Con un procedimiento similar.
Siendo los límites: inferior y superior del intervalo:
𝟏 𝑿̅𝟐
̂ 𝟏 ± 𝒕 𝜶 (𝒏 − 𝟐)√𝒔𝟐 ( +
𝜷𝟏 ∈ 𝜷 )
𝟏−
𝟐 𝒏 𝜮𝒙𝟐
Prueba de hipótesis
Es un procedimiento a través de pruebas de hipótesis. Involucran la recolección de una muestra
y el uso de resultados muestrales para proporcionar evidencias y emitir conclusiones.
Hipótesis Nula 𝑯𝟎 : 𝜷𝟐 = 𝒂
Hipótesis alternativa 𝑯𝟎 : 𝜷𝟐 ≠ 𝒂
Al ser 𝜷𝟐 una variable aleatoria prácticamente nunca será igual al valor, salvo cuestión de
azar.
Intervalo aleatorio
• Rechazo 𝐻0
Si el valor de la hipótesis 𝑎 cae fuera del intervalo de confianza
• No rechazo 𝐻0
Si el valor de la hipótesis 𝑎 cae dentro del intervalo de confianza
• ERROR TIPO I
Rechaza la hipótesis a pesar que 𝑎 y 𝛽2 son valores muy próximos
• ERROR TIPO II
Acepta la hipótesis a pesar que 𝑎 y 𝛽2 son valores muy lejanos (se acepta una hipótesis falsa)
 Intervalos de confianza más anchos o más angostos
Relacionado con 𝛼(nivel de significancia)
𝐻0
𝐻1 𝐻1
Región de rechazo Región de rechazo
Región de
aceptación
𝛼 𝛼
2 2
Estadístico t
T-student cuando 𝐻0 es cierta 𝜷𝟐 = 𝒂
• Condición de rechazo de 𝐻0
̂𝟐 − 𝒂
𝜷
|| || > 𝒕 𝜶 (𝒏 − 𝟐)
𝟏−
𝟐
̂(𝜷
√𝑽𝒂𝒓 ̂𝟐 )
• Condición de No rechazo de 𝐻0
̂𝟐 − 𝒂
𝜷
|| || < 𝒕 𝜶 (𝒏 − 𝟐)
𝟏−
𝟐
̂(𝜷
√𝑽𝒂𝒓 ̂𝟐 )
Dado el umbral 𝒕𝟏−𝜶 (𝒏 − 𝟐)

𝟐
|𝑡| > 𝒕𝟏−𝜶 (𝒏 − 𝟐), no se comporta como t-student

𝟐
Se rechaza 𝐻0 , con un 𝛼% de posibilidades de cometer un error

PRUEBA DE SIGNIFICANCIA DE UN COEFICIENTE
𝑌𝑖 = 𝛽1 + 𝛽2 𝑋𝑖 + 𝑢𝑖
𝑯𝟎 : 𝜷𝟐 = 𝟎
𝑯𝟏 : 𝜷𝟐 ≠ 𝟎
• Condición de rechazo de 𝐻0 , con un 𝛼% de significancia
̂𝟐
𝜷
|𝒕| = || || > 𝒕𝟏−𝜶 (𝒏 − 𝟐)
𝟐
̂ ̂
√𝑽𝒂𝒓(𝜷𝟐 )
• Condición de No rechazo de 𝐻0 con un 𝛼% de significancia
̂𝟐
𝜷
|𝒕| = || || < 𝒕 𝜶 (𝒏 − 𝟐)
𝟏−
𝟐
̂(𝜷
√𝑽𝒂𝒓 ̂𝟐 )
EL P-VALUE
Probabilidad o 𝒑 > 𝒕
Indica el menor nivel de significancia con el cual podemos rechazar la 𝑯𝟎
𝛽̂
𝑝 − 𝑣𝑎𝑙𝑢𝑒 = 2 × 1 − 𝐹 || || , 𝑛 − 𝑘
̂ (𝛽̂)
√𝑉𝑎𝑟
[ ( )]
̂
𝜷
𝒑 − 𝒗𝒂𝒍𝒖𝒆 = 𝟐 × 𝑭 − || || , 𝒏 − 𝒌
̂(𝜷
√𝑽𝒂𝒓 ̂)
( )
Donde:
̂
𝛽
 𝐹 (| | , 𝑛 − 𝑘)=Función de distribución acumulada de t-student
̂)
̂ (𝛽
√𝑉𝑎𝑟
 𝑘 = 2 en el modelo bivariado
Función de 𝑷-value
densidad de la
variable aleatoria
𝛼
Área= 2
𝛼 Área= 2
El 𝑝 − 𝑣𝑎𝑙𝑢𝑒 es igual al área sombreada
• Si 𝑝 − 𝑣𝑎𝑙𝑢𝑒 > 0.10 el parámetro no es significativo
• Si 0.10 ≥ 𝑝 − 𝑣𝑎𝑙𝑢𝑒 > 0.05 el parámetro es significativo al 10%
• Si 0.05 ≥ 𝑝 − 𝑣𝑎𝑙𝑢𝑒 > 0.01 el parámetro es significativo al 5 %
• Si 𝑝 − 𝑣𝑎𝑙𝑢𝑒 ≤ 0.01 el parámetro es significativo al 1 %
EJERCICIO 1:
Se tiene el siguiente modelo 𝒀𝒊 = 𝜷𝟏 + 𝜷𝟐 𝑿𝒊 + 𝒖𝒊 y los siguientes datos:
𝜮𝑿𝒊 = 𝟒𝟒 𝜮𝒀𝒊 = 𝟕𝟔. 𝟑 𝜮𝑿𝒊 𝒀𝒊 = 𝟒𝟐𝟕. 𝟓𝟓 𝒏=𝟗
𝜮𝑿𝟐𝒊 = 𝟐𝟒𝟓. 𝟓 𝜮𝒀𝟐𝒊 = 𝟕𝟓𝟏. 𝟑𝟗 ̂

𝒀𝒊 = 𝟕𝟔. 𝟑
𝜮𝒙𝒊 𝒚𝒊 = 𝟓𝟒. 𝟓𝟑 𝜮𝒙𝟐𝒊 = 𝟑𝟎. 𝟑𝟗 𝜮𝒚𝟐𝒊 = 𝟏𝟎𝟒. 𝟓𝟒

Cálculos previos:
∑ 𝑋𝑖 44 ∑ 𝑌𝑖 76.3
𝑋̅ = = = 4.89 𝑌̅ = = = 8.48
𝑛 9 𝑛 9
𝛽̂1 = 𝑌̅ + 𝛽̂2 𝑋̅ = 8.48 − (1.79)(4.89) = −0.27 ,

∑ 𝑌𝑖 𝑋𝑖 54.53
𝛽̂2 = = = 1.79
𝑋𝑖2 30.39
2
2
∑ 𝑒𝑖2 ∑(𝑌𝑖 − 𝛽̂2 𝑋𝑖 )2 𝑌𝑖2 − 2𝛽̂2 ∑ 𝑌𝑖 𝑋𝑖 + 𝛽̂2 ∑ 𝑋𝑖2
𝑆 = = =
𝑛−2 30.39 𝑛−2
104.54 − 2(1.79)(54.53) + (1.79)2 (30.39)
=
9−2
= 0.956
𝑡 𝛼(𝑛−2) = 𝑡0.975 (7) = 2.3646 , 1 − 𝛼 = 0.95 ; 𝛼 = 0.05
1−
2
i) Intervalo de confianza para 𝛽1 :

1 𝑋̅ 2 1 𝑋̅ 2
𝛽̂1 − 𝑡 𝛼 (𝑛−2) √𝑆
2( + 2 ) ≤ 𝛽1 ≤ 𝛽̂1 + 𝑡 𝛼(𝑛−2) √𝑆 2 ( + )
1−
2
𝑛 ∑ 𝑋𝑖 1−
2
𝑛 ∑ 𝑋𝑖2
−2.4609 ≤ 𝛽1 ≤ 1.9209 => 𝛽1 ∈ ⌈ , ⌉
ii) Intervalo de confianza para 𝛽2 :
𝑆2 𝑆2
𝛽̂2 − 𝑡 𝛼 (𝑛−2) √( ) ≤ 𝛽2 ≤ 𝛽̂2 + 𝑡 𝛼(𝑛−2) √( )
1−
2
∑ 𝑋𝑖2 1−
2
∑ 𝑋𝑖2
1.3706 ≤ 𝛽1 ≤ 2.2094 => 𝛽2 ∈ ⌈ , ⌉
iii) Intervalo de confianza para 𝜎 2
(𝑛 − 2)𝑆 2 2
(𝑛 − 2)𝑆 2
≤ 𝜎 ≤
𝑋 2 𝛼(𝑛−2) 𝑋 2 𝛼(𝑛−2)
1− 2 2
∗ 𝑋2 𝛼(𝑛−2) = 𝑋 2 0.975(7) = 16.01

1−
2
∗ 𝑋 2 𝛼(𝑛−2) = 𝑋 2 0.025(7) = 1.69
2
=> 0.4180 ≤ 𝜎 2 ≤ 3.9598
iv) Contraste de la hipótesis : 𝛽2

Hipótesis
𝐻0 : 𝛽2 = 0
𝐻1 : 𝛽2 ≠ 0
Estadístico t:
𝛽̂2 | 1.79 | 1.79
|𝑡| = || || = = || || = |10.092| = 10.092
√𝑣𝑎𝑟 (𝛽̂2 ) | 𝑆 |2
√ 0.956
√ 30.39
∑ 𝑋𝑖2
Decisión:
Como
|𝑡| = 10.092 > 2.3646 = 𝑡 𝛼(𝑛−2)
1−
2
=> 𝑆𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝑙𝑎 ℎ𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎 𝑐𝑜𝑛 5% 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑛𝑐𝑖𝑎
EJERCICIO 2:
Continuando con el ejercicio de 12 del capítulo 2, pruebe que 𝜷𝟐 = 𝟎
i) Contraste de la hipótesis : 𝛽2
Hipótesis
𝐻0 : 𝛽2 = 0
𝐻1 : 𝛽2 ≠ 0
Estadístico t:
𝛽̂2 |1. .0111| 1.0111

|𝑡| = || || = = || || = |14.509| = 14.509
√𝑣𝑎𝑟 (𝛽̂2 ) | 2
𝑆 | √ 0.5735
√ 118.10
∑ 𝑋𝑖2
Decisión:
Como
|𝑡| = 14.509 > 2.228 = 𝑡0.95(10)
𝑡 𝛼(𝑛−2)
1−
2

Ejercicio 3:
La tabla muestra información relacionada con la producción y el costo total de
producción de un bien en el corto plazo
Producción 1 2 3 4 5 6 7 8 9 10
Costo Total 193 226 240 244 257 260 274 297 350 420
̂ 𝑖 = 𝛽̂1 + 𝛽̂2 𝑃𝑟𝑜𝑑𝑢𝑐𝑐𝑖ó𝑛𝑖 + 𝑢𝑖

Se desea estimar la función de costos 𝐶𝑜𝑠𝑡𝑜𝑠
a) Grafique el diagrama de dispersión de las observación de la tabla y estime los

parámetros del modelo por MCO. Calcule el costo estimado
̂ 𝑖 = 𝛽̂1 + 𝛽̂2 𝑃𝑟𝑜𝑑𝑢𝑐𝑐𝑖ó𝑛𝑖 y grafíquelo junto con el grafico de dispersión
𝐶𝑜𝑠𝑡𝑜𝑠
¿ Considera usted qué modelo se ajusta bien a los datos
b) Obtenga los residuos y grafíquelos para cada nivel de producción
c) Obtenga el estimador 𝑆 2 y las varianzas estimadas de 𝛽̂1 y 𝛽̂2

Obtenga también el R-cuadrado
d) Construya un intervalo de confianza para la pendiente. Pruebe la hipótesis que

los parámetros son iguales a cero
𝑁° 𝑋 𝑌 𝑥 = 𝑋 − 𝑋̅ 𝑦 = 𝑌 − 𝑌̅ 𝑥2 𝑥𝑦 𝑌̂ 𝑒 𝑒2
1 1 193 -4.50 -83.10 20.25 373.95 186.40 6.60 43.56
2 2 226 -3.50 -50.10 12.25 175.35 206.33 19.67 386.78
3 3 240 -2.50 -36.10 6.25 90.25 226.27 13.73 188.60
4 4 244 -1.50 -32.10 2.25 48.15 246.20 -2.20 4.84
5 5 257 -0.50 -19.10 0.25 9.55 266.13 -9.13 83.42
6 6 260 0.50 -16.10 0.25 -8.05 286.07 -26.07 679.47
7 7 274 1.50 -2.10 2.25 -3.15 306 -32.00 1024.00
8 8 297 2.50 20.90 6.25 52.25 325.93 -28.93 837.14
9 9 350 3.50 73.90 12.25 258.65 345.87 4.13 17.08
10 10 420 4.50 143.90 20.25 647.55 365.80 54.20 2937.64
SUMA 55.00 2761.00 0.00 0.00 82.50 1644.50 2761.00 0 6202.53
PROMEDIO 5.50 276.10
𝛽1 = 166.4667
𝛽2 = 19.9333
Donde:
Numero de observaciones
n 10
Promedios (Medias):
∑ 𝑋𝑖 ∑ 𝑌𝑖
𝑋̅ = 𝑌̅ =
𝑛 𝑛
Media de x:
𝑋̅ 5.50
Media de y:
𝑌̅ 276.10
Desviaciones de x e y respecto a su promedio
𝑥 = 𝑋 − 𝑋̅ 𝑦 = 𝑌 − 𝑌̅
Estimadores (Parámetros):
∑ 𝑥𝑦
𝛽̂1 = 𝑌̅ − 𝛽̂2 𝑋̅ 𝛽̂2 = 2
𝑥
Función de Regresión muestral (FRM):
𝑌̂ = 𝛽̂1 + 𝛽̂2 𝑋
Residuos:
𝑒 = 𝑌 − 𝑌̂ = 𝑦 − 𝛽̂2 𝑥
Estimador 𝑆 2 (𝐸𝑠𝑡𝑖𝑚𝑎𝑐𝑖𝑜𝑛 𝑑𝑒 𝜎 2 ):
∑ 𝑒2
𝑆2 =
𝑛−2
Varianza estimadas de 𝛽1 𝑦 𝛽2:
1 𝑋̅ 2 𝑆2
𝑣𝑎𝑟 (𝛽̂1 ) = 𝑆 2 (𝑛 + ∑ 𝑋 2 ) 𝑣𝑎𝑟 (𝛽̂2 ) = ∑ 𝑋 2
𝑖 𝑖
Suma de cuadrados totales (SCT):
𝑆𝐶𝑇 = ∑ 𝑌 2 = ∑(𝑌 − 𝑌̅ )2
𝑆𝐶𝑇 = ∑ 𝑌 2 = 𝑆𝐶𝐸 + 𝑆𝐶𝑅 = 𝛽̂22 ∑ 𝑋 2 + ∑ 𝑒 2
Suma de cuadrados explicada por la regresión (SCE):
𝑆𝐶𝐸 = 𝛽̂2 ∑ 𝑋 2
Suma de cuadrados de los Residuos (SCR):
𝑆𝐶𝑅 = ∑ 𝑒 2 = ∑(𝑦 − 𝛽̂2 𝑥)2
R cuadrado (Medida de bondad de ajuste)

𝑆𝐶𝑅 𝑆𝐶𝐸
𝑅2 = 1 − =
𝑆𝐶𝑇 𝑆𝐶𝑇
0 < 𝑅2 < 1
𝑆𝑖 𝑅 2 𝑡𝑖𝑒𝑛𝑑𝑒 𝑎 𝑐𝑒𝑟𝑜 , 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑒𝑙 𝑎𝑗𝑢𝑠𝑡𝑒 𝑒𝑠 𝑏𝑎𝑗𝑜
𝑆𝑖 𝑅 2 𝑡𝑖𝑒𝑛𝑑𝑒 𝑎 𝑢𝑛𝑜 , 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑒𝑙 𝑎𝑗𝑢𝑠𝑡𝑒 𝑒𝑠 𝑎𝑙𝑡𝑜
Hipótesis Hipótesis
𝐻0 : 𝛽1 = 0 𝐻0 : 𝛽1 = 0
𝐻1 : 𝛽1 ≠ 0 𝐻1 : 𝛽1 ≠ 0
Valor absoluto
del estadístico t Estadístico t
|𝑡| = 8.7515 |𝑡| = 6.5023
Decisión Decisión
Se rechaza la hipótesis nula Se rechaza la hipótesis nula
𝐸𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑆 2
2
∑ 𝑒2
𝑆 = = 775.3167
𝑛−2
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑎
1 𝑋̅ 2 𝑆2
𝑣𝑎𝑟 (𝛽̂1 ) = 𝑆 2 ( + ∑ ) 𝑣𝑎𝑟 (𝛽̂2 ) = ∑
𝑛 𝑋𝑖2 𝑋𝑖2
𝑣𝑎𝑟 (𝛽̂1 ) = 361.8144 𝑣𝑎𝑟 (𝛽̂2 ) = 9.3978
𝑆𝑢𝑚𝑎 𝑑𝑒 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑡𝑜𝑡𝑎𝑙𝑒𝑠 (𝑆𝐶𝑇)
𝑆𝐶𝑇 = ∑ 𝑌 2 = ∑(𝑌 − 𝑌̅ )2
𝑆𝐶𝑇 = ∑ 𝑌 2 = 𝑆𝐶𝐸 + 𝑆𝐶𝑅

𝑆𝐶𝑇 = 38982.9000
𝑆𝑢𝑚𝑎 𝑑𝑒 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑒𝑥𝑝𝑙𝑖𝑐𝑎𝑑𝑎 𝑝𝑜𝑟 𝑙𝑎 𝑟𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛 (𝑆𝐶𝐸)
𝑆𝐶𝐸 = 𝛽̂2 ∑ 𝑋 2
𝑆𝐶𝐸 = 32780.3667
𝑆𝑢𝑚𝑎 𝑑𝑒 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑟𝑒𝑠𝑖𝑑𝑢𝑜𝑠 (𝑆𝐶𝑅)
𝑆𝐶𝑅 = 6202.5333
𝑆𝐶𝑅 = ∑ 𝑒 2
4. Se tiene el siguiente modelo:

𝑌𝑖 = 𝛽1 +𝛽2 𝑋𝑖 + 𝜇𝑖
Donde Y es la demanda de alimentos y X es el ingreso disponible. Además se sabe que:
𝜮𝑿𝒊 𝒀𝒊 = 𝟏𝟗𝟕𝟑. 𝟔𝟕 𝒏 = 𝟐𝟎
𝜮𝑿𝟐𝒊 = 𝟐𝟏𝟔𝟓. 𝟏𝟖 𝜮𝒀𝟐𝒊 = 𝟏𝟖𝟏𝟑. 𝟓𝟑
̅ = 𝟗. 𝟓𝟔
𝑿 ̅ = 𝟖. 𝟕𝟔𝟓
𝒀
SOLUCION:
𝑌 = 𝐷𝑒𝑚𝑎𝑛𝑑𝑎 𝑑𝑒 𝑎𝑙𝑖𝑚𝑒𝑛𝑡𝑜
𝑋 = 𝐼𝑛𝑔𝑟𝑒𝑠𝑜 𝑑𝑖𝑠𝑝𝑜𝑛𝑖𝑏𝑙𝑒
𝑌𝑖 = 𝛽1 +𝛽2 𝑋𝑖 + 𝜇𝑖
a)
∑ 𝑋𝑖
𝑋̅ = = 9.56 → ∑ 𝑋𝑖 = 191.20
𝑛
∑ 𝑌𝑖
𝑌̅ = = 8.765 → ∑ 𝑌𝑖 = 175.3
𝑛
𝑥𝑖 = 𝑋𝑖 − 𝑋̅
𝑦𝑖 = 𝑌𝑖 − 𝑌̅
∗ ∑ 𝑌𝑖 𝑋𝑖 = ∑(𝑋𝑖 + 𝑋̅)(𝑌𝑖 + 𝑌̅)

1973.67 = ∑(𝑋𝑖 𝑌𝑖 + 𝑋𝑖 𝑌̅ + 𝑌𝑖 𝑋̅ + 𝑋̅𝑌̅)
∑ 𝑋𝑖 𝑌𝑖 + 𝑌̅ ∑ 𝑋𝑖 + 𝑋̅ ∑ 𝑌𝑖 + ∑ 𝑋̅𝑌̅
1973.67 = ∑ 𝑋𝑖 𝑌𝑖 + ∑ 𝑋̅𝑌̅
𝑛 𝑥𝑋̅𝑥 𝑌̅ = 1675.868
=> ∑ 𝑋𝑖 𝑌𝑖 = 297.802
∗ ∑ 𝑋𝑖2 = ∑(𝑋𝑖 − 𝑋̅)2
= ∑(𝑋𝑖2 − 2𝑋𝑖 𝑋̅𝑖 + 𝑋̅ 2 )
= ∑ 𝑋𝑖2 − 2𝑋̅ ∑ 𝑋̅𝑖 + ∑ 𝑋̅ 2
= 2165.18 − 2(9.56)(191.2) + 20(9.56)2

= 337.308
∑ 𝑌𝑖 𝑋𝑖 297.802
𝛽̂2 = = = 0.883
𝑋𝑖2 337.308
𝛽̂1 = 𝑌̅ + 𝛽̂2 𝑋̅ = 8.765 − (0.883)(9.56) = 0.324 ,
𝐼𝑛𝑡𝑒𝑟𝑝𝑟𝑒𝑡𝑎𝑐𝑖𝑜𝑛:
𝛽1 (𝐼𝑛𝑡𝑒𝑟𝑐𝑒𝑝𝑡𝑜)
𝛽2 (𝑃𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒)
=>𝛽̂1 : 𝑅𝑒𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑎 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑦 𝑐𝑢𝑎𝑛𝑑𝑜 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑋 𝑒𝑠 𝑖𝑔𝑢𝑎𝑙 𝑎 0
=>𝛽̂2 : 𝑅𝑒𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑎 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑦 𝑐𝑢𝑎𝑛𝑑𝑜 𝑣𝑎𝑟𝑖𝑎 𝑒𝑛 1 𝑢𝑛𝑖𝑑𝑎𝑑 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑥
𝑆𝐶𝑅 14.0302
b) 𝑅 2 = 1 − 𝑆𝐶𝑇 = 1 − 277.0255 = 0.9494
∗ 𝑆𝐶𝑅 = ∑(𝑌𝑖 − 𝛽̂2 𝑋𝑖 )2 = ∑(𝑌𝑖2 − 2𝛽̂2 𝑋 − 𝑋 2 𝛽̂22 )
∑ 𝑌𝑖2 − 2𝛽̂2 ∑ 𝑋 − 𝛽̂22 ∑ 𝑋𝑖2
∗ ∑ 𝑌𝑖2 = ∑(𝑌𝑖 − 𝑌̅ 2 ) = ∑(𝑌𝑖2 − 2𝑌𝑖 𝑌̅ + 𝑌̅ 2 )
= ∑ 𝑌𝑖2 − 2𝑌̅ ∑ 𝑌𝑖 + ∑ 𝑌̅ 2
= 1813.53 − 2(8.765)(175.3) + 20(8.765)2
= 277.0255
=> 𝑆𝐶𝑅 = 277.0255 − (0.883)2 (337.308) = 14.0302
=> 𝑆𝐶𝑇 = ∑ 𝑌𝑖2
Estimar la varianza de 𝜇
𝑉𝑎𝑟(𝜇) = 𝜎 2 = 𝑆 2 (𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙)
∑ 𝑒𝑖2 𝑆𝐶𝑅 14.0302

𝑆2 = = = = 0.7795
𝑛−2 𝑛−2 18
c) Intervalos de confianza para 𝛽1

1 𝑋̅ 2 1 𝑋̅ 2
𝛽̂1 − 𝑡 𝛼 (𝑛−2) √𝑆
2( + 2 ) ≤ 𝛽1 ≤ 𝛽̂1 + 𝑡 𝛼(𝑛−2) √𝑆 2 ( + )
1−
2
𝑛 ∑ 𝑋𝑖 1−
2
𝑛 ∑ 𝑋𝑖2
∗𝑡 𝛼(𝑛−2) = 𝑡0.975 (18) = 2.101
1−
2
, 1 − 𝛼 = 0.95 ; 𝛼 = 0.05
−0.7269 ≤ 𝛽1 ≤ 1.3749
Intervalos de confianza para 𝛽2

𝑆2 𝑆2
𝛽̂2 − 𝑡 𝛼 (𝑛−2) √( ) ≤ 𝛽2 ≤ ̂
𝛽2 + 𝑡 𝛼 (𝑛−2) √( )
1−
2
∑ 𝑋𝑖2 1−
2
∑ 𝑋𝑖2
0.7820 ≤ 𝛽2 ≤ 0.9840
Intervalos de confianza para 𝜎 2
(𝑛 − 2)𝑆 2 2
(𝑛 − 2)𝑆 2
≤ 𝜎 ≤
𝑋 2 𝛼(𝑛−2) 𝑋 2 𝛼(𝑛−2)
1− 2 2
∗ 𝑋2 𝛼(𝑛−2) = 𝑋 2 0.975(18) = 31.53

1−
2
∗ 𝑋 2 𝛼(𝑛−2) = 𝑋 2 0.025(18) = 8.23
2
Contraste de la hipótesis: 𝛽2
Hipótesis
𝐻0 : 𝛽2 = 0
𝐻1 : 𝛽2 ≠ 0
Estadístico t:
𝛽̂2 | 0.883 | 0.883
|𝑡| = || || = = || || = |18.3681| = 18.3681
√𝑣𝑎𝑟 (𝛽̂2 ) | 𝑆 | 2
√ 0.7795
√ 337.308
∑ 𝑋𝑖2
Decisión:
Como
|𝑡| = 18.3681 > 2.101 = 𝑡 𝛼(𝑛−2)
1−
2
5. Dados los siguientes datos de un modelo bivariado:
X 3 5 6 4 2 7 8 9 10
Y 2 4 6 3 4 8 10 14 12
a) Encuentre la SCT, SCE, SCR y calcule el R-cuadrado.

b) Encuentre la varianza de 𝛽̂1 𝑦 𝛽̂2
c) Pruebe la hipótesis 𝐻0 : 𝛽2 = 0 y construya un intervalo de confianza al 95%
para 𝛽1 𝑦 𝛽2
SOLUCION:
a) Estimador 𝑆 2
∑ 𝑒2
𝑆2 = = 2.9619
𝑛−2
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑎
𝑣𝑎𝑟 (𝛽̂1 ) = 2.1062 𝑣𝑎𝑟 (𝛽̂2 ) = 0.0494
𝑆𝑢𝑚𝑎 𝑑𝑒 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑡𝑜𝑡𝑎𝑙𝑒𝑠 (𝑆𝐶𝑇)
𝑆𝐶𝑇 = ∑ 𝑌 2 = ∑(𝑌 − 𝑌̅ )2
𝑆𝐶𝑇 = ∑ 𝑌 2 = 𝑆𝐶𝐸 + 𝑆𝐶𝑅
𝑆𝐶𝑇 = 144.0000
𝑆𝑢𝑚𝑎 𝑑𝑒 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑒𝑥𝑝𝑙𝑖𝑐𝑎𝑑𝑎 𝑝𝑜𝑟 𝑙𝑎 𝑟𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛 (𝑆𝐶𝐸)
𝑆𝐶𝐸 = 𝛽̂2 ∑ 𝑋 2
𝑆𝐶𝐸 = 123.2667
𝑆𝑢𝑚𝑎 𝑑𝑒 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑜𝑠 𝑟𝑒𝑠𝑖𝑑𝑢𝑜𝑠 (𝑆𝐶𝑅)
𝑆𝐶𝑅 = 20.7333
𝑅 − 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜
𝑅 2 = 0.8560
b) 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑝𝑎𝑟𝑎 𝛽1 𝑦 𝛽2 𝑦 𝜎 2

𝑆𝑖 𝑒𝑙 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 (1 − 𝛼)𝑥100% = 95%
Nivel (𝛼) = 0.05
Grados = 7
𝑡1−𝛼 = 2.3646
2
𝑋 𝛼(𝑛−2) = 16.0128
1−
2
𝑋𝛼(𝑛−2) = 1.6899
2
Intervalos de confianza 𝛽1
𝐿𝐼 = −5.0318
𝐿𝑆 = 1.8318
Intervalos de confianza 𝛽2
𝐿𝐼 = 0.980
𝐿𝑆 = 1.9587
Intervalos de confianza 𝜎 2
𝐿𝐼 = 1.2948
𝐿𝑆 = 12.2692
c) Prueba de Hipótesis
Hipótesis Hipótesis
𝐻0 : 𝛽1 = 0 𝐻0 : 𝛽1 = 0
𝐻1 : 𝛽1 ≠ 0 𝐻1 : 𝛽1 ≠ 0
Valor absoluto
del estadístico t Estadístico t
|𝑡| = 1.1025 |𝑡| = 6.4512
Decisión Decisión
No se rechaza la hipótesis nula Se rechaza la hipótesis nula

β1

Cargado por

Información del documento

Descripción original:

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

β1

Cargado por

Copyright:

Formatos disponibles

EL SUPUESTO DE NORMALIDAD DE LOS ERRORES

Con el cumplimiento del supuesto de normalidad se tiene la justificación teórica para la

Una propiedad de la distribución normal es que cualquier función lineal de variables

Podemos construir intervalos de confianzas alrededor de los estimadores puntuales.

INTERVALOS DE CONFIANZA PARA LOS PARAMETROS ESTIMADOS

Intervalo de confianza: rango de valores sobre el cual tenemos la confianza de que el

Construyendo un intervalo para el parámetro 𝛽2 , estandarizado como:

Definimos un nivel de confianza de (1 − 𝛼) × 100%:

Dado los valores 𝛼 podemos definir los intervalos

Pero 𝝈𝟐 no es un valor conocido por lo que usaremos en reemplazo el valor estimado 𝑠 2 , el

Definimos una variable aleatoria con distribución t-student, como:

Siendo los limites: inferior y superior del intervalo:

En el cado del parámetro 𝜷𝟏 Con un procedimiento similar.

Siendo los límites: inferior y superior del intervalo:

Si el valor de la hipótesis 𝑎 cae fuera del intervalo de confianza

Si el valor de la hipótesis 𝑎 cae dentro del intervalo de confianza

Rechaza la hipótesis a pesar que 𝑎 y 𝛽2 son valores muy próximos

Relacionado con 𝛼(nivel de significancia)

Dado el umbral 𝒕𝟏−𝜶 (𝒏 − 𝟐)

|𝑡| > 𝒕𝟏−𝜶 (𝒏 − 𝟐), no se comporta como t-student

Se rechaza 𝐻0 , con un 𝛼% de posibilidades de cometer un error

• Condición de rechazo de 𝐻0 , con un 𝛼% de significancia

• Condición de No rechazo de 𝐻0 con un 𝛼% de significancia

Indica el menor nivel de significancia con el cual podemos rechazar la 𝑯𝟎

El 𝑝 − 𝑣𝑎𝑙𝑢𝑒 es igual al área sombreada

• Si 𝑝 − 𝑣𝑎𝑙𝑢𝑒 > 0.10 el parámetro no es significativo

• Si 0.10 ≥ 𝑝 − 𝑣𝑎𝑙𝑢𝑒 > 0.05 el parámetro es significativo al 10%

• Si 0.05 ≥ 𝑝 − 𝑣𝑎𝑙𝑢𝑒 > 0.01 el parámetro es significativo al 5 %

• Si 𝑝 − 𝑣𝑎𝑙𝑢𝑒 ≤ 0.01 el parámetro es significativo al 1 %

Se tiene el siguiente modelo 𝒀𝒊 = 𝜷𝟏 + 𝜷𝟐 𝑿𝒊 + 𝒖𝒊 y los siguientes datos:

𝜮𝑿𝒊 = 𝟒𝟒 𝜮𝒀𝒊 = 𝟕𝟔. 𝟑 𝜮𝑿𝒊 𝒀𝒊 = 𝟒𝟐𝟕. 𝟓𝟓 𝒏=𝟗

𝜮𝑿𝟐𝒊 = 𝟐𝟒𝟓. 𝟓 𝜮𝒀𝟐𝒊 = 𝟕𝟓𝟏. 𝟑𝟗 ̂

𝜮𝒙𝒊 𝒚𝒊 = 𝟓𝟒. 𝟓𝟑 𝜮𝒙𝟐𝒊 = 𝟑𝟎. 𝟑𝟗 𝜮𝒚𝟐𝒊 = 𝟏𝟎𝟒. 𝟓𝟒

𝛽̂1 = 𝑌̅ + 𝛽̂2 𝑋̅ = 8.48 − (1.79)(4.89) = −0.27 ,

i) Intervalo de confianza para 𝛽1 :

∗ 𝑋2 𝛼(𝑛−2) = 𝑋 2 0.975(7) = 16.01

iv) Contraste de la hipótesis : 𝛽2

Continuando con el ejercicio de 12 del capítulo 2, pruebe que 𝜷𝟐 = 𝟎

𝛽̂2 |1. .0111| 1.0111

=> 𝑆𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝑙𝑎 ℎ𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎 𝑐𝑜𝑛 5% 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑛𝑐𝑖𝑎

̂ 𝑖 = 𝛽̂1 + 𝛽̂2 𝑃𝑟𝑜𝑑𝑢𝑐𝑐𝑖ó𝑛𝑖 + 𝑢𝑖

a) Grafique el diagrama de dispersión de las observación de la tabla y estime los

b) Obtenga los residuos y grafíquelos para cada nivel de producción

c) Obtenga el estimador 𝑆 2 y las varianzas estimadas de 𝛽̂1 y 𝛽̂2

d) Construya un intervalo de confianza para la pendiente. Pruebe la hipótesis que

Desviaciones de x e y respecto a su promedio

Función de Regresión muestral (FRM):

Suma de cuadrados totales (SCT):

𝑆𝐶𝑇 = ∑ 𝑌 2 = 𝑆𝐶𝐸 + 𝑆𝐶𝑅 = 𝛽̂22 ∑ 𝑋 2 + ∑ 𝑒 2

Suma de cuadrados explicada por la regresión (SCE):

𝑆𝐶𝑅 = ∑ 𝑒 2 = ∑(𝑦 − 𝛽̂2 𝑥)2

R cuadrado (Medida de bondad de ajuste)

𝑆𝑖 𝑅 2 𝑡𝑖𝑒𝑛𝑑𝑒 𝑎 𝑢𝑛𝑜 , 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑒𝑙 𝑎𝑗𝑢𝑠𝑡𝑒 𝑒𝑠 𝑎𝑙𝑡𝑜

|𝑡| = 8.7515 |𝑡| = 6.5023

Se rechaza la hipótesis nula Se rechaza la hipótesis nula

𝑣𝑎𝑟 (𝛽̂1 ) = 361.8144 𝑣𝑎𝑟 (𝛽̂2 ) = 9.3978

𝑆𝑢𝑚𝑎 𝑑𝑒 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑡𝑜𝑡𝑎𝑙𝑒𝑠 (𝑆𝐶𝑇)

𝑆𝐶𝑇 = ∑ 𝑌 2 = 𝑆𝐶𝐸 + 𝑆𝐶𝑅

4. Se tiene el siguiente modelo:

𝜮𝑿𝟐𝒊 = 𝟐𝟏𝟔𝟓. 𝟏𝟖 𝜮𝒀𝟐𝒊 = 𝟏𝟖𝟏𝟑. 𝟓𝟑

∗ ∑ 𝑌𝑖 𝑋𝑖 = ∑(𝑋𝑖 + 𝑋̅)(𝑌𝑖 + 𝑌̅)

∗ ∑ 𝑋𝑖2 = ∑(𝑋𝑖 − 𝑋̅)2

= ∑(𝑋𝑖2 − 2𝑋𝑖 𝑋̅𝑖 + 𝑋̅ 2 )