Documentos de Académico
Documentos de Profesional
Documentos de Cultura
UNIDAD 2
MODELO DE REGRESION LINEAL SIMPLE
1.- El departamento de ventas de una gran empresa desea estimar las ventas (Yi) respecto del
precio (Xi), para lo cual cuenta con la siguiente información:
obs Xi Yi
1 30 6
2 25 12
3 23 12
4 19 18
5 15 20
6 15 20
7 11 26
8 8 31
a) Estime la función lineal de Y en X
b) Determine las varianzas : V(𝛽̂1), V(𝛽̂2)
c) Determine las desviaciones estándar de 𝛽̂1 y 𝛽̂2
d) Determine los intervalos de confianza para los coeficientes beta al 95%
e) Verifique si es significativo la razón cambio al 5%
f) ¿Es útil el modelo?
g) ¿Cuál es la predicción de las ventas si el precio es 28?
h) Determine el intervalo de confianza de la predicción al 90%
i) Determine la varianza de la predicción
j) ¿Cambia la estructura de la ventas al 5%?
Solución:
X = Precio
Y = Ventas
n=8
Y X XY X2 Y2
6 30 180 900 36,00
12 25 300 625 144,00
12 23 276 529 144,00
18 19 342 361 324,00
20 15 300 225 400,00
20 15 300 225 400,00
26 11 286 121 676,00
31 8 248 64 961,00
145 146 2.232 3.050 3.085,00
a)
Ecuaciones normales:
pág. 1
Yi nˆ 0 ˆ1 X i (1) 145 8ˆ0 ˆ1146 * (18,25)
X i Yi ˆ 0 X i ˆ1 X i ˆ ˆ
(2) 2232 0 146 1 3050
2
414,25
ˆ1 1,0746
385,5
145 156,8916
ˆ 0 37,7361
8
Interpretacion:
̂0 = 37,73 Si el precio fuera cero, por lo tanto el ventas en promedio aumentara en 37,73.
b)
Varianzas:
ˆ 2 * X i2 1,96212 * 3050
V( ̂ 0 ) = 1,94049
( X i ) 2
(146) 2
n X i2 83050
n 8
ˆ 2 1,96212
V( ̂1 ) = 0,00509
( X i ) 2
(146) 2
X i
2
n
3050
8
2
Yi ˆ 0 Yi ˆ1 Yi X i
2
nk
3085 37,7361 * 145 (1,0746 * 2232) 11,7727
2 1,96212
82 6
pág. 2
c)
Desviaciones tipicas de los estimadores:
d)
C [𝛽̂𝑖 − 𝑡∞;𝑛−𝑘 ∗ 𝑆𝛽̂𝑖 ≤ 𝑖 ≤ 𝛽̂𝑖 + 𝑡∞;𝑛−𝑘 ∗ 𝑆𝛽̂𝑖 ] =1- ∞
∝ 0,05
∝= 2 = 2 = 0,025
𝑡∞;𝑛−𝑘 = 𝑡0,025;8−2 = 2,447 Bilateral
e)
Prueba de hipótesis:
1. Planteamiento de la hipótesis:
H 0 : 1 0
H1 : 1 0
2. Nivel de significancia
∝ = 0,05
-1,692
-15,09
4. Decisión estadística:
ˆi i 1,0746 0
tC tC 15,09
S ( ˆi ) 0,0712
5. Conclusión:
Como la t calculada cae en la región de la hipótesis alterna, concluimos que es significado.
f)
R.- El modelo es util, porque precio tiene una influencia significativa sobre las ventas.
pág. 3
g)
𝑿𝟎 = 𝟐𝟖
E (Yˆ / X 0 ) 37,7361 1,0746 X 0 E (Yˆ / X 0 ) 37,7361 1,0746 * 28 7,647
h)
INTERVALO DE CONFIANZA PARA LA PREDICCION:
∝ 0,10
∝= 2 = 2 = 0,05
𝑡∞;𝑛−𝑘 = 𝑡0,05;8−2 = 1,943
i)
VARIANZA PARA LA PREDICCION:
2 1 ( X 0 X )2 1 (28 18,25) 2
V( Yˆ / X 0 ) = 1,96212 0,68884
n ( X i ) 2 8 3085 (146)
2
i
X 2
n 8
X
X i
146
18,25
n 8
j)
Prueba de hipótesis para la predicción
1. Planteamiento de la hipótesis:
H 0 : ( Noexistecambio en laestructura)
H 1 : ( Existe cambio....)
2. Nivel de significancia
∝ = 0,05
3. Regiones de rechazo y aceptación
∝ 0,05
𝐻0 ∝ = 2 = 2 = 0,025
𝐻1 𝐻1 𝑔𝑙 = 𝑛 − 𝑘 = 8 − 2 = 6 𝑡 = 2,447
-2,447 2,447
-12,62
pág. 4
Prueba bilateral
4. Decisión estadística:
t exp
E (Yˆ / X 0 ) Y 7,647 18,125
12,62 Y
Y i
145
18,125
S (Yˆ / X )
0
0,83 n 8
5. Conclusión:
Concluimos que existe un cambio en la estructura, ya que -12,62 cae en la región de la Hipótesis alterna (H1).
2.- Una empresa que se dedica a la producción de cierto producto en unidades (Yi) respecto
de la cantidad de mano de obra que utiliza (Xi):
obs Xi Yi
1 21 111
2 30 131
3 40 148
4 50 165
5 60 184
6 71 221
a) Estime la función lineal de Y en X
b) Determine las varianzas : V(𝛽̂1), V(𝛽̂2)
c) Determine las desviaciones estándar de 𝛽̂1 y 𝛽̂2
d) Determine los intervalos de confianza para los coeficiente beta al 95%
e) Verifique si es significativo la razón cambio al 5%
f) ¿Es útil el modelo?
g) ¿Cuál es la predicción de la producción si la mano de obra es de 65?
h) Determine el intervalo de confianza de la predicción al 90%
i) Determine la varianza de la predicción
j) ¿Cambia la estructura de la producción al 5%?
Solución:
X = Cantidad de mano de obra
Y = Producción (Unidades)
n=6
pág. 5
a)
Y X XY X2 Y2
111 21 2.331 441 12.321,00
131 30 3.930 900 17.161,00
148 40 5.920 1.600 21.904,00
165 50 8.250 2.500 27.225,00
184 60 11.040 3.600 33.856,00
221 71 15.691 5.041 48.841,00
960 272 47.162 14.082 161.308,00
Ecuaciones normales:
3642 0 ˆ11751,33333
3642
ˆ1 2,07956
1751,33333
960 565,64032
ˆ0 65,72668
6
Interpretacion:
̂0 = 65,73 Si la cantidad de mano de obra fuera cero, por lo tanto la produccion en
promedio aumentara en 65,73 unidades.
𝐶𝑎𝑚𝑏𝑖𝑜 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑜 𝑌𝑖 𝜕𝑌̂
̂ 1 = = 𝑋𝑖 = 2,08 Si se incrementa un trabajador a la cantidad de
𝐶𝑎𝑚𝑏𝑖𝑜 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑜 𝑋𝑖
mano de obra, la produccion en promedio aumentara en 2,08 unidades cuando todo lo
demas permanece constante.
pág. 6
b)
Varianzas:
ˆ 2 * X i2 33,54462 *14082
V( ̂ 0 ) = 44,95388
( X i ) 2 (272) 2
n X i2 6 14082
n 6
ˆ 2 33,54462
V( ̂1 ) = 0,019154
( X i ) 2
(272) 2
Xi n
2
14082
6
2
Yi ˆ 0 Yi ˆ1 Yi X i
2
nk
161308 65 ,72668 * 960 (2,07956 * 47162 ) 134,17848
2 33,54462
62 4
c)
Desviaciones tipicas de los estimadores:
d)
C [𝛽̂𝑖 − 𝑡∞;𝑛−𝑘 ∗ 𝑆𝛽̂𝑖 ≤ 𝑖 ≤ 𝛽̂𝑖 + 𝑡∞;𝑛−𝑘 ∗ 𝑆𝛽̂𝑖 ] =1- ∞
∝ 0,05
∝= 2 = 2 = 0,025
𝑡∞;𝑛−𝑘 = 𝑡0,025;6−2 = 2,776
e)
Prueba de hipótesis:
1. Planteamiento de la hipótesis:
H 0 : 1 0
H 1 : 1 0
2. Nivel de significancia
∝ = 0,05
pág. 7
3. Regiones de rechazo y aceptación
𝐻0 ∝ = 0,05
𝐻1 𝑔𝑙 = 𝑛 − 𝑘 = 6 − 2 = 4 𝑡 = 2,131
2,131
15,02
4. Decisión estadística:
ˆi i 2,0796 0 i
tC tC 15,02
S ( ˆi ) 0,13839
5. Conclusión:
Concluimos que la razón de cambio es significativa al 5%, ya que la t cae en la región de la
Hipótesis alterna H1.
f)
R.- El modelo es util, porque cantidad de mano de obra tiene una influencia significativa
sobre la produccion.
g)
𝑿𝟎 = 𝟔𝟓
E (Yˆ / X 0 ) 65,72668 2,07956 X 0 E (Yˆ / X 0 ) 65,72668 2,07956 * 65 200,89
h)
INTERVALO DE CONFIANZA PARA LA PREDICCION:
∝ 0,10
∝= = = 0,05
2 2
pág. 8
i)
VARIANZA PARA LA PREDICCION:
2 1 ( X 0 X )2 1 (65 45,33333) 2
V( Yˆ / X 0 ) = 33,54462 12,99902
n ( X i ) 2
2
6 14082 (272)
i
X 2
n 6
X
X i
272
45,33333
n 6
j)
Prueba de hipótesis para la predicción
1. Planteamiento de la hipótesis:
H 0 : ( Noexistecambio en laestructura)
H 1 : ( Existe cambio....)
2. Nivel de significancia
∝ = 0,05
3. Regiones de rechazo y aceptación
∝ 0,05
𝐻0 ∝ = 2 = 2 = 0,025
𝐻1 𝐻1 𝑔𝑙 = 𝑛 − 𝑘 = 6 − 2 = 4 𝑡 = 2,776
-2,776 2,776
11,34
4. Decisión estadística:
t exp
E (Yˆ / X 0 ) Y 200,89 160
11,34 Y
Y i
960
160
S (Yˆ / X 0 ) 3,60542 n 6
5. Conclusión:
Concluimos que existe un cambio en la estructura, ya que 11,34 cae en la región de la Hipótesis alterna (H1).
3.- Se cuenta con información referida al consumo de energía (Yi) y el consumo de gas
natural (Xi) para 35 años:
X Y X Y X Y Y
2
i 17,22 i 85 i
2
10,92 i i 37,1022 i 12,15
R 0,7462
2
pág. 9
Ecuaciones normales:
4,7178
ˆ1 1.92739
2,44776
Reemplanzando en ecuacion normal (1):
85 35 * ˆ 0 (1,92739 ) *17,22
85 33,18966
ˆ 0 3,37685 Yˆi ˆ 0 ˆ1 X i u i Yˆi 3,376 1,927 X i
35
Interpretacion:
̂0 = 3,37 Si el consumo de gas fuera cero, por lo tanto el consumo de energia en promedio
aumentara en 3,37 unidades monetarias.
𝐶𝑎𝑚𝑏𝑖𝑜 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑜 𝑌𝑖 𝜕𝑌̂
̂ 1 = = 𝑋𝑖 = -1,93 Si se incrementa una unidad al consumo de gas,
𝐶𝑎𝑚𝑏𝑖𝑜 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑜 𝑋𝑖
los consumos disminuiras en promedio en 1,93 unidades moetarias, cuando todo lo demas
permanece constante.
b) Es significativo el consumo de gas natural en la explicación del consumo de energía
eléctrica?. Utilice un 5 % de nivel de significación
1. Planteamiento de la hipótesis:
H 0 : 1 0
H1 : 1 0
2. Nivel de significancia
∝ = 0,05
-1,692
-9,87
4. Decisión estadística:
pág. 10
ˆi i 1,92739 0
tC tC 9,87
S ( ˆi ) 0,19537
5. Conclusión:
Como la t calculada cae en la región de la hipótesis alterna, concluimos que es significado.
ˆ 2 0,09344
V( ̂1 ) = V( ̂1 ) = 0,03817
x 2
i 2,44776
Desviacion tipica de B1:
SCR 3,08367
2 2 0,09344
nk 35 2
SCT = ∑(Yi − 𝑌̅ )2 = 12,15
𝑆𝐶𝑅 𝑆𝐶𝑅 𝑆𝐶𝑅 𝑆𝐶𝑅
𝑅2 = 1 − 𝑆𝐶𝑇 0,7462 = 1 − 12,15 = 1 − 0,7462 = 0,2538
12,15 12,15
( X i ) 2 (17,22) 2
xi2 X i2 xi2 10,92
2,44776
n 35
c) ¿Entre que valores se encuentra la verdadera razón de cambio al 95 %?
pág. 11
C[𝐸(𝑌̂/𝑋0 ) − 𝑡2𝑄;𝑛−𝑘 ∗ 𝑆(𝑌̂/𝑋0 ) ≤ 𝑌 ≤ 𝐸(𝑌̂ /𝑋0 ) + 𝑡2𝑄;𝑛−𝑘 ∗ 𝑆(𝑌̂/𝑋0 )] =1- ∞
C[−1,4415 − 2,035 ∗ 0,39571 ≤ 𝑌 ≤ −1,4415 + 2,035 ∗ 0,39571] = 0,95
C[−2,25 ≤ 𝑌 ≤ −0,64] = 0,95
Por cada 100 intervalos de confianza, el 95% de ellas esta comprendida su verdadero valor
para la prediccion entre -2,25 y -0,64.
X
X i
17,22
0,492
n 35
4.- Una empresa dedicada a la comercialización de pañales de cierta marca pretende obtener
un modelo que estudie las ventas en función de sus gastos en anuncios en televisión. Se
recoge información durante 22 meses, obteniéndose los siguientes resultados:
Y 114,5463 X 3,917273 X i
2
353,01745 Y Xi i 9922,69428 2 169,22
y 2
i 288885,7407 expresado en desvíos
X X
X 3,917273 X
i
3,917273 * 22 86,180006
i
i
n 22
Y Y
Y 114,5463 Y
i
114,5463 * 22 2520,0186
i
i
n 22
pág. 12
Yi nˆ0 ˆ1 X i (1)
X iYi ˆ0 X i ˆ1 X i (2)
2
51,09346 0 ˆ115,42684
51,09346
ˆ1 3,31198
15,42684
Reemplanzando en ecuacion normal (1):1
2520,0186 285,42646
ˆ 0 127,52023
22
Interpretacion:
̂0 = −127,52 Si los gastos en anuncios fuera cero, por lo tanto las ventas en promedio
disminuira en 127,52 unidades monetarias.
𝐶𝑎𝑚𝑏𝑖𝑜 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑜 𝑌𝑖 𝜕𝑌̂
̂ 1 = = 𝑋𝑖 = 3,31 Si se incrementa una unidad a los gastos en
𝐶𝑎𝑚𝑏𝑖𝑜 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑜 𝑋𝑖
anuncios, las ventas aumentaran en promedio en 3,31 unidades moetarias, cuando todo lo
demas permanece constante.
b) ¿Considera usted que el modelo estimado es significativo
1. Planteamiento de la hipótesis:
H 0 : 0 1 0
H1 : 0 1 0
2. Nivel de significancia
∝ = 0,05
2,10
pág. 13
80,45
4. Decisión estadística:
R 2 n k 0,9883(22 2)
FC FC 80,45
1 R 2 (n 1) 1 0,9883(22 1)
SCR SCR
2 169,22 169,22(20) SCR 3384,4 SCR
nk 22 2
STC y i2 288885,7407
𝑆𝐶𝑅
𝑅2 = 1 −
𝑆𝐶𝑇
3384,4
𝑅2 = 1 − = 0,9883
288885,7407
5. Conclusión:
Concluimos que el modelo es significativo, porque cae la Fc cae en la región de hipótesis
alterna.
1,725
1
4. Decisión estadística:
ˆi i 3,31198 0
tC tC 1
S ( ˆi ) 3,31197
5. Conclusión:
Como la t calculada cae en la región de la hipótesis Nula, concluimos que No es significado.
pág. 14
ˆ 2 169,22
V( ̂1 ) = 10,96919
( X i ) 2 (86,180006 ) 2
X i2 n
353,01745
22
Desviacione tipica de la pendiente:
2 1 ( X 0 X )2 1 (5,5 3,91727 ) 2
V( Yˆ / X 0 ) = 169,22 35,17
n ( X i ) 2 22 353,01745 (86,180006 )
2
i
X 2
n 22
X
X i
86,180006
3,91727
n 22
Prueba de hipótesis para la predicción
1. Planteamiento de la hipótesis:
H 0 : ( Noexistecambio en laestructura)
H 1 : ( Existe cambio....)
2. Nivel de significancia
∝ = 0,05
3. Regiones de rechazo y aceptación
∝ 0,05
𝐻0 ∝ = 2 = 2 = 0,025
𝐻1 𝐻1 𝑔𝑙 = 𝑛 − 𝑘 = 22 − 2 = 20 𝑡 = 2,086
-2,086 2,086
-37,75
4. Decisión estadística:
pág. 15
E (Yˆ / X 0 ) Y 109,3042 114,5463
t exp 37,75
S (Yˆ / X ) 0
5,9304
Y
Y i
2520,0186
114,5463
n 22
5. Conclusión:
Concluimos que existe un cambio en la estructura, ya que -37,75 cae en la región de la
Hipótesis alterna (H1).
pág. 16