Documentos de Académico
Documentos de Profesional
Documentos de Cultura
MÚLTIPLE
Arístides Choquehuanca Tintaya
REGRESIÓN
REGRESIÓN LINEAL:
REGRESIÓN NO LINEAL
Regresión polinómica
Regresión potencial
Regresión no lineal propiamente dicha
USOS DE REGRESIÓN LINEAL SIMPLE
Relación
USOS
Forma de Predicción
relación
LAS VARIABLES EN REGRESIÓN
VARIABLES X: Predicción
Y: Respuesta
MODELO DE REGRESIÓN LINEAL SIMPLE
y
* *
*
*
* *
*
*
*
0 X
MODELO DE REGRESIÓN LINEAL SIMPLE
𝑌 = 𝛽0 + 𝛽1 𝑋
0 X
MODELO DE REGRESIÓN LINEAL SIMPLE
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝜀𝑖
Donde:
Y
𝛽0 =representa el intercepto * * 𝑌𝑖 = 𝜇𝑌/𝑋 + 𝜀𝑖
𝛽1 =es el coeficiente de regresión ** *
*
𝑋𝑖 =valor de la variable de predicción * *
*
*
𝜀𝑖 =es el error aleatorio no observable *
𝑌𝑖 =es la i-ésima observación de la
variable respuesta 0 X
REGRESIÓN LINEAL MÚLTIPLE
La regresión lineal múltiple es una extensión de la regresión
lineal simple.
Entonces,
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖1 + 𝛽2 𝑋𝑖2 + … + 𝛽𝑘 𝑋𝑖𝑘 + 𝜀𝑖
Donde:
𝛽0 : 𝑙𝑎 𝑜𝑟𝑑𝑒𝑛𝑎𝑑𝑎 𝑎𝑙 𝑜𝑟𝑖𝑔𝑒𝑛
𝛽𝑗 : 𝑒𝑓𝑒𝑐𝑡𝑜 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒𝑙 𝑖𝑛𝑐𝑟𝑒𝑚𝑒𝑛𝑡𝑜 𝑒𝑛 𝑢𝑛𝑎 𝑢𝑛𝑖𝑑𝑎𝑑 𝑑𝑒 𝑙𝑎
𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑝𝑟𝑒𝑑𝑖𝑐𝑡𝑜𝑟𝑎 𝑋𝑗 𝑠𝑜𝑏𝑟𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒 𝑌.
𝜀𝑖 : 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑒𝑛𝑡𝑟𝑒 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜 𝑦 𝑒𝑙 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜 𝑝𝑜𝑟
𝑒𝑙 𝑚𝑜𝑑𝑒𝑙𝑜.
DESCRIPCIÓN DE DATOS Y EL MODELO
Sea n observaciones de la variable Y y K variables independientes
𝑿𝟏 , 𝑿𝟐 , … , 𝑿𝒌
Las observaciones son presentadas de la siguiente manera:
𝑦1 , 𝑦2 , … , 𝑦𝑛 ; en los puntos de observación
𝑥11 , 𝑥21 , … , 𝑥𝑛1 , 𝑥12 , 𝑥22 , … , 𝑥𝑛2 , … , 𝑥1𝑘 , 𝑥2𝑘 , … , 𝑥𝑛𝑘
En base al modelo lineal se tiene las siguientes ecuaciones:
𝑦1 = 𝛽0 + 𝛽1 𝑥11 + 𝛽2 𝑥12 + … + 𝛽𝑘 𝑥1𝑘 + 𝜀1
𝑦2 = 𝛽0 + 𝛽1 𝑥21 + 𝛽2 𝑥22 + … + 𝛽𝑘 𝑥2𝑘 + 𝜀2
𝑦3 = 𝛽0 + 𝛽1 𝑥31 + 𝛽2 𝑥32 + … + 𝛽𝑘 𝑥3𝑘 + 𝜀3
⋮ ⋮ ⋮
𝑦𝑛 = 𝛽0 + 𝛽1 𝑥𝑛1 + 𝛽2 𝑥𝑛2 + … + 𝛽𝑘 𝑥𝑛𝑘 + 𝜀𝑛
DESCRIPCIÓN DE DATOS Y EL MODELO
Considerando los datos, el modelo de regresión lineal múltiple
𝑦𝑖 = 𝛽0 + 𝛽1 𝑥𝑖1 + 𝛽2 𝑥𝑖2 + … + 𝛽𝑘 𝑥𝑖𝑘 + 𝜀𝑖
𝑦𝑖 = 𝛽0 + σ𝑘𝑗=1 𝛽𝑗 𝑥𝑖𝑗 + 𝜀𝑖 ; 𝑖 = 1, 2, … , 𝑛
Donde:
𝛽0 = 𝑖𝑛𝑡𝑒𝑟𝑐𝑒𝑝𝑡𝑜
𝛽𝑗 = 𝛽1 𝑎 𝛽𝑘 = 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒𝑠 𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒𝑠 𝑝𝑎𝑟𝑐𝑖𝑎𝑙𝑒𝑠
𝜀𝑖 = 𝑝𝑒𝑟𝑡𝑢𝑟𝑏𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡𝑜𝑐𝑎𝑠𝑡𝑖𝑐𝑎
𝑖 = 1, 2, … , 𝑛; 𝑗 = 1, 2, … , 𝑘
DESCRIPCIÓN DE DATOS Y EL MODELO
Consideremos las n ecuaciones simultaneas:
𝑦1 = 𝛽0 + 𝛽1 𝑥11 + 𝛽2 𝑥12 + … + 𝛽𝑘 𝑥1𝑘 + 𝜀1
𝑦2 = 𝛽0 + 𝛽1 𝑥21 + 𝛽2 𝑥22 + … + 𝛽𝑘 𝑥2𝑘 + 𝜀2
𝑦3 = 𝛽0 + 𝛽1 𝑥31 + 𝛽2 𝑥32 + … + 𝛽𝑘 𝑥3𝑘 + 𝜀3
⋮ ⋮ ⋮
𝑦𝑛 = 𝛽0 + 𝛽1 𝑥𝑛1 + 𝛽2 𝑥𝑛2 + … + 𝛽𝑘 𝑥𝑛𝑘 + 𝜀𝑛
𝑌 = 𝑋 𝛽 + 𝜀
nx1 nxk kx1 nx1
𝑌 =𝑋 β + 𝜀
Entonces 𝜀 es un vector de variables aleatorias normales tal que:
𝐸 𝜀 =0
𝑉𝑎𝑟 𝜀 = 𝜎 2 𝐼
donde: 𝜎 2 𝑒𝑠 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑑𝑒𝑙 𝑒𝑟𝑟𝑜𝑟, 𝑐𝑜𝑚ú𝑛 𝑎 𝑡𝑜𝑑𝑜𝑠 𝑒𝑙𝑙𝑜𝑠
𝜕 𝑒′𝑒
= − 2𝑋 ′ 𝑌 + 2 𝑋 ′ 𝑋 𝛽መ
𝜕𝛽መ
ESTIMACIÓN DE PARÁMETROS DE
REGRESIÓN
Igualando la ecuación anterior a cero, entonces:
𝑋 ′ 𝑋 𝛽መ = 𝑋 ′ 𝑌
Usando algebra matricial , y, si la inversa de 𝑋 ′ 𝑋 existe; tenemos:
𝑋 ′ 𝑋 −1 𝑋 ′ 𝑋 𝛽መ = 𝑋 ′ 𝑋 −1 𝑋 ′ 𝑌
dado que: 𝑋 ′ 𝑋 −1 𝑋 ′ 𝑋 = 𝐼
entonces: 𝐼 𝛽መ = 𝑋 ′ 𝑋 −1 ′
𝑋𝑌
Por tanto: = 𝑿′ 𝑿
𝜷 −𝟏 𝑿′ 𝒀
′ 𝑿′ 𝒀
𝑺𝑪 𝑬 = 𝒆′ 𝒆 = 𝒀′ 𝒀 − 𝜷
ANÁLISIS DE VARIANZA EN REGRESIÓN
Σ𝑦𝑖 2
A la 𝑆𝐶 𝐸 sumamos y restamos , entonces se tiene:
𝑛
2 Σ𝑦𝑖 2
Σ𝑦𝑖 መ ′ ′
𝑒 ′𝑒 = 𝑌′𝑌 − − 𝛽 𝑋 𝑌− 𝑛
𝑛
𝑆𝐶 𝐸 = 𝑆𝐶 𝑌 − 𝑆𝐶 𝑅𝑒𝑔
2 2
Σ𝑦𝑖 Σ𝑦𝑖
′
𝑌 𝑌− = መ ′ ′
𝛽 𝑋 𝑌− + 𝑒′𝑒
𝑛 𝑛
𝟐
′
𝜮𝒚𝒊
𝑺𝑪 𝑻𝑶𝑻𝑨𝑳 = 𝒀 𝒀 −
𝒏
𝜮𝒚𝒊 𝟐
𝑿 𝒀−
𝑺𝑪 𝑹𝒆𝒈𝒓𝒆𝒔𝒊ó𝒏 = 𝜷′ ′ ′ 𝑿′ 𝒀
𝑺𝑪 𝑬𝒓𝒓𝒐𝒓 = 𝒀′ 𝒀 − 𝜷
𝒏
ANÁLISIS DE VARIANZA EN REGRESIÓN
ANÁLISIS DE VARIANZA
F de V GL SC CM Fc
Regresión k SC Regresión CM Regresión
Error n-k-1 SC Error CM Error
TOTAL n-1 SC TOTAL
VARIANZA DE LOS ESTIMADORES
VARIANZA DE 𝒃𝟏
(x,y) 𝑏1
(X,Y) (x,y)
𝑏2
(x,y) 𝑏𝑘
2
2 𝑆𝑦/𝑥
𝑆𝑏1 =
Σ 𝑥𝑖 −𝑥ҧ 2
𝟐
ESTIMACIÓN DE 𝝈
Las varianzas de los 𝛽መ se expresan en términos de los elementos de la
inversa de la matriz 𝑋 ′ 𝑋.
Los elementos de la diagonal de 𝑋 ′ 𝑋 −1 multiplicado por la
constante 𝜎 2 son las varianzas de 𝛽መ0 , 𝛽መ1 , … , 𝛽መ𝑘
Si se tiene k=2 regresores, entonces :
𝑐00 𝑐01 𝑐02
𝐶 = 𝑋′𝑋 −1
= 𝑐10 𝑐11 𝑐12
𝑐20 𝑐21 𝑐22
X1 X2 Y 80
70 27 56 70
Contenido de vitamina C
90 33 67 60
77 20 57 50
84 40 65 40
93 44 70 30
68 18 53 20
65 25 54 10
88 22 62 0
81 29 60 0 10 20 30 40 50 60 70 80 90 100
72 38 58 X1 X2
𝑦𝑖 = 𝑏0 + 𝑏1 𝑥𝑖1 + 𝑏2 𝑥𝑖2 + 𝑒𝑖 𝑌 = 𝑋𝑏 + 𝑒
CÁLCULO DE LOS ESTIMADORES DE PARÁMETROS
𝑏 = 𝑋′𝑋 −1 𝑋 ′ 𝑌
1 70 27
1 90 33 1 1 1 ⋯ 1
𝑋= 1 77 20 𝑋 ′ = 70 90 77 ⋯ 72
⋮ ⋮ ⋮ 27 33 20 ⋯ 38
1 72 38 3 x 10
10 x 3
1 70 27
1 1 1 ⋯ 1 1 90 33 10 788 296
𝑋′𝑋 = 70 90 77 ⋯ 72 1 77 20 𝑋 ′ 𝑋 = 788 62972 23722
27 33 20 ⋯ 38 ⋮ ⋮ ⋮ 296 23722 9472
1 72 38
3x3
3 x 10 10 x 3
INVERSA DE LA MATRIZ 3 x 3
𝑏 = 𝑋 ′ 𝑋 −1 𝑋 ′ 𝑌
1 ′
′
𝑋𝑋 −1
= 𝑋 ′ 𝑋 𝑎𝑑𝑗 𝑋 𝑋
10 788 296
𝑋 ′ 𝑋 = 788 62972 23722
296 23722 9472
= 4656792
INVERSA DE LA MATRIZ 3 x 3
′ −1
1
𝑋𝑋 = ′ 𝑎𝑑𝑗 𝑋 ′ 𝑋
𝑋𝑋 10 788 296
𝑎𝑑𝑗 𝑋 ′ 𝑋 = 𝑐𝑜𝑓 𝑋 ′ 𝑋 ′
= 𝐶′ 𝑋 ′ 𝑋 = 788 62972 23722
296 23722 9472
62972 23722 788 23722 788 62972
−
23722 9472 296 9472 296 23722
788 296 10 296 10 788
𝐶= − −
23722 9472 296 9472 296 23722
788 296 10 296 10 788
−
62972 23722 788 23722 788 62972
𝐴𝑁Á𝐿𝐼𝑆𝐼𝑆 𝐷𝐸 𝑉𝐴𝑅𝐼𝐴𝑁𝑍𝐴
F de V GL SC CM Fc F
Regresión 2 286.71331 143.35666 214.1167 4.737 9.546
Error 7 4.68669 0.6695271
TOTAL 9 291.4
PRUEBA DE HIPÓTESIS DE LOS 𝛽𝑗
𝐻𝑜 ∶ 𝛽1 = 0
𝐻𝑎 ∶ 𝛽1 ≠ 0
𝑆𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝑙𝑎 𝐻𝑜 𝑠𝑖 𝑡𝑐 > 2.365
𝑏1
𝑡𝑐 =
𝑆 2 𝑐11
= 13.826
PRUEBA DE HIPÓTESIS DE LOS 𝛽𝑗
𝐻𝑜 ∶ 𝛽2 = 0
𝐻𝑎 ∶ 𝛽2 ≠ 0
𝑆𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝑙𝑎 𝐻𝑜 𝑠𝑖 𝑡𝑐 > 2.365
𝑏2
𝑡𝑐 =
𝑆 2 𝑐22
𝑏2 = 0.2256377 𝑆 2 = 0.669527 𝑐22 = 0.0018846
0.2256377
𝑡𝑐 =
0.669527 0.0018846
= 6.352
X X2 Y 80
Contenido de vitamina C
70
75 5625 66
60
84 7056 69 50
67 4489 56 40
81 6561 71 30
90 8100 61 20
69 4761 58 10
0
87 7569 64 0 20 40 60 80 100
78 6084 72 Temperatura
65 4225 52
𝑦𝑖 = 𝑏0 + 𝑏1 𝑥𝑖 + 𝑏11 𝑥𝑖2 + 𝑒𝑖
73 5329 64
𝑏11 = 𝑏2 𝑥𝑖2 = 𝑥𝑖2
𝑦𝑖 = 𝑏0 + 𝑏1 𝑥𝑖1 + 𝑏2 𝑥𝑖2 + 𝑒𝑖 𝑌 = 𝑋𝑏 + 𝑒
CÁLCULO DE LOS ESTIMADORES DE PARÁMETROS
𝑏 = 𝑋′𝑋 −1 𝑋 ′ 𝑌
1 75 5625
1 84 7056 1 1 1 ⋯ 1
𝑋= 1 67 4489 𝑋 ′ = 75 84 67 ⋯ 73
⋮ ⋮ ⋮ 5625 7056 4489 ⋯ 6561
1 73 6561 3 x 10
10 x 3
1 75 5625
1 1 1 ⋯ 1 1 84 7056 10 769 59799
𝑋 ′ 𝑋 = 75 84 67 ⋯ 73 1 67 4489 𝑋 ′ 𝑋 = 769 59799 4700989
5625 7056 4489 ⋯ 6561 ⋮ ⋮ ⋮ 59799 4700989 373456407
1 73 6561
3x3
3 x 10 10 x 3
INVERSA DE LA MATRIZ 3 x 3
𝑏 = 𝑋 ′ 𝑋 −1 𝑋 ′ 𝑌
1 ′
′
𝑋𝑋 −1
= 𝑋 ′ 𝑋 𝑎𝑑𝑗 𝑋 𝑋
10 769 59799
𝑋 ′ 𝑋 = 769 59799 4700989
59799 4700989 373456407
= 213263912
INVERSA DE LA MATRIZ 3 x 3
′ −1
1
𝑋𝑋 = ′ 𝑎𝑑𝑗 𝑋 ′ 𝑋
𝑋𝑋
10 769 59799
𝑎𝑑𝑗 𝑋 ′ 𝑋 = 𝑐𝑜𝑓 𝑋 ′ 𝑋 ′
= 𝐶′ 𝑋 ′ 𝑋 = 769 59799 4700989
59799 4700989 373456407
59799 4700989 769 4700989 769 62972
−
4700899 373456407 59799 373456407 59799 4700989
769 59799 10 59799 10 769
𝐶= − −
4700989 373456407 59799 373456407 59799 4700989
769 59799 10 59799 10 769
−
59799 4700989 769 4700989 769 59799
23302200000 −6073535772 39140140
= −6073535772 158643669 −1024459
39140140 −1024459 6629
INVERSA DE LA MATRIZ 3 x 3
1
′
𝑋𝑋 −1
= ′ 𝑎𝑑𝑗 𝑋 ′ 𝑋 𝑋 ′ 𝑋 = 213263912
𝑋𝑋
23302200000 −6073535772 39140140
𝑎𝑑𝑗 𝑋 ′ 𝑋 = 𝐶 ′ = −6073535772 158643669 −1024459
39140140 −1024459 6629
𝐴𝑁Á𝐿𝐼𝑆𝐼𝑆 𝐷𝐸 𝑉𝐴𝑅𝐼𝐴𝑁𝑍𝐴
F de V GL SC CM Fc F
Regresión 2 369.200175 184.600088 61.828 4.737 9.546
Error 7 20.899824 2.985689
TOTAL 9 390.1
PRUEBA DE HIPÓTESIS DE LOS 𝛽𝑗
𝐻𝑜 ∶ 𝛽1 = 0
𝐻𝑎 ∶ 𝛽1 ≠ 0
𝑆𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝑙𝑎 𝐻𝑜 𝑠𝑖 𝑡𝑐 > 2.365
𝑏1
𝑡𝑐 =
𝑆 2 𝑐11
= 9.148
PRUEBA DE HIPÓTESIS DE LOS 𝛽𝑗
𝐻𝑜 ∶ 𝛽2 = 0
𝐻𝑎 ∶ 𝛽2 ≠ 0
𝑆𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝑙𝑎 𝐻𝑜 𝑠𝑖 𝑡𝑐 > 2.365
𝑏2
𝑡𝑐 =
𝑆 2 𝑐22
𝑏2 = −0.085297 𝑆 2 = 2.985689 𝑐22 = 0.000031084
−0.085297
𝑡𝑐 =
2.985689 0.000031084
= −8.854