Está en la página 1de 8

UC 3: MODELOS DE

REGRESIÓN Y PRUEBAS
NO PARAMÉTRICAS

MODELO REGRESIÓN MULTILINEAL


COEFICIENTE DE CORRELACIÓN MÚLTIPLE Y PARCIAL
MATRIZ DE CORRELACIONES Y COVARIANZAS

ESTADÍSTICA
FABIÁN ORDÓÑEZ
DEPARTAMENTO DE CIENCIAS EXACTAS - ESPE
CLASE Nro. 31

CONTENIDO

Título Coeficiente de correlación múltiple y parcial


matriz de correlaciones y covarianzas

Duración 2 horas

Información general Determina el coeficiente de regresión múltiple, construye la


matriz de correlaciones y covarianzas
Objetivo Construir un modelo de regresión multilineal y determinar
el coeficiente de regresión múltiple e interpretarlo, genera la
matriz de correlaciones y covarianzas

1
CLASE Nro. 31

COEFICIENTE DE CORRELACIÓN MULTILINEAL

El coeficiente de correlación multilineal mide la fuerza de la relación existente entre la


variable dependiente y las independientes.

𝑆𝐶𝑅 𝑆𝐶𝑇 − 𝑆𝐶𝐸


2
𝑆𝐶𝐸 ∑𝑛𝑖=1 (𝑦𝑖 − 𝑦̂)2
𝑅 = = =1 − =1 − 𝑛
𝑆𝐶𝑇 𝑆𝐶𝑇 𝑆𝐶𝑇 ∑𝑖=1 (𝑦𝑖 − 𝑦̅)2

El coeficiente de correlación multilineal corregido consiste en dividir la fracción para el grado


de libertad respectivo, así:

𝑆𝐶𝐸
𝑅̅2 = 1 − 𝑛 − 𝑘 −1
𝑆𝐶𝑇
𝑛 −1

Donde n es el número de variables independientes. Existe una fórmula más desarrollada para
su determinación como se presenta a continuación.

2
𝑛[𝑏0 ∑ 𝑦 + 𝑏1 ∑ 𝑥1 𝑦 + 𝑏2 ∑ 𝑥2 𝑦 + … + 𝑏𝑘 ∑ 𝑥𝑘 𝑦] − (∑ 𝑦)2
𝑅 =
𝑛 ∑ 𝑦 2 − (∑ 𝑦)2

ERROR ESTÁNDAR DE ESTIMACIÓN

Este indicador al igual que en regresión simple mide la dispersión de la función de regresión
multilineal alrededor del plano de regresión Se, viene dado por:

∑𝑛𝑖=1(𝑦𝑖 − 𝑦̂𝑖 )2
𝑆𝑒 = √
𝑛−𝑘−1

Los grados de libertad están dados por el valor que toma el denominador de la fórmula, y k
representa el número de variables independientes. Se interpreta de manera similar a regresión
simple.

EJERCICIO 1

Un analista inmobiliario cree que existe relación entre la demanda de las viviendas, su precio
y el ingreso anual medio de los hogares, para ello construye un modelo de regresión lineal.
Los valores de estas variables se recogen en la siguiente tabla durante 6 períodos.

2
CLASE Nro. 31

Determinar además el error estándar de estimación, coeficiente de determinación y el


coeficiente de determinación corregido.

Las ecuaciones normales de regresión multilineal, son:


𝑛 𝑛 𝑛

∑ 𝑦𝑖 = 𝑛𝑏0 + 𝑏1 ∑ 𝑥1 + 𝑏2 ∑ 𝑥2
𝑖=0 𝑖=0 𝑖=0

𝑛 𝑛 𝑛 𝑛

∑ 𝑥1 𝑦𝑖 = 𝑏0 ∑ 𝑥1 + 𝑏1 ∑ 𝑥1 + 𝑏2 ∑ 𝑥1 𝑥2 2

𝑖=0 𝑖=0 𝑖=0 𝑖=0

𝑛 𝑛 𝑛 𝑛

∑ 𝑥2 𝑦𝑖 = 𝑏0 ∑ 𝑥2 + 𝑏1 ∑ 𝑥1 𝑥2 + 𝑏2 ∑ 𝑥2 2
𝑖=0 𝑖=0 𝑖=0 𝑖=0

Ahora, vamos a determinar cada sumatoria, reemplazar y resolver el sistema de ecuaciones


formado.

Período yi x1 x2 x1.y x12 x1.x2 x2y x22 y(reg) (yi - y(reg))2 (yi -ym)2 y2
1 8 12 6,80 96,00 144,00 81,60 54,40 46,24 4,99 9,03 8,03 64,00
2 9 13 7,20 117,00 169,00 93,60 64,80 51,84 9,75 0,57 3,36 81,00
3 12 13 7,40 156,00 169,00 96,20 88,80 54,76 11,20 0,65 1,36 144,00
4 9 14 7,10 126,00 196,00 99,40 63,90 50,41 10,91 3,65 3,36 81,00
5 12 14 7,00 168,00 196,00 98,00 84,00 49,00 10,19 3,28 1,36 144,00
6 15 15 7,40 225,00 225,00 111,00 111,00 54,76 14,95 0,00 17,36 225,00
SUM. 65 81 42,90 888,00 1099,00 579,80 466,90 307,01 17,18 34,83 739,00
ymedia 10,83

65 = 6𝑏0 + 81𝑏1 + 42.90𝑏2 (1)

888 = 81𝑏0 + 1099𝑏1 + 579.80𝑏2 (2)

466.90 = 42.90𝑏0 + 579.80𝑏1 + 307.01𝑏2 (3)

Al resolver el sistema de ecuaciones, obtenemos que b o = − 40,419, b1 = 1,367 y b2 = 4,587,


lo que permite plantear el modelo de regresión multilineal.

y = − 40.419 + 1,8771x1 + 4,587x2

∑𝑛𝑖=1(𝑦𝑖 − 𝑦̂𝑖 )2 10.62


𝑆𝑒 = √ =√ = 1.88
𝑛−𝑘−1 6−2−1

3
CLASE Nro. 31

Existe una demanda de 1.88 viviendas alrededor del plano de regresión.

Ahora, vamos a determinar cada sumatoria, reemplazar y resolver el sistema de ecuaciones


formado.

𝑛[𝑏0 ∑ 𝑦 + 𝑏1 ∑ 𝑥1 𝑦 + 𝑏2 ∑ 𝑥2 𝑦 + … + 𝑏𝑘 ∑ 𝑥𝑘 𝑦] − (∑ 𝑦)2
𝑅2 =
𝑛 ∑ 𝑦 2 − (∑ 𝑦)2

6[− 40.419 ∗ 65 + 1.367 ∗ 888 + 4.587 ∗ 466.90] − (65)2


𝑅2 = = 0.6937
6(739) − (65)2

Interpretación

Coeficiente de determinación: El 69,37% del cambio que se presenta en la demanda de


viviendas, es explicado mediante los cambios en el precio promedio de las viviendas y el
ingreso familiar promedio.

El coeficiente de determinación corregido, es:

𝑆𝐶𝐸 10.62
̅2
𝑅 =1 − 𝑛 − 𝑘 − 1 =1 − 6 − 2 − 1 = 0.4919
𝑆𝐶𝑇 34,83
𝑛 −1 6 −1

CORRELACIÓN PARCIAL, MATRIZ DE CORRELACIONES Y DE


COVARIANZAS

El coeficiente de correlación simple, mide la relación existente entre las variables dependiente
e independiente, en cambio la correlación parcial, mide la relación existente entre 2 variables
independientes, se calcula mediante la siguiente expresión:

[∑ 𝑥𝑖 𝑥𝑗 − ∑ 𝑥𝑖 ∑ 𝑥𝑗 ]
2
𝑅𝑖,𝑗 =1 − 𝑛
2
(∑ 𝑥 )2 (∑ 𝑥𝑗 )
√[∑ 𝑥𝑖2 − 𝑛𝑖 ] [∑ 𝑥𝑗2 − 𝑛 ]

La matriz de correlaciones es la matriz en la que se resume todos los coeficientes de


correlación posibles. Es una matriz triangular inferior, en la diagonal principal va el 1 que es

la correlación de la variable consigo mismo y en los otros casilleros estará el valor del
coeficiente de correlación, como se indica en el ejemplo siguiente.

4
CLASE Nro. 31

Y X1 X2 X3
Y 1
X1 0.3029 1
X2 0.862 0.251 1
X3 0.7077 0.2058 0.6823 1
Se interpreta esta información diciendo que existe correlación entre las variables 2 y 3
(multicolinealidad) pues pasa el 60%, se analiza entre las variables independientes.

La covarianza entre 2 variables, viene definida por la siguiente expresión:

∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ ) (𝑦𝑖 − 𝑦̅) ∑𝑛𝑖=1 𝑥𝑦


𝑐𝑜𝑣(𝑥, 𝑦) = = − 𝑥.
̅ 𝑦̅
𝑛 𝑛

La covarianza indica el valor para dos variables aleatorias que varían con respecto a sus
medias.

Si cov(x, y) > 0, significa que es una relación positiva o directamente proporcional y se da


cuando tanto x como y crecen

Si cov(x, y) > 0, significa que es una relación negativa o inversamente proporcional y se da


cuando x crece, y decrece o viceversa.

Si cov(x, y) = 0, significa que no hay relación existente entre las variables.

Aprovechando esta expresión, se puede determinar el coeficiente de correlación con la


siguiente relación:

𝑐𝑜𝑣(𝑥, 𝑦)
𝑅𝑥,𝑦 =
𝑆𝐶𝑥 𝑆𝐶𝑦

La matriz de covarianzas resume todas las posibles covarianzas de las variables que
intervienen, es una matriz triangular inferior, en la diagonal principal va el valor de la
varianza, ya que es el cálculo de la covarianza consigo mismo y en los otros casilleros estará
el valor de la covarianza entre las variables.

5
CLASE Nro. 31

Y X1 X2 X3
Y 96.222
X1 20.467 47.44
X2 37.622 7.6933 19.796
X3 40.356 8.24 17.649 33.796
Estos valores obtenidos nos indican si son directa o inversamente proporcionales entre las
variables analizadas.

6
CLASE Nro. 31

REFERENCIAS BIBLIOGRAFICAS

1. Galindo, E., Estadística Métodos y Aplicaciones, Prociencia Editores, tercera edición,


Quito-Ecuador, 2015
2. Levin R., Rubin D., Estadística para Administración y Economía, Pearson Educación de
México S.A. de C.V., séptima edición, 2010
3. Lind, D., Marchal, W., Wathen, S., Estadística aplicada a los negocios y la Economía,
McGraw-Hill Interamericana Editores S.A. de C.V., décimoséptima edición, México, 2019
4. Webster, A., Estadística para la Administración y Economía, tercera edición, McGraw-Hill
Interamericana, Colombia, 2000
5. https://www.youtube.com/watch?v=pDHdSovBxb4
6. https://www.youtube.com/watch?v=LJ6SX7PBreg
7. https://www.youtube.com/watch?v=-MYp5KaW7gQ
8. https://www.youtube.com/watch?v=T2xL3-XBAnc
9. https://www.youtube.com/watch?v=7EeiVna55n

También podría gustarte