Está en la página 1de 21

Unidad 2:

Modelo de
Regresión Simple
y Método de
Mínimos
Cuadrados
Ordinarios

Econometría
Página 1 de 20

Introducción

El modelo de regresión lineal clásico representa la herramienta fundamental de análisis


en el curso. A través de él, una o más variables, llamadas explicativas o independientes,
permiten explicar y entender la evolución de otra denominada variable dependiente o
explicada.

Los objetivos del análisis de regresión son predecir, analizar y medir efectos que las
variables tienen sobre la variable dependiente y conocer si estas son significativas.
Aquí, aprenderemos a estimar los parámetros y conoceremos los supuestos detrás de
ellos.

De la misma forma, revisaremos una serie de fórmulas y cálculos estadísticos,


considerando la funcionalidad de este modelo en los estudios econométricos.

Ingrese aquí el nombre de la


asignatura
Página 2 de 20

1. Modelo de Regresión Simple y Método de


Mínimos Cuadrados Ordinarios

1.1. Objetivo del análisis de regresión

El análisis de regresión relaciona la dependencia de una variable que llamamos “variable


dependiente” con una o más variables que llamamos “variables independientes o
variables explicativas”. Esto se realiza para poder estimar o predecir la media o valor
promedio poblacional de la dependiente respecto a los valores conocidos de las otras.

1.2. Función de regresión muestral y poblacional


Una forma gráfica de visualizar el análisis de regresión es a través de un diagrama o
gráfico de dispersión. En él, se puede ilustrar en el eje de las abscisas (eje X) la variable
independiente y en el eje de las ordenadas (eje Y,) la variable dependiente. En este
contexto, la regresión representará aquella recta que permite minimizar los errores, que
es la diferencia de los valores efectivos respecto a los valores equivalentes de la línea de
regresión.

Así, desde el punto de vista geométrico, una curva de regresión poblacional es el lugar
geométrico de las medias condicionales de la variable dependiente para los valores fijos
de la o las variables independientes. Es decir, es la curva que conecta las medias de las
subpoblaciones de Y que corresponden a los valores dados de X.
Página 3 de 20

Línea de regresión poblacional

Fuente: Gujurati, D. y Porter, D.(2010). Econometría. Ciudad de México: Mc Graw Hill. Recuperado
de: https://fvela.files.wordpress.com/2012/10/econometria-damodar-n-gujarati-5ta-ed.pdf

La regresión poblacional corresponde al valor esperado de Y dado Xi, es decir, E(Y | Xi ) = f


(Xi ). El modelo de regresión lineal que se estima es de la forma E(Y | Xi )= β1 + β2Xi , donde
β1 es llamado intercepto y β2 es la pendiente.
Página 4 de 20

1.3. Características de un modelo de regresión simple

1.3.1. Modelo de regresión lineal simple


Entendemos por regresión al estudio de la dependencia de una variable (la variable
dependiente) de una o más variables (las explicativas) con la idea de estimar y/o predecir
el valor poblacional medio de la primera en términos de los valores conocidos de las
segundas.

Y = f ( x1 , x2 ,....., xk ) , con K parámetros a estimar.


Si k=2 es llamada regresión simple y si k>2, regresión múltiple.

1.3.2. Objetivos del modelo de regresión lineal

Los objetivos del análisis de regresión son:

• Predecir el valor poblacional medio de Y dado los valores fijos de las variables X.
• Analizar los efectos de políticas que alteren las variables X.
• Saber si las variables X tienen efectos o no sobre las variables dependientes (Y) y si
estas son significativas.

1.4. Supuestos clásicos de un modelo de regresión simple

Para derivar los estimadores ˆ1 y ̂ 2 no se realizaron supuestos sobre la forma en que
se obtuvo la muestra, sí sobre la distribución de probabilidad de los errores.

Los supuestos son necesarios para verificar las propiedades estadísticas que tienen los
estimadores. Para lograrlo, podemos seguir el siguiente paso a paso:
Página 5 de 20

1. La variable explicativa X está dada (es decir, no es estocástica o aleatoria). COV( X,


e)=0

2. E(ei/Xi)=0  i, los errores pueden ser positivos o negativos pero no existe razón a
priori para esperar que sistemáticamente sean positivos o negativos.

EYi / Xi  = E1 +  2 X i +  i  = 1 +  2 X i , acá se supone


que se ocupa toda la información disponible.

COV ( i ,  j ) = 0
3. No autocorrelación, ,ij

   
COV ( i ,  j ) = E i − E ( i )   j − E ( j )  = E  i  j = 0

VAR ( i / X j ) =  2
4. Homoscedasticidad, . Las perturbaciones se distribuyen
con la misma dispersión (varianza) respecto a la media. Esto podría ser
representado en el siguiente gráfico:

Homocedasticidad Heterocedasticidad

Fuente: Elaboración propia

5. Modelo bien especificado, es decir no hay errores en la especificación.


6. Normalidad de los errores, los errores se distribuyen independiente y idénticamente

normal,
 ~ N (0,  2
).
Página 6 de 20

1.5. Construcción de estimadores mediante el método de


Mínimos Cuadrados Ordinarios (MCO)
La intuición es ajustar una recta de regresión a través de los puntos de un gráfico de forma
que esté lo más próximo a los puntos. Se busca que las distancias verticales (errores) sean
lo más pequeñas posibles.

Gráfico de intuición

Fuente: Elaboración propia.

ei = Yi − Yˆi = Yi − ˆ1 − ˆ 2  X
Donde , son los errores.

• MICO busca encontrar


ˆ1 y
̂ 2 tal que la suma de los cuadrados de los

e
2
i
errores sea mínima. Es decir, se busca minimizar, .
Página 7 de 20

• Por ejemplo, en el caso del modelo de regresión simple el problema es:

L = Min i ei = i (Yi −  1 −  2  X ) 2
2

1 ,  2

Las condiciones de primer orden son:

L =0 L =0
1  2

, y las de segundo orden:

2L 0 2L 0
1  2
2 2

La obtención de los parámetros se realiza de acuerdo con:

L = −2 (Yi − ˆ1 − ˆ 2 X i ) = 0


 1
= − Yi +  ˆ1 + ˆ 2  X i = 0
Nˆ1 =  Yi − ˆ 2  X i
ˆ1 = Y − ˆ 2 X
L = −2 (Yi − ˆ1 − ˆ 2 X i )X i = 0
 2
= − X i Yi +  ˆ1 X i + ˆ 2  X i = 0
2

ˆ 2 =
X Y i i − N  X Y
X −NX2
2
i
Página 8 de 20

Lo anterior se puede ver reflejado en el siguiente gráfico. Considerando lo que sucede con
grandes empresas.

P/BEjemplo:
vs ROE P/B vs ROE
3,5

Falabella
3,0
Andina SQM Enel
2,5

2,0
P/B

Entel AES
1,5
Latam Copec Cencosud
1,0 Colbún Engie
CMPC
0,5 y = 0,12x + 0,63
Cap R² = 0,51

0,0
-2 0 2 4 6 8 10 12 14 16 18
ROE
Fuente: Elaboración propia.
Página 9 de 20

1.6. Propiedades de los estimadores de MICO


1.6.1. Teorema de Gauss-Markov

• Si se cumple que:

1. E(ei/Xi)=0  i,

VAR ( i ) =  2
2.

3.
cov( et , et +k ) = 0 ,  k

4.
cov( et + k , xt ) = 0 ,  k, t

5. La variable explicativa está dada xt


6. No hay errores de especificación.

Los estimadores de MCO de una regresión lineal simple serán MELI (o BLUE), es decir los
mejores estimadores lineales insesgados.

1.7. Varianza y covarianza de los estimadores.

A partir del modelo de regresión 𝑌𝑖 = 𝛽1 + 𝛽2 𝑋𝑖 se puede obtener la varianza de los


estimadores β1 y β2 que corresponde a:
Página 10 de 20

1.8. Análisis de correlación y coeficiente de determinación:


objetivo, estimación e interpretación

Yt = Yˆt + et Yˆt = ˆ + ˆ  xt
A partir de la ecuación típica , donde
podemos llegar a una expresión ordenada por desviaciones al cuadrado:

∑(𝑦𝑡 − 𝑦̅𝑡 )2 =  ∑(𝑥𝑡 − 𝑥̅𝑡 )2 + ∑(𝑒𝑡 )2


Suma total de los Suma cuadrados regresión Suma cuadrados errores
cuadrados SCT SCE SCR

SCE SCR
1= +
Alternativamente, SCT SCT
Página 11 de 20

1.8.1. Ajuste de una regreción


SCE
Llamando R2 a la medida de la bondad de ajuste del modelo de regresión, SCT , se
obtiene la expresión tradicional para el coeficiente de determinación.

SCE SCR
R2 = = 1−
SCT SCT

1.9. Pruebas de Hipótesis de significancia individual

1.9.1. Distribución t-student:

Si X es la media de una muestra aleatoria de tamaño N, tomando una población de


media  y varianza finita y desconocida 2, pero varianza estimada S2, entonces el

X −
t= ~ t ( n−1)
S
estadístico N

P(− t 2  t  t 2 ) = 1 − 
Página 12 de 20

Distribución t-student

Fuente: Elaboración propia

1.10. Predicción

1.10.1. Intervalos de confianza para los parámetros

Lo que se busca es que


P(ˆ2 −    2  ˆ2 +  ) = 1 −  , es decir

que la probabilidad que


 2 esté entre ˆ2 −  y
ˆ 2 +  sea 1-.

Entenderemos por (1-) al nivel de confianza y por  al nivel de significancia.

ˆ 2 −  2
~ t n−2
ˆ ˆ2
Previamente sabemos que , entonces 1- de esta distribución t

− t t
con N-2 grados de libertad estará entre 2 y 2 .
Página 13 de 20

P  − t  t n − 2  t  = 1 − 
 2 2

 ˆ 2 −  2 
P  − t   t  = 1 − 
 2 ˆ ˆ2 2


P − ˆ 2 − t  ˆ ˆ2  −  2  − ˆ 2 + t  ˆ ˆ2  = 1 − 
 2 2 

P  ˆ 2 − t  ˆ ˆ2   2  ˆ 2 + t  ˆ ˆ2  = 1 − 
 2 2 

Por lo tanto el intervalo de confianza para 2 es

 2 = ˆ2  t  ˆ ˆ 2
2

1.10.2. Test de Hipótesis


Si queremos saber si las observaciones son compatibles o no con alguna determinada
hipótesis. Por ejemplo,

A través de la construcción de intervalos de confianza (I.C.) es posible apreciar si la


hipótesis es verdadera o no.

Si b  I.C. NO rechazo H0 (hipótesis nula)

Si b  I.C. Rechazo H0
Página 14 de 20

Alternativamente, es posible realizar test de significancia.

ˆ 2 −  2 ˆ 2 − b
~ t n−2 ~ t n−2
ˆ ˆ ˆ ˆ
Sabemos que 2
, entonces bajo la hipótesis nula 2

Así,

ˆ 2 −  2
~ t n−2
ˆ ˆ
2
Bajo H0,

Fuente: Elaboración propia.


Página 15 de 20

1.11. Modelos de regresión simple no lineal


Hasta ahora hemos estimado modelos de regresión lineal en los parámetros, los que
pueden ser o no lineales en las variables. Sin embargo, acá presentamos modelos de
regresión que no lineales en las variables pero sí en los parámetros, o que pueden serlo
mediante transformaciones apropiadas de las variables. Algunos ejemplos son:

Tipo Modelo Representación:


log-lineal

Semilogarítmi
cos

Recíproco

Recíproco
logarítmico

Fuente: Elaboración propia.


Página 16 de 20

Ahora revisemos un ejemplo de aplicación.

• Supone que estás a cargo de la autoridad monetaria y que posees los siguientes
datos históricos sobre la cantidad de dinero e ingreso nacional (ambos en
millones de dólares).
1. Grafica las variables
2. Estima el siguiente modelo: Ingreso =  +  M1

M1 Ingreso Disponible
(promedios en miles -y(miles de millones
Años
de millones de de pesos
pesos) encadenados)
2005 6.946 88.967

2006 7.773 97.455

2007 9.168 103.356

2008 10.265 103.084

2009 11.614 103.257

2010 14.947 115.916

2011 16.631 121.425

2012 18.350 127.903

2013 20.544 132.066

2014 23.030 135.124

2015 26.153 138.060

2016 27.793 141.207

2017 30.132 144.544

2018 33.451 148.646

2019 37.475 150.607

2020 53.143 143.477


Fuente: Banco Central de Chile.
Página 17 de 20

La solución puede realizarse a través de las fórmulas para estimar el intercepto y la


pendiente de una regresión lineal simple o bien usando un software estadístico.
Las fórmulas son
L = −2 (Yi − ˆ1 − ˆ 2 X i ) = 0
 1
= − Yi +  ˆ1 + ˆ 2  X i = 0
Intercepto:
Nˆ1 =  Yi − ˆ 2  X i
ˆ1α== Y − ˆ 2 X

 2  i 1 2 i i
L = −2 (Y − ˆ − ˆ X )X = 0
Pendiente: ˆ
= − X iYi +  1 X i + ˆ 2  X i = 0
2

ˆ 2 =
 X iYi − N  X  Y
 Xi − N  X 2
2

Promedio PIB= 𝑌̅ =93061,8

Promedio Dinero real= 𝑋̅ = 488,8


∑ 𝑋 ∙ 𝑌= 2131284782

2
∑
L𝑋 =15047129,3
= −2 (Yi − ˆ1 − ˆ 2 X i ) = 0
 1
= − Yi +  ˆ1 + ˆ 2  X i = 0
Nˆ1 =  Yi − ˆ 2  X i
L = −2 (Y −ˆˆ − ˆ X )X = 0
ˆα=  2 Y − i 21 X2 i i
1 =

  
= − X Y + ˆ X + ˆ X 53634 =0
2
α= i i 1 i 2 i

ˆ 2 =
 X Y − N  X Y
i i

X −NX
2 2
i

β= 80,657
Página 18 de 20

Respuesta al ejercicio

Coeficientes Estadístico t Probabilidad


Intercepción 53.634 12,8 2,5442E-14

M1_real 80,657 12,6 3,7481E-14

Relación PIB/M1
250.000

200.000

150.000 Año
2020
PIB

100.000
PIB = 80,657xM1 + 53634
R² = 0,8278
50.000

0
0,0 500,0 1000,0 1500,0 2000,0
Dinero

Fuente: Elaboración propia.


Página 19 de 20

Conclusiones

En esta unidad, revisamos la importancia del modelo de regresión lineal clásico y podemos
estimar los parámetros de una regresión simple.

También conocimos los supuestos detrás del modelo de regresión. Ellos nos permitirán
hacer inferencia con lo que validamos estadísticamente la relación entre una variable y
otra.

Una vez estimados los parámetros, podemos realizar pruebas de hipótesis para evaluar la
significancia estadística de los valores encontrados. Estos nos permitirán realizar un
análisis estadístico más eficaz y fiable.

Para finalizar, realizamos un ejemplo aplicando los modelos vistos. Considera que el apoyo
de Excel en el desarrollo de gráficos y análisis estadístico es vital para comprender los
modelos propuestos.
Página 20 de 20

Referencias bibliográficas

Gujurati, D. y Porter, D.(2010). Econometría. Ciudad de México: Mc Graw Hill. Recuperado


de: https://fvela.files.wordpress.com/2012/10/econometria-damodar-n-gujarati-5ta-
ed.pdf

También podría gustarte