Contenido Activador Unidad 2 Econometría

Unidad 2:
Modelo de
Regresión Simple
y Método de
Mínimos
Cuadrados
Ordinarios
Econometría
Página 1 de 20
Introducción
El modelo de regresión lineal clásico representa la herramienta fundamental de análisis

en el curso. A través de él, una o más variables, llamadas explicativas o independientes,
permiten explicar y entender la evolución de otra denominada variable dependiente o
explicada.
Los objetivos del análisis de regresión son predecir, analizar y medir efectos que las
variables tienen sobre la variable dependiente y conocer si estas son significativas.
Aquí, aprenderemos a estimar los parámetros y conoceremos los supuestos detrás de
ellos.
De la misma forma, revisaremos una serie de fórmulas y cálculos estadísticos,

considerando la funcionalidad de este modelo en los estudios econométricos.
Ingrese aquí el nombre de la

asignatura
Página 2 de 20
1. Modelo de Regresión Simple y Método de

Mínimos Cuadrados Ordinarios
1.1. Objetivo del análisis de regresión
El análisis de regresión relaciona la dependencia de una variable que llamamos “variable

dependiente” con una o más variables que llamamos “variables independientes o
variables explicativas”. Esto se realiza para poder estimar o predecir la media o valor
promedio poblacional de la dependiente respecto a los valores conocidos de las otras.
1.2. Función de regresión muestral y poblacional

Una forma gráfica de visualizar el análisis de regresión es a través de un diagrama o
gráfico de dispersión. En él, se puede ilustrar en el eje de las abscisas (eje X) la variable
independiente y en el eje de las ordenadas (eje Y,) la variable dependiente. En este
contexto, la regresión representará aquella recta que permite minimizar los errores, que
es la diferencia de los valores efectivos respecto a los valores equivalentes de la línea de
regresión.
Así, desde el punto de vista geométrico, una curva de regresión poblacional es el lugar
geométrico de las medias condicionales de la variable dependiente para los valores fijos
de la o las variables independientes. Es decir, es la curva que conecta las medias de las
subpoblaciones de Y que corresponden a los valores dados de X.
Página 3 de 20
Línea de regresión poblacional
Fuente: Gujurati, D. y Porter, D.(2010). Econometría. Ciudad de México: Mc Graw Hill. Recuperado
de: https://fvela.files.wordpress.com/2012/10/econometria-damodar-n-gujarati-5ta-ed.pdf
La regresión poblacional corresponde al valor esperado de Y dado Xi, es decir, E(Y | Xi ) = f

(Xi ). El modelo de regresión lineal que se estima es de la forma E(Y | Xi )= β1 + β2Xi , donde
β1 es llamado intercepto y β2 es la pendiente.
Página 4 de 20
1.3. Características de un modelo de regresión simple
1.3.1. Modelo de regresión lineal simple

Entendemos por regresión al estudio de la dependencia de una variable (la variable
dependiente) de una o más variables (las explicativas) con la idea de estimar y/o predecir
el valor poblacional medio de la primera en términos de los valores conocidos de las
segundas.
Y = f ( x1 , x2 ,....., xk ) , con K parámetros a estimar.

Si k=2 es llamada regresión simple y si k>2, regresión múltiple.
1.3.2. Objetivos del modelo de regresión lineal
Los objetivos del análisis de regresión son:
• Predecir el valor poblacional medio de Y dado los valores fijos de las variables X.
• Analizar los efectos de políticas que alteren las variables X.
• Saber si las variables X tienen efectos o no sobre las variables dependientes (Y) y si
estas son significativas.
1.4. Supuestos clásicos de un modelo de regresión simple
Para derivar los estimadores ˆ1 y ̂ 2 no se realizaron supuestos sobre la forma en que
se obtuvo la muestra, sí sobre la distribución de probabilidad de los errores.
Los supuestos son necesarios para verificar las propiedades estadísticas que tienen los
estimadores. Para lograrlo, podemos seguir el siguiente paso a paso:
Página 5 de 20
1. La variable explicativa X está dada (es decir, no es estocástica o aleatoria). COV( X,

e)=0
2. E(ei/Xi)=0  i, los errores pueden ser positivos o negativos pero no existe razón a
priori para esperar que sistemáticamente sean positivos o negativos.
EYi / Xi  = E1 +  2 X i +  i  = 1 +  2 X i , acá se supone

que se ocupa toda la información disponible.
COV ( i ,  j ) = 0
3. No autocorrelación, ,ij
   
COV ( i ,  j ) = E i − E ( i )   j − E ( j )  = E  i  j = 0
VAR ( i / X j ) =  2
4. Homoscedasticidad, . Las perturbaciones se distribuyen
con la misma dispersión (varianza) respecto a la media. Esto podría ser
representado en el siguiente gráfico:
Homocedasticidad Heterocedasticidad
Fuente: Elaboración propia
5. Modelo bien especificado, es decir no hay errores en la especificación.

6. Normalidad de los errores, los errores se distribuyen independiente y idénticamente
normal,
 ~ N (0,  2
).
Página 6 de 20
1.5. Construcción de estimadores mediante el método de

Mínimos Cuadrados Ordinarios (MCO)
La intuición es ajustar una recta de regresión a través de los puntos de un gráfico de forma
que esté lo más próximo a los puntos. Se busca que las distancias verticales (errores) sean
lo más pequeñas posibles.
Gráfico de intuición
Fuente: Elaboración propia.
ei = Yi − Yˆi = Yi − ˆ1 − ˆ 2  X
Donde , son los errores.
• MICO busca encontrar

ˆ1 y
̂ 2 tal que la suma de los cuadrados de los
e
2
i
errores sea mínima. Es decir, se busca minimizar, .
Página 7 de 20
• Por ejemplo, en el caso del modelo de regresión simple el problema es:
L = Min i ei = i (Yi −  1 −  2  X ) 2
2
1 ,  2
Las condiciones de primer orden son:
L =0 L =0
1  2
, y las de segundo orden:
2L 0 2L 0
1  2
2 2
La obtención de los parámetros se realiza de acuerdo con:
L = −2 (Yi − ˆ1 − ˆ 2 X i ) = 0

 1
= − Yi +  ˆ1 + ˆ 2  X i = 0
Nˆ1 =  Yi − ˆ 2  X i
ˆ1 = Y − ˆ 2 X
L = −2 (Yi − ˆ1 − ˆ 2 X i )X i = 0
 2
= − X i Yi +  ˆ1 X i + ˆ 2  X i = 0
2
ˆ 2 =
X Y i i − N  X Y
X −NX2
2
i
Página 8 de 20
Lo anterior se puede ver reflejado en el siguiente gráfico. Considerando lo que sucede con
grandes empresas.
P/BEjemplo:
vs ROE P/B vs ROE
3,5
Falabella
3,0
Andina SQM Enel
2,5
2,0
P/B
Entel AES
1,5
Latam Copec Cencosud
1,0 Colbún Engie
CMPC
0,5 y = 0,12x + 0,63
Cap R² = 0,51
0,0
-2 0 2 4 6 8 10 12 14 16 18
ROE
Página 9 de 20
1.6. Propiedades de los estimadores de MICO

1.6.1. Teorema de Gauss-Markov
• Si se cumple que:
1. E(ei/Xi)=0  i,
VAR ( i ) =  2
2.
3.
cov( et , et +k ) = 0 ,  k
4.
cov( et + k , xt ) = 0 ,  k, t
5. La variable explicativa está dada xt

6. No hay errores de especificación.
Los estimadores de MCO de una regresión lineal simple serán MELI (o BLUE), es decir los
mejores estimadores lineales insesgados.
1.7. Varianza y covarianza de los estimadores.
A partir del modelo de regresión 𝑌𝑖 = 𝛽1 + 𝛽2 𝑋𝑖 se puede obtener la varianza de los

estimadores β1 y β2 que corresponde a:
Página 10 de 20
1.8. Análisis de correlación y coeficiente de determinación:

objetivo, estimación e interpretación
Yt = Yˆt + et Yˆt = ˆ + ˆ  xt
A partir de la ecuación típica , donde
podemos llegar a una expresión ordenada por desviaciones al cuadrado:
∑(𝑦𝑡 − 𝑦̅𝑡 )2 =  ∑(𝑥𝑡 − 𝑥̅𝑡 )2 + ∑(𝑒𝑡 )2

Suma total de los Suma cuadrados regresión Suma cuadrados errores
cuadrados SCT SCE SCR
SCE SCR
1= +
Alternativamente, SCT SCT
Página 11 de 20
1.8.1. Ajuste de una regreción

SCE
Llamando R2 a la medida de la bondad de ajuste del modelo de regresión, SCT , se
obtiene la expresión tradicional para el coeficiente de determinación.
SCE SCR
R2 = = 1−
SCT SCT
1.9. Pruebas de Hipótesis de significancia individual
1.9.1. Distribución t-student:
Si X es la media de una muestra aleatoria de tamaño N, tomando una población de

media  y varianza finita y desconocida 2, pero varianza estimada S2, entonces el
X −
t= ~ t ( n−1)
S
estadístico N
P(− t 2  t  t 2 ) = 1 − 
Página 12 de 20
Distribución t-student
Fuente: Elaboración propia
1.10. Predicción
1.10.1. Intervalos de confianza para los parámetros
Lo que se busca es que

P(ˆ2 −    2  ˆ2 +  ) = 1 −  , es decir
que la probabilidad que

 2 esté entre ˆ2 −  y
ˆ 2 +  sea 1-.
Entenderemos por (1-) al nivel de confianza y por  al nivel de significancia.
ˆ 2 −  2
~ t n−2
ˆ ˆ2
Previamente sabemos que , entonces 1- de esta distribución t
− t t
con N-2 grados de libertad estará entre 2 y 2 .
Página 13 de 20
P  − t  t n − 2  t  = 1 − 
 2 2

 ˆ 2 −  2 
P  − t   t  = 1 − 
 2 ˆ ˆ2 2

P − ˆ 2 − t  ˆ ˆ2  −  2  − ˆ 2 + t  ˆ ˆ2  = 1 − 
 2 2 
P  ˆ 2 − t  ˆ ˆ2   2  ˆ 2 + t  ˆ ˆ2  = 1 − 
 2 2 
Por lo tanto el intervalo de confianza para 2 es
 2 = ˆ2  t  ˆ ˆ 2
2
1.10.2. Test de Hipótesis

Si queremos saber si las observaciones son compatibles o no con alguna determinada
hipótesis. Por ejemplo,
A través de la construcción de intervalos de confianza (I.C.) es posible apreciar si la

hipótesis es verdadera o no.
Si b  I.C. NO rechazo H0 (hipótesis nula)
Si b  I.C. Rechazo H0
Página 14 de 20
Alternativamente, es posible realizar test de significancia.
ˆ 2 −  2 ˆ 2 − b
~ t n−2 ~ t n−2
ˆ ˆ ˆ ˆ
Sabemos que 2
, entonces bajo la hipótesis nula 2
Así,
ˆ 2 −  2
~ t n−2
ˆ ˆ
2
Bajo H0,

Página 15 de 20
1.11. Modelos de regresión simple no lineal

Hasta ahora hemos estimado modelos de regresión lineal en los parámetros, los que
pueden ser o no lineales en las variables. Sin embargo, acá presentamos modelos de
regresión que no lineales en las variables pero sí en los parámetros, o que pueden serlo
mediante transformaciones apropiadas de las variables. Algunos ejemplos son:
Tipo Modelo Representación:

log-lineal
Semilogarítmi
cos
Recíproco
Recíproco
logarítmico

Página 16 de 20
Ahora revisemos un ejemplo de aplicación.
• Supone que estás a cargo de la autoridad monetaria y que posees los siguientes
datos históricos sobre la cantidad de dinero e ingreso nacional (ambos en
millones de dólares).
1. Grafica las variables
2. Estima el siguiente modelo: Ingreso =  +  M1
M1 Ingreso Disponible
(promedios en miles -y(miles de millones
Años
de millones de de pesos
pesos) encadenados)
2005 6.946 88.967
2006 7.773 97.455
2007 9.168 103.356
2008 10.265 103.084
2009 11.614 103.257
2010 14.947 115.916
2011 16.631 121.425
2012 18.350 127.903
2013 20.544 132.066
2014 23.030 135.124
2015 26.153 138.060
2016 27.793 141.207
2017 30.132 144.544
2018 33.451 148.646
2019 37.475 150.607
2020 53.143 143.477

Fuente: Banco Central de Chile.
Página 17 de 20
La solución puede realizarse a través de las fórmulas para estimar el intercepto y la

pendiente de una regresión lineal simple o bien usando un software estadístico.
Las fórmulas son
L = −2 (Yi − ˆ1 − ˆ 2 X i ) = 0
 1
= − Yi +  ˆ1 + ˆ 2  X i = 0
Intercepto:
Nˆ1 =  Yi − ˆ 2  X i
ˆ1α== Y − ˆ 2 X
 2  i 1 2 i i
L = −2 (Y − ˆ − ˆ X )X = 0
Pendiente: ˆ
= − X iYi +  1 X i + ˆ 2  X i = 0
2
ˆ 2 =
 X iYi − N  X  Y
 Xi − N  X 2
2
Promedio PIB= 𝑌̅ =93061,8
Promedio Dinero real= 𝑋̅ = 488,8

∑ 𝑋 ∙ 𝑌= 2131284782
2
∑
L𝑋 =15047129,3
= −2 (Yi − ˆ1 − ˆ 2 X i ) = 0
 1
= − Yi +  ˆ1 + ˆ 2  X i = 0
Nˆ1 =  Yi − ˆ 2  X i
L = −2 (Y −ˆˆ − ˆ X )X = 0
ˆα=  2 Y − i 21 X2 i i
1 =
  
= − X Y + ˆ X + ˆ X 53634 =0
2
α= i i 1 i 2 i
ˆ 2 =
 X Y − N  X Y
i i
X −NX
2 2
i
β= 80,657
Página 18 de 20
Respuesta al ejercicio
Coeficientes Estadístico t Probabilidad

Intercepción 53.634 12,8 2,5442E-14
M1_real 80,657 12,6 3,7481E-14
Relación PIB/M1
250.000
200.000
150.000 Año
2020
PIB
100.000
PIB = 80,657xM1 + 53634
R² = 0,8278
50.000
0
0,0 500,0 1000,0 1500,0 2000,0
Dinero

Página 19 de 20
Conclusiones
En esta unidad, revisamos la importancia del modelo de regresión lineal clásico y podemos
estimar los parámetros de una regresión simple.
También conocimos los supuestos detrás del modelo de regresión. Ellos nos permitirán
hacer inferencia con lo que validamos estadísticamente la relación entre una variable y
otra.
Una vez estimados los parámetros, podemos realizar pruebas de hipótesis para evaluar la
significancia estadística de los valores encontrados. Estos nos permitirán realizar un
análisis estadístico más eficaz y fiable.
Para finalizar, realizamos un ejemplo aplicando los modelos vistos. Considera que el apoyo
de Excel en el desarrollo de gráficos y análisis estadístico es vital para comprender los
modelos propuestos.
Página 20 de 20
Referencias bibliográficas
Gujurati, D. y Porter, D.(2010). Econometría. Ciudad de México: Mc Graw Hill. Recuperado

de: https://fvela.files.wordpress.com/2012/10/econometria-damodar-n-gujarati-5ta-
ed.pdf

Contenido Activador Unidad 2 Econometría

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Contenido Activador Unidad 2 Econometría

Cargado por

Copyright:

Formatos disponibles

Unidad 2:

El modelo de regresión lineal clásico representa la herramienta fundamental de análisis

De la misma forma, revisaremos una serie de fórmulas y cálculos estadísticos,

Ingrese aquí el nombre de la

1. Modelo de Regresión Simple y Método de

1.1. Objetivo del análisis de regresión

El análisis de regresión relaciona la dependencia de una variable que llamamos “variable

1.2. Función de regresión muestral y poblacional

Línea de regresión poblacional

La regresión poblacional corresponde al valor esperado de Y dado Xi, es decir, E(Y | Xi ) = f

1.3. Características de un modelo de regresión simple

1.3.1. Modelo de regresión lineal simple

Y = f ( x1 , x2 ,....., xk ) , con K parámetros a estimar.

1.3.2. Objetivos del modelo de regresión lineal

Los objetivos del análisis de regresión son:

1.4. Supuestos clásicos de un modelo de regresión simple

1. La variable explicativa X está dada (es decir, no es estocástica o aleatoria). COV( X,

EYi / Xi  = E1 +  2 X i +  i  = 1 +  2 X i , acá se supone

Fuente: Elaboración propia

5. Modelo bien especificado, es decir no hay errores en la especificación.

1.5. Construcción de estimadores mediante el método de

Fuente: Elaboración propia.

• MICO busca encontrar

• Por ejemplo, en el caso del modelo de regresión simple el problema es:

Las condiciones de primer orden son:

, y las de segundo orden:

La obtención de los parámetros se realiza de acuerdo con:

L = −2 (Yi − ˆ1 − ˆ 2 X i ) = 0

1.6. Propiedades de los estimadores de MICO

5. La variable explicativa está dada xt

1.7. Varianza y covarianza de los estimadores.

A partir del modelo de regresión 𝑌𝑖 = 𝛽1 + 𝛽2 𝑋𝑖 se puede obtener la varianza de los

1.8. Análisis de correlación y coeficiente de determinación:

∑(𝑦𝑡 − 𝑦̅𝑡 )2 =  ∑(𝑥𝑡 − 𝑥̅𝑡 )2 + ∑(𝑒𝑡 )2

1.8.1. Ajuste de una regreción

1.9. Pruebas de Hipótesis de significancia individual

1.9.1. Distribución t-student:

Si X es la media de una muestra aleatoria de tamaño N, tomando una población de

Fuente: Elaboración propia

1.10.1. Intervalos de confianza para los parámetros

Lo que se busca es que

que la probabilidad que

Entenderemos por (1-) al nivel de confianza y por  al nivel de significancia.

Por lo tanto el intervalo de confianza para 2 es

1.10.2. Test de Hipótesis

A través de la construcción de intervalos de confianza (I.C.) es posible apreciar si la

Si b  I.C. NO rechazo H0 (hipótesis nula)

Alternativamente, es posible realizar test de significancia.

Fuente: Elaboración propia.

1.11. Modelos de regresión simple no lineal

Tipo Modelo Representación:

Fuente: Elaboración propia.

Ahora revisemos un ejemplo de aplicación.

2006 7.773 97.455

2007 9.168 103.356

2008 10.265 103.084

2009 11.614 103.257

2010 14.947 115.916

2011 16.631 121.425

2012 18.350 127.903

2013 20.544 132.066

2014 23.030 135.124

2015 26.153 138.060

2016 27.793 141.207