Está en la página 1de 23

Unidad 2: Modelo de

Regresión Lineal Simple.

Clase N°4: Modelo de Regresión Lineal Simple:


Estimación por Mínimos Cuadrados Ordinarios.

Universidad de las Américas


Resultados de Aprendizaje Involucrados.

1. Aplicar el modelo de regresión lineal simple y/o múltiple, a casos prácticos


atingentes, para la obtención de información relevante en la toma de
decisiones de negocios.

2. Analizar la incidencia de incluir en el modelo a ejecutar, cada variable


independiente propuesta para medir su contribución en la capacidad
explicativa de la curva.

3. Analizar los efectos que sobre la bondad del ajuste, tendrá la forma de la
curva lineal o no lineal en, la consecución de información relevante.

Universidad de las Américas


Contenidos de esta sesión .

 Estimación del modelo econométrico.


 Estimación de la Función de Regresión Muestral (F.R.M), criterio
Mínimos Cuadrados Ordinarios (MCO).
 Aplicación de estimación por MCO: Ejemplo consumo-ingreso.
 Interpretación de los coeficientes estimados por MCO.
෣ y la predicción
 La Función de Regresión Muestral Estimada (𝐹𝑅𝑀)
puntual.
 Cálculo de los errores o residuales.
 Varianza de las perturbaciones y varianza residual.

Universidad de las Américas


Metodología de Análisis Econométrico.
En las sesiones anteriores se revisó los pasos 1 al 3 de la Metodología de Construcción de un modelo Econométrico.
En esta sesión nos adentraremos en detalle en el Paso 5: Estimación del Modelo Econométrico.
¿Por qué no analizaremos el Paso 4? Pues porque en la primera sesión de este curso estudiamos la clasificación de los datos
(corte transversal, series temporales, paneles, etc), y esto es lo más importante respecto al paso 4; además de lo
mencionado al respecto de que siempre usaremos muestras aleatorias.

1. Plantear la Hipótesis o Conjetura.

2. Especificar el modelo matemático.

3. Especificar el modelo econométrico.

4. Recolectar los datos.

5. Estimar e interpretar el modelo econométrico.

6. …
Universidad de las Américas
Estimación por Mínimos Cuadrados Ordinarios
Antes de aplicar el Paso 5, desarrollaremos la técnica de estimación mayormente utilizada en este curso:
Mínimos Cuadrados Ordinarios (MCO).
Luego, con el dominio de las fórmulas y métodos que nos provea este método (MCO) , lo aplicaremos a
nuestro, ya clásico, ejemplo consumo ingreso.
Para comenzar, vamos a entender en qué consiste la intuición detrás del método. En primer lugar, recordemos
que la FRP con la que estamos trabajando será:

𝑌𝑖 = 𝛽0 + 𝛽1 𝑋i + μ𝑖 (𝐹𝑅𝑃)

Sin embargo, como no tenemos acceso a los datos de la población, usaremos una muestra aleatoria de tamaño
𝑛 para realizar una estimación de la FRP, mediante su función homóloga en la muestra, la FRM :

෢0 + 𝛽
𝑌𝑖 = 𝛽 ෢1 𝑋i + μෝ𝑖 (𝐹𝑅𝑀)

Universidad de las Américas


M.C.O Intuición

Para pensar en cómo estimaremos esta función, y desarrollar el criterio detrás de MCO, realizaremos
un análisis gráfico; en el cuál supondremos dos cosas:

 Tenemos un diagrama de dispersión entre X e 𝑌, que representará los datos de nuestra muestra
aleatoria, de tamaño 𝑛.

 Además, supondremos que ya conocemos a 𝛽 ෢0 y a 𝛽


෢1 (esto es sólo un supuesto pedagógico). Esto
es poco intuitivo, pero una forma de hacerlo mejor, es pensar que ya hemos calculado los valores
de los parámetros mediante MCO y queremos un criterio para evaluar ¿qué tan bien? Lo hizo dicha
estimación.

Universidad de las Américas


M.C.O Intuición

Analizaremos la siguiente gráfica.


Como se mencionó, y aquí se puede observar, la distancia entre
cada punto y la recta se representa con 𝜇ෝ𝑖 , la variación exógena a
𝑋, que afecta a 𝑌, provocando que su valor observado quede
alrededor de la recta. Esta variabilidad proviene de un error
sistemático en la proyección, respecto al dato observado. 𝜇ෝ𝑖
Suponemos que el comportamiento de este error es aleatorio.
𝜇ෝ𝑖
Por lo tanto, dado que nos interesará que la recta buscada pase ෢1
𝛽
lo suficientemente centrada por el diagrama de puntos; un
criterio intuitivo para encontrar los valores algebraicos de los
parámetros es buscar aquellos valores de 𝛽෢0 y 𝛽
෢1 que minimizan
estas distancias, es decir los que minimicen el error. Ellos 𝜇ෝ𝑖
compondrán la recta en cuestión, la cuál provoque que la nube
de puntos esté lo más cercana posible a la misma, y por ende el ෢0
𝛽
modelo “ajustado” tenga la menor varianza posible.

Universidad de las Américas


M.C.O Intuición

Formalizaremos las ideas anteriores:


Tenemos que explicar de donde viene un error 𝑖-ésimo.
Usando la 𝐹𝑅𝑀 anteriormente descrita, y despejando al
error, encontramos la siguiente expresión:

෢0 + 𝛽
𝑌𝑖 = 𝛽 ෢1 𝑋i + μෝ𝑖

෢0 − 𝛽
μෝ𝑖 = 𝑌𝑖 − 𝛽 ෢1 𝑋i

Es decir; un error es la diferencia, o residuo, entre el valor


de la variable dependiente observado 𝑌𝑖 , y el valor que
proporciona la recta e predicción, al que podemos llamar:
෢0 + 𝛽
𝑌෡𝑖 = 𝛽 ෢1 𝑋𝑖 valor predicho, o valor estimado.
Al definir un criterio para hallar nuestra recta de
predicción, podríamos establecer el hecho de que estas
distancias representadas por μෝ𝑖 = 𝑌𝑖 − 𝑌෡𝑖 , sean tan
pequeñas como se pueda.

Universidad de las Américas


M.C.O Intuición

Recordando además, el hecho de que nos interesa minimizar


la suma de todas estas distancias en la muestra, por lo cuál
debemos aplicarle a la ecuación anterior, el operador
sumatoria, con el objetivo de incluir todas las observaciones.
Sin embargo, antes de hacerlo recordemos el hecho de que
queremos evitar que estas diferencias se anulen entre ellas,
por lo cuál previo a aplicar la sumatoria, elevamos ambos
lados de la igualdad al cuadrado.
Elevamos:
μෝ𝑖 2
= 𝑌𝑖 − 𝛽෢ ෢
0 − 𝛽1 𝑋𝑖
2

Sumamos:

𝑛 𝑛
2
෍ μෝ𝑖 2 = ෍ 𝑌𝑖 − 𝛽෢ ෢
0 − 𝛽1 𝑋𝑖
𝑖=1 𝑖=1
Esta última expresión servirá como un indicador de la varianza
alrededor de la recta ajustada. En la medida en que esta
magnitud sea más pequeña, tendremos un modelo más
preciso, pues los datos se acercan más a la predicción
elaborada con la 𝐹𝑅𝑀 estimada.

Universidad de las Américas


Mínimos Cuadrados Ordinarios: Problema de Optimización.

El método de estimación por Mínimos Cuadrados Ordinarios, es aquél que minimiza la expresión anterior. Esta expresión refleja la
suma del cuadrado de los errores , o residuales. Dicho de otra manera, cuando buscamos los parámetros de 𝛽 ෢0 y 𝛽 ෢1 con el
método de MCO, formalmente estamos buscando aquellos valores de los parámetros que minimicen la suma cuadrática de los
errores residuales. Es decir:

𝑛 𝑛
2
min ෍ μෝ𝑖 2 = ෍ 𝑌𝑖 − 𝛽෢
0 − 𝛽෢
1 𝑋𝑖
෢0 ; 𝛽
(𝛽 ෢1 )
𝑖=1 𝑖=1

෢0 ; 𝛽
Por lo tanto, los valores de 𝛽 ෢1 obtenidos según MCO, son el 𝑎𝑟𝑔𝑚𝑖𝑛 σ𝑛𝑖=1 μෝ𝑖 2 . En breve, resolveremos el problema recién
planteado.

Universidad de las Américas


Mínimos Cuadrados Ordinarios.
Problema de Optimización
¿COMO OBTENER LAS CONDICIONES DE PRIMER ORDEN DEL PROBLEMA?
Puesto que el anterior es un problema de optimización sencillo, sin restricciones -usando cálculo infinitesimal- sabemos que la
solución proviene en calcular la primera derivada respecto a cada variable y asegurarse que esta derivada sea cero. En economía, a
este procedimiento se lo conoce como OBTENER LAS CONDICIONES DE PRIMER ORDEN DEL PROBLEMA.
Para el problema anterior, las C.P.O.s son:

2
𝜕 σ𝑛
𝑖=1 ෞ
μ𝑖
= 2σ𝑛 ෢ ෢
𝑖=1 𝑌𝑖 − 𝛽0 − 𝛽1 𝑋𝑖 −1 = 0
෢0
𝜕𝛽

𝑛
𝜕 σ𝑛𝑖=1 μෝ𝑖 2
෢0 − 𝛽෢
= 2 ෍ 𝑌𝑖 − 𝛽 1 𝑋𝑖 −𝑋𝑖 = 0
෢1
𝜕𝛽
𝑖=1

Estas ecuaciones son conocidas en los manuales de texto, como las Ecuaciones Normales del Método Mínimos Cuadrados
෢0 ; 𝛽
Ordinarios. Los valores de 𝛽 ෢1 que satisfacen simultáneamente éstas dos ecuaciones, son los que minimizan la suma cuadrática de
los errores. Y por ende son aquellos valores que determinan la recta que proveerá “el mejor ajuste” a la nube de puntos
representada en el diagrama de dispersión.

Universidad de las Américas


Mínimos Cuadrados Ordinarios.
Problema de Optimización: ¿COMO OBTENER LAS CONDICIONES DE PRIMER ORDEN DEL
PROBLEMA?

෢0 ; 𝛽
Entonces el paso siguiente es resolver el sistema de dos ecuaciones normales, para los valores de 𝛽 ෢1 .Se puede demostrar,
usando álgebra sencilla que éstos valores son:
Coeficiente de la razón media de cambio, o Pendiente.
𝑛 σ𝑛 𝑛 𝑛
𝑖=1 𝑌𝑖 𝑋𝑖 −[σ𝑖=1 𝑌𝑖 ×σ𝑖=1 𝑋𝑖 ]
෢1 =
𝛽 2
[𝑛 σ𝑛 2 𝑛
𝑖=1 𝑋𝑖 ]−[σ𝑖=1 𝑋𝑖 ]
Coeficiente de a intercepción al eje de las ordenadas , o Intercepto:

෢0 = 𝑌ത − 𝛽
𝛽 ෢1 𝑋ത

; donde 𝑌:promedio de 𝑌, y

𝑋:promedio de 𝑋.
Es decir, cada vez que tengamos un conjunto de datos, donde exista una posible hipótesis de causalidad entre una variable
dependiente y una variable independiente, podemos calcular los valores de los coeficientes de la recta de regresión con estas
sencillas fórmulas.

Universidad de las Américas


Mínimos Cuadrados Ordinarios: PROPIEDADES DE LOS COEFICIENTES
ESTIMADOS.

Los coeficientes estimados por el método de 𝑀𝐶𝑂;


𝑛 σ𝑛 𝑛 𝑛
𝑖=1 𝑌𝑖 𝑋𝑖 −[σ𝑖=1 𝑌𝑖 ∗σ𝑖=1 𝑋𝑖 ]
෢1 =
𝛽 2 ;
[𝑛 σ𝑛 2 𝑛
𝑖=1 𝑋𝑖 ]−[σ𝑖=1 𝑋𝑖 ]
෢0 = 𝑌ത − 𝛽
𝛽 ෢1 𝑋;

nos asegurarán que la recta estimada pase lo más centrada
posible por los puntos del diagrama de dispersión, ya que es
aquella que minimiza el error cuadrático medio.
Una vez teniendo éstos valores podemos escribir
la 𝐹𝑅𝑀 estimada:

෢0 + 𝛽
𝑌෡𝑖 = 𝛽 ෢1 𝑋𝑖

Y reemplazando cualquier valor para 𝑋𝑖 = 𝑋0 ; obtendremos


una predicción puntual para 𝑌෡𝑖 = 𝑌෡0.

Universidad de las Américas


Mínimos Cuadrados Ordinarios: PROPIEDADES NUMÉRICAS DE LOS
COEFICIENTES ESTIMADOS.

Llamaremos a ésta función 𝐹𝑅𝑀 estimada debido a que podemos escribirla, una vez que le hemos aplicado el
principio de estimación por 𝑀𝐶𝑂 a los datos obtenidos, y estimado los coeficientes. Además, los coeficientes que
forman esta función cumplirán ciertas Propiedades Numéricas, que no tienen que ver con la generación de datos
misma, sino que con el procedimiento bajo el que se obtuvieron estos estimadores 𝑀𝐶𝑂.
Propiedades Numéricas:
1. Son una estadística suficiente: Es decir, pueden ser fácilmente calculados una vez que se tienen todos los
valores de la muestra disponibles.
2. Son estimadores puntuales: Esto es, dada la muestra cada estimador proporcionará un solo valor (puntual)
del parámetro poblacional relevante.
3. Una vez obtenidos los estimadores 𝑴𝑪𝑶 de la información muestral, la recta de regresión puede obtenerse
fácilmente, esta recta tendrá las siguientes dos propiedades:

Universidad de las Américas


Mínimos Cuadrados Ordinarios: PROPIEDADES NUMÉRICAS DE LOS
COEFICIENTES ESTIMADOS.
i. Pasan por las medias muestrales de 𝑌 y de 𝑋. Ésto es obvio, ya que a partir de la fórmula del estimador intercepto de
𝑀𝐶𝑂, podemos escribir:
෢0 + 𝛽
𝑌ത = 𝛽 ෢1

ii. El valor promedio o medio del 𝑌 estimado (𝑌෢


𝑖 ); es igual al valor medio del 𝑌 real u observado (𝑌). Para demostrarlo,
escribiremos la 𝐹𝑅𝑀:

෢0 + 𝛽
𝑌෡𝑖 = 𝛽 ෢1 𝑋𝑖
Que se puede rescribir como:
෢1 𝑋)
𝑌෡𝑖 = (𝑌ത − 𝛽 ෢1 𝑋𝑖
ത + 𝛽
Que a su vez, es lo mismo que:
෢1 (𝑋𝑖 − 𝑋)
𝑌෡𝑖 = 𝑌ത + 𝛽 ത
Luego, sumando y dividiendo por 𝑛 a ambos lados de la ecuación, se obtiene:

𝑌ഥ
෡ = 𝑌ഥ

Universidad de las Américas


Mínimos Cuadrados Ordinarios: Aplicación Ejemplo Consumo Ingreso.

X (ingreso) Y (consumo)
Usaremos el ejemplo anteriormente descrito: relación entre Consumo e Ingreso;
con un 𝑛 = 60. A la derecha tenemos un resumen de estos datos. 80 55
Para ordenar correctamente nuestros cálculos, definimos: 100 88
𝑌𝑖 = 𝐶𝑜𝑛𝑠𝑢𝑚𝑜 𝐴𝑔𝑟𝑒𝑔𝑎𝑑𝑜 𝐶 120 79
𝑋𝑖 = 𝐼𝑛𝑔𝑟𝑒𝑠𝑜 − 𝑃𝐼𝐵 𝑛𝑜𝑚𝑖𝑛𝑎𝑙 − (𝑌)
140 80
140 93
Necesitamos calcular el promedio de cada variable, y luego la suma de "𝑌𝑖 ",
"𝑋𝑖 ", "𝑌𝑖 ∗ 𝑋𝑖 ” , “𝑋𝑖2 ". 140 95
Luego, con toda esa información resumida, usaremos la fórmulas proveídas por el … …
método 𝑀𝐶𝑂:
140 103
Para la pendiente.
160 125
𝑛 σ𝑛 𝑛 𝑛
𝑖=1 𝑌𝑖 𝑋𝑖 −[σ𝑖=1 𝑌𝑖 ×σ𝑖=1 𝑋𝑖 ]
෢1 =
𝛽 2 180 135
[𝑛 σ𝑛 2 𝑛
𝑖=1 𝑋𝑖 ]−[σ𝑖=1 𝑋𝑖 ]

Para el intercepto. 200 145


220 135
෢0 = 𝑌ത − 𝛽
𝛽 ෢1 𝑋ത 240 137
260 150
Universidad de las Américas
Mínimos Cuadrados Ordinarios: Aplicación Ejemplo Consumo Ingreso.

Usando los datos anteriores; se puede obtener la siguiente información:

σ60
𝑖=1 𝑋𝑖 = 10420 σ60
𝑖=1 𝑌𝑖 = 7272 ;
σ60
𝑖=1 𝑋𝑖 𝑌𝑖 = 1381220 σ60 2
𝑖=1 𝑋𝑖 = 2006800.
𝑋ത = 173.67 𝑌ത = 121.20
Reemplazando esta información en los estimadores MCO; se obtiene
Coeficiente para la Pendiente:

෢1 = 60∗1381220 −[7272×10420] 82873200 − 75774240 7098960


𝛽 = = 11831600 = 0.6
[60∗2006800− 10420 2 120408000−108576400

Coeficiente para el Intercepto:


෢0 = 121.20 − 0.6 ∗ 173.67 = 17
𝛽

Universidad de las Américas


Interpretación de la FRM estimada.

Una vez escrita la Función de Regresión Muestral


(𝐹𝑅𝑀 ) estimada. Podemos graficarla, y ver su
figura, la que nos ayudará a darle interpretación a
los coeficientes estimados.
෢0 = 17 Nos informa que si 𝑋𝑖 = 0 (es decir, el
𝛽
ingreso es cero); el consumo medio estimado, será
de 17 dólares semanales.
෢1 = 0.6 Nos informa el cambio promedio en la
𝛽
media de 𝑌, cuando 𝑋 aumenta en una unidad.
En la gráfica se puede observar que cuando la
variable independiente se mueve desde 𝑥0 hasta
𝑥0 + 1, esto genera un impacto de 0.6 en la media
estimada de 𝑌, denotada por 𝑌෡𝑜 .

Universidad de las Américas


෣ y la predicción
La Función de Regresión Muestral Estimada (𝐹𝑅𝑀)
puntual.
Para darle más relato a lo comentado
anteriormente, complementemos con un ejemplo.
Nuestra 𝐹𝑅𝑀 estimada será: 𝑌෡𝑖 = 17 + 0.6𝑋𝑖 .
Podemos usar está función para predecir la media
del consumo cuando el ingreso es, por ejemplo
105 dólares por semana. Esto se realizará
simplemente reemplazando este valor del ingreso
en la 𝐹𝑅𝑀 estimada:

𝑌෡𝑖 = 17 + 0.6 105 = 80

Es decir, cuando el ingreso sea de 105;dólares por


semana en promedio el consumo será de 80
dólares por semana.
Nótese que el valor 𝑥 = 105 no estaba presente
en nuestros datos, es decir con la 𝐹𝑅𝑀 estimada
podemos hacer predicciones puntuales para
cualquier valor de la variable independiente.

Universidad de las Américas


La Función de Regresión Muestral Estimada : Cálculo de los errores o residuales.

¿Y qué podemos decir respecto a los errores o


residuales?
Habíamos comentado que un error es la distancia, o
diferencia, entre el valor observado de 𝑌, y el valor
predicho en un determinado punto de la muestra:
μෝ𝑖 =𝑌𝑖 − 𝑌෡𝑖
Por ejemplo cuando el ingreso sea de 𝑋 = 100
dólares por semana; en promedio el consumo
estimado será de 𝑌෠ = 77 dólares por semana. Sin
embargo, al observar en los datos la primera familia
que gana 𝑋 = 100, consume 𝑌 = 65 dólares por
semana.
Esto significa que:

μෝ𝑖 =𝑌𝑖 − 𝑌෡𝑖 = 65 − 77 = −12


Es decir, el valor observado de 𝑌, difiere en menos
doce, del valor estimado por la 𝐹𝑅𝑀, para dicha
observación (familia 1).

Universidad de las Américas


Varianza de las perturbaciones y Varianza de los errores o residuales.

Habíamos mencionado que el ajuste mediante 𝑀𝐶𝑂


proporcionaba la recta que pasaba más centrada por la
nube de puntos, minimizando la suma cuadrática de las 𝜎෢

𝜇
2
perturbaciones (en la población). Una medida de la
variabilidad de los puntos alrededor de la recta
“ajustada” es:
2
σ𝑁𝑖=1(𝜇𝑖 )
2
𝜎𝜇 =
𝑁
Por principio de analogía, su homólogo muestral será:

σ𝑛𝑖=1(μෝ𝑖 )2
𝜎෢

𝜇
2
=
𝑛−𝑘
Finalmente, una vez que se ha calculado; el valor de μෝ𝑖
para todas las observaciones, y se han elevado al
cuadrado; se puede sumar y dividir en el total de
observaciones 𝑛 − 𝑘; donde 𝑘 es el número de betas
presentes en el modelo (en este caso 2) . A este indicador
se le conoce como varianza de el error 𝜎෢2
ෝ.
𝜇

Universidad de las Américas


Resumen de Contenidos.

En esta sesión hemos desarrollado el criterio de Mínimos Cuadrados Ordinarios (M.C.O). Este criterio nos provee de 2 sencillas
formulas:
𝑛 σ𝑛 𝑛 𝑛
𝑖=1 𝑌𝑖 𝑋𝑖 −[σ𝑖=1 𝑌𝑖 ×σ𝑖=1 𝑋𝑖 ]
෢1 =
𝛽 2
[𝑛 σ𝑛 2 𝑛
𝑖=1 𝑋𝑖 ]−[σ𝑖=1 𝑋𝑖 ]

෢0 = 𝑌ത − 𝛽
𝛽 ෢1 𝑋ത
Que nos permitirán: Dado un conjunto de datos de una muestra aleatoria estimar la FRM que pasa lo mas centrada posible por dichos
datos.
Esto ultimo se logra minimizando la suma cuadrática de las residuales.
La FRM estimada por M.C.O cumple las siguientes propiedades numéricas:
1. Son una estadística suficiente: Es decir, pueden ser fácilmente calculados una vez que se tienen todos los valores de la muestra
disponibles.
2. Son estimadores puntuales: Esto es, dada la muestra cada estimador proporcionará un solo valor (puntual) del parámetro
poblacional relevante.
3. Una vez obtenidos los estimadores 𝑴𝑪𝑶 de la información muestral, la recta de regresión puede obtenerse fácilmente, esta recta
tendrá las siguientes dos propiedades:
A. ෢0 + 𝛽
Pasan por las medias muestrales de 𝑌 y de 𝑋. Ésto es obvio, ya que a partir de la fórmula del estimador intercepto de 𝑀𝐶𝑂, podemos escribir: 𝑌ത = 𝛽 ෢1

B. El valor promedio o medio del 𝑌 estimado (𝑌෢ ෡ ෢ ෢


𝑖 ); es igual al valor medio del 𝑌 real u observado (𝑌). Para demostrarlo, escribiremos la 𝐹𝑅𝑀: 𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖

_ Universidad de las Américas


Bibliografía

 Econometría, Damodar Gujarati. Mc Graw Hill, 4ª edición, 2004.

 Introducción a la econometría. Un enfoque Moderno, Jeffrey M.


Wooldridge. Cengage Learning Editores, 4ª. Edición, 2009.

 Introducción a la Econometría, James H. Stock y Mark M. Watson.


Pearson Ed, 3ª edición,2012.

_ Universidad de las Américas

También podría gustarte