Está en la página 1de 91

Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores

Supue

ECONOMETR ÍA I

T EMA 2 A ): M ODELO DE R EGRESI ÓN LINEAL SIMPLE

Curso 2018

ECONOMETRÍA I 1 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

ESQUEMA DE LA PRESENTACI ÓN

6 P ROPIEDADES DE LOS
1 I NTRODUCCI ÓN
ESTIMADORES
2 M ODELO DE REGRESI ÓN
LINEAL SIMPLE 7 S UPUESTOS MRLS

3 E STIMACI ÓN DE LOS 8 E STIMACI ÓN DE LA VARIANZA


PAR ÁMETROS DE LOS ERRORES
4 M ÉTODO MCO
9 U NIDADES DE MEDIDA Y
5 B ONDAD DE AJUSTE FORMA FUNCIONAL

Gujarati, Damodar. (5ta edición). ((Econometria)). Cap 1 y 2.

Gujarati, Damodar. (5ta edición). ((Econometria)). Cap 6.

Wooldridge, Jeffrey M. (4ta edición). ((Introducción a la Econometria. Un


enfoque moderno)). Cap 2.
ECONOMETRÍA I 2 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

Introducción

O RIGEN HIST ÓRICO DEL T ÉRMINO REGRESI ÓN

El término regresión fue inicialmente empleado por Francis Galton (primo de


Charles Darwin) en sus estudios sobre las leyes de herencia en las especies.
Inicialmente Galton creı́a que la altura del hijo cuando llegara a ser adulto
deberı́a tener un valor esperado igual a la altura de su progenitor del mismo sexo.
Ahora bien, si lo anterior fuera ası́, se podrı́a decir que aproximadamente la mitad
de la descendencia de la gente muy alta serı́a incluso más alta que sus padres y
que aproximadamente la mitad de la descendencia de la gente muy baja serı́a
incluso más baja que sus padres.
Ası́, cada nueva generación generarı́a individuos más altos y también más bajos
que los de la generación anterior.
Sin embargo, los datos mostraban una cierta estabilidad en las alturas de la
población de generación en generación. ¿Cómo podrı́a explicarse esta aparente
contradicción?
Galton encontró que, contrariamente a su creencia inicial, padres altos tienen, en
promedio, hijos altos pero, en promedio, más bajos que sus padres, mientras que
padres bajos tienen, en promedio, hijos bajos pero, en promedio más altos que
sus padres.
Ası́, Galton concluyó que las leyes de herencia ocasionaban que los valores
extremos sobre una población regresaran a la media y le dio la denominación de
regresión a la mediocridad.
ECONOMETRÍA I 3 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

Introducción

INTERPRETACI ÓN MODERNA

La interpretación moderna del término regresión es algo diferente. El análisis de


regresión trata de un estudio de la dependencia de una variable (variable
dependiente) respecto de una o más variables (variables explicativas) con el
objetivo de estimar o predecir la media o el valor promedio poblacional de la
primera en términos de los valores conocidos o fijos (en muestras repetidas) de
las segundas.

ECONOMETRÍA I 4 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

Introducción

MODELOS

Veremos cómo construir modelos que expliquen el comportamiento de una


variable de interés, la variable respuesta (que llamaremos y), como
resultado del efecto de un conjunto de variables explicativas (que
llamaremos x) y mostrar la utilización de estos modelos para hacer
predicciones o tomar decisiones.

Nos interesarán las relaciones que tienen las variables económicas, pero en
particular las relaciones no deterministas. Conociendo la relación entre
variables,no podemos prever con certeza el valor que tomará una de las
variables en función del valor que asumen las demás. Esto se debe a que
podemos no estar considerando todas las variables relevantes o cometiendo
errores de medida, aún si la variable de respuesta pudiera ser predicha con
certeza en condiciones totalmente controladas. En estos casos estamos
frente a lo que se denomina una relación estadı́stica entre variables.

ECONOMETRÍA I 5 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

Notación

E JEMPLO . I NGRESOS Y G ASTOS DE 60 FAMILIAS

Ejemplo del capı́tulo 2 de Gujarati.

Tenemos información de los ingresos y gastos de un grupo de 60 familias


(población total). La variable dependiente o variable a explicar y es el consumo
semanal en dólares y la variable independiente o explicativa x es el ingreso
semanal en dólares de las 60 familias consideradas. Las 60 familias se dividen
en 10 grupos de ingresos (de 80 a 260 dólares), por lo tanto tenemos 10 valores
fijos de x y los correspondientes valores y para cada valor de x.

ECONOMETRÍA I 6 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

Notación

E JEMPLO . I NGRESOS Y G ASTOS DE 60 FAMILIAS

ECONOMETRÍA I 7 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

Notación

E JEMPLO . I NGRESOS Y G ASTOS DE 60 FAMILIAS

En base a la tabla anterior:

Vemos que, en general, las familias que tienen mayores ingresos tienen
también mayores niveles de gastos.

ECONOMETRÍA I 8 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

Notación

E JEMPLO . I NGRESOS Y G ASTOS DE 60 FAMILIAS

En base a la tabla anterior:

Vemos que, en general, las familias que tienen mayores ingresos tienen
también mayores niveles de gastos.
¿Necesariamente una familia con mayor nivel de ingresos tiene asociado un
mayor nivel de gastos?

ECONOMETRÍA I 8 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

Notación

E JEMPLO . I NGRESOS Y G ASTOS DE 60 FAMILIAS

En base a la tabla anterior:

Vemos que, en general, las familias que tienen mayores ingresos tienen
también mayores niveles de gastos.
¿Necesariamente una familia con mayor nivel de ingresos tiene asociado un
mayor nivel de gastos?
Resp: observar la penúltima fila de la tabla (una familia con ingreso 240 y
gasto 189 y la otra con ingreso de 260 y gasto de 185).

ECONOMETRÍA I 8 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

Notación

E JEMPLO . I NGRESOS Y G ASTOS DE 60 FAMILIAS

En base a la tabla anterior:

Vemos que, en general, las familias que tienen mayores ingresos tienen
también mayores niveles de gastos.
¿Necesariamente una familia con mayor nivel de ingresos tiene asociado un
mayor nivel de gastos?
Resp: observar la penúltima fila de la tabla (una familia con ingreso 240 y
gasto 189 y la otra con ingreso de 260 y gasto de 185).
¿Cuál es el valor esperado del consumo semanal de una familia?

ECONOMETRÍA I 8 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

Notación

E JEMPLO . I NGRESOS Y G ASTOS DE 60 FAMILIAS

En base a la tabla anterior:

Vemos que, en general, las familias que tienen mayores ingresos tienen
también mayores niveles de gastos.
¿Necesariamente una familia con mayor nivel de ingresos tiene asociado un
mayor nivel de gastos?
Resp: observar la penúltima fila de la tabla (una familia con ingreso 240 y
gasto 189 y la otra con ingreso de 260 y gasto de 185).
¿Cuál es el valor esperado del consumo semanal de una familia?
Respuesta: 121,20 dólares=7.272/60

Cuál es el valor esperado del consumo semanal de una familia cuyo ingreso
semanal es de 140 dólares?

ECONOMETRÍA I 8 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

Notación

E JEMPLO . I NGRESOS Y G ASTOS DE 60 FAMILIAS

En base a la tabla anterior:

Vemos que, en general, las familias que tienen mayores ingresos tienen
también mayores niveles de gastos.
¿Necesariamente una familia con mayor nivel de ingresos tiene asociado un
mayor nivel de gastos?
Resp: observar la penúltima fila de la tabla (una familia con ingreso 240 y
gasto 189 y la otra con ingreso de 260 y gasto de 185).
¿Cuál es el valor esperado del consumo semanal de una familia?
Respuesta: 121,20 dólares=7.272/60

Cuál es el valor esperado del consumo semanal de una familia cuyo ingreso
semanal es de 140 dólares?
Respuesta: 101 dólares

Conceptualizar la diferencia entre E(y) y las esperanzas condicionales a los


valores de x: E [y |x ]
ECONOMETRÍA I 8 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

Notación

E JEMPLO . I NGRESOS Y G ASTOS DE 60 FAMILIAS

Distribución condicional del gasto en varios niveles de ingresos

ECONOMETRÍA I 9 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

Notación

E JEMPLO . I NGRESOS Y G ASTOS DE 60 FAMILIAS

Bajo, el supuesto de linealidad, los puntos oscuros dentro de los cı́rculos de la


gráfica anterior muestran los valores medios condicionales de y, graficados en
función de los diferentes valores de X. Al unir estos valores se obtiene la linea
de regresión poblacional (LRP), o lo que es lo mismo la curva de regresión
poblacional (CRP). Con palabras mas sencillas, es la regresión de y sobre x.

Esta figura muestra que, para cada x (nivel de ingresos) existe una población
de valores y (consumo semanal) que se distribuyen alrededor de la media
condicional de dichos valores de y.

ECONOMETRÍA I 10 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

M ODELO

Consideremos una medición de una variable sobre una unidad en estudio, que
produce una observación yi . Un modelo econométrico propone considerar dicha
observación formada por dos componentes, una parte sistemática f (x), y una
parte aleatoria denotado por u.

Ası́, un modelo econométrico se puede plantear con una ecuación del tipo

yi = f (xi ) + ui i = 1, 2, ..., n

que representa las observaciones sobre un conjunto de n unidades, donde la


parte sistemática explica la respuesta a partir de las condiciones xi a las que
fueron sometidas las unidades bajo estudio en el momento de la medición. Se
asume que la parte aleatoria es una variable no observable con una distribución
probabilı́stica.

ECONOMETRÍA I 11 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

F UNCI ÓN DE REGRESI ÓN POBLACIONAL (FRP)

A la parte sistemática (no aleatoria) se la denomina como vimos función de


regresión poblacional. El término poblacional refiere a que estamos
considerando toda la población y no una parte. En este último caso, como
veremos a continuación, el término será función de regresión muestral.

¿Qué forma tiene la parte sistemática f (x)? La teorı́a tendrá mucho que decir
al respecto.

Como primera aproximación supondremos que es lineal del tipo:

E [y |xi ] = β0 + β1 xi .

donde β0 y β1 son parámetros desconocidos, pero fijos que se denominan


coeficientes de regresión y representan la interesección con el eje de las
ordenadas y la pendiente de una recta respectivamente.

ECONOMETRÍA I 12 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

E SPECIFICACI ÓN ESTOC ÁSTICA DE LA FRP

Vimos que a medida que aumenta el ingreso familiar, el consumo familiar


promedio, también aumenta. Pero ¿qué sucede con el consumo de una familia
en relación con un nivel de ingreso fijo?

ECONOMETRÍA I 13 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

E SPECIFICACI ÓN ESTOC ÁSTICA DE LA FRP

El consumo de una familiar en particular no necesariamente aumenta a medida


que lo hace el nivel de ingreso. El consumo de una una familia en particular, se
expresa como la suma de dos componentes: 1) una primer componente
sistemática o determinı́stica, que es la media del consumo de todas las familias
con el mismo nivel de ingreso, y 2) un componente aleatorio o no sistemático.

yi = E [y |xi ] + ui

El término u es denominado como término de perturbación estocástica. Es un


término que considera o representa a todas las variables omitidas o ignoradas
en modelo de regresión, que pueden afectar a la variable y.

ECONOMETRÍA I 14 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

I MPORTANCIA DE LOS ERRORES

Si los errores recogen variables omitidas que explican a y, ¿porqué no se


plantea un modelo que tenga todas las variables explicativas que afecten a y?

Vaguedad de la teorı́a.
Falta de disponibilidad de datos.
Variables centrales y periféricas.
Aleatoriedad intrı́nsica en el comportamiento humano.
Variables representantes (proxy) inadecuadas.
Principio de parsimonia.
Forma funcional incorrecta.

ECONOMETRÍA I 15 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

FUNCI ÓN DE REGRESI ÓN MUESTRAL (FRM)

Supongamos que tenemos solo una muestra seleccionada al azar de n


individuos de los que tenemos el par de valores de las variables x, y (xi , yi ). Con
estos datos intentaremos estimar la FRP.

ECONOMETRÍA I 16 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

¿Es posible estimar la FRP a partir de los datos de una muestra?

Se obtendrán tantas FRM como muestras haya.

ECONOMETRÍA I 17 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

N OTACI ÓN

1 yi = E [y |xi ] + ui = β0 + β1 xi + ui
2 E [y |xi ] = β0 + β1 xi
3 E [yˆ|xi ] = βˆ0 + βˆ1 xi

El 1) es el modelo teórico o econométrico donde se especifica claramente que la


variable a explicar es la agregación de una componente sistemática o
determinı́stica más una aleatoria.

El 2) es la función de regresión poblacional (FRP) o recta en este caso. Es


desconocida pues los parámetros son desconocidos.

El 3) es la estimación de la recta de regresión poblacional, se denomina función


de regresión muestral (FRM), en lugar de los verdaderos valores de los
parmámetros tiene las estimaciones obtenidas a partir de nuestra muestra.

Finalmente tenemos que: yi − (βˆ0 + βˆ1 xi ) = ûi

donde ûi es el residuo. Se considera una ÍAestimación


ECONOMETR I del error ui que se 18 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

F UNCI ÓN DE REGRESI ÓN POBLACIONAL Y MUESTRAL

Se obtendrán tantas FRM como muestras haya, sin embargo la FRP es única.

ECONOMETRÍA I 19 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

¿CU ÁNDO POSTULAR UN MODELO DE REGRESI ÓN LINEAL SIMPLE?

Para ver si la regresión lineal simple se puede considerar como un modelo


razonable de la relación existente entre un par de variables, recurrimos al
diagrama de dispersión.

Supongamos que se dispone de un conjunto de pares de datos (xi , yi ),


i = 1, 2, ..., n, donde cada par significa que cuando la variable de entrada se
ha fijado igual a xi , el valor observado de la variable de respuesta ha sido
yi .

Graficamos estos puntos para ver si resulta razonable la hipótesis de que


existe una relación estadı́stica (sujeta a error aleatorio) lineal entre la
variable de respuesta y la variable de entrada.

ECONOMETRÍA I 20 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

EJEMPLO

Se puso a la venta un nuevo tipo de lavadora en 11 grandes comercios (todos ellos son
de aproximadamente igual tamaño y están situados en barrios de caracterı́sticas
socioeconómicas similares). El productor ha variado el precio de venta en cada uno.
Para cada comercio se dispone del precio de venta y el número de unidades que se
vendieron el mes pasado.
Precio Unidades
(en US$) vendidas
280 44
290 41
300 34
310 38
320 33
330 30
340 32
350 26
360 28
370 23
380 20

ECONOMETRÍA I 21 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

EJEMPLO

Se puso a la venta un nuevo tipo de lavadora en 11 grandes comercios (todos ellos son
de aproximadamente igual tamaño y están situados en barrios de caracterı́sticas
socioeconómicas similares). El productor ha variado el precio de venta en cada uno.
Para cada comercio se dispone del precio de venta y el número de unidades que se
vendieron el mes pasado.
Precio Unidades
(en US$) vendidas DIAGRAMA DE DISPERSIÓN
280 44
290 41
300 34
310 38
320 33
330 30
340 32
350 26
360 28
370 23
380 20

ECONOMETRÍA I 21 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

EJEMPLO

Se puso a la venta un nuevo tipo de lavadora en 11 grandes comercios (todos ellos son
de aproximadamente igual tamaño y están situados en barrios de caracterı́sticas
socioeconómicas similares). El productor ha variado el precio de venta en cada uno.
Para cada comercio se dispone del precio de venta y el número de unidades que se
vendieron el mes pasado.
Precio Unidades
(en US$) vendidas DIAGRAMA DE DISPERSIÓN
280 44
290 41
300 34
310 38
320 33
330 30
340 32
350 26
360 28
370 23
380 20

El diagrama indica que, sujeto a errores aleatorios, la hipótesis de que existe una
relación lineal entre el número de unidades vendidas y el precio resulta razonable. Esto
es, el modelo de regresión lineal simple parece ser apropiado.
ECONOMETRÍA I 21 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

E STIMACI ÓN DE LOS PAR ÁMETROS

Se quieren utilizar las respuestas observadas, yi correspondientes a los


valores de entrada xi , i = 1, 2, ..., n para estimar los parámetros β0 y β1 del
modelo de regresión lineal simple yi = β0 + β1 xi + ui .

ECONOMETRÍA I 22 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

E STIMACI ÓN DE LOS PAR ÁMETROS

Se quieren utilizar las respuestas observadas, yi correspondientes a los


valores de entrada xi , i = 1, 2, ..., n para estimar los parámetros β0 y β1 del
modelo de regresión lineal simple yi = β0 + β1 xi + ui .

Para determinar las estimaciones de β0 y β1 , se puede razonar como sigue:


si βˆ0 y βˆ1 fueran los valores estimados respectivos de β0 y β1 , el valor
estimado de la respuesta correspondiente a la entrada xi serı́a βˆ0 + βˆ1 xi .

ECONOMETRÍA I 22 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

E STIMACI ÓN DE LOS PAR ÁMETROS

Se quieren utilizar las respuestas observadas, yi correspondientes a los


valores de entrada xi , i = 1, 2, ..., n para estimar los parámetros β0 y β1 del
modelo de regresión lineal simple yi = β0 + β1 xi + ui .

Para determinar las estimaciones de β0 y β1 , se puede razonar como sigue:


si βˆ0 y βˆ1 fueran los valores estimados respectivos de β0 y β1 , el valor
estimado de la respuesta correspondiente a la entrada xi serı́a βˆ0 + βˆ1 xi .

Puesto que la respuesta observada fue yi , su diferencia con su valor


estimado viene dada por: ûi = yi − (βˆ0 + βˆ1 xi ).
En otras palabras, ûi = yi − yˆi .
Recordar que: yˆi = E [yˆ|xi ]

ECONOMETRÍA I 22 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

E STIMACI ÓN DE LOS PAR ÁMETROS

Se quieren utilizar las respuestas observadas, yi correspondientes a los


valores de entrada xi , i = 1, 2, ..., n para estimar los parámetros β0 y β1 del
modelo de regresión lineal simple yi = β0 + β1 xi + ui .

Para determinar las estimaciones de β0 y β1 , se puede razonar como sigue:


si βˆ0 y βˆ1 fueran los valores estimados respectivos de β0 y β1 , el valor
estimado de la respuesta correspondiente a la entrada xi serı́a βˆ0 + βˆ1 xi .

Puesto que la respuesta observada fue yi , su diferencia con su valor


estimado viene dada por: ûi = yi − (βˆ0 + βˆ1 xi ).
En otras palabras, ûi = yi − yˆi .
Recordar que: yˆi = E [yˆ|xi ]

Es decir, ûi representa el error que se deriva de usar los valores estimados
de los parámetros de la recta de regresión para predecir la respuesta al
valor de entrada xi .

ECONOMETRÍA I 22 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

E STIMACI ÓN DE LOS PAR ÁMETROS

Se quieren utilizar las respuestas observadas, yi correspondientes a los


valores de entrada xi , i = 1, 2, ..., n para estimar los parámetros β0 y β1 del
modelo de regresión lineal simple yi = β0 + β1 xi + ui .

Para determinar las estimaciones de β0 y β1 , se puede razonar como sigue:


si βˆ0 y βˆ1 fueran los valores estimados respectivos de β0 y β1 , el valor
estimado de la respuesta correspondiente a la entrada xi serı́a βˆ0 + βˆ1 xi .

Puesto que la respuesta observada fue yi , su diferencia con su valor


estimado viene dada por: ûi = yi − (βˆ0 + βˆ1 xi ).
En otras palabras, ûi = yi − yˆi .
Recordar que: yˆi = E [yˆ|xi ]

Es decir, ûi representa el error que se deriva de usar los valores estimados
de los parámetros de la recta de regresión para predecir la respuesta al
valor de entrada xi .

Resulta razonable entonces elegir como valores estimados de β0 y β1


aquellos valores βˆ0 y βˆ1 que hagan que estos residuos sean pequeños.
ECONOMETRÍA I 22 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

R ESIDUOS . R EPRESENTACI ÓN GR ÁFICA

ECONOMETRÍA I 23 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

M ÉTODO DE LOS M ÍNIMOS CUADRADOS ORDINARIOS

Para los pares de datos (xi , yi ), i = 1, 2, ..., n, los valores estimados por mı́nimos
cuadrados para β0 y β1 son los valores βˆ0 y βˆ1 , respectivamente, que minimizan
la suma de los residuos al cuadrado:

h i2
∑ni=1 (yi − (βˆ0 + βˆ1 xi )

¿Porqué se minimiza la suma de los cuadrados y no la suma de los residuos?

ECONOMETRÍA I 24 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

M ÉTODO DE LOS M ÍNIMOS CUADRADOS ORDINARIOS

Para los pares de datos (xi , yi ), i = 1, 2, ..., n, los valores estimados por mı́nimos
cuadrados para β0 y β1 son los valores βˆ0 y βˆ1 , respectivamente, que minimizan
la suma de los residuos al cuadrado:

h i2
∑ni=1 (yi − (βˆ0 + βˆ1 xi )

¿Porqué se minimiza la suma de los cuadrados y no la suma de los residuos?

La suma de los residuos puede ser pequeña incluso aunque los residuos
individuales sean grandes ya que los residuos grandes positivos se podrı́an
compensar con los residuos grandes negativos (más aún, el procedimiento
propuesto conduce a que la suma de los residuos sea nula). Sin embargo, esto
no ocurre con la suma de los cuadrados de los residuos puesto que ninguno de
los sumandos puede ser negativo.

ECONOMETRÍA I 24 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

i=n i=n  2
SCR = ∑ û2i = ∑ yi − βˆ0 − βˆ1 xi
i=1 i=1

n 
∂ SCR 
= ∑ 2 yi − βˆ0 − βˆ1 xi (−1) = 0
∂ βˆ0 i=1 | {z }| {z }
∂ ûi
ûi ∂ βˆ0

n 
∂ SCR 
= ∑ 2 yi − βˆ0 − βˆ1 xi (−xi ) = 0
∂ βˆ1 i=1 | {z }| {z }
∂ ûi
ûi ∂ βˆ1

ECONOMETRÍA I 25 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

E CUACIONES NORMALES

n n
∑ yi = n βˆ0 + βˆ1 ∑ xi
i=1 i=1

n n n
∑ yi xi = βˆ0 ∑ xi + βˆ1 ∑ xi2
i=1 i=1 i=1

dividiendo la primera ecuación entre n se obtiene: y = βˆ0 + βˆ1 x

dividiendo la segunda ecuación entre n y restando yx y reescribiendo


y = βˆ0 + βˆ1 x se obtiene:

!
∑ni=1 yi xi ∑ni=1 xi2
− y x = βˆ0 x − βˆ0 x + βˆ1 − x2
n n

∑ni=1 yi xi
−y x ∑ni=1 yi xi − n y x
despejando se obtiene: βˆ1 = n
=
∑ni=1 xi2 ∑ni=1 xi2 − n x2
n − x2
ECONOMETRÍA I 26 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

ESTIMACI ÓN DE LOS PAR ÁMETROS POR MCO

∑ni=1 (xi −x̄)(yi −ȳ) Sxy


βˆ0 = ȳ − βˆ1 x̄ y βˆ1 = ∑ni (xi −x̄)2
= Sxx

donde
∑ni xi ∑ni yi
x̄ = n ; ȳ = n ; Sxy = ∑ni=1 (xi − x̄)(yi − ȳ) ; Sxx = ∑ni=1 (xi − x̄)2

RECTA DE REGRESI ÓN ESTIMADA


La recta ŷ = βˆ0 + βˆ1 x se denomina recta de regresión estimada.
βˆ1 es la pendiente y βˆ0 es la constante o término independiente de la recta.

ECONOMETRÍA I 27 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

EJEMPLO

Retomamos el ejemplo de las nuevas lavadoras que se ofrecen a distintos


precios en 11 grandes comercios.

Denotemos y = número de lavadoras vendidas en un comercio y x = precio al


que se ofrece una lavadora en un comercio.

ECONOMETRÍA I 28 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

EJEMPLO

Retomamos el ejemplo de las nuevas lavadoras que se ofrecen a distintos


precios en 11 grandes comercios.

Denotemos y = número de lavadoras vendidas en un comercio y x = precio al


que se ofrece una lavadora en un comercio.

Nos planteamos el modelo: yi = β0 + β1 xi + ui i = 1, 2, ..., n.

ECONOMETRÍA I 28 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

EJEMPLO

Retomamos el ejemplo de las nuevas lavadoras que se ofrecen a distintos


precios en 11 grandes comercios.

Denotemos y = número de lavadoras vendidas en un comercio y x = precio al


que se ofrece una lavadora en un comercio.

Nos planteamos el modelo: yi = β0 + β1 xi + ui i = 1, 2, ..., n.

Para el conjunto de datos presentado en la página 10 tenemos:


ȳ = 31, 73, x̄ = 330, Sxy = −2350, Sxx = 11000, Syy = 546, 1818.

ECONOMETRÍA I 28 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

EJEMPLO

Retomamos el ejemplo de las nuevas lavadoras que se ofrecen a distintos


precios en 11 grandes comercios.

Denotemos y = número de lavadoras vendidas en un comercio y x = precio al


que se ofrece una lavadora en un comercio.

Nos planteamos el modelo: yi = β0 + β1 xi + ui i = 1, 2, ..., n.

Para el conjunto de datos presentado en la página 10 tenemos:


ȳ = 31, 73, x̄ = 330, Sxy = −2350, Sxx = 11000, Syy = 546, 1818.

Entonces, las estimaciones por mı́nimos cuadrados de β0 y β : 1 resultan:


Sxy
βˆ1 = Sxx = −0, 2136 y βˆ0 = ȳ − βˆ1 x̄ = 102, 2273.

ECONOMETRÍA I 28 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

EJEMPLO

Retomamos el ejemplo de las nuevas lavadoras que se ofrecen a distintos


precios en 11 grandes comercios.

Denotemos y = número de lavadoras vendidas en un comercio y x = precio al


que se ofrece una lavadora en un comercio.

Nos planteamos el modelo: yi = β0 + β1 xi + ui i = 1, 2, ..., n.

Para el conjunto de datos presentado en la página 10 tenemos:


ȳ = 31, 73, x̄ = 330, Sxy = −2350, Sxx = 11000, Syy = 546, 1818.

Entonces, las estimaciones por mı́nimos cuadrados de β0 y β : 1 resultan:


Sxy
βˆ1 = Sxx = −0, 2136 y βˆ0 = ȳ − βˆ1 x̄ = 102, 2273.

Ası́, la recta de regresión estimada es: ŷ = 102, 2273 − 0, 2136x.

ECONOMETRÍA I 28 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

DIAGRAMA DE DISPERSIÓN Y RECTA DE REGRESIÓN ESTIMADA PARA


EL EJEMPLO DE LAS LAVADORAS

ECONOMETRÍA I 29 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

E JEMPLO SUELDO CEO


Denotemos y = sueldo anual de los directores generales en miles de USD
Sea x = promedio, en los últimos 3 años, del rendimiento sobre el capital en las
empresas de los CEO.
Nos planteamos el modelo: yi = β0 + β1 xi + ui i = 1, 2, ..., n.
¿Qué signo esperarı́amos que tuviera el parámetro β1 ?
La recta de regresión estimada resulta: ŷ = 963,191 + 18,501x.
¿Cómo se interpretan los resultados obtenidos?

E JEMPLO SALARIO Y EDUCACI ÓN


Denotemos y = salario en dólares por hora
Sea x = años de educación.
Nos planteamos el modelo: yi = β0 + β1 xi + ui i = 1, 2, ..., n.
¿Qué signo esperarı́amos que tuviera el parámetro β1 ?
La recta de regresión estimada resulta: ŷ = −0,90 + 0,54x.
¿Cómo se interpretan los resultados obtenidos?

ECONOMETRÍA I 30 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

B ONDAD DE AJUSTE

Se considera la suma de cuadrados totales SCT = ∑ni=1 (yi − ȳ)2 como una
medida de la variabilidad del conjunto de respuestas y1 , ..., yn con respecto
a su media muestral.

ECONOMETRÍA I 31 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

B ONDAD DE AJUSTE

Se considera la suma de cuadrados totales SCT = ∑ni=1 (yi − ȳ)2 como una
medida de la variabilidad del conjunto de respuestas y1 , ..., yn con respecto
a su media muestral.
Sabemos que el estimador de la respuesta yi para cada valor de entrada xi
es yˆi = βˆ0 + βˆ1 xi .

ECONOMETRÍA I 31 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

B ONDAD DE AJUSTE

Se considera la suma de cuadrados totales SCT = ∑ni=1 (yi − ȳ)2 como una
medida de la variabilidad del conjunto de respuestas y1 , ..., yn con respecto
a su media muestral.
Sabemos que el estimador de la respuesta yi para cada valor de entrada xi
es yˆi = βˆ0 + βˆ1 xi .

Ası́, se define la suma de cuadrados de los residuos SCR = ∑ni=1 (yi − yˆi )2
mide la variabilidad residual de la variable de respuesta luego de haber
tenido en cuenta su estimación según el modelo propuesto. Es decir SCR
mide aquellas variaciones que no recoge el modelo.

ECONOMETRÍA I 31 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

B ONDAD DE AJUSTE

Se considera la suma de cuadrados totales SCT = ∑ni=1 (yi − ȳ)2 como una
medida de la variabilidad del conjunto de respuestas y1 , ..., yn con respecto
a su media muestral.
Sabemos que el estimador de la respuesta yi para cada valor de entrada xi
es yˆi = βˆ0 + βˆ1 xi .

Ası́, se define la suma de cuadrados de los residuos SCR = ∑ni=1 (yi − yˆi )2
mide la variabilidad residual de la variable de respuesta luego de haber
tenido en cuenta su estimación según el modelo propuesto. Es decir SCR
mide aquellas variaciones que no recoge el modelo.

Finalmente la variabilidad en las respuestas que viene explicada por el


modelo y se denomina suma de cuadrados explicada SCE = ∑ni=1 (yˆi − ȳ)2

ECONOMETRÍA I 31 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

PARTICI ÓN DE LA VARIACI ÓN TOTAL EN DOS COMPONENTES

SCT = SCE + SCR

n n n
∑ (yi − ȳ)2 = ∑ (ŷi − ȳ)2 + ∑ û2i
i=1 i=1 i=1
| {z } | {z } | {z }
SCT SCE SCR

Dem: ∑ni=1 (yi − ȳ)2 = ∑ni=1 (yi − yˆi ) + (yˆi − ȳ))2

= ∑ni=1 (ûi + yˆi − ȳ)2

= ∑ni=1 ûi 2 + ∑ni=1 (yˆi − ȳ)2 + 2 ∑ni=1 ûi (yˆi − ȳ)

= SCR + SCE

obs: ∑ni=1 ûi (yˆi − ȳ) = 0 pues es el numerador de la covarianza entre los residuos
y los valores ajustados de la variable dependiente.

ECONOMETRÍA I 32 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

PARTICI ÓN DE LA VARIACI ÓN TOTAL EN DOS COMPONENTES

ECONOMETRÍA I 33 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

N OTACI ÓN

No existe acuerdo general para el nombre ni para las siglas de las tres
cantidades anteriores y esto provoca grandes confusiones:

A lo que en el curso llamaremos suma de cuadrados totales (SCT),


Wooldridge le llama suma total de cuadrados (STC).

A lo que en el curso llamaremos suma de cuadrados explicada (SCE),


Wooldridge le llama suma explicada de cuadrados (SEC). También se le
denomina suma de cuadrados del modelo y en ocasiones suma de
cuadrados de la regresión. En inglés se le llama sums of squares in
regression (SSR). La confusión radica que en este caso el lugar de la letra
E se utiliza la letra R pudiendola confundir con el término residuos.

A lo que en el curso llamaremos suma de cuadrados de los Residuos


(SCR), Wooldridge le llama suma residual de cuadrados (SRC). Aunque
no es lo mismo, en ocasiones también se le denomina suma de cuadrados
de los errores que en inglés es sums of squares of errors (SSE).
Nuevamente quedan invertidas la letra E y R.

ECONOMETRÍA I 34 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

D EFINICI ÓN
En consecuencia, la expresión R2 definida por
SCT − SCR SCR SCE
R2 = = 1− = recibe el nombre de coeficiente de
SCT SCT SCT
determinación.

I NTERPRETACI ÓN
Representa la proporción de variabilidad en las respuestas que es explicada
por el modelo propuesto.
El coeficiente de determinación R2 toma valores entre 0 y 1.
Un valor de R2 próximo a 1 indica que la mayor parte de la variabilidad de
la variable de respuesta está explicada por el modelo.
Un valor de R2 próximo a 0 indica que es muy poca la variabilidad de la
variable de respuesta que es explicada por el modelo.

ECONOMETRÍA I 35 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

RESULTADO
Recordemos que el coeficiente de correlación muestral para el conjunto de pares
de datos (xi , yi ), i = 1, ..., n, está dado por
∑ni=1 (xi −x̄)(yi −ȳ) S
r= √ = √ xy
∑ni=1 (xi −x̄)2 ∑ni=1 (yi −ȳ)2 Sxx Syy

ECONOMETRÍA I 36 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

RESULTADO
Recordemos que el coeficiente de correlación muestral para el conjunto de pares
de datos (xi , yi ), i = 1, ..., n, está dado por
∑ni=1 (xi −x̄)(yi −ȳ) S
r= √ = √ xy
∑ni=1 (xi −x̄)2 ∑ni=1 (yi −ȳ)2 Sxx Syy

En el contexto del modelo de regresión lineal simple y = β0 + β1 x + u, puede


demostrarse que

|r| = R2
y el signo del coeficiente de correlación muestral coincidirá con el de βˆ1 .

ECONOMETRÍA I 36 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

EJEMPLO
Retomamos el ejemplo de las nuevas lavadoras que se ofrecen a distintos precios
en 11 grandes comercios en el que definimos y = número de lavadoras vendidas
en un comercio y x = precio al que se ofrece una lavadora en un comercio.
Nos planteamos el modelo: yi = β0 + β1 xi + ui i = 1, 2, ..., n.

¿Qué proporción de la variabilidad total de las observaciones de la variable


de respusta es explicada por el modelo?

ECONOMETRÍA I 37 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

EJEMPLO
Retomamos el ejemplo de las nuevas lavadoras que se ofrecen a distintos precios
en 11 grandes comercios en el que definimos y = número de lavadoras vendidas
en un comercio y x = precio al que se ofrece una lavadora en un comercio.
Nos planteamos el modelo: yi = β0 + β1 xi + ui i = 1, 2, ..., n.

¿Qué proporción de la variabilidad total de las observaciones de la variable


de respusta es explicada por el modelo?

Para responder calculamos el coeficiente de determinación.

ECONOMETRÍA I 37 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

EJEMPLO
Retomamos el ejemplo de las nuevas lavadoras que se ofrecen a distintos precios
en 11 grandes comercios en el que definimos y = número de lavadoras vendidas
en un comercio y x = precio al que se ofrece una lavadora en un comercio.
Nos planteamos el modelo: yi = β0 + β1 xi + ui i = 1, 2, ..., n.

¿Qué proporción de la variabilidad total de las observaciones de la variable


de respusta es explicada por el modelo?

Para responder calculamos el coeficiente de determinación.

En este ejemplo tenemos: SRC = 44, 14 y SCT = 546, 18. Por tanto,
SCR 44,14
R2 = 1 − SCT = 1 − 546,18 = 0, 92.

ECONOMETRÍA I 37 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

EJEMPLO
Retomamos el ejemplo de las nuevas lavadoras que se ofrecen a distintos precios
en 11 grandes comercios en el que definimos y = número de lavadoras vendidas
en un comercio y x = precio al que se ofrece una lavadora en un comercio.
Nos planteamos el modelo: yi = β0 + β1 xi + ui i = 1, 2, ..., n.

¿Qué proporción de la variabilidad total de las observaciones de la variable


de respusta es explicada por el modelo?

Para responder calculamos el coeficiente de determinación.

En este ejemplo tenemos: SRC = 44, 14 y SCT = 546, 18. Por tanto,
SCR 44,14
R2 = 1 − SCT = 1 − 546,18 = 0, 92.

Ası́, el modelo propuesto explica el 92 % de la variabilidad en el número de


lavadoras vendidas en los 11 comercios.

ECONOMETRÍA I 37 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

EJEMPLO
Retomamos el ejemplo de las nuevas lavadoras que se ofrecen a distintos precios
en 11 grandes comercios en el que definimos y = número de lavadoras vendidas
en un comercio y x = precio al que se ofrece una lavadora en un comercio.
Nos planteamos el modelo: yi = β0 + β1 xi + ui i = 1, 2, ..., n.

¿Qué proporción de la variabilidad total de las observaciones de la variable


de respusta es explicada por el modelo?

Para responder calculamos el coeficiente de determinación.

En este ejemplo tenemos: SRC = 44, 14 y SCT = 546, 18. Por tanto,
SCR 44,14
R2 = 1 − SCT = 1 − 546,18 = 0, 92.

Ası́, el modelo propuesto explica el 92 % de la variabilidad en el número de


lavadoras vendidas en los 11 comercios.

Además, r = −0, 96 = sig(βˆ1 ) 0, 92.

ECONOMETRÍA I 37 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

C ARACTER ÍSTICAS DE βˆ0 Y βˆ1

1 Los estimadores MCO se expresan únicamente en términos de las


cantidades observables (notar que son funciones de x y de y).
2 Son estimadores puntuales. Dada la muestra, cada estimador proporciona
un solo valor (puntual) del parámetro poblacional pertinente.
3 Una vez obtenidos los estimadores MCO con los datos de la muestra, se
obtiene la lı́nea de regresión muestral que cumple las siguientes
propiedades:

El promedio muestral de los residuos es cero:


∑ni=1 ûi = 0
La covarianza entre los regresores y los residuos por MCO es cero:
∑ni=1 xi ûi = 0.
El punto (x̄, ȳ) se encuentra siempre sobre la lı́nea de regresión muestral
estimada por MCO.

Estas propiedades son válidas por construcción, es decir, para cualquier muestra
de datos.Surgen directamente de las condiciones de primer orden del método
MCO.
ECONOMETRÍA I 38 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

P ROPIEDADES DE LOS ESTIMADORES βˆ0 Y βˆ1

Bajo ciertos supuestos, los estimadores mı́nimo cuadráticos de β0 y β1 son


insesgados y de mı́nima varianza en la clase de estimadores lineales en las
respuestas yi . Se dice entonces que son los mejores estimadores lineales
insesgados (MELI) de β0 y β1 .

S UPUESTOS M ODELO DE R EGRESI ÓN LINEAL S IMPLE


1 El modelo es lineal en los parámetros.
2 Muestreo aleatorio.
3 Variación muestral de la variable explicativa.
4 Media condicional cero.
5 Homoscedasticidad.
6 El número de observaciones n debe ser mayor que el número de
parámetros del modelo.

ECONOMETRÍA I 39 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

S UPUESTO 1
S IGNIFICADO DEL T ÉRMINO LINEAL
El término lineal puede ser interpretada de dos formas:
Linealidad en las variables
La esperanza condicional de y es una función lineal de la x.
Geométricamente la curva de regresión es una recta.
Linealidad en los parámetros
Es lineal en los parámetros (β ), puede ser o no lineal en la x. El supuesto
de linealidad refiere a este segundo caso.

A LGUNOS EJEMPLOS
1 E [y |xi ] = β0 + β1 xi
2 E [y |xi ] = β0 + β1 xi2
3 E [y |xi ] = β0 + β12 xi
4 E [y |xi ] = β0 + β1 log(xi )
β
5 E [y |xi ] = β0 xi
6 E [y |xi ] = exp( β0 + β1 xi )
ECONOMETRÍA I 40 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

S UPUESTO 2. M UESTREO ALEATORIO

Suponemos que tenemos un muestra aleatoria de tamaño n (n individuos) de


las variables y y x y que se puede ajustar con el siguiente modelo poblacional:
yi = β0 + β1 xi + ui i = 1, 2, ..., n

En muchos textos de econometrı́a los valores de x se consideran fijos en


muestras repetidas (regresora fija), sin embargo Wooldridge considera que la
variable x es muestreada junto con la variable dependiente y (regresora
estocástica). En este segundo caso es necesario suponer que la media
condicional de los errores es cero, para cualquier valor de la variable x
(supuesto 4).

En ocasiones este supuesto falla. Es usual tener datos faltantes (no respuesta).
Los datos pueden faltar por diferentes razones:

Razones totalmente aleatorias (independientes de y y de x):


Selección basada en x
Selección basada en la variable dependiente y

ECONOMETRÍA I 41 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

S UPUESTO 2. M UESTREO ALEATORIO

Mas adelante veremos que las primeras dos razones no generan problema, pero
la tercera puede conducir a sesgo: sesgo por selección muestral.

En econometrı́a tenemos un problema de sesgo de selección cuando hay un


mecanismo de selección que afecta la disponibilidad de datos y ese mecanismo
está relacionado con la variable dependiente, luego de controlar por los
regresores.

E JEMPLOS
Salarios de las mujeres sólo se observan para las que trabajan.
Estado de salud sólo se observa para los que fueron al médico.
Desempeño de las personas que se autoseleccionan para realizar una
prueba.

ECONOMETRÍA I 42 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

S UPUESTOS 3. VARIACI ÓN MUESTRAL DE x.

Implica que la varianza muestral de la variable regresora x no es igual a cero.


Esto es necesario para el cálculo, pues Sxx está en demonimador del cálculo de
la estimación de β1 .

Es muy raro que no se cumpla, la única forma serı́a que todos los individuos
tuvieran exactamente el mismo valor de la variable regresora.

ECONOMETRÍA I 43 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

S UPUESTOS 4. M EDIA CONDICIONAL CERO .

E [ui |xi ] = 0

ECONOMETRÍA I 44 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

S UPUESTOS 4. M EDIA CONDICIONAL CERO

El supuesto 3) dice que E [ui |xi ] = 0


Dado el valor de xi , el valor esperado de los errores es cero.
Este supuesto implica que E [yi |xi ] = β0 + β1 xi
Aplicando esperanza condicional tenemos que
E [yi |xi ] = E(E [y |xi ]) + E(ui |xi )
como E(E [y |xi ]) = E [y |xi ] resulta que:
E [yi |xi ] = β0 + β1 xi + 0
Recordar que si la media condicional de una variable aleatoria, dada otra
variable aleatoria, es cero, la covarianza entre las dos es cero y, por tanto, las
dos variables no están correlacionadas. Entonces este supuesto implica que xi y
ui no están correlacionadas.
Este supuesto implica que los factores no incluı́dos en el modelo no afectan
sistemáticamente a media de la variable dependiente y.

ECONOMETRÍA I 45 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

S UPUESTOS 5. H OMOSCEDASTICIDAD

Var(ui |xi ) = σ 2 ∀i = 1, 2, ..., n. Ası́, se asume que la varianza de los términos de


error permanece constante con independencia de los valores de entrada x. Esta
hipótesis equivale a asumir que, para cualquier valor de entrada x, la variable de
respuesta y es una variable aleatoria con varianza σ 2 .

Note que σ 2 no tiene el subı́ndice i, lo que significa que es constante para todo
valor de i.

Este supuesto se conoce con el nombre de homoscedasticidad. Implica que la


varianza del término de error es constante, no cambia con el valor de x.

Homo significa (igual) y cedasticidad (dispersión). La palabra proviene del


verbo griego skedanime, que significa dispersar o esparcir.

Var[ui |xi ] = E(ui |xi − E[ui |xi ])2 = E[u2i |xi ] − E 2 [ui |xi ]

por supuesto 3) el último término es cero, entonces Var[ui |xi ] = E[u2i |xi ] = σ 2

Este supuesto implica que las varianzas condicionales de yi |xi también son
homoscedásticas.
ECONOMETRÍA I 46 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

S UPUESTOS 5. H OMOSCEDASTICIDAD

En la primera figura la varianza de los errores es constante (homoscedasticidad)


y en la segunda no (heteroscedasticidad).

ECONOMETRÍA I 47 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

PROPIEDADES DE LOS ESTIMADORES MCO

El teorema de Gauss-Markov, dice que, si se cumplen los supuestos clásicos


vistos anteriormente, los estimadores MCO de β0 y β1 son MELI. Mejores
estimadores lineales insesgados.

Lineales pues son funciones lineales de de la variable aleatoria y.


Insesgados porque el valor esperado de los estimadores coincide con el
valor del parámetro poblacional.
Son eficientes, es decir, dentro de todos los posibles estimadores
insesgados son los que tienen varianza menor.
σ2
Var(βˆ2 ) =
∑ni=1 Xi2

∑ni=1 Xi2
Var(βˆ1 ) = n∗∑ni=1 Xi2
∗σ2

ECONOMETRÍA I 48 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

ESTIMACI ÓN DE σ 2
El valor de σ 2 es desconocido y se deberá estimar a partir de los datos.
Por tanto, debemos obtener un estimador puntual para este parámetro.

ECONOMETRÍA I 49 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

ESTIMACI ÓN DE σ 2
El valor de σ 2 es desconocido y se deberá estimar a partir de los datos.
Por tanto, debemos obtener un estimador puntual para este parámetro.
 
Para deducirlo definimos las variables aleatorias yi − βˆ0 + βˆ1 xi
∀i = 1, 2....n que se denominan residuos.

ECONOMETRÍA I 49 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

ESTIMACI ÓN DE σ 2
El valor de σ 2 es desconocido y se deberá estimar a partir de los datos.
Por tanto, debemos obtener un estimador puntual para este parámetro.
 
Para deducirlo definimos las variables aleatorias yi − βˆ0 + βˆ1 xi
∀i = 1, 2....n que se denominan residuos.
Ası́, los residuos representan las diferencias entre la variable de respuesta y
su estimador a través del modelo que estamos postulando.

ECONOMETRÍA I 49 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

ESTIMACI ÓN DE σ 2
El valor de σ 2 es desconocido y se deberá estimar a partir de los datos.
Por tanto, debemos obtener un estimador puntual para este parámetro.
 
Para deducirlo definimos las variables aleatorias yi − βˆ0 + βˆ1 xi
∀i = 1, 2....n que se denominan residuos.
Ası́, los residuos representan las diferencias entre la variable de respuesta y
su estimador a través del modelo que estamos postulando.
La suma de los cuadrados de los residuos se denota como SCR, es decir
h  i2
SCR = ∑n yi − βˆ0 + βˆ1 xi i=1

ECONOMETRÍA I 49 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

ESTIMACI ÓN DE σ 2
El valor de σ 2 es desconocido y se deberá estimar a partir de los datos.
Por tanto, debemos obtener un estimador puntual para este parámetro.
 
Para deducirlo definimos las variables aleatorias yi − βˆ0 + βˆ1 xi
∀i = 1, 2....n que se denominan residuos.
Ası́, los residuos representan las diferencias entre la variable de respuesta y
su estimador a través del modelo que estamos postulando.
La suma de los cuadrados de los residuos se denota como SCR, es decir
h  i2
SCR = ∑n yi − βˆ0 + βˆ1 xi i=1

Un estimador insesgado de σ2 es:


SCR
σ̂ 2 = n−2

ECONOMETRÍA I 49 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

EJEMPLO

Retomamos el ejemplo de las nuevas lavadoras que se ofrecen a distintos precios


en 11 grandes comercios en el que definimos Y = número de lavadoras vendidas
en un comercio y x = precio al que se ofrece una lavadora en un comercio.

ECONOMETRÍA I 50 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

EJEMPLO

Retomamos el ejemplo de las nuevas lavadoras que se ofrecen a distintos precios


en 11 grandes comercios en el que definimos Y = número de lavadoras vendidas
en un comercio y x = precio al que se ofrece una lavadora en un comercio.

Nos planteamos el modelo: yi = β0 + β1 xi + ui i = 1, 2, ..., n.

ECONOMETRÍA I 50 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

EJEMPLO

Retomamos el ejemplo de las nuevas lavadoras que se ofrecen a distintos precios


en 11 grandes comercios en el que definimos Y = número de lavadoras vendidas
en un comercio y x = precio al que se ofrece una lavadora en un comercio.

Nos planteamos el modelo: yi = β0 + β1 xi + ui i = 1, 2, ..., n.

Las estimaciones por mı́nimos cuadrados de β0 y β1 resultaron:


βˆ0 = 102, 2273 y βˆ1 = −0, 2136.

ECONOMETRÍA I 50 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

EJEMPLO

Retomamos el ejemplo de las nuevas lavadoras que se ofrecen a distintos precios


en 11 grandes comercios en el que definimos Y = número de lavadoras vendidas
en un comercio y x = precio al que se ofrece una lavadora en un comercio.

Nos planteamos el modelo: yi = β0 + β1 xi + ui i = 1, 2, ..., n.

Las estimaciones por mı́nimos cuadrados de β0 y β1 resultaron:


βˆ0 = 102, 2273 y βˆ1 = −0, 2136.

Estamos entonces en condiciones de obtener estimaciones de los residuos y


de SCR.
Por ejemplo, para la primer observación el residuo estimado es:
44 − (102, 2273 − 0, 2136 × 280) = 1, 591.
Si calculamos las estimaciones de los 11 residuos y hacemos la suma de
sus cuadrados se obtiene SCR = 44, 14.

ECONOMETRÍA I 50 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

EJEMPLO

Retomamos el ejemplo de las nuevas lavadoras que se ofrecen a distintos precios


en 11 grandes comercios en el que definimos Y = número de lavadoras vendidas
en un comercio y x = precio al que se ofrece una lavadora en un comercio.

Nos planteamos el modelo: yi = β0 + β1 xi + ui i = 1, 2, ..., n.

Las estimaciones por mı́nimos cuadrados de β0 y β1 resultaron:


βˆ0 = 102, 2273 y βˆ1 = −0, 2136.

Estamos entonces en condiciones de obtener estimaciones de los residuos y


de SCR.
Por ejemplo, para la primer observación el residuo estimado es:
44 − (102, 2273 − 0, 2136 × 280) = 1, 591.
Si calculamos las estimaciones de los 11 residuos y hacemos la suma de
sus cuadrados se obtiene SCR = 44, 14.
44,14
Ası́, el valor estimado para σ 2 es 11−2 = 4, 9

ECONOMETRÍA I 50 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

MODELO DE REGRESI ÓN LINEAL SIMPLE EN FORMA MATRICIAL

El modelo de regresión simple lo podemos escribir en forma matricial de la


siguiente manera:

y = X β + u
(n × 1) (n × k) (k × 1) (n × 1)

En elcaso 
del modelolineal simple,
 k=2, se tiene que:  
y1 1 x1 u1
 y2   1 x2     u2 
β0
y= .  X= . β= u=
     
. ..
 ..   .. .. 
 
β1  . 
yn 1 xn un

ECONOMETRÍA I 51 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

I NTERPRETACI ÓN GEOM ÉTRICA DE LOS ESTIMADORES MCO

ECONOMETRÍA I 52 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

R EGRESI ÓN A TRAV ÉS DEL ORIGEN

Considere el modelo lineal simple sin término independiente,


yi | X=xi = β xi + ui ; ∀i = 1, 2, ...n

En términos matriciales es de la forma:

Y = X β + u
(n × 1) (n × k) (k × 1) (n × 1)

Estamos
 trabajando
 con
 modelos
 lineales simples,
entonces
 k=1 y se tiene que:
y1 x1 u1
 y2   x2   u2 
Y= .  X= β = (β ) u= . 
     
.. 
 ..   .   .
. 
yn xn un

ECONOMETRÍA I 53 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

R EGRESI ÓN A TRAV ÉS DEL ORIGEN

X 0 X = ∑ni=1 xi2 (X 0 X)−1 = 1


(X 0Y ) = ∑ni=1 xi yi
∑ni=1 xi2

∑ni=1 xi yi
β̂ = (X 0 X)−1 (X 0Y ) = ;
∑ni=1 xi2
 
La expresión ∑ni=1 yi − xi β̂ = 0 ya no forma parte de las ecuaciones normales
del modelo y no se puede garantizar que la suma de los residuos de cero.

ECONOMETRÍA I 54 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

C AMBIO EN LAS UNIDADES DE MEDIDA DE LAS VARIABLES

Los coeficientes MCO cambian de forma totalmente predecible cuando


cambiamos las unidades de medida.

Caso 1: si la variable dependiente y se mutiplica por una constante positiva c,


y los valores de la variable independiente x se mantienen, entonces los
coeficientes MCO del nuevo modelo ajustado también se multiplicarán por c.

Ejemplo Wooldridge ecuación de salarios expresada en dólares o en miles de


dólares.

Caso 2: si la variable independiente x se mutiplica por una constante positiva c,


y los valores de la variable dependiente y se mantienen, entonces el coeficientes
MCO del nuevo modelo ajustado también se multiplicarán por c, pero se
mantiene la misma estimación MCO del modelo original para el término
independiente.

¿Qué sucederá con el coeficiente de determinación en ambos casos?

ECONOMETRÍA I 55 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

F ORMA FUNCIONAL

Las relaciones lineales no son suficientes para describir las relaciones


económicas:

1 Modelo lineal: implica asumir que el incremento de y ante un cambio en


una unidad en la variable x es siempre igual, independientemente del valor
de x.
2 Elasticidad constante (modelos log-log): la relación entre x y y es en
términos relativos.
β
El modelo original es no lineal de la forma: yi = β0 xi 1 eui
Haciendo la transformación logaritmica obtenemos un modelo lineal:

ln(yi ) = ln(β0 ) + β1 ln(xi ) + ln(ui )

β1 es la elasticidad de y sobre x.
cuando x aumenta un 1 %, y aumenta un β1 %.
Ej: elasticidad de la demanda con respecto al precio.

ECONOMETRÍA I 56 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

F ORMA FUNCIONAL

Modelos semilogarı́tmicos (nivel-log y log-nivel)

1 Los modelos nivel-log tienen en su valor original o nivel a la dependiente


y y en logaritmo a los regresores.

yi = β0 + β1 ln(xi ) + ui

β1 es el cambio en y con respecto al cambio relativo en ln(x).


Puede interpretarse como el cambio en el nivel de y con respecto a un
cambio de un 1 % en x.
2 Los modelos log-nivel son logaritmicos en la variable dependiente y en su
nivel a los regresores.

ln(yi ) = β0 + β1 (xi ) + ui

β1 es el cambio en el ln (y) con respecto al cambio unitario en x.


Puede interpretarse como el cambio relativo en y con respecto a un cambio
unitario en x, cuando x aumenta 1 unidad, y aumenta en β1 ∗ 100 %

ECONOMETRÍA I 57 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

F ORMA FUNCIONAL

ECONOMETRÍA I 58 / 59
Introducción Modelo de regresión lineal simple Estimación de los parámetros Método MCO Bondad de ajuste Propiedades de los estimadores Supue

OTROS M ÉTODOS PARA ENCONTRAR LOS ESTIMADORES DE β0 Y β1

Método de los momentos


Método de máximaverosimilutud

ECONOMETRÍA I 59 / 59

También podría gustarte