Está en la página 1de 70

El Modelo de Regresin Simple

Carlos Velasco1
1 Departamento de Economa

Universidad Carlos III de Madrid

Econometra I
Mster en Economa Industrial
Universidad Carlos III de Madrid
Curso 2007/08

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 1 / 70


Resumen

1 Definicin del Modelo de Regresin Simple

2 Derivacin de las estimaciones por Mnimos Cuadrados Ordinarios

3 Funcionamiento del mtodo MCO

4 Unidades de medida y forma funcional

5 Valores esperados y varianzas de los estimadores MCO

6 Regresin por el origen

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 2 / 70


El Modelo de Regresin Simple

Objetivos
1 Propiedades del modelo de regresin simple.
2 Estimacin MCO y propiedades.
3 Estimadores MCO.

Bibliografa
Wooldridge (2006). Captulo 2.
Goldberger (2001). Captulos 2-7.
Greene (1999). Captulos 3, 4.2-4.3.

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 3 / 70


1. Definicin del Modelo de Regresin Simple

1 Definicin del Modelo de Regresin Simple

2 Derivacin de las estimaciones por Mnimos Cuadrados Ordinarios

3 Funcionamiento del mtodo MCO

4 Unidades de medida y forma funcional

5 Valores esperados y varianzas de los estimadores MCO

6 Regresin por el origen

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 4 / 70


Definicin del Modelo de Regresin Simple

Objetivo: Modelo Economtrico para explicar cmo x explica y


Problemas bsicos:
Como la relacin entre x e y no es perfecta, cmo se permite
que otros factores afecten a y ?
Cul es la relacin funcional entre x e y ?
Cmo asegurarnos que est captando una relacin ceteris
paribus?

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 5 / 70


Modelo de Regresin lineal simple
Definicin y elementos

Solucin sencilla a los problemas anteriores:

y = 0 + 1 x + u.

El supuesto es que se cumple en la poblacin de inters.

Elementos del modelo:


Variables y trmino de error.
Relacin funcional.
Parmetros.

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 6 / 70


Modelo de Regresin lineal simple
Variables

y x
Variable dependiente Variable independiente
Variable explicada Variable explicativa
Variable de respuesta Variable de control
Variable predicha Variable predictor
Regresando Regresor [covariable]

u : trmino de error o perturbacin: factores distintos a x que afectan a


y (y que no observamos).

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 7 / 70


Modelo de Regresin lineal simple
Relacin funcional: Modelo lineal

Si los dems factores contenidos en u se mantienen fijos, u = 0,


entonces x tiene un efecto lineal sobre y

y = 1 x si u = 0.

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 8 / 70


Modelo de Regresin lineal simple
Parmetros

1 : parmetro de pendiente en la relacin entre x e y : es el cambio


en y cuando se multiplica por el cambio en x. Es el parmetro clave
en aplicaciones.

0 : trmino constante (valor de y cuando x y u son cero). Menos


interesante.

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 9 / 70


Modelo de Regresin lineal simple
Ejemplo: produccin de soja y fertilizante

yield = 0 + 1 fertilizer + u
u : calidad de la tierra, lluvia, etc.

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 10 / 70


Modelo de Regresin lineal simple
Ejemplo: ecuacin para el salario

wage = 0 + 1 educ + u
u : experiencia en el trabajo, habilidad innata, antigedad en el empleo
actual, etc.

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 11 / 70


Modelo de Regresin lineal simple
Linealidad

Un cambio de una unidad en x tiene siempre el mismo efecto sobre y ,


independientemente del valor inicial de x.

x = 1 = y = 1 , x, u = 0.

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 12 / 70


Anlisis ceteris paribus?

1 : efecto de x sobre y , con todos los dems factores (en u) fijos.


Pero en qu sentido podemos mantener los otros factores para llegar
a tales conclusiones?

Slo se pueden obtener estimaciones fiables de los parmetros 0 y


1 a partir del muestreo aleatorio cuando establecemos supuestos
que restringen el modelo en que el error no observable u se relaciona
con la variable explicativa x.

Como x y u son VAs necesitamos un concepto basado en su


distribucin de probabilidad.

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 13 / 70


Trmino constante: 0

Supuesto inicial: siempre que incluyamos el trmino constante 0 en la


ecuacin podemos suponer que el valor medio de u en la poblacin es
cero:
E (u) = 0.

No afirma nada sobre la relacin entre x e y .


Slo afecta a la distribucin marginal de u.
Es simplemente una normalizacin: el efecto medio de los otros
factores se renormaliza a cero.

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 14 / 70


Modelo de Regresin lineal simple
Relacin x y u

1a posibilidad: medir la relacin con el coeficiente de correlacin: si


la correlacin es cero, las variables estn incorreladas, es decir no
tienen relacin lineal.

Pero pueden tener otro tipo de relacin (no lineal): puede haber
relacin con x 2 , etc.

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 15 / 70


Modelo de Regresin lineal simple
Relacin x y u (2)

2a posibilidad: definir la independencia desde el punto de vista de la


distribucin de u condicional en x :

E (u|x) = E (u) = 0.

Para todos los posibles valores de x, la media de u siempre es la


misma, 0.

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 16 / 70


Modelo de Regresin lineal simple
Ejemplo: Ecuacin de salarios

Si suponemos que u es igual a la habilidad innata:


El nivel medio de habilidad tiene que ser el mismo
independientemente del nmero de aos de formacin:

E (habil|x = 8) = E (habil|x = 16) .

Si pensamos que el nivel de habilidad debe aumentar con los


aos de educacin, el supuesto entonces debe ser falso.
No podemos comprobarlo porque el nivel de habilidad innata no
se puede observar: pero es una pregunta que hay que plantearse
para interpretar el modelo.

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 17 / 70


Modelo de Regresin lineal simple
Ejemplo: Nota exmen

score = 0 + 1 attend + u,
donde score es el resultado de un examen final, que depende de las
clases a las que se ha asistido, attend y de otros factores no
observables, u, como capacidad del estudiante que acude al examen.

Cundo podremos esperar que el modelo satisfaga

E (u|attend) = E (u) = 0?

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 18 / 70


Modelo de Regresin lineal simple
Ejemplo: Fertilizantes

Si las cantidades de fertilizantes se establecen


independientemente de otras caractersticas de las parcelas,
entonces E (u|x) = 0.
Si aplicamos mayores cantidades de fertilizante en aquellas
tierras de mayor calidad, entonces el valor esperado de u cambia
con el nivel de fertilizante, y E (u|x) 6= 0.

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 19 / 70


Otra interpretacin
El supuesto E (u|x) = E (u) = 0 conlleva otra interpretacin muy til.
Tomando el valor esperado de y condicional en el valor de x,

E (y |x) = 0 + 1 x.

Esta expresin proporciona el valor de la funcin de regresin


poblacional, que en este caso es lineal.
En este caso el incremento de una unidad de x provoca un
aumento esperado en y de una unidad.
Tambin se puede escribir

y = E (y |x) + u
= 0 + 1 x + u

donde E (y |x) = 0 + 1 x es la parte explicada por x y u es la


parte no explicada por x.
C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 20 / 70
2. Derivacin de las estimaciones por Mnimos
Cuadrados Ordinarios

1 Definicin del Modelo de Regresin Simple

2 Derivacin de las estimaciones por Mnimos Cuadrados Ordinarios

3 Funcionamiento del mtodo MCO

4 Unidades de medida y forma funcional

5 Valores esperados y varianzas de los estimadores MCO

6 Regresin por el origen

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 21 / 70


Derivacin de las estimaciones por Mnimos
Cuadrados Ordinarios

Estimacin de 0 y 1 .

Se necesita una muestra de la poblacin: {(xi , yi ) , i = 1, . . . , n} una


muestra aleatoria de tamao n.

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 22 / 70


Motivacin de la estimacin MCO

Varias alternativas.
Usaremos los supuestos del modelo: en la poblacin u tiene que
tener media nula y no estar correlacionado con x,

E (u) = 0
Cov (u, x) = 0.

Estos supuestos implican

E (y 0 1 x) = 0
Cov (y 0 1 x, x) = E ([y 0 1 x] x) = 0,

que son dos ecuaciones que definen dos parmetros.

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 23 / 70


Estimacin mtodo momentos

Dados los datos, hacemos que los estimadores 0 y 1 satisfagan las


mismas ecuaciones, pero dentro de la muestra, no en la poblacin,
n
1 X 
yi 0 1 xi = 0
n
i=1
n

d n y 0 1 x, x
 1 X 
Cov = yi 0 1 xi xi = 0.
n
i=1

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 24 / 70


MCO: Resolucin ecuaciones estimacin (1)

Operando con la primera ecuacin,


n
1X
y = 0 + 1 x , y = yi ,
n
i=1

es decir
0 = y 1 x ,
lo que nos permite obtener 0 una vez que tenemos estimado 1 .

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 25 / 70


MCO: Resolucin ecuaciones estimacin (2)

Sustituyendo la solucin para 0


n 
X   
yi y 1 x 1 xi xi = 0
i=1

y agrupando trminos,
n
X n
X
(yi y ) xi = 1 (xi x ) xi .
i=1 i=1

Se puede usar que


n
X n
X n
X n
X
(yi y ) xi = (yi y ) (xi x ) ; (xi x ) xi = (xi x )2
i=1 i=1 i=1 i=1

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 26 / 70


MCO: Resolucin ecuaciones estimacin (3)

Suponiendo que
n
X
(xi x )2 > 0,
i=1

el valor estimado de la pendiente es


Pn

i=1 (yi y ) (xi x ) Cov
d n (x, y )
1 = Pn = .
2
i=1 (xi x ) Var
d n (x)

Si x e y estn positivamente relacionadas en la muestra, entonces 1


ser positiva, y viceversa.

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 27 / 70


MCO: Resolucin ecuaciones estimacin (4)

Si
n
X
(xi x )2 = 0,
i=1

Hemos tenido mala suerte en la muestra y todas las xi son


iguales.
O el problema no es interesante, porque la x es constante en la
poblacin.

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 28 / 70


Estimacin Mnimo Cuadrtica (1)
Valor ajustado: una vez obtenidos los estimadores,

yi = 0 + 1 xi ,

que es el valor predicho cuando x = xi . Dada una muestra tenemos n


valores ajustados.
Residuo: diferencia entre el valor verdadero yi y el ajustado yi ,

i = yi yi = yi 0 1 xi .
u

Suma de Cuadrados de los residuos


n
X n 
X 2
i2 =
u yi 0 1 xi .
i=1 i=1
Pn
Criterio MCO: escoger 0 , 1 tal que la suma 2
i=1 ui sea lo ms
pequea posible.
C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 29 / 70
Estimacin Mnimo Cuadrtica (2)

Las condiciones de primer orden son


n
n 
X
2
X 
(yi b0 b1 xi ) = 2 yi 0 1 xi = 0
b0
i=1 b = ,b = i=1
n
0 0 1 1
n 
X
2
X 
(yi b0 b1 xi ) = 2 yi 0 1 xi xi = 0,
b1
i=1 b0 =0 ,b1 =1 i=1

que son equivalentes a las condiciones anteriores.

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 30 / 70


Por qu MCO? (Y no otro mtodo)

Se minimiza la suma de cuadrados de los residuos por varias razones:


Es fcil obtener la frmula de los estimadores.
Sin tcnicas de optimizacin numrica.
Teora estadstica es sencilla: insesgadez, consistencia, etc.
Solucin coincide con las propiedades deducidas de la esperanza
condicional.

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 31 / 70


Recta de regresin

O funcin de regresin muestral,

y = 0 + 1 x,

que subraya que son valores ajustados o estimadores de


E (y |x) = 0 + 1 x:
0 es el valor predicho cuando x = 0, lo cual puede tener sentido
o no.
1 es el valor estimado de la pendiente,

y
1 =
x
o equivalentemente
y = 1 x.

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 32 / 70


Ejemplos
Salario director general y rendimiento de las acciones

salary = 0 + 1 roe + u.

CEOSAL1.RAW, n = 209 :
\ = 963,191 + 18,501roe.
salary

Salario y educacin,

wage = 0 + 1 educ + u.

WAGE1.RAW, n = 526.
Resultados electorales y gastos de campaa,

voteA = 0 + 1 shareA + u.

VOTE1.RAW, n = 173.
C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 33 / 70
Notacin

Cuando se obtiene el ajuste

y = 0 + 1 x

se dice que se ha llevado a cabo la regresin de y sobre x (o hemos


regresado y sobre x) : variable dependiente sobre variable
independiente.

Esto indica que siempre se estima la pendiente y el trmino constante.

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 34 / 70


3. Funcionamiento del mtodo MCO

1 Definicin del Modelo de Regresin Simple

2 Derivacin de las estimaciones por Mnimos Cuadrados Ordinarios

3 Funcionamiento del mtodo MCO

4 Unidades de medida y forma funcional

5 Valores esperados y varianzas de los estimadores MCO

6 Regresin por el origen

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 35 / 70


Funcionamiento del mtodo MCO
Propiedades ajuste MCO

Estudiaremos propiedades algebraicas de la recta ajustada por MCO,


para un conjunto de datos en particular.

Luego las compararemos con propiedades estadsticas, que se


refieren a toda la poblacin.

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 36 / 70


Valores ajustados y residuos
Supondremos que hemos obtenido los estimadores de la ordenada en
el origen y la pendiente 0 , 1 a partir de una determinada muestra
(xi , yi ) , i = 1, . . . , n.
Valor ajustado (para cada observacin)
yi = 0 + 1 xi ,
que est sobre la recta ajustada.
Residuo (asociado a cada observacin):
i
u = yi yi
= yi 0 1 xi .

i > 0, la recta ajustada infrapredice (pasa por debajo del


Si u
punto (xi , yi )).
i < 0, la recta ajustada sobrepredice (pasa por encima del
Si u
punto (xi , yi )).
i = 0, situacin ideal, pero no ocurre casi nunca.
Si u
C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 37 / 70
Propiedades Algebraicas de los Estadsticos MCO
1 La suma (y la media muestral) de los residuos MCO es cero,
n
X
i = 0.
u
i=1

Prueba: primera condicin de primer orden de MCO.


2 La covarianza muestral de regresores y residuos MCO es cero,
n
X
i xi = 0.
u
i=1

Prueba: segunda condicin de primer orden de MCO.


3 La covarianza muestral de los valores ajustados y de los residuos
MCO es cero,
Xn
i yi = 0.
u
i=1

Prueba: Usar (1) y (2) y que yi = 0 + 1 xi .


C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 38 / 70
Propiedades Algebraicas de los Estadsticos MCO (2)

4. El punto (x , y ) siempre est sobre la recta ajustada, es decir

y (x ) = 0 + 1 x = y .

Prueba: definicin de 0 = y 1 x .
5. Descomposicin de yi :

yi = yi + u
i ,

en el valor ajustado y su residuo asociado, que estn


incorrelados. Adems se deduce que:

y = y .

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 39 / 70


Sumas de Cuadrados

Suma de Cuadrados Totales, SST:


n
X
(yi y )2 .
i=1

Suma de Cuadrados Explicada, SSE:


n
(yi y )2 .
X

i=1

Suma de Cuadrados de los Residuos, SSR:


n
X
i2 .
u
i=1

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 40 / 70


Descomposicin de las Sumas de Cuadrados

SST = SSE + SSR.


Prueba:
n n
({yi yi } + {yi y })2
X X
(yi y )2 =
i=1 i=1
n
i + {yi y })2
X
= (u
i=1
=0
z }| {
n n n
{yi y }2 + 2
X X X
= i2 +
u ui {yi y }
i=1 i=1 i=1
= SSR + SSE.

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 41 / 70


Descomposicin Sumas de Cuadrados
Notacin

Suma de Cuadrados Totales: SST=TSS=SCT=STC.

A veces se habla de Suma de Cuadrados de la Regresin (o del


Modelo) y de suma explicada de los cuadrados: SSE=SCE=SEC.

Tambin se habla de la Suma de Cuadrados de los Errores en


lugar de la de Residuos, pero es muy confuso (y errneo, son
residuos, no errores): nosotros siempre SCR.

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 42 / 70


Bondad de Ajuste

(Suponemos que SST6= 0 y que ajustamos el trmino constante)


Coeficiente de Determinacin or R-cuadrado:
SSE SSR
R 2 = Rn2 = =1
SST SST
0 R 2 1.
100R 2 es el porcentaje de la variabilidad de y que explica x.
R 2 = 1 : ajuste perfecto.
Propiedad:
R 2 = 2y ,x .
En aplicaciones es frecuente ver R 2 bastante bajos, pero eso no
significa que el modelo sea intil o est mal (ni que uno con R 2
alto est muy bien).

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 43 / 70


4. Unidades de medida y forma funcional

1 Definicin del Modelo de Regresin Simple

2 Derivacin de las estimaciones por Mnimos Cuadrados Ordinarios

3 Funcionamiento del mtodo MCO

4 Unidades de medida y forma funcional

5 Valores esperados y varianzas de los estimadores MCO

6 Regresin por el origen

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 44 / 70


Unidades de medida y forma funcional
Unidades de Medida

Los coeficientes de MCO cambian de forma totalmente predecible


cuando cambiamos las unidades de medida.
Si la variable dependiente se multiplica por c, entonces los
coeficientes MCO del nuevo modelo ajustado tambin se
multiplican por c.
Ejemplo: salary = salario en miles de dlares,

\ = 963,191 + 18,501roe
salary

que se cambia a salarydol, en dlares, salarydol = 1000 salary

\ = 963191 + 18501roe.
salarydol

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 45 / 70


Unidades de medida y forma funcional
Unidades de Medida (2)

Si la variable explicativa se multiplica por c, entonces el


coeficiente estimado de la pendiente se divide por c (y 0 no
cambia).
Ejemplo: roedec = roe/100, entonces

\ 100
salary = 963,191 + 18,501 roe
100
roe
= 963,191 + (18,501 100)
100
= 963,191 + 1850,1roedec

El R 2 no cambia en ningn caso porque no depende de las


unidades de medida.

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 46 / 70


Especificacin de la forma funcional
No linealidades en regresin simple

Las relaciones lineales no son suficientes para describir las


relaciones econmicas.
Es importante introducir no linealidades mediante definiciones
apropiadas de las variables dependiente e independientes.
Casos ms frecuentes es cuando ciertas variables aparecen en
logaritmos.
Pero el modelo sigue siendo lineal, en particular, lineal en los
parmetros 0 y 1 , por lo que la estimacin MCO se realiza igual,
pero su interpretacin puede ser diferente.

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 47 / 70


Modelos No Lineales
Variable dependiente en logaritmos (log-level)

El modelo lineal implica que el incremento de y cuando cambia x


siempre es igual, independientemente del nivel de x :
wage = 0 + 1 educ + u
Es ms razonable suponer que es el porcentaje de incremento el
que es constante.
Un modelo que consigue esto, aproximadamente, es
log (wage) = 0 + 1 educ + u.
As, si u = 0, entonces (100 1 ) es la semielasticidad de
wage respecto a educ,
%wage = (100 1 ) educ.
Para ver la relacin podramos tomar exponenciales en ambos
lados del modelo,
wage = exp (0 + 1 educ + u) .
EJEMPLO.
C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 48 / 70
Modelos No Lineales
Modelo de Elasticidad Constante (log-log)

En este caso la relacin entre x e y se establece en trminos de


incrementos relativos.
Ambas variables deben aparecer en logaritmos,

log (salary ) = 0 + 1 log (sales) + u,

donde 1 es la elasticidad de salary respecto a sales.


En este caso
%wage = 1 %sales.

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 49 / 70


Modelos No Lineales
Modelo con regresores en logaritmos (level-log)

En este caso controlamos incrementos relativos de x,

y = 0 + 1 log (x) + u,

Significado de 1 ,
1
y = %x.
100

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 50 / 70


5. Valores esperados y varianzas de los estimadores
MCO

1 Definicin del Modelo de Regresin Simple

2 Derivacin de las estimaciones por Mnimos Cuadrados Ordinarios

3 Funcionamiento del mtodo MCO

4 Unidades de medida y forma funcional

5 Valores esperados y varianzas de los estimadores MCO

6 Regresin por el origen

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 51 / 70


Valores esperados y varianzas de los EMCO
Supuestos

RLS.1 (Modelo lineal en parmetros). En el modelo para la poblacin, la


variable dependiente y se relaciona con la variable independiente
x y el error u mediante
y = 0 + 1 x + u,
donde 0 y 1 son los parmetros del trmino constante y la
pendiente.
Esta expresin es importante para interpretar 0 y 1 .
RLS.2 (Muestreo aleatorio). Para estimar los parmetros podemos usar
una muestra de tamao n, (xi , yi ) , i = 1, . . . , n del modelo
poblacional,
yi = 0 + 1 xi + ui , i = 1, . . . , n.
Esta expresin es importante para deducir las propiedades de los
EMCO de 0 y 1 .
C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 52 / 70
Valores esperados y varianzas de los EMCO
Supuestos (2)

RLS.3 (Media Condicional cero).

E (u|x) = 0.

Para la muestra aleatoria esto implica que

E (ui |xi ) = 0, i = 1, . . . , n.

Este supuesto permite deducir las propiedades de los EMCO


condicionales en los valores de xi en nuestra muestra. (Similar
supuesto a situaciones donde xi son fijos en muestras repetidas,
aunque no es la forma habitual de recoger datos en Economa).

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 53 / 70


Valores esperados y varianzas de los EMCO
Supuestos (3)

RLS.4 (Variacin muestral en la variable independiente). En la muestra,


las variables independientes xi , i = 1, . . . , n, no son todas iguales
a una misma constante. Esto requiere alguna variacin de x en la
poblacin.
Es decir, necesitamos que la variacin total en xi , sx2 , sea
positiva,
Xn
sx2 = (xi x )2 > 0.
i=1

Si este supuesto falla no se pueden calcular los EMCO, por los


que su anlisis estadstico no tiene sentido.

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 54 / 70


Valores esperados y varianzas de los EMCO
Insesgadez estimadores MCO

1 es una muestra aleatoria:


Pn
(xi x ) yi
1 = Pi=1
n
.
2
i=1 (xi x )
Sustituyendo el modelo yi = 0 + 1 xi + ui tenemos que
Pn Pn

i=1 (xi x ) yi (xi x ) (0 + 1 xi + ui )

1 = = i=1 .
2
sx sx2
n
X n
X
(xi x ) (0 + 1 xi + ui ) = (xi x ) (1 xi + ui )
i=1 i=1
n
X n
X
= 1 (xi x ) xi + (xi x ) ui
i=1 i=1
n
X
= 1 sx2 + (xi x ) ui .
i=1
C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 55 / 70
Valores esperados y varianzas de los EMCO
Insesgadez estimadores MCO (2)

Por tanto, definiendo di = (xi x ),


Pn
(xi x ) ui
1 = 1 + i=1 2
sx
 X n
1
= 1 + di ui
sx2 i=1

1 es igual a la pendiente poblacional, 1 , ms un trmino que es


una combinacin lineal de los errores ui .
Condicional en xi , la aleatoriedad de 1 depende solamente de
los errores {u1 , . . . , un } .
La razn de que 1 difiera de 1 es debido a que los errores
{u1 , . . . , un } no son cero.

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 56 / 70


Valores esperados y varianzas de los EMCO
Insesgadez estimadores MCO (3)

Teorema. (Insesgadez de los EMCO). Usando los supuesto


RLS.1-RLS.4,    
E 0 = 0 , E 1 = 1 .

Prueba: los valores esperados son condicionales en los valores


muestrales de xi ,
"  n #
  1 X
E 1 = 1 + E di ui
sx2 i=1
 X n
1
= 1 + di E (ui )
sx2 i=1
 X n
1
= 1 + di 0 = 1 ,
sx2 i=1
ya que E (ui ) E (ui |xi ) = 0.
C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 57 / 70
Valores esperados y varianzas de los EMCO
Insesgadez estimadores MCO (4)

Prueba para 0 . Usando que 0 = y 1 x , y usando RLS.1

0 = y 1 x = 0 = 0 + 1 x + u
1 x .

Entonces, tomando esperanzas condicionales en xi , i = 1, . . . , n,


    
E 0 = 0 + 1 E 1 x + E (u )
 
= 0 + 1 1 x + 0
= 0

) = 0 por RLS.3.
porque E (u

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 58 / 70


Valores esperados y varianzas de los EMCO
Insesgadez estimadores MCO (5)

La propiedad de Insesgadez no dice nada sobre el valor que se


obtiene para una muestra en particular.
Esta propiedad no se cumple si alguno de los supuestos falla.
Si RLS.4 falla, no se pueden computar los EMCO.
RLS.1 se puede hacer cumplir eligiendo x e y incluso si la relacin
original es no lineal.
RLS.2 no se cumplir para datos de series temporales.
El supuesto clave es RLS.3, si falla los EMCO no sern
insesgados. La posibilidad de que x est correlada con u siempre
est ah con datos no experimentales.
Correlacin esprea: si hay factores en u que afectan a y y que
tambin estn correlados con x.

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 59 / 70


Valores esperados y varianzas de los EMCO
Ejemplo: rendimiento en matemticas y el programa de comidas en el colegio

Modelo para explicar el efecto de un programa de comidas


subvencionadas en el colegio, cp, sobre el rendimiento:

math10 = 0 + 1 lnchprg + u.

math10 : % que aprueban un test de matemticas en la high


school (MEAP93)
lnchprg: % de estudiantes elegibles para el programa de comida
subvencionadas.
Qu signo esperaras para 1 si midiese un efecto cp?

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 60 / 70


Valores esperados y varianzas de los EMCO
Varianza de los estimadores MCO (1)

Adems de saber que la distribucin muestral de 1 est


centrada, es importante saber su variabilidad alrededor de 1 .
La varianza de 1 se puede deducir a partir de RLS.1-RLS.4, pero
su expresin es complicada. Por eso aadimos un nuevo
supuesto:
RLS.5 (Homocedasticidad Condicional): u tiene varianza, condicional en
x, constante,
Var (u|x) = 2 .
Este supuesto simplifica el anlisis y hace que los EMCO tengan
ciertas propiedades de eficiencia.
Es, junto con RLS.4, ms dbil que el supuesto de independencia.
2 se le llama la varianza del error o perturbacin.

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 61 / 70


Valores esperados y varianzas de los EMCO
Varianza de los estimadores MCO (2)

Los supuestos sobre u, condicionales en x,

E (u|x) = 0
 
Var (u|x) = E u 2 |x = 2 ,

Se escriben frecuentemente en funcin de la distribucin de y ,


condicional en x,

E (y |x) = 0 + 1 x
Var (y |x) = 2 .

Si Var (y |x) = Var (u|x) dependiese de x se hablara de


Heterocedasticidad (condicional).
Ejemplo: heterocedasticidad en salarios.

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 62 / 70


Valores esperados y varianzas de los EMCO
Varianza de los estimadores MCO (3)

Teorema 2. (Varianza de los EMCO). Bajo los supuesos RLS.1-5


  2
Var 1 =
sx2
2 n1 ni=1 xi2
  P
Var 0 = ,
sx2

condicionales en los valores muestrales {x1 , . . . , xn } .

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 63 / 70


Valores esperados y varianzas de los EMCO
Varianza de los estimadores MCO (4)

Prueba: (Slo para 1 ) Se parte de


 X n
1
1 = 1 + di ui .
sx2 i=1
Por tanto, condicional en xi ,
n
 2 !
  1 X
Var 1 = Var di ui
sx2 i=1
 2 X n
1
= di2 Var (ui )
sx2 i=1
 2 X n
1
= di2 2
sx2 i=1
 2
1 2
= 2 s 2
x = .
sx2 sx2
C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 64 / 70
Valores esperados y varianzas de los EMCO
Varianza de los estimadores MCO (4)

Estas frmulas no son vlidas en presencia de


heterocedasticidad.
Son importantes para construir intervalos de confianza y
contrastes de hiptesis
 
Var 1 depende de:
2
sx2
(Indirectamente) n, ya que sx2 = n Var
d (x) .

Cul podemos elegir de esos factores?


Consistencia?

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 65 / 70


Valores esperados y varianzas de los EMCO
Estimacin de la Varianza del Error (1)

   
Hay factores en Var 1 y Var 0 desconocidos: 2 .
2 se puede estimar con los datos (a partir de los residuos u
i , ya
que los errores ui no son observables).
Usando yi = 0 + 1 xi , tenemos que

i
u = yi yi
= 0 + 1 xi + ui 0 1 xi
   
= ui + 0 0 + 1 1 xi ,

i tiene un valor esperado de


por lo que la diferencia entre ui y u
cero (y p 0).

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 66 / 70


Valores esperados y varianzas de los EMCO
Estimacin de la Varianza del Error(2)

2 =PE u 2 , por lo que un estimador insesgado de 2 es




n1 ni=1 ui2 .
Como los errores
Pno son observables, un primer estimador sera
n1 SSR = n1 ni=1 u
i2 , pero ste no es insesgado.
Los residuos satisfacen dos restricciones:
n
X n
X
i = 0,
u i xi = 0.
u
i=1 i=1

Por tanto los residuos tienen n 2 grados de libertad.


El estimador insesgado de 2 que hace el ajuste por los grados
de libertad es
n
1 X 2 SSR
2 =
i =
u .
n2 n2
i=1

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 67 / 70


Valores esperados y varianzas de los EMCO
Estimacin de la Varianza del Error (3)

Estimador de , o error estndar de regresin,



=
2.

Error estndar de 1 :
 

se 1 =  1/2 .
Pn
2
i=1 (xi x )

Da una idea de la variacin muestral de 1 , pero es un estimador


que vara de muestra a muestra.
Tambin son fundamentales en construir ICs y contrastes de
hiptesis.

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 68 / 70


6. Regresin por el origen

1 Definicin del Modelo de Regresin Simple

2 Derivacin de las estimaciones por Mnimos Cuadrados Ordinarios

3 Funcionamiento del mtodo MCO

4 Unidades de medida y forma funcional

5 Valores esperados y varianzas de los estimadores MCO

6 Regresin por el origen

C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 69 / 70


Regresin por el origen
A veces se impone la restriccin de que cuando x = 0, el valor
esperado de y es cero, es decir 0 = 0 (renta - impuestos).
Se quiere una funcin de regresin estimada que pase por
(x = 0, y = 0) ,
y = 1 x.
En este caso MCO minimiza
Xn  2
yi 1 xi .
i=1

1 satisface la condicin de primer orden:


Pn n 
yi xi X 
1 = Pi=1
n 2
: yi
1 i xi = 0.
x
i=1 xi i=1

Necesita que no todos los xi sean cero. Slo coincide con MCO si
x = 0. Estimador sesgado si 0 6= 0.
C Velasco (MEI, UC3M) Regresin Simple UC3M, 2006 70 / 70

También podría gustarte