Está en la página 1de 22

Estimacin por MCO

U Lima
Prof. Pablo J. Azabache La
Torre

Funcin de Regresin
Poblacional

La poblacin es de 526 individuos de los cuales se ha recopilado informacin


sobre su salario por hora y el nmero de aos de estudio. Cmo estimamos
los parmetros B0 y B1?

Derivacin de los estimadores


MCO
(continuacin)

Cmo se estiman los parmetros B0 y B1?

Para esto necesitamos una muestra de la poblacin:


{(xi,yi): i=1....n}, esta es una muestra aleatoria de tamao n.
Dada esta muestra podemos escribir:

yi 0 1 xi i

Ahora tenemos que decidir cmo usar estos datos para


lograr valores estimados del trmino constante y de la
pendiente en la regresin poblacional.

Derivacin de los estimadores


MCO
(continuacin)

yi 0 1 xi i

De la poblacin se tomo una muestra de 32 familias, en la realidad slo se


tienen una muestra de la poblacin. El grfico presenta los puntos y su
funcin de regresin de esta muestra. Cmo estimar los parmetros de
esta muestra?

Derivacin de los estimadores


MCO
Dada la muestra de tamao
n ,{(x ,y ): i=1....n}, debemos de decidir como usar estos
i

(continuacin)

datos para lograr valores estimados del trmino constante y de la pendiente de la


FRP.
Para esto usamos el supuesto:

E[u/x]=0
En la poblacin: u tiene una media nula y no est correlacionada con x.

E[u]=0 y COV[x,u]=0
COV[x,u]=E(x)E(u)=0

... Slo por que x y u son independientes

Derivacin de los estimadores


MCO
(continuacin)

La covarianza mide el grado de dependencia lineal que existe entre


dos variables aleatorias:
Una covarianza positiva indica que dos variables aleatorias se
muevan en la misma direccin.
Una covarianza negativas indica que dos variables aleatorias se
muevan en direcciones opuestas.
Nota.- Que la covarianza entre x y y sea cero no implica
independencia Porqu?
Si Y=X2 su covarianza es cero. Pero si se conoce X se conoce Y,
es extrao que su covarianza sea cero. Pero recurdese que la
covarianza mide el grado de dependencia lineal.

Derivacin de los estimadores


MCO
Dados estos dos supuestos:
Media de los errores igual a cero e
(continuacin)

independencia lineal entre u y x. Podemos escribir:

E (u ) E[ y 0 1 x] 0
E (ux) E[ x( y 0 1 x)] 0
Podemos esperar obtener buenos estimadores de B0 y B1. Dada la muestra
de datos, elegimos los valores estimado de B0 y B1 tal que se cumpla las
contrapartidas mustrales de las 2 ecuaciones anteriores:
n
1
i
0
1 i
i 1

x ] 0
[
y

n
n

x ) 0
x
(
y

i i 0 1i
i 1

Derivacin de los estimadores


MCO
(continuacin)

0 y 1 x

(
x

x
)(
y

y
)
i
i
i 1

(
x

x
)
i
i 1

Estos son los valores estimados por mnimos cuadrados ordinarios.

Derivacin de los estimadores


Si la varianza de x es
cero entonces no se puede estimar los
MCO
estimadores MCO.
n
2
i 1 ( xi x ) 0
(continuacin)

Derivacin de los estimadores


En base a la muestra y MCO
con las formulas obtenidas estimamos los estimadores
MCO.
(continuacin)

Derivacin de los estimadores


Valores ajustados:
MCO
(continuacin)

y i 0 1 xi
Valores residuales:

i y i y i yi 0 1 xi
Estos residuos no deben confundirse con los errores o el trmino de
perturbacin.

Derivacin de los estimadores


El residuo para la observacin
i es la diferencia entre el valor verdadero y y su
MCO
(continuacin)

valor ajustado.

Derivacin de los estimadores


Observacin: Supongamos
que escogemos los estimadores MCO tal que
MCO
minimicen la suma de los cuadrados de los residuos:
(continuacin)

min i ( yi 0 1xi )
i 1

i 1

Solucin: Esta se denominan las condiciones de primer orden. La expresin


MCO, vienen del hecho que estos valores estimados minimizan la suma de los
cuadrados de los residuos.
n
1
i
0
1 i
i 1

x ] 0
[
y

n
n

x ) 0
x
(
y

i i 0 1i
i 1

Derivacin de los estimadores


Dado que obtenemos la funcin de regresin muestral para una muestra de
MCO
datos determinada, una nueva muestra dar lugar a una pendiente y un
(continuacin)

trmino constante diferentes.

Funcionamiento del
Mtodo MCO
UPC
Prof. Pablo J. Azabache La
Torre

I. Valores ajustados y
residuos
1.- Propiedades
algebraicas de los estadsticos
a.- La suma y por lo tanto la media muestral de los residuos MCO es nula. Esto
se deriva de la condicin de primero orden.
n


i 1

b.- La covarianza muestral entre los regresores y los residuos MCO es nula.
Tambin viene dado por una de las condiciones de primer orden.

x
i 1

c.- La media muestral de x e y , (x,y), estn sobre la recta de regresin MCO.

Valores ajustados y residuos


(continuacin)

Otras consideraciones:

yi y i i
E ( yi ) E ( y i ) E ( i )

y y
Demuestre que los valores ajustados y los residuos estn incorrelacionados.

Valores ajustados y residuos


(continuacin)

Definamos:

Suma total de cuadrados: Es una


medida de la varianza muestral total
en las yi.

STC ( yi y )
i 1
n

Suma explicada de cuadrados: mide


la variacin muestral de los valores
predichos.

SEC ( y i y )
i 1
n

Suma de los cuadrados de los residuos:


mide la variacin muestral de los
residuos.

SCE i
i 1

Valores ajustados y residuos


(continuacin)

STC= SEC + SCE

Demostrarlo. Para esto tiene que


demostrar que la covarianza entre
los valores estimados de yi y los
residuos es cero.

Valores ajustados y residuos


(continuacin)

Bondad de ajuste:
Cmo medir la capacidad de la variable x de explicar a la
variable y? A menudo resulta til calcular un nmero que
resuma hasta que punto la recta de regresin MCO se
ajusta bien a los datos.
STC= SEC + SCE
1 = SEC/STC + SCE/STC
Luego el R2 o coeficiente de determinacin es definido
como:
R2= SEC/STC= 1 SCE/STC

Valores ajustados y residuos


(continuacin)

Bondad de ajuste:
R2= SEC/STC= 1 SCE/STC
Se interpreta como la fraccin de la variacin muestral en
y que viene explicada por x.
0R2 1
Si todos los puntos de la muestra se encuentran sobre la
misma recta, la recta MCO se ajusta perfectamente a los
datos.
Es el porcentaje de la variacin muestral de y que viene
explicada por x.
Si R2 es cercano a cero, indica que la recta MCO da un
ajuste de baja calidad, y la variacin de yi est muy poco
representada por la variacin de i

II. Valores esperados y


varianzas de los
Insesgadez del estimador MCO
estimadores MCO
Demostrar que

E ( 0 ) 0

E ( 1 ) 1

Recuerde que en la demostracin los valores esperados estn


condicionados a los valores de las variables independientes de la muestra.
Dado que STCx y (xi-ux), son funciones de las xi entonces no son aleatorias
cuando se condicionan.