Está en la página 1de 21

Econometría I

Dra. Paola Bulnes


Objetivo

• Estudiar el método de estimación de mínimos


cuadrados ordinarios (MCO)
Definición
EJEMPLO Cálculo de la ecuación de regresión lineal (de Y sobre X)

X Y XY X2
suj1 120 10 1200 14400
suj2 100 9 900 10000
suj3 90 4 360 8100
suj4 110 6 660 12100

4 SUMA SUMA
3120 44600
PROMEDIO PROMEDIO
105 7.25

N
4

3120  4 105  7 ' 25 Luego


B 2
 0 '15
44600  4 105 Y’=-8’5+0’15X

A  7 ' 25  0 '15 105  8'5


Los errores de predicción en la recta de regresión de Y sobre X

Si no tuviéramos el predictor X, ¿qué puntuación prediríamos para las


puntuaciones de Y?

En tal caso, dado el criterio de mínimos cuadrados, si tenemos datos en Y y


carecemos de datos en X, nuestra mejor estimación de Y será su media Y
Recordemos que la media minimiza el sumatorio de las diferencias
Cuadráticas

 (Y  Y ) 2
es mínimo

Si empleamos la media como predictor, la varianza de las predicciones será

s y2 
 (Y  Y ) 2

n
Los errores de predicción en la recta de regresión de Y sobre X

Pero si tenemos un predictor X, la varianza será

s y2. x 
 i i
(Y  Y 
) 2

n
Esta es la varianza de Y no explicada por X

Se puede demostrar que s y2. x  s y2 (1  rxy2 )

s y2. x
Que despejando sale rxy2  1 
s y2
¿Cuán buena es la predicción de la recta de regresión? El coeficiente de
determinación como índice de la bondad de ajuste de nuestro modelo (la
recta de regresión)

Acabamos de mostrar que 2


s y2. x
r  1
xy
s y2
2
r xy
Es el llamado coeficiente de determinación y permite conocer cuán
bueno es el ajuste de la recta de regresión (o en general del modelo
lineal). Está acotado entre 0 y 1.

Si todos los puntos del diagrama de dispersión están sobre la recta (con pendiente
2
diferente de 0), s y . x entonces será 0, y el coeficiente de determinación será 1

Cuanto más se alejen los puntos de la recta de regresión, mayor será el valor de s y2. x
el valor del coeficiente de determinación será menor y menor.
El coeficiente de determinación y la proporción de varianza
asociada/explicada/común (1)
Empecemos con una tautología

Yi  Yi  (Yi  Yi )
Esta expresión indica que la puntuación observada por el sujeto i-ésimo es igual a la
puntuación predicha para dicho sujeto más un error de predicción.

Se puede demostrar que las puntuaciones predichas y los errores de predicción son
independientes, con lo que podemos señalar

s y2  s y2 '  s y2. x

s y2 Varianza total de Y

s y2 ' Varianza de las puntuaciones de Y predichas por el predictor X

s y2. x Varianza de los errores de predicción (varianza no explicada por X)


El coeficiente de determinación y la proporción de varianza
asociada/explicada/común (2)

De la transparencia anterior, tenemos s y2  s y2 '  s y2. x

s y2. x
Y sabíamos que rxy2  1  2
s y

s y2  s y2. x s y2´
luego rxy2  2

s y s y2

En definitiva, el coeficiente de determinación mide la proporción de la varianza


de Y que está asociada/explicada por el predictor X
FINALIZANDO (MCO)…
EJERCICIO
A partir de estos datos (X es gasto de publicidad, Y son las ventas):

a) Calcule la media aritmética para cada variable


b) Calcule el valor de Beta2 y Beta1
c) Cuál es la recta de regresión estimada (FRM)
d) Interprete el resultado según el valor de la pendiente de la ecuación anterior
e) Si X = 10, ¿cuántas ventas se alcanzarán en promedio?

También podría gustarte