Está en la página 1de 16

1

Grado en Economía 2022-2023 2


Tema 2: Modelo de regresión lineal Simple

eCONOMETRÍAI
2.1 Planteamiento del modelo de regresión lineal simple. Estimación MCO.
2.2 Propiedades descriptivas de los estimadores MCO.
2.3 Interpretación de los coeficientes: la clausula ceteris paribus.
2.4 Formas funcionales alternativas: efecto marginal y elasticidad.
Profesor: Unidades de medida.
Marko Petrovic
Correo electrónico: marko.petrovic@uv.es 2.5 Medidas de bondad de ajuste y selección de modelos
Despacho: 3C01
Tutorías: miércoles 10.30-12.00
miércoles 16.00-17.30
online

Tema 2: Modelos de regresión 3 Tema 2: Modelos de regresión 4

2.1. Planteamiento. 2.1. Planteamiento.


Ejemplo hipotético: supongamos que hemos obtenido información De acuerdo con los datos, podemos calcular la probabilidad de consumir
sobre una población (el conjunto de todos los posibles valores de 55 si la renta es de 80: P(Consumo=55| Renta=80)= 1/5
una medición o de un experimento) de consumo (Y) y renta (X).

• Valor esperado incondicional del consumo semanal:


• Media del consumo = $7.272/60 = 121.20

• Valor esperado condicional del consumo semanal al valor dado


de la variable (condicional) X:

Tabla 2. Fuente: Gujarati, D. y Porter D.C. (2010) Econometría (5ª Edición). McGraw-Hill.

Tabla 1. Fuente: Gujarati, D. y Porter D.C. (2010) Econometría (5ª Edición). McGraw-Hill.
Tema 2: Modelos de regresión 5 Tema 2: Modelos de regresión 6

2.1. Planteamiento. 2.1. Planteamiento.


Así, con los valores del consumo para cada nivel de renta, podríamos calcular la
esperanza condicionada del consumo para cada nivel de renta o media condicional: • El gráfico anterior muestra que para cada X (es decir, el nivel de ingresos) existe
E(Y|X=80) = 55*(1/5) + 60*(1/5) + 65*(1/5) + 70*(1/5) + 75*(1/5) = 65 una población de valores Y (consumo semanal) que se distribuyen alrededor de
la media (condicional) de dichos valores Y.
Distribución condicional del gasto en varios niveles de ingreso: • Por simplicidad, suponemos que tales valores Y están distribuidos
simétricamente alrededor de sus respectivos valores medios (condicionales)
• La recta (o curva) de regresión poblacional recoge todos los valores esperados
De modo que, por
Los puntos oscuros dentro de término medio, el (medios condicionales) del consumo en función de la renta: E(Y|Xi) = f(Xi)
círculos muestran los valores Consumo aumenta
medios condicionales de Y,
cuando lo hace la renta.
graficados en función de los
diferentes valores de X.

Figura 1. Fuente: Gujarati, D. y Porter D.C. (2010) Econometría (5ª Edición). McGraw-Hill.

Figura 2. Fuente: Gujarati, D. y Porter D.C. (2010) Econometría (5ª Edición). McGraw-Hill.

Tema 2: Modelos de regresión 7 Tema 2: Modelos de regresión 8

2.1. Planteamiento. 2.1. Planteamiento.


• La Ecuación E(Y|Xi) = f(Xi) se conoce como función de regresión poblacional • Así, cuando se plantea la pregunta “¿cuál es el valor esperado del consumo
(FRP), donde ƒ(Xi) denota alguna función de la variable explicativa X. semanal de una familia?”, la respuesta es 121.20 dólares (la media
• Como primera aproximación o hipótesis de trabajo, podemos suponer que la incondicional)
FRP E(Y | Xi) es una función lineal de Xi, del tipo:
• Pero si se pregunta “¿cuál es la mejor predicción (media) del gasto semanal de
las familias con un ingreso semanal de 140 dólares?”, la respuesta es 101
donde b1 y b2 son parámetros no conocidos pero fijos que se denominan dólares
coeficientes de regresión.
• Por consiguiente, conocer el nivel de ingreso permite predecir mejor el valor
• La ecuación se conoce como función de regresión poblacional lineal. medio del consumo que si se ignora esa información

• En el análisis de regresión, la idea es estimar la FRP como en la ecuación, es


decir, estimar los valores no conocidos de b1 y b2 con base en las observaciones
de Y y X.
Tema 2: Modelos de regresión 9 Tema 2: Modelos de regresión 10

2.1. Planteamiento: Especificación estocástica de la FRP 2.1. Planteamiento.


Por consiguiente, podemos expresar la desviación de un nivel de consumo
individual Yi alrededor de su valor esperado de la manera siguiente:
ui.= Yi - E(Y|Xi)
Es decir: Yi = E(Y|Xi) + ui.
Componente Componente
sistémico o aleatorio o no
determinista sistémico

Ui es la perturbación aleatoria o estocástica o término de error estocástico que sustituye o representa a


todas las variables omitidas o ignoradas que puedan afectar a Y pero que no se incluyen (o no pueden
incluirse) en el modelo de regresión.
Figura 3. Fuente: Gujarati, D. y Porter D.C. (2010) Econometría (5ª Edición). McGraw-Hill.

Según el gráfico anterior está claro que, a medida que aumenta el ingreso familiar, Si tomamos el valor esperado (condicionado a las X dadas) de la ecuación en ambos
aumenta el consumo familiar promedio. Pero, ¿qué sucede con el gasto de lados, obtenemos:
consumo de una familia individual con relación a su nivel fijo de ingresos?

Si nos fijamos en el diagrama de dispersión, dado un nivel de ingresos de 100, el


gasto de consumo de una familia individual está agrupado alrededor del consumo Como E(Yi|Xi) es lo mismo que E(Y|Xi) la ecuación implica que E(ui|Xi) = 0
promedio de todas las familias de ese nivel de 100, esto es, alrededor de su Así, el supuesto de que la línea de regresión pasa a través de las medias condicionales
esperanza condicional. de Y implica que los valores de la media condicional de ui son cero.
MEDIA CONDICIONADA NULA - importante para estimar el efecto “ceteris paribus”

Tema 2: Modelos de regresión 11 Tema 2: Modelos de regresión 12

2.1. Planteamiento. 2.1. Planteamiento.


• Problema: en la práctica lo que tenemos disponible no es más que una muestra
de valores de Y que corresponden a algunos valores fijos de X.
La especificación estocástica tiene la ventaja que muestra claramente otras • Por tanto, la labor ahora es estimar la FRP con base en información muestral.
variables, además del ingreso, que afectan el consumo, y que el consumo de una • Supongamos que no se conocía la población de la tabla 1 y que la única
familia no se explica en su totalidad sólo por la(s) variable(s) en el modelo de información que se tenía era dos muestras de valores de Y seleccionadas al azar
regresión. para valores dados de X como se presentan en las siguientes tablas:

Tabla 3a Tabla 3b
Tabla 3. Fuente: Gujarati, D. y Porter D.C. (2010) Econometría (5ª Edición). McGraw-Hill.

• Ahora se tiene sólo un valor de Y correspondiente a los valores dados de X.


Tema 2: Modelos de regresión 13 Tema 2: Modelos de regresión 14

2.1. Planteamiento. 2.1. Planteamiento.


Igual que la FRP en la cual se basa la línea de regresión poblacional, se desarrolla el
concepto de función de regresión muestral (FRM) para representar la línea de regresión
muestral:

donde 𝑌෠𝑖 se lee “Y sombrero” o “Y gorra”


𝑌෠𝑖 es estimador de E(Y | Xi )
𝛽መ1 es estimador de b1
𝛽መ2 es estimador de b2
Figura 4. Fuente: Gujarati, D. y Porter D.C. (2010) Econometría (5ª Edición). McGraw-Hill. Un estimador, conocido también como estadístico (muestral), no es más que una regla,
fórmula o método para estimar el parámetro poblacional a partir de la información
Las líneas de regresión en la figura 4 se conocen como líneas de regresión muestral. suministrada por la muestra disponible.
Debido a fluctuaciones muestrales, son, en el mejor de los casos, sólo una Un valor numérico particular obtenido por el estimador en un análisis se conoce como
aproximación de la verdadera RP. estimación.

Tema 2: Modelos de regresión 15 Tema 2: Modelos de regresión 16

2.1. Planteamiento. 2.1. Planteamiento.


La FRM se expresa en su forma estocástica de la siguiente manera: Para resumir, el objetivo principal del análisis de regresión es estimar la FRP

donde, además de los símbolos ya definidos, ûi denota el término residual (muestral). con base en la FRM

Conceptualmente, ûi es análogo a ui y se considera una estimación de ui, que se Debido a fluctuaciones muestrales,
introduce en la FRM por las mismas razones que se introdujo ui en la FRP. la estimación de la FRP basada en la
FRM es, en el mejor de los casos,
una aproximación

En términos de la FRM, la Yi
observada se expresa como

En términos de la FRP, como


Figura 5. Fuente: Gujarati, D. y Porter D.C. (2010) Econometría (5ª Edición).
McGraw-Hill.
Tema 2: Modelos de regresión 17 Tema 2: Modelos de regresión 18

2.1. Planteamiento: Estimación


2.1. Planteamiento.

La pregunta crítica es Función de Regresión Poblacional


Y = b1 + b2 X + u E(Y|X)= b1 + b2X

Muestra aleatoria de
tamaño N i=1,2,…,N
¿Cómo se debe construir la FRM para que 𝛽መ1 y 𝛽መ2 estén tan “cerca” de los verdaderos
b1 y b2 como sea posible, aunque nunca se lleguen a conocer los verdaderos b1 y b2?

Mínimos Cuadrados Ordinarios


Yi = b1 + b2Xi + ui

𝑌෠𝑖 = 𝛽መ1 + 𝛽መ2 𝑋𝑖


Función de Regresión Muestral

Tema 2: Modelos de regresión 19 Tema 2: Modelos de regresión 20

2.1. Planteamiento: Estimación por Mínimos Cuadrados 2.1. Planteamiento: Estimación por Mínimos Cuadrados
Ordinarios (MCO) Ordinarios (MCO)
De vuelta al tema del residuo. Este error o residuo es la diferencia entre el
valor observado de la variable endógena (dependiente) y el valor ajustado,
Por lo tanto, min σ𝑁 ො 𝑖2 es hacer mínima la suma: 𝑢ො 12 + 𝑢ො 22 + … + 𝑢ො 𝑁
𝑖=1 𝑢
2
es decir:
o lo que es lo mismo :
𝑁 𝑁
Y el criterio será hacer el ajuste de manera que todos los residuos sean lo más 2
pequeños posible.
𝑚𝑖𝑛 ෍ 𝑢ො 𝑖2 = min ෍ 𝑌𝑖 − 𝑌෠𝑖
Y
𝑖=1 𝑖=1
û 4

û 3 Que es equivalente a minimizar la siguiente expresión:


û1
û 2 𝑁 𝑁
2
X
𝑚𝑖𝑛 ෍ 𝑢ො 𝑖2 = min ෍ 𝑌𝑖 − 𝛽መ1 − 𝛽መ2 𝑋𝑖
𝑖=1 𝑖=1
Matemáticamente queremos hacer mínima la suma de los residuos σ𝑁
𝑖=1 𝑢
ො𝑖
respecto a 𝛽መ1 𝛽መ2
Teniendo en cuenta que hay positivos y negativos que pueden compensarse σ𝑁 ො 𝑖2
𝑖=1 𝑢
Tema 2: Modelos de regresión 21 Tema 2: Modelos de regresión 22

2.1. Planteamiento: Estimación por Mínimos Cuadrados 2.1. Planteamiento: Estimación por Mínimos Cuadrados
Ordinarios (MCO) Ordinarios (MCO)
min L = min σ[𝑌𝑖 −( 𝛽መ1 + 𝛽መ2 𝑋𝑖 )]2 respecto a 𝛽መ1 y ෡𝛽2 .
De (2),  X (Y − bˆ − bˆ X ) = 0
i i 1 2 i X Y i i = bˆ1  X i + bˆ2  X i2 (4)
i
La optimización implica hacer las primeras derivadas respecto a 𝛽መ1 y 𝛽መ2 e Segunda ecuación normal
igualarlas a cero. de la regresión.
L
= −2 (Yi − bˆ1 − bˆ2 X i ) = 0 (1)
Sustituyendo (3) en (4): X Y i i = (Y − bˆ2 X ) X i + bˆ2  X i2
ˆ
b1 i X Y i i = Y  X i − bˆ2 X  X i + bˆ2  X i2

L X Y = NY X − bˆ2 NX X + bˆ2  X i2
= −2 X i (Yi − bˆ1 − bˆ2 X i ) = 0 (2) i i

bˆ2 i
 X Y − NY X = bˆ ( X
i i 2 i
2
− NX 2)
Primera ecuación
De (1),  (Y − bˆ
i 1 − bˆ2 X i ) = 0 Y i = Nbˆ1 + bˆ2  X i normal de la recta de
( X i − X )(Yi − Y ) = bˆ2  ( X i − X )2
i regresión.

Donde: Yi = N Ῡ, y , Xi = N 𝑋;


ത y por tanto, es fácil obtener :

bˆ1 = Y − bˆ2 X (3)

Tema 2: Modelos de regresión 23 Tema 2: Modelos de regresión 24

2.1. Planteamiento: Estimación por Mínimos Cuadrados 2.2. Propiedades descriptivas de los estimadores MCO
Ordinarios (MCO) La suma de los residuos es cero, es decir, σ𝑁
1. 𝑖=1 𝑢
ො𝑖 = 0

• Resolviendo para bˆ1 y b̂ 2 , obtenemos que:  Demostración

◼ A partir de la definición de residuo: 𝑢ො 𝑖 = 𝑌𝑖 − 𝑌෠𝑖 = 𝑌𝑖 − 𝛽መ1 − 𝛽መ2 𝑋𝑖


◼ Sumamos los N residuos
( X i − X )(Yi − Y ) σ𝑁 ො 𝑖 = σ𝑁
𝑖=1 𝑢
𝑁 ෠ 𝑁 መ መ 𝑁
𝑖=1 𝑌𝑖 − σ𝑖=1 𝑌𝑖 = σ𝑖=1 𝑌𝑖 − 𝛽1 𝑁 − 𝛽2 σ𝑖=1 𝑋𝑖 = 0
bˆ1 = Y − bˆ2 X bˆ2 =
( X i − X )2 ◼ Esta suma es cero, dada la primera ecuación normal

2. La recta ajustada pasa por el punto de medias ( X ,Y )


 Demostración

Se divide la primera ecuación normal σ𝑁 ෠ ෠ 𝑁


𝑖=1 𝑌𝑖 = 𝑁 𝛽1 + 𝛽2 σ𝑖=1 𝑋𝑖
En resumen: El método de MCO escoge bˆ1 y b̂ 2 de tal manera que, para

por N.
una muestra dada, proporciona valores estimados únicos deN β1 y β2 ◼ 𝑌ത = 𝛽෠1 + 𝛽෠2 𝑋ത
que producen el valor más pequeño o reducido posible de  uˆi
2

i =1 3. La suma de los productos cruzados de los residuos con la variable explicativa es


cero, es decir, σ𝑁
𝑖=1 𝑢
ො 𝑖 𝑋𝑖 = 0
 Demostración σ𝑁 ො 𝑖 𝑋𝑖 = σ𝑁
𝑖=1 𝑢
መ መ 𝑁 መ 𝑁 መ 𝑁 2
𝑖 𝑌𝑖 − 𝛽1 − 𝛽2 𝑋𝑖 𝑋𝑖 = σ𝑖=1 𝑌𝑖 𝑋𝑖 − 𝛽1 σ𝑖=1 𝑋𝑖 − 𝛽2 σ𝑖=1 𝑋𝑖 = 0

◼ Esta suma es cero, dada la segunda ecuación normal.


Tema 2: Modelos de regresión 25 Tema 2: Modelos de regresión 26

2.2. Propiedades descriptivas de los estimadores MCO 2.2. Propiedades descriptivas de los estimadores MCO
4. La suma de los productos cruzados de los residuos con Yˆt es cero: Nota: Existen dos tipos de propiedades que no hay que
𝑁 confundir bajo ningún concepto.
෍ 𝑢ො 𝑖 𝑌෠𝑖 = 0
𝑖=1 Las propiedades numéricas o descriptivas: Provienen del
método de cálculo (MCO), sin considerar cómo se generan los
 Demostración:
datos (2.2).
Las propiedades estadísticas: Se mantienen sólo bajo ciertos
◼ Teniendo en cuenta la propiedad 1 y 3, se tiene que
supuestos o hipótesis sobre la forma en cómo se generan los
datos.
Hipótesis Estadísticas en el método de regresión lineal. (Tema 4.1)

Propiedades probabilísticas o estadísticas de los


estimadores MCO (Tema 4.2)

Tema 2: Modelos de regresión 27 Tema 2: Modelos de regresión 28

2.3. Interpretación de los coeficientes: la claúsula ceteris 2.3. Interpretación de los coeficientes: la claúsula ceteris paribus
paribus Ejemplo:
Ejemplo: Cálculo de MCO. Estimar por MCO los parámetros del siguiente modelo: 𝑋−𝑋ҧ (𝑌−𝑌)ҧ
Notai = β1 + β2 Horasi + ui
Calcule además la suma de cuadrados de la regresión. Por si acaso compruebe que
se satisfacen las propiedades descriptivas de los estimadores MCO del MRLS.

bˆ1 = Y − bˆ2 X bˆ2 =  i


( X − X )(Yi − Y )
( X
2
i − X)
Tema 2: Modelos de regresión 29 Tema 2: Modelos de regresión 30

2.3. Interpretación de los coeficientes: la claúsula ceteris paribus 2.3. Interpretación de los coeficientes: la claúsula ceteris paribus
Ejemplo:
Ejemplo:
¿Cuánto subiría la nota si se dedica una hora más a estudiar?
¿Cómo se han calculado las estimaciones para los dos parámetros?
El efecto marginal = pendiente de la recta = 0,38: si estudia una hora más la nota
sube 0,38 puntos (aproximadamente 4 décimas)
La recta estimada es: Yi = b1 + b2 Xi + ui y eso implica en el ejemplo:
La cláusula ceteris paribus implica que se observa el efecto marginal de una hora más
Ŷi = 3, 75+ 0,38Xi de estudio sin que cambie ninguna otra variable que podría afectar el resultado (el
resto de condicionantes deben permanecer constantes): salud, nervios en el examen,
Con la estimación de los parámetros del modelo, podemos calcular los errores o
..., si son factores relevantes, y están explícitamente en el modelo:
residuos de la estimación y los valores de predicción que nos interesen.
Notai = β1 + β2 Horasi + β3 Nota selectivoi + β4 Nerviosi + ui
¿Qué nota obtendría un alumno que dedica 9 horas a estudiar (como María)? 7.17
¿Cuál es el error de estimación (de María)? 0.83
La cláusula ceteris paribus implicaría evaluar el cambio en la nota generado por una
hora adicional de estudio, sin que haya cambiado la nota del selectivo o los nervios,
el resto de variables permanecería constante.

Tema 2: Modelos de regresión 31 Tema 2: Modelos de regresión 32

2.4. Formas funcionales alternativas: efecto marginal o 2.4. Formas funcionales alternativas: efecto marginal o elasticidad
elasticidad. Unidades de medida
Ajuste lineal: Yi = b1 + b2Xi + ui
A veces suponer que una recta es la mejor manera de hacer el ajuste a una
nube de puntos no es lo más adecuado. Implica que el cambio en 1 ud.
de X siempre tiene el mismo
efecto en Y, con independencia
de su valor.

Si obtenemos la variación de Y generada por una variación en X, en el margen,


es decir, el efecto marginal:

dYi /dXi = b2,


La interpretación de los coeficientes dependerá de la forma funcional que se
haya elegido para al ajuste. donde “d” es el operador diferencial (denota cambios infinitesimalmente
pequeños).
Hay que tener presente en todo momento que el modelo debe ser lineal en
los parámetros para estimar a través de MCO. La pendiente de la recta nos da una medida de las unidades de cambio en Yi
cuando la Xi varía una unidad adicional.
Tema 2: Modelos de regresión 33 Tema 2: Modelos de regresión 34

2.4. Formas funcionales alternativas: efecto marginal o elasticidad 2.4. Formas funcionales alternativas: efecto marginal o elasticidad

Términos, a los que se hace referencia frecuentemente: ¿Qué es el coeficiente de la pendiente b2?
• Cambio absoluto

• Cambio relativo o proporcional

Figura 6. Fuente: Gujarati, D. y Porter D.C. (2010) Econometría


(5ª Edición). McGraw-Hill.
• Cambio relativo en términos porcentuales o tasa de crecimiento
En la práctica, si el cambio en X (o Y) es pequeño, cambio en d(lnX) es un cambio
relativo en X. Así, para cambios pequeños tenemos:

Por tanto, el coeficiente mide el cambio relativo en Y ante un cambio relativo en X en términos
porcentuales:

Si X cambia un 1% : (ΔX/X) = 1% Y cambiará (ΔY/Y) = β2%

El modelo supone que el coeficiente de la elasticidad entre Y y X, β2, permanece constante a


través del tiempo, de aquí su otro nombre es modelo de elasticidad constante.

Tema 2: Modelos de regresión 35 Tema 2: Modelos de regresión 36

2.4. Formas funcionales alternativas: efecto marginal o elasticidad 2.4. Formas funcionales alternativas: efecto marginal o elasticidad
Modelo log-lin
Modelo log-log β2 > 0 β2 < 0

Si multiplicamos el cambio relativo en Y por 100,


dará el cambio porcentual, en Y ocasionada por un
cambio absoluto en X. Es decir, 100 por β2 da como
resultado la tasa de crecimiento en Y.

β2 > 1 β2 < 0
Modelo lin-log
0 < β2 < 1 β2 > 0 β2 < 0

Si multiplicamos el cambio relativo en X por 100 da el cambio


absoluto en Y ocasionado por un cambio porcentual en X. Es decir,
1/100 por β2 da como resultado el cambio absoluto en Y.
Tema 2: Modelos de regresión 37 Tema 2: Modelos de regresión 38

2.4. Formas funcionales alternativas: efecto marginal o elasticidad 2.4. Formas funcionales alternativas: efecto marginal o elasticidad
El modelo recíproco: Modelo recíproco
logarítmico:

A medida que X aumenta indefinidamente, el término β2(1/X) Al principio Y se incrementa con una tasa creciente (es decir, la curva es
se acerca a cero (nota: β2 es una constante) y Y se aproxima al convexa al inicio) y luego aumenta con una tasa decreciente (la curva se
valor límite o asintótico β1. convierte en cóncava).

Ejemplo: Una función de producción de corto plazo. La relación entre


producto y mano de obra de corto plazo con capital constante.

Tema 2: Modelos de regresión 39 Tema 2: Modelos de regresión 40

2.4. Formas funcionales alternativas: efecto marginal o elasticidad 2.4. Formas funcionales alternativas: efecto marginal o elasticidad
Modelos de regresión
polinomial:

β2 > 0 β2 > 0 β2 < 0


β3 > 0 β3 < 0 β3 > 0

Un polinomio de segundo grado en la variable X; la mayor potencia de X


representa el grado del polinomio Tabla 5. Fuente: Gujarati, D. y Porter D.C. (2010) Econometría (5ª Edición). McGraw-Hill.

Ejemplo: log-log

Algunos modelos inicialmente no lineales en los parámetros pueden linealizarse


aplicando logaritmo al modelo.
Tema 2: Modelos de regresión 41 Tema 2: Modelos de regresión 42

2.4. Formas funcionales alternativas: efecto marginal o elasticidad 2.4. Formas funcionales alternativas: Unidades de medida

Unidades de medida
• Cambio en la escala de la explicativa: X
Si X se multiplica (divide) por un valor constante τ, el coeficiente que la acompaña, la
pendiente, β2, también se divide (multiplica) por el mismo valor:
X
Yˆi = bˆ1 + ( bˆ2 ) ( i )
Por ejemplo:

si Cons i = 2,3 + 0,67 Renta i con la renta expresada en miles de euros, será Cons i = 2,3
+ 670 Renta i cuando expresamos la renta en millones.

• Cambio en la escala de la endógena: Y


Tabla 6. Wooldridge, J (2016). Introducción a la econometría. 5 ed. Cengage Learning.
Si Y se multiplica o divide por un valor constante τ, la ordenada en el origen, β1, y la
pendiente, β2, también se multiplican o dividen respectivamente por el mismo valor:
(Yˆi  ) = bˆ1  + (bˆ2  ) X i
Por ejemplo:
si Cons i = 2,3 + 0,67 Renta i con el consumo expresado en miles de euros, será
Cons i = 2300 + 670 Renta i cuando expresamos el consumo en euros.

Tema 2: Modelos de regresión 43 Tema 2: Modelos de regresión 44

2.4. Formas funcionales alternativas: Unidades de medida 2.5. Medidas de bondad de ajuste y selección de modelos
Unidades de medida: El coeficiente de determinación (R2) es un indicador de la bondad del ajuste MCO.
N

• Cambio en el origen  (Yˆ − Yˆ )


i
2
Por tanto, R2 es la proporción de la varianza muestral
Si se suma/resta una constante τ en X, y/o Y, la pendiente MCO no se ve afectada. No R2 = i =1
N de Y explicada por la regresión, es decir, por el modelo.
obstante, si se cambia el origen de X, y/o Y el término independiente de la regresión sí
se verá afectado.
 (Y − Y )
i =1
i
2

Si se resta una constante τ en X, el término independiente cambia de la siguiente Partiendo de la igualdad Yi = Yˆi + uˆi Cada observación está formada por una parte
manera: explicada (parte sistemática o determinista) y una no explicada.
Yˆi = (bˆ1 + bˆ2 ) + bˆ2 ( X i − )
SUMA TOTAL DE LOS CUADRADOS (STC) σ𝑵 𝒊=𝟏 𝒀𝒊 − 𝒀
ഥ 𝟐
Medida de la varianza muestral total de las Yi. Indicador del grado de dispersión de la
Si se resta una constante τ en Y, el término independiente cambia de la siguiente variable a explicar en la muestra.
manera:
SUMA EXPLICADA DE LOS CUADRADOS (SEC) σ𝑵 ෡ ഥ 𝟐
(Yˆi − ) = (bˆ1 − ) + bˆ2 X i 𝒊=𝟏 𝒀𝒊 − 𝒀
Medida de la varianza muestral de los valores ajustados. Indicador del grado de
Por ejemplo: dispersión de las variables predichas en la muestra.
si Cons i = 2300 + 670 Renta i y hay una reducción en la renta constante e igual en 5
unidades, entonces Cons i = 5650 + 670(Renta i-5). SUMA DE LOS CUADRADOS DE LOS RESIDUOS (SCR) σ𝑵 ෝ 𝟐𝒊
𝒊=𝟏 𝒖
Medida de la varianza muestral de los residuos. Indicador del grado de dispersión de
los residuos en la muestra
Tema 2: Modelos de regresión 45 Tema 2: Modelos de regresión 46

2.5. Medidas de bondad de ajuste y selección de modelos 2.5. Medidas de bondad de ajuste y selección de modelos
El coeficiente de determinación (R2) es un indicador de la bondad del ajuste MCO. STC = SCR + SEC
Bondad de Ajuste:
𝑁 𝑁
2

ሜ 2 = ෍ 𝑌𝑖 − 𝑌෠𝑖 + (𝑌෠𝑖 − 𝑌)
෍(𝑌𝑖 − 𝑌)
𝑖=1 𝑖=1
𝑁
2

= ෍ 𝑢ො 𝑖 + (𝑌෠𝑖 − 𝑌)
𝑖=1

𝑁 𝑁 𝑁

= ෍(𝑢ො 𝑖 )2 + 2 ෍(𝑌෠𝑖 − 𝑌)
ሜ 𝑢ො 𝑖 + ෍(𝑌෠𝑖 − 𝑌)
ሜ 2
𝑖=1 𝑖=1 𝑖=1
𝑁

= 𝑆𝐶𝑅 + 2 ෍(𝑌෠𝑖 − 𝑌)
ሜ 𝑢ො 𝑖 + 𝑆𝐸𝐶
𝑖=1
Visión de Ballentine de R2: a) R2=0 ; f) R2=1

El círculo Y representa la variación en la variable dependiente Y, y el círculo X, la variación en la variable =0


explicativa X. 21 La intersección de los dos círculos (el área sombreada) indica la medida en la cual la
variación en Y se explica por la variación en X (por ejemplo, mediante una regresión de MCO).
Fuente: Guajarati y Porter (5ª edición)

Tema 2: Modelos de regresión 47 Tema 2: Modelos de regresión 48

2.5. Medidas de bondad de ajuste y selección de modelos 2.5. Medidas de bondad de ajuste y selección de modelos
El coeficiente de determinación (R2) es un indicador de la bondad del ajuste MCO. El coeficiente de determinación (R2) es un indicador de la bondad del ajuste MCO.

Bondad de Ajuste: medida de la capacidad de la relación lineal establecida entre


la variable a explicar (Y) y la variable explicativa (X) para explicar (Y)
STC = SEC + SCR
Coeficiente de determinación R2: proporción de la variación explicada en
Variación total de Y (STC) = Variación explicada en la Variación residual, comparación con la variación total. Fracción de la variación muestral de Y que
regresión (SEC) + no explicada en la viene explicada por X.
regresión (SCE) 𝑆𝐸𝐶 𝑆𝐶𝑅
𝑅2 = =1−
𝑆𝑇𝐶 𝑆𝑇𝐶
N N
¿Qué parte de la variación total de Y es explicada Parte de la variación total de Y  (Yˆ − Y )
i
2
 (uˆ ) i
2

por la regresión? → BONDAD DE AJUSTE NO explicada por la regresión R =


2 i =1
N
R = 1−
2
N
i =1

 (Y − Y )
i =1
i
2
 (Y − Y ) i
2

i =1

R2 no varía al hacer cambios de unidades de X y/o Y, y tampoco ante cambios de origen


Tema 2: Modelos de regresión 49 Tema 2: Modelos de regresión 50

2.5. Medidas de bondad de ajuste y selección de modelos 2.5. Medidas de bondad de ajuste y selección de modelos
El coeficiente de determinación (R2) es válido, en general, para cualquier modelo
lineal o no lineal (si se considera como varianza explicada con la que se obtiene R2 es el cuadrado del coeficiente de correlación entre X e Y , rXY (sólo en el
después de haber hecho el ajuste correspondiente). Sólo puede comparar modelos modelo de regresión lineal simple).
con la misma endógena.
2
N
 N 
R2 Está acotado entre 0 y 1.  (Yˆi − Yˆ ) 2  (Yi − Y )( X i − X ) 
• Si el ajuste es perfecto, todas las observaciones pasarán por la recta de regresión, R 2 = iN=1 = N i =1 N
 = r2
XY

, y por tanto, R2=1.


 (Yi − Y )  (Yi − Y )  ( X i − X ) 2
i =1
2

i =1
2

i =1

N N N
• Si la varianza explicada es nula  (Yˆ − Yˆ )
i =1
i
2
=0 ,  (Y − Y ) =  (uˆ )
i =1
i
2

i =1
i
2
y por R2 no es adecuado cuando el modelo no tiene término constante. En este caso, no se
tanto , R2=0.
puede garantizar , por tanto Yi  Yˆ y R2 puede ser negativo.

Tema 2: Modelos de regresión 51 52

2.5. Medidas de bondad de ajuste y selección de modelos


Otros indicadores de la bondad del ajuste:
Referencias
𝑆𝐶𝑅 2(𝑘 + 1)
Criterio de Información de Akaike (AIC): 𝐴𝐼𝐶 = 1 + ln( 2𝜋) + ln
𝑁
+
𝑁
• Básicas
CRITERIO: Menor valor del AIC implica un mejor ajuste del modelo. • Gujarati, D. y Porter D.C. (2010) Econometría (5ª
a) No es una medida de la bondad del ajuste en sí misma, pero sí permite Edición). McGraw-Hill.
comparar modelos (aunque no tengan la misma variable endógena) • Complementarias
b) AIC puede aplicarse a modelos sin término constante. • Wooldridge, J (2016). Introducción a la econometría. 5
c) AIC penaliza la introducción de regresores adicionales, por lo que permite
comparar modelos con diferente número de regresores. ed. Cengage Learning.
d) El AIC tampoco se utiliza directamente para comparar modelos con diferente • Uriel E. (2019) Introducción a la Econometria. Libro
endógena. Se requerirá una transformación adecuada. electrónico. Universitat de València. (Castellano,
Valencià, english) https://www.uv.es/uriel/libroin.htm
SI comparamos un modelo con Y, Modelo 1, y otro con ln(Y), Modelo 2, como
endógenas, el estadístico AIC corregido para el modelo 2 se calcula como:

AICc = AIC2 +2 ln(Y) y lo compararemos con el AIC del modelo 1.


1
Grado en Economía 2022-2023 2

eCONOMETRÍAI Prácticas 2 y 3
- Tema 2-

Profesor:
Marko Petrovic
Correo electrónico: marko.petrovic@uv.es
Despacho: 3C01
Tutorías: miércoles 10.30-12.00
miércoles 16.00-17.30
online

Ejercicio 1 3
Ejercicio 2 4

Con la información que se muestra en la siguiente tabla: Dados los siguientes modelos de regresión:

a. Especifica un modelo de regresión lineal simple donde 𝑌 es la


variable dependiente y 𝑋 es la variable independiente. Donde , demuestre que los estimadores de mínimos
b. Estimar el modelo con las ecuaciones normales, con las ecuaciones cuadrados verifican que:
directas y con una computadora.
c. Escriba la ecuación de regresión estimada.
d. Interpreta la estimación que acompaña a la variable independiente
o explicativa.
e. Calcula los valores ajustados o predichos de la variable
dependiente.
f. Calcula los residuos.
g. Presenta los puntos de las observaciones (diagrama de dispersión o
scatter plot) y el ajustado línea de regresión y enseña los valores
ajustados y los residuos.
Ejercicio 3 5
Ejercicio 4 6

Dados los siguientes modelos de regresión: En un modelo de regresión lineal simple, ¿cuál es el efecto de
multiplicar tanto el dependiente como los variables independientes
por la misma constante?

Donde , demuestre que los estimadores de mínimos


cuadrados verifican que:

Ejercicio 5 7
Ejercicio 6 8

Dado el siguiente modelo de regresión: Dado el siguiente modelo de regresión:

Si se suma/resta una constante τ en X, y/o Y, como se verá afectada la 1. Deduzca la fórmula para estimar el parámetro b.
pendiente y la constante de la regresión.
2. En este modelo, ¿a qué es igual ?

Ejercicio 7
Aplicar el modelo de mínimos cuadrados ordinarios para estimar en el

modelo . ¿A qué es igual ?


Ejercicio 8 9
Ejercicio 8 - continuación 10

Un zoólogo cree que existe una relación lineal entre el peso y la a. Especifique un modelo de regresión lineal simple que relacione el
longitud de ciertos mamíferos. Para estudiar esta relación se dispone peso con la longitud de los animales
de la siguiente muestra de veinte animales: b. Estime este modelo con una computadora
c. Interpreta la estimación de la pendiente
d. ¿Cuánto pesará un animal si mide 45 centímetros de largo?
e. Si un animal mide tres centímetros más que otro, ¿qué diferencia
de peso se puede esperar?
f. Si el peso se expresa en gramos y la longitud en centímetros, ¿qué
estimación se obtiene?
g. Si el peso se expresa en kilogramos y la longitud en metros, ¿qué
estimación se obtiene?
h. Interpreta R cuadrado y explica como se puede calcular utilizando
la tabla de los resultados de Gretl.
donde PESO se expresa en kilogramos y LONGITUD en centímetros.

Ejercicio 9 11

El conjunto de datos hprice2_tema2_ej9.gdt contiene información


sobre precios de las viviendas y sus características. La variable price es
el precio de las viviendas en miles de dólares y variable crime son
delitos cometidos per cápita.

a. Muestra un gráfico que relacione los precios y delitos.


b. ¿Según dicho gráfico qué se podría decir sobre la relación entre
ambas variables?
c. Plantea y estima por MCO un modelo econométrico que relacione
el los precios de las viviendas y delitos.
d. Interprete los parámetros (betas) estimados de dicho modelo.

También podría gustarte