Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ECONOMETRÍA
MODELIZACIÓN E INFORMACIÓN ECONÓMICA Y
CONSTRUCCIÓN DE MODELOS ECONOMÉTRICOS
ÍNDICE
CAPÍTULO 1. RESUMEN DE TODOS LOS TEMAS IMPARTIDOS…………………………….……..3
CAPÍTULO 2. DESARROLLO TEMARIO………………………………………………………………………18
Tema 4. MODELIZACIÓN E INFORMACIÓN ECONÓMICA………………………………………..…18
4.1 La modelización en economía………………………………………………………………………………18
4.1.1 Econometría, fundamentos y naturaleza……………………………………………………18
4.1.2 Propósitos de la econometría……………………………………………………………………20
4.2 Construcción de modelos econométricos…………………………………………………………….24
4.2.1 Tipos de modelos……………………………………………………………………………………….24
4.2.2 Modelos algebraicos……………………………………………………………………………...….28
4.2.3 Modelos econométricos…………………………………………………………………………….30
4.3 Información económica y modelización……………………………………………………………….34
4.3.1 Los datos en el análisis económico…………………………………………………………….34
4.3.2 Fuentes de datos………………………………………………………………………………………..35
4.3.3 Datos, información y modelización…………………………………………………………….35
Tema 5. CONSTRUCCIÓN DE MODELOS ECONOMÉTRICOS…………………………………….….38
5.1 Modelo Básico de Regresión I: Especificación y Estimación………………………………….38
5.1.1 Supuestos del MLG………………………………………………………………………………….…38
5.1.1.1 Supuestos simplificadores………………………………………………………………..40
5.1.1.2 Término de perturbación estocástica……………………………………………….43
5.1.1.3 Supuestos referentes a las perturbaciones aleatorias………………………46
5.1.2 Especificación de los Modelos Econométricos……………………………………………49
5.1.3 Estimación de los Modelos Econométricos…………………………………………………52
5.1.3.1 Estimación mediante MCO…………………………………………………………...…52
5.1.3.2 Propiedades del estimador MCO……………………………………………………..54
5.1.3.3 Estimación de la varianza residual de los estimadores MCO………..….62
5.1.3.4 Estimación MV…………………………………………………………………………………62
CAPÍTULO 3. EJERCICIOS RESUELTOS…………………………………………………………………...…66
Ejercicio Nº1………………………………………………………………………………………………………………66
Ejercicio Nº2………………………………………………………………………………………………………………69
CAPÍTULO 4. COMPETENCIA APLICADA EN CADA CASO SEGÚN LA GÚIA DOCENTE…71
2
UCLM-2014/2015
Yeferson Valencia Quispe
La gráfica I.1. puede ser concebida como un diagrama de flujo que muestra de
manera sistemática cómo se combinan y utilizan eventualmente las distintas partes de
un estudio econométrico.
3
UCLM-2014/2015
Yeferson Valencia Quispe
Modelo verbal/ lógico: Este enfoque emplea analogías verbales, tales como la
metáfora y el símil; el modelo resultante a menudo se denomina un “paradigma”.
Modelo físico: En ciertos casos el sistema del mundo real es físico y puede
obtenerse un modelo mediante un ajuste a escala apropiado, hacia arriba o hacia abajo.
4
UCLM-2014/2015
Yeferson Valencia Quispe
Series temporales:
5
UCLM-2014/2015
Yeferson Valencia Quispe
Datos transversales:
Datos combinados:
Consiste en series temporales para cada unidad de corte transversal del conjunto
de datos. Por ejemplo, supongamos que tenemos un registro de datos sobre el salario, la
educación, el historial de empleo, o datos financieros o de inversión durante un periodo
de cinco años. A diferencia de los datos combinados, los datos de panel mantiene el
registro de las mismas unidades de sección cruzada (individuos, empresas…) durante un
periodo de tiempo determinado
6
UCLM-2014/2015
Yeferson Valencia Quispe
- Lagunas estadísticas
- Cambios metodológicos
B) Atribuibles al método de obtención
- Errores de muestreo
- Errores de observación o medida
C) Cambios estructurales
- Cambios estructurales entre individuos
- Cambios estructurales en el tiempo
D) Problemas técnicos
Problemas derivados de la técnica a utilizar:
- Grados de libertad
- Variables no observables: variables “proxy”.
- Multicolinealidad ( dependencia entre variables explicativas)
- Autocorrelación serial
Gran parte del análisis econométrico comienza con las siguiente premisa: Y y X
son dos variables que representan a una población, y estamos interesados en “explicar Y
en términos de X” o “ estudiar cómo varía Y con los cambios de X”.Una ecuación que
relacione Y y X, y una forma simple de hacerlo sería:
(2.1)
7
UCLM-2014/2015
Yeferson Valencia Quispe
Hay que tener en cuenta que esta distinción varía dependiendo del modelo econométrico
en particular y su objetivo. Así, una exógena en un modelo puede pasar a ser la
endógena de otro. Ej. C f (Y ) y Y f (M ) , donde M es cantidad de dinero.
Variables continuas: pueden tomar valores en todos los puntos de la recta real (
C e Y ).
Variables discretas: sólo toman valores en algunos puntos de la recta real.
Ct 1 2Yt t
Esta hipótesis supone que las k variables explicativas del modelo son aquellas
variables relevantes que explican el comportamiento de la endógena. Y que están todas.
No existe ninguna variable xi que no explique nada de la y . Es decir, el modelo está
bien planteado o especificado.
(a) Aceptar que siempre hay una teoría detrás que me permite saber cuáles
son las variables relevantes en cada modelo.
(b) Aceptar que sobre estas variables dispongo siempre de información
muestral adecuada.
8
UCLM-2014/2015
Yeferson Valencia Quispe
Esta hipótesis implica que los datos de las variables explicativas son fijos en
muestras repetidas.
Existen tres situaciones en Econometría donde no es posible mantener esta hipótesis:
La razón por la que no metemos todas las variables posibles en un modelo se debe a las
siguientes causas:
9
UCLM-2014/2015
Yeferson Valencia Quispe
10
UCLM-2014/2015
Yeferson Valencia Quispe
Generalmente se representa:
11
UCLM-2014/2015
Yeferson Valencia Quispe
De modo matricial:
Conviene remarcar que el estimador está definida, siempre que la matriz X´X
sea invertible, eso ocurre cuando: las k variables explicativas del modelo sean
independientes entre sí; o cuando la matriz X es de orden nxk (salvo que haya
multicolinealidad) sea invertible.
12
UCLM-2014/2015
Yeferson Valencia Quispe
yˆ ˆ
t 1
t t 0.
Demostración:
Yˆ T Yˆ ˆ T X T X ˆ ˆ T X T Y
10. En el MLG con término constante estimado por MCO, la propiedad 8 se cumple cuando
las variables se expresan en desviaciones con respecto a sus medias, es decir:
(Y iY )T (Y iY ) (Yˆ iYˆ )T (Yˆ iYˆ ) (ˆ iˆ )T (ˆ iˆ )
( y y ) ( yˆ y ) ˆ
t
2
t
2
t
2
Demostración: operando y 2
t ny 2 yˆt2 ny 2 ˆt2 , que se corresponde con la
propiedad 8.
13
UCLM-2014/2015
Yeferson Valencia Quispe
13. El vector de residuos mínimo-cuadráticos, es una transformación lineal del vector del
término de error:
ɛ^=y-X β^=y-X(XTX)-1XTy=My=Mu
donde M es la matriz M= IT-X(XTX)-1XT que es singular simétrica e idempotente, y
donde la última igualdad viene de MX= OTXk.
14. Coeficiente de determinación: SCT,SCE,SCR. El vector de residuos mínimo-cuadráticos
tienen esperanza cero y matriz de covarianzas σ² ɛM gracias a la propiedad anterior.
La medida de ajuste más conocida es el llamado coeficiente de determinación o R 2 del
modelo definido como:
SE SR
R2 1
ST ST
15. Coeficiente de determinación.
R2 =
Con lo cual:
R2 = =
17. El coeficiente de determinación es siempre menor o igual que las dos sumas del SCR y
SCT, son por definición, dos números positivos, entonces su cociente lo será también,
con lo que R2≤ 1.
18. Si una de las variables explicativas es constante, entones se tienen que el R2≥ 0. Una
vez probado que la SCT= SCE + SCR, al ser cantidades positivas, necesariamente el
SCE≤ SCR, con lo que (SCR/ SCT) ≤ 1. Por tanto, tenemos que el R2≥0.
19. Cuando disponemos de menos observaciones que parámetros a estimar (T < K), el
estimador MCO no estará explícitamente definido. Est se debe a que con T-K el
14
UCLM-2014/2015
Yeferson Valencia Quispe
reango de la matriz X es menor que K y lo mismo pasa su X´X, que será singular,
condenando al sistema de ecuaciones normales a infinitas soluciones.
20. Cuando el término de error sigue una distribución Normal, el estimador MCO seguirá
también una distribución Normal.
En primer lugar, puede ser engañoso mirar solo el R2 sin mirar los datos.
Muchas veces R2 es muy alto en relaciones espúreas.
K= n- k=
2. Estos nuevos regresores pueden mejorar el modelo en términos de ajuste, es
decir,
K RS R2
Como ejemplo, supongamos que se han estimado dos funciones de consumo alternativo:
Donde dividiendo por n la Suma Residual y la Suma Total; esta medida se puede
interpretar como un ratio de varianzas.
15
UCLM-2014/2015
Yeferson Valencia Quispe
ˆ t
2
ˆT ˆ
ˆ 2 t 1
nk nk
ˆ Y Yˆ Y X ˆ Y X ( X T X )1 X T Y [ I X ( X T X )1 X T ]Y MY
2 ln L( )
I E , siendo 2
2
2 4 (n k )
En el caso MV, el estimador de 2 tiene una varianza igual a que es
n n
inferior a la Cota de Cramer Rao. No obstante, en este caso el estimador MV es
sesgado. Lo que sí es cierto es que no existe un estimador insesgado de 2 que alcance
la cota.
16
UCLM-2014/2015
Yeferson Valencia Quispe
Esto se demuestra:
Simbólicamente:
17
UCLM-2014/2015
Yeferson Valencia Quispe
Con el objetivo de resaltar los aspectos más relevantes, a la vez que perseguimos
una mayor comprensión de los fundamentos básicos de econometría, en este tema
seguiremos de lleno el libro de Modelos econométricos, técnicas y aplicaciones de
Michael D. Intriligator. Por lo que el primer paso es saber qué significa econometría.
Definición de econometría
18
UCLM-2014/2015
Yeferson Valencia Quispe
La gráfica I.1. puede ser concebida como un diagrama de flujo que muestra de
manera sistemática cómo se combinan y utilizan eventualmente las distintas partes de
un estudio econométrico.
20
UCLM-2014/2015
Yeferson Valencia Quispe
q= q (p) (1.4.1)
21
UCLM-2014/2015
Yeferson Valencia Quispe
(1.4.2)
(1.4.3)
22
UCLM-2014/2015
Yeferson Valencia Quispe
La gráfica I.3 ilustra una función lineal de consumo, dando el valor en dólares
del gasto total en consumo, C, como una función del valor en dólares del ingreso
nacional, Y (por ejemplo, PIB). En general, la función consumo es una curva
ascendente pero tiene una pendiente menor a la unidad; es decir, el ingreso adicional
produce un consumo adicional pero también conduce a ahorros adicionales. La
pendiente de la curva se denomina la propensión marginal al consumo, PMC, y por lo
tanto se supone positiva pero inferior a la unidad. Así, en este caso de una función lineal
de consumo.
(1.5.1)
Por los dos puntos mostrados en la gráfica I.3, la PMC puede estimarse como
(1.5.2)
23
UCLM-2014/2015
Yeferson Valencia Quispe
Definición de Modelo
Por lo general, para lograr maleabilidad hay que efectuar diversos procesos de
idealización, entre los que se incluyen la eliminación de influencias “extrañas” y la
simplificación de procesos. Normalmente este proceso de idealización hace que el
modelo sea menos “realista”, no obstante, el proceso es necesario para asegurar que el
sistema modelo pueda ser manipulado en términos razonables.
Entre los tipos de modelos más importantes que encontramos, todas ellas,
implican formas alternativas de representación de un modelo.
Modelo verbal/ lógico: Este enfoque emplea analogías verbales, tales como la
metáfora y el símil; el modelo resultante a menudo se denomina un “paradigma”. En
economía, dos de los primeros paradigmas, y todavía mejores paradigmas fueron
desarrollados por el fundador de la disciplina, Adam Smith. El primero fue la fábrica de
alfileres, y el segundo, el de la “mano invisible”.
Modelo físico: En ciertos casos el sistema del mundo real es físico y puede
obtenerse un modelo mediante un ajuste a escala apropiado, hacia arriba o hacia abajo.
Así, es común que un alerón para un nuevo avión sea probado por medio de la
construcción en pequeña escala y a través de un túnel de viento. Esta representación es
realista en tanto que las influencias omitidas (por ejemplo, el esquema de colores al
interior de la cabina) son en realidad ajenas. Al mismo tiempo, es maleable en el sentido
de que puede ser construida y probada fácilmente y sin demasiado coste.
24
UCLM-2014/2015
Yeferson Valencia Quispe
25
UCLM-2014/2015
Yeferson Valencia Quispe
ejemplo, a D'D', porque tal variación hacia afuera de la demanda implica que, a
cualquier precio dado, mayor cantidad será demandada.
Si se supone que estos gastos son exógenos (determinados por algún otro
mecanismo), la cantidad total de gasto puede ser mostrada gráficamente mediante la
adición al consumo, para cada nivel de ingreso nacional, de este gasto exógeno.
26
UCLM-2014/2015
Yeferson Valencia Quispe
La curva resultante, mostrada en la gráfica II.3, puede ser interpretada como una
curva de demanda del PNB, indicando la cantidad total demandada por los
consumidores y por otras unidades (autónomas) de gasto. Como el eje horizontal es el
ingreso nacional, la línea de 45° también mide el ingreso nacional y puede ser
interpretada como la oferta del PNB.
La función de oferta agregada es una función muy sencilla que establece que
cualquier cantidad demandada (C+Z) será abastecida (Y). Así, la ecuación de oferta,
que marca la igualdad entre C+Z y Y, es una igualdad y no una identidad, y refleja la
habilidad de los empresarios para ofrecer cualquier cantidad de producción que se
demande.
También debería observarse que sólo son significativos los puntos sobre la línea
de 45° en este modelo, ya que cualquier otro punto violaría los supuestos bajo los cuales
se construye la curva de oferta. La curva y la línea se intersectan a un nivel de PNB que
es un nivel de equilibrio –esto es, donde la demanda y la oferta se igualan.
Ambos modelos son útiles para indicar las principales relaciones entre las
variables fundamentales que representan los fenómenos bajo investigación. No obstante,
como el número de dimensiones disponible es limitado, es necesario restringir los
modelos geométricos a relativamente pocas variables. Para tratar con más variables, es
usual que se emplee un modelo algebraico en vez de un modelo geométrico.
27
UCLM-2014/2015
Yeferson Valencia Quispe
(2.4.1)
(2.4.2)
(2.4.3)
(2.4.4)
Las últimas dos ecuaciones están escritas como identidades porque definen Y0 y
C0, respectivamente. A estas alturas, debería observarse que el modelo y el equilibrio
obtenido son exactamente como en la gráfica II.3; los modelos algebraico y geométrico
constituyen diferentes representaciones del mismo modelo de determinación del ingreso
nacional.
(2.4.5)
28
UCLM-2014/2015
Yeferson Valencia Quispe
El modelo también contiene otras variables, llamadas variables exógenas, que son
determinadas fuera del sistema pero que lo influyen afectando los valores de las
variables endógenas. Las variables exógenas afectan al sistema pero no son afectadas
por él. Aquí el gasto exógeno es una variable de ese tipo.
29
UCLM-2014/2015
Yeferson Valencia Quispe
Por supuesto, hay una amplia gama de formas funcionales disponibles para un
modelo algebraico; y la elección de una en particular depende de la aceptabilidad
teórica, la plausibilidad, la facilidad de estimación, la bondad del ajuste, la capacidad de
predicción, etcétera.
30
UCLM-2014/2015
Yeferson Valencia Quispe
Tercero: Una tercera razón es que, a menudo, un modelo puede ser transformado en
un modelo lineal. La transformación logarítmica puede emplearse en muchos casos. A
continuación destacamos los principales ejemplos que se pueden dar.
31
UCLM-2014/2015
Yeferson Valencia Quispe
Que expresa la producción como una función general del capital y el trabajo. Si
la función es continua, puede ser aproximada como una función lineal en un rango apro-
piado simplemente tomando la porción lineal de la serie de expansión de Taylor. Al
expandir alrededor de los niveles base de (K0, L0)
Donde la función y sus derivadas parciales son todas evaluadas al nivel base.
Así, en un pequeño rango alrededor del punto (K0, L0)
32
UCLM-2014/2015
Yeferson Valencia Quispe
33
UCLM-2014/2015
Yeferson Valencia Quispe
Para terminar este punto, cabe distinguir, entre modelos econométricos estáticos
o dinámicos. Un modelo estático no involucra dependencia explícita del tiempo, de
modo que el tiempo no es esencial en el modelo.
34
UCLM-2014/2015
Yeferson Valencia Quispe
datos combinados, los datos de panel mantiene el registro de las mismas unidades de
sección cruzada (individuos, empresas…) durante un periodo de tiempo determinado.
Debemos decidir entonces cómo expresar los datos (en cantidades nominales o
reales, totales o per cápita, niveles absolutos o relativos…). Además debemos decidir si
utilizamos variables “proxy”.
Por otro lado, en muchas ocasiones, los datos que disponemos hay que tratarlos
de distinta manera (eliminando la tendencia, ajuste estacional para poder comparar
series y centrarnos en el fenómeno de interés, etc.).
Lagunas estadísticas: por diversas razones, no siempre existen todos los datos
referentes a un fenómeno, bien por conflictos bélicos, bien por otros problemas.
Entonces procedemos a la aplicación de fórmulas de interpolación y
extrapolación.
Cambios metodológicos: cuando extraemos información de una fuente
estadística, debemos prestar atención a los posibles cambios en la variable.
- Cambios metodológicos conceptuales: cambia la denominación de la
variable que recoge el fenómeno en estudio.
- Cambios en los criterios de valoración: la misma variable se obtiene por
agregación distinta a la que se venía obteniendo.
- Cambios en el año base de referencia.
35
UCLM-2014/2015
Yeferson Valencia Quispe
G) Cambios estructurales
Son cambios debido a que los datos son estructuralmente heterogéneos provocados por:
H) Problemas técnicos
36
UCLM-2014/2015
Yeferson Valencia Quispe
- Homogeneización de series.
- Solución de problemas técnicos.
= Componente tendencial
= Componente cíclica
= Componente estacional
= Componente errática
- Esquema de composición:
Aditivo:
Multiplicativo:
Mixto:
- Análisis clásicos de series:
Series de alta frecuencia
Series de baja frecuencia
- Análisis de tendencia:
Determinación de la tendencia
o Técnicas de alisado: alisado por medias móviles y alisado
exponencial.
o Ajuste de funciones matemáticas:
Eliminación de la tendencia:
o Cálculo de tasas de crecimiento
o Diferenciación de series
Análisis de estacionalidad
o Tipos de estacionalidad.
o Técnicas de análisis de estacionalidad rígida.
o Técnicas de análisis de estacionalidad no rígida
o Métodos de desestacionalización CENSUS II: algoritmo X-1
37
UCLM-2014/2015
Yeferson Valencia Quispe
Gran parte del análisis econométrico comienza con las siguiente premisa: Y y X
son dos variables que representan a una población, y estamos interesados en “explicar Y
en términos de X” o “ estudiar cómo varía Y con los cambios de X”.
1. Dado que nunca se da una relación exacta entre dos variables, ¿cómo permitir
que otros factores afecten a Y?
2. ¿Cuál es la relación funcional existente entre Y y X?
3. ¿Cómo podemos asegurarnos de estar captando una relación ceteris paribus
*entre Y y X (siempre y cuando éste sea el objetivo buscado)?
(2.1)
, si
38
UCLM-2014/2015
Yeferson Valencia Quispe
Variables Exógenas: explican a la endógena pero no pueden estar influidas por ella.
Puede haber k variables explicativas y son denotadas por x1 , x2 ,..., xk .
Hay que tener en cuenta que esta distinción varía dependiendo del modelo
econométrico en particular y su objetivo. Así, una exógena en un modelo puede pasar a
ser la endógena de otro. Ej. C f (Y ) y Y f (M ) , donde M es cantidad de
dinero.
Variables continuas: pueden tomar valores en todos los puntos de la recta real ( C e Y ).
Un ejemplo son las variables ficticias que toman valor uno o cero. La idea es
que hay características que no se pueden medir (en euros, en kilos, etc.), pero que
pueden ser factores relevantes a la hora de explicar a otra variable. Por ejemplo, en la
función de consumo familiar, además de la renta, el hecho de que la familia viva en el
campo o en la ciudad puede ser relevante para explicar diferencias en el consumo. Para
ello, se construye una variable ficticia que toma uno para las familias que viven en la
39
UCLM-2014/2015
Yeferson Valencia Quispe
ciudad y cero para las que viven en el campo ( Di ) y se introduce como una exógena
más en el modelo.
Ct 1 2Yt t
donde 1 y 2 son los parámetros de esta relación. No hay que confundir esta hipótesis
de linealidad con la linealidad entre las variables. Por ejemplo, en las relaciones entre y
y x que se dan a continuación, sólo la primera es formalmente lineal. Sin embargo,
cumplen la hipótesis de linealidad en los parámetros las tres:
y 1 2 x
y 1 2e x
y 1 2 ln x
Y AK L
ln Y ln A ln K ln L
40
UCLM-2014/2015
Yeferson Valencia Quispe
C a bY c
donde a, b y c son los parámetros que caracterizan esta relación. En este caso, habría
que estimar estos tres parámetros dada una muestra de C y Y. Contrastar una relación
lineal entre C y Y, equivale a contrastar si el parámetro c es unitario o no.
Esta hipótesis supone que las k variables explicativas del modelo son aquellas
variables relevantes que explican el comportamiento de la endógena. Y que están todas.
No existe ninguna variable xi que no explique nada de la y . Es decir, el modelo está
bien planteado o especificado.
a. Aceptar que siempre hay una teoría detrás que me permite saber cuáles
son las variables relevantes en cada modelo.
b. Aceptar que sobre estas variables dispongo siempre de información
muestral adecuada.
Esta hipótesis supone que los parámetros 1 , 2 ,..., k son constantes en el tiempo.
41
UCLM-2014/2015
Yeferson Valencia Quispe
Esta hipótesis implica que cada variable explicativa contiene información adicional
sobre la endógena que no está contenida en otras. Si hubiera información repetida,
habría variables explicativas dependientes linealmente de otras. Formalmente, se puede
resumir la información muestral sobre las k variables explicativas (regresores) en una
matriz, denotada por X , de tamaño n k con la siguiente estructura:
x11 x1k
x xnk
n1
donde cada columna recoge los datos asociados a cada variable x . El hecho de que
cada columna sea linealmente independiente de las otras implica que el rango de la
matriz X es completo, es decir, igual a k . Si alguna variable x es linealmente
dependiente de otra, decimos que existe un problema de multicolinealidad exacta.
Esta hipótesis implica que los datos de las variables explicativas son fijos en
muestras repetidas. Es decir, el valor de las variables explicativas es constante en la
función de distribución de la endógena.
pt c dqto 2t
qtd qto , t 1, 2, ,n
42
UCLM-2014/2015
Yeferson Valencia Quispe
(6.2) Modelos dinámicos en los que aparecen como regresores sucesivos retardos de la
variable endógena. Por ejemplo, si en la relación entre consumo y renta se supone un
modelo dinámico como:
Ct 1 2Ct 1 3Yt t
Ct 1 1 2Ct 2 3Yt 1 t 1
(6.3) Modelos con errores de medida en las variables explicativas. Bajo la hipótesis de
renta permanente de Friedman, el consumo sólo depende del componente permanente
de la renta ( Yt P ):
Ct bYt P t
Yt Yt P YtT
Los valores que toma la regresora X pueden considerarse fijos en muestras repetidas (el
caso de la regresora fija), o haber sido muestreados junto con la variable dependiente Y
(el caso de la regresora estocástica). En el segundo caso se supone que la(s) variable(s)
X y el término de error son independientes, esto es, cov (Xi, ui )= 0.
La razón por la que no metemos todas las variables posibles en un modelo se debe a las
siguientes causas:
43
UCLM-2014/2015
Yeferson Valencia Quispe
1. Vaguedad de la teoría
44
UCLM-2014/2015
Yeferson Valencia Quispe
pesar de todos los esfuerzos que se inviertan. Las perturbaciones, u, pueden reflejar muy
bien esta aleatoriedad intrínseca.
6. Principio de parsimonia
45
UCLM-2014/2015
Yeferson Valencia Quispe
Una situación en la que se incumple esta hipótesis, es cuando a su vez, se incumple otra,
como es omitir en el modelo una variable relevante. Si la verdadera función de consumo
es
Ct a bYt cit t
donde it es un tipo de interés y se trabaja con un modelo que omite esta variable:
Ct a bYt t
Por otro lado, los valores negativos de la perturbación estocástica se compensan con
valores positivos y no representan ningún efecto en la variable. Geométricamente, este
supuesto se representa mediante una gráfica, como en la figura 3.3, que muestra algunos
valores de la variable X y las poblaciones Y asociadas a cada uno de ellos. Puede
46
UCLM-2014/2015
Yeferson Valencia Quispe
47
UCLM-2014/2015
Yeferson Valencia Quispe
1 1
E . = .
n n
Sería una matriz que recoge las varianzas de cada variable en la diagonal
principal y las covarianzas entre una perturbación y otra diferente fuera de la diagonal.
Es simétrica, definida positiva y de tamaño n n .
48
UCLM-2014/2015
Yeferson Valencia Quispe
n(n 1)
Los elementos diferentes de dicha matriz son . No obstante, si la
2
muestra disponible es de tamaño n , ya no tenemos grados de libertad para caracterizar
n(n 1)
el término de error, ya que habría que estimar n medias y varianzas y
2
covarianzas distintas. Las hipótesis (7) hacen que el vector de medias sea nulo y la
matriz de var-cov una matriz diagonal, en donde sólo habría que estimar la varianza
constante 2 , ya que por ausencia de autocorrelación todas las covarianzas son cero.
49
UCLM-2014/2015
Yeferson Valencia Quispe
Generalmente se representa:
50
UCLM-2014/2015
Yeferson Valencia Quispe
c) Relación funcional: existe una relación lineal entre las variables, por dos motivos
fundamentales: primero, porque empíricamente, la experiencia econométrica ha
demostrado que con las relaciones lineales entre varias variables se consiguen
aproximaciones suficientemente válidas para explicar el comportamiento de los
fenómenos reales, segundo, porque ciertas relaciones no lineales pueden transformarse
fácilmente en lineales mediante un cambio de variable. Por ejemplo:
51
UCLM-2014/2015
Yeferson Valencia Quispe
Relación A
52
UCLM-2014/2015
Yeferson Valencia Quispe
También consideramos el vector formado por los coeficientes del modelo β= (β1,
β2…βk), y el vector formado por los términos de error de los distintos periodos
muestrales U= (U1, U2,…UT), con lo que podremos escribir las T relaciones mostradas
en la Relación A, mediante una notación matricial.
Y=Xβ+U
Una vez que hemos estimado los coeficientes β, se puede estimar cada instante t:
Y la cuestión que surge es, si estamos ante el valor realmente estimado, y esta
consideración nos hace que haya una discrepancia.
A partir de aquí, podremos generar una serie de T residuos que representan en forma
matricial un vector Tx1, por lo tanto será:
U^=Y-Y^=Y-X β^.
De modo matricial:
53
UCLM-2014/2015
Yeferson Valencia Quispe
Conviene remarcar que el estimador está definida, siempre que la matriz X´X
sea invertible, eso ocurre cuando: las k variables explicativas del modelo sean
independientes entre sí; o cuando la matriz X es de orden nxk (salvo que haya
multicolinealidad) sea invertible.
54
UCLM-2014/2015
Yeferson Valencia Quispe
donde se han usado las hipótesis de (1) parámetros constantes, (2) regresores fijos e
independientes linealmente y (3) esperanza nula del término de error.
y, finalmente, aplicando las hipótesis de que las perturbaciones tienen esperanza nula,
varianza constante y ausencia de autocorrelación:
var(ˆ ) 2 ( X T X )1
4. En el MLG con o sin término constante estimado por MCO, los residuos son
ortogonales a las variables explicativas, es decir:
n
X T ˆ 0 . En términos escalares, x ˆ
t 1
ti t 0, i 1, 2,..., k .
X T X ˆ X T Y X T (Y X ˆ ) 0 X T ˆ 0
6. En el MLG con término constante estimado por MCO, la media muestral de los
residuos es nula, es decir, ˆ 0 .
55
UCLM-2014/2015
Yeferson Valencia Quispe
iT X ˆ iT Y iT (Y X ˆ ) 0 iT (Y Yˆ ) 0 iT ˆ 0 ˆt 0
iT X ˆ iT Y iT Yˆ iT Y yˆt yt
8. En el MLG con o sin término constante estimado por MCO, los residuos son
ortogonales a la variable endógena ajustada, es decir: Yˆ T ˆ 0 . En términos escalares,
n
yˆ ˆ
t 1
t t 0.
Yˆ T ˆ 0 ( X ˆ )T ˆ 0 ˆ T X T ˆ 0
9. En el MLG con o sin término constante estimado por MCO, la suma de cuadrados de
la variable endógena real es igual a la suma de cuadrados de la variable ajustada más la
suma de cuadrados de residuos, es decir: Y T Y Yˆ T Yˆ ˆT ˆ . O bien, escrita en términos
escalares,
n n n
y yˆ ˆ
t 1
2
t
t 1
2
t
t 1
t
2
.
ˆT ˆ (Y X ˆ )T (Y X ˆ ) Y T Y 2ˆ T X T Y ˆ T X T X ˆ
Finalmente: Yˆ T Yˆ ˆ T X T X ˆ ˆ T X T Y
10. En el MLG con término constante estimado por MCO, la propiedad 9 se cumple
cuando las variables se expresan en desviaciones con respecto a sus medias, es decir:
56
UCLM-2014/2015
Yeferson Valencia Quispe
( y y ) ( yˆ y ) ˆ
t
2
t
2
t
2
y operando y2
t ny 2 yˆt2 ny 2 ˆt2 , que se corresponde con la propiedad 9.
57
UCLM-2014/2015
Yeferson Valencia Quispe
Como se explicó, se dice que un estimador, por ejemplo, el estimador de MCO βˆ2, es
el mejor estimador* lineal insesgado óptimo (ELIO) de β 2 si se cumple lo siguiente:
Estimador*: “una regla que puede aplicarse a cualquier muestra de datos para
producir un valor estimado”
12. La suma residual (suma de los cuadrados de los residuos mediante MCO), se denota
de la siguiente forma:
Otra forma de denotar la suma residual, como diferencia entre la suma de los cuadrados
de las observaciones y la suma de los cuadrados de los valores de yt implicados por el
modelo Y^t:
ɛ^=y-X β^=y-X(XTX)-1XTy=My=Mu
58
UCLM-2014/2015
Yeferson Valencia Quispe
SE SR
R2 1
ST ST
R2 =
Mide la bondad del ajuste del modelo de regresión que estamos estudiando.
Tenemos nuestro modelo MLG que es por ejemplo que cumple las
hipótesis. Al establecer el modelo donde
con lo cual
17. El coeficiente de determinación es siempre menor o igual que las dos sumas del
SCR y SCT, son por definición, dos números positivos, entonces su cociente lo será
también, con lo que R2≤ 1.
18. Si una de las variables explicativas es constante, entones se tienen que el R 2≥ 0. Una
vez probado que la SCT= SCE + SCR, al ser cantidades positivas, necesariamente el
SCE≤ SCR, con lo que (SCR/ SCT) ≤ 1. Por tanto, tenemos que el R2≥0.
19. Cuando disponemos de menos observaciones que parámetros a estimar (T < K), el
estimador MCO no estará explícitamente definido. Est se debe a que con T-K el reango
de la matriz X es menor que K y lo mismo pasa su X´X, que será singular, condenando
al sistema de ecuaciones normales a infinitas soluciones.
20. Cuando el término de error sigue una distribución Normal, el estimador MCO
seguirá también una distribución Normal.
En primer lugar, puede ser engañoso mirar sólo el R 2 sin mirar los datos.
Muchas veces, el R 2 es muy alto en relaciones espúreas. El ejemplo más famoso en la
literatura econométrica es la relación entre el Nº de nacimientos en un año en los EEUU
y el Nº de cigueñas en ese mismo año y estados. La estimación del modelo que explica
el Nº de nacimientos en función del Nº de cigueñas proporciona un R 2 muy elevado y
esto sabemos que es espúreo. La razón es que en ese año la correlación muestral entre
ambas variables fue muy alta y aunque no hay ninguna relación causal entre ambas, el
coeficiente de determinación es bueno, pero engañoso.
disminuye la suma residual y éste es positivo. Si el peso del efecto negativo es mayor
que la mejora en el ajuste, no compensará introducir esta nueva variable y a la inversa.
n 1
R2 1 (1 R 2 )
nk
(2) Esos nuevos regresores pueden mejorar el modelo en términos de ajuste, es decir:
k SR R2 R 2 . Si el efecto de penalización es menor que el efecto de
mejora en el ajuste, el R 2 aumentará e indicará que compensa la introducción de esas
nuevas variables y a la inversa.
ˆ ˆ ; R 2 0.80
Ct aˆ bYt t
ˆ ci
Ct aˆ bY ˆ t ˆt ; R 2 0.87
t
SR SR / n
R2 1 1
ST ST / n
donde dividiendo por n la Suma Residual y la Suma Total, esta medida se puede
interpretar como un ratio de varianzas. Implantando la restricción de que los
estimadores de las varianzas residual y de la variable endógena sean insesgados, se
obtiene el R 2 corregido de los grados de libertad:
SR / n k n 1
R2 1 1 (1 R 2 )
ST / n 1 nk
61
UCLM-2014/2015
Yeferson Valencia Quispe
ˆ t
2
ˆT ˆ
ˆ 2 t 1
nk nk
ˆ Y Yˆ Y X ˆ Y X ( X T X )1 X T Y [ I X ( X T X )1 X T ]Y MY
1/ 2 1
f ( ) (2) n / 2 exp ( )T 1 ( )
2
1
f ( ) (2) n / 2 2 n / 2 exp 2 T
2
f (Y ) f ( )
Y
62
UCLM-2014/2015
Yeferson Valencia Quispe
Por tanto:
1
f (Y ) f ( ) (2) n / 2 2 n / 2 exp 2 (Y X )T (Y X ) L( , 2 )
2
n n 1
max ln L( , 2 ) ln 2 ln 2 2 (Y X )T (Y X )
2 2 2
ln L( , 2 ) 1
2 (2 X T Y 2 X T X ) 0 ˆMV ( X T X ) 1 X T Y
2
ln L( , 2 ) n (Y X )T (Y X ) 1 ˆT ˆ
4
0 ˆ 2
2 2 2
MV
2 n
Por tanto, el estimador MV de coincide con el MCO, pero no es así para el estimador
de la varianza de las perturbaciones, 2 . En concreto, sabemos que el estimador MV de
la varianza de las perturbaciones no es insesgado, ya que para que lo sea es necesario
ponderar la suma de cuadrados de residuos por los grados de libertad, n k .
63
UCLM-2014/2015
Yeferson Valencia Quispe
XT X
2 0
H
0 n
4
2
2 ln L( )
I E , siendo 2
2
Tomando las derivadas segundas a las condiciones de primer orden, se tiene que:
2 ln L( , 2 ) XT X
2
2
2 ln L( , 2 ) X T [ X Y ]
( )( 2 ) 4
2 ln L( , 2 ) n [Y X ]T [Y X ]
( 2 )( 2 ) 2 4 6
y formando el hessiano:
XT X X T[X Y ]
2 4
H
n [Y X ]T [Y X ]
2 4
6
XT X XTX
E 2 2
X T [ X Y ] X T
E E 4 0
4
n [Y X ]T [Y X ] n E[ T ] n n 2 n
E 4 6 4
2 2 2 2
6 4 6 4
64
UCLM-2014/2015
Yeferson Valencia Quispe
Puesto que la matriz de información es diagonal por bloques, su inversa también y tiene
la expresión:
2 ( X T X ) 1 0
I 1
2 4
0
n
Esta matriz indica que la cota inferior para la varianza de un estimador insesgado de
es 2 ( X T X )1 y la cota inferior para la varianza de un estimador insesgado de 2 es
2 4
la expresión .
n
En el caso MCO y MV, el estimador de tiene una matriz de varianzas que alcanza la
cota exactamente, luego es eficiente.
2 4
En el caso MCO, el estimador de 2 tiene una varianza igual a (ver Apéndice 2),
nk
que supera a la Cota de Cramer Rao. En este caso, no podemos hablar de eficiencia.
2 4 (n k )
En el caso MV, el estimador de 2 tiene una varianza igual a (ver
n n
Apéndice 2), que es inferior a la Cota de Cramer Rao. No obstante, en este caso el
estimador MV es sesgado. Lo que sí es cierto es que no existe un estimador insesgado
de 2 que alcance la cota.
65
UCLM-2014/2015
Yeferson Valencia Quispe
TABLA 2.
66
UCLM-2014/2015
Yeferson Valencia Quispe
Nota:
Figura 1.
Con los datos presentados en esta tabla, la línea de regresión estimada se obtiene como
sigue:
67
UCLM-2014/2015
Yeferson Valencia Quispe
Como sabemos, cada punto de la línea de regresión da una estimación del valor
medio de Y que corresponde al valor seleccionado de X; es decir, es una estimación
de . El valor de , que mide la pendiente de la linea, indica que,
dentro del intervalo muestral de X entre 6 y 18 años de escolaridad, a medida que el
valor de X aumenta un dólar, el incremento estimado en el salario promedio por hora es
cercano a 72 centavos de dólar. Es decir, cada año adicional de escolaridad, en
promedio, produce aumentos en los salarios por hora de alrededor de 72 centavos de
dólar.
Antes de dejar este ejemplo, observe que el modelo es muy sencillo. La teoría
económica laboral indica que, aparte de la escolaridad, las variables como género, raza,
ubicación, sindicatos e idioma son también factores importantes en la determinación de
los salarios por hora. Después de estudiar la regresión múltiple en los capítulos 7 y 8,
consideraremos un modelo más amplio de determinación de los salarios.
68
UCLM-2014/2015
Yeferson Valencia Quispe
EJERCICIO 2.
SOLUCIÓN:
No son estocásticamente independientes entre sí, porque las covarianzas deberían ser
ceros, además se distribuyen como una Normal.
69
UCLM-2014/2015
Yeferson Valencia Quispe
70
UCLM-2014/2015
Yeferson Valencia Quispe
71