Econometría I

@ramirovillamey Universidad Central del Ecuador
@SEYA_Ecu Facultad de Ciencias Económicas

Ramiro Villarruel Meythaler
2021
ECONOMETRÍA: Medición Económica
 La Econometría es una disciplina basada en el
desarrollo de modelos probabilísticos y de métodos de
inferencia estadística, para el estudio de relaciones
económicas, la contrastación de teorías económicas o la
evaluación e implementación de políticas económicas o
empresariales (Alonso).
 La Econometría combina elementos de:
μ Teoría Económica.
μ Matemáticas.
μ Estadística.
✓ La Econometría nos ayuda a responder interrogantes
económicas y sociales tales como:
β Efectos de una subida de las Tasas de Interés en el Volumen de Crédito del
Sector Financiero Nacional.
β Efectos de un Programa de Capacitación en la Productividad o en el Salario de
los Trabajadores.
β Efectos del Bono de Desarrollo Humano (BDH) en la Escolaridad o Tasa de
Mortalidad de los Niños Pobres de Ecuador.
β Efecto del Tamaño de la Clase en el Rendimiento Escolar.
β Rendimientos Esperados de diversas estrategias de Inversión.
β Efectos de una campaña publicitaria.
β Impacto de los Seguros Médicos Privados en el aporte al Seguro Social.
 Uno de los principales objetivos de la Econometría es realizar
Análisis Causal, es decir, analizar cualitativa y cuantitativamente
como ciertos factores afectan a una variable asociada a un
fenómeno económico de interés.
 El Análisis Causal permite:

δ Determinar los efectos de ciertas políticas (caracterizados por cambios en
determinados factores que afectan al fenómeno de interés).
δ Caracterizar y cuantificar la relación de comportamiento entre variables
económicas, de acuerdo con lo que sugiere la teoría económica.
δ Simular los efectos de políticas alternativas.
 Efecto Causal de la Educación en el Salario
Es el incremento salarial que conseguiría un individuo de la población
objeto de estudio si, manteniéndose constantes sus demás
características, tuviera un nivel mayor de educación.
Los estudios empíricos encuentran que el efecto causal de tener un

título universitario suponen un salario que es, en promedio, un 40%
mayor que el de los que no tienen un título universitario.
 Otro objetivo de la Econometría es intervenir en el Análisis Empírico,
es decir, emplear datos para cuantificar una relación o contrastar una
teoría.
 El diseño de un Análisis Empírico se estructura de los siguientes

elementos:
Ω Modelo Económico.
Ω Modelo Econométrico.
Ω Datos.
 La Teoría Económica propone modelos que explican el
comportamiento de una o varias variables, Y1, Y2,..., Yi, en función de
otra u otras variables, X1, X2,...,Xi, que se determinan fuera del modelo.
 El modelo planteado puede ser mas o menos formal.
∞ Modelo Formal: Ecuaciones matemáticas que describen relaciones

entre variables, basados en la maximización de la utilidad
(consumidores), o beneficio (empresas), sujeto a diversas
restricciones.
∞ Modelo Informal: Su descripción se inspira en la teoría y en aspectos

mas intuitivos.
 El Modelo Económico, de manera mas o menos formal, permite
expresar Y a través de una ecuación del tipo:
Y = f (X1, . . . ,Xi )
 Habitualmente, la función f (X) no queda caracterizada por la teoría.

Dicha función depende del modelo de decisión subyacente, que rara
vez se conoce.
 Función de la Oferta y Demanda de un Bien Agrícola
Demanda: Q= f1(P, R)
Oferta: Q= f2(P, Ll)
Q= Cantidades, P= Precios, R= Renta y, Ll= Lluvias
Y1= Q,Y2= P, X1= R, X2= Ll
 Modelo de Capital Humano
Ec. Salarial: W= f1(S, EX)

Ec. Educación: S= f2(Sp, Sm)
W= Salario, S= Años de Estudios, Ex= Años de Experiencia Laboral, Sp= Nivel Educativo del
Padre, Sm= Nivel Educativo de la Madre.
Y1= W, Y2= S, X1= EX, X2= Sp, X3= Sm
 Curva de Engel
G= f(GT)
Y1= G= Gasto de un Bien, X1= GT= GastoTotal
 El Modelo Econométrico permite cuantificar y contrastar las relaciones
entre variables postuladas por los modelos económicos a partir de los
datos (Evidencia Empírica).
 Este modelo recoge la naturaleza estocástica que gobierna las

relaciones entre variables.
 El modelo establece como tratar el problema de las variables que,

aunque postuladas por el Modelo Económico, no pueden observarse.
 El modelo parametriza f(X), la forma funcional estableciendo una

relación entre Y y X1, ……, Xk por medio de parámetros constantes.
 Dada la naturaleza aleatoria de las variables económicas (tanto
exógenas como endógenas), es de esperar que cada uno de los datos
no cumpla exactamente cada una de las ecuaciones que especifica un
modelo económico. Sin embargo, siempre se puede encontrar un
conjunto de funciones que satisfaga:
E [Y – f (X1, . . . ,Xk)] = 0
 Esta naturaleza aleatoria de las relaciones económicas se puede

expresar a través de un error inobservable de la siguiente manera:
Y = f (X1, . . . ,Xk)] + μ
 Dependiendo del problema a analizar, del interés de investigador y de la
naturaleza de los datos se formulan diferentes tipos de modelos
econométricos.
 Algunos tipos de modelos econométricos son:
- Los modelos univariantes emplean exclusivamente la información que

contienen los datos disponibles de una única variable.
- Los modelos multivariantes emplean la información que contienen los
datos disponibles de varias variables.
- Los modelos uniecuacionales formulan la existencia de una relación
entre una variable (endógena) y otras que inciden sobre esta (exógenas).
- Los modelos multiecuacionales formulan la existencia de una relación
simultanea entre diversas variables.
 Predicción de la Evolución de la Inflación π del país x
- Si disponemos solo de la serie de tiempo anterior de la inflación puedo formular un

modelo univariante para π, de manera que π = f (pasado de π).
- Si disponemos de datos de otras variables que inciden sobre la inflación (tipos de
interés, variación de la oferta monetaria, crecimiento económico, etc.) puedo
formular un modelo multivariante para π, es decir, π = f (pasado de π, otras
variables).
- Modelos uniecuacionales, π = f (pasado de π, otras variables).

- Modelos multiecuacionales, Demanda: Q= 1 + 2R + 3P + .
Oferta: Q= 1 + 2P + 3Ll + .
 Las variables de un modelo económico representan aspectos del
comportamiento de los agentes económicos en el ámbito individual o
agregado.
 Los economistas observan, directamente o de forma aproximada, el

comportamiento y características de los agentes. Esta observación
constituye la evidencia empírica, los datos:
- Datos de Corte Transversal.

- Datos de Series de Tiempo.
- Datos de Panel.
 Existen diversas escuelas de pensamiento sobre la metodología
econométrica de investigación. La más utilizada es la metodología
tradicional o clásica, la misma que aún predomina en la investigación
empírica en economía y en las ciencias sociales y del comportamiento.
1. Planteamiento de la teoría o de la hipótesis.

2. Especificación del modelo matemático de la teoría.
3. Especificación del modelo econométrico o estadístico de la teoría.
4. Obtención de datos.
5. Estimación de los parámetros del modelo econométrico.
6. Pruebas de hipótesis.
7. Pronóstico o predicción.
8. Utilización del modelo para fines de control o de políticas.
 Planteamiento de la teoría o de la hipótesis
Keynes plantea:
La ley psicológica fundamental… consiste en que los hombres (y las

mujeres), como regla general y en promedio, están dispuestos a incrementar
su consumo a medida que aumenta su ingreso, pero no en la misma cuantía
del aumento en su ingreso (Keynes, 1936).
Keynes postula que la Propensión Marginal a Consumir (PMC), es decir, la

tasa de cambio del consumo generado por una unidad (un dólar) de
cambio en el ingreso, es mayor que cero pero menor que uno.
 Especificación del modelo matemático
Keynes, después de haber postulado una relación positiva entre el consumo y el ingreso no
especifica la forma precisa de la relación funcional entre ambas variables.
Un economista matemático puede proponer la siguiente forma de la Función Keynesiana de

Consumo:
Y =  1 +  2X
En la función keynesiana de consumo, el consumo (gasto)

es la variable dependiente, y el ingreso, la explicativa.
Fuente: Gujarati (2010)

 Especificación del modelo econométrico o estadístico
El modelo matemático de la función de consumo es de interés limitado para el
econometrista, pues supone una relación exacta o determinista entre el consumo y el
ingreso. Pero las relaciones entre las variables económicas suelen ser inexactas.
Para dar cabida a relaciones inexactas entre las variables económicas, el econometrista
modificaría la función determinista de consumo en la ecuación de la siguiente manera:
Y =  1 +  2X + 
Modelo de Regresión Lineal

 Obtención de datos
Para estimar el modelo económico y econométrico, dada una ecuación planteada,
es necesario la obtención de los valores numéricos de  1 y  2, son necesarios los
datos.
La variable Y en esta ecuación es el Gasto de Consumo Personal (GCP) agregado

(para la economía en su conjunto).
La variable X, el Producto Interno Bruto (PIB), una medida del ingreso agregado.
 Pruebas de hipótesis
En el supuesto de que el modelo ajustado sea una aproximación razonablemente
buena de la realidad, tenemos que establecer criterios apropiados para comprobar
si los valores estimados obtenidos en una ecuación concuerdan con las
expectativas de la teoría que estamos probando.
Tal confirmación o refutación de las teorías económicas con fundamento en la

evidencia muestral se basa en una rama de la teoría estadística conocida como
Inferencia Estadística (Pruebas de Hipótesis).
 Utilización del modelo para fines de control o de políticas
Suponemos tener la función keynesiana de consumo estimada. Además, suponemos que el

gobierno considera que un nivel de gasto de aproximadamente 8750 (miles de millones)
mantendrá la tasa de desempleo en su nivel actual de cerca de 4.2% (estimación para
principios del 2006).
¿Qué nivel de ingreso garantizará la cantidad de gasto de consumo fijado como meta?
8750 = −299.59 + 0.72(X=PIB2006)

X=PIB2006 = 12537
Un nivel de ingresos de alrededor de 12537 (miles de millones), con una PMC de cerca de
0.72, producirá un gasto aproximado de 8750 millones de dólares.
Como indican estos cálculos, un modelo estimado sirve para fines de control o de políticas
públicas. Mediante una mezcla apropiada de política fiscal y monetaria, el gobierno puede
manejar la variable de control X para producir el nivel deseado de la variable objetivo Y.
 El término Regresión fue introducido por Francis Galton.
 En su ensayo Family Likeness in Stature (1886), Galton, planteó que la

estatura de los hijos de los padres altos y bajos tienden a regresar hacia
la estatura promedio de la población.
 La Ley de Regresión Universal de Galton fue confirmada por Karl

Pearson en On the Laws of Inheritance (1903), descubrió que la estatura
promedio de los hijos de un grupo de padres de estatura alta era
menor que la estatura de sus padres, y que la estatura promedio de los
hijos de un grupo de padres de estatura baja era mayor que la estatura
de sus padres; es decir, los registros “regresan” por igual a la estatura
promedio de todos los demás.
 Regresión a la Mediocridad.
 El análisis de regresión trata del estudio de la dependencia de una
variable (variable dependiente) respecto a una o más variables
(variables explicativas) con el objeto de estimar o predecir el valor
promedio poblacional de la primera en términos de los valores
conocidos o fijos de las segundas.
- Galton: Razones de estabilidad.

- Moderno: Estatura promedio.

 En el análisis de regresión nos interesa lo que se conoce como
Dependencia Estadística entre variables, pero no la Determinista o
Funcional propia de la física clásica.
 En las relaciones estadísticas entre variables tratamos esencialmente

con variables aleatorias o estocásticas; es decir, variables que tienen
distribuciones de probabilidad.
 En las relaciones deterministas o funcionales también manejamos

variables, pero no son aleatorias o estocásticas.
 La palabra estocástica proviene de la palabra griega stokhos que

significa centro del blanco. El resultado de lanzar dardos sobre un
tablero es un proceso estocástico, pues este proceso genera errores.
 El análisis de regresión se relaciona con la dependencia de una variable
respecto de otras variables, pero esto no implica causalidad
necesariamente.
 Una relación estadística, sin importar que tan fuerte sea, nunca podrá
establecer una conexión causal: nuestras ideas de causalidad deben
provenir de estadísticas externas y, en último término, de una u otra
teoría (Kendall y Stuart, 1961).
 El Análisis de Correlación está estrechamente relacionado con el de regresión,
aunque conceptualmente los dos son muy diferentes.
 En el análisis de correlación se mide la fuerza o el grado de asociación lineal

entre dos variables. El Coeficiente de Correlación mide esta fuerza de
asociación (lineal). En el análisis de regresión se estima o predice el valor
promedio de una variable sobre la base de valores fijos de otras variables.
 La regresión y la correlación presentan diferencias fundamentales.
 En el análisis de regresión hay una asimetría en el tratamiento que se da a las

variables dependientes o explicativas. La variable dependiente es estadística,
aleatoria o estocástica, es decir, que tiene una distribución de probabilidad. Por
su parte, las variables explicativas tienen valores fijos (en muestras repetidas).
 En el análisis de correlación se trata de dos variables cualesquiera en forma

simétrica; no hay distinción entre las variables dependientes y las explicativas.
Yi =  1 +  2Xi + μi
Yi = Variable Dependiente, Explicada o Endógena
Xi = Variable Independiente, Explicativa o Exógena
 i = Parámetros o Coeficientes de Regresión
μi = Perturbación Estocástica
 El análisis de regresión simple es el que se realiza a dos variables, una dependiente y una
explicativa.
 El análisis de la regresión múltiple es el que se realiza con más de dos variables, una
dependiente y más de una explicativa.
Yi =  0 +  1X1 +  2X2 + ……… +  kXk + μi

i = Datos de CorteTransversal
t= Datos de Series deTiempo
 El análisis de regresión se relaciona en gran medida con la estimación o
predicción de la media (de la población) o valor promedio de la variable
dependiente, con base en los valores conocidos o fijos de las variables
explicativas.

 Desde el punto de vista geométrico, una Curva de Regresión Poblacional (CRP)
es el lugar geométrico de las medias condicionales de la variable dependiente
para los valores fijos de la(s) variable(s) explicativa(s). En otras palabras, es la
curva que conecta las medias de las subpoblaciones de Y que corresponden a
los valores dados de la regresora X.

 Cada media condicional E(Y | Xi) es función de Xi.
E(Y | Xi) = f(Xi)

- Donde ƒ(Xi) denota una función de la variable explicativa X, y
- E(Y | Xi) es una función lineal de Xi.
 Esta ecuación toma el nombre de Función de Esperanza Condicional (FEC),

Función de Regresión Poblacional (FRP) o Regresión Poblacional (RP) y denota
que los valores esperados de las distribuciones de Y están relacionados
funcionalmente con Xi. Suponiendo que el gasto de consumo está relacionado
linealmente con el ingreso.
E(Y | Xi) = 1 + 2 Xi
- Donde 1 y 2 son parámetros no conocidos que se llaman Coeficientes de
Regresión cuya estimación es el interés del análisis de regresión.
- E(Y | Xi) =  1 +  2 Xi es la función que permite estimar los coeficientes de
regresión con base en la Función de Regresión Lineal Poblacional.
 Como se ha demostrado, a medida que aumenta el ingreso familiar, el consumo familiar,
en promedio, también aumenta.
 A su vez, el consumo de una familia en particular no necesariamente aumenta a medida

que lo hace el nivel de ingreso.
 μi es una variable aleatoria no observable que adopta valores positivos o negativos.

Técnicamente, μi se conoce como Perturbación Estocástica o Término de Error
Estocástico. En términos estadísticos son desviaciones respecto a la media, que
sustituyen o representan las variables omitidas o ignoradas que pueden afectar a Y, pero
que están (o pueden no estar) incluidas en el modelo de regresión.
- E(Y | Xi) = 1 + 2 Xi
-Yi =  1 +  2Xi + μi (Reemplazar)
Por un lado, el promedio de las
-Yi = E(Y | Xi) + μi ( Multiplicar E(…) ) perturbaciones estocásticas es igual
- EX(Yi) = E[E(Y | Xi) + μi] a cero porque son desviaciones con
respecto a la media. Por otro lado, lo
- E(Yi | Xi) = E[E(Y | Xi) + E(μi | Xi) anterior implica que la recta de
- E(Yi | Xi) = E(Y | Xi) + E(μi | Xi) regresión pase a través de las
- E(μi | Xi) = 0 medias condicionales de Y.
 Vaguedad de la teoría.
 Falta de disponibilidad de datos.
 Variables centrales y variables periféricas.
 Aleatoriedad intrínseca en el comportamiento humano.
 Variables representantes (proxy) inadecuadas.
 Principio de parsimonia.
 Forma funcional incorrecta.

 El análisis se ha centrado en la perspectiva de valores poblacionales,
ahora se considerarán valores muestrales que es el problema práctico
del análisis de regresión.
C60,10 = 60!
10! x 50!
Muestra 1 Muestra 2

 La estimación tanto de la regresión poblacional como de la regresión muestral se la
obtiene a través de los siguientes métodos de estimación:
- Mínimos Cuadrados Ordinarios (MCO) y,

- Máxima Verosimilitud (MV).
 El método de MCO es el más común en el análisis de regresión, sobre todo por ser mucho
más intuitivo y matemáticamente más sencillo que el método de máxima verosimilitud.
 En el contexto de la regresión lineal, por lo general los dos métodos proporcionan

resultados similares.
…….. continúa
…….. continúa
 En estadística, la precisión de un valor estimado se mide por su error estándar (ee).
 El ee es la desviación estándar de la distribución muestral del estimador, y la distribución

muestral de un estimador es tan sólo una probabilidad o distribución de frecuencias del
estimador, es decir, una distribución del conjunto de valores del estimador obtenidos de
todas las muestras posibles de igual tamaño de una población dada.
 La bondad del ajuste de la línea de regresión a un conjunto de datos se la mide a través
del coeficiente de determinación; es decir, veremos cuán bien se ajusta la línea de
regresión a los datos. Este coeficiente mide la proporción o el porcentaje de la variación
total en Y explicada por el modelo de regresión.
r² = 0
r² = 1
 Una cantidad estrechamente relacionada con r² pero conceptualmente muy diferente es
el coeficiente de correlación, el cual, como ya lo hemos mencionado, es una medida del
grado de asociación entre dos variables.
 Este coeficiente se lo mide a partir de:

 La probabilidad:
 El problema de las pruebas de hipótesis estadísticas puede plantearse de la siguiente
manera:
¿Es compatible o no lo es una observación o un hallazgo dados, según algunas hipótesis

planteadas?
 La palabra compatible se utiliza en el sentido de que la observación es lo bastante cercana

al valor hipotético, de forma que no se rechaza la hipótesis planteada. Así, si alguna teoría
o experiencia previa lleva a creer que el verdadero coeficiente de la pendiente β2, ¿es el β2
(estimado) obtenido consistente con la hipótesis planteada? De ser así, no se rechaza la
hipótesis; de lo contrario, se puede rechazar.
 La hipótesis planteada (en el lenguaje estadístico hipótesis nula) se la denota como H0.
 La hipótesis alternativa o mantenida se la denota como H1.
 La teoría de pruebas de hipótesis se refiere al diseño de reglas o procedimientos que

permitan decidir si se rechaza o no la hipótesis nula. Hay dos métodos mutuamente
complementarios para diseñar tales reglas: el intervalo de confianza y la prueba de
significancia.
X: Rendimiento Excedente del Mercado
Y: Rendimiento Excedente del Sector de Bienes de Consumo
 Si tenemos el siguiente ejemplo:
Yi= Inversión Doméstica Privada Bruta (IDPB) de Estados Unidos (miles de millones/millones de dólares).
Xi= Producto Interno Bruto (PIB) de Estados Unidos (miles de millones/millones de dólares).
Yi*= w1Yi
Xi*= w2Xi
w1 y w2 son constantes denominados factores de escala.
Yi= Inversión Doméstica Privada Bruta (IDPB) de Estados Unidos (miles de millones/millones de dólares).
Xi= Producto Interno Bruto (PIB) de Estados Unidos (miles de millones/millones de dólares).
- El intercepto, lo mismo que su

error estándar, es 1.000 veces
los valores correspondientes de
la regresión.
- La pendiente, al igual que su
error estándar, permanecen sin
cambio.
w1= 1.000
- El coeficiente de la pendiente,
al igual que su error estándar, es
(1/1.000), pues sólo se modificó
la escala de la variable PIB.
- Tanto el intercepto como el

coeficiente de la pendiente y sus
errores estándar respectivos son
1.000 veces sus valores.
 En la sección anterior vimos que las unidades con que se expresan la variable
independiente (regresora) y la dependiente (regresada) influyen en la interpretación de
los coeficientes de regresión. Esto se evita si ambas variables (regresora y regresada) se
expresan como variables estandarizadas.
 Una variable es estandarizada si se resta el valor de la media de esta variable de sus

valores individuales y se divide esa diferencia entre la desviación estándar de la variable.
 Una propiedad interesante de una variable estandarizada es que el valor de su media

siempre es cero y que su desviación estándar siempre es 1.
 Como resultado, no importa en qué unidades se expresen ambas variables (la regresada
y la regresora). En consecuencia, en lugar de llevar a cabo la regresión estándar
(bivariada), podemos realizar la regresión sobre las variables estandarizadas.
Coeficientes Beta.
 Para mostrar la diferencia entre la regresión estándar y estandarizada, a continuación tenemos el
siguiente ejemplo: IDPB – PIB.
 Si el PIB se incrementa en un dólar, en promedio, la IDPB aumentará 25 centavos.
 Si el PIB (estandarizado) se incrementa en una desviación estándar, en promedio, la IDPB

(estandarizada) aumentará 0.98 desviaciones estándar.
 Los modelos lineales en los parámetros, pueden ser o no lineales en las variables.
 En esta sección revisaremos algunos modelos de regresión muy comunes, que pueden
ser no lineales en las variables pero sí lineales en los parámetros, o que pueden serlo
mediante transformaciones apropiadas de las variables. Estos modelos de regresión
pueden ser:
1. El modelo log-lineal.
2. Modelos semilogarítmicos.
3. Modelos recíprocos.
4. El modelo logarítmico recíproco.
 Ahora analizaremos las características especiales de cada modelo, los casos en los cuales
su uso es apropiado y la forma de estimarlos.
 Los resultados evidencian que la elasticidad de GASBD respecto de GCPERT es de casi
1.63, lo que indica que si el gasto personal total aumenta 1%, en promedio, el gasto en
bienes duraderos se incrementará casi 1.63%. En consecuencia, el gasto en bienes
duraderos es muy sensible a los cambios en el gasto de consumo personal. Por esta
razón, los productores de bienes duraderos siguen muy de cerca los cambios en el
ingreso personal y el gasto de consumo personal.
Modelo log-lin
 A estos modelos se los denominan Modelos Semilog porque sólo una variable (en este
caso, la regresada) aparece en forma logarítmica. Para fines descriptivos, un modelo en
el cual la variable regresada es logarítmica se denomina Modelo log-lin.
Tasa de Crecimiento (Interés Compuesto)
 En este modelo, el coeficiente de la pendiente mide el cambio proporcional constante o

relativo en Y para un cambio absoluto dado en el valor de la regresora (en este caso, la
variable tiempo t), es decir:
 Si multiplicamos el cambio relativo en Y por 100, dará entonces el cambio porcentual, o

la tasa de crecimiento, en Y ocasionada por un cambio absoluto en X, la variable
regresora. Por tanto, 100 por β2 da como resultado la tasa de crecimiento en Y; 100 por
β2 se conoce como la semielasticidad de Y respecto de X.
La interpretación del modelo nos dice
que durante los periodos trimestrales
de 2003-I a 2006-III, en promedio, el
gasto en servicios se incrementó con
una tasa (trimestral) de 0.705%.
Aproximadamente, esto equivale a un
crecimiento anual de 2.82%.
Como 8.3226 = log de gastos en
servicios al comienzo del periodo de
análisis. Si se toma su antilogaritmo
obtenemos 4115.96 (miles de millones
de dólares) como el valor inicial de los
gastos en servicios (es decir, el valor a
Tasas de Crecimiento Instantánea y Compuesta principios de 2003).
 El coeficiente de la variable de tendencia del modelo de crecimiento, β2, da la tasa de crecimiento instantánea
(en un momento dado), pero no la tasa de crecimiento compuesta (durante un periodo).
 La tasa de crecimiento compuesta se calcula a través del antilogaritmo de la β2 estimada (0.007054), se resta 1 y
se multiplica la diferencia por 100.
 En consecuencia, la tasa compuesta de crecimiento de gastos en servicios fue de casi 0.708% por trimestre, lo
cual es un poco mayor que la tasa de crecimiento instantánea de 0.705%. Lo anterior se debe, por supuesto, al
efecto de la composición.
Modelo de Tendencia Lineal
 En este modelo en lugar de regresar el log de Y sobre el tiempo, regresan Y sobre el tiempo, donde Y es la
variable regresada en consideración.
 Un modelo de este tipo se denomina Modelo de Tendencia Lineal, y la variable tiempo t se conoce como
variable de tendencia. Si el coeficiente de la pendiente es positivo, existe una tendencia creciente en Y,
mientras que si es negativa, existe una tendencia decreciente en Y.
Durante los periodos trimestrales de 2003-I a 2006-

III, en promedio, el gasto en servicios se incrementó
con una tasa absoluta (no relativa) de alrededor de
30.67 miles de millones de dólares por trimestre. Es
decir, hubo una tendencia creciente en el gasto en
servicios.
La elección entre estos dos últimos modelos
dependerá de que el interés recaiga en el cambio
relativo o absoluto del gasto en servicios, aunque,
para propósitos de comparación, es el cambio
relativo el que tiene mayor importancia.
Modelo lin-log
 A diferencia del modelo de crecimiento recién estudiado, en el cual nos interesaba

encontrar el crecimiento porcentual en Y ante un cambio unitario absoluto en X, ahora
deseamos encontrar el cambio absoluto en Y debido a un cambio porcentual en X. Para
fines descriptivos, este modelo se lo como lin-log.
 Esta ecuación plantea que el cambio absoluto en Y es igual a la pendiente multiplicada

por el cambio relativo en X. Si ΔX/X cambia en 0.01 unidades (o 1%), el cambio absoluto
en Y es 0.01(β2). Por tanto, si en una aplicación se encuentra que β2=500, el cambio
absoluto en Y es (0.01)(500)= 5.0.
 Por consiguiente, cuando se utiliza MCO para estimar regresiones, se debe multiplicar el
valor del coeficiente estimado de la pendiente por 0.01, o, lo que es lo mismo, dividirlo
entre 100.
 Modelos de Gasto Engel (Ernst Engel 1821-1896) muestran que el gasto total que se
dedica a los alimentos tiende a incrementarse en progresión aritmética, mientras que el
gasto total aumenta en progresión geométrica.
✓ Los resultados evidencian que el coeficiente de la pendiente es 257.27. Esto implica que un
incremento en el gasto total del 1%, en promedio, propicia un incremento de casi 2.57 rupias
en el gasto en alimento de las 55 familias incluidas en la muestra.
 A pesar de que este modelo es no lineal en la variable X porque se encuentra inversamente o
en forma recíproca, el modelo es lineal en β1 y β2, y, por consiguiente, es un modelo de
regresión lineal.
 Este modelo tiene las siguientes características: a medida que X aumenta indefinidamente, el
término β2(1/X) se acerca a cero y Y se aproxima al valor límite o asintótico β1.
 Por consiguiente, los modelos recíprocos contienen un valor asintótico o límite que tomará la
variable dependiente cuando el valor de la variable X aumente indefinidamente.
La pendiente de la regresión,
implica que si el β2 es positivo,
la pendiente siempre es
negativa, a su vez, si el β2 es
negativo, la pendiente siempre
es positiva.
✓ Conforme el PIB per cápita se incrementa indefinidamente, la mortalidad infantil se acerca a
su valor asintótico de casi 82 muertes por millar. El valor positivo del coeficiente β2 de
(1/PIBPCt) implica que la tasa de cambio de la MI respecto del PIBPC es negativa.
 Concluimos este análisis de los modelos recíprocos con el modelo recíproco logarítmico,
que adopta la siguiente forma:
 Al principio Y se incrementa con una tasa creciente (es decir, la curva es convexa al inicio)
y luego aumenta con una tasa decreciente (la curva se convierte en cóncava).
 Se ha analizado las distintas formas funcionales que un modelo empírico puede tomar,
incluso dentro de los confines de los modelos de regresión lineal en los parámetros.
 La elección de una forma funcional particular puede ser relativamente fácil para el caso de
dos variables, pues se pueden graficar las variables y tener así una ligera idea respecto del
modelo adecuado. La elección se complica mucho más cuando se considera el modelo de
regresión múltiple que implica más de una regresora.
 Se requiere una gran destreza y experiencia al escoger un modelo apropiado para la

estimación empírica. No obstante, se pueden mencionar algunas sugerencias:
- La teoría sugiere la forma funcional particular de una regresión (Curva de Phillips).

- Calcular la tasa de cambio (es decir, la pendiente) de la regresada respecto de la regresora, así
como conocer la elasticidad de la regresada respecto de la regresora.
- Los coeficientes del modelo escogido deberán satisfacer determinadas expectativas a priori.
- Algunas ocasiones, más de un modelo puede ajustarse razonablemente bien a un determinado
conjunto de datos.
- No se debe sobrevaluar la medida de r² en el sentido de creer que mientras más alta sea r² mejor
será el modelo. Lo que reviste mayor importancia es la justificación teórica del modelo elegido,
los signos de los coeficientes estimados y su importancia estadística.
- Usar las llamadas transformaciones Box-Cox.
Modelo de regresión Box-Cox
Donde λ es un parámetro que puede ser negativo, cero o positivo. Como Y está elevado a la
potencia λ, obtendremos varias transformaciones de Y, según el valor de λ.
 En la regresión, β1 es el término del intercepto. Este término da el efecto
medio o promedio sobre Y de todas las variables excluidas del modelo, aunque
su interpretación mecánica sea el valor promedio de Y cuando X2 y X3 se
igualan a cero. Los coeficientes β2 y β3 se denominan coeficientes de
regresión parcial.
✓ −0.0056 y -2,2316 son los coeficientes de
regresión parcial.
✓ El coeficiente −0.0056 expresa que si se
mantiene constante la influencia de la TAF,
conforme el PIBPC se incrementa en una unidad,
en promedio, la MI disminuirá en 0.0056
unidades. Para interpretar esto desde el punto
de vista económico, si el PIB percápita se
incrementara 1 dólar, en promedio, el número
de muertes de niños menores de 5 años se
reduciría a 5.6 por cada 1000 nacimientos vivos.
✓ El coeficiente −2.2316 señala que si la influencia
del PIBPC se mantiene constante, el número de
muertes de niños menores de 5 años disminuirá,
en promedio, 2.23 por cada 1000 nacimientos
vivos, si la tasa de alfabetización en las mujeres
sube un punto porcentual.
✓ El valor del intercepto de alrededor de 263, si se
interpretara de una forma mecanicista,
significaría que si los valores del PIBPC y de la
TAF fuesen cero, la mortalidad infantil sería de
más o menos 263 muertes por cada 1000
nacimientos vivos.
Multicolinealidad
 El supuesto 8 del Modelo Clásico de Regresión Lineal (MCRL) plantea que no
existe multicolinealidad entre las regresoras incluidas en el modelo de
regresión.
 El supuesto de no multicolinealidad en busca de respuestas a las siguientes

preguntas:
1. ¿Cuál es la naturaleza de la multicolinealidad?

2. ¿Es la multicolinealidad realmente un problema?
3. ¿Cuáles son sus consecuencias prácticas?
4. ¿Cómo se detecta?
5. ¿Qué medidas pueden tomarse para aliviar el problema de multicolinealidad?
 El término multicolinealidad se atribuye a Ragnar Frisch. Originalmente,
significó la existencia de una relación lineal “perfecta” o exacta entre algunas o
todas las variables explicativas de un modelo de regresión.
Mayor multicolinealidad, mayor error estándar.

Causas
 El método de recolección de información. Por ejemplo, la obtención de muestras en
un intervalo limitado de valores tomados por las regresoras en la población.
 Restricciones en el modelo o en la población objeto de muestreo. Por ejemplo, en la

regresión del consumo de electricidad sobre el ingreso (X2) y el tamaño de las
viviendas (X3) hay una restricción física en la población, pues las familias con ingresos
más altos suelen habitar viviendas más grandes que las familias con ingresos más
bajos.
 Especificación del modelo. Por ejemplo, la adición de términos polinomiales a un

modelo de regresión, en especial cuando el rango de la variable X es pequeño.
 Un modelo sobredeterminado. Esto sucede cuando el modelo tiene más variables

explicativas que el número de observaciones. Esto puede suceder en investigación
médica, donde en ocasiones hay un número reducido de pacientes sobre quienes se
reúne información respecto de un gran número de variables.
Consecuencias
 Aunque los estimadores de MCO son MELI, presentan varianzas y covarianzas
grandes que dificultan la estimación precisa.
 Debido a la consecuencia 1, los intervalos de confianza tienden a ser mucho

más amplios, lo cual propicia una aceptación más fácil de la “hipótesis nula
cero” (es decir, que el verdadero coeficiente poblacional es cero).
 También debido a la consecuencia 1, la razón t de Student de uno o más

coeficientes tiende a ser estadísticamente no significativa.
 Aunque la razón t de Student de uno o más coeficientes sea estadísticamente

no significativa, r2, la medida global de bondad de ajuste, puede ser muy alta.
 Los estimadores de MCO y sus errores estándar son sensibles a pequeños

cambios en los datos.
Detección
 Una r2 elevada (0.8) pero pocas razones t de Student significativas.
 Altas correlaciones (0.8) entre parejas de regresoras.
 Examen de las correlaciones parciales.
 Regresiones auxiliares, r2 auxiliar mayor que r2 global.
 Valores propios e índice de condición.
 Tolerancia y factor de inflación de la varianza. FIV superior a 10, TOL cerca a 0.
 Diagrama de dispersión.
Medidas Correctivas
 Blanchard (1967) expresa que ante la multicolinealidad “no hay que hacer
nada”. La multicolinealidad es en esencia un problema de deficiencia de datos
(micronumerosidad) y, en algunas ocasiones, no hay opción respecto de los
datos disponibles para el análisis empírico.
 Existen ciertas reglas prácticas para corregir la multicolinealidad:

- Información a priori.
- Combinación de información de corte transversal y de series de tiempo.
- Eliminación de una(s) variable(s) y el sesgo de especificación (sesgo de
especificación).
- Transformación de variables (primeras diferencias y transformación de
razón).
- Datos nuevos o adicionales (nueva muestra o ampliar la muestra).
- Reducción de la colinealidad en las regresiones polinomiales.
Heteroscedasticidad
 El supuesto 4 del Modelo Clásico de Regresión Lineal (MCRL) plantea que las
perturbaciones μi que aparecen en la función de regresión poblacional son
homoscedásticas; es decir, que todas tienen la misma varianza.
 El supuesto de no heteroscedasticidad busca de respuestas a las siguientes

preguntas:
1. ¿Cuál es la naturaleza de la heteroscedasticidad ?

2. ¿Es la heteroscedasticidad realmente un problema?
5. ¿Qué medidas pueden tomarse para aliviar el problema de heteroscedasticidad?
 El término heteroscedasticidad se origina de heteros (diferente u otro) y
cedasticidad (dispersión o varianza).
Heteroscedasticidad - Causas
 Con base en los modelos de aprendizaje de los errores.
 A medida que aumentan los ingresos, la gente posee más ingreso discrecional.
 A medida que mejoran las técnicas de recolección de datos, es probable que σ2 se reduzca.
 La heteroscedasticidad surge por la presencia de datos atípicos o aberrantes.
 Violación del supuesto 9 del MCRL, que establece que el modelo de regresión está
correctamente especificado.
 Asimetría en la distribución de una o más regresoras incluidas en el modelo.
 Hendry (1995) la heteroscedasticidad surge por la incorrecta transformación de los datos

(transformaciones de razón o de primeras diferencias) y por una forma funcional
incorrecta (modelos lineales frente a modelos log-lineales).
Heteroscedasticidad - Detección
 Métodos Informales
- Naturaleza del problema.
- Método gráfico.
 Métodos Formales
Prueba de Park.- Si no hay una

significancia estadística entre
los parámetros, no hay
heteroscedasticidad.
Prueba de Glejser.- Si no hay una significancia estadística entre los parámetros, no hay
Prueba de correlación de orden de Spearman.- No hay una significancia estadística

entre los parámetros , por tanto, no hay heteroscedasticidad.
Prueba de Goldfeld-Quandt.- Si el valor estimado de λ excede el valor crítico de la F de

Fisher, existe heteroscedasticidad.
Prueba Breusch-Pagan-Godfrey.- Si el valor estimado de Θ excede el valor crítico de ji

cuadrada, existe heteroscedasticidad.
Prueba de White.- Si el valor de n.R2 excede el valor crítico de ji cuadrada, existe

Prueba de Koenker-Basset.- Si = 0, no hay heteroscedasticidad.

Heteroscedasticidad - Medidas Correctivas
 Cuando se conoce σ2i: Método de los Mínimos Cuadrados Ponderados.
 Cuando no se conoce σ2i: Varianzas y errores estándar consistentes con

heteroscedasticidad de White (errores estándar robustos).
Autocorrelación
 El supuesto 5 del Modelo Clásico de Regresión Lineal (MCRL) plantea que no

exista autocorrelación o correlación serial entre las perturbaciones μi - μj.
 El supuesto de no autocorrelación busca de respuestas a las siguientes

preguntas:
1. ¿Cuál es la naturaleza de la autocorrelación?

2. ¿Es la autocorrelación realmente un problema?
5. ¿Qué medidas pueden tomarse para aliviar el problema de autocorrelación?
 El término autocorrelación se define como la correlación entre miembros de
series de observaciones ordenadas en el tiempo (en datos de series de tiempo)
o en el espacio (en datos de corte transversal).
Autocorrelación - Causas
 Inercia.
 Sesgo de especificación: caso de variables excluidas.
 Sesgo de especificación: forma funcional incorrecta.
 Fenómeno de la telaraña.
 Rezagos.
 “Manipulación” de datos.
 Transformación de datos.
 No estacionariedad.
Autocorrelación - Detección
 Método gráfico.
 Prueba de “las rachas”.
 Prueba d de Durbin-Watson.
 Prueba general de autocorrelación: Prueba de Breusch-Godfrey (BF).

Autocorrelación - Medidas Correctivas
× Método Generalizado de Mínimos Cuadrados (MCG).
× Método Newey-West.
× Método de Cochrane-Orcutt.
× Conservar el método de los Mínimos Cuadrados Ordinarios.

Econometría I

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Econometría I

Cargado por

Copyright:

Formatos disponibles

@ramirovillamey Universidad Central del Ecuador

@SEYA_Ecu Facultad de Ciencias Económicas

 El Análisis Causal permite:

Los estudios empíricos encuentran que el efecto causal de tener un

 El diseño de un Análisis Empírico se estructura de los siguientes

 El modelo planteado puede ser mas o menos formal.

∞ Modelo Formal: Ecuaciones matemáticas que describen relaciones

∞ Modelo Informal: Su descripción se inspira en la teoría y en aspectos

 Habitualmente, la función f (X) no queda caracterizada por la teoría.

Y1= Q,Y2= P, X1= R, X2= Ll

 Modelo de Capital Humano

Ec. Salarial: W= f1(S, EX)

Y1= W, Y2= S, X1= EX, X2= Sp, X3= Sm

 Este modelo recoge la naturaleza estocástica que gobierna las

 El modelo establece como tratar el problema de las variables que,

 El modelo parametriza f(X), la forma funcional estableciendo una

 Esta naturaleza aleatoria de las relaciones económicas se puede

 Algunos tipos de modelos econométricos son:

- Los modelos univariantes emplean exclusivamente la información que

- Si disponemos solo de la serie de tiempo anterior de la inflación puedo formular un

- Modelos uniecuacionales, π = f (pasado de π, otras variables).

 Los economistas observan, directamente o de forma aproximada, el

- Datos de Corte Transversal.

1. Planteamiento de la teoría o de la hipótesis.

La ley psicológica fundamental… consiste en que los hombres (y las

Keynes postula que la Propensión Marginal a Consumir (PMC), es decir, la

Un economista matemático puede proponer la siguiente forma de la Función Keynesiana de

En la función keynesiana de consumo, el consumo (gasto)

Fuente: Gujarati (2010)

Fuente: Gujarati (2010)

La variable Y en esta ecuación es el Gasto de Consumo Personal (GCP) agregado

Tal confirmación o refutación de las teorías económicas con fundamento en la

Suponemos tener la función keynesiana de consumo estimada. Además, suponemos que el

8750 = −299.59 + 0.72(X=PIB2006)

 En su ensayo Family Likeness in Stature (1886), Galton, planteó que la

 La Ley de Regresión Universal de Galton fue confirmada por Karl

- Galton: Razones de estabilidad.

Fuente: Gujarati (2010)

 En las relaciones estadísticas entre variables tratamos esencialmente

 En las relaciones deterministas o funcionales también manejamos

 La palabra estocástica proviene de la palabra griega stokhos que

 En el análisis de correlación se mide la fuerza o el grado de asociación lineal

 La regresión y la correlación presentan diferencias fundamentales.

 En el análisis de regresión hay una asimetría en el tratamiento que se da a las

 En el análisis de correlación se trata de dos variables cualesquiera en forma

Yi =  0 +  1X1 +  2X2 + ……… +  kXk + μi

Fuente: Gujarati (2010)

Fuente: Gujarati (2010)

E(Y | Xi) = f(Xi)

 Esta ecuación toma el nombre de Función de Esperanza Condicional (FEC),

 A su vez, el consumo de una familia en particular no necesariamente aumenta a medida

 μi es una variable aleatoria no observable que adopta valores positivos o negativos.

 Falta de disponibilidad de datos.

 Variables centrales y variables periféricas.

 Aleatoriedad intrínseca en el comportamiento humano.

 Variables representantes (proxy) inadecuadas.

 Forma funcional incorrecta.

Fuente: Gujarati (2010)

- Mínimos Cuadrados Ordinarios (MCO) y,

 En el contexto de la regresión lineal, por lo general los dos métodos proporcionan

 El ee es la desviación estándar de la distribución muestral del estimador, y la distribución

 Este coeficiente se lo mide a partir de:

¿Es compatible o no lo es una observación o un hallazgo dados, según algunas hipótesis

 La palabra compatible se utiliza en el sentido de que la observación es lo bastante cercana