Documentos de Académico
Documentos de Profesional
Documentos de Cultura
!7
A modo de presentacin
Los estudiosos del campo econmico tienden a establecer sus opiniones desde muchas
perspectivas, algunos se basan en los hechos regulares o persistentes que existieron en largos
perodos de tiempo y que tienden a repetirse, por ejemplo la existencia de dficit fiscal puede
generar problemas inflacionarios en las economas, debido a la monetizacin de dichos dficit y a
una situacin de gasto excesivo. Esta realidad tiene evidencias desde los eventos que derivaron
en la revolucin francesa, se aplican a las economas latinoamericanas en los aos 90 y an hoy
son aplicables a economas como la Griega o la Venezolana en pleno siglo XXI.
Las evidencias as denominadas histricas terminan siendo aspectos generalizados que
simplemente prueban la hiptesis de su existencia porque en la historia son recurrentes. A todos
les queda claro que la emisin monetaria es perjudicial cuando genera inflaciones por encima de
los equilibrios de largo plazo. Evidencias de ellos tenemos, desde las inflaciones en la Espaa
colonizadora, hasta los procesos inflacionarios en Alemania de entre guerras, Bolivia junto a Per
en las postrimeras de los aos 80 y as se pueden obtener otras evidencias de ello, de modo que
la vista histrica es algo bastante extendido en el anlisis econmico.
Otras miradas al anlisis econmico se basan en hechos concretos que derivan del
comportamiento humano, as los economistas en el siglo XVIII evidenciaron que las personas
intercambiaban bienes en funcin a algn valor dado en ellos, en principio el valor poda ser
mucho y por ende el cambio de la mercanca se haca sobre mayores bienes o sobre mayor valor
monetario (los albores de la moneda en oro), esta medicin sobre los hechos constitua la base
del descubrimiento de teoras (como la de oferta y demanda) que luego se probaban basados en
la recurrencia de los actos humanos.
Los xitos tericos iban de la mano de una regularidad emprica observable, por tanto las
hiptesis quedaban probadas, el xito de muchas teoras de este tipo pueden encontrarse hasta
nuestros das, donde los economistas no discuten las leyes de oferta y demanda, sino sus
excepciones o sus no cumplimientos (tambin observadas en la realidad), con fines de agregar
un mayor bagaje al entendimiento de los mercados.
No obstante lo importante de las vistas anteriores, los economistas han pretendido tener una
idea mas clara de los eventos o fenmenos de la realidad econmica, la idea de cuantificar los
procesos econmicos es una de las vertientes ms importantes de la ciencia econmica, en esta
rama cae la econometra, pretendiendo darle un valor a las relaciones entre diversas variables
econmicas, o buscando saber si estas relaciones son persistentes en algn perodo de tiempo o
son coyunturales, o simplemente son relaciones a largo plazo.
! !8
En los tiempos recientes, la idea de saber el impacto causado por las polticas econmicas o
sociales, ha devenido en nuevas herramientas economtricas que se conjugan en incluso
vertientes especficas como la macro y microeconometra, no obstante ambos aspectos tienen la
misma base terica instrumental, que simplemente las variables de anlisis deben tener
relaciones medibles en condiciones de estabilidad o de ausencia de un error intencional, es decir
bases muy vinculadas a la aleatoriedad que debe tener todo diseo de modelos economtricos.
La econometra no ha escapado al debate sobre sus aplicaciones en el campo del anlisis de
eventos o de simplemente pronsticos, sin embargo al margen de pretender hacer de
futurlogos, lo que ms pretende un buen anlisis economtrico es entender porque algunos
eventos econmicos son particularmente causados por alguna variable, o son influenciados de
algn modo por algn evento que puede ser administrado o no por los ejecutores de polticas,
con fines de tener ideas claras de lo que funciona o no en las economas del mundo.
Este libro se enmarca en esa idea central, buscar que los economistas pueden tener alguna
herramienta adicional para entender la dinmica de los sucesos econmicos y sus distintas
variables relacionadas, est orientado al diseo de modelos economtricos en cada unos de sus
captulos. Nos hemos permitido tomar ideas interesantes de diversos autores, con fines de que
los lectores puedan esbozar sus propios modelos o sus propios entendimientos de esa realidad
econmica especfica.
La primera parte del libro se aboca a los cursos bsicos de econometra (captulos I al VIII)
donde se analizan los modelos generales y sus distintas aplicaciones as como desventajas por
decirlo de algn modo, ya que tienen muchas utilidades antes que las denominadas fallas que se
sealan comnmente. Dichas fallas han originado una serie de modelos economtricos que
permiten complementarlas o por lo menos darles rigurosidad a los resultados obtenidos, la
segunda parte del libro se aboca a dichos modelos derivados de aquellos bsicos o con
desventajas, por ejemplo las series de tiempo estacionarias, los modelos Tobit, los paneles de
datos y algunas aplicaciones ms cercanas al mundo de la empresa, de modo que los captulos
IX al XIV, pueden ser muy aplicativos en cursos de econometra de mayor complejidad o
tratamiento.
Finalmente sealamos que el libro puede contener, como todo en la vida, muchos errores y
quizs aciertos, solo esperamos que la comunidad acadmica puede tener en este documento
una referencia adicional a la hora de disear sus modelos economtricos o plantear relaciones de
este tipo. Hay que agradecer tambin a los alumnos de estos cursos, que han permitido el
esfuerzo de poder corregirlo con sus siempre inteligentes aportes, as como a todos los colegas
involucrados en ello, para lo cual van nuestros agradecimientos infinitos.
C. Len / A. Escajadillo
!9
NDICE
pg.
Introduccin
17
21
22
27
38
42
45
46
49
51
53
56
59
60
64
67
68
!10
78
81
83
85
86
88
89
98
103
110
121
123
130
135
137
138
146
154
160
162
168
!11
Referencias bibliogrficas
169
173
174
187
194
202
210
213
215
216
219
220
230
244
252
254
258
259
7 Autocorrelacin de errores
Introduccin al tema
262
12
!
263
272
279
283
285
288
290
293
294
303
318
326
329
331
334
336
337
340
349
362
364
!13
Ejercicios
Referencias bibliogrficas
366
378
380
381
390
396
400
406
426
432
434
436
437
440
441
448
455
466
!
14!
477
479
481
490
493
494
497
505
515
521
525
527
529
535
538
539
555
557
!15
567
573
576
578
580
586
591
592
632
647
655
657
659
665
!
16
Introduccin
Este libro consta de 14 captulos, se ha pensado en una secuencia de temas que ayuden a
los estudiantes de econometra a pasar de los modelos bsicos a aquellos cuyo tratamiento es
ms complejo. El captulo I nos introduce en el hecho de que todo modelo economtrico parte de
alguna teora bsica; en algunos diseos avanzados, los modelos parten de lo que el
investigador podra pensar como evento econmico a estudiar y donde la teora es inexistente
an o es parcial y puede ser ampliada o evidenciada de modo reciente. Las teoras diversas
deben tener formas de medirse y para ellos se requiere procesos generadores de datos los
mismos que llevan al tratamiento estadstico que arrojan los resultados que podran probar o no
alguna hiptesis.
El captulo II introduce al tratamiento estadstico de los datos, se analizan la aleatoriedad de
las variables y como estas relaciones permiten establecer comportamientos asociados y
medibles en indicadores diversos, tanto de desviacin como de correlacin. Estos aspectos son
ampliados ya desde una perspectiva economtrica en los captulos III y IV. Estos ltimos
captulos nos llevan a la estimacin de modelos de regresin bsicos (una sola variable
explicativa) o modelos de regresin general (muchas variables explicativas). El tratamiento de los
resultados es equivalente, la forma de llegar a las mediciones puede variar en su tratamiento
operativo, pero en concreto ambos captulos permiten entender cuando un modelo es vlido o
expresa correctamente las relaciones econmicas planteadas y permite estimar una prueba de
hiptesis de modo correcto.
Del capitulo V al captulo VII se tratan los ya clsicos rompimientos de los supuestos bsicos
de un modelo economtrico, como son la multicolinealidad que nos lleva a pensar en distintas
formas de solucin para variables redundantes o poco explicativas, e inclusive en plantear
modelos usando las complejas variables instrumentales. Luego tenemos los modelos con
varianza cambiante o heterocedsticos, donde tratamos de explicar que corregirlo, mas que un
tema de usar desviaciones o mnimos cuadrados generalizados, pasa por disear mejor las
muestras de estudio. Finalmente esta seccin concluye con los modelos con errores
autocorrelacionados, cuya solucin (primeras diferencias) ha generado toda la gama de modelos
de series de tiempo tan usada en la actualidad.
Luego tenemos los captulos VIII y IX, ambos relacionados con los modelos de respuesta
limitada, dicotmica o simplemente probabilsticos. El tratamiento empieza por los modelos de
probabilidad lineal, que al tener limitaciones de acotacin en sus extremos, generan los modelos
logit (para datos concentrados en algn lado de la distribucin) o probit (para datos de
distribucin normal). La idea de estos modelos es poder conocer la probabilidad de ocurrencia de
algn evento, en general su diseo puede llevar a plantear variables latentes no observadas,
17
ramas distintas de aplicacin y no slo mtodos de estimacin puntual, sino que se familiaricen
un tanto con los mtodos no paramtricos que ofrece este captulo final.
Hay que sealar que cada captulo tiene casos de aplicacin, donde el objetivo es disear
modelos economtricos de tratamiento especfico. As segn el captulo que se analice, se
plantean extractos tericos que sirvan de base para el diseo del modelo que se relacione con el
dicho captulo. Igualmente cada captulo contiene al menos un ejercicio donde se apliquen datos
diversos para realizar ejercicios de estimacin de modelos economtricos.
Como esta labor de investigacin o al menos anlisis de la teora existente nunca termina,
invitamos a los lectores y estudiantes diversos, a plantear sus propios ejercicios, a compartir ello
con nosotros y poder as incrementar el anlisis que este documento quiere invitar en todos sus
lectores. Igualmente cualquier error detectado puede escribirnos para poder corregirlo de cara a
un mejor desempeo en las clases donde este material pueda buenamente utilizarse.
Para correcciones, solicitudes de las bases de datos (en Microsoft Excel) que este libro usa y
plantea como ejercicios o compartir sus propios casos con nosotros, no dude en escribirnos a:
cleon@usat.edu.pe. Expresamos tambin nuestras disculpas para los errores cometidos, siempre
ello ser responsabilidad exclusiva de los autores.
Finalmente el lector debe saber, que la mayor parte de este libro usa como soporte
informtico el programa STATA (en su versin para MAC OS pero equivalente en Windows), no
obstante los anlisis aqu planteados pueden ser replicados o aplicados en otros programas para
estos fines; como por ejemplo Eviews, SPSS, Gretl, Matlab u otros que el lector domine.
Consideramos que en econometra es muy importante disear el modelo, el tratamiento operativo
en cualquier programa informtico nos mostrar buenos resultados si el diseo es bueno, por
general todas las licencias informticas para econometra son igualmente potentes.
Chiclayo, Per.
Julio de 2015.
19
CAPTULO I
Modelacin economtrica: De
la teora econmica al
modelo estimable
20
Introduccin al tema
Los modelos economtricos siempre parten de una concepcin previa, es decir hay todo un
diseo terico que permite establecer relaciones diversas entre variables econmicas y otras. Por
ejemplo la posibilidad de que la creciente masa monetaria de un pas genera alzas de precios, es
una regularidad que se da en las economas. Esta regularidad ha sido planteada a modo terico
como la relacin entre la inflacin y la cantidad de dinero, esto conlleva luego a probar si esta
regularidad es vlida en trminos estadsticos de modo que pueda generalizarse en el contexto
donde se produce.
En general los modelos economtricos tienen un soporte terico necesario, al menos tienen
diversas regularidades que se presentan en la realidad econmica, por ello surge la intencin de
establecer estas relaciones tericas (que pueden ser nuevas, originales o tradas de otras
realidades para probar su vigencia) y medirlas o validarlas con criterios estadsticos.
En este captulo analizamos esos fundamentos tericos para los modelos economtricos en
general, por ello los componentes del captulo son el anlisis terico necesario, la bsqueda de
datos para validar las teoras, el planteamiento de modelos que se puedan estimar, errores de
diseo y el uso de modelos para prediccin o evaluacin de las polticas, que disean los
ejecutores en el mbito pblico e inclusive en el privado.
21
(1)
Donde Po representa el precio de los bienes ofertados, Qo representa las cantidad ofertada
en el mercado, a representa el precio existente cuando no existe cantidad ofertada (en buena
cuenta el mnimo precio posible por un bien) y b representa la tasa de cambio entre el precio y la
cantidad. Observemos que un mayor precio necesariamente coincide con una mayor cantidad
ofertada, cumpliendo la observacin terica y el fenmeno real.
De igual modo puede plantearse una ecuacin de la demanda, de la forma siguiente:
Pd = c - d (Qd)
(2)
(3)
(4)
Si por ejemplo a (mnimo precio de los ofertantes) baja en razn de un mayor nmero de
productores, entonces la cantidad ofrecida y demandada (Q) en el mercado aumenta y el precio
de equilibrio (P) baja. Esta regularidad ya sealada como leyes de oferta y demanda puede
estimarse a partir de conocer el valor de a, b, c y d, con los cuales se resuelven las ecuaciones
(3) y (4).
Saber los valores sealados anteriormente, implica estimar las ecuaciones (1) y (2) desde un
punto de vista estadstico o matemtico, la estimacin se realiza usando informacin del mercado
donde estemos realizando el anlisis respectivo.
Podemos, por ejemplo, recurrir al mercado de venta de uvas de exportacin (un ejemplo en el
Per es la uva red globe) y conocer la produccin anual para cada precio del mercado
internacional. Con ello podemos encontrar el valor de b (tambin la pendiente matemtica de la
ecuacin 1), podemos a su vez preguntarles a los productores de uvas a qu precio ya no hay
ganancias y tendremos el valor de a. Con lo cual ya hemos resuelto gran parte del problema.
Un segundo paso es conocer en el mercado externo, cunto se consume de uvas a cada
precio internacional, eso nos da el valor de d, sin embargo conocer el precio al cual ya no se
comprara uva, supone hacer una encuesta entre los compradores o mayoristas, con lo cual
obtenemos el valor de c. Toda la informacin anterior nos ayudar a hallar tanto el precio como
la cantidad de equilibrio en el mercado de uvas.
Como puede verse el planteamiento terico acorde a las leyes de oferta y demanda, es la
base para establecer relaciones matemticas o estadsticas con las cuales se pueden estimar
tanto el precio como la cantidad de equilibrio en un mercado.
23
Por qu sealamos antes que pueden establecerse relaciones estadsticas? Pues porque
para conocer los precios mximos o mnimos se recurre a encuestas donde previamente hay que
elegir a los entrevistados, lo cual ya supone un proceso al azar o aleatorio, de modo que las
respuestas sean lo ms autnticas posibles. Las respuestas de los entrevistados en torno a los
precios indicados en las ecuaciones (1) y (2) pueden ser tomadas como el promedio, la moda o
la mediana, de modo que tengamos un dato representativo del grupo de entrevistados, esto ya
supone un tratamiento estadstico de los datos, con los cuales tambin podemos conocer la
cantidad y precio de equilibrio que se evidencia en las ecuaciones (3) y (4).
De esa combinacin de modelos econmicos, basados en teoras econmicas que derivan de
una realidad o regularidad emprica, junto con bases matemticas para su estimacin o la
necesidad de datos estadsticos para probarlos, surgen los modelos economtricos. Como su
nombre seala, es medir de alguno modo la existencia o regularidad de los hechos econmicos,
reafirmando la teora construida, amplindola o simplemente mejorndola (cuando no
rechazando sus postulados). La econometra termina siendo la herramienta que permite verificar
la validez que tienen los modelos econmicos, para representar los hechos existentes en la
realidad o en las decisiones econmicas que continuamente tienen los agentes.
Una primera conclusin sobre lo tratado previamente, supone que para el diseo de modelos
economtricos debemos conjugar dos cosas, primero una regularidad existente o hecho
econmico que normalmente sucede, afecta o genera comportamientos de los agentes y la
segunda una base terica que explique dichos comportamientos a modo general.
Es posible que existan fenmenos econmicos cuyo comportamiento no tiene un sustento
terico pero que su regularidad permite establecer criterios para su anlisis. Por ejemplo en el
pasado se poda encontrar elevado nivel de informalidad entre los productores en un pas en
desarrollo, por ejemplo el Per. Las teoras existentes para explicar este comportamiento podan
ser muy exiguas, en virtud de que la informalidad o la economa al margen de las normas legales
(sin ser ilegales completamente) era un fenmeno de los pases en vas de desarrollo y casi
inexistentes en los pases desarrollados, con lo cual el bagaje terico al respecto era limitado.
De Soto (1986) en su tratamiento de la informalidad comienza a sealar que son los
gobiernos los que imponen elevadas cargas regulatorias que generan estos comportamientos
informales, tambin seala que el capital no tiene valor (al no tener un criterio formal de medicin
o traspaso), entonces este capital informal debe ser registrado y valorado, con fines de que la
economa tenga una mayor dinmica y se reduzca su amplio rol informal. Con estos criterios
analizados, se puede sealar que surgen tratamientos tericos al hecho econmico que se
presenta, sin embargo la informalidad en el Per es persistente, an con diversas medidas dadas
24
para que el capital sea legalizado, o para que los productores puedan ser reconocidos
formalmente.
Esto supone que pueden darse ms tratamientos tericos al tema, por ejemplo se puede
mencionar que el clima de negocios es vital para que estos desarrollen y prosperen en ambientes
formales (Porter, 1991), en la medida que los pases desarrollen un buen clima de negocios,
atraern a stos y su desempeo ser notable. Otras corrientes indican que los pases en
desarrollo tienden a esos niveles de economa informal por cuanto carecen de institucionalidad o
de slidas bases para el desarrollo institucional (Acemoglu y Robinson, 2012) y terminan siendo
economas extractivas, es decir no fomentan un sistema donde son las instituciones antes que
las personas los responsables del xito, en buena cuenta los procesos polticos se orientan de
modo adecuado porque existen mecanismos de control institucionalizados, eso reduce
enormemente la informalidad en las decisiones del pas. Buenas instituciones adems supone
que provienen de procesos donde todos los agentes tienen los incentivos adecuados, por
ejemplo ser informal es ms costoso que ser formal, adems ser informal es inviable porque no
se tienen proteccin alguna en un estado formal y siempre controlado.
Como puede verse las teoras, corrientes o pensamiento econmico ligado al tema de la
informalidad ha ido cambiando, en algunos casos es explicado por teoras puntuales, en otros
casos proviene de diversos conjuntos tericos que explican no slo ese problema sino otros
hechos econmicos, cada tratamiento terico le puede dar una perspectiva distinta al fenmeno y
aporta variables de estudio. En el caso de la informalidad en la economa (Y), esta puede
deberse, por ejemplo, a: excesos regulatorios (X1), escasa institucionalidad (X2), costos bajos de
ser informal (X3), nivel de cumplimiento de la ley (X4), nivel de formalizacin del capital invertido
(X5), grado de movilidad del capital en un mercado legal (X6). El proceso no termina, por ejemplo
an no termina de explicarse por qu si hay una gran cantidad de informales, una economa
sigue creciendo, como el caso de Per o la India, no es acaso la informalidad una traba al
crecimiento econmico, o es el alto crecimiento un impulso adicional a la informalidad en un pas
donde el marco regulatorio es de por s excesivo.
Finalmente podemos sealar a modo de modelo terico, que la informalidad (Y) es explicada
total o parcialmente con las variables X1, X2, X3, X4, X5 y X6.
La utilidad de esta forma de ver los modelos econmicos desde una perspectiva terica,
puede ser un aliciente para aquellos dedicados a investigar los fenmenos econmicos. Puede
darse por ejemplo lo siguiente:
25
Crecimiento!del!
Volumen!
exportado!
?!
Variacin!del!
Tipo!de!cambio!
real!
En la figura anterior observamos que el volumen exportado de un pas hacia otro, puede
depender del tipo de cambio real (la relacin equivalente a tipo de cambio nominal * precio
internacional / precio nacional), hasta aqu hemos encontrado una variable que puede explicar a
la otra en alguna medida (sealada como la parte del grfico intersectado), sin embargo puede
existir otra variable (u otras) que tambin influyen en el crecimiento del volumen exportado, aqu
es donde el investigador puede recurrir a otras teoras o plantear su propia teora o teoras,
cuando observa hechos en la realidad econmica que requieren una explicacin conceptual,
siempre que nadie las haya realizado antes.
Por ejemplo algunos pueden sealar que el volumen exportado depende de las ventajas
relativas del pas sobre todo en los costos comparados de mano de obra (Ricardo, 1817). Porter
(1985) indica que las exportaciones pueden acelerarse mediante las ventajas competitivas de las
empresas, esto es el logro de ventajas a lo largo de la cadena de valor empresarial, por ejemplo
proveedores de mayor sofisticacin o calidad, clientes ms exigentes, un gobierno que ayuda en
la cadena logstica reduciendo barreras, sistemas de apoyo de la empresa en tecnologa y otros.
Krugman (1991) en torno al mismo tema anterior indica que las economas de escala pueden
influir en la mayor exportacin, as zonas con ventajas para subir su produccin a bajos costos
(economas en algn factor productivo o rendimientos crecientes, por ejemplo mano de obra
calificada y concentrada o costos logsticos bajos) pueden exportar ms o incrementar la oferta
exportable y con ello ganar ventajas en el comercio exterior. Eso indica que los investigadores
26
pueden ir planteando nuevas explicaciones a un mismo problema o hecho econmico, con lo cual
el acervo cientfico se va incrementando.
Entonces podemos sealar tambin que mediante los modelos econmicos se puede ampliar
un conocimiento terico ya establecido, se puede avanzar hacia nuevos sustentos tericos, o se
puede aplicar teoras de otras realidades para ver si se cumplen en algn contexto particular.
Estos modelos econmicos trasladados a un modelo economtrico pueden dar con que falta
evidencia o la evidencia actual no sigue un patrn terico definido, o que se requiere nuevas
teoras o simplemente que las teoras de un contexto no funcionan en otros.
generadora del problema, por ejemplo en Bolivia el proceso de bajo precio del combustible,
obligaba al gobierno a subsidiarlo o cubrir parte del costo del mismo, al ser adems los
impuestos al combustible unos de los principales tributos, la solucin fue simplemente dejar que
el precio de combustible pase a su nivel real (mucho ms alto), esto elimin el subsidio, mejor la
recaudacin del estado y por ende cort el proceso generador de altos precios, simplemente
estos se pusieron en su nivel de equilibrio.
Existen otros casos donde hay un cambio en el proceso formador de precios bajo
expectativas adaptativas y se da cuando los bancos centrales juegan a mejorar la actividad
econmica y pueden con ello crear procesos de inflacin incluso mayores a los niveles previos.
Sachs (1990) indica que los grandes conflictos sociales en Amrica Latina, obligan a sus
ejecutores de poltica a cambiar sus acciones, por ejemplo pueden de pronto decidir incrementar
las emisiones monetarias, con lo cual la demanda de bienes sube y los salarios en los sectores
de demanda interna tambin (considere economas de dos sectores transables y no transables),
esto supone que el cambio real se aprecia (sobre todo considerando que los pases normalmente
intervienen en los mercados cambiarios). Hay que notar que la economa al interno tiene precios
ms altos, lo que conduce a un menor impulso del sector exportador (es ms costoso en los
insumos o pagos externos) y ello termina generando procesos que en lugar de reactivar una
economa la deprimen, muy al margen de que las autoridades hayan querido ello, considere
adems que la economa se hace importadora (dficit en cuenta corriente) y ello terminar
produciendo una crisis cambiaria que igualmente elevar los precios internos.
Lo nico que finalmente se concluye es que la economa rompe su esquema de precios y se
traslada a uno ms alto, el proceso puede degenerar en espiral si es que el banco central sigue
inyectando dinero en la economa, alimentando la nueva inflacin, proceso que termina en lo que
se conoce como hiperinflacin.
La otra variable mostrada en el modelo, indica que la inflacin tiene una relacin inversa con
el desempleo. En buena cuenta mayores niveles de desempleo, implican menos demanda de
bienes (al tenerse menos ingresos), esta menor demanda implica que los precios
progresivamente irn bajando.
Con fines de probar esta relacin o modelo econmico nos enfrentamos a los siguientes
problemas:
- La tasa de inflacin equivale a la variacin porcentual del ndice de Precios, sin embargo
se puede tomar el ndice de precios al por mayor (IPM) o al consumidor (IPC), o se puede
considerar slo el IPC de la ciudad capital (en el caso de Per el IPC de Lima), esto ltimo
se da cuando no se publican ndices de precios promedios nacionales.
28
Como vemos, tomar los datos supone una decisin del investigador o tambin es aquella
variable que mejor representa lo que queremos medir. En el caso de Per normalmente
se hubiera tomado el ndice de precios al consumidor, debido a la ausencia de mayor
disponibilidad de informacin agregada nacional. En todo caso podra construirse un
ndice de precios al consumidor nacional, pero el problema sera saber cmo ponderar el
peso de cada regin en el consumo nacional.
- Otro problema que podra darse es la poca variabilidad que presentara la tasa de
desempleo, agregando adems el hecho de que se publican ndices de desempleo
anuales y de la ciudad capital en muchos casos. Esta escasa variabilidad podra terminar
no afectando de ninguna manera la tasa de inflacin.
Este fenmeno de datos cuya variacin es pequea (comparado con otros pases cuyo
desempleo es ms dinmico) se da porque la economa tiene un mercado laboral rgido
en materia del empleo o desempleo formal, pero muy dinmico en la parte del empleo
informal, normalmente conocido como subempleo o simplemente no conocido al darse
pocos estudios sobre el desempleo en la zona informal de la economa.
Es probable que pases con mercados laborales rgidos tengan tasas de desempleo de
poco movimiento anual o de lento ajuste, sin contar que es probable que no se tenga
disponibilidad de esta tasa a ritmo mensual, mientras que es normal que existan ndices
de precios mensuales.
- Para tener una idea del problema previo veamos algunos datos, de acuerdo con
estadsticas del INEI (Instituto Nacional de Estadstica e Informtica del Per) la cantidad
de personas que estuvieron desempleadas cay en 2% anual desde el ao 2004 al 2012,
mientras que la tasa de desempleo (obtenida como poblacin desempleada sobre
poblacin econmicamente activa) pas de 5.3% en el ao 2004 a 4.53% en el ao 2012,
reflejando una escasa cada de 0.8% en esos 9 aos, poca movilidad a la hora de querer
plantear relaciones estadsticas. En ese mismo lapso la tasa de inflacin nacional (usando
el ndice de precios al por mayor) fue de 4.89% en el 2004 y de -0.59% en el 2012. Como
puede verse en ese lapso la tasa de inflacin cay y el desempleo tambin, lo cual podra
terminar concluyendo que no se cumple la teora planteada, pero las conclusiones no
pueden ser abordadas de modo tan simple.
Siguiendo con el problema previo, algunas razones pueden ser suficientes para no usar
los datos previos, por ejemplo el uso de perodos base diferentes. Se pueden tener
estimaciones diferenciadas de ndices de precios tomando aos base diferentes.
29
Otro problema subsiste como dijimos antes en el uso de ndices, por ejemplo el IPC
nacional a diciembre de 2012 arroja una tasa de inflacin de 2.65% notoriamente diferente
a la del IPM y adems no se encuentran datos disponibles para el ao 2003, limitando las
comparaciones.
- Otro problema vinculado a la disponibilidad de datos, normalmente en el caso peruano, es
que muchos datos anuales son posteriores a 1990 (lo cual da una historia de apenas 24
aos) cuando muchos analistas e investigadores plantean estudios que pueden ir de 100
a ms aos, un ejemplo es Piketty (2013) tomando series de ms 200 aos de antigedad
(recopiladas en diversas fuentes y pases diversos) concluye que el crecimiento del capital
normalmente ha superado el crecimiento econmico, lo que supone que los capitalistas o
inversionistas han tenido siempre rendimientos superiores al comn de la gente
(considere que el crecimiento econmico se redistribuye), si bien pueden haber subido los
salarios u otros rendimientos del trabajo, estos se diluyen con el crecimiento poblacional,
mientras que el capital ha seguido redituando a grupos minoritarios, lo que supone una
desigualdad creciente en el sistema econmico de los pases llamados desarrollados.
- Entonces se puede sealar que los modelos economtricos a partir de datos existentes o
secundarios puede enfrentar problemas como: ausencia de datos frecuentes, al menos
frecuencias equivalentes en todas las variables, uso de aos base diferentes, series que
no varan por motivos estructurales o ajenos a lo que se quiere medir.
Hay que considerar adems el nivel en que se miden o construyen los datos secundarios,
por un lado las variables deben estar en medidas equivalentes, por ejemplo ndices o
variaciones, inclusive logaritmos de ndices, si estn en unidades monetarias es preferible
que sean ambas en la misma unidad (por ejemplo millones o miles de unidades
monetarias o soles en el caso de Per), bsicamente por un tema de interpretacin de los
resultados a obtener.
Generacin de datos primaria
Normalmente en algunos casos, ciertos estudios pueden no tener informacin previa (algo
que felizmente va siendo historia debido a las tendencias de medir los impactos o por lo menos
las intervenciones del estado), veamos el siguiente ejemplo:
=
Donde Y representa el ingreso obtenido por individuo en su mayora de edad no cronolgica
sino llamemos profesional o formativa (por ejemplo 22 aos) y X representa los aos de
escolaridad del individuo, consideremos que este estudio se realiza en un distrito del pas o
30
Levantamiento de datos
Es importante determinar el lugar o dnde se recogen los datos de los individuos que
queremos analizar. Para nuestro ejemplo, puede hacerse tomando los hogares o
domicilios como puntos de referencia. En este caso se pueden aplicar tcnicas de
seleccin de hogares al azar, para que el estudio sea lo ms aleatorio posible, por
ejemplo sortear los hogares o nmeros de residencias o simplemente tomar cada x
casas la siguiente. El levantamiento de datos supone los problemas tpicos de no tener
al elemento objetivo en el domicilio, no lograr respuesta del domicilio, preguntar al
individuo equivocado y otros, que deben ser previstos.
!
Preguntas
Una vez que se tiene definido la forma de tomar los datos, viene el proceso de
preguntarle al individuo, las preguntas bien pueden ser:
1. Sobre su formacin educativa, usted estudi hasta:
1.1. Primaria incompleta
( )
( )
( )
( )
( )
( )
( )
( )
Hasta _________ Ao
Hasta _________ Ao
32
( )
( )
( )
( )
( )
Hay que notar que un criterio que debilita la toma de datos, es si el individuo trabaja a tiempo
completo o a medio tiempo, si es un ingreso permanente o si es ingreso eventual, esto debe ser
considerado en algunas preguntas adicionales con fines de tener una clara idea de la relacin
aos de estudios e ingresos.
La pregunta dos, puede plantearse de modo directo, cuanto gana el individuo, pero ello
podra tener un error al alza que debemos evitar, primero porque el individuo podra querer
quedar bien al ser preguntado por un tema privado y evidentemente dara un ingreso mayor al
real. Otra es pedirle una boleta de pago, pero ello sera en un ambiente de empleo muy formal y
el problema es que el individuo no quiere ser molestado a la hora de ser entrevistado. Dado que
la informacin es muy personal, no es posible recurrir a otras fuentes, aun cuando en el estado
existen entidades que tienen esta informacin al menos la de los ingresos bastante detallados,
por ejemplo mediante las declaraciones tributarias de las empresas.
Note tambin que la pregunta una supone que los aos los colocaremos nosotros en la base
de datos, por ejemplo:
ID
1
Aos de estudio
6
Ingresos
2
33
Datos no observados
Existe la posibilidad de que algunas variables que quieren analizarse no tengan hechos o
informacin observable, para ello veamos el ejemplo siguiente:
Sea un modelo donde queremos maximizar la utilidad o bienestar (V) del individuo, a partir
del consumo (C) y del uso de dinero M, para diversos perodos t. (Len, 2003)
V = U (C1, M1) + (C2, M2)
(i)
Donde:
: Tasa de descuento del consumo futuro
C: Consumo en diversos perodos per cpita
M: Demanda de dinero en diversos perodos per cpita
El consumidor enfrenta una restriccin presupuestaria en trminos per cpita igual a:
34
(ii)
(iii)
Estas ecuaciones finales representan la restriccin presupuestaria de los agentes, con lo cual
se plantea el modelo de optimizacin del individuo o agente representativo. Para resolver el
modelo tomamos en cuenta la ecuacin de optimizacin (i) y se tiene que una de las condiciones
de primer orden se resuelve del siguiente modo, para ello use adems las ecuaciones (ii) y (iii):
V/b1 = 0
35
( V / C1 ) ( C1 / b1 ) + ( V / C2 ) ( C2 / b1 ) = 0
( V / C1 ) ( -1 ) + ( V / C2 ) (1+R1) /(1+)(1+n) = 0
( V / C1 ) ( -1 ) + ( V / C2 ) (1+R1) /(1+)(1+n) = 0
(iv)
(v)
(vi)
(vii)
Donde:
(V / m1): Representa la demanda de dinero del individuo para maximizar su utilidad o bienestar
(V / C1): La preferencia del individuo por consumo presente que maximiza su bienestar
R1 / (1+R1): La tasa de inters adelantada o que el individuo percibe como costo del dinero al
tomar una decisin siempre en valor presente.
36
En buena cuenta el modelo hallado previamente tiene la limitacin de que su agregacin ser
de algn modo sesgada, en la economa no todos los agentes se comportan igual, se tiene
agentes cuya demanda de dinero es escasa primero porque es probable que usen dinero
electrnico o porque simplemente su riqueza es tal que su dinero se mantiene en formas de
activo financiero. Otros agentes pueden demandar en alta medida el dinero, dado que su
consumo es bsicamente todos sus saldos reales.
Otro problema que sealan Mies y Soto (2000) supone que la demanda de dinero no es slo
personal sino tambin empresarial, en ese caso es vlido considerar una restriccin adicional,
que indique el comportamiento de las empresas para mantener caja (fondos en la empresa), lo
cual depender principalmente del rendimiento de los activos financieros (en el modelo los
37
bonos) y de la tasa de crecimiento del producto, porque ello da una seal de la dinmica el
mercado.
Sin embargo el aporte de Mies y Soto (2000), modelando las relaciones de la demanda de
dinero en la funcin de utilidad, ya planteada por Sidrauski (1967) resuelven el problema de tener
variables observables, al menos usando el consumo en cada perodo y la tasa de inters.
Un problema que an existe es la observacin de una variable denominada demanda de
dinero, la cual no es explcita o no se da normalmente como estadstica publicada. Al respecto
Arrau y De Gregorio (1993) usan como demanda de dinero, los datos conocidos como saldos
reales de dinero (dinero en la economa tipo M1 que se mide como circulante ms depsitos
dividido sobre el ndice de precios), versus el consumo en la economa y la tasa de inters por
depsitos a corto plazo.
Carrera (2012) emplea en sus estimaciones de demanda de dinero, primero el concepto
Keynesiano de que esta depende del ingreso y de la tasa de inters (en nuestro modelo el
consumo puede ser muy bien representado por el ingreso), siguiendo a Ball (2003) se puede
decir que la demanda de dinero a largo plazo se basa tambin en el uso de los saldos monetarios
conocidos como M1 (tambin llamado dinero primario).
Como puede verse, los investigadores pueden toparse con variables no observables pero que
deben ser estimadas, esto es un proceso necesario para probar las teoras vertidas o analizadas
y que corresponden a un fenmeno real. Por ejemplo es un hecho del individuo promedio, que a
medida que los retornos financieros son mayores, se tiende a manejar ms activos financieros
(ms rentabilidad indica que uno puede comprar diversos instrumentos financieros) obviamente
este anlisis corresponde a individuos que manejan saldos monetarios que superan su consumo
y que no se mantienen en efectivo. Sin embargo si consideramos que la tasa de inters refleja el
costo de oportunidad de usar dinero, es natural que ms costos el dinero de mantener o
administrar, supone que mejor se demanda menos (donde demandar se entiende como poseer
dinero) y ello es perfectamente atribuible al comportamiento promedio de cualquier agente.
L = ( *)2 + (y y*)2
(i)
La ecuacin (i) est sujeta a la dinmica de la oferta agregada (restriccin), donde el producto
depende de la expectativa de precios de los agentes, si la expectativa de precios coincide con la
realidad, entonces el producto crece a su tasa potencial ms algn efecto externo medido por u.
Si la inflacin supera lo esperado, se produce un efecto de ganancias para los empresarios
(salario real cae bajo lo esperado) con lo cual el producto sube.
y = yn + ( e) + u
(ii)
Donde:
y: producto, y*: producto objetivo, yn: producto potencial
: inflacin, *: inflacin objetivo, e: inflacin esperada
u: Efectos externos, por ejemplo incrementos productivos sectoriales, mejoras de clima, o
empeoramientos de condiciones productivas, puede inclusive ser cambios no esperados en
polticas -sobre todo- monetarias.
El modelo planteado anteriormente puede resolverse minimizando el costo del gobierno (L) e
insertando la ecuacin (ii) en (i), con lo cual resulta:
L/ = 0
2 ( *) + 2 (yn + ( e) + u y*) = 0
( * ) = (1/ ) [(y*- yn)+ (e - ) u]
= * + (1/ ) [(y*- yn)+ (e - ) u]
(iii)
(iv)
Si combinamos las ecuaciones (iii) y (iv) obtenemos la tasa de inflacin ptima que debe
seguir el gobierno (para ello inserte la ecuacin iii en la ecuacin iv y despeje):
= * + (1/ ) (y*- yn) u / (1+ )
(v)
39
La ecuacin (v) indica que la inflacin puede elevarse en la medida que el producto objetivo
supere al potencial, esto indica que la demanda en la economa tiende a ser ms alta respecto
del crecimiento a largo plazo. En ese caso el gobierno usa alguna poltica de ajuste evidenciada
por: u / (1+ ).
Ahora si usamos las ecuaciones (ii), (iv) y (v) obtenemos el crecimiento del producto para el
nivel ptimo de inflacin y sera:
y = yn + u u / (1+ )
(vi)
Si consideramos que la oferta agregada neto del producto potencial (ii), es igual a la demanda
agregada (modelo IS), obtenemos:
y - y n = A ( i - e) + g
(vii)
(viii)
Usando la ecuacin (ii), la ecuacin (v), la ecuacin (vii) y la ecuacin (viii), obtenemos lo
siguiente:
A ( i - e) + g = * e + (1/ ) (y*- yn ) u / (1+ ) + u
( i - e) = (1/) [ e - * - (1/ ) (y* - yn) - u / (1+ ) + A+ g ]
i = e + (1/) ( e - * ) - (1/ ) (y* - yn) - u / (1+ ) + A / + g /
i = e + r + (1/) ( e - * ) - (1/ ) (y* - yn ) - u / (1+ ) + g /
(ix)
La ecuacin (ix) representa la regla de Taylor (2000) que es muy usada por diversos bancos
centrales en el mundo, con sus diversos matices o ajustes. La regla indica que si la inflacin
40
esperada es mayor al objetivo de inflacin, entonces eso obliga al banco central a subir la tasa de
inters nominal.
Otra implicancia es que el producto objetivo puede superar el producto potencial, en este
caso hay un exceso de demanda que elevar los precios por encima del nivel objetivo, aqu hay
dos efectos por un lado el efecto negativo del alza del producto (correspondiente a escenarios de
menor inters) y el efecto de precios crecientes, que deben ser corregidos con un alza de la tasa
de inters.
La ecuacin (ix) vendra a ser el modelo que necesitamos estimar (modelo estimable) para
establecer la regla de poltica monetaria de un pas. Por ejemplo Taylor (2000) ha estimado que
la regla a seguir es la siguiente:
i = e + 2 + 0.5 ( e 2 ) + 0.5 (y* - yn )
Lo anterior supone que la tasa de inters real es 2% y que la inflacin objetivo es 2%,
adems el valor de 1/ , termina siendo positivo e igual a 0.5, en otros estimados el valor de
1/, puede llegar hasta 1.5, como vemos el modelo estimable se ha probado en la prctica,
mediante el uso de un modelo estadstico.
En el caso de la ecuacin (ix) el modelo estadstico es el siguiente:
i = a0 + a1 ( e - * ) - a2 (y* - yn ) + error
(x)
La estimacin del modelo estadstico sealado en la ecuacin (x) nos permitir saber el valor
de a1 y a2, que son claves para estimar la regla de Taylor, dichos valores se juntan con la tasa de
inters real y la tasa de inflacin esperada, que en teora deberan asemejarse con a0, an
cuando esto no tiene por que ser necesariamente cierto, puesto que con los parmetros hallados,
podemos agregar los datos existentes de la tasa real de inters y la inflacin esperada. El nivel
de error del modelo configura el comportamiento de los efectos externos de la regla de Taylor,
que bien pueden indicar la ausencia de mayor cantidad de variables, o sealar que el modelo
estadstico tiene un comportamiento aceptado.
En el modelo estadstico previo, se constata la presencia de un error, no hay que olvidar que
los modelos son una representacin parcial de la realidad y por ende pueden no considerar otras
variables que pueden influir del algn modo en la respuesta esperada. Tambin hay que indicar
que normalmente se toma una muestra de datos de toda la poblacin, esperando que ello sea
representativo, aun cuando esta muestra pueda ser limitada. Estos aspectos sealados hacen
que los modelos estadsticos no necesariamente expliquen el 100% del comportamiento de la
41
variable respuesta o variable dependiente, existiendo este nivel de error, la idea siempre en todo
modelo estimable es que este error sea pequeo o sea minimizado.
(i)
(ii)
En este caso el error que tuvimos al estimar el modelo (i) puede ser representado del
siguiente modo:
u = c X2 + e
Como podemos notar, en los modelos donde falta incluir variables relevantes, el error
es mayor al esperado y ello invalida las estimaciones o resultados estadsticos. A la
inversa pensemos que el modelo (ii) presenta un exceso de variables donde X2 no
aporta mayormente al modelo, en este caso es una variable redundante y debe ser
sacada del modelo. En este caso el error e equivale al error u, slo estamos sobre
estimando el modelo en nmero de datos, pero no cambia el nivel de respuestas, ya
que c ser igual a cero.
-
Otros problemas en el diseo pueden ser el orden en que se expresan los cdigos o
nmeros que representan los datos. Por ejemplo pensemos que se tiene una encuesta
donde la variable dependiente es el Tipo de vivienda o casa de la familia, medido
como: tenencia de casa propia pagada totalmente con cdigo 1, casa propia pagada a
plazos con cdigo 2, casa de familia con cdigo 3 y casa alquilada con cdigo 4.
42
En esa misma encuesta hemos tomado adems los ingresos de la familia, cuya
variable es continua. Es decir puede ir de 1000 soles por ejemplo a 10000 soles por
mes, as cada familia tiene ingresos diferentes y se tiene una base de datos como la
siguiente, considerando por ejemplo la existencia de unos 5 entrevistados:
Id
Tipo_Vivienda Ingreso_mensual
5,000
1,000
7,000
2,000
Otro error a considerar es el uso de las variables correctas, por ejemplo en el caso del
modelo siguiente explorado anteriormente como Regla de Taylor:
i = a0 + a1 ( e - * ) - a2 (y* - yn ) + error
Existen dos variables que no son observadas, esta es la inflacin esperada e y la otra
es el producto potencial yn. La inflacin objetivo * y el producto objetivo y* son
43
variables que normalmente las define el ejecutor de poltica, en este caso el Banco
Central.
Entonces se requiere estimar la inflacin esperada y el producto potencial, pueden
darse algunas formas de estimacin bsicas, por ejemplo el uso de un promedio para
toda la serie o muestra de datos, con el problema de que la inflacin esperada es una
formacin de expectativas de los agentes por ensayo y error, es decir la expectativa se
crea en la medida que la serie de datos sea muy variable o poco variable.
La obtencin del promedio puede acarrear el problema de que es un solo dato a usar y
ello evitara la estimacin de los parmetros del modelo planteado, puesto que se
requieren series con una cantidad de datos suficiente que permita plantear relaciones
entre las variables.
Una salvedad es el clculo de un promedio mvil que pueda servir de tasa esperada o
potencial, pero esto supone que necesitamos los tramos a promediar, por ejemplo cada
3 perodos, cada dos o cada 4, la decisin puede depender de si los datos son anuales,
mensuales, trimestrales u otros, con el detalle de que si hay estacionalidades estas
deben ser eliminadas. Lo anterior supone problemas a la hora de obtener esas series
an en promedio mvil, cuya construccin puede generar errores amplios en la
estimacin.
-
44
Como vemos en el modelo final, la constante a est sub estimada, puesto que
corresponde en realidad a o, que es mayor. El parmetro b no representa realmente
el efecto de X1 en el modelo, este efecto en realidad es bd.
Prediccin de Qt
7.25
10
20
0.5
Como puede verse, hemos pronosticado el valor de la cantidad demandada (Q) para diversos
escenarios de precios (P), esto es cuando los modelos se usan para estos fines. Sin embargo
normalmente los modelos estadsticos (economtricos) se usan para analizar las relaciones entre
variables diversas.
45
Logaritmo del PIB per cpita como Proxy del nivel de desarrollo.
Para estimar el modelo sealado y encontrar cuanto efecto tienen los fondos de pensiones
(que a su vez impactan en la infraestructura), tuvieron que tener un indicador de crecimiento del
stock de infraestructura, para lo cual recurrieron a Canning (1998) quien plantea pronosticar la
infraestructura usando el modelo siguiente:
Infraest = 0.213 (TranspAer) + 0.221 (GenEnerg) + 0.200 (VasFerr) + 0.215 (Carret) + 0.208
(Telef)
Como puede verse, el ndice de infraestructura est construido a partir de datos anuales del
sector de telecomunicaciones (nmero de lneas telefnicas principales), del sector de energa
(capacidad de generacin elctrica en MW), del sector de transporte terrestre (la longitud de la
red de carreteras en kms.), del sector de transporte areo (nmero de pasajeros transportados) y
del sector de transporte ferroviario (longitud de la red ferroviaria en kms).
En buena cuenta la hiptesis indica, en ausencia de fondos de pensiones, que el ndice de
infraestructura influye en la productividad total de factores, ese efecto fue estimado por Alonso et
al (2013) en 0.014%. Si se hace una relacin simple, se puede decir que si los fondos de
pensiones invierten en esta actividad elevando un 1% adicional la infraestructura, tendrn un
efecto adicional de 0.014% en la productividad total de los factores.
Bancos Centrales, por el Ministerio de Economa u otras entidades encargadas de ejecutar las
polticas monetarias o fiscales.
Un ejemplo de la evaluacin de polticas puede encontrarse en Jaramillo y Saavedra (2011),
se analiza el efecto de la distribucin del ingreso, luego de las reformas estructurales que se
hicieron en el pas en las dcadas precedentes, al respecto se hace la siguiente cita textual:
El anlisis de las tendencias posteriores a la reforma de los noventa sugiere que la desigualdad
de los ingresos familiares ha disminuido. Este declive puede observarse en los aos de la
recesin (de 1997 a 2001) aunque no es estadsticamente significativo y se acenta ms y
adquiere significancia estadstica en el periodo de crecimiento (20012006).
Los ingresos no laborales (otros retornos por ejemplo actividades independientes - nota del autor)
han tenido el rol ms importante en la reduccin de la desigualdad del ingreso durante el periodo
de anlisis (19972006). Para el periodo 19972006, la desigualdad de los ingresos laborales a
nivel de los hogares permaneci estable, primero aument durante la recesin y luego disminuy
durante el periodo de crecimiento, de forma que en 2006 estaba en un nivel similar al de 1997.
Al desagregar el anlisis por dominio geogrfico, identificamos que los niveles de desigualdad
fueron mayores en las zonas urbanas que en las rurales y que la disminucin de la desigualad de
1997 a 2006 fue ms pronunciada en las zonas urbanas.
Con relacin a los factores explicativos asociados a la desigualdad, los resultados economtricos
confirman la importancia de la educacin como factor de reduccin de la desigualdad. As mismo,
nuestro anlisis identifica que el rea de residencia (urbana/rural) es un factor que juega un rol
mucho mayor para explicar el patrn de desigualdad que el que sugieren los estimados entre los
aos ochenta y mediados de los noventa. Esta nueva evidencia revela la importancia que parece
haber adquirido la dimensin espacial (el espacio territorial donde se desarrolla el individuo) para
explicar la desigualdad, por lo que debemos prestarle mayor atencin. En esta misma direccin,
las diferencias entre regiones (ex departamentos) estn jugando un rol importante en la
desigualdad a nivel nacional.
Los resultados mostrados por Jaramillo y Saavedra (2011) indican que la desigualdad es
bastante diferenciada, por ejemplo ser mujer supone un efecto de la desigualdad de 0.231
mientras que los hombres es de 0.214 para el ao 1999, mientras que para el ao 2006 el efecto
47
se reduce a 0.19 para mujeres y de 0.172 para los hombres, esto indica que la desigualdad se ha
reducido a lo largo del tiempo y es muy pequea entre hombres y mujeres.
El ao 1999 por ejemplo el efecto en la desigualdad es de 0.186 para aquellos sin estudios y
de 0.235 para aquellos que tienen estudios universitarios, el ao 2006 esos datos fueron de
0.128 y 0.187 respectivamente. La evidencia es que la desigualdad en el tiempo se ha reducido,
pero las diferencias entre individuos relacionadas con el nivel educativo son bastante altas, como
concluyen los mismos autores.
Las polticas que derivan de estos anlisis pueden ser de diversos tipos, por ejemplo, pensar
que estar en el mundo rural genera ms desigualdad indica que debe potenciarse los servicios
bsicos en este mbito, igualmente si la educacin es clave a la hora de mejorar los ingresos,
entonces la calidad de este servicio pblico, sobre todo en el mundo rural debe tomarse muy en
cuenta como factor de desarrollo. De este modo los modelos economtricos pueden ayudar a
establecer polticas de mejoras de los grupos sociales con fines de mejorar su calidad de vida en
el futuro.
48
49
Preguntas de opinin:
1. Se necesita siempre teora para disear un modelo economtrico?
2. Necesariamente se debe contar siempre con informacin primaria?
3. Un modelo estadstico necesariamente debe tener abundancia de datos?
4. Pueden los parmetros de un modelo economtrico ser sobreestimados?
5. Brinde 2 ejemplos de variables no observadas y cmo podra medirlas?
50
Caso de aplicacin
Lectura previa
En un mundo donde el capital es perfectamente mvil, el ahorro de un pas es libre de
moverse a su uso ms productivo. De aqu se sigue que un pas puede incrementar su inversin
sin tener que incrementar sus ahorros, ya que el incremento en la inversin pudo haberse
financiado mediante capital externo (ahorro externo). Esto es, con perfecta movilidad del capital,
un incremento en las tasas de ahorro de un pas causar un incremento en la inversin de todos
los pases. La distribucin de este incremento variar positivamente con el acervo inicial de
capital e inversamente con la elasticidad del producto marginal del capital en ese pas. De este
razonamiento se infiere que no debe haber una correlacin significativa entre la tasa de ahorro y
la tasa de inversin en ese pas.
En un mundo con movilidad perfecta de capital, el Ahorro domstico buscar estar donde su
tasa de ganancia sea la ms alta. Este movimiento se llevar a cabo an cuando la demanda
interna de capital en el pas del que se trate sea alta, ya que el flujo internacional de capital,
probablemente, cubrir en parte la demanda domstica. A la fraccin de ahorro total de un pas
que permanece como inversin se le llama "coeficiente de retencin de ahorro".
Una situacin problemtica surge cuando estadsticamente se obtienen elevados coeficientes
de retencin de ahorro que indican que el capital es inmvil y simultneamente, se observan en
la prctica mercados de capital altamente integrados con flujos de capital mviles. Esta es la
conocida paradoja de Feldstein-Horioka.
La paradoja de Feldstein-Horioka es uno de los seis mayores acertijos en Macroeconoma
Internacional (Obstfeld y Rogoff, 2000). El ahorro interno y las tasas de inversin estn altamente
correlacionados tanto dentro como entre pases de la OCDE (Organizacin para la cooperacin y
desarrollo econmico-pases ricos), en los aos y en los pases donde el ahorro es alto, por la
inversin realizada.
Este hecho parece incompatible con la teora intertemporal de la cuenta corriente. Si se
asume perfecta movilidad del capital, por ejemplo, una teora predice que los factores
determinantes del ahorro y la inversin no son lo mismo. Por lo tanto, los pases deben prestar y
pedir prestado en el extranjero cada vez que necesitan para invertir o desinvertir, sin verse
limitados por las decisiones de ahorro interno.
Feldstein y Horioka (1980) interpretaron su hallazgo como evidencia de la baja movilidad de
capitales entre los pases de la OCDE. Sin embargo, en las dcadas posteriores a la publicacin
de los resultados de Feldstein y Horioka, la movilidad del capital entre los pases de la OCDE ha
51
seguido aumentando, mientras que la correlacin entre las tasas de ahorro e inversin slo ha
disminuido ligeramente.
Preguntas de la lectura
1. Qu variables intervienen en la paradoja de Feldstein-Horioka?
2. Cmo ser un modelo terico que represente bien la paradoja sealada?
3. Plantee un modelo estadstico para la paradoja de Feldstein-Horioka.
52
Ejercicios
Considera la figura siguiente que ilustra el teorema de separacin de Fisher:
8!(1+i)!
R!
Donde C1* y C2* son el consumo presente y consumo futuro respectivamente, mientras que
D2* es el flujo obtenido en el futuro por una inversin (I) realizada en el presente. La inversin (I)
equivale a R D1, Donde R es la riqueza inicial del individuo o su dotacin inicial. Este es un
supuesto fuerte del modelo, que considera que los inversores si bien pueden no tener riqueza
alguna, pueden conseguir estos fondos iniciales de alguna forma en el mercado financiero directo
(emisiones de capital) o mediante redes de inversionistas ngeles o inversores de riesgo,
inclusive puede darse financiamiento bancario, pero esto no influir en la generacin del flujo D2.
D1* vendra a ser el ingreso disponible del individuo en el presente, dado que invirti parte de
su riqueza, el saldo es ingreso destinado a consumo o ahorro en el mercado financiero.
La curva que se origina en R, genera un flujo de caja (tambin denominada una funcin de
produccin o generacin de ingresos) cuya caracterstica es que tiene rendimientos marginales
decrecientes y adems se hace igual a la tasa de inters acumulada, equivalente a (1+i) o
pendiente del comportamiento presente y futuro del mercado financiero.
53
D2* = FC (I)
D2* / FC (I) = (1+i)
Entonces el flujo de caja que genera una inversin, es como mnimo equivalente a (1+i), con
ello resultan el flujo futuro D2 y el ingreso disponible D1.
Si el total de los ingresos actuales y futuros (D1* y D2*) son iguales al consumo, entonces esto
tambin resulta equivalente a la tasa de inters:
C1* + C2* / (1+i) = D1* + D2* / (1+i)
Para C1* = 0
C2* = D1* (1+i) + D2*
Para C2* = 0
C1* = D1* + D2* / (1+i)
Hallando la pendiente del consumo presente y futuro C2* / C1*:
D1* (1+i) + D2* / D1* + D2* / (1+i)
[ D1* (1+i) + D2* ] (1+i) / D1* (1+i) + D2*
C2* / C1* = (1+i )
La relacin es inversa, por cuanto el mayor inters afectar el consumo.
Finalmente la ganancia (G) del inversor se puede estimar del siguiente modo:
G = FC (I) I
En esta ecuacin debemos tomar en cuenta que la inversin se encuentra en el presente y el
flujo de caja es presente y futuro, de modo que los resultados se estiman considerando lo
siguiente:
54
FC (I) = Y2 / (1+i) + Y1
Ahora G se denomina en ese caso, Valor presente neto o tambin valor actual neto (VAN),
indicador que mide el xito de la inversin realizada.
Si ahora consideramos que el FC (I) se halla teniendo una tasa de inters y una dotacin R,
entonces es posible encontrar C1* y C2* del siguiente modo:
FC (I) = C1* + C2* / (1+i)
Tomando en cuenta que la pendiente equivale a (1+i) entonces (en este caso las preferencias
intertemporales son homogneas y equivalentes, el consumidor es indiferente a decidir en el
presente o futuro):
FC (I) = C1* + C1* (1+i) / (1+i)
FC (I) = 2 C1*
FC (I) / 2 = C1
Si quisiramos saber si el individuo tom prestado en el presente o asumi una deuda,
estimamos lo siguiente:
Y1 C1
De ser positivo el individuo ahorr y si es negativo, el individuo se endeud, pero ello no
altera en nada el patrn de comportamiento de FC (I), lo que se denomina teorema de
separacin de Fisher.
Preguntas
55
Referencias bibliogrficas
Acemoglu, D. And Robinson, J. (2012) Why Nations Fail: The Origins of Power, Prosperity, and
Poverty. Crown Publisher. NY. USA.
Alcal V. Gmez, M. y Ventosa, D. (2010) Paradoja Feldstein Horioka: El caso de Mxico (19502007). Estudios Econmicos. Vol 26. Nm. 2. Junio Diciembre 2011. Mxico.
Alonso, J. Bjeletic, J. Herrera, C. Hormazbal, S. Ordez, I. Romero, C. Tuesta, D. y Ugarte, A.
(2013) Proyecciones del impacto de los Fondos de Pensiones en la inversin en infraestructuras y el
crecimiento en Latinoamrica. Economic Research Department No 0921. BBVA Working papers.
Espaa.
Barro, R. y D. Gordon (1983), Rules, Discretion, and Reputation in a Model of Monetary Policy,
Journal of Monetary Economics, 12.
Becker, Gary (1975). Human Capital. Columbia University Press.
Carrera, C. (2012) Long-Run Money Demand in Latin-American countries: A Nonstationary Panel
Data Approach. DT. N 2012-016. Banco Central de Reserva del Per.
Chiswick, Barry (1997). Interpreting the Coefficient of Schooling in the Human Capital Earnings
Function. Policy Research Working Paper 1790. The World Bank.
De Soto, H. (1986) El otro sendero: La revolucin informal. Edit. Sudamericana. BA. Argentina.
Jaramillo, M. y Saavedra, J. (2011) Menos desiguales: La distribucin del ingreso luego de las
reformas estructurales. Grade. Per.
Krugman, P. (1991) Increasing returns and economics geography. Journal of Political Economy,
1991. Vol. 99, no. 3. Chicago U. USA.
Len, C. (2003) Anlisis macroeconmico para la empresa. Edit. USAT.
Mies, V. y Soto, R. (2000) Demanda por dinero: Teora, evidencia y resultados. Revista de
Economa Vol. 3. N. 3. Banco Central de Chile.
56
Obstfeld, M. and Rogoff, K. (2000) The six major puzzles in international macroeconomics: Is there a
common cause?. Cap. VI in NBER Macroeconomics annual 2000. Volume 15. Editor Bernanke, B.
And Rogoff K. MIT Press.
Piketty, T. (2013) Capital in the Twenty-First Century. Belknap Press.
Porter, M. (1985) The Competitive
Performance. NY: Free Press.
Advantage:
Creating
and
Sustaining
Superior
57
CAPTULO II
Relaciones estadsticas
entre variables aleatorias
58
Hogares que demandan energa elctrica en el ltimo ao, de los cuales se elegirn
aquellos con consumo mayores al promedio.
Tener variables discretas ayuda mucho en la representacin de diversas variables que suelen
llamarse categricas, donde encajan niveles de empleo, tipos de empleo, educacin, salud y
otras variables sociales.
Se tiene tambin variables continuas, que pueden tomar cualquier valor numrico en un
conjunto infinito de posibilidades, por ejemplo tenemos:
-
Sea E: El valor del tipo de cambio en una semana cualquiera, por ejemplo lunes 2.75
soles por dlar, martes 2.77, mircoles 2.79, jueves 2.76, viernes 2.77. Donde la
variables aleatoria es E = (2.75, 2.77, 2.79. 2.76, 2.77)
Sea i: La tasa de inters trimestral, por ejemplo trimestre I 10%, Trimestre II 12%,
Trimestre III 9% y Trimestre IV 10.5%, as la variable continua i = (10%, 12%, 9%,
10.5%)
En las ciencias econmicas las variables continuas son normalmente las que tienen que ver
con valores numricos diversos: edad, aos de estudio, aos de trabajo, tasas de inters, tipos
de cambio, valores monetarios diversos como emisin, liquidez, reservas internacionales, valores
porcentuales en cambio diario, mensual o anual como tasa de inflacin, depreciacin cambiaria,
variacin de la pobreza, tasa de pobreza, tasa de empleo, ndices diversos como IPC, IPM,
ndice de empleo, ndice de valor de la produccin y otros.
Las variables aleatorias pueden relacionarse de diversos modos, veamos los ejemplos
siguientes:
61
Fig. 2.1 Relacin entre tasa de encaje (%) y Tasa interbancaria en Soles (%) 2010-2013 en
Meses
Fuente: BCRP
La figura anterior indica una relacin positiva entre la tasa de encaje que cobra el Banco
Central de Reserva a los bancos y la tasa de inters interbancaria en soles, evidenciando para el
perodo de anlisis que un mayor encaje progresivamente representa una mayor tasa de inters,
existe la evidencia que para mayores tasas de encaje el efecto del incremento es ms dbil. En
este caso hemos graficado dos variables continuas en % mensual. La muestra empleada para el
conjunto de enero del 2010 a diciembre del 2013, fue elegida al azar entre todo el horizonte de
tiempo disponible.
En la figura siguiente combinamos una variable continua calculada como ndice, nos
referimos al ndice selectivo de la Bolsa de Valores de Lima y la tasa de encaje ya mostrada.
Como podemos ver no hay una aparente relacin entre ambas variables, en buena cuenta si
esperamos que el mayor costo del inters en el mercado bancario puede actuar como incentivo
al mayor rendimiento en ndice burstil, pues la evidencia no lo respalda. Lo ms probable sea
que la menor actividad econmica (mayor encaje afecta el inters al alza y reduce el crdito)
pueda influir negativamente en las operaciones burstiles, pero esa evidencia tampoco se
62
respalda, estamos entonces en presencia de dos variables continuas que no generan relacin
alguna, al menos en la muestra aleatoria tomada.
Fig. 2.2 Relacin entre tasa de encaje (%) e ndice Selectivo de la BVL 2010-2013 en
Meses
Fuente: BCRP
Fuente: INEI
63
La figura previa muestra las relaciones entre dos variables aleatorias, una continua que
representa al nmero de mujeres hospitalizadas por enfermedades infecciosas y la otra es una
variable discreta que son los grupos etreos o edades agrupadas, donde 1 representa menores
de 15 aos, 2 indica el grupo de 15 a 24 aos, 3 es para las edades entre de 25 a 49 aos y 4
representa a los que tienen 50 a ms aos. Como indica la figura, es normal encontrar que las
enfermedades infecciosas en mujeres se concentran normalmente a partir de los 25 aos, que es
donde ms casos existe, aqu la muestra tomada fueron datos anuales del ao 2007 al 2012.
Sale
2
3
3
3
3
2
4
5
4
2
6
6
4
3
3
Lanza
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Sale
6
3
6
5
2
2
1
4
4
2
6
4
5
3
1
64
Con estos resultados se tiene la siguiente tabla de frecuencias totales, relativas y acumuladas:
Tabla 2.2 Frecuencias relativas para 30 lanzamientos de un dado
Nmero del dado
1
2
3
4
5
6
Total
frecuencia
2
6
8
6
3
5
30
Frecuencia relativa
0.07
0.20
0.27
0.20
0.10
0.17
1
F acumulada
0.07
0.27
0.53
0.73
0.83
1.00
La tabla indica que el nmero uno del dado sali 2 veces, esto representa un 0.07 (7%) de un
total de 30 lanzadas, as el nmero 3 sali 8 veces, lo cual representa el 0.27 (27%) del total de
lanzadas que fue 30. As sucesivamente se ponen las veces que sali el nmero del dado,
conocido como frecuencia, luego se tiene la frecuencia relativa y finalmente la frecuencia
acumulada, equivalente a la suma de las frecuencias relativas para cada nmero del dado, por
ejemplo para el primer lanzamiento la frecuencia acumulada es 0.07, luego 0.27 (sumando 0.20)
y as sucesivamente hasta llegar a 1
La figura siguiente indica el tipo de distribucin que hemos conseguido, como podemos ver
los resultados de lanzamiento de los dados se concentran al medio, para ello vean la figura en
barras, esta concentracin al centro indica la clsica llamada distribucin normal, es probable que
si lanzramos el dado unos 100 veces o mil veces, obtendramos una figura con datos
concentrados al centro y eso representa que la distribucin lograda es Normal. Algunas veces los
datos pueden concentrarse hacia los costados, lo que indica otros tipos de distribucin, algo
relacionado a datos de tipo social cuando por ejemplo medimos la estructura de ingresos as los
datos tendern a concentrarse en los ms numerosos, que pueden ser los de menores ingresos.
65
El lanzamiento de 30 dados tiene un valor esperado que se estima del siguiente modo, para
ello usamos la informacin de la tabla 2.2 de frecuencias previa:
Valor esperado del nmero del dado= Frecuencia relativa * Nmero del dado
Valor esperado = 0.07 * 1 + 0.20 * 2 + 0.27 * 3 + 0.20 * 4 + 0.10 *5 + 0.17 * 6 = 3.57
Una generalizacin al clculo anterior es el hecho de que la frecuencia relativa, tambin
refleja la probabilidad de ocurrencia del nmero del dado, as por ejemplo la probabilidad de que
salga el nmero 5 en 30 lanzamientos del dado es de 0.10 o 10%, mientras que el nmero del
dado vendra a ser la variable aleatoria que estamos midiendo (nmero que sale en cada
lanzamiento), con ello la frmula general de valor esperado, considerando que X es la variable
aleatoria cualquiera, queda:
Valor esperado de X = Px * X
66
Donde Px, es la probabilidad de suceso de X. Hay que notar que el valor esperado equivale al
promedio de la variable aleatoria para todo el grupo de datos que resultan de cada lanzamiento,
as la suma de nmeros que sale del dado entre 30 lanzamientos en total, equivale al promedio
de la variable aleatoria:
Valor esperado de X = Promedio Xm = Xi / N
Donde Xm es el promedio de X y Xi representa a cada valor resultante en el dado para cada
lanzamiento, por ejemplo X para el primer lanzamiento (es decir X1) es 2, para el segundo
lanzamiento X2 es 3 y as sucesivamente.
Gasto (Y)
1
2
3
4
5
6
Total
20
28
8
4
0
0
0
40
Ingresos (X)
30
40
3
0
15
3
6
6
6
15
0
3
0
3
30
30
Total
31
26
16
21
3
3
100
68
De acuerdo con la tabla previa, 40 entrevistados tienen ingresos de 20 mil al ao, 30 tienen
ingresos de 30 mil y 30 ms tienen ingresos de 40 mil al ao. Por otro lado 31 entrevistados
tienen un nivel de gasto de 1 (70% a ms del ingreso usado como gasto en alimentos), 26
entrevistados tienen un nivel de gasto 2, 16 entrevistados un nivel de gasto 3, 21 tienen un gasto
equivalente a 4, 3 tienen un gasto en nivel 5 y 3 tienen un gasto en nivel 6, es decir slo 3
entrevistados tienen un gasto que equivale a menos del 30% de sus ingresos.
Dentro de la tabla aparecen las frecuencias absolutas, por ejemplo 28 entrevistados ganan 20
mil soles al ao y gastan en el nivel 1. En el mismo sentido 6 entrevistados por ejemplo, tienen
ingresos por 30 mil al ao y gastan en el nivel 4, asimismo 15 entrevistados ganan 40 mil y
gastan en el nivel 4.
Una vez conocidas las frecuencias absolutas podemos ahora estimar las frecuencias relativas
o tambin las probabilidades de suceso, para ello veamos la tabla siguiente:
Tabla 2.4 Probabilidades de suceso para ingreso (X) y gasto (Y)
gasto (Y)
1
2
3
4
5
6
PMg X
20
0.28
0.08
0.04
0
0
0
0.4
Ingresos (X)
30
40
PMg Y
0.03
0
0.31
0.15 0.03
0.26
0.06 0.06
0.16
0.06 0.15
0.21
0
0.03
0.03
0
0.03
0.03
0.3
0.3
1
En la tabla 2.4, se muestran las probabilidades de suceso para X e Y, se estim tambin las
probabilidades marginales (PMg) tanto de X como de Y. Las probabilidades de suceso se
estiman como Frecuencia absoluta / total de entrevistados, por ejemplo el 0.28 equivale a la
probabilidad de ganar 20 mil y gastar en el nivel 1 y se calcula como 28/100.
Las probabilidades marginales se calculan como la suma de las probabilidades de suceso
para cada posibilidad de X o de Y. En el caso de la probabilidad marginal de X, se obtiene
sumando:
69
20
0.7
0.2
0.1
0
0
0
1
30
0.1
0.5
0.2
0.2
0
0
1
40
0
0.1
0.2
0.5
0.1
0.1
1
Como muestra la tabla 2.5, la probabilidad de que se gaste en el nivel 1 dado un ingreso de
20 mil, es de 0.20 o 20%. La probabilidad de que se gaste en el nivel 2 dado un ingreso de 30
70
mil, es de 0.5 o 50%. La probabilidad de que se gaste en el nivel 6 dado un ingreso de 40 mil, es
de 0.1 o 10% y as sucesivamente con otro nivel de gasto dado un ingreso.
Ahora estimaremos el valor esperado condicional de Y/X, para ello consideramos lo siguiente:
E (Y / Xi) = P (Y / Xi) * Yi
La tabla siguiente muestra los estimados, as para cada nivel de ingreso (Xi) hay un valor
esperado condicional de Y / X:
Tabla 2.6 Esperanza condicional de Y / X
P ( Y/Xi ) * Y
1
2
3
4
5
6
E Y / Xi
20
0.7
0.4
0.3
0
0
0
1.4
30
0.1
1
0.6
0.8
0
0
2.5
40
0
0.2
0.6
2
0.5
0.6
3.9
Los clculos salen del siguiente modo, para un nivel de ingresos de 20 mil, las probabilidades
condicionales por Yi, son: 0.7 * 1, 0.2 * 2, 0.1 * 3, 0 * 4, 0 * 5, 0 * 6.
Para un ingreso de 30 mil, resulta: 0.1 * 1, 0.5 * 2, 0.2 * 3, 0.2 * 4, 0 * 5, 0 * 6.
Para un ingreso de 40 mil resulta: 0 * 1, 0.1 * 2, 0.2 * 3, 0.5 * 4, 0.1 * 5, 0.1 * 6
La sumatoria de las probabilidades condicionales (Y/X) * Y, resulta finalmente en el valor
esperado de Y/Xi, que en la tabla se muestra como E Y/ Xi, as el valor esperado resulta del
siguiente modo:
E Y / X1 = 1.4
E Y/ X2 = 2.5
E Y / X3 = 3.9
71
Como se ve en la figura previa y tomando en cuenta los datos de la tabla 2.3, para un ingreso
de 20 mil, los valores de gasto van de 1 a 3, siendo el valor esperado de 1.4 (equivalente a la
media condicional). Para el nivel de ingreso de 30 mil, los valores de gasto van de 1 a 4, siendo
el valor esperado de 2.5 (promedio condicional). Finalmente para un nivel de gasto de 40 mil, el
gasto en alimentos va del nivel dos al 6, siendo el valor esperado de 3.9 o promedio condicional
de Y/X.
Para calcular el valor esperado del conjunto de datos analizado (los 100 entrevistados)
procedemos del siguiente modo:
E Y/ X = E Y / Xi * Pmg Xi
E Y / X = 1.4 * 0.4 + 2.5 * 0.3 + 3.9 * 0.3 = 2.48
72
Hay que notar que el valor esperado de Y es de 2.48 y debe coincidir con el promedio de
todos los entrevistados para la variable respectiva.
Para hallar la varianza total condicional de Y/X, recurriremos al concepto previo de varianza
ya analizado y le agregaremos el valor esperado de la varianza condicional. As la varianza
condicional de una variable aleatoria (V) equivale a la suma de la varianza del valor esperado de
Y/ X y al valor esperado de la varianza condicional. Para el caso de la variable Gasto (Y) la
varianza total condicional V (Y / X) es:
V (Y / X) = Var E Y/ X + E (V Y/X)
Donde:
Var E Y/ X
= E Y/ X 2 - (E Y/ X)2
E Y/ X 2
= [E Y / Xi 2 * PMg Xi]
E (V Y/X)
= [V Y/ Xi E Y / Xi 2] PMg Xi
V Y/ Xi
= Pi Y/ Xi * Yi 2
73
20
0.7
0.8
0.9
0
0
0
2.4
30
0.1
2
1.8
3.2
0
0
7.1
40
0
0.4
1.8
8
2.5
3.6
16.3
La sumatoria de los valores obtenidos para cada nivel de ingreso resulta en la esperanza de
la varianza, por ejemplo para un nivel de ingreso de 20 mil, la esperanza de la varianza
condicional es de 2.4 y as sucesivamente para los valores que se muestran en la tabla. A estos
valores obtenidos le quitamos la esperanza de la varianza al cuadrado, como sigue:
E (V Y/ X) = [V Y/ Xi E Y / Xi 2 ] PMg Xi
V Y/ X1 E Y / X1 2 = 2.4 - 1.4 2 = 0.44
V Y/ X2 E Y / X2 2 = 7.1 - 2.5 2 = 0.85
V Y/ X3 E Y / X3 2 = 16.3 - 3.9 2 = 1.09
E (V Y/X) = 0.44 * 0.4 + 0.85 * 0.3 + 1.09 * 0.3 = 0.758
Finalmente con la varianza del valor esperado E Y/X y con la esperanza de la Varianza
condicional V Y/ X, tenemos la varianza total condicional:
V (Y / X) = Var E Y/ X + E (V Y/X)
V (Y / X) = 1.0716 + 0.758 = 1.8296
Con la varianza obtenida, se puede estimar tambin la desviacin estndar total de Y/X, que
resulta del siguiente modo:
S (Y / X) = 1.8296 0.5 = 1.35263
74
Del mismo modo puede estimarse la varianza total condicional de X/Y y la desviacin
estndar respectiva, los clculos se basan en las siguientes ecuaciones:
V (X / Y ) = Var E X/ Y + E ( V X/ Y)
Donde:
Var E X/ Y
= E X/ Y 2 - (E X/ Y)2
E X/ Y 2
= [E X / Yi 2 * PMg Yi]
E (V X/ Y)
= [V X/ Yi - E X / Yi 2 ] PMg Yi
V X/ Yi
= P X/ Yi * Xi 2
20
0.90
0.31
0.25
0
0
0
30
0.10
0.58
0.38
0.29
0
0
40
0
0.12
0.38
0.71
1.00
1.00
Total
1
1
1
1
1
1
La tabla anterior muestra el clculo de la probabilidad condicional de X/Yi, para ello se usaron
los datos de las probabilidades de suceso Pi y se dividieron entre la probabilidad marginal de Y
(PMg Y). Como puede verse la suma de las probabilidades condicionales para cada nivel de
gasto es igual a 1.
75
20
18.06
6.15
5.00
0
0
0
30
2.90
17.31
11.25
8.57
0
0
40
0
4.62
15.00
28.57
40.00
40.00
E X/Y
E X/Yi
20.96774
28.0769
31.25
37.14286
40
40
29
E X/Yi 2
439.6462
788.3136
976.56
1379.591
1600
1600
883.2161468
La tabla previa muestra el clculo del valor esperado de Y/X, los valores de la tabla se
obtienen usando cada probabilidad condicional estimado en la tabla 2.8 multiplicado por el valor
de Xi.
La suma de los valores esperados para cada nivel de gasto del 1 al 6, se muestra en la
columna E X/Yi, donde por ejemplo 20.96 es el valor esperado del ingreso X para el nivel de
gasto 1, 28.07 sera el valor esperado del ingreso para el nivel de gasto 2 y as sucesivamente. El
valor esperado de X resulta de aplicar lo siguiente:
E X/ Y = 20.96 * 0.31 + 28.07 * 0.26 + 31.25 * 0.16 + 37.14 * 0.21 + 40 * 0.03 + 40 * 0.03 =
29
La columna E X/Yi 2, muestra el valor esperado elevado al cuadrado, para cada nivel de gasto
se hace esta estimacin, por ejemplo para el nivel 1 de gasto, el valor E X/Y1 2 es de 439 (resulta
de 20.96 2) y as sucesivamente. Mientras que el valor esperado total resulta as:
E X/ Y 2 = 439.6 * 0.31 + 788.3 * 0.26 + 976.5 * 0.16 + 1379.5 * 0.21 + 1600 * 0.03 + 1600 *
0.03 = 883.22
Con el clculo anterior, procedemos a estimar un componente de la varianza total condicional
de X/Y, denominado la varianza del valor esperado de X/Y:
Var E X/ Y = 832.22 292 = 42.22
76
La tabla siguiente indica la estimacin del otro componente de la varianza total condicional
de X/Y, en este caso se refiere al valor esperado de la varianza condicional. La columna P (X/Yi)
X2 indica la sumatoria de las probabilidad condicionales multiplicadas por el cuadrado de X, por
ejemplo para el primer valor de varianza condicional de Y1/X equivale a 0.90 * 20 2, para el
segundo valor es 0.1 * 30 2 y para el valor final es 0 (0 * 40 2), la suma de esos tres valores para
Y1 es de 448.4 (Tenga cuidado con el redondeo de los nmeros en esta tabla).
Finalmente la ltima columna es el componente de valor esperado de la varianza condicional
para cada Yi, en este caso consideramos que P (X/Yi) X2 equivale a V X/Yi y se resta del valor
esperado de (E X/Yi) 2 obtenido en la tabla 2.9. As por ejemplo para Y1, se tiene el clculo
siguiente (y sucesivamente):
V X/ Y1 E X / Y1 2 = 448.4 439.6 = 8.74
Tabla 2.10 Estimacin de la varianza condicional de X/Y
P X/ Yi * Xi 2
1
2
3
4
5
6
20
361.3
123.1
100.0
0.0
0.0
0.0
30
87.1
519.2
337.5
257.1
0.0
0.0
40
0.0
184.6
600.0
1142.9
1600.0
1600.0
P (X/Yi) X2
448.4
826.9
1037.5
1400.0
1600.0
1600.0
V X/ Yi E X / Yi 2
8.7409
38.6095
60.9375
20.4082
0.0000
0.0000
= [V X/ Yi - E X / Yi 2 ] PMg Yi
E (V X/ Y) = 8.7 * 0.31 + 38.6 * 0.26 + 60.9 * 0.16 + 20.4 * 0.21 + 0 * 0.03 + 0 * 0.03 = 26.78
Finalmente la varianza de X/Y resulta:
V (X / Y) = Var E X/ Y + E (V X/ Y)
V (X / Y) = 42.22 + 26.78 = 69
77
Con la varianza obtenida, se puede estimar tambin la desviacin estndar total de X, que
resulta del siguiente modo:
S (X / Y) = 69 0.5 = 8.3066
= E XY - E Y/X * E X/Y
E XY
= Pi * Xi * Yj
Xi * Yj
20
5.6
3.2
2.4
0
0
0
30
0.9
9
5.4
7.2
0
0
40
0
2.4
7.2
24
6
7.2
78
Cada elemento de la tabla anterior se obtiene del siguiente modo, por ejemplo para el primer
elemento (gasto nivel 1 e ingreso de 20 mil) se multiplica 0.28 (revise las probabilidad de la tabla
2.4) por 20 y por 1, resultado 5.6. Para el segundo elemento 0.9, se obtiene multiplicando 0.03 *
30 * 1, resultando 0.9, as sucesivamente.
La suma del total de elementos de la tabla 2.11 representa el valor esperado de XY:
E XY = 80.5
Con esta informacin la covarianza es:
Covarianza (X, Y) = 80.5 - 2.48 * 29 = 8.58
Finalmente la correlacin entre X, Y es:
Coeficiente de correlacin (X, Y) = 8.58 / (1.35263 * 8.3066) = 0.7636
El coeficiente de correlacin indica que entre X, Y existe una asociacin positiva, es decir si
una variable sube o aumenta de valor, la otra se comporta de igual modo. El mximo valor que
puede obtener una correlacin positiva es 1, esto supone que la covarianza equivale al producto
de las varianzas. Esto ltimo significa que la variable tiene una varianza cuyo comportamiento
equivale a la otra, ambas varan de modo similar por ello su correlacin es 1.
El valor mnimo de una correlacin es -1, lo que indica un perfecto comportamiento inverso o
negativo, en buena cuenta la varianza de una variable equivale a la inversa de la otra varianza,
de modo que su comportamiento es perfectamente opuesto.
Si la correlacin es cero, supone que las varianzas independientes son bastante altas, pero
que la covarianza entre variables es baja, es decir su comportamiento no tienen ninguna relacin,
de modo que las variables no tienen ningn comportamiento asociado.
79
Fig. 2.6 Relacin entre tipo de cambio y riesgo pas. 2010-2013 Mensual
Fuente: BCRP
La figura previa muestra la relacin entre dos variables aleatorias, el tipo de cambio sol x
dlar y el riesgo pas en puntos bsicos, el coeficiente de correlacin entre ambas variables es de
0.51, positiva y relativamente alta. Esto puede indicar que alzas del riesgo pas, implican una
salida de capitales con lo cual sube el tipo de cambio. En la figura siguiente la correlacin es de
0.01, claramente no existe ninguna relacin entre las dos variables en estudio:
Fig. 2.7 Relacin entre tipo de cambio y tasa de inflacin (IPC). 2010-2013 Mensual
Fuente: BCRP
80
81
Preguntas de opinin
1. Correlacin es lo mismo que causalidad?
2. Por qu la correlacin al cuadrado, se denomina coeficiente de determinacin?
3. Por qu la correlacin no puede ser mayor que 1?
4. D ejemplos de experimentos aleatorios para estudiar el efecto de los programas
sociales.
5. Brinde 2 ejemplos de variables aleatorias discretas que puedan usarse en
poltica fiscal.
82
Caso de aplicacin
Lectura previa
Una trampa de la liquidez es aquella situacin en la que el pblico est dispuesto, a un
tipo de inters dado, a mantener cualquier cantidad de dinero que se ofrezca. En buena
cuenta la tasa de inters no representa mayor incentivo para modificar los saldos monetarios
reales o la demanda de dinero. En el contexto de la trampa de la liquidez, la curva LM es
horizontal ya que las variaciones de la cantidad de dinero no la desplazan:
Inters!
IS!
LM!
Producto!
Como muestra la figura previa, la poltica monetaria llevada a cabo por medio de
operaciones de mercado abierto (es decir las colocaciones de soles en el mercado que
pueden darse por compra de moneda extranjera o por incrementos de activos diversos del
Banco Central de Reserva) no influye ni en el tipo de inters ni en el nivel de renta. Esto se
debe a que todo aumento monetario equivale a un comportamiento similar de la demanda de
dinero, toda vez que los agentes no responden a la tasa de inters, de modo que ms oferta
monetaria equivale a ms demanda monetaria. Ello hace que los saldos monetarios tampoco
alteren el consumo y dado que no se mueve la tasa de inters, tampoco se altera el crdito y
por ende no se mueve el producto.
83
84
Ejercicios
X
Y
100
70
95
20
45
125
65
245
85
Referencias bibliogrficas
Greene, W. (2003) Econometric Analysis. Fifth Edition. Pearson Ed.
Gujarati, D. (2004) Econometra. 4ta Edic. Mc Graw Hill.
Jimnez, F. ( ) Elementos de teora y poltica macroeconmica para una economa abierta. Fondo
Editorial PUCP.
Johnston, J. and Dinardo, J. (1997) Econometric Methods. Fourth Edition. Mc Graw Hill.
Novales, A. (1993) Econometra. Mc Graw Hill.
Wooldridge, J. (2009) Introductory Econometrics. A modern approach. Third Edition. Cengage
Learning.
86
CAPTULO III
Modelo de regresin lineal
bsico: Estimacin y prueba
de hiptesis
87
88
(i)
E Y/X = 0 + 1 X2
(ii)
Un ejemplo de un modelo donde Xa (no lineal) puede darse, es la expresin comn del
modelo de produccin siguiente:
Y=KaLb
Y/L= KaLb/L
Donde:
Y:
Producto
Y / L:
K:
Stock de capital
L:
a +b = 1
a=1b
Y / L = (K / L) a
Esta ltima expresin indica que el producto per cpita se relaciona con el capital por
trabajador o per cpita, si deseamos estimar este modelo sin aplicar logaritmos, tendra esta
versin economtrica:
Ypc = 0 + 1 Kpc a
(iii)
Si bien el producto per cpita (Ypc) no tiene un relacin perfectamente lineal con el capital per
cpita (Kpc), la expresin (iii) es un modelo economtrico que presenta un error de diseo, por
cuanto no conocemos el valor del parmetro a haciendo ello imposible su estimacin.
El modelo correcto sera el siguiente:
Log Ypc = a Log Kpc
Donde vemos que el resultado del modelo economtrico es estimar a, por lo tanto la
presencia de variables cuadrticas o con un algn exponente, puede representar un problema de
diseo del modelo, en algunos casos el uso de variables cuadrticas se usa sin perder linealidad
considerando aspectos como:
90
La variable explicativa se comporta de modo no lineal, por ejemplo los costos de una
empresa pueden no ser lineales, en razn de darse costos fijos y variables o semi fijos.
Los costos de algunas empresas pueden ser en forma decreciente y creciente (la
clsica curva en forma de U) de modo que modelos que incorporen el costo como
independiente pueden ser no lineales en esa variable.
Las percepciones del pblico respecto a un producto pueden variar dependiendo del
ingreso del individuo, as a medida que hay ms distancia cuadrtica entre ingresos
(por ejemplo ingreso del individuo uno menos el del individuo dos, todo al cuadrado)
podra variar en mayor ritmo la demanda de un bien medido en gasto monetario.
(iv)
La ecuacin (iv) es no lineal en los parmetros, por lo menos en 1, esto genera problemas
de estimacin al menos desde la perspectiva que aqu trabajamos, que es tener un parmetro
cuyo efecto es directo con la variable respuesta. Consideremos que estimamos el modelo (iv), sin
embargo no conocemos que el parmetro es al cuadrado, es decir el efecto real no es la
estimacin realizada sino la raz cuadrada de la misma, por ende el modelo puede tener
problemas de estimacin del parmetro, puede estar sobre estimado.
Ahora revisemos la figura siguiente, que muestra la relacin entre la tasa de encaje promedio
en el Per y la tasa de inters activa en moneda nacional. Se puede evidenciar una pequea
relacin positiva entre ambas variables, en buena cuenta un alza de la tasa de encaje se
relaciona con pequeas alzas en la tasa de inters, la idea de la econometra es estimar el
tamao de ese efecto medido por el parmetro respectivo.
91
Fig. 3.1 Relacin entre Tasa de Encaje y Tasa activa en moneda nacional (TAMN)
Mensual Junio 2012 - Mayo 2014
Error = 4.482
Error = 4.223
Error = -5-528
Muestra!1!
Muestra!2!
Poblacin!
Encaje!
El error mostrado en las estimaciones anteriores, se refiere a cuanta distancia hay entre la
TAMN estimada poblacionalmente y cada una de las muestras, como puede verse el error de las
estimaciones muestrales puede ir por encima de la variable TAMN o por debajo de la misma. En
buena cuenta los modelos economtricos dado que son muestrales, siempre tienen un nivel de
93
Como muestra la figura anterior las estimaciones que realizamos de una variable aleatoria
contienen siempre un nivel de error, primero porque siempre estimamos un valor esperado, el
cual es un dato que se encuentra entre la media de los datos respectivos, la desviacin existente
en torno a la media estimada, garantiza la presencia de error aleatorio. En el caso de las
regresiones muestrales el error se amplifica, porque adems de que estimamos una media
94
muestral (o valor esperado muestral), a las desviaciones propias de la muestra se le suma las
desviaciones en torno a la media poblacional (o valor esperado poblacional), lo que implica un
mayor nivel de error.
Las siguientes son las sumas y valores esperados de las estimaciones de error de cada
regresin realizada:
Tabla 3.1 Valor esperado del Error del modelo Encaje -TAMN
Suma Error
E (Error)
Poblacin
0.03
0.00
Muestra 1
-0.03
0.00
Muestra 2
0.10
0.01
Muestra 3
0.49
0.04
La tabla anterior indica que el valor esperado del error poblacional tiende a ser cero (es
posible que haya estimaciones mayores y menores respecto al dato real), mientras que de las
tres muestras realizadas la primera tiene un error esperado de cero y las otras dos tienen estos
errores cercanos a cero.
Visto la tabla, el modelo poblacional tiene un E(U) = 0, mientras que la regresin de mayor
cercana de la muestra 1, tambin presenta un E(Ui) = 0, en ambos casos ambos modelos son
los que mejor representan el comportamiento de la variable dependiente o tasa de inters activa
en moneda nacional, es siempre muy probable que la funcin de regresin poblacional tenga un
error esperado de cero, dado que contiene todos los daos posibles, mientras que la muestra de
menor error (o cero) es aquella que mejor representa el comportamiento poblacional.
Hay que considerar adems, que normalmente siempre trabajaremos con regresiones
muestrales, de modo que un criterio bsico es hallar aquella regresin que presenta el menor
error posible en la estimacin de la variable dependiente. En nuestro ejemplo la regresin y los
parmetros a usar, seran los de la muestra 1.
Ahora analicemos el comportamiento del error cuadrtico, esto puede expresarse as:
U = Y - 0 + 1 X
Var U = E (U E U)2
Var U = E (U 2 2 U E U + (E U)2 )
Var U = E U 2 2 E U E U + N (E U)2
95
Los parmetros a estimar de modo insesgado producen el mnimo error o error cero
Los parmetros de un modelo a estimar, deben ser lineales, ya que ello permite
identificar el efecto que se genera entre variable independiente hacia la dependiente.
97
Como se puede ver, el parmetro muestral que minimiza el error al cuadrado total es 1.87.
Esto nos lleva a plantear el siguiente problema de optimizacin para minimizar el error al
98
cuadrado, que permitir conocer como hallar los parmetros insesgados de cualquier modelo
economtrico bsico o de dos variables:
Sea el error del modelo (donde Ye es Y estimado):
U i 2 = ( Y - Y e) 2
Ui 2 = ( Yi 0 - 1 Xi ) 2
Minimizando el error (derivando) con respecto a los parmetros tenemos:
Ui 2 / 0 = 0
Ui 2 / 1 = 0
Ui 2 / 0 = 2 ( Yi 0 - 1 Xi ) (-1) = 0
Yi N 0 - 1 Xi = 0
Yi / N 0 - 1 Xi / N = 0
0 = Ym - 1 Xm
Donde:
Ym es el valor promedio o esperado de Y
Xm es el valor promedio o esperado de X
Ui 2 / 1 = 2 ( Yi 0 - 1 Xi ) (-Xi) = 0
( Yi 0 - 1 Xi ) (Xi) = 0
( Yi Xi 0 Xi - 1 Xi Xi ) = 0
Yi Xi 0 Xi - 1 Xi 2 = 0
Considerando que:
Yi / N 1 Xi / N = 0
Yi Xi - ( Yi / N 1 Xi / N) Xi - 1 Xi 2 = 0
99
Yi Xi - Yi Xi / N + 1 Xi Xi / N - 1 Xi 2 = 0
N Yi Xi - Yi Xi + 1 Xi Xi - 1 N Xi 2 = 0
N Yi Xi - Yi Xi = 1 [N Xi 2 - Xi Xi ]
[N Yi Xi - Yi Xi ] / [N Xi 2 - Xi Xi ] = 1
Ahora demostraremos que la covarianza entre variables sobre la varianza de X, se relaciona
con la estimacin del parmetro 1, primero analicemos la covarianza:
Covar (X, Y) = (X Xm) (Y Ym)
= (X Y Xm Y + Xm Ym X Ym)
= X Y Xm Y + N Xm Ym X Ym
= X Y Xm Y + X Ym X Ym
= Xi Yi Xi Yi / N
(v)
(vi)
(vii)
La ecuacin (vii) es idntica a la obtenida para estimar 1, de modo que podemos decir que el
parmetro se estima finalmente del siguiente modo:
100
TAMN (Yi)
21.39
22.79
20.70
21.29
19.59
24.12
21.93
19.93
22.89
20.33
16.81
21.07
21.07
ENCAJE (Xi)
19.30
19.33
19.28
19.09
19.41
19.27
19.08
19.09
18.95
18.81
18.47
18.12
19.02
yi
0.32
1.72
-0.37
0.22
-1.48
3.05
0.86
-1.14
1.82
-0.74
-4.26
-0.00
Xi
0.28
0.32
0.26
0.07
0.40
0.25
0.06
0.07
-0.07
-0.21
-0.54
-0.90
Sumatoria
yi xi
0.09
0.54
-0.10
0.02
-0.59
0.78
0.05
-0.08
-0.13
0.15
2.31
0.00
3.05
xi2
0.08
0.10
0.07
0.00
0.16
0.06
0.00
0.01
0.00
0.04
0.29
0.80
1.63
1 = 3.05 / 1.63
1 = 1.868
0 = Ym - 1 Xm
0 = 21.07 1.868 * 19.02
0 = -14.45
Finalmente el modelo con sus parmetros insesgados, se expresa as:
TAMN = -14.45 + 1.868 * Encaje + Ui
Una forma de explicar los resultados de este modelo, indica que si el encaje sube en 1,
entonces la tasa de inters subira en 1.868 (no hemos corrido el modelo en logaritmos, de modo
que es un parmetro medido en valores absolutos antes que elasticidades), la pendiente de este
modelo equivale al valor 1.868.
En caso que el encaje fuera cero, la Tasa de inters activa en moneda nacional sera -14.45,
lo cual de por s no es explicable en trminos econmicos, toda vez que no existen tasas
negativas, he all una forma de expresar que el modelo pudo ser ms efectivo si se empleaban
logaritmos. El valor negativo del parmetro no es un buen referente o respuesta en este modelo,
es ms probable que indique que en ausencia de encaje la tasa de mercado podra bajar en
14.45, pero esa es ya una explicacin del analista, que termina siendo una opinin que procura
acomodarse al modelo.
La estimacin de los parmetros tambin debe ser independiente del nivel de error, con fines
de ser insesgado, probemos este criterio con los modelos siguientes:
Y = 0 + 1 X + U
Ym = 0 + 1 Xm
Y - Ym = 1 (X - Xm ) + U
yi = 1 xi + U
Sea la covarianza entre Y con el error u, considere que el valor esperado del error es cero
(E U = 0):
102
yi U = 1 xi U
yi U = 1 xi ( yi - 1 xi)
yi U = 1 [ xi yi - 1 xi 2 ]
yi U = 1 xi yi - 1 2 xi 2
yi U = 1 ( 1 xi 2 ) - 1 2 xi 2
yi U = 1 2 xi 2 - 1 2 xi 2
yi U = 0
Como puede demostrarse, la relacin entre el error y la variable dependiente estimada es
cero, a partir de los parmetros insesgados estimados, esto debe cumplirse al estimarse
cualquier modelo economtrico.
Donde xi = 0 (La sumatoria del valor de una variable aleatoria respecto de su media es
cero), entonces:
1 = xi Yi / xi2
1 = Zi Yi
Donde Zi = xi / xi2
Ahora consideremos que:
Zi = 0 (por el criterio anterior para las desviaciones),
Zi 2= xi 2 / xi4 = 1/ xi2
Zi Xi = xi Xi / xi2 = xi 2 / xi2 = 1
Note que antes se ha demostrado que xi yi = xi Yi, por tanto xi xi = xi Xi
1 / Zi = Yi, entonces la variable dependiente queda del siguiente modo:
Yi = 0 + 1 Xi + U
1 / Z i = 0 + 1 X i + U
1 = Zi [0 + 1 Xi + U]
1 = 0 Z i + 1 Z i X i + Z i U
Aplicando los criterios previos, donde 1 es el valor estimado de 1, tenemos:
E 1 = 0 + E ( 1 * 1 ) + Z i E U
E 1 = 1
Note que tambin es posible (antes que E Ui = 0) que:
E 1 - 1 = Z i E U i
Ahora para hallar la varianza de 1 tenemos que restar 1 del valor esperado de 1:
Var 1 = E (1 - E ( 1) ) 2
104
Var 1 = E (1 - 1) 2
Var 1 = (E 1 - 1) 2
Var 1 = E ( Zi Ui) 2
Var 1 = E [ Z1 2 U1 2 + Z2 2 U2 2 + Z2 2 U3 2 + + Zn 2 Un 2 + 2 Z1 Z2 U1 U2 + .+ 2 Zn-1 Zn Un-1 Un ]
Considere que el valor esperado E (Ui Uj) = E ( Ui - E Ui ) ( Uj E Uj) = E (Ui * Uj) = 0
Adems como vimos antes, E Ui 2 = Var U =
U 2 / N K)
La ecuacin de la varianza (Var) del parmetro y su error estndar (SE) o desviacin, queda:
Var 1 =
Var 1 =
S E ( 1 ) =
( Zi 2 )
* (1/ xi 2)
/ ( xi 2) 0.5
* (1/ xi2)
105
Var 0 = [ Xi 2 / N xi 2 ]
SE (0) = [ Xi 2 / N xi 2 ] 0.5
Los clculos anteriores indican que los intervalos de confianza (en que rango se mueven
como mximo o mnimo los parmetros estimados en el modelo) para los parmetros seran los
siguientes:
- SE ( 1 ) + 1 + SE ( 1 )
- SE ( 0) + 0 + SE ( 0)
Una vez que establecemos la varianza de los parmetros, ahora conoceremos el ajuste del
modelo, en buena cuenta que tan bien la variable dependiente es explicada con la informacin
que contiene la variable independiente, para ello consideremos siempre el modelo inicial:
Yi = Yi + Ui
Visto en desviaciones (Note que Ui = ui, porque la media del error o su valor esperado es cero)
tenemos:
yi = yi + ui
Colocando yi al cuadrado, queda:
yi 2 = yi 2 + 2 yi ui + ui2
Aplicando sumatorias, resulta:
yi 2 = yi 2 + 2 yi ui + ui2
Como se demostr antes, yi u = 0, con lo cual la expresin queda del siguiente modo:
yi 2 = yi 2 + ui2
(viii)
Yi = 1 xi 2 / xi
Yi 2 = 1 2 xi 2
En desviaciones:
yi 2 = 1 2 xi 2
Ahora reemplazando esta ltima expresin en la ecuacin (viii) tenemos el resultado final,
note que hemos considerado igual que antes que la variable aleatoria, puede ser escrita en sus
desviaciones sin alterar lo que hemos estimado:
yi 2 = 1 2 xi 2 + ui2
Si dividimos todo entre yi 2, obtenemos:
1 = 1 2 xi 2 / yi 2 + ui2 / yi 2
Donde obtenemos r 2, indicador que ayuda a conocer el grado en que X explica a Y, el
coeficiente r 2 es tambin, el cuadrado del coeficiente de correlacin ya estudiado en el tema
anterior:
r 2 = 1 2 xi 2 / yi 2
Dado 1 es igual a la covarianza de X, Y sobre la varianza de X, entonces r 2 es igual a:
r 2 = ( xi yi ) 2 / [ xi 2 yi 2 ]
Otra forma de verlo es del siguiente modo:
1 = r 2 + ui2 / yi 2
r 2 = 1 - ui2 / yi 2
r 2 = 1 SRC / STC
SEC / STC = 1 - SRC / STC
Donde:
SEC: Suma explicada de cuadrados de la regresin
107
Y'
21.60
21.66
21.56
21.20
21.81
21.54
21.19
21.21
20.94
20.68
20.06
19.39
21.07
Ui
-0.21
1.13
-0.85
0.09
-2.22
2.58
0.74
-1.27
1.95
-0.35
-3.25
1.67
Suma
Ui 2
0.05
1.28
0.73
0.01
4.92
6.63
0.55
1.62
3.82
0.12
10.57
2.80
33.10
xi 2
0.08
0.10
0.07
0.00
0.16
0.06
0.00
0.01
0.00
0.04
0.29
0.80
1.63
Xi 2
372.50
373.74
371.58
364.24
376.81
371.33
363.97
364.42
358.92
353.73
341.32
328.29
4,340.84
yi '
0.53
0.59
0.49
0.13
0.74
0.47
0.12
0.14
-0.13
-0.39
-1.01
-1.68
-
yi ' 2
0.28
0.35
0.24
0.02
0.55
0.23
0.01
0.02
0.02
0.15
1.02
2.81
5.69
yi 2
0.10
2.96
0.14
0.05
2.19
9.30
0.73
1.29
3.32
0.55
18.16
0.00
38.79
108
En primer lugar estimaremos la varianza del modelo y su respectiva raz conocida como error
estndar del modelo o de la regresin:
2=
U 2 / N K)
33.10 / 10 = 3.31
SE Regresin = 1.819
Ahora estimaremos la varianza y error estndar de cada parmetro
Var 1 =
* (1/ xi 2)
2/
(N K)
(N K) /
=1
=0
(N K) /
111
(N K) /
=Z
Existe una distribucin estandarizada que relaciona tanto la varianza del modelo ( 2) como
la distribucin estandariza de los parmetros y se conoce como distribucin t de Student, cuya
representacin es la siguiente:
t = Z (N - K) 0.5 / Z 0.5
t = [ ( 1 - 1 ) ( xi 2 ) 0.5 /
] ( N - K) 0.5 / [
t = [ ( 1 - 1 ) ( xi 2 ) 0.5 /
] ( N - K) 0.5 / [
t = [ ( 1 - 1 ) ( xi 2 ) 0.5 /
(N K) 0.5 /
]/ [
t = [ ( 1 - 1 ) ( xi 2 ) 0.5 ] /
(N K) /
] 0.5
]
Donde:
/ ( xi 2 ) 0.5 ] = SE (1) : Error estndar del parmetro 1
1 = 0. Si consideramos que la hiptesis nula es que sea igual a cero, entonces hay que
probar eso. Con la cual la distribucin t de Student del parmetro 1 y 0 queda as, considere
como vimos en las ecuaciones previas que hay (N K) grados de libertad o datos ajustados, en
el modelo bsico sera (N 2) grados de libertad en la distribucin t:
t = 1 / SE (1)
t = 0 / SE (0)
Con esto queda adems ajustado el nivel de variacin de los parmetros o intervalo de
confianza y quedan como sigue:
1 = 1 +/- t * S E ( 1 )
0 = 0 +/- t * S E ( 0 )
112
Donde la distribucin t de Student puede ser a una cola o dos colas, veamos los datos que
muestra la distribucin a una y dos colas, para diversos niveles de confianza o error:
N - K: Grados de
Libertad
10
20
30
40
60
120
Como se muestra en la tabla previa, si se cuenta con 30 grados de libertad (existen 32 datos
con dos variables en el modelo, una explicativa y la otra dependiente), entonces para que t sea
mayor de 0.68, la probabilidad es de 50% en una cola y de 25% en dos colas.
Con el mismo razonamiento, para 120 datos, la probabilidad para que t sea mayor a 2, es de
5% a una cola y 2.5% a dos colas.
En la distribucin t de Student hay dos zonas, una de aceptacin y la otra de rechazo de la
hiptesis nula, en consiguiente si el valor hallado en el modelo de regresin, supera el valor
crtico mostrado en la tabla previa, se est rechazando la hiptesis nula.
La figura siguiente muestra este criterio, en ella se indica que para 14 grados de libertad (16
datos en un modelo simple), el valor de la tabla es de 2.145, este valor es idntico a ambos lados
de la distribucin (siempre que sea a dos colas) y equivale a una probabilidad de 2.5% en cada
cola, para el caso de que el valor t del parmetro estimado supere a 2.145:
113
(N K) /
=Z
Z = ( 1 - 1 ) ( xi 2 ) 0.5 /
Z 2 = ( 1 - 1 )2 ( xi 2 ) /
Ahora hallemos la distribucin denominada F de Fisher, que mide la significancia global del
modelo, esto es que tan bueno es el modelo a partir de los errores estimados y la significancia de
los parmetros:
F = [ Z 2 / 1 ] / [ Z / (N - K) ]
Donde Z tiene un grado de libertad y Z tiene (N K ) grados de libertad:
F = [ ( 1 - 1 )2 ( xi 2 ) /
2]
/[
F = [ ( 1 - 1 )2 ( xi 2 ) /
2
2]
(N K) /
/[
F = [ ( 1 - 1 )2 ( xi 2 ) ] /
F = [ ( 1 - 1 )2 ( xi 2 ) ] /
(N K) ]
2]
F = [ ( 1 - 1 )2 ( xi 2 ) ] / [ Ui 2 / ( N K ) ]
Si consideramos que la hiptesis nula es probar que 1 es igual a cero, entonces queda:
115
F = [ 1 2 ( xi 2 ) ] / [ Ui 2 / ( N K ) ]
La distribucin F de Fisher como ha podido verse, cuenta con 1 grado de libertad en el
numerador y N-K grados de libertad en el denominador (en este caso K equivale a dos variables,
es decir su valor es 2), a continuacin pondremos el valor crtico de la F de Fisher desde la tabla
respectiva siguiente:
Tabla 3.5 Valores de la distribucin F de Fisher
N - K: Grados de
Libertad
denominador
10
20
30
40
60
120
La tabla puede entenderse del siguiente modo, para 10 grados de libertad en el denominador
(en este caso 12 datos menos, K que equivale a 2), se tiene que existe un 5% de probabilidad de
que el valor obtenido supere a 4.96.
Para 120 grados de libertad en el denominador (122 datos en el caso de tener K = 2), se
tiene que existe un 1% de probabilidad de que le valor F supere a 6.85.
Tal como en el caso anterior, cuando el valor F obtenido en la regresin supera al de la tabla
se asume que se cae en la regin de rechazo de la hiptesis nula, que en este caso es
equivalente a que todos los parmetros del modelo son cero.
Entonces si el valor estimado de F supera el de la tabla, se rechaza la hiptesis nula y se
acepta la hiptesis alterna, que equivale a que todos los parmetros del modelo son diferentes de
cero, estimar F supone hallar:
F = [ 1 2 ( xi 2 ) ] / [ Ui 2 / ( N K ) ]
F = SEC / [ SRC / (N K) ]
116
Source
SS
df
MS
Number of obs =
F(
Model
5.68861332
5.68861332
Residual
33.0995857
10
3.30995857
Total
TAM1
38.788199
Coef.
11
3.52619991
Std. Err.
P>|t|
1,
12
10) =
1.72
Prob > F
0.2192
R-squared
0.1467
Adj R-squared =
0.0613
Root MSE
1.8193
ENC1
1.868061
1.424948
1.31
0.219
-1.306921
5.043043
_cons
-14.45373
27.10163
-0.53
0.605
-74.83992
45.93246
117
Como muestra la tabla previa, el valor F es 1.72 ya estimado, el error estndar del modelo se
denomina Root MSE y es 1.8193, el coeficiente de determinacin (r 2 ) es 0.1467 y tambin hay
un ajustado, que se estima del siguiente modo:
r 2 ajustado = 1 ( 1- r 2 ) * [ N-1 / ( N - K) ]
En nuestro ejemplo sera:
r 2 ajustado = 1 ( 1- 0.1467 ) * [11 / 10 ] = 0.0613
r 2 ajustado = 6.13 %
Note que el r2 ajustado para muestras grandes o abundantes en datos, tiende a ser
equivalente al r2 estimado en la regresin, mientras que para muestras pequeas tiende a
castigar el r2 estimado reduciendo su escala de medicin, ello se debe a que la presencia de
pocos datos y muchas variables a involucradas reducen la potencia del modelo.
El resultado del Stata tambin indica la suma de cuadrados explicada (SEC) que aparece
como Model y la suma de residuos al cuadrado (SRC) que aparece como Residual, la suma de
ambas da la suma total de cuadrados, al dividirla entre los grados de libertad se obtiene primero
las desviaciones cuadrticas de la variable dependiente estimada y luego la varianza del modelo.
Ms abajo aparecen el coeficiente de los parmetros, el error estndar (Std err) y la prueba t
de Student, luego viene la probabilidad de que est en la regin de rechazo o aceptacin de la
hiptesis nula (si supera el 0.05 se acepta la hiptesis nula de que el parmetro es cero) y luego
viene el intervalo de confianza del parmetro.
Obviamente para que funcione el comando en Stata debe estar cargada a base de datos
que puede importarse de Excel usando el men siguiente:
118
Una vez que se importan los datos, estos deben cargarse del siguiente modo:
119
Luego los datos aparecen en la seccin derecha arriba (caja vaca) donde dice: Variables,
Name, Label, una vez all se tiene todo listo para ejecutar los comandos.
120
Preguntas de opinin
1. La varianza de los parmetros puede afectar su significancia?
2. Qu pasa con el coeficiente de determinacin, si el error se relaciona con la
variable independiente?
3. Qu sucede con el modelo en general, si la prueba F indica que se acepta la
hiptesis nula?
4. En un modelo donde el consumo depende del ingreso, cmo explica que el
parmetro constante o intercepto sea muy alto?
5. Si el modelo es la curva de Phillips (relacin entre inflacin y desempleo, ambas
medidas respecto de sus tasas esperadas o potenciales) y el parmetro
estimado sale negativo cmo podra explicarlo?
122
Caso de aplicacin
Lectura previa
Foxley (2012, seala textualmente lo siguiente:
La historia contempornea de las economas latinoamericanas se caracteriza por una
discontinuidad en su desarrollo. Aos buenos, seguidos de recesin econmica, alto
desempleo, crisis sociales y debilitamiento de las instituciones. Parafraseando lo que los
brasileos solan decir de su pas y aplicndolo a la regin en su conjunto: Amrica Latina es
el continente del futuro y siempre lo ser.
Ese fantasma ha estado a menudo presente en quienes participan en los asuntos
pblicos, ya sea desde el Ejecutivo o del Parlamento, al procurar contribuir a los aos buenos
y sentirse a veces desbordados por shocks que sufren nuestras economas y que se hacen
extremadamente complejos de controlar o neutralizar.
En mi caso, las preocupaciones por estos temas fueron compartidas desde fines de los
aos 80 ininterrumpidamente. Durante los aos en el Senado Chileno quisimos inyectar de
optimismo la reflexin sobre el futuro, aprendiendo de lo que en ese momento llamamos los
casos de pases afines exitosos. Organizamos, en conjunto con el entonces senador
Fernando Flores, visitas de estudio a Finlandia, Estonia, Irlanda, Australia y Nueva Zelandia.
Gastamos muchos das y horas en terreno, aprendiendo de la experiencia de desarrollo de
esos pases. Visitamos agencias gubernamentales, universidades y centros de investigacin,
parlamentos, a dirigentes sociales y empresarios, y hablamos exhaustivamente con quienes
desde las regiones o empresas impulsaban iniciativas de innovacin. Cuando las
circunstancias nos llevaron a la Cancillera, retomamos el tema empujando iniciativas que
generaban redes de cooperacin con los centros de excelencia de esos pases y convenios
de intercambio masivos de profesionales y egresados de la educacin superior en Chile. Al
mismo tiempo, patrocinamos un proyecto de investigacin en profundidad acerca de los
pases afines exitosos.
Con la coordinacin de Cristbal Aninat, Edgardo Boeninger y Angel Flisflisch, se instal
una red internacional de colaboradores que examinaron las experiencias de desarrollo de
pases como Finlandia, Noruega, Irlanda, Corea, Australia, Nueva Zelandia, Espaa y
Portugal. Los resultados se publicaron en dos volmenes de un libro titulado Caminos al
desarrollo: lecciones de pases afines exitosos.
123
Ambos estudios sirvieron de motivacin para continuar la reflexin sobre los pases a
medio camino. Pero ahora el nfasis esta puesto en cmo recorrer la mitad del camino que
falta para alcanzar el pleno desarrollo; lo que hay que evitar desde luego es la trampa de los
pases de ingreso medio.
Las naciones que muestran ms dificultad para pasar el umbral hacia economas
avanzadas son los pases de ingreso medio y, entre ellos, los de Amrica Latina. El
pronstico, considerando la experiencia pasada, es que un buen nmero de estos podra caer
en lo que la literatura econmica ha llamado trampa de ingreso medio, precisamente debido
a la incapacidad de sostener un alto crecimiento por varias dcadas. A menudo se alude a
Argentina como el caso ms ilustrativo de esta trampa: a comienzos del siglo XX este pas
clasificaba entre los ms desarrollados del mundo, pero a la fecha an no logra salir de la
categora de ingreso medio. Dado que la historia econmica de esta regin se ha
caracterizado por permanentes ciclos de aos buenos, seguidos por fases de turbulencias
econmicas que contagian a la sociedad y al sistema poltico, son ms las probabilidades de
quedarse en un punto intermedio que completar la transicin al desarrollo.
La idea de que cada cierto tiempo hay que comenzar de nuevo, ha marcado a la poltica
latinoamericana, incubando puntos de ruptura institucional que abren paso a gobiernos
fundacionales, a menudo de carcter autoritario o seudo-revolucionario, que tampoco logran
dar con la salida de este laberinto. As, una de las fallas histricas de Amrica Latina es la
incapacidad de persistir en una trayectoria de alto crecimiento. Pero esto no ocurre solo por
malas polticas o por excesiva dependencia de fuerzas externas desestabilizadoras. Lo que
empuja a un pas de ingreso medio a caer en una trampa que frena su desarrollo es un
conjunto de factores, identificables a travs de dos tipos de estudio de experiencias
comparadas. El primero consiste en examinar los casos de pases afines, que fueron
exitosos en salir de la trampa de ingreso medio en los ltimos 20 aos. Otro enfoque
complementario es aprender de pases que todava pertenecen a la categora de ingreso
medio en regiones como el Este de Asia y el Este de Europa. Conocer sus aciertos y errores
puede ayudar a los pases latinoamericanos a caminar con pie ms firme hacia el umbral del
desarrollo (Banco Interamericano de Desarrollo [BID] y Ministerio de Relaciones Exteriores de
Chile, 2009; Foxley, 2009, 2010a, 2010b).
Los factores que llevan a la trampa de ingreso medio son clasificables en cuatro
categoras: desaceleracin del crecimiento por incapacidad de lograr mejoras continuas en
competitividad y productividad; baja calidad de la educacin y lenta transferencia de
conocimiento e ideas innovadoras; excesiva desigualdad y desproteccin de los grupos
vulnerables; e incapacidad de las instituciones para proveer estabilidad, buena calidad de
124
gestin y transparencia, as como una adecuada calidad en las decisiones del sistema
poltico.
Tomado textualmente de Foxley (2012)
Preguntas de la lectura
1. Qu variable emplearas como dependiente en la idea de analizar la trampa del
ingreso medio?
2. Cules seran tus variables independientes?
3. De dnde sacara algn ndice de institucionalidad?
Aplicacin economtrica
Continuando con el tema del ingreso medio solo desde una visin econmica, a
continuacin se muestra una tabla de variables para pases de Amrica Latina y El Caribe,
selecciona el ao que creas conveniente, realice regresiones individuales para cada
variable que usted considere independiente.
En el caso de la variable dependiente, sera el ingreso per cpita, usted puede establecer
como ingreso medio la media del ingreso per cpita de todos los pases y hallar como
variable dependiente la desviacin de cada pas sobre el ingreso medio.
Estime los indicadores de bondad de ajuste del modelo y de los parmetros en cada una de
las regresiones, compare sus resultados e indique que variable produce el mayor efecto en
el ingreso per cpita respecto del ingreso medio. Se aconseja tener regresiones con
variables en logaritmos.
Puede tambin eliminar los pases que considere cuentan con datos irrelevantes o podran
sesgar su anlisis.
125
Variable
PBI per cpita (Medido PPC
US$)
Inflacin (%)
Exportaciones (cambio anual %)
2010
2011
17,429.29
17,398.14
2012
2013
18,196.75 18,558.11
3.37
3.457
3.377
1.056
-3.412
3.535
-0.291
-3.317
15,921.64
17,476.60
Argentina
Argentina
Inflacin (%)
10.461
9.775
10.043
10.619
Argentina
13.932
3.445
-6.246
4.578
Bahamas
Bahamas
29,821.29
30,570.14
Inflacin (%)
1.342
3.204
1.971
0.277
2.86
-0.991
9.414
2.373
Bahamas
17,917.44 18,749.34
31,324.44 32,036.09
Barbados
24,068.44
24,672.53
Barbados
Inflacin (%)
5.761
9.426
4.539
2.305
Barbados
4.513
-0.581
-5.523
-3.184
Belice
Belice
8,066.41
8,258.67
8,598.02
8,715.60
Inflacin (%)
0.918
1.494
1.408
0.509
7.944
5.727
8.281
-1.983
4,563.34
4,800.37
5,041.31
5,363.55
2.502
9.883
4.519
5.735
11.802
3.121
Belice
Bolivia
Bolivia
Inflacin (%)
Bolivia
Brasil
Brasil
Brasil
25,043.44 25,180.87
3.361
3.651
11,215.68
11,646.36
Inflacin (%)
5.039
6.636
5.404
6.204
9.501
2.925
-0.338
3.118
16,002.08
17,097.27
11,875.96 12,220.90
Chile
18,181.56 19,067.25
Chile
Inflacin (%)
1.408
3.34
3.007
1.792
Chile
2.446
5.34
1.075
4.496
Colombia
9,498.86
10,207.90
Colombia
Inflacin (%)
2.272
3.415
3.169
2.017
Colombia
1.192
13.752
4.521
1.783
Costa Rica
11,336.97
11,927.72
10,696.92 11,188.81
12,593.83 12,942.09
126
Costa Rica
Inflacin (%)
Costa Rica
Dominica
Dominca
5.663
4.878
4.495
5.232
9.527
3.635
5.541
5.447
13,580.78
13,882.85
Inflacin (%)
2.81
1.262
1.46
-0.434
Dominca
7.537
-0.2
-12.956
5.698
Repblica Dominicana
Repblica Dominicana
8,785.15
9,194.34
9,547.45
9,910.51
Inflacin (%)
6.33
8.459
3.695
4.831
12.16
8.733
6.894
6.222
8,513.92
9,201.83
9,682.07
10,080.21
Repblica Dominicana
13,964.10 14,282.94
Ecuador
Ecuador
Inflacin (%)
3.553
4.476
5.101
2.725
Ecuador
-0.237
4.589
2.666
7.582
El Salvador
6,855.36
7,099.29
7,315.99
7,515.09
El Salvador
Inflacin (%)
1.179
5.129
1.73
0.758
El Salvador
13.942
7.812
5.073
1.526
Granada
Granada
13,107.54
13,416.30
Inflacin (%)
3.437
3.033
2.411
-0.044
-8.705
4.778
-7.374
-4.025
Granada
13,360.92 13,723.95
Guatemala
4,862.51
5,042.16
5,153.48
5,282.37
Guatemala
Inflacin (%)
3.86
6.215
3.783
4.343
Guatemala
3.662
2.123
2.298
2.375
Guyana
6,923.65
7,333.17
7,754.90
8,250.25
Guyana
Inflacin (%)
3.73
4.955
2.417
3.478
Guyana
-4.649
6.126
9.745
2.414
Hait
Hait
1,149.81
1,220.32
1,259.78
1,315.18
4.136
7.385
6.78
6.776
Hait
Inflacin (%)
Exportaciones (cambio anual %)
-4.631
20.756
3.045
14.296
4,414.60
4,580.51
4,743.52
4,839.38
Inflacin (%)
4.699
6.762
5.218
5.186
Honduras
19.005
10.091
10.642
-0.78
Jamaica
8,600.75
8,850.28
8,915.52
9,048.14
Jamaica
Inflacin (%)
12.613
7.525
6.897
9.391
Honduras
Honduras
127
Jamaica
Mxico
Mxico
Mxico
-15.876
-9.419
6.513
11.608
14,021.21
14,684.41
Inflacin (%)
4.155
3.405
15,343.58 15,562.60
4.112
3.804
21.642
7.547
3.457
2.016
3,869.49
4,109.47
4,351.67
4,554.03
Nicaragua
Nicaragua
Inflacin (%)
5.455
8.08
7.196
7.399
Nicaragua
18.69
9.155
8.755
11.445
Panama
12,579.02
13,967.62
Panama
Inflacin (%)
3.49
5.876
Panama
Paraguay
Paraguay
15,467.54 16,658.14
5.698
4.027
-8.035
12.092
24.959
5.254
5,860.45
6,129.46
6,052.96
6,823.19
Inflacin (%)
4.651
8.254
3.676
2.684
Paraguay
17.782
2.268
-3.659
22.972
Per
Per
9,273.45
9,950.25
Inflacin (%)
1.53
3.37
3.655
2.806
1.57
8.381
2.709
-1.821
15,895.66
15,590.89
Per
St. Kitts y Nevis
St. Kitts y Nevis
St. Kitts y Nevis
St. Luca
St. Luca
St. Luca
St. Vicente y las Granadinas
St. Vicente y las Granadinas
St. Vicente y las Granadinas
Surinam
Surinam
Surinam
Trinidad y Tobago
Trinidad y Tobago
Trinidad y Tobago
10,595.90 11,123.70
15,418.49 15,605.40
Inflacin (%)
0.603
7.071
1.414
0.666
1.58
-6.456
5.86
16.671
12,493.82
12,840.81
Inflacin (%)
3.25
2.769
4.177
1.467
6.451
-7.508
-5.642
2.768
11,180.51
11,420.46
Inflacin (%)
0.752
3.186
2.598
0.857
1.772
-12.332
3.298
4.832
12,816.09 12,729.73
11,785.30 12,207.20
11,109.36
11,734.37
Inflacin (%)
6.888
17.721
5.007
1.923
29.946
6.436
5.805
-6.269
19,595.21
19,391.53
Inflacin (%)
10.547
5.104
9.264
5.2
5.786
13.35
-10.687
18.69
12,472.01 13,116.11
19,910.94 20,437.69
128
Uruguay
13,909.50
15,055.02
Uruguay
Uruguay
Venezuela
Venezuela
Venezuela
15,864.67 16,722.67
Inflacin (%)
6.699
8.093
8.098
8.575
13.88
6.702
-0.222
-1.713
12,173.36
12,734.70
Inflacin (%)
28.187
26.09
21.069
40.71
-12.877
4.665
1.594
-6.528
13,480.03 13,604.75
Fuente: International Monetary Fund, World Economic Outlook Database, April 2014
129
Ejercicios
El modelo Harrod-Balassa-Samuelson, sirve para explicar la dinmica del tipo de cambio real
a partir de distintas variables, Primero tenemos que los precios de los bienes transables (Pt) y de
los no transables (Pn) equivalen a:
Pt = W / at
Pn = W / an
Donde (1/an), (1/at), equivalen al uso del factor trabajo (nico) en la produccin de una unidad
de bienes transables y no transables, de modo que el costo esta asociado al salario y ello debe
ser igual al precio de los bienes. Considere que el modelo se expresa en ndices.
Consideremos que el precio relativo nacional entre ambos bienes es: p = Pt / Pn
Adems considerando que el precio transable, equivale al tipo de cambio (e) por el precio
internacional Pt*, es decir:
P t = e P t*
Si pensamos que el precio relativo del otro pas es p* = Pt* / Pn*, y que el ndice de precios
de bienes transables en cada pas representan una proporcin (1-), entonces el tipo de cambio
real entre ambos pases es q = (p / p*)
Adems considerando que por la ley de un solo precio se tiene que: 1 = e . Pt* / Pt
Finalmente este modelo considera que la produccin de transables (Yt) y no transables (Yn)
equivale a:
Yt = at . Lt
Yn = an . Ln
Donde Ln, Lt, es la cantidad de factor de trabajo para cada bien (empleo).
Una vez analizado dicho modelo terico se debe plantear y estimar dos modelos
economtricos para explicar lo siguiente:
130
Los efectos en el tipo de cambio real de un cambio en los precios relativos de dos
pases, en este caso Per y EEUU.
Los efectos en el tipo de cambio real del diferencial de productividades transables y no
transables entre dos pases en este caso Per y EEUU.
Datos requeridos:
Mes/Ao
ndice de
tipo de
TC Nominal
cambio
(S x U$) real
Interbancario
bilateral
compra (Per USA)
promedio
Base Dic
mensual
2001
IPC Lima
(2009 =
100)
IPC
transables
Lima (2009
= 100)
IPC no
transables
Lima (2009
= 100)
Manufactura
Produc
(ndice
1994=100)
Otros
servicios
produc
(ndice
1994=100)
nd. empleo
urb. 10 y
ms trab. manufactura
ene-08
89.1269
2.9481
93.8411
96.5427
92.0132
182.6922
171.5286
115.8363
feb-08
87.2366
2.9044
94.6923
96.9553
93.1536
177.7689
176.6965
116.6373
mar-08
84.2510
2.8099
95.6788
97.3308
94.5555
182.2799
177.6170
116.7545
abr-08
82.7329
2.7445
95.8264
97.7113
94.5399
191.8559
188.9940
115.9567
may-08
84.8384
2.8015
96.1804
98.6376
94.5145
195.5508
197.0539
116.6880
jun-08
87.6775
2.8888
96.9207
99.2631
95.3290
195.0641
188.4492
116.5034
jul-08
86.3424
2.8464
97.4590
99.5750
96.0233
188.9931
192.9462
115.5777
ago-08
86.8099
2.8899
98.0345
99.9558
96.7342
188.0309
186.5984
115.7050
sept-08
88.3923
2.9643
98.5906
100.1275
97.5473
192.0167
185.3715
116.2248
oct-08
90.1717
3.0681
99.1950
100.6497
98.2010
194.4709
194.8984
116.7423
nov-08
88.6519
3.0897
99.5016
100.6858
98.6893
192.5355
187.2792
118.2423
dic-08
88.0389
3.1125
99.8600
100.4455
99.4522
189.7516
215.5457
118.9421
ene-09
89.3879
3.1504
99.9656
99.7346
100.1174
181.7210
179.2647
113.0302
feb-09
92.3241
3.2352
99.8909
99.0240
100.4727
165.8639
179.6115
110.6744
mar-09
90.4688
3.1732
100.2507
98.8686
101.1743
172.3439
186.1667
109.5121
abr-09
88.1141
3.0828
100.2698
99.0908
101.0673
165.7936
191.2806
107.8296
may-09
85.7993
2.9923
100.2266
99.2990
100.8376
179.8310
201.1596
107.9942
jun-09
86.7275
2.9888
99.8863
99.3716
100.2196
169.4840
192.0235
108.4013
jul-09
87.0652
3.0111
100.0728
99.4359
100.4888
165.8520
195.4886
108.9750
ago-09
85.6435
2.9495
99.8652
99.4955
100.1018
168.4060
189.5675
107.5763
sept-09
84.5833
2.9083
99.7781
99.7339
99.7953
176.0142
189.8739
108.8001
131
oct-09
83.4600
2.8705
99.9005
99.8446
99.9255
182.9944
202.4702
110.5984
nov-09
83.9833
2.8833
99.7885
100.0082
99.6279
187.4796
197.7978
112.2610
dic-09
83.3668
2.8766
100.1050
99.9442
100.2004
192.8221
228.4426
113.6539
ene-10
82.7958
2.8554
100.4012
100.3670
100.4215
183.0111
185.2763
110.1024
feb-10
82.4782
2.8530
100.7250
100.7251
100.7239
177.1124
187.3760
109.0080
mar-10
82.1600
2.8388
101.0079
101.1258
100.9383
198.6272
199.1173
109.3772
abr-10
82.2986
2.8392
101.0335
101.5398
100.7323
191.4762
205.9249
109.6557
may-10
82.3301
2.8448
101.2738
101.9070
100.8973
204.4028
218.0413
111.1501
jun-10
81.8291
2.8375
101.5278
101.9426
101.2800
206.0044
212.2190
112.8811
jul-10
81.1122
2.8223
101.8973
101.8725
101.9105
194.3681
212.5115
113.0586
ago-10
80.4099
2.8014
102.1710
102.0417
102.2472
200.0615
207.7426
113.6319
sept-10
80.1553
2.7902
102.1383
102.0346
102.1993
204.4108
207.9600
115.4887
oct-10
80.3930
2.7910
101.9935
102.2776
101.8238
209.9324
219.1189
118.2121
nov-10
80.8272
2.8050
102.0016
102.5004
101.7044
215.0861
216.4690
118.9053
dic-10
81.1125
2.8145
102.1836
102.7978
101.8188
211.2349
249.0950
121.3183
Mes/Ao
nd. empleo
urb. 10 y ms
trab. - servicios
US Employment
Cost Index:
Wages and
Salaries: Private
Industry Workers:
Manufacturing
US Employment
Cost Index:
Wages and
Salaries:
Private Industry
Workers:
Service
Occupations
US Consumer
Price Index for
All Urban
Consumers:
Services
US Consumer
Price Index for All
Urban
Consumers:
Manufacturing
Durable goods
US Consumer
Price Index for
All Urban
Consumers: All
Items
Ene08
115.3435672
92.2
93.4
251.283
112.3
212.18
Feb08
113.3478476
93
93.9
251.847
112.094
212.684
Mar08
117.4479909
93.8
94.5
252.784
112.059
213.464
Abr08
125.1530277
94.4
94.8
253.503
111.671
214.118
May08
129.3993583
94.8
95.6
254.661
111.362
215.304
132
Jun08
131.197719
95.3
96.1
255.832
111.232
217.235
Jul08
133.0964253
95.7
96.4
257.17
111.275
219.133
Ago08
131.5727943
96.4
96.9
257.585
110.779
218.78
Sep08
132.3120849
97.4
97.4
257.597
110.077
218.852
Oct08
135.8703917
97.6
97.9
257.778
109.677
216.93
Nov08
136.9022412
98.2
98.6
257.846
109.191
213.002
Dic08
137.2413449
98.8
99
258.037
108.811
211.327
Ene09
126.3824038
99.6
99.6
258.398
109.025
211.903
Feb09
122.5237914
100.2
100
258.692
109.221
212.879
Mar09
125.9304049
100.6
100.6
258.621
109.264
212.572
Abr09
134.2466453
101.6
101.3
258.587
109.404
212.799
May09
136.7325998
101.8
102
258.593
109.65
213.078
Jun09
138.5494756
102.5
102.9
258.698
109.983
214.527
Jul09
138.4861647
103.2
104.6
258.815
109.924
214.782
Ago09
136.319616
103.8
105.3
259.31
109.129
215.519
Sep09
136.7859045
104.4
106.5
259.615
109.387
215.956
Oct09
140.3851237
105.1
107.1
260.037
110.684
216.445
Nov09
141.1522719
105.9
107.9
260.198
111.159
216.956
Dic09
142.5492586
106.7
108.8
260.339
111.477
217.158
Ene10
130.6188754
107.3
109.7
259.774
111.731
217.458
Feb10
129.0911534
107.9
110.1
260.046
111.753
217.562
Mar10
132.6304834
108
111
260.396
111.694
217.611
Abr10
140.0607367
108.3
111.2
260.72
111.45
217.625
133
May10
142.2033004
108.6
112.1
261.012
111.454
217.32
Jun10
143.8120087
109.1
112.3
261.157
111.443
216.865
Jul10
144.2845301
109.4
112.6
261.498
111.555
217.621
Ago10
141.3287871
109.9
112.7
261.645
111.587
218.068
Sep10
141.8931942
110.5
113.3
261.844
111.174
218.427
Oct10
145.2845775
110.9
113.5
262.06
110.966
218.97
Nov10
146.7789724
111.4
114.2
262.363
110.573
219.24
Dic10
147.3164279
112
114.2
262.782
110.512
220.186
134
Referencias bibliogrficas
Greene, W. (2003) Econometric Analysis. Fifth Edition. Pearson Ed.
Gujarati, D. (2004) Econometra. 4ta Edic. Mc Graw Hill.
Foxley, A. (2009) Recovery: The Global Financial Crisis and Middle-Income Countries. Washington,
D. C. Carnegie Endowment for International Peace.
Foxley, A. (2010a). Sustaining Social Safety Nets, Critical For Economic Recovery. Carnegie
Endowment for International Peace, Washington D. C.
Foxley, A. (2010b). Regional Trade Blocs: The Way To Future? Carnegie Report, September,
Washington D.C, Carnegie Endowment For International Peace.
Foxley, A. (2010c). More Market or More State for Latin America? En Mainwaring, S. y Scully, T.
(eds.), Democratic governance in Latin America. A reflection for the post-crisis. Stanford, California:
Stanford University Press.
Foxley, A. (2012) La trampa del ingreso medio. El desafo de esta dcada para Amrica Latina.
CIEPLAN Chile.
Jimnez, F. (2012) Elementos de teora y poltica macroeconmica para una economa abierta.
Fondo Editorial PUCP.
Johnston, J. and Dinardo, J. (1997) Econometric Methods. Fourth Edition. Mc Graw Hill
Novales, A. (1993) Econometra. Mc Graw Hill.
The Economist (2014) Democracy Index 2012, 2013. Intelligence Unit. UK.
The Heritage Foundation (2014) ndice 2014 de Libertad Econmica. Miller T, Kim, A and Holmes K.
Edit. The Wall Street Journal. EEUU.
Wooldridge, J. (2009) Introductory Econometrics. A modern approach. Third Edition. Cengage
Learning.
135
CAPTULO IV
Modelo de regresin general
y mtodo de mxima
verosimilitud
136
Yn
Xi
X1
X2
X3
X4
Xn
Zi
Z1
Z2
Z3
Z4
Zn
Wi
W1
W2
W3
W4
Wn
Considere ahora que Yi es la variable dependiente, adems que Xi, Zi y Wi son las variables
independientes o explicativas, de modo que el modelo puede escribirse del siguiente modo:
Yi = 0 + 1 Xi + 2 Zi + 3 Wi + Ui
Visto en lenguaje de matrices podemos escribirlo del siguiente modo:
Y1
Y2
Y3
Y4
Yn
1
1
1
1
X1
X2
X3
X4
Xn
Z1
Z2
Z3
Z4
Zn
W1
W2
W3
W4
Wn
0
1
2
3
138
U1
U2
U3
U4
Un
U1
U2
U3
U4
Un
- Yi Wi + 0 Wi + 1 Xi Wi + 2 Zi Wi + 3 Wi 2 = 0
Despejando el cero, queda:
N 0 + 1 Xi + 2 Zi + 3 Wi = Yi
0 Xi + 1 Xi 2 + 2 Zi Xi + 3 Wi Xi = Yi Xi
0 Zi + 1 Xi Zi + 2 Zi 2 + 3 Wi Zi = Yi Zi
0 Wi + 1 Xi Wi + 2 Zi Wi + 3 Wi 2 = Yi Wi
Visto en matrices esto queda:
N
Xi
Zi
Wi
Xi
Xi 2
Xi Zi
Xi W i
Zi
Zi Xi
Zi 2
Zi W i
Wi
W i Xi
Wi Zi
Wi 2
0
1
2
3
1
X1
Z1
W1
1
X2
Z2
W2
1
X3
Z3
W3
1
X4
Z4
W4
Y1
Y2
Y3
Y4
(1)
Finalmente el multiplicador bancario indica que a medida que esta variable va subiendo, hay
ms liquidez en la economa lo que supone un mayor uso de dinero para gastar por parte del
pblico y ello eleva los precios por una presin de demanda.
El modelo anterior es ilustrativo, una mejor aproximacin puede ser en logaritmos de las
variables explicativas (modelo semilog) y adems debe tener en cuenta que hay teoras
econmicas que sealan que las tasas de inters y el tipo de cambio pueden ser relacionados,
de modo que el modelo puede tener ciertas restricciones para su uso, por lo cual aqu solo sirve
de ejemplo metodolgico.
Las variables mencionadas han tenido el siguiente comportamiento en el ltimo ao:
Fig. 4.1 Variables monetarias y su relacin con la inflacin Per (mensual)
Fuente: BCRP
Ahora presentaremos los datos en forma de matrices, para lo cual haremos uso del programa
Stata , mostraremos los comandos para crear primero la matriz de variables explicativas,
hemos denominado matriz A:
mkmat Multiplicador Interbancaria TC, matrix (A)
141
matrix list A
La ventana del programa muestra los resultados, es una matriz de 18 filas por 3 columnas
A[18, 3], del mismo debe procederse con la matriz de la variable independiente Y:
Fig. 4.1 Matriz A de variables independientes
Ahora aplicaremos la ecuacin, hallando primero A, para ello usaremos el comando de Stata
para transpuestas de matrices, donde AT es la transpuesta de A igual a A:
matrix AT = A'
142
matrix list AT
Ahora hallaremos AA, para lo cual definiremos en Stata una matriz C que es el producto de
A transpuesta por A, para ello escribimos en el Do-editor la sentencia respectiva y nos arroja los
resultados siguientes:
. mat C=AT*A
. matrix list C
symmetric C[4,4]
Id
Multiplic
Interb
Id
18
Multiplic
46.912583
122.60948
Interb
75.2606
195.92196
314.97982
TC
49.241857
128.45778
205.85621
TC
134.85673
Los espacios vacos son equivalentes al otro elemento de la matriz, no olvidemos que es
simtrica, as por ejemplo el elemento128.45778 (cruce entre TC y Multiplicador) se repite en el
espacio en blanco que corresponde a multiplicador con TC (esquina superior derecha de la
matriz).
Una vez que tenemos la matriz C, necesitamos invertirla, para ello aplicamos en Stata lo
siguiente:
. matrix INVC=inv(C)
. matrix list INVC
symmetric INVC[4,4]
Id
Multiplic
Interb
Id
244.10742
Multiplic
-32.846801
Interb
-38.124863
6.1955516
7.5361964
TC
.35122075
-6.2137161
-3.4844434
TC
9.1859449
11.116981
143
Una vez que tenemos la inversa, ahora estimaremos la matriz AY, para ello usemos el Doeditor de Stata y obtenemos:
. matrix AY=AT*Y
. matrix list AY
AY[4,1]
inflacion
Id
5.0416697
Multiplic
13.235525
Interb
21.186479
TC
13.820259
Ahora ya tenemos todo lo necesario para hallar los parmetros, de modo que apliquemos la
ecuacin:
= (A A ) -1 A Y
Usando Stata tenemos (en todos los casos el comando list muestra los resultados de las
estimaciones o clculos realizados) la matriz de parmetros B:
. matrix B=INVC*AY
. matrix list B
B[4,1]
inflacion
Id
-6.9133294
Multiplic
1.3648439
Interb
1.2979727
TC
-.65458463
Se puede decir que la inflacin mensual sube con la tasa interbancaria (lo cual resulta inverso
a la teora, al menos la mayor tasa de inters reduce la demanda y los precios), la inflacin crece
con el multiplicador bancario lo cual es correcto y la inflacin se reduce con el tipo de cambio,
resultado que esperbamos de comportamiento inverso.
A continuacin mostrados los resultados del modelo empleado la funcin regresin de Stata
, lo cual confirma que la forma de hallar los parmetros ha sido correcta:
SS
df
MS
Number of obs =
F(
Model
.250511093
.083503698
Residual
.99361033
14
.070972166
Total
1.24412142
inflacion
Coef.
Multiplic
Interb
17
.073183613
3,
18
14) =
1.18
Prob > F
0.3540
R-squared
0.2014
Adj R-squared =
0.0302
Root MSE
.26641
Std. Err.
P>|t|
1.364844
.807432
1.69
0.113
-.3669255
3.096613
1.297973
.7313414
1.77
0.098
-.2705985
2.866544
TC
-.6545846
.8882546
-0.74
0.473
-2.559701
1.250532
_cons
-6.913329
4.162311
-1.66
0.119
-15.8406
2.01394
Puede verse que los parmetros calculados mediante matrices son exactamente los mismos
que calculados mediante el programa estadstico, de modo que los clculos son correctos,
aunque el modelo brinde explicaciones que no se ajustan al anlisis terico.
Algunas ideas pueden sealar que la bajada de tipo de cambio en el ltimo ao, por factores
ajenos a la economa peruana ha terminado de generar esa relacin negativa, as la mayor
145
inflacin en el pas se ve reducida de algn modo por el alza cambiaria. Un razonamiento puede
ser que a medida que el contexto externo reduce las expansiones monetarias, los flujos de
moneda salen de los pases elevando el cambio. Pero la tasa de inflacin al interno de cada pas
es por el aumento monetario por otras fuentes, ante un escenario internacional adverso.
La explicacin de la tasa interbancaria relacionada positivamente con la inflacin, est mas
compleja, los resultados del modelo indican que menores tasas interbancarias generan menos
inflacin, o al revs alzas interbancarias crean ms inflacin, es totalmente opuesto a lo que
cabra esperar, evidenciando fallas en el diseo del modelo, que se usa slo para fines de aplicar
el mtodo matricial.
(2)
COV==
Var B1
Cov B1 B2
Cov B1 B3
Cov B1 B4
Cov B1 Bn
Cov B2 B1
Var B2
Cov B2 B3
Cov B2 B4
Cov B2 Bn
Cov B3 B1
Cov B3 B2
Var B3
Cov B3 B4
Cov B3 Bn
Cov B4 B1
Cov B4 B2
Cov B4 B3
Var B4
Cov B4 Bn
Cov Bn B1
Cov Bn B2
Cov Bn B3
Cov Bn B4
Var Bn
Para estimar la matriz requerimos algunos clculos previos, para ellos tomaremos la ecuacin
(1), considerando ahora que estamos hallando el Beta estimado ():
146
= ( A A ) -1 A Y
= ( A A ) -1 A [ A + U ]
= ( A A ) -1 A A + ( A A ) -1 A U
Note que el trmino ( A A ) -1 A A , es en realidad el valor del parmetro poblacional (sin
error mostrado en la matriz U ) es decir , dado que el resultado de (A ) es la matriz Y, con lo
cual resulta:
= + ( A A ) -1 A U
- = ( A A ) -1 A U
Ahora aplicando la ecuacin (2) para hallar COV, tenemos:
COV = E [ `- E B ] [ `- E B ]
COV = E [ `- ] [ - ]
COV= E [ ( A A ) -1 A U ] [ ( A A ) -1 A U ]
COV= E [ ( A A ) -1 A ] [ U U ] [ ( A A ) -1 A ]
COV= E [ ( A A ) -1 A ] E [ U U ] [ A ( A A ) -1 ]
Por definicin U U es la matriz de varianzas del modelo o errores cuadrticos
con N-K, adems consideramos que E [ U U] equivale a
COV= [ ( A A ) -1 A ]
COV=
2I
2 ajustndolo
[ A ( A A ) -1 ]
[ (A A ) -1 ]
Ahora aplicaremos estas matrices para hallar las varianzas de los parmetros en el modelo
que usamos de ejemplo, ya sabemos que la matriz: INVC es la inversa de la matriz AT*A (ver la
seccin anterior), nos faltara hallar la matriz de errores cuadrticos
realidad un valor numrico o escalar).
Para el clculo del error cuadrtico, primero hallar el error del modo siguiente:
147
Stata aplicados antes, donde sigma_cuad representa el valor de 2 (antes de dividir sobre
N-K), note que este valor es idntico al mostrado en la fig. 4.2 donde se indica la suma cuadrada
del residuo (SCR y aparece como residual en la columna SS que significa suma cuadrtica):
. mkmat U, matrix(error)
. matrix errorT=error'
. matrix sigma_cuad=errorT*error
. matrix list sigma_cuad
symmetric sigma_cuad[1,1]
U
U
.99361032
El valor obtenido se dividir entre los grados de libertad del modelo, en este caso se tienen 18
datos y 4 variables usadas, con lo cual N - K es igual a 14:
2=
0.99361032 / 14
2=
0.07097217
148
Una vez obtenido este dato procedemos a hallar la matriz de varianzas y covarianzas COV,
para lo cual multiplicaremos el valor de
2 hallado
En nuestros clculos sigma_cuad equivale a la suma de errores al cuadrado, por lo que para
estimar 2 usaremos la matriz SER en Stata (el nombre SER servir para relacionarlo con
la suma de errores y no es una matriz sino un valor numrico o escalar, en el lenguaje de Stata
aparece siempre el comando Matrix) que equivale a la suma de errores entre N - K, as la matriz
COV se muestra a continuacin:
. matrix SER=sigma_cuad/14
. matrix list SER
symmetric SER[1,1]
U
U
.07097217
. matrix COV=SER*INVC
. matrix list COV
symmetric COV[4,4]
Id
Multiplic
Interb
Id
17.324832
Multiplic
-2.3312086
.65194641
Interb
-2.7058041
.43971171
.53486018
TC
.0249269
-.44100089
-.2472985
TC
.78899624
149
Varianza
17.324832
0.65194641
0.53486018
0.78899624
Desviacin
4.162310897
0.807431985
0.731341357
0.888254603
Parmetro
-6.9133294
1.3648439
1.2979727
-0.65458463
t
-1.66
1.69
1.77
-0.74
Los valores crticos de t de Student coinciden con los mostrados en la fig. 4.2 donde se
indican los resultados de la regresin y en base a ellos, se puede decir que ninguna variable es
significativa, no olvidemos que las variables estadsticamente diferentes de cero, deben tener un
valor mayor a 2, lo que significa que caemos en la zona de rechazo de la hiptesis nula y
aceptacin de la alternativa.
Ahora evaluaremos la bondad de ajuste del modelo, para ello necesitamos conocer el valor
de R2 o de la prueba F de Fisher, lo cual supone los clculos siguientes:
SCT = SCE + SRC
Ya vimos antes que la suma cuadrtica total es SCT, SCE es la suma de cuadrados
explicada y SRC es la suma de residuos al cuadrado, ahora esto queda:
SRC = SCT SCE
Donde SCT se expresa en desviaciones de Y, mientras que Ym es la media de Y:
SCT = yi 2
SCT = ( Yi Ym ) 2
SCT = ( Yi 2 - 2 Yi Ym + Ym 2 )
SCT = Yi 2 - 2 Yi Ym + N Ym 2
SCT = Yi 2 - 2 Yi Ym + Yi Ym
SCT = Yi 2 - Yi Ym
SCT = Yi 2 - N Ym 2
150
En matrices queda:
SCT = Y Y N Ym 2
SCE, se expresa del modo siguiente:
SCE = 1 2 xi 2
SCE = 1 xi yi xi 2 / xi 2
SCE = 1 xi yi
Desarrollando las desviaciones:
SCE = 1 [ xi yi - xi Ym ]
SCE = 1 Xi Yi - 1 Xi Ym
No olvidemos que en matrices:
Y = X
Ym = Xm
N Ym = Xi
N Ym / Xi =
Reemplazando en SCE:
SCE = 1 Xi Yi - [ N Ym / Xi ] Xi Ym
SCE = 1 Xi Yi - N Ym 2
En matrices se expresa generalmente como sigue, donde A es la matriz de las variables
independientes (X y otras):
SCE = A Y N Ym 2
Donde Ym es un valor numrico y N es el total de datos, con eso ya podemos estimar la suma
de cuadrados totales:
SCT = Y Y N Ym 2
151
. matrix YT=Y'
. matrix Yp=YT*Y
. matrix list Yp
symmetric Yp[1,1]
inflacin
inflacin 2.6562566
Entonces Y Y = 2.6562566
La media de Y o Ym es 0.2800928, con lo cual tenemos:
SCT = 2.6562566 - 18 (0.2800928) 2
SCT = 1.2441
Ahora estimaremos la suma explicada cuadrtica, con los comandos de Stata respectivos
(note que A es la matriz de variables independientes):
SCE = X Y N Ym 2
SCE = A Y N Ym 2
152
. matrix BT=B'
. matrix BXY=BT*AT*Y
. matrix list BXY
symmetric BXY[1,1]
inflacin
inflacin 1.6626463
Entonces A Y = 1.6626463
SCE = 1.66266463 18 (0.2800928) 2
SCE = 0.250511
Finalmente hallamos:
SCT = SCE + SCR
SCT = 0.250511 + 0.99361032
SCT = 1.2441
Lo cual coincide con nuestro clculo previo, esta informacin ser relevante para hallar el R2
del modelo, que resulta:
R2 = SCE / SCT
R2 = 0.250511 / 1.2441 = 0.2014
R2 = 20.14%
La bondad de ajuste del modelo es de 20%, esto indica que las variables: multiplicador
bancario, tasa interbancaria y tipo de cambio, slo explican el 20% de la tasa de inflacin
153
mensual, el ajuste es bajo e indica que el modelo tiene poca fuerza explicativa. El coeficiente de
correlacin llega a 45% de asociacin global.
Finalmente la prueba F de Fisher se calcula de este modo:
F = [SCE / (K - 1)] / [SCR / (N K)]
Donde la SCR puede hallarse tambin del siguiente modo, en matrices:
Y=X+U
U=(Y-X)
U U = ( Y - X ) ( Y - X )
U U = Y Y - 2 X Y + X X
Considere que si la estimacin es correcta, entonces Y = X , la ecuacin previa resulta:
U U = Y Y - 2 X Y + X Y
U U = Y Y - X Y
U U = 2.6562566 - 1.6626463
U U = 0.9936103 = SCR
Entonces la prueba F resulta:
F = [ 0.250511 / (4 - 1) ] / [ 0.9936103 / (18 - 4) ]
F = 1.18
El valor de la prueba F es bastante bajo, lo que supone que el modelo en realidad tiene un
bajo ajuste y no sera explicativo para la tasa de inflacin.
2:
154
F ( Y i / 0 + 1 X i,
2)
2)
= F ( Y 1 / 0 + 1 X i,
2)
* F ( Y 2 / 0 + 1 X i,
2)
* * F ( Yn / 0 + 1 Xi,
2)
2 ) 0.5 ] e [ -1 / 2
2 ] (Yi - 0 - 1 Xi ) ^ 2
2)
= [1/
2 ) 0.5 ] e [ -1 / 2
2 ] (Y2 - 0 - 1 Xi ) ^ 2
FV = F (Yi / 0 + 1 Xi,
**[1/
2)
= [1 /
2 ] (Y1 - 0 - 1 Xi ) ^ 2
2 ) 0.5 ] e [ -1 / 2
N
2 ) 0.5 N ] e [ -1 / 2
*[1/
2 ) 0.5 ]
2 ] (Yn - 0 - 1 Xi ) ^ 2
2 ] (Yi - 0 - 1 Xi ) ^ 2
Esto ltimo se conoce como funcin de verosimilitud, en buena cuenta es la expresin que
refleja a la distribucin de probabilidades condicionales de Yi, la funcin de verosimilitud puede
ser expresada en logaritmos del siguiente modo:
Ln FV = -1 ( N ln
Ln FV = - N ln
Ln FV = - 0.5 N ln
+ 0.5 N ln (2 ) 1 / 2 (Yi - 0 - 1 Xi ) 2 /
- 0.5 N ln (2 ) 1 / 2 (Yi - 0 - 1 Xi ) 2 /
2
Para hallar los parmetros del modelo y adems la varianza del mismo, derivamos todo e
igualamos a cero:
155
Considere que
Ln FV / 0 = -1 * (Yi - 0 - 1 Xi ) /
2=
Ln FV / 1 = - Xi * (Yi - 0 - 1 Xi ) /
2=
2)
2* 2=
2=
- (Xi Yi + 0 Xi + 1 Xi Xi ) = 0
- Xi Yi + 0 Xi + 1 Xi 2 = 0
0 Xi + 1 Xi 2 = Xi Yi
( Ym - 1 Xm ) Xi + 1 Xi 2 = Xi Yi
Ym Xi - 1 Xm Xi + 1 Xi 2 = Xi Yi
1 ( - Xm Xi + Xi 2 ) = Xi Yi - Ym Xi
1 = Xi Yi - Ym Xi / Xi 2 - Xm Xi
1 = [ N Yi Xi - Yi Xi ] / [N Xi 2 - Xi Xi ]
156
Como fue demostrado en el tema anterior, la expresin previa equivale a hallar 1 por
mnimos cuadrados ordinarios:
1 = (X Xm) ( Y Ym) / (X Xm)2
1 = yi xi / xi2
En el caso de la varianza del modelo, los ajustes a la ecuacin que deriva la funcin FV
respecto a
2,
resulta:
( 0.5 N ) = 0.5 (Yi - 0 - 1 Xi ) 2 /
2=
2=
Si analizamos el estimador de
obtenemos:
(Yi - 0 - 1 Xi ) 2 / N
(Ui ) 2 / N
2
(i)
Yi = 0 + 1 Xi + Ui
Ym = 0 + 1 Xm + Um
Donde m, significa la media de la variable, adems yi, xi son las variables en desviaciones
respecto de la media:
Yi Ym = 1 xi + ( Ui Um )
(ii)
Considere que la estimacin correcta del parmetro 0 nos lleva al valor de Ym poblacional,
entonces:
Y m - 1 X m = 0
Y m = 0 + 1 X m
Y i Y m = ( 0 + 1 X i + U i ) - ( 0 + 1 X m )
Yi Ym = 1 xi + Ui
yi - 1 xi = Ui (iii)
157
/ xi ) 2 xi 2 + ( N - 1)
2 E ( Zi ui ) xi ( Ui Um ) = E Ui 2
(iv)
Donde:
E ( Ui Um ) 2 = E (Ui 2 2Ui Um + Um 2)
E ( U i U m ) 2 = E ( U i 2 2 U i U m + N U m 2)
E ( Ui Um ) 2 = E ( Ui 2 2 Ui Um + Ui Um )
E ( Ui Um ) 2 = E ( Ui 2 Ui Um )
E ( Ui Um ) 2 = E ( Ui2 Ui 2 / N )
E ( Ui Um ) 2 = N
E ( Ui Um ) 2 = ( N - 1 )
+ ( N - 1)
2 E ( Zi ui ) xi ( Ui Um ) = E Ui 2
158
Donde Um = 0, entonces (Recuerde que ui = Ui, dado que son variables sin desviaciones ya
que el valor esperado de Ui o su media es cero), adems Zi xi es igual a 1:
2
+ ( N - 1)
2
2 E ( Zi ui ) xi ( ui ) = E Ui 2
+ ( N - 1)
2
2 E Zi xi ui 2 = E Ui 2
+(N1)
2
+(N1)
(N2)
2 E ui 2 = E Ui 2
2
2
2
= E Ui 2
= E Ui 2
= Ui 2 / ( N 2 )
(v)
Hay que notar que la ecuacin (v) de la varianza del modelo a partir de los mnimos
cuadrados ordinarios, difiere de la ecuacin (i) que es la varianza estimada con verosimilitud, lo
que indica que el mejor estimador de la varianza del modelo de regresin no es el de
verosimilitud (que normalmente tiende a ser poblacional), sino es el estimador de mnimos
cuadrados mostrados en la ecuacin (v) y que para fines de generalizar equivale a:
2
= Ui 2 / ( N K )
159
160
Preguntas de opinin
1. Puede un modelo con muchas variables explicativas no ser relevante?
2. Si al insertar ms variables explicativas el R2 no aumenta, entonces eso qu
significa?
3. Por qu se aade un vector de 1 (unos) en la matriz de variables explicativas?
4. Por qu las varianzas de los parmetros son solo la diagonal de la matriz de
varianza covarianza de Betas?
5. Si uso el valor de la varianza del modelo desde la funcin MV, Qu pasa con
los estimadores de Betas?
161
Caso de aplicacin
Lectura previa
De acuerdo con Romer (2002), la curva LM debe ser ajustada a una curva conocida como MP
(Monetary Policy Curve) que esta basada en las variables tasas de inters real (r) y producto (y)
similar a la LM, sin embargo la diferencia estriba en que la MP es horizontal.
La tasa de inters real es estable a todo nivel de oferta monetaria y se ajusta ms bien con
los cambios en la brecha del producto, de este modo cuando el producto es alto respecto del
potencial (brecha creciente) la tasa de inflacin tiende a subir, en ese caso el banco central
ajusta la tasa de inters anunciando elevaciones de las tasas de referencia, con lo cual mantiene
la tasa real, pero eleva la tasa nominal y los agentes ajustan sus expectativas y por ende tienden
a consumir o prestar menos, lo que algunos economistas conocen como enfriar la economa,
pero en la prctica es ajustar la inflacin esperada. Siguiendo a Romer la tasa real de inters,
debe seguir la siguiente funcin:
r = r ( )
(1)
Es previsible entonces, que el crecimiento productivo sea constante a todo nivel de precios,
esto se produce porque si el incentivo de mayor inflacin se da a corto plazo, entonces la oferta
puede incrementarse de modo inmediato, esa expansin de la brecha del producto se convierte
en el objetivo a reducir por la poltica monetaria, la elevacin del inters real reduce la brecha, el
producto vuelve a su nivel potencial y los precios siguen estables, siempre se producir a un
mismo nivel de precios, dicho nivel se conoce como inflacin ajustada.
Hay que sealar que a diferencia de Lucas (1973), que seala que los shocks nominales
pueden tener efectos de corto plazo, pero a largo plazo slo son inflacionarios, evidenciando una
oferta vertical (producto potencial a largo plazo), el movimiento de la inflacin ajustada se da en
torno a los precios estables de corto plazo y son base de estabilidad a largo plazo, Lucas se
sustenta en las expectativas, si estas se ajustan a la inflacin esperada, entonces la oferta no
vara a mayor nivel de precios, pero si hay ajuste lento, entonces a corto plazo hay efecto real
con mayor inflacin, un resultado nada deseable para el banco central.
En el caso de la inflacin ajustada, los shocks nominales, producen un efecto de corto plazo
inmediato con mayor inflacin, pero a corto plazo el banco central ajusta las tasas de inters y
mantiene estables el producto y la inflacin, con las evidentes ganancias de una mayor demanda
en el corto plazo.
Cuando la Oferta Agregada (OA) es menor al producto potencial, entonces la oferta se mueve
hacia ese nivel a tasas de inflacin decreciente (siguiendo a Lucas, un producto menor al
potencial implica una inflacin decreciente), que es lo mismo decir que el banco central reduce
las tasas nominales para incentivar el consumo.
A la inversa, si la OA se mueve por encima del producto potencial (Yp), esto se produce a
mayores tasas de inflacin, de modo que el Banco Central ajusta las tasas nominales a un mayor
nivel, para reducir el consumo y por ende llevar al producto a su nivel potencial.
Podemos decir entonces, que los movimientos en la inflacin estn alineados con la
estabilidad de la tasa de inters real, lo cual es un resultado del alza de tasas nominales, la que
se da cuando el producto efectivo supera al potencial, planteando un modelo como el siguiente:
P t = P e + (Y t - Yp)
(2)
(3)
r t = P e + (Y t - Yp)
(4)
Donde:
Pe: Tasa de inflacin esperada
Pt: Tasa de inflacin del perodo
: Indicador de ajuste, va de 0 (en este caso la inflacin es igual a la esperada) a < 1, en
donde la inflacin es mayor a la esperada si la brecha es positiva y menor a la esperada si la
brecha es negativa.
rt:
: Factor de ajuste, si es cero, entonces no existe relacin entre inflacin del perodo y tasa
real de inters, si es 1 la relacin es perfecta y la tasa real pasa a depender de la inflacin
esperada y la brecha de producto.
Dado que la poltica monetaria se hace con la tasa nominal de referencia, entonces la
ecuacin 4 puede ser analizada, partiendo de la nocin de inters real:
rt = it-Pt
(5)
Reemplazando en 4:
i t = P t + P e + (Y t - Yp) (6)
Donde:
it :
: Producto de
La tasa de referencia se ajusta en funcin a la inflacin del perodo, el nivel de ajuste de la
inflacin esperada y la brecha de producto, un crecimiento de la inflacin del perodo, el ajuste
del nivel esperado de inflacin y un crecimiento de la brecha, determinan un alza en la tasa de
inters nominal de referencia.
El uso de la tasa de inters focalizada en la tasa interbancaria, como elemento de poltica
monetaria de corto plazo (Hsing, 2005), se basa en la denominada regla de Taylor (1993), cuya
propuesta indica que la tasa de inters de mercado responde bsicamente a cuatro agregados, a
164
saber la brecha de producto, la brecha de precios (la desviacin en torno a la meta de inflacin),
la meta de inters real y la tasa de inflacin, dicha tasa adems esta en relacin con la inflacin
rezagada, la inflacin esperada (asumiendo la inflacin de largo plazo) y la brecha de producto,
con esta informacin ajustaremos la ecuacin (2) y (6) a las propuestas de Taylor, primero en el
caso de la inflacin:
P t = b P t - 1 + (1 - b) P e + (Y t - Yp)
(7)
Donde:
b: Regla de poltica, si es igual a 0, entonces la inflacin depende del nivel esperado y la
brecha de producto, si es igual a 1, la inflacin se forma con expectativas pasadas y la brecha de
producto.
Ahora analicemos el caso de la tasa de inters:
i t = r e + P t + c1 ( P t - P e ) + c2 (Y t - Yp)
(8)
Donde:
re: Tasa de inters real tomada como meta
c1: Indicador de poltica, si es 1, entonces la tasa de inters crece a mayor impulso que la
brecha de precios, si es cero, la tasa de inters crece en funcin a las desviaciones en torno a la
tasa nominal de largo plazo.
No obstante la propuesta de Taylor, tiene a su vez sus opiniones divergentes, los bancos
centrales si bien han dejado de usar la oferta monetaria como nica o principal variable de ajuste
de precios, consideran que es necesario evaluar otros indicadores del manejo de precios, por
ejemplo el ajuste de los salarios reales, la expectativa de los agentes a travs de encuestas de
confianza, el manejo fiscal, el nivel cambiario y la dinmica de los activos financieros burstiles
(La Caixa, 2005).
Siguiendo a Herrau-Aragn (2003), la regla de Taylor tiene que ser considerada con cuidado
ante shock reales, es decir el uso de la tasa de inters como mecanismo de ajuste no debera
darse en contextos de shock temporal, sin embargo si la desviacin empieza a debilitar la meta
de inters y de precios, es importante hacer uso de la regla, es decir preservar la credibilidad del
instrumento y ajustar la oferta.
Siguiendo a Montoro (2007), se analiza la evidencia emprica de los recientes modelos de
poltica monetaria basadas en la regla de Taylor, el autor revisa resultados para la economa
165
norteamericana, concluyendo en un bajo ajuste entre la tasa de inters de referencia, que a decir
de diversos exponentes se debe, entre otros aspectos: a la incertidumbre de los agentes
respecto a la marcha econmica, la cual genera poca sensibilidad a cambios econmicos en los
agentes cuando se mueve la tasa de inters, es decir los niveles de apuesta por inversin o
consumo se hacen lentos. Otra consideracin es sostener la estabilidad de los mercados
financieros, de modo que el uso de la tasa de inters es cuidadoso y de pequeos cambios,
tambin se hace mencin al uso gradual de las tasas a corto plazo, pensando en la estabilidad
de la tasa de inters a largo plazo y finalmente, el uso de las tasas de inters esta sujeto a las
decisiones de los gestores de poltica (o un monopolio de la decisin), de modo que el ajuste
lento de las tasas es para evitar impactos o shocks en el bienestar social, a partir de cambios
fuertes en la brecha de producto.
Castillo, Montoro y Tuesta (2006) analizan los hechos estilizados de la economa peruana y
encuentran evidencia que sustenta el uso de la tasa de inters en un contexto de metas de
inflacin, por un lado la correlacin producto inflacin ha ido creciendo; esto supone un
incremento del rol de la demanda en la formacin de la brecha del producto, rol que se ve
influenciado principalmente por la tasa de inters de referencia, otro hallazgo es la correlacin
positiva entre inters y producto, de modo que las reglas de inters estn teniendo un efecto
positivo en la brecha de producto.
En contrapartida, el estudio indica que en el caso peruano, se est reduciendo el nivel de
impacto de los agregados monetarios en la inflacin, asimismo la menor volatilidad de las tasas
inflacionarias y de inters se ven reflejadas en un ciclo econmico con un producto menos voltil,
ciclo estimado desde 1994 al 2003.
Otro trabajo de los mismos autores (Castillo, Montoro y Tuesta, 2006-1), indican que seguir el
esquema de metas de inflacin y por ende la regla de tasas de inters, requiere la estimacin de
una tasa natural de inters, la cual gua las acciones en torno al producto y precios, si la brecha
de inters es positiva (una tasa mayor a la natural) entonces se contrae el producto y los precios,
a la inversa una brecha negativa implica elevar el producto y los precios, esta tasa natural se
estima siguiendo la propuesta de Greenspan (1993) en torno a una tasa real de inters de largo
plazo alineada con el producto potencial.
Tomado textualmente de Len (2007)
166
Preguntas
1. Cmo sera el modelo economtrico a plantear para analizar la regla de Taylor?
2. Cules seran las variables observadas a emplear?
3. Cmo hara para obtener informacin acerca de las variables medidas en valor
esperado o potencial?
167
Ejercicios
Se tiene un modelo de demanda (Xd: Cantidad demandada) y oferta (Xo: Cantidad ofertada),
para los precios del bien P1 y de un bien relacionado P2, donde e son los errores respectivos.
Xd=0+1P1+2P2+ed
X o = 0 + 1 P 1 + 2 P 2 + eo
Se recopilaron adems diversos datos de precios y cantidades demandadas y ofertadas, los
cuales se muestran en la tabla siguiente, para cada perodo T1 a T10.
Tabla 4.2 Datos de precios, cantidad demandada y cantidad ofertada
T1
T2
T3
T4
T5
T6
T7
T8
T9
T10
P1
1.5
1.7
1.6
2.1
1.8
1.9
2.2
P2
0.5
0.4
0.3
0.3
0.2
0.25
0.28
0.3
0.27
0.24
Xd
20
18
17
18
15
14
15
15
13
10
Xo
10
12
13
13
14
15
15
13
16
18
168
Referencias bibliogrficas
Castillo, P. Montoro, C. Tuesta. V. (2006) Estimacin de la Tasa Natural de Inters para la
Economa Peruana. Documentos de Trabajo. Banco Central de Reserva del Per.
Castillo, P. Montoro, C. Tuesta. V. (2006-I). Hechos Estilizados de la Economa Peruana.
Documentos de Trabajo. Banco Central de Reserva del Per.
Clarida, R., J. Gal and M. Gertler (1998), Monetary policy rules in practice. Some international
evidence, European Economic Review, 42:1033-1067.
Clarida, R., J. Gal y M. Gertler (1999), The science of monetary policy: a new keynesian
perspective, Journal of Economic Literature, XXXVII, December: 1661-1707.
Clarida, R., J. Gal y M. Gertler (2001), Optimal monetary policy in open versus closed
economies: an integrated approach, American Economic Review, 91, No.2: 248-252
Corbo, V. Tesada, J. (2003) Modeling a small open economy: the case of Chile. Documentos de
Trabajo. Banco Central de Chile.
DeLong B. J. (2000) How to Teach Monetary Policy: Do Central Banks Set the Interest rate or Do
They Target the Money Stock? University of California. Berkeley.
Galindo, L. (2007) El rgimen de metas de inflacin y la estructura de tasas de inters: Evidencia
emprica para un debate. CEPAL. Chile.
Greene, W. (2003) Econometric Analysis. Fifth Edition. Pearson Ed.
Gujarati, D. (2004) Econometra. 4ta Edic. Mc Graw Hill.
Herrou-Aragn, Alberto. (2003) La regla de Taylor para la tasa de inters. Cuadernos de
Economa. N 121. Pontificia Universidad Catlica de Chile. Chile.
Hsing, Yu. (2005) Application of the ISMPIA model to the German economy and policy
implications. Economics Bulletin. Vol. 15. No. 5.
Hsing, Yu. (2005) Application of the ISMPIA model to the Singapore economy and policy
implications. Economics Bulletin. Vol. 15. No. 6
169
Hsing, Yu. Clark, Don. (2005) Application of the IS-MP-IA Model and the Taylor Rule to Korea and
Policy Implications. The Journal of the Korean Economy. Vol. 6. N 2. Korea.
Jimnez, F. (2012) Elementos de teora y poltica macroeconmica para una economa abierta.
Fondo Editorial PUCP.
Johnston, J. and Dinardo, J. (1997) Econometric Methods. Fourth Edition. Mc Graw Hill.
La Caixa. (2005) Poltica monetaria: Un traje a medida?. Informe mensual de economa
europea. Espaa.
Len, C. (2007) El modelo IS-MP y la regla de Taylor: Una aproximacin emprica para el Per.
USAT Escuela de Economa DI 003. Per.
Lucas, R. (1973) Some International evidence on output-inflation tradeoffs. The American
Economic Review. Vol. 63. Nro 3. USA.
Montoro, Carlos. (2007) Why Central Banks Smooth Interest Rates? A Political Economy
Explanation. Documentos de Trabajo. Banco Central de Reserva del Per.
Novales, A. (1993) Econometra. Mc Graw Hill.
Romer, David. (2000) Keynesian Macroeconomics without the LM Curve. Journal of Economic
Perspectivas. Vol. 14. N 2.
Romer, David. Romer, Christina. (2000) Federal Reserve Information and the Behavior of Interest
Rates. University of California.
Romer, David. Romer, Christina. (2002) A Rehabilitation of Monetary Policy in the 1950s.
University of California.
Romer, David. Romer, Christina. (2004) A New Measure of Monetary Shocks: Derivation and
Implications. University of California.
Rotemberg, J.J. y M. Woodford (1999) Interest rate rules in an estimated sticky price model, en
Taylor, J.B. (ed.), Monetary Policy Rules, National Bureau of Economic Research, University of
Chicago Press: 319-348.
170
Rotemberg, J.J. (1987) The new Keynesian microfoundations, S. Fischer (ed.), NBER
Macroeconomics Annual, MIT Press: 297-346.
Taylor, John B. (1993) Discretion versus Policy Rules in Practice. Carnegie-Rochester
Conference. Series on Public Policy.
Taylor, J.B. (ed.), (1999a) Monetary Policy Rules, National Bureau of Economic Research,
University of Chicago Press.
Taylor, J.B. (1999b) A historical analysis of monetary policy rules, Taylor, J.B. (ed.), Monetary
Policy Rules, National Bureau of Economic Research, University of Chicago Press, 319-348.
Taylor, J.B. (1999c) The robustness and efficiency of monetary policy rules as guidelines for
interest rates setting by the European Central Bank. Journal of Monetary Economics, Vol. 43(3),
June, 655-679.
Taylor, J.B. (2001) The role of the exchange rate in monetary-policy rules, American Economic
Review Papers and Proceedings, Vol. 91, 2: 263-267.
Woodward, B. (2001), Greenspan, Pennsula Atalaya.
Wooldridge, J. (2009) Introductory Econometrics. A modern approach. Third Edition. Cengage
Learning.
171
CAPTULO V
Multicolinealidad en modelos
economtricos
172
174
X1
Y
X2
X1
X2
La fig. 5.1 muestra que la variable dependiente recibe influencia de las variables X1 y X2 pero
las variables explicativas no se relacionan entre s. Mientras que en la Fig. 5.2 se muestra que las
variables X1 y X2 se relacionan entre s, evidenciando un proceso de multicolinealidad.
Las razones para la existencia de multicolinealidad pueden ser las siguientes:
175
Tambin es posible que las variables explicativas generen relaciones cuando las
opciones de respuesta son limitadas (sesgadas hacia lo dicotmico) o tienen muy poca
variacin. Consideremos que la variable es estar de acuerdo (1) o no (2) con las colas
de atencin en una entidad financiera, pues naturalmente pocos estaran de acuerdo.
Ahora si calificamos el servicio del banco (donde hay muchas colas) de 1 a 5, donde 5
es de acuerdo que tiene un buen servicio y 1 estamos en desacuerdo que tiene un
buen servicio. Entonces encontraremos que las respuestas de ambas variables estarn
en alrededor de 1.
Ahora si consideremos que las colas son un factor que influye en las colocaciones de la
entidad, puede que un mal servicio afecte los crditos o colocaciones y que estar de
acuerdo con que haya colas igual afecte el servicio por cuanto sern muy pocos los que
estn de acuerdo. En este ejemplo la variable dependiente colocaciones depende de
dos variables cuya relacin es lineal y muy alta, ambas son 1.
176
Identidad
X1
X2
X3
10
12
10
13
12
15
14
18
16
20
18
20
10
20
21
11
22
23
12
24
28
13
26
29
177
178
symmetric XTX[3,3]
I X1 X2
I 12
X1 90 818
X2 180 1636 3272
. matrix INVX=inv(XTX)
matrix has missing values
179
I
X1
X2
I
12
90
180
X1
90
818
1636
X2
180
1636
3272
Ahora apliquemos la regla de Sarrus para hallar el determinante, primero repliquemos las
columnas I, X1 armando la matriz siguiente:
I
X1
X2
I
12
90
180
X1
90
818
1636
X2
180
1636
3272
I
12
90
180
X1
90
818
1636
Ahora multipliquemos las diagonales de la matriz previa, las diagonales positivas sern:
I*X1*X2 + X1*X2*I + X2*I*X1
Mientras que las diagonales negativas son:
-X1*I*X2 - I*X2*X1 - X2*X1*I
La suma de ambas diagonales (positiva + y negativa - ) se muestra ahora:
Diagonal +
Diagonal -
32,117,952.00
-26,503,200.00
26,503,200.00
-32,117,952.00
26,503,200.00
-26,503,200.00
Determinante
Sumatoria
85,124,352.00
-85,124,352.00
0.00
Como indica el clculo, el determinante es cero, lo que significa que no podremos dividir
ningn nmero sobre este valor (no olvide que una matriz inversa es su matriz adjunta entre el
determinante) ya que sera indeterminado, esto pasa cuando la multicolinealidad es perfecta y no
se puede hallar la inversa de XX, siendo imposible hallar los parmetros del modelo de
regresin.
180
Ahora analicemos el caso de la multicolinealidad inexacta, para ello usemos las variables I,
X1, X3 (no olvide que X3 se relaciona de modo inexacto con X1) con las cuales crearemos la
matriz A, usemos ahora los comandos de Stata :
. mkmat I X1 X3, matrix(A)
. matrix AT=A'
. matrix ATA=AT*A
. matrix list ATA
symmetric ATA[3,3]
I X1 X3
I 12
X1 90 818
X3 217 1891 4421
Ahora estimemos la inversa de la matriz AA, con los resultados hallados previamente con el
Stata de AA:
A'A =
I
X1
X3
I
12
90
217
X1
90
818
1,891
X3
217
1,891
4,421
Hallemos la matriz Adjunta de AA, para ello usemos los cofactores de cada elemento de la
matriz AA, por ejemplo para el elemento 1,2 o 90 (el elemento de X1,I) de la matriz AA, sus
cofactores son los siguientes:
181
90
217
Cofactores X1,I =
1,891
4,421
El determinante de los cofactores de (X1,I) o del elemento (1,2) es: 90*4421 1891*217 =
-12,457, este valor sera el elemento 1,2 de la matriz adjunta que se muestra a continuacin
como Adj AA:
Adj A'A =
40,497
-12,457
-7,316
-12,457
5,963
3,162
-7,316
3,162
1,716
Una vez que se obtiene la matriz adjunta, debemos multiplicar cada elemento de orden impar
por -1, eso nos da la matriz adjunta siguiente:
Adj A'A *(-1)
40,497
12,457
-7,316
12,457
5,963
-3,162
-7,316
-3,162
1,716
Para hallar la matriz inversa de AA, necesitamos el determinante de AA, el cual se estima
del modo siguiente usando la regla de Sarrus:
I
X1
X3
I
12
90
217
X1
90
818
1891
X3
217
1891
4421
I
12
90
217
X1
90
818
1891
Con la cual obtenemos las diagonales tal como se estimaron antes para XX:
Diagonal +
Diagonal -
43,396,536.00
-38,518,802.00
36,931,230.00
-42,910,572.00
36,931,230.00
-35,810,100.00
Determinante
Sumatoria
117,258,996.00
-117,239,474.00
19,522.00
2.074429
0.638101
-0.374757
0.638101
0.305450
-0.161971
-0.374757
-0.161971
0.087901
Los resultados se muestran tambin con el programa Stata , lo cual indica que en presencia
de multicolinealidad inexacta, si es posible estimar los parmetros del modelo de regresin que
se plantee, esto se debe a que si es posible hallar la inversa de AA.
. matrix INVA=inv(ATA)
. matrix list INVA
symmetric INVA[3,3]
I
X1
X3
I 2.0744288
X1 .6381006 .30545026
X3 -.37475668 -.16197111 .08790083
(1)
Donde:
Xi3 = Xi1
183
(2)
Ahora estimemos los parmetros para las regresiones mostrados en las ecuaciones (1) y (2),
en el caso de la ecuacin (1) los resultados mostrados en la Fig. 5.2 se pueden expresar as:
Yi = 1.096763 + 0.1392788 X1i + 0.1672984 X3i + Ui
Tambin se puede notar que esta regresin tiene todos los parmetros no significativos,
debido a que el valor crtico de t de Student es menor que 2 y observe que el R2 del modelo es
relativamente alto, el valor llega a 0.9146 o 91.46% de ajuste.
En el caso de la regresin mostrada en la Fig. 5.3, ecuacin (2), los resultados se expresan as:
Yi = 1.810023 + 0.4475524 Xi1 + Ui
Note que en la regresin donde slo hay X1 como explicativa, la prueba t de Student es
satisfactoria y el valor del parmetro es significativo. Asimismo el ajuste del modelo medido con
R2 es de 0.9045 o 90.45%.
184
SS
df
MS
Number of obs =
F(
Model
28.9617696
14.4808848
Residual
2.70489704
.300544115
Total
31.6666667
Coef.
X1
11
2.87878788
2,
12
9) =
48.18
Prob > F
0.0000
R-squared
0.9146
Adj R-squared =
0.8956
Root MSE
.54822
Std. Err.
P>|t|
.1392788
.3029873
0.46
0.657
-.546126
.8246836
X3
.1672984
.1625364
1.03
0.330
-.2003844
.5349813
_cons
1.096763
.7895932
1.39
0.198
-.6894212
2.882946
SS
df
MS
Number of obs =
F(
10) =
94.74
Model
28.6433566
28.6433566
Prob > F
0.0000
Residual
3.02331002
10
.302331002
R-squared
0.9045
Adj R-squared =
0.8950
Total
31.6666667
11
2.87878788
Root MSE
.54985
Coef.
X1
_cons
1,
12
Std. Err.
P>|t|
.4475524
.0459805
9.73
0.000
.3451016
.5500033
1.810023
.379629
4.77
0.001
.9641572
2.655889
185
1
0.263286681
0.079020962
-0.105244758
-0.289510477
-0.473776196
Podemos notar que para cualquier valor de 3, las posibilidades de estimacin de 1 son
variadas e ilimitadas y ello imposibilita saber de manera insesgada el parmetro 1.
Al observar ambas regresiones en los modelos (1) y (2) tenemos otros detalles, por ejemplo:
Tabla 5.2 Varianza de los parmetros 1 en los modelos Y, X1, X3 - Y, X1
Modelo 1 (Multicolineal)
Modelo 2
1
0.1392788
0.4475524
Desviacin Estndar
0.3029873
0.0459805
Varianza
0.091801304
0.002114206
En buena cuenta los modelos con multicolinealidad, tienen parmetros con varianza mucho
mayor a los modelos sin esta falla, esto supone que el intervalo de confianza de los parmetros
es ms amplio, en el caso del parmetro constante o intercepto del modelo tambin presenta
varianzas diferenciadas:
Tabla 5.3 Varianza de los parmetros 0 en los modelos Y, X1, X3 - Y, X1
Modelo 1 (Multicolineal)
Modelo 2
0
1.096763
1.810023
Desviacin Estndar
0.7895932
0.379629
Varianza
0.623457421
0.144118178
Como se indica antes, la varianza del intercepto del modelo con multicolinealidad es mayor al
intercepto del modelo que no presenta este problema, implicando un rango alto de variacin de
los parmetros.
Dado que los valores de la desviacin estndar de los parmetros ,son mayores en el modelo
con multicolinealidad inexacta respecto del modelo sin este problema, esto supone que los
valores t crticos de Student son bajos o menores en el caso multicolineal comparado con los del
modelo sin la presencia de la multicolinealidad, como pueden ver:
187
t de 1
0.459685274
9.733526169
t de 0
1.389022854
4.767873371
Entonces se puede verificar que la prueba t de modelos con multicolinealidad tiene valores
bajos, respecto del mismo modelo sin multicolinealidad.
Otra forma de detectar la multicolinealidad tiene que ver con el ajuste global del modelo, para
ello estimemos el valor de R2:
Tabla 5.5 R2 en los modelos Y, X1, X3 - Y, X1
Modelo 1 (Multicolineal)
Modelo 2
SCE
28.9617696
28.6433566
SCT
31.6666667
31.6666667
R2
0.9146
0.9045
Puede notarse que el valor de R2 no vara mucho entre un modelo y el otro, en el caso del
modelo sin multicolinealidad el R2 es de 90.45% y en el caso del modelo con multicolinealidad la
medida global de ajuste es de 91.46%.
Tabla 5.6 Prueba F en los modelos Y, X1, X3 - Y, X1
Modelo 1 (Multicolineal)
Modelo 2
SCE
28.9617696
28.6433566
K1
2
1
SCR
N-K
2.70489704
9
3.02331002 10
F
48.182
94.742
Donde R2 (Xi), resulta de estimar una regresin entre las variables explicativas, dicha regresin
se muestra a continuacin:
Fig. 5.5 Regresin de X1, X3
. reg X1 X3
Source
SS
df
MS
Number of obs =
F(
1,
12
10) =
426.79
Model
139.726145
139.726145
Prob > F
0.0000
Residual
3.27385544
10
.327385544
R-squared
0.9771
Adj R-squared =
0.9748
Total
143
11
13
Root MSE
.57218
X1
Coef.
Std. Err.
X3
.53027
.0256678
_cons
-2.089049
.4926717
P>|t|
20.66
0.000
.4730787
.5874613
-4.24
0.002
-3.18679
-.9913082
189
En buena cuenta si existe multicolinealidad, entonces el FIV ser bastante alto, existe de ese
modo una gran distancia entre la varianza del parmetro multicolineal y aquel parmetro
equivalente sin esta falla.
Un indicador alterno es el nivel de tolerancia, que se estima del siguiente modo:
Tolerancia = 1 / FIV
Tolerancia = 1 / 43.6681 = 0.0229
La tolerancia 0 (o muy cercana a cero) indica alta multicolinealidad, mientras que la tolerancia
igual a1 indica que no existe multicolinealidad, de ese modo podemos hallar esta falla en los
modelos economtricos. En el caso de nuestro ejemplo existe una alta multicolinealidad.
Una forma de darnos cuenta a modo indirecto de la presencia de variables que no aportan al
modelo, que a pesar de ello tiene un R2 alto, es el criterio de informacin de Akaike (AIC),
estimado como:
AIC = - 2 Ln FV + 2K
Donde:
Ln FV: Es el logaritmo natural del valor de la funcin de verosimilitud estimada con los
parmetros que resultan del modelo, dichos parmetros son 0, 1, i y la ecuacin de
estimacin es:
Ln FV = - 0.5 N ln
Ln FV = N [ - ln
parmetros se pondera por 2, ahora en el BIC los parmetros tienen mayor impacto en la medida
que el tamao muestral aumenta.
En Stata podemos calcular el AIC y BIC, para cada uno de los modelos siguiente, mediante
el comando de Stata que se escribe en el Do editor, estat ic (escriba el comando una vez que
realice la regresin respectiva):
Yi = 0 + 1 X1i + 2 X2i + 3 X3i + Ui
(modelo 1)
Model
Obs
ll(null)
ll(model)
df
AIC
BIC
12
-22.84941
-8.088206
22.17641
23.63113
Note:
La fig. anterior muestra los resultados del AIC y BIC para todas las variables de anlisis en
nuestro ejemplo (recuerde que usamos los datos de la tabla 5.1) incluidas en el modelo 1.
Estos resultados coinciden con los de la fig. 5.7 donde se ha suprimido la variable X2 (para
ello usamos la estimacin del modelo 2), tomemos en cuenta que esta variable tiene colinealidad
perfecta con X1, de modo que puede ser eliminada sin que cambien los resultados de las
estimaciones de BIC y AIC.
Para estimar el AIC y BIC del modelo 2, primero logremos la estimacin del Ln FV
relacionado con la expresin ll (model), mostrado en los resultados de Stata . Para dicha
estimacin se usan todos los parmetros del modelo. En el caso de este modelo tenemos:
Parmetros (K) = 3 y Datos (N)= 12.
En los resultados mostrados por Stata , tambin aparece el ll (null) esta es la estimacin
del LN FV slo para el parmetro 0 tambin llamado intercepto.
Yi = 0 + 1 X1i + 3 X3i + Ui
(modelo 2)
191
Model
Obs
ll(null)
ll(model)
df
AIC
BIC
12
-22.84941
-8.088206
22.17641
23.63113
Note:
El valor del LN FV (ll model) para el clculo de AIC del modelo 2, puede hallarse tambin del
siguiente modo:
Tabla 5.7 datos de Y estimado para el clculo del Ln FV del modelo
Y
2
3
4
4
5
6
5
6
6
6
7
8
Y'
2.7137078
3.1875834
3.661459
3.9680362
4.4419118
5.0830858
5.5569614
5.6962402
6.0028174
6.476693
7.4524638
7.759041
Total
( Y - Y' ) 2
0.509378824
0.035187532
0.114610009
0.001021685
0.311462439
0.84073165
0.310206001
0.092270016
7.93774E-06
0.227236216
0.20472349
0.05806124
2.704897039
mv =
2.70489704 / 12
192
Esto es el estimador de
=[
2 para
2 ] 0.5
(modelo 3)
Model
Obs
ll(null)
ll(model)
df
AIC
BIC
12
-22.84941
-8.755936
21.51187
22.48169
Note:
Para el modelo 3, se tiene: K = 2 y N = 12. En este caso hay que notar que el AIC y el BIC
han bajado de valor, lo que indica que el modelo donde X1 es explicativa tiene mejor poder de
prediccin que el modelo que usa X1 y X3 como explicativas.
Probemos ahora hallando el AIC y BIC del modelo 4, que se expresa a continuacin:
Yi = 0 + 3 X3i + Ui
(modelo 4)
193
Model
Obs
ll(null)
ll(model)
df
AIC
BIC
12
-22.84941
-8.227451
20.4549
21.42472
Note:
Finalmente en el modelo 4 se tiene: K = 2 y N = 12. Hay que notar que el AIC y el BIC han
bajado nuevamente de valor, lo que indica que el modelo que emplea a X3 como variable
explicativa tiene mejor poder de prediccin o ajuste que todos los modelos anteriores.
La idea que existe detrs del uso del AIC y el BIC, es que los modelos iniciales usando X2 y
X1 son con variables colineales, que no le aportan informacin al modelo, por ello los criterios de
Akaike y Shwarz se van reduciendo, hasta llegar a X3 que si aporta informacin con mayor ajuste
que las variables previamente utilizadas, dando una idea de la posible existencia de
multicolinealidad.
No olvidemos que el AIC y el BIC sirven, adems, para testear si el diseo del modelo es
ptimo no slo en nmero de variables, sino tambin en el tipo de variables que colocamos. Al
existir variables redundantes es muy probable que haya multicolinealidad.
Tamn: Tasa activa en moneda nacional para el Per (para crditos anuales)
intbs: Tasa interbancaria en soles para el Per
intbf: tasa interbancaria en moneda extranjera para el Per
Libor3m: Tasa de inters Libor a 3 meses (datos diarios en valor anual)
La lgica del modelo es que el tipo de cambio responde a los diferenciales de tasas de inters
entre la moneda local y la moneda extranjera. As mayores tasas locales de inters generan una
salida de fondos los cuales hacen que el tipo de cambio en dlares se reduzca y el tipo de
cambio en soles aumente, esto se conoce como la paridad de intereses.
Estimemos la regresin del modelo planteado:
Fig. 5.9 Regresin semestral para la variable dependiente Tipo de cambio venta en dlares
TCVf
Source
SS
df
MS
Number of obs =
F(
Model
.006374232
.001593558
Residual
.004465926
115
.000038834
Total
.010840158
TCVf
Coef.
Tamn
119
.000091094
4,
120
115) =
41.03
Prob > F
0.0000
R-squared
0.5880
Adj R-squared =
0.5737
Root MSE
.00623
Std. Err.
P>|t|
.0091061
.0021967
4.15
0.000
.0047548
.0134574
intbs
-.0181542
.0086193
-2.11
0.037
-.0352275
-.001081
intbf
-.0006434
.0004862
-1.32
0.188
-.0016065
.0003197
Libor3m
-.2022685
.1806032
-1.12
0.265
-.5600087
.1554717
_cons
.3710111
.0489487
7.58
0.000
.2740532
.4679689
195
10
.3
Libor3m
.28
.26
10
intbf
0
.26
.28
.3
196
Los resultados del modelo indican, que alzas del costo de la moneda local reflejados en la
Tamn generan entrada de fondos y una alza del TCVf (medido en dlares). Al revs se reduce el
valor de la moneda local en soles.
Alzas del intbs producen bajas del TCVf en este caso la variable se comporta al inverso de lo
esperado, una explicacin es que esta tasa rige principalmente para la gran empresa, alzas de
esta tasa reflejan una mayor demanda local de moneda extranjera (ante el mayor costo de la
moneda local) que impulsa al alza al tipo de cambio en soles y a la baja al tipo de cambio en
dlares.
En el caso de la intbf y la Libor3m, reflejan un comportamiento esperado en teora, as las
tasas en moneda extranjera suben y ello implica que los fondos se mueven del mercado local al
mercado externo, en este caso el valor de la moneda local en dlares baja y al revs, en trminos
de soles, sube.
Una forma de corregir el modelo que presenta una correlacin entre intbf y Libor3m de 0.71
(71%), es eliminar la variable que consideramos sospechosa del problema, sin embargo esta
quizs sea una solucin relativamente mala, por cuanto perdemos algo de informacin y ajuste,
veamos los resultados eliminando Libor3m, que es la de menor valor crtico t de Student.
La Fig. 5.11 indica que el ajuste del modelo es ahora 0.5835 ligeramente menor al modelo
previo, lo que indica que la variable eliminada incorporaba algo de informacin al modelo, el AIC
es ahora -874, ha variado muy poco respecto del valor inicial, sealando nuevamente que
eliminar Libor3m no ha sido la mejor solucin.
Este problema tambin se presenta, si en lugar de eliminar intbf eliminamos Libor3m, de
modo que eliminar variables parece una solucin fcil pero es irrelevante para el modelo.
En el caso de los coeficientes del modelo estimado, la variable intbf sigue siendo no
significativa, al igual que el modelo original, mientras que las dems variables son
estadsticamente vlidas.
197
Fig. 5.11 Regresin corregida semestral para la variable dependiente Tipo de cambio venta
en dlares TCVf
Source
SS
df
MS
Number of obs =
F(
Model
.006325522
.002108507
Residual
.004514636
116
.000038919
Total
TCVf
.010840158
Coef.
119
.000091094
Std. Err.
P>|t|
3,
120
116) =
54.18
Prob > F
0.0000
R-squared
0.5835
Adj R-squared =
0.5728
Root MSE
.00624
Tamn
.006901
.0009753
7.08
0.000
.0049694
.0088326
intbs
-.0174002
.0086024
-2.02
0.045
-.0344383
-.000362
intbf
-.0004467
.0004539
-0.98
0.327
-.0013457
.0004523
_cons
.3455068
.0433763
7.97
0.000
.2595946
.431419
198
Fig. 5.12 Regresin anual para la variable dependiente Tipo de cambio venta en dlares
TCVf
Source
SS
df
MS
Number of obs =
F(
Model
.032711126
.008177781
Residual
.006481266
208
.00003116
Total
.039192392
212
.00018487
TCVf
Coef.
Std. Err.
Tamn
.0129274
.0011908
intbs
-.0061514
intbf
-.0008158
Libor3m
_cons
4,
213
208) =
262.45
Prob > F
0.0000
R-squared
0.8346
Adj R-squared =
0.8314
Root MSE
.00558
P>|t|
10.86
0.000
.0105797
.015275
.0024608
-2.50
0.013
-.0110026
-.0013002
.0003467
-2.35
0.020
-.0014992
-.0001324
-.4741422
.0927275
-5.11
0.000
-.6569484
-.291336
.3357063
.0125277
26.80
0.000
.3110089
.3604038
199
El signo del parmetro del riesgo pas indica que si este sube, los fondos se van del pas,
sube el cambio en sol por dlar, pero medido en moneda extranjera (TCVf) baja, lo cual es una
respuesta esperada.
Fig. 5.13 Regresin anual para la variable dependiente TCVf incluyendo Riesgo pas
Source
SS
df
MS
Number of obs =
F(
5,
213
207) =
572.43
Model
.036549067
.007309813
Prob > F
0.0000
Residual
.002643325
207
.00001277
R-squared
0.9326
Adj R-squared =
0.9309
Total
.039192392
212
.00018487
Root MSE
.00357
TCVf
Coef.
Std. Err.
P>|t|
Tamn
.0059603
.0008618
6.92
0.000
.0042614
.0076593
intbs
.0006838
.0016239
0.42
0.674
-.0025177
.0038852
intbf
-.0003779
.0002233
-1.69
0.092
-.0008182
.0000624
Libor3m
-.2034508
.0613801
-3.31
0.001
-.324461
-.0824405
Rp
-.0002681
.0000155
-17.34
0.000
-.0002985
-.0002376
_cons
.3779431
.0083817
45.09
0.000
.3614187
.3944674
Para no perder la potencia de ajuste ganada, podemos ensayar otra forma de corregir los
modelos multicolineales, ello es transformando ligeramente las variables, para ello tomaremos
ahora la serie intbs y la pondremos en un perodo rezagado, es decir que estamos pensando que
el efecto de intbs se evidencia recin al siguiente da de producida su alza o baja.
Los resultados de esta regresin muestran un R2 de 0.93 (ligeramente menor al hallado
previamente) los valores de intbf e intbs (rezagado un perodo) no han mejorado el diseo o
efectividad del modelo.
Otras formas de ajuste es poner las variables al cuadrado, en este caso dado que intbs es
una tasa pequea comparada con la Tamn, entonces procedemos a elevarla al cuadrado para
potenciar su efecto, sin embargo los resultados de este ensayo no producen mejoras en el
200
modelo. El R2 sigue siendo de 0.93 y las variables intbs2 (al cuadrado) e intbf siguen siendo no
significativas.
Otra forma de modificar los resultados en presencia de multicolinealidad (o sospecha de esta)
es cambiar las variables que podran no aportar nada al modelo, en este caso son intbf e intbs,
con una nueva variable que en este caso es el riesgo pas, los resultados son los siguientes:
Fig. 5.13 Regresin anual para la variable dependiente TCVf con Riesgo pas sin intbf e intbs
Source
SS
df
MS
Number of obs =
F(
3,
213
209) =
948.45
Model
.036510565
.012170188
Prob > F
0.0000
Residual
.002681827
209
.000012832
R-squared
0.9316
Adj R-squared =
0.9306
Total
.039192392
212
.00018487
Root MSE
.00358
TCVf
Coef.
Tamn
Std. Err.
P>|t|
.0050525
.0006867
7.36
0.000
.0036987
.0064064
Libor3m
-.1529431
.0537147
-2.85
0.005
-.2588352
-.0470509
Rp
-.0002695
.0000149
-18.06
0.000
-.000299
-.0002401
_cons
.3803906
.0071104
53.50
0.000
.3663733
.394408
Como vemos el modelo tiene ahora un ajuste de 93.16% muy similar a los casos anterior y
mucho mejor al de la Fig. 5.12, el valor del AIC es ahora -1,790 mucho menor a todas las
estimaciones previas. Este modelo parece ser el de mejor poder explicativo de todos los
ejemplos previos.
Algunos otros criterios de solucin de la multicolinealidad pueden ser:
-
201
TCVfi - TCVfi, t-1= 0 + 1 ( Tamn1i - Tamn1i, t-1 )+ 2 ( intbs2i - intbs2i, t-1 )+ 3 ( interbf3i interbf3i, t-1 ) + 4 ( Libor3m4i - Libor3m4i, t-1 )+ Ui
Los resultados de este modelo en nuestro ejemplo fueron bastante bajos, el R2 apenas
lleg a 0.14 o 14%, esto puede indicar que las variaciones inmediatas del tipo de
cambio no se explican por las variaciones diarias de las distintas variables explicativas.
-
Otros criterios de solucin implican conocer de algn modo el valor que afecta
previamente la variable, pensemos por ejemplo que sabemos que por cada punto de
PBI la pobreza se reduce en 0.25%, entonces en modelos donde intervengan el PBI
per cpita y la pobreza, es mejor partir de ese criterio a priori. Si consideramos que la
desigualdad tiene que ver con el PBI per cpita y la pobreza, entonces podemos
estimar solamente el parmetro del PBI per cpita y luego sabemos que el otro
parmetro de pobreza tendr un efecto de 0.25.
Otra idea es hallar variables que reemplacen tanto al PBI per cpita como a la pobreza,
pero que a la vez se relacionan con ella sin perder su independencia, podemos usar
por ejemplo la tenencia de activos fsicos o biolgicos en el hogar, de modo que a ms
activos se tiene ms ingresos y menos pobreza, ello reduce la desigualdad y la
tenencia de activos se relaciona con las variables previas pero es de por s
independiente, ello es usar variables proxy y en otros casos se pueden usar las
denominadas variables instrumentales.
(i)
Donde:
X1i = Son los aos de estudio medido de modo continuo
X2i = Habilidad innata del individuo
Yi = El ingreso del individuo en logaritmos
202
(ii)
Donde:
ei = 2 X2i + Ui
A partir del modelo (ii) podemos estimar 1:
1 = x1i yi / x1i 2
Si el modelo (i) se expresa restndola de su media queda:
Yi Ym = yi = 1 ( X1i - X1m) + 2 ( X2i X2m) + ( Ui Um )
(iii)
203
Hay que considerar que los efectos no se producen en un solo perodo del pasado sino
tambin en diversos perodos previos por ejemplo:
Yi t = 11 Y1i, t-1+ 21 Y1i, t-2 + + n1 Y1i, t-n + 21 X1i, t-1+ 22 X1i, t-2 + + 2n X1i, t-n + U1i
Xi t = 13 Y1i, t-1+ 23 Y1i, t-2 + + n3 Y1i, t-n + 41 X1i, t-1+ 42 X1i, t-2 + + 4n X1i, t-n + U1i
Lo que finalmente se expresa del siguiente modo:
Yi t = i1 Y1i, t-1 + 2i X1i, t-1+ U1i
X i t = i3 Y1i, t-1 + 4i X1i, t-1+ U2i
Probar la causalidad de Granger (1969) requiere estimar el modelo anterior para cada
variable, en las siguientes condiciones:
Yi t = i1 Y1i, t-1 + U1i
(a)
(b)
Donde el modelo (a) nos dar una suma de residuos al cuadrado restringido (SRCr) mientras
que el modelo (b) nos dar una SRC no restringido (es decir usa todas las variables), esto lo
denominaremos SRCnr, se cumplir entonces lo siguiente:
F = [ (SRCr SCRnr) / R ] / [ SRCnr / (N K)
Donde:
R = equivale al nmero de rezagos de la variable Xij
K= Es el nmero de parmetros estimado en el modelo (b)
N= Es el nmero de datos empleado
Las estimaciones estn disponibles en los programas estadsticos, se requiere
adicionalmente conocer sobre ecuaciones simultneas de series de tiempo, aqu haremos un
ejemplo a priori considerando unos 5 rezagos de la variables intbf e intbs, tomando el modelo que
hemos usado en la seccin anterior. Note que los modelos (a) y (b) se estiman sin constante.
La idea es conocer si intbf (Xi) causa a intbs (Yi), de modo que podamos eliminar a una de
ellas y usar la otra en el modelo evitando as la multicolinealidad o al menos mejorando las
205
estimaciones realizadas; para esta previa causalidad consideramos que la tasas locales de
inters responden a las tasas internacionales de inters:
El modelo (a) nos arroja un SRCr = 3.43398847
El modelo (b) nos arroja un SRCnr = 3.43152284
R= 5
K = 10
N = 208 datos para el modelo empleado en la seccin anterior, 5 rezagos hacen perder datos.
F = [ 3.43398847 - 3.43152284 ] / 5 ] / [ 3.43152284 / 198 ]
F = 0.028
Este valor es bastante bajo para probar que es significativo, el valor de la tabla F es 2.26,
dado que no supera el valor crtico entonces se indica que la variable intbf no causa a intbs o
que la inclusin de la variable intbf en rezagos efectivamente afectan la regresin planteada.
Retomando el modelo (i) donde los aos de estudio y la habilidad afectan el ingreso del
individuo y considerando que la habilidad no observable supone estimar el modelo (ii), entonces
el uso de una variable instrumental, por ejemplo Zi, requiere cumplir necesariamente los
siguientes criterios:
Cov (Zi, ei ) = 0
Cov ( Zi, X1i) diferente de 0
En ese caso Zi es una variable instrumental a ser usada en lugar de X1i siendo la variable
instrumental de X1i, donde ei es el nivel de error.
Hay que notar que no debe darse covarianza positiva entre Zi y el error del modelo (ii), as
mismo debe darse una correlacin diferente de cero entre Zi y X1i (que se transforma en una
variable endgena, ya que es influida o causada por Zi.
El problema de usar variables instrumentales, es que necesariamente requiere pensar en una
variable independiente de X2i para estimar el modelo (i). En buena cuenta, si consideramos que
X1i son los aos de educacin, necesitamos una variable que se relacione con sta, pero que sea
independiente de la habilidad (X2i ).
206
La educacin de los padres del individuo, puede estar correlacionada con la habilidad
(X2i ) debido a que el individuo gana habilidades de acuerdo a lo que saben los padres.
El coeficiente intelectual del individuo, puede ser una variable interesante, pero no
necesariamente se relaciona con los aos de educacin formal del individuo, adems
est el hecho de la posibilidad de medicin y del sesgo de esta medicin (sin reparar lo
costoso que debe ser) que tiende a ser subjetiva o emplear diversos test psicolgicos.
Tambin hay que notar que el coeficiente intelectual puede predisponer a ganar ms
habilidades innatas, de modo que se da la correlacin con X2i, lo que invalidad el uso.
La zona donde naci el individuo, esto puede no estar correlacionado con la habilidad
pero tampoco se correlaciona con los aos de estudio, salvo que podamos sealar que
si la zona es ms alta entonces ms difcil ir a la escuela, con lo cual la variable podra
ser los metros sobre el nivel del mar donde vive el individuo y eso se correlaciona con
aos de estudio y puede ser independiente de la habilidad.
Otra variable puede ser la lejana al centro de estudios, as ms lejos supone menos
aos de educacin y esa lejana no tiene nada que ver con la habilidad, de modo que
puede ser una buena variable instrumental.
Otra variable puede ser la edad en que se es padre, si es una edad temprana entonces
menos aos de educacin, si es una edad mayor entonces hay ms aos de educacin
sin que ello se vincule con la habilidad.
Los ingresos de los padres, puede implicar una buena relacin con aos de estudios,
pero tambin se relaciona con la habilidad (ms ingresos es ms probable que se
adquieran ms habilidades)
Yi = 0 + 1 X1i + ei
Donde:
1 = Es el estimador de variable instrumental (VI)
Para demostrar las propiedades del estimador del parmetro de la VI, tomemos la estimacin
en promedios:
Yim = 0 + 1 X1i m
Si hallamos las desviaciones tenemos:
Yi - Yim = 1 ( X1i - X1i m ) + ei
yi = 1 x1i + ei
Donde:
1 = x1i yi / xi1 2
Note que x1i ha sido estimado con zi, de modo que el parmetro 1 de la VI es:
1 = zi yi / zi x1i
Si consideramos la estructura del modelo (i) que deseamos estimar, entonces reemplazamos
en la estimacin previa, todo en desviaciones respecto de la media:
yi = 1 x1i + 2 x2i + Ui
1 = zi [1 x1i + 2 x2i + Ui ] / zi x1i
1 = 1 zi x1i + zi [ 2 x2i + Ui ] / zi x1i
Ahora recuerde que:
ei = 2 X2i + Ui, que equivale a:
ei = 2 X2i + Ui
Donde los parmetros i equivalen a i, puesto que estamos haciendo estimaciones de los
modelos, ante la no observacin de la variable habilidad o tambin denominada X2i:
208
1 = 1 + zi ei / zi x1i
Lo que finalmente se expresa como:
1 = 1 + Cov ( Zi ei ) / Cov ( Zi x1i ) (iv)
De modo que para hallar el estimador correcto de la variable instrumental 1, se debe cumplir
que la covarianza (Cov) entre la variable Zi y el error del modelo (ii) debe ser cero y la covarianza
entre Zi y la variable X1i, debe ser diferente de cero, de modo que esas condiciones hacen
robusta la estimacin mediante la variable instrumental.
Podemos transformar la ecuacin (iv) en lo siguiente:
1 = 1 +
Correlacin ( Zi, ei ) /
209
210
Las variables instrumentales son complejas de hallar y deben cumplir las condiciones previas,
adems debe verificarse tambin que pueda existir causalidad entre esta y la variable a
reemplazar.
211
Preguntas de opinin
1. Si la demanda de dinero influye en la tasa de inflacin, as como la demanda
interna, Es este modelo un ejemplo donde usar variable instrumental?, Por
qu?
2. Qu variable instrumental puede usar para la demanda de dinero que cumpla
los criterios sealados en el tema?
3. Qu variable proxy se usa normalmente en lugar de la demanda de dinero, ser
colineal con la demanda interna?
4. Qu diferencias existen entre el AIC y el BIC?
5. Por qu un menor AIC supone que el modelo gana potencia?
212
Caso de aplicacin
Lectura previa
Tomando textualmente a Pasco Font et al (1999) se seala que:
La demanda de los servicios de telefona (en este caso las llamadas locales o servicio local y
de larga distancia hacia otras ciudades del pas y hacia ciudades localizadas en otros pases o
servicios de larga nacional e internacional) tiene algunas caractersticas no compartidas con la
demanda de la mayora de bienes o servicios, lo que usualmente dificulta su estimacin. En
particular, Taylor (1993) y Levy (1996), sugieren la existencia de cuatro aspectos: En primer
lugar, la demanda por el servicio de telefona est caracterizada por la existencia de una
externalidad al nivel de la red de usuarios. El acceso a la red no representa utilidad para un hogar
si los miembros de su grupo social o las empresas a las que compra no estn suscritos a la red.
Es decir, el acceso a los servicios de telefona es til en tanto otros individuos o empresas
tambin acceden a la red. En este sentido, cada vez que un hogar decide ser usuario de los
servicios genera una externalidad en los restantes hogares y empresas, por lo que el beneficio de
acceder a la red aumenta con el nmero de suscriptores.
En segundo lugar, existe una externalidad al nivel de las llamadas. Cada vez que un usuario
realiza una llamada, presumiblemente genera una externalidad en el receptor (los miembros de la
red estaran dispuestos a pagar una cantidad de dinero para tener la opcin de contestar las
llamadas). En esta perspectiva, la utilidad de los usuarios depende tambin del consumo de los
otros miembros de la red.
En tercer lugar, la demanda de servicios de telefona tiene un componente estocstico
importante. El patrn de llamadas de los individuos suele cambiar de manera importante ante la
ocurrencia de eventos no anticipados como son, por ejemplo, la enfermedad de un pariente o
amigo, el encuentro casual con otras personas, el acceso a nueva informacin, o la toma de una
decisin importante que modifique las necesidades de coordinacin con otras personas.
Finalmente, los tipos de llamada que efectan los miembros de un hogar son cualitativamente
distintos. Por ejemplo, existen diferencias entre una llamada a un familiar o amigo y una llamada
para averiguar la direccin de un establecimiento o para comprar una hamburguesa por telfono.
Es decir, existe heterogeneidad en los usos del servicio de telefona por lo que es necesario
hacer supuestos en la agregacin de las llamadas evitando, as, problemas con la definicin de la
demanda.
Las variables utilizadas en el estudio son el total de pasos del servicio local de telefona y el
total de minutos en el servicio de larga distancia consumidos mensualmente.
213
Este tipo de informacin a nivel del hogar es adecuado para los objetivos del estudio, de
relacionar el acceso a la red de telefona y el consumo de los servicios con las tarifas, el ingreso
familiar y, especialmente, con las caractersticas socioeconmicas de los hogares, Para capturar
esta heterogeneidad de las familias, en el estudio se asume la existencia de varios grupos de
consumo distintos los que se representan por los niveles socio econmicos.
En el estudio se asume una secuencia en las decisiones de los hogares. En un primer
momento, los hogares deciden suscribirse al servicio. Esta etapa del modelo es importante
porque permite relacionar la suscripcin al servicio con el costo de instalacin (en buena cuenta
si el hogar tiene mas beneficios que costos al optar el servicio en trminos econmicos o si
acceder a telefona tiene excedentes del consumidor mayores a los costos) y las caractersticas
socioeconmicas de las familias. Si bien no se observa el neto de tener el servicio, si se observa
el acceso al servicio o el no acceso al mismo.
Posteriormente, en un segundo momento, una vez que se ha accedido al servicio, los
hogares deciden el consumo de los servicios de telefona local, de larga distancia nacional y de
larga distancia internacional.
Tomado textualmente de Pasco Font et al (1999)
Preguntas
1. Qu variables tomara en cuenta para estimar la demanda de acceso al servicio
de telefona?
2. Qu variables tomara en cuenta para estimar la demanda de uso del servicio de
telefona, difieren del caso anterior?
3. Es posible encontrar multicolinealidad en sus modelos previos?, cmo corrige
esta falla?
214
Ejercicios
Si se maximiza una funcin de utilidad: U = X1 1 X2 2
Sujeto a la restriccin presupuestaria de I = P1 X1 + P2 X2, se obtiene una funcin de demanda
igual a:
Xi = i I / P i
Donde X es la cantidad demandada de bienes i. I es el ingreso del consumidor, P es el precio.
Entonces, con los siguientes datos:
T1
T2
T3
T4
T5
T6
T7
T8
T9
T10
P1
1.5
1.7
1.6
2.1
1.8
1.9
2.2
P2
0.5
0.4
0.3
0.3
0.2
0.25
0.28
0.3
0.27
0.24
X1
20
18
17
18
15
14
15
15
13
10
X2
10
11
12
14
16
10
10
14
16
Para cada bien, probar que la elasticidad precio, ingreso y cruzada son unitarias,
considerando que la elasticidad precio tiene signo negativo.
Hallar 1 y 2
Pruebe que entre Pi y el Ingreso existe colinealidad, que recomienda en este caso
215
Referencias bibliogrficas
Acemoglu, Daron y Johnson, Simon y James Robinson (2001) The colonial origins of comparative
development: an empirical investigation. American Economic Review, 91(5), p. 1369-1401.
Angrist, Joshua (1990) Lifetime Earnings and the Vietnam Era Draft Lottery: Evidence from Social
Security Administrative Records. American Economic Review, American Economic Association,
vol. 80(3), p. 313-36.
Angrist, Joshua y Alan Krueger (1991) Does Compulsory School Attendance Affect Schooling and
Earnings?. The Quarterly Journal of Economics, MIT Press, vol. 106(4), p. 979-1014.
Angrist, Joshua y Jorn-Steffen Pischke (2009) Mostly Harmless Econometrics. Princeton
University Press, Captulo 4.
Granger, C. (1969) Investigating causal relations by Econometrics models and cross spectral
Methods. Econometrica. Julio 1969. USA.
Greene, W. (2003) Econometric Analysis. Fifth Edition. Pearson Ed.
Gujarati, D. (2004) Econometra. 4ta Edic. Mc Graw Hill.
Jimnez, F. (2012) Elementos de teora y poltica macroeconmica para una economa abierta.
Fondo Editorial PUCP.
Johnston, J. and Dinardo, J. (1997) Econometric Methods. Fourth Edition. Mc Graw Hill
Levy, A. (1996). Semi-Parametric Estimation of Telecommunications Demand. Ph.D. Dissertation,
University of California at Berkeley.
Murray, Michael (2006) Avoiding invalid instruments and coping with weak instruments. Journal of
Economic Perspectives, 20(4), p. 111-132.
Novales, A. (1993) Econometra. Mc Graw Hill.
Pasco Font, A. Gallardo, J. Fry, V. (1999) La demanda residencial de servicios de telefona
bsica en el Per. OSIPTEL.
216
217
CAPTULO VI
Heterocedasticidad en
Modelos economtricos
218
Ahora analicemos los indicadores de varianza para cada pas, en el modelo hipottico siguiente:
Ahorro it = 0 + 1 Ingreso it + Uit
Realizando la estimacin usando los 20 datos, obtenemos lo siguiente para la varianza del
modelo general, igual a SCR / N-K, tambin obtenemos las varianzas para el uso de dos
muestras con slo 10 datos elegidos de modo aleatorio:
Tabla 6.1 Varianza del modelo Ahorro Ingreso hipottico
Pas
General
Muestra 1
Muestra 2
A!
B!
1.7774!
1.8707!
1.4082!
1.5702!
2.1479!
2.2087!
Como pueden notar en la tabla previa, las varianzas en todos los casos son cambiantes, esto
indica que las estimaciones realizadas al interno de cada muestra no logran aproximarse a la
poblacin, en buena cuenta hay mucha distancia entre el ahorro existente y sus estimaciones, la
figura siguiente muestra el error obtenido general para cada pas A o B:
Fig. 6.2 Error obtenido en el modelo Ingreso Ahorro por pas A y B
221
Como se puede ver en la figura previa, el nivel de error no tiene un valor esperado de cero o
una suma igual a cero, ello porque es cambiante y bastante oscilante, al no cumplir el criterio de
media cero, entonces es natural que la varianza no sea constante. Ahora ajustemos la serie de
tiempo a la figura siguiente:
Fig. 6.3 Modelo Ahorro modificado e ingresos datos hipotticos pases A y B
Podemos notar que el ingreso A y el ahorro se comportan de manera similar, mientras que el
ingreso B sigue siendo bastante cambiante aunque con cierta relacin con A, los resultados del
modelo economtrico modificado presentan una varianza de 0.3816 para el pas A y de 2.80 para
el pas B, confirmando que la varianza existente es mayor en el caso de los cambiantes datos de
ingresos del pas B.
Los niveles de error al cuadrado del modelo con el ahorro modificado (mostrados en la fig.
siguiente) indican claramente que el modelo no es aplicable para el pas B debido a su naturaleza
de alta varianza y es de mayor confiabilidad en el caso del pas A.
222
Fig. 6.4 Error cuadrtico del Modelo Ahorro modificado e ingresos pases A y B
Podemos tambin considerar si el error est asociado al ahorro o al ingreso, en ambos casos
tenemos:
Fig. 6.5 Error cuadrtico versus Ahorro (a) y versus Ingreso B (b)
(a)
(b)
223
La fig. previa en el caso (a) indica que no hay mucha relacin entre la varianza (error
cuadrtico) y el ahorro modificado, si retrocedemos podemos observar cierta relacin entre la
variable ingreso y ahorro, de modo que la varianza no se asocia con la variable dependiente.
Observando la figura (b) notamos que existe cierto comportamiento correlacionado
(positivamente) entre la varianza y el nivel de ingreso del pas B, en este caso la variabilidad de
las estimaciones del modelo suceden, por cuanto la variable explicativa es muy voltil o
cambiante.
Es posible entonces, en los modelos de series de tiempo, la presencia de problemas de
varianza no constante o heterocedasticidad debido a que la variable explicativa o tambin la
dependiente, presentan un alto grado de variacin de manera individual y sus estimaciones son
bastante alejadas del valor real o histrico.
En el caso de los modelos de corte transversal su estructura es la siguiente:
Yij = 0 + 1 Xij + Uij
Aqu se pueden tener i observaciones para cada grupo j de anlisis, en buena cuenta j
representa los estratos, segmentos o sub grupos dentro de la muestra empleada, mientras que i
son todos los elementos que existen dentro de ese grupo.
Consideremos por ejemplo la tabla siguiente, donde slo se entrevistan mujeres y se quiere
relacionar la cantidad de kilos de fruta consumida por semana con el peso en kilos de la
entrevistada, la idea es que si la entrevistada tiene ms peso, entonces su tendencia es a
consumir ms frutas, con fines de ajustar su peso.
Las mujeres entrevistadas tienen entre 20 a 25 aos de edad. El modelo para los datos de la
tabla sera el siguiente (id es el nmero de entrevistado):
Fruta ij = 0 + 1 Peso ij + Uij
(i)
224
Fruta
2
1
3
1
1
4
3
1
2
3
peso
45
65
76
55
52
75
85
48
49
61
Mujeres
id
1
2
3
4
5
6
7
8
9
10
Fruta
2
1
3
1
1
4
3
1
2
3
peso
45
65
76
55
52
75
85
48
49
61
id
11
12
13
14
15
16
17
18
19
20
fruta
2
1
1
1
3
1
2
1
1
2
peso
65
62
78
84
62
71
70
66
60
59
Usando los datos de la tabla anterior, la varianza del modelo previo resulta en 0.89899, lo
cual es mayor al obtenido slo con mujeres, evidenciando que conforme se van aadiendo
225
grupos, se va elevando el nivel de varianza, esto sucede siempre que los grupos aadidos sean
diferentes al estrato previo.
Hay que notar que el modelo incluyendo hombres, debe tener alguna forma de discriminar la
presencia de hombres y mujeres, en este caso es posible aadir la siguiente variable dicotmica
(D):
D= o si es mujer
D = 1 si es hombre
Con ello el modelo planteado queda del siguiente modo, el error ahora es eij:
Fruta ij = 0 + 1 Peso ij + 2 Dj + eij
(ii)
As si el entrevistado es mujer, entonces el modelo slo estima el parmetro para ese grupo
de datos, ya que 2 Dj sera igual a cero.
Si el entrevistado es hombre (D=1), entonces la estimacin quedara del siguiente modo:
Fruta ij = 0 + 1 Peso ij+ 2 + Uij
En este caso, la estimacin tienen un valor adicional equivalente a 2, con lo cual se corrige la
estimacin inicial que no considera la variable dicotmica.
Hay que notar que la presencia de la variable Dj reduce el nivel de error presente en el
modelo, en el modelo inicial el error era equivalente a:
Uij = eij + Dj
En el nuevo modelo el error es slo eij, con lo cual la varianza se reduce. Estimando el
modelo (i) la varianza finalmente result en 0.77896, mucho menor al modelo general que incluye
a los hombres y ligeramente mayor al modelo (i) que slo inclua mujeres.
Si bien se redujo el nivel de varianza del modelo final (ii) respecto al (i), de todos modos se
presenta mayor varianza conforme hay ms grupos heterogneos en la muestra, grafiquemos el
nivel de error cuadrtico de la estimacin inicial y final para darnos cuenta de los efectos:
226
Fig. 6.6 Error cuadrtico para el modelo Peso Fruta con mujeres y hombres
Como se ve en la fig. previa, el error cuadrtico del modelo slo con mujeres (error1cuad) es
mucho menor al que se tiene cuando se estima el modelo con los datos del grupo de hombres e
incluyendo la variable dicotmica, que se muestra como error2cuad.
Hay que notar adems que para los primeros 10 datos que son mujeres, la varianza del
modelo incluyendo hombres se parece mucho, ello porque la variable dicotmica es cero. En la
segunda parte de datos se incluyen los hombres, aqu la varianza del grupo de mujeres es
constante y la de los hombres eleva notoriamente el comportamiento previo con una mayor
oscilacin, evidenciando que el grupo es mucho ms heterogneo que las mujeres.
En la medida que se insertan nuevos grupos diferentes al anterior, la varianza ir subiendo en
las estimaciones economtricas que se realicen, sin embargo incrementar la cantidad de datos
en cada grupo puede reducir el nivel de varianza (esto supone que el tamao total de la muestra
se ampla). El efecto de una mayor cantidad de entrevistados por ejemplo, radica en que la media
ir convergiendo a la poblacional y con ello se ir reduciendo el nivel de error existente; adems
cada nuevo entrevistado adicional tender a parecerse al anterior, salvo que las unidades
muestrales o individuos sean muy diferentes an dentro del mismo sub grupo muestral, con lo
cual la muestra debera ser mucho ms grande an.
227
Para fines de diseo de un modelo transversal que pueda ser de menor varianza y tenga
estimaciones fiables, es importante que la poblacin sea correctamente representada en la
muestra, veamos el siguiente ejemplo:
Tabla 6.4 Datos para diseo muestral
Datos poblacionales
Hombres
Mujeres
Rural
Urbano
Distrito A
Distrito B
Distrito C
20 a 30 aos
31 a 40 aos
41 a 50 aos
51 a ms
Total (N)
Valor
45%
55%
25%
75%
10%
65%
25%
22%
26%
32%
20%
1,300,000
Pensemos que la poblacin de inters son 1.3 millones de individuos, todos ellos son lectores
de diarios (peridicos, matutinos o noticieros impresos), y se ha credo conveniente asumir que
compran diarios desde los 20 aos, queremos saber de esta poblacin, primero su estructura. La
tabla anterior resume las caractersticas de inters en el estudio a realizar, como son el gnero,
la zona de residencia, la geografa de residencia o densidad urbana rural y la edad.
Si queremos por ejemplo, estimar la demanda de diarios de tipo econmico, podramos
realizar una encuesta preguntando las motivaciones e intenciones en torno a leer un diario de
noticias o comentarios econmicos, para dicha encuesta necesitamos una muestra, a
continuacin la frmula para este clculo:
n = N Z2 PQ / [ ( N 1) e 2 + Z2 PQ ]
Donde:
N: tamao poblacional (slo la poblacin de inters)
228
Z: Nivel de confianza estandarizado en una distribucin normal, se asume 95% de confianza que
da un valor estndar de 1.96.
P: Poblacin que efectivamente comprar o estar interesada en el producto sujeto del estudio o
simplemente se asume 0.5 para maximizar la muestra, donde 0.5 indica que el 50% de la
poblacin estar interesada en lo que queremos vender o analizar.
Q: Es el complementario o inverso de P, es decir es 1-P
e: Nivel de error del estudio o diseo muestral, de cada 100 respuestas cuntas estarn fuera de
la media.
n: tamao de la muestra a estimar.
En el ejemplo anterior los resultados del tamao muestral se muestran a continuacin:
Tabla 6.5 Tamao muestral para diversos errores
Poblacin (N)
N homognea
N tpico
N Heterognea
Error
7%
5%
2%
Muestra
196
384
2397
Podemos observar que en el escenario tpico de aceptar un 5% de error, la muestra sale 384
entrevistados, sin embargo si consideramos que el pblico es muy parecido u homogneo,
podemos elevar el nivel de error a 7% con lo cual la muestra se reduce a 196 entrevistados.
Ahora si consideramos que e pblico es muy heterogneo (grupos muy diferentes entre s)
entonces es mejor reducir el nivel de error, en el ejemplo hemos pasado a un error de 2%, con lo
cual la muestra sale 2,397 entrevistados, como podemos concluir en esta parte, si se prev una
alta varianza, es mejor incrementar el tamao muestral.
Considere que trabajaremos con 384 entrevistas, reducir la varianza tambin implica conocer
la estructura de la muestra, la cual debe referirse exactamente a la poblacin:
229
Hombre
173
43
130
17
112
43
38
45
55
35
Mujer
211
53
158
21
137
53
46
55
68
42
Total
384
96
288
38
250
96
84
100
123
77
Como se puede ver en la tabla previa, la muestra equivale a 384 personas, que se distribuyen
por gnero, por densidad urbana rural, por distrito, por edades; esta distribucin permite reducir
los errores de concentrarnos en grupos poblacionales con la cual podemos generar varianzas de
mayor distorsin.
Un paso final es la seleccin aleatoria de hombres o mujeres, segn las dems
caractersticas que se indican en la tabla previa, la aleatoriedad es importante por cuanto reduce
el error por sesgo de seleccin que ya vimos en el tema anterior.
Series de tiempo con estacionalidades o con datos atpicos pueden ser causa de
varianza no constante o heterocedasticidad, por ejemplo piense un PBI que oscila entre
4 a 6% anual en los ltimos 40 aos y de pronto tiene una cada de -6%, con este dato
la varianza cambiar, la cada puede deberse a mltiples factores no manejables por el
investigador, en este caso es mejor retirar este dato, cuando se espera adems que las
condiciones econmicas en general hagan que el PBI vuelva a su nivel original. Ahora
si las cadas se mantienen, entonces hay que considerarlo, pues la varianza an
subiendo, refleja ya un comportamiento relevante en la economa, habr que corregir
231
de algn modo la estimacin. Este ejemplo tambin darse por ejemplo si queremos
explicar la captura de anchoveta y resulta que por un clima no previsto en otras partes
del mundo, la presencia del cardumen es alta y eleva la captura fuertemente, este dato
es atpico y es mejor retirarlo del modelo, considerando que la captura, pasado el
efecto no manejable, volver a su nivel.
-
Cuando se presenta varianza no constante, las estimaciones que realizamos en los modelos
economtricos tienden a cambiar, veamos el modelo simple siguiente:
Y i = 0 + 1 X i+ U i
Donde, expresado en desviaciones:
1 = xiyi / xi2
Ahora ya hemos estimado antes, la varianza de 1, la cual es como sigue:
232
Var 1 = E ( Zi ui) 2
Var 1 = E [ Z1 2 u1 2 + Z2 2 u2 2 + Z2 2 u3 2 + + Zn 2 un 2 + 2 Z1 Z2 u1 u2 + .+ 2 Zn-1 Zn un-1 un ]
Adems como vimos antes, el valor esperado E (ui uj) = E ( ui - E ui ) ( uj E uj) = E (ui * uj) = 0
La ecuacin de la varianza (Var) del parmetro, queda:
Var 1 =
( Zi 2 )
Donde Zi = xi / xi2
Var 1 =
xi 2 / (xi 2) 2
(1)
/ xi 2
= Ui 2 / N 2 = E Ui 2
Donde Ui = Yi - 0 - 1 Xi
Entonces podemos expresar la varianza como:
2
= (0 + 1 Xi+ Ui - 0 - 1 Xi ) 2 / N - 2
= - ( 0 - 0 ) (1 - 1 ) Xi + Ui )2 / N - 2
No olvide que (Um se considera cero, pero lo expresamos aqu), en el modelo poblacional
(para 0 ) Um es cero, entonces ambos estimados quedan:
0 = Y m - 1 X m + U m
233
0 = Ym - 1 Xm
Restando tenemos:
0 - 0 = - ( 1 - 1 ) X m + U m
Con lo que el modelo anterior queda:
2
= - [ - ( 1 - 1 ) Xm +Um ] (1 - 1 ) Xi + Ui )2 / N - 2
= ( 1 - 1 ) Xm - Um (1 - 1 ) Xi + Ui )2 / N - 2
= [ - ( 1 - 1 ) ( Xi - Xm ) + (Ui - Um) ] 2 / N 2
Donde la media de Ui es cero, todos los productos con Ui tambin resultarn cero y sin
considerar a (N - 2), entonces:
E
E
E
E
E
= [ - Var 1 xi 2 + E (Ui 2 - 2 Ui Um + Um 2 ]
= [ - Var 1 xi 2 + E Ui 2 + E Ui 2 / N ]
E
E
= [ - Var 1 xi 2 + ( N E Ui 2 + E Ui 2 ) / N ]
2
= [-
= [ - Var 1 xi 2 + ( N + 1) E Ui 2 / N ]
i
xi 2 / xi 2 + ( N + 1)
/N ]
(2)
234
y el valor de
E
=
i , si la estimacin contiene heterocedasticidad, entonces la varianza del modelo
resulta la expresin (2) calculada previamente y en ese caso la varianza del parmetro 1 es la
expresin mostrada en la ecuacin (1).
2
= 0* (A /
)+ 1* ( Xi /
) + Uij /
(3)
i)
Var Ui = E Ui 2 = E ( ui /
i)
Var Ui = E Ui 2 = ( 1 /
Var Ui = E Ui 2 = ( 1 /
i)
E ( ui ) 2
i)
Var Ui = 1
Con ello se tiene que la varianza del modelo (3) es constante, esta correccin empleada se
denomina normalmente mnimos cuadrados generalizados (MCG), donde la estimacin del
parmetro 1, sera la siguiente:
235
Ui 2 = ( Yi - 0 + 1 Xi + Ui ) 2
Ponderando el modelo tal como se hizo en la ecuacin (3) para establecer los mnimos
cuadrados generalizados, tenemos:
i Ui 2 = i ( Yi - 0 * + 1 * Xi + Ui ) 2
Donde:
i = ( 1 /
2)
Diferenciando e igualando a cero como se hizo para obtener los estimados de mnimos
cuadrados (MCO) ya realizados en captulos anteriores, tenemos:
i Yi = 0 * i + 1 * i Xi
i Xi Yi = 0 * i Xi + 1 * i Xi 2
Finalmente los parmetros 0 * y 1 * quedan:
Ym * - 1 * Xm * = 0 *
Donde:
Ym * = Ym i / i
Xm * = Xm i / i
i Xi Yi = [ ( i Yi - 1 * i Xi ) / i ] * i Xi + 1 * i Xi 2
i Xi Yi = [ i Yi i Xi - 1 * i Xi i Xi ] / i + 1 * i Xi 2
i Xi Yi - i Yi i Xi / i = 1 * [ i Xi 2 - ( i Xi) 2 / i ]
i i Xi Yi - i Yi i Xi = 1 * i [ i Xi 2 - ( i Xi) 2 / i ]
i i Xi Yi - i Yi i Xi = 1 * [ i i Xi 2 - ( i Xi) 2 ]
[ i i Xi Yi - i Yi i Xi ] / [ i i Xi 2 - ( i Xi) 2 ] = 1 *
236
Bajo el criterio del modelo de mnimos cuadrados generalizados (MCG), la varianza del
parmetro 1 *, queda del siguiente modo:
Var 1 * = i 2
Zi 2
Donde:
Zi 2 = [ i i Xi 2 - ( i Xi) 2 ] / [ i i Xi 2 - ( i Xi) 2 ] 2
Finalmente tenemos:
Var 1 * = i 2
/ [ i i Xi 2 - ( i Xi) 2 ]
Var 1 = i / [ i i Xi 2 - ( i Xi) 2 ]
Como podemos ver la estimacin de la varianza de 1 por MCG es una valor ponderado, note
en el denominador que se pondera las sumatorias de la variable independiente, mientras que en
MCO no existen esas ponderaciones, lo cual tiende a diferenciar ambas estimaciones. Si
tenemos que i (varianza homocedstica) es una constante entonces podemos determinar que la
varianza del modelo con MCG es equivalente a MCO:
Var 1 * = N / [ N Xi 2 - 2 ( Xi) 2 ]
Var 1 * = N / [ N 2 Xi 2 - 2 ( Xi) 2 ]
Var 1 * = N / 2 [ N Xi 2 - ( Xi) 2 ]
Var 1 * = N / [ N Xi 2 - ( Xi) 2 ]
Var 1 * = N
Var 1 * =
Var 1 * =
/ [ N X i 2 - ( X i) 2 ]
/ [ X i 2 - ( X i) 2 / N ]
2
/ [ Xi 2 - Xi Xm ]
Var 1 * = Var 1 =
/ xi 2
237
Finalmente hay que sealar que la estimacin con MCG brinda estimadores con varianza
constante, lo cual hace que los parmetros sean de mayor potencia y tambin son insesgados.
Detectar la heterocedasticidad requiere analizar el comportamiento de los errores al
cuadrado, una primera seal es la mostrada en las figuras 6.5 (a) y (b), donde (b) muestra una
cierta relacin con la variable independiente. Entonces una primera seal de heterocedasticidad,
es que las variables independientes o dependientes no tienen relacin alguna con el error al
cuadrado.
Para el uso de la tcnica grfica, consideremos el modelo (ii) ya realizado antes:
Fruta ij = 0 + 1 Peso ij + 2 Dj + eij
(ii)
SS
df
MS
Number of obs =
F(
2,
20
17) =
2.54
Model
3.95766652
1.97883326
Prob > F
0.1083
Residual
13.2423335
17
.778960793
R-squared
0.2301
Adj R-squared =
0.1395
Total
17.2
19
.905263158
Root MSE
.88259
fruta1
Coef.
peso1
Std. Err.
P>|t|
.0306487
.0184152
1.66
0.114
-.0082041
.0695014
-.8022812
.4129943
-1.94
0.069
-1.673623
.0690605
_cons
.2273661
1.159269
0.20
0.847
-2.218479
2.673211
Ahora graficaremos el error cuadrtico obtenido en el modelo anterior, contra las variables
dependiente e independiente lo cual se muestra a continuacin:
238
Es probable que la Fig, 6.8 indique la presencia de heterocedasticidad dada la relacin entre
el error cuadrtico y la variable dependiente, mientras que los datos de la Fig. 6.9 no indican
presencia de heterocedasticidad.
Fig. 6.9 Error cuadrtico versus Peso
239
Una segunda forma de detectar este problema, implica realizar algunas pruebas previas, las
ms conocidas plantean siempre relaciones estadsticas entre el error cuadrtico y las variables
existentes.
Park (1966) propone la siguiente prueba, conocida como test de Park (donde e* es el error del
modelo planteado por Park):
Ln
2=
Ln
2+
Ln eij 2 = Ln
2+
1 Ln Xi + e*i
1 Ln Xi + e*i
Ln eij 2 = 0 + 1 Ln Xi + e*i
En este test, la presencia de heterocedasticidad se relaciona con la significancia del
parmetro 1, para hallar esta estimacin, primero obtenemos los errores del modelo (ii) o
modelo original ya planteado y luego se procede a estimar la regresin respectiva, de acuerdo
con ello los resultados son los siguientes:
Fig. 6.10 Test de Park
. reg lnerror2 lnpeso
Source
SS
df
MS
Number of obs =
F(
Model
.051306844
.051306844
Residual
28.0326955
18
1.55737197
1,
20
18) =
0.03
Prob > F
0.8580
R-squared
0.0018
lnerror2
28.0840023
Coef.
19
1.47810539
Std. Err.
Root MSE
P>|t|
1.2479
lnpeso
.2862508
1.577086
0.18
0.858
-3.027083
3.599585
_cons
-2.198639
6.550322
-0.34
0.741
-15.96036
11.56308
240
Como evidencia el test de Park mostrado en la regresin previa, el ajuste del modelo es de
0.1% y el valor t de Student para la variable lnpeso (independiente) es de 0.18, lo cual no es
significativo, con ello descartamos la presencia de heterocedasticidad.
Otra prueba empleada en la deteccin de heterocedasticidad es la prueba de Breusch Pagan (1979) y Godfrey (1978), en este caso primero se plantea el modelo respectivo o modelo
original:
Fruta ij = 0 + 1 Peso ij + 2 Dj + eij
De este modelo se obtiene la varianza del mismo, bajo el criterio de mxima verosimilitud, es
decir empleado la frmula siguiente ya estimada antes (donde Ui es el error del modelo que se
estime inicialmente o el modelo original):
mv
= Ui 2 / N
Con ese valor se obtienen los errores cuadrticos corregidos, los cuales se expresan del
siguiente modo:
e i = e i 2 /
Apliquemos el test de Breusch - Pagan (1979) y Godfrey (1978) para el modelo peso fruta (ii)
usado de ejemplo, primero la varianza (con verosimilitud) resulta:
mv
= 13.2423335 / 20 = 0.6621
Ahora corremos la regresin con el error cuadrado ajustado, (ei ) los resultados son:
241
SS
df
MS
Number of obs =
F(
Model
.286924009
.286924009
Residual
23.1487013
18
1.28603896
1,
20
18) =
0.22
Prob > F
0.6424
R-squared
0.0122
23.4356253
errorajus
Coef.
peso1
_cons
19
1.23345396
Root MSE
1.134
Std. Err.
P>|t|
.0106815
.0226139
0.47
0.642
-.0368285
.0581915
.3121122
1.478247
0.21
0.835
-2.793568
3.417793
El valor de SCE hallado para este test, debe evaluarse en una distribucin chi cuadrado con 1
variable explicativa o 1 grado de libertad (los grados de libertad equivalen al nmero de variables
independientes). Para el 5% de confianza, el valor de la distribucin chi cuadrado es 3.8414, de
modo que el valor hallado de 0.14 no supera el valor de la distribucin esto significa que su
varianza es menor del punto mximo, lo que indica la no existencia de heterocedasticidad.
Si el valor SCE del test, supera al valor de la distribucin chi cuadrado, entonces la varianza
supera el mnimo establecido y es heterocedstica.
Otro test muy usado es la prueba de White (1980), mediante esta prueba se relacionan los
errores cuadrticos del modelo original con las variables explicativas en la forma siguiente:
Yi = 0 + 1 X1 + 2 X2 + Ui
242
U i 2 = a0 + a1 X1 + a2 X2 + a3 X1 2 + a4 X2 2 + a5 X1 X2 + vi
De la regresin previa se obtiene el valor de R2, con el cual se construye el siguiente
indicador:
NR2
El valor anterior NR2, sigue una distribucin chi cuadrado, de modo que si supera el valor de
la distribucin al 5% existe heterocedasticidad. En este caso el R2 es bastante alto, de modo que
la relacin entre el error cuadrtico y las variables explicativas es alto, presentndose
heterocedasticidad.
Si el valor R2 es bajo no se tienen mayores relaciones entre el error cuadrtico y las variables
explicativas, lo que indica que no existe heterocedasticidad, el indicador de varianza NR2 no
supera entonces el valor de la distribucin chi cuadrado. Considere siempre que existen grados
de libertad equivalentes al nmero de variables independientes.
Apliquemos el test de White para el ejemplo usado, los resultados son:
Fig. 6.12 Prueba de White
. reg error2cuad peso
Source
SS
df
MS
Number of obs =
F(
Model
.125787053
.125787053
Residual
10.1483557
18
.56379754
1,
20
18) =
0.22
Prob > F
0.6424
R-squared
0.0122
10.2741428
error2cuad
Coef.
peso1
_cons
19
.540744357
Root MSE
.75086
Std. Err.
P>|t|
.0070724
.014973
0.47
0.642
-.0243848
.0385296
.2066547
.9787717
0.21
0.835
-1.849668
2.262978
243
correlacionado con X 2
Dado que necesitamos la desviacin del modelo, esta puede aproximarse del siguiente modo:
correlacionado con X
En caso la varianza del modelo se correlacione con X, entonces la desviacin puede
plantearse del siguiente modo:
correlacionado con X 0.5
Si la relacin entre la varianza y la variable dependiente estimada existe, tal como vimos
antes, esto puede plantearse as:
correlacionado con Y
correlacionado con Y 0.5
244
Entonces un paso previo para corregir la heterocedasticidad puede ser graficar el error
cuadrtico contra la variable dependiente o independiente y elegir la variable donde ms
correlacione, otra es usar los clculos de correlacin entre variables.
Para aplicar las correlaciones empleamos el ejemplo previo del peso y consumo de fruta,
primero veamos el modelo respectivo y luego las correlaciones, siempre usando el modelo (ii):
Fruta ij = 0 + 1 Peso ij + 2 Dj + eij
Error 2 vs Peso =
Error 2 vs Fruta =
error 2 vs Peso 2 =
Error 2 vs Fruta 2 =
(ii)
0.110648409
0.372621576
0.088780417
0.449366471
Como puede verse, la correlacin ms grande entre el error y la variable, se presenta con
Fruta 2 (que es la variable dependiente), dada la relacin cuadrtica, entonces la desviacin
implica lo siguiente:
correlacionado con Y
Con lo cual el modelo (ii) se puede estimar del siguiente modo:
Fruta ij / Y = 0 * (1 / Y ) + 1 * ( Peso ij / Y ) + 2 * ( Dj / Y ) + ( eij / Y )
(iii)
Hay que notar que el modelo (iii) se estima sin constante, para poder as obtener el valor del
parmetro 0*, ya que (1 / Y ) se transforma en una variable.
Los resultados del modelo estimado se muestran en la Fig. siguiente:
Donde:
Ye, es la estimacin Fruta / Y
Yinv, equivale a 1 / Y
Xe, equivale a Peso / Y
De, equivale a la variable D / Y.
245
SS
df
MS
Number of obs =
F(
Model
20.6849782
6.89499272
Residual
4.36247099
17
.25661594
Total
25.0474491
Ye
Coef.
Yinv
20
1.25237246
3,
20
17) =
26.87
Prob > F
0.0000
R-squared
0.8258
Adj R-squared =
0.7951
Root MSE
.50657
Std. Err.
P>|t|
.911444
1.268191
0.72
0.482
-1.764206
3.587094
Xe
.0170468
.0216428
0.79
0.442
-.0286155
.0627091
De
-.4616473
.4402641
-1.05
0.309
-1.390523
.4672287
Hay que notar que el modelo no tiene constante de modo que para obtener este valor, basta
con establecer la siguiente ecuacin:
0* [ 1 / Y ] Y = 0.91444
En el caso del valor que tiene la constante, se debe a que la varianza resultante del modelo,
genera que la estimacin por MCG tenga diferencias respecto del modelo (ii) original, as el
estimador 0* difiere del 0 hallado originalmente con MCO.
En el caso de los parmetros de las variables explicativas, si multiplicamos 1 * Y y sacamos
la media de esta estimacin, obtenemos con muy escasas diferencias, el estimador 1 y 2 del
modelo original (ii):
1 = ( 0.0170468 * Y ) / 20 = 0.0306
2 = ( -0.4616473 * Y ) / 20 = - 0.8
246
Una vez comprobada que el modelo MCG corrige los parmetros hay que notar que la
varianza del modelo ha cambiado, pas de 0.7789 en el original de MCO a 0.2566 en el modelo
por MCG. Dado que en nuestro ejemplo no existe heterocedasticidad, al corregirlo en la prctica
estamos variando el error estndar de cada parmetro.
En el caso de la variable explicativa denominada Peso en el modelo MCO y Xe en modelo
MCG, el error estndar pas de 0.0184 a 0.0216, la tasa de cambio ha sido pequea, las
varianzas son bastante parecidas, 0.00034 en el caso MCO y 0.00047 en el caso MCG, ello se
debe a la no presencia de heterocedasticidad, en el caso de que el modelo (iii) original hubiera
sido heterocedstico, la correccin por MCG hubiera generado menores errores estndar.
La correccin por MCG debera mejorar la prueba t de Student, siempre que el modelo inicial
presente la varianza no constante.
La estimacin por MCG nos dara parmetros con varianza constante, que seran en caso de
presencia heterocedstica, los resultados mostrados en la Fig. 6.13 anterior.
En el caso de que la varianza sea conocida, se puede aplicar directamente al modelo la
estimacin por MCG ya planteada antes en la ecuacin (3) donde A=1:
Yi /
= 0 (A /
)+ 1 ( Xi /
) + Uij /
(3)
La varianza conocida se refiere a que conocemos las desviaciones existentes dentro de cada
sub muestra o grupos que conforman la muestra de anlisis.
Por ejemplo, si analizamos la rentabilidad de los bancos, cajas municipales, cajas rurales y
otras entidades financieras en funcin al tamao o volumen crediticio, podemos hallar las
varianzas al interno de cada subgrupo, es decir la varianza en el grupo de bancos, luego la
varianza en cajas y etc, esta vendra a ser la varianza conocida del modelo.
Para ejemplificar el uso de la varianza conocida, tomemos este ejemplo de Gujarati (2004),
donde el modelo a plantear sera el siguiente:
Rotacin promedio = 0 + 1 Tamao + eij
247
Tabla 6.7 Datos trimestrales para rotacin de activos segn rango de tamao de activos
Rotacin de activos promedio por empresa (1) segn Tamao de
activos
(mills de soles)
Ao /
100 a
250 a
1000 a
Rango *
Trim
!
1 a 10 10 a 25 25 a 50 50 a 100
250
1000
+
1
1
6.696 6.929
6.858
6.966
7.819
7.557
7.860
2
6.826 7.311
7.299
7.081
7.907
7.685
7.351
3
6.338 7.035
7.082
7.145
7.691
7.309
7.088
4
6.272 6.265
6.874
6.485
6.778
7.120
6.765
2
1
6.692 6.236
7.101
7.060
7.104
7.584
6.717
2
6.818 7.010
7.719
7.009
8.064
7.457
7.280
3
6.783 6.934
7.182
6.923
7.784
7.142
6.619
4
6.779 6.988
6.531
7.146
7.279
6.928
6.919
3
1
7.291 7.428
7.272
7.571
7.583
7.053
6.630
2
7.766 9.071
7.818
8.692
8.608
7.571
6.805
3
7.733 8.357
8.090
8.357
7.680
7.654
6.772
4
8.316 7.621
7.766
7.867
7.666
7.380
7.072
Fuente: Basado en Gujarati (2004)
* El rango no es abierto, la categora dos va de 10.01 a 25 millones y as en cada caso
En buena cuenta, el tamao de las empresas puede influenciar en la rotacin de activos, que
normalmente se mide como Ventas / Activos, la rotacin es un indicador importante para medir la
productividad de la empresa y es un componente de la rentabilidad sobre activos.
En este modelo tomamos el tamao promedio para cada grupo de activos, ello para realizar
una regresin del modo ms simple posible y ejemplificar el proceso de estimacin.
La variable Tamao ser categrica e ir de 1 a 7, donde 1 corresponde al tamao de 1 a 10
millones y 7 corresponde al tamao de 1000 millones a ms.
Con base a lo anterior, el modelo finalmente usa los datos siguientes:
248
1 a 10
7.026
1
10 a 25
7.265
2
25 a 50
7.299
3
SS
df
MS
Number of obs =
F(
1,
5) =
0.13
Model
.007736167
.007736167
Prob > F
0.7355
Residual
.303023776
.060604755
R-squared
0.0249
Total
.310759942
.051793324
Rotacion
Coef.
Std. Err.
Root MSE
.24618
P>|t|
Tamao
.016622
.0465237
0.36
0.735
-.102971
.136215
_cons
7.215298
.2080604
34.68
0.000
6.680461
7.750134
El modelo anterior tiene un ajuste de 2.5%, con una varianza de 0.0606 y los parmetros no
son significativos.
Ahora consideremos que existe heterocedasticidad (puede probarse la misma con los test ya
sealados antes), entonces para estimar el modelo por MCG se requiere hallar la desviacin
estndar, los resultados son los siguientes:
249
1 a 10
0.62
11.31
1.61
1.61
10 a 25
0.80
9.05
1.25
2.49
250 a
1000
0.26
28.75
3.90
23.41
1000 a
+
0.37
19.14
2.74
19.17
Donde la desviacin estndar calculada corresponde a cada grupo de datos de la tabla 6.7,
as la desviacin de 0.62, equivale a la desviacin estndar de la rotacin trimestral para el
tamao 1 de activos (1 a 10 millones), el calculo de la desviacin se puede hacer con el comando
= desvest ( ) de Excel .
Con los resultados previos, el modelo por MCG es el siguiente:
Rotacin promedio /
= 0 * ( 1 /
) + 1 * ( Tamao /
) + ( eij /
Las variables para correr este modelo estn en la tabla 6.9, la regresin por MCG se hace sin
constante y los resultados se muestran en la Fig. siguiente. Como puede notarse la varianza del
MCG ha pasado a ser 0.12187, ligeramente mayor lo que evidencia la no presencia de
heterocedasticidad por cuanto la varianza no se redujo.
El error estndar de la variable Tamao para el modelo inicial por MCO es 0.0465, mientras
que con MCG el error estndar de Tamao / i, es 0.037, la cual es menor debido a que al
ponderar la variable, hemos reducido el efecto de la varianza no constante.
La prueba t de Student para la variable tamao mejor notoriamente entre el modelo con
MCO y el modelo con ponderaciones o MCG.
250
Fig. 6.15 Regresin MCG o MC Ponderados para la rotacin versus tamao de activos
. reg Rotacion1 desv_inv Tamano1, noconstant
Source
SS
df
MS
Number of obs =
F(
2,
4) = 6909.50
Model
1684.14024
842.070122
Prob > F
0.0000
Residual
.48748545
.121871362
R-squared
0.9997
Adj R-squared =
0.9996
Total
1684.62773
280.771288
Std. Err.
Root MSE
P>|t|
.3491
Rotacion1
Coef.
desv_inv
7.118227
.1838038
38.73
0.000
6.607905
7.628548
Tamano1
.0539352
.0373373
1.44
0.222
-.0497297
.1576002
Hay que indicar que el efecto del tamao sobre la rotacin de activos es de 0.0539, para el
caso de las variables ponderadas, el efecto es mayor a la estimacin inicial de 0.0166, ello
debido a que elimina el sesgo de varianza no constante.
Finalmente si la ponderacin fuera realizada con la variable X (para el caso que no se
conozca la varianza), el modelo original quedara:
Rotacin promedio / Tamao = 0 * (1 / tamao) + 1 (Tamao / Tamao) + eij
Rotacin promedio / Tamao = 0 * (1 / tamao) + 1 + eij
El modelo anterior debe estimarse mediante una regresin donde se incluya el intercepto, el
valor del intercepto ser el estimador de 1 sin el efecto de heterocedasticidad.
251
Preguntas de opinin
1. Por qu en una serie de tiempo es menos probable que haya
heterocedasticidad?
2. La heterocedasticidad puede darse por sesgo de seleccin? Explique.
3. La varianza del modelo heterocedstico relacionada con X en la prctica qu
implicancia tiene?
4. Explique Por qu la varianza podra no ser conocida en caso de
heterocedasticidad?
5. Cmo se relacionan entre s, los test de deteccin de heterocedasticidad aqu
estudiados?
253
Caso de aplicacin
Lectura previa
Tomando textualmente a Amors (2009):
En el Per, como en otros pases, la oferta de microcrdito con fines de lucha contra pobreza,
se ubica generalmente dentro de la estructura de organizaciones no gubernamentales (ONG);
otras modalidades de financiamiento son de aquellas entidades que sostienen el autoempleo de
sus miembros y se denomina generalmente Cooperativas de Ahorro y Crdito, un paso ms
adelante y ya en la esfera de las microfinanzas; se encuentran aquellas orientadas al crdito a
microempresas como las Entidades de Desarrollo de la Microempresa (EDPYME) y en una
escala de mayor desarrollo con crditos hacia la micro y pequea empresa, adems de cumplir
diversas funciones de la banca comercial se encuentra las Cajas Rurales y Cajas Municipales
(Jansson, 2001).
Dado que el mercado crediticio no es restringido al accionar de una entidad especfica, es
posible encontrar compitiendo en el mismo mercado a las cooperativas de crdito, edpymes,
cajas rurales, cajas municipales, bancos especializados en pequea empresa y banca comercial,
de modo que todas estas entidades encajan en la idea de microfinanzas. Esto supone una oferta
de crdito orientada a las necesidades empresariales antes que personales, cuyo fin es
bsicamente la expansin de las operaciones de la empresa mediante el financiamiento
especializado (Jansson, 2003).
Copa et al (1995) seala adems que la oferta de financiamiento hacia la pequea empresa
peruana, tambin ha pasado por alianzas entre bancos tradicionales y ONGs, estableciendo una
tecnologa crediticia externa al banco, es decir el seguimiento y seleccin lo hacen las ONG y el
banco comercial acta como financiador (similar a la banca de segundo piso) en este caso el
riesgo se comparte entre ambas entidades y el repago es mayor dado la vigilancia permanente
de las ONG; que adems despliegan en la zona mltiples actividades no slo de crdito, sino
ayuda social en general.
El sistema de microfinanzas tiene algunas diferencias con la banca comercial, una de ellas es
que las entidades de microfinanzas no cumplen todas las funciones que la banca realiza, esto
debido a criterios regulatorios. Otra diferencia notoria son las tasas de inters cobradas, las
mismas que superan en gran medida el inters cobrado por la banca. Copa et al (1995)
manifiestan que este podra ser un aspecto positivo, ya que la pequea empresa peruana al
financiarse a altas tasas de prestamistas informales, en realidad no tienen mucha sensibilidad al
precio y ello ayudara a la entrada de entidades de microfinanzas a tasas relativamente altas pero
254
menores a los crditos informales; permitiendo de ese modo cubrir los altos costos de monitoreo
o vigilancia del repago, dado que el seguimiento efectuado por las entidades de microfinanzas al
crdito, es personal y continuo.
En otros casos la vigilancia del repago, se ayuda de crditos solidarios o grupales, aspecto
an presente en las realidades rurales; pero en los mbitos de la microempresa urbana, el crdito
es una actividad personal y por ende costosa de seguir, sobre todo cuando los montos son
pequeos, en ese caso la nica forma de rentabilizar a los ofertantes es sostener altas tasas de
inters (Banerjee, 2002).
En el mercado de microfinanzas hay caractersticas que permiten su separacin de los
mercados bancarios tradicionales, Chong y Schroht (1998) sealan que los clientes de
microfinanzas por lo general carecen de colateral, que la informacin respecto del historial
crediticio es limitada; que existen problemas de seleccin adversa por informacin asimtrica. Es
decir que la probabilidad de prestarle dinero a un cliente con problemas de repago, con riesgos
elevados o conducta dudosa; es alta ante ausencias de informacin pasada del cliente, riesgos
que actualmente se han reducido ante la expansin de las centrales de riesgo y la mayor
penetracin del mercado, cambios que se han dado continuamente desde finales de los aos 90.
Otros factores que diferencian el mercado microfinanciero se relacionan con el seguimiento ms
costoso, ventajas que dispone la banca comercial al contar con clientes ms grandes o mejor
conectados al mercado financiero. El mercado microfinanciero tambin tiene aspectos
culturalmente aceptados, como la permanencia de crdito subsidiado del estado o de ONGs
(aspecto muy reducido en los mercados urbanos) y la falta de ahorro de los hogares pobres. Sin
embargo este ltimo argumento de los autores es un tema debatible, toda vez que el ahorro en
las microfinanzas tiende a ser creciente en los ltimos aos.
Investigaciones relacionadas a las microfinanzas tienden a especificar el financiamiento a
partir del gnero, en este sentido Yunus (2006) seala el abierto nfasis de brindar crdito a
mujeres, considerando que ello permite una elevacin de ingresos en la familia y la generacin
de ahorros que puede hacer sostenible el proceso de intermediacin.
Stiglitz y Weiss (1981) sealan tambin, que subir la tasa de inters, eleva la probabilidad de
que los clientes asuman proyectos ms riesgosos y por ende generan problemas de pago, este
aspecto conocido como riesgo moral, es algo que los mercados en competencia generalmente no
tienen, por ello en estas condiciones, la oferta se raciona o restringe y se equilibra en contextos
de exceso de demanda, discriminando a los demandantes.
De acuerdo a lo anterior, Tenjo (2002) hace algunas relaciones con el mercado crediticio
colombiano, encontrando que el comportamiento de la banca comercial sigue el esquema de
racionamiento a tasas diferenciadas entre clientes, es decir la decisin bancaria no es por el
255
proyecto en cuestin rentable, sino por evaluaciones hechas a la empresa, de este modo se
encuentran los clientes racionados y las tasas ms altas o las que corresponden a mayores
riesgos del cliente (no el proyecto) no acceden al crdito.
No obstante esta premisa debe ajustarse, dado que las entidades de microfinanzas entran
con xito en mercados tradicionalmente racionados. Para ello Chong y Schroth (1998) aaden el
aspecto de la reputacin, algo similar a la incidencia cultural del pago ya sealada antes. Un
cliente deudor que paga sus crditos a tiempo, genera una reputacin buena y en la siguiente
oportunidad incrementa su crdito.
La persistencia de los riesgos de repago en los clientes de microfinanzas, han sido
analizadas por De Morais (2005). El autor manifiesta la mltiple segmentacin que recibe el
pequeo empresario, ya que recibe financiamiento de acuerdo al tamao que posee, las
garantas que puede exhibir o las relaciones que logre entablar con la banca. En todos los casos
an cuando pueda ser segmentado en el tamao del crdito, el pequeo empresario siempre
asume altas tasas de inters, producto de la elevada percepcin de riesgo y las malas
condiciones de acceso a la informacin de la empresa en el contexto brasileo. Esta condicin
final se ve mejorada en los ltimos aos, por la generacin de credit scoring (calificacin y
ranking crediticio por entidad) en la central de riesgo manejada por el Banco Central Brasileo. El
autor seala tambin, que las principales limitantes para el acceso al crdito en el caso brasileo,
se relacionan con la ausencia de registros contables fiables, con la escasa informacin
relacionada a las prcticas gerenciales de los pequeos empresarios, la alta mortalidad de las
micro y pequeas empresas, lo cual limita el crdito hacia el muy corto plazo o se raciona el
crdito ante poca garanta de desempeo futuro. Otros factores son la informalidad de los
pequeos negocios, los altos costos en la recuperacin de activos brindados como garantas
(costos judiciales o administrativos) y finalmente, el acceso se ve limitado por la exigencia de
garantas reales o bienes que sustenten la posibilidad de repago.
En el caso de la segmentacin de pequeos negocios y sus relaciones con las entidades de
microcrdito, un aspecto muy relevante ser el tamao de la empresa, tal como seala Jaramillo
(2006). Este autor adems seala que la conexin entre estas entidades y sus clientes, es
bsicamente la asesora para mejorar sus inversiones, de modo que es muy relevante la relacin
que establece el cliente con su entidad de crdito. Los criterios financieros, como el uso de los
fondos, son problemas que se comparten con la gran empresa, de modo que el tamao es lo
relevante para una microempresa, ya que las prcticas del microempresario deben tender a la
eficiencia como en cualquier corporacin.
Se puede concluir que uno de los criterios de segmentacin ms importantes giran en torno al
tamao del negocio y en segundo aspecto a las relaciones que se establecen con la entidad
256
financiera, las cuales pueden derivar en poca o mucha lealtad al actual ofertante de microcrdito,
desde all podemos explorar la insatisfaccin de los clientes en un mercado ya cubierto. En el
caso que esas relaciones con los ofertantes no existan, pero hay la intencin del crdito,
entonces podemos derivar la parte de mercado no satisfecha actualmente.
Es relevante, adems, conocer las cualidades personales del microempresario como la
educacin, aspecto relevante en los estudios de Amao y Ogbowa (2005); tambin aspectos
relacionados a la conduccin del negocio, como los ingresos generados e inclusive el gnero
(Hietalahti y Linden, 2006) como factores de crecimiento empresarial, asimismo sus preferencias
en cuanto al financiamiento, sea mediante una entidad de microcrditos o mediante prestamos
informales, en este aspecto Lelong y Schwartz (2003) manifiestan que slo el 2.6% de
microempresas en Latinoamrica accede al crdito formal. En algunos casos se puede dar una
conexin con entidades de la banca comercial, es decir ya el segmento es penetrado por actores
que tradicionalmente no intervienen en el mismo; de modo que considerar el acceso al crdito
formal e informal como criterio de segmentacin es tambin relevante.
Tomado textualmente de Amors (2009)
Preguntas
1. Qu modelo economtrico diseara para analizar la demanda de microcrditos?
2. Qu encuesta diseara para tomar la informacin que exige su modelo
economtrico?
3. Por qu motivos el modelo a estimar tendra heterocedasticidad, considere que su
estimacin es slo en mercados urbanos y para diversas actividades econmicas?
257
Ejercicios
Sea el modelo y = X Donde X representa a una constante y una variable. Visto en
matrices, tenemos que los parmetros se estiman como: = (X X) -1 X y
Adems la matriz de errores cuadrticos puede estimarse de los siguientes modos
equivalentes:
e e = y y XX
e e = y y y X
Muestra 2
50
300
50
300
300
2100
300
2100
yX =
300
2000
300
2200
yy
2100
2800
258
Referencias bibliogrficas
Amors, M. (2009) Determinantes del microcrdito y el perfil de microempresarios urbanos en las
ciudades de Chiclayo y Trujillo Per. CIES.
Angrist, Joshua y Jorn-Steffen Pischke (2009) Mostly Harmless Econometrics. Princeton
University Press, Captulo 4.
Amao, J. Ogbowa. O. y Oni, O. (2005). Determinants of credit demand among rural farming
household in OSE local government area: Ondo State of Nigeria. Journal of financial managerial
and analysis. Vol. 18. N 2. Nigeria.
Banerjee, A. (2002). The uses of economic theory: Against a purely positive interpretation of
theoretical results. Mimeo. MIT. USA.
Breusch, T. And Pagan A. (1979) A simple test for heteroscedasticity and random coefficient
variation. Econometrica Vol. 47.
Copa, T.; Gonzles de Otoya, G. y Linares, C. (1995). Atractivo del financiamiento a las
pequeas y microempresas para la banca comercial privada. ESAN. Lima. Per.
Chong, A. y Schroth. (1998). Cajas municipales, microcrdito y pobreza en el Per. CIES. Lima.
Per.
De Morais, J. (2005). Crdito bancrio no Brasil: Participacao das pequenas empresas e
condicoes de acesso. CEPAL. Chile.
Godfrey, L. (1978) Testing for multiplicative heteroscedasticity. Journal of Econometrics. Vol. 8.
Greene, W. (2003) Econometric Analysis. Fifth Edition. Pearson Ed.
Gujarati, D. (2004) Econometra. 4ta Edic. Mc Graw Hill.
Hietalahti, J. y Linden, M. (2006). Socio-economic impacts of microfinance and repayment
performance: A case study of the Small Enterprise Foundation, South Africa. Progress in
development studies. Vol. 6. N 3.
259
CAPTULO VII
Autocorrelacin de errores
261
Autocorrelacin de errores
Autocorrelacin de errores
263
Autocorrelacin de errores
Una segunda causa de la autocorrelacin son las omisiones de variables, tambin los
modelos con formas funcionales inexactas o estimaciones cuyas variables estn
expresadas de modo incorrecto.
Pensemos que el modelo estimado, se expresa del siguiente modo:
Y i = 0 + 1X 1 + U i
(1)
(2)
Autocorrelacin de errores
265
Autocorrelacin de errores
Xk = ( Xn + Xt-n-1 + Xt-n-2 ) / 3
Para k trimestres, la sera previa va a generar de todos modos una serie suavizada
respecto a la original, con lo cual los errores tendern a correlacionarse con la variable
dependiente, toda vez que cada media explica parcialmente su perodo y el siguiente.
-
(3)
Una aplicacin de este tipo de modelos, puede ser por ejemplo, que si el tipo de cambio
(en este caso X) va subiendo respecto al perodo anterior (depreciacin vista la moneda
como valor local o soles por dlar), entonces es probable que las reservas
internacionales (en este caso Y) puedan ir bajando respecto al nivel anterior, esto se
produce porque el Banco Central al intervenir vende moneda extranjera con fines de
atenuar la subida cambiaria.
En el caso del modelo (3) vi sera el error del modelo, en muestras pequeas el valor
esperado de vi no es cero, en muestras grandes podra acercarse a cero. Cuando vi es
cero hablamos de un concepto llamado estacionariedad del modelo y es la base de las
estimaciones de modelos seriales en la econometra actual:
E vi = E (et - e t -1) = 0
E vi = (et - e t -1) / N = 0
En el caso de los modelos en desviaciones (si es con un rezago tambin se llama
modelo en primeras diferencias) la varianza del mismo sera:
E vi 2 = [ ( et - e t -1) - E ( et - e t -1) ] 2
266
Autocorrelacin de errores
La varianza del modelo estacionario es, en buena cuenta, una constante cumpliendo
con los criterios de los modelos economtricos correctamente estimados.
-
Hay que notar entonces que la presencia de autocorrelacin genera una covarianza diferente
de cero aunque constante.
Finalmente hay que sealar que la presencia de autocorrelacin puede generar modelos en
diferencias, cuyos estimadores son correctos o insesgados, siempre que los errores de dicho
modelo sean estacionarios o de valor esperado cero.
Para analizar las fallas de los modelos con presencia de autocorrelacin verifiquemos el
comportamiento del error, de su valor esperado y la covarianza que este error presenta con su
pasado. Comencemos con proponer el siguiente modelo genrico:
267
Autocorrelacin de errores
Y t = 0 + 1X t + e t
Que tiene la siguiente secuencia de errores autocorrelacionados:
et = et-1 + ui
(4)
El modelo (4) indica una autocorrelacin de errores, supone que el error del perodo t se
relaciona con el error del perodo t-1, en este caso el error esperado del modelo es:
E et = et = E et-1 + E ui = 0
Mientras que la varianza del modelo puede estimarse como:
Var et = 2 Var et-1 + Var ut
Var et = Var ut / (1 - 2 )
Var et =
2/
(1 - 2 ) = E et 2
Si bien se cumple que el error esperado es cero y tambin que la varianza previa es
constante, esta varianza se ajusta o es influenciada por el valor del parmetro del error
autocorrelacionado (), lo que indica la presencia de este proceso.
Para valores positivos de , note que la varianza con autocorrelacin es naturalmente mayor
que la varianza de un modelo sin este problema (estimada con MCO), lo que significa que a
pesar que la varianza es constante, su mayor valor puede afectar la estimacin del modelo.
Podemos probar la autocorrelacin persistente en el tiempo, analicemos la covarianza entre
et y et-1 (recuerde que los valores esperados individuales del error son cero), esto tiene los
siguientes resultados:
Cov (et, et-1) = E ( et-1 + ui ) et-1
Cov (et, et-1) = E et-12 + E ui et-1
Cov (et, et-1) = E et-12
Cov (et, et-1) =
2/
(1 - 2 )
Para el caso de dos perodos de rezago, la covarianza entre et y et-2 es como sigue:
268
Autocorrelacin de errores
et = et-1 + ui
et -1= et-2 + ui t-1
Cov (et, et-2) = E ( [ et-2 + ui t-1] et-2
Cov (et, et-2) = E (2 et-2 + ui t-1] et-2
Cov (et, et-2) = 2 E et-22
Cov (et, et-2) = 2
2/
(1 - 2 )
Donde:
s : Es la correlacin entre et y et+s (para s perodos adelante o hacia atrs)
Dado que el error es:
et = et-1 + ui, entonces:
= et et-1 / et-1 2 para 1 rezago
De la forma anterior, sucesivamente, se va obteniendo la covarianza de los errores rezagados
evidenciando la autocorrelacin existente, por cuanto los errores van teniendo correlaciones
distintas de cero (lo cual ya viola los criterios bsicos del diseo y estimacin de los modelos
economtricos). Note que si el parmetro que relaciona el error con su pasado () es cero,
entonces las covarianzas son cero y el modelo sera el clsico estimado por MCO, con las
condiciones de parmetros eficientes e insesgados.
Para analizar estos parmetros insesgados o no, veamos los efectos de la autocorrelacin en
la varianza de los mismos, esta varianza de los parmetros es importante en la significancia de
los mismos. El anlisis puede plantearse del siguiente modo, en este caso para el parmetro 1,
tomando estimaciones realizadas ya en captulos previos:
Var 1 = E [ Z1 2 e1 2 + Z2 2 e2 2 + Z2 2 e3 2 + + Zn 2 en 2 + 2 Z1 Z2 e1 e2 + .+ 2 Zn-1 Zn en-1 en ]
Ahora considere que:
Zt = xt / xt2
Para: Yt = 0 + 1 Xt + ut
Autocorrelacin de errores
Donde:
xt 2 = xt 2+ xt+1 2+ xt+2 2 + + Xt+n 2
Tambin considere que:
Cov (et,et+1) = E (et et+1) =
2/
(1 - 2 )
2=
E (et et+1)
2=
E (et, et+2)
n-1
2=
E (et, et+n-1)
2+
( 1 / xt +1 2 )
2+
2)
2 .+
/ xt xt+1
2
Var 1 = (1 / xt 2 )
2[
( 1 / xt+2 2 )
+ + ( 1 / xt+n 2)
2 n - 1
2 xt xt+n / xt xt+n
2
+ 2 ( xt xt+1
(5)
Donde:
xt 2 = xt+1 2 = = xt+n 2
270
Autocorrelacin de errores
2[
1 + 2 ( xt xt+1 / xt 2 ) .+ 2 ( xt xt+n / xt 2 ) n - 1 ]
Otra perspectiva de las fallas ocasionadas en los parmetros, ha sido analizada por Kmenta
(1986) y Baltagi (2008), en este sentido la estimacin del parmetro en un modelo con
autocorrelacin, sigue el proceso siguiente: Sea un modelo donde se considera la estimacin por
mnimos cuadrados generalizados, usando la correlacin de errores como ponderador, se tiene:
Y t = 0 + 1X t + e t
Yt-1 = 0 + 1Xt-1 + et-1
et = et-1 + ut
et = (Yt-1 0 - 1Xt-1) + ut
Yt 0 - 1Xt = (Yt-1 0 - 1Xt-1) + ut
Yt 0 - 1Xt = Yt-1 - 0 - 1Xt-1+ ut
Yt - Yt-1 = 0 - 0 + 1Xt - 1Xt-1+ ut
Yt - Yt-1 = 0 - 0 + 1Xt - 1Xt-1+ ut
Yt - Yt-1 = 0 (1 - ) + 1 (Xt - Xt-1 )+ ut
En este modelo, el parmetro queda:
1 = (Xt - Xt-1) (Yt - Yt-1) / (Xt - Xt-1 )2
Como puede notarse, el parmetro estimado es diferente al de MCO, an con autocorrelacin
la varianza es constante, pero influenciada por (en la prctica denominado coeficiente de
autocorrelacin) por ello la estimacin del parmetro difiere de la hallada en MCO, sin embargo
en ausencia de autocorrelacin ( = 0) ambos estimadores son iguales.
Desde la perspectiva de Kmenta (1986) la varianza de 1, es como sigue:
271
Autocorrelacin de errores
Var 1 =
2/
(Xt - Xt-1 ) 2
(6)
Donde la ecuacin (6) con un solo rezago equivale a la ecuacin (5) en n rezagos.
Hay que notar que la autocorrelacin genera una varianza de parmetros mayor que en
MCO, eso reduce la significancia de los parmetros. Otro detalles es que la varianza del modelo
autocorrelacionado, si bien es constante, es mayor que en MCO, ello reduce la potencia del
ajuste del modelo por lo tanto en presencia de correlacin de errores, las estimaciones dejan de
ser insesgadas y el ajuste global del modelo esta sobre estimado.
Autocorrelacin de errores
relacin inversa pero tenuemente, lo que implica realizar la regresin respectiva para probar el
ajuste del modelo y luego el proceso de autocorrelacin. Los resultados de la regresin son
(prueba t en parntesis):
Preferencia por Circulante t = 3.67025 - 0.1474987 Inters activo soles t + et
(12.79)
( -1.49)
R 2 = 5.4%
Fig. 7.1 Relacin entre log circulante y log tasa de inters activa en soles
(mensual feb 2011-junio 2014)
Fuente: BCRP
Como se puede encontrar en los resultados, la evidencia de ajuste global es pequea, ahora
analicemos el comportamiento de los errores del modelo:
273
Autocorrelacin de errores
Se nota una clara relacin positiva lo que podra evidenciar la presencia de autocorrelacin.
La Fig. siguiente muestra otro patrn de comportamiento, por un lado los residuos o errores del
modelo y por otro los residuos estandarizados (los residuos divididos entre el error estndar del
modelo o raz de la varianza), se supone que el error estandarizado debe comportarse de modo
aleatorio con media cero y varianza constante, sin embargo la Fig. evidencia que tiene el mismo
patrn que el error normal, de modo que es posible la autocorrelacin de errores.
Fig. 7.3 Errores del modelo y errores estandarizados
274
Autocorrelacin de errores
d=4
=0
d=2
=1
d=0
Autocorrelacin de errores
Finalmente hay que sealar que el Durbin Watson se analiza para modelos donde el error se
relaciona con un solo rezago, lo que se suele llamar tambin modelo autoregresivo de orden 1 o
AR (1).
La secuencia del valor de Durbin Watson (1951) ha sido tambin planteada en la Fig.
siguiente. Como puede verse hay zonas de indecisin y zonas donde se evidencia la
autocorrelacin positiva o negativa, para ello hay que estimar los valores de dU y dL.
Con fines de analizar el indicador de Durbin Watson, procedemos a calcularlo del modo ya
planteado antes:
d = (et - et-1) 2 / et 2
d = 0.02728484 / 0.084980371
d = 0.321
Si reemplazamos este valor podemos hallar la correlacin de errores:
276
Autocorrelacin de errores
d= 2[1 ]
0.321 = 2 [ 1 ]
= 0.84
Este valor de la correlacin es idntico si hiciramos la siguiente regresin, cuyos resultados son:
et = et-1 + ut
et = 0.84 et-1 + ut
(t = 9.67)
R2 = 70.6%
Donde vemos que el parmetro , es significativo mediante la prueba t (valor mayor a 9) y
con un ajuste de modelo de 70.6%, evidenciando la clara presencia de autocorrelacin.
Ahora usemos el valor de Durbin Watson calculado antes, para situarnos en la Fig. 7.4
necesitamos ubicar en la tabla estadstica de Durbin y Watson (1951) los valores de dU y dL, los
cuales son para 41 datos (N) aunque usaremos 40 para usar la tabla y 1 variable explicativa (K):
dU = 1.544
dL = 1.442
d = 0.321
Como indica la Fig. siguiente, en nuestro modelo de ejemplo existe una autocorrelacin
positiva, esto slo confirma la evidencia previa de una correlacin de 84% entre el error y su
pasado inmediato o un rezago. El indicador de Durbin Watson, como se ha visto, se estima
desde dos posibilidades, una de ellas hallando el parmetro del modelo de regresin entre el
error y su rezago o tambin a partir de las desviaciones entre el error y su rezago
277
Autocorrelacin de errores
0.321!
1.442!
1.544!
El indicador de Durbin Watson funciona bien para un rezago del modelo del error, pero si
tenemos p rezagos, entonces se puede plantear el modelo siguiente:
et = 0 + 1 X1 + 1 et-1 + 2 et-2 + 3 et-3 + p et-p + ut
En este caso probamos dos cosas, una que el error es independiente de la variable
explicativa y dos que el error no tiene autocorrelaciones en p rezagos, esta prueba requiere
estimar el siguiente indicador:
(N p ) R2
Que sigue una distribucin chi cuadrado con p grados de libertad, apliquemos este test para
el modelo previo considerando 5 rezagos, los resultados son (prueba t en parntesis):
et = 0.169 - 0.06 X1 + 0.702 et-1 - 0.063 et-2 + 0.271 et-3 - 0.139 et-4 + 0.09 et-5 + ut
(0.918) (-0.937) (3.904)
(-0.283)
(1.281) (-0.673)
(0.499)
R2 = 0.735
278
Autocorrelacin de errores
Autocorrelacin de errores
(-1.59)
R2 = 6.2%
280
Autocorrelacin de errores
Un parmetro positivo (en caso el modelo sea explicativo) indica que mayores tasas de
inters activa tiene efecto positivo o alcista en el circulante, en buena cuenta hay
menos preferencia por depsitos bancarios, esto puede ser porque en el mercado en
general las tasas de rentabilidad tambin estn subiendo y los fondos pasan del sector
bancario a sectores reales, hacia el mercado de capitales (por lo menos el private
equity o financiamiento privado) o hacia operaciones primarias fuera de bolsa.
As como han cambiado el valor de los parmetros, de igual modo comprobamos que el
R2 ha subido, igual sucede con los valores de la pruebas t de cada parmetro, el
modelo sin autocorrelacin tiene mejor ajuste y mejores indicadores de significancia del
parmetro de la variable explicativa.
-
R2 = 8.3%
281
Autocorrelacin de errores
Finalmente en este modelo, el valor del parmetro ya es significativo (al menos al 5%) y
el indicador Durbin Watson seala que no hay autocorrelacin de errores, el valor
estimado de la correlacin es de -20% bastante bajo para rechazar la posibilidad de
que los errores estn autocorrelacionados.
En este caso el signo del parmetro es el esperado, cumpliendo con lo que estamos
indicando en nuestro diseo terico, que las mayores tasas en el mercado bancario
incentivan los depsitos (siempre que la tasa activa impulse la tasa pasiva) y reducen
la preferencia por circulante.
282
Autocorrelacin de errores
283
Autocorrelacin de errores
Preguntas de opinin:
1. Brinde ejemplos de modelos econmicos donde es posible la autocorrelacin.
2. La autocorrelacin tiene varianza constante, pero Por qu es ineficiente?
3. Por qu la correlacin entre los errores no es conocida?
4. Por qu el modelo de error con su rezago no tiene constante?
5. Qu significa que los errores sean estacionarios?
284
Autocorrelacin de errores
Caso de aplicacin
Lectura previa
En base a Guerrero et al (2006):
La relacin entre inflacin y desempleo no es un anlisis reciente, Sultan (1957) propone que
a medida que la sociedad requiere un menor desempleo, entonces debe estar dispuesto a
sacrificar su consumo mediante el alza de la tasa de inflacin, este sacrificio no obstante es
atenuado y hasta reducido si el menor desempleo produce un crecimiento de la demanda interna.
La figura siguiente indica que conforme sube el nivel de precios, igualmente puede ir
subiendo el nivel de empleo (la llamada relacin hipottica), sin embargo Sultan (1957) indica
tambin que hay un rango de precios tolerable mximo y de cada mnimo, en la cada tambin
baja el nivel de empleo, ambos casos relacionados con la mayor demanda de trabajadores en
contextos donde la demanda de bienes finales tambin es creciente.
Fig. 7.6 Curva de inflacin y cambio en el empleo
Autocorrelacin de errores
Phillips (1958) indica que los salarios crecen cuando aumenta su demanda respecto de la
oferta, en buena cuenta el salario es el precio del trabajo y se mueve segn las fuerzas de
demanda u oferta laboral. Una demanda laboral mayor (con crecimiento positivo) genera un
crecimiento positivo de los salarios de modo que la relacin es positiva, asimismo estos salarios
estn vinculados al nivel de precios: Por ejemplo mayores niveles de precios incentivan al
empresario a producir ms con lo cual sube la demanda de empleo (a la inversa baja el nivel de
desempleo) y finalmente sube el salario monetario.
Phillips (1958) plantea una relacin no lineal sino ms bien cuadrtica, que puede plantearse as:
Y+a=BXx
En logaritmos:
Log (Y + a) = Log B + x Log X
Donde X es la tasa de desempleo (a la inversa la mayor demanda de empleo) y x es la
variacin de esta tasa, Y es la tasa de variacin del salario donde a representa una variable de
nivel que indica que el salario no puede crecer a tasa cero, crecer desde un nivel base,
atendiendo la idea de que los sindicatos siempre parte de un crecimiento base. Finalmente
Phillips (1958) propone una relacin negativa entre desempleo y salarios.
En base a Phillips (1958), Samuelson y Solow (1960) plantean que la relacin del desempleo
se verifica en sus efectos en la tasa de inflacin, variable de mayor dinmica que la tasa de
crecimiento de los salarios.
La fig. siguiente es la clsica representacin de la curva de Phillips, donde un mayor nivel de
desempleo puede verse afectado por la menor inflacin, efectos que Samuelson y Solow (1960)
plantearon a largo plazo.
Basado en Guerrero et al (2006)
286
Autocorrelacin de errores
287
Autocorrelacin de errores
Ejercicios
Como ya se indic en el texto, la Curva de Phillips, es la relacin negativa entre la tasa de
inflacin y la tasa de desempleo. Debido a que los mercados tienen informacin, los precios
pueden ser estimados y anticipados, cuando sucede esto, existe independencia entre el
desempleo y la inflacin, por cuanto los precios se ajustan antes de la ocurrencia del fenmeno,
sin embargo esta independencia debe ser probada. Por ello avances recientes consideran que la
Curva de Phillips debe ser con expectativas, en buena cuenta la independencia no se produce,
porque los agentes no estiman bien el precio y por ende hay efectos reales, esta mala estimacin
se conoce como efecto sorpresa. Eso ha llevado al modelo con expectativas siguiente:
(Pt Pt / t-1) = (Dt D*) + e
(1)
Donde:
Pt: Inflacin en el perodo t, calculado como la variacin porcentual (%) del ndice de precios Pt
Pt / t-1: Inflacin estimada para el perodo t, dado la influencia de toda la informacin
disponible en t-1, esta informacin se resume en el conjunto de variables t-1,expresado en
variacin %, esta variable es condicional.
Dt: Tasa de desempleo
D*: Desempleo natural, una variable constante no observable, pero que puede ser estimada a
partir de la ecuacin (1) aplicando regresin con constante en este modelo.
Pt Pt / t-1: Representa la inflacin mal estimada, si es positiva la inflacin es mayor a la
estimada o a la inversa.
Dt D*: Representa el efecto real que existe cuando se estima mal la inflacin, es decir el
desempleo real supera o es menor a la tasa natural, con lo cual hay efectos en la produccin.
La lgica del modelo es: En el mercado los agentes producen ms que el PBI natural
(variable estable a largo plazo o el promedio de largo plazo) cuando creen que el precio ser
mayor al esperado. Cuando se da esto, el desempleo se reduce por debajo del nivel natural o de
288
Autocorrelacin de errores
largo plazo. Este menor desempleo incentiva la demanda y con ello crece la inflacin realmente
observada. Por lo tanto debera ser negativo.
Para fines de estimacin, consideramos que el conjunto de variables t-1, esta representado
por la variacin porcentual de la emisin primaria (M t-1) y la variacin porcentual del ndice de
precios internacional de combustibles (PIC t-1), los datos son los siguientes:
Tabla 7.1 Datos para el ejercicio
Perodo t
Pt
M t (Miles Mlls)
PIC t-1
Dt (%)
10
1000
11
1200
12
1400
13
1300
14
1500
15
1700
16
1600
17
1500
18
1800
10
19
2000
11
20
2000
13
Determine:
La inflacin Pt / t-1
La tasa natural de desempleo
La existencia de autocorrelacin, mediante el estimador Durbin-Watson.
289
Autocorrelacin de errores
Referencias bibliogrficas
Angrist, Joshua y Jorn-Steffen Pischke (2009) Mostly Harmless Econometrics. Princeton
University Press, Captulo 4.
Baltagi, B. (2008) Econometrics. 4th Edition Springer. USA
Breusch, T. (1978) Testing for autocorrelation dynamic linear models. Australian Economic
Papers. Vol. 17.
Godfrey, L. (1978) Testing against general autoregressive and moving average error models
when the regressor include lagged dependent variable. Econometrica. Vol. 46.
Greene, W. (2003) Econometric Analysis. Fifth Edition. Pearson Ed.
Guerrero, C. Osorio, P. Y Tiol, A. (2006) Un siglo de la curva de Phillips en Mxico. Working
paper EGAP 2006-03. ITESM. Mxico.
Gujarati, D. (2004) Econometra. 4ta Edic. Mc Graw Hill.
Jimnez, F. (2012) Elementos de teora y poltica macroeconmica para una economa abierta.
Fondo Editorial PUCP.
Johnston, J. and Dinardo, J. (1997) Econometric Methods. Fourth Edition. Mc Graw Hill
Kmenta, J. (1986) Elements of Econometrics. McMillan NY. USA
Nigrinis, M. (2003) Es lineal la curva de Phillips en Colombia? Documentos de Trabajo Diciembre.
Banco de la Repblica. Colombia
Novales, A. (1993) Econometra. Mc Graw Hill.
Phillips, A. W. (1958). The relation between unemployment and the rate of change of money
wage rates in the United Kingdom, 1861-1957. Economica 25: 283-299.
Samuelson, P. A. y R. M. Solow (1960), Problem of achieving and maintaining a stable price
level: analytical aspects of anti-Inflation policy, The American Economic Review, vol. 50, nm. 2,
pp. 177-94.
290
Autocorrelacin de errores
291
CAPTULO VIII
Modelos de respuesta
limitada: Probabilidad lineal y
logit
292
Introduccin al tema
Los estudios sociales normalmente buscan explicar el comportamiento de las personas, por
ejemplo saber si alguien comprar o no un producto es importante para las empresas, esta
decisin puede enmarcarse en dos posibilidades, cero (0) si no compra y uno (1) si compra, de
modo que estos modelos se conocen como discretos ante estas opciones o limitados, por cuanto
no superan 1 y dado la variabilidad de datos, puede ser la respuesta tambin una probabilidad
donde si no compra es cero y si decide comprar como mximo es una decisin con 100% de
probabilidad.
En otros casos los estudios sociales pueden querer conocer por ejemplo, cual es la
probabilidad de que un hogar deje de ser pobre, o cul es la probabilidad de ganar ms, o de
obtener un empleo en el caso de individuos que buscan empleo. Todos estos estudios son
naturalmente de corte transversal, es decir provienen de informacin que se extrae en un mismo
momento del tiempo y por tanto estn sujetos a un correcto diseo de encuestas para evitar
errores cuadrticos cambiantes o heterocedasticidad.
Los estudios con variables probabilsticas o de respuesta limitada son muy comunes en el
campo economtrico y ayudan mucho a medir los efectos de las diversas polticas de orden
social o de los diversos impulsos que se dan para que un individuo o agente econmico cambie
su comportamiento, siendo muy relevantes conocer en qu casos sus respuestas son
significativas.
293
En cualquiera de estos casos, las variables explicativas pueden ser diversas, por ejemplo
para comprar un producto puede decidirse en funcin a los precios percibidos o cualidades del
producto, el empleo formal puede deberse a si el trabajador tiene calificaciones o estudios
superiores, la vivienda propia puede deberse al nivel de ingresos o tamao familiar y si es mujer
jefa de hogar, puede deberse al grado de educacin de la madre soltera.
Como se puede notar, la respuesta es simplemente una variable discreta, pero las
explicativas pueden ser variables discretas o continuas, el modelo planteado sera siempre con la
siguiente estructura:
Yi = 0 + 1 X1 + 2 X2 + + n Xn + ui
Donde:
Yi = 0 (si el evento no ocurre)
Yi = 1 (si el evento ocurre)
Dado que la estimacin de Yi es un valor esperado condicional, se puede escribir del siguiente
modo:
E (Yi = 0/ Xi ) = 0 + 1 X1 + 2 X2 + + n Xn + ui
E (Yi = 1/ Xi ) = 0 + 1 X1 + 2 X2 + + n Xn + ui
Ahora consideremos que el evento ocurre con las siguientes probabilidades, si es exitoso, la
probabilidad es 1 (Pi) y si es fracaso la probabilidad es cero (1 - Pi), lo cual se define as:
Yi = 0
Probabilidad = 1 - Pi
294
Yi = 1
Probabilidad = Pi
(1)
Donde:
Combinatoria (N, X) = N! / [ X! * ( N X )! ]
La expresin !, representa el factorial de dicho nmero.
Considere que el evento fue un fracaso es decir Pi = 0, entonces para todo valor positivo del
nmero aleatorio X, la distribucin de probabilidad binomial arroja el valor cero. Ahora considere
que el evento fue un xito, es decir Pi = 1, entonces el valor de la distribucin binomial ser
nuevamente cero.
Ahora tomemos en cuenta que las probabilidades de suceso pueden ser nmeros entre 0 y 1,
entonces el valor de la distribucin binomial, por ejemplo para 5 datos, considerando que la
variable aleatoria X es cambiante, puede representarse en la figura que sigue.
Como pueden ver, considerando que la variable aleatoria va de 0 a 5, piense por ejemplo que
el experimento consiste en sacar de una nfora (se sacan papeletas conteniendo el DNI)
aquellas personas que estn o no desempleadas, entonces el nmero 0 indica que no se saco
ninguna desempleada, el nmero 1 indica que se sac una desempleada y as sucesivamente
hasta sacar 5 desempleados.
La probabilidad de 0.1 para este primer caso indica que existen 10% de posibilidades de
obtener un desempleado en un conjunto cualquiera de personas, piense que en el nfora existen
100 papeletas y el experimento es sacar al menos 10 papeletas, a ver cuales son empleados o
desempleados, en el nfora existen al menos 10 desempleados.
295
296
(P = 0.1)*Xi
0
0.32805
0.1458
0.0243
0.0018
0.00005
0.5
(P = 0.2)*Xi
0
0.4096
0.4096
0.1536
0.0256
0.0016
1
(P = 0.3)*Xi
0
0.36015
0.6174
0.3969
0.1134
0.01215
1.5
(P = 0.5)*Xi
0
0.15625
0.625
0.9375
0.625
0.15625
2.5
El valor de cada elemento de la tabla anterior, resulta del valor de la distribucin binomial por
Xi, a partir de la siguiente expresin:
E (Xi = 0) = Pi * (Xi = 0)
E (Xi = 0) = 0.59 * 0
E ( Xi = 1) = 0.328 * 1
E ( Xi = 1) = 0.07 * 2
As sucesivamente, donde el valor de la distribucin binomial siguiendo la ecuacin (1) para
una probabilidad de 10% (P = 0.1) es de (mostrado en la figura 8.1):
Pi (X = 0) = 0.59
Pi (X = 1) = 0.328
Pi (X = 2) = 0.07
Entonces el valor esperado X para la distribucin binominal con P=0.1, resulta en:
E X ( P = 0.1) = Pi Xi = 0.5
E X ( P = 0.2) = Pi Xi = 1
Y sucesivamente, esto puede expresarse a modo general como:
297
EX=N*P
Donde N es el nmero de datos y P es la probabilidad de xito, en este caso 0.1, 0.2, 0.3 y
0.5, como las usadas en la tabla anterior. Si estuviramos slo con una distribucin dicotmica
discreta, conocida como distribucin de Bernoulli, el valor esperado de X es:
EX=P
La varianza en una distribucin se puede expresar del siguiente modo:
Varianza = E (X 2) - ( E X) 2
Para lo cual hemos construido la tabla siguiente:
Tabla 8.2 varianza en una distribucin binomial, para N = 5 datos y X de 0 a 5
X2
0
1
4
9
16
25
Suma
(EX)2
Varianza
Desviacin
(P = 0.1)*Xi 2
0
0.33
0.29
0.07
0.01
0.00
0.70
0.25
0.45
0.67
(P = 0.2)*Xi 2
0
0.41
0.82
0.46
0.10
0.01
1.80
1.00
0.80
0.89
(P = 0.3)*Xi 2
0
0.36
1.23
1.19
0.45
0.06
3.30
2.25
1.05
1.02
(P = 0.5)*Xi 2
0
0.16
1.25
2.81
2.50
0.78
7.50
6.25
1.25
1.12
Los valores de la distribucin binomial estimados usando la ecuacin (1), se multiplican ahora
por Xi 2, estos resultados son sumados para cada nivel de probabilidad, por ejemplo para P = 0,1,
la suma resulta 0.70, lo que equivale al valor esperado: E (X2), esto se resta de la esperanza de
X cuadrtica (E X) 2 estimada antes, con lo cual la varianza estimada y la desviacin estndar se
muestran en el cuadro previo.
Los resultados estimados equivalen a decir que la varianza estimada de una distribucin
binomial es:
298
Varianza X = N * P * (1 P)
As para una probabilidad de 0.1, se tiene una varianza de:
Varianza X = 5 * 0.1 * 0.9 = 0.45
Desviacin estndar = 0.45 0.5 = 0.67
En el caso de que se tenga una variable discreta de probabilidad, la denominada Bernoulli, se
tiene que la varianza es:
Varianza X = P * (1 P)
Finalmente hay que sealar, que la distribucin binomial que sigue una variable cualquiera,
en estos modelos dicotmicos, tiene una distribucin de probabilidad acumulada, mostrada en la
figura siguiente.
En este caso, el valor de la variable (para fines economtricos la respuesta probabilstica es
una variable dependiente) equivalente a la probabilidad, es mximo 1, se muestra adems que
toma valores entre 0 y 1, si bien el planteamiento del modelo muestra solo dos posibilidades
(xito 1 y fracaso 0) las estimaciones de la variable dependiente son una distribucin de
probabilidades continua.
Fig. 8.2 Distribucin binomial acumulada para X que va de 0 a 5 con N = 5 datos
299
300
La figura previa indica que los resultados superavitarios del gobierno central (la variable toma
valor 1), tienden a relacionarse con un crecimiento de la inversin privada trimestral, lo cual
probaremos estimando los parmetros respectivos (prueba t en parntesis):
Pi = -1.286 + 0.09 X1 + ui
(-1.87)
(2.708)
R2 = 0.314
El modelo indica que el ajuste es de 31% y el parmetro X1 (la inversin privada sobre PBI)
es significativo pues tiene un valor t de 2.7, ahora veamos si el modelo presenta evidencias de
heterocedasticidad, para ello tomemos la siguiente figura:
Fig. 8.4 Error cuadrtico (ui2) versus inversin privada sobre PBI (X)
La figura previa muestra una potencial heterocedasticidad, de modo que debemos corregir el
modelo, tomando en cuenta los clculos de la desviacin estndar de cada Pi estimado.
301
Para las correcciones consideramos, tal como muestra la tabla siguiente, que las
probabilidades estimadas (Yi) negativas no sern tomadas en cuenta, toda vez que no existen en
el espacio binominal o discreto.
Asimismo consideramos que Yi es discreto y dicotmico, lo que supone que la varianza de
cada estimacin equivale a Pi * (1 Pi ), este valor servir para ajustar las estimaciones
realizadas. Para corregir la heterocedasticidad usaremos el siguiente modelo:
Pi = Yi corr = 0 + 1 Xi corr + ui
Donde:
Yi corr = Yi / [ Pi * (1 - Pi) ] 0.5
Xi corr = Xi / [ Pi * (1 - Pi) ] 0.5
Tabla 8.3. Estimaciones de varianzas y correccin a Y (estimado) y X
Yi
0
1
1
0
0
1
1
1
0
1
1
0
0
1
1
0
0
1
Xi
12.355
18.742
20.664
18.714
18.028
22.676
21.871
19.705
18.249
20.645
23.776
23.149
17.146
24.495
24.037
22.803
18.320
24.413
Yi '
-0.178
0.394
0.566
0.392
0.330
0.747
0.675
0.480
0.350
0.565
0.845
0.789
0.251
0.910
0.869
0.758
0.356
0.902
Pi
Pi (1-Pi)
0.394
0.566
0.392
0.330
0.747
0.675
0.480
0.350
0.565
0.845
0.789
0.251
0.910
0.869
0.758
0.356
0.902
0.239
0.246
0.238
0.221
0.189
0.220
0.250
0.227
0.246
0.131
0.166
0.188
0.082
0.114
0.183
0.229
0.088
ui
0.178
0.606
0.434
-0.392
-0.330
0.253
0.325
0.520
-0.350
0.435
0.155
-0.789
-0.251
0.090
0.131
-0.758
-0.356
0.098
u i2
0.032
0.367
0.188
0.153
0.109
0.064
0.106
0.270
0.122
0.190
0.024
0.623
0.063
0.008
0.017
0.575
0.127
0.010
Xi
Yi corr
12.355
18.742 0.806
20.664 1.143
18.714 0.802
18.028 0.702
22.676 1.717
21.871 1.440
19.705 0.962
18.249 0.734
20.645 1.139
23.776 2.337
23.149 1.934
17.146 0.579
24.495 3.174
24.037 2.571
22.803 1.770
18.320 0.744
24.413 3.040
Xi corr
38.355
41.695
38.341
38.338
52.141
46.678
39.441
38.263
41.640
65.738
56.741
39.544
85.459
71.155
53.242
38.255
82.255
302
Los resultados del modelo corregido son los siguientes (usando constante pero puede
correrse sin constante, lo cual ajusta ms el modelo, la prueba t est en parntesis):
Pi = -1.163219 + 0.0523105 X1 corr + ui
(-9.81)
(23.53)
R2 = 0.97
Como indica la versin corregida del modelo (sin heterocedasticidad), el parmetro constante
y la pendiente se han ajustado a la baja (tienen menos varianza), as encontramos que la
inversin privada sobre PBI (%) tiene un efecto de 0.05 en la probabilidad de que el gobierno
tenga un resultado primario positivo (1% de crecimiento de la inversin privada eleva 5% la
probabilidad de supervit).
Ambas variables son significativas y el ajuste del modelo es 97%. Con lo cual los resultados
son de mejor explicacin y ajuste que el modelo anterior, producto de que ahora tenemos
variables corregidas sin el efecto de la varianza. Hay que notar que Yi es discreto o sigue la
distribucin de Bernoulli, mientras que Yi es continuo y sigue una distribucin binominal, siendo
una versin ajustada del primero, pero de mayor consistencia.
No obstante el R2 no es buen indicador de ajuste, como hemos visto en figuras previas, la
distribucin de datos no es normal sino Binomial (de forma discreto es de Bernoulli) esto limita el
uso del coeficiente de determinacin, por lo que en este caso el indicador es ms bien
referencial.
En las colas de atencin normalmente los usuarios llegan concentrados por horas, por
ejemplo primeras horas de la maana o ltimas horas de la tarde. Las teoras de colas
recogen este comportamiento a travs de distribucin de datos tipo Poisson.
en estudios tcnicos superiores y un grupo ms reducido son los que siguen estudios
universitarios.
-
10
Percent
20
30
40
Fig. 8.5 Per: Distribucin de Ingresos por hogar 2013 (%) en soles netos por mes
5000
10000
15000
(ocupacin principal) ingreso lquido
20000
La figura anterior indica una concentracin de datos hacia la izquierda, es decir hacia la parte
baja de ingresos, esto no es evidentemente una distribucin normal, lo cual limita las
304
estimaciones de mnimos cuadrados, en estos casos inclusive los errores no siguen una
distribucin normal.
Un problema adicional de los modelos de regresin binomiales o de eleccin dicotmica es la
posibilidad de que la estimacin sea mayor que 1 o menor que cero, lo cual genera prdidas de
datos, sobre todo si se quiere probar la heterocedasticidad, en estos casos los modelos previos
son de uso limitado y si los datos son no normales, entonces hay que recurrir a otra forma de
estimacin.
Existe adems secuencias de datos que no son necesariamente dicotmicas, por ejemplo si
tomamos como variable dependiente el nivel educativo, este puede tomar valores desde 0 a 1, 2,
3 y sucesivamente, donde 3 puede ser primaria completa. En este caso tenemos modelos de
tipo multinomial, cuya estimacin supera los modelos de probabilidad lineal ya vistos
previamente.
Una forma de resolver los problemas previos, es plantear un modelo de distribucin de datos
logstica o Logit, en este tipo de distribucin la probabilidad de xito cambia lentamente conforme
la variable aleatoria se acerca a cero, lo mismo sucede si la variable es muy grande.
Fig. 8.6 Modelo Logit y Modelo de probabilidad lineal
305
(0 + 1 Xi ) ]
) / (1 / [ e (0 + 1 Xi ) + 1 ] )
Pi / (1 Pi ) = e (0 + 1 Xi )
Pi / (1 Pi ) = e Z est
Donde Z est (estimado) = 0 + 1 Xi
En logaritmos:
Ln [ Pi / (1 Pi ) ] = 0 + 1 Xi
306
De modo que la estimacin del modelo economtrico es una funcin de tipo logstica.
Consideremos que la funcin de distribucin probabilstica logit (la versin acumulada de la figura
anterior) es:
L (Y1, Y2, Y3 .Yn) = F ( Yi) = Pi Yi (1 Pi) (1 - Yi)
En este caso contamos con una variable aleatoria Y con n datos o elementos, que toma
valores entre 0 y 1, estos valores son para un conjunto de probabilidades Pi y (1 - Pi ), de modo
que la funcin previa es un producto de todas las distribuciones, note que la funcin logit tiene
mucho parecido con la binomial, donde:
= Funcin producto para todas las distribuciones de Yi
L = Funcin de verosimilitud Logit
Ahora expresemos la funcin L en logaritmos y obtenemos:
Ln L (Y1, Y2, Y3 .Yn) = [ Yi Ln Pi + ( 1- Yi ) Ln (1 Pi ) ]
= [ Yi Ln Pi + Ln (1 Pi ) - Yi Ln (1 Pi ) ]
= [ Yi (Ln Pi + Ln (1 Pi ) + Ln (1 Pi ) ]
= [ Yi Ln ( Pi / Ln (1 Pi ) ) + Ln (1 Pi ) ]
Ln L (Y1, Y2, Y3 .Yn) = Yi Ln ( Pi / Ln (1 Pi ) ) + Ln (1 Pi )
Ln L (Y1, Y2, Y3 .Yn) = Yi ( 0 + 1 Xi ) + Ln (1 / [ e (0 + 1 Xi ) + 1 ] )
Ln L (Y1, Y2, Y3 .Yn) = Yi ( 0 + 1 Xi ) (1) Ln [ e (0 + 1 Xi ) + 1 ]
Si derivamos la funcin logit con respecto a 0 (maximizando el valor de la funcin) e
igualamos a cero, obtenemos:
Ln L / 0 = 0
Ln L / 0 = Yi - [ ( 1 / [ e (0 + 1 Xi ) + 1] ) * (0 + 1 Xi ) * [ e (0 + 1 Xi ) + 1 ] (1) ] = 0
Ln L / 0 = Yi - ( 0 + 1 Xi ) = 0
Yi - N 0 + 1 Xi = 0
307
N 0 = Yi - 1 Xi
Entonces el valor esperado o tambin 0 estimado es:
E 0 = Ym - 1 X m
Donde:
Ym: es la media de Y
Xm: es la media de X
La estimacin del parmetro es similar a la obtenida en los estimadores de mnimos
cuadrados, de modo que podemos emplear esta forma de clculo para obtener los parmetros en
el modelo Logit. Del mismo modo puede expresarse el valor de 1.
Hay dos formas de ver el modelo logit, una es el logit agrupado y la otra es el logit binomial
(cuando la variable dependiente toma valores entre 0 y 1).
Agrarias
Empresa
Integra
Habitat
Prima
Profuturo
Paramonga
Pucal
Laredo
San Jacinto
Capitalizacin Miles
Soles (Xi)
55,467
43,826
255,392
181,26
332,709
208,822
347,479
119,501
18
Rentables (ni)
1
0
1
1
0
0
1
1
308
Sector
Empresa
Cartavio
Casa Grande
Chucarapi
Andahuasi
Chiquitoy
Salamanca
La Unin
San Juan
Sintuco
Cayalt
Pomalca
Tumn
Ingenio
Fanupe
Capitalizacin Miles
Soles (Xi)
232,772
774,957
56,220
227,462
888
40,027
2,559
60,000
34,599
18,857
64,957
28,749
43,699
2139
Rentables (ni)
1
1
0
0
1
0
0
1
0
0
0
0
0
0
obstante la posibilidad de que el logit agrupado sea heterocedstico es alta para cualquier
tipo de estos modelos.
Tabla 8.5 Tabla de datos sobre rentabilidad de empresas para modelo logit
Sector
Capitalizacin ms alta (Xi) Total empresas (Ni) Rentables (ni) * Pi
AFP
255,392
4
3
0.75
Agrarias
774,957
18
6
0.33
Bancos
24,086,035
31
22
0.71
Diversas
6,435,524
68
41
0.60
Fondos de inversin
91,071
9
3
0.33
Industriales
5,285,275
47
19
0.40
Mineras
8,411,631
43
19
0.44
Seguros
348,384
18
5
0.28
Servicios
9,371,780
29
21
0.72
* Datos hipotticos
Note que al final aparece el estimado de Pi, tomando la siguiente expresin:
Pi = ni / Ni
En este caso se tiene la probabilidad de que haya empresas rentables en cada sector o
actividad econmica, en funcin a la capitalizacin burstil, el modelo finalmente ser:
Li = Ln [ Pi / (1 Pi ) ] = 0 + 1 Xi
Considerando que el modelo tiene heterocedasticidad, estimaremos lo siguiente:
Li * wi 0.5 = 0* wi 0.5 + 1* Xi * wi 0.5
Para esta estimacin tenga en cuenta que no hay constante, consideremos la tabla siguiente
con toda la informacin necesaria para ello:
310
Tabla 8.6. Estimacin del Logit para la rentabilidad de empresas segn capitalizacin
Xi
255,392
774,957
24,086,035
6,435,524
91,071
5,285,275
8,411,631
348,384
9,371,780
Pi 1 - Pi Ln (Pi / 1 - Pi ) = Li Ni Pi (1 - Pi ) = wi
0.75 0.25
1.10
0.75
0.33 0.67
-0.69
4.00
0.71 0.29
0.89
6.39
0.60 0.40
0.42
16.28
0.33 0.67
-0.69
2.00
0.40 0.60
-0.39
11.32
0.44 0.56
-0.23
10.60
0.28 0.72
-0.96
3.61
0.72 0.28
0.97
5.79
wi 0.5
0.87
2.00
2.53
4.03
1.41
3.36
3.26
1.90
2.41
Li * wi 0.5
0.95
-1.39
2.26
1.69
-0.98
-1.30
-0.76
-1.82
2.32
Xi*wi 0.5
221,176
1,549,914
60,871,929
25,965,893
128,794
17,781,749
27,392,294
662,031
22,556,812
En la tabla anterior, se ha tomado como varianza del modelo logit agrupado, la siguiente
expresin (note que es similar al modelo binomial) que sera la inversa de la varianza del
error (ui):
Varianza Li = 1 / Var (ui) = wi = Ni * Pi * (1 - Pi)
En base a la tabla anterior, se hizo una regresin de mnimos cuadrados ponderados (ya
que tanto Li como Xi han sido ponderados con wi 0.5) los resultados son los siguientes:
Li ponderado = -0.4194912 * wi 0.5 + 0.0000000641 * Xi ponderado + ui
(1.54)
(2.33)
R2 = 0.44
Los resultados de la regresin por Logit Agrupado indican que la variable capitalizacin
burstil (equivale tambin al valor y tamao de la empresa), tiene un efecto positivo (aunque
pequeo) en el logaritmo ponderado que mide la probabilidad de ser rentable, para cada
sector analizado con los datos de la tabla 8.5 (algunos datos hipotticos).
Visto desde el anlisis de significancia con la prueba t ( en parntesis), la variable Xi es
significativa, mientras que el parmetro relacionado con la desviacin estndar no lo es.
Ahora estimaremos la probabilidad de ocurrencia de Yi (la rentabilidad) para cada
elemento Xi (capitalizacin burstil o tamao de la empresa):
311
Li '
-0.40
-0.37
1.12
-0.01
-0.41
-0.08
0.12
-0.40
0.18
ez
0.67
0.69
3.08
0.99
0.66
0.92
1.13
0.67
1.20
Pi
0.40
0.41
0.75
0.50
0.40
0.48
0.53
0.40
0.55
Cambio
0.000000015
0.000000015
0.000000012
0.000000016
0.000000015
0.000000016
0.000000016
0.000000015
0.000000016
El logit (Li) ponderado se obtiene usando los resultados de la regresin del logit agrupado,
mientras que el Logit estimado (Li ), se obtiene del siguiente modo:
Li = Li ponderado / wi 0.5
Siguiendo las frmulas mostradas previamente, obtenemos la probabilidad para cada
capitalizacin burstil o tamao empresarial medido por la variable X. As si el tamao es de
255 millones de soles, la probabilidad de ser rentable es de 40%; mientras que si el tamao
es de 774 millones, la probabilidad es 41%.
Para un tamao de 24 mil millones de soles, la probabilidad de ser rentable es de 75%,
mientras que en el ltimo caso, si el tamao de la empresa (capitalizacin burstil) es de 9 mil
millones de soles, la probabilidad de ser rentable es de 55%.
La estimacin del Logit Agrupado, puede realizarse mediante el programa Stata , para
ello hay que cargar los datos respectivos mediante la opcin de importacin, en el cuadro de
variables deben aparecer X, N y n, tal como se muestra en el Data Editor del programa (click
en el men Browse):
312
Fig. 8.7 Data Editor en Stata con variables necesarias para un Logit Agrupado
Una vez cargado los datos, se coloca en Do-file Editor la sentencia para el logit agrupado
del siguiente modo:
blogit N, n X
Est indicando que se agrupan los datos por N, con n sale la probabilidad (P i) y X es la
variable explicativa, los resultados en Stata se muestran en la figura siguiente, note que es
muy aproximado al clculo manual que hemos realizado, debido al mayor uso de dgitos por
parte del programa:
313
Log likelihood =
-179.4723
_outcome
Coef.
X
_cons
Number of obs
267
LR chi2(1)
10.74
0.0010
Pseudo R2
0.0291
Std. Err.
P>|z|
6.53e-08
2.11e-08
3.10
0.002
2.40e-08
1.07e-07
-.4160216
.1988611
-2.09
0.036
-.8057822
-.026261
Los resultados sealan que la variable X es significativa (z con una probabilidad cercana a
cero) y tambin es significativa la constante, se tiene un Seudo R2 de 2.9%, indicador que
veremos en la seccin final de este captulo.
influye en la nota final es la Nota de diagnstico (Nota_diagn) o prueba de entrada del alumno
en el curso, donde se evala si conoce los temas o materias necesarias y llevadas
previamente para estudiar el curso actual y finalmente la ltima variable influyente es si el
profesor aplica metodologas activas en el aula (Aplica_met), por ejemplo uso de internet,
multimedia, debates, trabajos y otros que involucran al alumno fuertemente.
Los datos se muestran en el cuadro siguiente:
Tabla 8.8 Datos para el modelo logit explicativo de la nota final de un curso
id
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
Promed_inicial
2.66
2.89
3.28
2.92
4.00
2.86
2.76
2.87
3.03
3.92
2.63
3.32
3.57
3.26
3.53
2.74
2.75
2.83
3.12
3.16
2.06
3.62
2.89
Nota_diagn
20.00
22.00
24.00
12.00
21.00
17.00
17.00
21.00
25.00
29.00
20.00
23.00
23.00
25.00
26.00
19.00
25.00
19.00
23.00
25.00
22.00
28.00
14.00
Aplica_met
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
Nota_final
0
0
0
0
1
0
0
0
0
1
0
0
0
1
0
0
0
0
0
1
0
1
0
315
24
25
26
27
28
29
30
31
32
3.51
3.54
2.83
3.39
2.67
3.65
4.00
3.10
2.39
26.00
24.00
27.00
17.00
24.00
21.00
23.00
21.00
19.00
1
1
1
1
1
1
1
1
1
0
1
1
1
0
1
1
0
1
log likelihood =
Iteration 1:
-20.59173
Iteration 2:
Iteration 3:
Iteration 4:
Iteration 5:
Logistic regression
Std. Err.
Number of obs
32
LR chi2(3)
15.40
0.0015
Pseudo R2
0.3740
Nota_final
Coef.
P>|z|
Promed_inicial
2.826113
1.262941
2.24
0.025
.3507936
5.301432
Nota_diagn
.0951577
.1415542
0.67
0.501
-.1822835
.3725988
Aplica_met
2.378688
1.064564
2.23
0.025
.2921801
4.465195
_cons
-13.02135
4.931324
-2.64
0.008
-22.68656
-3.356129
316
Como puede verse la estimacin es bastante sencilla y permite sealar al menos usando la
probabilidad (P > z), que las variables significativas son el Promedio inicial (0.025 dentro del
5% de rechazo de la hiptesis nula), Aplica metodologa y la constante. La variable Nota
diagnstico no es significativa. En buena cuenta si el alumno tiene un buen promedio (seal
de que se preocupa por cumplir lo requerido en sus cursos) es probable que apruebe el curso
siguiente, esto se refuerza si el profesor aplica metodologas activas.
Las estimaciones de las probabilidades de suceso, se realizan considerando que
Zi est = 0 + 1 Promed_inicial + 2 Nota_diagn + 3 Aplica_met
Adicional a esto se considera que:
Pi = e Z est / (1+ e Z est )
Las estimaciones se muestran en la tabla siguiente:
Tabla 8.9 Probabilidades estimadas para la Nota final
Id
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Z est
-3.60
-2.76
-1.47
-3.63
0.28
-3.32
-3.60
-2.91
-2.08
0.82
-3.69
-1.45
-0.74
-1.43
-0.57
-3.47
e z est
0.03
0.06
0.23
0.03
1.33
0.04
0.03
0.05
0.13
2.26
0.03
0.23
0.48
0.24
0.56
0.03
Pi
0.03
0.06
0.19
0.03
0.57
0.03
0.03
0.05
0.11
0.69
0.02
0.19
0.32
0.19
0.36
0.03
317
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
-2.87
-3.22
0.36
0.67
-2.73
2.25
-1.14
1.75
1.65
-0.08
0.56
-0.81
1.67
2.85
0.12
-2.08
0.06
0.04
1.44
1.95
0.07
9.51
0.32
5.76
5.18
0.93
1.74
0.44
5.32
17.29
1.12
0.12
0.05
0.04
0.59
0.66
0.06
0.90
0.24
0.85
0.84
0.48
0.64
0.31
0.84
0.95
0.53
0.11
De acuerdo con la tabla previa, el primer entrevistado tiene una probabilidad de aprobar el
curso de 3%, el segundo tiene una probabilidad de 6% y as sucesivamente, el ltimo
entrevistado tiene una probabilidad de aprobar el curso actual, de 11%.
Podemos observar que las probabilidades suben conforme va subiendo el promedio inicial,
por ejemplo la probabilidad de aprobar el curso para un promedio inicial de 2.06 es de 6%
(vase el entrevistado 21), mientras que la probabilidad de aprobar el curso para quien
obtuvo un promedio inicial de 4 es de 57%, reflejando las relaciones que se establecen del
modelo.
Para ello usemos el mismo ejemplo del caso anterior, para empezar los parmetros de un
modelo logit se analizan con el ratio z, que se estima del siguiente modo:
z = i / SE (i)
Si este valor tiende a cero, entonces cae en la regin de rechazo de la hiptesis nula, que
indica que el parmetro es igual a cero. De este modo los coeficientes del modelo y sus
respectivos valores z son:
Tabla 8.10 Significancia de parmetros
variable
Promed_inicial
Nota_diagn
Aplica_met
Constante
Parmetro
2.826113
0.095158
2.378688
-13.021350
Error
estndar
1.26
0.14
1.06
4.93
Valor Z
2.24
0.67
2.23
-2.64
Ratio Wald
5.01
0.45
4.99
6.97
El valor z debe superar a 2 para poder indicar que la variable es significativa, en el ejemplo
trabajado, la variable Nota_diagn no es significativa.
El ratio Wald es el valor z 2, indica que la distribucin de los parmetros sigue una secuencia
por lo que el valor crtico ser 4, de modo que si el valor calculado supera a 4, se puede decir
que tenemos un variable significativa.
t 2,
Otros indicadores que ayudan a entender la importancia y el impacto de los parmetros son el
ratio ODDS y los efectos marginales.
Tabla 8.11 Impacto de parmetros
Variable
Promed_inicial
Nota_diagn
Aplica_met
Ratio ODDS
16.87971
1.099832
10.79073
Efecto
marginal
0.3626
0.0122
0.3052
319
Pi (1 - Pi)
0.03
0.06
0.15
0.03
0.25
0.03
0.03
0.05
0.10
0.21
0.02
0.15
0.22
0.16
0.23
0.03
0.05
Promed_inicial
0.07
0.16
0.43
0.07
0.69
0.10
0.07
0.14
0.28
0.60
0.07
0.43
0.62
0.44
0.65
0.08
0.14
Nota_diagn
0.00
0.01
0.01
0.00
0.02
0.00
0.00
0.00
0.01
0.02
0.00
0.01
0.02
0.01
0.02
0.00
0.00
Aplica_met
0.06
0.13
0.36
0.06
0.58
0.08
0.06
0.12
0.23
0.51
0.06
0.37
0.52
0.37
0.55
0.07
0.12
320
0.04
0.04
0.59
0.24
0.66
0.22
0.06
0.06
0.90
0.09
0.24
0.18
0.85
0.13
0.84
0.14
0.48
0.25
0.64
0.23
0.31
0.21
0.84
0.13
0.95
0.05
0.53
0.25
0.11
0.10
Efectos Marginales
Promedio
0.10
0.68
0.63
0.16
0.24
0.52
0.36
0.38
0.71
0.65
0.60
0.38
0.15
0.70
0.28
0.00
0.02
0.02
0.01
0.01
0.02
0.01
0.01
0.02
0.02
0.02
0.01
0.00
0.02
0.01
0.09
0.58
0.53
0.14
0.20
0.44
0.30
0.32
0.59
0.55
0.51
0.32
0.12
0.59
0.23
0.36258
0.01221
0.30518
Donde los efectos marginales (como cambia la probabilidad ante cambios en X) individuales
se calculan del siguiente modo:
Pi / Xi = [ Pi / Z ] [ Z / Xi ]
Donde:
Z = i Xi
Z / Xi = i
Pi = 1 / [ 1 + e Z ]
Pi / Z = e Z / ( 1+ e Z ) 2
Pi * ( 1 - Pi ) = ( 1 / [ 1 + e Z ] ) ( 1 (1 / [ 1 + e Z ] )) = e Z / ( 1+ e Z ) 2
321
Con las estimaciones anteriores, podemos sealar que los efectos marginales individuales
(para cada variable explicativa del modelo) resultan en:
i * Pi ( 1- Pi )
El efecto marginal promedio, sera la sumatoria de la expresin anterior entre el nmero de
datos. El programa Stata tambin computa los efectos marginales para ello, una vez estimado
el logit, se usa el comando margins, del modo que se ve en la figura 8.10, donde dy/dx es el
indicador de efecto marginal.
Otros valores que nos ayudarn a estimar indicadores de ajuste del modelo son los
estimados de las funciones logit de verosimilitud que ya hemos visto anteriormente. As se
cuentan con dos estimados, uno es L (M), donde M indica el mximo nmero de iteraciones
realizadas para el modelo y el otro es L(0) para la iteracin de inicio.
Fig. 8.10 Estimacin de efectos marginales con Stata
. . margins, dydx(Promed_inicial Nota_diagn Aplica_met)
Average marginal effects
Number of obs
Model VCE
: OIM
Expression
: Pr(Nota_final), predict()
32
Delta-method
dy/dx
Std. Err.
P>|z|
Promed_inicial
.3625808
.1094412
3.31
0.001
.1480801
.5770815
Nota_diagn
.0122084
.0177942
0.69
0.493
-.0226675
.0470843
Aplica_met
.3051777
.0923796
3.30
0.001
.1241171
.4862383
Cada iteracin en la funcin de verosimilitud, supone el uso de los parmetros del modelo, as
podemos sealar que:
L(0), estima la funcin de verosimilitud considerando que es:
322
Yi * Ln Pi + (1 - Yi ) * Ln (1 - Pi )
Donde Yi es el estimado de la funcin logit usando slo el parmetro constante, que en
nuestro modelo de ejemplo es -13.021, as el valor de Yi es:
Yi = e Zi = 0.000002213
Como vemos el resultado es una constante. Con esos datos nos aproximamos al valor de L (0),
que en el modelo result - 20.59. Donde Pi proviene de la tabla 8.9.
L(5) la mxima iteracin lograda en el modelo de ejemplo, se estim considerando que es:
Pi * Ln Pi + (1 - Pi ) * Ln (1 - Pi )
Donde:
Pi = e Z / (1+ e Z )
El valor de Z incluye todos los parmetros del modelo, la tabla 8.9 ya muestra los clculos de
Pi, en este caso slo se ha procedido a hallar los logaritmos y ponderarlos. Con estos datos el
valor de L(5) para las iteraciones realizadas con todos los parmetros fue de -12.88.
La tabla siguiente muestra los clculos:
Tabla 8.13 Estimacin del logaritmo de verosimilitud LM (5)
Pi
0.03
0.06
0.19
0.03
0.57
0.03
0.03
0.05
0.11
0.69
Ln Pi
-3.628
-2.822
-1.675
-3.653
-0.562
-3.356
-3.630
-2.965
-2.197
-0.366
Ln (1 - Pi)
-0.027
-0.061
-0.207
-0.026
-0.844
-0.035
-0.027
-0.053
-0.118
-1.183
Pi Ln Pi
-0.096
-0.168
-0.314
-0.095
-0.320
-0.117
-0.096
-0.153
-0.244
-0.254
[ Pi Ln Pi ] +
(1- Pi )( Ln (1 - Pi)) [ (1- Pi )( Ln (1 - Pi)) ]
-0.026
-0.123
-0.058
-0.226
-0.169
-0.482
-0.026
-0.120
-0.363
-0.683
-0.034
-0.151
-0.026
-0.122
-0.050
-0.203
-0.105
-0.349
-0.362
-0.616
323
0.02
0.19
0.32
0.19
0.36
0.03
0.05
0.04
0.59
0.66
0.06
0.90
0.24
0.85
0.84
0.48
0.64
0.31
0.84
0.95
0.53
0.11
-3.710
-1.661
-1.132
-1.644
-1.019
-3.500
-2.926
-3.255
-0.528
-0.414
-2.791
-0.100
-1.420
-0.160
-0.176
-0.732
-0.453
-1.180
-0.172
-0.056
-0.637
-2.198
-0.025
-0.211
-0.389
-0.215
-0.448
-0.031
-0.055
-0.039
-0.891
-1.081
-0.063
-2.352
-0.277
-1.911
-1.822
-0.656
-1.009
-0.367
-1.843
-2.907
-0.753
-0.118
-0.091
-0.316
-0.365
-0.318
-0.368
-0.106
-0.157
-0.126
-0.311
-0.274
-0.171
-0.090
-0.343
-0.136
-0.148
-0.352
-0.288
-0.363
-0.145
-0.053
-0.337
-0.244
-0.024
-0.171
-0.264
-0.173
-0.286
-0.030
-0.052
-0.038
-0.366
-0.367
-0.059
-0.224
-0.210
-0.283
-0.295
-0.340
-0.368
-0.254
-0.292
-0.159
-0.355
-0.105
LM (5)
-0.115
-0.486
-0.629
-0.491
-0.654
-0.135
-0.209
-0.163
-0.677
-0.641
-0.231
-0.314
-0.553
-0.419
-0.442
-0.692
-0.656
-0.617
-0.437
-0.212
-0.691
-0.349
-12.8896
Hay que notar que L(4) y L(5) muestran el mismo valor, esto indica que la funcin de
verosimilitud en realidad hizo 4 combinaciones de las variables explicativas, quedndose con
aquella que dio el mximo valor (son nmeros negativos) y que corresponde al empleo de todas
las variables del modelo.
Con estas estimaciones de la funcin L, se procede a calcular indicadores globales de ajuste,
como el Seudo R2, conocido tambin como R2 de Mc Fadden (1974):
Seudo R2 = 1 - [ L (M) / L (0) ]
324
325
Los modelos Logit tienen indicadores de ajustes global como el R2 de Mc Fadden, o el de Cox
Snell, ambos indican el grado de explicacin de las variables independientes sobre la variable
respuesta. Los parmetros se validan mediante un ratio z de distribucin o el ratio Wald, asimismo
se procura estimar los impactos de cada parmetro mediante los efectos marginales, que miden cual
es la variable de mayor efecto en la probabilidad estimada.
327
Preguntas de opinin
1. Disee un logit agrupado para medir la productividad agrcola.
2. Disee una encuesta breve para un logit individual que mida las causas del
desempleo temporal.
3. El logit es mejor que el modelo de probabilidad lineal?
4. Cundo usar un logit multinomial?
5. Explique Por qu el test de Wald debe ser mayor a 4?
328
Caso de aplicacin
Lectura previa
Zegarra et al (2007) encontraron una asociacin positiva entre la actividad minera y los gatos
e ingresos de las familias urbanas, pero no se encontraron efectos en las familias rurales, no
obstante ellos afirman que si es posible encontrar menor pobreza en zonas donde hay actividad
minera comparada con zonas donde no existe dicha actividad.
Otros hallazgos vinculados a su estudio indican que la agricultura rural en general, no ha
sufrido desplazamientos producto de la actividad minera, excepto zonas en donde se produce
alta competencia entre ambas actividades, como el centro del pas.
Las evidencias por zonas indican que la sierra norte ha tenido mejoras de ingreso, mientras
que la sierra sur se ha visto afectada con mayor pobreza. Ahora en el caso de los hogares
estudiados por Zegarra et al (2007), se hallan evidencias de impacto positivo de la minera en
aquellos hogares donde el jefe tienen mayor nivel educativo, mientras que en grupos de mayor
pobreza y vulnerabilidad (menos calificacin) el impacto de la minera puede ser hasta negativo.
En el caso del norte, Aragon y Rud (2009) encuentran que el efecto de la minera es concreto,
ellos hallan incrementos del ingreso de 1.7% relacionado con al menos 10% de las compras que
las empresas mineras realizan en la regin o distrito de influencia, en esa lnea dicha mejora de
los ingresos sustenta un aumento del bienestar y reduccin de la pobreza.
Estudios de Macroconsult (2012) indican que la minera si impacta en la pobreza, as zonas
con actividad minera comparables con otras que no lo son, tienen menores ndices de pobreza,
los efectos son mayores si se trata de la gran minera, mientras que la pequea minera apenas
genera una reduccin de pobreza de 1.4% entre hogares no pobres y pobres.
En materia de indicadores sociales, la minera reduce los efectos de la desnutricin infantil
hasta en 6% y reduce el analfabetismo en 5%, mientras que la pequea minera aumenta el
efecto de la mortalidad infantil en 5% (explicada por la incidencia negativa de zonas pobladas sin
servicios, contaminadas e infecciosas). En ambos casos, esas medidas son los mayores
impactos en variables sociales entre hogares vinculados a la minera y aquellos que no.
Kunanayagam et al (2000) seala que la minera puede tener efectos positivos en la
macroeconoma del pas, pero tambin efectos directos en los hogares, puesto que es posible
encontrar efectos contaminantes en el aire, agua y suelo que afecten la productividad.
329
Es posible que el desarrollo humano, junto a la salud de los trabajadores formales informales
vinculados al rubro minero, se deterioren e inclusive pueden surgir actividades ilegales en torno a
la minera que generan empleos precarios y de alto contagio de enfermedades.
Hay efectos ms institucionales por ejemplo en la corrupcin local, o en la solidez de las
finanzas locales, por ejemplo la minera eleva los precios de los alimentos y otros bienes,
adems de afectar el valor de la moneda local, esto puede ser el lado negativo del incremento de
los ingresos, considerando adems que las poblaciones locales sufren evidentes cambios en sus
perfiles socio culturales.
Preguntas
1. Cmo diseara un modelo (o modelos) LOGIT para medir los efectos de la minera
en los hogares, incluya las variables a usar?
2. Cmo tomara la informacin o que fuentes de datos necesita?
3. Qu valores o signos deben tener los parmetros para explicar el efecto de la
minera en los hogares?
330
Ejercicios
Si consideramos que la tasa de inters en moneda extranjera para un pas cualquiera sube,
entonces esto promueve la entrada de capitales y el tipo de cambio expresado en la moneda
local debera bajar (por ejemplo en soles por dlar). Al revs, menores tasa de inters por la
moneda extranjera suponen que el tipo de cambio debe subir en moneda local, esto se da por la
salida de moneda extranjera del pas.
En buena cuenta, si las tasas de inters se reducen, es ms probable que suban los tipos de
cambio en moneda local o que la moneda local se deprecie.
El modelo previo puede expresarse del siguiente modo:
F = St * ( 1+ i en moneda local t ) / ( 1+ i en Moneda extranjera t )
Donde F se expresa en dlares por sol y S tambin, F es el tipo de cambio esperado, as un
crecimiento de la tasa en moneda extranjera implica una cada de F (cae en dlar por sol), lo que
a su vez indica un alza de la moneda en soles por dlar. Esto valida la intuicin de la salida de
capitales por menor rendimiento local frente a la moneda extranjera (medido en tasas de inters
pasivas).
Entonces podemos plantear el modelo siguiente:
Y=a+bX+e
Donde Y es la probabilidad lineal de que suba el tipo de cambio en dlares por sol, en buena
cuenta la probabilidad de que (F/S) sea creciente. Considere que Y es 1 si F es creciente o tiene
variacin porcentual positiva (indicando lo que en economa se denomina apreciacin del sol o de
la moneda local pues requiere ms moneda extranjera por unidad) y cero de no ser as. Esto
puede expresarse del siguiente modo tambin:
F = St+1 = St* ( 1+ i en moneda local t ) / ( 1+ i en Moneda extranjera t )
St+1 / St = ( 1+ i en moneda local t ) / ( 1+ i en Moneda extranjera t )
Donde:
331
TC Nominal Interbancario
Venta - promedio
mensual (S/. por US$)
Tasa Pasiva
Promedio en
Moneda Nacional
(TIPMN)
Tasa Pasiva
Promedio en
Moneda Extranjera
(TIPMEX)
Oct12
2.5883000
2.4000
0.7000
Nov12
2.599142857
2.4423
0.8703
Dic12
2.567045635
2.3700
0.8860
Ene13
2.552474026
2.3774
0.9752
Feb13
2.579000000
2.3671
1.1500
Mar13
2.594601504
2.2871
1.1213
Abr13
2.598584416
2.3090
0.9172
May13
2.646616883
2.3039
0.7265
Jun13
2.750819549
2.3187
0.6263
Jul13
2.778047619
2.3271
0.5968
Ago13
2.802897959
2.3158
0.5448
332
Sep13
2.77937415
2.3467
0.4763
Oct13
2.770027211
2.3432
0.4461
Nov13
2.799300000
2.3327
0.4367
Dic13
2.787042857
2.2697
0.4074
Ene14
2.810006494
2.2552
0.3700
Feb14
2.813221429
2.2636
0.3493
Mar14
2.807285714
2.2732
0.3390
Abr14
2.795021429
2.2957
0.3400
May14
2.787659864
2.3419
0.3452
Jun14
2.795306122
2.403
0.3547
Jul14
2.78722449
2.3829
0.3548
Ago14
2.815619048
2.3319
0.3539
Sep14
2.865642857
2.324
0.3517
Fuente: BCRP
Preguntas
Considere los datos siguientes y estime el modelo previo, analice si se cumple la intuicin
aqu sealada o si requiere algunos ajustes al modelo.
Si el modelo es poco explicativo, qu otras variables pueden explicar la probabilidad de
que el sol se aprecie?
333
Referencias bibliogrficas
Aragon, F. Rud., J. (2009) The blessing of natural resources: Evidence from Peruvian gold mine.
DT 2009-015. BCRP.
Cox, D. R., and E. J. Snell. 1989. The Analysis of Binary Data, 2nd ed. London: Chapman and
Hall.
Greene, W. (2003) Econometric Analysis. Fifth Edition. Pearson Ed.
Gujarati, D. (2004) Econometra. 4ta Edic. Mc Graw Hill.
Hausman, R. Hwang, J. and Rodrick, D. (2005) What your export matters. NBER Working Papers
11905.
Imbs, J. and Wacziarg, R. (2003) Stages of Diversification. American Economic Review. Vol. 93
Issue 1.
Johnston, J. and Dinardo, J. (1997) Econometric Methods. Fourth Edition. Mc Graw Hill
Kunanayagam, R. McMahon, G. Sheldon, C. Strongman, J. and Weber, M. (2000) La minera y la
reduccin de la pobreza. Banco Mundial
Mc Fadden, D. 1974. Conditional logit analysis of qualitative choice behavior. In: Frontiers in
Economics, P. Zarembka, eds. New York: Academic Press.
Nagelkerke, N. J. D. 1991. A note on the general definition of the coefficient of determination.
Biometrika, 78:3, 691-692.
Novales, A. (1993) Econometra. Mc Graw Hill.
Rodrick, D. And Mc Millan, M. (2012) Globalization, structural change and Economic Growth.
NBER Working Papers 17143.
Wooldridge, J. (2009) Introductory Econometrics. A modern approach. Third Edition. Cengage
Learning.
Zegarra, E. Orihuela, C. y Paredes M. (2007) Minera y economa en los hogares en la sierra
peruana: Impactos y espacios de conflicto. DT Nro 51, GRADE.
334