Está en la página 1de 65

APUNTES DE ECONOMETRA

Werther G. Kern F. Ing. MBA


NOTA IMPORTANTE: ESTE ES UN SYLLABUS QUE PRETENDE SINTETIZAR LOS TEMAS DEL CURSO, POR LO TANTO ES UN SUSTITUTO MUY IMPERFECTO DE LAS CLASES PRESENCIALES. ESTE SYLLABUS NO HA SIDO SOMETIDO TODAVIA AL JUICIO DE UN COMIT EDITOR DE REVISION, POR LO TANTO PUEDE CONTENER ERRORES. ESPERO QUE UDS, ESTIMADOS ALUMNOS, LOS DETECTEN Y ME INFORMEN PARA EFECTUAR LAS CORRECCIONES NECESARIAS PARA UNA SEGUNDA VERSIN DE MEJOR CALIDAD.

Clase 1 Definicin de Econometra

Disciplina de las Ciencias Sociales que se preocupa de la medicin a travs de modelos de los fenmenos econmicos del mundo. El eje central de este tema se encuentra en la inferencia estadstica a partir de datos de una muestra, de relaciones micro y macroeconmicas. Estas relaciones pueden ser simples (definida por un variable que explica y una variable explicada) o complejas (mltiples variables que explican, e incluso los modelos pueden ser constituidos por ms de una ecuacin). La econometra puede ser definida como el anlisis cuantitativo de los fenmenos econmicos reales (IMACEC, PGB, IPC, etc), basados en el desarrollo simultneo de la teora y la observacin.. Estos fenmenos involucran los siguientes problemas que aborda la economa : a) El comportamiento humano y las comportamiento se derivan para la sociedad. b) consecuencias que de dicho

El comportamiento humano en relacin con sus necesidades.

c) La utilizacin de los recursos que son escasos. La escasez es relativa, ya que los recursos son limitados porque los deseos humanos son prcticamente ilimitados y crecientes. d) Distribucin y uso de problema de la eleccin. estos recursos (bienes y servicios), esto da lugar al

El arte del econometrista consiste en encontrar el conjunto de supuestos que sean suficientemente especficos y realistas, de tal forma que le permitan aprovechar de la mejor manera los datos que tiene a su disposicin. La econometra permite asociar otras disciplinas entre s, tales como la teora econmica, la economa matemtica, la estadstica econmica y la estadstica matemtica. Mientras la teora econmica hace afirmaciones o postula hiptesis de naturaleza principalmente cualitativa, no proporcionando medida numrica alguna de la relacin entre los distintos factores (no dice en qu magnitud aumentar o se reducir la cantidad), la economa matemtica expresa la teora econmica en una forma matemtica (ecuaciones), sin preocuparse por la capacidad de medicin o de verificacin emprica de la teora y la estadstica econmica se relaciona principalmente con la recoleccin, procesamiento y presentacin de las cifras econmicas (informacin clave en el desarrollo de la econometra), en forma de grficos y tablas. Luego de esto, es donde acta la 2

econometra, aprovechando las bases de la estadstica matemtica, la cual proporciona muchas de las herramientas utilizadas, con el fin de probar o refutar la validez de las teoras econmicas. El tema central de la econometra son las regresiones, las cuales en funcin de las variables consideradas en el estudio de los fenmenos econmicos se dividen en dos:

Regresin Simple y = f (x) Regresin mltiple y=f(x,z,w,k)

Donde x,z,w,k son variables explicativas o independientes e y es la variable explicada o dependiente. Si se estudia la dependencia de una variable en una nica variable explicativa, como es el caso del gasto de consumo sobre el ingreso real, dicho estudio es conocido como el anlisis de regresin simple, o con dos variables. Sin embargo, si se estudia la dependencia de una variable (como el producto de una cosecha) en ms de una variable explicativa (como la lluvia, la temperatura, el sol y los fertilizantes), ste se conoce como anlisis de regresin mltiple En el caso de la regresin mltiple, donde es difcil trabajar con ms de una variable explicativa, se utilizan programas computacionales que facilitan el trabajo, tales como E-Views, Excel, SPSS, SAS, Stata, RATS, TSP, WinBugs, entre otros.

Metodologa para la constitucin de un modelo Economtrico 1.-) Recopilacin de informacin respecto de variables relevantes para explicar un fenmeno econmico. Principio de Wilfredo Pareto Wilfredo Pareto seala que el 20 % de las variables causan el 80 % de los efectos, es decir, pocas fundamentales y varias irrelevantes. Por tanto, si queremos modificar los efectos tenemos que ubicar solamente el 20% de las variables ms importantes que darn el 80% de los resultados. La aplicacin de este concepto permite identificar en forma clara y objetiva hacia dnde enfocar los esfuerzos al centrar la atencin en aspectos verdaderamente importantes de una situacin, este principio se conoce como "principio de Pareto.

Regla del 80-20

2.-) Planteamiento de una hiptesis La formalizacin de la hiptesis o sospecha del econometrista debe partir de una lgica bsica. Proviene fundamentalmente del rea de la teora econmica o del sentido comn. Ejemplo : Hiptesis 1 : Sospecho que si maana elevo la tasa general de impuesto la recaudacin tributaria va a reducirse

Curva de Laffer :

(tasa de impuesto promedio)

t2 = nivel ptimo de impuestos 3.-) Planteamiento de un modelo matemtico. Ejemplo : Se sugiere la siguiente forma de la funcin demanda-precio :

Q = a + b P

Ecuacin lineal 0 < 1< 1

Qx = 0 + 1 Px

Donde Qx = cantidad demandada de un bien y Px = precio del bien, y donde 0 y 1 son conocidos como los parmetros del modelo, correspondiendo respectivamente, a los coeficientes de interseccin y pendiente de la recta.

4.-) Planteamiento de un modelo economtrico. Es la interpretacin economtrica de los parmetros. Es el inicio de una comprobacin emprica del modelo. Ejemplo 1 :
x

Px+ i

En este caso, se utilizan las mismas variables mencionadas en el ejemplo anterior, sin embargo, stas tienen una variante debido a que los valores obtenidos en el modelo economtrico, exceptuando Px, son estimaciones muestrales, por tanto, se designan con un gorro ( ^ ).

5.-) Realizacin de un procedimiento estadstico. El siguiente paso es estimar numricamente los indicadores del modelo economtrico, tambin llamados parmetros, estimadores o coeficientes de regresin. Esto equivale a calcular en regresin lineal cunto valen respectivamente. Para la estimacin de Ordinarios (MCO).
0 0

utilizamos el mtodo de Mnimos Cuadrados

6.-) Validacin del modelo. Se debe comprobar si la afirmacin es aceptada o rechazada. 5

Para aceptar o rechazar una hiptesis, se plantea respectivamente : En el caso de


1= 1 1

H0 = H1 =

0
o

- En el caso de H0 = H1 =
0= 0

Esto significa verificar la significancia estadstica o el grado de representatividad de los estimadores obtenidos, es decir, qu tan efectivos son estos estimadores muestrales respecto de la poblacin. Esto se realiza mediante inferencia estadstica (pruebas de hiptesis) como lo son la t de Student, la F de Snedecor y en ocasiones se utiliza la distribucin normal y la R2.

7.-) Aplicacin Poltica y/o aplicacin de toma de decisiones. La econometra es una herramienta de toma de decisiones dentro de la empresa o el gobierno. Ejemplo : Proponer medidas frente a un alza en el nivel de desempleo basado en un PIB estimado del modelo economtrico correspondiente.

Metodologa segn Damodar Gujarati

Se presenta a continuacin la anatoma de la elaboracin de modelos economtricos, segn Damodar Gujarati.

Formulacin de una Hiptesis

Modelo matemtico de la hiptesis

Modelo economtrico de la hiptesis

Datos

Estimacin del modelo economtrico

Prueba de Hiptesis

Pronstico o prediccin

Uso del modelo para fines de control o de poltica

Naturaleza y Fuentes de Informacin para el Anlisis Economtrico.

An cuando un modelo economtrico fuese realizado con gran prolijidad y utilizando abundante cantidad de datos, puede no estar explicando los fenmenos econmicos de una manera significativa, si lo datos recopilados no fueron obtenidos de una fuente confiable y responsable. Por tanto, el xito de cualquier anlisis economtrico depende en ltimo trmino de la disponibilidad de informacin apropiada.

Tipos de datos Puede haber tres tipos de datos disponibles para el anlisis emprico: series de tiempo, series de corte transversal e informacin combinada. Series de tiempo : Una serie de tiempo es un conjunto de observaciones sobre los valores que toma un variable en diferentes momentos del tiempo. Tal informacin debe ser recopilada a intervalos regulares, es decir, en forma diaria (precios de acciones), semanal (cifras de oferta monetaria), mensual (tasa de desempleo e ndice de Precios al Consumidor), trimestral (el PIB), anual (presupuestos de gobierno), quinquenal (censo manufacturero), o decenalmente (censos de poblacin). Algunos datos estn disponibles en ms de un periodo, por ejemplo, el PIB y los gastos de consumo, son entregados trimestral y anualmente. Series de Corte Transversal (cross-section): La informacin de Corte Transversal consiste en datos de una o ms variables recogidos en el mismo momento del tiempo, tales como el censo de poblacin realizado por la Oficina del Censo cada 10 aos y las encuestas de opinin. Informacin combinada : los datos agrupados tienen elementos de series de tiempo y de corte transversal reunidos. - Datos longitudinales de panel o micropanel : Hay un tipo especial de datos agrupados, tambin llamada informacin micropanel, en la cual la misma unidad de corte transversal (una familia o una empresa) es encuestada a travs del tiempo. Por ejemplo, el Ministerio del Trabajo y Previsin Social (MINTRAB) del Gobierno de Chile, realiza cada dos aos la Encuesta de Proteccin Social (EPS). Para cada encuesta peridica se entrevista a la misma unidad familiar con el fin de indagar respecto de las expectativas de vida, composicin del hogar, informacin laboral e ingresos de los trabajadores y sistema de pensiones, entre otros; en relacin a la percepcin y accionar de la ciudadana en temas de Proteccin Social.

Regresiones

Orgenes Thomas Robert Malthus es considerado el padre de la Demografa. En 1798 presenta un Ensayo sobre el principio de la poblacin, en el que expone el principio segn el cual la poblacin humana crece en progresin geomtrica, mientras que los medios de subsistencia lo hacen en progresin aritmtica. As, llegar un punto en el que la poblacin no encontrar recursos suficientes para su subsistencia (catstrofe maltusiana). Adems, segn Malthus, los recursos para la vida estn limitados y, cuando se hayan agotado, la vida humana desaparecer. El primero en mencionar el trmino de regresin fue Francis Galton. En un famoso artculo plante que, a pesar de la tendencia en la que los padres de estatura alta tenan hijos altos y los padres de estatura baja tenan hijos bajos, la estatura promedio de los nios nacidos de padres de una estatura dada tenda a moverse o regresar hacia la estatura promedio de la poblacin. La ley de Regresin Universal de Galton fue confirmada por su colega Karl Pearson, quien reuni ms de mil registros de estaturas de miembros de grupos familiares. En palabras de Galton, se trataba de una regresin hacia la mediocridad.

1,75 1,65 1,62 1,55

Cabe hacer notar, que la recta, conocida como recta de regresin, tiene una pendiente positiva; sin embargo, la pendiente es menor que 1 (m<1), esto significa que tiende hacia la mediocridad, debido a que los extremos tienden a nivelarse. En otras palabras, los datos obtenidos en una muestra tienden a valores medios o mediocres.

Interpretacin moderna de Regresin La interpretacin moderna de la regresin es bastante diferente a lo planteado en los inicios del concepto. Actualmente se entiende como el estudio de la dependencia de la variable dependiente, respecto a una o ms variables (variables explicativas), con el objetivo de estimar y/o predecir la media o el valor promedio poblacional de la primera en trminos de los valores conocidos o fijos (en muestras repetidas) de las ltimas.

Debe existir Causalidad en la Regresin? En el anlisis de regresin nos interesa lo que se conoce como dependencia estadstica entre variables. En ste se trata esencialmente con variables aleatorias o estocsticas, esto es, variables que tienen distribuciones de probabilidad, por lo tanto, puede tomar cualquier conjunto de valores, positivos o negativos, y permite errores en sus resultados. Este tipo de relacin es tambin llamado no determinstico. Estas variables aleatorias o estocsticas dependen de otras variables no aleatorias, lo que no implica causalidad necesariamente. Esto se explica de la siguiente forma : una relacin estadstica, sin importar qu tan fuerte y sugestiva sea, nunca podr establecer una conexin causal: nuestras ideas de causalidad deben venir de estadsticas externas y, en ltimo trmino, de una u otra teora (Kendall y Stuart), lo que deja en claro que una relacin estadstica no puede por s misma implicar en forma lgica una causalidad.

10

Clase 2. Nomenclatura de la Regresin Simple

En la regresin simple slo existen dos variables involucradas, x e y, donde x es la variable explicativa o independiente a la cual le hacemos tomar valores fijos, por tanto se convierte en una variable de control, e y es la variable explicada o dependiente, la cual se denomina tambin como variable aleatoria o estocstica, puesto que en ella existe una esperanza matemtica o promedio, y es posible la dispersin de sus valores. La expresin estndar de la funcin de regresin muestral corresponde :

i=

Xi

Y se observa grficamente en forma simblica :

Y FRM (*) 6 5 4 3 2 1

X1

X2

X3

X4

X5

X6

(*) Funcin de Regresin Muestral : Valores de la recta

Considerando una serie de datos muestrales (puntos en el plano), correspondientes al comportamiento de la ordenada sobre Xi, se puede encontrar

11

un valor medio de todos los Yi para cada Xi, a estos valores medios se les denomina i. Por consiguiente :

Y FRM
Observacin Yi

i
1

Valor medio estimado

Xi

i : error muestral, dispersin o perturbacin muestral. Yi : datos muestrales de la poblacin. i : valor medio estimado de la funcin de regresin.
1

: coeficiente de la pendiente interseccin con el eje de las ordenadas.

0:

Por lo tanto, podemos expresar los valores de Yi como la suma entre el valor esperado i y la desviacin de un Yi individual alrededor de su valor esperado de la siguiente manera: Yi = i + i Yi =
0

Xi i

Adems, despejando obtenemos :

i = Yi -

Xi

12

Funcin de Regresin Poblacional

La FRP se diferencia de la Funcin de Regresin Muestral (FRM), en que sus parmetros son estimados en base a todo el universo estudiado, es decir una FRP abarca todos los datos de la poblacin y en estos trminos, cualquier FRM pretende llegar a obtener esos valores, si es as, una FRM es confiable y se acerca al fenmeno real. Para reconocer una de otra, la nomenclatura de los componentes de la regresin es diferente. A cada valor perteneciente a la recta de regresin, que corresponde al valor medio de todos los Yi sobre su Xi respectivos, se les conoce como valores esperados condicionales, en vista de que dependen de los valores dados a la variable (condicional) X. En forma simblica se denota como E (Y/X), lo cual se lee como el valor esperado de Y, dado el valor X. Se debe distinguir entre valor esperado condicional y valor esperado incondicional E(Y). Este ltimo corresponde al promedio de todos los E(Y/X). Cuando se unen los valores de las medias condicionales, se obtiene lo que se conoce como la funcin de regresin poblacional (RRP), o en forma general, la curva de regresin poblacional (CRP). Los parmetros de la FRP no llevan gorro y se reconoce de dos formas : Estndar

E (Yi /Xi) =

1 Xi

Estadstica

Yi =

1 Xi + i

= E (Y/X) + i

13

Y Y1 1 E(Y1/X1)

FRM

i i
FRP

0
m=
0

m = 1
1

X1
I

Ejemplo : Tenemos el siguiente modelo :

20

15

Inversin = f (tasa de inters) FRM : I = 10 2 * ri FRP : I = 15 - 3 * ri Una observacin : (r, I ) = (4,20) r = variable explicativa I = variable explicada FRM = estndar : i = 10- 2 * ri estadstica : Ii = 10- 2 * ri + i FRP = estndar : E ( Ii / ri ) = 15 - 3 * ri estadstica : Ii = 15 - 3 * ri + i
i = 2 10 FRM

FRP

1 para X1 = 4
i para X1 = 4

1 = 18
i = 17 14

De lo anterior se concluye que el error es la distancia, desviacin o perturbacin entre un Yi individual y su valor esperado en la funcin de
regresin. Propiedades del error ( i ) : i = 0 i = 0 n ei = 0 Clculo de los parmetros (Frmulas generales para parmetros de Regresin Simple) La estimacin de los parmetros 0 y 1 se realiza comnmente mediante el clculo de los Mnimos Cuadrados Ordinarios (MCO). Este mtodo estadstico se atribuye a Carl Friedrich Gauss. Mnimos Cuadrados Ordinarios permite minimizar los errores, es decir, buscar estimadores del modelo que generen la menor distancia entre las observaciones y su valor medio estimado i. Cuadrados Ordinarios se refiere al trato que se le da a los errores, los cuales se estudian estando al cuadrado. La razn es que, al elevar al cuadrado los errores se hace manifiesto el real peso de stos, por lo tanto, las pequeas distancias son atenuadas y las grandes son incrementadas. Lo cual no sucede si no estuvieran al cuadrado, debido que a todos los residuos se les da la misma importancia sin considerar qu tan cerca o qu tan dispersas estn las observaciones individuales de la FRM. Respecto a lo anterior, es muy posible que la suma algebraica de los errores sea pequea (an cero) a pesar de que los errores pudiesen estar bastante dispersos alrededor de la FRM.

i = Yi - i
min i 2 = (Yi - i )2 min i 2 = (Yi 0

Xi )2

15

Derivando la funcin con respecto a =

=
0

(Yi -

Xi )2

= 2 (Yi = -2 (Yi = (Yi = Yi - = Yi - n Yi = n


0 0 0

Xi ) * (-1) = 0 Xi ) = 0

Xi ) = 0
1

- +
1 1

Xi = 0

Xi = 0 Xi = 0

1
= Yi + n Derivando la funcin con respecto a
1=

Xi

(Yi -

Xi )2
1

= -2 (Yi = Yi Xi -
0

Xi ) * ( -Xi ) = 0
1

Xi -

Xi2 = 0

= Yi Xi -

Xi -

Xi2 = 0

16

Yi Xi =

Xi +

Xi2

Reordenando n
0

1 Xi 2 = Yi Sistema de ecuaciones

Reordenando

Xi +

Xi2 = Yi Xi

Aplicando el mtodo de Cramer :

n Xi

Yi Xi Yi = Xi Xi 2

nYi Xi - Xi Yi n X i 2 ( X i ) 2

=
n Xi

En base a esta demostracin se concluye que :

nYi Xi - Xi Yi
1

n X i 2 ( X i ) 2

17

Ejercicio 1 Calcule
0

con los siguientes datos.

Qd = f ( P ) Qd = 0 + 1 P

Precio (miles de $) 2 3 4 6 7

Qd(ton) 4 3 2 1 1

Segn la teora econmica el precio determina la cantidad demandada, por lo tanto, el precio es la variable explicativa (X) y la cantidad demandada es la variable explicada (Y). Se realizan a continuacin los clculos pertinentes para estimar los parmetros. P (Xi ) Qd (Yi) Xi 2 Xi Yi i 2 4 4 8 3,64 3 3 9 9 3,04 4 2 16 8 2,44 6 1 36 6 1,24 7 1 49 7 0,64 = 22 = 11 = 114 = 38
i

= 4,4 i = 2,2 Estimacin de los parmetros:


i

= =

2,2 (-0,6) * 4,4 = 4,84 nYi Xi - Xi Yi

1=

n X i 2 ( X i ) 2 18

= 5*38 - 22*11 = -0,6 5*114 - 484 Qd = 4,84 0,6 P

Ecuacin de la Regresin :

Qd

4,84

Si 1 es negativo significa que la pendiente de la funcin de regresin lineal es negativa.

Ejercicio 2 Se plantea una situacin simplificada, en la cual se impone la siguiente condicin : Xi = 0 i)


0 i

=0

n Yi Xi ii) n Xi 2 Esta simplificacin se presenta de dos maneras: serie par y serie impar, esta diferencia est determinada por n (nmero de datos de la muestra), es serie par cuando el nmero de datos es par y corresponde a serie impar cuando el nmero de datos es impar.En este ejercicio se desarrolla una serie impar, sin embargo, a continuacin, se muestra una simplificacin de serie par. t (aos) 1997 1998 1999 2000 2001 2002 2003 2004 t -3,5 -2,5 -1,5 -0,5 0,5 1,5 2,5 3,5 19
1

Posterior a esta modificacin, se procede a realizar los clculos con las frmulas propuestas. Utilizando los siguientes datos, estimar los parmetros: V (millones $) Yi 3 5 6 6 8 9 10 = 47 = 6,7 Estimacin de los parmetros : t (aos) Xi 1997 1998 1999 2000 2001 2002 2003 t -3 -2 -1 0 1 2 3 t = 0 v * t -9 -10 -6 0 8 18 30 v * t = 0 t 2 9 4 1 0 1 4 9 2 t = 28

= =

= 6,71 Yi Xi

= Xi 2 = 31/28 = 1,1

El modelo predictivo es : =
0

= 6,7 + 1,1 t
2007 2007

= 6,7 + 1,1 * 7 = 14,4

20

Clase 3 Coeficiente de correlacin r y de determinacin R2

Muy importante para la regresin es introducir el concepto de bondad de ajuste, que se refiere a cun cerca estn los puntos del diagrama de dispersin de una lnea recta. Asociado al concepto de bondad de ajuste aparecen muchos indicadores, entre ellos se encuentran el coeficiente de correlacin (r) y el de determinacin (R2). El coeficiente de correlacin r es una medida de la intensidad de la relacin entre dos variables. Requiere datos con escala de intervalo o de razn (variables), los cuales pueden tomar valores entre -1 y 1. Valores de -1 o 1 indican correlacin fuerte y perfecta. Valores cercanos a 0 indican correlacin dbil. Valores negativos indican una relacin inversa y valores positivos indican una relacin directa.

Su cuadrado, R2, denominado coeficiente de determinacin, puede interpretarse como el porcentaje de variabilidad de la variable explicada o el porcentaje de variacin debida a la recta de regresin. En este sentido, R2 mide el poder explicatorio del modelo lineal, en otras palabras, mide cunto pesa la relacin causa-efecto entre variables. Sus valores fluctan entre 0 y 1, siendo 1 el que tiene mayor poder explicatorio o ajuste perfecto y 0 manifiesta total independencia entre las variables. R2 [ 0 , 1 ] r [-1, 1 ]

21

Y Yi FRM

R2 = relacin entre estas dos distancias.

Xi

Se sabe que: SCR = 1 SCE SCT SCT es decir, R2 = 1 SCE SCT

Se demuestra de la siguiente manera : Yi = i + i (Yi (Yi i

/ (i

I)

) = ( i )2 = ( i -

) + (i)
i

/ ( )2
i

)2 + (i)2 + 2 ( i -

) (i)

(Yi (Yi SCT

)2 = ( i )2 = ( i +

)2 + (i)2 + 2 ( i )2 + (i)2 SCE

) (i)

= SCR

SCT = SCR + SCE SCT SCT SCT

22

R2 = 1 SCE SCT

R=

SCE SCT

El coeficiente de determinacin, R2, depende del tamao de la muestra. Una muestra con 20 o ms datos puede ser considerada significante. Sin embargo, a pesar de tener un coeficiente de determinacin alto, que implica que la mayor parte de las variables son explicadas en el modelo, no se puede considerar como un procedimiento suficiente. Debemos necesariamente, recurrir a mtodos adicionales de inferencia estadstica. Incluso, el R2 puede determinar errnamente la dependencia entre variables (entrega un coeficiente alto), cuando estamos en presencia de multicolinealidad.

Ejercicio 3 Calcular R2 e interpretar resultados.


$/ US$ Tipo de cambio
Valor de las exportaciones chilenas (en millones de dlares)

500 550 600 670 700 600 600 500

12 10 10 13 15 20 30 30

El tipo de cambio es la variable explicativa (X) y el valor de las exportaciones chilenas es la variable explicada (Y). Se realizan a continuacin los clculos pertinentes para estimar los parmetros.

23

Xi 500 550 600 670 700 600 600 500 = 4720


i

Yi 12 10 10 13 15 20 30 30 = 140
i=

Xi 2 250000 302500 360000 448900 490000 360000 360000 250000 = 2.821.400

Xi Yi 6000 5500 6000 8710 10500 12000 18000 15000 = 81.710

= 590

17,5

Estimacin de los parmetros:


0

= =

17,5 (-0,0243) * 590

= 31,837 nYi Xi - Xi Yi

1=

n X i 2 ( X i ) 2
1

= (8 *81.710) (4720* 140) 8 *2.821.400 22.278.400 = - 0,0243

Ecuacin de la Regresin :

= i = 31,837 0,0243Xi
Y 31,837

Si 1 es negativo significa que la pendiente de la funcin de regresin lineal es negativa.

24

1 = 31,837 0,0243 * 500 = 19,687 2 = 31,837 0,0243 * 550 = 18,472 3 = 31,837 0,0243 * 600 = 17,257 4 = 31,837 0,0243 * 670 = 15,556 5 = 31,837 0,0243 * 700 = 14,827 6 = 31,837 0,0243 * 600 = 17,257 7 = 31,837 0,0243 * 600 = 17,257 8 = 31,837 0,0243 * 500 = 19,687

Yi 12 10 10 13 15 20 30 30

i 19,687 18,472 17,257 15,556 14,827 17,257 17,257 19,687

i (Yi - i )
-7.687 -8.472 -7,257 -2,556 0,173 2,743 12,743 10.313 =0

i2
58,6756 71,5716 52,7076 6,6564 0,0196 7,5076 162,3076 106,9156
=466,3616

(Xi - )2 8100 1600 100 6400 12100 100 100 3100


= 36.600

( i - )2 4,6656 0,9216 0,0576 3,6864 6,9696 0,0576 0,0576 4,6656

(Y i - )2 30,25 56,25 56,25 20,25 6,25 6,25 156,25 156,25

=21,0816 = 488

Clculo del Coeficiente de Determinacin: R2 = SCR = ( i SCT


(Y i -

)2 )
2

= 21,0816 = 0,0432 488

Interpretacin de resultados: Los parmetros del modelo no son significativos, puesto que slo el 4% de los datos son explicados.

25

Clase 4. Pruebas de Significancia Debido a que el coeficiente de determinacin (R2), no es un estimador suficiente de la significancia del modelo, es necesario recurrir a otras pruebas de inferencia estadstica, para concluir si el fenmeno estudiado est siendo bien explicado por el modelo de regresin.

t de Student Corresponde a una prueba de hiptesis para observar la significancia de los parmetros, es decir, qu tanto se parece (estimador muestral) de (estimador poblacional). Si el parmetro de la prueba resultase 0, no hay modelo. Donde tci = parmetro de t de Student

tci =

t (tabla)

= desviacin estndar de los parmetros ( )


0,95 = 0,5 g. de libertad = n - k

t (tabla)

n = tamao de la muestra. k = n de parmetros

En caso de no tener la tabla t de Student a mano, se toma como referencia el valor 2, ya que todos los valores tienden a l.
X i
2

donde, (

0)

2 i

n (n-2) * (Xi - )2

26

y (

1)

i2

(n-2) * (Xi - )2

Analizaremos el mtodo mediante un ejemplo : Estimar la significancia de los parmetros al 95%, dada la siguiente informacin :
ndice % inflacin ndice % crecimiento del PIB

2 3 3 4 4

4 5 5 4 6

El ndice porcentual del crecimiento del PIB es la variable explicativa explicatoria (X) y la variacin en el ndice de inflacin corresponde a la variable explicada (Y). Se realizan a continuacin los clculos pertinentes para estimar los parmetros. Xi 2 16 25 25 16 36 = 118

Xi 4 5 5 4 6 = 24
i

Yi 2 3 3 4 4 = 16
i=

Xi Yi 8 15 15 16 24 = 78

= 4,8

3,2

27

Estimacin de los parmetros:


0

= =

3,2 0,4286* 4,8

= 1,1427

nYi Xi - Xi Yi
1=

n X i 2 ( X i ) 2
1

= (5 *78) (24*16) 5 *118 576 = 0,4286

Ecuacin de la Regresin :

= i =1,1427 + 0,4286Xi
Y

Si 1 es positivo significa que la pendiente de la funcin de regresin lineal es positiva.


1,1427

1 = 1,143 2 = 1,143 3 = 1,143 4 = 1,143 5 = 1,143

+ 0,4286 * 4 = 2,857 + 0,4286 * 5 = 3,286 + 0,4286 * 5 = 3,286 + 0,4286 * 4 = 2,857 + 0,4286 * 6 = 3,714

28

Yi 2 3 3 4 4

i 2,857 3,286 3,286 2,857 3,714

i (Yi - i )
-0,857 -0,286 -0,286 1,143 0,286 =0

i2
0,734 0,082 0,082 1,306 0,082
= 2,286

Xi -0,8 0,2 0,2 -0,8 1,2

(Xi - )2 0,64 0,04 0,04 0,64 1,44 = 2,8

Luego, se realiza el procedimiento de inferencia estadstica mediante la prueba de hiptesis t de Student. Planteamiento : H0 = H1 =
0= 0

Para comprobarlo se calcula

(
tc =

0)

X i

2 i

n (n-2) * (Xi - )2

118 * 2,286 5(5-2) * 2,8

= 2,534

= 1,143 = 0,451
0

2,534

Se concluye al 95% de confianza que 0,451 es menor que 2, por lo tanto, se acepta la hiptesis nula. El parmetro por lo tanto se dice que no es significante.
0

no es generalizable a la poblacin,

H0 = H1 =

1= 1

Para comprobarlo se calcula

0)

i2

(n-2) * (Xi - )2

2,286 (5-2)*2,8

= 0,522

29

tc =

= 0,4286 = 0,822
1

0,522

Se concluye al 95% de confianza que 0,822 es menor que 2, por lo tanto, se acepta la hiptesis nula. El parmetro
1

no es inferible a la poblacin.

30

Clase 5. Formas funcionales

Modelos lineales-lineales En estos modelos de representan relaciones que enfrentan variaciones absolutas de las variables explicatorias y variaciones absolutas de la variable explicada. En este caso el parmetro Beta cero, representa el valor autnomo de la variable explicada independiente del efecto de las variables explicatorias del modelo. En tanto, los betas que acompaan a cada una de las variables representan las sensibilidades parciales de la variable explicada frente a variaciones unitarias absolutas de cada variable explicatorio. Para las interpretaciones es fundamental considerar las unidades en que se estn expresando las variables en el modelo. Por ejemplo, en el siguiente modelo de regresin lineal, del tipo lineal-lineal: M = 20.000 + 500*PIB Donde: M = Valor de importaciones anuales de un pas, expresado en US$ millones. PIB = Producto interno bruto anual de un pas, expresado en miles de millones de dlares. En este caso el valor del beta cero, 20.000, representa el valor autnomo de importaciones anuales de un pas sin considerar el efecto del PIB. Dicho nivel de importaciones ser, entonces de 20.000 millones de dlares. Por otra parte, el valor de beta uno, 500, representa la variacin absoluta que experimenta el valor de las importaciones ante variaciones absolutas unitarias del PIB. Por lo tanto, en este caso el valor de las importaciones crecer positivamente en 500 millones de dlares por cada mil millones que aumente el PIB anual del pas. El valor 500 corresponde a la sensibilidad absoluta de las importaciones, ante variaciones absolutas unitarias del PIB

31

Modelos doble logartmicos En estos modelos, de uso frecuente en estudios de econometra, se representan relaciones que enfrentan variaciones relativas de las variables explicatorias y variaciones relativas de la variable explicada. Los valores de los parmetros de estimacin que acompaan a cada variable explicatoria, corresponden a elasticidades (variacin porcentual de la variable explicada, ante una variacin de un 1% en la variable explicatorio, a la cual acompaa el parmetro en cuestin) Por ejemplo, en el siguiente modelo de regresin lineal, del tipo logartmicologartmico: Ln Qdx = 10 0,4*lnPx Donde: Qdx = miles de Kg de pan demandados anualmente en una comuna. Px = Precio del pan en unidades monetarias por kg. En este caso el valor del antilogaritmo natural de beta cero (10) representa el valor autnomo de la cantidad anual de Kg demandados en una comuna, independiente del efecto del precio del pan. Dicho nivel de ser, entonces de 3.269 miles de Kg de pan, en un ao. Por otra parte, el valor de beta uno, -0,4, representa la variacin relativa que experimenta la cantidad demandada de pan ante variaciones relativas unitarias del precio. Por lo tanto, en este caso, la cantidad demandada de pan decaer en un 0,4%, por cada 1% que aumente el precio del pan. El valor -0,4, corresponde a la elasticidad demanda-precio del pan estimada para una comuna.

32

Modelos lineales logartmicos En estos modelos de representan relaciones que enfrentan variaciones relativas de las variables explicatorias y variaciones absolutas de la variable explicada. Por ejemplo, en el siguiente modelo de regresin lineal, del tipo lineal-logartmico: IPC = 134,5 + 4*lnG Donde: IPC = ndice de precios al consumidor (mensual) G = Gasto gubernamental mensual de un pas, expresado en miles de millones de pesos. En este caso el valor del beta cero (134,5) representa el valor autnomo del ndice IPC mensual, independiente del efecto del monto de gasto del gobierno. Dicho nivel de ser, entonces de 134,5 (unidades adimensionales del ndice IPC) Por otra parte, el valor de beta uno, 4, representa la variacin absoluta que experimenta el valor del IPC ante variaciones relativas unitarias del gasto gubernamental. Por lo tanto, en este caso, el valor del IPC aumentar en 4 puntos de IPC, por cada 1% que aumente gasto del gobierno.

33

Modelos logartmicos lineales En estos modelos de representan relaciones que enfrentan variaciones absolutas de las variables explicatorias y variaciones relativas de la variable explicada. Por ejemplo, en el siguiente modelo de regresin lineal, del tipo logartmico-lineal: Ln X = 8 + 0,7*E Donde: X = Valor de exportaciones anuales de molibdeno por parte de un pas, expresado en US$ miles de millones E = Tipo de cambio nominal, expresado en unidades monetarias nacionales por dlar. En este caso el valor del antilogaritmo natural del beta cero (8) representa el valor autnomo de exportaciones anuales de molibdeno independientes del efecto del tipo de cambio nominal. Dicho nivel de exportaciones ser, entonces de 2.981 millones de dlares. Por otra parte, el valor de beta uno, 0,7, representa la variacin relativa que experimenta el valor de las exportaciones anuales de molibdeno ante variaciones absolutas unitarias del tipo de cambio nominal. Por lo tanto, en este caso el valor de las exportaciones de molibdeno crecer positivamente en un 0,7% por cada unidad que aumente el tipo de cambio nominal (una unidad monetaria nacional por dlar).

34

Clase 6. Regresin mltiple

Este tipo de regresin se presenta cuando dos o ms variables independientes influyen sobre una variable dependiente.

Y = f (x1, x2, x3, x4,, xm)


En este caso se trabaja con muchos y la funcin se extiende as :

Donde : a : media de Y cuando todas las Xi son cero, p.e. edad. Se interpreta como la media de Y que no depende de las Xi).

b : cambio en la media de Y cuando Xi aumenta una unidad


permaneciendo constantes las dems. La estimacin de los coeficientes ( ) se realiza igualmente a travs de la minimizacin de la sumatoria de los errores al cuadrado (MCO) o a travs de mxima verosimilitud y se obtienen los mismos resultados. En la regresin mltiple las frmulas son muy complejas, por este motivo, se trabaja con Matrices Y= X +

Y = vector columna de los valores de la variable explicada = vector columna de los parmetros estimados X = matriz de valores de las variables explicatorios = vector columna de los errores o perturbaciones Ejemplo : Las variables biolgicas suelen presentar multicorrelaciones. Por ejemplo, para estudiar el efecto del consumo de grasas saturadas en el nivel del colesterol

35

en sangre, se puede plantear un modelo de Regresin Lineal Simple, sin embargo, el nivel de colesterol puede depender tambin de otras variables: consumo de otras sustancias, ejercicio realizado, edad, factores metablicos genticos, etc. Si para cada valor del consumo de grasas, las dems variables se distribuyen aleatoriamente, la estimacin por RLS es adecuada y la variacin "debida" a las otras variables estara incluida en la variacin aleatoria alrededor de la regresin, pero en caso contrario la estimacin sera incorrecta, si por ejemplo, las costumbres dietticas variaran con la edad y sta influyera en el colesterol, una parte no cuantificada de la variacin del colesterol que el modelo atribuye al consumo de grasas sera debida a la edad. La regresin lineal mltiple (RLM) es un modelo que permite estudiar estos efectos.

Presentacin de la matriz : Y Y1 Y2 Y3
: ::

X X1 X2 X3
: :

Z Z1 Z2 Z3
: :

W W1 W2 W3
: :

Yn

Xn

Zn

Wn

Y1 Y2 Y3
:

1 1 1
:

X1 X2 X3
: :

Z1 Z2 Z3
: :

W1 W2 W3
:

1 2

3 n

1 2 3
:

: Yn

: 1

Xn

Zn

: :W n

= ( XT * X ) -1 * ( XT * Y ) Donde : XT = traspuesto

36

( X T * X ) 1 = inversa de X T * X

No obstante, estas frmulas ponen de manifiesto algunas limitaciones al resolver el modelo. En estos casos hay que invertir una matriz y no todas las matrices pueden invertirse (singulares). En dos situaciones no se puede: 1. El nmero de observaciones (n), es menor o igual que el nmero de variables independientes (k). 2. Una variable independiente es combinacin lineal de otra(s) o constante (colinealidad ).

Ejercicio 4 :

Estimar los parmetros utilizando matrices, utilizando los siguientes datos :


Y X

2 3 5 7 7

1 2 3 4 5

Y 2 3 5 7 7

X + 1 1 1 1 1 1 2 3 4 5

=
5*1

*
1

+
2*1

5*2

1 2 3 4 5

5*1

Columna unitaria permite tener en la columna el valor del


0

37

Se generan 5 ecuaciones : 2=1 3=1 5=1 7=1 7=1


+
0

1 2 3 4 5

1+
1 1 1 1

1 2 3 4 5
-1 2 3 5 7 7

+
0

+ +

+
0

+
0

+ +

+
0

0 1

1 1 1 1 1 1 2 3 4 5

1 1 1 1 1

1 2 3 4 5

1 1 1 1 1 1 2 3 4 5

(2x1)
2 filas, 1 columna

= =

(2 x 5 ) * ( 5 x 2) (2x2) ( 2 x 1)

(2x5) * (5x1) (2x1)

(2x1)

n
x

*
x2

Y xy

-1
5 15 15 55

24 86

A -1 = adj (AT) ; definicin de Laplace det (A) (55)*(-1)1+1 (15) *(-1)3 (15)*(-1)3 5*55 15*15 (5) * (-1)4 275 - 225

38

(55) (-15)

(-15) (5) 55/50

50

*
-15/50 5/50

24 86

0 1

-15/50

24 86

1,1
0 1

-0,3 0,1 *

-0,3

24 86

1,1 * 24 + -0,3 * 86 -0,3 * 24 + 0,1 * 86

26,4 = 7,2

+ 25,8 + 8,6

0,6 1,4

0 1

Finalmente se obtiene la siguiente ecuacin de regresin :

0,6 + 1,4 Xi + i

Esto se puede ampliar ad - infinitum para el caso de regresiones mltiples. Por ejemplo en el caso de dos variables explicatorias, la matriz XT * X ser de tres por tres, con las consiguientes dificultades para desarrollar su inversa, y as sucesivamente, pero con la ayuda del software es posible acceder a soluciones rpidas para el caso de regresiones mltiples. An as, es bueno, desde el punto de vista didctico, resolver uno de estos ejercicios complejos, para as saber que est haciendo el software. Esto es especialmente til cuando los valores de parmetros e indicadores aparecen ilgicos o abandonan el conjunto de los nmeros reales. Adems, los algoritmos matriciales, permitirn que podamos calcular otros indicadores como el coeficiente de determinacin del modelo y las desviaciones estndar de cada uno de los parmetros de regresin.

39

Clase 7. Supuestos y bases del modelo clsico

Teorema fundamental de la inferencia estadstica (Teorema de Gauss-Markov)


0 y 1 son estimadores obtenidos a partir de MCO. Adems se da por supuesto que estos estimadores son MELI (mejores estimadores lineales insesgados). Esta ltima definicin involucra a lo menos tres consideraciones :

i) ii) iii)

son parmetros lineales son insesgados son estimadores de la mejor calidad entre sus pares

i) Linealidad en los parmetros Una Regresin lineal es llamada lineal no por la condicin de sus variables explicativas, sino por la linealidad de los parmetros, los (esto es, los

parmetros son elevados solamente a la primera potencia). As, i = 0 + 1Xi, es lineal en los parmetros igual que en las variables. Otro modelo de Regresin lineal i =
0

Xi 2, es lineal en los parmetros pero no en la variable X. Esto

significa que al despejar 0 o 1, stos pueden escribirse mutuamente como funciones lineales respecto del resto de las variables y parmetros. Despejando :
0

= i = i Xi

1Xi

Un ejemplo de no linealidad en los parmetros sera: Yi = 0 ln 1Xi, por lo tanto, no corresponde a un modelo de regresin lineal, an cuando la variable X est elevada a la primera potencia.

40

ii) Estimadores Lineales Insesgados El trmino sesgo se dirige a una bsqueda selectiva de informacin. ( Ej. Opinin de mujeres sobre 25 aos). Sin embargo, el propsito de la regresin es acercarse lo ms posible al comportamiento poblacional, por lo tanto, se responde a un proceso aleatorio (insesgado). Conceptualmente se refiere a que la esperanza de 0 es 0 ( E( 0) = 0 ) y corresponde al valor poblacional. Y
1

es 1 ( E(

1)

= 1 ). La esperanza (E)

FRM1

FRM2

FRP

0
FRM3

X El promedio de todos los El promedio de todos los


0,

va a constituir al 0 de la FRP. va a constituir al 1 de la FRP.

1,

Todo esto ocurre ya que los parmetros son aleatorios. Si no fueran obtenidos al azar, es decir, si existiera sesgo, no podramos asegurar que el promedio de los corresponda al poblacional.

Estimadores lineales insesgados tambin implica que se distribuyen normalmente. Distribucin de los parmetros: E(
0)

= 0 = mnimas

(
E(

0)

1)

= 1

41

1)

= mnimas E( E(
0) 1)

2 (

0)=

xi2 *

2
)2

2 (

1)

2
( xi )2

n ( xi -

2 = Varianza de los errores o perturbaciones de la poblacin.


2

= i

( n 2 ) = grados de libertad, en este caso es 2, ya que son dos parmetros (


0, 1)

(n-2)

iii) Mejores Estimadores Se seala en este punto, que los estimadores deben ser de mnima varianza, es decir, debe existir mnima dispersin respecto del valor central.

E( E(

0) 0)

= 0 = 0

La transgresin de los supuestos se puede presentar tanto en regresiones mltiples como en simples.

42

A continuacin se exponen los supuestos de Gauss y su posible transgresin: Supuesto Normalidad en errores o perturbaciones No autocorrelacin entre los errores y las perturbaciones Homocedasticidad en errores No multicolinealidad entre variables aleatorias Estabilidad entre variables Estacionalidad de las variables Modelo correctamente especificado Transgresin No normalidad Autocorrelacin serial Heterocedasticidad Multicolinealidad Inestabilidad en variables No estacionalidad Modelo mal especificado

43

Clase 8 Autocorrelacin Serial

Surgen problemas con las variables ordenadas a travs del tiempo. Los errores (distancias) no estn distribuidos aleatoriamente, sino que estn relacionados (existe relacin de dependencia entre s). Esto implica que deja de ser un modelo insesgado. Cuando esto es detectado, generalmente mediante la Prueba de Durban-Watson, es necesario modificar el modelo. La autocorrelacin se expresa como :

t = Yti - ti t -1 = Y( t-1) i - ( t-1) i

= rho +1
t - 1

Autocorrelacin Serial Positiva. El coeficiente de correlacin tiende a 1.

44

= rho -1
t - 1

Autocorrelacin Negativa. El coeficiente de correlacin tiende a -1. Errores negativos, dan origen a errores positivos en el siguiente y viceversa.

= rho 0

t - 1

No existe autocorrelacin serial entre los errores. En el mundo ideal de la regresin se espera que esta situacin ocurra, en donde un error se desenvuelvencon absoluta independencia con respecto a otro.

45

En resumen: .

-1 0 Autocorrelacin No serial autocorrelacin Clculo de 1 Autocorrelacin serial +

t = t -1 - Vt
Vt = error de pares ordenados.

= t * t -1
t2 Modificando esta frmula, hace aparicin la prueba de Durbin-Watson, utilizando el parmetro d :

d=
Relacin entre

( t - t -1) t2

yd
2-2

0 2 1 0

-1 4

dL

du

4- du

4- dL

Lo valores ubicados en el tramo 0 dL indican la existencia de autocorrelacin serial positiva. 46

Para los valores incluidos en el tramo dL - du y ((4 - du) a (4 - dL)) no existe evidencia concluyente de autocorrelacin.

Los valores ubicados en los tramos de du a (4 - du ) indican la existencia de autocorrelacin serial negativa. Lo valores ubicados en el tramo (4 - dL) a 4 indican la existencia de autocorrelacin serial negativa.
n = n de observaciones k = n de parmetros del modelo excluyendo al
0

n /k 6 7 8

1 dLdu

La tabla de Durban-Watson entrega valores respecto de n y k, segn esto, determino si existe autocorrelacin serial. En caso de aparecer el signo de la enfermedad , se pueden intentar caminos de salida: Aumentar el nmero de observaciones Reconstituir el modelo (estructuralmente) Internalizar el problema. Esto implica trabajar con un modelo nuevo, distinto al original, por lo tanto, tiene una interpretacin diferente.

1) Yt = 2) Yt-1 =

+
0

X t + t
1

+
0

X t-1 + t-1 /
1

3) Yt-1 = 1) y 3)

X t-1 + t-1
0 0

Yt - Yt-1 = Yt - Yt-1 =

1 1

Xt -

X t-1 + t - t-1

(1- ) +

( X t - X t-1 ) + t - t-1

Y* =

0*

1*

X*

+ Vt

A partir de esta combinacin de ecuaciones obtengo variables modificadas. 47

Ejercicio 5 i ) Calcular d ii ) Establecer escala utilizando tabla DW al 95% y al 99%. iii) determinar si existe A.S. al 95% y al 99%. Los datos son : n 1998 1999 2000 2001 2002 2003 2004 2005 W (salario en millones de $) 2 1 0,5 0,5 0,6 1 0,4 0,3 Ld (demanda laboral en cientos de personas) 3 4 5 5 6 3 7 8

El salario (W) corresponde a la variable explicativa (X) y la demanda laboral es la variable explicada (Y). Se realizan a continuacin los clculos pertinentes para estimar los parmetros. Xi 2 1 0,5 0,5 0,6 1 0,4 0,3 = 6,3
i

Yi 3 4 5 5 6 3 7 8 = 41
i=

Xi 2 4 1 0,25 0,25 0,36 1 0,16 0,09 = 7,11

Xi Yi 6 4 2.5 2.5 3.6 3 2.8 2.4 = 26.8

= 0,7875

5,125

Donde :

n=8 k=1

48

Estimacin de los parmetros:

= =

5,125 (-2,55) * 0,7875

= 7,133 nYi Xi - Xi Yi

1=

n X i 2 ( X i ) 2
1

= ( 8 *26,8 ) ( 6,3*41 ) 8 * 7,11 36,69 = - 2,55

Ecuacin de la Regresin :

= i = 7,133 2,55Xi
Y 7,133

Si 1 es negativo significa que la pendiente de la funcin de regresin lineal es negativa.

1 =7,133 2,55 * 2 = 2,033 2 =7,133 2,55 * 1 = 4,583 3 = 7,133 2,55 *0,5 = 5,858 4 =7,133 2,55 * 0,5 = 5,858 5 =7,133 2,55 * 0,6= 5,603 6 = 7,133 2,55 * 1 = 4,583 7 =7,133 2,55 * 0,4= 6,113 8 =7,133 2,55 * 0,3= 6,368

49

Yi 3 4 5 5 6 3 7 8

i 2,033 4,583 5,858 5,858 5,603 4,583 6,113 6,368

i (Yi - i )
-0,967 -0,583 -0,858 -0,858 0,397 -1,583 0,887 1,632 = 0,001

i2
0,935 0,3398 0,7362 0,7361 0,1576 2,505 0,7867 2,663
=8,8593

Luego :

d=

( t - t -1) t2

t -1

( t - t -1)2
2,4025 0,0756 0 1,575 3,9204 6,1009 0,555 ( t - t -1) = 14,6294 t = 8,8593
2 2

-0,583 0,967 = -1,55 -0,858 + 0,853 = -0,275 -0,858 0,858 = 0 0,397 + 0,858 = 1,255 -1,583 0,397 = -1,98 0,887 + 1,583 = 2,47 1,632 0,887 = 0,745

= 14,6294 = 1,65 8,8593

Al 95% 1,65

50

0,763

1,332

Con un 95% de confianza, se infiere que no existe autocorrelacin serial. Al 99% 1,65 0 0,435 1,003 2

Con un 99% de confianza, se infiere que no existe autocorrelacin serial.

51

Clase 9. HETEROCEDASTICIDAD

Un supuesto importante del modelo clsico de regresin lineal es que las perturbaciones o errores que aparecen en la funcin de regresin son homocedsticas, es decir, todas tienen la misma varianza. En otras palabras, la homocedasticidad establece que la varianza de cada trmino de perturbacin o error, condicional a los valores seleccionados de las variables explicativas, es algn nmero constante igual a 2.

Varianza 2 de las perturbaciones es constante

En cambio cuando existe heterocedasticidad la dispersin aumenta o disminuye a medida que aumenta el valor de X.

52

Para analizar la heterogeneidad de varianza heterocedasticidad) se ocupan las siguientes pruebas :

(homocedasticidad

Regresin simple : - coeficiente de correlacin de rango de Spearman (rs) - Prueba de Goldfeld y Quandt - Prueba de Glejser. Regresin mltiple : - Prueba de White - Prueba de Park - Prueba de Koenker-Basset

Prueba de coeficiente de correlacin de rango de Spearman (rs) Ejercicio 6: Rentabilidad promedio de una cartera de inversin : Y = f (X) Donde X = Riesgo de cartera dado por rentabilidad. Se tiene el siguiente modelo:

Modelo de Markowitz o Modelo Financiero Y


rentabilidad promedio de la cartera o portafolio de inversin

X (riesgo o variabilidad de la rentabilidad)

53

=
0

X
1

i ) Obtener parmetros de la regresin ii) Calcular rs = 1 6 d2 n( n2 -1)

d = rango de error rango de X rango = ordenar de menor a mayor

iii) Obtener t c = rs n -2 ;
1 - rs
2

Donde n 2 son los grados de libertad

Considerando los siguientes datos :

X 1 3 5 8 8 9
1=

Y 2 5 6 9 10 12 y
0=

1,12

0,99 1

Y1 = 1 + 1,12 * X = 2,12
2,12 4,36 6,6 9,96 9,96 11,8

i
-0,12 0,64 0,6 0,96 0,04 0,92

Rango de error 2 4 3 6 1 5

Rango de x 1 2 3 4 4 6

d 1 2 0 2 -3 -1

d2 1 4 0 4 9 1

d2 = 19 54

rs = 1 6

19 6( 36 -1)

=1

19 35

= 0,457

Prueba de t de Student H0 : s = 0 H0 : s 0 Homocedasticidad Heterocedasticidad

t c = rs n -2 = 0,457 * 4
1 - rs
2

1 0,457

t c = 1,027 y t tabla = 2,776

Regin Crtica

1,027 Aceptacin 2,776 Rechazo

En base a los datos obtenidos se concluye que la hiptesis nula se acepta (s = 0), y que; por lo tanto, estamos frente a un modelo homocedstico.

55

Modelo de White Es til cuando el nmero de variables hace engorroso los clculos, esto es, en la regresin mltiple. Se utiliza el computador como herramienta de trabajo.

ei2 = f (x1, x2, x3, x12, x22, x32, x1x2, x1x3, x2 x3)
Regresin auxiliar :

i2 =

0+

1 1+

x2+

x3 +

4 1

x 2+

5 2

x 2+

6 3

x 2+

7 1 2+

xx

8 1 3+

xx

9 2

x x3

Determina si existe o no Heterocedasticidad

Modelo especificado. Muestra si se han usado correctamente las variables explicativas

n * R2

Si n * R

x x
>

2 g.l 2 g.l
Hay evidencia de heterocedasticidad.

Prueba de Koenker Basset Modelo de base : Yi=


0+ 1 1

x +

2 2

x +

x3 + i

Regresin auxiliar para comprobar si existe heterocedasticidad.

i2 = f ( i 2) i2 =
0 + 1

(i2)

Es decir, la variable acta como variable X y acta como variable Y.

56

En conclusin, se genera esta funcin con el fin de realizar una prueba de t de Student.

tc =
S

1
1

t (tabla)
(2)

Para los grados de libertad de la muestra (gl), se utiliza el nmero de regresiones ( excluyendo
0).

tc > 2 , rechazamos la hiptesis de que Si tc > t (tabla) aceptamos heterocedasticidad. Si tc < t (tabla) tc < 2 , aceptamos la hiptesis de que aceptamos que no existen evidencias de heterocedasticidad.

= 0,

= 0,

57

Medidas remediales o paliativas para la heterocedasticidad Se reduce el problema mediante transformaciones de variables. Si Yi= 0 + 1x1 + 2x2 + 3 x3 + i presenta heterocedasticidad, es posible transformar la funcin de la siguiente manera: i ) ln Yi=
0 + 1

ln x1 +

ln x2 +

ln x3 + i

La utilizacin de logaritmo en las variables permite reducir problemas de dispersin de valores. ii ) Yi=
0 + 1

x1 +

x2 +

x3 + i

Una funcin utilizando la raz de las variables permite reducir problemas de dispersin de valores. iii )

1 =

0 +

1 +

1 +

Yi

x1

x2

x3

Una funcin utilizando el inverso multiplicativo de la raz de las variables permite reducir problemas de dispersin de valores. iv ) Yi =
0

x1 +

x2 +

x3 + i

, esta funcin es igual a :

x1 Yi * =
0* + 1*

x1
+
2*

x2 + x1

3*

x3 + i

58

Clase 10. Multicolinealidad

El trmino de multicolinealidad se atribuye a Ragnar Frisch. Originalmente, signific la existencia de una funcin lineal perfecta o exacta entre algunas o todas las variables explicativas de un modelo de regresin. Es decir, se generan relaciones cruzadas entre las variables. Hoy en da, sin embargo, el trmino multicolinealidad se utiliza en un sentido ms amplio para incluir el caso de multicolinealidad perfecta, como tambin, el caso en el cual hay variables intercorrelacionadas pero no en forma perfecta, donde se acepta un error estocstico. La multicolinealidad es un problema de grado, no de existencia. Se puede convivir con cierto nivel del problema (manejndolo). No existen pruebas, sino sntomas, tales como, R2 alto (sobre el 80%), convergente con relaciones de tc bajas o no significativas ( tc < 2) respecto de los parmetros. Tambin es utilizado el coeficiente de correlacin (R) para los mismos fines. Si se modificase una observacin de la muestra, el modelo se modifica tanto en su sentido como en su forma completa. Es altamente sensible en un dato.

Multicolinealidad Perfecta e Imperfecta

Yi=

0+

1 1

x +

2 2

x +

x3 + i

Multicolinealidad Perfecta Y X1 X2 X3 10 1 3 1 20 2 5 0 4 25 3 7 30 4 9 7 35 5 11 9

Entre X1 y X2 X2 = 2x1 + 1

59

Multicolinealidad Imperfecta Y 10 20 25 30 35 X1 1 2 3 4 5 X2 3,2 5 6,4 10 10,8 X3 1 0 4 7 9 Entre X1 y X2 X2 = 2x1 + 1 + i

El grado de imperfeccin nos indica la fuerza de la multicolinealidad. MP

Yi= Yi=

0+

1 1

x + x +

2(

2x1+1) +
2

x 3 + i x 3 + i

1 1

2x1 +

Yi= Yi=

0*+

( +

1+

2)

x1 +

x 3 + i x3 + i

0*

* x1 +

Una decisin importante a considerar para terminar con el problema de multicolinealidad es la eliminacin de variables. Step Wise es un programa que elimina relaciones de multicolinealidad. Muestra todas las posibilidades de modelos, siendo el objetivo final provocar el mejor ajuste. Como ejemplo : Variable de tendencia ti

i= i=

0+

1 1

x + i x +
3

R2 = 0,6 ti i R2 = 0,7

0+

1 1

Donde ti es contador (1,2,3,,n)

60

Clase 11.

Variables Dicotmicas o Variables Dummy y otros tipos de variables especiales En modelos economtricos, especficamente en modelos de regresin logstica, una variable dummy es aquella que marca o codifica una cualidad particular. Por ejemplo, 1 para mujer y 0 para hombre. Igual que una variable indicadora o variables binarias. Una variable dummy es una variable numrica usada en anlisis de regresin para representar subgrupos de la muestra. En diseos de investigacin, una variable dummy es a menudo usada para distinguir grupos de tratamientos diferentes. En el caso ms simple, nosotros usamos variables 0 1 para diferenciar dos grupos, dando valor 0 a las personas que estn en el grupo control o 1 si estn en el grupo en tratamiento. Las variables dummy son tiles porque nos permiten usar una ecuacin de regresin simple para representar grupos mltiples. Esto significa que no necesitamos escribir modelos de ecuaciones separadas para cada subgrupo. Las variables dummy actan como 'switches' que conectan varios parmetros dentro y fuera de en una ecuacin. Otra ventaja del cdigo 0-1 de la variable dummy consiste en que an cuando esto sea una variable de nivel nominal se puede tratar estadsticamente como una variable de nivel de intervalo variable Por ejemplo, si se toma un promedio de una variable 0-1, el resultado es la proporcin de 1s en la distribucin.

Para ilustrar las variables dummy, considere el modelo simple de la regresin para un experimento seleccionado al azar para dos grupos de postprueba. Este modelo es esencialmente igual que conduciendo una prueba t en los medios de postprueba para dos grupos o conduciendo un anlisis de varianza unidireccional (ANOVA). El trmino clave en el modelo es b1, la estimacin de la diferencia entre los grupos. Para ver cmo las variables dummy trabajan, utilizaremos este modelo simple para demostrar cmo usarlos para sacar las subecuaciones separadas separadas para cada subgrupo. Entonces demostraremos cmo estimar la diferencia entre los subgrupos restando sus ecuaciones respectivas. Se ver que podemos embalar una enorme

61

cantidad de informacin en una sola ecuacin usando las variables dummy. Es decir, b1 es la diferencia entre el tratamiento y los grupos de control Para considerar esto, el primer paso es computar cul sera la ecuacin para cada uno de nuestros dos grupos por separado. Para el grupo de control, Z = 0. Cuando sustituimos eso en la ecuacin, y reconocemos que por la asuncin el trmino del error hace un promedio a 0, encontramos que el valor predicho para el grupo de control es b0, la intercepcin. Ahora, a la figura fuera de la lnea del grupo del tratamiento, substituimos el valor de 1 para Z, otra vez reconociendo que el trmino del error hace un promedio a 0. La ecuacin para el grupo del tratamiento indica que el valor de grupo del tratamiento es la suma de los dos valores beta.

Ahora, estamos listos para el segundo paso -- computando la diferencia entre los grupos. La diferencia debe ser entre las ecuaciones de los dos grupos que fueron desarrollados arriba. De otra forma, para encontrar la diferencia entre los grupos debemos encontrar la diferencia entre las ecuaciones. La diferencia entre los grupos es b1.

Siempre que tengamos un modelo de regresin con variables dummy, es posible ver siempre cmo las variables estn siendo utilizadas para representar ecuaciones mltiples del subgrupo despus de desarrollar los dos pasos descritos arriba: - Genere ecuaciones separadas para cada subgrupo substituyendo los valores simulados. - Encuentre la diferencia entre los grupos encontrando la diferencia entre sus ecuaciones

62

Clase 12. Pronsticos de negocios

Pronosticar es el arte y la ciencia de predecir los eventos futuros. Puede involucrar el manejo de datos histricos para proyectarlos en el futuro, mediante algn tipo de modelo matemtico. Generalmente los pronsticos son tanto intuitivos como subjetivos, esto es debido a que la toma de decisiones se lleva a cabo con un buen modelo matemtico y el buen juicio del administrador. Existen varios mtodos para realizar los pronsticos, entre ellos: Promedios Mviles Suavizacin exponencial Proyeccin de Tendencia Para evaluar un sistema de pronsticos se lleva a cabo lo siguiente: 1. Determinar el uso del pronostico 2. Seleccionar las partidas que se van a pronosticar 3. Determinar el horizonte de tiempo del pronstico. 4. Seleccionar un(os) modelo(s) de pronostico 5. Juntar los datos del pronstico 6. Validar el modelo del pronstico 7. Hacer el pronstico 8. Instrumentar los resultados.

Pronstico de series de tiempos.


Promedios Mviles Los promedios mviles son tiles si se asume que las demandas el mercado sern mas o menos constantes durante un determinado periodo de tiempo. Para obtener el promedio mvil basta con dividir la demanda de los periodos previos entre la cantidad de periodos.

Promedios Mviles Ponderados Estos se usan cuando existe una tendencia o un patrn, se le puede dar nfasis a los periodos mas recientes para as hacer mas sensible a los cambios. Decidir por la importancia de cada periodo para el periodo calculado es cuestin de intuicin y de suerte. Para obtenerlo basta con elegir la cantidad de periodos que sern tomados en cuenta para estimar un periodo, por ejemplo, para estimar 4to periodo se analizaran los 3 periodos anteriores, al primer periodo se le multiplica por tres, al segundo por dos y al ultimo por 1, y despus se dividen entre seis.

63

Suavizamiento Exponencial Este pronstico es fcil de usar y se maneja de forma eficiente con las computadoras. Aun cuando este es parte de los Modelos Mviles, casi no se respalda en los datos histricos. La formula para este mtodo es la siguiente: Valor pronosticado = Pronstico del ultimo periodo + * ( Valor real del ltimo periodo pronstico del ltimo periodo) donde alfa, es considerada como la constante de suavizacin que tiene un valor entre 0 y 1. En el caso de los pronsticos se utilizan una serie de indicadores y seales para evaluar la calidad del pronstico. MAD (Mean Absolute Desviation Desviacin Media Absoluta): Es una medida del error global del pronostico para un modelo, esta se calcula al sumar los valores absolutos de los errores individuales del pronostico, y dividindolos entre el numero de periodos de informacin. MAD = (errores del pronostico )/(cantidad de periodos) Error del pronstico = Demanda Pronstico MSE (Mean Square Error Error Medio Cuadrado): Es el promedio de las diferencias al cuadrado, entre el pronstico y los valores observados. MAPE (Mean Absolute Porcentual Error Error Porcentual Medio Absoluto): Es la media absoluta entre el pronstico y los valores observados expresado como porcentaje de los valores observados.

64

Referencias

- Gujarati, Damodar. Econometra. Mac Graw Hill, 4 Edicin, Mxico. - Salvatore, D. Econometra, serie Schaum. - Pgina web : http://www.socialresearchmethods.net/kb/dummyvar.htm - Pgina web: http://economics.about.com/od/economicsglossary/g/ dummyvar.htm - Pgina web: http://campusvirtual.uma.es/est_fisio/apuntes/ficheros/cap06. pdf - Pgina web: http://www.monografias.com/trabajos30/regresionmultiple/ regresion-multiple.shtml

- Pgina web: http://www.hrc.es/bioest/Reglin_9.html

65

También podría gustarte