Está en la página 1de 16

Capitulo 1

Anlisis de Regresin Simple


Introduccin
La econometra en su definicin ms esencial, es la medicin de las relaciones econmicas; entonces dado que la economa es una ciencia social y emprica, en la que la aleatoriedad est presente, es fundamental el ejercicio de contrastar las diversas teoras econmicas. La econometra se encarga entonces de la medicin y el anlisis de las relaciones estocsticas que se producen entre las variables econmicas y para lograr este objetivo utiliza como herramienta el anlisis de regresin, que es una tcnica que se ocupa de analizar y cuantificar la dependencia de una variable dependiente o endgena y una o ms variables independientes o exgenas . ( ) ( )

Donde es una variable aleatoria cuya presencia en el modelo evita que este sea deterministico. Mas a delante explicaremos el por qu de esta variable y en todo caso algn daremos como supuesto comportamiento o modelo probabilstico que debera seguir. El modelo (1) recibe el nombre de Regresin Mltiple dado que estamos utilizando ms de una variable exgena para explicar el

comportamiento de la endgena, sin embargo en el presente capitulo nos centraremos exclusivamente en el modelo de regresin simple, es decir en un modelo donde explicaremos la variable endgena con solo una variable exgena.

( )

( )

Sin prdida de generalidad y ms a delante daremos alguna justificacin, supondremos que la relacin que envuelve a ambas variables en (2) es lineal y que la perturbacin aleatoria o error entra de manera aditiva en el modelo: ( ) Donde: es el intercepto de la lnea de regresin y explica el valor de cuando . es la pendiente de la lineal de regresin y explica la variacin en por cada unidad de variacin en . As pues y son los parmetros o coeficientes del modelo y que sern motivo de estimacin y contraste estadstico. Especificado de esta manera el modelo, podemos ver que este consta de dos partes: A se la denomina componente Sistemtica o determinista del modelo porque de no ser por , para cada valor de ; queda automticamente determinado por el modelo. A se la denomina componente aleatoria del modelo.

Funcin de Regresin Poblacional


En una poblacin de agentes econmicos, supongamos que queremos analizar las pautas de comportamiento de alguna variable endgena en funcin de una exgena . Si existiese una relacin funcional lineal exacta entre las dos variables, entonces para cada observacin de la poblacin se cumplira: ( )

Geomtricamente, esto implica pues que cada observacin de la ) se ubicara exactamente sobre la recta de regresin, poblacin ( sin embargo es fundamental sealar que el comportamiento de los agentes econmicos es muy heterogneo, es decir no todos responden de la misma manera a los estmulos porque sus estructuras de preferencias son diferentes y cambiantes. Esto implica pues que agentes econmicos con el mismo valor para , realizar o materializan un valor diferente para . As mismo hay que sealar que en (4), de repente es necesario alguna otra variable exgena para poder explicar mejor el comportamiento de y se est obviando o por falta de informacin o por una mala especificacin en el modelo. En vista de estos y otros motivos es necesaria la modificacin de (4) adicionando una variable aleatoria para cada observacin: ( )

Supongamos que se mantiene fija para cada observacin y varia de observacin a observacin. Sea la variable cuyo comportamiento queremos predecir en funcin de la variable fija , entonces se dice que la Funcin de

Regresin Poblacional predice la media condicional funcin de : ( | )

( |

) en

( )

De una simple comparacin de (5) con (6), se establece: ( | ) ( )

La ecuacin (7) se denomina Funcin de regresin poblacional y la interpretacin que podemos darle es que para cada nivel de la variable exgena , la pauta de comportamiento de la endgena es la suma de un promedio o valor esperado de la endgena dado el valor de la ) mas un valor de la variable aleatoria exgena ( | que puede ser positiva o negativa. Ahora dado un valor fijo de , normalmente los valores observados de difieren de ( | ); a esa desviacin de cada respecto de su valor medio se llama Perturbacin Estocstica o Error estocstico y se representa por: ( | ) ( )

La FRP se obtiene pues al ajustar lo mejor posible los puntos de las ) a la recta de regresin poblacional que muestra observaciones ( como la media poblacional de la endgena para valores fijos de la exgena, se relaciona con la variable explicativa:

( |

Todas estas ideas se representan geomtricamente en la figura 1.

( | )

( | )

Figura 1 Observaciones: Dado que la ecuacin (5) es una lnea recta, entonces por tal motivo la denominaremos como la Recta de Regresin Lineal. Llamaremos de ahora en adelante a la variable como la variable independiente, variable endgena o variable regresora y supondremos que se mantiene fija. As mismo llamaremos a la variable variable dependiente o variable endgena o variable regresando. Ha y los denominaremos parmetros del modelo y conforman el trmino independiente y la pendiente de la recta de regresin lineal respectivamente.

Por ltimo a ( | ) la denominaremos componente sistemtico o determinstico del modelo y a componente no sistmico o aleatorio del modelo.

Funcin de Regresin Muestral


Es clsico ya en econometra tratar de describir y predecir comportamientos poblacionales a travs de tcnicas y procedimientos muestrales y esto es as porque trabajar con informacin poblacional es bastante dificultoso y costoso en trminos monetarios y de tiempo. Entonces en vista de ello, lo que se hace normalmente es seleccionar aleatoriamente una muestra representativa de la poblacin, recopilar la informacin relevante y a partir de ella se trata de estimar la FRP usando Estimadores Muestrales. Ahora un estimador, es una regla, mtodo o formula que nos indica como estimar parmetros poblacionales usando informacin muestral y un valor particular que obtiene un estimador se conoce como Estimado. Por lo tanto si planteamos que:

es un estimador de ( | ). es un estimador de . es un estimador de y es un estimador de .

La versin muestral de la FRP seria: .. (9)

A se denomina residuo, por lo que para cada observacin podemos afirmar que el residuo es un estimador del error o perturbacin aleatoria .

Observaciones: A la ecuacin (9) se le conoce como la recta de regresin muestral y constituye en el mejor de los casos solo una aproximacin a la verdadera recta de regresin poblacional. Observando la figura 2 vemos que de la FRM, la observada es igual a la estimada ms el residuo :

(10)

( | )

Figura 2

Por su parte de la FRP vemos que : ( | )

De las ecuaciones (9) y (10), podemos concluir que:

(11)

Supuestos del Modelo de Regresin Lineal


Conociendo la especificacin lineal de nuestro modelo y si nuestro objetivo es estimar los parmetros y realizar contraste de hiptesis sobre los mismos, tenemos que partir de ciertos supuestos sobre la forma en que se han generado los datos a travs de un proceso subyacente.

Supuesto 1.- Linealidad del modelo de regresin Como nuestro principal objetivo es la estimacin y la inferencia de los parmetros del modelo, por ahora lo que ms nos interesa es que el modelo sea lineal en los parmetros, sin importarnos tanto por la linealidad en las variables; es decir nos interesa que el modelo no se especifique con parmetros elevados a laguna potencia o que los parmetros aparezcan multiplicndose o dividindose entre ellos. Por ejemplo los modelos (12) y (13) son lineales en parmetros a pesar de que el modelo (13) no lo es en la variable .

. (12) ; Con . (13)

Cuando una relacin entre e se especifique de la forma (12) o (13) o cualquiera otra forma en donde los parmetros del modelo sean lineales, hablaremos de regresin lineal. Observe por ejemplo los siguientes modelos no cumplen con esta regla:

. (14) (15)

Sin embargo, algunos modelo no lineales podemos transformarlos en lineales haciendo alguna manipulacin algebraica simple, as por ejemplo si en (14) sacamos logaritmos, obtenemos el modelo lineal en logaritmos (lin - log): ( )

En cambio existen modelos como el (14) que bajo ninguna manipulacin algebraica se transforman en lineales, se hace necesario entonces otro tipo de anlisis que emprenderemos en su respectivo momento. Por ahora entonces asumiremos linealidad en el modelo o en alguna transformacin de las variables implicadas en el.

Supuesto 2.- El modelo est correctamente especificado Aqu hay que considerar tres aspectos importantes: 1. La forma funcional.- Asumiremos que la relacin lineal entre las variables es la correcta. 2. El nmero de variables exgenas a considerar.- Se pueden omitir variables explicativas importantes para el modelo o se pueden

estar considerando variables explicativas no relevantes, cualquiera de los dos errores trae consecuencias considerables en los resultados de estimacin y contraste que analizaremos luego. 3. La distribucin de probabilidad de .- Note que depende linealmente de los errores y por lo tanto tambin es una variable aleatoria que tendra la misma distribucin de densidad de . Entonces cualquier error cometido respecto de la funcin de densidad de tendr efecto directo sobre la distribucin de densidad de . Supuesto 3.- La variable exgena es fija

Supuesto 4.- El valor medio de la perturbacin estocstica es cero Para cualquier observacin cero. ( ) , el valor de la media condicional de es

Sacando esperanzas en (5), este supuesto implica un resultado ya conocido: ( | )

Supuesto 5.- Homocedasticidad La varianza del error es constante: ( ) ( ) ( )

Supuesto 6.- No autocorrelacin Los valores del trmino de error no estn correlacionados entre s, formalmente tenemos: ( ) ( ) ( )

Si las perturbaciones cumplen con el supuesto (5) y el (6), entonces se dice que son perturbaciones esfricas. Esto puede apreciarse mejor en la figura 3 en donde se ha graficado curvas isoprobabilidad de la distribucin de probabilidad bivariante. En la figura 3(a) podemos apreciar que ambas variables tienen varianza constante y estn incorrelacionas y las curvas isoprobabilidad son esfricas, en la figura 3(b) podemos apreciar curvas isoprobabilidad elpticas y muestran una correlacin positiva entre las variables y por ultimo en la figura 3(c) vemos que la varianza de es mayor que la de por lo tanto no son homocedasticas.

(a)

(b) Figura 3

(c)

Supuesto 7.-

es independiente de presentan

Este supuesto es importante porque implica que y efectos separados sobre . Entonces tenemos que:

Resultados De la aplicacin de estos supuestos podemos establecer algunos resultados importantes:

I.

( ) ( ) ( ) ( )

[ [ ( )

( )] ]

Es decir que la varianza de la variable endgena es constante e igual a la varianza del error.

II.

( ( ( (

) ) ) )

[ [ ( )

( )][ ][

( )] ]

Es decir que la variable endgena se distribuye de manera independiente.

Estimadores de Mnimos Cuadrados Ordinarios


El objetivo es estimar la FRM que mejor se ajuste a la informacin muestral disponible. El principio de ajustar los datos de tal manera que ) sean los ms pequeos ( la suma de los residuos posibles podra ser atractivo pero presenta algunos inconvenientes. De la figura 4 podemos ver que los residuos tienen una distribucin dispersa alrededor de la FRM y por tanto la suma de los residuos se anula, el problema es que en esta simple suma se estn dando la misma importancia (peso) a los residuos pequeos y grandes, es ms, bajo este criterio, se estara tentado a buscar la lnea de regresin muestral con los residuos ms negativos posibles lo cual no constituye un buen criterio de estimacin.

Figura 4 Este problema de las descompensaciones se evita con el criterio de mnimos cuadrados ordinarios (MICO). Bajo este criterio el objetivo es ajustar los datos de la muestra a la lnea de regresin muestral de tal manera que la suma de cuadrados de los residuos sea mnima. Ahora

dado que tratamos de estimar la FRM que mejor se aproxime a la FRP, elegiremos un y como estimadores de y de tal modo que sea mnimo. As pues los MICO se establecen en el siguiente problema de optimizacin:

( )

Sin prdida de generalidad aplicamos condiciones de primer orden: ( ) ( )

( )

Distribuyendo la sumatoria y ordenando optimemos las ecuaciones normales:

Para desarrollar el sistema llamaremos:

De manera anloga podemos establecer que: )

Y finalmente

)(

De (22) tenemos:

Despejando de (24) y remplazando en (23):

Finalmente remplazando (25) en (24): ( )