Está en la página 1de 18

Tema 0

Josep Navarro
jm.navarro@ucv.es
Gujarati Capı́tulos 1, 2 y 3

UCV

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 1, 2 y 3 (UCV)


Tema 0 1 / 18
Introducción

El análisis de regresión trata del estudio de la dependencia de una variable


(variable dependiente) respecto de una o más variables (variables
explicativas) con el objetivo de estimar o predecir la media o valor
promedio poblacional de la primera en términos de los valores conocidos o
fijos (en muestras repetidas) de las segundas.

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 1, 2 y 3 (UCV)


Tema 0 2 / 18
Relaciones estocásticas y relaciones deterministas

Las relaciones entre dos o más variables pueden ser:


1. Determinista: La relación entre las variables no depende de una
función de probabilidad. Este serı́a el caso de la ley de la Gravedad de
Newton dónde se puede calcular exactamente las distintas fuerzas a
partir de los datos obtenidos. Es decir, no existe ninguna parte
estocástica.
2. Estocásticas: La relación entre las variables depende de una función
de probabilidad. En este caso individuos iguales pueden dar resultados
distintos, es decir, dos individuos con la misma renta pueden tener
niveles de consumo distintos o dos campos de cultivo iguales pueden
tener rendimientos distintos. Estos son los procesos propios de las
ciencias sociales y son los que nos interesan en el contexto de la
econometrı́a.

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 1, 2 y 3 (UCV)


Tema 0 3 / 18
Regresión y Causalidad
Una relación estadı́stica por sı́ misma no puede implicar causalidad. Para
aducir causalidad se debe acudir a consideraciones a priori o teóricas.

Volvamos al ejemplo del campo de cultivo, no hay una razón estadı́stica


para suponer que la lluvia no depende del rendimiento del cultivo.
Considerar que el rendimiento del cultivo depende de la lluvia se debe a
cuestiones no estadı́sticas: el sentido común indica que la relación no
puede ser a la inversa, pues no es posible controlar la lluvia mediante el
rendimiento del cultivo.

Por otro lado, si volvemos al ejemplo de la propensión marginal al


consumo tratado en la Presentación el terreno se vuelve más ambiguo.
¿Produce un PIB mayor un mayor consumo o es el incremento en el
consumo el que provoca un aumento del PIB?
Podrı́amos argumentar que una mayor oferta de bienes produce un
consumo mayor pero también que una mayor demanda de consumo
provoca una producción superior.
Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 1, 2 y 3 (UCV)
Tema 0 4 / 18
Regresión y Correlación

El análisis de correlación se relaciona de manera estrecha con el de


regresión, aunque conceptualmente son muy distintos.

El coeficiente de correlación mide esta fuerza de asociación lineal. Por


ejemplo, si queremos medir la correlación entre el habito de fumar y el
cáncer de pulmón, la relación entre las notas de un examen de estadı́stica
y uno de mates, etc.

En el análisis de regresión se trata de estimar o predecir el valor promedio


de una variable con base en los valores fijos de otras. Ası́, quizá se desee
predecir el promedio de las calificaciones de un examen de estadı́stica a
partir de la calificación de un estudiante de un examen de matemáticas.

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 1, 2 y 3 (UCV)


Tema 0 5 / 18
Terminologı́a y notación
En las publicaciones especializadas, los términos variable dependiente y
variable explicativa se definen de varias maneras:

El término aleatorio es sinónimo de estocástico. Una variable aleatoria o


estocástica es la que toma cualquier conjunto de valores, positivos o
negativos, con una probabilidad dada.
Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 1, 2 y 3 (UCV)
Tema 0 6 / 18
Valores esperados

La esperanza condicional de una variable aleatoria Y es el valor esperado


de dicha variable teniendo en cuenta la información aportada por las
variables X de las que depende. En forma simbólica se denota E (Y |X ).

Es importante distinguir los valores esperados condicionales y el valor


esperado incondicional E (Y ).

Desde el punto de vista geométrico, una curva de regresión poblacional es


tan sólo el lugar geométrico de las medias condicionales de la variable
dependiente para los valores fijos de las variables explicativas.

Veamos estos conceptos utilizando un ejemplo:

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 1, 2 y 3 (UCV)


Tema 0 7 / 18
Valores esperados
En la siguiente tabla tenemos los datos de una comunidad hipotética de 60
familias, ası́ como su ingreso semanal (X) y su gasto de consumo semanal
(Y) en dólares.

Dónde E (Y ) = 121,20
Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 1, 2 y 3 (UCV)
Tema 0 8 / 18
Valores esperados

Si hacemos un gráfico de puntos con los anteriores valores y trazamos una


lı́nea que cruce por los valores condicionales esperados obtendremos:

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 1, 2 y 3 (UCV)


Tema 0 9 / 18
Valores esperados
El anterior gráfico se puede entender utilizando las distribuciones de
probabilidad en cada punto de la lı́nea:

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 1, 2 y 3 (UCV)


Tema 0 10 / 18
Concepto de función de regresión poblacional

De lo expuesto anteriormente deducimos que cada media condicional


E (Y |Xi ) es función de Xi , donde Xi es una valor dado de X.

E (Y |Xi ) = f (Xi ) (1)

donde f (Xi ) denota alguna función de la variable explicativa X. En el


ejemplo, E (Y |Xi ) es una función lineal de Xi . La ecuación (1) se conoce
como función de esperanza condicional (FEC), función de regresión
poblacional (FRP) o regresión poblacional (RP). Dicha función sólo
denota que el valor esperado de la distribución de la Y cada Xi se
relaciona funcionalmente con Xi . En otras palabras, dice cómo la media o
respuesta promedio de Y varı́a con X .

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 1, 2 y 3 (UCV)


Tema 0 11 / 18
Concepto de función de regresión poblacional

¿Qué forma adopta la función f (Xi )?

La forma funcional de la FRP es una pregunta empı́rica, aunque en casos


especı́ficos la teorı́a tiene algo que decir. Por ejemplo, un economista
puede plantear que el consumo manifiesta una función lineal con el
ingreso. Por tanto, como primera aproximación o hipótesis de trabajo,
podemos suponer que la FRP E (Y |Xi ) es una función lineal de Xi del tipo

E (Y |Xi ) = β1 + β2 Xi (2)
donde β1 y β2 son parámetros no conocidos pero fijos que se denominan
coeficientes de regresión; β1 y β2 se conocen también como coeficientes de
intersección y de pendiente, respectivamente. La ecuación (2) se conoce
como función de regresión poblacional lineal

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 1, 2 y 3 (UCV)


Tema 0 12 / 18
Especificación estocástica de la FRP

En la figura (9) se ve que, con el nivel de ingresos de Xi , el consumo de


una familia en particular se agrupa alrededor del consumo promedio de
todas las familias de ese nivel de Xi , es decir, alrededor de su esperanza
condicional. Por consiguiente, expresamos la desviación de un Yi particular
alrededor de su valor esperado de la manera siguiente:

ui = Yi − E (Y |Xi )

o
Yi = E (Y |Xi ) + ui (3)
donde la desviación ui es una variable aleatoria no observable que adopta
valores positivos o negativos. Técnicamente, ui se conoce como
perturbación estocástica o término de error estocástico.

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 1, 2 y 3 (UCV)


Tema 0 13 / 18
Especificación estocástica de la FRP
Para interpretar la ecuación (3) se puede decir que el gasto de una familia
en particular, según su nivel de ingreso, se expresa como la suma de dos
componentes:
1. E (Y |Xi ), que es la media del consumo de todas las familias con el
mismo nivel de ingreso. Este componente se conoce como sistemático
o determinista.
2. ui que es el componente aleatorio o no sistemático. Examinaremos
en breve la naturaleza de este término, pero por el momento
supondremos que un término que sustituye o representa a todas las
variables omitidas o ignoradas que pueden afectar a Y pero que no se
incluyen (o no se pueden incluir) en el modelo de regresión.
Si suponemos que E (Y |Xi ) es lineal en Xi , la ecuación (3) se escribe como

Yi = E (Y |Xi ) + ui
= β1 + β2 Xi + ui

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 1, 2 y 3 (UCV)


Tema 0 14 / 18
Especificación estocástica de la FRP
Si suponemos que E (Y |Xi ) es lineal en Xi , la ecuación (3) se escribe como
Yi = E (Y |Xi ) + ui
= β1 + β2 Xi + ui
Si tomamos el valor esperado condicional a X en ambos lados de la
primera ecuación obtenemos:

E (Yi |Xi ) = E (E (Y |Xi )) + E (ui |Xi )


= E (Y |Xi ) + E (ui |Xi )
donde se aprovecha que el valor esperado de una constante (E (Y |Xi )) sea
la constante misma.
Como E (Yi |Xi ) = E (Y |Xi ), la ecuación anterior implica:
E (ui |Xi ) = 0
Ası́, el supuesto de que la lı́nea de regresión pasa a través de las medias
condicionales de Y implica que los valores de la media condicional de ui
son cero.
Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 1, 2 y 3 (UCV)
Tema 0 15 / 18
Función de Regresión Muestral (FRM)
Hasta el momento, nos hemos limitado a la población de valores de Y que
corresponden a los valores fijos de X, es decir, tenı́amos todos los datos de
toda la población estudiada. No obstante, en la práctica lo que se tiene al
alcance no es más que una muestra de valores de Y que corresponde a
algunos valores fijos de X. Por tanto, la labor ahora es estimar la FRP con
base en la información muestral.

Al igual que desarrollamos el término Función de Regresión Poblacional


(FRP), ahora desarrollamos el de Función de Regresión Muestral (FRM)
para la lı́nea de regresión muestral. La función de regresión muestral se
escribirá:
Ŷi = β̂1 + β̂2 Xi
donde:
Ŷi = estimador de E (Y |Xi )
β̂1 = estimador de β1
β̂2 = estimador de β2
Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 1, 2 y 3 (UCV)
Tema 0 16 / 18
Función de Regresión Muestral (FRM)

Un estimador, conocido también como estadı́stico, no es más que una


regla, fórmula o método para estimar el parámetro poblacional a partir de
la información suministrada por la muestra disponible.
Un valor numérico particular obtenido por el esimador en un análisis se
conoce como estimación. Cabe destacar que un estimador es aleatorio
pero una estimación no.
Al igual que la FRP, la FRM se expresa en su forma estocástica de la
siguiente manera:

Yi = β̂1 + β̂2 Xi + ûi


donde ûi denota el término residual muestral. Conceptualmente, ûi es
análogo a ui y se considera una estimación de ui , que se introduce en la
FRM por las mismas razones que se introdujo ui en la FRP-

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 1, 2 y 3 (UCV)


Tema 0 17 / 18
Función de Regresión Muestral (FRM)

Ası́, para resumir, concluimos que el objetivo principal del análisis de


regresión es estimar la FRP.

Yi = β1 + β2 Xi + ui

con base en la FRM


Yi = β̂i + β̂2 xi + ûi
porque son más frecuentes los casos en que el análisis se basa en una sola
muestra tomada de una población. Pero, debido a las fluctuaciones
muestrales, la estimación de la FRP basada en la FRM es una
aproximación.

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 1, 2 y 3 (UCV)


Tema 0 18 / 18

También podría gustarte