Tema 0

Tema 0
Josep Navarro
jm.navarro@ucv.es
Gujarati Capı́tulos 1, 2 y 3
UCV
Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 1, 2 y 3 (UCV)

Tema 0 1 / 18
Introducción
El análisis de regresión trata del estudio de la dependencia de una variable

(variable dependiente) respecto de una o más variables (variables
explicativas) con el objetivo de estimar o predecir la media o valor
promedio poblacional de la primera en términos de los valores conocidos o
fijos (en muestras repetidas) de las segundas.

Tema 0 2 / 18
Relaciones estocásticas y relaciones deterministas
Las relaciones entre dos o más variables pueden ser:

1. Determinista: La relación entre las variables no depende de una
función de probabilidad. Este serı́a el caso de la ley de la Gravedad de
Newton dónde se puede calcular exactamente las distintas fuerzas a
partir de los datos obtenidos. Es decir, no existe ninguna parte
estocástica.
2. Estocásticas: La relación entre las variables depende de una función
de probabilidad. En este caso individuos iguales pueden dar resultados
distintos, es decir, dos individuos con la misma renta pueden tener
niveles de consumo distintos o dos campos de cultivo iguales pueden
tener rendimientos distintos. Estos son los procesos propios de las
ciencias sociales y son los que nos interesan en el contexto de la
econometrı́a.

Tema 0 3 / 18
Regresión y Causalidad
Una relación estadı́stica por sı́ misma no puede implicar causalidad. Para
aducir causalidad se debe acudir a consideraciones a priori o teóricas.
Volvamos al ejemplo del campo de cultivo, no hay una razón estadı́stica

para suponer que la lluvia no depende del rendimiento del cultivo.
Considerar que el rendimiento del cultivo depende de la lluvia se debe a
cuestiones no estadı́sticas: el sentido común indica que la relación no
puede ser a la inversa, pues no es posible controlar la lluvia mediante el
rendimiento del cultivo.
Por otro lado, si volvemos al ejemplo de la propensión marginal al

consumo tratado en la Presentación el terreno se vuelve más ambiguo.
¿Produce un PIB mayor un mayor consumo o es el incremento en el
consumo el que provoca un aumento del PIB?
Podrı́amos argumentar que una mayor oferta de bienes produce un
consumo mayor pero también que una mayor demanda de consumo
provoca una producción superior.
Tema 0 4 / 18
Regresión y Correlación
El análisis de correlación se relaciona de manera estrecha con el de

regresión, aunque conceptualmente son muy distintos.
El coeficiente de correlación mide esta fuerza de asociación lineal. Por

ejemplo, si queremos medir la correlación entre el habito de fumar y el
cáncer de pulmón, la relación entre las notas de un examen de estadı́stica
y uno de mates, etc.
En el análisis de regresión se trata de estimar o predecir el valor promedio

de una variable con base en los valores fijos de otras. Ası́, quizá se desee
predecir el promedio de las calificaciones de un examen de estadı́stica a
partir de la calificación de un estudiante de un examen de matemáticas.

Tema 0 5 / 18
Terminologı́a y notación
En las publicaciones especializadas, los términos variable dependiente y
variable explicativa se definen de varias maneras:
El término aleatorio es sinónimo de estocástico. Una variable aleatoria o

estocástica es la que toma cualquier conjunto de valores, positivos o
negativos, con una probabilidad dada.
Tema 0 6 / 18
Valores esperados
La esperanza condicional de una variable aleatoria Y es el valor esperado

de dicha variable teniendo en cuenta la información aportada por las
variables X de las que depende. En forma simbólica se denota E (Y |X ).
Es importante distinguir los valores esperados condicionales y el valor

esperado incondicional E (Y ).
Desde el punto de vista geométrico, una curva de regresión poblacional es

tan sólo el lugar geométrico de las medias condicionales de la variable
dependiente para los valores fijos de las variables explicativas.
Veamos estos conceptos utilizando un ejemplo:

Tema 0 7 / 18
Valores esperados
En la siguiente tabla tenemos los datos de una comunidad hipotética de 60
familias, ası́ como su ingreso semanal (X) y su gasto de consumo semanal
(Y) en dólares.
Dónde E (Y ) = 121,20
Tema 0 8 / 18
Valores esperados
Si hacemos un gráfico de puntos con los anteriores valores y trazamos una

lı́nea que cruce por los valores condicionales esperados obtendremos:

Tema 0 9 / 18
Valores esperados
El anterior gráfico se puede entender utilizando las distribuciones de
probabilidad en cada punto de la lı́nea:

Tema 0 10 / 18
Concepto de función de regresión poblacional
De lo expuesto anteriormente deducimos que cada media condicional

E (Y |Xi ) es función de Xi , donde Xi es una valor dado de X.
E (Y |Xi ) = f (Xi ) (1)
donde f (Xi ) denota alguna función de la variable explicativa X. En el

ejemplo, E (Y |Xi ) es una función lineal de Xi . La ecuación (1) se conoce
como función de esperanza condicional (FEC), función de regresión
poblacional (FRP) o regresión poblacional (RP). Dicha función sólo
denota que el valor esperado de la distribución de la Y cada Xi se
relaciona funcionalmente con Xi . En otras palabras, dice cómo la media o
respuesta promedio de Y varı́a con X .

Tema 0 11 / 18
Concepto de función de regresión poblacional
¿Qué forma adopta la función f (Xi )?
La forma funcional de la FRP es una pregunta empı́rica, aunque en casos

especı́ficos la teorı́a tiene algo que decir. Por ejemplo, un economista
puede plantear que el consumo manifiesta una función lineal con el
ingreso. Por tanto, como primera aproximación o hipótesis de trabajo,
podemos suponer que la FRP E (Y |Xi ) es una función lineal de Xi del tipo
E (Y |Xi ) = β1 + β2 Xi (2)
donde β1 y β2 son parámetros no conocidos pero fijos que se denominan
coeficientes de regresión; β1 y β2 se conocen también como coeficientes de
intersección y de pendiente, respectivamente. La ecuación (2) se conoce
como función de regresión poblacional lineal

Tema 0 12 / 18
Especificación estocástica de la FRP
En la figura (9) se ve que, con el nivel de ingresos de Xi , el consumo de

una familia en particular se agrupa alrededor del consumo promedio de
todas las familias de ese nivel de Xi , es decir, alrededor de su esperanza
condicional. Por consiguiente, expresamos la desviación de un Yi particular
alrededor de su valor esperado de la manera siguiente:
ui = Yi − E (Y |Xi )
o
Yi = E (Y |Xi ) + ui (3)
donde la desviación ui es una variable aleatoria no observable que adopta
valores positivos o negativos. Técnicamente, ui se conoce como
perturbación estocástica o término de error estocástico.

Tema 0 13 / 18
Para interpretar la ecuación (3) se puede decir que el gasto de una familia
en particular, según su nivel de ingreso, se expresa como la suma de dos
componentes:
1. E (Y |Xi ), que es la media del consumo de todas las familias con el
mismo nivel de ingreso. Este componente se conoce como sistemático
o determinista.
2. ui que es el componente aleatorio o no sistemático. Examinaremos
en breve la naturaleza de este término, pero por el momento
supondremos que un término que sustituye o representa a todas las
variables omitidas o ignoradas que pueden afectar a Y pero que no se
incluyen (o no se pueden incluir) en el modelo de regresión.
Si suponemos que E (Y |Xi ) es lineal en Xi , la ecuación (3) se escribe como
Yi = E (Y |Xi ) + ui
= β1 + β2 Xi + ui

Tema 0 14 / 18
Si suponemos que E (Y |Xi ) es lineal en Xi , la ecuación (3) se escribe como
Yi = E (Y |Xi ) + ui
= β1 + β2 Xi + ui
Si tomamos el valor esperado condicional a X en ambos lados de la
primera ecuación obtenemos:
E (Yi |Xi ) = E (E (Y |Xi )) + E (ui |Xi )

= E (Y |Xi ) + E (ui |Xi )
donde se aprovecha que el valor esperado de una constante (E (Y |Xi )) sea
la constante misma.
Como E (Yi |Xi ) = E (Y |Xi ), la ecuación anterior implica:
E (ui |Xi ) = 0
Ası́, el supuesto de que la lı́nea de regresión pasa a través de las medias
condicionales de Y implica que los valores de la media condicional de ui
son cero.
Tema 0 15 / 18
Función de Regresión Muestral (FRM)
Hasta el momento, nos hemos limitado a la población de valores de Y que
corresponden a los valores fijos de X, es decir, tenı́amos todos los datos de
toda la población estudiada. No obstante, en la práctica lo que se tiene al
alcance no es más que una muestra de valores de Y que corresponde a
algunos valores fijos de X. Por tanto, la labor ahora es estimar la FRP con
base en la información muestral.
Al igual que desarrollamos el término Función de Regresión Poblacional

(FRP), ahora desarrollamos el de Función de Regresión Muestral (FRM)
para la lı́nea de regresión muestral. La función de regresión muestral se
escribirá:
Ŷi = β̂1 + β̂2 Xi
donde:
Ŷi = estimador de E (Y |Xi )
β̂1 = estimador de β1
β̂2 = estimador de β2
Tema 0 16 / 18
Un estimador, conocido también como estadı́stico, no es más que una

regla, fórmula o método para estimar el parámetro poblacional a partir de
la información suministrada por la muestra disponible.
Un valor numérico particular obtenido por el esimador en un análisis se
conoce como estimación. Cabe destacar que un estimador es aleatorio
pero una estimación no.
Al igual que la FRP, la FRM se expresa en su forma estocástica de la
siguiente manera:
Yi = β̂1 + β̂2 Xi + ûi

donde ûi denota el término residual muestral. Conceptualmente, ûi es
análogo a ui y se considera una estimación de ui , que se introduce en la
FRM por las mismas razones que se introdujo ui en la FRP-

Tema 0 17 / 18
Ası́, para resumir, concluimos que el objetivo principal del análisis de

regresión es estimar la FRP.
Yi = β1 + β2 Xi + ui
con base en la FRM

Yi = β̂i + β̂2 xi + ûi
porque son más frecuentes los casos en que el análisis se basa en una sola
muestra tomada de una población. Pero, debido a las fluctuaciones
muestrales, la estimación de la FRP basada en la FRM es una
aproximación.

Tema 0 18 / 18

Tema 0

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Tema 0

Cargado por

Copyright:

Formatos disponibles

Tema 0

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 1, 2 y 3 (UCV)

El análisis de regresión trata del estudio de la dependencia de una variable

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 1, 2 y 3 (UCV)

Las relaciones entre dos o más variables pueden ser:

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 1, 2 y 3 (UCV)

Volvamos al ejemplo del campo de cultivo, no hay una razón estadı́stica

Por otro lado, si volvemos al ejemplo de la propensión marginal al

El análisis de correlación se relaciona de manera estrecha con el de

El coeficiente de correlación mide esta fuerza de asociación lineal. Por

En el análisis de regresión se trata de estimar o predecir el valor promedio

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 1, 2 y 3 (UCV)

El término aleatorio es sinónimo de estocástico. Una variable aleatoria o

La esperanza condicional de una variable aleatoria Y es el valor esperado

Es importante distinguir los valores esperados condicionales y el valor

Desde el punto de vista geométrico, una curva de regresión poblacional es

Veamos estos conceptos utilizando un ejemplo:

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 1, 2 y 3 (UCV)

Si hacemos un gráfico de puntos con los anteriores valores y trazamos una

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 1, 2 y 3 (UCV)

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 1, 2 y 3 (UCV)

De lo expuesto anteriormente deducimos que cada media condicional

E (Y |Xi ) = f (Xi ) (1)

donde f (Xi ) denota alguna función de la variable explicativa X. En el

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 1, 2 y 3 (UCV)

¿Qué forma adopta la función f (Xi )?

La forma funcional de la FRP es una pregunta empı́rica, aunque en casos

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 1, 2 y 3 (UCV)

En la figura (9) se ve que, con el nivel de ingresos de Xi , el consumo de

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 1, 2 y 3 (UCV)

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 1, 2 y 3 (UCV)

E (Yi |Xi ) = E (E (Y |Xi )) + E (ui |Xi )

Al igual que desarrollamos el término Función de Regresión Poblacional

Un estimador, conocido también como estadı́stico, no es más que una

Yi = β̂1 + β̂2 Xi + ûi

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 1, 2 y 3 (UCV)

Ası́, para resumir, concluimos que el objetivo principal del análisis de

con base en la FRM

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 1, 2 y 3 (UCV)

También podría gustarte