Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Econometría I
Regresión lineal-Función de
Regresión Poblacional y Función de
Regresión Muestral
Veamos este ejemplo: Una población total de 60 familias de una comunidad hipotética, así como a su ingreso
semanal (X) y su gasto de consumo semanal (Y ), en dólares. Las 60 familias se dividen en 10 grupos de ingresos
(de 80 dólares a 260); asimismo, aparecen los gastos semanales de cada familia de los diversos grupos. Por
consiguiente, hay 10 valores fijos de X y los correspondientes valores Y para cada valor X; así, hay 10
subpoblaciones Y.
El panorama general es que, a pesar de la variabilidad del consumo semanal en cada nivel de ingreso
considerado, en promedio, el consumo semanal se incrementa a medida que aumenta el ingreso.
hay 10 valores medios para las 10 subpoblaciones de Y. A estos valores medios se les llama valores esperados
condicionales, en virtud de que dependen de los valores de la variable (condicional) X. En forma simbólica, se
denotan con E(Y | X ), lo cual se lee como el valor esperado de Y, dado el valor de
X
Al unir los valores medios de cada grupo, obtenemos la línea de regresión poblacional (LRP), o, más general, la curva
de regresión poblacional (CRP).5 Con palabras más sencillas, es la regresión de Y sobre X. El adjetivo “poblacional” se
debe a que en este ejemplo trabajamos con la población total de 60 familias.
Es claro que cada media condicional E(Y | Xi) es función de Xi, donde Xi es un valor dado de X.
Simbólicamente,
E(Y / Xi ) = f (Xi )
E(Y / Xi ) = β1 + β2Xi
donde β1 y β2 son parámetros no conocidos pero fijos que se denominan coeficientes de regresión; β1 y β2 se
conocen también como coeficientes de intersección y de pendiente
El primer significado, y tal vez el más “natural”, de linealidad es aquel en que la esperanza
condicional de Y es una función lineal de Xi. Geométricamente, la curva de regresión en este caso es
una recta. En esta interpretación, una función de regresión
como E(Y / Xi ) = β1 + β2X2 no es una función lineal porque la variable X aparece elevada a una
potencia o índice de 2.
el nivel de ingresos de Xi, el consumo de una familia en particular se agrupa alrededor del
consumo promedio de todas las familias en ese nivel de Xi, es decir, alrededor de su esperanza
condicional. Por consiguiente, expresamos la desviación de un Yi en particular alrededor de su
valor esperado de la manera siguiente:
ui = Yi − E(Y | Xi )
Técnicamente, ui se conoce como perturbación
o
estocástica o término de error estocástico.
Yi = E(Y | Xi ) + ui
Si suponemos que E(Y | Xi) es lineal en Xi, entonces la ecuación se escribe como
Yi = E(Y | Xi ) + ui
= β 1 + β 2 X i + ui
1. Vaguedad de la teoría
¿se puede estimar la FRP a partir de quizá no pueda calcularse la FRP con “precisión”
los datos de la muestra? debido a las fluctuaciones muestrales.
Las líneas de regresión en se conocen como líneas de regresión muestral
Se supone que representan la línea de regresión poblacional, pero, debido a fluctuaciones muestrales,
son, en el mejor de los casos, sólo una aproximación de la verdadera RP.
Se desarrolla, entonces, el concepto de función de regresión muestral (FRM) para representar la línea de
regresión muestral. La contraparte muestral de la FRP puede escribirse como
La FRP se expresa en dos formas equivalentes: la FRM se expresa en su forma estocástica así:
𝑌 𝑖= ^
𝛽1 + ^
𝛽 2 𝑋 𝑖 +𝑒 𝑖 FRM
Porque son más frecuentes los casos en que el análisis se basa en una sola muestra tomada de
una población. Pero, debido a fluctuaciones muestrales, la estimación de la FRP basada en la
FRM es, en el mejor de los casos, una aproximación.
16.0000
14.0000
12.0000
10.0000
Salario promedio
8.0000
6.0000
4.0000
2.0000
0.0000
4 6 8 10 12 14 16 18 20
Años escolaridad
EJERCICIO
En la tabla 2.8 se proporcionan los datos sobre gasto en comida y gasto total (en rupias)
para una muestra de 55 familias rurales de India. (A principios de 2000, un dólar
estadounidense equivalía a casi 40 rupias indias.)
a) Grafique los datos con el eje vertical para el gasto en comida y el eje horizontal para
el gasto total; trace una línea de regresión a través de los puntos de dispersión.
600
500
400
GASTO_COM
300
200
100
0
350 400 450 500 550 600 650 700 750 800 850
GASTO_TOT