Está en la página 1de 18

Universidad Privada de Tacna

Facultad de Ciencias Empresariales


Escuela Profesional de Economía y Microfinanzas

Econometría I
Regresión lineal-Función de
Regresión Poblacional y Función de
Regresión Muestral

Profesor: Dr. Elmer Limache Sandoval


el análisis de regresión se relaciona en gran medida con la estimación o predicción de la media (de la población)
o valor promedio de la variable dependiente, con base en los valores conocidos o fijos de las variables
explicativas.

Veamos este ejemplo: Una población total de 60 familias de una comunidad hipotética, así como a su ingreso
semanal (X) y su gasto de consumo semanal (Y ), en dólares. Las 60 familias se dividen en 10 grupos de ingresos
(de 80 dólares a 260); asimismo, aparecen los gastos semanales de cada familia de los diversos grupos. Por
consiguiente, hay 10 valores fijos de X y los correspondientes valores Y para cada valor X; así, hay 10
subpoblaciones Y.
El panorama general es que, a pesar de la variabilidad del consumo semanal en cada nivel de ingreso
considerado, en promedio, el consumo semanal se incrementa a medida que aumenta el ingreso.

hay 10 valores medios para las 10 subpoblaciones de Y. A estos valores medios se les llama valores esperados
condicionales, en virtud de que dependen de los valores de la variable (condicional) X. En forma simbólica, se
denotan con E(Y | X ), lo cual se lee como el valor esperado de Y, dado el valor de
X

Si graficamos todos los datos en un diagrama de dispersión, se obtiene lo siguiente:


Cada grupo tiene una
media y una
determinada
dispersión, por tanto
debe distribuirse
como una normal

Al unir los valores medios de cada grupo, obtenemos la línea de regresión poblacional (LRP), o, más general, la curva
de regresión poblacional (CRP).5 Con palabras más sencillas, es la regresión de Y sobre X. El adjetivo “poblacional” se
debe a que en este ejemplo trabajamos con la población total de 60 familias.

Así, desde el punto de vista geométrico, una curva de regresión


poblacional es tan sólo el lugar geométrico de las medias
condicionales de la variable dependiente para los valores fijos
de la(s) variable(s) explicativa(s).
Función de regresión poblacional (FRP)

Es claro que cada media condicional E(Y | Xi) es función de Xi, donde Xi es un valor dado de X.
Simbólicamente,

E(Y / Xi ) = f (Xi )

donde ƒ(Xi) denota alguna función de la variable explicativa X y es la función de esperanza


condicional (FEC), función de regresión poblacional (FRP)
¿Qué forma adopta la función ƒ(Xi)? Esta pregunta es importante porque en una situación real
no disponemos de toda la población para efectuar el análisis.
como primera aproximación o hipótesis de trabajo, podemos suponer que la FRP, E(Y | Xi) es una función
lineal de Xi, del tipo

E(Y / Xi ) = β1 + β2Xi

donde β1 y β2 son parámetros no conocidos pero fijos que se denominan coeficientes de regresión; β1 y β2 se
conocen también como coeficientes de intersección y de pendiente

se conoce como función de regresión poblacional lineal


Significado del término lineal

Linealidad en las variables

El primer significado, y tal vez el más “natural”, de linealidad es aquel en que la esperanza
condicional de Y es una función lineal de Xi. Geométricamente, la curva de regresión en este caso es
una recta. En esta interpretación, una función de regresión
como E(Y / Xi ) = β1 + β2X2 no es una función lineal porque la variable X aparece elevada a una
potencia o índice de 2.

Linealidad en los parámetros


La segunda interpretación de linealidad se presenta cuando la esperanza condicional de Y, E(Y / Xi),
es una función lineal de los parámetros, los β; puede ser o no lineal en la variable X. De acuerdo
con esta interpretación, E(Y | Xi ) = β1 + β2X2
es un modelo de regresión lineal (en el parámetro), porque están elevados a la unidad
Especificación estocástica de la FRP

el nivel de ingresos de Xi, el consumo de una familia en particular se agrupa alrededor del
consumo promedio de todas las familias en ese nivel de Xi, es decir, alrededor de su esperanza
condicional. Por consiguiente, expresamos la desviación de un Yi en particular alrededor de su
valor esperado de la manera siguiente:

ui = Yi − E(Y | Xi )
Técnicamente, ui se conoce como perturbación
o
estocástica o término de error estocástico.
Yi = E(Y | Xi ) + ui

Si suponemos que E(Y | Xi) es lineal en Xi, entonces la ecuación se escribe como

Yi = E(Y | Xi ) + ui
= β 1 + β 2 X i + ui

La especificación estocástica tiene la ventaja que muestra claramente otras variables,


además del ingreso, que afectan el consumo, y que el consumo de una familia no se explica
en su totalidad sólo por la(s) variable(s) en el modelo de regresión.
El término de perturbación estocástica

1. Vaguedad de la teoría

2. Falta de disponibilidad de datos

3. Variables centrales y variables periféricas

4. Aleatoriedad intrínseca en el comportamiento humano

5. Variables representantes (proxy) inadecuadas


6. Principio de parsimonia
7. Forma funcional incorrecta con frecuencia no se conoce la forma de la relación funcional entre la
variable regresada y las regresoras
Función de regresión muestral (FRM)

¿se puede estimar la FRP a partir de quizá no pueda calcularse la FRP con “precisión”
los datos de la muestra? debido a las fluctuaciones muestrales.
Las líneas de regresión en se conocen como líneas de regresión muestral

Se supone que representan la línea de regresión poblacional, pero, debido a fluctuaciones muestrales,
son, en el mejor de los casos, sólo una aproximación de la verdadera RP.

Se desarrolla, entonces, el concepto de función de regresión muestral (FRM) para representar la línea de
regresión muestral. La contraparte muestral de la FRP puede escribirse como

La FRP se expresa en dos formas equivalentes: la FRM se expresa en su forma estocástica así:

𝑌 𝑖= ^
𝛽1 + ^
𝛽 2 𝑋 𝑖 +𝑒 𝑖 FRM

Porque son más frecuentes los casos en que el análisis se basa en una sola muestra tomada de
una población. Pero, debido a fluctuaciones muestrales, la estimación de la FRP basada en la
FRM es, en el mejor de los casos, una aproximación.
16.0000

14.0000

12.0000

10.0000

Salario promedio
8.0000

6.0000

4.0000

2.0000

0.0000
4 6 8 10 12 14 16 18 20

Años escolaridad
EJERCICIO

En la tabla 2.8 se proporcionan los datos sobre gasto en comida y gasto total (en rupias)
para una muestra de 55 familias rurales de India. (A principios de 2000, un dólar
estadounidense equivalía a casi 40 rupias indias.)

a) Grafique los datos con el eje vertical para el gasto en comida y el eje horizontal para
el gasto total; trace una línea de regresión a través de los puntos de dispersión.

b) ¿Qué conclusiones generales se pueden deducir de este ejemplo?

c) Diga a priori si se esperaría que el gasto en comida se incrementara de manera lineal


conforme el gasto total aumentase, independientemente del nivel de gasto. ¿Por qué?

Puede emplear el gasto total como representante del ingreso total.


700

600

500

400
GASTO_COM

300

200

100

0
350 400 450 500 550 600 650 700 750 800 850

GASTO_TOT

También podría gustarte