Regresión lineal poblacional y muestral

Universidad Privada de Tacna
Facultad de Ciencias Empresariales

Escuela Profesional de Economía y Microfinanzas
Econometría I
Regresión lineal-Función de
Regresión Poblacional y Función de
Regresión Muestral
Profesor: Dr. Elmer Limache Sandoval

el análisis de regresión se relaciona en gran medida con la estimación o predicción de la media (de la población)
o valor promedio de la variable dependiente, con base en los valores conocidos o fijos de las variables
explicativas.
Veamos este ejemplo: Una población total de 60 familias de una comunidad hipotética, así como a su ingreso
semanal (X) y su gasto de consumo semanal (Y ), en dólares. Las 60 familias se dividen en 10 grupos de ingresos
(de 80 dólares a 260); asimismo, aparecen los gastos semanales de cada familia de los diversos grupos. Por
consiguiente, hay 10 valores fijos de X y los correspondientes valores Y para cada valor X; así, hay 10
subpoblaciones Y.
El panorama general es que, a pesar de la variabilidad del consumo semanal en cada nivel de ingreso
considerado, en promedio, el consumo semanal se incrementa a medida que aumenta el ingreso.
hay 10 valores medios para las 10 subpoblaciones de Y. A estos valores medios se les llama valores esperados
condicionales, en virtud de que dependen de los valores de la variable (condicional) X. En forma simbólica, se
denotan con E(Y | X ), lo cual se lee como el valor esperado de Y, dado el valor de
X
Si graficamos todos los datos en un diagrama de dispersión, se obtiene lo siguiente:

Cada grupo tiene una
media y una
determinada
dispersión, por tanto
debe distribuirse
como una normal
Al unir los valores medios de cada grupo, obtenemos la línea de regresión poblacional (LRP), o, más general, la curva
de regresión poblacional (CRP).5 Con palabras más sencillas, es la regresión de Y sobre X. El adjetivo “poblacional” se
debe a que en este ejemplo trabajamos con la población total de 60 familias.
Así, desde el punto de vista geométrico, una curva de regresión

poblacional es tan sólo el lugar geométrico de las medias
condicionales de la variable dependiente para los valores fijos
de la(s) variable(s) explicativa(s).
Función de regresión poblacional (FRP)
Es claro que cada media condicional E(Y | Xi) es función de Xi, donde Xi es un valor dado de X.
Simbólicamente,
E(Y / Xi ) = f (Xi )
donde ƒ(Xi) denota alguna función de la variable explicativa X y es la función de esperanza

condicional (FEC), función de regresión poblacional (FRP)
¿Qué forma adopta la función ƒ(Xi)? Esta pregunta es importante porque en una situación real
no disponemos de toda la población para efectuar el análisis.
como primera aproximación o hipótesis de trabajo, podemos suponer que la FRP, E(Y | Xi) es una función
lineal de Xi, del tipo
E(Y / Xi ) = β1 + β2Xi
donde β1 y β2 son parámetros no conocidos pero fijos que se denominan coeficientes de regresión; β1 y β2 se
conocen también como coeficientes de intersección y de pendiente
se conoce como función de regresión poblacional lineal

Significado del término lineal
Linealidad en las variables
El primer significado, y tal vez el más “natural”, de linealidad es aquel en que la esperanza
condicional de Y es una función lineal de Xi. Geométricamente, la curva de regresión en este caso es
una recta. En esta interpretación, una función de regresión
como E(Y / Xi ) = β1 + β2X2 no es una función lineal porque la variable X aparece elevada a una
potencia o índice de 2.
Linealidad en los parámetros

La segunda interpretación de linealidad se presenta cuando la esperanza condicional de Y, E(Y / Xi),
es una función lineal de los parámetros, los β; puede ser o no lineal en la variable X. De acuerdo
con esta interpretación, E(Y | Xi ) = β1 + β2X2
es un modelo de regresión lineal (en el parámetro), porque están elevados a la unidad
Especificación estocástica de la FRP
el nivel de ingresos de Xi, el consumo de una familia en particular se agrupa alrededor del
consumo promedio de todas las familias en ese nivel de Xi, es decir, alrededor de su esperanza
condicional. Por consiguiente, expresamos la desviación de un Yi en particular alrededor de su
valor esperado de la manera siguiente:
ui = Yi − E(Y | Xi )
Técnicamente, ui se conoce como perturbación
o
estocástica o término de error estocástico.
Yi = E(Y | Xi ) + ui
Si suponemos que E(Y | Xi) es lineal en Xi, entonces la ecuación se escribe como
Yi = E(Y | Xi ) + ui
= β 1 + β 2 X i + ui
La especificación estocástica tiene la ventaja que muestra claramente otras variables,

además del ingreso, que afectan el consumo, y que el consumo de una familia no se explica
en su totalidad sólo por la(s) variable(s) en el modelo de regresión.
El término de perturbación estocástica
1. Vaguedad de la teoría
2. Falta de disponibilidad de datos
3. Variables centrales y variables periféricas
4. Aleatoriedad intrínseca en el comportamiento humano
5. Variables representantes (proxy) inadecuadas

6. Principio de parsimonia
7. Forma funcional incorrecta con frecuencia no se conoce la forma de la relación funcional entre la
variable regresada y las regresoras
Función de regresión muestral (FRM)
¿se puede estimar la FRP a partir de quizá no pueda calcularse la FRP con “precisión”
los datos de la muestra? debido a las fluctuaciones muestrales.
Las líneas de regresión en se conocen como líneas de regresión muestral
Se supone que representan la línea de regresión poblacional, pero, debido a fluctuaciones muestrales,
son, en el mejor de los casos, sólo una aproximación de la verdadera RP.
Se desarrolla, entonces, el concepto de función de regresión muestral (FRM) para representar la línea de
regresión muestral. La contraparte muestral de la FRP puede escribirse como
La FRP se expresa en dos formas equivalentes: la FRM se expresa en su forma estocástica así:
𝑌 𝑖= ^
𝛽1 + ^
𝛽 2 𝑋 𝑖 +𝑒 𝑖 FRM
Porque son más frecuentes los casos en que el análisis se basa en una sola muestra tomada de
una población. Pero, debido a fluctuaciones muestrales, la estimación de la FRP basada en la
FRM es, en el mejor de los casos, una aproximación.
16.0000
14.0000
12.0000
10.0000
Salario promedio
8.0000
6.0000
4.0000
2.0000
0.0000
4 6 8 10 12 14 16 18 20
Años escolaridad
EJERCICIO
En la tabla 2.8 se proporcionan los datos sobre gasto en comida y gasto total (en rupias)
para una muestra de 55 familias rurales de India. (A principios de 2000, un dólar
estadounidense equivalía a casi 40 rupias indias.)
a) Grafique los datos con el eje vertical para el gasto en comida y el eje horizontal para
el gasto total; trace una línea de regresión a través de los puntos de dispersión.
b) ¿Qué conclusiones generales se pueden deducir de este ejemplo?
c) Diga a priori si se esperaría que el gasto en comida se incrementara de manera lineal

conforme el gasto total aumentase, independientemente del nivel de gasto. ¿Por qué?
Puede emplear el gasto total como representante del ingreso total.

700
600
500
400
GASTO_COM
300
200
100
0
350 400 450 500 550 600 650 700 750 800 850
GASTO_TOT

Regresión lineal poblacional y muestral

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Regresión lineal poblacional y muestral

Cargado por

Copyright:

Formatos disponibles

Universidad Privada de Tacna

Facultad de Ciencias Empresariales

Profesor: Dr. Elmer Limache Sandoval

Si graficamos todos los datos en un diagrama de dispersión, se obtiene lo siguiente:

Así, desde el punto de vista geométrico, una curva de regresión

donde ƒ(Xi) denota alguna función de la variable explicativa X y es la función de esperanza

se conoce como función de regresión poblacional lineal

Linealidad en las variables

Linealidad en los parámetros

La especificación estocástica tiene la ventaja que muestra claramente otras variables,

2. Falta de disponibilidad de datos

3. Variables centrales y variables periféricas

4. Aleatoriedad intrínseca en el comportamiento humano

5. Variables representantes (proxy) inadecuadas

b) ¿Qué conclusiones generales se pueden deducir de este ejemplo?

c) Diga a priori si se esperaría que el gasto en comida se incrementara de manera lineal

Puede emplear el gasto total como representante del ingreso total.

También podría gustarte