Documentos de Académico
Documentos de Profesional
Documentos de Cultura
regresin
con dos variables:
algunas ideas
bsicas
Ejemplo
El anlisis de regresin se relaciona en gran medida con la
estimacin o prediccin de la media (de la poblacin) o valor
promedio de la variable dependiente, con base en los valores
conocidos o fijos de las variables explicativas. Para entender
esto, consideremos los datos de la tabla que se indica a
continuacin. Estos datos se refieren a la poblacin total de 60
familias de una comunidad hipottica, as como a su ingreso
semanal (X) y su gasto de consumo semanal (Y), en dlares. Las
60 familias se dividen en 10 grupos de ingresos (de 80 dlares a
260); asimismo, aparecen los gastos semanales de cada familia
de los diversos grupos. Por consiguiente, hay 10 valores fijos de
X y los correspondientes valores Y para cada valor X; as, hay 10
subpoblaciones Y.
Ingreso familiar
semanal X, $
Probabilidades
condicionales p(Y /Xi)
Los puntos oscuros dentro de crculos de la ltima grfica, muestran los valores
medios condicionales de Y, graficados en funcin de los diferentes valores de X. Al
unir esos valores obtenemos la lnea de regresin poblacional (LRP), o, ms
general, la curva de regresin poblacional (CRP). Con palabras ms sencillas, es
la regresin de Y sobre X. El adjetivo poblacional se debe a que en este ejemplo
trabajamos con la poblacin total de 60 familias. Por supuesto, en realidad una
poblacin tendra ms familias.
As, desde el punto de vista geomtrico, una curva de regresin poblacional es tan
slo el lugar geomtrico de las medias condicionales de la variable dependiente
para los valores fijos de la(s) variable(s) explicativa(s). En palabras ms simples, es
la curva que conecta las medias de las subpoblaciones de Y que corresponden a los
valores dados de la regresora X. Lo anterior se ve de manera grfica a continuacin.
Concepto de funcin de
regresin poblacional (FRP)
De la anteriormente descrito, y en especial de las 2 ltimas
grficas, es claro que cada media condicional E(Y/Xi) es funcin
de Xi, donde Xi es un valor dado de X. Simblicamente,
E(Y /Xi ) = f (Xi )
donde (Xi) denota alguna funcin de la variable explicativa X. En
el ejemplo, E(Y/Xi) es una funcin lineal de Xi. La ecuacin se
conoce como funcin de esperanza condicional (FEC), funcin
de regresin poblacional (FRP) o regresin poblacional (RP),
para abreviar. Dicha funcin slo denota que el valor esperado de
la distribucin de Y dada Xi se relaciona funcionalmente con Xi. En
otras palabras, dice cmo la media o respuesta promedio de Y
vara con X.
Significado
lineal
del
trmino
Especificacin estocstica de
la FRP
En la grfica (Distribucin condicional del gasto en varios niveles de
ingreso), es claro que, a medida que aumenta el ingreso familiar, el consumo
familiar, en promedio, tambin aumenta. Pero, qu sucede con el consumo
de una familia en relacin con su nivel de ingreso (fijo)? Es obvio, dada la
grfica y la tabla de Ingreso familiar semanal X($), que el consumo de una
familia en particular no necesariamente aumenta a medida que lo hace el
nivel de ingreso. Por ejemplo, en la tabla de Ingreso familiar semanal X($),
se observa que en el nivel de ingreso de 100 dlares existe una familia cuyo
consumo, de 65, es menor que el consumo de dos familias cuyo ingreso
semanal es slo de 80 dlares. Sin embargo, hay que advertir que el
consumo promedio de las familias con ingreso semanal de 100 es mayor que
el consumo promedio de las familias con un ingreso semanal de 80 dlares
(77 y 65).
Funcin
de
muestral (FRM)
regresin
Al graficar los datos de las ltimas tablas, se obtiene el diagrama de dispersin del
siguiente grfico. En el diagrama de dispersin se trazaron dos lneas de
regresin muestral con el fin de ajustar razonablemente bien las dispersiones:
FRM1 se basa en la primera muestra y FRM2 en la segunda. Cul de las dos
lneas de regresin representa a la lnea de regresin poblacional verdadera? Si
evitamos mirar la grfica de Distribucin condicional del gasto en varios niveles de
ingreso, que a propsito representa la RP, no hay forma de estar por completo
seguro de que alguna de las lneas de regresin del presente grfico, representan
la verdadera recta (o curva) de regresin poblacional. Las lneas de regresin en
la grfica se conocen como lneas de regresin muestral. Se supone que
representan la lnea de regresin poblacional, pero, debido a fluctuaciones
muestrales, son, en el mejor de los casos, slo una aproximacin de la verdadera
RP. En general, se obtendran N FRM diferentes para N muestras diferentes, y
estas FRM no por fuerza son iguales.