Está en la página 1de 24

ANLISIS DE REGRESIN LINEAL

Por: Adolfo C. Jimnez Ch.

INTRODUCCIN

Esta relacionado en gran medida con la estimacin y/o prediccin de la media (de la poblacin) o valor promedio de la variable dependiente en funcin a los valores de las variables explicativas.

EJEMPLO HIPOTTICO

Ejemplo: Supongamos que se desea predecir el nivel de la media del gasto de consumo semanal Y conociendo el ingreso semanal X. Tenemos una poblacin total de 60 familias que se dividen en 10 grupos con ingresos aprox. iguales.

EJEMPLO HIPOTTICO

De la tabla se observa que existen cinco familias cuyos gastos de consumo semanal se encuentran entre 55 y 75 unidades, esto siendo el ingreso semanal de 80u.
Y X 80 55 60 65 70 75 325 100 65 70 74 80 85 88 462 120 79 84 90 94 98 445 140 80 93 95 103 108 113 115 707 160 102 107 110 116 118 125 678 180 110 115 120 130 135 140 750 200 120 136 140 144 145 685 220 135 137 140 152 157 160 162 1043 240 137 145 155 165 175 189 966 260 150 152 175 178 180 185 191 1211

Gasto de consumo familiar semanal, Y

Total

La distribucin condicional de Y, condicionada a los valores de X

EJEMPLO HIPOTTICO

La tabla anterior representa a la poblacin por lo tanto, podemos calcular la probabilidad condicional de Y. p(Y|X), probabilidad de Y dado X. Por ejemplo, para X=80 hay 5 valores para Y: 55, 60, 65, 70 y 75. Tonces, dado X=80 la probabilidad de obtener cualquiera de los gastos de consumo es 1/5. Simblicamente:

1 p (Y 55 | X 80) 5

Probabilidad condicional de p(Y|Xi)

En color rojo se puede apreciar la media de las probabilidades condicionales, conocida como media condicional o esperanza condicional.
80 1/5 1/5 1/5 1/5 1/5 100 1/6 1/6 1/6 1/6 1/6 1/6 77 120 1/5 1/5 1/5 1/5 1/5 89 140 1/7 1/7 1/7 1/7 1/7 1/7 1/7 101 160 1/6 1/6 1/6 1/6 1/6 1/6 113 180 1/6 1/6 1/6 1/6 1/6 1/6 125 200 1/5 1/5 1/5 1/5 1/5 137 220 1/7 1/7 1/7 1/7 1/7 1/7 1/7 149 240 1/6 1/6 1/6 1/6 1/6 1/6 161 260 1/7 1/7 1/7 1/7 1/7 1/7 1/7 173

Probabilidades condicionales p(Y|Xi)

Medias condicionales de Y

65

Probabilidad condicional de p(Y|Xi)

E (Y | X X i )

Se lee como: El valor esperado de Y dado que X adquiere el valor especifico de Xi. La esperanza condicional de Y dado X=80 es:

1 1 1 1 1 55( ) 60( ) 65( ) 70( ) 75( ) 65 5 5 5 5 5

Distribucin condicional del gasto para diversos niveles de ingreso

Gasto de consumo semanal por ingreso semanal


173 161 149 137 125 105 85 77 65 45 50 100 150 200 250 65 89 113 101 125

165 145

En el grfico anterior podemos observar que a medida que aumenta el valor de X aumento el valor de Y. Se puede observar que dichas medias caen sobre la lnea recta con pendiente positiva. Esta lnea se conoce como lnea de regresin poblacional. La curva de regresin poblacional es el lugar geomtrico de las medias condicionales o esperanzas de la variable dependiente para los valores fijos de la(s) variable(s) explicativa(s)

CONCEPTO DE LA FUNCIN DE REGRESIN POBLACIONAL (FRP)

De los dos grficos anteriores podemos apreciar que la:

E (Y | X X i )

es funcin de X i . Simblicamente:

E (Y | X i ) f ( X i )

Donde f ( X i ) denota alguna funcin de la variable explicativa X i .

LNEA DE REGRESIN POBLACIONAL

Podemos suponer que la FRP es una funcin lineal de X i del tipo.

E (Y | X i ) 1 2 X i

ESPECIFICACIN ESTOCSTICA DE LA FRP

Qu sucede con el gasto de consumo de una familia individual con relacin a su nivel fijo de ingresos?

El gasto de consumo de una familia esta agrupada alrededor del consumo promedio de todas las familias en ese nivel de Xi, es decir, alrededor de su esperanza condicional.

ESPECIFICACIN ESTOCSTICA DE LA FRP

De grfico anterior podemos expresar la desviacin de un Yi individual alrededor de su valor esperado de la manera siguientes:

u i Yi E (Y | X i )

(a)

Yi E (Y | X i ) u i

(b)

cmo se interpreta? Donde la desviacin u i es una variable no observable que toma valores positivos o negativos. : perturbacin estocstica o trmino de error estocstico.

ui

ESPECIFICACIN ESTOCSTICA DE LA FRP

Si se supone que E (Y | X i ) es lineal en X i , la ecuacin (b) puede escribirse como:

Yi E (Y | X i ) ui
Yi 1 2 X i ui

La ecuacin anterior plantea que el gasto de consumo de una familia est relacionada linealmente con su ingreso, ms el trmino de perturbacin.

ESPECIFICACIN ESTOCSTICA DE LA FRP

Los gastos de consumo individual, dado X=80 puede expresarse como:


Y1 55 1 2 (80) u1

Y2 60 1 2 (80) u2 Y3 65 1 2 (80) u3 Y4 70 1 2 (80) u4


Y5 75 1 2 (80) u5

FUNCIN DE REGRESIN MUESTRAL

En la prctica lo que se tiene al alcance no es ms que una muestra de valores de Y que corresponden a algunos valores fijos de X. Por lo tanto, la labor es ahora estimar la FRP en base a informacin muestral. Ahora, supongamos que no conocamos la poblacin y que la nica informacin que conocemos es una muestra de valores de Y seleccionada aleatoriamente para valores dados de X.

FUNCIN DE REGRESIN MUESTRAL

Para las tablas mostradas tenemos un valor de Y correspondiente a los valores de X, para cada muestra.
Y 70 65 90 95 110 115 120 140 155 150 X 80 100 120 140 160 180 200 220 240 260 Y 55 88 90 80 118 120 145 135 145 175 X 80 100 120 140 160 180 200 220 240 260

Se puede estimar la forma FRP a partir de la informacin muestral ?

Funcin de regresin muestral 1


Diagrama de dispersin de la primera muestra
300

Y 70 65 90 95 110 115 120 140 155 150

X 80 100 120 140 160 180 200 220 240 260

260 250 220 200 180 150 120 100 100 80 50 60 70 80 90 100 110 120 130 140 150 160 160 140 200 240

Diagrama de dispersin de la segunda muestra


310

Y 55 88 90 80 118 120 145 135 145 175

X 80 100 120 140 160 180 200 220 240 260

260 240 210 180 160 140 110 80 60 50 70 90 110 130 150 170 120 100 160 220 200

260

190

LNEAS DE REGRESIN BASADA EN DOS MUESTRAS DIFERENTES


190 170
FRM2 Regresin basada en la segunda muestra

150

FRM1

130

110
Regresin basada en la primera muestra

90

70

50 60 80 100 120 140 160 180 200 220 240 260 280

En forma anloga a la FRP se puede desarrollar el concepto de funcin de regresin muestral (FRM) para representar la lnea de regresin muestral, tal como:

X Y i 1 2 i

Donde: se lee Y gorro Y i 1 1 = estimador de = estimador de 2 2

Tal como se expresa la FRP en (a) y (b), se puede expresar la FRM en su forma estocstica de la siguiente forma:

X u i Y i 1 2 i

El objetivo principal en el anlisis de regresin es estimar la funcin de regresin poblacional (FRP) con base en la FRM.
Yi 1 2 X i ui
X u i Y i 1 2 i

LNEA DE REGRESIN MUESTRAL Y POBLACIONAL


Yi
Yi

X i FRM : Y 1 2 i

i Y
E (Y | X i )

ui

i u

FRP : E (Y | X i ) 1 2 X i

i Y
E (Y | X i )

l a m u n c d s C l a m u n c e d t s o C
Xi
Ingreso semanal

Continuar