Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Gujarati en su libro econometría, afirma que “El análisis de regresión trata del estudio
de la dependencia de una variable (variable dependiente) respecto de una o más
variables (variables explicativas) con el objetivo de estimar o predecir la media o valor
promedio poblacional de la primera en términos de los valores conocidos o fijos (en
muestras repetidas) de las segundas” (p.15).
Por lo tanto se concluye que la Función de regresión poblacional (F.R.P) trabaja con
todos los datos de una población determinada, por lo que se convierte en un concepto
idealizado, ya que pocas veces se tiene total acceso a la población que se desea
encuestar, por este motivo se utiliza más la F.R.M que la F.R.P. Al contrario de esta, la
función de regresión muestral (F.R.M), como su nombre lo dice, trabaja con una
muestra tomada al azar a una determinada población, es decir, trabaja con
estimaciones de factores y variable, por lo que se utiliza la F.R.M para estimar la F.R.P,
además, la F.R.M tiene como propósito cuantificar y medir el impacto de una variable
sobre otra, pronosticar y aconsejar sobre política económica.
El termino de error estocástico es el que se utiliza para representar todas las demás
variables que afectan a y pero que no están incluidas directamente en el modelo ya sea
porque no afectan en gran cantidad, porque son de carácter psicológico o simplemente
no se las tuvo en cuenta por alguna dificultad. El termino de error residual o muestral
usualmente se lo considera similar al término de error estocástico, pero la diferencia
radica en que mientras que el error residual es la distancia entre el punto de datos y la
línea estimada, el término de error estocástico es la distancia entre el punto de datos y
la línea verdadera. Ya vimos en la anterior pregunta las FRM y FRP y observamos que
mientras que la FRM trabaja con el error estocástico, la FRM trabaja con el error
residual o muestral y este último esta dado por la ecuación ε^ i= y i−^y i. Para terminar
podemos decir que un modelo de regresión nunca va a poder ser un completo reflejo
de la realidad, es decir, no puede describir la realidad en su total magnitud.
Mientras:
Y i=β 1 + β 2 ( X1 )+Ɛ
i
i
dy x 1
dx y
=−β 2
xy( )
modelo semilogarítmico, lin-log: es lineal en parámetros, pero no lineal o
logarítmico en la variable x, por lo tanto SI es un modelo de regresión lineal en
parámetros.
Y i=β 1 + β 2 ln X i+ Ɛ i
dY 1
dx
=β 2
x()
La elasticidad o efecto marginal está dado por:
dy x 1
dx y
=β2
y ()
modelo semilogarítmico inverso, log-lin: es lineal en parámetros, pero no lineal o
logarítmico en la variable Y, por lo tanto SI es un modelo de regresión lineal en
parámetros.
ln Y i= β1 + β 2 X i+ Ɛ i
dY
=β 2 ( y )
dx
La elasticidad o efecto marginal está dado por:
dy x
=β2 ( x )
dx y
dY y
dx
=β 2
x()
La elasticidad o efecto marginal está dado por:
dy x
=β2
dx y
modelo logarítmico reciproco: es lineal en parámetros, pero no lineal o logarítmico
en variables, por lo tanto SI es un modelo de regresión lineal en parámetros.
ln Y i= β1 + β 2 ( X1 )+Ɛ
i
i
dY y
dx ( )
=−β 2 2
x
dy x 1
dx y
=−β 2
x ()
modelo doble logarítmico reciproco: es lineal en parámetros, pero no lineal o
logarítmico en variables, por lo tanto SI es un modelo de regresión lineal en
parámetros.
ln Y i= β1 + β 2 ln ( X1 )+Ɛ
i
i
dY dY
( ln yi ) = ¿
dx dx
d yi
d xi d 1
yi
=β 2
( )
dx xi
1 dy
y dx
i i
i
=−β
( x1 ) 2
i
d yi y
d xi ( )
=−β 2 2i
xi
Dado que:
d yi y
d xi ( )
=−β 2 2i
xi
d y i xi y ∗x
d xi yi
=−β 2 2i i
xi ∗ yi ( )
d y i xi 1
d xi yi
=−β 2
x ()
dY x x
dx
=−β 2
y ()
−2 β 3
y ()
La elasticidad o efecto marginal está dado por:
dy x
=−β 2−2 β 3
dx y
Primer caso
1
Y i=
β 1 + β2 X i
y i∗(β ¿ ¿ 1+ β2 x i)=1 ¿
1
= β1 + β 2 x i
yi
Como podemos ver en este caso tenemos linealidad en parámetros, pero no en la
variable, por lo que podríamos hacerla lineal mediante alteraciones algebraicas sí:
Z 1
1=¿ ¿
yi
Z1=¿ β +β
1 2 x i¿
Xi
Y i=
β 1 + β2 X i
y i∗(β 1+ β2 x i)=x i
xi
= β1 + β 2 x i
yi
Z xi
1=¿ ¿
yi
Z1=¿ β +β 1 2 x i¿
Y de esta forma quedaría lineal. Sin embargo, cabe resaltar que econométricamente
hablando, no es lógico que una variable se explique en base a ella misma; es decir, que
habría una redundancia cíclica al dar solución a Xi/Yi utilizando la mima Xi, ya que no
sería coherente en especificación.
Tercer caso
1
ln Y i= − β1−β 2 X i
1+e
Este caso no puede ser linealizado por alteraciones algebraicas, pues aún si
intentáramos hacer lineal la expresión e− β −β X mediante un (Ln), no podríamos ya que
1 2 i
Sin embargo, de ser el caso que existiese una solución, ésta podría ser desarrollada tras
el uso de bastantes supuestos.
Cuarto caso
Y i=β 1 X iβ X βj2 3
ln Y i=ln β1 + β 2 ln X i + β 3 ln X j
En este caso, una vez linealizado todo menos el término ln β 1, podríamos plantear que:
α 1= ln β 1
Y por tanto:
ln Y i=α 1 + β 2 ln X i+ β3 ln X j
5. Considere la información del cuadro 1.
horas de
estudiante Nota (Y)
estudio (X)
1 2,7 3
2 3,6 5
3 4,1 7
4 2,3 2,5
5 3,1 4,5
6 2,8 3
7 4,5 8
8 2,2 2,5
9 4,1 7
10 3,8 5
11 1,9 2
12 2,7 3
13 2,9 3
14 3,9 7
15 4,5 10
Donde:
Para plasmar este modelo nos basamos en la función de regresión muestral, donde
tomamos una estimación de todos los datos antes mencionados.
Y^ i= β^ 0 + β^ 1 x i
^β 1= ∑ Y i x i−Ý i ∑ x i
∑ x i2− x́ i ∑ x i
^β 1= 265−3.273333∗72.5 =0.3322
433.75−4.83333∗72.5
Si mantenemos todo lo demás constante, podemos decir que un incremento en una
hora de estudio semanal, va a producir un incremento de 0.3322 puntos en la nota final
de microeconomía.
^β 0=Ý i − ^β1 x́ i
^β 0=3.273333−0.3322∗4.83333=1.6677
Las variables diferentes a las horas semanales de estudio, tienen un efecto de 1.6677
sobre la nota final de microeconomía.
Y^ i= β^ 0 + β^ 1 x i
Y^ =1.6677 +0.3322 x i
Cuando las horas semanales de estudio son iguales a cero, la nota final de
microeconomía será igual a 1.6677, debido a que otras variables diferentes, ya sean las
bases que tenga el estudiante o su asistencia a clases y demás, van a provocar que la
nota final tenga una variación.
SRC
r 2=1−
STC
0.99293
r 2=1− =0.90255202
10.189333
SEC
r 2=
STC
9.19640333
r 2= =0.90255202
10.1893333
El valor de 0.90255202 nos dice que con la variable (horas de estudio semanalmente),
estoy explicando el 90.255% de los cambios experimentados en la nota final de
microeconomía, lo que quiere decir que un 9.745% de las variaciones se explican por
otras variables que también influyen en la nota final pero que son diferentes a las horas
de estudio semanales. Este valor también nos dice que nuestro modelo tiene una
capacidad predictiva del 90.255%.
Modelo 1
Y i=β 0 + β 1 x i +Ɛ i
^β 1= ∑ Y i x i−Ý i ∑ x i
∑ x i2− x́ i ∑ x i
^β 1= 30197−48.25∗484 =1.09177922
25790−40.33333∗484
Si mantenemos todo lo demás constante, podemos decir que un incremento en una
señal de tránsito en mal estado, va a ocasionar un incremento de 1.09177922 accidentes
de tránsito.
^β 0=Ý i − ^β1 x́ i
^β 0=48.25−1.09177922∗40.333=4.21490482
Las variables diferentes a las señales de tránsito en mal estado, tienen un efecto de
4.21490482 sobre el número de accidentes de tránsito.
La ecuación de Y estimada estaría establecida de la siguiente manera.
Y^ =4.21490482+1.09177922 x i
SRC
r 2=1−
STC
18.1130224
r 2=1− =0.99758179
7490.25
La variable (señales de tránsito en mal estado) explica el número de accidentes de
tránsito en un 99.758% lo que quiere decir que un 0.242% del número de accidentes de
tránsito, se explican por otras variables. Añado que este modelo tiene una capacidad
predictiva del 99.758%.
Modelo 2
Y i=β 0 + β 1 x i +Ɛ i
^β 1= ∑ Y i x i−Ý i ∑ x i
∑ x i2− x́ i ∑ x i
^β 1= 7783−48.25∗121 =3.34772629
1801−10.08333∗121
Si mantenemos todo lo demás constante, podemos decir que un incremento en una
falla técnico-mecánica, va a ocasionar un incremento de 3.34772629 accidentes de
tránsito.
^β 0=Ý i − ^β1 x́ i
^β 0=48.25−3.34772629∗10.08333=14.4937599
Y^ =14.4937599+3.34772629 x i
SRC
r 2=1−
STC
979.759288
r 2=1− =0.86919538
7490.25
La variable (falla técnico-mecánica) explica el número de accidentes de tránsito en un
86.919% lo que quiere decir que un 13.081% del número de accidentes de tránsito, se
explican por otras variables. Añado que este modelo tiene una capacidad predictiva
del 86.919%.
Modelo 3
Y i=β 0 + β 1 x i +Ɛ i
^β 0=48.25+0.45170332∗95.5=91.3876671
Y^ =91.3876671-0.45170332 x i
Si el presupuesto de publicidad fuera de cero, la cantidad de accidentes de tránsito
seria de 91.3876671, debido a que puede ser afectado por otras variables.
SRC
r 2=1−
STC
392.861578
r 2=1− =0.94755027
7490.25
La variable (presupuesto de publicidad) explica el número de accidentes de tránsito en
un 94.75% lo que quiere decir que un 5.25% del número de accidentes de tránsito, se
explican por otras variables. Este modelo esta explicado o/y tiene una capacidad
predictiva del 94.755%.
Modelo 4
Y i=β 0 + β 1 x i +Ɛ i
Para este modelo vamos a tener en cuenta que hay menor número de accidentes de
tránsito cuando las vías son adecuadas, por lo tanto:
x i= tomare valores de 1 cuando existen vías adecuadas y 0 para cualquier otro caso.
1= vías adecuadas
0= vías inadecuadas
^β 1= ∑ Y i x i−Ý i ∑ x i
∑ x i2− x́ i ∑ x i
^β 1= 168−48.25∗6 =−40.5
6−0.5∗6
Si mantenemos todo lo demás constante, podemos decir que un incremento en la
calidad de vías va a ocasionar una disminución de 40.5 accidentes de tránsito.
^β 0=Ý i − ^β1 x́ i
^β 0=48.25+40.5∗0.5=68.5
Las variables diferentes a la calidad de vías, tienen un efecto de 68.5 sobre el número
de accidentes de tránsito.
La ecuación de Y estimada estaría establecida de la siguiente manera.
Y^ =68.5−40.5 x i
SRC
r 2=1−
STC
2569.5
r 2=1− =0.65695404
7490.25
La variable calidad de vías explica el número de accidentes de tránsito en un 65.69% lo
que quiere decir que un 34.31% del número de accidentes de tránsito, se explican por
otras variables. Este modelo esta explicado o tiene una capacidad predictiva del
65.69%.
Señales de
fallas técnico- Presupuesto de Calidad de las
tránsito en mal
mecánicas publicidad vías
estado
Anteriormente, dadas las interpretaciones de cada uno de los resultados y ahora, con
base en la comparación de los parámetros ^β 0, ^β 1 y el coeficiente de determinación r 2 de
los 4 modelos econométricos uniecuacionales univariados, para lograr determinar cuál
de los modelos se considera el mejor se tendrá en cuenta el modelo cuyos valores de los
parámetros y r 2 cumpla más requisitos:
1. Un r 2 alto que nos brinde una alta bondad de ajuste, que nos asegure que la mayor
parte de los cambios experimentados en el número de accidentes se deben a las
variaciones suscitadas en la variable independiente.
Tenemos entonces que, por un r 2 alto, el mejor modelo “hasta este momento” es
el MODELO 1.
2. Añadido a eso, que el valor de los parámetros no tienda o sea igual a cero, ya que
expresaría el menor efecto de las variables. Por lo que un buen modelo económico
demostraría la relación de significancia establecida y existente entre el parámetro
^β 1 y la variable dependiente Yi o número de accidentes con respecto a los cambios
de la variable independiente Xi en cada modelo econométrico.
Para este caso nos parece más conveniente el MODELO 4. Puesto que, cuando
disminuyen las vías adecuadas, el número de accidentes que se relacionan su variación
es más alto que en otros modelos, siendo que cambia en 40,5.
3. Si nos basamos en que el modelo sea consecuente, con que la teoría tenga sentido
con la práctica y el modelo tenga el mejor comportamiento, en nuestro criterio
nuevamente optaríamos por el MODELO 4. Ello, a razón de que:
En conclusión, estas últimas razones sumadas al hecho de que dicho MODELO 4 tiene
un alto ^β 1 que establece un gran efecto sobre la variable dependiente Yi, nos permiten
identificar en nuestro criterio a éste como el mejor modelo de entre todos.