Está en la página 1de 28

PRÁCTICAS TEMA 5 – MODELOS DE ELECCIÓN DISCRETA

EJERCICIO 1

En la realización de un estudio en el transporte urbano de cierta ciudad, se ha tomado


una muestra de 10 observaciones en una misma parada. En esta parada pasan dos líneas
de autobuses, de recorridos distintos, pero que permiten realizar el viaje entre la parada
donde se realiza la encuesta y otra parada destino común.

Una de las informaciones que se trataba de captar en la encuesta realizada era detectar
cuál de las dos líneas seleccionaba la persona, sabiendo que existe una LÍNEA 1 con
más frecuencia, pero más tiempo de recorrido, que otra LÍNEA 2 de menor frecuencia.

Es decir, el conjunto de alternativas posibles son dos:

1. Subir al autobús de la LÍNEA 1 y realizar el viaje.


2. Esperar al autobús de la LÍNEA 2 y realizar el viaje.

Los atributos para cada alternativa son:

1. Tiempo de recorrido desde la parada origen a la parada destino en la LÍNEA 1.


2. Tiempo de espera a la LÍNEA 2 más tiempo de recorrido de la parada origen a la
parada destino en LÍNEA 2.

Para ello, disponemos de 10 observaciones de usuarios en la parada en el instante en que


se encuentra allí el autobús de la LÍNEA 1, debiendo decidir si suben a ese autobús o
esperan a la LÍNEA 2.

OBSERVACIÓN OPCIÓN ATRIBUTOS


SELECCIONADA
Tiempo recorrido L1 Tiempo espera más
recorrido L2
1 1 11 16
2 2 10 10
3 1 15 17
4 1 11 9
5 1 9 12
6 2 16 11
7 2 14 10
8 1 13 13
9 2 11 10
10 1 9 14

En base a esta información, se pide:


1) Estimar el parámetro θ que define la función de probabilidad del usuario.
2) Calcular las probabilidades de elección de las distintas observaciones.
3) Intentar resolver el mismo problema si en la observación número 4 se eligiera la
Línea 2.
SOLUCIÓN:

1) Estimar el parámetro θ que define la función de probabilidad del usuario

Únicamente existen dos alternativas con un solo atributo. Por tanto:

eθ ⋅ X 1
i

P =i

eθ ⋅ X 1 + eθ ⋅ X 2
1 i i

P2i = 1− P1i

La función de verosimilitud de la muestra es:

L(θ ) = ∏∏ ( Pji )
gij

L(θ ) = P11 ⋅ P22 ⋅ P13 ⋅ P14 ⋅ P15 ⋅ P26 ⋅ P27 ⋅ P18 ⋅ P29 ⋅ P110

e11⋅θ e10⋅θ e15⋅θ e11⋅θ e 9⋅θ


L(θ ) = 11⋅θ ⋅ ⋅ ⋅ ⋅ ⋅
e + e16⋅θ e10⋅θ + e10⋅θ e15⋅θ + e17⋅θ e11⋅θ + e 9⋅θ e 9⋅θ + e12⋅θ
e11⋅θ e10⋅θ e13⋅θ e10⋅θ e 9⋅θ
⋅ 16⋅θ ⋅ ⋅ ⋅ ⋅
e + e11⋅θ e14⋅θ + e10⋅θ e13⋅θ + e13⋅θ e11⋅θ + e10⋅θ e 9⋅θ + e14⋅θ
Debemos maximizar la función de verosimilitud. En este paso, tenemos dos opciones:

1 – Derivar parcialmente (en este caso, totalmente, porque sólo hay un parámetro)
respecto de θ. Pero es más cómodo si antes tomamos Ln en la función.

Ln( L(θ )) = l (θ ) = 11 ⋅ θ − Ln(e11⋅θ + e16⋅θ ) + 10 ⋅ θ − Ln(e10⋅θ + e10⋅θ ) +


+ 15 ⋅ θ − Ln(e15⋅θ + e17⋅θ ) + 11 ⋅ θ − Ln(e11⋅θ + e 9⋅θ ) +
+ 9 ⋅ θ − Ln(e 9⋅θ + e12⋅θ ) + 11 ⋅ θ − Ln(e16⋅θ + e11⋅θ ) +
+ 10 ⋅ θ − Ln(e14⋅θ + e10⋅θ ) + 13 ⋅ θ − Ln(e13⋅θ + e13⋅θ ) +
+ 10 ⋅ θ − Ln(e11⋅θ + e10⋅θ ) + 9 ⋅ θ − Ln(e 9⋅θ + e14⋅θ )

Derivando e igualando a cero, obtendremos el valor de θ:

∂ ln( f (θ )) f ' (θ ) ∂e f (θ )
= ; = f ' (θ ) ⋅ e f (θ )
∂θ f (θ ) ∂θ
∂l (θ ) 11 ⋅ e11⋅θ + 16 ⋅ e16⋅θ 10 ⋅ e10⋅θ + 10 ⋅ e10⋅θ
= 11 − + 10 − +
∂θ e11⋅θ + e16⋅θ e10⋅θ + e10⋅θ
15 ⋅ e15⋅θ + 17 ⋅ e17⋅θ 11 ⋅ e11⋅θ + 9 ⋅ e 9⋅θ 9 ⋅ e 9⋅θ + 12 ⋅ e12⋅θ
+ 15 − + 11 − +9− +
e15⋅θ + e17⋅θ e11⋅θ + e 9⋅θ e 9⋅θ + e12⋅θ
16 ⋅ e16⋅θ + 11 ⋅ e11⋅θ 14 ⋅ e14⋅θ + 10 ⋅ e10⋅θ 13 ⋅ e13⋅θ + 13 ⋅ e13⋅θ
+ 11 − + 10 − + 13 − +
e16⋅θ + e11⋅θ e14⋅θ + e10⋅θ e13⋅θ + e13⋅θ
11 ⋅ e11⋅θ + 10 ⋅ e10⋅θ 9 ⋅ e 9⋅θ + 14 ⋅ e14⋅θ
+ 10 − +9−
e11⋅θ + e10⋅θ e 9⋅θ + e14⋅θ

Desarrollamos las divisiones para facilitar el trabajo:

11 ⋅ e11⋅θ + 16 ⋅ e16⋅θ 11 ⋅ e11⋅θ + 11 ⋅ e16⋅θ 5 ⋅ e16⋅θ 5 ⋅ e16⋅θ


= + = 11 +
e11⋅θ + e16⋅θ e11⋅θ + e16⋅θ e11⋅θ + e16⋅θ e11⋅θ + e16⋅θ
10 ⋅ e10⋅θ + 10 ⋅ e10⋅θ
= 10
e10⋅θ + e10⋅θ
15 ⋅ e15⋅θ + 17 ⋅ e17⋅θ 15 ⋅ e15⋅θ + 15 ⋅ e17⋅θ 2 ⋅ e17⋅θ 2 ⋅ e17⋅θ
= + = 15 +
e15⋅θ + e17⋅θ e15⋅θ + e17⋅θ e15⋅θ + e17⋅θ e15⋅θ + e17⋅θ
11 ⋅ e11⋅θ + 9 ⋅ e 9⋅θ 9 ⋅ e11⋅θ + 9 ⋅ e 9⋅θ 2 ⋅ e11⋅θ 2 ⋅ e11⋅θ
= + 11⋅θ = 9 + 11⋅θ
e11⋅θ + e 9⋅θ e11⋅θ + e 9⋅θ e + e 9⋅θ e + e 9⋅θ
9 ⋅ e 9⋅θ + 12 ⋅ e12⋅θ 9 ⋅ e 9⋅θ + 9 ⋅ e12⋅θ 3 ⋅ e12⋅θ 3 ⋅ e12⋅θ
= + = 9 +
e 9⋅θ + e12⋅θ e 9⋅θ + e12⋅θ e 9⋅θ + e12⋅θ e 9⋅θ + e12⋅θ
16 ⋅ e16⋅θ + 11 ⋅ e11⋅θ 11 ⋅ e16⋅θ + 11 ⋅ e11⋅θ 5 ⋅ e16⋅θ 5 ⋅ e16⋅θ
= + 16⋅θ = 11 + 16⋅θ
e16⋅θ + e11⋅θ e16⋅θ + e11⋅θ e + e11⋅θ e + e11⋅θ
14 ⋅ e14⋅θ + 10 ⋅ e10⋅θ 10 ⋅ e14⋅θ + 10 ⋅ e10⋅θ 4 ⋅ e14⋅θ 4 ⋅ e14⋅θ
= + = 10 +
e14⋅θ + e10⋅θ e14⋅θ + e10⋅θ e14⋅θ + e10⋅θ e14⋅θ + e10⋅θ
13 ⋅ e13⋅θ + 13 ⋅ e13⋅θ
= 13
e13⋅θ + e13⋅θ
11 ⋅ e11⋅θ + 10 ⋅ e10⋅θ 10 ⋅ e11⋅θ + 10 ⋅ e10⋅θ e11⋅θ e11⋅θ
= + = 10 +
e11⋅θ + e10⋅θ e11⋅θ + e10⋅θ e11⋅θ + e10⋅θ e11⋅θ + e10⋅θ
9 ⋅ e 9⋅θ + 14 ⋅ e14⋅θ 9 ⋅ e 9⋅θ + 9 ⋅ e14⋅θ 5 ⋅ e14⋅θ 5 ⋅ e14⋅θ
= + 9⋅θ = 9 + 9⋅θ
e 9⋅θ + e14⋅θ e 9⋅θ + e14⋅θ e + e14⋅θ e + e14⋅θ
Y entonces, queda:
∂l (θ )  5 ⋅ e16⋅θ   2 ⋅ e17⋅θ 
= 11 − 11 + 11⋅θ  + 10 − (10 ) + 15 − 15 + 15⋅θ +
17⋅θ 
∂θ  e + e16⋅θ   e + e 
 2 ⋅ e11⋅θ   3⋅ e12⋅θ
  5⋅e 16⋅θ

+ 11 −  9 + 11⋅θ  + 9 −  9 + 9⋅θ  + 11 − 11 + 16⋅θ
12⋅θ 
+
11⋅θ 
 e + e 9⋅θ   e + e   e + e 
 4 ⋅ e14⋅θ   e11⋅θ 
+ 10 − 10 + 14⋅θ  + 13 − (13) + 10 − 10 + 11⋅θ  +
 e + e10⋅θ   e + e10⋅θ 
 5 ⋅ e14⋅θ 
+ 9 −  9 + 9⋅θ =
 e + e14⋅θ 
5 ⋅ e16⋅θ 2 ⋅ e17⋅θ 2 ⋅ e11⋅θ 3 ⋅ e12⋅θ 5 ⋅ e16⋅θ
= − 11⋅θ − + 2 − 11⋅θ − − −
e + e16⋅θ e15⋅θ + e17⋅θ e + e 9⋅θ e 9⋅θ + e12⋅θ e16⋅θ + e11⋅θ
4 ⋅ e14⋅θ e11⋅θ 5 ⋅ e14⋅θ
− 14⋅θ − −
e + e10⋅θ e11⋅θ + e10⋅θ e 9⋅θ + e14⋅θ
Haciendo el cambio x=eθ

∂l (θ ) 5 ⋅ e16⋅θ 2 ⋅ e17⋅θ 2 ⋅ e11⋅θ 3 ⋅ e12⋅θ 5 ⋅ e16⋅θ


= − 11⋅θ − + 2 − − − −
∂θ e + e16⋅θ e15⋅θ + e17⋅θ e11⋅θ + e 9⋅θ e 9⋅θ + e12⋅θ e16⋅θ + e11⋅θ
4 ⋅ e14⋅θ e11⋅θ 5 ⋅ e14⋅θ
− 14⋅θ − − =
e + e10⋅θ e11⋅θ + e10⋅θ e 9⋅θ + e14⋅θ
5 ⋅ x16 2 ⋅ x17 2 ⋅ x11 3 ⋅ x12 5 ⋅ x16 4 ⋅ x14
= − 11 16 − 15 + 2 − 11 − − − −
x +x x + x17 x + x 9 x 9 + x12 x16 + x11 x14 + x10
x11 5 ⋅ x14
− 11 10 − 9
x +x x + x14
Igualando esta expresión a 0, se resuelve x (de forma aproximada), obteniendo lo que
sigue:

∂l (θ ) 5 ⋅ x16 2 ⋅ x17 2 ⋅ x11 3 ⋅ x12 5 ⋅ x16


= − 11 16 − 15 + 2 − 11 − − −
∂θ x +x x + x17 x + x 9 x 9 + x12 x16 + x11
4 ⋅ x14 x11 5 ⋅ x14
− 14 − − = 0 ⇒ x = 0,48526
x + x10 x11 + x10 x 9 + x14
Y por tanto el parámetro θ valdrá:

x = eθ = 0,48526 ⇒ ln x = θ = −0,72307
2 – Representación gráfica de la función de log-verosimilitud respecto de θ. El máximo
coincide con el obtenido anteriormente mediante derivaciones matemáticas. En este
caso, la resolución es más aproximada.

-3,892

-3,893

-3,894
ln L(theta)

-3,895

-3,896

-3,897

-3,898
-0,76 -0,75 -0,74 -0,73 -0,72 -0,71 -0,7 -0,69 -0,68

Parámetro (theta)

2) Calcular las probabilidades de elección de las distintas observaciones

A continuación, obtendremos las probabilidades de elección, y comprobaremos la


calidad del modelo obtenido:
e −0,72307⋅ X1
i

P1i =
e −0,72307⋅ X1 + e −0,72307⋅ X 2
i i

P2i = 1− P1i

OBSERVACIÓN VALOR DE P
P1 P2
1 0,9738 0,0262
2 0,5 0,5
3 0,8094 0,1906
4 0,1906 0,8094
5 0,8975 0,1025
6 0,0262 0,9738
7 0,0525 0,9475
8 0,5 0,5
9 0,3267 0,6733
10 0,9738 0,0262

Representa la realidad en todas las observaciones menos en la número 4 (y en las que


los tiempos son iguales, ya que las dos alternativas son equiprobables).
3) Intentar resolver el mismo problema si en dicha observación (número 4) se eligiera la
Línea 2  ¿Qué sucede?

En este caso, la función de verosimilitud sería:

L(θ ) = P11 ⋅ P22 ⋅ P13 ⋅ P24 ⋅ P15 ⋅ P26 ⋅ P27 ⋅ P18 ⋅ P29 ⋅ P110

e11⋅θ e10⋅θ e15⋅θ e 9⋅θ e 9⋅θ


L(θ ) = 11⋅θ ⋅ ⋅ ⋅ ⋅ ⋅
e + e16⋅θ e10⋅θ + e10⋅θ e15⋅θ + e17⋅θ e11⋅θ + e 9⋅θ e 9⋅θ + e12⋅θ
e11⋅θ e10⋅θ e13⋅θ e10⋅θ e 9⋅θ
⋅ 16⋅θ ⋅ ⋅ ⋅ ⋅
e + e11⋅θ e14⋅θ + e10⋅θ e13⋅θ + e13⋅θ e11⋅θ + e10⋅θ e 9⋅θ + e14⋅θ
Y su logaritmo neperiano:

Ln( L(θ )) = l (θ ) = 11 ⋅ θ − Ln(e11⋅θ + e16⋅θ ) + 10 ⋅ θ − Ln(e10⋅θ + e10⋅θ ) +


+ 15 ⋅ θ − Ln(e15⋅θ + e17⋅θ ) + 9 ⋅ θ − Ln(e11⋅θ + e 9⋅θ ) +
+ 9 ⋅ θ − Ln(e 9⋅θ + e12⋅θ ) + 11 ⋅ θ − Ln(e16⋅θ + e11⋅θ ) +
+ 10 ⋅ θ − Ln(e14⋅θ + e10⋅θ ) + 13 ⋅ θ − Ln(e13⋅θ + e13⋅θ ) +
+ 10 ⋅ θ − Ln(e11⋅θ + e10⋅θ ) + 9 ⋅ θ − Ln(e 9⋅θ + e14⋅θ )

Derivando respecto a θ:

∂l (θ ) 11 ⋅ e11⋅θ + 16 ⋅ e16⋅θ 10 ⋅ e10⋅θ + 10 ⋅ e10⋅θ


= 11 − + 10 − +
∂θ e11⋅θ + e16⋅θ e10⋅θ + e10⋅θ
15 ⋅ e15⋅θ + 17 ⋅ e17⋅θ 11⋅ e11⋅θ + 9 ⋅ e 9⋅θ 9 ⋅ e 9⋅θ + 12 ⋅ e12⋅θ
+ 15 − +9− +9− +
e15⋅θ + e17⋅θ e11⋅θ + e 9⋅θ e 9⋅θ + e12⋅θ
16 ⋅ e16⋅θ + 11⋅ e11⋅θ 14 ⋅ e14⋅θ + 10 ⋅ e10⋅θ 13 ⋅ e13⋅θ + 13 ⋅ e13⋅θ
+ 11 − + 10 − + 13 − +
e16⋅θ + e11⋅θ e14⋅θ + e10⋅θ e13⋅θ + e13⋅θ
11⋅ e11⋅θ + 10 ⋅ e10⋅θ 9 ⋅ e 9⋅θ + 14 ⋅ e14⋅θ
+ 10 − +9−
e11⋅θ + e10⋅θ e 9⋅θ + e14⋅θ
Desarrollando las divisiones, simplificando y haciendo el cambio x=eθ:

∂l (θ )  5 ⋅ e16⋅θ   2 ⋅ e17⋅θ 
= 11 − 11 + 11⋅θ  + 10 − (10 ) + 15 − 15 + 15⋅θ +
17⋅θ 
∂θ  e + e16⋅θ   e + e 
 2 ⋅ e11⋅θ   3 ⋅ e12⋅θ   5 ⋅ e16⋅θ 
+ 9 −  9 + 11⋅θ  + 9 −  9 + 9⋅θ  + 11 − 11 + 16⋅θ +
 e + e 9⋅θ   e + e12⋅θ   e + e11⋅θ 
 4 ⋅ e14⋅θ   e11⋅θ 
+ 10 − 10 + 14⋅θ  + 13 − (13) + 10 − 10 + 11⋅θ  +
 e + e10⋅θ   e + e10⋅θ 
 5 ⋅ e14⋅θ  5 ⋅ e16⋅θ 2 ⋅ e17⋅θ 2 ⋅ e11⋅θ 3 ⋅ e12⋅θ
+ 9 −  9 + 9⋅θ  = − 11⋅θ
14⋅θ  16⋅θ
− 15⋅θ 17⋅θ
− 11⋅θ 9⋅θ
− 9⋅θ 12⋅θ

 e + e  e + e e + e e + e e + e
16⋅θ
5⋅e 4 ⋅ e14⋅θ e11⋅θ 5 ⋅ e14⋅θ 5 ⋅ x16
− 16⋅θ − − − = − 11 16 −
e + e11⋅θ e14⋅θ + e10⋅θ e11⋅θ + e10⋅θ e 9⋅θ + e14⋅θ x +x
2⋅ x 17
2⋅ x 11
3⋅ x 12
5⋅ x 16
4⋅ x 14
x11 5 ⋅ x14
− 15 − − − − − −
x + x17 x11 + x 9 x 9 + x12 x16 + x11 x14 + x10 x11 + x10 x 9 + x14
En este caso, no existe solución que iguale esta expresión a 0.

• El único valor que podría ser válido sería x=0. Sin embargo, los denominadores
nos quedarían nulos, con lo estaríamos dividiendo 0 entre 0, lo que es una
indeterminación.

• Incluso aunque x=0 fuera válido, no tiene sentido lógico, ya que, para calcular θ,
necesitaríamos obtener el logaritmo neperiano de x, que no existe si x=0.

• Además, si representamos gráficamente la función, quedaría como sigue:


100

50
d l (theta) / d theta

-50

-100

-150
-2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5

X
Por tanto, podemos extraer una importante conclusión de este apartado, dado que se ha
comprobado que, si entre las observaciones no hay ninguna que contenga una respuesta
“equivocada”, el modelo es inestimable.

La razón de esta circunstancia es que los modelos de elección discreta se basan en una
teoría probabilística. Si no hay nadie que se “equivoque”, el error sería nulo, y no
estamos ante un modelo probabilístico, sino determinista.

En dicho caso, el modelo logit multinomial que estamos intentando calibrar no tiene
sentido, ya que se basa en la hipótesis de que los errores siguen una distribución de
probabilidad según la Ley de Gumbel. Dado que los errores son nulos, evidentemente
no se ajustan a esta distribución, con lo que no es aplicable este tipo de modelo, ni
ningún otro que tenga un enfoque probabilístico.

Anexo  Demostración de que el valor de theta que maximiza la función de


verosimilitud L(θ) también maximiza su logaritmo neperiano l(θ)

Dada la fórmula con la que obtenemos la probabilidad para un modelo logit


multinomial:

eVi
Pi =
∑e
Vj

Para que existiera alguna probabilidad Pk nula, debería darse que la exponencial de Vk
fuera también nula, lo que sólo sucedería si la utilidad representativa tuviera valor - ∞.
Dado que esta utilidad representativa es una función de números reales, generalmente
con forma polinómica, es imposible que valga - ∞, por lo que no puede darse el caso de
que la probabilidad de elección de alguna alternativa sea nula.

Por otra parte, dado que la suma de las probabilidades de todas las alternativas
disponibles debe ser igual a la unidad, y dado que no hay ninguna probabilidad nula,
también podemos deducir que no habrá ninguna probabilidad igual a 1.

En resumen, dada la forma de las probabilidades en el modelo logit multinomial, éstas


siempre deben valer:

0 < Pk < 1 ∀Ak ∈ A

Además, dado que la función de verosimilitud se compone de un producto de


probabilidades (elevadas a 0 ó a 1), y todas éstas están en el conjunto (0,1), la función
de verosimilitud L(θ) también estará comprendida en este conjunto (0,1), sin alcanzar
ninguna los valores extremos.

0 < Pk < 1 ∀Ak ∈ A 



L = ∏ ∏ Pj ( )
q g jq  ⇒ 0 < L(θ ) < 1
q j 
Entonces, dadas las propiedades de la derivada del logaritmo neperiano, podemos
concluir que la derivada de l(θ) se anula si y sólo si la derivada de L(θ) también se
anula.

∂l (θ ) ∂ ln L(θ ) L ′(θ ) 
l ′(θ ) = = = ⇒ L ′(θ ) = l ′(θ ) ⋅ L(θ )
∂θ ∂θ L(θ )  L ′(θ ) = 0 ⇔ l ′(θ ) = 0
L(θ ) ≠ 0 

Sin embargo, no basta con que la derivada se anule para que el punto sea un máximo
de la función. También es necesario que la segunda derivada sea negativa, para
demostrar que la función es cóncava hacia las ordenadas negativas. Dicha segunda
derivada de la función l(θ) valdrá:

∂ L (θ )

∂l ′(θ ) L(θ ) L ′′(θ ) ⋅ L(θ ) − L ′(θ ) ⋅ L ′(θ )
l ′′(θ ) = = =
∂θ ∂θ (L(θ ))2
Para el valor de theta en que las derivadas de L(θ) y l(θ) se anulan, esta expresión vale:

L ′′(θ ) ⋅ L(θ )
l ′′(θ ) =
(L(θ ))2
Además, como ya se ha demostrado anteriormente, L(θ) está comprendida entre 0 y 1,
pero sin alcanzar nunca dichos valores. Entonces, (L(θ))2 también estará en ese rango.
Así, dado que ambas funciones tienen valores positivos, podemos concluir que, para el
valor de theta que anula las derivadas de L(θ) y de l(θ), el signo de las segundas
derivadas coincide.

L(θ ) 
l ′′(θ ) = L ′′(θ ) ⋅
(L(θ ))2 

0 < L(θ ) < 1  ⇒ Signo l ′′(θ ) = Signo L ′′(θ )

0 < (L(θ )) < 1
2



Por tanto, teniendo en cuenta las condiciones de la primera y segunda derivadas,


podemos concluir que, para un valor determinado del parámetro theta, la función L(θ)
alcanzará un máximo si y sólo si la función l(θ) también está en un máximo.

Así, dadas las características de la función de verosimilitud (compuesta por un


producto de probabilidades mayores que 0 y menores que 1), se comprueba que el valor
de theta que la maximiza coincide con el que maximiza su logaritmo neperiano, como
queríamos demostrar. Pero esto no implica, evidentemente, que el valor de ambas
funciones sea el mismo, sino sólo que tienen el máximo en la misma posición en el eje
de abscisas.
EJERCICIO 2

Considere un modelo logit binario para coche y autobús, con las siguientes funciones de
utilidad representativa:

Vauto = 0,35 – 0,03 ta – 0,15 ca


Vbus = – 0,03 tb – 0,15 cb

donde t es el tiempo de viaje en el vehículo (minutos) y c es el coste del viaje (euros).

La tabla presentada a continuación presenta información para un grupo de individuos


que viven en la zona A y viajan al trabajo en la zona C (tiempo en minutos, y coste en
céntimos de euro):

Opción Nivel de
Individuo ta tb ca cb
escogida ingreso
1 Coche Alto 30,2 45,0 10 5
2 Coche Bajo 34,8 50,2 55 35
3 Bus Bajo 12,0 14,0 45 17
4 Bus Alto 45,0 50,6 8 5
5 Bus Bajo 15,3 20,5 50 17
6 Coche Alto 47,5 83,2 15 7
7 Bus Bajo 65,5 100,5 200 54
8 Coche Alto 22,0 30,4 13 4

En base a esta información, se pide:


1) Encontrar la proporción que escogería el coche, utilizando el método de
enumeración muestral.
2) Encontrar esta misma proporción utilizando el enfoque inocente. Calcule
el error de agregación en este caso.
3) Encontrar ahora la proporción agregada utilizando el método de
clasificación (empleando el ingreso como variable estratificadora).
Compare estos resultados con los del enfoque inocente.
SOLUCIÓN:

1) Enumeración muestral

En esta metodología, se calculan las utilidades representativas de las dos alternativas,


así como sus probabilidades de elección, para cada observación, como sigue:

eVcoche
P(coche) = Vcoche
e + eVbus

A continuación, el promedio de todas estas probabilidades será la proporción estimada


de individuos que elegirían el coche.

Los valores de utilidad y probabilidad resultan:

Individuo Va Vb Proba Probb


1 -0,571 -1,358 0,687 0,313
2 -0,777 -1,559 0,686 0,314
3 -0,078 -0,446 0,591 0,409
4 -1,012 -1,526 0,626 0,374
5 -0,184 -0,641 0,612 0,388
6 -1,098 -2,507 0,804 0,196
7 -1,915 -3,096 0,765 0,235
8 -0,330 -0,918 0,643 0,357

Finalmente, la proporción que escoge coche será el promedio de las observaciones. En


este caso, resulta un 67,7%.

2) Enfoque inocente

En el enfoque inocente, se introducen a las funciones de utilidad los valores medios


zonales, y se calcula la probabilidad a partir de éstos:

Valores medios (de todos los datos):


• ta  34,0 minutos
• tb  49,3 minutos
• ca  0,50 €
• cb  0,18 €

Entonces, el valor de las utilidades representativas en este enfoque sería

Vauto = 0,35 – 0,03 ta – 0,15 ca = 0,35 – 0,03 * 34,0 – 0,15 * 0,50 = – 0,745

Vbus = – 0,03 tb – 0,15 cb = – 0,03 * 49,3 – 0,15 * 0,18 = – 1,506


Así pues, la proporción agregada de individuos que elegiría el coche queda:

eVcoche e −0, 745


P(coche) = = = 0,681 = 68,1%
eVcoche + eVbus e −0, 745 + e −1,506

Calculamos el porcentaje de error:

Pinocente − Penumeración 0,681 − 0,677


error = = = 0,0059 = 0,6%
Penumeración 0,677

3) Clasificación

Es una metodología similar al enfoque inocente, pero dividiendo a los individuos en


estratos supuestamente homogéneos. De este modo, ahora tendríamos dos
subpoblaciones, en función del nivel de ingreso.

A partir de los valores medios de los parámetros de las cuatro variables, se obtienen las
utilidades medias de cada estrato, así como su probabilidad de elección del coche. Esta
información se presenta en las tablas que siguen:

Valores Ingresos Ingresos


medios altos bajos
ta 36,2 31,9
tb 52,3 46,3
ca 12 88
cb 5 31

Estrato Va Vb Proba Probb


Ingresos altos -0,753 -1,577 0,695 0,305
Ingresos bajos -0,738 -1,435 0,667 0,333

Por último, la proporción global se calcula ajustando las probabilidades de cada estrato
al número de individuos del mismo que configuran la población:

Individuosingresos altos Individuosingresos bajos


P(coche) = P(coche)ingresos altos ⋅ + P(coche)ingresos bajos ⋅ =
Individuostotal Individuostotal
4 4
= 0,695 ⋅ + 0,667 ⋅ = 0,681 = 68,1%
8 8

De este modo, la proporción agregada resulta exactamente igual que la obtenida por el
enfoque inocente. Ello es debido a que, en este caso, los dos estratos dividen a la
población en dos mitades exactamente iguales, por lo que al final la clasificación resulta
similar al promedio global.

Sin embargo, dado que en la población estos estratos no estarán exactamente igual
distribuidos, sí serían distintos los resultados  Las proporciones que hay que emplear
son las de la población, no las de la muestra  En este caso las desconocemos
EJERCICIO 3

Considere un modelo logit binario para coche y autobús, en el que las siguientes
funciones de utilidad representativa han sido estimada con base en una muestra de 750
individuos pertenecientes a un sector particular del área urbana:

Vauto = 3,5 – 0,25 ta – 0,42 ea – 0,1 ca


Vbus = – 0,25 tb – 0,42 eb – 0,1 cb

donde t es el tiempo de viaje en el vehículo (minutos), e es el tiempo de acceso


(minutos) y c es el coste del viaje (€).

Suponga conocidos los siguientes datos promedio:

Variable
Modo
t e c
Coche 25 5 1,40
Autobús 40 8 0,50

Además, se conoce el número de individuos que escoge cada opción en el sector y en el


área completa. Dichas cifras son las siguientes:

Número de individuos que escogen


Modo la alternativa i
Muestra Población
Coche 283 17.100
Autobús 467 68.900

En base a esta información, se pide:


1) Calcular el porcentaje de variación en la probabilidad de escoger la
alternativa “coche”, si la tarifa del bus aumenta en un 25%.
2) Encuentre qué sucedería si, por el contrario, los costes del automóvil se
incrementaran en un 100%, mientras el tiempo de viaje en el vehículo en
coche se reduce en 5 minutos.
3) Unión de ambos efectos.
SOLUCIÓN:

Este problema se puede resolver mediante un análisis de pivoteo, ya que conocemos las
proporciones de mercado de la población, así como las funciones de utilidad de las
diferentes alternativas.

De este modo, en primer lugar calcularemos las proporciones de mercado de cada


alternativa:

• Proporción coche = 17.100 / (17.100 + 68.900) = 17.100 / 86.000 = 0,199


• Proporción bus = 68.900 / 86.000 = 0,801

Mediante el análisis de pivoteo, únicamente será necesario considerar los incrementos


de utilidad de las distintas alternativas, así como sus proporciones de mercado. De este
modo, las nuevas proporciones estimadas para cada modo serían:

p BUS ⋅ e ∆U BUS
pˆ BUS =
p BUS ⋅ e ∆U BUS + pCOCHE ⋅ e ∆U COCHE
pCOCHE ⋅ e ∆U COCHE
pˆ COCHE =
p BUS ⋅ e ∆U BUS + pCOCHE ⋅ e ∆U COCHE

A continuación, analizamos las distintas situaciones que se nos presentan:

1) Aumento de la tarifa del autobús en un 25%

En este caso, el único incremento (positivo o negativo) de utilidades se corresponderá


con el término de las tarifas. De este modo:

∆U coche = −0,25∆t a − 0,42∆ea − 0,1∆c a = 0


∆U bus = −0,25∆t b − 0,42∆eb − 0,1∆cb = −0,1∆cb = −0,1 ⋅ (0,25 ⋅ 0,50) = −0,0125

Así, las proporciones finales de mercado estimadas quedarían:

p BUS ⋅ e ∆U BUS 0,801 ⋅ e −0, 0125


pˆ BUS = = = 0,799
p BUS ⋅ e ∆U BUS + p COCHE ⋅ e ∆U COCHE 0,801 ⋅ e −0,0125 + 0,199 ⋅ e 0
pCOCHE ⋅ e ∆U COCHE 0,199 ⋅ e 0
pˆ COCHE = = = 0,201
p BUS ⋅ e ∆U BUS + p COCHE ⋅ e ∆U COCHE 0,801 ⋅ e −0,0125 + 0,199 ⋅ e 0

Es decir, un 0,2% (variación absoluta, tomada como proporción final menos proporción
inicial) del total de la población dejará de emplear el autobús, comenzando a viajar en
coche. En variaciones relativas, tendremos que un 0,25% de los usuarios de coche dejan
de utilizarlo, y que el uso del autobús aumento un 1% respecto de su valor inicial.

0,799 − 0,801 0,201 − 0,199


∆ rel p coche = = −0,0025 ; ∆ rel p bus = = 0,01
0,801 0,199
2) Aumento del coste en el automóvil de un 100%, junto con una reducción de
5 minutos en el tiempo de viaje en el vehículo

En este caso, los incrementos de utilidad se producen en el coche. De este modo:

∆U coche = −0,25∆t a − 0,42∆ea − 0,1∆c a = −0,25∆t − 0,1∆c a =


= −0,25 ⋅ (− 5) − 0,1 ⋅ (1 ⋅ 1,40) = +1,11
∆U bus = −0,25∆t b − 0,42∆eb − 0,1∆cb = 0

Y, por tanto, las proporciones finales de mercado estimadas quedarían:

p BUS ⋅ e ∆U BUS 0,801 ⋅ e 0


pˆ BUS = = = 0,570
p BUS ⋅ e ∆U BUS + p COCHE ⋅ e ∆U COCHE 0,801 ⋅ e 0 + 0,199 ⋅ e1,11
pCOCHE ⋅ e ∆U COCHE 0,199 ⋅ e1,11
pˆ COCHE = = = 0,430
p BUS ⋅ e ∆U BUS + p COCHE ⋅ e ∆U COCHE 0,801 ⋅ e 0 + 0,199 ⋅ e1,11

En este caso, del 80,1% de proporción de uso del autobús, ésta desciende hasta un 57%,
produciéndose por tanto un cambio de modo (variación absoluta) en el 23,1% de los
usuarios.

3) Unión de ambos efectos

Comprobaremos si el efecto conjunto es igual a la suma de los efectos:

∆U coche = −0,25∆t a − 0,42∆ea − 0,1∆c a = −0,25∆t − 0,1∆c a =


= −0,25 ⋅ (− 5) − 0,1 ⋅ (1 ⋅ 1,40) = +1,11
∆U bus = −0,25∆t b − 0,42∆eb − 0,1∆cb = −0,1∆cb = −0,1 ⋅ (0,25 ⋅ 0,50) = −0,0125

p BUS ⋅ e ∆U BUS 0,801 ⋅ e −0, 0125


pˆ BUS = = = 0,567
p BUS ⋅ e ∆U BUS + pCOCHE ⋅ e ∆U COCHE 0,801 ⋅ e − 0, 0125 + 0,199 ⋅ e1,11
p COCHE ⋅ e ∆U COCHE 0,199 ⋅ e1,11
pˆ COCHE = = = 0,433
p BUS ⋅ e ∆U BUS + pCOCHE ⋅ e ∆U COCHE 0,801 ⋅ e −0, 0125 + 0,199 ⋅ e1,11

Por tanto, se observa que el efecto de ambas modificaciones influye de manera superior
que el de cada una por separado (respecto de la situación original), como podríamos
esperar. En los casos anteriores había un trasvase (en variaciones absolutas) de usuarios
de un 0,2% y un 23,1%, mientras que, con las dos acciones conjuntamente, este valor es
de un 23,4% de usuarios, ligeramente superior a la suma de los anteriores.

Nota: Se podría calcular también este último apartado aplicando los cambios del coche a
las proporciones de mercado, una vez modificadas por la actuación sobre las tarifas del
autobús.
EJERCICIO 4

Las Administraciones de una determinada ciudad, a la vista del alto porcentaje de


utilización del vehículo privado en la misma, están tratando de potenciar la utilización
de los autobuses urbanos para los viajes de los trabajadores a un polígono industrial de
la periferia.

Para ello, realizaron una encuesta de preferencias declaradas a los trabajadores de dicho
polígono, en la que se les preguntaba si emplearían el transporte público o el vehículo
privado en una serie de escenarios hipotéticos de promoción del autobús. Las variables
que se incluyeron en dicha encuesta fueron: coste del viaje (ccoche y cbus), duración del
viaje (tcoche y tbus) e intervalo entre autobuses (Ibus).

Los resultados de 4 observaciones de la encuesta escogidas al azar son los que siguen:
ccoche cbus tcoche tbus Ibus Opción
Observación
(€) (€) (min) (min) (min) escogida
1 3,00 0,30 20 18 15 Bus
2 2,50 0,30 20 18 20 Coche
3 2,50 0,24 20 18 20 Bus
4 2,50 0,24 20 30 15 Coche

Con estos datos, se pide:


a. Sabiendo que, en promedio, los usuarios valoran en 6 €/hora el tiempo de viaje y
en 10,5 €/hora el tiempo de espera, calcula el coste generalizado del coche y del
autobús, en cada observación, empleando la formulación siguiente.
Tiempo medio de espera = 0,5 * Intervalo
Cg, coche = coste monetario + coste del tiempo de viaje
Cg, bus = coste monetario + coste del tiempo de viaje + coste del tiempo de
espera
b. Aplicando el método de la máxima verosimilitud, calcula el parámetro θ del
modelo logit binario formado por las siguientes funciones de utilidad
representativa del coche y del autobús.
Vcoche = θ * Cg, coche Vbus = θ * Cg, bus
c. Calcula las probabilidades de elección de cada alternativa en las observaciones
anteriores, y valora el éxito en la predicción del modelo creado.
d. Si, para fomentar el transporte público, se mejorara el coste y el tiempo de viaje
en autobús según se indica en la tabla, calcula la proporción de usuarios que lo
emplearían para viajar al trabajo, a partir de los valores actuales que siguen.

ccoche cbus tcoche tbus Ibus % usuarios % usuarios


Situación
(€) (€) (min) (min) (min) bus coche
Actual 2,50 0,30 20 30 20 30% 70%
Mejora bus 2,50 0,24 20 18 20 ¿? ¿?

e. Plantea (sin desarrollar) el sistema de ecuaciones que necesitarías resolver para


obtener los parámetros θ1 y θ2, si la utilidad representativa de las alternativas
fuera la que sigue.
Vcoche = θ1 * Cg, coche + θ2 Vbus = θ1 * Cg, bus
SOLUCIÓN:

a) Calcular el coste generalizado del coche y del autobús en cada observación

Empleando la formulación que nos aporta el enunciado, podemos calcular el coste del
tiempo de viaje de ambos modos (6 €/hora), y también del tiempo de espera (mitad del
intervalo) del autobús (10,5 €/hora). Finalmente, sumando a éstos el coste del viaje, se
obtiene el coste generalizado:

ccoche c, tcoche Cg, coche cbus c, tbus c, Ibus Cg, bus


Observación
(€) (€) (€) (€) (€) (€) (€)
1 3,00 2,00 5,00 0,30 1,80 1,31 3,41
2 2,50 2,00 4,50 0,30 1,80 1,75 3,85
3 2,50 2,00 4,50 0,24 1,80 1,75 3,79
4 2,50 2,00 4,50 0,24 3,00 1,31 4,55

b) Estimar el parámetro θ aplicando el método de Máxima Verosimilitud

Dadas las funciones de utilidad que nos dan en el enunciado, el modelo se reduce un
logit binario.
Vcoche = θ * Cg, coche
Vbus = θ * Cg, bus

Así, únicamente existen dos alternativas con un solo atributo. Por tanto:

eθ ⋅Cgb
i

P =i

eθ ⋅Cgb + eθ ⋅Cg c
b i i

Pci = 1 − Pbi

La función de verosimilitud de la muestra es:

L(θ ) = ∏∏ ( Pji ) = Pb1 ⋅ Pc2 ⋅ Pb3 ⋅ Pc4


gij

e 3, 41⋅θ e 4,5⋅θ e 3,79⋅θ e 4,5⋅θ


L(θ ) = 3, 41⋅θ ⋅ ⋅ ⋅
e + e 5⋅θ e 3,85⋅θ + e 4,5⋅θ e 3,79⋅θ + e 4,5⋅θ e 4,55⋅θ + e 4,5⋅θ
Debemos maximizar la función de verosimilitud. En este paso, tenemos dos opciones:

1 – Derivar parcialmente (en este caso, totalmente, porque sólo hay un parámetro)
respecto de θ. Pero es más cómodo si antes tomamos Ln en la función.

Ln ( L(θ )) = l (θ ) = 3,41 ⋅ θ − Ln(e 3, 41⋅θ + e 5⋅θ ) + 4,5 ⋅ θ − Ln (e 3,85⋅θ + e 4,5⋅θ ) +


+ 3,79 ⋅ θ − Ln(e 3,79⋅θ + e 4,5⋅θ ) + 4,5 ⋅ θ − Ln (e 4,55⋅θ + e 4,5⋅θ )
Derivando e igualando a cero, obtendremos el valor de θ:

∂ ln( f (θ )) f ' (θ ) ∂e f (θ )
= ; = f ' (θ ) ⋅ e f (θ )
∂θ f (θ ) ∂θ

∂l (θ ) 3,41 ⋅ e 3, 41⋅θ + 5 ⋅ e 5⋅θ 3,85 ⋅ e 3,85⋅θ + 4,5 ⋅ e 4,5⋅θ


= 3,41 − + 4,5 − +
∂θ e 3, 41⋅θ + e 5⋅θ e 3,85⋅θ + e 4, 5⋅θ
3,79 ⋅ e 3, 79⋅θ + 4,5 ⋅ e 4,5⋅θ 4,55 ⋅ e 4,55⋅θ + 4,5 ⋅ e 4,5⋅θ
+ 3,79 − + 4,5 −
e 3, 79⋅θ + e 4,5⋅θ e 4,55⋅θ + e 4,5⋅θ

Desarrollamos las divisiones para facilitar el trabajo:

3,41 ⋅ e 3, 41⋅θ + 5 ⋅ e 5⋅θ 3,41 ⋅ e 3, 41⋅θ + 3,41 ⋅ e 5⋅θ 1,59 ⋅ e 5⋅θ 1,59 ⋅ e 5⋅θ
= + 3, 41⋅θ = 3,41 + 3, 41⋅θ
e 3, 41⋅θ + e 5⋅θ e 3, 41⋅θ + e 5⋅θ e + e 5⋅θ e + e 5⋅θ
3,85 ⋅ e 3,85⋅θ + 4,5 ⋅ e 4,5⋅θ 3,85 ⋅ e 3,85⋅θ + 3,85 ⋅ e 4,5⋅θ 0,65 ⋅ e 4,5⋅θ 0,65 ⋅ e 4,5⋅θ
= + 3,85⋅θ = 3,85 + 3,85⋅θ
e 3,85⋅θ + e 4,5⋅θ e 3,85⋅θ + e 4,5⋅θ e + e 4,5⋅θ e + e 4,5⋅θ
3,79 ⋅ e 3,79⋅θ + 4,5 ⋅ e 4,5⋅θ 3,79 ⋅ e 3,79⋅θ + 3,79 ⋅ e 4,5⋅θ 0,71 ⋅ e 4,5⋅θ 0,71 ⋅ e 4,5⋅θ
= + = 3, 79 +
e 3,79⋅θ + e 4,5⋅θ e 3,79⋅θ + e 4,5⋅θ e 3,79⋅θ + e 4,5⋅θ e 3,79⋅θ + e 4,5⋅θ
4,55 ⋅ e 4,55⋅θ + 4,5 ⋅ e 4,5⋅θ 4,5 ⋅ e 4,55⋅θ + 4,5 ⋅ e 4,5⋅θ 0,05 ⋅ e 4,55⋅θ 0,05 ⋅ e 4,55⋅θ
= + = 4,5 +
e 4,55⋅θ + e 4,5⋅θ e 4,55⋅θ + e 4,5⋅θ e 4,55⋅θ + e 4,5⋅θ e 4,55⋅θ + e 4,5⋅θ

Y entonces, queda:

∂l (θ )  1,59 ⋅ e 5⋅θ   0,65 ⋅ e 4,5⋅θ 


= 3,41 −  3,41 + 3, 41⋅θ  + 4,5 −  3,85 + 3,85⋅θ  +
∂θ  e + e 5⋅θ   e + e 4,5⋅θ 
 0,71 ⋅ e 4,5⋅θ   0,05 ⋅ e 4,55⋅θ 
+ 3,79 −  3,79 + 3, 79⋅θ  + 4,5 −  4,5 + 4,55⋅θ =
4 , 5⋅θ 
 e + e 4,5⋅θ   e + e 
1,59 ⋅ e 5⋅θ 0,65 ⋅ e 4,5⋅θ 0,71⋅ e 4,5⋅θ 0,05 ⋅ e 4,55⋅θ
= − 3, 41⋅θ + 0 , 65 − − −
e + e 5⋅θ e 3,85⋅θ + e 4,5⋅θ e 3,79⋅θ + e 4,5⋅θ e 4,55⋅θ + e 4,5⋅θ
Haciendo el cambio x=eθ

∂l (θ ) 1,59 ⋅ e 5⋅θ 0,65 ⋅ e 4,5⋅θ 0,71⋅ e 4,5⋅θ 0,05 ⋅ e 4,55⋅θ


= − 3, 41⋅θ + 0,65 − 3,85⋅θ − − =
∂θ e + e 5⋅θ e + e 4,5⋅θ e 3,79⋅θ + e 4,5⋅θ e 4,55⋅θ + e 4,5⋅θ
1,59 ⋅ x 5 0,65 ⋅ x 4,5 0,71⋅ x 4,5 0,05 ⋅ x 4,55
= − 3, 41 + 0,65 − 3,85 − −
x + x5 x + x 4,5 x 3, 79 + x 4,5 x 4,55 + x 4,5
Igualando esta expresión a 0, se resuelve x (de forma aproximada), obteniendo lo que
sigue:

∂l (θ ) 1,59 ⋅ x 5 0,65 ⋅ x 4,5 0,71⋅ x 4,5 0,05 ⋅ x 4,55


= − 3, 41 + 0,65 − 3,85 − − =0⇒
∂θ x + x5 x + x 4,5 x 3, 79 + x 4,5 x 4,55 + x 4,5
⇒ x = 0,3035

Y por tanto el parámetro θ valdrá:

x = eθ = 0,3035 ⇒ ln x = θ = −1,1923

2 – Representación gráfica de la función de log-verosimilitud respecto de θ. El máximo


coincide con el obtenido anteriormente mediante derivaciones matemáticas. En este
caso, la resolución es más aproximada.

-2,3145

-2,31455

-2,3146

-2,31465

-2,3147
ln L(theta)

-2,31475

-2,3148

-2,31485

-2,3149

-2,31495

-2,315

-2,31505
-1,24 -1,23 -1,22 -1,21 -1,2 -1,19 -1,18 -1,17 -1,16 -1,15 -1,14

Parámetro (theta)

c) Calcular las probabilidades de elección de las distintas observaciones y valorar el


éxito en la predicción

Tal y como se ha indicado en el apartado anterior, al ser un modelo logit binario, las
probabilidades de elección de cada modo se calculan según la formulación que sigue:

eθ ⋅Cgb
i

Pbi = θ ⋅Cg bi θ ⋅Cg ci


; Pci = 1 − Pbi
e +e
Sustituyendo el valor de theta obtenido, las probabilidades serán las siguientes:

e −1,1923⋅Cgb
i

P =
b
i
−1,1923⋅Cg bi −1,1923⋅Cg ci
; Pci = 1 − Pbi
e +e
VALOR DE P
OBSERVACIÓN
Pbus Pcoche
1 0,87 0,13
2 0,68 0,32
3 0,70 0,30
4 0,48 0,52

Vemos que el modelo acierta en todas las observaciones, excepto en la 2ª, en la que
nosotros precedimos que el usuario elegirá el autobús, y sin embargo elige el coche.
Así, tendríamos un porcentaje de éxito del 75%.

Sin embargo, y como se ha demostrado en ejercicios anteriores, es necesario que exista


al menos una observación “errónea”, ya que, si no, el modelo es inestimable. Por tanto,
es la mejor modelización que se podría realizar, ya que únicamente tiene un error.

d) Calcular la proporción de usuarios que viajarían en autobús, si se realizaran ciertas


mejoras en el sistema

Este problema se puede resolver mediante un análisis de pivoteo, ya que conocemos las
proporciones actuales de mercado de la población (30% en bus y 70% en coche), así
como las funciones de utilidad de las diferentes alternativas.

Mediante el análisis de pivoteo, únicamente será necesario considerar los incrementos


de utilidad de las distintas alternativas, así como sus proporciones de mercado. De este
modo, las nuevas proporciones estimadas para cada modo serían:

p BUS ⋅ e ∆U BUS
pˆ BUS =
p BUS ⋅ e ∆U BUS + p COCHE ⋅ e ∆U COCHE
pCOCHE ⋅ e ∆U COCHE
pˆ COCHE =
p BUS ⋅ e ∆U BUS + p COCHE ⋅ e ∆U COCHE

Así, dados los valores del enunciado, el primer paso sería calcular los costes
generalizados de cada modo en la situación actual y con las supuestas mejoras del
autobús:

ccoche c, tcoche Cg, coche cbus c, tbus c, Ibus Cg, bus


Situación
(€) (€) (€) (€) (€) (€) (€)
Actual 2,50 2,00 4,50 0,30 3,00 1,75 5,05
Mejora bus 2,50 2,00 4,50 0,24 1,80 1,75 3,79

Así, podemos calcular directamente los incrementos en los costes generalizados de cada
modo:
∆Cg coche = 4,50 − 4,50 = 0
∆Cg bus = 3,79 − 5,05 = −1,26

Los incrementos de utilidad de cada modo serán igual a estos incrementos de coste
generalizado, multiplicados por el parámetro theta antes calculado.
Entonces, las proporciones finales de mercado estimadas quedarían:

p BUS ⋅ eθ ⋅∆Cg BUS 0,3 ⋅ e −1,1923⋅(−1, 26 )


pˆ BUS = = = 0,659
p BUS ⋅ eθ ⋅∆Cg BUS + pCOCHE ⋅ eθ ⋅∆CgCOCHE 0,3 ⋅ e −1,1923⋅(−1, 26 ) + 0,7 ⋅ e 0
p COCHE ⋅ eθ ⋅∆CgCOCHE 0,7 ⋅ e 0
pˆ COCHE = = = 0,341
p BUS ⋅ eθ ⋅∆Cg BUS + pCOCHE ⋅ eθ ⋅∆CgCOCHE 0,3 ⋅ e −1,1923⋅(−1, 26 ) + 0,7 ⋅ e 0

Es decir, frente al 30% inicial de trabajadores que realizaban el viaje en autobús, si se


realizaran las mejoras propuestas, ese porcentaje se transformaría en casi un 66%. Por
tanto, cerca del 36% de los trabajadores dejarían de viajar en su coche particular,
comenzando a utilizar el autobús.

e) Plantear el sistema de ecuaciones a resolver para obtener los nuevos parámetros θ1 y


θ2

En este caso, seguimos teniendo un modelo logit binario, pero aparece una constante
específica en la función de utilidad del coche.
Vcoche = θ1 * Cg, coche + θ2
Vbus = θ1 * Cg, bus

Así, siguen existiendo dos alternativas, pero en este caso hay dos atributos. Por tanto:
eθ1⋅Cgb eθ1⋅Cg c +θ 2
i i

Pbi = θ1 ⋅Cg bi θ1⋅Cg ci +θ 2


; Pci = 1 − Pbi =
+e eθ1⋅Cgb + eθ1⋅Cg c +θ 2
i i
e
La función de verosimilitud de la muestra es:
e 3, 41⋅θ1
L(θ ) = L(θ1 , θ 2 ) = ∏∏ ( P ) = P ⋅ P ⋅ P ⋅ P = 3, 41⋅θ1
i g ij 1 2 3 4

+ e 5⋅θ1 +θ2
j b c b c
e
e 4,5⋅θ1 +θ2 e 3,79⋅θ1 e 4,5⋅θ1 +θ2
⋅ 3,85⋅θ1 ⋅ ⋅
e + e 4,5⋅θ1 +θ2 e 3,79⋅θ1 + e 4,5⋅θ1 +θ2 e 4,55⋅θ1 + e 4,5⋅θ1 +θ2
En este caso, dado que hay dos parámetros a estimar, deberemos maximizar la función
de verosimilitud empleando derivadas parciales respecto a éstos. De nuevo, los cálculos
se facilitan bastante si tomamos logaritmos neperianos de la función.
Ln ( L(θ1 , θ 2 )) = l (θ1 , θ 2 ) = 3,41 ⋅ θ1 − Ln(e 3, 41⋅θ1 + e 5⋅θ1 +θ 2 ) + 4,5 ⋅ θ1 + θ 2 −
− Ln (e 3,85⋅θ1 + e 4,5⋅θ1 +θ 2 ) + 3,79 ⋅ θ1 − Ln (e 3,79⋅θ1 + e 4,5⋅θ1 +θ 2 ) + 4,5 ⋅ θ1 + θ 2 −
− Ln (e 4,55⋅θ1 + e 4,5⋅θ1 +θ 2 )

Finalmente, derivando parcialmente respecto de cada uno de los parámetros a estimar, e


igualando a cero, nos resulta el sistema de ecuaciones con el que obtenemos el valor de
θ1 y θ2 :

∂l (θ1 ,θ 2 ) ∂l (θ1 ,θ 2 )
=0 ; =0
∂θ1 ∂θ 2
EJERCICIO 5

Dados los valores promedio de las variables que se presentan en la tabla, se plantea un
esquema de elección de acuerdo al siguiente modelo logit jerárquico:

Transporte
masivo

Coche Taxi Autobús Metro

Tiempo (t) Coste (c)


Modo
(min) (€)
Coche 4,5 23,0
Taxi 5,5 15,0
Autobús 7,5 5,5
Metro 5,5 3,6

Las funciones de utilidad son las que siguen:

• Nido superior
Vcoche = –0,03 tcoche – 0,02 ccoche + 1,25
Vtaxi = –0,03 ttaxi – 0,02 ctaxi – 0,20
VTM = 0,60 EMU

• Nido transporte masivo


Vbus = –0,04 tbus – 0,03 cbus + 0,50
Vmetro = –0,04 tmetro – 0,03 cmetro

Con estos datos, se pide:


a. Calcula las probabilidades de elección del coche, taxi, autobús y metro.
b. Replantea las funciones de utilidad, suponiendo que los tres modos de transporte
público (taxi, bus y metro), tuvieran una constante específica igual para todos,
cuyo parámetro fuera TP.
SOLUCIÓN:

a) Calcular las probabilidades de elección

En un modelo logit jerárquico, se puede emplear la misma formulación que para el logit
multinomial, pero resolviendo el problema de forma secuencial.

El primer paso consiste en la resolución del nido correspondiente al transporte masivo


(bus y metro). En este caso, vemos que no existen variables con igual valor para las dos
alternativas, por lo que el vector W es nulo.

Las probabilidades de elección dentro del nido son condicionadas a que se escoja el
nido completo. Entonces:

Vbus = –0,04 tbus – 0,03 cbus + 0,50 = –0,04 * 7,5 – 0,03 * 5,5 + 0,50 = 0,035

Vmetro = –0,04 tmetro – 0,03 cmetro = –0,04 * 5,5 – 0,03 * 3,6 = –0,328

(
P bus
TM
)
= Vbus
eVbus
=
e 0, 035
e + eVmetro e 0, 035 + e −0,328
= 0,590

(
P metro
TM
) = 1 − P(bus TM ) = 0,410

A continuación, se resuelve la jerarquía superior. El primer paso, de nuevo, es el cálculo


de las utilidades de cada alternativa:

Vcoche = –0,03 tcoche – 0,02 ccoche + 1,25 = –0,03 * 4,5 – 0,02 * 23,0 + 1,25 = 0,655

Vtaxi = –0,03 ttaxi – 0,02 ctaxi – 0,20 = –0,03 * 5,5 – 0,02 * 15,0 – 0,20 = –0,665

EMU = ln ∑( exp (V ) = ln(e


j
Vbus
) ( )
+ eVmetro = ln e 0, 035 + e −0,328 = 0,563 ⇒
)
A j ∈A q

⇒ VTM = 0,60 ⋅ EMU = 0,60 ⋅ 0,563 = 0,338

Como vemos, el parámetro φ es, en este caso, igual a 0,60, y efectivamente está
comprendido entre 0 y 1.

Entonces, las probabilidades finales de elección de cada alternativa de la jerarquía


superior serían:

eVcoche e 0, 655 
P(coche) = = − 0 , 665
= 0,501
e Vcoche
+e +e Vtaxi VTM
e 0 , 655
+e +e 0 , 338

Vtaxi − 0 , 665
  P(coche ) + P(taxi ) +
P(taxi ) = Vcoche
e e
= = 0,134 ⇒
e + eVtaxi + eVTM e 0, 655 + e − 0, 665 + e 0,338  + P(TM ) = 1
VTM 0 , 338

P(TM ) = V
e e
= 0, 655 −
= 0,365 
e coche + e taxi + e TM
V V
e +e 0 , 665
+e 0 , 338

Y, finalmente, las probabilidades de las alternativas dentro del nido, quedan como
sigue:

(
P (bus ) = P (TM ) ⋅ P bus ) = 0,365 ⋅ 0,590 = 0,215 
 ⇒ P (bus ) + P(metro ) = P (TM )
TM
(
P (metro ) = P (TM ) ⋅ P metro
TM
) = 0,365 ⋅ 0,410 = 0,150

b) Replantear las funciones de utilidad, añadiendo la constante específica TP

La constante específica toma el valor 1 si la alternativa es de transporte público (taxi,


bus o metro) y 0 en los demás casos (coche). Su parámetro lo denominaremos TP

Añadiendo dicha constante, si el modelo fuera un logit multinomial, las funciones de


utilidad de cada alternativa serían:

Vcoche = –0,03 tcoche – 0,02 ccoche + 1,25

Vtaxi = –0,03 ttaxi – 0,02 ctaxi – 0,20 + TP

Vbus = –0,04 tbus – 0,03 cbus + 0,50 + TP

Vmetro = –0,04 tmetro – 0,03 cmetro + TP

A partir de este caso, derivamos el logit jerárquico. En este caso, debemos eliminar del
nido la variable que tiene igual valor para el bus y el metro, que, en este caso, es la
constante específica TP, e incluirla directamente en la utilidad compuesta del nido,
multiplicada por un parámetro desconocido α, con lo que quedaría TP*.

Así, dentro del nido, nos quedaría como sigue (igual que en el apartado anterior):

Vbus = –0,04 tbus – 0,03 cbus + 0,50

Vmetro = –0,04 tmetro – 0,03 cmetro

Y, para la jerarquía superior, habrá que añadir esta variable a la utilidad compuesta del
nido:

Vcoche = –0,03 tcoche – 0,02 ccoche + 1,25

Vtaxi = –0,03 ttaxi – 0,02 ctaxi – 0,20 + TP

VTM = 0,60 EMU + α TP = 0,60 EMU + TP*


EJERCICIO 6

Sean dos ciudades A y B, que distan 900 km, que están unidas por una línea de
ferrocarril de mercancías que discurre por terreno montañoso. El tiempo de viaje entre
ambas (ttren) es de 20 horas, y la tarifa actual (ctren) es de 650 €/ton. Dado que el servicio
se utiliza a baja capacidad, se puede suponer que ttren es constante, e independiente del
volumen de tráfico (Vtren).

En una carretera casi paralela (suponer igual distancia) opera también un servicio de
camiones, en competencia directa con el ferrocarril, cuya velocidad media es de
60 km/h y cuya tarifa (ccam) es de 960 €/ton. Está también previsto un proyecto de
autopista que conecte también ambas ciudades, con el que se espera que los vehículos
pesados abandonen la carretera y utilicen la nueva infraestructura.

El tiempo de viaje estimado de la nueva autopista se considera función de la demanda


de tráfico de mercancías de la misma, mediante la relación que sigue (donde el tiempo
se mide en horas y la demanda en toneladas transportadas por hora):

tcam = 6 + 0,06 Vcam

Por otra parte, la empresa del ferrocarril ha calculado una función de demanda, dada por
la formulación que sigue:

Vtren / Vcam = 0,9 * (ttren / tcam)-0,7 * (ctren / ccam)-1,5

Se espera que el volumen total transportado entre las dos ciudades (Vtren + Vcam)
permanezca constante a medio plazo, e igual a 250 toneladas/hora.

Con estos datos, se pide:


a. Estimar el reparto modal actual.
b. Recalcular el reparto modal si la autopista estuviera hecha.
c. Si, para competir con la autopista, el servicio de ferrocarril redujera sus tarifas
hasta 400 €/ton, ¿cómo sería el nuevo reparto? ¿Y si a los camiones se les
hiciera pagar un peaje de 5 €/ton para la financiación de la autopista? ¿Y si
sucedieran ambos cambios a la vez?
SOLUCIÓN:

En este caso, estamos ante otro tipo de métodos simplificados de reparto modal, donde
se nos da directamente la relación entre la demanda y las variables de cada modo. De
hecho, en la fórmula que nos dan para la demanda por ferrocarril y por carretera, los
exponentes tienen un significado similar a las elasticidades cruzadas, es decir, cómo
influyen los cambios en un modo de transporte sobre la demanda de los demás que están
en competencia con éste.

a) Calcular el reparto modal actual

Para la situación actual, podemos calcular directamente los valores de las variables:

t tren = 20 horas
ctren = 650 € / ton

t cam = 900km = 15 horas


60km / h
ccam = 960 € / ton

Así pues, la relación entre demandas será:

( ) ⋅ (650 960)
−0 , 7 −1, 5
− 0, 7 −1, 5
= 0,9 ⋅  tren  ⋅  tren 
Vtren t c
  = 0,9 ⋅ 20 = 1,32
Vcam  t cam   c cam  15

Y, por tanto, la demanda de cada modo:

Vtren = 1,32Vcam  Vtren = 142,3 ton / hora


⇒
Vtren + Vcam = 250 ton / hora  Vcam = 107,7 ton / hora

b) Calcular el nuevo reparto modal si entra en funcionamiento la autopista

Aunque la autopista comience a funcionar, los valores para el ferrocarril en principio no


varían.

Para el transporte por camión, supondremos que la tarifa se mantiene constante, ya que
no nos informan de ningún cambio. Sin embargo, el tiempo de viaje sí se modifica, y
comienza a ser función de la demanda:

t cam = 6 + 0,06 ⋅ Vcam

Así, introduciendo este nuevo término en la ecuación de relación entre demandas:

( )
−0 , 7 −1, 5 −0 , 7
−1, 5
= 0,9 ⋅  tren  ⋅   = 0,9 ⋅  20 
Vtren t ctren
 ⋅ 650 =
Vcam  t cam   ccam   6 + 0, 06 ⋅ V 
cam  960
0,198 0,198 ⋅ Vcam
= ⇒ Vtren =
(6 + 0,06 ⋅ Vcam )−0,7 (6 + 0,06 ⋅ Vcam )−0,7
Y como, por otra parte, como sabemos que la demanda se mantendrá constante, se
puede resolver numéricamente el sistema de ecuaciones:

0,198 ⋅ Vcam 
Vtren =  Vtren = 135,6 ton / hora
(6 + 0,06 ⋅ Vcam ) − 0, 7
⇒
Vcam = 114,4 ton / hora
Vtren + Vcam = 250 ton / hora 

Así pues, como resultaba lógico a priori, la introducción del servicio por autopista hace
que aumente la proporción de mercancías transportadas en camiones en un:

114,4 − 107,7
∆ prop cam = = 6,2%
107,7

c) Recalcular si:

Se hace de igual forma, resolviendo numéricamente el sistema de ecuaciones que


corresponda.

• ctren = 400 €/ton

−0 , 7 −1, 5 −0 , 7
= 0,9 ⋅  tren  ⋅  ctren  = 0,9 ⋅  20 
Vtren t
    ⋅
Vcam  t cam   c cam   6 + 0, 06 ⋅ V cam 

(
⋅ 400
960
−1,5
)
=
0,411
(6 + 0,06 ⋅ Vcam ) − 0 , 7
⇒ Vtren =
0,411 ⋅ Vcam
(6 + 0,06 ⋅ Vcam )−0,7

0,411 ⋅ Vcam 
Vtren =  Vtren = 171,0 ton / hora
(6 + 0,06 ⋅ Vcam ) ⇒
−0 ,7

Vcam = 79,0 ton / hora


Vtren + Vcam = 250 ton / hora 

171,0 − 135,6
∆ proptren, resp b ) = = 26,1%
135,6

• ccam aumenta en 5 €/ton

−0 , 7 −1, 5 −0 , 7
= 0,9 ⋅  tren  ⋅  tren  = 0,9 ⋅  20 
Vtren t c

Vcam  t cam   ccam  
 6 + 0,06 ⋅ Vcam 

(
⋅ 650
960 + 5
) −1,5
=
0,200
(6 + 0,06 ⋅ Vcam ) −0 ,7
⇒ Vtren =
0,200 ⋅ Vcam
(6 + 0,06 ⋅ Vcam )−0,7
0,200 ⋅ Vcam 
Vtren =  Vtren = 136,0 ton / hora
(6 + 0,06 ⋅ Vcam ) ⇒
− 0, 7

Vcam = 114,0 ton / hora


Vtren + Vcam = 250 ton / hora 

136,0 − 135,6
∆ proptren, resp b ) = = 0,3%
135,6
• Ambas medidas

−0 , 7 −1, 5 −0 , 7
= 0,9 ⋅  tren  ⋅  tren  = 0,9 ⋅  20 
Vtren t c
   ⋅
Vcam  t cam   c cam   6 + 0 , 06 ⋅ V cam 

(
⋅ 400
960 + 5
)−1, 5
=
0,414
(6 + 0,06 ⋅ Vcam ) − 0, 7
⇒ Vtren =
0,414 ⋅ Vcam
(6 + 0,06 ⋅ Vcam )−0,7
0,414 ⋅ Vcam 
Vtren =  Vtren = 171,4 ton / hora
(6 + 0,06 ⋅ Vcam ) −0 ,7
⇒
Vcam = 78,6 ton / hora
Vtren + Vcam = 250 ton / hora 

171,4 − 135,6
∆ proptren, resp b ) = = 26,3%
135,6

Como ha sucedido en otros ejercicios, se comprueba de nuevo, que, para los


modelos de reparto modal, dado que las funciones de demanda no son lineales,
el efecto conjunto de dos medidas es diferente (en este caso, ligeramente
inferior) que la suma de los efectos aislados de cada una de ellas.

También podría gustarte