Está en la página 1de 8

Investigación de Operaciones

Sasieni, Yaspan y Friedman


Ejercicio 1, página 279; Programación Dinámica.

Enunciado del ejercicio.

Mediante la siguiente figura formularemos el problema. En efecto, en el sector circular


𝑃0 𝒪𝑃𝑛 , en el cual se tiene un ángulo 𝛼, dentro del cual se eligen los puntos 𝑃1 , 𝑃2 , …, 𝑃𝑛
sobre el cual se tiende el segmento quebrado 𝑃0 𝑃1 𝑃2 … 𝑃𝑛 . El problema establece que
la medida del ángulo ∡𝑃𝑖−1 𝒪𝑃𝑖 = 𝜃𝑖
Investigación de Operaciones
@EqTEconomica
Sasieni, Yaspan y Friedman www.facebook.com/EqTEconomica

Ejercicio 1, página 279; Programación Dinámica.

Figura 1. Planteamiento del ejercicio.

Podemos observar que se forman triángulos isósceles de lado ℛ que corresponden al


radio de la circunferencia unitaria, por lo que ℛ = 1.

2
Investigación de Operaciones
@EqTEconomica
Sasieni, Yaspan y Friedman www.facebook.com/EqTEconomica

Ejercicio 1, página 279; Programación Dinámica.


La base 𝑃𝑖−1 𝑃𝑖 del triángulo 𝑃𝑖−1 𝒪𝑃𝑖 podemos encontrarla usando la ley de cosenos, en-
tonces

𝑐 2 = ℛ 2 + ℛ 2 − 2ℛ. ℛ cos 𝜃𝑖 (1.1)

recordando que ℛ = 1, se tiene

𝑐 2 = 2(1 − cos 𝜃𝑖 ) (1.2)

por identidad del ángulo mitad, tenemos

𝜃𝑖
1 − cos 𝜃𝑖 = 2 sin2 (1.3)
2

por lo que la base de triangulo es

𝜃𝑖 𝜃𝑖
𝑐 2 = 4 sin2 ⇒ 𝑐 = 2 sin (1.4)
2 2

Entonces, el segmento quebrado 𝑃0 𝑃1 … 𝑃𝑛 tiene por longitud


𝑛 𝑛
𝜃𝑖 𝜃𝑖
𝑃0 𝑃1 … 𝑃𝑛 = ∑ 2 sin = 2 ∑ sin (1.5)
2 2
𝑖=1 𝑖=1

Por otro lado, sabemos que los ángulos del segmento quebrado que se tiende sobre la
circunferencia unitaria satisface la siguiente condición

𝛼 = 𝜃1 + 𝜃2 + ⋯ + 𝜃𝑛 (1.6)

por lo que el problema a resolver es el siguiente


𝑛
𝜃𝑖
max 𝑃0 𝑃1 … 𝑃𝑛 = 2 ∑ sin
𝜃𝑖 2
𝑖=1
(1.7)
sujeto a
𝜃1 + 𝜃2 + ⋯ + 𝜃𝑛 = 𝛼

3
Investigación de Operaciones
@EqTEconomica
Sasieni, Yaspan y Friedman www.facebook.com/EqTEconomica

Ejercicio 1, página 279; Programación Dinámica.


que es un problema de programación no lineal que implica la resolución de 𝑛 + 1 ecua-
ciones y 𝑛 + 1 variables, que puede ser complicado de resolver.
Programación dinámica1
Recordemos que la longitud del segmento quebrado

𝜃1 𝜃2 𝜃𝑛
𝑃0 𝑃1 … 𝑃𝑛 = 2 sin + 2 sin + ⋯ + 2 sin (1.8)
2 2 2

entonces, la longitud máxima está dada por

𝜃𝑛 𝜃𝑛−1 𝜃2 𝜃1
𝑓𝑛 (𝛼) = max {2 sin + 2 sin + ⋯ + 2 sin + 2 sin } (1.9)
0≤𝜃≤𝛼 2 2 2 2

Sin embargo, a partir de la expresión anterior, podemos apreciar que

𝜃𝑛−1 𝜃2 𝜃1
𝑓𝑛−1 (𝛼) = max {2 sin + ⋯ + 2 sin + 2 sin } (1.10)
0≤𝜃≤𝛼 2 2 2

remplazando (1.10) en (1.9), nos queda

𝜃𝑛
𝑓𝑛 (𝛼) = max {2 sin + 𝑓𝑛−1 (𝛼)} (1.11)
0≤𝜃≤𝛼 2

a esta regla recursiva se le denomina como ecuación de Hamilton-Jacobi-Bellman (HJB).


Antes de continuar con este punto, veamos lo siguiente, partir de la Figura 1 tenemos

𝛼1 = 𝛼0 + 𝜃1 |𝛼0 = 0 = 𝜃1

𝛼2 = 𝛼1 + 𝜃2 = 𝜃1 + 𝜃2

𝛼3 = 𝛼2 + 𝜃3 = 𝜃1 + 𝜃2 + 𝜃3

𝛼𝑛 = 𝛼𝑛−1 + 𝜃𝑛 = 𝜃1 + 𝜃2 + ⋯ + 𝜃𝑛 = 𝛼 (1.12)

1 Aquí, se omiten varios detalles técnicos del método de programación dinámica. Quien desee pro-
fundizar puede consultar Bertsekas (2017).

4
Investigación de Operaciones
@EqTEconomica
Sasieni, Yaspan y Friedman www.facebook.com/EqTEconomica

Ejercicio 1, página 279; Programación Dinámica.


entonces

𝛼 = 𝜃1 + 𝜃2 + ⋯ + 𝜃𝑛 (1.13)

teniendo la siguiente recurrencia en general.

𝛼𝑖 = 𝛼𝑖−1 + 𝜃𝑖 |𝛼0 = 0 (1.14)

Continuando con el punto que dejamos en (1.11), a partir de (1.12) se tiene

𝛼𝑛−1 = 𝛼𝑛 − 𝜃𝑛 (1.15)

entonces, la expresión (1.11) queda

𝜃𝑛
𝑓𝑛 (𝛼) = max {2 sin + 𝑓𝑛−1 (𝛼𝑛 − 𝜃𝑛 )} (1.16)
0≤𝜃≤𝛼 2

que es lo que queríamos demostrar.


Ahora, esta expresión, puede ser descompuesta de la siguiente manera

𝜃𝑛
𝑓𝑛 (𝛼) = max {2 sin + max 𝑓 (𝛼 − 𝜃𝑛 )} (1.17)
0≤𝜃≤𝛼 2 0≤𝜃≤𝛼 𝑛−1 𝑛

que se obtiene de la descomposición del operador de optimización, pieza fundamental


del principio de optimalidad (y encaje) de Bellman. Entonces, el problema queda plan-
teado de la siguiente manera

𝜃𝑛
𝑓𝑛 (𝛼) = max {2 sin + 𝑓𝑛−1 (𝛼𝑛 − 𝜃𝑛 )}
0≤𝜃≤𝛼 2
(1.18)
sujeto a
𝛼𝑖 = 𝛼𝑖−1 + 𝜃𝑖

5
Investigación de Operaciones
@EqTEconomica
Sasieni, Yaspan y Friedman www.facebook.com/EqTEconomica

Ejercicio 1, página 279; Programación Dinámica.


transformando un problema de 𝑛 variables en un problema de 𝑛 −etapas cada uno de
una variable2.
Empezando, para 𝑖 = 1, se tiene

𝑖 = 1: 𝛼0 = 0 = 𝛼1 − 𝜃1 → 𝛼1 = 𝜃1∗ (1.19)

pero

𝑓0∗ (𝛼0 ) = 0 (1.20)

toda vez que 𝛼0 = 0, y no genera segmento para ser tomado en cuenta en la longitud
del segmento quebrado. Por lo que
𝛼1
𝑓1∗ (𝛼) = 2 sin (1.21)
2

Para 𝑖 = 2, se tiene

𝑖 = 2: 𝛼1 = 𝛼2 − 𝜃2 (1.22)

la ecuación del HJB es

𝜃2 𝜃2 𝛼1
𝑓2 (𝛼) = max {2 sin + 𝑓1 (𝛼 − 𝜃)} = max {2 sin + 2 sin } (1.23)
0≤𝜃≤𝛼 2 0≤𝜃≤𝛼 2 2

remplazando (1.22) en la expresión anterior, tenemos

𝜃2 𝛼2 − 𝜃2
𝑓2 (𝛼) = max {2 sin + 2 sin } (1.24)
0≤𝜃≤𝛼 2 2

siendo la condición de primer orden (CPO)3

2En esta clase de problemas, a la variable 𝛼 se le denomina variable de estado y, 𝜃 es una variable de
control.
3 Recordando que (sin 𝑢)′ = cos 𝑢 . 𝑢′.

6
Investigación de Operaciones
@EqTEconomica
Sasieni, Yaspan y Friedman www.facebook.com/EqTEconomica

Ejercicio 1, página 279; Programación Dinámica.

𝜃2 1 𝛼2 − 𝜃2 1 𝜃2 𝛼2 − 𝜃2
2 cos . + 2 cos . (− ) = 0 → cos = cos
2 2 2 2 2 2

resolviendo la ecuación anterior encontramos

𝜃2 𝛼2 − 𝜃2 𝛼2
= → 𝜃2∗ = (1.25)
2 2 2

que, remplazando en (1.24) nos queda


𝛼2
𝑓2∗ (𝛼) = 4 sin (1.26)
4

Para 𝑖 = 2, se tiene

𝑖 = 2: 𝛼2 = 𝛼3 − 𝜃3 (1.27)

remplazando la expresión anterior y (1.26) en la ecuación HJB, tenemos

𝜃3 𝛼3 − 𝜃3
𝑓3 (𝛼) = max {2 sin + 4 sin } (1.28)
0≤𝜃≤𝛼 2 4

siendo la CPO

𝜃3 1 𝛼3 − 𝜃3 1 𝜃3 𝛼3 − 𝜃3
2 cos . + 4 cos . (− ) = 0 → cos = cos
2 2 4 4 2 4

resolviendo la ecuación anterior, tenemos

𝜃3 𝛼3 − 𝜃3 𝛼3
= → 𝜃3∗ = (1.29)
2 4 3

que, reemplazando en (1.28) se tiene


𝛼3
𝑓3∗ (𝛼) = 6 sin (1.30)
6

De lo encontrado en 𝑓1∗ (𝛼), 𝑓2∗ (𝛼), 𝑓3∗ (𝛼), podemos apreciar lo siguiente

7
Investigación de Operaciones
@EqTEconomica
Sasieni, Yaspan y Friedman www.facebook.com/EqTEconomica

Ejercicio 1, página 279; Programación Dinámica.

𝛼1 𝛼1
𝑓1∗ (𝛼) = 2 sin = 2(1) sin
2 2(1)
𝛼2 𝛼2
𝑓2∗ (𝛼) = 4 sin = 2(2) sin
4 2(2)
𝛼3 𝛼3
𝑓3∗ (𝛼) = 6 sin = 2(3) sin
6 2(3)

generalizando, encontramos que


𝛼𝑛 𝛼
𝑓𝑛∗ (𝛼) = 2(𝑛) sin = 2(𝑛) sin (1.31)
2(𝑛) 2(𝑛)

que es lo que se quería demostrar.

Referencias
Bertsekas, D. (2017). Dynamic Programming and Optimal Control, 4th edition, Vol. I.
Athena Scientific
Sasieni, M.; Yaspan, A. and Friedman, L. (1967). Operations Research - Methods and
Problems. John Wiley and Sons.

También podría gustarte