Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Optimal Periodic Control For Scalar Dynamics Under Integral Constraint On The Input - En.es
Optimal Periodic Control For Scalar Dynamics Under Integral Constraint On The Input - En.es
com
Térence Bayen, Alain Rapaport, Fatima Zahra Tani. Control periódico óptimo para la dinámica escalar bajo
restricción integral en la entrada. Control matemático y campos relacionados, AIMS, 2020, 10
(3), págs. 547-571. ??? 10.3934 / mcrf.2020010 ???. ??? hal-02057590v2 ???
https://hal.archives-ouvertes.fr/hal-02057590v2
Enviado el 9 Sep 2019
Térence Bayen
IMAG, Univ Montpellier, CNRS, Francia.
MISTEA, Univ Montpellier, INRA, Montpellier SupAgro, Francia.
Abstracto. Este artículo estudia un problema de control óptimo periódico regido por un
sistema unidimensional, lineal con respecto al control u, bajo una restricción integral en u.
Damos condiciones para las cuales el valor de la función de costo en estado estacionario con
un control constante ū se puede mejorar considerando el control periódico tu con valor medio
igual a ū. Esto conduce al llamado "exceso de rendimiento" que se cumple en varias
aplicaciones. Con el uso del Principio Máximo de Pontryagin, proporcionamos la síntesis
óptima de estrategias periódicas bajo la restricción integral. Los resultados se ilustran en un
único modelo de población con el fin de estudiar el efecto de los insumos periódicos sobre la
utilidad del stock de recursos.
1
2 T. BAYEN, A. RAPAPORT Y F.-Z. TANI
hay un retraso en la dinámica. Sin embargo, hay relativamente pocos trabajos teóricos sobre la
optimización global de los controles periódicos (aparte de [18] para la caracterización de la
función de valor bajo supuestos bastante fuertes). La mayoría de las obras existentes se ocupan
de las condiciones locales necesarias ([8, 12]), condiciones de segundo orden ([7, 21, 13]) o
técnicas de aproximaciones ([11, 1, 4]). En [4] por ejemplo, se lleva a cabo un análisis local en el
contexto de un sistema estructurado por edad que muestra cómo mejorar localmente la
función de costos al considerar controles periódicos versus controles constantes (pero no se
considera ninguna restricción integral sobre el control). Debe subrayarse que, en nuestro
enfoque, no tenemos que considerar que el estado estacionario está optimizando el criterio
entre todas las soluciones estacionarias del sistema (el control óptimo del estado estacionario
no necesariamente satisface la restricción integral). Hasta donde sabemos, la restricción
integral sobre el control aún no se ha considerado en los problemas de determinación de
trayectorias periódicas óptimas. Por lo tanto, nuestro objetivo es algo diferente de lo que se ha
descrito anteriormente.
En aplicaciones para las que la variable de control es una tasa de flujo de materia (como en
reactores de alimentación continua, por ejemplo [14]), esta restricción equivale a considerar
que una determinada cantidad de materia está disponible para cada período de tiempo, y el
problema es entonces determinar cómo entregar esta materia durante este período (es decir,
¿A caudal constante o no?), manteniendo una operación periódica durante los tiempos futuros
y maximizando la producción o la calidad de un producto en cada período. El problema actual
ha sido motivado principalmente por la modelización de poblaciones explotadas de stock (o
densidad)X, ver, p.ej, [10], para la cual la variable de control tu es el esfuerzo de recolección (por
ejemplo, el número de botes de pescadores en un lago). En nuestro entorno, para un estado
estable dadoX y su control constante asociado ū, consideramos el conjunto de T -trayectorias
periódicas con controles periódicos que tienen ū como promedio. Decimos que unSobre
rendimiento ocurre cuando la utilidad promedio de la acción X(·) de un T -La solución periódica
es mayor que la utilidad de la acción. X. Mencionemos finalmente [dieciséis, 17] donde los
insumos periódicos se estudian en el contexto de la biología de poblaciones y el manejo de
pesquerías, pero con diferentes objetivos (no se considera la optimización ni tal restricción
integral).
Hasta donde sabemos, este problema aún no se ha abordado teóricamente en la
literatura. Desde un punto de vista matemático, la restricción integral en la entrada trae
dos dificultades principales:
1. la existencia de trayectorias periódicas no constantes con un control que satisface la
restricción integral,
2. la caracterización de un control óptimo bajo ambas restricciones de periodicidad de
la trayectoria y la restricción integral en la entrada,
que nos proponemos abordar aquí para la dinámica escalar en el marco general.
El documento está organizado de la siguiente manera. En la sección2, formulamos el problema y
dar una definición precisa de exceso de rendimiento. Luego proporcionamos supuestos sobre la
dinámica y la función de costo que garantizan o previenen el rendimiento excesivo. En particular,
mostramos que la convexidad juega un papel importante. En la sección3, sintetizamos controles
periódicos óptimos (en particular los no constantes) mejorando la función de costo en comparación
con el estado estacionario (ver Teorema 3.6). En la sección4, mostramos cómo relajar los supuestos
de la Sección 2 que se requieren en un dominio invariante (a, b)
de la dinámica, cuando estas se cumplen sólo en un vecindario de X. Esto nos lleva a dar
un resultado similar al de la Sección 3 pero por valores restrictivos del período T.
Finalmente, ilustramos los resultados de la Sección 3-4 en la sección 5 en el contexto de la
gestión sostenible de los recursos (ver, p.ej, [10]). Estudiamos el impacto
CONTROL PERIÓDICO ÓPTIMO BAJO RESTRICCIÓN INTEGRAL 3
sobre el stock de insumos periódicos no constantes (esfuerzos de cosecha) pero con el mismo
valor promedio, y determinar los peores escenarios con respecto a una determinada utilidad
del stock.
Observación 1. La hipótesis (H1) implica que el intervalo I es invariante por (1) mientras que la
Hipótesis (H2) está relacionada con las propiedades de controlabilidad de (1) (que se utilizará en
la siguiente sección para la síntesis de trayectorias periódicas no constantes). En el resto del
artículo, consideraremos las condiciones iniciales enI solamente.
ψ (x): = -f (x) .
g (x)
Observe que las hipótesis (H1) - (H2) implican que uno tiene ψ (yo) ⊂ [-1, 1]. Por lo tanto, para
cualquierX ∈ I, el valor de control ū definido como ū: = ψ (x̄) es tal que ū ∈ [-1, 1]. Tenga en
cuenta que cualquier puntoX es un equilibrio de (1) para el control constante u = ū.
A lo largo del documento, arreglamos un punto X ∈ I como un estado estacionario nominal. En el
secuela, consideraremos T -soluciones periódicas de (1), dónde T ∈ R∗ + , con aT-
control periódico tu que satisface el restricción integral
∫ T
1
Utah) Dt = ū. (2)
T 0
Lema 2.1. Bajo Hipótesis (H1), ninguna T-solución periódica X de (1) en I con
tu ∈ UT cumple la propiedad ∫ T
Prueba. En la inte∫rval I, la función∫ gramo es positivo un∫ Td de la ecuación (1), nosotros obtener
T T
ẋ (t)
Dt = - ψ (x (t)) Dt + Utah) Dt.
0 g (x (t)) 0 0
Definir la función ∫ X Dξ
h (x): = , ∈
x yo,
Xg (ξ)
4 T. BAYEN, A. RAPAPORT Y F.-Z. TANI
Lema 2.2. Bajo hipótesis (H1) - (H̄), existen no constantes T-periódico so-
lciones de (1) con X(0) = X y tu ∈ UT, para cualquier T> 0.
lo que implica que el mapa t 7 → ψ (x (t)) - ψ (x̄) no puede ser de signo constante en [0, T].
La hipótesis (H̄) implica que x (t) - X tiene que cambiar su signo. Por lo tanto hay
existas t̄ ∈ (0, T) con x (t̄) = x̄ de tal manera que la función de control ũ definido por
t 7 → Utah) : = u (t + t̄) garantías para tener X
dónde Xtu es la solución única de (1) tal que Xu (0) = X, asociado con un
control tu ∈ UT. Nuestro objetivo en este trabajo es abordar la cuestión de encontrar una
trayectoria periódica con X(0) = X que tiene un costo menor que la constante X, con un
(T -periódico) control del valor medio ū. Para ello, presentamos la siguiente terminología.
Definición 2.3. Dado T> 0, decimos que (1) exhibe un Sobre rendimiento por el costo7) si
existe un T -solución periódica X de (1) con X(0) = X asociado con un
control tu ∈ UT tal que JT (u) <`(̀x̄).
Además, nuestro objetivo es caracterizar en la siguiente sección las estrategias que realizan
el mínimo del criterio (7) entre dichos controles. La posibilidad de tener un rendimiento
excesivo se basa en supuestos específicos sobre la función de costo y la dinámica, que ahora
presentamos.
Observación 2. Hipótesis (H3) implica Hipótesis (H̄). Por lo tanto, por Lemma2.2,
allí existe T -soluciones periódicas X de (1) con X(0) = X y tu ∈ UT, que son diferentes de la
solución constante X, cuando se cumplen (H1) - (H2) - (H3). Hipótesis (H3) también
implica que ψ esta incrementando.
Proposición 2.1. Si (H1) y (H3) mantener la verdad, cualquier no constante T-solución periódica
X de (1) con X(0) = X y tu ∈ UT satisface JT (u) <`(̀x̄).
Prueba. Considere un T -peri solución ódica X con X(0) = X asociado con un control en
UT. De Lemma 2.1, eq∫la calidad4) está satisfecho y deducimos
T
(γ (`(̀x (t))) - γ (̀ (x̄))) Dt = 0.
0
T ∫T
1 1
γ̄ (`(̀x (t))) Dt ≥ ψ (x (t)) Dt. (10)
T 0 T 0
que es una contradicción con la igualdad (4) dado por Lemma 2.1.
dónde U denota el conjunto de funciones de control medibles tu más de [0, T] tomando valores
en [-1, 1]. Tenga en cuenta que Problema (13) admite una solución por resultados de existencia
clásicos. De hecho, las hipótesis (H1) - (H2) - (H3) implican que existen trayectorias de (11)
satisfactorio12). Dado que el sistema es una nueva forma del control y `es continuo, la
existencia de un control óptimo sigue el teorema de existencia de Filippov [9].
φ (t)> 0 ⇒ u (t) = 1,
φ (t) < 0 ⇒ u (t) = -1, (dieciséis)
φ (t) = 0 ⇒ Utah) ∈ [-1, 1].
Además, si diferenciamos φ wrt t, nosotros encontrar eso para t ∈ [0, T]
Lema 3.1. Bajo hipótesis (H1) - (H2) - (H3), no hay una trayectoria extrema anormal, es
decir, λ0 6 = 0.
de X(·) (recordar que f + g> 0 y F - g < 0 sobre signo I). Como consecuencia, λX es de
constante. Ahora, desdeλ0 = 0, uno tiene
Deducimos que φ̇ es de signo constante (recuérdese que, en ψ′> 0), por lo tanto φ es monótono.
consecuencia, la trayectoria extrema tiene como máximo un punto de conmutación. Así, uno
∈
tiene x (t)> x̄ fo∈r en cualquier momento t (0, T) lo que implica una contradicción con (4). Six (t) <x̄
para cualquier momento t (0, T), concluimos de la misma manera.
3.2. Propiedades de los tiempos de conmutación. Denotemos por Xmetro y XMETRO el mínimo
y máximo en [0, T∈] {de un T -una} solución admisible X. Tenga en cuenta que para cualquier momento t ∈
(0, T) tal que x (t) xmetro, XM, entonces uno tiene φ (t) = 0. De hecho, de lo contrario uno
tendría φ (t)> 0 o φ (t) < 0. Supongamos, por ejemplo, que φ (t)> 0. Desde (dieciséis), el
control tu sería igual a 1 en un vecindario de t, y así, a partir de (H2),
tendría una contradicción con el hecho de que XMETRO es el máximo de X. Procedemos de
la misma forma si φ (t) < 0.
Proposición 3.1. Bajo hipótesis (H1) - (H2) - (H3), cualquier extremo satisface las siguientes
propiedades.
1. En cualquier momento de cambio ts ∈ (0, T), uno tiene x (ts) ∈ {Xmetro, XMETRO}.
2. No tiene arco singular.
Prueba. Dejar t1, t2 en [0, T] ser tal que x (t1) = Xmetro y x (t2) = XMETRO con Xmetro, XMETRO en
I. Deducimos que λX(t1)g (xm) = λX(t2)g (xM) = -λy. Ahora, desde H se conserva
a lo largo de cualquier trayectoria extrema (ver por ejemplo [9]), uno tiene
f (xMETRO) fx)( m
H= - `(̀XMETRO) - λy = - `(̀X) - λy g (xmetro)
metro
g (xMETRO)
1 ψ (x)METRO
- ψ (x)
- m= γ (`(̀xMETRO)) - γ (`(̀xmetro))
= , (17)
λy `(̀XM) `(̀Xmetro) `(̀XMETRO) - ' (̀Xmetro)
Como γ está aumentando sobre `(̀I), uno tiene λy> 0. Suponga ahora eso ts es un cambio
tiempo tal que x (ts) ∈ (Xmetro, XMETRO). Usando un cálculo similar al anterior, encontramos
eso
1 ψ (xMETRO) - ψ (x (ts)) γ (̀ (xMETRO)) - γ (`(̀x (ts)))
= = . (18)
λy - s))
`(̀XM) `(̀x (t - s))
`(̀XM) `(̀x (t
Ya que γ y `son respectivamente estrictamente (18)co {nvexuna
implican y} aumentando enlo[Xque
contradicción, por x (tXs)M], (17)
metro, y
∈ Xmetro, XMETRO como se iba a demostrar.
CONTROL PERIÓDICO ÓPTIMO BAJO RESTRICCIÓN INTEGRAL 9
Supongamos ahora por contradicción que existe un intervalo de tiempo [t1, t2] tal que
φ (t) = φ̇ (t) = 0 para t∈[t1, t2]. Combinatorio φ = φ = 0˙ sobre [t1, t2], uno encuentra que
′̀ ′ (x (t)) = 0,
`(x- y(γt)) λ- yψ ∀
′
⇒ 1λ (̀ (x (t))) = 0, ∀t ∈ [t1, t2],
1 ′ (̀ (x (t))),
⇒ λy
= γ ∀tt ∈ recordar que ψ = γ ◦ `) ̀,
[t1,[tt1,2]t(2],
Ahora, dado que las extremidades del arco singular t1 y t2 deben ser horas de conmutación, uno
debe tener x (t1), x (t2) en Xmetro, XM. Supongamos, por ejemplo, que x (t1) = X . metro
Entonces uno se pone 1 = γ′ (̀ (Xmetro)) que es una contradicción con (17) (ya que γ es estrictamente
λy
convexo) y de manera similar en t = t2. Esto completa la prueba.
En esta etapa, hemos demostrado que las trayectorias óptimas son de bang-bang
escribe (es decir, son conc∈en {enciones de arcos con u = ±1) de manera que en cada momento de
conmutación ts uno tiene x (ts)Xmetro, XMETRO}. Se puede demostrar que el número de conmutaciones
times es finito (haciendo un razonamiento similar al de la exclusión de arcos singulares).
Además, este número es necesariamente par. De hecho, dejaX(·) ser un T -admisible
solución de (1) asociado con un control tu ∈ UT tener 2n + 1 tiempos de conmutación
sobre [0, T] con n> 0. Tenga en cuenta que n = 0 es imposible ya que el mapa t 7 → x (t) - X
tiene que cambiar su signo sobre [0, T]. Por lo tanto, tiene que ser igual al menos una vez
para X en el intervalo (0, T), decir a la vez t̄, satisfacer (4) que invalida n = 0. Finalmente,
observe que el signo de X(0+) y ẋ (T-), con un número impar de conmutadores, son
necesariamente distintos. De ello se deduce que el signo deẋ (T-) y ẋ (T +) también son
distintos. Desde la condición inicialx (t̄) = x̄, los T -solución periódica sobret̄, T + t̄) cambia
entonces a la hora t = T, que pertenece al intervalo (t̄, T + t̄). Ya que x (T) = x̄, tenemos una
contradicción con el punto 1 de la Proposición 3.1. Por tanto, el número de conmutadores
es par.
Nos centramos ahora en trayectorias extremas con dos interruptores.
3.
t→73. xTrayectorias
(t) soluciones
condedos el [0, T] con X(0)
(1) interruptores. = X una
Para dada T>con
y asociado un control tu trayectorias
0, consideramos
de fi nido por dos tiempos de conmutación 1 ∣∣2 t, t con 0 < t1 < t2 < T:
∣
∣∣∣ t ∈ [0, t1),
u (t) = -1,1, t ∈ (19)
1, t ∈ [t[t1,2,tT].
2),
1 1
η (x): = - .
f (x) + g (x) f (x) g-(x)
Prueba. Para t ∈ [0, t1∫) ∪ [t2, T), uno tiene ẋ = f (x) +∫g (x)> 0 y uno puede escribir
x (T)
XMETRO
DX DX
t1 = , T - t2 = .
X f (x) + g (x) Xmetro
f (x) + g (x)
Similarmente para t ∈ [t1, t2), uno tiene ẋ = f∫ (X) - g (x) < 0 y
XMETRO
DX
t2 - t1 = - .
Xmetro
f (x) - g (x)∫ XMETRO
Uno luego obtiene∫En s
x (T ) ∫ XMETRO
DX DX DX
T= - + ,
X metro
f (x) + g (x) Xmetro
F (x) g- (x) X f (x) + g (x )
y fo∫real academia de bellas artes T -solución periódica, x (T) = x̄ da exactamente la propiedad (20). Proceder
con la misma deco∫ mposition del int mi∫rval [0, T], uno puede w
T ∫rito
X
XMETRO
DX Xmetro
DX DX
Utah) Dt = - + ,
0 X f (x) + g (x) XMETRO
f (x) - g (x) X metro
f (x) + g (x)
que da el qua∫lity
X ( )
METRO
1 1
+ Dx = Utah,
Xmetro
f (x) + g (x) f (x) g-(x)
cuando tu cumple2). Finalmente, observe que uno tiene
1 1
+ = η (x) ψ (x),
f (x) + g (x) f (x) g-(x)
por X ∈ I, y por lo tanto propiedad (21) está satisfecho.
Lema 3.3. Bajo hipo∫tesisH1) - (H2), para cualquier T> 0 existe un único
función βT: [a, b] 7 → [a, b] eso satisface βT (α)> α para cualquier α ∈ I y
βT (α)
η (x) Dx = T, α ∈ I.
α
es tal que para cualquier α ∈ Yo, χ (α, ·) es de clase C1, aumentando con χ (α, α) = 0 y χ (α,
b) = +∞. Según el teorema de la función implícita, existe un mapa único
CONTROL PERIÓDICO ÓPTIMO BAJO RESTRICCIÓN INTEGRAL 11
βT: I 7 → I de clase C1, tal que tiene χ (α, βT (α)) = T para cualquier α ∈ I. Es más, uno
η (α)
βT′ (α) = > 0, α ∈ I.
η (βT (α))
La función βT está aumentando, y luego admite límites en los puntos a + y B-.
Por lo tanto uno tiene βT (a +): = limα→a + βT (α) ≥ a y βT (B-): = limα→B- βT (α) ≤B
que verifican χ (a, βT (a +)) = T y χ (b, βT (B-)) = T, ya que χ es continuo. Como
previamente, F - g < 0 en I con (F - g) (a) = 0 implica que K-: = -minX∈ [a, b] (F -
gramo)′ (x)> 0. De ello se deduce que (F - g) (x) ≥ K- (a - X) para cualquier X ∈ I. Por lo tanto, deducimos
ese
1 1
η (x)> - ≥ > 0, X ∈ I.
f (x) g-(x) K- (xa) -
Si βT (a +)> a, entonces uno debería tener χ (a, βT (a +)) = +∞ que no es posible ya que uno
tiene χ (α, βT (α)) = T para cualquier α ∈ I. Entonces, uno tiene βT (a +) = a. Como la función
η es positivo en I, uno tambien tiene βT (α)> α para cualquier α ∈ I, y deducimos
ese βT (B-) = B. Esto prueba que βT se puede extender a un mapeo uno a uno desde [a, b]
para [a, b].
Ahora estamos listos para demostrar que existe un único B + B-B + trayectoria que
satisface ambas condiciones integrales (20) y (21).
Proposición 3.2. Bajo hipótesis (H1) - (H2) - (H̄), existe un par único
(Xmetro, XMETRO) ∈ I2 satisfactorio20) - (21), y uno tiene Xm < x̄ <xMETRO.
Prueba. De Lemma 3.3, condición20) implica tener XM = βT (Xmetro). Por lo tanto, simplemente
tenemos que mostrar la singularidad de Xmetro para la condición21) para ser cumplido.
Considere la función F: [a, b] → R definido por
∫ βT (α)
F (α): = η (x) (ψ (x) - ψ (x̄)) DX, (22)
α
y observe que las condiciones (20) y (21) están ambos satisfechos exactamente cuando F (xm) = 0.
De la hipótesis (H̄) y las propiedades satisfechas por la función βT (ver lema
3.3), uno tiene F (α)> 0 para cualquier α ∈ [x̄, b), y F (α) < 0 para cualquier α ∈ (a, β-1 T (X)].
Según el teorema del valor medio, existe Xmetro ∈ (β-1 T (x̄), x̄) tal que F (xm) = 0.
Además, uno tiene
F ′ (α) = η (βT (α)) (ψ (βT (α)) - ψ (x̄)) β′ T (α) - η (α) (ψ (α)) - ψ (x̄)).
Como βT está aumentando y ψ satisface (H̄), obtenemos F ′ (α)> 0 para cualquier α <x̄ con
βT (α)> x̄, eso es exactamente para α ∈ (β-1 T (x̄), x̄), y concluimos sobre la existencia
y singularidad de Xmetro, XMETRO en I, con Xm < X y XM> X.
También vale la pena mencionar que Xmetro y XMETRO depende del período T. En el siguiente Lema,
proporcionamos propiedades de Xmetro y XMETRO como funciones de T.
12 T. BAYEN, A. RAPAPORT Y F.-Z. TANI
Lema 3.4. Bajo hipótesis (H1) - (H2) - (H̄), Las funciones T 7 → Xmetro(T) y T 7 →
XMETRO(T) son continuamente diferenciables, y respectivamente decreciente y creciente.
además, uno tiene
lim∞Xmetro(T) = a y→ lim∞XMETRO(T) = b. (23)
T +→ T+
Prueba. Para cada T> 0, sabemos de Proposición 3.2 que existe un único
par (Xmetro(T), xMETRO(T)) yo∈
2 satisfactorio20) - (21). Según el teorema de la función implícita,
X METRO
′ los derivados de Xmetro y XMETRO wrt T. Diferenciar (20) - (21) wrt T luego
ceder ds
η (xMETRO(T)) -η (xmetro(T)) X ′ (T) 1 METRO
= ,
′
η (xMETRO(T)) ψ (xMETRO (T)) )) XmT) ψ(X)
︸ ︷
︷-η (xmetro(T)) ψ (x ︸
metro(TXT)
′ (T),
donde detX (T )): = η (xMETRO(T)) η (xmetro(T)) (ψ (xMETRO (T)) - ψ (xmetro(T)))> 0. Entonces X METRO
X m′ T) se dan n por las expresiones
METRO
detX (T))
η (x (T)) (ψ (x̄) - ψ (x (T)))
X m′ T) =
METRO METRO
< 0.
detX (T))
Desde (20) y (21), una H∫como
XMETRO(T) ∫ XMETRO(T)
T DX DX
(ū + 1) = < .
2 x (T) f
metro (x) + g (x) a f (x) + g (x)
Tomando el límite cuando T tiende a +∞ en ambos lados de esta desigualdad, se obtiene
limT→ + ∞ XMETRO(T) = b. Del mismo modo, se puede probar que limT→ + ∞ Xmetro(T) = a.
3.4. Soluciones óptimas. Según la propuesta 3.2, para cualquier T> 0, tenemos
visto que hay un único B + B-B + trayectoria XT (·) eso es T -admisible, generado por un
control que denotaremos ûT. Además, existe un único t̄ ∈ (0, T)
tal· ese XT (t̄) = x̄. Por lo tanto, hay exactamente dos T -soluciones admisibles XT (·),
XT () con dos interruptores, dado por ûT y ǔT con
ǔT (t): = ûT (t + t̄), t ≥ 0,
que tienen el mismo costo. De manera similar, denotamos porB-B + B- la trayectoria XT.
Ahora estudiamos la monotonicidad del costo. JT (ûT) con respecto a T. Esta propiedad es
crucial para la síntesis óptima (Teorema 3.6) y se basa en la convexidad
suposiciones sobre los datos.
Prueba. Siguiente (19), denotamos por t1 a∪Dakota del Norte t2 los dos tienen éxito-instantes sivos de (0, T)
por cual uno tiene ûT = +1 sobre [0, t1) [t2, T] y ûT = 1 sobre [t1, t2). En el
de la misma manera, de fi nemos s∪1, s2 como los dos su instantes sucesivos de (0, S) tal que uno tiene
ûS = +1 sobre [0, s1) [s2, T] y ûS = -1 sobre [s1, s2). Denotemos también por x, y
las soluciones de (1) correspondiente a ûT y ûS respectivamente y establecer XM: = x (t1),
Xm: = x (t2), yM: = y (s1), ym: = y (s2).
CONTROL PERIÓDICO ÓPTIMO BAJO RESTRICCIÓN INTEGRAL 13
De Lemma 3.4, uno tiene XM < yMETRO, Xm> ymetro, t1 < s1, y t2 < s2. Entonces, presentamos un
mi definido por
E: = {s ∈ [0, S] ; y (s)> xMETRO o y (s) <xmetro},
junto con una función ϕ: [0, T] → [0, S] \ E por
t si t ∈ [0, t1),
ϕ (t): = t + δ1 si t ∈ [t1, t2),
t + δ1 + δ2 si t ∈ [t2, T],
dónde δ1, resp. δ2 es el tiempo pasado por y sobre X, resp. debajoX. Son dadas por
δ1: = medir ({s ∈ [0, S] ; y (s)> xMETRO}), δ2: = medir ({s ∈ [0, S] ; y (s) <xmetro}).
Por construcción uno tiene x (t) = y (ϕ (t)), por t ∈ [0, T] y ϕ es biyectivo, por lo tanto
medirE) = S - T. Además, para cualquier función monótona ρ: yo → R uno tiene
∫ T ∫T ∫
ρ (x (t)) Dt = ρ (y (ϕ (t))) Dt = ρ (y (s)) Ds,
0 0 [0,S] \ E
y ∫T ∫
γ (̀ (x (t))) Dt = γ (̀ (y (s))) Ds.
0 [0,S] \ E
lo que implica
1
γ (̀ (y (s))) Ds = ū. (25)
S T- mi
Vamos a no∣∣∣∣lo consideramos Una función γ̂: [̀ (ym), `(̀yMETRO)] → R definido por
∣
γ (̀ (X )) - γ (`(̀x))
(ξ - `(̀Xmetro)) por ξ ∈ [`(̀Xm), `(̀XMETRO )],
METRO metro
`(̀X) - `(̀X)
metro
∣∣ γ (̀ (x)) +
γ (ξ) de lo contrario,
(ver Fig. 1). Primero, tenga en cuenta queγ̂ es convexo creciente y satisface
1
`(̀Y (s)) Ds ≤ γ̂-1 (ū). (27)
S T- mi
γ̂̂
γ
`(̀Xmetro) `(̀XMETRO)
usando el hecho de que x (t) ∈ [Xmetro, ∫ T por t ∈ [0, T ], (26) y (4). Por lo tanto, uno tiene
XMETRO]
1
`(̀X (t)) Dt> γ̂-1 (ū). (28)
T 0∫
Teorema 3.6. Suponga que las hipótesis (H1) - (H2) - (H3) se cumplen. Entonces, para
cualquierT> 0, hay dos soluciones óptimas de (13) dado por los controles ûT y ǔT.
Prueba. Dado que (H3) implica (H̄), la proposición 3.2 da la singularidad de un T -admisible
B + B-B + trayectoria (ver Observación 6), lo que equivale a afirmar que hay exactamente
dos extremos con dos interruptores (correspondientes a n = 1), dado por los controles
ûT (·) y ǔT (·). Recuerde que tienen el mismo costo porque ǔT (·) es obtenido por un
traducción de tiempo de ûT (·).
Ahora, propuesta 3.1 muestra que una trayectoria óptima consiste en 2n (con norte ≥ 1)
interruptores, que ocurren exactamente en los valores máximo y mínimo. Se debería notar
que cualquier trayectoria con 2norte interruptoresnorte ≥ 1) es T n -periódico. Por construcción,
un extremal tiene que cruzar X después de sus dos primeros cambios, digamos en t̄> 0. Desde t = t̄, el
control alterna los mismos valores +1 y -1 y los puntos de conmutación ocurren exactamente
los mismos valores de X(·), a saber XMETRO y Xmetro. Por lo tanto, usando el teorema de Cauchy-
Lipschitz, se obtiene x (t) = x (t + t̄) para cualquier t ∈ [0, t̄] y sucesivamente en los intervalos
[t̄, 2t̄], · · ·, [(norte-1)t̄, nt̄]. Por lo tanto X(·) es t̄-periódico con x (nt̄) = x (T) = x̄, por lo tanto t̄ = T / n.
Deducimos que un extremo con 2norte interruptores es Tennesse-periódico. Para concluir,
CONTROL PERIÓDICO ÓPTIMO BAJO RESTRICCIÓN INTEGRAL 15
supongamos que una trayectoria óptima tiene 2norte conmuta con n> 1. Su costo es entonces igual
para J (ûTennesse). Aplicando Lema 3,5 con T y Tennesse da J (ûT) < J (ûTennesse), lo que demuestra
que la solución óptima se logra para n = 1 (es decir, con dos interruptores).
4. Relajar las suposiciones sobre el exceso de rendimiento local. Las secciones anteriores
han mostrado el papel crucial que juega la propiedad de monotonicidad de la función
ψ y la convexidad de la función γ en el intervalo I (ver Hipótesis (H̄) y (H3)). En la presente
sección, consideramos situaciones para las cuales estas condiciones no se cumplen en
todo el intervalo.I pero solo en un barrio de X. Normalmente, podrían existir otros valores
de X satisfactorio ψ (x̄) = ū (Por tanto, la hipótesis (H̄) no se cumple en I) o γ podría ser sólo
localmente convexa en un vecindario de X (Por tanto, la hipótesis (H3) no se cumple en I).
La idea es entonces restringir los valores del período
T para caracterizar las soluciones óptimas (periódicas) que quedan en un vecindario de X
(y presentando exceso de rendimiento). Por lo tanto, esperamos no tener un rendimiento
excesivo sistemático (ver observación7 y el ejemplo 5.2.2 como ilustración).
Proposición 4.1. Suponga que las hipótesis (H1) - (H2) se cumplen con ψ′ (x̄)> 0.
Entonces hay e existe Tmax> 0 tal que para cualquier T ∈ (0, Tmáx.), existe un único
(Xmetro, XMETRO) ∈ I2 que verifican20) y (21) con
Prueba. Considere un subintervalo J: = (ã, ˜B) ⊂ I con ã <x̄ < ˜B tal que la propiedad
(ψ (x) - ψ (x̄)) (x - x̄)> 0, ∀X ∈ J \ {x̄}. (30)
se cumple (como ψ′ es estrictamente positivo en X, lo sabemos tal intervalo existe). Dejar [a,
entonces consideremos el fu∣∣ ncion F definido en el intervalo b] por
∣∣∣∣∣ f (x)
si X ∈ J
( )
1
g (x) (X - a) - 1) si X ∈ [a, ã],
f˜(x): = ∣∣ -g∣∣∣∣ (x)
- ãa
-
(ψ (ã) +
1 - ψ (˜B) -
(bx) + 1 si X ∈ [˜b̃, b].
B -˜B
Claramente, la pareja (f̃, g) satisface las hipótesis (H1) - (H2) - (H̄). La funciónF no es
C1 pero Lipschitz continua, pero se puede comprobar fácilmente que Lemma 3.3, Propuesta
3.2 y Lemma 3.4 siguen siendo válidos con F simplemente Lipschitz continuo. Esto le da al
existencia y unicidad de Xmetro y XMETRO que verifican20) y (21) para la pareja (f̃, g)
y cualquier T> 0. Como T 7 → Xmetro(T) y T 7 → XMETRO(T) son respectivamente decrecientes y
crecientes wrt T (recordar Lemma 3.4), existe T̃> 0 tal que Xmetro(T̃) = ã o
XMETRO(T˜) = ˜B. Como F coincide con F en [a, ˜B], concluimos que Xmetro, XMETRO son los números
únicos que verifican (20) y (21) sobre [a, ˜B] para la parejaf, g) y cualquier T ≤ T̃. Esto se puede
hacer para cualquier subintervalo. J que verifica la condición30). Entonces consideramos
Tmax como el supremo de T̃ para todos esos subintervalos J.
dieciséis T. BAYEN, A. RAPAPORT Y F.-Z. TANI
Dado T <Tmax, uno puede preguntarse si es suficiente para requerir que la Hipótesis (H3) se
cumpla en [Xmetro, XM] (en lugar de I) para obtener la optimalidad de los controles ûT,
ǔT como en el teorema 3.6. Sin embargo, podrían existir trayectorias extremas tomando
valores fuera del intervalo [Xmetro, XMETRO], sin requerir suposiciones adicionales sobre la
función ψ fuera de este conjunto.
Para esto ∈propósito, consideramos el∈tw∣∣∣o controles tu- y u + de fi nido por un tiempo de
conmutación(0,t- T) (por tu-) y t + (∣0, T) (por u +) como
x T+
X t+
t-
X-T
0
T
XT
(31)
x T+ : = x (t, -u +, x̄).
Se puede comprobar que en Hipótesis (H1) - (H2), cualquier T -solución periódica X(·) de
(1) con X(0) = X y control tu tomando valores en [-1, 1] verificaciones
que completa la prueba de propiedad (32). También se puede observar que uno tiene
Prueba. Reparar T ∈ (0, Tmáx.) que cumple la condición33). Tenga en cuenta que esto es posible ya que
+
ψ está aumentando en un barrio de X y (X- T, XT) → (x̄, x̄) cuando T → 0.
Según la propuesta 4.1, existe unico Xmetro, XMETRO que verifican20) y
(21). Dado que existe unT -trayectoria admisible tomando los valores Xmetro y XMETRO, uno
tiene necesariamente
y κ (x̄) = B <T-t̂. Por lo tanto X∫† se define de forma única con X† ∈ (Xmetro, X). Es más,
uno tiene
X
DX
t† = t̂ -
∈]t̂, T [.
-
(x) g (x) X† f
Expresión (35) está bien definido. La soluciónX se muestra en la Fig. 3.
ũ=1
ũ=ū t† T
X t
t̂ - α t̂
ũ = -1 ũ=1
X†
Para concluir,∫ya que uno tiene X†> Xmetro un∫D η> 0 en I, Se obtiene
T XMETRO
Por periodos T> 0 que cumpla con las condiciones de la Proposición 4.2, sabemos que op-
las soluciones temporales permanecen en el conjunto [Xmetro, XMETRO]. Entonces obtenemos la misma conclusión
como teorema 3.6 cuando se cumple la Hipótesis (H3) en el intervalo [Xmetro, XMETRO] solamente, como
se establece en el siguiente teorema.
CONTROL PERIÓDICO ÓPTIMO BAJO RESTRICCIÓN INTEGRAL 19
Teorema 4.1. Suponga que las hipótesis (H1) - (H2) se cumplen y consideran T > 0
tal que
I) (ψ (x)-ψ (x̄)) (x- x̄)> 0 para cualquier X ∈ [X-, T x T+] \ {x̄}, dónde X-, T x T+ son de fi ned
en (31),
ii) `está aumentando en [Xmetro, XMETRO] y γ = ψ ◦ `-1 es estrictamente convexo aumentando en
[̀ (Xm), `(̀XMETRO)], dónde Xmetro y XMETRO son dadas por Proposición 4.1.
Entonces, hay dos soluciones óptimas de (13), dado por los controles ûT y ǔT.
Prueba. Primero, el supuesto ii) implica que ψ está aumentando en el intervalo [Xmetro, XMETRO].
Gracias a i), sabemos por Proposición 4.2 que cualquier extremal es tal que X acepta
valores dentro del intervalo [Xmetro, XMETRO]. Con el supuesto ii) en lugar de la hipótesis (H3), el
lector puede comprobar fácilmente que los argumentos del teorema 3.6 aplicar en el
de la misma manera en [Xmetro, XM] (en lugar de todo el intervalo I), para demostrar que solo los
extremos X y X son óptimos.
Observación 7. Cuando las hipótesis (H1) - (H2) - (H3) no se satisfacen todas (lo que se considera en
esta sección), no se puede garantizar un rendimiento excesivo para ningún valor de T como en la
sección anterior. Sin embargo, el teorema 4.1 proporciona soluciones periódicas óptimas que
presentan un rendimiento excesivo.
Tenga en cuenta que la ecuación (37) puede tener varias soluciones. Consideramos uno de ellos que
conduce a un equilibrio estable (se puede comprobar fácilmente que esto equivale a tener
Ē> f′ 0(X)). Nuestro objetivo es estudiar si la av∫criterio de edad
T
1
JT (E): = `(̀X (t)) Dt, (38)
T 0
F0 (x): = rx 1 - X ,
K
dónde r> 0 y K> 0. Se puede comprobar fácilmente que existe un equilibrio positivo
X de (36) satisfactorio37) Tan pronto como Ē <r. Es más, X es un equilibrio estable (ver
[10]). Suponemos de ahora en adelante que uno tiene)Ē <r. Ya que uno tiene
( r ( X)
(F - g) (x) = xr -mimax - X ; (f + g) (x) = rx 1 - ,
K K
Las hipótesis (H1) - (H2) son satisfactorias∣ed para el intervalo Yo: = (λ (E max ) , K) dónde
∣∣∣∣ h-1 (mi0máx.) si mimax> r,
λ (Emax) =
si mimax < r.
2r
Nota ese ψ es una función a ffi ne: ψ (x) = c1X + C0con c = 10- mimax
, C1 =
2r
KE
. Cuando `es estrictamente cóncava, la functio norte γ = ψ ◦ `-1 es estrictamente convexo
max
representado en Higo. 4.
ℓ (x̄) XMETRO(T)
Xmetro(T)
λ (Emáx.)
0 1 2 3 4 5 6 7 8 9 10 2 4 6 8 10
T T
5.2. La logística con compensación. Se sabe que algunas poblaciones presentan una
indemnización en la primera parte de su crecimiento (función [10], que también se llama
débil efecto Allee. Esto está representado por la siguiente modificación de la logística
función ) X
F0 (x): = rxα 1- ,
K
con α> 2. Para esta función, uno tiene
( X)
h (x) = rxα-1 1- ,
K
que aumenta en [0, ¿X?) y disminuyendo en (x?, K] con
α-1
¿X? : = K,
α
(ver Fig. 5). En presencia de compensación en el modelo, también se puede comprobar
fácilmente que la funciónψ es cóncavo decreciente en [0, XC), convexo decreciente en (XC, ¿X?), y
convexo aumentando en (x?, K] con
α-2
x:C= K <x ?,
α
(ver Fig. 5).
mi⋆
0,5
0
0.4
−0,5
0,2
−1
XC XC
0 −1,5
X⋆ K X⋆ K
Consideraremos aquí la función `(̀x) = x (es decir, el criterio es simplemente el nivel del
stock X). Definamos
¿MI? : = h (x?).
Distinguimos ahora dos casos dependiendo de si mimax está por debajo o por encima ¿MI?.
5.2.1. Caso 1: mimax < ¿MI?. Tenga en cuenta primero que hay dos soluciones λ1 (mimáx.) y
λ2 (mimáx.) en el intervalo (0,K) de la ecuación h (x) = Emax tal que λ1 (mimáx.) <
¿X? <λ2 (mimáx.). A continuación, se puede comprobar que se cumplen las hipótesis (H1) - (H2) - (H3)
en el intervalo Yo: = (λ2 (mimáx.),K). Para cualquier MI ∈ (0, mimáx.), También se puede
demostrar, como en el modelo logístico, que existe una solución única. X ∈ I de (37) cual es
además, un estado estable estable de (36) (ver [10]). Proposición2.1 garantiza entonces un
rendimiento excesivo T> 0.
Higo. 6 describe el valor de costo óptimo JT (ûT) para los siguientes valores de parámetro:
r = 0,3, K = 5, a = 2,5, x̄ = 4, Ē = 0.48, y mimax = 0.5893.
4.02
K
X
XMETRO(T)
Xmetro(T)
λ2 (mimáx.)
3,84
0 2 4 6 8 0 1 2 3 4 5 6 7 8 9 10
T T
5.2.2. Caso 2: mimax> ¿MI?. Se puede comprobar fácilmente que las hipótesis (H1) - (H2) se
cumplen en el intervalo (0,K), pero no Hipótesis (H3). Ya queX es un estable estable
estado de la dinámica, el punto X pertenece al intervalox?, K) (ver [10]). Tenga en cuenta
también queψ está aumentando en un barrio de X. Proposición 4.1 garantías entonces
la existencia del T -trayectoria periódica B + B-B + (o B-B + B-) que satisface la restricción integral,
para T no demasiado grande. Además paraT lo suficientemente pequeño, la función
ψ es estrictamente convexo en [Xmetro(T), xMETRO(T)], y podemos concluir sobre la
optimalidad de estas trayectorias según el Teorema 4.1.
Usando los mismos valores de parámetro excepto mimax = 0.8235, la función F definido en (22) se
muestra en la Fig. 7 (izquierda) para diferentes valores de T. Recordamos (ver la prueba de
Proposición 3.2) que la existencia de Xmetro, XMETRO es equivalente a la existencia de un cero
de F. Uno puede ver en esta figura que Tmax como se define en la prueba de la Proposición 4.1
es aproximadamente igual a 6. Para T> 6, no podemos concluir sobre la existencia de
trayectorias bang-bang., ni sobre su optimalidad. Por el contrario, paraT < 6,
los B + B-B + y B-B + B- las estrategias son admisibles y óptimas, y Xmetro, XMETRO,
X-T, x + T se grafican en función de T en la Fig. 7 (Derecha). Observe que la propiedad (34)
se cumple, para todos T < 6. Tenga en cuenta que la ecuación h (x) = Ē tiene dos soluciones x <x̄
CONTROL PERIÓDICO ÓPTIMO BAJO INTEGRAL RESTRICCIÓN 23
3 T=4 K x T+
T=5 XMETRO(T)
T=6
X
2
T=7
X-T Xmetro(T)
X
−1
α
1,5
X 2
2.5 3 3,5 4 2
T
4 6
2 4 6
T
Algunas de las técnicas que hemos propuesto aquí para hacer frente a la restricción integral
sobre la variable de control, que es la característica principal del problema que hemos
considerado, podrían ser implementadas para sistemas de dimensiones superiores y serán
materia de un trabajo futuro.
REFERENCIAS
[1] EM Abulesz y G. Lyberatos, Forzamiento de impulso periódico de sistemas no lineales: un nuevo método, Revista
Internacional de Control, vol. 48, págs. 469–480, 1988.
[2] EM Abulesz y G. Lyberatos, Optimización periódica de los procesos de crecimiento microbiano,
Biotecnología y bioingeniería, vol. 29, págs. 1059-1067, 1987.
[3] EM Abulesz y G. Lyberatos, Operación periódica de un cultivo continuo de levadura de panadería, Biotecnología y
bioingeniería, vol. 34, págs. 741–749, 1989.
[4] AO Belyakov y VM Veliov, Pesca constante versus pesca periódica: enfoque de control óptimo estructurado por
edad Matemáticas. Modelo. Nat. Phenom., Vol. 9, págs. 20–37, 2014.
[5] DS Bernstein y EG Gilbert, Control periódico óptimo: El π prueba revisada, Transacciones IEEE sobre control
automático, vol. 25, págs. 673–684, 1980.
[6] S. Bittanti, G. Fronza y G. Guardabassi, Control periódico: un enfoque en el dominio de la frecuencia,
Transacciones IEEE sobre control automático, vol. 18, págs. 33-38, 1973.
[7] S. Bittanti, A. Locatelli y C. Ma ff ezzoni, Métodos de segunda variación en la optimización periódica,
J. Teoría y aplicación de la optimización, vol. 14, págs. 31-49, 1974.
[8] S. Bittanti, A. Locatelli y S. Rinaldi, Estado de optimización periódica de sistemas dinámicos,
J. Teoría y aplicación de la optimización, vol. 14, págs. 1-20, 1974.
[9] L. Cesari, Teoría de la optimización y aplicaciones. Problemas con ecuaciones diferenciales ordinarias,Springer,
1983.
[10] CW Clark Bioeconomía matemática: las matemáticas de la conservación Wiley, 2010.
[11] RT Evans, JL Speyer y CH Chuang, Solución de un problema de control óptimo periódico por series asintóticas, J.
Teoría y aplicación de la optimización, vol. 52, págs. 343–364, 1987.
[12] EG Gilbert, Control periódico óptimo: una teoría general de las condiciones necesarias, SIAM J. Control Optim.,
Vol. 15, págs. 717–746, 1987.
[13] EG Gilbert, Q. Wang, Q. y JL Speyer, Condiciones necesarias y suficientes para la optimización local de un proceso
periódico, SIAM J. Control Optim., Vol. 28, págs. 482–497, 1990.
[14] J. Harmand, C. Lobry, A. Rapaport y T. Sari, El Chemostat: teoría matemática de cultivos de microorganismos, ISTE
Wiley, 2017.
[15] V. Hatzimanikatis, G. Lyberatos, S. Pavlou y SA Svoronos, Un método para la optimización periódica pulsada de
sistemas de reacción química, Ciencias de la Ingeniería Química, vol. 48, n. 4, págs. 789–797, 1993.
[16] Ideales LV, Análisis de estabilidad de los modelos de producción periódica de Fox, Poder. Apl. Matemáticas. P. 14, no.
3, págs. 331–341, 2006.
[17] LV Idels, M. Wang Estrategias de recolección con función de esfuerzo modificada, Interno. J. de Modelado, Identi
fi cación y Control, Edición especial de Modelado de sistemas complejos (IJMIC) vol. 3,
norte. 1, págs. 83–87, 2008.
[18] C. Ma ff ezzoni, Teoría de Hamilton-Jacobi para problemas de control periódico, J. Teoría y aplicación de la
optimización, vol. 14, págs. 21-29, 1974.
[19] L. Perko, Ecuaciones diferenciales y sistemas dinámicos, Springer Sciences, 2013.
[20] LS Pontryagin, VG Boltyanskiy, RV Gamkrelidze y EF Mishchenko, Teoría matemática de procesos óptimos, The
Macmillan Company, 1964.
[21] JL Speyer y RT Evans, Una segunda teoría de variación para procesos periódicos óptimos, Transacciones IEEE
sobre control automático, vol. 29, págs. 138-148, 1984.
CONTROL PERIÓDICO ÓPTIMO BAJO RESTRICCIÓN INTEGRAL 25