Está en la página 1de 26

Traducido del inglés al español - www.onlinedoctranslator.

com

Control periódico óptimo para la dinámica escalar bajo


restricción integral en la entrada
Térence Bayen, Alain Rapaport, Fatima Zahra Tani

Para citar esta versión:

Térence Bayen, Alain Rapaport, Fatima Zahra Tani. Control periódico óptimo para la dinámica escalar bajo
restricción integral en la entrada. Control matemático y campos relacionados, AIMS, 2020, 10
(3), págs. 547-571. ??? 10.3934 / mcrf.2020010 ???. ??? hal-02057590v2 ???

Identificación de HAL: hal-02057590

https://hal.archives-ouvertes.fr/hal-02057590v2
Enviado el 9 Sep 2019

HAL es un acceso abierto multidisciplinario L'archive ouverte pluridisciplinaire HAL, est


archivo para el depósito y difusión de documentos sci- destinée au dépôt et à la diffusion de documents,
investigación interesante ya sean pub- scientifiques de niveau recherche, publiés ou non, Los documentos pueden
Lished o no. provenir de émanant des établissements d'enseignement et de
instituciones de enseñanza e investigación en Francia o recherche français ou étrangers, des laboratoires en el
extranjero, o de centros de investigación públicos o privados. publics ou privés.
Control matemático y campos relacionados Revistas de doi: 10.3934 / xx.xx.xx.xx
AIMS
Volumen X, Número 0X, XX 200X páginas. X – XX

CONTROL PERIÓDICO ÓPTIMO PARA DINÁMICAS ESCALARES


BAJO RESTRICCIÓN INTEGRAL EN LA ENTRADA

Térence Bayen
IMAG, Univ Montpellier, CNRS, Francia.
MISTEA, Univ Montpellier, INRA, Montpellier SupAgro, Francia.

Alain Rapaport y Fatima-Zahra Tani


MISTEA, Univ Montpellier, INRA, Montpellier SupAgro, Francia.

Abstracto. Este artículo estudia un problema de control óptimo periódico regido por un
sistema unidimensional, lineal con respecto al control u, bajo una restricción integral en u.
Damos condiciones para las cuales el valor de la función de costo en estado estacionario con
un control constante ū se puede mejorar considerando el control periódico tu con valor medio
igual a ū. Esto conduce al llamado "exceso de rendimiento" que se cumple en varias
aplicaciones. Con el uso del Principio Máximo de Pontryagin, proporcionamos la síntesis
óptima de estrategias periódicas bajo la restricción integral. Los resultados se ilustran en un
único modelo de población con el fin de estudiar el efecto de los insumos periódicos sobre la
utilidad del stock de recursos.

Palabras clave. Control óptimo, principio máximo de Pontryagin, soluciones periódicas,


rendimiento excesivo.

1. Introducción. En muchas aplicaciones, el control de modelos dinámicos permite conducir el


estado X de un sistema a un punto de funcionamiento, normalmente un estado estable X
que es un punto de equilibrio de la dinámica bajo un control constante ū. Cuando un
criterio de rendimiento se asocia con el estado del sistema, puede suceder que una
trayectoria periódica cerca del estado estable dé un rendimiento promedio mejor que en
el estado estable. Pero tal ganancia en el desempeño podría tener el precio de un mayor
esfuerzo (o costo) en la variable de control. El objetivo del presente trabajo es investigar la
posibilidad de mejorar el desempeño de un estado estacionario con soluciones
periódicas, manteniendo el mismo esfuerzo de control en cada período de tiempo.
Consideramos en este trabajo que este esfuerzo se mide por la integral del controlu (·)
en un periodo. Mantener el mismo esfuerzo consiste entonces en imponer que el control
promedio sobre una solución periódica es igual al controlū en estado estacionario. Para
ello, formulamos un problema de control óptimo sobre soluciones periódicas, bajo una
restricción integral sobre el control. El control óptimo periódico ya ha sido investigado en
la literatura, principalmente considerando que las soluciones se buscan cerca de un
estado estacionario optimizando el criterio entre las soluciones estacionarias. En
particular, el llamadoπ-El criterio caracteriza la existencia de "mejores" períodos. Consiste
primero en determinar un estado estable óptimo entre controles constantes, y luego en
verificar en una aproximación lineal-cuadrática si existe una frecuencia de una señal
periódica cercana a la constante nominal que podría mejorar el costo (ver [6, 5]). Por
ejemplo, en [2, 3, 15], este método se ha aplicado en el modelo de quimiostato, y se ha
demostrado que su productividad se puede mejorar con un control periódico cuando

1
2 T. BAYEN, A. RAPAPORT Y F.-Z. TANI

hay un retraso en la dinámica. Sin embargo, hay relativamente pocos trabajos teóricos sobre la
optimización global de los controles periódicos (aparte de [18] para la caracterización de la
función de valor bajo supuestos bastante fuertes). La mayoría de las obras existentes se ocupan
de las condiciones locales necesarias ([8, 12]), condiciones de segundo orden ([7, 21, 13]) o
técnicas de aproximaciones ([11, 1, 4]). En [4] por ejemplo, se lleva a cabo un análisis local en el
contexto de un sistema estructurado por edad que muestra cómo mejorar localmente la
función de costos al considerar controles periódicos versus controles constantes (pero no se
considera ninguna restricción integral sobre el control). Debe subrayarse que, en nuestro
enfoque, no tenemos que considerar que el estado estacionario está optimizando el criterio
entre todas las soluciones estacionarias del sistema (el control óptimo del estado estacionario
no necesariamente satisface la restricción integral). Hasta donde sabemos, la restricción
integral sobre el control aún no se ha considerado en los problemas de determinación de
trayectorias periódicas óptimas. Por lo tanto, nuestro objetivo es algo diferente de lo que se ha
descrito anteriormente.
En aplicaciones para las que la variable de control es una tasa de flujo de materia (como en
reactores de alimentación continua, por ejemplo [14]), esta restricción equivale a considerar
que una determinada cantidad de materia está disponible para cada período de tiempo, y el
problema es entonces determinar cómo entregar esta materia durante este período (es decir,
¿A caudal constante o no?), manteniendo una operación periódica durante los tiempos futuros
y maximizando la producción o la calidad de un producto en cada período. El problema actual
ha sido motivado principalmente por la modelización de poblaciones explotadas de stock (o
densidad)X, ver, p.ej, [10], para la cual la variable de control tu es el esfuerzo de recolección (por
ejemplo, el número de botes de pescadores en un lago). En nuestro entorno, para un estado
estable dadoX y su control constante asociado ū, consideramos el conjunto de T -trayectorias
periódicas con controles periódicos que tienen ū como promedio. Decimos que unSobre
rendimiento ocurre cuando la utilidad promedio de la acción X(·) de un T -La solución periódica
es mayor que la utilidad de la acción. X. Mencionemos finalmente [dieciséis, 17] donde los
insumos periódicos se estudian en el contexto de la biología de poblaciones y el manejo de
pesquerías, pero con diferentes objetivos (no se considera la optimización ni tal restricción
integral).
Hasta donde sabemos, este problema aún no se ha abordado teóricamente en la
literatura. Desde un punto de vista matemático, la restricción integral en la entrada trae
dos dificultades principales:
1. la existencia de trayectorias periódicas no constantes con un control que satisface la
restricción integral,
2. la caracterización de un control óptimo bajo ambas restricciones de periodicidad de
la trayectoria y la restricción integral en la entrada,
que nos proponemos abordar aquí para la dinámica escalar en el marco general.
El documento está organizado de la siguiente manera. En la sección2, formulamos el problema y
dar una definición precisa de exceso de rendimiento. Luego proporcionamos supuestos sobre la
dinámica y la función de costo que garantizan o previenen el rendimiento excesivo. En particular,
mostramos que la convexidad juega un papel importante. En la sección3, sintetizamos controles
periódicos óptimos (en particular los no constantes) mejorando la función de costo en comparación
con el estado estacionario (ver Teorema 3.6). En la sección4, mostramos cómo relajar los supuestos
de la Sección 2 que se requieren en un dominio invariante (a, b)
de la dinámica, cuando estas se cumplen sólo en un vecindario de X. Esto nos lleva a dar
un resultado similar al de la Sección 3 pero por valores restrictivos del período T.
Finalmente, ilustramos los resultados de la Sección 3-4 en la sección 5 en el contexto de la
gestión sostenible de los recursos (ver, p.ej, [10]). Estudiamos el impacto
CONTROL PERIÓDICO ÓPTIMO BAJO RESTRICCIÓN INTEGRAL 3

sobre el stock de insumos periódicos no constantes (esfuerzos de cosecha) pero con el mismo
valor promedio, y determinar los peores escenarios con respecto a una determinada utilidad
del stock.

2. Existencia de exceso de rendimiento. Dadas dos funciones f, g: R → R de clase C1,


consideramos el sistema de control
ẋ = f (x) + ug (x), (1)
dónde tu es una variable de control que toma valores en [-1, 1]. Suponemos que el sistema
satisface las siguientes hipótesis:
(H1) Existe (a, b) ∈ R2 con a <b tal que gramo es positivo en el intervalo
Yo: = (a, b) con

fa) - g (a) = 0 y f (b) + g (b) = 0.

(H2) Uno tiene F - g < 0 y f + g> 0 en I.

Observación 1. La hipótesis (H1) implica que el intervalo I es invariante por (1) mientras que la
Hipótesis (H2) está relacionada con las propiedades de controlabilidad de (1) (que se utilizará en
la siguiente sección para la síntesis de trayectorias periódicas no constantes). En el resto del
artículo, consideraremos las condiciones iniciales enI solamente.

Definimos por X ∈ I la función

ψ (x): = -f (x) .
g (x)
Observe que las hipótesis (H1) - (H2) implican que uno tiene ψ (yo) ⊂ [-1, 1]. Por lo tanto, para
cualquierX ∈ I, el valor de control ū definido como ū: = ψ (x̄) es tal que ū ∈ [-1, 1]. Tenga en
cuenta que cualquier puntoX es un equilibrio de (1) para el control constante u = ū.
A lo largo del documento, arreglamos un punto X ∈ I como un estado estacionario nominal. En el
secuela, consideraremos T -soluciones periódicas de (1), dónde T ∈ R∗ + , con aT-
control periódico tu que satisface el restricción integral
∫ T
1
Utah) Dt = ū. (2)
T 0

Luego de fi nimos el conjunto UT de controles admisibles como

UT: = {u: [0, +∞) → [-1, 1] st tu es medida., T -periódicos y cumplidos2)}. (3)


Uno tiene la siguiente propiedad.

Lema 2.1. Bajo Hipótesis (H1), ninguna T-solución periódica X de (1) en I con
tu ∈ UT cumple la propiedad ∫ T

(ψ (x (t)) - ψ (x̄)) Dt = 0. (4)


0

Prueba. En la inte∫rval I, la función∫ gramo es positivo un∫ Td de la ecuación (1), nosotros obtener

T T
ẋ (t)
Dt = - ψ (x (t)) Dt + Utah) Dt.
0 g (x (t)) 0 0

Definir la función ∫ X Dξ
h (x): = , ∈
x yo,
Xg (ξ)
4 T. BAYEN, A. RAPAPORT Y F.-Z. TANI

junto con la función t 7 → y (t): =


función tu que cumple la restricción (2), entonces uno tiene
∫ hT(x (t)) por t ∈ [0, T]. Para cualquier control
y (T) - y (0) = - (ψ (x (t)) - ū) Dt,
0

dónde ū = ψ (x̄). Para cualquier T -solución periódica X en Yo, y es también T -periódico y se


obtiene la propiedad (4).

Ahora requerimos la siguiente hipótesis sobre X.


(H̄) La función ψ satisface la propiedad.
(ψ (x) - ψ (x̄)) (x - x̄)> 0, ∀X ∈ Yo \ {x̄}.
Esta hipótesis está relacionada con la asintótica estabilidad de X para la dinámica1)
en I con el control constante ū (como veremos en Lemma (2.2), ver (5)). Para las
aplicaciones, también parece razonable que el estado estable dadoX es un equilibrio
estable del sistema bajo control constante.
Por conveniencia, denotamos por t 7 → x (t, u, x0) la solución de (1) con tu ∈ UT
y tomando el valor X0 ∈ I en el tiempo 0. A continuación, consideraremos T -soluciones
periódicas con la condición inicial X(0) = X (es decir, que son tales que x (T, u, x̄) = x̄
por tu ∈ UT). Primero mostramos que la Hipótesis (H̄) garantiza la existencia de tales
soluciones no constantes.

Lema 2.2. Bajo hipótesis (H1) - (H̄), existen no constantes T-periódico so-
lciones de (1) con X(0) = X y tu ∈ UT, para cualquier T> 0.

Prueba. Considere el control constante u = ū y su dinámica asociada en I


ẋ = f̄ (x): = g (x) (ū - ψ (x)) = g (x) (ψ (x̄) - ψ (x)). (5)
Como la función gramo es positivo en I, La hipótesis (H̄) implica que uno tiene f̄ < 0 en
(x̄, b), y f̄> 0 en (a, x̄). Por tanto, uno tiene las propiedades
X0 ∈ (x̄, b) ⇒ x (T, ū, x0) < X0,
(6)
X0 ∈ (a, x̄) ⇒ x (T, ū, x0)> X0.
Considere ahora cualquier T -perio dic función medible v: [0, +∞) → [-1, 1]
satisfactorio acotado
∫ T
Vermont) Dt = 0,
0
y la función de control
tuε (t): = ū + εv (t),
dónde ε ∈ R. Claramente, tuε satisface la restricción (2) y para ε lo suficientemente pequeño, uno tiene
tuε (t) ∈ [-1, 1] para cualquier t ≥ 0. Defina entonces la función

θ (x0, ε): = x (T, uε, X0) - X0,


por (X0, ε) ∈ I × R. Por el teorema de dependencia continua de las soluciones de ecuaciones
diferenciales ordinarias con condiciones y parámetros iniciales (ver para
instancia [19]), θ es una función continua. Desde (6), deducimos que
X0 ∈ (x̄, b) ⇒ θ (x0, 0) <0,
X0 ∈ (a, x̄) ⇒ θ (x0, 0)> 0,

y por continuidad de θ, existe ε θ (x +, ε) < 6 = 0, x +0 ∈ (x̄, b) y X- 0 ∈ (a, x̄) tal que


0 y θ0 (x-, ε)> 0. Por 0 el teorema del valor medio, deducimos el
CONTROL PERIÓDICO ÓPTIMO BAJO RESTRICCIÓN INTEGRAL 5

existencia de X0 ∈ (X- 0, x +0) tal que θ (x0, ε) = 0, es decir, la existencia de un T-


solución periódica X de (1) wi∫th un control no constante tu que satisface la restricción
(2). De Lemma2.1, tal solución satisface
T
(ψ (x (t)) - ψ (x̄)) Dt = 0,
0

lo que implica que el mapa t 7 → ψ (x (t)) - ψ (x̄) no puede ser de signo constante en [0, T].
La hipótesis (H̄) implica que x (t) - X tiene que cambiar su signo. Por lo tanto hay
existas t̄ ∈ (0, T) con x (t̄) = x̄ de tal manera que la función de control ũ definido por
t 7 → Utah) : = u (t + t̄) garantías para tener X

Ahora, dejar `: R → R ser una función de la clase C1 y considere la función de costo


∫ (T,
T ũ, x̄) = x̄.
1
JT (u): = `(̀Xu (t)) Dt, (7)
T 0

dónde Xtu es la solución única de (1) tal que Xu (0) = X, asociado con un
control tu ∈ UT. Nuestro objetivo en este trabajo es abordar la cuestión de encontrar una
trayectoria periódica con X(0) = X que tiene un costo menor que la constante X, con un
(T -periódico) control del valor medio ū. Para ello, presentamos la siguiente terminología.

Definición 2.3. Dado T> 0, decimos que (1) exhibe un Sobre rendimiento por el costo7) si
existe un T -solución periódica X de (1) con X(0) = X asociado con un
control tu ∈ UT tal que JT (u) <`(̀x̄).

Además, nuestro objetivo es caracterizar en la siguiente sección las estrategias que realizan
el mínimo del criterio (7) entre dichos controles. La posibilidad de tener un rendimiento
excesivo se basa en supuestos específicos sobre la función de costo y la dinámica, que ahora
presentamos.

(H3) La función `: I → R está aumentando y la función γ: = ψ ◦ `-1 es estrictamente convexo


aumentando sobre `(̀I).

Observación 2. Hipótesis (H3) implica Hipótesis (H̄). Por lo tanto, por Lemma2.2,
allí existe T -soluciones periódicas X de (1) con X(0) = X y tu ∈ UT, que son diferentes de la
solución constante X, cuando se cumplen (H1) - (H2) - (H3). Hipótesis (H3) también
implica que ψ esta incrementando.

Proposición 2.1. Si (H1) y (H3) mantener la verdad, cualquier no constante T-solución periódica
X de (1) con X(0) = X y tu ∈ UT satisface JT (u) <`(̀x̄).

Prueba. Considere un T -peri solución ódica X con X(0) = X asociado con un control en
UT. De Lemma 2.1, eq∫la calidad4) está satisfecho y deducimos
T
(γ (`(̀x (t))) - γ (̀ (x̄))) Dt = 0.
0

Para una s no constante∫lución, nos encontramos d por J∫la desigualdad de ensen


(o )
T T
1 1
γ `(̀X (t)) Dt < γ (`(̀x (t))) Dt = γ (̀ (x̄)).
T 0 T 0

Ya que γ está aumentando sobre `(I) con W


∫obtenemos
T
1
JT (u) = `(̀X (t)) Dt <`(̀x̄).
T0
6 T. BAYEN, A. RAPAPORT Y F.-Z. TANI

Observación 3. (i) El resultado de la propuesta 2.1 se aplica en el caso simple donde


`(x) = x y ψ es estrictamente convexo y aumenta sobre I.
(ii) Si ψ es estrictamente convexo y aumenta sobre I y `es estrictamente cóncava aumentando sobre I,
el resultado de la propuesta 2.1 también es cierto (por un razonamiento similar).

Ahora proporcionamos condiciones suficientes para prevenir cualquier rendimiento excesivo.

(H4) Existe una función continua ψ̄ tal que


(I) ψ̄ ≥ ψ sobre I con ψ̄ (x̄) = ψ (x̄),
(ii) la función γ̄: = ψ̄ ◦ `-1 es cóncavo creciente en `(̀I).

Proposición 2.2. Si (H1) y (H4) Si es cierto, entonces no es posible un rendimiento excesivo.

Prueba.Suponemos por contradicción que existe una solución periódica X asociación


atado con un control tu ∈ UT tal que
∫ T
1
JT (u) = `(̀X (t)) Dt <`(̀x̄),
T 0

La función γ̄ estar en∫arrugando en `(̀)I), tenemos


T
1
γ̄ `(̀X (t)) Dt <γ̄ (̀ (x̄)) = ψ̄ (x̄) = ψ (x̄). (8)
T 0

Usando la inequa (lidad de Jensen∫por γ̄, podemos escribir ∫


T T
1 1
γ̄ `(̀X (t)) Dt ≥ γ̄ (̀ (x (t))) Dt. (9)
T 0 T 0

Como uno tiene ψ̄ = γ̄ ◦ `≥ ψ∫ terminado, obtenemos

T ∫T
1 1
γ̄ (`(̀x (t))) Dt ≥ ψ (x (t)) Dt. (10)
T 0 T 0

Combinando desigualdades (8), (9), (10), w∫obtenemos


T
1
ψ (x̄)> ψ (x (t)) Dt,
T 0

que es una contradicción con la igualdad (4) dado por Lemma 2.1.

Observación 4. (i) Gracias a la proposición anterior, si `(̀x) = x por X ∈ R y ψ es estrictamente cóncava,


entonces no es posible un exceso de rendimiento. De la misma manera, si `está aumentando enI y γ
estrictamente cóncavo aumentando sobre `(̀I), entonces se sigue la misma conclusión.
(ii) Bajo las hipótesis (H1) - (H3), decimos que un rendimiento excesivo es sistemático (lo que
significa que existe para cualquier T> 0, ver propuesta 2.1).

3. Determinación de soluciones periódicas óptimas. En esta sección, asumimos que las


hipótesis (H1) - (H2) - (H3) son verdaderas, de modo que sabemos que el exceso de rendimiento
es posible (en realidad, es sistemático de acuerdo con la Proposición 2.1). Para una dadaT> 0,
diremos que una solución X de (1) es T-admisible si esto es T -periódico con X(0) = X
y tu ∈ UT. Reformulamos la restricción de control (2) considerando el aumento
dinámica
{
X = f (x) + ug (x),
(11)
ẏ = u,
CONTROL PERIÓDICO ÓPTIMO BAJO RESTRICCIÓN INTEGRAL 7

junto con las condiciones de contorno:


(X(0)∫ , y (0)) = (X, 0) y (x (T), y (T)) = (x̄, ūT). (12)
El problema de control óptimo puede ser luego declaró lo siguiente
T
inf `(̀X (t)) Dt s. t. (x, y) satisface11) - (12), (13)
tu∈U 0

dónde U denota el conjunto de funciones de control medibles tu más de [0, T] tomando valores
en [-1, 1]. Tenga en cuenta que Problema (13) admite una solución por resultados de existencia
clásicos. De hecho, las hipótesis (H1) - (H2) - (H3) implican que existen trayectorias de (11)
satisfactorio12). Dado que el sistema es una nueva forma del control y `es continuo, la
existencia de un control óptimo sigue el teorema de existencia de Filippov [9].

3.1. Aplicación del principio máximo de Pontryagin. Derivamos las condiciones de


optimalidad necesarias utilizando el Principio Máximo de Pontryagin [20]. Dejar
H: R2 ×R2 ×R×R → R ser el hamiltoniano asociado con (13):
H = H (x, y, λX, λy, λ0, u) = λ0` (̀x) + λXf (x) + u (λXg (x) + λy),
dónde λ: = (λX, λy) denota el vector adjunto. Dejartu ∈ U ser un control óptimo y
(x, y) una solución {de (11) - (12) asociado con u. Entonces, existe un escalar λ0 ≤ 0
y un mapa absolutamente continuo λ: [0, T] → R2 satisfaciendo la ecuación adjunta

λ̇x = -λ0 `(x (t)) - λX(F′ (x (t)) + u (t) g′ (x (t))),
(14)
λ˙y = 0,
por ae t ∈ [0, T]. Es más, (λ0, λ) 6 = 0 y la condición hamiltoniana escribe
Utah) ∈ arg max H (x (t), λ (t), λ0, ω) ae t ∈ [0, T]. (15)
ω∈ [-1,1]

Dado que la dinámica es una ffi ne wrt u, el cambio función


t 7 → φ (t): = λX(t) g (x (t)) + λy,
proporciona el siguiente ejemplo presión del control u (gracias a (15)):

  φ (t)> 0 ⇒ u (t) = 1,
φ (t) < 0 ⇒ u (t) = -1, (dieciséis)
 
φ (t) = 0 ⇒ Utah) ∈ [-1, 1].
Además, si diferenciamos φ wrt t, nosotros encontrar eso para t ∈ [0, T]

φ̇ (t) = λX(t) [f (x (t)) g′ (x (t)) - F′ (x (t)) g (x (t))] - λ0`′ ̀ (x (t)) g (x (t)).


Una trayectoria extrema es cuádruple (x, λ, λ0, u) dónde (x, λ) satisface el estado-
ecuaciones adjuntas y tu la condición hamiltoniana15). Recordamos que un singular
el arco ocurre si φ desaparece en algún intervalo de tiempo [t1, t2] con t1 < t2, y un tiempo de
cambio ts ∈ (0, T) es tal que un control extremo tu es no constante en cualquier vecino
capucha de ts (lo que implica que φ (ts) = 0). También cabe mencionar que a partir de la
Hipótesis (H2), cuandoφ> 0, resp. φ < 0, entonces X está aumentando, resp. decreciente.

Lema 3.1. Bajo hipótesis (H1) - (H2) - (H3), no hay una trayectoria extrema anormal, es
decir, λ0 6 = 0.

Prueba. Si λ0 = 0, entonces λX no puede desaparecer de la ecuación adjunta. De lo contrarioλX


sería cero sobre [0, T] y la función de conmutación sería constante igual a λy.
Ya que λy no puede ser simultáneamente igual a 0, φ sería de signo constante sobre [0, T]
implicando que u = 1 o u = -1 sobre [0, T] y una contradicción con la periodicidad
8 T. BAYEN, A. RAPAPORT Y F.-Z. TANI

de X(·) (recordar que f + g> 0 y F - g < 0 sobre signo I). Como consecuencia, λX es de
constante. Ahora, desdeλ0 = 0, uno tiene

φ̇ (t) = λX(t) g (x (t))2ψ′ (x (t)), t ∈ [0, T].

Deducimos que φ̇ es de signo constante (recuérdese que, en ψ′> 0), por lo tanto φ es monótono.
consecuencia, la trayectoria extrema tiene como máximo un punto de conmutación. Así, uno

tiene x (t)> x̄ fo∈r en cualquier momento t (0, T) lo que implica una contradicción con (4). Six (t) <x̄
para cualquier momento t (0, T), concluimos de la misma manera.

Sin ninguna pérdida de generalidad, podemos suponer que λ0 = -1.

Observación 5. Considerando T -soluciones óptimas periódicas en I sin requerir la


condición inicial X(0) = X, pero sólo x (T) = x (0) proporciona la transversalidad
dición λX(T) = λX(0). Sin embargo, Lemma2.1 un· d La hipótesis (H3) (o simplemente (H̄))
implica que cualquier T -solución óptima periódica X( ) en I tiene que pasar X. Por lo tanto,
podemos imponer X(0) = X sin ninguna pérdida de generalidad, y deducir que λX(·) es
necesariamente T -periódica (aunque no usaremos esta propiedad en lo siguiente).

3.2. Propiedades de los tiempos de conmutación. Denotemos por Xmetro y XMETRO el mínimo
y máximo en [0, T∈] {de un T -una} solución admisible X. Tenga en cuenta que para cualquier momento t ∈
(0, T) tal que x (t) xmetro, XM, entonces uno tiene φ (t) = 0. De hecho, de lo contrario uno
tendría φ (t)> 0 o φ (t) < 0. Supongamos, por ejemplo, que φ (t)> 0. Desde (dieciséis), el
control tu sería igual a 1 en un vecindario de t, y así, a partir de (H2),
tendría una contradicción con el hecho de que XMETRO es el máximo de X. Procedemos de
la misma forma si φ (t) < 0.

Proposición 3.1. Bajo hipótesis (H1) - (H2) - (H3), cualquier extremo satisface las siguientes
propiedades.
1. En cualquier momento de cambio ts ∈ (0, T), uno tiene x (ts) ∈ {Xmetro, XMETRO}.
2. No tiene arco singular.

Prueba. Dejar t1, t2 en [0, T] ser tal que x (t1) = Xmetro y x (t2) = XMETRO con Xmetro, XMETRO en
I. Deducimos que λX(t1)g (xm) = λX(t2)g (xM) = -λy. Ahora, desde H se conserva
a lo largo de cualquier trayectoria extrema (ver por ejemplo [9]), uno tiene

f (xMETRO) fx)( m
H= - `(̀XMETRO) - λy = - `(̀X) - λy g (xmetro)
metro

g (xMETRO)

lo que implica que (recuerde que γ = ψ ◦ `-1)

1 ψ (x)METRO
- ψ (x)
- m= γ (`(̀xMETRO)) - γ (`(̀xmetro))
= , (17)
λy `(̀XM) `(̀Xmetro) `(̀XMETRO) - ' (̀Xmetro)

Como γ está aumentando sobre `(̀I), uno tiene λy> 0. Suponga ahora eso ts es un cambio
tiempo tal que x (ts) ∈ (Xmetro, XMETRO). Usando un cálculo similar al anterior, encontramos
eso
1 ψ (xMETRO) - ψ (x (ts)) γ (̀ (xMETRO)) - γ (`(̀x (ts)))
= = . (18)
λy - s))
`(̀XM) `(̀x (t - s))
`(̀XM) `(̀x (t
Ya que γ y `son respectivamente estrictamente (18)co {nvexuna
implican y} aumentando enlo[Xque
contradicción, por x (tXs)M], (17)
metro, y
∈ Xmetro, XMETRO como se iba a demostrar.
CONTROL PERIÓDICO ÓPTIMO BAJO RESTRICCIÓN INTEGRAL 9

Supongamos ahora por contradicción que existe un intervalo de tiempo [t1, t2] tal que
φ (t) = φ̇ (t) = 0 para t∈[t1, t2]. Combinatorio φ = φ = 0˙ sobre [t1, t2], uno encuentra que
′̀ ′ (x (t)) = 0,
`(x- y(γt)) λ- yψ ∀

⇒ 1λ (̀ (x (t))) = 0, ∀t ∈ [t1, t2],
1 ′ (̀ (x (t))),
⇒ λy
= γ ∀tt ∈ recordar que ψ = γ ◦ `) ̀,
[t1,[tt1,2]t(2],

Ahora, dado que las extremidades del arco singular t1 y t2 deben ser horas de conmutación, uno
debe tener x (t1), x (t2) en Xmetro, XM. Supongamos, por ejemplo, que x (t1) = X . metro

Entonces uno se pone 1 = γ′ (̀ (Xmetro)) que es una contradicción con (17) (ya que γ es estrictamente
λy
convexo) y de manera similar en t = t2. Esto completa la prueba.

En esta etapa, hemos demostrado que las trayectorias óptimas son de bang-bang
escribe (es decir, son conc∈en {enciones de arcos con u = ±1) de manera que en cada momento de
conmutación ts uno tiene x (ts)Xmetro, XMETRO}. Se puede demostrar que el número de conmutaciones
times es finito (haciendo un razonamiento similar al de la exclusión de arcos singulares).
Además, este número es necesariamente par. De hecho, dejaX(·) ser un T -admisible
solución de (1) asociado con un control tu ∈ UT tener 2n + 1 tiempos de conmutación
sobre [0, T] con n> 0. Tenga en cuenta que n = 0 es imposible ya que el mapa t 7 → x (t) - X
tiene que cambiar su signo sobre [0, T]. Por lo tanto, tiene que ser igual al menos una vez
para X en el intervalo (0, T), decir a la vez t̄, satisfacer (4) que invalida n = 0. Finalmente,
observe que el signo de X(0+) y ẋ (T-), con un número impar de conmutadores, son
necesariamente distintos. De ello se deduce que el signo deẋ (T-) y ẋ (T +) también son
distintos. Desde la condición inicialx (t̄) = x̄, los T -solución periódica sobret̄, T + t̄) cambia
entonces a la hora t = T, que pertenece al intervalo (t̄, T + t̄). Ya que x (T) = x̄, tenemos una
contradicción con el punto 1 de la Proposición 3.1. Por tanto, el número de conmutadores
es par.
Nos centramos ahora en trayectorias extremas con dos interruptores.

3.
t→73. xTrayectorias
(t) soluciones
condedos el [0, T] con X(0)
(1) interruptores. = X una
Para dada T>con
y asociado un control tu trayectorias
0, consideramos
de fi nido por dos tiempos de conmutación 1 ∣∣2 t, t con 0 < t1 < t2 < T:

∣∣∣ t ∈ [0, t1),
u (t) = -1,1, t ∈ (19)
1, t ∈ [t[t1,2,tT].
2),

Estas trayectorias, que llamaremos B + B-B + trayectorias, jugará un importante


papel en lo siguiente. Tenga en cuenta que bajo Hipótesis (H1) - (H2) aB + B-B + La
trayectoria se caracteriza únicamente por sus valores máximos y mínimos. XM = x (t1) y Xm =
x (t2) en I. Por conveniencia, de fi nimos en el intervalo I la función

1 1
η (x): = - .
f (x) + g (x) f (x) g-(x)

De la hipótesis (H2), tenga en cuenta que η es C1 y función positiva en I.

Lema 3.2. Bajo hipótesis (H1) - (H2), si un B + B-B + la trayectoria es T-periódico,


luego el parXmetro, XMETRO) satisface
∫ XMETRO
η (x) Dx = T. (20)
Xmetro
10 T. BAYE∫N, A. RAPAPORT Y F.-Z. TANI

Además, si el control correspondiente satisface (2) luego el parXmetro, XMETRO) satisface


XMETRO

η (x) ψ (x) Dx = ūT. (21)


Xmetro

Prueba. Para t ∈ [0, t1∫) ∪ [t2, T), uno tiene ẋ = f (x) +∫g (x)> 0 y uno puede escribir

x (T)
XMETRO
DX DX
t1 = , T - t2 = .
X f (x) + g (x) Xmetro
f (x) + g (x)
Similarmente para t ∈ [t1, t2), uno tiene ẋ = f∫ (X) - g (x) < 0 y
XMETRO
DX
t2 - t1 = - .
Xmetro
f (x) - g (x)∫ XMETRO
Uno luego obtiene∫En s
x (T ) ∫ XMETRO
DX DX DX
T= - + ,
X metro
f (x) + g (x) Xmetro
F (x) g- (x) X f (x) + g (x )
y fo∫real academia de bellas artes T -solución periódica, x (T) = x̄ da exactamente la propiedad (20). Proceder
con la misma deco∫ mposition del int mi∫rval [0, T], uno puede w
T ∫rito
X
XMETRO
DX Xmetro
DX DX
Utah) Dt = - + ,
0 X f (x) + g (x) XMETRO
f (x) - g (x) X metro
f (x) + g (x)
que da el qua∫lity
X ( )
METRO
1 1
+ Dx = Utah,
Xmetro
f (x) + g (x) f (x) g-(x)
cuando tu cumple2). Finalmente, observe que uno tiene
1 1
+ = η (x) ψ (x),
f (x) + g (x) f (x) g-(x)
por X ∈ I, y por lo tanto propiedad (21) está satisfecho.

Primero analizamos las posibilidades de satisfacer la condición integral (20).

Lema 3.3. Bajo hipo∫tesisH1) - (H2), para cualquier T> 0 existe un único
función βT: [a, b] 7 → [a, b] eso satisface βT (α)> α para cualquier α ∈ I y
βT (α)
η (x) Dx = T, α ∈ I.
α

es más βT es de clase C1, creciente y biyectiva de [a, b] para [a, b].

Prueba. La función f + g es de clase C1 y positivo en I con (f + g) (b) = 0. Por lo tanto,


Es fácil ver eso K +: = -minX∈ [a, b] (f + g)′ (x)> 0. De ello se deduce que se tiene la desigualdad (
f + g) (x) ≤ K + (b - X) para cualquier X ∈ I. Como la función η satisface
1 1
η (x)> ≥ > 0, X ∈ I,
f (x) + g (x) K + (b - X)
se deduce que el mapa
∫ ξ+
χ: (ξ-, ξ +) 7 → χ (ξ-, ξ +): = η (x) DX,
ξ-

es tal que para cualquier α ∈ Yo, χ (α, ·) es de clase C1, aumentando con χ (α, α) = 0 y χ (α,
b) = +∞. Según el teorema de la función implícita, existe un mapa único
CONTROL PERIÓDICO ÓPTIMO BAJO RESTRICCIÓN INTEGRAL 11

βT: I 7 → I de clase C1, tal que tiene χ (α, βT (α)) = T para cualquier α ∈ I. Es más, uno

η (α)
βT′ (α) = > 0, α ∈ I.
η (βT (α))
La función βT está aumentando, y luego admite límites en los puntos a + y B-.
Por lo tanto uno tiene βT (a +): = limα→a + βT (α) ≥ a y βT (B-): = limα→B- βT (α) ≤B
que verifican χ (a, βT (a +)) = T y χ (b, βT (B-)) = T, ya que χ es continuo. Como
previamente, F - g < 0 en I con (F - g) (a) = 0 implica que K-: = -minX∈ [a, b] (F -
gramo)′ (x)> 0. De ello se deduce que (F - g) (x) ≥ K- (a - X) para cualquier X ∈ I. Por lo tanto, deducimos
ese
1 1
η (x)> - ≥ > 0, X ∈ I.
f (x) g-(x) K- (xa) -
Si βT (a +)> a, entonces uno debería tener χ (a, βT (a +)) = +∞ que no es posible ya que uno
tiene χ (α, βT (α)) = T para cualquier α ∈ I. Entonces, uno tiene βT (a +) = a. Como la función
η es positivo en I, uno tambien tiene βT (α)> α para cualquier α ∈ I, y deducimos
ese βT (B-) = B. Esto prueba que βT se puede extender a un mapeo uno a uno desde [a, b]
para [a, b].

Ahora estamos listos para demostrar que existe un único B + B-B + trayectoria que
satisface ambas condiciones integrales (20) y (21).

Proposición 3.2. Bajo hipótesis (H1) - (H2) - (H̄), existe un par único
(Xmetro, XMETRO) ∈ I2 satisfactorio20) - (21), y uno tiene Xm < x̄ <xMETRO.

Prueba. De Lemma 3.3, condición20) implica tener XM = βT (Xmetro). Por lo tanto, simplemente
tenemos que mostrar la singularidad de Xmetro para la condición21) para ser cumplido.
Considere la función F: [a, b] → R definido por
∫ βT (α)
F (α): = η (x) (ψ (x) - ψ (x̄)) DX, (22)
α

y observe que las condiciones (20) y (21) están ambos satisfechos exactamente cuando F (xm) = 0.
De la hipótesis (H̄) y las propiedades satisfechas por la función βT (ver lema
3.3), uno tiene F (α)> 0 para cualquier α ∈ [x̄, b), y F (α) < 0 para cualquier α ∈ (a, β-1 T (X)].
Según el teorema del valor medio, existe Xmetro ∈ (β-1 T (x̄), x̄) tal que F (xm) = 0.
Además, uno tiene
F ′ (α) = η (βT (α)) (ψ (βT (α)) - ψ (x̄)) β′ T (α) - η (α) (ψ (α)) - ψ (x̄)).
Como βT está aumentando y ψ satisface (H̄), obtenemos F ′ (α)> 0 para cualquier α <x̄ con
βT (α)> x̄, eso es exactamente para α ∈ (β-1 T (x̄), x̄), y concluimos sobre la existencia
y singularidad de Xmetro, XMETRO en I, con Xm < X y XM> X.

Observación 6. La existencia y unicidad de un T-admisible B + B-B + trayectoria es una


consecuencia directa de Lemma 3.2 y propuesta 3.2. De hecho, bajo
Hipótesis (H1) - (H2) - (H̄), Proposición 3.2 permite definir unívocamente un par (Xmetro, XMETRO)
satisfactorio20) - (21). Considere ahora una soluciónX(·) de (1) tal que X(0) = X cuales
es tal que u = 1 hasta X(·) alcanza XMETRO, decir a la vez t1 y luego u = -1 de t1
hasta la primera vez t2> t1 tal que x (t2) = Xmetro, y finalmente u = 1 hasta X(·) alcanza
X. Para cualquier T> 0, esta construcción de fi ne un único B + B-B + trayectoria que es
T -admisible, gracias a (20) - (21).

También vale la pena mencionar que Xmetro y XMETRO depende del período T. En el siguiente Lema,
proporcionamos propiedades de Xmetro y XMETRO como funciones de T.
12 T. BAYEN, A. RAPAPORT Y F.-Z. TANI

Lema 3.4. Bajo hipótesis (H1) - (H2) - (H̄), Las funciones T 7 → Xmetro(T) y T 7 →
XMETRO(T) son continuamente diferenciables, y respectivamente decreciente y creciente.
además, uno tiene
lim∞Xmetro(T) = a y→ lim∞XMETRO(T) = b. (23)
T +→ T+

Prueba. Para cada T> 0, sabemos de Proposición 3.2 que existe un único
par (Xmetro(T), xMETRO(T)) yo∈
2 satisfactorio20) - (21). Según el teorema de la función implícita,

Xmetro y XMETRO son continuamente diferenciables wrt T. Denotemos por X ′, metro

X METRO
′ los derivados de Xmetro y XMETRO wrt T. Diferenciar (20) - (21) wrt T luego
ceder ds
        
η (xMETRO(T)) -η (xmetro(T)) X ′ (T)   1 METRO

     =     ,

η (xMETRO(T)) ψ (xMETRO (T)) )) XmT) ψ(X)
︸ ︷
︷-η (xmetro(T)) ψ (x ︸
metro(TXT)

′ (T),
donde detX (T )): = η (xMETRO(T)) η (xmetro(T)) (ψ (xMETRO (T)) - ψ (xmetro(T)))> 0. Entonces X METRO
X m′ T) se dan  n por las expresiones

   η (x (T)) (ψ (x̄) - ψ (x (T)))


X ′ (T) = > 0,
metro metro

  METRO

detX (T))
   η (x (T)) (ψ (x̄) - ψ (x (T)))
  X m′ T) =
METRO METRO

< 0.
detX (T))
Desde (20) y (21), una H∫como
XMETRO(T) ∫ XMETRO(T)
T DX DX
(ū + 1) = < .
2 x (T) f
metro (x) + g (x) a f (x) + g (x)
Tomando el límite cuando T tiende a +∞ en ambos lados de esta desigualdad, se obtiene
limT→ + ∞ XMETRO(T) = b. Del mismo modo, se puede probar que limT→ + ∞ Xmetro(T) = a.

3.4. Soluciones óptimas. Según la propuesta 3.2, para cualquier T> 0, tenemos
visto que hay un único B + B-B + trayectoria XT (·) eso es T -admisible, generado por un
control que denotaremos ûT. Además, existe un único t̄ ∈ (0, T)
tal· ese XT (t̄) = x̄. Por lo tanto, hay exactamente dos T -soluciones admisibles XT (·),
XT () con dos interruptores, dado por ûT y ǔT con
ǔT (t): = ûT (t + t̄), t ≥ 0,
que tienen el mismo costo. De manera similar, denotamos porB-B + B- la trayectoria XT.
Ahora estudiamos la monotonicidad del costo. JT (ûT) con respecto a T. Esta propiedad es
crucial para la síntesis óptima (Teorema 3.6) y se basa en la convexidad
suposiciones sobre los datos.

Lema 3.5. Bajo hipótesis (H1) - (H2) - (H3), uno tiene


S> T> 0 ⇒ JS(ûS) < JT (ûT).

Prueba. Siguiente (19), denotamos por t1 a∪Dakota del Norte t2 los dos tienen éxito-instantes sivos de (0, T)
por cual uno tiene ûT = +1 sobre [0, t1) [t2, T] y ûT = 1 sobre [t1, t2). En el
de la misma manera, de fi nemos s∪1, s2 como los dos su instantes sucesivos de (0, S) tal que uno tiene
ûS = +1 sobre [0, s1) [s2, T] y ûS = -1 sobre [s1, s2). Denotemos también por x, y
las soluciones de (1) correspondiente a ûT y ûS respectivamente y establecer XM: = x (t1),
Xm: = x (t2), yM: = y (s1), ym: = y (s2).
CONTROL PERIÓDICO ÓPTIMO BAJO RESTRICCIÓN INTEGRAL 13

De Lemma 3.4, uno tiene XM < yMETRO, Xm> ymetro, t1 < s1, y t2 < s2. Entonces, presentamos un
mi definido por
E: = {s ∈ [0, S] ; y (s)> xMETRO o y (s) <xmetro},
junto con una función ϕ:  [0, T] → [0, S] \ E por
 
  t si t ∈ [0, t1),
ϕ (t): =   t + δ1 si t ∈ [t1, t2),
 
t + δ1 + δ2 si t ∈ [t2, T],
dónde δ1, resp. δ2 es el tiempo pasado por y sobre X, resp. debajoX. Son dadas por
δ1: = medir ({s ∈ [0, S] ; y (s)> xMETRO}), δ2: = medir ({s ∈ [0, S] ; y (s) <xmetro}).
Por construcción uno tiene x (t) = y (ϕ (t)), por t ∈ [0, T] y ϕ es biyectivo, por lo tanto
medirE) = S - T. Además, para cualquier función monótona ρ: yo → R uno tiene
∫ T ∫T ∫
ρ (x (t)) Dt = ρ (y (ϕ (t))) Dt = ρ (y (s)) Ds,
0 0 [0,S] \ E

considerando el chang∫mi de variable s =∫ϕ (t). Entonces obtenemos


T
`(̀X (t)) Dt = `(̀y (s)) Ds, (24)
0 [0,S] \ E

y ∫T ∫
γ (̀ (x (t))) Dt = γ (̀ (y (s))) Ds.
0 [0,S] \ E

Como ambos controles ûT y ûS satisfacer la restricción (4), uno tiene


∫ T ∫S
1 1
γ (`(̀x (t)))∫Dt = γ (̀ (y (s))) Ds = ū,
T 0 S 0

lo que implica
1
γ (̀ (y (s))) Ds = ū. (25)
S T- mi
Vamos a no∣∣∣∣lo consideramos Una función γ̂: [̀ (ym), `(̀yMETRO)] → R definido por

γ (̀ (X )) - γ (`(̀x))
(ξ - `(̀Xmetro)) por ξ ∈ [`(̀Xm), `(̀XMETRO )],
METRO metro

`(̀X) - `(̀X)
metro

γ̂ (ξ): = METRO metro

∣∣ γ (̀ (x)) +
γ (ξ) de lo contrario,

(ver Fig. 1). Primero, tenga en cuenta queγ̂ es convexo creciente y satisface

γ̂ (ξ)> γ (ξ) por ξ ∈ (`(̀Xm), `(̀XMETRO)). (26)


Como uno tiene γ = γ̂ en [`(̀ym), `(̀yMETRO)]∫ \ [`(̀Xm), `(̀XMETRO)], también tenemos, gracias a (25),
1
γ̂ (̀ (y (s))) Ds = ū.
S T- mi
Por la desigualdad de Jensen, obtenemos∫

1
`(̀Y (s)) Ds ≤ γ̂-1 (ū). (27)
S T- mi

Ahora, desde γ̂∫es un ffi ne sobre (Xmetro)∫, `(̀XMETRO)], Se obtiene ∫


( )
T T T
1 1 1
γ̂ `(̀X (t)) Dt = γ̂ (`(̀x (t))) Dt> γ (`(̀x (t))) Dt = ū,
T 0 T 0 T0
14 T. BAYEN, A. RAPAPORT Y F.-Z. TANI

γ̂̂
γ

`(̀Xmetro) `(̀XMETRO)

Figura 1. Funciones γ = ψ ◦ `-1 y γ̂ definido anteriormente.

usando el hecho de que x (t) ∈ [Xmetro, ∫ T por t ∈ [0, T ], (26) y (4). Por lo tanto, uno tiene
XMETRO]

1
`(̀X (t)) Dt> γ̂-1 (ū). (28)
T 0∫

Nos las arreglamos∫24), (27) y (28)


S ∫
1 1 1
`(̀Y (s)) Ds = `(̀Y (s)) Ds + ∫ `(̀Y (s)) Ds
S 0 S mi S [0,S] \ E
T
S - T -1 (ū) 1
≤ γ̂ + `(̀X (t)) Dt
S S 0
∫T ∫T
S- 1 T1
< `(̀X (t)) Dt + `(̀X (t)) Dt
S T 0 ST 0
∫ TT
1
= `(̀X (t)) Dt,
T 0
que concluye la prueba.

Ahora damos nuestro resultado principal.

Teorema 3.6. Suponga que las hipótesis (H1) - (H2) - (H3) se cumplen. Entonces, para
cualquierT> 0, hay dos soluciones óptimas de (13) dado por los controles ûT y ǔT.

Prueba. Dado que (H3) implica (H̄), la proposición 3.2 da la singularidad de un T -admisible
B + B-B + trayectoria (ver Observación 6), lo que equivale a afirmar que hay exactamente
dos extremos con dos interruptores (correspondientes a n = 1), dado por los controles
ûT (·) y ǔT (·). Recuerde que tienen el mismo costo porque ǔT (·) es obtenido por un
traducción de tiempo de ûT (·).
Ahora, propuesta 3.1 muestra que una trayectoria óptima consiste en 2n (con norte ≥ 1)
interruptores, que ocurren exactamente en los valores máximo y mínimo. Se debería notar
que cualquier trayectoria con 2norte interruptoresnorte ≥ 1) es T n -periódico. Por construcción,
un extremal tiene que cruzar X después de sus dos primeros cambios, digamos en t̄> 0. Desde t = t̄, el
control alterna los mismos valores +1 y -1 y los puntos de conmutación ocurren exactamente
los mismos valores de X(·), a saber XMETRO y Xmetro. Por lo tanto, usando el teorema de Cauchy-
Lipschitz, se obtiene x (t) = x (t + t̄) para cualquier t ∈ [0, t̄] y sucesivamente en los intervalos
[t̄, 2t̄], · · ·, [(norte-1)t̄, nt̄]. Por lo tanto X(·) es t̄-periódico con x (nt̄) = x (T) = x̄, por lo tanto t̄ = T / n.
Deducimos que un extremo con 2norte interruptores es Tennesse-periódico. Para concluir,
CONTROL PERIÓDICO ÓPTIMO BAJO RESTRICCIÓN INTEGRAL 15

supongamos que una trayectoria óptima tiene 2norte conmuta con n> 1. Su costo es entonces igual
para J (ûTennesse). Aplicando Lema 3,5 con T y Tennesse da J (ûT) < J (ûTennesse), lo que demuestra
que la solución óptima se logra para n = 1 (es decir, con dos interruptores).

Una consecuencia interesante de Lemma 3,5 es la propiedad de monotonicidad de la


función de costo evaluada en la solución óptima en función de T.

Corolario 3.1. El criterio óptimo T 7 → JT (ûT) está disminuyendo wrt T.

4. Relajar las suposiciones sobre el exceso de rendimiento local. Las secciones anteriores
han mostrado el papel crucial que juega la propiedad de monotonicidad de la función
ψ y la convexidad de la función γ en el intervalo I (ver Hipótesis (H̄) y (H3)). En la presente
sección, consideramos situaciones para las cuales estas condiciones no se cumplen en
todo el intervalo.I pero solo en un barrio de X. Normalmente, podrían existir otros valores
de X satisfactorio ψ (x̄) = ū (Por tanto, la hipótesis (H̄) no se cumple en I) o γ podría ser sólo
localmente convexa en un vecindario de X (Por tanto, la hipótesis (H3) no se cumple en I).
La idea es entonces restringir los valores del período
T para caracterizar las soluciones óptimas (periódicas) que quedan en un vecindario de X
(y presentando exceso de rendimiento). Por lo tanto, esperamos no tener un rendimiento
excesivo sistemático (ver observación7 y el ejemplo 5.2.2 como ilustración).

Primero revisamos la propuesta 3.2 como sigue.

Proposición 4.1. Suponga que las hipótesis (H1) - (H2) se cumplen con ψ′ (x̄)> 0.
Entonces hay e existe Tmax> 0 tal que para cualquier T ∈ (0, Tmáx.), existe un único
(Xmetro, XMETRO) ∈ I2 que verifican20) y (21) con

(ψ (x) - ψ (x̄)) (x - x̄)> 0, ∀X ∈ [Xmetro, XM] \ {X}. (29)

Prueba. Considere un subintervalo J: = (ã, ˜B) ⊂ I con ã <x̄ < ˜B tal que la propiedad
(ψ (x) - ψ (x̄)) (x - x̄)> 0, ∀X ∈ J \ {x̄}. (30)
se cumple (como ψ′ es estrictamente positivo en X, lo sabemos tal intervalo existe). Dejar [a,
entonces consideremos el fu∣∣ ncion F definido en el intervalo b] por
∣∣∣∣∣ f (x)
si X ∈ J
( )
1
g (x) (X - a) - 1) si X ∈ [a, ã],
f˜(x): = ∣∣ -g∣∣∣∣ (x)
- ãa
-
(ψ (ã) +
1 - ψ (˜B) -
(bx) + 1 si X ∈ [˜b̃, b].
B -˜B

Claramente, la pareja (f̃, g) satisface las hipótesis (H1) - (H2) - (H̄). La funciónF no es
C1 pero Lipschitz continua, pero se puede comprobar fácilmente que Lemma 3.3, Propuesta
3.2 y Lemma 3.4 siguen siendo válidos con F simplemente Lipschitz continuo. Esto le da al
existencia y unicidad de Xmetro y XMETRO que verifican20) y (21) para la pareja (f̃, g)
y cualquier T> 0. Como T 7 → Xmetro(T) y T 7 → XMETRO(T) son respectivamente decrecientes y
crecientes wrt T (recordar Lemma 3.4), existe T̃> 0 tal que Xmetro(T̃) = ã o
XMETRO(T˜) = ˜B. Como F coincide con F en [a, ˜B], concluimos que Xmetro, XMETRO son los números
únicos que verifican (20) y (21) sobre [a, ˜B] para la parejaf, g) y cualquier T ≤ T̃. Esto se puede
hacer para cualquier subintervalo. J que verifica la condición30). Entonces consideramos
Tmax como el supremo de T̃ para todos esos subintervalos J.
dieciséis T. BAYEN, A. RAPAPORT Y F.-Z. TANI

Dado T <Tmax, uno puede preguntarse si es suficiente para requerir que la Hipótesis (H3) se
cumpla en [Xmetro, XM] (en lugar de I) para obtener la optimalidad de los controles ûT,
ǔT como en el teorema 3.6. Sin embargo, podrían existir trayectorias extremas tomando
valores fuera del intervalo [Xmetro, XMETRO], sin requerir suposiciones adicionales sobre la
función ψ fuera de este conjunto.
Para esto ∈propósito, consideramos el∈tw∣∣∣o controles tu- y u + de fi nido por un tiempo de
conmutación(0,t- T) (por tu-) y t + (∣0, T) (por u +) como

-1, t ∈ [0, t-),


u -(t) =
t ∈ [t-, T],
∣∣∣∣ 1,
t ∈ [0, t +),
u + (t) =
-1,1, t ∈ [t +, T],
tal que las trayectorias correspondientes X(·, tu-, X) y X(·, u +, x̄) están T -periódico
-
(ver Fig. 2). Entonces definamosXT ∈ R, x + T ∈ R como

x T+

X t+
t-

X-T
0
T

Figura 2. T -por{ -: = xsoluciones


(t +, u +, x̄)iodicas
, X(·, tu-, X) y X(·, u +, x̄).

XT
(31)
x T+ : = x (t, -u +, x̄).
Se puede comprobar que en Hipótesis (H1) - (H2), cualquier T -solución periódica X(·) de
(1) con X(0) = X y control tu tomando valores en [-1, 1] verificaciones

x (t) ∈ [XT,-x + T], ∀t ∈ [0, T]. (32)


De hecho, al comparar soluciones de EDO escalares sobre [0, t +], Se obtiene (ya que
u + (t) = 1 en [0, t +] y f + ug ≤ f + g, u ∈ [-1, 1]):
x (t) ≤ x (t, u +, x̄), ∀t ∈ [0, t +].
Además, durante el intervalo de tiempo [t +, T], el mismo razonamiento para los rendimientos
de la dinámica hacia atrás (ya que u + (t) = -1 en [t +, T] y - (f + ug) ≤ - (F-Gu ∈ [-1, 1]):

x (t) ≤ x (t, u +, x + T), ∀t ∈ [t +, T].


Resulta que
x (t) ≤ x (t, u +, x̄), ∀t ∈ [0, T].
Por una argumentación similar con el control tu- en lugar de u +, uno concluye que
x (t, u-, X) ≤ x (t) ≤ x (t, u +, x̄), ∀t ∈ [0, T],
CONTROL PERIÓDICO ÓPTIMO BAJO RESTRICCIÓN INTEGRAL 17

que completa la prueba de propiedad (32). También se puede observar que uno tiene

X-T < x̄ <x +


T y (X- T, x +T) → (x̄, x̄) cuando T → 0.
+
Damos ahora un resultado que requiere la condición (29) que se cumplirá el [X-, XT T ],
lo que garantiza que cualquier solución óptima está en el intervalo [Xmetro, XMETRO].
′ (x̄)> 0.
Proposición 4.2. Suponga que las hipótesis (H1) - (H2) se cumplen con ψ
Llevar T ∈ (0, Tmáx.) tal que
(ψ (x) - ψ (x̄)) (x - x̄)> 0, ∀X ∈ [X- T, x +T] \ {X} (33)
dónde X-, Tx + están
T de fi nidos en (31). Entonces el re existe único x, x metro METRO
en [X-T , x +]
T
satisfactorio20) y (21). Si ψ está aumentando en [Xmetro, XMETRO], entonces cualquiera T-admisible
solución X( )· verifica
x̂: = ∈ max x (t) ≤ XMETRO y x̌: = ∈min x (t) ≥ Xmetro.
t [0,T] t [0,T]

Prueba. Reparar T ∈ (0, Tmáx.) que cumple la condición33). Tenga en cuenta que esto es posible ya que
+
ψ está aumentando en un barrio de X y (X- T, XT) → (x̄, x̄) cuando T → 0.
Según la propuesta 4.1, existe unico Xmetro, XMETRO que verifican20) y
(21). Dado que existe unT -trayectoria admisible tomando los valores Xmetro y XMETRO, uno
tiene necesariamente

X-T< x <x̄ <x <


metro METRO
XT.+ (34)
Considere ahora cualquier T -solución admisible X. De la propiedad (32), uno tiene X ≤ x + T
y X ≥ X- T. Además, a partir de la condición (33) y Lema 2.1, uno tiene x̂> x̄> x̌. Dejar
t̂ ∈]0, T [ ser tal que x (t̂) = x̂ y supongamos que uno tiene x̂> xMETRO. Podemos suponer, sin
pérdida de generalidad, que x (t) ≥ X está satisfecho con cualquier t ∈ [0, t̂] (si no, considera
t0: = sorber{t <t̂; x (t∫) < X } y reemplazar X( ·) por x (+· t)). 0Dejar (A, B) ∈ R∗+×R∗ ser+
definido por
X ∫ X
DX DX
A: = y B: = - .
Xf (x) + g (x) Xf (x) - g (x)
Se puede observar que A y B son los tiempos más rápidos para una solución de (1) alcanzar,
respectivamente, X desde X- (con el control constante u = 1) y X desde X (con el
control constante u = 1). Cl∣temprano, uno tiene t̂ ≥ A y T - t̂> B.
Construimos ahora un T -solución periódica X de (1) tal que X(0) = X y asociado
con un control ũ definido de la siguiente manera

∣∣ ū si t ∈ [0, t̂ -A ∈ [t̂ -A[∪ [t†,


ũ (t) = ∣∣∣ 1 si T], (35)
-1 si ∫ t ∈ [t̂, t† [,

dónde t† es dado por


X
DX
t †= T - ,
X† f (x) + g (x)
y X† es una solución de κ∫ (X†) = T - t̂, los metro

X X κ (·) siendo de fi nido por


∫ ap
DX DX
κ (ξ): = - , ξ ∈ I.
ξf (x) + g (x) ξf (x) - g (x)
Por Hipótesis (H2), la función κ es decr∫ XMETRO aliviando y uno tiene
∫X
κ (xm) = η (x) DX -A> η (x) DX - t̂ = T - t̂,
Xmetro Xmetro
18 T. BAYEN, A. RAPAPORT Y F.-Z. TANI

y κ (x̄) = B <T-t̂. Por lo tanto X∫† se define de forma única con X† ∈ (Xmetro, X). Es más,
uno tiene
X
DX
t† = t̂ -
∈]t̂, T [.
-
(x) g (x) X† f
Expresión (35) está bien definido. La soluciónX se muestra en la Fig. 3.

ũ=1

ũ=ū t† T
X t
t̂ - α t̂
ũ = -1 ũ=1

X†

Figura 3. La solución X en línea gruesa, X en línea delgada.

Claramente X alcanza X en el momento t̂ y está debajo de la función X en el intervalo [0, t̂].


En el intervalo [t̂, t†], X tiene el descenso más rápido y, por lo tanto, se mantiene también por debajo X en este
intervalo. En el momentot = t†, uno tiene x̃ (t†) = X†. Finalmente, el control constante u = 1 es el único que
permite conectar X† en el momento t† para X en el momento T. Entonces, cualquier solución periódica debe
estar por encima de X en [t†, T]. Concluimos que uno tiene x (t) ≥ x̃ (t) para cualquier
t ∈ [0, T]. Como ψ (x)> ψ (x̄) por X ∈ [XMETRO, X] y ψ está aumentando en [Xmetro, XMETRO], y como
hemos demostrado que x (t)> xmetro para cualquier∫t ∈ [0, T], uno puede escribir
∫ T
(ψ (x (t)) - ψ (x̄)) Dt > (ψ (x (t)) - ψ (x̄)) Dt
0 }
∫ {t∈ [0,T] | x (t)≤XMETRO
≥ (ψ (x̃ (t)) - ψ (x̄)) Dt
∫ {t∈
X
[0,T] | x (t)≤XMETRO}
METRO

= (ψ (x) - ψ (x̄)) η (x) DX.


X†

Para concluir,∫ya que uno tiene X†> Xmetro un∫D η> 0 en I, Se obtiene
T XMETRO

(ψ (x (t)) - ψ (x̄)) Dt > (ψ (x) - ψ (x̄)) η (x) Dx = 0,


0 Xmetro

que no es posible según Lemma 2.1. Luego concluimos que la desigualdad


X ≤ XMETRO está satisfecho. De manera similar, se puede probar la otra desigualdad
X ≥ Xmetro.

Por periodos T> 0 que cumpla con las condiciones de la Proposición 4.2, sabemos que op-
las soluciones temporales permanecen en el conjunto [Xmetro, XMETRO]. Entonces obtenemos la misma conclusión
como teorema 3.6 cuando se cumple la Hipótesis (H3) en el intervalo [Xmetro, XMETRO] solamente, como
se establece en el siguiente teorema.
CONTROL PERIÓDICO ÓPTIMO BAJO RESTRICCIÓN INTEGRAL 19

Teorema 4.1. Suponga que las hipótesis (H1) - (H2) se cumplen y consideran T > 0
tal que
I) (ψ (x)-ψ (x̄)) (x- x̄)> 0 para cualquier X ∈ [X-, T x T+] \ {x̄}, dónde X-, T x T+ son de fi ned
en (31),
ii) `está aumentando en [Xmetro, XMETRO] y γ = ψ ◦ `-1 es estrictamente convexo aumentando en
[̀ (Xm), `(̀XMETRO)], dónde Xmetro y XMETRO son dadas por Proposición 4.1.
Entonces, hay dos soluciones óptimas de (13), dado por los controles ûT y ǔT.
Prueba. Primero, el supuesto ii) implica que ψ está aumentando en el intervalo [Xmetro, XMETRO].
Gracias a i), sabemos por Proposición 4.2 que cualquier extremal es tal que X acepta
valores dentro del intervalo [Xmetro, XMETRO]. Con el supuesto ii) en lugar de la hipótesis (H3), el
lector puede comprobar fácilmente que los argumentos del teorema 3.6 aplicar en el
de la misma manera en [Xmetro, XM] (en lugar de todo el intervalo I), para demostrar que solo los
extremos X y X son óptimos.

Observación 7. Cuando las hipótesis (H1) - (H2) - (H3) no se satisfacen todas (lo que se considera en
esta sección), no se puede garantizar un rendimiento excesivo para ningún valor de T como en la
sección anterior. Sin embargo, el teorema 4.1 proporciona soluciones periódicas óptimas que
presentan un rendimiento excesivo.

5. Estrategias periódicas versus constantes en un solo modelo poblacional. Consideramos


una población explotada de un recurso renovable (peces, bosque ...) representada por su
densidad x (t) que sigue una dinámica
ẋ = f0 (X) -E (t) x, (36)
donde la función de crecimiento F0: R + → R es de clase C1 y satisface F0 (0) = 0. El esfuerzo
de cosecha MI, que se considera un control medible, toma valores
dentro de un intervalo [0, mimax] (con mimax> 0). Tales modelos se han estudiado extensamente
en la literatura bioeconómica (ver, por ejemplo, [10] y las referencias citadas
Aquí en). Normalmente un estado estable óptimoX asociado con un control constante MI
se determina como maximizar un beneficio bioeconómico de la cosecha en un horizonte
infinito descontado. Sin embargo, no siempre es posible o deseable aplicar el valor teórico
MI del esfuerzo de cosecha de forma constante (por leyes laborales, estacionalidad ...),
pero su valor medio suele estar garantizado en un período T. En este contexto, nuestro
objetivo es estudiar los impactos sobre el stock de aplicar un esfuerzo de
aprovechamiento periódico en lugar de uno constante. Estudiamos las condiciones de la
función de crecimiento para que el esfuerzo de cosecha periódico tenga o no impacto
negativo. En el caso de impacto negativo, consideramos los peores escenarios para
estimar la pérdida máxima que podría esperarse. Hay varias formas de medir los
impactos en una población, en términos de una función `(̀X) que mide el bienestar de la
acción o su utilidadcomo actividades recreativas). En el caso más simple, `(̀X) es igual a
la densidad del stock X pero de manera más general se puede considerar que `: R + → R es un C1
función creciente cóncava.
Dado un control constante MI ∈ (0, mimáx.), luego consideramos una constante asociada
estado X de (36) tal que
(37)
dónde h: R + → R es la funcion ∣∣∣ h (x̄) =definido
Ē, como
F0 (X)
∣∣∣∣ si x> 0,
h (x): = X
F′0 (X) si x = 0.
20 T. BAYEN, A. RAPAPORT Y F.-Z. TANI

Tenga en cuenta que la ecuación (37) puede tener varias soluciones. Consideramos uno de ellos que
conduce a un equilibrio estable (se puede comprobar fácilmente que esto equivale a tener
Ē> f′ 0(X)). Nuestro objetivo es estudiar si la av∫criterio de edad
T
1
JT (E): = `(̀X (t)) Dt, (38)
T 0

se puede mejorar considerando T -∫entradas periódicas MI(·) satisfactorio


T
1
E (t) Dt = Ē, (39)
T 0

y T -soluciones periódicas de (36) asociado con MI(·) con

X(0) = x (T) = x̄. (40)


Para utilizar la configuración anterior, consideramos el siguiente cambio de variables:
2EEE max X ; g (x) max X,
u: = 1 - ; f (x): = f0 (X) - :=
mimax 2 2
y la función ψ se convierte en
2
ψ (x) = -f (x) =1- h (x).
g (x) mimax
Tan, (36) tiene exactamente la forma (1) con tu ∈ [-1, 1]. Dejarū ∈ (-1, 1) sea el control
constante asociado con MI tal que ū = ψ (x̄). Ahora estudiamos los efectos de T -
Entradas periódicas para dos funciones de crecimiento. F0: la función logística clásica, y la
modificado uno con un término de compensación (que resaltará la Sección 4).

5.1. El crecimiento logístico. Recordamos la expresión clásica de este modelo.

F0 (x): = rx 1 - X ,
K
dónde r> 0 y K> 0. Se puede comprobar fácilmente que existe un equilibrio positivo
X de (36) satisfactorio37) Tan pronto como Ē <r. Es más, X es un equilibrio estable (ver
[10]). Suponemos de ahora en adelante que uno tiene)Ē <r. Ya que uno tiene
( r ( X)
(F - g) (x) = xr -mimax - X ; (f + g) (x) = rx 1 - ,
K K
Las hipótesis (H1) - (H2) son satisfactorias∣ed para el intervalo Yo: = (λ (E max ) , K) dónde
∣∣∣∣ h-1 (mi0máx.) si mimax> r,
λ (Emax) =
si mimax < r.
2r
Nota ese ψ es una función a ffi ne: ψ (x) = c1X + C0con c = 10- mimax
, C1 =
2r
KE
. Cuando `es estrictamente cóncava, la functio norte γ = ψ ◦ `-1 es estrictamente convexo
max

(y aumentando). Por tanto, se satisface la hipótesis (H3). Según la propuesta2.1,


hay un rendimiento excesivo sistemático T> 0, es decir, el criterio promedio JT
siempre está debajo de `(̀X). Su valor más bajo está dado por las dos estrategias B + B-B + o
B-B + B- (ver teorema 3.6). Tenga en cuenta que cuando `(̀x) = x, la función γ es un ffi ne y
en consecuencia, el criterio JT es siempre igual a X, es decir, el promedio de la acción es
siempre igual a X.
Ahora ilustramos el exceso de rendimiento con la función
4X
`(̀X): = ,
1+X
CONTROL PERIÓDICO ÓPTIMO BAJO RESTRICCIÓN INTEGRAL 21

que es cóncavo creciente. Se han realizado simulaciones numéricas con = 7, x̄ = los


parámetros valores r = 3, K 3,5, mimax = 2,5 y Ē = 1.5. Resultados están

representado en Higo. 4.

ℓ (x̄) XMETRO(T)

Xmetro(T)

λ (Emáx.)
0 1 2 3 4 5 6 7 8 9 10 2 4 6 8 10
T T

Figura 4. Óptimo criterio JT (ûT) (izquierda) y Xmetro, XM (derecha) como


funciones del periodo T para el crecimiento logístico.

5.2. La logística con compensación. Se sabe que algunas poblaciones presentan una
indemnización en la primera parte de su crecimiento (función [10], que también se llama
débil efecto Allee. Esto está representado por la siguiente modificación de la logística
función ) X
F0 (x): = rxα 1- ,
K
con α> 2. Para esta función, uno tiene
( X)
h (x) = rxα-1 1- ,
K
que aumenta en [0, ¿X?) y disminuyendo en (x?, K] con
α-1
¿X? : = K,
α
(ver Fig. 5). En presencia de compensación en el modelo, también se puede comprobar
fácilmente que la funciónψ es cóncavo decreciente en [0, XC), convexo decreciente en (XC, ¿X?), y
convexo aumentando en (x?, K] con
α-2
x:C= K <x ?,
α
(ver Fig. 5).

mi⋆
0,5

0
0.4

−0,5

0,2

−1

XC XC
0 −1,5
X⋆ K X⋆ K

Figura 5. Gráficos de las funciones hizquierda) y ψ (adecuado para r =


0,3, K = 5, α = 2,5, mimax = 0,5893, ¿MI? =0,6235.
22 T. BAYEN, A. RAPAPORT Y F.-Z. TANI

Consideraremos aquí la función `(̀x) = x (es decir, el criterio es simplemente el nivel del
stock X). Definamos

¿MI? : = h (x?).

Distinguimos ahora dos casos dependiendo de si mimax está por debajo o por encima ¿MI?.

5.2.1. Caso 1: mimax < ¿MI?. Tenga en cuenta primero que hay dos soluciones λ1 (mimáx.) y
λ2 (mimáx.) en el intervalo (0,K) de la ecuación h (x) = Emax tal que λ1 (mimáx.) <
¿X? <λ2 (mimáx.). A continuación, se puede comprobar que se cumplen las hipótesis (H1) - (H2) - (H3)
en el intervalo Yo: = (λ2 (mimáx.),K). Para cualquier MI ∈ (0, mimáx.), También se puede
demostrar, como en el modelo logístico, que existe una solución única. X ∈ I de (37) cual es
además, un estado estable estable de (36) (ver [10]). Proposición2.1 garantiza entonces un
rendimiento excesivo T> 0.
Higo. 6 describe el valor de costo óptimo JT (ûT) para los siguientes valores de parámetro:
r = 0,3, K = 5, a = 2,5, x̄ = 4, Ē = 0.48, y mimax = 0.5893.

4.02

K
X

XMETRO(T)

Xmetro(T)

λ2 (mimáx.)
3,84
0 2 4 6 8 0 1 2 3 4 5 6 7 8 9 10
T T

Figura 6. Criterio óptimo JT (ûT) (izquierda) y Xmetro, XM (derecha) como


funciones del período T para el modelo de compensación (caso 1).

Finalmente, en presencia de compensación en el modelo con un esfuerzo de cosecha máximo


mimax < ¿MI?, Nuestro análisis muestra que las soluciones periódicas provocan una disminución sistemática
del valor medio de la población (en comparación con la cosecha constante).

5.2.2. Caso 2: mimax> ¿MI?. Se puede comprobar fácilmente que las hipótesis (H1) - (H2) se
cumplen en el intervalo (0,K), pero no Hipótesis (H3). Ya queX es un estable estable
estado de la dinámica, el punto X pertenece al intervalox?, K) (ver [10]). Tenga en cuenta
también queψ está aumentando en un barrio de X. Proposición 4.1 garantías entonces
la existencia del T -trayectoria periódica B + B-B + (o B-B + B-) que satisface la restricción integral,
para T no demasiado grande. Además paraT lo suficientemente pequeño, la función
ψ es estrictamente convexo en [Xmetro(T), xMETRO(T)], y podemos concluir sobre la
optimalidad de estas trayectorias según el Teorema 4.1.
Usando los mismos valores de parámetro excepto mimax = 0.8235, la función F definido en (22) se
muestra en la Fig. 7 (izquierda) para diferentes valores de T. Recordamos (ver la prueba de
Proposición 3.2) que la existencia de Xmetro, XMETRO es equivalente a la existencia de un cero
de F. Uno puede ver en esta figura que Tmax como se define en la prueba de la Proposición 4.1
es aproximadamente igual a 6. Para T> 6, no podemos concluir sobre la existencia de
trayectorias bang-bang., ni sobre su optimalidad. Por el contrario, paraT < 6,
los B + B-B + y B-B + B- las estrategias son admisibles y óptimas, y Xmetro, XMETRO,
X-T, x + T se grafican en función de T en la Fig. 7 (Derecha). Observe que la propiedad (34)
se cumple, para todos T < 6. Tenga en cuenta que la ecuación h (x) = Ē tiene dos soluciones x <x̄
CONTROL PERIÓDICO ÓPTIMO BAJO INTEGRAL RESTRICCIÓN 23

3 T=4 K x T+
T=5 XMETRO(T)
T=6
X
2

T=7

X-T Xmetro(T)

X
−1

α
1,5
X 2
2.5 3 3,5 4 2

T
4 6

Figura 7. Gráfico de la función F de fi nido por (22) (izquierda) y Xmetro,


-
XMETRO, X T, x +
T (derecha) como funciones del período T
( T < 6) para el
modelo de indemnización (caso 2).

2 4 6
T

Figura 8. Criterio óptimo JT (ûT) para el modelo de compensación (caso 2)

(tal que ψ (x) = ψ (x̄)). Finalmente, en la Fig. 8, presentamos el costo de la B + B-B +


(o B-B + B-) estrategia en función de T (por T < 6).

6. Conclusión. En este trabajo, hemos demostrado que bajo supuestos de concavidad, la


trayectoria óptima es la solución de estado estacionario, es decir, no es posible un rendimiento
excesivo.
Por el contrario, bajo supuestos de convexidad, hemos demostrado que hay exactamente
una trayectoria óptima (hasta una traslación temporal) que es bang-bang con dos interruptores
en un período. Este resultado de optimalidad es global y válido para cualquier período.T.
También hemos relajado las hipótesis para demostrar el mismo resultado de optimalidad a nivel
mundial, pero para un rango limitado de valores del período. T, cuando sólo se cumple la convexidad
local.
La determinación de la solución óptima para grandes valores de T cuando no se
cumplen ni los supuestos de convexidad ni de concavidad parece ser mucho más
complejo, ya que la solución bang-bang ya no es admisible.
Este análisis se ilustró en el contexto de un modelo de población sujeta a un esfuerzo de
aprovechamiento. Dependiendo del modelo de crecimiento y el criterio, podemos predecir el
efecto de un esfuerzo de recolección periódico (con el mismo valor medio dado) en
comparación con el valor constante en estado estacionario. Tal análisis en este contexto es
nuevo hasta donde sabemos.
24 T. BAYEN, A. RAPAPORT Y F.-Z. TANI

Algunas de las técnicas que hemos propuesto aquí para hacer frente a la restricción integral
sobre la variable de control, que es la característica principal del problema que hemos
considerado, podrían ser implementadas para sistemas de dimensiones superiores y serán
materia de un trabajo futuro.

Expresiones de gratitud. Los autores agradecen al programa AVERROES entre Argelia y


Francia la obtención de la beca de doctorado de F.-Z. Tani. El primer autor quiere
agradecer al INRA Montpellier ya la unidad de investigación MISTEA por proporcionar una
delegación de medio año durante el curso académico 2017-2018. Este trabajo fue
apoyado por el LabEx NUMEV incorporado al I-Site MUSE (AAP2017-2-08) y por el ANR
THERMOMIC (ref. ANR-16-CE04-0003). También nos gustaría agradecer a Pedro Gajardo
por las útiles discusiones.

REFERENCIAS

[1] EM Abulesz y G. Lyberatos, Forzamiento de impulso periódico de sistemas no lineales: un nuevo método, Revista
Internacional de Control, vol. 48, págs. 469–480, 1988.
[2] EM Abulesz y G. Lyberatos, Optimización periódica de los procesos de crecimiento microbiano,
Biotecnología y bioingeniería, vol. 29, págs. 1059-1067, 1987.
[3] EM Abulesz y G. Lyberatos, Operación periódica de un cultivo continuo de levadura de panadería, Biotecnología y
bioingeniería, vol. 34, págs. 741–749, 1989.
[4] AO Belyakov y VM Veliov, Pesca constante versus pesca periódica: enfoque de control óptimo estructurado por
edad Matemáticas. Modelo. Nat. Phenom., Vol. 9, págs. 20–37, 2014.
[5] DS Bernstein y EG Gilbert, Control periódico óptimo: El π prueba revisada, Transacciones IEEE sobre control
automático, vol. 25, págs. 673–684, 1980.
[6] S. Bittanti, G. Fronza y G. Guardabassi, Control periódico: un enfoque en el dominio de la frecuencia,
Transacciones IEEE sobre control automático, vol. 18, págs. 33-38, 1973.
[7] S. Bittanti, A. Locatelli y C. Ma ff ezzoni, Métodos de segunda variación en la optimización periódica,
J. Teoría y aplicación de la optimización, vol. 14, págs. 31-49, 1974.
[8] S. Bittanti, A. Locatelli y S. Rinaldi, Estado de optimización periódica de sistemas dinámicos,
J. Teoría y aplicación de la optimización, vol. 14, págs. 1-20, 1974.
[9] L. Cesari, Teoría de la optimización y aplicaciones. Problemas con ecuaciones diferenciales ordinarias,Springer,
1983.
[10] CW Clark Bioeconomía matemática: las matemáticas de la conservación Wiley, 2010.
[11] RT Evans, JL Speyer y CH Chuang, Solución de un problema de control óptimo periódico por series asintóticas, J.
Teoría y aplicación de la optimización, vol. 52, págs. 343–364, 1987.
[12] EG Gilbert, Control periódico óptimo: una teoría general de las condiciones necesarias, SIAM J. Control Optim.,
Vol. 15, págs. 717–746, 1987.
[13] EG Gilbert, Q. Wang, Q. y JL Speyer, Condiciones necesarias y suficientes para la optimización local de un proceso
periódico, SIAM J. Control Optim., Vol. 28, págs. 482–497, 1990.
[14] J. Harmand, C. Lobry, A. Rapaport y T. Sari, El Chemostat: teoría matemática de cultivos de microorganismos, ISTE
Wiley, 2017.
[15] V. Hatzimanikatis, G. Lyberatos, S. Pavlou y SA Svoronos, Un método para la optimización periódica pulsada de
sistemas de reacción química, Ciencias de la Ingeniería Química, vol. 48, n. 4, págs. 789–797, 1993.

[16] Ideales LV, Análisis de estabilidad de los modelos de producción periódica de Fox, Poder. Apl. Matemáticas. P. 14, no.
3, págs. 331–341, 2006.
[17] LV Idels, M. Wang Estrategias de recolección con función de esfuerzo modificada, Interno. J. de Modelado, Identi
fi cación y Control, Edición especial de Modelado de sistemas complejos (IJMIC) vol. 3,
norte. 1, págs. 83–87, 2008.
[18] C. Ma ff ezzoni, Teoría de Hamilton-Jacobi para problemas de control periódico, J. Teoría y aplicación de la
optimización, vol. 14, págs. 21-29, 1974.
[19] L. Perko, Ecuaciones diferenciales y sistemas dinámicos, Springer Sciences, 2013.
[20] LS Pontryagin, VG Boltyanskiy, RV Gamkrelidze y EF Mishchenko, Teoría matemática de procesos óptimos, The
Macmillan Company, 1964.
[21] JL Speyer y RT Evans, Una segunda teoría de variación para procesos periódicos óptimos, Transacciones IEEE
sobre control automático, vol. 29, págs. 138-148, 1984.
CONTROL PERIÓDICO ÓPTIMO BAJO RESTRICCIÓN INTEGRAL 25

Dirección de correo electrónico: terence.bayen@umontpellier.fr


Dirección de correo electrónico: alain.rapaport@inra.fr
Dirección de correo electrónico: fatima.tani@etu.umontpellier.fr

También podría gustarte