Está en la página 1de 28

Introducción a los Métodos Recursivos

Luis A. Alcalá

Doctorado en Economı́a, FCE, UNCuyo – 2022

1. Introducción
Hemos visto anteriormente que el problema de crecimiento óptimo

X
max β t u(ct )
{ct ,kt+1 }∞
t=0
t=0

s.a. ct + kt+1 ≤ f (kt ), t = 0, 1, . . . ,


ct ≥ 0, t = 0, 1, . . . ,
kt+1 ≥ 0, t = 0, 1, . . . ,
k0 ≥ 0 dado,

puede formularse como la siguiente ecuación funcional


 
v(k) = max u(c) + βv(y) (1.1)
c,y

s.a. c + y ≤ f (k),
c, y ≥ 0,
k ≥ 0 dado.

La función de utilidad periódica u(·) y la función de producción f (·) constituyen las primitivas
del modelo. Mientras que las primitivas son conocidas, la función de valor v(·) en (1.1) debe
ser determinada.
El enfoque clásico a este problema se denomina método de las aproximaciones sucesivas
que consiste en conjeturar (guess) la forma de una función v0 que satisface (1.1). Luego, se
define una nueva función v1 por
 
v1 (k) = max u(f (k) − y) + βv0 (y) .
0≤y≤f (k)

Si v1 (k) = v0 (k) para todo k ≥ 0, entonces v0 es una solución de (1.1). Si v1 ̸= v0 , entonces

1
se utiliza v1 como un nuevo guess para obtener v2 , de la siguiente manera:
 
v2 (k) = max u(f (k) − y) + βv1 (y) .
0≤y≤f (k)

Ası́ siguiendo, en cada iteración de este proceso se define recursivamente una sucesión de
funciones {vn } tales que
 
vn+1 (k) = max u(f (k) − y) + βvn (y) , n = 0, 1, 2, . . .
0≤y≤f (k)

Hacemos esto con la esperanza que, a medida que n crece, las aproximaciones sucesivas vn
se acerquen a una función v que cumpla con la condición (1.1). En lo que sigue, vamos a
demostrar que:
(1) existe una única función v que es solución de (1.1) y sus propiedades se deducen de las
propiedades de u y f ;
(2) lim vn = v, para cualquier guess inicial v0 .
n→∞

Nuestro interés en resolver (1.1) es el de obtener una polı́tica óptima de acumulación de


capital g(k) para la economı́a. El problema también puede plantearse en términos de una
sucesión de funciones de polı́tica {gn (k)}∞ n=0 , tales que 0 ≤ gn (k) ≤ f (k), para todo k ≥ 0,
n = 0, 1, . . . y se analiza la convergencia gn → g.
Hay una manera más conveniente de describir el método. Dada una función w : R+ → R
en un espacio de funciones apropiado, llamémoslo W , podemos definir una aplicación T que
toma elementos del espacio W y los relaciona con elementos de otro espacio V (puede ser el
mismo W ). Las aplicaciones de este tipo se llaman operadores y se denotan por T : W → V .
Los operadores más comunes son los operadores lineales, que actúan sobre espacios vectoriales.
En general, el término “operador lineal” se refiere a aplicaciones sobre espacios vectoriales
de funciones que preservan ciertas propiedades, como la continuidad.
En nuestro caso, definimos al operador T como
 
(T w)(k) = max u(f (k) − y) + βw(y) .
0≤y≤f (k)

Cuando utilizamos esta notación, el método de aproximaciones sucesivas implica la elección


de una función v0 y el estudio de la sucesión {vn } definida por vn+1 = T vn , n = 0, 1, 2, . . ..
El objetivo es probar que dicha sucesión converge y que la función lı́mite v satisface (1.1).
Alternativamente, podemos ver al operador T como una aplicación de un conjunto C de
funciones en sı́ mismo, es decir T : C → C. Con esta notación, resolver (1.1) es equivalente
a encontrar un punto fijo del operador T , o sea una función v ∈ C que satisface v = T v.
A continuación, vamos a revisar algunos aspectos básicos sobre los espacios métricos y
los espacios vectoriales. Luego estudiamos dos teoremas fundamentales para la resolución de
ecuaciones funcionales del tipo (1.1), el teorema de la aplicación contractiva y el teorema del
máximo de Berge.

2
2. Preliminares
2.1. Espacios métricos
Para hablar de convergencia es necesario tener una noción de distancia. La distancia
euclı́dea se generaliza con el concepto de métrica.

Definición 2.1: Un espacio métrico es un conjunto S junto con una métrica (función
distancia) d : S × S → R tal que para todo x, y, z ∈ S
(a) d(x, y) ≥ 0, con igualdad sii x = y;
(b) d(x, y) = d(y, x);
(c) d(x, z) ≤ d(x, y) + d(y, z) (desigualdad triangular).

Ejemplo 1 Los siguientes son espacios métricos


1. S = Z con d(x, y) = |x − y|.
2. Sea S el conjunto de todas las funciones continuas, estrictamente crecientes en [a, b]
con d(x, y) = maxa≤t≤b |x(t) − y(t)|.
3. Sea S = Q con d(x, y) = |x − y|.

2.2. Espacios vectoriales


Definición 2.2: Un espacio vectorial (real) es un conjunto X, cuyos elementos se deno-
minan vectores, junto con las operaciones de adición y multiplicación escalar. Para cualquier
par de vectores x, y ∈ X, la adición resulta en un vector x + y ∈ X y para cualquier x ∈ X
y cualquier número real α ∈ R, el producto escalar da como resultado αx ∈ X.

Ejemplo 2 Los siguientes son espacios vectoriales


1. El espacio euclı́deo n-dimensional Rn (con n finito).
2. El conjunto X de sucesiones (infinitas) x = (x0 , x1 , x2 , . . .), donde xi ∈ R, ∀i ∈ Z+ .
3. El conjunto de funciones continuas definidas en un intervalo [a, b].

2.3. Espacios vectoriales normados


Definición 2.3: Un espacio vectorial normado es un espacio vectorial S, junto con una
norma ∥ · ∥ : S → R tal que para todo x, y ∈ S y para todo α ∈ R:
(a) ∥x∥ ≥ 0, con igualdad sii x = 0;
(b) ∥αx∥ = |α|∥x∥;
(c) ∥x + y∥ ≤ ∥x∥ + ∥y∥ (desigualdad triangular).

Ejemplo 3 Los siguientes son espacios vectoriales normados


Pn 1
1. S = Rn con ∥x∥ = 2 2
i=1 xi (Espacio euclı́deo).
n
2. S = R con ∥x∥ = maxi |xi |.
3. Sea S el conjunto de todas las funciones continuas sobre [a, b] con ∥x∥ = supa≤t≤b |x(t)|
(Espacio C[a, b]).1
1 Si X es un subconjunto de R, el número real α es una cota superior de X si para todo x ∈ X se cumple

3
2.4. Convergencia
Cualquier espacio normado (S, ∥ · ∥) puede verse como un espacio métrico, si se define la
métrica como d(x, y) := ∥x − y∥, para todo x, y ∈ S. La noción de convergencia para una
sucesión de números reales se extiende en forma directa para espacios métricos.

Definición 2.4: Sea (S, d) un espacio métrico. Una sucesión {xn }n=0 en S converge a
x ∈ S si, para cada ε > 0, existe un entero Nε tal que n ≥ N implica d(xn , x) < ε.

Definición 2.5: Sea (S, d) un espacio métrico. Una sucesión {xn }n=0 en S es una sucesión
de Cauchy (o satisface el criterio de Cauchy) si para cada ε > 0, existe un entero Nε tal
que d(xn , xm ) < ε para todo n, m ≥ Nε .

2.5. Espacios métricos completos


Definición 2.6: Se dice que un espacio métrico (S, d) es completo si toda sucesión de
Cauchy en S converge a un elemento en S.

Observación: En espacios métricos completos, probar que una sucesión satisface el criterio
de Cauchy es equivalente a demostrar la existencia de un punto lı́mite en S. El conjunto
de los reales R con la métrica d(x, y) = |x − y| es un espacio métrico completo. Un espacio
normado completo también se denomina espacio de Banach.

2.6. Espacios normados completos


Teorema 2.7: Sea X ⊂ RL y sea C(X) el espacio de funciones continuas y acotadas con la
norma ∥f ∥ := supx∈X |f (x)|. Entonces, C(X) es un espacio vectorial normado completo.

Demostración. (“Sketch”) Es suficiente con probar que si {fn } es una sucesión de Cauchy,
existe f ∈ C(X) tal que para cada ε > 0, hay un entero no negativo Nε tal que

∥fn − f ∥ ≤ ε, para todo n ≥ Nε .

La demostración se completa con tres pasos: (i) Encontrar una función “candidata” para f ;
(ii) demostrar que {fn } converge a f en la norma sup; (iii) probar que f ∈ C(X). ■

2.7. Aplicación contractiva o contracción


Definición 2.8: Sea (S, d) un espacio métrico y T una aplicación de S en sı́ mismo. Se dice
que T es una aplicación contractiva o contracción si existe un número real 0 < β < 1
tal que
d (T x, T y) ≤ βd(x, y), ∀x, y ∈ S.

La constante β se denomina módulo de la contracción.


que x ≤ α. Si X es un subconjunto no vacı́o y acotado superiormente, entonces una cota superior s ∈ X se
denomina supremo de X, denotado como s = sup X, si s es menor que cualquier otra cota superior de X.
Es decir, el supremo es la mı́nima cota inferior de X.

4
Observación: Una contracción toma dos puntos x, y ∈ S y los envı́a a puntos situados
“más cerca” de lo que estaban x e y ente sı́. Una contracción posee al menos un punto fijo.
El teorema del punto fijo de Banach afirma que toda contracción sobre un espacio métrico
completo tiene un único punto fijo. Además, se cumple que para todo punto x ∈ S la sucesión
(x, T (x), T (T (x)), . . .) converge a dicho punto fijo. La combinación de estos dos resultados se
enuncia formalmente a continuación en el teorema de la aplicación contractiva.

3. Teorema de la aplicación contractiva


La parte (a) de este teorema también se conoce como teorema del punto fijo de Banach.

Teorema 3.1 (Teorema de la aplicación contractiva): Sea (S, d) un espacio métrico y sea
T : S → S una contracción con módulo β. Entonces
(a) T tiene exactamente un punto fijo v en S;
(b) para cualquier v0 ∈ S, se cumple que

d (T n v0 , v) ≤ β n d(v0 , v), n = 0, 1, 2, . . .

Demostración. Para demostrar (a), debemos encontrar un candidato v en S, probar que


satisface T v = v y que no hay otro elemento del espacio v̂ ∈ S que también lo es.
Definimos las iteraciones del operador T como aplicaciones sucesivas del mismo. Entonces,

construimos una sucesión de operadores {T n } con T 0 x = x y T n x = T T n−1 x , para
n = 1, 2, . . .. Ahora elegimos un elemento arbitrario v0 ∈ S y definimos {vn }∞ n=0 en forma
recursiva, vn+1 = T vn . Por lo tanto vn = T n v0 . Dado que T es una contracción,

d(v2 , v1 ) = d(T v1 , T v0 ) ≤ βd(v1 , v0 ).

Continuando en forma inductiva, se obtiene d(vn+1 , vn ) ≤ β n d(v1 , v0 ), n = 1, 2, . . . Entonces,


para cualquier m > n, por la desigualdad triangular y el resultado anterior,

d(vm , vn ) ≤ d(vm , vm−1 ) + · · · + d(vn+2 , vn+1 ) + d(vn+1 , vn )

≤ β m−1 d(v1 , v0 ) + · · · + β n+1 d(v1 , v0 ) + β n d(v1 , v0 )

= β n β m−1−n + · · · + β + 1 d(v1 , v0 )


βn
≤ d(v1 , v0 ).
1−β

De aquı́ se deduce que {vn } es una sucesión de Cauchy. Dado que S es completo, se cumple
que vn → v ∈ S.

5
Para probar que T v = v, nótese que para todo n y para toda v0 ∈ S

d(T v, v) ≤ d(T v, T n v0 ) + d(T n v0 , v)

≤ βd(T v, T n−1 v0 ) + d(T n v0 , v).

Ya hemos demostrado que los dos términos de la última expresión convergen a cero, por lo
que d(T v, v) = 0, o sea, T v = v.
Finalmente, debemos probar que v es único. Supongamos que existe v̂ ∈ S, con v̂ ̸= v, tal
que T v̂ = v̂. Entonces,
0 < d(v̂, v) = d(T v̂, T v) ≤ βd(v̂, v),

pero esto es una contradicción, ya que β < 1. Esto concluye con la demostración de (a).
Para probar (b), observe que para cualquier n ≥ 1,

d(T n v0 , v) = d T (T n−1 v0 ), T v ≤ βd T n−1 v0 , v ,


 

entonces el resultado en (b) se obtiene por inducción. ■

Si (S, d) es un espacio métrico completo y S ′ es un subconjunto cerrado de S, entonces


(S ′ , d) también es un espacio métrico completo. Ahora supongamos que T : S → S es una
aplicación contractiva. Más aún, supongamos que T aplica S ′ en sı́ mismo y T (S ′ ) ⊆ S ′ .
Entonces T también es una contracción sobre S ′ . Por lo tanto el único punto fijo de T sobre
S también está en S ′ . Este hecho se formaliza en el siguiente corolario al Teorema 3.1.

Corolario 3.2: Sea (S, d) un espacio métrico completo y sea T : S → S una contracción
con punto fijo v ∈ S. Si S ′ es un subconjunto cerrado de S y T (S ′ ) ⊆ S ′ , entonces v ∈ S ′ .
Si, además, T (S ′ ) ⊆ S ′′ ⊆ S ′ , entonces v ∈ S ′′ .

3.1. Condiciones suficientes de Blackwell


Blackwell (1965) desarrolló un método muy útil para verificar cuando ciertos operadores
son contracciones.

Teorema 3.3 (Condiciones suficientes de Blackwell para una contracción): Sea X ⊂ RL y


sea B(X) el espacio de funciones acotadas f : X → R junto con la norma del supremo,
∥f ∥ = supx∈X |f (x)|. Sea T : B(X) → B(X) un operador que satisface
(a) [monotonı́a] f, g ∈ B(X) y f (x) ≤ g(x), para todo x ∈ X, implica (T f )(x) ≤ (T g)(x),
para todo x ∈ X;
(b) [descuento] Existe algún escalar β ∈ (0, 1) tal que

[T (f + a)] (x) ≤ (T f )(x) + βa, para todo f ∈ B(X), a ≥ 0, x ∈ X,

donde (f + a)(x) := f (x) + a.


Entonces, T es una contracción con módulo β.

6
Demostración. Si f (x) ≤ g(x) para todo x ∈ X, lo vamos a escribir como f ≤ g. Para
cualquier f, g ∈ B(X) se cumple que

f ≤ g + ∥f − g∥.

Entonces las propiedades (a) y (b) implican que

T f ≤ T (g + ∥f − g∥) ≤ T g + β∥f − g∥.

Ahora, si revertimos los roles de f y g y aplicamos el razonamiento anterior,

T g ≤ T f + β∥g − f ∥.

Combinando estas desigualdades, obtenemos

−β∥f − g∥ ≤ T f − T g ≤ β∥f − g∥,

que inmediatamente implica


|T f − T g| ≤ β∥f − g∥.

En particular, esto también debe cumplirse para

sup |T f (x) − T g(x)| ≤ β∥f − g∥,


x∈X

con lo que puede concluirse que ∥T f − T g∥ ≤ β∥f − g∥, que es el resultado buscado. ■

3.2. Condiciones de Blackwell: Ejemplo


En varias aplicaciones económicas las condiciones de Blackwell se verifican fácilmente.
Por ejemplo, en el modelo de crecimiento óptimo, definimos al operador T como
 
(T v)(k) = max u(f (k) − y) + βv(y) .
0≤y≤f (k)

Si v(y) ≤ w(y) para todo y, claramente se cumple que T v ≤ T w, ya que la maximización


se realiza sobre una función que toma valores mayores. Entonces T satisface monotonicidad.
Por otro lado,
 
T (v + a)(k) = max u(f (k) − y) + β(v(y) + a)
0≤y≤f (k)
 
= max u(f (k) − y) + βv(y) + βa
0≤y≤f (k)

= (T v)(k) + βa,

con lo que se verifica la propiedad de descuento.

7
Como conclusión, T es una contracción con módulo β. Dado que el espacio B(X) es
completo, puede aplicarse el teorema de punto fijo de Banach para afirmar que existe un
único elemento v ∈ B(X) tal que T v = v.

4. Teorema del máximo de Berge


El teorema de la aplicación contractiva puede utilizarse para resolver problemas más
generales que los vistos hasta ahora. Consideremos entonces una formulación un poco más
general de (FE). Sea x ∈ X la variable de estado a principio del perı́odo y sea y ∈ X la
variable de estado al final del perı́odo. Quisiéramos tener una especificación de la función de
retorno en el perı́odo actual F (x, y) y el conjunto de valores factibles de y (dado x), que sea
lo más general posible. Por otro lado, queremos que el operador T definido por

(T v)(x) = sup [F (x, y) + βv(y)]


y

para valores de y factibles dado x, aplique el espacio C(X) de funciones continuas y acotadas
sobre sı́ mismo.
La descripción del conjunto de factibilidad se realiza a través del concepto de aplicación
multivaluada o correspondencia de X a Y : una relación que asigna a cada x ∈ X el
conjunto Γ(X) ⊆ Y . Decimos que Γ : X → Y “toma valores compactos” o es “de valores
compactos” cuando Γ(X) es un conjunto compacto (igualmente para valores convexos, valores
cerrados, etc.)
Nuestro objetivo es entonces determinar qué condiciones debe cumplir la correspondencia
Γ : X → X, que describe las restricciones de factibilidad, y la función de retorno F que
conjuntamente aseguren que si v ∈ C(X) y T v(x) = supy∈Γ(x) [F (x, y) + βv(y)], entonces
T v ∈ C(X). También quisiéramos determinar las propiedades de la correspondencia G(x)
que contiene los valores óptimos de y para cada x. El teorema o principio del máximo de
Berge cumple con ambas metas.
Para ser más concretos, sean X ⊆ Rl , Y ⊆ Rm ; sea f : X × Y → R una función y
sea Γ : X → Y una correspondencia. Nuestro interés es resolver problemas con la forma
supy∈Γ(x) f (x, y). Si para cada x, f (x, ·) es continua en y y el conjunto Γ(x) es no vacı́o y
compacto, entonces se alcanza el máximo para cada valor de x. En este caso, la función

h(x) = max f (x, y) (4.1)


y∈Γ(x)

está bien definida, al igual que el conjunto no vacı́o



G(x) = y ∈ Γ(x) : f (x, y) = h(x) (4.2)

de valores de y que alcanzan el máximo. Vamos a imponer restricciones adicionales sobre f


y Γ para asegurar que la función h y el conjunto G varı́en de manera continua con x.

8
Existen distintas nociones de continuidad para correspondencias. En nuestro caso, es
conveniente utilizar definiciones de tipo secuencial.

Definición 4.1: Una correspondencia Γ : X → Y es semicontinua inferior (s.c.i.) en


x ∈ X si Γ(x) es no vacı́o y si, para todo y ∈ Γ(x) y toda sucesión xn → x, existen un entero

N ≥ 1 y una sucesión {yn }n=N tal que yn → y e yn ∈ Γ(xn ) para todo n ≥ N .

Definición 4.2: Una correspondencia de valores compactos Γ : X → Y es semicontinua


superior (s.c.s.) en x ∈ X si Γ(x) es no vacı́o y si, para toda sucesión xn → x y toda sucesión
{yn } tales que yn → y e yn ∈ Γ(xn ) para todo n, existe una subsucesión convergente de {yn }
cuyo punto lı́mite y ∈ Γ(x).

Definición 4.3: Una correspondencia Γ : X → Y es continua en x ∈ X si es simultánea-


mente s.c.i. y s.c.s. en x.

El siguiente resultado nos permite responder las preguntas que planteamos sobre h y G.

Teorema 4.4 (Teorema del máximo): Sean X ⊆ Rn , Y ⊆ Rm , sea f : X × Y → R


una función continua y sea Γ : X → Y una correspondencia continua de valores compactos.
Entonces la función h : X → R definida en (4.1) es continua y la correspondencia G : X → Y
definida en (4.2) es no vacı́a, de valores compactos y s.c.s.

Demostración. Fı́jese un valor x ∈ X. El conjunto Γ(x) es no vacı́o y compacto y f (x, ·) es


continua, por lo tanto se alcanza el máximo en (4.1) y el conjunto G(x) de argumentos de
dichos valores maximales es no vacı́o. Además, como G(x) ⊆ Γ(x) y Γ(x) es compacto, se
sigue que G(x) es acotado. Suponga que yn → y con yn ∈ G(x) para todo n. Dado que Γ(x)
es cerrado, y ∈ Γ(x). Dado que h(x) = f (x, yn ), para todo n, y f es continua, f (x, y) = h(x).
Entonces y ∈ G(x), lo que implica que G(x) es cerrado. En conclusión, G(x) es no vacı́o y
compacto para cada x.
Ahora demostramos que G(x) es s.c.s. Para un x ∈ X fijo, sea {xn } una sucesión que
converge a x. Elija yn ∈ G(xn ) para todo n. Dado que Γ es s.c.s., existe una subsucesión {ynk }
que converge a y ∈ Γ(x). Sea z ∈ Γ(x). Como Γ es s.c.i., existe una sucesión znk → z, con
znk ∈ Γ(xnk ) para todo k. Dado que f (xnk , ynk ) ≥ f (xnk , znk ), para todo k, y f es continua,
f (x, y) ≥ f (x, z). Como esto se cumple para cualquier z ∈ Γ(x) arbitrario, entonces y ∈ G(x).
Esto que implica que G es s.c.s.
Finalmente, probaremos que h es continua. Sea x ∈ X fijo y {xn } alguna sucesión que
converge a x. Elija yn ∈ G(xn ), para todo n. Sea h = lim sup h(xn ) y h = lim inf h(xn ).
Entonces existe una subsucesión {xnk } tal que h = lim f (xnk , ynk ). Pero dado que G es
s.c.s., existe una subsucesión de {ynk }, llámese {yj′ }, que converge a y ∈ G(x). Entonces
h = lim f (xj , yj′ ) = f (x, y) = h(x). Con un argumento análogo puede establecerse que
h(x) = h. Por lo tanto, {h(xn )} converge y su lı́mite es h(x). ■

9
5. Programación dinámica determinı́stica
En términos secuenciales, o de sucesiones de dimensión infinita, los problemas que estamos
interesados en estudiar son de la forma

X
sup β t F (xt , xt+1 ) (SP)
{xt+1 }∞
t=0 t=0

s.a. xt+1 ∈ Γ(xt ), t = 0, 1, . . .

x0 ∈ X dado.

Este tipo de problemas tiene asociada una ecuación funcional de la forma

v(x) = sup [F (x, y) + βv(y)] , x ∈ X. (FE)


y∈Γ(x)

Vamos a establecer las relaciones que existen entre las soluciones de estos dos problemas y
desarrollar métodos para analizar ecuaciones funcionales.

5.1. Principio de optimalidad de Bellman


La idea general es que la solución v de (FE), evaluada en x0 , da el supremo en (SP)
cuando el valor inicial del estado es x0 y la sucesión {xt+1 }∞
t=0 alcanza el supremo en (SP) si
y solo si satisface
v(xt ) = F (xt , xt+1 ) + βv(xt+1 ), t = 0, 1, . . . (5.1)

Esto es lo que Richard Bellman llamó el principio de optimalidad.


Sea X el conjunto de valores posibles de la variable de estado. Por el momento no vamos
a imponer ninguna restricción sobre X. Sea Γ : X → X la correspondencia que describe
las restricciones de factibilidad. Para cada x ∈ X, Γ(x) representa el conjunto de valores
factibles de la variable de estado en el próximo perı́odo, dado que el estado actual es x. Sea
A la gráfica de Γ, definida por

A = {(x, y) ∈ X × X : y ∈ Γ(x)} .

Sea F : A → R la función de retorno perı́odica y β ≥ 0 el factor de descuento. Entonces, las


primitivas del modelo están dadas por (X, Γ, F, β).
Primero vamos a establecer condiciones para que el problema (SP) está bien definido, lo
que implica que el conjunto de valores factibles sea no vacı́o y la función objetivo esté bien
definida para todo x en dicho conjunto.
Una sucesión {xt }∞
t=0 en X se denomina un plan. Para x0 ∈ X dado, el conjunto de todos
los planes factibles desde x0 se define como
n o
Π(x0 ) = {xt }∞
t=0 : x t+1 ∈ Γ(x t ), t = 0, 1, . . . .

10
Sea x = (x0 , x1 , . . .) un elemento tı́pico de Π(x0 ).
˜
Vamos a adoptar los siguientes supuestos sobre Γ y Π:
(S1) El conjunto Γ(x) es no vacı́o para todo x ∈ X.
Pn t 2
(S2) Para todo x0 ∈ X y x ∈ Π(x0 ), el lı́mite limn→∞ t=0 β F (xt , xt+1 ) existe en R.
˜
Por lo tanto, (S1) asegura que Π(x0 ) es no vacı́o, para todo x0 ∈ X, y (S2) requiere que
todos los planes factibles puedan ser evaluados utilizando la función de retorno F y el factor
de descuento β.3
Para n = 0, 1, 2, . . ., definimos Jn : Π(x0 ) → R por
n
X
Jn (x) = β t F (xt , xt+1 ).
˜ t=0

Entonces Jn (x) es la suma parcial de los retornos descontados para los perı́odos 0 hasta n,
˜
correspondientes a un plan factible x. Si se cumple (S2), también podemos definir una función
˜
J : Π(x0 ) → R como

J(x) = lim Jn (x).


˜ n→∞ ˜
Suponiendo que se satisfacen (S1)-(S2), el conjunto Π(x0 ) es no vacı́o para cada x0 ∈ X y
la función objetivo en (SP) está bien definida para todo plan x ∈ Π(x0 ). La función supremo
˜
v ∗ : X → R entonces se define por

v ∗ (x0 ) = sup J(x).


x∈Π(x0 )˜
˜

Por lo tanto, v ∗ (x0 ) es el supremo en (SP). Nótese que, por definición, v ∗ es la única función
que satisface las siguientes tres condiciones:
(a) Si |v ∗ (x0 )| < ∞, entonces

v ∗ (x0 ) ≥ J(x), para todo x ∈ Π(x0 ); (5.2)


˜ ˜
y para cualquier ε > 0,

v ∗ (x0 ) ≤ J(x) + ε, para algún x ∈ Π(x0 ). (5.3)


˜ ˜
(b) Si v ∗ (x0 ) = +∞, existe una sucesión {xk } en Π(x0 ) tal que limk→∞ J(xk ) = +∞.
˜ ˜
(c) Si v ∗ (x0 ) = −∞, entonces J(x) = −∞, para todo x ∈ Π(x0 ).
˜ ˜
A continuación, analizaremos las conexiones existentes entre la función supremo v ∗ y las
soluciones v de la ecuación funcional (FE). Es importante recordar que si se satisfacen los
supuestos (S1) y (S2), v ∗ está siempre definida en forma unı́voca, mientras que (FE) puede
tener - en principio - una, varias o ninguna solución.

2R := R ∪ {−∞, +∞} es el conjunto de los números reales extendidos.


3 Para saber qué condiciones aseguran que (S2) se cumple, véase el Cap. 4.1 de Stokey and Lucas (1989).

11
Diremos que v ∗ satisface la ecuación funcional si se cumplen las siguientes tres condiciones:
(a) Si |v ∗ (x0 )| < ∞, entonces

v ∗ (x0 ) ≥ F (x0 , y) + βv ∗ (y), para todo y ∈ Γ(x0 ); (5.4)

y para cualquier ε > 0,

v ∗ (x0 ) ≤ F (x0 , y) + βv ∗ (y) + ε, para algún y ∈ Γ(x0 ). (5.5)

(b) Si v ∗ (x0 ) = +∞, existe una sucesión {y k } en Γ(x0 ) tal que

lim F (x0 , y k ) + βv ∗ (y k ) = +∞.


 
(5.6)
k→∞

(c) Si v ∗ (x0 ) = −∞, entonces

F (x0 , y) + βv ∗ (y) = −∞, para todo y ∈ Γ(x0 ). (5.7)

Antes de probar que la función supremo v ∗ satisface la ecuación funcional, es útil esta-
blecer un resultado preliminar.

Lema 5.1: Si X, Γ, F y β satisfacen (S2), entonces para todo x0 ∈ X y para todo plan factible
x = (x0 , x1 , . . .) ∈ Π(x0 ),
˜
J(x) = F (x0 , x1 ) + βJ(x′ ),
˜ ˜

donde x = (x1 , x2 , . . .).
˜
Demostración. Por (S2), para cualquier x0 ∈ X y cualquier x ∈ Π(x0 ),
˜
Xn
J(x) = lim β t F (xt , xt+1 ),
˜ n→∞
t=0
n
X
= F (x0 , x1 ) + β lim β t F (xt+1 , xt+2 ),
n→∞
t=0

= F (x0 , x1 ) + βJ(x′ ). ■
˜
Teorema 5.2: Si X, Γ, F y β cumplen (S1)-(S2), entonces v ∗ satisface (FE).

Demostración. Si β = 0, el resultado es trivial. Suponga que β > 0 y elı́jase x0 ∈ X.


Si v ∗ (x0 ) es finito, entonces se satisfacen (5.2)-(5.3) y basta con probar que esto implica
que se cumplen (5.4)-(5.5). Para determinar (5.4), sea x1 ∈ Γ(x0 ) y ε > 0 dado. Por (5.3),
existe x′ = (x1 , x2 , . . .) ∈ Π(x1 ) tal que J(x′ ) ≥ v ∗ (x1 ) − ε. Nótese que, además, se cumple
˜ ˜
que x = (x0 , x1 , x2 , . . .) ∈ Π(x0 ). Entonces, se sigue de (5.2) y el Lema 5.1 que
˜
v ∗ (x0 ) ≥ J(x) = F (x0 , x1 ) + βJ(x′ ) ≥ F (x0 , x1 ) + βv ∗ (x1 ) − βε.
˜ ˜
Como ε > 0 es arbitrario, esto implica (5.4).

12
Para establecer (5.5), dado un ε > 0 fijo, se deduce de (5.3) y el Lema 5.1 que puede
elegirse x = (x0 , x1 , . . .) ∈ Π(x0 ) tal que
˜
v ∗ (x0 ) ≤ J(x) + ε = F (x0 , x1 ) + βJ(x′ ) + ε,
˜ ˜
donde x′ = (x1 , x2 , . . .). Luego, por (5.2)
˜
v ∗ (x0 ) ≤ F (x0 , x1 ) + βv ∗ (x1 ) + ε.

Dado que x1 ∈ Γ(x0 ), esto implica (5.5).


Si v ∗ (x0 ) = +∞, existe una sucesión {xk } en Π(x0 ) tal que limk→∞ J(xk ) = +∞. Dado
˜ ˜
que xk1 ∈ Γ(x0 ), para todo k, y que

J(xk ) = F (x0 , xk1 ) + βJ((x′ )k ) ≤ F (x0 , xk1 ) + βv ∗ (xk1 ), para todo k,


˜ ˜
entonces se cumple (5.6) para la sucesión formada por y k = xk1 , para todo k, en Γ(x0 ).
Si v ∗ (x0 ) = −∞, entonces

J(x) = F (x0 , x1 ) + βJ(x′ ) = −∞, para todo x ∈ Π(x0 ),


˜ ˜ ˜
donde x′ = (x1 , x2 , . . . ). Como F toma valores reales, se sigue que
˜
J(x′ ) = −∞, para todo x1 ∈ Γ(x0 ) y x ∈ Π(x0 ).
˜ ˜
Por lo tanto, v ∗ (x1 ) = −∞, para todo x1 ∈ Γ(x0 ). Dado que F toma valores reales y β > 0,
esto inmediatamente implica (5.7). ■

El próximo teorema es un recı́proco parcial del Teorema 5.2. El mismo demuestra que v ∗
es la única solución a la ecuación funcional que satisface una condición de ser acotada.

Teorema 5.3: Suponga que X, Γ, F y β satisfacen (S1)-(S2). Si v es una solución de (FE)


y cumple que
lim β n v(xn ) = 0, ∀(x0 , x1 , . . .) ∈ Π(x0 ), ∀x0 ∈ X, (5.8)
n→∞

entonces v = v .

Demostración. Si v(x0 ) es finita, se satisfacen (5.4)-(5.5), entonces basta con demostrar que
esto implica que se cumplen (5.2)-(5.3). Ahora bien, (5.4) implica que para todo x ∈ Π(x0 ),
˜
v(x0 ) ≥ F (x0 , x1 ) + βv(x1 ),
≥ F (x0 , x1 ) + βF (x1 , x2 ) + β 2 v(x2 ),
..
.
≥ Jn (x) + β n+1 v(xn+1 ), n = 1, 2, . . .
˜
Tomando el lı́mite para n → ∞ y usando (5.8), vemos que se cumple (5.2).

13
Fı́jese ε > 0 y sea {δt }∞
t=1 en R+ tal que


X ε
β t−1 δt ≤ .
t=1
2

Dado que se cumple (5.5) por hipótesis, podemos elegir x1 ∈ Γ(x0 ), x2 ∈ Γ(x1 ), . . ., tales que

v(xt ) ≤ F (xt , xt+1 ) + βv(xt+1 ) + δt+1 , t = 0, 1, . . .

Entonces, x = (x0 , x1 , . . .) ∈ Π(x0 ) y además


˜
X n
v(x0 ) ≤ β t F (xt , xt+1 ) + β n+1 v(xn+1 ) + (δ1 + · · · + β n δn+1 )
t=0
ε
≤ Jn (x) + β n+1 v(xn+1 ) + , n = 1, 2, . . .
˜ 2
Por lo tanto, (5.8) implica que para n suficientemente grande, v(x0 ) ≤ Jn (x) + ε. Dado que
˜
ε > 0 es arbitrario, se satisface (5.3).
Si se cumple (5.8), entonces (5.7) implica que v no puede tomar el valor −∞. Por otro
lado, si v(x0 ) = +∞, se eligen n ≥ 0 y (x0 , x1 , . . . , xn ) ∈ Rn+1
+ tales que xt+1 = Γ(xt ) y
v(xt ) = +∞ para t = 0, 1, . . . , n y v(xn+1 ) < +∞ para todo xn+1 ∈ Γ(xn ). Claramente, la
condición (5.8) implica que n es finito. Sea M > 0. Dado que v(xn ) = +∞, (5.6) implica que
se puede elegir xMn+1 ∈ Γ(xn ) tal que

" n−1
#
X
−n
F (xn , xM
n+1 ) + βv(xM
n+1 ) ≥β M +1− t
β F (xt , xt+1 ) .
t=0

−(n+1)
Entonces, se elige xM M M M
n+1 ∈ Π(xn+1 ) tal que J(xn+1 ) ≥ v(xn+1 ) − β . Dado que
M ˜ ˜
v(xn+1 ) es finito, el argumento anterior demuestra que esto es posible. Por lo tanto,
xM = (x0 , x1 , . . . , xn , xMn+1 ) ∈ Π(x0 ) y
˜ ˜
n−1
X
J(xM ) = β t F (xt , xt+1 ) + β n F (xn , xM
n+1 ) + β
n+1
J(xMn+1 ) > M.
˜ t=0
˜

Dado que M fue elegido arbitrariamente, se sigue que v ∗ (x0 ) = +∞. ■

Una consecuencia inmediata del Teorema 5.3 es que la ecuación funcional (FE) tiene a lo
sumo una solución que satisface (5.8).
En resumen, hemos establecido dos resultados principales acerca de las soluciones de
(FE). Por un lado, el Teorema 5.2 prueba que v ∗ satisface (FE). Esta ecuación funcional
puede tener otras soluciones, pero el Teorema 5.3 demuestra que estas soluciones violan la
condición (5.8).
Nuestro próximo objetivo es la caracterización de los planes factibles que alcanzan el
óptimo. Se dice que un plan factible x ∈ Π(x0 ) es un plan óptimo desde x0 si alcanza
˜

14
el supremo en (SP), es decir, si J(x) = v ∗ (x0 ). Los dos próximos teoremas tratan sobre la
˜
relación entre los planes óptimos y aquellos que satisfacen la ecuación de polı́tica (5.1) para
v = v ∗ . El teorema siguiente prueba que los planes óptimos satisfacen (5.1).

Teorema 5.4: Suponga que X, Γ, F y β satisfacen (S1)-(S2) y sea x∗ ∈ Π(x0 ) un plan


˜
factible que alcanza el supremo en (SP) para el estado inicial x0 . Entonces

v ∗ (x∗t ) = F (x∗t , x∗t+1 ) + βv ∗ (x∗t+1 ), t = 0, 1, . . . (5.9)

Demostración. Dado que x∗ alcanza el supremo,


˜
v ∗ (x∗0 ) = J(x∗ ) = F (x0 , x∗1 ) + βJ(x∗′ ), (5.10)
˜ ˜
≥ J(x) = F (x0 , x1 ) + βJ(x′ ),
˜ ˜
para todo x ∈ Π(x0 ). En particular, la desigualdad se cumple para todos los planes con
˜
x1 = x∗1 . Dado que (x∗1 , x2 , x3 , . . .) ∈ Π(x∗1 ) implica que (x0 , x∗1 , x2 , x3 , . . .) ∈ Π(x0 ), se
cumple que

J(x∗′ ) ≥ J(x′ ), para todo x′ ∈ Π(x∗1 ).


˜ ˜ ˜
Entonces J(x∗′ ) = v(x∗1 ). Sustituyendo esto en (5.10) da (5.9) para t = 0. Continuando en
˜
forma inductiva, se establece (5.9) para todo t. ■

El próximo teorema provee un recı́proco parcial del Teorema 5.4. Demuestra que cualquier
sucesión que satisface (5.9) y una condición sobre la cota superior de v ∗ es un plan óptimo.

Teorema 5.5: Supongamos que X, Γ, F y β satisfacen (S1)-(S2) y sea x∗ ∈ Π(x0 ) un plan


˜
factible desde x0 que satisface (5.9), tal que

lim sup β t v ∗ (x∗t ) ≤ 0. (5.11)


t→∞

Entonces x∗ alcanza el supremo en (SP) para el estado inicial x0 .


˜
Demostración. Suponga que x∗ ∈ Π(x0 ) satisface (5.9) y (5.11). Entonces, se sigue por
˜
inducción sobre (5.9) que

v ∗ (x0 ) = Jn (x∗ ) + β n+1 v ∗ (x∗n+1 ), n = 1, 2, . . .


˜
Entonces, aplicando (5.11) se obtiene que v ∗ (x0 ) ≤ J(x∗ ). Dado que x∗ ∈ Π(x0 ), también se
˜ ˜
cumple la desigualdad inversa, lo que establece el resultado buscado. ■

Cualquier correspondencia no vacı́a G : X → X con G(x) ⊆ Γ(x) para todo x ∈ X, se


denomina correspondencia de polı́tica, dado que G(x) es un conjunto de acciones factibles
cuando el estado inicial es x. En el caso que G es univaluada, se llama función de polı́tica
y se denota por g. Se dice que una sucesión x = (x0 , x1 , . . .) es generada por G desde x0
˜

15
si cumple que xt+1 ∈ G(xt ), t = 0, 1, . . .. Finalmente, definimos la correspondencia de
polı́tica óptima G∗ como

G∗ (x) = y ∈ Γ(x) : v ∗ (x) = F (x, y) + βv ∗ (y) .




Podemos concluir entonces que el Teorema 5.4 prueba que todo plan óptimo {x∗t } es generado
por G∗ y el Teorema 5.5 demuestra que cualquier plan {x∗t } generado por G∗ , que además
satisface (5.11), es un plan óptimo.

5.2. Retornos acotados


En esta sección, analizamos ecuaciones funcionales del tipo

v(x) = sup [F (x, y) + βv(y)] , (5.12)


y∈Γ(x)

asumiendo que la función F es acotada y 0 < β < 1. Para ello, adoptamos los siguientes
supuestos adicionales sobre las primitivas del modelo:
(S3) X es un subconjunto convexo de Rl y la correspondencia Γ : X → X es no vacı́a, de
valores compactos y continua.
(S4) La función F : A → R es acotada y continua y 0 < β < 1.
Si se satisfacen (S3)-(S4), también lo hacen (S1)-(S2), entonces el problema secuencial
asociado a (5.12) está bien definido. Los teoremas anteriores implican que ambas soluciones
coinciden exactamente. El supuesto que X sea un subconjunto de un espacio euclı́deo podrı́a
relajarse, pero con el costo de una cantidad adicional de terminologı́a y notación (p.ej. las
definiciones que vimos de correspondencia s.c.s. y s.c.i. se aplican sólo a espacios euclı́deos).
Si B es una cota para |F (x, y)|, entonces v ∗ satisface

B
|v ∗ (x)| ≤ , para todo x ∈ X,
1−β

por lo que es natural buscar soluciones en el espacio C(X) de funciones f : X → R continuas


y acotadas con la norma del supremo o “norma sup”, ∥f ∥ = supx∈X |f (x)|.
Cualquier solución a (5.12) en C(X) satisface las hipótesis del Teorema 5.3 y es entonces
una función supremo. Más aún, dada una solución v ∈ C(X) de (5.12), podemos definir una
correspondencia de polı́tica G : X → X dada por

G(x) = y ∈ Γ(x) : v(x) = F (x, y) + βv(y) , (5.13)

y los Teoremas 5.4 y 5.5 implican que para todo x0 ∈ X, una sucesión {x∗t } alcanza el
supremo en el problema secuencial si y solo si es generada por G.
Definimos el operador T en C(x) como

(T f ) (x) = max [F (x, y) + βf (y)] , (5.14)


y∈Γ(x)

16
por lo que (5.12) se vuelve v = T v.

5.2.1. Retornos acotados: existencia

Teorema 5.6: Supongamos que X, Γ, F y β satisfacen (S3)-(S4) y sea C(X) el espacio de


funciones f : X → R continuas y acotadas con la norma sup. Entonces, el operador T aplica
C(X) en sı́ mismo, es decir, T : C(X) → C(X), tiene un único punto fijo v ∈ C(X) y, para
todo v0 ∈ C(X),
∥T n v0 − v∥ ≤ β n ∥v − v0 ∥, n = 0, 1, 2, . . . (5.15)

Más aún, dada v, la correspondencia de polı́tica óptima G : X → X definida por (5.13) toma
valores compactos y es s.c.s.

Demostración. Por (S3)-(S4), para cada f ∈ C(X) y x ∈ X, el problema (5.14) consiste en


maximizar la función continua F (x, ·) + βf (·) sobre el conjunto compacto Γ(x). Entonces
se alcanza el máximo. Dado que F y f son acotadas, también lo es T f y como F, f son
continuas, Γ compacta y continua, el teorema del máximo implica la continuidad de T f .
Entonces T : C(X) → C(X).
Puede verse que T satisface las hipótesis de las condiciones suficientes de Blackwell para
una contracción. Como C(X) es un espacio de Banach, se sigue del teorema de la aplicación
contractiva que T tiene un único punto fijo v ∈ C(X) y se cumple (5.15). Las propiedades
de G se deducen del teorema del máximo. ■

5.3. Caracterización de la solución


Para poder caracterizar v y G, necesitamos más información sobre F y Γ. El próximo re-
sultado muestra cómo puede aplicarse el Corolario 3.2 al teorema de la aplicación contractiva
para obtener una caracterización más precisa de v y G. Con este fin, se adoptan los siguientes
supuestos adicionales:
(S5) Para cada y, F (·, y) es estrictamente creciente en cada uno de sus l primeros argumentos.
(S6) La correspondencia Γ es monótona, en el sentido que x, x′ ∈ X con x ≤ x′ , implica que
Γ(x) ⊆ Γ(x′ ).

Teorema 5.7: Supongamos que X, Γ, F y β satisfacen (S3)-(S6) y que v es la única solución


de (5.12). Entonces v es estrictamente creciente.

Demostración. Sea C ′ (X) ⊂ C(X) el conjunto de las funciones definidas sobre X que son
no decrecientes, continuas y acotadas, y sea C ′′ (X) ⊂ C ′ (X) el conjunto de funciones es-
trictamente crecientes. Dado que C ′ (X) es un subconjunto cerrado de C(X), por lo tanto
un espacio métrico completo, por el Teorema 5.6 y el Corolario al teorema de la aplicación
contractiva, es suficiente con probar que T [C ′ (X)] ⊆ C ′′ (X). Esto queda garantizado por los
supuestos (S5) y (S6). ■

17
5.3.1. Función de valor

(S7) F estrictamente cóncava, es decir, para todo (x, y), (x′ , y ′ ) ∈ A y θ ∈ (0, 1)

F [θ(x, y) + (1 − θ)(x′ , y ′ )] ≥ θF (x, y) + (1 − θ)F (x′ , y ′ ),

con desigualdad estricta si x ̸= x′ .


(S8) Γ es convexa, es decir, para todo x, x′ ∈ X y θ ∈ [0, 1],

y ∈ Γ(x), y ′ ∈ Γ(x′ ) implica que θy + (1 − θ)y ′ ∈ Γ [θx + (1 − θ)x′ ] .

Como consecuencia del supuesto (S8), para cada x ∈ X, el conjunto Γ(x) es convexo y no
hay “rendimientos crecientes”. Dado que X es convexo, (S8) es equivalente a asumir que la
gráfica de Γ (el conjunto A) también es convexo.

Teorema 5.8: Supongamos que X, Γ, F y β satisfacen (S3)-(S4) y (S7)-(S8); supongamos


que v cumple con la condición (5.12) y G satisface (5.13). Entonces v es estrictamente
cóncava y G es una función (aplicación univaluada) continua.

Demostración. Sea C ′ (X) ⊂ C(X) el conjunto de funciones acotadas, continuas y débilmente


cóncavas sobre X y sea C ′′ (X) ⊂ C ′ (X) el conjunto de funciones estrictamente cóncavas.
Dado que C ′ (X) es cerrado y C(X) un espacio métrico completo, por el Teorema 5.6 y el
Corolario al teorema de la aplicación contractiva, basta con demostrar que el operador T
cumple T [C ′ (X)] ⊆ C ′′ (X).
Para verificar esto, sea f ∈ C ′ (X) y sean x0 ̸= x1 , θ ∈ (0, 1) y xθ = θx0 + (1 − θ)x1 .
Supongamos que yi ∈ Γ(xi ) alcanza el máximo de (T f )(xi ) para i = 0, 1. Entonces,

(T f )(xθ ) ≥ F (xθ , yθ ) + βf (xθ )

> θ [F (x0 , y0 ) + βf (x0 )] + (1 − θ) [F (x1 , y1 ) + βf (x1 )]

= θ(T f )(x0 ) + (1 − θ)(T f )(x1 ),

donde la primera lı́nea usa la definición de (T f ) y el hecho que yθ ∈ Γ(xθ ); la segunda,


la hipótesis que f es cóncava y (S7). Dado que x0 , x1 son arbitrarios, T f es estrictamente
cóncava y, dado que f es arbitraria, T [C ′ (X)] ⊆ C ′′ (X).
Por lo tanto, el único punto fijo v es una función estrictamente cóncava. Además, Γ(x)
es convexo para todo x ∈ X, por lo que se sigue que el máximo en (5.14) se alcanza para un
y único. Entonces, G es una aplicación univaluada (función). La continuidad de G se deduce
del hecho que es s.c.s. ■

Convergencia

Un hecho importante es que T preserva ciertas propiedades de v. Formalmente, si v0


cumple cierta propiedad P y esta propiedad P es preservada por T , entonces cada función

18
en {T n v0 } cumple P . Si P es preservada bajo convergencia uniforme, entonces v también
cumple P . Lo mismo sucede con g.
Es necesario determinar en qué sentido las aproximaciones de g, las gn que cumplen con
T n v0 , convergen. Esto se establece en el próximo teorema.

5.3.2. Función de polı́tica

Teorema 5.9 (Convergencia de las funciones de polı́tica): Supongamos que X, Γ, F y β


satisfacen (S3)-(S4) y (S7)-(S8) y que las funciones v y g satisfacen (5.12) y (5.13), respec-
tivamente. Sea C ′ (X) el conjunto de funciones f : X → R acotadas, continuas y cóncavas y
sea v0 ∈ C ′ (X). Definimos {(vn , gn )} por

vn+1 = T vn , n = 0, 1, . . .
gn (x) = argmaxy∈Γ(x) [F (x, y) + βvn (y)] , n = 0, 1, . . .

Entonces, gn → g puntualmente. Si además X es compacto, la convergencia es uniforme.

Demostración. Sea C ′′ (X) ⊂ C ′ (X) como en el teorema anterior, de modo que v ∈ C ′′ (X).
Dado que v0 ∈ C ′ (X), cada función vn , n = 1, 2, . . ., es estrictamente cóncava. Definimos
{fn } y f como

fn (x, y) = F (x, y) + βvn (y), n = 1, 2, . . .

f (x, y) = F (x, y) + βv(y).

Dado que F satisface (S7), cada fn es estrı́ctamente cóncava, como ası́ también lo es f .
Entonces se aplica el Teorema 5.7 y se obtiene el resultado deseado. ■

Una vez que la existencia de una solución única v ∈ C(X) de la ecuación funcional (1.1) se
ha establecido, quisiéramos tratar el problema de maximización en dicho problema como un
problema de optimización ordinario y apicar herramientas estándares del cálculo diferencial
para caracterizar la función g.

5.3.3. Diferenciabilidad

Consideremos, por ejemplo, la ecuación funcional del modelo de crecimiento neoclásico

v(x) = max [u(f (x) − y) + βv(y)] .


0≤y≤f (x)

Si v fuese diferenciable y la solución siempre interior, entonces g estarı́a dada en forma


implı́cita por la condición de primer orden

u′ [f (x) − g(x)] − βv ′ [g(x)] = 0. (5.16)

19
Si, además, supiéramos que v es dos veces diferenciable, puede determinarse la monotonicidad
de g diferenciando la condición (5.16) y analizando la expresión resultante para g ′ . Podemos
hacer supuestos sobre la diferenciabilidad de u y f , pero la diferenciabilidad de v y g deben
determinarse.
Benveniste and Scheinkman (1979) demostraron la diferenciabilidad de v bajo condicio-
nes relativamente generales. Sin embargo, las condiciones para asegurar que v es dos veces
diferenciable (por ende, para la diferenciabilidad de g) son bastante restrictivas.4 Entonces,
hay que ser cuidadosos al usar (5.16) para establecer propiedades de g por diferenciación. Sin
embargo, en casos donde g es monótona, es posible establecer ese hecho por un argumento
directo basado en condiciones de primer orden como (5.16).

Teorema 5.10 (Benveniste–Scheinkman): Sea X ∈ Rl un conjunto convexo, V : X → R


cóncava, x0 un punto interior de X y D un entorno de x0 . Si existe una función cóncava y
diferenciable W : D → R con W (x0 ) = V (x0 ) y W (x) ≤ V (x), para todo x ∈ D, entonces V
es diferenciable en x0 y se cumple que

Vi (x0 ) = Wi (x0 ), i = 1, 2, . . . , l.

Teorema 5.11 (Diferenciabilidad de v): Supongamos que X, Γ, F y β satisfacen (S3)-(S4)


y (S7)-(S8) y que las funciones v y g están definidas por (5.12) y (5.13), respectivamente.
Si x0 es un punto interior de X y g(x0 ) es interior a Γ(x0 ), entonces v es continuamente
diferenciable en x0 con

vi (x0 ) = Fi [x0 , g(x0 )] , i = 1, 2, . . . , l.

Demostración. Dado que g(x0 ) es interior a Γ(x0 ) y Γ es continua, tenemos que g(x0 ) es
interior a Γ(x) para todo x en un entorno D de x0 . Definimos a W en D como

W (x) = F [x, g(x0 )] + βv [g(x0 )] .

Por la concavidad de F y su diferenciabilidad, W es cóncava y diferenciable. Además, dado


que g(x0 ) ∈ Γ(x) para todo x ∈ D,

W (x) ≤ max [F (x, y) + βv(y)] = v(x), para todo x ∈ D,


y∈Γ(x)

con igualdad en x0 . Entonces, v y W satisfacen las hipótesis del Teorema de Benveniste-


Scheinkman y se obtiene el resultado buscado. ■
4 La diferenciabilidad de la función de polı́tica ha sido objeto de estudio en los artı́culos de Araujo (1991)

y Santos (1991).

20
6. Aplicación: modelos de búsqueda
Estudiaremos una aplicación del método de programación dinámica a ciertos problemas
con una elección restringida a dos acciones posibles: aceptar o rechazar una oferta laboral del
tipo “tómala o déjala”. Por ejemplo, un trabajador desempleado enfrenta una distribución
de probabilidad de ofertas salariales o caracterı́sticas de un trabajo, desde donde se realizan
un número limitado de ofertas cada perı́odo. Dada su percepción de la distribución de pro-
babilidad de ofertas, el trabajador debe diseñar una estrategia para decidir cuándo aceptar
o rechazar una oferta.
La teorı́a de búsqueda (search theory) es una herramienta útil en el estudio del desempleo.
En el contexto de esta teorı́a, un trabajador desempleado puede tomar la decisión de rechazar
ofertas y permanecer desempleado en el presente, porque prefiere esperar mejores ofertas más
adelante.5 Esta teorı́a sirve para analizar, por ejemplo, cómo los trabajadores responden ante
variaciones en las tasas de seguro de desempleo, las percepciones de riesgo de la distribución
de salarios, la probabilidad de ser despedido, la calidad de información de los trabajos y la
frecuencia en la que la distribución de salarios puede ser estimada.
Las ideas principales de la teorı́a surgieron de los modelos de búsqueda de McCall (1970),
Jovanovic (1979) y McCall (1991). También un modelo de elección de carrera en Neal (1999).
En lo que sigue, vamos a desarrollar dos versiones del modelo intertemporal de búsqueda de
McCall. Consideremos un trabajador desempleado que está buscando trabajo. Cada perı́odo
el trabajador recibe una oferta salarial w que es una realización de una variable aleatoria.
Las ofertas salariales están idéntica e independientemente distribuidas de acuerdo con una
función de distribución acumulada F (w) conocida por el agente, con soporte en el intervalo
cerrado W = [0, w], de modo que F (0) = 0 y F (w) = 1. También asumimos que existe la
densidad de probabilidad de F y la denotamos con f .6

6.1. Modelo sin despidos ni renuncias


Habiendo recibido una oferta salarial w, un trabajador desempleado puede aceptar la
oferta y percibir un salario w indefinidamente. Si decide rechazar la oferta, recibe c como
compensación por desempleo y debe esperar hasta el próximo perı́odo para recibir una nueva
oferta salarial (si c toma valores negativos puede interpretarse como un costo de búsqueda).
Suponemos por el momento que no hay despidos ni renuncias. Las ofertas rechazadas pierden
validez (no recall ).
El agente es neutral al riesgo y maximiza el valor esperado del valor presente descontado
del ingreso sobre un horizonte infinito. Es decir, maximiza

X
β t yt ,
t=0
5 El modelo también permite incorporar la búsqueda de otras oportunidades de empleo mientras se está

trabajando.
6 Para fines prácticos, dF (w) puede entenderse como f (w)dw.

21
donde 0 < β < 1 es el factor de descuento. Entonces, yt = c si el trabajador está desempleado
en el perı́odo t. Por otro lado, yt = w si el trabajador ha aceptado una oferta para trabajar
por un salario w.
La variable de estado de este problema es simplemente el conjunto de ofertas salariales
y existen dos acciones posibles: aceptar o rechazar. Consideremos un trabajador que acaba
de recibir una oferta w. Si acepta la oferta, el valor descontado del flujo de ingresos es
simplemente w/(1 − β). Si rechaza la oferta, el valor descontado es c más el valor esperado
descontado de seguir desempleado durante un perı́odo hasta que recibe una nueva oferta.
Entonces, el valor v(w) de tener una “oferta en mano” w y tomar la decisión óptima de
aceptar o rechazar la oferta es la solución de la siguiente ecuación de Bellman
( )
Z w
w ′ ′
v(w) = max , c+β v(w ) dF (w ) .
1−β 0

Ahora bien, podemos definir


Z w
Ev := v(w′ ) dF (w′ ), (6.1)
0

ya que el valor de esta integral es una constante. Entonces


 
w
v(w) = max , c + βEv ,
1−β

lo que implica que la regla de decisión óptima toma la forma de un salario de reserva w∗ ,
definido por
w∗
= c + βEv. (6.2)
1−β
La polı́tica óptima consiste en rechazar cualquier oferta menor a w∗ y aceptar cualquier oferta
que sea mayor.
La función de valor representada en la Figura 1 tiene la siguiente forma

c + βEv
 si w ≤ w∗ ,
v(w) = w

 si w ≥ w∗ .
1−β

Por lo tanto, la definición de Ev en (6.1) implica que

w∗ w
w′
Z Z

Ev = (c + βEv) dF (w ) + dF (w′ ). (6.3)
0 w∗ 1−β

Tenemos entonces un sistema de dos ecuaciones (6.2) y (6.3), con dos incógnitas: w∗ y Ev.

22
Figura 1: Función de valor v(w)

Para resolver el sistema, es conveniente sustraer


Z w Z w∗ Z w
′ ′
c + βEv = (c + βEv) dF (w ) = (c + βEv) dF (w ) + (c + βEv) dF (w′ )
0 0 w∗

de ambos lados de la ecuación (6.3) para eliminar Ev. De esta manera, obtenemos

w
w′
Z  
(1 − β)Ev − c = − (c + βEv) dF (w′ ). (6.4)
w∗ 1−β

Resolviendo Ev en términos de w∗ en (6.2)

w∗
 
1
Ev = −c
β 1−β

y sustituyendo esta expresión en ambos lados de (6.4), tenemos que


Z w
β
w∗ − c = (w′ − w∗ ) dF (w′ ). (6.5)
1−β w∗

Para caracterizar la solución que hemos obtenido, definamos la siguiente función


Z w
h(w) = (w′ − w) dF (w′ ).
w

Observe que h(w)/(1 − F (w)) es el incremento esperado en la oferta salarial del próximo

23
perı́odo, condicional a que la oferta sea al menos w.7 La función h cumple con las siguientes
propiedades

h′ (w) = − [1 − F (w)] ≤ 0,

h′′ (w) = f (w) ≥ 0,


R
es decir, es decreciente y convexa. Además, h(0) = Ew = w dF (w) (el salario medio) y
limw→∞ h(x) = 0.

Figura 2: Determinación del salario de reserva w∗

Entonces, podemos reescribir (6.5) como

β
w∗ − c = h(w∗ ). (6.6)
1−β

El lado izquierdo de esta ecuación es el costo en valor presente de una búsqueda adicional
cuando se tiene una oferta w∗ ; y el lado derecho es el valor presente del incremento esperado
en el ingreso si se hace una nueva búsqueda, multiplicado por la probabilidad de dicho
incremento. El salario de reserva es el que iguala el costo marginal y el beneficio marginal de
continuar con la búsqueda.

6.2. Modelo con despidos


Consideremos la siguiente modificación del modelo anterior. Un trabajador enfrenta en
cada perı́odo que está empleado la posibilidad de ser despedido con probabilidad α, donde
7 Esta función h(·) está relacionada con la función de riesgo o hazard function.

24
0 < α < 1. Para simplificar, asumimos que esta probabilidad es independiente del tiempo que
el trabajador ha estado empleado y del salario que percibe. Un trabajador que es despedido
permanece un perı́odo desempleado, recibe una compensación c y vuelve a recibir una oferta
al principio del perı́odo siguiente.
Sea v̂(w) el valor presente esperado del ingreso de un trabajador previamente desempleado
que ha recibido una oferta salarial w y decide si aceptar o rechazar la oferta de manera
óptima. Si rechaza la oferta, recibe la compensación por desempleo c y en el próximo perı́odo
se realiza una nueva oferta salarial w′ que tiene un valor actual esperado para el trabajador
igual a β v̂(w′ ) dF (w′ ). Si acepta la oferta, recibe w este perı́odo; el próximo perı́odo, con
R

probabilidad (1 − α) conserva el trabajo y obitene v̂(w); con probabilidad α es despedido en


el perı́odo siguiente, con lo que debe esperar un perı́odo desempleado para obtener una nueva
oferta salarial, por lo tanto obtiene c + β v̂(w′ ) dF (w′ ). Entonces la ecuación de Bellman es
R

n o
v̂(w) = max w + β [(1 − α)v̂(w) + α (c + βEv̂)] , c + βEv̂ ,

donde Z w
Ev̂ := v̂(w′ )dF (w′ ).
0

Dado que c + βEv̂ es independiente de w, si v̂(w) es creciente en w, entonces el término

w + β [(1 − α)v̂(w) + α (c + βEv̂)]

también es creciente en w y la polı́tica óptima es del tipo salario de reserva. Sea w


e el salario
de reserva. Entonces

c + βEv̂, si w ≤ w,
e
v̂(w) = (6.7)
w + β [(1 − α)v̂(w) + α (c + βEv̂)] , si w ≥ w.

e

Pero dado que v̂ aparece en ambos lados de la igualdad cuando w ≥ w,


e tenemos que

v̂(w) = w + β [(1 − α)v̂(w) + α (c + βEv̂)] ,

que se reduce a

w + βα (c + βEv̂)
v̂(w) = , para w ≥ w.
1 − β(1 − α)
e

Por lo tanto, la función de valor v̂(w) satisface



c + βEv̂,
 si w ≤ w,
e
v̂(w) = w + βα (c + βEv̂)

 , si w ≥ w.
1 − β(1 − α)
e

25
y el salario de reserva w
e satisface

w
e + βα (c + βEv̂)
c + βEv̂ = ,
1 − β(1 − α)

lo que se reduce a

w
e
= c + βEv̂ (6.8)
1−β

y guarda una gran similitud con (6.2). Pero esto no implica que el equilibrio sea el mismo.
A partir de (6.7), podemos obtener una expresión para Ev̂,

w w
w′ + βα (c + βEv̂)
Z e Z  

Ev̂ = (c + βEv̂) dF (w ) + dF (w′ ).
0 w
e 1 − β(1 − α)

Siguiendo un procedimiento similar al del modelo sin despidos, escribimos


Z w
e Z w
Ev̂ = Ev̂ dF (w′ ) + Ev̂ dF (w′ ),
0 w
e

multiplicamos ambos miembros de esta igualdad por β y sumamos c. Luego, restamos el


resultado a la expresión anterior para Ev̂, lo que implica
w
w′ − (1 − β) (c + βEv̂)
Z  
(1 − β)Ev̂ − c = dF (w′ ).
w
e 1 − β(1 − α)

Finalmente, utilizamos (6.8) para eliminar Ev̂ de ambos miembros, con lo que obtenemos
Z w
β
e−c=
w (w′ − w)
e dF (w′ ), (6.9)
1 − β(1 − α) w
e

que es comparable con (6.5). Más precisamente, haciendo α = 0 en (6.9), se obtiene (6.5).
Esto es razonable, ya que el modelo anterior puede interpretarse como un caso especial de
un modelo con despidos cuando la probabilidad de ser despedido es nula. También podemos
reescribir (6.9) para obtener una condición análoga a (6.6), en términos de la función h,

β
e−c=
w h(w). (6.10)
1 − (1 − α)β
e

¿Cuál es el efecto de 0 < α < 1 en la determinación del salario de reserva comparado


con el caso α = 0? Esto puede verse modificando la Figura 2. No es sorprendente que el
beneficio marginal de una búsqueda adicional disminuye con una probabilidad positiva de
despido, lo que desplaza la curva decreciente hacia abajo y a la izquierda, como se muestra
en la Figura 3. Todo lo demás es exactamente igual. Como resultado el salario de reserva
disminuye, es decir we < w∗ , ya que el trabajador está dispuesto a aceptar ofertas menores
para compensar la probabilidad de ser despedido.

26
Figura 3: Determinación del salario de reserva w
e

A. Apéndice: Un par de herramientas matemáticas


A.1. Teorema fundamental del cálculo
Teorema: Sea f una función continua definida sobre un intervalo cerrado [a, b]. Sea F la
función definida por Z x
F (x) = f (t) dt.
a

Entonces F es continua en [a, b] y diferenciable en (a, b). Más aún, F ′ (x) = f (x) para todo
a < x < b.

A.2. Diferenciación bajo el signo de la integral


Teorema: Sean f : [a, b] × R → R, α : [a, b] → R y β : [a, b] → R funciones continuamente
diferenciables. Defina la función
Z β(x)
Φ(x) = f (x, t) dt,
α(x)

para todo a ≤ x ≤ b. Entonces Φ es diferenciable en (a, b) y su derivada es igual a


Z β(x)
Φ′ (x) = fx (x, t) dt + f (x, α(x)) α′ (x) − f (x, β(x)) β ′ (x).
α(x)

Esta fórmula es una generalización de la llamada regla de Leibniz.

27
Referencias
Araujo, A. The once but not twice differentiability of the policy function. Econometrica, 59
(5):1383–1393, 1991.

Benveniste, L. M. and Scheinkman, J. A. On the differentiability of the value function in


dynamic models of economics. Econometrica, 47(3):727–732, 1979.

Blackwell, D. Discounted dynamic programming. The Annals of Mathematical Statistics, 36


(1):226–235, 1965.

Jovanovic, B. Job matching and the theory of turnover. Journal of Political Economy, 87(5,
Part 1):972–990, 1979.

Ljungqvist, L. and Sargent, T. Recursive Macroeconomic Theory. MIT Press, third edition,
2012.

McCall, B. P. A dynamic model of occupational choice. Journal of Economic Dynamics and


Control, 15(2):387–408, 1991.

McCall, J. J. Economics of information and job search. The Quarterly Journal of Economics,
84(1):113–126, 1970.

Neal, D. The complexity of job mobility among young men. Journal of Labor Economics, 17
(2):237–261, 1999.

Santos, M. Smoothness of the policy function in discrete time economic models. Econome-
trica, 59(5):1365–1382, 1991.

Stokey, N. L. and Lucas, R. E. Recursive methods in economic dynamics (with E.C. Prescott).
Harvard University Press, 1989.

28

También podría gustarte