Professional Documents
Culture Documents
de la economía matemática
Ma. Teresa V. Martínez Palacios y Francisco Venegas-Martínez
Educación Matemática, vol. 23, núm. 3, diciembre de 2011, pp. 147-181 147
Introducción
función objetivo, a fin de encontrar las sendas óptimas y obtener así la trayectoria
óptima de las variables de estado a partir de la ecuación de movimiento que las
une (Cerda, 2001). Este problema intertemporal comúnmente se conoce como
problema de control óptimo estocástico en optimización dinámica.
Para establecer el modelo matemático general del problema de control ópti-
mo estocástico en optimización dinámica en tiempo continuo, resulta necesario
disponer del planteamiento general del problema matemático. Para ello, se
considera un sistema dinámico formulado en tiempo continuo en el horizonte
( ) (
temporal [0, T], y se definen las funciones μ t , x,u y σ t , x,u , dadas por, )
μ : R+ ´ R n ´ R k → R n ,
σ : R+ ´ R n ´ R k → R n´d .
X0 = x0, (2)
u : R+ ´ R n → R k ,
definida por
ut = u(t, Xt)
( ( )) dt + σ (t , X ,u (t , X )) dW .
dX t = μ t , X t ,u t , X t t t
(3)t
Además, se impone a u la restricción de que, para cada t, ut ∈ U ⊂ R k , donde
U es la clase de controles admisibles.
Definición 1. Una regla de control u(t, x) es admisible si (Björk, 2004);3
( )
i) u t , x ∈ U , ∀t ∈ R + y ∀x ∈ R n
ii) Para cualquier punto inicial (t, x) dado, la ecuación diferencial estocástica
( ) ( )
dX s = μ s , X s ,u ( s , X s ) ds + σ s , X s ,u ( s , X s ) dWs
Xt = x
( ) ( )
μu t , x = μ t , x ,u
σ (t , x ) = σ (t , x ,u )
u
( ) ( ( ))
μ u t , x = μ t , x ,u t , x
σ (t , x ) = σ (t , x ,u (t , x ))
u
3
Varios de los conceptos teóricos fundamentales utilizados, así como alguna de la nota-
ción adoptada en este documento, provienen del texto de Björk (2004).
( ) ( )
dx i = μi x i , t dt + σ i x i , t dWit
expansión en serie de Taylor y el uso de las reglas del cálculo de Itô, se obtiene el
teorema fundamental del cálculo estocástico (véase el apéndice A, sección A.1),
⎡ ∂f x,t ( ) n
( )
n ∂2f x,t
dy = ⎢
⎢⎣ ∂t
+ 12 ∑ ∑ ( ) ( )
σ ui x i ,t σ uj x i ,t ρij
j =1 i =1 ∂x j ∂x i
( )
n ∂f x,t ⎤ ( )
n ∂f x,t
+∑
∂x i
u
( )
μ i x i ,t ⎥ dt + ∑
⎥⎦ ∂x i
( )
σ ui x i ,t dWit .
i =1 i =1
⎡ ∂f x,t ( ) n
( )
n ∂2f x,t
dy = ⎢
⎢⎣ ∂t
+ 2 ∑∑
1
∂x ∂x
( ) ( )
σ ui x i ,t σ uj x i ,t ρij
j =1 i =1 j i
( )
n ∂f x,t ⎤ ( )
n ∂f x,t
+∑
∂x
( )
μ ui x i ,t ⎥ dt + ∑
⎥ ∂x
( )
σ ui x i ,t dWit .
i =1 i ⎦ i =1 i
dX tu = μ u dt + σ u dWt (4)
donde,
4
Varios de los conceptos teóricos fundamentales utilizados, así como alguna de la nota-
ción empleada en este documento se adoptan del libro de Venegas-Martínez (2008).
( )
ut = u t , X tu
F : R +´ R n ´ R k → R dada por (t , X ,u ) → F (t , X ,u )
u
t t
u
t t
y
Φ : Rn → R dada por X → Φ (X )
u
t
u
t
J0 : U → R
definida por,
⎡T ⎤
() ( ) ( )
J 0 u = E ⎢ ∫ F t , X tu ,ut dt+Φ X Tu F0 ⎥ ,
⎣0 ⎦
()
Ĵ 0 = max J 0 u .
u∈U
()
Ĵ 0 = J 0 û
⎡T ⎤
u s ⎢⎣ t
( )
Maximizar E ⎢ ∫ F s , X su ,us dt + Φ X Tu Ft ⎥
⎥⎦
( )
sujeto a las ecuaciones dinámicas
( ( )) ( (
dX su = μ s , X su ,u s , X su ds + σ s , X su ,u s , X su dWs )) (5)
Xt = x (6)
y a la restricción
( )
u s , y ∈ U , para todo (s , y ) ∈ ⎡⎣t ,T ⎤⎦ ´ R .
n
(7)
Ecuación de Hamilton-Jacobi-Bellman
J : R + ´ Rn ´ U → R
está definida por
⎡T ⎤
( ) ( )
J t , x ,u = E ⎢ ∫ F s , X su ,us ds+ Φ X Tu Ft ⎥
⎢⎣ t ⎥⎦
( )
junto con las ecuaciones dinámicas 5 y 6.
ii) La función de valor óptimo es
Ĵ : R + ´ R n → R
( ) (
Ĵ t , X tu = max J t , x ,u .
u∈U
)
( ) ( )
Considere el par t , x ∈ 0,T ´ R nfijo pero arbitrario y suponga un incre-
mento muy pequeño, de hecho, diferencial dt ∈ R, tal que t < t + dt < T.
También elegimos una regla de control u fija pero arbitraria. Por tanto, dada la
definición de la función de valor óptimo y el incremento dt, se tiene la relación
recursiva temporal (Venegas-Martínez, 2008),
⎡T ⎤
( ) u∈U
( ) ( )
Ĵ t , X tu = max J t , x ,u = max E ⎢ ∫ F s , X su ,us ds + Φ X Tu Ft ⎥
u∈U
⎢⎣ t
( )
⎥⎦
⎡t + dt T ⎤
( ) ( )
= max E ⎢ ∫ F s , X su ,us ds + ∫ F s , X su ,us ds + Φ X Tu Ft ⎥
u∈U
⎢⎣ t t +dt ⎥⎦
( )
⎡t + dt ⎤
( ) (
= max E ⎢ ∫ F s , X su ,us ds + Ĵ t + dt , X tu + dX tu Ft ⎥ ,
u∈U
⎢⎣ t ⎥⎦
)
a esta expresión se le aplica en el primer sumando el teorema del valor medio
de cálculo integral y, en el segundo sumando se aplica expansión en serie de
Taylor, de lo que resulta
simplificando, se tiene
⎡
( )
⎡ ∂Ĵ t , X u
( ) ( )
n ∂Ĵ t , X u
⎢
( )
0 = max E F t , X t ,ut dt + o dt +
u∈U ⎢
u
( )
⎢
⎢ ∂t
t
+∑
∂x
t
μ ui x i ,t
⎣ ⎣ i =1 i
+ 12 ∑ ∑
( ) ( ) ( )
n ∂2 Ĵ t , X u
t
⎤
σ ui x i ,t σ uj x i ,t ρij ⎥ dt + ∑
( ) ( )
n ∂Ĵ t , X u
t
⎤
σ ui x i ,t dWit Ft ⎥ .
∂x j ∂x i ⎥ ∂x i ⎥
j =1 i =1 ⎦ i =1 ⎦
Puesto que dWit ∼ N 1dt2, al tomar valores esperados a los términos aleatorios
de la ecuación anterior, se sigue que:
⎡
( )
⎡ ∂Ĵ t , X u
( ) ( )
n ∂Ĵ t , X u
⎢
( )
0 = max F t , X t ,ut dt + o dt +
u∈U ⎢
u
( )
⎢
⎢ ∂t
t
+∑
∂x
t
μ ui x i ,t
⎣ ⎣ i =1 i
⎤ ⎤
+ 2 ∑∑
1
n
( ) ( ) ( )
n ∂2 Ĵ t , X u
t
σ i x i ,t σ j x i ,t ρij ⎥ dt ⎥ .
u u
∂x ∂x ⎥ ⎥
j =1 i =1 j i ⎦ ⎦
⎧ ⎡
⎪ dt o dt ( ) ( )
⎡ ∂Ĵ t , X u n ∂Ĵ t , X
( ) ( )
u
dt →0
⎪
⎢
u∈U ⎢
(
0 = lim ⎨max F t , X t ,u u
)
dt
+
dt
+ ⎢
⎢ ∂t
t
+∑
i =1 ∂x
t
μ ui x i ,t
⎩ ⎣ ⎣ i
⎤ ⎤⎫
+ 2 ∑∑
1
n
2
( ) ( ) ( )
n ∂ Ĵ t , X
u
t dt ⎪
σ i x i ,t σ j x i ,t ρij ⎥ ⎥⎬
u u
j =1 i =1 ∂x j ∂x i ⎥ dt ⎥⎪
⎦ ⎦⎭
⎡ ∂Ĵ t , X tu ( ) n ∂Ĵ t , X
u
( ) ( )
u∈U ⎢
⎢
(
0 = max F t , X t ,u +
u
) ∂t
+∑
i =1 ∂x i
t
μ ui x i ,t
⎣
2
1 n n ∂ Ĵ t , X t
+ ∑∑
( ) ( ) ( )
u ⎤
σ i x i ,t σ j x i ,t ρij ⎥ .
u u
2 j =1 i =1 ∂x j ∂x i ⎥ (8)
⎦
Puesto que el análisis ha sido realizado sobre un punto fijo pero arbitrario, la
ecuación se sostiene para todo punto 1t, x2 ∈ 10, T2 ¥ Rn, y podemos establecer
ahora el siguiente teorema.
Teorema 1. Ecuación de Hamilton-Jacobi-Bellman
Bajo los supuestos 1 se afirma lo siguiente:
a) Jˆ satisface la ecuación Hamilton-Jacobi-Bellman
⎧ ⎡
( )
∂Ĵ t , X tu ( ) ( )
n ∂Ĵ t , X
u
⎪ (
⎪0 = max ⎢F t , X u ,u +
u ∈U ⎢
) t
∂t
+ ∑ ∂x μui xi ,t
i =1
t
⎪ ⎣ i
⎪
⎪
⎨ + 2 ∑∑
1
n
( ) ( ) ( )
2
n ∂ Ĵ t , X
u
t u u
⎤
( )
σ i x i ,t σ j x i ,t ρij ⎥ para toda pareja (x ,t ) ∈ 0,T ´ R n
⎪ j =1 i =1 ∂x ∂x ⎥
j i ⎦
⎪
⎪
u
( )
⎪ Ĵ (t , X T ) = Φ(X T ) para toda X ∈ 0,T ´ R .
u n
⎪
⎩
b) Para cada 1t, x2 ∈ 10, T2 ¥ Rn, el máximo en la ecuación hjb es alcanzado
por u = û 1t,x2.
0 = F (t , X ,u ) +
u ( ) + ∑ ∂Ĵ (t , X ) μ ( x ,t )
∂Ĵ t , X tu n
u
t u
t i i
∂t ∂x i =1 i
1 n ∂ Ĵ (t , X )
n
2 u
σ ( x ,t ) σ ( x ,t ) ρ .
t
+ ∑∑ u
i i
u
j i ij
2 j =1 i =1 ∂x j ∂x i
0=
(
∂F t , X tu ,u ) + ∂ Ĵ (t , X ) + ∂ ⎛⎜∑ ∂Ĵ (t , X ) μ ( x ,t )⎞⎟
2 u
t
n
u
t u
∂u ∂u∂t ∂u ⎜ ∂x i i
⎟
⎝ i =1 i ⎠
+
⎛
∑∑
2
∂ ⎜ 1 n n ∂ Ĵ t , X t ( ) ( ) ( )
u ⎞
σ i x i ,t σ j x i ,t ρij ⎟ .
u u (9)
∂u ⎜ 2 j =1 i =1 ∂x j ∂x i ⎟
⎝ ⎠
La ecuación 9, condicionada por las funciones F, Jˆ (junto con sus derivadas
parciales) μui , σ ui y σ uj , caracteriza al control óptimo u en función de x y t y Jˆ;
es decir, û = û 1t, xi, Jˆ2.
Para resolver la ecuación de hjb y encontrar la trayectoria óptima del control,
teóricamente se procede a resolver por el método de funciones en variables
separables (en un producto), ya que se trata de una ecuación diferencial parcial
no lineal; aunque es necesario recordar que, en general, es difícil obtener una
solución explícita de la ecuación de hjb. Sin embargo, para el tipo de aplicaciones
que se requieren en las ciencias económicas, existen algunos casos en los que, a
pesar de ser no triviales, la ecuación de hjb tiene una solución analítica; véanse,
al respecto, Merton (1990), Lehoczky (1983) y Hakansson (1970).
Teorema de verificación
⎪ u ∈U ⎢
(
⎪0 = max ⎢F t , X u ,u +
t ) ∂t
+∑
i =1 ∂x i
t
μui x i ,t
⎪ ⎣
⎪
⎨+ 2 ∑ ∑
2
⎪ 1 n n ∂ H t , Xt ( ) ( ) ( )
u ⎤
σ i x i ,t σ j x i ,t ρij ⎥para todo par (x ,t ) ∈ 0,T ´ R n
u u
( )
⎪ j =1 i =1 ∂x j ∂x i ⎥
⎦
⎪
158 nEducación Matemática, vol. 23, núm. 3, diciembre de 2011
⎪H(t , X T ) = Φ(X T ) para todo X ∈ R
u u
⎪
⎪
⎩
Ó
⎪H(t , X T ) = Φ(X T ) para todo X ∈ R
u u n
⎪
⎪
⎩
ii) La función g es una regla de control admisible.
iii) Para cada 1t, x2 ∈ 10, T 2 ¥ Rn, 1t, x2, fijo pero arbitrario, el máximo en la
ecuación de hjb es alcanzado por la elección u = g 1t, x2.
Ĵ (t , X tu ) = H(t , X tu ) .
2) Existe una regla de control óptima û tal que û 1t, x2 = g 1t, x2.
( )
dX t = X t 1 - θt dRB + X t θt dR S - c t dt
= Xt (1 - θ ) rdt + X θ (μdt + σdW ) - c dt
t t t t t
equivalentemente,
dX t
= μ X dt + σ X dWt (13)
Xt
donde
ct
(
μ X = r + θt μ - r - ) Xt
y σ X = θt σ . (14)
X 0 = x0
c t ³ 0, ∀t ³ 0
⎡∞ ⎤
( ) θ∈ R ,0≤c
⎣t s
( )
J X t ,t = max E ⎢ ∫ F c s , s ds Ft ⎥
⎦
⎡t + dt ∞ ⎤
θ∈ R ,0≤c
⎣ t s
( )
= max E ⎢ ∫ F c s , s ds + ∫ F c s , s ds Ft ⎥ ( )
⎦
(16)
t + dt
Al aplicar el teorema del valor medio del cálculo integral al primer sumando
y recursividad al segundo sumando, se obtiene que
( )
J X t ,t = max
θ∈ R ,c t ⎡t ,t + dt ⎤
{F (c ,t ) dt + o (dt ) + J ( X
t t ) }
+ dX t ,t + dt Ft .
⎣ ⎦
( )
J X t ,t = max
θ∈ R ,c t ⎡t ,t + dt ⎤
{F (c ,t ) dt + o (dt ) + J ( X ,t ) + dJ ( X ,t ) + o (dt ) F }
t t t t
⎣ ⎦
consecuentemente,
0= max
θ∈ R ,c t ⎡t ,t + dt ⎤
{F (c ,t ) dt + o (dt ) + dJ ( X ,t ) F } .
t t t
⎣ ⎦
⎫
⎡ ∂J X ,t
+⎢
t ( )
+
∂J X t ,t
X tμX +
2
1 ∂ J X t ,t 2 2 ⎥
X σ
⎤
( )
dt F
⎪
⎬.
( )
t X t
⎢⎣ ∂t ∂X t 2 ∂X t 2
⎥⎦ ⎪⎭
+
( ) dt + ∂J ( X ,t ) X μ
∂J X t ,t t
dt F
⎫⎪
⎬.
t X t
∂t ∂X t ⎭⎪
⎧⎪ ∂J X t ,t ( )
∂J X t ,t ( ) 2
1 ∂ J X t ,t 2 2 ⎪
⎫
( )
0 = max ⎨F c t ,t +
θ∈ R ,c
( )∂t
+
∂X t
X tμX +
2 ∂X t2
X t
σ X
⎬ . (17)
t
⎩⎪ ⎭⎪
( )
F c t ,t = e -ρt c γ , con 0 < γ < 1,
lo que forzará a que el consumo sea positivo a través del horizonte temporal.
Al suponer máximo interior y hacer las sustituciones correspondientes, de la
edp de hjb se obtiene
∂J X t ,t( )∂J X t ,t ( )
⎛ c ⎞
0 = e -ρt c γ +
∂t
+
∂X t ⎝
(
X t ⎜⎜r + θt μ - r - t ⎟⎟
Xt ⎠
(18) )
2
( )
1 ∂ J X t ,t 2 2
+
2 ∂X t 2 ( )
X t θt σ .
Lo que ahora se requiere es optimizar para ct y qt. Las condiciones de primer
orden son:
0 = e - ρt γc γ -1 -
( )
∂J X t ,t
⇒ γc γ -1 =
( )e
∂J X t ,t ρt
∂X t ∂X t
6
Si la función de utilidad es tal que su medida de aversión absoluta o relativa al riesgo
es positiva e hiperbólica en el consumo y puesto que se ha supuesto que los precios de los
activos son generados por el movimiento browniano, será posible obtener soluciones explícitas
para el consumo y portafolio óptimos. Para un amplio análisis de funciones de utilidad de tipo
hara, véanse por ejemplo Merton (1990) y Hakansson (1970).
( ) (μ - r )
∂J X t ,t
( )X
∂J X t ,t 2
∂ J X t ,t ( )X θσ ∂X
0=
∂X t t (μ - r ) + ∂X 2
2
t t
2
⇒ θt =-
∂ J ( X ,t )
2
t
.
t t 2
Xσ t
∂X t2
Ahora, para elegir la función J 1Xt, t 2 que satisfaga la edp de hjb y toda vez
que se trata de una ecuación diferencial parcial no lineal, su función solución es
un producto de funciones en variables separables (en un producto) de la forma
( ) ( )
J X t ,t = V x t h(t )e -ρt , es decir,
( )
J X t ,t = h(t )e -ρt x γ . (19)
( ) = -ρx h t e
∂J X t ,t
∂t
() γ -ρt
()
+ x γhʹ t e -ρt .
⇒ ĉ = xh γ-1 t , ()
( ) (μ - r )
∂J x t ,t
θt = -
∂x t
=-
(μ - r ) γx e γ-1 -ρt
⇒ θ̂t = -
(μ - r ) . (22)
∂ J ( x ,t )
2
t
x σ γ ( γ - 1) x e
2 t
2 γ-2 -ρt
σ ( γ - 1)
2
xσ t
∂x t2
⎡ ⎛ 2 ⎞ 2 ⎤
⎢ ⎜ μ -r ( ) ( )
⎟ + 1 γ μ - r ⎥ y k = 1 - γ ,
( )
k1 = ⎢ -ρ + γ ⎜r - 2 ⎟⎟ 2 σ 2 γ - 1 ⎥ ( ) (24)
⎢⎣
⎜ σ γ -1
⎝ ( ) ⎠ ( ⎥⎦
2
)
se tiene la ecuación diferencial ordinaria
⎡ γ ⎤
()
0 = x γ ⎢hʹ t + k1h t + k2h γ-1 t ⎥ .
⎢⎣ ⎥⎦
() (25) ()
Si esta ecuación se sostiene para toda x y t, entonces h1t 2 debe de resol-
ver la ecuación
γ
() ()
hʹ t + k1h t = -k2h γ-1 t , () (26)
γ
la cual es una ecuación de Bernoulli con p 1x 2 = k1, q 1x 2 = -k2 y n = . Para
γ -1
transformar la ecuación de Bernoulli en una ecuación diferencial lineal de una
1
-
función (desconocida), sustituimos z = h1-n t = h () γ-1
(t ), de donde se tiene
() () ( )
que h t = z 1- γ y hʹ t = 1 − γ z - γ z ʹ, al sustituir en 26 y multiplicar ambos lados
zγ
de la ecuación por , se obtiene,
1− γ ( )
k1 k2
zʹ + z =- o z ʹ + k11z = -k22 . (27)
(1 − γ) (1 − γ)
Para resolver esta ecuación lineal, se tiene que el factor integrante está dado
por
μ t =e∫ ()
k11dt
=e
tk11
,
∫ μ (t ) q (t ) dt + k -k22 ∫ e dt + k5
tk11
k11 5
()
z t =
5
= = (28)
μ t() e
tk11
e
tk11
k22 -tk
=- + k 5e , 11
k11
y, por tanto,
1- γ
⎛ k ⎞
()
h t = ⎜⎜ - 22 + k5e
k
⎝ 11
-tk 11
⎟⎟
⎠
.
(29)
Hemos mostrado que, si J está definida por 19 con h1t 2 dada por 29 y defini-
da como la solución de 25 y si definimos q̂ y ĉ por 21 y 22, entonces J satisface
la ecuación de hjb y q̂ y ĉ consiguen optimizar el problema de control óptimo.
⎛ c ⎞
dX t = X t ⎜⎜r + θt α - r - t
⎝ Xt
( ) ⎟⎟ dt + X t θt σdWt ,
⎠
(32)
equivalentemente,
dX t
= α X dt + σ X dWt (33)
Xt
donde
ct
α X = r + θt α - r - ( ) Xt
y σ X = θt σ. (34)
Dados los supuestos del problema, obsérvese que el agente puede pedir
prestada una cantidad ilimitada e invertirla en acciones, por lo que, en algún
momento, su riqueza podría llegar a ser cero e incluso negativa. De esta manera,
T es una variable aleatoria, la cual se llama tiempo de paro. Para librar este pro-
{
blema, se restringe el dominio a D = 0,T ´ x x > 0 , y se define la función }
τ = min⎡⎣inf t > 0 X t = 0 ,T ⎤⎦ ,
{ }
y la interpretación correspondiente es que, cuando el proceso de riqueza pegue
en la frontera del dominio, es decir, sea cero, entonces la actividad se termina y
ya no hay herencia, de esta manera lo natural es que f sea cero.
En resumen, y estableciendo formalmente el problema de maximización de uti-
lidad del consumidor como un problema de control óptimo estocástico, se tiene
⎡τ ⎤
Maximizar E ⎢ ∫ F t ,c t dt F0 ⎥,
θ ,c
⎣0 ⎦
( )
t t ( )
dX = X θ α - r dt + X r - c dt + X θ σdW ,
t ( t t )
(35)
t t t
X 0 = x0 ,
c t ³ 0, ∀t ³ 0.
Para dar solución a nuestro problema y encontrar las proporciones óptimas
en el portafolio de inversión y el consumó óptimo del agente maximizador, defi-
nimos la función de valor de nuestro problema de la siguiente manera:
⎡τ ⎤
( )
J X t ,t = max E ⎢ ∫ F c s , s ds Ft ⎥
θ∈ R ,0≤c
⎣t ⎦
s ⎡t , τ ⎤
( ) (36)
⎣ ⎦
⎡t + dt τ ⎤
θ∈ R ,0≤c
⎣ t
( )
= max E ⎢ ∫ F c s , s ds + ∫ F c s , s ds Ft ⎥.
⎦
( )
s ⎡t , τ ⎤
t + dt
⎣ ⎦
Después de aplicar el teorema del valor medio del cálculo integral al primer
sumando y recursividad al segundo sumando, se obtiene que
( )
J X t ,t = max
θ∈ R ,0≤c t ⎡t ,t + dt ⎤
{F (c ,t ) dt + o (dt ) + J ( X
t t ) }
+ dX t ,t + dt Ft .
⎣ ⎦
( )
J X t ,t =
θ∈ R ,0≤c t
max
⎡t ,t + dt ⎤
⎣ ⎦
{F (c ,t ) dt + o (dt ) + J ( X ,t ) + dJ ( X ,t ) + o (dt ) F }
t t t t
por consiguiente,
0=
θ∈ R ,0≤c s
max
⎡t ,t + dt ⎤
{F (c ,t ) dt + o (dt ) + dJ ( X ,t ) F } .
t t t
⎣ ⎦
⎧⎪ ∂J X t ,t ( )
0= max
θ∈ R ,0≤c t
( )
⎨F c t ,t dt + o dt +
∂X t
( )
X t σ X dWt
⎡t ,t + dt ⎤
⎣ ⎦ ⎩⎪
⎫
+ ⎢ t ( )
⎡ ∂J X ,t
+
∂J X t ,t
X t αX +
2
( )
1 ∂ J X t ,t 2 2 ⎥
⎤ ⎪
X t σ X dt Ft ⎬ .
( )
⎢⎣ ∂t ∂X t 2 ∂X t 2
⎥⎦ ⎪⎭
⎧⎪ 2
1 ∂ J X t ,t 2 2 ( )
0= max
θ∈ R ,0≤c
⎨F c t ,t dt + o dt +
⎪⎩t ⎡t ,t + dt ⎤
( )
2 ∂X t2
( )
X t σ X dt
⎣ ⎦
+
∂J X t ,t( ) dt +
∂J X t ,t ⎫⎪
X t α X dt Ft ⎬ .
( )
∂t ∂X t ⎪⎭
⎧⎪ ∂J X t ,t ∂J X t ,t ( ) 2
( )
1 ∂ J X t ,t 2 2 ⎪
⎫
( )
0 = max ⎨F c t ,t +
θ∈ R ,0≤c
⎪⎩ ∂t
t
+ ( )
∂X t
X t αX +
2 ∂X t2
X t
σ X
⎬.
⎪⎭
Ï
⎧⎪ ⎫
( )
∂J X t ,t ( )
∂J X t ,t 2
( )
1 ∂ J X t ,t 2 2 ⎪ ,
0= max ( )
⎨F c t ,t + + X t αX + X σ ⎬
Ì
t X
θ∈ R ,0≤c t ⎡t ,t + dt ⎤
⎣ ⎦ ⎪⎩ ∂t ∂X t 2 ∂X t2 ⎪⎭
( )
J T , x = 0,
Ó J (t , 0) = 0. (37)
lo que forzará a que el consumo sea positivo a través del horizonte temporal.
Al suponer máximo interior y hacer las sustituciones correspondientes en la
edp de hjb, se tiene
( )
c γ ∂J X t ,t ∂J X t ,t( ) ⎛ c ⎞
0 = e -ρt
γ
+
∂t
+
∂X t
(
X t ⎜⎜r + θt α - r - t ⎟⎟
⎝ Xt ⎠
)
2
( )
1 ∂ J X t ,t 2 2
+
2 ∂X t 2 ( )
X t θt σ . (38)
Ahora bien, para elegir la función J 1Xt, t 2 que satisfaga la edp de hjb y ya que
se trata de una ecuación diferencial parcial no lineal, su solución es un producto
de funciones separables de tal manera que:
γ
( )
J X t ,t = e -ρt h t ( ) xγ , (40)
junto con h 1T 2 = 0 debido a las condiciones de frontera de la ecuación de hjb.
Dado J, se tiene que
( )=x
∂J x t ,t γ
e -ρt hʹt - ρ
x γ -ρt
e ht
∂t γ γ
( )=x
∂J x t ,t γ-1 -ρt
e ht
∂x t (41)
( )=
∂2 J x t ,t
∂x t2
( γ - 1) x γ-2 -ρt
e ht .
Si sustituimos los valores de 41 en 39, se obtiene:
1 1
c tγ−1 = x γ-1e -ρt ht e ρt ⇒ c t = ⎡⎣x γ-1ht ⎤⎦ γ-1 ⇒ ĉ t = xh γ-1 t , (42)
θ̂t = -
(
x γ-1e -ρt ht x t α - r ) =-
(α - r ) , (43)
( γ - 1) x γ-2 -ρt
e ht x σ 2
t
2
σ ( γ - 1)
2
⎧ ⎡ ⎛ 2 ⎞ 2 ⎤
⎪ 1 ⎢⎛ ρ ⎞ ⎜ α -r
0 = x ⎨hʹt + ht ⎢⎜ - ⎟ + ⎜r - 2
γ ( ) (
⎟- 1 α -r ) ⎥
⎟⎟ 2 σ 2 γ - 1 ⎥
⎪
⎩
γ
⎢⎣⎝
γ⎠ ⎜ σ γ -1
⎝ ( ) ⎠ ( ) ⎥⎦
+
(
1 - γ γ-1γ
h t ⎬ .
⎫⎪)
γ ⎪⎭
Después de multiplicar por g, se tiene que
⎧ ⎡ ⎛ 2 ⎞ 2⎤
⎪ ⎢ ⎜ γ α -r ⎟ 1 γ α -r ⎥ ( ) ( )
γ
( )
0 = x ⎨hʹt + ht ⎢ -ρ + ⎜r γ - 2 -
σ γ - 1 ⎟⎟ 2 σ 2 γ - 1 ⎥
⎪
⎩ ⎢⎣
⎜
⎝ ⎠ ⎥⎦( ) ( )
γ ⎫⎪
(
+ 1- γ h ) γ-1
t ⎬ .
⎪⎭
Si se sustituyen los términos constantes por
⎡ ⎛ 2 ⎞ 2⎤
⎢ ⎜ (
γ α -r ⎟ 1 γ α -r ⎥ ) ( )
( )
⎢ -ρ + ⎜⎜r γ - σ 2 γ - 1 ⎟⎟ - 2 σ 2 γ - 1 ⎥ = k3 y k4 = 1 - γ ( )
⎢⎣ ⎝ ⎠ ( ) ⎥⎦ ( )
se obtiene la ecuación diferencial ordinaria
⎧⎪ γ ⎫⎪
0 = x γ ⎨hʹt + k3ht + k4h γ-1 t ⎬ . (44)
⎪
⎩ ⎪
⎭
Si esta ecuación se sostiene para toda x y t, entonces h 1t 2 debe de resolver
la ecuación
γ
zγ
ambos lados de la ecuación por 1 − γ , se obtiene,
( )
172 Educación Matemática, vol. 23, núm. 3, diciembre de 2011
k3 k4
zʹ + z =- o z ʹ + k33 z = -k44 , (46)
(1 - γ) (1 - γ)
para resolver esta ecuación lineal, se tiene que el factor integrante está dado por:
μt = e ∫
k 33 dt
=e
tk 33
,
z t = =
μt e
tk 33
k
- 44 ∫ eu du + k6
k33 k -tk
(47)
= = - 44 + k6e , 33
e
tk 33
k33
y, por tanto,
1- γ
⎛ k -tk
⎞
ht = ⎜⎜ - 44
+ k6e ⎟⎟ . 33
(48)
⎝ k33 ⎠
k Tk
⇔ 44 e = k6 33
k33
por consiguiente, la solución de 45 está dada por,
1- γ
⎛ k k44 (T -t )k ⎞
ht = ⎜⎜ - 44
+ e ⎟⎟ . 33
(49)
⎝ k33 k33 ⎠
Hemos así mostrado que si J está dada por 40, con 49 definida como la
solución de 45 y si definimos q̂ y ĉ por 43 y 42, entonces J satisface la ecuación
de hjb y q̂ y ĉ consiguen optimizar el problema de control óptimo con horizonte
temporal estocástico.
Conclusiones
7
Para una amplia clasificación de las funciones tipo hara, véanse por ejemplo Merton
(1990) y Hakanson(1970).
Apéndice A
( ) ( )
dx i = μ i x i ,t dt + σ i x i ,t dWit , (A.1)
dt dWit dWjt
dt 0 0 0
dWit 0 dt rijdt
dWjt 0 rijdt dt
∂f x,t( ) dt + ∑ ∂f ( x,t ) dx
n
( )
df x,t =
∂t ∂x i i
i =1
+ ⎢∑
⎡ 2
1 n ∂ f x,t ( )
dx 2
+
n n ∂2f x,t
∑ ∑ ∂x ∂x dxi dx j
( )
i
2 ⎢⎣ i =1 ∂x i2 j =1 i =1 j i
+∑ ∑
n
( ) dx dx + ∑ ∂ f ( x,t ) dx dt
∂2f x,t n 2
j i i
i =1 j =1 ∂x i ∂x j i =1 ∂t∂x i (A.2)
n
+∑
2
∂ f x,t( ) dtdx t +
∂ f x,t
dt
2
2
⎤
( )
⎥.
Educación Matemática, vol. 23, núm. ∂x i ∂t de 2011 ∂t 2
i =13, diciembre ⎥⎦ 175
+ ⎢∑
⎡ 2
1 n ∂ f x,t
dx 2
+
n
( )
n ∂2f x,t
∑ ∑ ∂x ∂x dxi dx j
( )
i
2 ⎢⎣ i =1 ∂x i2 j =1 i =1 j i
Control óptimo
2 estocástico en la enseñanza de la economía matemática
+∑ ∑
n n 2
∂ f x,t ( ) dx dx + ∑ ∂ f ( x,t ) dx dt n
j i i
i =1 j =1 ∂x i ∂x j i =1 ∂t∂x i
+∑
( ) dtdx
n ∂2f x,t
+
∂2f x,t ( ) dt ⎤⎥ . 2
(A.2)
t
∂x ∂t
i =1 i
∂t 2 ⎥⎦
∂f x,t ( ) dt + n ∂f x,t ( )μ
( )
df x,t =
∂t i =1 ∂x i i
x i ,t dt + σ i x i ,t dWit +
∑ ( ( ) ( ) )
⎡ n ∂2f x,t ( ) 2
+ 12 ⎢∑ 2
⎢⎣ i =1 ∂x i
μ i x i ,t dt + σ i x i ,t dWit ( ( ) ( ) )
+∑ ∑
n n ∂2f x,t ( ) dx dx
i j
j =1 i =1 ∂x j ∂x i
+∑ ∑
n n ∂2f x,t ( ) dx dx ⎤⎥ ,
j i
i =1 j =1 ∂x i ∂x j ⎥⎦
al sustituir
( ) ( ) ( ) ( )
dx i2 = μ i2 x i ,t dt 2 + 2μ i x i ,t σ i x i ,t dtdWit + σ i2 x i ,t dWit2 .
dx i dx j = μ ( x ,t ) μ ( x ,t ) dt + μ ( x ,t ) σ ( x ,t ) dtdW
i i j j
2
i i j j jt
+μ ( x ,t ) σ ( x ,t ) dtdW + σ ( x ,t ) σ ( x ,t ) dW dW
j j i i it i i j j it jt
= σ ( x ,t ) σ ( x ,t ) ρ dt .
i i j j ij
∂f x, t( ) dt + n ∂f x, t ( )μ n ∂f x, t ( )σ
( )
df x, t =
∂t
∑ ∂x i i ( x , t ) dt +∑
i
∂x i i ( x , t ) dW
i it
i =1 i =1
n ∂2f x, t ( )μ n ∂2f x, t ( ) 2μ
+ 12 ∑
∂x i 2
2
i ( )
x i , t dt 2 + 12 ∑
∂x i2
i ( x , t ) σ ( x , t ) dtdW
i i i it
i =1 i =1
n ∂2f x, t ( )σ
+2∑ 1
∂x i2
2
i ( x , t ) dW
i it
2
∑
n 2
∂x,f t x,t
2σ 1x ,t ρ ⎥ dt
⎤
n ∂ f x, t
2
1
22 ∑ ∂x∂x
j =1 i =1
2 ( )j
μ
∂x ii i ( ) ( )
y2Francisco ,t Venegas-Martínez
σxi , tx i dt +j
2 ∑
i ij
⎥⎦ 2
∂x
2μi x i , t σ i x i , t dtdWit
i =1 i i =1 i
∂ (f x,) t 2
( )
n n ∂f 2 x,t
++12∑ ∑ σ i σ( xi i ,tx)i dW
( ) , t dW
it
. it2
i =1
i =1
∂x∂x 2
i i
n
( ) σ x ,t σ x ,t ρ dW dW
n ∂2f x,t
i ( i ) j ( i ) ij
+ 12 ∑ ∑ it jt
j =1 i =1 ∂x j ∂x i
+ 12 ∑ ∑
n
( ) σ σ ρ dW dW ⎤⎥
n ∂2f x,t
j i ji jt it
i =1 j =1 ∂x i ∂x j
⎥⎦
∂f ( x,t ) n ∂f x,t
( ) μ x ,t dt + n ∂f ( x,t ) σ x ,t dW
i ( i ) ∑ ∂x i ( i ) it
= dt + ∑
∂t i =1 ∂x i i =1 i
2
( )
1 n ∂ f x,t 2
2
1 n n ∂ f x,t ( )
+ ∑
2 i =1 ∂x i2
σ i
x i
,t dt + ∑∑( ) ( ) ( )
σ x ,t σ j x i ,t ρij dt
2 j =1 i =1 ∂x j ∂x i i i
2
1 n n ∂ f x,t ( ) ⎤
+ ∑∑
2 i =1 j =1 ∂x i ∂x j
( ) ( )
σ j x i ,t σ i x i ,t ρ ji dt ⎥ ,
⎥⎦
⎡ ∂f x,t ( )
n ∂f x,t
( )
( )
df x,t = ⎢
⎢⎣ ∂t
+∑
∂x i
μ i x i ,t ( )
i =1
2
1 n n ∂ f x,t ( ) ⎤
+ ∑∑
2 j =1 i =1 ∂x j ∂x i
( ) ( )
σ i x i ,t σ j x i ,t ρij ⎥ dt
⎥⎦
n ∂f x,t
( )
+∑
∂x i
σ i x i ,t dWit . ( ) (A.3)
i =1
n n
( )σ
∂2f x,t
+ 1
2 ∑∑ i ( x ,t ) σ ( x ,t ) ρ dW dW
i j i ij it jt
A.2. Demostración del i =1 ∂x j ∂x
j =1teorema dei verificación para programación dinámica
+ ∑∑
Demostración del teorema
∂2f x,t
1
n
2. Supóngase
n
( )
σ j σque
ρ H
dW y g
dWson
⎤
⎥ dadas como se enunció
2 i ji jt it
anteriormente. Se elije una =1 ∂x
i =1 j regla de
i
∂x control
j arbitraria u⎥⎦ Œ U y un punto fijo 1x, t 2.
Se define el proceso∂fX x,t
u
en el intervalo de tiempo 3t, T 4 como n ∂f la
x,tsolución de la
( ) n ∂f x,t
( ) ( )
ecuación =
∂t
dt + ∑
∂x i
μ i x i ,t dt +∑ ( ) ∂x i
σ i x i ,t dWit ( )
i =1 i =1
2
1 n ∂ f x,t 2 ( ) 2
1 n n ∂ f x,t ( )
+ ∑ ( )
σ i x i ,t dt + ∑ ∑ ( ) ( )
σ x ,t σ j x i ,t ρij dt
2 j =1 i =1 ∂x j ∂x i i i
Educación Matemática, vol. 23,2 núm.
2
i =1 3,∂x
diciembre
i de 2011 177
2
1 n n ∂ f x,t ( ) ⎤
+ ∑∑
2 i =1 j =1 ∂x i ∂x j
( ) ( )
σ j x i ,t σ i x i ,t ρ ji dt ⎥ ,
⎥⎦
( )
dX su = μ s , X su ds + σ s , X su dWs , ( ) (A.4)
Xt = x. (A.5)
( ) ( ( ) ) ( )
H T , X Tu = H t + T - t , X tu+ (T −t ) = H t , X tu + dH t , X tu ( )
⎧ ∂H s , X u
⎪ T
( ) + 1 ∑ ∑ ∂ H (s , X ) σ ( x ,t ) σ ( x ,t ) ρ
n n
2 u
( )
=H t,X + ∫ ⎨
u
t
t ⎪ ∂t
s
2 ∂x ∂x
j =1 i =1
s u
i i
u
j i ij
⎩ j i
+∑
(
n ∂H s , X
u
s ) ( )⎫
⎪
μ i x i ,t ⎬ ds +
u
T ⎧ n ∂H s , X u
⎪ s
∫ ⎨∑ ∂x σ i xi ,t
( ) ( )⎫⎪⎬ dW . (A.6)
is
i =1 ∂x i ⎪⎭ t ⎪ i =1 ⎪
⎩ i ⎭
2
1 n n ∂ H t,x u ( ) ⎞
+ ∑∑
2 j =1 i =1 ∂x j ∂x i
( ) ( )
σ i x i ,t σ uj x i ,t ρij ⎟ ds ≤ 0, ∀u ∈ U ,
⎟
⎠
( ) ∫ F (s , X ,u ) ds + Φ ( X )
H t , X su ³
t
u
s
u
T
T
⎪
- ∫ ⎨∑
(
⎧ ∂H s , Xn
) ⎫
⎪
σ ( x ,t )⎬ dW
u
s
i i is
t ⎪⎩ i =1 ∂x i ⎪⎭
( ) ( ) (
H t , X su ³ max J t , x ,u = Ĵ t , X tu , ) (A.8)
esto toda vez que la regla de control u fue elegida arbitrariamente.
Ahora, suponga que se elige una regla de control u1t, x 2 = g 1t, x 2, dado por
supuesto el inciso iii del teorema 2, de manera análoga se obtiene,
∂H t , x ( ) ⎛ n ∂H t , x ( )
∂t
( )
+ F g t , x + ⎜∑
⎜
μ ig x i ,t ( )
⎝ i =1 ∂x i
2
1 n n ∂ H t,x g ( ) ⎞
+ ∑∑
2 j =1 i =1 ∂x j ∂x i i i
( ) ( )
σ x ,t σ j x i ,t ρij ⎟ ds = 0,
g
⎟
⎠
( )u
Dado que Ĵ t , X t es la función de valor óptima, se tiene que
( ) ( )
Ĵ t , X tu ³ J t , x , g , (A.10)
( ) ( )
H(t , X su ) ³ Ĵ t , X tu ³ J t , x , g = H(t , X su ) ,
es decir,
( ) (
H(t , X su ) = Ĵ t , X tu = J t , x , g )
por tanto, H = Jˆ y g es la regla de control óptima.
Referencias bibliográficas