第2章 最优控制理论
2.1 静态最优化复习
(1)一元最优化(Single variable optimization ) 考虑以下无约束的最大化问题, max ()x
f x (2.1)
如果是最小化问题,可以转化为等价的最大化问题,即
[]min ()max ()x
x
f x f x - (2.2)
因此,在本章我们只考虑最大化问题。 一阶条件:*
()0f x ¢= (参见图2.1)
图2.1、 一元函数最大化的一阶条件
二阶条件:*
()0f x ¢¢£ (如果二阶导数严格小于0,则最大值唯一)
证明:在最大值*
x 处,将目标函数()f x 进行二阶泰勒展开。
注:如果()f x 为凹函数,则二阶条件自动满足。凹函数的经济含义:边际收益递减、边际产出递减、边际效用递减。凹函数的几何含义是,函数增长的速度慢于切线的速度,参见图2.2。
图2.2、 凹函数的几何意义
(2)价值函数及包络定理(The Value Function and the Envelope Theorem )
考虑带参数的一元最优化问题。 max (,)x
f x a (2.3)
其中,a 为参数。
一阶条件为,
*(,)
0()f x a x x a x
?= =? (2.4) 定义“价值函数”(Value function )为,
()()max (,)(),x
V a f x a f x a a o= (2.5)
即当参数取值为a 时,目标函数的最大值。
包络定理(The Envelope Theorem ):关心当参数a 变化时,价值函数()V a 如何变化,即求()V a ¢。
()()()0
(),(),(),()()df x a a f x a a f x a a x a V a da
x a a
=???¢=
=
+
???
(2.6)
由于*
()x x a =为最优解,故满足一阶条件
(,)
0f x a x
?=?,因此
()()*()
,(),()x x a f x a f x a a V a a
a
=??¢=
=
?? (2.7)
直观来说,由于()()(),V a f x a a o,故a 的变化有两个效应。一个为直接效应,即
()(),f x a a a ??;而另一个为通过x 而起的间接作用,即()(),()
f x a a x a x a ???
??。但由于x 的取值为最优,故x 的微小变化对(,)f x a 的影响可以忽略。
(3)多元最优化(Multivariate optimization ) {}
1212,,,max (,,,)n n x x x f x x x (2.8)
一阶条件为,
10,,0n
f f
x x ??==?? (2.9) 二阶条件为,海赛矩阵(Hessian )H 为“半负定”(negative semi-definite )
1112121
22
21
2............
...
......
n n n n nn f f f f f f H f f f ??÷?÷?÷?÷?÷?÷=?÷?÷÷?÷?÷?÷?è?
(对称矩阵),其中2ij i j f f x x ?=??
证明:在最大值*
x 处,将目标函数()f x 进行二阶泰勒展开。
注:如果12(,,,)n f x x x 为凹函数(参见图2.3),则其海赛矩阵半负定,二阶条件自动满足。
图2.3、 多维的凹函数
(4)有等式约束的最优化(Optimization with equality constraints )
张五常曾经说过,经济学的实质就是约束条件下的最优化问题。
{}
1212,,,12()max
(,,,)
..(,,,)n n x x x n V a f x x x s t g x x x a
o= (2.10)
其中,a 为参数。
例:12(,,,)n x x x 为n 种商品的消费量,12(,,,)n f x x x 为效用函数,a 为收入,
12(,,,)n g x x x a = 为预算约束。
几何解法:无差异曲线与预算约束线,参见图2.4。
图2.4、 消费者的效用最大化问题
在无差异曲线与预算约束线相切处,就是最优解。因此,在最优解处,与无差异曲线及预算约束线垂直的“法向量”(normal vector )都指向同一方向,即两个法向量只能相差一个常数的倍数(向量的方向相同,但长度可以不同)。
无差异曲线(0
12(,,,)n f x x x U = )的法向量为1n f f x x ¢????÷?÷?÷?÷??è?
(函数12(,,,)n f x x x 的梯度向量),而预算约束线(12(,,,)n g x x x a = )的法向量为1n g g x x ¢????÷?÷?÷?÷??è?
(函数12(,,,)n g x x x 的梯度向量)。因此,最优解须满足以下一阶条件,
1
2
x 2
x 1
11n n f g x x f g x x l ??????÷÷??÷÷??÷÷????÷÷??÷÷??÷÷??÷÷??÷÷=÷÷??÷÷??÷÷??÷÷????÷÷??÷÷??÷÷÷÷????è?è
? (2.11) 其中,l 为常数,其含义为两个法向量长度的倍数。如果引入一个“拉格朗日函数”
(Lagrangian ),可以很方便地得到上述一阶条件。
{}
[]12121212,,,;()max
(,,,;)(,,,)(,,,)n n n n x x x V a L x x x f x x x a g x x x l l l o
=+- (2.12)
其中,l 被称为“拉格朗日乘子”(Lagrange multiplier ),是一个新引入的选择变量。在形式上,这是一个无约束的最大化问题,其一阶条件为,
1111200(,,,)0n n n n L f g x x x L f g x x x L a g x x x l l l ì?????=-=???????????í????=-=???????????=-=????
(2.13) 一阶条件共有(1)n +个方程求解(1)n +个未知数12(,,,;)n x x x l 。根据包络定理, ()V a l ¢= (2.14) 因此,l 为边际地增加收入a 所能带来边际效用的增加。如果将a 理解为一种资源,则l
可被视为这种资源的“影子价格”(shadow price )或“约束条件的影子价值”(shadow value of the constraint ),即放松约束条件12(,,...,)n g x x x a =所能带来目标函数的边际增加。
如果有多个约束条件,则可以引入多个拉格朗日乘子。以两个约束条件为例,
{}
1212,,,1212max
(,,,)..(,,,)(,,,)n n x x x n n f x x x s t g x x x a h x x x b
== (2.15)
设立拉格朗日函数为,
[][]12121212(,,,;,)(,,,)(,,,)(,,,)n n n n L x x x f x x x a g x x x b h x x x l m l m =+-+- (2.16) 一阶条件为,