基本信息
文件名称:最优化理论与方法 教学课件 9 动态规划.pdf
文件大小:484.26 KB
总页数:21 页
更新时间:2025-06-05
总字数:约1.02万字
文档摘要
动态规划(DynamicProgramming)
动态规划是解决多阶段决策过程最优
化的一种数学方法,主要用于以时间或地
域划分阶段的动态过程的最优化。
应用:最优调度、资源分配、最优路
径、最优控制、设备更新、库存问题等。
1
例.
某产品从A城运至E城,其间要经过若干
个城镇和若干条道路,路线结构如图所示,
图中给出了每段道路的运费(单位:十元),
试选择一条合理的运输路线,使总运费最小?
2
C16
2
5
B13D18
5
2
A34C2E
3
B25D24
8
C35
3
?几个术语
1.阶段
过程的划分,包括时间、空间的划分,阶段数:n
描述阶段序号的变量称为阶段变量,用k表示,
k1,2,…..,n
2.状态
每个阶段开始所处的自然状况或客观条件称为状态,
是不可控因素。若给定了某阶段状态,则在这阶段以
后过程的发展不受这阶段以前各阶段状态的影响(无
后效性)。
4
状态变量:描述状态的变量,用s表示。
s表示第k阶段的状态变量;
k
S表示第k阶段的状态变量的集合;
k
s?S;
kk
例如:sAS,
11
sB?S{B,B},
21212
S{C,C,C},S{D,D},
3123412
S5{E}E.
5
3.决策
从一个阶段的状态到下一个阶段状态的选择。
描述决策的变量称为决策变量,用u表示.
uu(s)表示第k阶段处于s的决策变量;
kkkk
DD(s)表示第k阶段处于S时决策变量的集合,
kkkk
u?D(s).
kkk
如:D(B){u(B)C,u(B)C},
21211212
u(B