基本信息
文件名称:最优化理论与方法 教学课件 9 动态规划.pdf
文件大小:484.26 KB
总页数:21 页
更新时间:2025-06-05
总字数:约1.02万字
文档摘要

动态规划(DynamicProgramming)

动态规划是解决多阶段决策过程最优

化的一种数学方法,主要用于以时间或地

域划分阶段的动态过程的最优化。

应用:最优调度、资源分配、最优路

径、最优控制、设备更新、库存问题等。

1

例.

某产品从A城运至E城,其间要经过若干

个城镇和若干条道路,路线结构如图所示,

图中给出了每段道路的运费(单位:十元),

试选择一条合理的运输路线,使总运费最小?

2

C16

2

5

B13D18

5

2

A34C2E

3

B25D24

8

C35

3

?几个术语

1.阶段

过程的划分,包括时间、空间的划分,阶段数:n

描述阶段序号的变量称为阶段变量,用k表示,

k1,2,…..,n

2.状态

每个阶段开始所处的自然状况或客观条件称为状态,

是不可控因素。若给定了某阶段状态,则在这阶段以

后过程的发展不受这阶段以前各阶段状态的影响(无

后效性)。

4

状态变量:描述状态的变量,用s表示。

s表示第k阶段的状态变量;

k

S表示第k阶段的状态变量的集合;

k

s?S;

kk

例如:sAS,

11

sB?S{B,B},

21212

S{C,C,C},S{D,D},

3123412

S5{E}E.

5

3.决策

从一个阶段的状态到下一个阶段状态的选择。

描述决策的变量称为决策变量,用u表示.

uu(s)表示第k阶段处于s的决策变量;

kkkk

DD(s)表示第k阶段处于S时决策变量的集合,

kkkk

u?D(s).

kkk

如:D(B){u(B)C,u(B)C},

21211212

u(B