Friesz, T.L., Luque, J., Tobin, R.L., Wie, B

Friesz, T.L., Luque, J., Tobin, R.L., Wie, B-W.:
Dynamic network traffic assignment
considered as a continuous time optimal control problem,
Operations Research, Vol. 37(6), pp. 893-901, 1989.
Nonlinear Pricing and Revenue Optimization
Freight Systems and Logistics
Dynamic Network Games and Dynamic Traffic Assignment
Network Design and MPECs
2014/6/27(金)
集中理論談話会 #4
D2 浦田 淳司
論文目次
研究概要:
・動的交通配分の定式化
・Pontryaginの最大値原理の導入
・システム最適,ワードロップ均衡(利用者最適)のそれぞれで定式化
+Dynamic Control Problem (Pntryagin’s maximum principle)のエッセンス
1. Notation, Dynamics and Constraints
2. System Optimization
3. User Optimization
4. Conclusions
2
動学的問題への3つのアプローチ
著:A.C. チャン (訳:小田正雄, 仙波憲一,高森寛,平澤憲男)
動学的最適化の基礎,シーエーピー出版, 2006
1. 動的計画法(Bellman, R.E.(1953))
- 多段階意思決定モデル / 再帰的計算過程
2. 変分法(Newton,I(1687))
- 最適関数の決定問題(最速降下曲線など)
T
max V ( y ) = ∫ F (t , y (t ), y ' (t ))dt
0
subject to y (0) = A, y (T ) = Z
3. 最適制御理論(Pontryagin,L.S. et al.(1962))
- 変分法の進化
- 時間変数t, 状態変数y(t)に加えて,制御変数u(t)を追加
3
最適制御理論(Dynamic Control Problem)
状態変数
制御変数
=
,…,
= { ,…,
目的関数 maxV = max
等価
…,
…,
, ,
連続(区分的に微分可能,鋭点あり)
}( ) 非連続可(区分的に連続)
制約条件
=
,
,
運動方程式
(yは初期条件と運動方程式で決定)
初期条件
0 =
,…, …,
0
終端条件
自由 (制約を設定することも可能)
制御集合 u
∈!
最大値原理(ハミルトニアンHの最大化)
, , + ∑' &' ' , ,
H≡
max ( , , , & ∀
yについての運動方程式
λについての運動方程式
横断性条件
&
=0
+
=
=
*
+
*
・制御変数の最適な時間経路が決定
・時間積分を各時間帯ごとの最適化
計算に分解
・制御変数は非連続でも可
4
(制約条件)交通量変化率
研究概要:
・動的交通配分の定式化
・Pontryaginの最大値原理の導入
・システム最適,ワードロップ均衡(利用者最適)のそれぞれで定式化
,(-, .):ノードN,リンクAで形成されるネットワーク
ノードNのうちnを終着点ノード,M={1,2,…,n-1}は発ノード.
t : 時刻 t ∈ 0,
12 ( ):時刻tでのリンクa上の交通量=状態変数
32 [12 ( )]:交通量12 ( )のときの旅行時間コスト
2 ( ):リンクaへの流入交通量=制御変数
62 [12 ( )]:リンクaからの流出交通量
交通量変化率
(制約条件)
dxa (t )
= ua (t ) − g a [ xa (t )] ∀a, ∀t
dt
(1)
運動方程式:制御変数 を決めると,状態変数xが決まる
1. Notation, Dynamics and Constraints
5
(制約条件)交通量保存則,基本条件
S8 ( ):時刻tでのノードkからの発生交通量
.(9):ノードkが着点となるリンク集合
:(9):ノードkが発点となるリンク集合
交通量保存則 S k (t ) =
(制約条件)
基本条件
(制約条件)
∑u
a∈ A ( k )
a
(t ) −
∑ g [ x (t )] ∀k ∈ M , ∀t (2)
a∈B ( k )
a
xa (0) = xa0 ∀a
(3)
ua (t ) ≥ 0 ∀a, ∀t
(4)
xa (t ) ≥ 0 ∀a, ∀t
(5)
a
定義 Ω ≡ {( x, u ) : (1), (2), (3), (4) are satisfied }
1. Notation, Dynamics and Constraints
(6)
6
Definition 1
動的交通配分が成立するには次の条件を満足すればよい.
1. SOにおいて,その瞬間のコスト関数 C2 [12 ( )]は 非負,単調増加,微分可能,
凸である.これをすべてのa, tで成立し,12 ( ) ≥ 0を満たす.
2. UEにおいて,その瞬間のコスト関数=2 [12 ( )]は正,単調増加,微分可能,で
あり,合成関数 >2 12
= =2 [12 ( )]6′2 [12 ( )]で 表せる.これをすべてのa,
tで成立し,12 ( ) ≥ 0を満たす.
3. 流出関数62 [12 ]は非負,微分可能,単調増加,凹である.これをすべての
a, tで成立し,12 ( ) ≥ 0を満たす.
4. 初期条件62 0 = 0がすべてのa,tで成立する.
5. 初期条件12 0 ≥ 0がすべてのaで成立する.
=2 [12 ( )]:時刻tでの交通量xのリンクaでの旅行時間(1台あたり)
定義
1. Notation, Dynamics and Constraints
Ca ( xa ) ≡ ca ( xa ) g a ( xa ) ∀a
7
ハミルトニアン(2. System Optimization)
システム最適の目的関数
>@A@>@BC D = E F 32 12
H IJC=
(7)
2∈G
K (1, ) ∈ Ω
(全期間全リンクの旅行時間の合計の最小化)
ハミルトニアンの定義
( 1, , M,
= E 32 (12 ) + E M2 [
2∈G
2∈G
2
− 62 12 ]
(8)
M2 : 随伴変数(状態方程式に対するラグランジュ乗数)
- (8)式が解を持つには,Arrow-Kurzの十分定理より,Hが凸であることが必要
- Hが凸であるためには,M2 ≥ 0 (∀P)であることが求められる.
2. System Optimization
8
ラグラジアン・KKT条件
制御変数の制約条件(2)(4)を考慮して,Hの最小化問題に対し,ラグラジアンを設定
Q = ( + E R8 S8 − E
8∈U
2∈G 8
2
+ E 62 (12 ) + E V2 [−
2∈G
2∈T 8
2]
(11)
R8 , V2 : ラグランジュ乗数
Lの最小化問題
必要十分条件
KKT条件
(12)
M2 − R8 − V2 = 0
∀P ∈ .(9), ∀9 ∈ W, ∀ ∈ [0, ]
(13)
V2 ≥ 0, 2 ≥ 0, V2 2 = 0
∀P ∈ ., ∀ ∈ [0, ]
R8 ≥ 0, R8 S8 − ∑2∈G 8 2 + ∑2∈T 8 62 12 = 0∀9 ∈ W, ∀ ∈ [0, ] (14)
Eular-Lagrange方程式より
YQ
(15)
−M2X =
∀P ∈ ., ∀ ∈ [0, ]
Y12
∀P ∈ :(9), ∀9 ∈ W, ∀ ∈ [0, ]
−M2X = 32Z − M2 6Z 2 + R8 6Z 2
横断性条件
2. System Optimization
M2
=0
∀P ∈ .
(17)
(16)
※ ・はt微分,’はx微分を示す
9
最適制御問題の必要条件の再定式化
M2 ≥ R8
∀P ∈ .(9), ∀9 ∈ W, ∀ ∈ [0, ]
(18)
(17)より
M2
∀P ∈ .(9)
(19)
(16)より
−M2X = 32Z − M2 6Z 2 + R8 6Z 2 ∀P ∈ :(9), ∀9 ∈ W, ∀ ∈ [0, ]
(12)(13)より
(12)(13)より
2
=0
M2 − R8 = 0 ∀9, P,
(20)
∀P ∈ .(9), ∀9 ∈ W, ∀ ∈ [0, ]
(21)
(14)と(18)より, M2 ≥ 0 が成立するため,Hは凸であり,解を持つ.
(18)(21)より,制御変数
これを求めたい.
2. System Optimization
2は
M2 − R8 = 0のときに0でない値をとる.
10
制御変数の算出
M2 − R8 = 0が∀P, 9で成立することが必要
M2X ( ) = R8X ( )
M2[
= R8[
K\ ∈
,
]
⊆ [0, ]
(22)
(22)を(20)に代入
(23)
(τ a − µl ) g 'a −C 'a − µɺ k = 0
(τɺa − µɺ l ) g 'a +(τ a − µl ) g "a xɺ a − C"a xɺa − µɺɺk = 0
(24) ((23)をxで微分)
(22)(24)(1)より
ua
[
( µ k − µl ) g"a −C"a ]g a − ( µɺ k − µɺ l ) g 'a + µɺɺk
=
( µ k − µl ) g"a −C"a
(26)
(26)式または0で,制御変数は与えられる.
2. System Optimization
11
交通量保存則の証明
(7)式が満たされれば(18-21),交通量保存則が満たされることを示す
S k (t ) =
交通量保存則
(制約条件)
∑u
a∈ A ( k )
a
(t ) −
∑ g [ x (t )] ∀a, ∀t
a∈B ( k )
a
a
(2)
証明
あるkにおいて,保存則が成立していないと仮定し,背理法で示す
(14)式より R8 = 0
(18)式より M2 ≥ R8 = 0 ∀P
case i) M2 = R8 = 0の場合
M2 ( ) = 0より,MX 2 ( ) = 0
式(20)より, 0 = 32Z + R_ 6Z 2 ∀ , P = (9, ∀`)
Def1より,32Z と6Z 2 は正なので R_ < 0. これは(14)式と矛盾
case ii) M2 > R8 = 0の場合
S k (t ) +
2
∑ g [ x (t )] < ∑ u (t ) ∀k ∈ M , ∀t
a∈B ( k )
a
a
a∈ A ( k )
a
= 0 (∀P = (9, `))なので,
Sk +
∑ g [ x (t )] < 0 ∀k ∈ M , ∀t
a∈B ( k )
a
a
S8 , 62 (12 )は非負なので矛盾. 以上により,交通量保存則は成立∎
2. System Optimization
12
経路表現を用いた定式化とその解釈
ここでの疑問は,制御変数と状態変数は,通常のシステム最適の交通流と一致するのか.
ノードkからノードnまでの経路pを考える.
d = 9 = e , P , e , … , efg , Pf , ef = A
それぞれの経路で次が成立する.
Φp = ∑
(C 'a +τɺa )
a∈ p
D∗ [1
g 'a
(31)
静的システム最適における
32Z
i6Z
2 フローのリンクaにおける限界費用
動的な
MX 2
i6Z
2 フローのリンクaにおける限界費用
(32)
, ]を最適軌跡に従ったシステム最適の目的関数とすると,
フロー:単位時間あたり交通量
∂J1*[ x(t ), t ]
τa =
∂xa
∀P, ∀
フロー増分あたりの
経路総コストの増分[cost・t/veh]

 ∂J1*  
d
  g 'a
Φ p = ∑  C 'a + 
dt  ∂xa  
a∈ p 
経路pのフロー
の限界費用
2. System Optimization
1台増あたりの
総コストの増分[cost/veh]
(33)
(34)
1台増あたりの
フローの増分[1/t]
13
フローの限界費用と解の導出
定理:
∃ ∈ 0, , 2 > 0 ∀P ∈ d ∈ k8 において,
Φm
= @A Φn : ∀\ ∈ k8 となり,これはDefinition 1の解となる
証明:
式(20)より
Φp = ∑
(C 'a +τɺa )
a∈ p
ここで,式(18)より
m
g 'a
= ∑ (τ ai − µ vi )
i =1
τ a ≥ µ v ∀i
i
(35)
i −1
(36)
m
(35)(36)より
Φ p ≥ ∑ ( µ vi−1 − µ vi ) = µ v0 − µ vm = µ k − µ n
(37)
i =1
> 0では,式(21)より式(36)は等号が成立する必要があり,
Φm は式(37)の下界を解とする.
2
⇒ここでは,利用される経路の時刻tでの限界費用は,
経路候補の中での最小値であることを意味し,静的システム最適の概念と一致
2. System Optimization
14
DUE
同様の証明を目的関数を変えて実施
pq
>@A@>@BC D] = E F F 32 o2 6′2 o2
2∈G
H IJC=
( 1, , M,
= E F 32 o2 6′2 o2
2∈G
Q = ( + E R8 S8 − E
3. User Optimization
(38)
K (1, ) ∈ Ω
pq
8∈U
o2
2∈G 8
2
o2
+ E M2 [
2∈G
2
− 62 12 ]
+ E 62 (12 ) + E V2 [−
2∈T 8
2∈G
2]
(39)
(41)
15
まとめ
・動的交通配分における連続時間の最適制御問題は
静的配分における配分の考え方を保存している
・多くの定式化を行ったが,ひとつの定式化を出発点としている
・出発時刻選択,最適課金,,などに拡張可能
・複数目的地の場合はFIFO原則が保たれないという課題
⇒”exit function”は流入交通流率とリンク旅行時間の関係が非考慮 (桑原(2005),赤松(2007))
所感
・動学配分の問題が解を持つことを示したい
→最適制御理論による定式化が可能(旅行時間最小化と運動方程式,制約)
→最適制御問題が解を持つことを示せばよい
・(動的)交通配分も初期値が決まれば解が一意に決まるので,運動方程式ではない
のか..避難の問題で,目安としての最適解が求められる.
・(動的)制御変数と状態変数をどうするか.運動方程式として記述可能か.
→状態変数は流出台数と流入台数.
→制御変数は出発時刻,チェイン選択率
4. Conclusion
16
ご清聴ありがとうございました.
17
TRcの式1(Nested Dynamic Discrete Choice)
時間割引率
スケールパラメータ
選択確率(時刻t, Pair Set g)
exp((u ( S g ,t ) + βυ ( S g ,t ) ) σ ) exp(σ ln RL ,t )
P ( d t | S g , t ; θ ) = P ( d t | L, S g , t ; θ ) P ( L , S g , t ; θ ) =
RL , t
∑L ' exp(σ ln RL ',t )
選択結果 上位ネスト パラメータ
ログサム
RL ,t = ∑ g∈L exp((u ( S g ,t ) + βυ ( S g ,t ) ) σ )
(2)
υ (d t , S g ,t ) = ∑S υ ( S g ,t +1 ) p( S g ,t +1 | d t , S g ,t )
(3)
v(d t , S g ,t ) = u (d t , S g ,t ) + σε t (d t ) + ε t ( L) + βυ (d t , S g ,t )
(4)
(1)
推移確率
将来価値
g ,t
価値関数
利他差
Network Utility
t期でintra g内
のリンクが形成
形成あり効用
形成なし効用
同調性(集中性)

l g ,t  1
dam
dam
intra
intra
inter
inter

θ
δ
θ
δ
θ
S g ,t ( d t ) = m 
|
x
−
x
|
+
ln
k
+
ln
k
∑
4
j ,t
g ,t
g
g ,t
 N ij∈g 1 i ,t
 g 3
g


inter
S g ,t (d t ) = S g ,t (d t = (l g ,t −1 + 1, k gintra
(6)
,t −1 + 1, k g ,t −1 ))
1
u ( d t , S g ,t ) = S g ,t ( d t ) +
Ng
危険度
rain
5 t
u ( d t , S g ,t ) = θ x
(5)
形成コスト
dis
(7)
2 ij
∑θ x
ij∈g
root
(8)
Nest L
m
l g ,t
Ng
形成による利他差の縮小
g内の一定時間以内の形成数
g内のpair数
δ gintra , δ ginter
gがintraかinterか
k
intra
g ,t
,k
inter
g ,t
g内の形成数
xijdis
ij間距離
xtrain
当該時間帯の雨量
xidam
,t
iのダメージ
making pair
Non-make
Pair Set g
Intra A
Inter A&B
…
Pair ij
a1-a2
Intra B
a1-a3
a2-a3
a1-b1
a1-b2
a1-b3 … a3-b3
b1-b2
b1-b3
b2-b3
18
TRc の式
効用関数
Pair Cost
new pair
Pair Altruism
Majority Tuning 同調
time
previous pair
non-make
t-1
state
st −1
DP
time
Future Utility
Pair Utility
non-make
t
state
st
空間的準拠集団形成
time
non-make
t+1
Network Utility
state
st +1
Spatial Stochastic
Choice Set
Observed
time
non-make
t+2
state
Choice
st + 2
Latent
pair
Inter Pairs of A & B
a1
node
a3
b1
b2
nest
b3
Intra Pairs of A
Intra Pairs of B
a1
b1
A
a2
B
a) Dividing Basic Group
b2
a3
a2
b3
b) Dividing Intra and Inter Pairs by basic groups
++. Omake
19
TRcの式2 (Tuning Effect)
選択確率(時刻t, Pair Set g)
exp((u ( S g ,t ) + βυ ( S g ,t ) ) σ ) exp(σ ln RL ,t )
P ( d t | S g , t ; θ ) = P ( d t | L, S g , t ; θ ) P ( L , S g , t ; θ ) =
RL , t
∑L ' exp(σ ln RL ',t )
Network Utility
 1
S g ,t ( d t ) = m 
N
 g
= O1 + θ ' ln k g ,t
l g ,t
exp((u ( S g ,t ) + βυ ( S g ,t ) ) σ )
RL ,t
∑θ
ij∈g
1
dam
i ,t
|x
−x
= exp(u ( S g ,t ) σ )

|  + δ gintraθ 3 ln k gintra
+ δ ginterθ 4 ln k ginter
,
t
,t


dam
j ,t
exp(βυ ( S g ,t ) σ )
RL , t
[
] O
= [exp(θ ' ln k )exp(O )]
= exp(θ ' ln k g ,t + O1 )
1σ
2
1σ
g ,t
1
[ ( ( ))] O O
= (k ) O O = (k )
= exp ln k g ,t
1σ
θ'
3
θ' 1σ
g ,t
2
θ' σ
3
適応度モデル
P(vi ) =
ノードe のリンク形成確率
O2
2
g ,t
O3O2
η i ki
∑ jη j k j
20