This document discusses self-supervised representation learning (SRL) for reinforcement learning tasks. SRL learns state representations by using prediction tasks as an auxiliary objective. The key ideas are: (1) SRL learns an encoder that maps observations to states using a prediction task like modeling future states or actions; (2) The learned state representations improve generalization and exploration in reinforcement learning algorithms; (3) Several SRL methods are discussed, including world models, inverse models, and causal infoGANs.
This document discusses self-supervised representation learning (SRL) for reinforcement learning tasks. SRL learns state representations by using prediction tasks as an auxiliary objective. The key ideas are: (1) SRL learns an encoder that maps observations to states using a prediction task like modeling future states or actions; (2) The learned state representations improve generalization and exploration in reinforcement learning algorithms; (3) Several SRL methods are discussed, including world models, inverse models, and causal infoGANs.
The document summarizes research on simulating hydrogen dispersion using the ADVENTURE_sFlow solver. It describes modeling hydrogen dispersion as an analogy to thermal convection problems. Two models are analyzed: a hallway model and a car garage model. The hallway model analyzes hydrogen dispersion from inlet, door, and roof vents in an empty volume. The car garage model analyzes hydrogen leakage from a fuel cell car in a full-scale garage. The objective is to demonstrate the feasibility of using the ADVENTURE_sFlow solver, which uses a hierarchical domain decomposition method, to efficiently solve large-scale problems like hydrogen dispersion in engineering facilities.
6. V. AdvSolid-1.2 の概要
第 6 回 ADVENTURE 定期セミナー
DDM アルゴリズム - 領域の分
割
fKu =
・解くべき式
orgiven vect:ctor,unknown ve:
SPDmateix,stiffness:
fu
K
NΩΩΩ ,...,1→・ N 個に領域分割
∑∑
==
===
N
i
i
T
i
N
i
ii
T
iii fRfRKRKuRu
11
,,
自由度制限行列 Ri
全体自由度から領域 i 自由度へ
全体領域
部分領域 i
Ri
7. V. AdvSolid-1.2 の概要
第 6 回 ADVENTURE 定期セミナー
領域内部自由度 (I)
領域間境界上自由度 (B)
DDM アルゴリズム - 自由度の分
割
・部分領域の自由度を領域内部 (I) と領域間境界 (B) に分割
=
=
=
=
iB
iI
i
iB
iI
i
BB
T
iIB
iIBiII
i
iB
iI
i
R
R
R
f
f
f
KK
KK
K
u
u
u
0
0
,,,
領域分割モデル
RIi
RBi
8. V. AdvSolid-1.2 の概要
第 6 回 ADVENTURE 定期セミナー
DDM アルゴリズム - 式の分割
=
∑ B
NI
iI
B
NI
I
iBiBB
T
iB
T
NIB
T
NB
T
IB
T
B
NBNIBNII
BIBII
f
f
f
u
u
u
RKRKRKR
RKK
RKK
1
11
111
0
0
( ) NiuRKfKu BiBiIBiIiIIiI ,...,1,
1
=−=
−
( )∑
=
−
−=
N
i
iIiII
T
iIBiB
T
iB fKKfRg
1
1
部分領域内部と領域間境界に式を分割
(1) 領域間境界上自由度に関する式 ( インターフェース問題 )
(2) 部分領域内部自由度に関する式
gSuB = iIBiII
T
iIBiBBi
N
i iBi
T
iB KKKKSRSRS
1
1
,
−
=
−== ∑
・ (I),(B) で自由度を並び替えた式
(1) を解き , 求まっ
た uB を用いて (2)
を解き , 全体の解 u
10. V. AdvSolid-1.2 の概要
第 6 回 ADVENTURE 定期セミナー
DDM の実装 - CG 法アルゴリ
ズム
kkkk
T
kk
T
kk
kk
kkkk
kkkBkB
k
T
kk
T
kk
kk
pzp
zrzr
rMz
qrr
puu
qpzr
Spq
k
β
β
α
α
α
+=
=
=
−=
−=
=
=
=
++
++
+
−
+
+
+
11
11
1
1
1
1
1
/
ˆˆ
/
0,1,2,...for
00
0
1
0
00
0
ˆ
guessinitial:ˆ
zp
rMz
guSr
u
B
B
=
=
−=
−
1
ˆ
−
M
p
z
r
u
k
k
k
kB : k-th approximate solution vector
: residual vector
: preconditioned residual vector
: search direction vector
: preconditioning matrix
初期化 CG 反復
11. V. AdvSolid-1.2 の概要
第 6 回 ADVENTURE 定期セミナー
DDM の実装 - 行列ベクトル積
• 係数行列 - ベクトル積 → 等価な領域単位の処理に置き換
える
−
=
⋅ pRKK
KKx
iBiBB
T
iIB
iIBiIIi
0
⋅
=
⋅
−
iiIIi x
I
Kw
1
0
0
=
⋅
pR
w
KK
KK
y iB
i
iBB
T
iIB
iIBiII
i
∑=
=
N
i
i
T
iB yRy
1
( ) pRKKKKRSpy
N
i iBiIBiII
T
iIBiBB
T
iB∑ =
−
−== 1
1
(1) 領域間境界を基本
境界として処理
(2) 連立方程式の求解
(3) 領域間境界上の
反力計算
(4) 領域間境界上で
重ね合わせ
Dirichlet 境界
Neumann 境界
領域間境界
Dirichlet 自由度
未知自由度
12. V. AdvSolid-1.2 の概要
第 6 回 ADVENTURE 定期セミナー
DDM の実装 - 行列ベクトル積
−
=
⋅
⋅
0
0
pR
KKK
KKK
KKKx
iB
i
T
iB
T
iI
iBiBB
T
iIB
iIiIBiIIi
DDDD
D
D
ΓΓΓΓ
Γ
Γ
⋅
⋅
=
⋅
⋅
−
iiIIi x
I
I
Kw
1
00
00
00
∑=
=
N
i
i
T
iB yRy
1
領域 i における元の基本境界を D とし ,
=
⋅
⋅
0
pR
w
KKK
KKK
KKK
y iB
i
i
T
iB
T
iI
iBiBB
T
iIB
iIiIBiII
i
DDDD
D
D
ΓΓΓΓ
Γ
Γ
全体自由度を
(I): 領域内部
(B): 領域間境界上
(ΓD): 元の基本境界上
に分けて考える
13. V. AdvSolid-1.2 の概要
第 6 回 ADVENTURE 定期セミナー
DDM の実装 - 初期残差
−
−
=
⋅
⋅
i
BiB
i
T
iB
T
iI
iBiBB
T
iIB
iIiIBiIIi
DDDDD
D
D
u
uR
KKK
KKK
KKKx
ΓΓΓΓΓ
Γ
Γ
0
ˆ
0
⋅
⋅
+
=
⋅
⋅
−
iIiiIIi xf
I
I
Kw
1
00
00
00
( )∑
=
−=
N
i
Bii
T
iB fyRr
1
0
=
⋅
⋅
i
BiB
i
i
T
iB
T
iI
iBiBB
T
iIB
iIiIBiII
i
DDDDD
D
D
u
uR
w
KKK
KKK
KKK
y
ΓΓΓΓΓ
Γ
Γ
0
ˆ
元の基本境界 D 上の変位境界条件値を とすると ,iD
uΓ
初期残差計算時には
元の境界条件 ( 変位
拘束 , 表面力 , 体積
力 ) を
考慮すればよい
Dirichlet 境界
Neumann 境界
領域間境界
14. V. AdvSolid-1.2 の概要
第 6 回 ADVENTURE 定期セミナー
DDM の実装 - 内部自由度解
−
−
=
⋅
⋅
i
BiB
i
T
iB
T
iI
iBiBB
T
iIB
iIiIBiIIi
DDDDD
D
D
u
uR
KKK
KKK
KKKx
ΓΓΓΓΓ
Γ
Γ 0
⋅
⋅
+
=
⋅
⋅
−
iIiiIIIi xf
I
I
Ku
1
00
00
00
CG 法により求めた領域間境界上の解を とすると ,Bu
内部自由度解計算時
にも元の境界条件を
考慮し忘れないよう
に
する