ライブマイグレーションにおけるサブページ書き込み保護の評価

ライブマイグレーションにおける
サブページ書き込み保護の評価
〇小澤洋介品川高廣
東京大学
2021/4/19 1
第151回システムソフトウェアとオペレーティング・システム研究会
2021年3月2日

アウトライン
1. 背景
◦ ライブマイグレーション
◦ 既存の細粒度化手法
2. 提案手法
3. 実装
4. 評価
5. まとめ
2021/4/19 2

背景:
ライブマイグレーション
2021/4/19 3

仮想マシンを動作したまま
他物理マシンへ移送
ユースケース
◦ ハードウェア/ソフトウェア
メンテナンス
◦ 負荷分散
2021/4/19
4
[1] Christopher Clark et al, Live migration of virtual machines, In Proc. NSDI 2005, p.273-286, May
移行元物理マシン移行先物理マシン
VM VM
VM
VM
VM
ライブマイグレーション[1]

プレコピーマイグレーション
移行元から移行先へ複数回のメモリコピー
各イテレーションでの転送メモリ量の削減は重要
◦ ネットワーク負荷，総マイグレーション時間の削減に直結
◦ 転送メモリ量が大きすぎるとマイグレーションが完了できないことも
2021/4/19
5
メモリメモリ
移行元物理マシン移行先物理マシン

書き込み検知の細粒度化
ページサイズでの書き込みトレースが主流
◦ CPUのネステッドページングの付随機構であるダーティビットを用いるため
細粒度化により余剰なメモリ転送を排除可能
2021/4/19 6
書き込み
領域

背景:
既存の細粒度化手法
2021/4/19 7

01101101
01101101
01101101
ページの一時保存による細粒度化
転送時にページそのものやページのハッシュを保存
XBZRLE: 再転送時に前回転送時との差分を計算し，差分圧縮を行い転送
2021/4/19 8
メモリメモリ
移行元移行先
01110101

サブページ書き込み保護
当分割されたサブページへの書き込み保護
◦ 保護されたサブページへの書き込みは
ページフォルトを発生
書き込み検知は目的外
◦ 本来はメモリ保護用
2021/4/19 10
書き込み不可
書き込み可
通常ページ
サブページ

サブページ書き込み検知
ハイパーバイザは各サブページの書き込み権限を個別に設定
2021/4/19 11
ハイパーバイザ
書き込み不可
書き込み可
仮想マシン
ゲストOS

ゲストOS
仮想マシン
はじめに全サブページを書き込み保護
書き込みはページフォルトを発生し，ハイパーバイザに処理が移行
2021/4/19 12
ページ
フォルト
書き込み不可
書き込み可

ゲストOS
仮想マシン
書き込み不可
書き込み可
ハイパーバイザはサブページの書き込み保護を解除
書き込み許可されたページ＝書き込みが行われたページ
2021/4/19 13
フォルト
ハンドリング

メリット/デメリット
2021/4/19 14
通常ページ
書き込み検知
通常ページ
書き込み検知
+ 一時保存
サブページ
書き込み検知
転送メモリ量
✗粗粒度
書き込み検知
✓ビット単位で
比較
✓細粒度
書き込み検知
余剰リソース使用 ✓ ✗メモリとCPU ✓
仮想マシンの
性能劣化
✓CPUが処理
余剰リソースに
依存
✗ページフォルト
を発生

実装
Intel EPT-Based Sub-page
write permission (SPP)[3]
◦ 128Bサブページ
◦ 4KB通常ページを32分割
実装されたCPUを入手できず
→ IA-32エミュレータのBochs[4]を使用
2021/4/19 16
https://software.intel.com/sites/default/files/managed/39/c5/325462-sdm-vol-1-2abcd-3abcd.pdf
[3]
http://bochs.sourceforge.net/
[4]

2021/4/19 17
仮想マシン
KVM
QEMU
ゲストOS
Bochs
書き換え
サブページ
フォルト
ハンドラ
1 1 0 1
1 0 1 1
1 1 0 0
0 0 0 0
反映
サブページ
転送システム
書き込み情報の取得
仮想CPU
仮想メモリ
書き込み保護
変更部位
凡例
変更部位
変更なしの部位
書き込み
ネステッドページテーブル
サブページ
フォルト
命令取得
システム概要

2021/4/19 18
仮想マシン
KVM
QEMU
ゲストOS
Bochs
書き換え
サブページ
フォルト
ハンドラ
1 1 0 1
1 0 1 1
1 1 0 0
0 0 0 0
反映
サブページ
転送システム
仮想CPU
仮想メモリ
書き込み保護
変更部位
凡例
変更部位
書き込み
サブページ
フォルト
命令取得
システム概要

2021/4/19 19
仮想マシン
KVM
QEMU
ゲストOS
Bochs
書き換え
サブページ
フォルト
ハンドラ
1 1 0 1
1 0 1 1
1 1 0 0
0 0 0 0
反映
サブページ
転送システム
仮想CPU
仮想メモリ
書き込み保護
変更部位
凡例
変更部位
書き込み
サブページ
フォルト
命令取得
システム概要

2021/4/19 20
仮想マシン
KVM
QEMU
ゲストOS
Bochs
書き換え
サブページ
フォルト
ハンドラ
1 1 0 1
1 0 1 1
1 1 0 0
0 0 0 0
反映
サブページ
転送システム
仮想CPU
仮想メモリ
書き込み保護
変更部位
凡例
変更部位
書き込み
サブページ
フォルト
命令取得
システム概要

評価手法
1. 従来の4KiB ページ単位の書き込み検知手法
2. 4KiB ページ書き込み検知と
QEMUに標準搭載のページ一時保存(XBZRLE)を
組み合わせた手法
3. Intel SPPによるサブページ書き込み検知手法
2021/4/19 22

実験設定
2021/4/19 23
仮想マシン割り当てメモリ 1GiB
ネットワークバンド幅 1Gbps
ワークロード Idle
Kernel compile
redis + YCSB
(workloada～workloadf)
SPECCPU
(xxx.*_r)
XBZRLE一時保存メモリサイズ 512MiB
最大イテレーション数 20
ストップコピー移行条件転送時間<300ミリ秒

評価
Bochsの性能は実機よりかなり低い
◦ Bochs上でマイグレーションを行っても結果は現実と乖離
→時間経過ではなく実行命令数を基準として
メモリ転送量を測定する
疑似マイグレーションを実行
2021/4/19 24

疑似マイグレーション
2021/4/19 25
仮想メモリ
ゲストOS
Bochs
Bochs上で仮想マシンを動作
→メモリへの書き込みが発生

2021/4/19 26
Bochs
仮想マシンを停止し
次イテレーションに
かかる時間を推定
転送メモリ量
ネットワークバンド幅
1GB/1Gbps = 8s
仮想メモリ
ゲストOS

8s ×4.8GIPS = 38.4GI
2021/4/19 27
Bochs
次イテレーションで
実行される命令数を推定
転送時間
×
実機上で動作する仮想マシンのIPS
仮想メモリ
ゲストOS

2021/4/19 28
Bochs
推定された命令数
仮想マシンを動作させ，
再度書き込みメモリ量を測定
仮想メモリ
ゲストOS

オーバーヘッドの概算
2021/4/19 29
Bochs
SPP関連イベントに要した
命令数をオーバーヘッドとして概算
SPP関連イベントの回数
×
1回のイベントハンドリングにかかる
命令数
仮想メモリ
ゲストOS

第二イテレーション時転送削減量
2021/4/19 30

2021/4/19 31
平均1,300枚の4KiBページは
そのうち1枚のサブページにのみ
書き込み
平均で19.1％の転送量削減

2021/4/19 32
平均16,000の4KiBページは
ページ全体に書き込み
→多数のページフォルトが
オーバーヘッドの要因

書き込み命令分析
0xffffffff81ab27a7 0xffffffff811b3a23
0xffffffff812da15d other instruction
multi instructions
2021/4/19 33
ほとんどが
ページゼロクリア関数内の
rep stosq命令によるもの

総マイグレーション時間
(=総転送メモリ量)
2021/4/19 34
Lower is
better
XBZRLEと同程度の総マイグレーション時間削減

未転送メモリ量推移
502.gcc_r
2021/4/19 35
XBZRLEと
サブページ書き込み検知で
同程度の
総マイグレーション時間削減
を達成

557.xz_r
2021/4/19 36
差分圧縮が利きにくい，
または新規ページへの
書き込みが多い
ワークロードでは
サブページ書き込み検知が
効果的

531.deepsjeng_r
2021/4/19 37
書き込み頻度が高く
差分圧縮も効きにくい
ワークロードでは
サブページ書き込み検知のみ
マイグレーションを完了

519.lbm_r
2021/4/19 38
ほとんどの書き込みが
ページ全体にわたる場合
メタデータの影響で
サブページ書き込み検知が
マイグレーション性能を低下

CPUオーバーヘッド
2021/4/19 39
Lower is
better
メモリを転送する準備として
QEMU で使用するフォーマットに整形するのに要した命令数

メモリオーバーヘッド
2021/4/19 40
Lower is
better
第二イテレーション開始時における，
ホストマシン（Bochs）全体におけるメモリ使用量

サブページ書き込み保護の
オーバーヘッド
2021/4/19 41
Lower is
better

まとめ
サブページ書き込み保護機構を用いた
サブページ書き込み検知の
ライブマイグレーションにおける有効性について評価
4KiBページ書き込み検知＋XBZRLEと同程度の
総マイグレーション時間短縮を実現
サブページ書き込み保護のみがマイグレーションを完了させられる
ワークロードも確認
2021/4/19 43

今後の課題
サブページ書き込み保護をサポートするCPUを搭載した
実機マシン上での性能評価
サブページ単位での書き込み予測によるページフォルトの回避
複数仮想CPU間での一貫性を保つためのオーバーヘッドの評価
2021/4/19 44

ライブマイグレーションにおけるサブページ書き込み保護の評価

Recommended

Recommended

More Related Content

More from Shinagawa Laboratory, The University of Tokyo

More from Shinagawa Laboratory, The University of Tokyo (11)

ライブマイグレーションにおけるサブページ書き込み保護の評価

Editor's Notes