Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
PowerEdge R730 及び
NVIDIA GRID K2 パフォーマンス測定結果報告書
背景
• GPUサーバから複数のレンダリング映像を送出する
といった使い方をする場合、以下の製品が候補とし
て考えられる
– NVIDIA GRID K1/K2 (VDI用途)
– NVIDIA GRID K340/K520 (CloudGam...
背景
• K1/K2はVDI用途とされているが…
– VDIのような定形リソース分割をする形ではなく、
フレキシブルなGPUリソースの利用を検討したい
• コンテンツ制作の柔軟性のため
– より汎用な製品を使うことによるメリット
• 供給の安定...
評価項目
• 1サーバでどれだけのアプリインスタンスを同
時実行できるのか
• K340/K520といった特化製品との挙動差異を
見る(今回の資料からは割愛)
概略図
Windows Server 2012 R2
App App App
PowerEdge R730
H.264 H.264
H.264 H.264
H.264 H.264 H.264
• サーバ上でアプリインスタンスを動かす
• 生成し...
評価機(サーバ)の仕様
• CPU
– Intel Xeon E5-2600 v3 2.60GHz x2
• RAM
– 32GB
• GPU
– NVIDIA GRID K2 x 2
評価ソフトウェア仕様
• アプリケーション仕様
– 解像度: 1280x720
– ビデオフレームレート: 30 fps
• アプリケーション種別
– App1
• 三角形の回転表示(シンプルなアプリ)
– App2
• 低負荷な2D表示
※今...
評価項目
• 主にビデオエンコーディング処理よる負荷計測にフォー
カス
– 評価機
• 測定スクリプトで計測
– CPU 使用率
– メモリ使用量
– NVIDIA GRID K2
• 1チップ単一処理/4チップ分散処理における性能差を比較
•...
評価結果 (ビデオチップ=1個で処理)
アプリケーション 最大インスタンス数 ボトルネック要因
App1 6 VPU
App2 6 VPU
評価結果 (ビデオチップ=4個で分散処理)
アプリケーション 最大インスタンス数 ボトルネック要因
App1 24 VPU
App2 24 VPU
ボトルネックにより発生する現象
ボトルネック要因 現象
CPU アプリケーション処理低下
GPU フレームレート低下
VPU エンコード遅延
RAM/VRAM不足 一定数よりアプリインスタンスが起動不能
まとめ
• NVIDIA GRID K2 について
– ほぼ期待どおりの挙動。VDI向けだからという制限は感じられない
– K520は同時16セッション(GPU Coreあたり 8 セッション)というカタログ
スペックなのでK2がCoreあたり...
まとめ
• アプリケーションのボトルネック傾向
– App1/2ともにVPUによるボトルネックが最初に来ている。それで最大
同時接続台数が決まっている
– アプリが高品質な3D映像を生成するアプリケーションに変わったとし
てもCPU/GPUの負...
APPENDIX
GPU使用率(App1)4チップ使用時
0
50
100
150
200
250
300
350
400
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
...
VPU使用率(App1)4チップ使用時
0
50
100
150
200
250
300
350
400
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
...
GPU使用率(App2)4チップ使用時
0
50
100
150
200
250
300
350
400
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
...
VPU使用率(App2)4チップ使用時
0
50
100
150
200
250
300
350
400
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
...
Upcoming SlideShare
Loading in …5
×

PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書

1,084 views

Published on

Published in: Technology
  • Be the first to comment

PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書

  1. 1. PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書
  2. 2. 背景 • GPUサーバから複数のレンダリング映像を送出する といった使い方をする場合、以下の製品が候補とし て考えられる – NVIDIA GRID K1/K2 (VDI用途) – NVIDIA GRID K340/K520 (CloudGaming用途)
  3. 3. 背景 • K1/K2はVDI用途とされているが… – VDIのような定形リソース分割をする形ではなく、 フレキシブルなGPUリソースの利用を検討したい • コンテンツ制作の柔軟性のため – より汎用な製品を使うことによるメリット • 供給の安定 • サポート
  4. 4. 評価項目 • 1サーバでどれだけのアプリインスタンスを同 時実行できるのか • K340/K520といった特化製品との挙動差異を 見る(今回の資料からは割愛)
  5. 5. 概略図 Windows Server 2012 R2 App App App PowerEdge R730 H.264 H.264 H.264 H.264 H.264 H.264 H.264 • サーバ上でアプリインスタンスを動かす • 生成した画面をNVIDIA GPUを使って H.264 にエンコード • ビデオデータをパケットとして接続相手のク ライアントに送出 • クライアントでデコード・表示 PC Smart Device PC
  6. 6. 評価機(サーバ)の仕様 • CPU – Intel Xeon E5-2600 v3 2.60GHz x2 • RAM – 32GB • GPU – NVIDIA GRID K2 x 2
  7. 7. 評価ソフトウェア仕様 • アプリケーション仕様 – 解像度: 1280x720 – ビデオフレームレート: 30 fps • アプリケーション種別 – App1 • 三角形の回転表示(シンプルなアプリ) – App2 • 低負荷な2D表示 ※今回の検証では3D性能による負荷の計測は行っていない。
  8. 8. 評価項目 • 主にビデオエンコーディング処理よる負荷計測にフォー カス – 評価機 • 測定スクリプトで計測 – CPU 使用率 – メモリ使用量 – NVIDIA GRID K2 • 1チップ単一処理/4チップ分散処理における性能差を比較 • 測定スクリプトで計測 – GPU使用率 – VPU使用率*1 – ビデオメモリ使用量
  9. 9. 評価結果 (ビデオチップ=1個で処理) アプリケーション 最大インスタンス数 ボトルネック要因 App1 6 VPU App2 6 VPU
  10. 10. 評価結果 (ビデオチップ=4個で分散処理) アプリケーション 最大インスタンス数 ボトルネック要因 App1 24 VPU App2 24 VPU
  11. 11. ボトルネックにより発生する現象 ボトルネック要因 現象 CPU アプリケーション処理低下 GPU フレームレート低下 VPU エンコード遅延 RAM/VRAM不足 一定数よりアプリインスタンスが起動不能
  12. 12. まとめ • NVIDIA GRID K2 について – ほぼ期待どおりの挙動。VDI向けだからという制限は感じられない – K520は同時16セッション(GPU Coreあたり 8 セッション)というカタログ スペックなのでK2がCoreあたり6セッションで頭打ちになっている事か らするとVPU性能に差異がある可能性もある
  13. 13. まとめ • アプリケーションのボトルネック傾向 – App1/2ともにVPUによるボトルネックが最初に来ている。それで最大 同時接続台数が決まっている – アプリが高品質な3D映像を生成するアプリケーションに変わったとし てもCPU/GPUの負荷が上がるだけでVPU負荷については解像度が変 わらない限り変化はない
  14. 14. APPENDIX
  15. 15. GPU使用率(App1)4チップ使用時 0 50 100 150 200 250 300 350 400 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 gpuusage(%) Num of running applications The transition of max gpu usage (App1) gpu3 gpu2 gpu1 gpu0
  16. 16. VPU使用率(App1)4チップ使用時 0 50 100 150 200 250 300 350 400 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 vpuusage(%) Num of running applications The transition of max vpu usage(App1) vpu3 vpu2 vpu1 vpu0
  17. 17. GPU使用率(App2)4チップ使用時 0 50 100 150 200 250 300 350 400 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 gpuusage(%) Num of running applicaitons The transition of max gpu usage(App2) gpu3 gpu2 gpu1 gpu0
  18. 18. VPU使用率(App2)4チップ使用時 0 50 100 150 200 250 300 350 400 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 vpuusage(%) Num of running applications The transition of vpu usage(App2) vpu3 vpu2 vpu1 vpu0

×