これが(多分)最後! ベンチマークs
自己紹介
もんた(@___monta___)
CGやったりFPGAやったり インフラSEやったり
本業
ボウリングやったり、マジックやったり、筋トレやったり適当に生きています
恵まれた環境にあるので試してみた!
1.デスクトップ(GTX1080)
2.ごっついサーバ
3.分散処理サーバ
Time is Money
3Dをやる人にとって、レンダリング時間は短ければ短いほどいいですよね?
1.デスクトップ(GTX1080)
CPU、メモリはひと昔 前のPC
・CPU:Corei7 4790K(4コア 8スレッド 4GHz)
・メモリ:16GB
・ディスク:SSD 512GB(SATA3.0 6Gbps)
・GPU:GeForce GTX1080
今日のために買った!
(といっても過言ではない)
2.ごっついサーバ
一年ほど前にBigdata処理用に仕事でくみ上げたサーバ
・Intel(R) Xeon(R) CPU E5-2699 v3 @ 2.30GHz × 2ソケット
(18コア 36スレッド) × 2ソケット
・メモリ:760GB
・ディスク:44TB
・GPU:なし
・ネットワーク 10G×4
3.分散処理サーバ
某N社にて販売されている超高密度サーバ × 56ノード
・CPU:Xeon(R) D-1541 @ 2.10GHz(8コア 16スレッド / ノード)
・メモリ:64GB
・ディスク:SSD 512GB
・GPU:なし
筐体間を80Gbpsにて接続!
ご用命あればいつでも!
テストした内容
その1.
その2.
テストその1.
※CPU or CUDAの単一ノード性能をはかることができる
BenchmarkのAdd-on見つけました!
今までは手動でベンチマークやっていましたが、便利なアドオン見つけました。
http://blenchmark.com/
※自己責任でお願いします。
使い方
ほかのアドオンと同様、「User Preferences」→ Add-onから「Install from File」
でアドオンをインストールして有効化
次に「Render」メニュー→「Run Benchmark」で、ベンチマークが起動
結果
デスクトップ(Corei7 4790K) 記録 159秒
デスクトップ(GTX1080) 記録 73秒25
GeForce GTX1080 with Corei7 4790K
ほかの方のGTX1080と同じ性能
まだCUDAToolがRC。正式版で
は5%~10%の向上する可能性あ
りとのこと。
期待しています。
GTX1080 に関するTips
2016/6/25 時点で、Cyclesは正式にPascal GPUに対応していません。
これは、Pascal用のCUDA ToolKit v8がRCの為で、実行すると
「When trying to render using GPU, I get: "Cuda binary kernel for this graphics card compute capability (6.1) not found."」
とエラーが出ます。
正式対応を待つか、有志が作成してくれている非公式CUDA Kernelを使いましょう。
https://developer.blender.org/T48544
デスクトップ(GTX1080 OC) 記録 68秒
GPUクロックを
1734MHz → 1906MHz
※4~5回に1度成功する程度
2GHz 空冷で余裕という
噂もありましたが駄目でした。
ごっついサーバ 記録 38秒71
Xeon(R) E5-2699 × 2ソケ (72コア) Memory 720GB
チューニングなし
参考:チューニングあり(CPU数が多いのでTiles設定を32x32に変更)
26秒44!!!
38秒71!
分散処理サーバ(Xeon D-1541) 記録 120秒
120秒ジャスト
Blenchmark まとめ
2.2倍
1.9倍
テストその2.
※CPU or OpenCLの性能をはかることができる
テストその2.
LuxMarkはOpenCLを用いたLuxRenderの宣伝用ツール
テスト内容
LuxCoreを用いてテストシーンをレンダリング、性能に応じてスコアが表示され
る。
Neumann TLM-120 SE
(1769K Tri)
Hotel Lobby
(4973K Tri)
LuxBall HDR
(217K Tri)
テスト結果 LuxBall HDR(簡単なシーン)
あ゛... 4部門のNo.1をとっちゃった...
LuxBallとHotelにおける、C++(Native)と、CPUのOpenCL
(Neumannもやればとれる)
ものたりない
BlenchMark、Luxmarkともに単一ノード性能計測
せっかくなのでLuxRenderのNetRendering(分散)も試そう!
分散レンダリングサーバで
・luxconsole -s
メインのサーバでここにIPを入力して+をクリックするだ
け
レンダリング対象
LuxRenderのExampleに含まれる、LuxTimeを使用。
秒間あたりのサンプリングレ
ートを性能とします
LuxTimeまとめ
最速は誰だ!?
Corei7 4790K(OpenCL)
分散処理サーバ(単体)
Corei7 4790K(C++)
GTX 1080
ごっついサーバ(単体)
ごっついサーバ(3ノー
ド)
分散処理サーバ(55ノー
ド)
①
②
③
④
⑤
⑥
⑦
まとめ
・GeForce GTX 1080、1070 は実用にはまだ早い。出力結果も怪しい!?
とはいえ、CUDA(Cycles)の性能は期待できる。
OpenCL(LuxRender)性能の判定もう少し様子見。
・やっぱりCPUレンダリング、分散レンダリングはいい。
制限が少ないので。
LuxRenderでは分散してもあまり性能落ちないので、クラウドでもいいかも。

04 これが(多分)最後! ベンチマークs