Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

[GTC 2018] DGXフォーラム Ridge-i発表資料

603 views

Published on

GTC Japan18
DGX-1とPCサーバーのパフォーマンス比較

Published in: Engineering
  • Be the first to comment

  • Be the first to like this

[GTC 2018] DGXフォーラム Ridge-i発表資料

  1. 1. DGX-1とPCサーバーのパフォーマンス比較 株式会社 Ridge-i 代表取締役社長 柳原 尚史 エンジニア 阿部 大志 2018年9月13日 DGX フォーラム
  2. 2. 1©2018 Ridge-i All Rights Reserved. 事業領域 ビジネスニーズに最適化し たAI技術を提供 • AIコンサルティング − 機械学習・ディープ ラーニング中心 • ソリューション開発 − 例:放送品質モノクロ 映像 彩色ディープ ラーニング 会社概要 オフィス • 千代田区大手町1-6-1- 442(大手町駅直結) 従業員数 • 15名 + α 主に機械学習エンジニ ア、コンサルタント 就労スタイル • 裁量労働制 パートナーシップ Deep Learning Lab幹事企業 (コミュニティ登録者3963人) Ridge-iについて
  3. 3. 2©2018 Ridge-i All Rights Reserved. 事例① 彩色ディープラーニング NHKで放映実績あり NHK『第50回思い出のメロディー』(2018年8月放送) • 番組内の企画コーナー “歌でつながる時代”― 「カラーでよみがえる 第1回 思い出のメロディー」のため に、初めて放送された回の白黒映像一部を、本システム を用いてカラー化 NHKスペシャル 「戦後ゼロ年東京ブラックホール 1945-1946」 (2017/8/20 NHKで放送) 大相撲 (2017/5/21 NHKで放送) 省力化を実現しながらも、放送クオリティを確保 人が価値を生み出せるところに集中し、AIをパートナーに 無断転載・配布禁止 プレゼン用途のみの画像部分 配布資料から削除しております
  4. 4. 3©2018 Ridge-i All Rights Reserved. 事例② ごみ焼却炉でのセグメンテーション活用 荏原環境プラント株式会社様と共同開発 従来の自動運転では 投入するごみ質の変動が大きく、 安定した燃焼ができない ごみの質をピクセル単位で 認識することに成功 熟練オペレータのノウハウを再現、 投入するごみ質の安定化が可能に ごみ焼却炉イメージ図 <燃焼状態を監視する中央操作室><クレーン操作室> ごみピット 焼却炉 課題と目的
  5. 5. 4©2018 Ridge-i All Rights Reserved. 事例② ごみをピクセル単位識別 プレゼン用途のみの画像部分 配布資料から削除しております
  6. 6. 5©2018 Ridge-i All Rights Reserved. • ルールでは波とオイルは分類困難 • 読み解けるのは一部のエキスパートのみ • AIの活用により、オイルスリック(油膜)が あるエリアを100%の精度で特定 衛星画像に対するディープラーニングによる解析の普及活動に参画 (総務省 4次元サイバーシティの活用に向けたタスクフォースのメンバー) 数枚の画像で学習 レーダー画像 AIによる解析 事例③ 衛星レーダ画像 SARでオイル流出検出
  7. 7. 6©2018 Ridge-i All Rights Reserved. AI 今回は、この技術をベースDGXで検証 学習用の良品画像 良品画像の 特徴を学んだ AI 検品画像 不良判定 良品には存在しなかった キズ・ゆがみなどを検出 事例④ ルールにできなかった 異常検知 生成モデルによる極小の傷の検知
  8. 8. 7©2018 Ridge-i All Rights Reserved. Ridge-iによるDGX-1検証 ■比較対象 ①DGX-1 Tesla V100 16GB × 8枚 ②PCサーバー GeForce 1080 Ti 11GB × 4枚 ■検証したアルゴリズム 独自開発した、異常検知用のAnoGAN ディープラーニングネットワーク 注:1日の検証なので、Apple to Appleではない簡易的な検証です。ご容赦ください
  9. 9. 8©2018 Ridge-i All Rights Reserved. Ridge-iによるDGX-1検証 ■調査背景 - NVIDIA社が発表したProgressive Growingという 2px*2pxから1024px*1024pxまで順次ネットワークを拡張させることで、 高解像度での学習と解析を可能する手法 (※本日テクニカルセッションで説明。SlideShareにアップ済) - 解像度が良い反面、学習時間が多くかかる - GPU4枚のPCサーバーでは2週間ほど学習にかかり、 効率化が求められていた
  10. 10. 9©2018 Ridge-i All Rights Reserved. ● Karrasらによって提案[3] (NVIDIA!!) ● 従来のGANsのクォリティを遥かに上回るGANsの学習手法 ○ 低解像度画像から徐々に学習を進め,最終的に高解像度・高精細画像を得る (参考)Progressive Growing of GANs
  11. 11. 10©2018 Ridge-i All Rights Reserved. (参考)AnoGANの利用用途 1~2 ピクセルの微細な傷に対して、 生成できない部位として外れ値が高く出力 プレゼン用途のみの画像部分 配布資料から削除しております
  12. 12. 11©2018 Ridge-i All Rights Reserved. Ridge-iによるDGX-1検証 ■学習条件 • 画像セット 322枚 • 学習画像サイズ 512px*512px • Batch sizeはサーバーごとにメモリアウトしない最大 ①DGX-1 64枚 ②PCサーバー 16枚 ※DGX-1ではNVLinkで一つの仮想メモリとして使えるのが大きな魅力 • イテレーション数 画像を20万枚分 学習するまで実行
  13. 13. 12©2018 Ridge-i All Rights Reserved. Ridge-iによるDGX-1検証 ■1イテレーションあたりの計測結果 1イテレーションあたり3倍程度のパフォーマンス向上 ①DGX-1 ②PCサーバ ー ②/① (速度向上) Forward (a) 23.3ms 59.8ms 2.6倍 Total (a+b+c+d) 46.1ms 151.2ms 3.3倍 Dataloader (c) 13.4ms 51.7ms 3.8倍 Backward (b) 3.2ms 7.4ms 2.3倍 その他 (d) 6.2ms 32.4ms 5.3倍
  14. 14. 13©2018 Ridge-i All Rights Reserved. Ridge-iによるDGX-1検証 ■総計測結果 バッチサイズ イテレーション 総学習時間 ①DGX-1 64枚 3,125回 144s ②PCサーバー 16枚 12,500回 1,890s ②/① (速度向上) 13.1倍 バッチサイズが4倍多く確保でき、 全体として13倍のパフォーマンス向上を発揮
  15. 15. 14©2018 Ridge-i All Rights Reserved. Ridge-iによるDGX-1検証 ■使い勝手 – NVIDIA Dockerのイメージにより、必要な環境を迅速に構築可能 – NVLinkで一つの大容量メモリとして利用でき、大きなバッチサイズで学習可能 – 複数GPUに分散する処理をユーザーが意識しないで行える ■まとめ – GPU枚数の対比としても、5倍のスピードアップを実感 – パフォーマンスを線形にスケールさせる並列環境を構築する手間を省け、 DGX-1 1台ですぐに実現できる面は非常に魅力的 超高速な並列GPU学習環境を、手間なく、すぐに構築できます

×