CPU・GPU
    ハイブリッドコンピューティング
     薦田 登志矢システム情報学専攻 博士3年
        komoda@hal.ipc.i.u-tokyo.ac.jp



1             2012 12/3 リサーチャーズカフェ       2012/12/5
並列計算機としてのGPU
   GPU is Everywhere
       Top 500 super computers
           52/500 のスパコンにGPUが搭載 (ICS, 2012)
       ラップトップ・モバイル端末
           GPUが搭載されているのが普通
                                                      AMD Radeon


   汎用的な並列処理をGPU上で実行
    (GPUコンピューティング)
       科学技術計算
       データマイニング
       動画像処理
                                                        NVIDIA Tesla
    2                      2012 12/3 リサーチャーズカフェ   2012/12/5
ヘテロジニアスシステム上の
タスクスケジューリング
   実用的なGPGPUアプリケーション
       「CPU処理」・「GPU処理」・「データ転送
        処理」が
        混在
GPU上でデータ並列性だけを利用するだ
    けでは不十分.

   粒度の大きなタスク並列性の利用
           CPU・GPU・データ転送バスという異なるデバ
            イス上
3
            で異なるタスクを並列実行したい 2012/12/5
                     2012 12/3 リサーチャーズカフェ
GPGPUアプリケーションのための
  タスクスケジューリングライブラリ
 パイプライン処理によるタスク並列性の利用
      高性能と高生産性の両立
                        input



 Applications    k1             k2   スケジューリング            CPU


                                k3
                                                         BUS
(APIを用いてライブラリの
タスクグラフ解析を支援)           output

 Programmers     タスクの依存関係を
                 表現したグラフ                                 GPU
   4                  2012 12/3 リサーチャーズカフェ   2012/12/5
実験結果(縦軸:性能向上率)
1.5
                                                  • 評価環境
 1
                                normal              • Intel CPU +
                                proposal
0.5
                                ideal overlap
                                                      Nvidia GPU
 0                                                  • OpenCLを用
      fft   nw   median   box                         いて提案ライブ
データ転送とGPU処理の並列実行(without User Hint)
                                                    • ラリを実装


                                                  • アプリケー
                                                   ション
                                                   • HPCアプリ
                                                   • 画像処理
 CPU, GPU, データ転送処理の並列実行 (with User Hint)
  5                        2012 12/3 リサーチャーズカフェ   2012/12/5
今後の課題
       大規模なアプリケーションへの提案ライブラリ
        の適用
       複数アクセラレータの並列実行
       低消費電力技術との融合
           動的電圧周波数制御とタスクスケジューリングの強調




                      GPUアプリケーションの
                      消費電力測定系

    6               2012 12/3 リサーチャーズカフェ   2012/12/5

2012 1203-researchers-cafe

  • 1.
    CPU・GPU ハイブリッドコンピューティング 薦田 登志矢システム情報学専攻 博士3年 komoda@hal.ipc.i.u-tokyo.ac.jp 1 2012 12/3 リサーチャーズカフェ 2012/12/5
  • 2.
    並列計算機としてのGPU  GPU is Everywhere  Top 500 super computers  52/500 のスパコンにGPUが搭載 (ICS, 2012)  ラップトップ・モバイル端末  GPUが搭載されているのが普通 AMD Radeon  汎用的な並列処理をGPU上で実行 (GPUコンピューティング)  科学技術計算  データマイニング  動画像処理 NVIDIA Tesla 2 2012 12/3 リサーチャーズカフェ 2012/12/5
  • 3.
    ヘテロジニアスシステム上の タスクスケジューリング  実用的なGPGPUアプリケーション  「CPU処理」・「GPU処理」・「データ転送 処理」が 混在 GPU上でデータ並列性だけを利用するだ けでは不十分.  粒度の大きなタスク並列性の利用  CPU・GPU・データ転送バスという異なるデバ イス上 3 で異なるタスクを並列実行したい 2012/12/5 2012 12/3 リサーチャーズカフェ
  • 4.
    GPGPUアプリケーションのための タスクスケジューリングライブラリ パイプライン処理によるタスク並列性の利用  高性能と高生産性の両立 input Applications k1 k2 スケジューリング CPU k3 BUS (APIを用いてライブラリの タスクグラフ解析を支援) output Programmers タスクの依存関係を 表現したグラフ GPU 4 2012 12/3 リサーチャーズカフェ 2012/12/5
  • 5.
    実験結果(縦軸:性能向上率) 1.5 • 評価環境 1 normal • Intel CPU + proposal 0.5 ideal overlap Nvidia GPU 0 • OpenCLを用 fft nw median box いて提案ライブ データ転送とGPU処理の並列実行(without User Hint) • ラリを実装 • アプリケー ション • HPCアプリ • 画像処理 CPU, GPU, データ転送処理の並列実行 (with User Hint) 5 2012 12/3 リサーチャーズカフェ 2012/12/5
  • 6.
    今後の課題  大規模なアプリケーションへの提案ライブラリ の適用  複数アクセラレータの並列実行  低消費電力技術との融合  動的電圧周波数制御とタスクスケジューリングの強調 GPUアプリケーションの 消費電力測定系 6 2012 12/3 リサーチャーズカフェ 2012/12/5