背景(GPUの欠点)
2019/12/18情報処理学会 第172回ハイパフォーマンスコンピューティング研究発表会 2
•条件分岐
• データレベルの並列性が低い処理
• 通信が多い処理(データ交換、制御など)
GPUの苦手な処理
GPUの苦手な処理をFPGAにより高速化
• 宇宙物理分野におけるLocally Essential Tree (LET) 生成のFPGAオフロード
– 計算+通信のオフロードにより、CPU実行に対し7.2倍高速化
[Tsuruta, C. et al, Off-loading let generation to peach2: A switching hub for high performance gpu
clusters. HEART, 2015]