応用事例紹介させてください
〜FPGAでエクストリームな
   コンピューティングの会
       〜
    電気通信大学
     吉見真聡
この発表について
• 発表者の取り組んだ研究事例の紹介
• 現在構想中のトピックについて少し紹介

• 話者紹介:吉見真聡(よしみまさと)
 – 慶應義塾大学〜同志社大学〜電気通信大学(吉永研)
 – もともとは科学計算専用ハードウェアの設計など
 – その後,Cell/B.E.,GPU,組み込みなど,専用ハー
   ドウェア,高性能アルゴリズムなどに関わる
 – 速く!安く!作りやすく!
生化学モデルとシミュレーション
  解析モデル(ODE)
             手法
              確率モデル(SSA)




                        確率的な振る舞いを含めたモデル化
                        モンテカルロ・シミュレーション

                       パラメータサーベイ的な性質
分子濃度を連続的な変量としてモデル
化
                       モデルの構築,検証に膨大な
                        シミュレーションを要する
                        →高いスレッドレベル並列性
                           パイプライン実行+並列モジュール



                                           3
FPGAを用いた化学反応シミュレー
              タ
   ReCSiP (Reconfigurable Cell Simulation Platform) [2003-]
       細胞内で生じる化学反応をシミュレーションする専用計算機
       長崎大学,JST-ERATO,Caltechとの共同研究(NIH)
       並列アクセス可能なSRAMと差動シリアル通信を実装
   FPGA: Field-Programmable Gate Array
       幸せな時代:1万~10万程度のLUTで任意の論理回路を構成するLSI
       十分な数のFP演算が構成できるようになっていた
                                                                   NoC型(16スレッド) SSA-FPGAの構造
                                              FP-                  ヒープ+NoC (2007)
                                            Multiplier                    D         D
           FPGA                             PRNG
                                                                               A
                                                                               B
                                                FP-                   C   D         D   C
                                             Logarithm
                                                                               E
                                                         入力 出力
         ReCSiP-3 board (2006)        LUT: LookUpTable 0000 1
         Xilinx Virtex-4 XC4VLX100-   出力をカスタム可能 0001 0
                                                                      C        F        C
         11FF1136                                        ….. 4..
                                                         1111 1
CUBE: 512 FPGA Cluster
   英国インペリアル・カレッジで海外研究(2009年2月~3月)
       FPGAが8x8実装されたボードを8枚重ねて運用•      Verilog-HDLを用いたFP演算の実装
                                       –   IEEE754準拠の四則演算+対数
       64ビット単方向信号で接続              •   乱数生成モジュール
                                       –   LSFR,Merssenne-Twisterなど
       ストリームアプリケーション向け計算システム      •   BlockRAMを利用したヒープ
       文字列編集距離で性能をCell/B.E.,GPUと比較•   NoC用ルータモジュール




このころ,CPUのマルチコア化と,GPUが人気になり,
「特定のアプリでも」何百倍も高速化する夢のデバイスと                                       5
してのFPGAはその歴史的役割を終えつつあった...(‘A`)
注目:PC内通信速度のギャッ
       プ



                 フォトンマッピングしたー
                 い!




           MBPR15(Core i7)でキャッシュに載ら
           なくなるとどうなるの?マージソー
(想定)並列ストレージ向けFPGA
  PCIe Gen3 ボード
  Max             FPGA: Computing
  32.0GB/s                 and
                Parallel Storage Access
  SATA each
  0.6GB/s


                  Max
                  0.125GB/s
                                  GbE
                                  NIC


                        FPGA-
                        board
    Parallel accessible SSDs
実現したいこと
• 並列ディスクアクセス密度の向上
 – (あたりまえ) RAIDを構築
 – 設置体積あたり,消費電力あたりのIO速度の向上
 – 分散処理の仕組みでノード数を削減
  • OSS-DBRMSのプラグインとかHadoopまわりのライブラリ
    等?
• 低遅延通信の実現
 – FPGA内でプリプロセス
  • FusionIOやらPCI-SSDをやっつけろ
ご相談
• 低遅延+IO-boundだと嬉しいアプリケー
  ション教えてください
• 各位の専門分野から,こんな機能,ライブ
  ラリが欲しい,という希望があれば教えて
  ください
Myoshimi extreme

Myoshimi extreme

  • 1.
    応用事例紹介させてください 〜FPGAでエクストリームな コンピューティングの会 〜 電気通信大学 吉見真聡
  • 2.
    この発表について • 発表者の取り組んだ研究事例の紹介 • 現在構想中のトピックについて少し紹介 •話者紹介:吉見真聡(よしみまさと) – 慶應義塾大学〜同志社大学〜電気通信大学(吉永研) – もともとは科学計算専用ハードウェアの設計など – その後,Cell/B.E.,GPU,組み込みなど,専用ハー ドウェア,高性能アルゴリズムなどに関わる – 速く!安く!作りやすく!
  • 3.
    生化学モデルとシミュレーション 解析モデル(ODE) 手法 確率モデル(SSA) 確率的な振る舞いを含めたモデル化 モンテカルロ・シミュレーション  パラメータサーベイ的な性質 分子濃度を連続的な変量としてモデル 化  モデルの構築,検証に膨大な シミュレーションを要する →高いスレッドレベル並列性  パイプライン実行+並列モジュール 3
  • 4.
    FPGAを用いた化学反応シミュレー タ  ReCSiP (Reconfigurable Cell Simulation Platform) [2003-]  細胞内で生じる化学反応をシミュレーションする専用計算機  長崎大学,JST-ERATO,Caltechとの共同研究(NIH)  並列アクセス可能なSRAMと差動シリアル通信を実装  FPGA: Field-Programmable Gate Array  幸せな時代:1万~10万程度のLUTで任意の論理回路を構成するLSI  十分な数のFP演算が構成できるようになっていた NoC型(16スレッド) SSA-FPGAの構造 FP- ヒープ+NoC (2007) Multiplier D D FPGA PRNG A B FP- C D D C Logarithm E 入力 出力 ReCSiP-3 board (2006) LUT: LookUpTable 0000 1 Xilinx Virtex-4 XC4VLX100- 出力をカスタム可能 0001 0 C F C 11FF1136 ….. 4.. 1111 1
  • 5.
    CUBE: 512 FPGACluster  英国インペリアル・カレッジで海外研究(2009年2月~3月)  FPGAが8x8実装されたボードを8枚重ねて運用• Verilog-HDLを用いたFP演算の実装 – IEEE754準拠の四則演算+対数  64ビット単方向信号で接続 • 乱数生成モジュール – LSFR,Merssenne-Twisterなど  ストリームアプリケーション向け計算システム • BlockRAMを利用したヒープ  文字列編集距離で性能をCell/B.E.,GPUと比較• NoC用ルータモジュール このころ,CPUのマルチコア化と,GPUが人気になり, 「特定のアプリでも」何百倍も高速化する夢のデバイスと 5 してのFPGAはその歴史的役割を終えつつあった...(‘A`)
  • 6.
    注目:PC内通信速度のギャッ プ フォトンマッピングしたー い! MBPR15(Core i7)でキャッシュに載ら なくなるとどうなるの?マージソー
  • 7.
    (想定)並列ストレージ向けFPGA PCIeGen3 ボード Max FPGA: Computing 32.0GB/s and Parallel Storage Access SATA each 0.6GB/s Max 0.125GB/s GbE NIC FPGA- board Parallel accessible SSDs
  • 8.
    実現したいこと • 並列ディスクアクセス密度の向上 –(あたりまえ) RAIDを構築 – 設置体積あたり,消費電力あたりのIO速度の向上 – 分散処理の仕組みでノード数を削減 • OSS-DBRMSのプラグインとかHadoopまわりのライブラリ 等? • 低遅延通信の実現 – FPGA内でプリプロセス • FusionIOやらPCI-SSDをやっつけろ
  • 9.
    ご相談 • 低遅延+IO-boundだと嬉しいアプリケー ション教えてください • 各位の専門分野から,こんな機能,ライブ ラリが欲しい,という希望があれば教えて ください