SlideShare a Scribd company logo
CUDAを利用したPIV解析の
  高速化に関する研究


指導教員      熱工学研究室
二宮 尚        史 翔新
CUDAを利用したPIV解析の
  高速化に関する研究


指導教員      熱工学研究室
二宮 尚        史 翔新
PIV
Particle Image Velocimetry
    粒子画像流速測定法
Particle Image Velocimetry




 時刻 t
Particle Image Velocimetry



        +
 時刻 t       時刻 t+Δt
Particle Image Velocimetry



        +             =
 時刻 t       時刻 t+Δt       ベクトル図
CPUで解析
CPUで解析

ベクトルを一個ずつ解析
CPUで解析

ベクトルを一個ずつ解析

    +
数千∼数万のベクトル
CPUで解析

ベクトルを一個ずつ解析

    +
数千∼数万のベクトル

    ¦¦
 解析時間が長い
CPUで解析

ベクトルを一個ずつ解析

    +
数千∼数万のベクトル

    ¦¦
  解析時間が長い
 (1枚10秒ほど)
同時に複数ベクトル解析
並列演算
GPGPU
CUDA™
解析時間



CPU (Average)




  GTX 560 Ti




                0   5          10     15




     ※画像サイズ: 1024×1024; 検査領域: 32×32 ;探査領域: 25×25
解析時間



CPU (Average)                       13.07 sec




  GTX 560 Ti




                0   5          10       15




     ※画像サイズ: 1024×1024; 検査領域: 32×32 ;探査領域: 25×25
解析時間



CPU (Average)                                  13.07 sec




  GTX 560 Ti        1.77 sec




                0              5          10       15




     ※画像サイズ: 1024×1024; 検査領域: 32×32 ;探査領域: 25×25
解析速度
10




5




               1X


0
        i5 (Sandy Bridge)          GTX 560 Ti


     ※画像サイズ: 1024×1024; 検査領域: 32×32 ;探査領域: 25×25
解析速度
10



                                      7X




5




               1X


0
        i5 (Sandy Bridge)          GTX 560 Ti


     ※画像サイズ: 1024×1024; 検査領域: 32×32 ;探査領域: 25×25
まだ足りない!
3
1
□Speed Up
最適化
最適化   スピード   読みやすさ   メンテナンス性
最適化   スピード   読みやすさ   メンテナンス性
最適化   スピード   読みやすさ   メンテナンス性
最適化   スピード   読みやすさ   メンテナンス性
最適化   スピード   読みやすさ   メンテナンス性
最適化   スピード   読みやすさ   メンテナンス性
最適化   スピード   読みやすさ   メンテナンス性
最適化   スピード   読みやすさ   メンテナンス性
最適化   スピード   読みやすさ   メンテナンス性
最適化   スピード   読みやすさ   メンテナンス性
最適化   スピード   読みやすさ   メンテナンス性
最適化   スピード   読みやすさ   メンテナンス性
解析時間


   CPU (Average)                                  13.07 sec




GTX 560 Ti (Old)       1.77 sec




GTX 560 Ti (New)



                   0              5          10       15




        ※画像サイズ: 1024×1024; 検査領域: 32×32 ;探査領域: 25×25
解析時間


   CPU (Average)                                       13.07 sec




GTX 560 Ti (Old)            1.77 sec




GTX 560 Ti (New)       0.12 sec




                   0                   5          10       15




        ※画像サイズ: 1024×1024; 検査領域: 32×32 ;探査領域: 25×25
解析速度
150




100




50




                            7X
           1X
 0
      CPU (Average)   GTX 560 Ti (Old)   GTX 560 Ti (Old)


      ※画像サイズ: 1024×1024; 検査領域: 32×32 ;探査領域: 25×25
解析速度
150




                                              109X

100




50




                            7X
           1X
 0
      CPU (Average)   GTX 560 Ti (Old)   GTX 560 Ti (Old)


      ※画像サイズ: 1024×1024; 検査領域: 32×32 ;探査領域: 25×25
□Speed Up
✓
□Speed Up
2
□サブピクセル解析
ガウス分布
□サブピクセル解析
✓
□サブピクセル解析
3
□誤ベクトル除去
周りのベクトルと照合
□誤ベクトル除去
✓
□誤ベクトル除去
✓
□誤ベクトル除去
✓
□Speed Up
✓
□サブピクセル解析
✓
□誤ベクトル除去
✓
□Speed Up
✓
□サブピクセル解析
✓
□誤ベクトル除去
解析速度
150




                                              109X

100




50




                            7X
           1X
 0
      CPU (Average)   GTX 560 Ti (Old)   GTX 560 Ti (Old)


      ※画像サイズ: 1024×1024; 検査領域: 32×32 ;探査領域: 25×25
解析速度
150




                                              109X

100

          □   □            □   □              □   □
          誤   サ            誤   サ              誤   サ
          ベ   ブ            ベ   ブ              ベ   ブ
          ク   ピ            ク   ピ              ク   ピ
50        ト   ク            ト   ク              ト   ク
          ル   セ            ル   セ              ル   セ
          除   ル            除   ル              除   ル
          去   解            去   解              去   解
              析                析                  析
                            7X
           1X
 0
      CPU (Average)   GTX 560 Ti (Old)   GTX 560 Ti (Old)


      ※画像サイズ: 1024×1024; 検査領域: 32×32 ;探査領域: 25×25
解析速度
150




                                              109X

100

          ✓
          □   ✓
              □            □   □              □   □
          誤   サ            誤   サ              誤   サ
          ベ   ブ            ベ   ブ              ベ   ブ
          ク   ピ            ク   ピ              ク   ピ
50        ト   ク            ト   ク              ト   ク
          ル   セ            ル   セ              ル   セ
          除   ル            除   ル              除   ル
          去   解            去   解              去   解
              析                析                  析
                            7X
           1X
 0
      CPU (Average)   GTX 560 Ti (Old)   GTX 560 Ti (Old)


      ※画像サイズ: 1024×1024; 検査領域: 32×32 ;探査領域: 25×25
解析速度
150




                                              109X

100




                          ✗
          ✓
          □   ✓
              □            □   □              □   □
          誤   サ            誤   サ              誤   サ
          ベ   ブ            ベ   ブ              ベ   ブ
          ク   ピ            ク   ピ              ク   ピ
50        ト   ク            ト   ク              ト   ク
          ル   セ            ル   セ              ル   セ
          除   ル            除   ル              除   ル
          去   解            去   解              去   解
              析                析                  析
                            7X
           1X
 0
      CPU (Average)   GTX 560 Ti (Old)   GTX 560 Ti (Old)


      ※画像サイズ: 1024×1024; 検査領域: 32×32 ;探査領域: 25×25
解析速度
150




                                              109X

100




                          ✗
          ✓
          □   ✓
              □            □   □              ✓
                                              □   ✓
                                                  □
          誤   サ            誤   サ              誤   サ
          ベ   ブ            ベ   ブ              ベ   ブ
          ク   ピ            ク   ピ              ク   ピ
50        ト   ク            ト   ク              ト   ク
          ル   セ            ル   セ              ル   セ
          除   ル            除   ル              除   ル
          去   解            去   解              去   解
              析                析                  析
                            7X
           1X
 0
      CPU (Average)   GTX 560 Ti (Old)   GTX 560 Ti (Old)


      ※画像サイズ: 1024×1024; 検査領域: 32×32 ;探査領域: 25×25
正真正銘の>100倍の速さ
「PIV解析において、GPGPUをうまく
駆使すれば、CPUより遥かに速い解析
スピードが得られます。」
おまけ
• 論文を一般公開(ソースコード含む)
• 論文を一般公開(ソースコード含む)
• iPad専用Multi-touch book同時公開
検索
CUDA PIV   検索
!ank y"

More Related Content

Viewers also liked

GPGPU Seminar (GPU Accelerated Libraries, 3 of 3, Thrust)
GPGPU Seminar (GPU Accelerated Libraries, 3 of 3, Thrust) GPGPU Seminar (GPU Accelerated Libraries, 3 of 3, Thrust)
GPGPU Seminar (GPU Accelerated Libraries, 3 of 3, Thrust)
智啓 出川
 
More modern gpu
More modern gpuMore modern gpu
More modern gpu
Preferred Networks
 
DRONE BORG 第一回ドローンビジネス勉強会資料
DRONE BORG 第一回ドローンビジネス勉強会資料DRONE BORG 第一回ドローンビジネス勉強会資料
DRONE BORG 第一回ドローンビジネス勉強会資料
DRONE BORG
 
CuPy解説
CuPy解説CuPy解説
CuPy解説
Ryosuke Okuta
 
できる!並列・並行プログラミング
できる!並列・並行プログラミングできる!並列・並行プログラミング
できる!並列・並行プログラミング
Preferred Networks
 
車載組み込み用ディープラーニング・エンジン NVIDIA DRIVE PX
車載組み込み用ディープラーニング・エンジン NVIDIA DRIVE PX車載組み込み用ディープラーニング・エンジン NVIDIA DRIVE PX
車載組み込み用ディープラーニング・エンジン NVIDIA DRIVE PX
NVIDIA Japan
 
The Top Skills That Can Get You Hired in 2017
The Top Skills That Can Get You Hired in 2017The Top Skills That Can Get You Hired in 2017
The Top Skills That Can Get You Hired in 2017
LinkedIn
 

Viewers also liked (7)

GPGPU Seminar (GPU Accelerated Libraries, 3 of 3, Thrust)
GPGPU Seminar (GPU Accelerated Libraries, 3 of 3, Thrust) GPGPU Seminar (GPU Accelerated Libraries, 3 of 3, Thrust)
GPGPU Seminar (GPU Accelerated Libraries, 3 of 3, Thrust)
 
More modern gpu
More modern gpuMore modern gpu
More modern gpu
 
DRONE BORG 第一回ドローンビジネス勉強会資料
DRONE BORG 第一回ドローンビジネス勉強会資料DRONE BORG 第一回ドローンビジネス勉強会資料
DRONE BORG 第一回ドローンビジネス勉強会資料
 
CuPy解説
CuPy解説CuPy解説
CuPy解説
 
できる!並列・並行プログラミング
できる!並列・並行プログラミングできる!並列・並行プログラミング
できる!並列・並行プログラミング
 
車載組み込み用ディープラーニング・エンジン NVIDIA DRIVE PX
車載組み込み用ディープラーニング・エンジン NVIDIA DRIVE PX車載組み込み用ディープラーニング・エンジン NVIDIA DRIVE PX
車載組み込み用ディープラーニング・エンジン NVIDIA DRIVE PX
 
The Top Skills That Can Get You Hired in 2017
The Top Skills That Can Get You Hired in 2017The Top Skills That Can Get You Hired in 2017
The Top Skills That Can Get You Hired in 2017
 

More from 翔新 史

ハッカソンに使うSwift & Swift 3.0のGCD
ハッカソンに使うSwift & Swift 3.0のGCDハッカソンに使うSwift & Swift 3.0のGCD
ハッカソンに使うSwift & Swift 3.0のGCD
翔新 史
 
CUDAを利用したPIV解析の高速化
CUDAを利用したPIV解析の高速化CUDAを利用したPIV解析の高速化
CUDAを利用したPIV解析の高速化
翔新 史
 
Steve jobs introducton
Steve jobs introductonSteve jobs introducton
Steve jobs introducton
翔新 史
 
2010 english honors camp music intro
2010 english honors camp music intro2010 english honors camp music intro
2010 english honors camp music intro
翔新 史
 
事業計画書
事業計画書事業計画書
事業計画書
翔新 史
 
工学部の魅力
工学部の魅力工学部の魅力
工学部の魅力
翔新 史
 
Honors camp music intro
Honors camp music introHonors camp music intro
Honors camp music intro
翔新 史
 

More from 翔新 史 (7)

ハッカソンに使うSwift & Swift 3.0のGCD
ハッカソンに使うSwift & Swift 3.0のGCDハッカソンに使うSwift & Swift 3.0のGCD
ハッカソンに使うSwift & Swift 3.0のGCD
 
CUDAを利用したPIV解析の高速化
CUDAを利用したPIV解析の高速化CUDAを利用したPIV解析の高速化
CUDAを利用したPIV解析の高速化
 
Steve jobs introducton
Steve jobs introductonSteve jobs introducton
Steve jobs introducton
 
2010 english honors camp music intro
2010 english honors camp music intro2010 english honors camp music intro
2010 english honors camp music intro
 
事業計画書
事業計画書事業計画書
事業計画書
 
工学部の魅力
工学部の魅力工学部の魅力
工学部の魅力
 
Honors camp music intro
Honors camp music introHonors camp music intro
Honors camp music intro
 

CUDAを利用したPIV解析の高速化に関する研究(卒業発表)