Submit Search
Upload
Hpc148
•
0 likes
•
747 views
N
N.Nakasato
Follow
第148回HPC研究会の発表スライド
Read less
Read more
Report
Share
Report
Share
1 of 18
Download now
Download to read offline
Recommended
2015年度先端GPGPUシミュレーション工学特論 第13回 数値流体力学への応用(高度な最適化)
2015年度先端GPGPUシミュレーション工学特論 第13回 数値流体力学への応用(高度な最適化)
智啓 出川
長岡技術科学大学 2015年度先端GPGPUシミュレーション工学特論(全15回,大学院生対象講義) 第13回数値流体力学への応用(高度な最適化) 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313 ・第1回補足 GROUSEの利用方法 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180326 ・第2回 GPUによる並列計算の概念とメモリアクセス http://www.slideshare.net/ssuserf87701/2015gpgpu2-59180382 ・第3回 GPUプログラム構造の詳細(threadとwarp) http://www.slideshare.net/ssuserf87701/2015gpgpu3-59180483 ・第4回 GPUのメモリ階層の詳細(共有メモリ) http://www.slideshare.net/ssuserf87701/2015gpgpu4-59180572 ・第5回 GPUのメモリ階層の詳細(様々なメモリの利用) http://www.slideshare.net/ssuserf87701/2015gpgpu5-59180652 ・第6回 プログラムの性能評価指針(Flop/Byte,計算律速,メモリ律速) http://www.slideshare.net/ssuserf87701/2015gpgpu6-59180736 ・第7回 総和計算(Atomic演算) http://www.slideshare.net/ssuserf87701/2015gpgpu7-59180844 ・第8回 偏微分方程式の差分計算(拡散方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu8-59180918 ・第9回 偏微分方程式の差分計算(移流方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu9-59180982 ・第10回 Poisson方程式の求解(線形連立一次方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu10-59181031 ・第11回 数値流体力学への応用(支配方程式,CPUプログラム) http://www.slideshare.net/ssuserf87701/2015gpgpu11-59181134 ・第12回 数値流体力学への応用(GPUへの移植) http://www.slideshare.net/ssuserf87701/2015gpgpu12-59181230 ・第13回 数値流体力学への応用(高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu13-59181316 ・第14回 複数GPUの利用 http://www.slideshare.net/ssuserf87701/2015gpgpu14-59181367 ・第15回 CPUとGPUの協調 http://www.slideshare.net/ssuserf87701/2015gpgpu15-59181450 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 講義には長岡技術科学大学のGPGPUシステム(GROUSE)を利用しています。 開発環境 CPU Intel Xeon X5670 × 32 GPU NVIDIA Tesla M2050(Fermi世代) × 64 CUDA 4.0(諸般の事情によりバージョンアップされていません) PGI Fortran 11.3
El text.tokuron a(2019).watanabe190613
El text.tokuron a(2019).watanabe190613
RCCSRENKEI
配信講義 計算科学技術特論A (2019) https://www.r-ccs.riken.jp/library/event/tokuronA_2019.html
2015年度GPGPU実践プログラミング 第7回 総和計算
2015年度GPGPU実践プログラミング 第7回 総和計算
智啓 出川
長岡技術科学大学 2015年度GPGPU実践プログラミング(全15回,学部4年対象講義) 第7回総和計算 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 ・第2回 GPUのアーキテクチャとプログラム構造 http://www.slideshare.net/ssuserf87701/2015gpgpu2-59179215 ・第3回 GPGPUプログラミング環境 http://www.slideshare.net/ssuserf87701/2015gpgpu3-59179255 ・第3回補足 GROUSEの利用方法 http://www.slideshare.net/ssuserf87701/2015gpgpu3-59183677 ・第4回 GPUでの並列プログラミング(ベクトル和,移動平均,差分法) http://www.slideshare.net/ssuserf87701/2015gpgpu4-59179449 ・第5回 GPUのメモリ階層 http://www.slideshare.net/ssuserf87701/2015gpgpu5-59179536 ・第6回 パフォーマンス解析ツール http://www.slideshare.net/ssuserf87701/2015gpgpu6-59179577 ・第7回 総和計算 http://www.slideshare.net/ssuserf87701/2015gpgpu7-59179639 ・第8回 総和計算(高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu8-59179686 ・第9回 行列計算(行列-行列積) http://www.slideshare.net/ssuserf87701/2015gpgpu9-59179722 ・第10回 行列計算(行列-行列積の高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu10-59179759 ・第11回 画像処理 http://www.slideshare.net/ssuserf87701/2015gpgpu11-59179789 ・第12回 偏微分方程式の差分計算 http://www.slideshare.net/ssuserf87701/2015gpgpu12-59179972 ・第13回 多粒子の運動 http://www.slideshare.net/ssuserf87701/2015gpgpu13-59180018 ・第14回 N体問題 http://www.slideshare.net/ssuserf87701/2015gpgpu14-59180054 ・第15回 GPU最適化ライブラリ http://www.slideshare.net/ssuserf87701/2015gpgpu15-59180086 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 講義には長岡技術科学大学のGPGPUシステム(GROUSE)を利用しています。 開発環境 CPU Intel Xeon X5670 × 32 GPU NVIDIA Tesla M2050(Fermi世代) × 64 CUDA 4.0(諸般の事情によりバージョンアップされていません) PGI Fortran 11.3
El text.tokuron a(2019).watanabe190606
El text.tokuron a(2019).watanabe190606
RCCSRENKEI
配信講義 計算科学技術特論A (2019) https://www.r-ccs.riken.jp/library/event/tokuronA_2019.html
GPGPU Seminar (GPU Accelerated Libraries, 2 of 3, cuSPARSE)
GPGPU Seminar (GPU Accelerated Libraries, 2 of 3, cuSPARSE)
智啓 出川
GPU最適化ライブラリの利用(1/3,cuBLAS) 長岡技術科学大学2015年度GPGPU講習会(2015年10月14日実施) CUDA付属のライブラリを利用して連立一次方程式を解く内容を3回に分けて実施. 1回目 cuBLASを利用したGPU移植 http://www.slideshare.net/ssuserf87701/gpgpu-seminar-gpu-accelerated-libraries-1-of-3-cublas 2回目 cuSPARSEを利用した省メモリ化 3回目 Thrustを利用した実装効率化 http://www.slideshare.net/ssuserf87701/gpgpu-seminar-gpu-accelerated-libraries-3-of-3-thrust 講義には長岡技術科学大学のGPGPUシステム(GROUSE)を利用しています。 開発環境 CPU Intel Xeon X5670 × 32 GPU NVIDIA Tesla M2050(Fermi世代) × 64 CUDA 4.0(諸般の事情によりバージョンアップされていません。) PGI Fortran 11.3 (with CUDA 3.2) GPGPU講習会 ・PyCUDA http://www.slideshare.net/ssuserf87701/gpgpu-seminar-pycuda ・CUDA Fortranによる格子ボルツマン法の高速化 http://www.slideshare.net/ssuserf87701/gpgpu-seminar-accelerataion-of-lattice-boltzmann-method-using-cuda-fortran ・補足資料 GPGPUとCUDA Fortran http://www.slideshare.net/ssuserf87701/gpgpu-seminar-gpgpu-and-cuda-fortran ・GPU最適化ライブラリの利用(その1,cuBLAS) http://www.slideshare.net/ssuserf87701/gpgpu-seminar-gpu-accelerated-libraries-1-of-3-cublas ・GPU最適化ライブラリの利用(その2,cuSPARSE) http://www.slideshare.net/ssuserf87701/gpgpu-seminar-gpu-accelerated-libraries-2-of-3-cusparse ・GPU最適化ライブラリの利用(その3,Thrust) http://www.slideshare.net/ssuserf87701/gpgpu-seminar-gpu-accelerated-libraries-3-of-3-thrust 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313
2015年度GPGPU実践プログラミング 第12回 偏微分方程式の差分計算
2015年度GPGPU実践プログラミング 第12回 偏微分方程式の差分計算
智啓 出川
長岡技術科学大学 2015年度GPGPU実践プログラミング(全15回,学部4年対象講義) 第12回偏微分方程式の差分計算 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 ・第2回 GPUのアーキテクチャとプログラム構造 http://www.slideshare.net/ssuserf87701/2015gpgpu2-59179215 ・第3回 GPGPUプログラミング環境 http://www.slideshare.net/ssuserf87701/2015gpgpu3-59179255 ・第3回補足 GROUSEの利用方法 http://www.slideshare.net/ssuserf87701/2015gpgpu3-59183677 ・第4回 GPUでの並列プログラミング(ベクトル和,移動平均,差分法) http://www.slideshare.net/ssuserf87701/2015gpgpu4-59179449 ・第5回 GPUのメモリ階層 http://www.slideshare.net/ssuserf87701/2015gpgpu5-59179536 ・第6回 パフォーマンス解析ツール http://www.slideshare.net/ssuserf87701/2015gpgpu6-59179577 ・第7回 総和計算 http://www.slideshare.net/ssuserf87701/2015gpgpu7-59179639 ・第8回 総和計算(高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu8-59179686 ・第9回 行列計算(行列-行列積) http://www.slideshare.net/ssuserf87701/2015gpgpu9-59179722 ・第10回 行列計算(行列-行列積の高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu10-59179759 ・第11回 画像処理 http://www.slideshare.net/ssuserf87701/2015gpgpu11-59179789 ・第12回 偏微分方程式の差分計算 http://www.slideshare.net/ssuserf87701/2015gpgpu12-59179972 ・第13回 多粒子の運動 http://www.slideshare.net/ssuserf87701/2015gpgpu13-59180018 ・第14回 N体問題 http://www.slideshare.net/ssuserf87701/2015gpgpu14-59180054 ・第15回 GPU最適化ライブラリ http://www.slideshare.net/ssuserf87701/2015gpgpu15-59180086 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 講義には長岡技術科学大学のGPGPUシステム(GROUSE)を利用しています。 開発環境 CPU Intel Xeon X5670 × 32 GPU NVIDIA Tesla M2050(Fermi世代) × 64 CUDA 4.0(諸般の事情によりバージョンアップされていません) PGI Fortran 11.3
2015年度先端GPGPUシミュレーション工学特論 第5回 GPUのメモリ階層の詳細(様々なメモリの利用)
2015年度先端GPGPUシミュレーション工学特論 第5回 GPUのメモリ階層の詳細(様々なメモリの利用)
智啓 出川
長岡技術科学大学 2015年度先端GPGPUシミュレーション工学特論(全15回,大学院生対象講義) 第5回GPUのメモリ階層の詳細(様々なメモリの利用) 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313 ・第1回補足 GROUSEの利用方法 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180326 ・第2回 GPUによる並列計算の概念とメモリアクセス http://www.slideshare.net/ssuserf87701/2015gpgpu2-59180382 ・第3回 GPUプログラム構造の詳細(threadとwarp) http://www.slideshare.net/ssuserf87701/2015gpgpu3-59180483 ・第4回 GPUのメモリ階層の詳細(共有メモリ) http://www.slideshare.net/ssuserf87701/2015gpgpu4-59180572 ・第5回 GPUのメモリ階層の詳細(様々なメモリの利用) http://www.slideshare.net/ssuserf87701/2015gpgpu5-59180652 ・第6回 プログラムの性能評価指針(Flop/Byte,計算律速,メモリ律速) http://www.slideshare.net/ssuserf87701/2015gpgpu6-59180736 ・第7回 総和計算(Atomic演算) http://www.slideshare.net/ssuserf87701/2015gpgpu7-59180844 ・第8回 偏微分方程式の差分計算(拡散方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu8-59180918 ・第9回 偏微分方程式の差分計算(移流方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu9-59180982 ・第10回 Poisson方程式の求解(線形連立一次方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu10-59181031 ・第11回 数値流体力学への応用(支配方程式,CPUプログラム) http://www.slideshare.net/ssuserf87701/2015gpgpu11-59181134 ・第12回 数値流体力学への応用(GPUへの移植) http://www.slideshare.net/ssuserf87701/2015gpgpu12-59181230 ・第13回 数値流体力学への応用(高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu13-59181316 ・第14回 複数GPUの利用 http://www.slideshare.net/ssuserf87701/2015gpgpu14-59181367 ・第15回 CPUとGPUの協調 http://www.slideshare.net/ssuserf87701/2015gpgpu15-59181450 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 講義には長岡技術科学大学のGPGPUシステム(GROUSE)を利用しています。 開発環境 CPU Intel Xeon X5670 × 32 GPU NVIDIA Tesla M2050(Fermi世代) × 64 CUDA 4.0(諸般の事情によりバージョンアップされていません) PGI Fortran 11.3
2015年度先端GPGPUシミュレーション工学特論 第1回 先端シミュレーションおよび産業界におけるGPUの役割
2015年度先端GPGPUシミュレーション工学特論 第1回 先端シミュレーションおよび産業界におけるGPUの役割
智啓 出川
長岡技術科学大学 2015年度先端GPGPUシミュレーション工学特論(全15回,大学院生対象講義) 第1回先端シミュレーションおよび産業界におけるGPUの役割 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313 ・第1回補足 GROUSEの利用方法 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180326 ・第2回 GPUによる並列計算の概念とメモリアクセス http://www.slideshare.net/ssuserf87701/2015gpgpu2-59180382 ・第3回 GPUプログラム構造の詳細(threadとwarp) http://www.slideshare.net/ssuserf87701/2015gpgpu3-59180483 ・第4回 GPUのメモリ階層の詳細(共有メモリ) http://www.slideshare.net/ssuserf87701/2015gpgpu4-59180572 ・第5回 GPUのメモリ階層の詳細(様々なメモリの利用) http://www.slideshare.net/ssuserf87701/2015gpgpu5-59180652 ・第6回 プログラムの性能評価指針(Flop/Byte,計算律速,メモリ律速) http://www.slideshare.net/ssuserf87701/2015gpgpu6-59180736 ・第7回 総和計算(Atomic演算) http://www.slideshare.net/ssuserf87701/2015gpgpu7-59180844 ・第8回 偏微分方程式の差分計算(拡散方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu8-59180918 ・第9回 偏微分方程式の差分計算(移流方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu9-59180982 ・第10回 Poisson方程式の求解(線形連立一次方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu10-59181031 ・第11回 数値流体力学への応用(支配方程式,CPUプログラム) http://www.slideshare.net/ssuserf87701/2015gpgpu11-59181134 ・第12回 数値流体力学への応用(GPUへの移植) http://www.slideshare.net/ssuserf87701/2015gpgpu12-59181230 ・第13回 数値流体力学への応用(高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu13-59181316 ・第14回 複数GPUの利用 http://www.slideshare.net/ssuserf87701/2015gpgpu14-59181367 ・第15回 CPUとGPUの協調 http://www.slideshare.net/ssuserf87701/2015gpgpu15-59181450 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 講義には長岡技術科学大学のGPGPUシステム(GROUSE)を利用しています。 開発環境 CPU Intel Xeon X5670 × 32 GPU NVIDIA Tesla M2050(Fermi世代) × 64 CUDA 4.0(諸般の事情によりバージョンアップされていません) PGI Fortran 11.3
Recommended
2015年度先端GPGPUシミュレーション工学特論 第13回 数値流体力学への応用(高度な最適化)
2015年度先端GPGPUシミュレーション工学特論 第13回 数値流体力学への応用(高度な最適化)
智啓 出川
長岡技術科学大学 2015年度先端GPGPUシミュレーション工学特論(全15回,大学院生対象講義) 第13回数値流体力学への応用(高度な最適化) 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313 ・第1回補足 GROUSEの利用方法 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180326 ・第2回 GPUによる並列計算の概念とメモリアクセス http://www.slideshare.net/ssuserf87701/2015gpgpu2-59180382 ・第3回 GPUプログラム構造の詳細(threadとwarp) http://www.slideshare.net/ssuserf87701/2015gpgpu3-59180483 ・第4回 GPUのメモリ階層の詳細(共有メモリ) http://www.slideshare.net/ssuserf87701/2015gpgpu4-59180572 ・第5回 GPUのメモリ階層の詳細(様々なメモリの利用) http://www.slideshare.net/ssuserf87701/2015gpgpu5-59180652 ・第6回 プログラムの性能評価指針(Flop/Byte,計算律速,メモリ律速) http://www.slideshare.net/ssuserf87701/2015gpgpu6-59180736 ・第7回 総和計算(Atomic演算) http://www.slideshare.net/ssuserf87701/2015gpgpu7-59180844 ・第8回 偏微分方程式の差分計算(拡散方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu8-59180918 ・第9回 偏微分方程式の差分計算(移流方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu9-59180982 ・第10回 Poisson方程式の求解(線形連立一次方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu10-59181031 ・第11回 数値流体力学への応用(支配方程式,CPUプログラム) http://www.slideshare.net/ssuserf87701/2015gpgpu11-59181134 ・第12回 数値流体力学への応用(GPUへの移植) http://www.slideshare.net/ssuserf87701/2015gpgpu12-59181230 ・第13回 数値流体力学への応用(高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu13-59181316 ・第14回 複数GPUの利用 http://www.slideshare.net/ssuserf87701/2015gpgpu14-59181367 ・第15回 CPUとGPUの協調 http://www.slideshare.net/ssuserf87701/2015gpgpu15-59181450 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 講義には長岡技術科学大学のGPGPUシステム(GROUSE)を利用しています。 開発環境 CPU Intel Xeon X5670 × 32 GPU NVIDIA Tesla M2050(Fermi世代) × 64 CUDA 4.0(諸般の事情によりバージョンアップされていません) PGI Fortran 11.3
El text.tokuron a(2019).watanabe190613
El text.tokuron a(2019).watanabe190613
RCCSRENKEI
配信講義 計算科学技術特論A (2019) https://www.r-ccs.riken.jp/library/event/tokuronA_2019.html
2015年度GPGPU実践プログラミング 第7回 総和計算
2015年度GPGPU実践プログラミング 第7回 総和計算
智啓 出川
長岡技術科学大学 2015年度GPGPU実践プログラミング(全15回,学部4年対象講義) 第7回総和計算 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 ・第2回 GPUのアーキテクチャとプログラム構造 http://www.slideshare.net/ssuserf87701/2015gpgpu2-59179215 ・第3回 GPGPUプログラミング環境 http://www.slideshare.net/ssuserf87701/2015gpgpu3-59179255 ・第3回補足 GROUSEの利用方法 http://www.slideshare.net/ssuserf87701/2015gpgpu3-59183677 ・第4回 GPUでの並列プログラミング(ベクトル和,移動平均,差分法) http://www.slideshare.net/ssuserf87701/2015gpgpu4-59179449 ・第5回 GPUのメモリ階層 http://www.slideshare.net/ssuserf87701/2015gpgpu5-59179536 ・第6回 パフォーマンス解析ツール http://www.slideshare.net/ssuserf87701/2015gpgpu6-59179577 ・第7回 総和計算 http://www.slideshare.net/ssuserf87701/2015gpgpu7-59179639 ・第8回 総和計算(高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu8-59179686 ・第9回 行列計算(行列-行列積) http://www.slideshare.net/ssuserf87701/2015gpgpu9-59179722 ・第10回 行列計算(行列-行列積の高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu10-59179759 ・第11回 画像処理 http://www.slideshare.net/ssuserf87701/2015gpgpu11-59179789 ・第12回 偏微分方程式の差分計算 http://www.slideshare.net/ssuserf87701/2015gpgpu12-59179972 ・第13回 多粒子の運動 http://www.slideshare.net/ssuserf87701/2015gpgpu13-59180018 ・第14回 N体問題 http://www.slideshare.net/ssuserf87701/2015gpgpu14-59180054 ・第15回 GPU最適化ライブラリ http://www.slideshare.net/ssuserf87701/2015gpgpu15-59180086 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 講義には長岡技術科学大学のGPGPUシステム(GROUSE)を利用しています。 開発環境 CPU Intel Xeon X5670 × 32 GPU NVIDIA Tesla M2050(Fermi世代) × 64 CUDA 4.0(諸般の事情によりバージョンアップされていません) PGI Fortran 11.3
El text.tokuron a(2019).watanabe190606
El text.tokuron a(2019).watanabe190606
RCCSRENKEI
配信講義 計算科学技術特論A (2019) https://www.r-ccs.riken.jp/library/event/tokuronA_2019.html
GPGPU Seminar (GPU Accelerated Libraries, 2 of 3, cuSPARSE)
GPGPU Seminar (GPU Accelerated Libraries, 2 of 3, cuSPARSE)
智啓 出川
GPU最適化ライブラリの利用(1/3,cuBLAS) 長岡技術科学大学2015年度GPGPU講習会(2015年10月14日実施) CUDA付属のライブラリを利用して連立一次方程式を解く内容を3回に分けて実施. 1回目 cuBLASを利用したGPU移植 http://www.slideshare.net/ssuserf87701/gpgpu-seminar-gpu-accelerated-libraries-1-of-3-cublas 2回目 cuSPARSEを利用した省メモリ化 3回目 Thrustを利用した実装効率化 http://www.slideshare.net/ssuserf87701/gpgpu-seminar-gpu-accelerated-libraries-3-of-3-thrust 講義には長岡技術科学大学のGPGPUシステム(GROUSE)を利用しています。 開発環境 CPU Intel Xeon X5670 × 32 GPU NVIDIA Tesla M2050(Fermi世代) × 64 CUDA 4.0(諸般の事情によりバージョンアップされていません。) PGI Fortran 11.3 (with CUDA 3.2) GPGPU講習会 ・PyCUDA http://www.slideshare.net/ssuserf87701/gpgpu-seminar-pycuda ・CUDA Fortranによる格子ボルツマン法の高速化 http://www.slideshare.net/ssuserf87701/gpgpu-seminar-accelerataion-of-lattice-boltzmann-method-using-cuda-fortran ・補足資料 GPGPUとCUDA Fortran http://www.slideshare.net/ssuserf87701/gpgpu-seminar-gpgpu-and-cuda-fortran ・GPU最適化ライブラリの利用(その1,cuBLAS) http://www.slideshare.net/ssuserf87701/gpgpu-seminar-gpu-accelerated-libraries-1-of-3-cublas ・GPU最適化ライブラリの利用(その2,cuSPARSE) http://www.slideshare.net/ssuserf87701/gpgpu-seminar-gpu-accelerated-libraries-2-of-3-cusparse ・GPU最適化ライブラリの利用(その3,Thrust) http://www.slideshare.net/ssuserf87701/gpgpu-seminar-gpu-accelerated-libraries-3-of-3-thrust 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313
2015年度GPGPU実践プログラミング 第12回 偏微分方程式の差分計算
2015年度GPGPU実践プログラミング 第12回 偏微分方程式の差分計算
智啓 出川
長岡技術科学大学 2015年度GPGPU実践プログラミング(全15回,学部4年対象講義) 第12回偏微分方程式の差分計算 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 ・第2回 GPUのアーキテクチャとプログラム構造 http://www.slideshare.net/ssuserf87701/2015gpgpu2-59179215 ・第3回 GPGPUプログラミング環境 http://www.slideshare.net/ssuserf87701/2015gpgpu3-59179255 ・第3回補足 GROUSEの利用方法 http://www.slideshare.net/ssuserf87701/2015gpgpu3-59183677 ・第4回 GPUでの並列プログラミング(ベクトル和,移動平均,差分法) http://www.slideshare.net/ssuserf87701/2015gpgpu4-59179449 ・第5回 GPUのメモリ階層 http://www.slideshare.net/ssuserf87701/2015gpgpu5-59179536 ・第6回 パフォーマンス解析ツール http://www.slideshare.net/ssuserf87701/2015gpgpu6-59179577 ・第7回 総和計算 http://www.slideshare.net/ssuserf87701/2015gpgpu7-59179639 ・第8回 総和計算(高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu8-59179686 ・第9回 行列計算(行列-行列積) http://www.slideshare.net/ssuserf87701/2015gpgpu9-59179722 ・第10回 行列計算(行列-行列積の高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu10-59179759 ・第11回 画像処理 http://www.slideshare.net/ssuserf87701/2015gpgpu11-59179789 ・第12回 偏微分方程式の差分計算 http://www.slideshare.net/ssuserf87701/2015gpgpu12-59179972 ・第13回 多粒子の運動 http://www.slideshare.net/ssuserf87701/2015gpgpu13-59180018 ・第14回 N体問題 http://www.slideshare.net/ssuserf87701/2015gpgpu14-59180054 ・第15回 GPU最適化ライブラリ http://www.slideshare.net/ssuserf87701/2015gpgpu15-59180086 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 講義には長岡技術科学大学のGPGPUシステム(GROUSE)を利用しています。 開発環境 CPU Intel Xeon X5670 × 32 GPU NVIDIA Tesla M2050(Fermi世代) × 64 CUDA 4.0(諸般の事情によりバージョンアップされていません) PGI Fortran 11.3
2015年度先端GPGPUシミュレーション工学特論 第5回 GPUのメモリ階層の詳細(様々なメモリの利用)
2015年度先端GPGPUシミュレーション工学特論 第5回 GPUのメモリ階層の詳細(様々なメモリの利用)
智啓 出川
長岡技術科学大学 2015年度先端GPGPUシミュレーション工学特論(全15回,大学院生対象講義) 第5回GPUのメモリ階層の詳細(様々なメモリの利用) 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313 ・第1回補足 GROUSEの利用方法 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180326 ・第2回 GPUによる並列計算の概念とメモリアクセス http://www.slideshare.net/ssuserf87701/2015gpgpu2-59180382 ・第3回 GPUプログラム構造の詳細(threadとwarp) http://www.slideshare.net/ssuserf87701/2015gpgpu3-59180483 ・第4回 GPUのメモリ階層の詳細(共有メモリ) http://www.slideshare.net/ssuserf87701/2015gpgpu4-59180572 ・第5回 GPUのメモリ階層の詳細(様々なメモリの利用) http://www.slideshare.net/ssuserf87701/2015gpgpu5-59180652 ・第6回 プログラムの性能評価指針(Flop/Byte,計算律速,メモリ律速) http://www.slideshare.net/ssuserf87701/2015gpgpu6-59180736 ・第7回 総和計算(Atomic演算) http://www.slideshare.net/ssuserf87701/2015gpgpu7-59180844 ・第8回 偏微分方程式の差分計算(拡散方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu8-59180918 ・第9回 偏微分方程式の差分計算(移流方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu9-59180982 ・第10回 Poisson方程式の求解(線形連立一次方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu10-59181031 ・第11回 数値流体力学への応用(支配方程式,CPUプログラム) http://www.slideshare.net/ssuserf87701/2015gpgpu11-59181134 ・第12回 数値流体力学への応用(GPUへの移植) http://www.slideshare.net/ssuserf87701/2015gpgpu12-59181230 ・第13回 数値流体力学への応用(高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu13-59181316 ・第14回 複数GPUの利用 http://www.slideshare.net/ssuserf87701/2015gpgpu14-59181367 ・第15回 CPUとGPUの協調 http://www.slideshare.net/ssuserf87701/2015gpgpu15-59181450 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 講義には長岡技術科学大学のGPGPUシステム(GROUSE)を利用しています。 開発環境 CPU Intel Xeon X5670 × 32 GPU NVIDIA Tesla M2050(Fermi世代) × 64 CUDA 4.0(諸般の事情によりバージョンアップされていません) PGI Fortran 11.3
2015年度先端GPGPUシミュレーション工学特論 第1回 先端シミュレーションおよび産業界におけるGPUの役割
2015年度先端GPGPUシミュレーション工学特論 第1回 先端シミュレーションおよび産業界におけるGPUの役割
智啓 出川
長岡技術科学大学 2015年度先端GPGPUシミュレーション工学特論(全15回,大学院生対象講義) 第1回先端シミュレーションおよび産業界におけるGPUの役割 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313 ・第1回補足 GROUSEの利用方法 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180326 ・第2回 GPUによる並列計算の概念とメモリアクセス http://www.slideshare.net/ssuserf87701/2015gpgpu2-59180382 ・第3回 GPUプログラム構造の詳細(threadとwarp) http://www.slideshare.net/ssuserf87701/2015gpgpu3-59180483 ・第4回 GPUのメモリ階層の詳細(共有メモリ) http://www.slideshare.net/ssuserf87701/2015gpgpu4-59180572 ・第5回 GPUのメモリ階層の詳細(様々なメモリの利用) http://www.slideshare.net/ssuserf87701/2015gpgpu5-59180652 ・第6回 プログラムの性能評価指針(Flop/Byte,計算律速,メモリ律速) http://www.slideshare.net/ssuserf87701/2015gpgpu6-59180736 ・第7回 総和計算(Atomic演算) http://www.slideshare.net/ssuserf87701/2015gpgpu7-59180844 ・第8回 偏微分方程式の差分計算(拡散方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu8-59180918 ・第9回 偏微分方程式の差分計算(移流方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu9-59180982 ・第10回 Poisson方程式の求解(線形連立一次方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu10-59181031 ・第11回 数値流体力学への応用(支配方程式,CPUプログラム) http://www.slideshare.net/ssuserf87701/2015gpgpu11-59181134 ・第12回 数値流体力学への応用(GPUへの移植) http://www.slideshare.net/ssuserf87701/2015gpgpu12-59181230 ・第13回 数値流体力学への応用(高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu13-59181316 ・第14回 複数GPUの利用 http://www.slideshare.net/ssuserf87701/2015gpgpu14-59181367 ・第15回 CPUとGPUの協調 http://www.slideshare.net/ssuserf87701/2015gpgpu15-59181450 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 講義には長岡技術科学大学のGPGPUシステム(GROUSE)を利用しています。 開発環境 CPU Intel Xeon X5670 × 32 GPU NVIDIA Tesla M2050(Fermi世代) × 64 CUDA 4.0(諸般の事情によりバージョンアップされていません) PGI Fortran 11.3
2015年度GPGPU実践プログラミング 第8回 総和計算(高度な最適化)
2015年度GPGPU実践プログラミング 第8回 総和計算(高度な最適化)
智啓 出川
長岡技術科学大学 2015年度GPGPU実践プログラミング(全15回,学部4年対象講義) 第8回総和計算(高度な最適化) 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 ・第2回 GPUのアーキテクチャとプログラム構造 http://www.slideshare.net/ssuserf87701/2015gpgpu2-59179215 ・第3回 GPGPUプログラミング環境 http://www.slideshare.net/ssuserf87701/2015gpgpu3-59179255 ・第3回補足 GROUSEの利用方法 http://www.slideshare.net/ssuserf87701/2015gpgpu3-59183677 ・第4回 GPUでの並列プログラミング(ベクトル和,移動平均,差分法) http://www.slideshare.net/ssuserf87701/2015gpgpu4-59179449 ・第5回 GPUのメモリ階層 http://www.slideshare.net/ssuserf87701/2015gpgpu5-59179536 ・第6回 パフォーマンス解析ツール http://www.slideshare.net/ssuserf87701/2015gpgpu6-59179577 ・第7回 総和計算 http://www.slideshare.net/ssuserf87701/2015gpgpu7-59179639 ・第8回 総和計算(高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu8-59179686 ・第9回 行列計算(行列-行列積) http://www.slideshare.net/ssuserf87701/2015gpgpu9-59179722 ・第10回 行列計算(行列-行列積の高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu10-59179759 ・第11回 画像処理 http://www.slideshare.net/ssuserf87701/2015gpgpu11-59179789 ・第12回 偏微分方程式の差分計算 http://www.slideshare.net/ssuserf87701/2015gpgpu12-59179972 ・第13回 多粒子の運動 http://www.slideshare.net/ssuserf87701/2015gpgpu13-59180018 ・第14回 N体問題 http://www.slideshare.net/ssuserf87701/2015gpgpu14-59180054 ・第15回 GPU最適化ライブラリ http://www.slideshare.net/ssuserf87701/2015gpgpu15-59180086 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 講義には長岡技術科学大学のGPGPUシステム(GROUSE)を利用しています。 開発環境 CPU Intel Xeon X5670 × 32 GPU NVIDIA Tesla M2050(Fermi世代) × 64 CUDA 4.0(諸般の事情によりバージョンアップされていません) PGI Fortran 11.3
GPGPU Seminar (GPU Accelerated Libraries, 3 of 3, Thrust)
GPGPU Seminar (GPU Accelerated Libraries, 3 of 3, Thrust)
智啓 出川
GPU最適化ライブラリの利用(1/3,cuBLAS) 長岡技術科学大学2015年度GPGPU講習会(2015年10月14日実施) CUDA付属のライブラリを利用して連立一次方程式を解く内容を3回に分けて実施. 1回目 cuBLASを利用したGPU移植 http://www.slideshare.net/ssuserf87701/gpgpu-seminar-gpu-accelerated-libraries-1-of-3-cublas 2回目 cuSPARSEを利用した省メモリ化 http://www.slideshare.net/ssuserf87701/gpgpu-seminar-gpu-accelerated-libraries-2-of-3-cusparse 3回目 Thrustを利用した実装効率化 講義には長岡技術科学大学のGPGPUシステム(GROUSE)を利用しています。 開発環境 CPU Intel Xeon X5670 × 32 GPU NVIDIA Tesla M2050(Fermi世代) × 64 CUDA 4.0(諸般の事情によりバージョンアップされていません。) PGI Fortran 11.3 (with CUDA 3.2) GPGPU講習会 ・PyCUDA http://www.slideshare.net/ssuserf87701/gpgpu-seminar-pycuda ・CUDA Fortranによる格子ボルツマン法の高速化 http://www.slideshare.net/ssuserf87701/gpgpu-seminar-accelerataion-of-lattice-boltzmann-method-using-cuda-fortran ・補足資料 GPGPUとCUDA Fortran http://www.slideshare.net/ssuserf87701/gpgpu-seminar-gpgpu-and-cuda-fortran ・GPU最適化ライブラリの利用(その1,cuBLAS) http://www.slideshare.net/ssuserf87701/gpgpu-seminar-gpu-accelerated-libraries-1-of-3-cublas ・GPU最適化ライブラリの利用(その2,cuSPARSE) http://www.slideshare.net/ssuserf87701/gpgpu-seminar-gpu-accelerated-libraries-2-of-3-cusparse ・GPU最適化ライブラリの利用(その3,Thrust) http://www.slideshare.net/ssuserf87701/gpgpu-seminar-gpu-accelerated-libraries-3-of-3-thrust 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313
2015年度GPGPU実践基礎工学 第1回 学際的分野における先端シミュレーション技術の歴史
2015年度GPGPU実践基礎工学 第1回 学際的分野における先端シミュレーション技術の歴史
智啓 出川
長岡技術科学大学 2015年度GPGPU実践基礎工学(全15回,学部3年対象講義) 第1回学際的分野における先端シミュレーション技術の歴史 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 ・第2回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu2 ・第3回 GPUクラスタ上でのプログラミング(CUDA) http://www.slideshare.net/ssuserf87701/2015gpgpu3 ・第4回 CPUのアーキテクチャ http://www.slideshare.net/ssuserf87701/2015gpgpu4 ・第5回 ハードウェアによるCPUの高速化技術 http://www.slideshare.net/ssuserf87701/2015gpgpu5 ・第6回 ソフトウェアによるCPUの高速化技術 http://www.slideshare.net/ssuserf87701/2015gpgpu6 ・第7回 シングルコアとマルチコア http://www.slideshare.net/ssuserf87701/2015gpgpu7 ・第8回 並列計算の概念(プロセスとスレッド) http://www.slideshare.net/ssuserf87701/2015gpgpu8 ・第9回 GPUのアーキテクチャ http://www.slideshare.net/ssuserf87701/2015gpgpu9 ・第9回補足 GROUSEの利用方法 http://www.slideshare.net/ssuserf87701/2015gpgpu9-59160061 ・第10回 GPGPUのプログラム構造 http://www.slideshare.net/ssuserf87701/2015gpgpu10 ・第11回 GPUでの並列プログラミング(ベクトル和) http://www.slideshare.net/ssuserf87701/2015gpgpu11 ・第12回 GPUによる画像処理 http://w ww.slideshare.net/ssuserf87701/2015gpgpu12 ・第13回GPUのメモリ階層 http://www.slideshare.net/ssuserf87701/2015gpgpu13 ・第14回 GPGPU組込開発環境 http://www.slideshare.net/ssuserf87701/2015gpgpu14 ・第15回 GPGPUの開発環境(OpenCL) http://www.slideshare.net/ssuserf87701/2015gpgpu15 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313 講義には長岡技術科学大学のGPGPUシステム(GROUSE)を利用しています。 開発環境 CPU Intel Xeon X5670 × 32 GPU NVIDIA Tesla M2050(Fermi世代) × 64 CUDA 4.0(諸般の事情によりバージョンアップされていません) PGI Fortran 11.3
2015年度先端GPGPUシミュレーション工学特論 第8回 偏微分方程式の差分計算(拡散方程式)
2015年度先端GPGPUシミュレーション工学特論 第8回 偏微分方程式の差分計算(拡散方程式)
智啓 出川
長岡技術科学大学 2015年度先端GPGPUシミュレーション工学特論(全15回,大学院生対象講義) 第8回偏微分方程式の差分計算(拡散方程式) 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313 ・第1回補足 GROUSEの利用方法 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180326 ・第2回 GPUによる並列計算の概念とメモリアクセス http://www.slideshare.net/ssuserf87701/2015gpgpu2-59180382 ・第3回 GPUプログラム構造の詳細(threadとwarp) http://www.slideshare.net/ssuserf87701/2015gpgpu3-59180483 ・第4回 GPUのメモリ階層の詳細(共有メモリ) http://www.slideshare.net/ssuserf87701/2015gpgpu4-59180572 ・第5回 GPUのメモリ階層の詳細(様々なメモリの利用) http://www.slideshare.net/ssuserf87701/2015gpgpu5-59180652 ・第6回 プログラムの性能評価指針(Flop/Byte,計算律速,メモリ律速) http://www.slideshare.net/ssuserf87701/2015gpgpu6-59180736 ・第7回 総和計算(Atomic演算) http://www.slideshare.net/ssuserf87701/2015gpgpu7-59180844 ・第8回 偏微分方程式の差分計算(拡散方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu8-59180918 ・第9回 偏微分方程式の差分計算(移流方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu9-59180982 ・第10回 Poisson方程式の求解(線形連立一次方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu10-59181031 ・第11回 数値流体力学への応用(支配方程式,CPUプログラム) http://www.slideshare.net/ssuserf87701/2015gpgpu11-59181134 ・第12回 数値流体力学への応用(GPUへの移植) http://www.slideshare.net/ssuserf87701/2015gpgpu12-59181230 ・第13回 数値流体力学への応用(高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu13-59181316 ・第14回 複数GPUの利用 http://www.slideshare.net/ssuserf87701/2015gpgpu14-59181367 ・第15回 CPUとGPUの協調 http://www.slideshare.net/ssuserf87701/2015gpgpu15-59181450 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 講義には長岡技術科学大学のGPGPUシステム(GROUSE)を利用しています。 開発環境 CPU Intel Xeon X5670 × 32 GPU NVIDIA Tesla M2050(Fermi世代) × 64 CUDA 4.0(諸般の事情によりバージョンアップされていません) PGI Fortran 11.3
2015年度GPGPU実践プログラミング 第10回 行列計算(行列-行列積の高度な最適化)
2015年度GPGPU実践プログラミング 第10回 行列計算(行列-行列積の高度な最適化)
智啓 出川
長岡技術科学大学 2015年度GPGPU実践プログラミング(全15回,学部4年対象講義) 第10回行列計算(行列-行列積の高度な最適化) 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 ・第2回 GPUのアーキテクチャとプログラム構造 http://www.slideshare.net/ssuserf87701/2015gpgpu2-59179215 ・第3回 GPGPUプログラミング環境 http://www.slideshare.net/ssuserf87701/2015gpgpu3-59179255 ・第3回補足 GROUSEの利用方法 http://www.slideshare.net/ssuserf87701/2015gpgpu3-59183677 ・第4回 GPUでの並列プログラミング(ベクトル和,移動平均,差分法) http://www.slideshare.net/ssuserf87701/2015gpgpu4-59179449 ・第5回 GPUのメモリ階層 http://www.slideshare.net/ssuserf87701/2015gpgpu5-59179536 ・第6回 パフォーマンス解析ツール http://www.slideshare.net/ssuserf87701/2015gpgpu6-59179577 ・第7回 総和計算 http://www.slideshare.net/ssuserf87701/2015gpgpu7-59179639 ・第8回 総和計算(高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu8-59179686 ・第9回 行列計算(行列-行列積) http://www.slideshare.net/ssuserf87701/2015gpgpu9-59179722 ・第10回 行列計算(行列-行列積の高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu10-59179759 ・第11回 画像処理 http://www.slideshare.net/ssuserf87701/2015gpgpu11-59179789 ・第12回 偏微分方程式の差分計算 http://www.slideshare.net/ssuserf87701/2015gpgpu12-59179972 ・第13回 多粒子の運動 http://www.slideshare.net/ssuserf87701/2015gpgpu13-59180018 ・第14回 N体問題 http://www.slideshare.net/ssuserf87701/2015gpgpu14-59180054 ・第15回 GPU最適化ライブラリ http://www.slideshare.net/ssuserf87701/2015gpgpu15-59180086 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 講義には長岡技術科学大学のGPGPUシステム(GROUSE)を利用しています。 開発環境 CPU Intel Xeon X5670 × 32 GPU NVIDIA Tesla M2050(Fermi世代) × 64 CUDA 4.0(諸般の事情によりバージョンアップされていません) PGI Fortran 11.3
GPGPU Seminar (PyCUDA)
GPGPU Seminar (PyCUDA)
智啓 出川
PyCUDA - CUDA C以外の開発環境 長岡技術科学大学2015年度GPGPU講習会(2015年11月25日実施) 開発および講義には長岡技術科学大学のGPU搭載ラップトップPC(GROUSE2)を利用しています。 開発環境 Dell Precision M4600 CPU Intel Core i7 2.7GHz メモリ 32GB GPU NVIDIA Quadro 2000M CUDA 6.5 Visual Studio Community 2013 Python 3.4 GPGPU講習会 ・PyCUDA http://www.slideshare.net/ssuserf87701/gpgpu-seminar-pycuda ・CUDA Fortranによる格子ボルツマン法の高速化 http://www.slideshare.net/ssuserf87701/gpgpu-seminar-accelerataion-of-lattice-boltzmann-method-using-cuda-fortran ・補足資料 GPGPUとCUDA Fortran http://www.slideshare.net/ssuserf87701/gpgpu-seminar-gpgpu-and-cuda-fortran ・GPU最適化ライブラリの利用(その1,cuBLAS) http://www.slideshare.net/ssuserf87701/gpgpu-seminar-gpu-accelerated-libraries-1-of-3-cublas ・GPU最適化ライブラリの利用(その2,cuSPARSE) http://www.slideshare.net/ssuserf87701/gpgpu-seminar-gpu-accelerated-libraries-2-of-3-cusparse ・GPU最適化ライブラリの利用(その3,Thrust) http://www.slideshare.net/ssuserf87701/gpgpu-seminar-gpu-accelerated-libraries-3-of-3-thrust 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313
El text.tokuron a(2019).ishimura190725
El text.tokuron a(2019).ishimura190725
RCCSRENKEI
配信講義 計算科学技術特論A (2019) https://www.r-ccs.riken.jp/library/event/tokuronA_2019.html
El text.tokuron a(2019).katagiri190509
El text.tokuron a(2019).katagiri190509
RCCSRENKEI
配信講義 計算科学技術特論A (2019) https://www.r-ccs.riken.jp/library/event/tokuronA_2019.html
NumPy闇入門
NumPy闇入門
Ryosuke Okuta
NumPyのちょっと不思議な挙動などをまとめた資料です。クイズ形式で紹介&解説をします。 PFIセミナー2016/01/28:NumPy闇入門 https://www.youtube.com/watch?v=fdLKVMCrzNE 2016/3/20 問題の一部を修正
El text.tokuron a(2019).katagiri190425
El text.tokuron a(2019).katagiri190425
RCCSRENKEI
配信講義 計算科学技術特論A (2019) https://www.r-ccs.riken.jp/library/event/tokuronA_2019.html
200528material takahashi
200528material takahashi
RCCSRENKEI
https://www.r-ccs.riken.jp/library/event/tokuronB_2020.html
DEEP LEARNING、トレーニング・インファレンスのGPUによる高速化
DEEP LEARNING、トレーニング・インファレンスのGPUによる高速化
RCCSRENKEI
計算科学技術特論B2020
Very helpful python code to find coefficients of the finite difference method
Very helpful python code to find coefficients of the finite difference method
智啓 出川
Python(Sympy)でLagrange補間多項式を記号的に構成し,それを微分することで差分法の公式を導出する方法の概説.
El text.tokuron a(2019).yoshii190704
El text.tokuron a(2019).yoshii190704
RCCSRENKEI
配信講義 計算科学技術特論A (2019) https://www.r-ccs.riken.jp/library/event/tokuronA_2019.html
Intel GoldmontとMPXとゆるふわなごや
Intel GoldmontとMPXとゆるふわなごや
Masaki Ota
Intel GoldmontとMPXとゆるふわなごや
More modern gpu
More modern gpu
Preferred Networks
GPUがなぜ速いのか,またその上でどのようなデータ構造やアルゴリズム,ライブラリが使えるのかを説明します。特にMapReduceなどの非均質で,離散的なアルゴリズムがいかに高速に実現されるかを紹介します。 実験に使ったコード https://github.com/hillbig/gpuexperiments セミナーの動画 https://www.youtube.com/watch?v=WmETPBK3MOI
2015年度先端GPGPUシミュレーション工学特論 第9回 偏微分方程式の差分計算(移流方程式)
2015年度先端GPGPUシミュレーション工学特論 第9回 偏微分方程式の差分計算(移流方程式)
智啓 出川
長岡技術科学大学 2015年度先端GPGPUシミュレーション工学特論(全15回,大学院生対象講義) 第9回偏微分方程式の差分計算(移流方程式) 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313 ・第1回補足 GROUSEの利用方法 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180326 ・第2回 GPUによる並列計算の概念とメモリアクセス http://www.slideshare.net/ssuserf87701/2015gpgpu2-59180382 ・第3回 GPUプログラム構造の詳細(threadとwarp) http://www.slideshare.net/ssuserf87701/2015gpgpu3-59180483 ・第4回 GPUのメモリ階層の詳細(共有メモリ) http://www.slideshare.net/ssuserf87701/2015gpgpu4-59180572 ・第5回 GPUのメモリ階層の詳細(様々なメモリの利用) http://www.slideshare.net/ssuserf87701/2015gpgpu5-59180652 ・第6回 プログラムの性能評価指針(Flop/Byte,計算律速,メモリ律速) http://www.slideshare.net/ssuserf87701/2015gpgpu6-59180736 ・第7回 総和計算(Atomic演算) http://www.slideshare.net/ssuserf87701/2015gpgpu7-59180844 ・第8回 偏微分方程式の差分計算(拡散方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu8-59180918 ・第9回 偏微分方程式の差分計算(移流方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu9-59180982 ・第10回 Poisson方程式の求解(線形連立一次方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu10-59181031 ・第11回 数値流体力学への応用(支配方程式,CPUプログラム) http://www.slideshare.net/ssuserf87701/2015gpgpu11-59181134 ・第12回 数値流体力学への応用(GPUへの移植) http://www.slideshare.net/ssuserf87701/2015gpgpu12-59181230 ・第13回 数値流体力学への応用(高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu13-59181316 ・第14回 複数GPUの利用 http://www.slideshare.net/ssuserf87701/2015gpgpu14-59181367 ・第15回 CPUとGPUの協調 http://www.slideshare.net/ssuserf87701/2015gpgpu15-59181450 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 講義には長岡技術科学大学のGPGPUシステム(GROUSE)を利用しています。 開発環境 CPU Intel Xeon X5670 × 32 GPU NVIDIA Tesla M2050(Fermi世代) × 64 CUDA 4.0(諸般の事情によりバージョンアップされていません) PGI Fortran 11.3
200521material takahashi
200521material takahashi
RCCSRENKEI
https://www.r-ccs.riken.jp/library/event/tokuronB_2020.html
2015年度GPGPU実践プログラミング 第9回 行列計算(行列-行列積)
2015年度GPGPU実践プログラミング 第9回 行列計算(行列-行列積)
智啓 出川
長岡技術科学大学 2015年度GPGPU実践プログラミング(全15回,学部4年対象講義) 第9回行列計算(行列-行列積) 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 ・第2回 GPUのアーキテクチャとプログラム構造 http://www.slideshare.net/ssuserf87701/2015gpgpu2-59179215 ・第3回 GPGPUプログラミング環境 http://www.slideshare.net/ssuserf87701/2015gpgpu3-59179255 ・第3回補足 GROUSEの利用方法 http://www.slideshare.net/ssuserf87701/2015gpgpu3-59183677 ・第4回 GPUでの並列プログラミング(ベクトル和,移動平均,差分法) http://www.slideshare.net/ssuserf87701/2015gpgpu4-59179449 ・第5回 GPUのメモリ階層 http://www.slideshare.net/ssuserf87701/2015gpgpu5-59179536 ・第6回 パフォーマンス解析ツール http://www.slideshare.net/ssuserf87701/2015gpgpu6-59179577 ・第7回 総和計算 http://www.slideshare.net/ssuserf87701/2015gpgpu7-59179639 ・第8回 総和計算(高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu8-59179686 ・第9回 行列計算(行列-行列積) http://www.slideshare.net/ssuserf87701/2015gpgpu9-59179722 ・第10回 行列計算(行列-行列積の高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu10-59179759 ・第11回 画像処理 http://www.slideshare.net/ssuserf87701/2015gpgpu11-59179789 ・第12回 偏微分方程式の差分計算 http://www.slideshare.net/ssuserf87701/2015gpgpu12-59179972 ・第13回 多粒子の運動 http://www.slideshare.net/ssuserf87701/2015gpgpu13-59180018 ・第14回 N体問題 http://www.slideshare.net/ssuserf87701/2015gpgpu14-59180054 ・第15回 GPU最適化ライブラリ http://www.slideshare.net/ssuserf87701/2015gpgpu15-59180086 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 講義には長岡技術科学大学のGPGPUシステム(GROUSE)を利用しています。 開発環境 CPU Intel Xeon X5670 × 32 GPU NVIDIA Tesla M2050(Fermi世代) × 64 CUDA 4.0(諸般の事情によりバージョンアップされていません) PGI Fortran 11.3
2015年度GPGPU実践プログラミング 第4回 GPUでの並列プログラミング(ベクトル和,移動平均,差分法)
2015年度GPGPU実践プログラミング 第4回 GPUでの並列プログラミング(ベクトル和,移動平均,差分法)
智啓 出川
長岡技術科学大学 2015年度GPGPU実践プログラミング(全15回,学部4年対象講義) 第4回GPUでの並列プログラミング(ベクトル和,移動平均,差分法) 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 ・第2回 GPUのアーキテクチャとプログラム構造 http://www.slideshare.net/ssuserf87701/2015gpgpu2-59179215 ・第3回 GPGPUプログラミング環境 http://www.slideshare.net/ssuserf87701/2015gpgpu3-59179255 ・第3回補足 GROUSEの利用方法 http://www.slideshare.net/ssuserf87701/2015gpgpu3-59183677 ・第4回 GPUでの並列プログラミング(ベクトル和,移動平均,差分法) http://www.slideshare.net/ssuserf87701/2015gpgpu4-59179449 ・第5回 GPUのメモリ階層 http://www.slideshare.net/ssuserf87701/2015gpgpu5-59179536 ・第6回 パフォーマンス解析ツール http://www.slideshare.net/ssuserf87701/2015gpgpu6-59179577 ・第7回 総和計算 http://www.slideshare.net/ssuserf87701/2015gpgpu7-59179639 ・第8回 総和計算(高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu8-59179686 ・第9回 行列計算(行列-行列積) http://www.slideshare.net/ssuserf87701/2015gpgpu9-59179722 ・第10回 行列計算(行列-行列積の高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu10-59179759 ・第11回 画像処理 http://www.slideshare.net/ssuserf87701/2015gpgpu11-59179789 ・第12回 偏微分方程式の差分計算 http://www.slideshare.net/ssuserf87701/2015gpgpu12-59179972 ・第13回 多粒子の運動 http://www.slideshare.net/ssuserf87701/2015gpgpu13-59180018 ・第14回 N体問題 http://www.slideshare.net/ssuserf87701/2015gpgpu14-59180054 ・第15回 GPU最適化ライブラリ http://www.slideshare.net/ssuserf87701/2015gpgpu15-59180086 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 講義には長岡技術科学大学のGPGPUシステム(GROUSE)を利用しています。 開発環境 CPU Intel Xeon X5670 × 32 GPU NVIDIA Tesla M2050(Fermi世代) × 64 CUDA 4.0(諸般の事情によりバージョンアップされていません) PGI Fortran 11.3
プログラムを高速化する話Ⅱ 〜GPGPU編〜
プログラムを高速化する話Ⅱ 〜GPGPU編〜
京大 マイコンクラブ
GPUを利用して汎用演算を行う技術であるGPGPUを用いて、プログラムを高速化する技法についてまとめました。高速化の具体例も適宜用いて解説しています。 CPU編はこちら https://www.slideshare.net/KMC_JP/ss-45855264
電子動力学アプリケーションの最適化2
電子動力学アプリケーションの最適化2
RCCSRENKEI
計算技術科学特論B2020
More Related Content
What's hot
2015年度GPGPU実践プログラミング 第8回 総和計算(高度な最適化)
2015年度GPGPU実践プログラミング 第8回 総和計算(高度な最適化)
智啓 出川
長岡技術科学大学 2015年度GPGPU実践プログラミング(全15回,学部4年対象講義) 第8回総和計算(高度な最適化) 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 ・第2回 GPUのアーキテクチャとプログラム構造 http://www.slideshare.net/ssuserf87701/2015gpgpu2-59179215 ・第3回 GPGPUプログラミング環境 http://www.slideshare.net/ssuserf87701/2015gpgpu3-59179255 ・第3回補足 GROUSEの利用方法 http://www.slideshare.net/ssuserf87701/2015gpgpu3-59183677 ・第4回 GPUでの並列プログラミング(ベクトル和,移動平均,差分法) http://www.slideshare.net/ssuserf87701/2015gpgpu4-59179449 ・第5回 GPUのメモリ階層 http://www.slideshare.net/ssuserf87701/2015gpgpu5-59179536 ・第6回 パフォーマンス解析ツール http://www.slideshare.net/ssuserf87701/2015gpgpu6-59179577 ・第7回 総和計算 http://www.slideshare.net/ssuserf87701/2015gpgpu7-59179639 ・第8回 総和計算(高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu8-59179686 ・第9回 行列計算(行列-行列積) http://www.slideshare.net/ssuserf87701/2015gpgpu9-59179722 ・第10回 行列計算(行列-行列積の高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu10-59179759 ・第11回 画像処理 http://www.slideshare.net/ssuserf87701/2015gpgpu11-59179789 ・第12回 偏微分方程式の差分計算 http://www.slideshare.net/ssuserf87701/2015gpgpu12-59179972 ・第13回 多粒子の運動 http://www.slideshare.net/ssuserf87701/2015gpgpu13-59180018 ・第14回 N体問題 http://www.slideshare.net/ssuserf87701/2015gpgpu14-59180054 ・第15回 GPU最適化ライブラリ http://www.slideshare.net/ssuserf87701/2015gpgpu15-59180086 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 講義には長岡技術科学大学のGPGPUシステム(GROUSE)を利用しています。 開発環境 CPU Intel Xeon X5670 × 32 GPU NVIDIA Tesla M2050(Fermi世代) × 64 CUDA 4.0(諸般の事情によりバージョンアップされていません) PGI Fortran 11.3
GPGPU Seminar (GPU Accelerated Libraries, 3 of 3, Thrust)
GPGPU Seminar (GPU Accelerated Libraries, 3 of 3, Thrust)
智啓 出川
GPU最適化ライブラリの利用(1/3,cuBLAS) 長岡技術科学大学2015年度GPGPU講習会(2015年10月14日実施) CUDA付属のライブラリを利用して連立一次方程式を解く内容を3回に分けて実施. 1回目 cuBLASを利用したGPU移植 http://www.slideshare.net/ssuserf87701/gpgpu-seminar-gpu-accelerated-libraries-1-of-3-cublas 2回目 cuSPARSEを利用した省メモリ化 http://www.slideshare.net/ssuserf87701/gpgpu-seminar-gpu-accelerated-libraries-2-of-3-cusparse 3回目 Thrustを利用した実装効率化 講義には長岡技術科学大学のGPGPUシステム(GROUSE)を利用しています。 開発環境 CPU Intel Xeon X5670 × 32 GPU NVIDIA Tesla M2050(Fermi世代) × 64 CUDA 4.0(諸般の事情によりバージョンアップされていません。) PGI Fortran 11.3 (with CUDA 3.2) GPGPU講習会 ・PyCUDA http://www.slideshare.net/ssuserf87701/gpgpu-seminar-pycuda ・CUDA Fortranによる格子ボルツマン法の高速化 http://www.slideshare.net/ssuserf87701/gpgpu-seminar-accelerataion-of-lattice-boltzmann-method-using-cuda-fortran ・補足資料 GPGPUとCUDA Fortran http://www.slideshare.net/ssuserf87701/gpgpu-seminar-gpgpu-and-cuda-fortran ・GPU最適化ライブラリの利用(その1,cuBLAS) http://www.slideshare.net/ssuserf87701/gpgpu-seminar-gpu-accelerated-libraries-1-of-3-cublas ・GPU最適化ライブラリの利用(その2,cuSPARSE) http://www.slideshare.net/ssuserf87701/gpgpu-seminar-gpu-accelerated-libraries-2-of-3-cusparse ・GPU最適化ライブラリの利用(その3,Thrust) http://www.slideshare.net/ssuserf87701/gpgpu-seminar-gpu-accelerated-libraries-3-of-3-thrust 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313
2015年度GPGPU実践基礎工学 第1回 学際的分野における先端シミュレーション技術の歴史
2015年度GPGPU実践基礎工学 第1回 学際的分野における先端シミュレーション技術の歴史
智啓 出川
長岡技術科学大学 2015年度GPGPU実践基礎工学(全15回,学部3年対象講義) 第1回学際的分野における先端シミュレーション技術の歴史 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 ・第2回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu2 ・第3回 GPUクラスタ上でのプログラミング(CUDA) http://www.slideshare.net/ssuserf87701/2015gpgpu3 ・第4回 CPUのアーキテクチャ http://www.slideshare.net/ssuserf87701/2015gpgpu4 ・第5回 ハードウェアによるCPUの高速化技術 http://www.slideshare.net/ssuserf87701/2015gpgpu5 ・第6回 ソフトウェアによるCPUの高速化技術 http://www.slideshare.net/ssuserf87701/2015gpgpu6 ・第7回 シングルコアとマルチコア http://www.slideshare.net/ssuserf87701/2015gpgpu7 ・第8回 並列計算の概念(プロセスとスレッド) http://www.slideshare.net/ssuserf87701/2015gpgpu8 ・第9回 GPUのアーキテクチャ http://www.slideshare.net/ssuserf87701/2015gpgpu9 ・第9回補足 GROUSEの利用方法 http://www.slideshare.net/ssuserf87701/2015gpgpu9-59160061 ・第10回 GPGPUのプログラム構造 http://www.slideshare.net/ssuserf87701/2015gpgpu10 ・第11回 GPUでの並列プログラミング(ベクトル和) http://www.slideshare.net/ssuserf87701/2015gpgpu11 ・第12回 GPUによる画像処理 http://w ww.slideshare.net/ssuserf87701/2015gpgpu12 ・第13回GPUのメモリ階層 http://www.slideshare.net/ssuserf87701/2015gpgpu13 ・第14回 GPGPU組込開発環境 http://www.slideshare.net/ssuserf87701/2015gpgpu14 ・第15回 GPGPUの開発環境(OpenCL) http://www.slideshare.net/ssuserf87701/2015gpgpu15 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313 講義には長岡技術科学大学のGPGPUシステム(GROUSE)を利用しています。 開発環境 CPU Intel Xeon X5670 × 32 GPU NVIDIA Tesla M2050(Fermi世代) × 64 CUDA 4.0(諸般の事情によりバージョンアップされていません) PGI Fortran 11.3
2015年度先端GPGPUシミュレーション工学特論 第8回 偏微分方程式の差分計算(拡散方程式)
2015年度先端GPGPUシミュレーション工学特論 第8回 偏微分方程式の差分計算(拡散方程式)
智啓 出川
長岡技術科学大学 2015年度先端GPGPUシミュレーション工学特論(全15回,大学院生対象講義) 第8回偏微分方程式の差分計算(拡散方程式) 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313 ・第1回補足 GROUSEの利用方法 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180326 ・第2回 GPUによる並列計算の概念とメモリアクセス http://www.slideshare.net/ssuserf87701/2015gpgpu2-59180382 ・第3回 GPUプログラム構造の詳細(threadとwarp) http://www.slideshare.net/ssuserf87701/2015gpgpu3-59180483 ・第4回 GPUのメモリ階層の詳細(共有メモリ) http://www.slideshare.net/ssuserf87701/2015gpgpu4-59180572 ・第5回 GPUのメモリ階層の詳細(様々なメモリの利用) http://www.slideshare.net/ssuserf87701/2015gpgpu5-59180652 ・第6回 プログラムの性能評価指針(Flop/Byte,計算律速,メモリ律速) http://www.slideshare.net/ssuserf87701/2015gpgpu6-59180736 ・第7回 総和計算(Atomic演算) http://www.slideshare.net/ssuserf87701/2015gpgpu7-59180844 ・第8回 偏微分方程式の差分計算(拡散方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu8-59180918 ・第9回 偏微分方程式の差分計算(移流方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu9-59180982 ・第10回 Poisson方程式の求解(線形連立一次方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu10-59181031 ・第11回 数値流体力学への応用(支配方程式,CPUプログラム) http://www.slideshare.net/ssuserf87701/2015gpgpu11-59181134 ・第12回 数値流体力学への応用(GPUへの移植) http://www.slideshare.net/ssuserf87701/2015gpgpu12-59181230 ・第13回 数値流体力学への応用(高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu13-59181316 ・第14回 複数GPUの利用 http://www.slideshare.net/ssuserf87701/2015gpgpu14-59181367 ・第15回 CPUとGPUの協調 http://www.slideshare.net/ssuserf87701/2015gpgpu15-59181450 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 講義には長岡技術科学大学のGPGPUシステム(GROUSE)を利用しています。 開発環境 CPU Intel Xeon X5670 × 32 GPU NVIDIA Tesla M2050(Fermi世代) × 64 CUDA 4.0(諸般の事情によりバージョンアップされていません) PGI Fortran 11.3
2015年度GPGPU実践プログラミング 第10回 行列計算(行列-行列積の高度な最適化)
2015年度GPGPU実践プログラミング 第10回 行列計算(行列-行列積の高度な最適化)
智啓 出川
長岡技術科学大学 2015年度GPGPU実践プログラミング(全15回,学部4年対象講義) 第10回行列計算(行列-行列積の高度な最適化) 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 ・第2回 GPUのアーキテクチャとプログラム構造 http://www.slideshare.net/ssuserf87701/2015gpgpu2-59179215 ・第3回 GPGPUプログラミング環境 http://www.slideshare.net/ssuserf87701/2015gpgpu3-59179255 ・第3回補足 GROUSEの利用方法 http://www.slideshare.net/ssuserf87701/2015gpgpu3-59183677 ・第4回 GPUでの並列プログラミング(ベクトル和,移動平均,差分法) http://www.slideshare.net/ssuserf87701/2015gpgpu4-59179449 ・第5回 GPUのメモリ階層 http://www.slideshare.net/ssuserf87701/2015gpgpu5-59179536 ・第6回 パフォーマンス解析ツール http://www.slideshare.net/ssuserf87701/2015gpgpu6-59179577 ・第7回 総和計算 http://www.slideshare.net/ssuserf87701/2015gpgpu7-59179639 ・第8回 総和計算(高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu8-59179686 ・第9回 行列計算(行列-行列積) http://www.slideshare.net/ssuserf87701/2015gpgpu9-59179722 ・第10回 行列計算(行列-行列積の高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu10-59179759 ・第11回 画像処理 http://www.slideshare.net/ssuserf87701/2015gpgpu11-59179789 ・第12回 偏微分方程式の差分計算 http://www.slideshare.net/ssuserf87701/2015gpgpu12-59179972 ・第13回 多粒子の運動 http://www.slideshare.net/ssuserf87701/2015gpgpu13-59180018 ・第14回 N体問題 http://www.slideshare.net/ssuserf87701/2015gpgpu14-59180054 ・第15回 GPU最適化ライブラリ http://www.slideshare.net/ssuserf87701/2015gpgpu15-59180086 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 講義には長岡技術科学大学のGPGPUシステム(GROUSE)を利用しています。 開発環境 CPU Intel Xeon X5670 × 32 GPU NVIDIA Tesla M2050(Fermi世代) × 64 CUDA 4.0(諸般の事情によりバージョンアップされていません) PGI Fortran 11.3
GPGPU Seminar (PyCUDA)
GPGPU Seminar (PyCUDA)
智啓 出川
PyCUDA - CUDA C以外の開発環境 長岡技術科学大学2015年度GPGPU講習会(2015年11月25日実施) 開発および講義には長岡技術科学大学のGPU搭載ラップトップPC(GROUSE2)を利用しています。 開発環境 Dell Precision M4600 CPU Intel Core i7 2.7GHz メモリ 32GB GPU NVIDIA Quadro 2000M CUDA 6.5 Visual Studio Community 2013 Python 3.4 GPGPU講習会 ・PyCUDA http://www.slideshare.net/ssuserf87701/gpgpu-seminar-pycuda ・CUDA Fortranによる格子ボルツマン法の高速化 http://www.slideshare.net/ssuserf87701/gpgpu-seminar-accelerataion-of-lattice-boltzmann-method-using-cuda-fortran ・補足資料 GPGPUとCUDA Fortran http://www.slideshare.net/ssuserf87701/gpgpu-seminar-gpgpu-and-cuda-fortran ・GPU最適化ライブラリの利用(その1,cuBLAS) http://www.slideshare.net/ssuserf87701/gpgpu-seminar-gpu-accelerated-libraries-1-of-3-cublas ・GPU最適化ライブラリの利用(その2,cuSPARSE) http://www.slideshare.net/ssuserf87701/gpgpu-seminar-gpu-accelerated-libraries-2-of-3-cusparse ・GPU最適化ライブラリの利用(その3,Thrust) http://www.slideshare.net/ssuserf87701/gpgpu-seminar-gpu-accelerated-libraries-3-of-3-thrust 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313
El text.tokuron a(2019).ishimura190725
El text.tokuron a(2019).ishimura190725
RCCSRENKEI
配信講義 計算科学技術特論A (2019) https://www.r-ccs.riken.jp/library/event/tokuronA_2019.html
El text.tokuron a(2019).katagiri190509
El text.tokuron a(2019).katagiri190509
RCCSRENKEI
配信講義 計算科学技術特論A (2019) https://www.r-ccs.riken.jp/library/event/tokuronA_2019.html
NumPy闇入門
NumPy闇入門
Ryosuke Okuta
NumPyのちょっと不思議な挙動などをまとめた資料です。クイズ形式で紹介&解説をします。 PFIセミナー2016/01/28:NumPy闇入門 https://www.youtube.com/watch?v=fdLKVMCrzNE 2016/3/20 問題の一部を修正
El text.tokuron a(2019).katagiri190425
El text.tokuron a(2019).katagiri190425
RCCSRENKEI
配信講義 計算科学技術特論A (2019) https://www.r-ccs.riken.jp/library/event/tokuronA_2019.html
200528material takahashi
200528material takahashi
RCCSRENKEI
https://www.r-ccs.riken.jp/library/event/tokuronB_2020.html
DEEP LEARNING、トレーニング・インファレンスのGPUによる高速化
DEEP LEARNING、トレーニング・インファレンスのGPUによる高速化
RCCSRENKEI
計算科学技術特論B2020
Very helpful python code to find coefficients of the finite difference method
Very helpful python code to find coefficients of the finite difference method
智啓 出川
Python(Sympy)でLagrange補間多項式を記号的に構成し,それを微分することで差分法の公式を導出する方法の概説.
El text.tokuron a(2019).yoshii190704
El text.tokuron a(2019).yoshii190704
RCCSRENKEI
配信講義 計算科学技術特論A (2019) https://www.r-ccs.riken.jp/library/event/tokuronA_2019.html
Intel GoldmontとMPXとゆるふわなごや
Intel GoldmontとMPXとゆるふわなごや
Masaki Ota
Intel GoldmontとMPXとゆるふわなごや
More modern gpu
More modern gpu
Preferred Networks
GPUがなぜ速いのか,またその上でどのようなデータ構造やアルゴリズム,ライブラリが使えるのかを説明します。特にMapReduceなどの非均質で,離散的なアルゴリズムがいかに高速に実現されるかを紹介します。 実験に使ったコード https://github.com/hillbig/gpuexperiments セミナーの動画 https://www.youtube.com/watch?v=WmETPBK3MOI
2015年度先端GPGPUシミュレーション工学特論 第9回 偏微分方程式の差分計算(移流方程式)
2015年度先端GPGPUシミュレーション工学特論 第9回 偏微分方程式の差分計算(移流方程式)
智啓 出川
長岡技術科学大学 2015年度先端GPGPUシミュレーション工学特論(全15回,大学院生対象講義) 第9回偏微分方程式の差分計算(移流方程式) 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313 ・第1回補足 GROUSEの利用方法 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180326 ・第2回 GPUによる並列計算の概念とメモリアクセス http://www.slideshare.net/ssuserf87701/2015gpgpu2-59180382 ・第3回 GPUプログラム構造の詳細(threadとwarp) http://www.slideshare.net/ssuserf87701/2015gpgpu3-59180483 ・第4回 GPUのメモリ階層の詳細(共有メモリ) http://www.slideshare.net/ssuserf87701/2015gpgpu4-59180572 ・第5回 GPUのメモリ階層の詳細(様々なメモリの利用) http://www.slideshare.net/ssuserf87701/2015gpgpu5-59180652 ・第6回 プログラムの性能評価指針(Flop/Byte,計算律速,メモリ律速) http://www.slideshare.net/ssuserf87701/2015gpgpu6-59180736 ・第7回 総和計算(Atomic演算) http://www.slideshare.net/ssuserf87701/2015gpgpu7-59180844 ・第8回 偏微分方程式の差分計算(拡散方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu8-59180918 ・第9回 偏微分方程式の差分計算(移流方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu9-59180982 ・第10回 Poisson方程式の求解(線形連立一次方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu10-59181031 ・第11回 数値流体力学への応用(支配方程式,CPUプログラム) http://www.slideshare.net/ssuserf87701/2015gpgpu11-59181134 ・第12回 数値流体力学への応用(GPUへの移植) http://www.slideshare.net/ssuserf87701/2015gpgpu12-59181230 ・第13回 数値流体力学への応用(高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu13-59181316 ・第14回 複数GPUの利用 http://www.slideshare.net/ssuserf87701/2015gpgpu14-59181367 ・第15回 CPUとGPUの協調 http://www.slideshare.net/ssuserf87701/2015gpgpu15-59181450 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 講義には長岡技術科学大学のGPGPUシステム(GROUSE)を利用しています。 開発環境 CPU Intel Xeon X5670 × 32 GPU NVIDIA Tesla M2050(Fermi世代) × 64 CUDA 4.0(諸般の事情によりバージョンアップされていません) PGI Fortran 11.3
200521material takahashi
200521material takahashi
RCCSRENKEI
https://www.r-ccs.riken.jp/library/event/tokuronB_2020.html
2015年度GPGPU実践プログラミング 第9回 行列計算(行列-行列積)
2015年度GPGPU実践プログラミング 第9回 行列計算(行列-行列積)
智啓 出川
長岡技術科学大学 2015年度GPGPU実践プログラミング(全15回,学部4年対象講義) 第9回行列計算(行列-行列積) 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 ・第2回 GPUのアーキテクチャとプログラム構造 http://www.slideshare.net/ssuserf87701/2015gpgpu2-59179215 ・第3回 GPGPUプログラミング環境 http://www.slideshare.net/ssuserf87701/2015gpgpu3-59179255 ・第3回補足 GROUSEの利用方法 http://www.slideshare.net/ssuserf87701/2015gpgpu3-59183677 ・第4回 GPUでの並列プログラミング(ベクトル和,移動平均,差分法) http://www.slideshare.net/ssuserf87701/2015gpgpu4-59179449 ・第5回 GPUのメモリ階層 http://www.slideshare.net/ssuserf87701/2015gpgpu5-59179536 ・第6回 パフォーマンス解析ツール http://www.slideshare.net/ssuserf87701/2015gpgpu6-59179577 ・第7回 総和計算 http://www.slideshare.net/ssuserf87701/2015gpgpu7-59179639 ・第8回 総和計算(高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu8-59179686 ・第9回 行列計算(行列-行列積) http://www.slideshare.net/ssuserf87701/2015gpgpu9-59179722 ・第10回 行列計算(行列-行列積の高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu10-59179759 ・第11回 画像処理 http://www.slideshare.net/ssuserf87701/2015gpgpu11-59179789 ・第12回 偏微分方程式の差分計算 http://www.slideshare.net/ssuserf87701/2015gpgpu12-59179972 ・第13回 多粒子の運動 http://www.slideshare.net/ssuserf87701/2015gpgpu13-59180018 ・第14回 N体問題 http://www.slideshare.net/ssuserf87701/2015gpgpu14-59180054 ・第15回 GPU最適化ライブラリ http://www.slideshare.net/ssuserf87701/2015gpgpu15-59180086 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 講義には長岡技術科学大学のGPGPUシステム(GROUSE)を利用しています。 開発環境 CPU Intel Xeon X5670 × 32 GPU NVIDIA Tesla M2050(Fermi世代) × 64 CUDA 4.0(諸般の事情によりバージョンアップされていません) PGI Fortran 11.3
2015年度GPGPU実践プログラミング 第4回 GPUでの並列プログラミング(ベクトル和,移動平均,差分法)
2015年度GPGPU実践プログラミング 第4回 GPUでの並列プログラミング(ベクトル和,移動平均,差分法)
智啓 出川
長岡技術科学大学 2015年度GPGPU実践プログラミング(全15回,学部4年対象講義) 第4回GPUでの並列プログラミング(ベクトル和,移動平均,差分法) 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 ・第2回 GPUのアーキテクチャとプログラム構造 http://www.slideshare.net/ssuserf87701/2015gpgpu2-59179215 ・第3回 GPGPUプログラミング環境 http://www.slideshare.net/ssuserf87701/2015gpgpu3-59179255 ・第3回補足 GROUSEの利用方法 http://www.slideshare.net/ssuserf87701/2015gpgpu3-59183677 ・第4回 GPUでの並列プログラミング(ベクトル和,移動平均,差分法) http://www.slideshare.net/ssuserf87701/2015gpgpu4-59179449 ・第5回 GPUのメモリ階層 http://www.slideshare.net/ssuserf87701/2015gpgpu5-59179536 ・第6回 パフォーマンス解析ツール http://www.slideshare.net/ssuserf87701/2015gpgpu6-59179577 ・第7回 総和計算 http://www.slideshare.net/ssuserf87701/2015gpgpu7-59179639 ・第8回 総和計算(高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu8-59179686 ・第9回 行列計算(行列-行列積) http://www.slideshare.net/ssuserf87701/2015gpgpu9-59179722 ・第10回 行列計算(行列-行列積の高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu10-59179759 ・第11回 画像処理 http://www.slideshare.net/ssuserf87701/2015gpgpu11-59179789 ・第12回 偏微分方程式の差分計算 http://www.slideshare.net/ssuserf87701/2015gpgpu12-59179972 ・第13回 多粒子の運動 http://www.slideshare.net/ssuserf87701/2015gpgpu13-59180018 ・第14回 N体問題 http://www.slideshare.net/ssuserf87701/2015gpgpu14-59180054 ・第15回 GPU最適化ライブラリ http://www.slideshare.net/ssuserf87701/2015gpgpu15-59180086 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 講義には長岡技術科学大学のGPGPUシステム(GROUSE)を利用しています。 開発環境 CPU Intel Xeon X5670 × 32 GPU NVIDIA Tesla M2050(Fermi世代) × 64 CUDA 4.0(諸般の事情によりバージョンアップされていません) PGI Fortran 11.3
What's hot
(20)
2015年度GPGPU実践プログラミング 第8回 総和計算(高度な最適化)
2015年度GPGPU実践プログラミング 第8回 総和計算(高度な最適化)
GPGPU Seminar (GPU Accelerated Libraries, 3 of 3, Thrust)
GPGPU Seminar (GPU Accelerated Libraries, 3 of 3, Thrust)
2015年度GPGPU実践基礎工学 第1回 学際的分野における先端シミュレーション技術の歴史
2015年度GPGPU実践基礎工学 第1回 学際的分野における先端シミュレーション技術の歴史
2015年度先端GPGPUシミュレーション工学特論 第8回 偏微分方程式の差分計算(拡散方程式)
2015年度先端GPGPUシミュレーション工学特論 第8回 偏微分方程式の差分計算(拡散方程式)
2015年度GPGPU実践プログラミング 第10回 行列計算(行列-行列積の高度な最適化)
2015年度GPGPU実践プログラミング 第10回 行列計算(行列-行列積の高度な最適化)
GPGPU Seminar (PyCUDA)
GPGPU Seminar (PyCUDA)
El text.tokuron a(2019).ishimura190725
El text.tokuron a(2019).ishimura190725
El text.tokuron a(2019).katagiri190509
El text.tokuron a(2019).katagiri190509
NumPy闇入門
NumPy闇入門
El text.tokuron a(2019).katagiri190425
El text.tokuron a(2019).katagiri190425
200528material takahashi
200528material takahashi
DEEP LEARNING、トレーニング・インファレンスのGPUによる高速化
DEEP LEARNING、トレーニング・インファレンスのGPUによる高速化
Very helpful python code to find coefficients of the finite difference method
Very helpful python code to find coefficients of the finite difference method
El text.tokuron a(2019).yoshii190704
El text.tokuron a(2019).yoshii190704
Intel GoldmontとMPXとゆるふわなごや
Intel GoldmontとMPXとゆるふわなごや
More modern gpu
More modern gpu
2015年度先端GPGPUシミュレーション工学特論 第9回 偏微分方程式の差分計算(移流方程式)
2015年度先端GPGPUシミュレーション工学特論 第9回 偏微分方程式の差分計算(移流方程式)
200521material takahashi
200521material takahashi
2015年度GPGPU実践プログラミング 第9回 行列計算(行列-行列積)
2015年度GPGPU実践プログラミング 第9回 行列計算(行列-行列積)
2015年度GPGPU実践プログラミング 第4回 GPUでの並列プログラミング(ベクトル和,移動平均,差分法)
2015年度GPGPU実践プログラミング 第4回 GPUでの並列プログラミング(ベクトル和,移動平均,差分法)
Similar to Hpc148
プログラムを高速化する話Ⅱ 〜GPGPU編〜
プログラムを高速化する話Ⅱ 〜GPGPU編〜
京大 マイコンクラブ
GPUを利用して汎用演算を行う技術であるGPGPUを用いて、プログラムを高速化する技法についてまとめました。高速化の具体例も適宜用いて解説しています。 CPU編はこちら https://www.slideshare.net/KMC_JP/ss-45855264
電子動力学アプリケーションの最適化2
電子動力学アプリケーションの最適化2
RCCSRENKEI
計算技術科学特論B2020
Deep learning実装の基礎と実践
Deep learning実装の基礎と実践
Seiya Tokui
2014年8月26日の日本神経回路学会主催セミナー「Deep Learningが拓く世界」における発表スライドです。Deep Learningの主なフレームワークで共通する設計部分と、実験の仕方について説明しています。
Introduction to Chainer (LL Ring Recursive)
Introduction to Chainer (LL Ring Recursive)
Kenta Oono
Presentation at LL Ring Recursive (2015/9/5)
2015年度GPGPU実践基礎工学 第7回 シングルコアとマルチコア
2015年度GPGPU実践基礎工学 第7回 シングルコアとマルチコア
智啓 出川
長岡技術科学大学 2015年度GPGPU実践基礎工学(全15回,学部3年対象講義) 第7回シングルコアとマルチコア 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 ・第2回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu2 ・第3回 GPUクラスタ上でのプログラミング(CUDA) http://www.slideshare.net/ssuserf87701/2015gpgpu3 ・第4回 CPUのアーキテクチャ http://www.slideshare.net/ssuserf87701/2015gpgpu4 ・第5回 ハードウェアによるCPUの高速化技術 http://www.slideshare.net/ssuserf87701/2015gpgpu5 ・第6回 ソフトウェアによるCPUの高速化技術 http://www.slideshare.net/ssuserf87701/2015gpgpu6 ・第7回 シングルコアとマルチコア http://www.slideshare.net/ssuserf87701/2015gpgpu7 ・第8回 並列計算の概念(プロセスとスレッド) http://www.slideshare.net/ssuserf87701/2015gpgpu8 ・第9回 GPUのアーキテクチャ http://www.slideshare.net/ssuserf87701/2015gpgpu9 ・第9回補足 GROUSEの利用方法 http://www.slideshare.net/ssuserf87701/2015gpgpu9-59160061 ・第10回 GPGPUのプログラム構造 http://www.slideshare.net/ssuserf87701/2015gpgpu10 ・第11回 GPUでの並列プログラミング(ベクトル和) http://www.slideshare.net/ssuserf87701/2015gpgpu11 ・第12回 GPUによる画像処理 http://w ww.slideshare.net/ssuserf87701/2015gpgpu12 ・第13回GPUのメモリ階層 http://www.slideshare.net/ssuserf87701/2015gpgpu13 ・第14回 GPGPU組込開発環境 http://www.slideshare.net/ssuserf87701/2015gpgpu14 ・第15回 GPGPUの開発環境(OpenCL) http://www.slideshare.net/ssuserf87701/2015gpgpu15 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313 講義には長岡技術科学大学のGPGPUシステム(GROUSE)を利用しています。 開発環境 CPU Intel Xeon X5670 × 32 GPU NVIDIA Tesla M2050(Fermi世代) × 64 CUDA 4.0(諸般の事情によりバージョンアップされていません) PGI Fortran 11.3
CMSI計算科学技術特論B(5) アプリケーションの性能最適化の実例2
CMSI計算科学技術特論B(5) アプリケーションの性能最適化の実例2
Computational Materials Science Initiative
マルチコアを用いた画像処理
マルチコアを用いた画像処理
Norishige Fukushima
2014年6月に開催されたSSII2014(http://www.ssii.jp/)のチュートリアル講演用資料です. 使用したコード等はこちら. https://github.com/norishigefukushima/SSII2014 アブストラクト 「CPUのクロック数が年月とともに増加する時代は終わり、プログラムの高速化をCPUの性能向上に任せることのできるフリーランチの時代は終わりを迎えています。しかしムーアの法則はいまだに続いており、CPUはマルチコア化、SIMD化という形で高性能化が続いています。本チュートリアルでは、計算コストの高い画像処理を高速化するために、CPUの能力をあますことなく引き出す、マルチコアプログラミング、SIMDプログラミングを解説します。」
第11回 配信講義 計算科学技術特論B(2022)
第11回 配信講義 計算科学技術特論B(2022)
RCCSRENKEI
本講義では地震分野における大規模有限要素法シミュレーションをスーパーコンピュータ上で高速に実行するための手法について説明する。ここでは、有限要素法におけるSIMDやマルチコアを用いた並列計算方法、また、時間並列アルゴリズムによるさらなる高速化について説明する。
ディープラーニングフレームワーク とChainerの実装
ディープラーニングフレームワーク とChainerの実装
Ryosuke Okuta
PPL2016@岡山 ディープラーニングの研究開発時には、計算を支援するためのフレームワークが用いられる。ChainerはPython上で動くディープラーニングフレームワークの一つである。他の多くのフレームワークと異なり、順伝播処理を行った時の実行履歴情報をもとに逆伝播のグラフを動的に構築するdefine-by-runという方式を採用している。この方式により、分岐や再帰を含むような複雑な構造のネットワークも直感的に構築でき、加えてデバッグが容易である。また、CuPyと呼ばれるNumPyサブセットのCUDAによる行列演算ライブラリを作成し、バックエンドとして利用している。本講演では、ディープラーニングフレームワークの基礎と実装、そして課題についてChainerを通して説明する。
Introduction to Chainer and CuPy
Introduction to Chainer and CuPy
Kenta Oono
2016/3/19 Chainer Meetup #2
Rの高速化
Rの高速化
弘毅 露崎
Chainerの使い方と自然言語処理への応用
Chainerの使い方と自然言語処理への応用
Seiya Tokui
第10回 NLP若手の会シンポジウム (YANS) のチュートリアルスライドです。ニューラルネットの(アルゴリズムとしての)おさらいと、Chainer v1.3.0の使い方を紹介しています。
ji-5. 繰り返し計算
ji-5. 繰り返し計算
kunihikokaneko1
トピックス:繰り返し, for, while, ユークリッドの互除法, 九九の表の表示, ド・モアブルの公式 Java プログラミング入門(スライド資料とプログラム例)(全6回) https://www.kkaneko.jp/pro/ji/index.html 金子邦彦研究室ホームページ https://www.kkaneko.jp/index.html
画像処理の高性能計算
画像処理の高性能計算
Norishige Fukushima
画像工学研究会
ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTURE Project
第7回ADVENTURE定期セミナー発表資料
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
Satoshi Kato
All sample codes are available at: https://github.com/katokohaku/tSNE_and_UMAP_using_R_packages
汎用グラフ処理モデルGIM-Vの複数GPUによる大規模計算とデータ転送の最適化
汎用グラフ処理モデルGIM-Vの複数GPUによる大規模計算とデータ転送の最適化
Koichi Shirahata
Presented at 第133回HPC研究発表会 (IPSJ SIG Technical Reports 2012-HPC-133)
2015年度先端GPGPUシミュレーション工学特論 第7回 総和計算(Atomic演算)
2015年度先端GPGPUシミュレーション工学特論 第7回 総和計算(Atomic演算)
智啓 出川
長岡技術科学大学 2015年度先端GPGPUシミュレーション工学特論(全15回,大学院生対象講義) 第7回総和計算(Atomic演算) 2015年度先端GPGPUシミュレーション工学特論 ・第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313 ・第1回補足 GROUSEの利用方法 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180326 ・第2回 GPUによる並列計算の概念とメモリアクセス http://www.slideshare.net/ssuserf87701/2015gpgpu2-59180382 ・第3回 GPUプログラム構造の詳細(threadとwarp) http://www.slideshare.net/ssuserf87701/2015gpgpu3-59180483 ・第4回 GPUのメモリ階層の詳細(共有メモリ) http://www.slideshare.net/ssuserf87701/2015gpgpu4-59180572 ・第5回 GPUのメモリ階層の詳細(様々なメモリの利用) http://www.slideshare.net/ssuserf87701/2015gpgpu5-59180652 ・第6回 プログラムの性能評価指針(Flop/Byte,計算律速,メモリ律速) http://www.slideshare.net/ssuserf87701/2015gpgpu6-59180736 ・第7回 総和計算(Atomic演算) http://www.slideshare.net/ssuserf87701/2015gpgpu7-59180844 ・第8回 偏微分方程式の差分計算(拡散方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu8-59180918 ・第9回 偏微分方程式の差分計算(移流方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu9-59180982 ・第10回 Poisson方程式の求解(線形連立一次方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu10-59181031 ・第11回 数値流体力学への応用(支配方程式,CPUプログラム) http://www.slideshare.net/ssuserf87701/2015gpgpu11-59181134 ・第12回 数値流体力学への応用(GPUへの移植) http://www.slideshare.net/ssuserf87701/2015gpgpu12-59181230 ・第13回 数値流体力学への応用(高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu13-59181316 ・第14回 複数GPUの利用 http://www.slideshare.net/ssuserf87701/2015gpgpu14-59181367 ・第15回 CPUとGPUの協調 http://www.slideshare.net/ssuserf87701/2015gpgpu15-59181450 2015年度GPGPU実践基礎工学 ・第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 2015年度GPGPU実践プログラミング ・第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 講義には長岡技術科学大学のGPGPUシステム(GROUSE)を利用しています。 開発環境 CPU Intel Xeon X5670 × 32 GPU NVIDIA Tesla M2050(Fermi世代) × 64 CUDA 4.0(諸般の事情によりバージョンアップされていません) PGI Fortran 11.3
準同型暗号の実装とMontgomery, Karatsuba, FFT の性能
準同型暗号の実装とMontgomery, Karatsuba, FFT の性能
MITSUNARI Shigeo
富士通研究所 下山武司さんの代理アップロード
Python physicalcomputing
Python physicalcomputing
Noboru Irieda
#pyconjp 2011/01
Similar to Hpc148
(20)
プログラムを高速化する話Ⅱ 〜GPGPU編〜
プログラムを高速化する話Ⅱ 〜GPGPU編〜
電子動力学アプリケーションの最適化2
電子動力学アプリケーションの最適化2
Deep learning実装の基礎と実践
Deep learning実装の基礎と実践
Introduction to Chainer (LL Ring Recursive)
Introduction to Chainer (LL Ring Recursive)
2015年度GPGPU実践基礎工学 第7回 シングルコアとマルチコア
2015年度GPGPU実践基礎工学 第7回 シングルコアとマルチコア
CMSI計算科学技術特論B(5) アプリケーションの性能最適化の実例2
CMSI計算科学技術特論B(5) アプリケーションの性能最適化の実例2
マルチコアを用いた画像処理
マルチコアを用いた画像処理
第11回 配信講義 計算科学技術特論B(2022)
第11回 配信講義 計算科学技術特論B(2022)
ディープラーニングフレームワーク とChainerの実装
ディープラーニングフレームワーク とChainerの実装
Introduction to Chainer and CuPy
Introduction to Chainer and CuPy
Rの高速化
Rの高速化
Chainerの使い方と自然言語処理への応用
Chainerの使い方と自然言語処理への応用
ji-5. 繰り返し計算
ji-5. 繰り返し計算
画像処理の高性能計算
画像処理の高性能計算
ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTUREの他のモジュール・関連プロジェクトの紹介
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
汎用グラフ処理モデルGIM-Vの複数GPUによる大規模計算とデータ転送の最適化
汎用グラフ処理モデルGIM-Vの複数GPUによる大規模計算とデータ転送の最適化
2015年度先端GPGPUシミュレーション工学特論 第7回 総和計算(Atomic演算)
2015年度先端GPGPUシミュレーション工学特論 第7回 総和計算(Atomic演算)
準同型暗号の実装とMontgomery, Karatsuba, FFT の性能
準同型暗号の実装とMontgomery, Karatsuba, FFT の性能
Python physicalcomputing
Python physicalcomputing
Recently uploaded
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
Matsushita Laboratory
我々はこれまで,新たなモノを産出する過程において「便利にすること」によって副次的に生じる課題を「便利の副作用」と定義し,その低減を目的としてアイディアの発想支援手法を提案してきた. これまでの研究では,便利前後の行為の増減に着目することにより便利の副作用への気づきの誘発が示唆されたものの,行為の増減の提示による便利の副作用への気づきへの影響は十分に検討できていなかった. そのため,本稿では行為の提示により便利の副作用に気づき,それを防いだアイディアの発想の支援が可能かの検証を目的として実験を行い,その有効性について検証する. 実験では,行為の増減の提示の有無によりアイディア発想にどのような影響を与えるか検証を行う.
キンドリル ネットワークアセスメントサービスご紹介 今のネットワーク環境は大丈夫? 調査〜対策までご支援します
キンドリル ネットワークアセスメントサービスご紹介 今のネットワーク環境は大丈夫? 調査〜対策までご支援します
Takayuki Nakayama
キンドリルネットワークアセスメントサービス
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
CRI Japan, Inc.
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
遺伝的アルゴリズムと知識蒸留による大規模言語モデル(LLM)の学習とハイパーパラメータ最適化
遺伝的アルゴリズムと知識蒸留による大規模言語モデル(LLM)の学習とハイパーパラメータ最適化
t m
オープンエンドな進化から着想を得て、個々の大規模言語モデル(LLM)が、グループとして学習を進めながら、ノームエージェントとして機能するという概念を探求しています。これは、単一のモデルでは難しい複雑な問題を解決することを目的としています。具体的な方法として、遺伝的アルゴリズムと知識蒸留を組み合わせた学習プロセスを提案しています。知識蒸留によって学習を進め、同時に遺伝的アルゴリズムでハイパーパラメータを最適化することで、より効率的な学習を目指します。ドメインタスクとして、指示からPythonコードを生成するコード生成タスクを選択しました。実験では、学習に3つの学習モデルと1つの教師モデルを使用しました。その結果、HumanEvalのpass@1で精度が1.2%向上し、学習が進むにつれて学習率が最適化された兆候が見られました。しかし、大幅な精度向上を達成し、さまざまなハイパーパラメータを最適化するには、まだ課題が残っています。
This is the company presentation material of RIZAP Technologies, Inc.
This is the company presentation material of RIZAP Technologies, Inc.
chiefujita1
RIZAPテクノロジーズ株式会社の会社説明資料です。
JSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさ
JSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさ
0207sukipio
JSAI2024の発表スライドです.
Generating Automatic Feedback on UI Mockups with Large Language Models
Generating Automatic Feedback on UI Mockups with Large Language Models
harmonylab
Generating Automatic Feedback on UI Mockups with Large Language Modelsを和訳紹介したものです
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
Toru Tamaki
Xinhong Ma, Yiming Wang, Hao Liu, Tianyu Guo, Yunhe Wang, "When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Segmentation" NeurIPS2023 https://proceedings.neurips.cc/paper_files/paper/2023/hash/157c30da6a988e1cbef2095f7b9521db-Abstract-Conference.html
論文紹介:Deep Learning-Based Human Pose Estimation: A Survey
論文紹介:Deep Learning-Based Human Pose Estimation: A Survey
Toru Tamaki
Ce Zheng, Wenhan Wu, Chen Chen, Taojiannan Yang, Sijie Zhu, Ju Shen, Nasser Kehtarnavaz, Mubarak Shah, "Deep Learning-Based Human Pose Estimation: A Survey" arXiv2020 https://arxiv.org/abs/2012.13392
Recently uploaded
(9)
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
キンドリル ネットワークアセスメントサービスご紹介 今のネットワーク環境は大丈夫? 調査〜対策までご支援します
キンドリル ネットワークアセスメントサービスご紹介 今のネットワーク環境は大丈夫? 調査〜対策までご支援します
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
遺伝的アルゴリズムと知識蒸留による大規模言語モデル(LLM)の学習とハイパーパラメータ最適化
遺伝的アルゴリズムと知識蒸留による大規模言語モデル(LLM)の学習とハイパーパラメータ最適化
This is the company presentation material of RIZAP Technologies, Inc.
This is the company presentation material of RIZAP Technologies, Inc.
JSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさ
JSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさ
Generating Automatic Feedback on UI Mockups with Large Language Models
Generating Automatic Feedback on UI Mockups with Large Language Models
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:Deep Learning-Based Human Pose Estimation: A Survey
論文紹介:Deep Learning-Based Human Pose Estimation: A Survey
Hpc148
1.
整数演算による多倍長浮動小数点演算 エミュレーションのGPUでの性能評価 中里直人(会津大学) 2015年3月2-3日 第148回HPC研究発表会 花菱ホテル@別府温泉
2.
多倍長浮動小数点演算の必要性 • 数値不安定なアルゴリズム • 情報落ち,
桁落ちの問題 • ファインマン・ダイアグラムの直接計算 • 本質的に数値誤差が問題になる場合 • 丸め誤差の蓄積 • 演算性能が向上するとよりシビアに
3.
問題例:Henon Map Searching for
sinks of Henon map using a multiple-precision GPU arithmetic library M. Joldes, V. Popescu, W. Tucker, HEART2014 ha,b(x1, x2) = (1 + x2 ax2 1, bx1) ns: hi+1 a,b := ha,b hi a,b, i 2 N⇤ . parameter values a = 1.4, b = 0.3 one observes the so-called H´enon iterating hn a,b, n ! 1: 1 / 23 H´enon attractor H´enon Map ha,b(x1, x2) = (1 + x2 ax2 1, bx1) Map iterations: hi+1 a,b := ha,b hi a,b, i 2 N⇤ . For classical parameter values a = 1.4, b = 0.3 one observes the so-called H´enon attractor by iterating hn a,b, n ! 1: 1 / 23 異なるa,bや初期位置からの計算 を繰り返して、興味のある場合 を発見する問題。 ! 繰り返し計算による丸め誤差の 蓄積が問題となる。 誤差の軌道への影響は指数関数的
4.
多倍長精度FP演算手法(1) エラーフリー変換に基づく手法 (FP方式) • 変数を複数のFP変数の組み合わせで表現する •
プロセッサのFP演算器を援用可能 • 演算密度が高いアルゴリズム • 欠点:指数部(Nexp)がnativeなFPフォーマットに依存する • エラーフリー変換・総和アルゴリズム • 加算 Knuth(1967), 乗算 Dekker(1971) • 任意の場合のアルゴリズム Shewchuk(1996) • QD library (Hida etal. 2001) • GPUでの実装がいくつかある。GEMM,BLASは高性能
5.
多倍長精度FP演算手法(2) 整数演算によるエミュレーション手法(Int方式) • GNU Multiple
Precision Arithmetic Library (GMP) • FPを含めて様々な多倍長精度演算アルゴリズムを実装 • FPについては基本演算と簡単な関数のみ • GNU MPFR (Fousse etal. 2007) • GMPをベースにより汎用的なFP演算の実装 • 一般的な数学関数含む • CUMP (Nakayama & Takahashi 2011) • GMPの一部(加算・乗算)をCUDAカーネルとして移植 • C++ templateを利用しているためOpenCL化難しい
6.
GPUの整数演算性能(1) • GPUの内部構造 ! ! ! ! ! http://www.realworldtech.com/cayman/5/ 浮動小数点演算器とALUは同じ数ある
7.
GPUの整数演算性能(2) GPUの整数演算性能はCPUより高い bitcoin発掘(SHA-256の並列計算)の性能比較 MHASH/S Tesla K20 135 GTX680
110 - 120 Radeon7970 555 - 825 Core i7 3930K 67 A10-5800K 105 Xoen Phi 5100 140 https://en.bitcoin.it/wiki/Non-specialized_hardware_comparison
8.
本研究の目的 • 多倍長精度浮動小数点演算をOpenCLにより 高速化する手法を性能評価する • GPUの整数演算性能を有効に利用することを想定 •
GPU, CPU, MIC, FPGAなどで同様のアルゴリズムが実行可能 • GRAPE-MP/MPXと対応する実装 • 独自設計によるFP演算器と同じアルゴリズムを採用 • 他の実装(QD, MPFR)との比較
9.
データ構造報処理学会研究報告 SJ SIG Technical
Report FP 演算における主たる処理は仮数部同士の演算であ 上記 (b) の手法は, 整数演算により複数語からなる仮 部の演算を, 四則演算それぞれの場合ついて筆算と同様 アルゴリズムでおこなう (例えば”The Art of Computer ogramming Volume 2”[8](TACP Vol.2) Section 4.3 参 ). ただし, 乗算 [9] と除算 [6] について, 筆算と同様の基 アルゴリズムよりも演算数を削減することのできるア ゴリズムが提案されている. この FP 演算のエミュレー ョンによる多倍長演算手法では, 原理的には指数部, 仮数 ともに任意のビット長を利用することができる. よって, 記ファインマン・ダイアグラムの直接計算の場合におけ 指数部サイズの制限の問題の解決策となる. 本論文では, (b) の手法による FP 演算を C 言語により 計・実装し, それを OpenCL カーネルとして利用可能と ることで, OpenCL でプログラム可能なマルチコア・メ typedef uint32_t u32; const u32 NC = 7; struct my_fp { u32 e; u32 m[NC]; }; typedef struct my_fp FP[1]; 図 1 本論文における多倍長精 めす. この構造体 FP では, FP- する. FP->e の最上位の 1 ビッ 30 ビットに指数部を保持する仕 754 規格にならって, バイアス とした. nexp = 30 より, この場 0x3fffffff となる. FP->m[] は仮 指数部と同様に符号なし 2 進数 • 符号なし整数の配列に格納 • 指数部に1語。bias方式 • 符号は指数部に格納する • 仮数部にn語 • 仮数部は1語当たり30 bitに分割。n = 7, 210 bit • hidden bitはなし ! • 32 bit vs. 64 bitの選択 • GPUの演算器は32 bitのはず。より冗長。今回はこちらを採用 • CPU(x86-64)は64 bit演算のほうが効率よい。GMPはこれ 指数部 仮数部[0] 仮数部[1] 仮数部[2] 符号 仮数部[3]
10.
アルゴリズムの概要(1) • C言語で実装テストし、OpenCLカーネル化 • ソースは共通化可能 •
加算・減算 • uint32の加算, マスク演算, シフト演算の組み合わせ • IEEE 754と同様のアルゴリズムだが丸めはforce-1 • 減算は加算の前に符号反転で実装 • 乗算 • TACP Vol.2のアルゴリズムと同様 • 仮数部同士の乗算は省略なし(49個の部分積の和をとる) • 32 x 32 の符号なし乗算
11.
アルゴリズムの概要(2) • 除算は3パターンを実装し比較 • 仮数部を直接計算 •
Huang etal.の高速アルゴリズムで仮数部の除算を計算 • TACPのアルゴリズムより平均的に3倍高速 • ニュートン法 • ニュートン法で逆数を求めてから乗算 • 初期値は単精度(SP)または倍精度(DP)で計算 • SPの場合3回, DPの場合2回のニュートンループ
12.
多倍長FP演算の性能(CPU) QD(FP方式)の性能評価 (演算当たりのサイクル数) 仮数部のサイズは105 or
209 bit IvyBridge 51 85 185 Haswell 45 84 191 Magny-Cours 92 145 332 Bulldozer 100 162 309 Llano 115 156 344 表 1 MPFR 方式 (nman = 210, nexp = 64) の CPU における性 能評価. 単位は 1 演算あたりのサイクル数. 加算 乗算 除算 Nehalem 115 218 1113 SandyBridge 93 193 1021 IvyBridge 76 174 919 Haswell 65 169 1013 Magny-Cours 211 348 1572 Bulldozer 165 277 1527 Llano 227 374 1559 表 2 QD 方式 (nman = 209, nexp = 11) の CPU における性能評 価. 単位は 1 演算あたりのサイクル数. 表では してい Stamp た. ど に RD 回数で 定した QD 方式は されて およそ 倍のサ 本表 IvyBri され, 演 進歩を が, ほと
13.
多倍長FP演算の性能(CPU) 情報処理学会研究報告 IPSJ SIG Technical
Report 加算 乗算 除算 Nehalem 71 121 242 SandyBridge 54 93 206 IvyBridge 51 85 185 Haswell 45 84 191 Magny-Cours 92 145 332 Bulldozer 100 162 309 Llano 115 156 344 表 1 MPFR 方式 (nman = 210, nexp = 64) の CPU における性 能評価. 単位は 1 演算あたりのサイクル数. QD L 5.1.3, 価で利 表では してい Stamp た. ど に RD 回数で 定した MPFR(Int方式)の性能評価 (演算当たりのサイクル数) 仮数部のサイズを指定可能
14.
本研究の実装性能評価(CPU) MYFP(Int方式)の性能評価 (演算当たりのサイクル数) 仮数部のサイズを指定可能 情報処理学会研究報告 IPSJ SIG
Technical Report 加算 乗算 除算 除算 F 除算 D Nehalem 111 167 2026 2087 1155 SandyBridge 91 148 1949 1986 1107 IvyBridge 80 142 1822 1737 970 Haswell 81 136 2029 1885 1049 Magny-Cours 174 275 2866 2925 1654 Bulldozer 186 373 3223 3044 2304 Llano 189 299 2884 2909 1657 表 3 MYFP 方式 (nman = 210, nexp = 30) の CPU における性 能評価. 単位は 1 演算あたりのサイクル数. 性能が高 かる. G ないが, ト ALU れる. た る場合が のマイク る同一の ドのバー 傾向は,
15.
各実装の比較 (サイクル数) 加算 乗算
除算 QD 65 169 1013 MPFR 45 84 191 MYFP 81 136 2029 加算 乗算 除算 QD 165 277 1527 MPFR 100 162 309 MYFP 186 373 3223 Haswell Bulldozer • この仮数部サイズでは、QDには性能上のメリットはない • MPFRはGMPによりアセンブリで最適化されているため高速 • MYFPは時間QDより遅い • MYFPの除算は直接法。ニュートン法の方が高速。
16.
OpenCLによる性能評価 MYFP(Int方式)の性能評価 (MFLOPS) 告 Report SP 性能
加算 乗算 除算 除算 F 除算 D Xeon E5-2670 3.3e5 247 180 21.3 20.4 38.9 GeForce GTX570 1.4e6 244 105 17.1 11.0 13.3 Radeon HD6970 2.7e6 1461 213 11.9 22.4 9.5 FirePro W8000 3.2e6 1546 82.6 35.4 – – Tesla K20c 3.5e6 349 138 22.6 15.2 15.8 Radeon R280X 4.2e6 2324 1835 190 61.7 231 FirePro W8100 4.2e6 260 44.7 24.4 – – GeForce TITAN 4.5e6 449 192 31.8 21.1 20.5 表 4 MYFP 方式 (nman = 210, nexp = 30) の CPU における性能評価. 単位は MPFLOS. sium on Computer Architecture, pp. 287– n Software Directory: . • FP SPでの性能にほぼ比例する • OpenCLのドライバ実装に大きく依存。一部実行不可能。 • CPU(16コア)とローエンドGPUは同等の性能
17.
応用例 1 4 Sample)code:)) 20# #pragma#goose#parallel#for#loopcounter(ixy,#iz)# #for(ixy#=#0;#ixy#<#ni;#ixy++)#{# #####sumzG[ixy]#=#0.0;# #####for#(iz#=#0;#iz#<#nj;#iz++)#{# ###########xx#=#dev_xx[ixy];# ###########yy#=#dev_yy[ixy];# ###########zz#=#x30_1[iz]#*#dev_cnt4[ixy];# ######d#=#K#xx#*#yy#*#s# #########L#*#zz#*#(one#K#xx#K#yy#K#zz)#+# #########(xx#+#yy)#*#lambda2#+# #########(one#K#xx#K#yy#K#zz)#*#(one#K#xx#K#yy)#*#fme2+# #########zz#*#(one#K#xx#K#yy)#*#fmf2#;# #########sumzG[ixy]#+=#gw30[iz]#/#(d#*#d);# #####}# #}# •
Gooseの拡張を実装 • pragma文からループをOpenCL API呼び出しに変換する • ループ本体は直接OpenCLカーネルへ変換 • 各種OpenCL実装での動作、性能評価をしている
18.
まとめ • 多倍長精度浮動小数点演算をOpenCLにより 実装し性能評価した • 様々なOpenCLデバイスで動作可能 •
GPUでの整数演算性能が有効に利用できる • GPU(Radeon R280X)はCPU(16コア)より10倍以上高速 • QD, MPFRの性能評価と比較 • 八倍精度相当ではMPFRのCPUでの性能は非常によい • QDには性能上のメリットはない • MYFPはMPFRの半分位の性能。除算の低速。 • 条件文を削減するなどの最適化が必要
Download now