SlideShare a Scribd company logo
技術系大学におけるGPU教育の一試行
出川智啓(長岡技術科学大学)
発表内容
2015/11/28オープンCAEシンポジウム20152
 はじめに
 本発表の目的(背景)
 講義カリキュラム
 以前のカリキュラムと現在のカリキュラム
 実施の結果
 講義の実施結果と所感
 今後の展開
本発表の目的
2015/11/28オープンCAEシンポジウム20153
 教育プロジェクトの紹介と成果発表
 GPUについての情報公開の促進
 GPU教育についての情報公開の促進
 公開後の情報の保守管理についてのノウハウの
修得
教育プロジェクトの紹介
2015/11/28オープンCAEシンポジウム20154
 長岡技術科学大学教育プロジェクト
「ハードウェア指向型IT技術者育成」
 高度情報化社会を支えるIT技術者の育成と,世
界的に通用する技術者の輩出
 ソフトウェアだけでなくハードウェアも含めた知識を
有した「ハードウェア指向型」の人材育成
 産業界が注目しているGPUを教材として,ソフトウェ
ア,ハードウェアに関する知識を教授
教育プロジェクトの紹介
2015/11/28オープンCAEシンポジウム20155
平成27年度
平成26年度
平成25年度
平成24年度
平成23年度 実施検討
GPUクラスタ導入(M2050 64台)
4月 講義開始
8月 GPGPUシンポジウムin長岡技科大
3月 前任者転出
8月 集中講義(学部4年生対象講義)
10月 発表者着任
開講科目,シラバスの確定
模擬授業(9月,12月,3月)
前任者採用
担当して驚いた事
2015/11/28オープンCAEシンポジウム20156
 GPUに関する興味が全体的に薄い
 知ってはいるが難しそう,取り組む時間がない
 MATLABが高速化されないなら不要とも
 プログラムが苦手
 Linuxに触れたことがない学生も
 学生の知識・技能レベルが不均一
 姿勢(技術系大学と称した理由)
 ScientistではなくEngineer
 ツールは問題解決の手段
授業設計で困った事
2015/11/28オープンCAEシンポジウム20157
 適した教科書がない
 「1から10まで」ではなく「0から」
 一時期のGPU熱が冷め,和書の出版が激減
 インターネットでも記事の更新が停滞
 GPUを取り扱う講義はいくつか存在
 参考にしたいが,資料が公開されていない
 対象とする学生像,授業のレベルが異なる
 もっと情報を公開・交換しませんか?
情報公開と保守管理
2015/11/28オープンCAEシンポジウム20158
 言い出しっぺの法則
 授業の録画,pdf,プログラムソースを公開
 CUDA Fortran版も作成中(ソースは完成)
 http://www.toffee.jp/streaming/gpgpu/
http://www.toffee.jp/streaming/gpgpu/gpgpu_programming/2015/gpgpu_programming08.html
情報公開と保守管理
2015/11/28オープンCAEシンポジウム20159
 情報公開後の保守管理をどうするか
 動画を撮り直すことはできないが・・・
 内容の正誤
 ソースファイルの公開とライセンス
 教授法や教授内容設計のノウハウ
 教える順序や効果的な例題などの蓄積
 オープンCAE学会なら情報が交換できるのでは
プロジェクトでの開講科目
2015/11/28オープンCAEシンポジウム201510
 GPGPU実践基礎工学(学部3年)
 GPUのアーキテクチャの基礎を理解
 CPUの高速化技術をハードウェアの側面から修得
 GPGPUの基礎知識を体得
 GPGPU実践プログラミング(学部4年)
 CPUとは異なる最適化方法を修得
 分野横断的な問題に活用できる汎用的プログラミ
ング能力を体得
プロジェクトでの開講科目
2015/11/28オープンCAEシンポジウム201511
 先端GPGPUシミュレーション工学特論(大学院)
 実践的な実装方法を修得
 異分野にわたる高度な専門知識を涵養
 GPGPU講習会(学内の全教員・学生対象)
 月1回の頻度で開催
 1回で完結
 今年度はCUBLAS, CUSPARSE, Thrustなどライブラ
リの利用方法や,PyCUDAなど開発環境を重点化
平成25年度のカリキュラム
2015/11/28オープンCAEシンポジウム201512
授業回 実践基礎工学(B3) 実践プログラミング(B4) 先端シミュレーション(M)
1 シミュレーション技術の歴史 計算の高速化手法 GPUプログラム構造の詳細
2 HPCとGPGPUの歴史 MIMDとSIMD GPUメモリ階層の詳細
3 GPGPUでの応用例(1) GPUアーキテクチャとプログラム構造 並列計算の効率化
4 GPGPUでの応用例(2) GPUメモリ階層 並列計算の非効率化への対応
5 CPUでの高速化技術 GPGPUプログラミング環境 GPUでの非効率化の原因
6 プロセッサのアーキテクチャ 開発ツール GPUとCPUの協調
7 シングルコアとマルチコア GPU最適化ライブラリ 計算ネックな数値計算
8 プロセッサの高速化技術 パフォーマンス解析ツール 画像処理
9 並列計算の概念 数値計算の特徴 計算機合成ホログラム
10 プロセスとスレッド 行列計算 CFDへの応用(粒子法)
11 GPUのアーキテクチャ 画像処理 メモリネックな数値計算
12 GPGPUのプログラム構造 拡散方程式 FDTD法
13 GPGPUのメモリ階層 N体問題 CFDへの応用(差分法)
14 開発環境(CUDA) 遺伝的アルゴリズム モンテカルロ法
15 開発環境(OpenCL) モンテカルロ法 演習
平成26年度のカリキュラム(発表者が担当)
2015/11/28オープンCAEシンポジウム201513
授業回 実践基礎工学(B3) 実践プログラミング(B4) 先端シミュレーション(M)
1 シミュレーション技術の歴史 計算の高速化手法 GPUプログラム構造の詳細
2 HPCとGPGPUの歴史 MIMDとSIMD GPUメモリ階層の詳細
3 GPGPUでの応用例(1) GPUアーキテクチャとプログラム構造 並列計算の効率化
4 GPGPUでの応用例(2) GPUメモリ階層 並列計算の非効率化への対応
5 CPUでの高速化技術 GPGPUプログラミング環境 GPUでの非効率化の原因
6 プロセッサのアーキテクチャ 開発ツール GPUとCPUの協調
7 シングルコアとマルチコア GPU最適化ライブラリ 計算ネックな数値計算
8 プロセッサの高速化技術 パフォーマンス解析ツール 画像処理
9 並列計算の概念 数値計算の特徴 計算機合成ホログラム
10 プロセスとスレッド 行列計算 CFDへの応用(粒子法)
11 GPUのアーキテクチャ 画像処理 メモリネックな数値計算
12 GPGPUのプログラム構造 拡散方程式 FDTD法
13 GPGPUのメモリ階層 N体問題 CFDへの応用(差分法)
14 開発環境(CUDA) 遺伝的アルゴリズム モンテカルロ法
15 開発環境(OpenCL) モンテカルロ法 演習
C
言
語
復
習
受講生数の推移(平成25, 26年)
2015/11/28オープンCAEシンポジウム201514
 受講生数
 単位取得学生数
科目名
受講生数
平成25年度 平成26年度
GPGPU実践基礎工学 34 31
GPGPU実践プログラミング 17 4(4*)
先端GPGPUシミュレーション工学特論 17 0
科目名
単位取得学生数
平成25年度 平成26年度
GPGPU実践基礎工学 31 28
GPGPU実践プログラミング 15 3(3*)
先端GPGPUシミュレーション工学特論 10 0
*平成25年度にGPU関連講義を受講・単位取得した学生数
カリキュラム改訂時に考慮したこと
2015/11/28オープンCAEシンポジウム201515
 受講した結果,何かができるようになっている
 苦労が報われ,その先に明確なゴールがある
 応用的な問題が解け,視覚的に確認できる
 入門から応用まで一貫している
 授業で紹介するGPUの機能を利用した結果,何が
どう変わるかを把握できる
 単年で完結する
ベクトル和の計算を複数GPUで実行できる
非圧縮性流れの差分計算をGPUで実行できる
現在のカリキュラム(平成27年)
2015/11/28オープンCAEシンポジウム201516
授業回 実践基礎工学(B3) 実践プログラミング(B4) 先端シミュレーション(M)
1 ガイダンス ガイダンス ガイダンス
2 GPGPUの歴史と応用例 GPUアーキテクチャとプログラム構造 GPUでの並列プログラミング
3 GPUクラスタの利用 GPUクラスタの利用 ThreadとWarp
4 CPUのアーキテクチャ GPUでの並列プログラミング GPUのメモリ階層
5 CPUの高速化技術(ハードウェア) GPUのメモリ階層 様々なメモリの利用
6 CPUの高速化技術(ソフトウェア) パフォーマンス解析ツール プログラムの性能評価指針
7 シングルコアとマルチコア 総和計算 総和計算(atomic演算)
8 プロセスとスレッド 総和計算(高度な最適化) 拡散方程式
9 GPUのアーキテクチャ 行列計算 移流方程式
0 GPUプログラムの構造 行列計算(高度な最適化) Poisson方程式
11 GPUでの並列プログラミング 画像処理 CFDへの応用(流れ関数‐渦度法)
12 画像処理 拡散方程式 CFDへの応用(GPUへの移植)
13 GPUのメモリ階層 多粒子の運動 CFDへの応用(高度な最適化)
14 組込開発環境(Jetson TK1) N体問題 複数GPUの利用
15 開発環境(OpenCL) GPU最適化ライブラリ CPUとGPUの協調
C
言
語
入
門・
復
習
単年での完結性(実践基礎工学)
2015/11/28オープンCAEシンポジウム201517
実践基礎工学(B3)
ガイダンス
GPGPUの歴史と応用例
GPUクラスタの利用
CPUのアーキテクチャ
CPUの高速化技術(ハードウェア)
CPUの高速化技術(ソフトウェア)
シングルコアとマルチコア
プロセスとスレッド
GPUのアーキテクチャ
GPUプログラムの構造
GPUでの並列プログラミング
画像処理
GPUのメモリ階層
組込開発環境(Jetson TK1)
開発環境(OpenCL)
目標:画像処理の高速化
• GPUの応用例について,画像,映像で紹介する.
• 話題がCPUにうつる前に,GPUに触れる機会を設ける.
• CPUのハードウェアや進化の歴史について雑学的な内容を
紹介する.
• キーワード
フォン・ノイマン型計算機,ムーアの法則,マルチコアCPU,メモリ,
キャッシュ,フリンの分類,アムダールの法則,OpenMP,MPI等々
• GPUのアーキテクチャやCUDAについて学習する.
• ベクトル和を例題としてCUDAでの並列化の基本を学習する.
• unsigned char型の配列を画像とみなし,処理を行うカー
ネルを作成する.
• 共有メモリやコンスタントメモリを利用する事で実行速度が
変わることを学習する.
• 電気系の学生が多いことを考慮し,研究で利用できそうな組
込開発環境について紹介する.
ゴール→
単年での完結性(実践プログラミング)
2015/11/28オープンCAEシンポジウム201518
実践プログラミング(B4)
ガイダンス
GPUアーキテクチャとプログラム構造
GPUクラスタの利用
GPUでの並列プログラミング
GPUのメモリ階層
パフォーマンス解析ツール
総和計算
総和計算(高度な最適化)
行列計算
行列計算(高度な最適化)
画像処理
拡散方程式
多粒子の運動
N体問題
GPU最適化ライブラリ
目標:様々な問題に対するプログラミング能力の修得
• GPUを利用する上で必要になる内容を学習する.
• GPUのアーキテクチャやCUDAについて紹介する.
• ベクトル和,移動平均,差分法,を例題としてCUDAでの
並列化の基本を学習する.
• 共有メモリやコンスタントメモリの利用方法を学習する.
• 実践基礎工学を受講した学生にとっては,6割程度が復
習,4割程度が新規の内容となる.
• プロファイラの使い方を学習する.以降の回で利用する.
• GPUで高い性能が発揮でき,かつGPU特有の最適化方法が
必要な問題を体験する.
• NVIDIAの資料よりも問題を細分化(7→9段階)
• 共有メモリのバンクコンフリクトなどをプロファイルする.
• 複数の最適化を行い,高速化される要因を考察する.
• Euler系の問題を取り扱う.
• 空間微分の離散化の精度についても言及する.
• Lagrange系の問題を取り扱う.
• 時間積分の離散化の精度についても言及する.
• CUDA付属のライブラリの利用方法を学習する.
ゴール
単年での完結性(先端シミュレーション)
2015/11/28オープンCAEシンポジウム201519
先端シミュレーション(M)
ガイダンス
GPUでの並列プログラミング
ThreadとWarp
GPUのメモリ階層
様々なメモリの利用
プログラムの性能評価指針
総和計算(atomic演算)
拡散方程式
移流方程式
Poisson方程式
CFDへの応用(流れ関数‐渦度法)
CFDへの応用(GPUへの移植)
CFDへの応用(高度な最適化)
複数GPUの利用
CPUとGPUの協調
目標:流体の数値シミュレーション,複数GPUの利用
• GPUを利用する上で必要になる内容を学習する.
• GPUのアーキテクチャやCUDAについて紹介する.
• ベクトル和を例題としてCUDAでの並列化の基本とメモリ
階層の基本を学習する.
• 共有メモリ,コンスタントメモリ,ページロックホストメモリの
利用方法を学習する.
• Flop/byteについて学習し,ベクトル和の実効性能を評価する.
• 総和計算の方法を学習する.(共役勾配法で使用)
• 数値計算の基礎的なプログラムをCUDAで作成する.
• 1次元2階微分および2次元拡散方程式
• 2次元移流方程式および2次元移流拡散方程式
• Poisson方程式(共役勾配法を利用)
• 移流拡散方程式,Poisson方程式を基にして,流れ関数‐
渦度法を用いて流体のシミュレーションができることを学習し,
実際にプログラムを作成する.
• 複数GPUを使ってベクトル和を実行する方法を学習する.
• ストリームについて学習する.
ゴール→
ゴール→
各講義の連携
2015/11/28オープンCAEシンポジウム201520
授業回 実践基礎工学(B3) 実践プログラミング(B4) 先端シミュレーション(M)
1 ガイダンス ガイダンス ガイダンス
2 GPGPUの歴史と応用例 GPUアーキテクチャとプログラム構造 GPUでの並列プログラミング
3 GPUクラスタの利用 GPUクラスタの利用 ThreadとWarp
4 CPUのアーキテクチャ GPUでの並列プログラミング GPUのメモリ階層
5 CPUの高速化技術(ハードウェア) GPUのメモリ階層 様々なメモリの利用
6 CPUの高速化技術(ソフトウェア) パフォーマンス解析ツール プログラムの性能評価指針
7 シングルコアとマルチコア 総和計算 総和計算(atomic演算)
8 プロセスとスレッド 総和計算(高度な最適化) 拡散方程式
9 GPUのアーキテクチャ 行列計算 移流方程式
0 GPUプログラムの構造 行列計算(高度な最適化) Poisson方程式
11 GPUでの並列プログラミング 画像処理 CFDへの応用(流れ関数‐渦度法)
12 画像処理 拡散方程式 CFDへの応用(GPUへの移植)
13 GPUのメモリ階層 多粒子の運動 CFDへの応用(高度な最適化)
14 組込開発環境(Jetson TK1) N体問題 複数GPUの利用
15 開発環境(OpenCL) GPU最適化ライブラリ CPUとGPUの協調
ベクトル和の計算を複数GPUで実行するまでの課程
2015/11/28オープンCAEシンポジウム201521
授業回 実践基礎工学(B3) 実践プログラミング(B4) 先端シミュレーション(M)
1 ガイダンス ガイダンス ガイダンス
2 GPGPUの歴史と応用例 GPUアーキテクチャとプログラム構造 GPUでの並列計算
3 GPUクラスタの利用 GPUクラスタの利用 ThreadとWarp
4 CPUのアーキテクチャ GPUでの並列プログラミング GPUのメモリ階層
5 CPUの高速化技術(ハードウェア) GPUのメモリ階層 様々なメモリの利用
6 CPUの高速化技術(ソフトウェア) パフォーマンス解析ツール プログラムの性能評価指針
7 シングルコアとマルチコア 総和計算 総和計算(atomic演算)
8 プロセスとスレッド 総和計算(高度な最適化) 拡散方程式
9 GPUのアーキテクチャ 行列計算 移流方程式
0 GPUプログラムの構造 行列計算(高度な最適化) Poisson方程式
11 GPUでの並列プログラミング 画像処理 CFDへの応用(流れ関数‐渦度法)
12 画像処理 拡散方程式 CFDへの応用(GPUへの移植)
13 GPUのメモリ階層 多粒子の運動 CFDへの応用(高度な最適化)
14 組込開発環境(Jetson TK1) N体問題 複数GPUの利用
15 開発環境(OpenCL) GPU最適化ライブラリ CPUとGPUの協調
2015/11/28オープンCAEシンポジウム201522
MPI
OpenMP
1次元分割
(1スレッド1要素)
コンスタントメモリページロックホストメモリ
ゼロコピー
UVA, GPU Direct
cudaSetDevice
1スレッド逐次実行
非同期転送
CPUとGPUの協調
1スレッド複数要素
デバイスの選択
複数GPU
ストリーム
メモリ
GPU基礎CPU
ベクトル和
ベクトル和の計算を複数GPUで実行するまでの課程
コアレスアクセスとストライド
アクセスでの性能変化の確認
コンスタントキャッシュ利用
による高速化の例
全講義
B3
B3,M
B4,M
M
OpenCL
非圧縮性流れの計算をGPUで実行するまでの課程
2015/11/28オープンCAEシンポジウム201523
授業回 実践基礎工学(B3) 実践プログラミング(B4) 先端シミュレーション(M)
1 ガイダンス ガイダンス ガイダンス
2 GPGPUの歴史と応用例 GPUアーキテクチャとプログラム構造 GPUでの並列計算
3 GPUクラスタの利用 GPUクラスタの利用 ThreadとWarp
4 CPUのアーキテクチャ GPUでの並列プログラミング GPUのメモリ階層
5 CPUの高速化技術(ハードウェア) GPUのメモリ階層 様々なメモリの利用
6 CPUの高速化技術(ソフトウェア) パフォーマンス解析ツール プログラムの性能評価指針
7 シングルコアとマルチコア 総和計算 総和計算(atomic演算)
8 プロセスとスレッド 総和計算(高度な最適化) 拡散方程式
9 GPUのアーキテクチャ 行列計算 移流方程式
0 GPUプログラムの構造 行列計算(高度な最適化) Poisson方程式
11 GPUでの並列プログラミング 画像処理 CFDへの応用(流れ関数‐渦度法)
12 画像処理 拡散方程式 CFDへの応用(GPUへの移植)
13 GPUのメモリ階層 多粒子の運動 CFDへの応用(高度な最適化)
14 組込開発環境(Jetson TK1) N体問題 複数GPUの利用
15 開発環境(OpenCL) GPU最適化ライブラリ CPUとGPUの協調
非圧縮性流れの計算をGPUで実行するまでの課程
2015/11/28オープンCAEシンポジウム201524
共役勾配法
1次元分割
(1スレッド1要素)
1スレッド複数要素
データの再利用
(Flop/byteの向上)
共役勾配法 差分法
移動平均
2次元分割
拡散方程式
移流方程式
流れ関数-渦度法
ベクトル和総和計算 配列転置
GPU基礎
数値計算
最適化
数値流体力学
GPU移植
B4,M
M
全講義
B4
受講生数の推移(平成25~27年)
2015/11/28オープンCAEシンポジウム201525
 受講生数
 単位取得学生数
科目名
受講生数
平成25年度 平成26年度 平成27年度
GPGPU実践基礎工学 34 31 100
GPGPU実践プログラミング 17 4(4*) 9(8*)
先端GPGPUシミュレーション工学特論 17 0 16(2**+9*)
*以前にGPU関連講義を受講・単位取得した学生数
科目名
単位取得学生数
平成25年度 平成26年度 平成27年度
GPGPU実践基礎工学 31 28 開講中
GPGPU実践プログラミング 15 3(3*) 8(7*)
先端GPGPUシミュレーション工学特論 10 0 14(2**+9*)
←!?
**全てのGPU関連講義を受講・単位取得した学生数
GPGPU実践プログラミングの実施結果
2015/11/28オープンCAEシンポジウム201526
 受講学生数 9人
 単位取得学生数 8人
 達成度自己評価(平均値)
受講前
受講後
項目 目標
a
GPUのアーキテクチャを理解し,CPUのアーキテクチャとの違いを
説明できる.
b
GPGPUのプログラム構造を理解し,並列化の概念をCPUの並列
化と対応付けて説明できる.
c GPGPUのメモリ階層を理解し,その特性を説明できる.
d
GPGPUでの高速化手法を理解し,適切なアルゴリズムを選択し,
その理由をアーキテクチャと関連付けて説明できる.
e 数値計算をGPUへ実装し,その性能を評価できる.
f 各種ライブラリの使用方法を取得し,実際にプログラムを作成し,
その性能を評価できる.
g パフォーマンス解析ツールの使用方法を習得し,プログラムの
性能を評価し,その情報を基に性能を改善できる.
a
b
f
de
g
c
8人が平成26年度の講義を受講,単位取得
理解度
GPGPU実践プログラミングの実施結果
2015/11/28オープンCAEシンポジウム201527
 問題点
 レポートの量が少ない(2題のみ)
 「GPUの基本的な使い方」と「総和計算」
 高度なチューニングを課題として出すには難易度が
高いと判断し,講義での説明に重点を置いた
 実践なのだからもっと課題をやりたかったという意見
があった
 問題をいくつも紹介するのではなく,問題を限定
した方が効果的かもしれない
先端GPGPUシミュレーション工学特論の実施結果
2015/11/28オープンCAEシンポジウム201528
 受講学生数 16人
 単位取得学生数 14人
 達成度自己評価(平均値)
項目 目標
a 産業界におけるGPUの役割を説明できる.
b
GPUプログラミングでのメモリの最適な使用方法を理解し,適切
なメモリを選択できる.
c 分岐条件におけるパフォーマンス低下の理由を理解し,回避方
法や適切な実装方法を説明できる.
d 数値計算の高速化手法を修得し,プログラムを作成して実行し,
その性能を評価できる.
e
CPUとGPUの協調プログラミングを修得し,プログラムを作成する
事ができる.
2人が平成25,26年度の講義を受講,単位取得,
9人が平成25年度の講義を受講,単位取得
a
b
d
e
c
理解度
受講前
受講後
先端GPGPUシミュレーション工学特論の実施結果
2015/11/28オープンCAEシンポジウム201529
 問題点
 レポートの量が多い(5題)
 ベクトル和の計算
 内積の計算
 移流拡散方程式の計算
 Poisson方程式の求解(共役勾配法)
 キャビティ流れの計算
 一つの項目が理解できないと,その後連鎖的にで
きなくなってしまう
GPGPU実践基礎工学の経過
2015/11/28オープンCAEシンポジウム201530
 受講学生数 100人
 うち2割がC言語未経験者
 授業毎に20人程度の欠席者
 予想単位取得者数 70人程度
GPGPU実践基礎工学の経過
2015/11/28オープンCAEシンポジウム201531
 問題点はまだ不透明
 課題として4題を課す予定
 授業で言及した内容+少し発展的な内容
 発展的な内容には,その次の授業で言及
 CUDAやGPUの制約に抵触する条件での実行も指示
 変更できるなら
 CPUに関係する5回分を削り,GPUに充てたい
 受講生の人数を制限する,もしくはC言語の事前履
修を必須にする
所感
2015/11/28オープンCAEシンポジウム201532
 興味のある学生が集まる
 授業態度は良好
 課題の出来はそこそこ
 課題を完璧にこなす学生から,エラーを解決できな
かった学生まで様々
 わからなくても質問には来ない
 授業前後に課題の様子を尋ねると効果的
所感
2015/11/28オープンCAEシンポジウム201533
 とにかくデバッグができない
 授業中にデバッグ方法の説明ができなかった
 応用問題になるほど原因の特定が困難
 言語,アルゴリズム,並列化,ハードウェア等々
 計算の安定性や収束性はGPUとは別問題
 自力でバグを特定・修正できるようにするには
 CUDA Debug Drill(仮称)があると有益?
 学生はドリルでデバッグの技術を修得
 教員はデバッグ対応に時間を割かなくてすむ
所感
2015/11/28オープンCAEシンポジウム201534
 GPUの知名度は年々上昇
 高専の先生からやっておいた方がいいと言われた
 インターンシップ先で使っているのを見た
 機械学習に興味がある等々
 プログラムを全く知らない人にも浸透
 独学はまだまだハードルが高い
 大学等でカリキュラムに組み込む場合
 授業対象の学生像を明確に
 授業内容に応じた予備知識の選定が不可欠
今後の展開
2015/11/28オープンCAEシンポジウム201535
 継続的な情報発信
 GPUの世代更新への対応
 GPU教育についての情報公開
 間違い,不正確な内容への対応
 ソースコードの保守管理
今後の展開
2015/11/28オープンCAEシンポジウム201536
 GPUの世代更新への対応
 個人で対応するのは半ばあきらめ気味
 実際には
 世代更新の度にシステムを更新しない
 主に使う世代を対象にしていればよいか?
 最新のGPUを入手した人が情報を公開してくれるよ
う機運が高まってくれると嬉しい
今後の展開
2015/11/28オープンCAEシンポジウム201537
 GPU教育についての情報公開
 大学の事情が強く反映されてしまう
 ある一つの例として公開
 何かが誰かの参考になれば
 例)東京工業大学GPUコンピューティング
 長岡技科大の学生には敷居が高い
 例)CFD Python:12 steps to Navier‐Stokes
 CFD(特に差分法)の経験者がPythonを修得するには
効果的だが,何も知らない学生には・・・
今後の展開
2015/11/28オープンCAEシンポジウム201538
 間違い,不正確な内容への対応
 誰が正当性をチェックするか
 指摘を受けた際にどのように対応するべきか
 現状は要改訂として公開中
http://www.toffee.jp/streaming/gpgpu/advanced_gpgpu/2015/advanced_gpgpu03.html
今後の展開
2015/11/28オープンCAEシンポジウム201539
 ソースコードの保守管理
 授業で用いた全ソースコードをオープンソースで公
開する予定
 どこで公開するか
 どのライセンスで公開するか
 誰に向けて公開するか
 コメントの内容,記述量,言語,エンコード
まとめ
2015/11/28オープンCAEシンポジウム201540
 プロジェクトの概要を紹介
 GPU関連講義のカリキュラムを紹介
 変更した背景
 授業のゴールと各回の連携
 実施結果
 今後の展開(情報公開)について
 オープンソースに造詣の深い皆様に教えを請いたい

More Related Content

What's hot

2015年度GPGPU実践基礎工学 第3回 GPUクラスタ上でのプログラミング(CUDA)
2015年度GPGPU実践基礎工学 第3回 GPUクラスタ上でのプログラミング(CUDA)2015年度GPGPU実践基礎工学 第3回 GPUクラスタ上でのプログラミング(CUDA)
2015年度GPGPU実践基礎工学 第3回 GPUクラスタ上でのプログラミング(CUDA)
智啓 出川
 
2015年度GPGPU実践基礎工学 第12回 GPUによる画像処理
2015年度GPGPU実践基礎工学 第12回 GPUによる画像処理2015年度GPGPU実践基礎工学 第12回 GPUによる画像処理
2015年度GPGPU実践基礎工学 第12回 GPUによる画像処理
智啓 出川
 
2015年度GPGPU実践基礎工学 第9回 GPUのアーキテクチャ
2015年度GPGPU実践基礎工学 第9回 GPUのアーキテクチャ2015年度GPGPU実践基礎工学 第9回 GPUのアーキテクチャ
2015年度GPGPU実践基礎工学 第9回 GPUのアーキテクチャ
智啓 出川
 
2015年度先端GPGPUシミュレーション工学特論 第3回 GPUプログラム構造の詳細 (threadとwarp)
2015年度先端GPGPUシミュレーション工学特論 第3回 GPUプログラム構造の詳細(threadとwarp)2015年度先端GPGPUシミュレーション工学特論 第3回 GPUプログラム構造の詳細(threadとwarp)
2015年度先端GPGPUシミュレーション工学特論 第3回 GPUプログラム構造の詳細 (threadとwarp)
智啓 出川
 
2015年度先端GPGPUシミュレーション工学特論 第6回 プログラムの性能評価指針 (Flop/Byte,計算律速,メモリ律速)
2015年度先端GPGPUシミュレーション工学特論 第6回 プログラムの性能評価指針(Flop/Byte,計算律速,メモリ律速)2015年度先端GPGPUシミュレーション工学特論 第6回 プログラムの性能評価指針(Flop/Byte,計算律速,メモリ律速)
2015年度先端GPGPUシミュレーション工学特論 第6回 プログラムの性能評価指針 (Flop/Byte,計算律速,メモリ律速)
智啓 出川
 
2015年度GPGPU実践プログラミング 第15回 GPU最適化ライブラリ
2015年度GPGPU実践プログラミング 第15回 GPU最適化ライブラリ2015年度GPGPU実践プログラミング 第15回 GPU最適化ライブラリ
2015年度GPGPU実践プログラミング 第15回 GPU最適化ライブラリ
智啓 出川
 
2015年度GPGPU実践基礎工学 第11回 GPUでの並列 プログラミング(ベクトル和)
2015年度GPGPU実践基礎工学 第11回 GPUでの並列プログラミング(ベクトル和)2015年度GPGPU実践基礎工学 第11回 GPUでの並列プログラミング(ベクトル和)
2015年度GPGPU実践基礎工学 第11回 GPUでの並列 プログラミング(ベクトル和)
智啓 出川
 
GPGPU Seminar (PyCUDA)
GPGPU Seminar (PyCUDA)GPGPU Seminar (PyCUDA)
GPGPU Seminar (PyCUDA)
智啓 出川
 
PGI CUDA FortranとGPU最適化ライブラリの一連携法
PGI CUDA FortranとGPU最適化ライブラリの一連携法PGI CUDA FortranとGPU最適化ライブラリの一連携法
PGI CUDA FortranとGPU最適化ライブラリの一連携法
智啓 出川
 
2015年度GPGPU実践基礎工学 第10回 GPUのプログラム構造
2015年度GPGPU実践基礎工学 第10回 GPUのプログラム構造2015年度GPGPU実践基礎工学 第10回 GPUのプログラム構造
2015年度GPGPU実践基礎工学 第10回 GPUのプログラム構造
智啓 出川
 
2015年度GPGPU実践プログラミング 第6回 パフォーマンス解析ツール
2015年度GPGPU実践プログラミング 第6回 パフォーマンス解析ツール2015年度GPGPU実践プログラミング 第6回 パフォーマンス解析ツール
2015年度GPGPU実践プログラミング 第6回 パフォーマンス解析ツール
智啓 出川
 
2015年度GPGPU実践基礎工学 第5回 ハードウェアによるCPUの高速化技術
2015年度GPGPU実践基礎工学 第5回 ハードウェアによるCPUの高速化技術2015年度GPGPU実践基礎工学 第5回 ハードウェアによるCPUの高速化技術
2015年度GPGPU実践基礎工学 第5回 ハードウェアによるCPUの高速化技術
智啓 出川
 
2015年度先端GPGPUシミュレーション工学特論 第14回 複数GPUの利用
2015年度先端GPGPUシミュレーション工学特論 第14回 複数GPUの利用2015年度先端GPGPUシミュレーション工学特論 第14回 複数GPUの利用
2015年度先端GPGPUシミュレーション工学特論 第14回 複数GPUの利用
智啓 出川
 
2015年度先端GPGPUシミュレーション工学特論 第4回 GPUのメモリ階層の詳細 (共有メモリ)
2015年度先端GPGPUシミュレーション工学特論 第4回 GPUのメモリ階層の詳細(共有メモリ)2015年度先端GPGPUシミュレーション工学特論 第4回 GPUのメモリ階層の詳細(共有メモリ)
2015年度先端GPGPUシミュレーション工学特論 第4回 GPUのメモリ階層の詳細 (共有メモリ)
智啓 出川
 
2015年度GPGPU実践プログラミング 第11回 画像処理
2015年度GPGPU実践プログラミング 第11回 画像処理2015年度GPGPU実践プログラミング 第11回 画像処理
2015年度GPGPU実践プログラミング 第11回 画像処理
智啓 出川
 
2015年度先端GPGPUシミュレーション工学特論 第1回 先端シミュレーションおよび産業界におけるGPUの役割
2015年度先端GPGPUシミュレーション工学特論 第1回 先端シミュレーションおよび産業界におけるGPUの役割2015年度先端GPGPUシミュレーション工学特論 第1回 先端シミュレーションおよび産業界におけるGPUの役割
2015年度先端GPGPUシミュレーション工学特論 第1回 先端シミュレーションおよび産業界におけるGPUの役割
智啓 出川
 
2015年度GPGPU実践プログラミング 第2回 GPUのアーキテクチャとプログラム構造
2015年度GPGPU実践プログラミング 第2回 GPUのアーキテクチャとプログラム構造2015年度GPGPU実践プログラミング 第2回 GPUのアーキテクチャとプログラム構造
2015年度GPGPU実践プログラミング 第2回 GPUのアーキテクチャとプログラム構造
智啓 出川
 
GPGPU Seminar (GPU Accelerated Libraries, 1 of 3, cuBLAS)
GPGPU Seminar (GPU Accelerated Libraries, 1 of 3, cuBLAS) GPGPU Seminar (GPU Accelerated Libraries, 1 of 3, cuBLAS)
GPGPU Seminar (GPU Accelerated Libraries, 1 of 3, cuBLAS)
智啓 出川
 
2015年度GPGPU実践基礎工学 第14回 GPGPU組込開発環境
2015年度GPGPU実践基礎工学 第14回 GPGPU組込開発環境2015年度GPGPU実践基礎工学 第14回 GPGPU組込開発環境
2015年度GPGPU実践基礎工学 第14回 GPGPU組込開発環境
智啓 出川
 
2015年度GPGPU実践基礎工学 第15回 GPGPU開発環境 (OpenCL)
2015年度GPGPU実践基礎工学 第15回 GPGPU開発環境(OpenCL)2015年度GPGPU実践基礎工学 第15回 GPGPU開発環境(OpenCL)
2015年度GPGPU実践基礎工学 第15回 GPGPU開発環境 (OpenCL)
智啓 出川
 

What's hot (20)

2015年度GPGPU実践基礎工学 第3回 GPUクラスタ上でのプログラミング(CUDA)
2015年度GPGPU実践基礎工学 第3回 GPUクラスタ上でのプログラミング(CUDA)2015年度GPGPU実践基礎工学 第3回 GPUクラスタ上でのプログラミング(CUDA)
2015年度GPGPU実践基礎工学 第3回 GPUクラスタ上でのプログラミング(CUDA)
 
2015年度GPGPU実践基礎工学 第12回 GPUによる画像処理
2015年度GPGPU実践基礎工学 第12回 GPUによる画像処理2015年度GPGPU実践基礎工学 第12回 GPUによる画像処理
2015年度GPGPU実践基礎工学 第12回 GPUによる画像処理
 
2015年度GPGPU実践基礎工学 第9回 GPUのアーキテクチャ
2015年度GPGPU実践基礎工学 第9回 GPUのアーキテクチャ2015年度GPGPU実践基礎工学 第9回 GPUのアーキテクチャ
2015年度GPGPU実践基礎工学 第9回 GPUのアーキテクチャ
 
2015年度先端GPGPUシミュレーション工学特論 第3回 GPUプログラム構造の詳細 (threadとwarp)
2015年度先端GPGPUシミュレーション工学特論 第3回 GPUプログラム構造の詳細(threadとwarp)2015年度先端GPGPUシミュレーション工学特論 第3回 GPUプログラム構造の詳細(threadとwarp)
2015年度先端GPGPUシミュレーション工学特論 第3回 GPUプログラム構造の詳細 (threadとwarp)
 
2015年度先端GPGPUシミュレーション工学特論 第6回 プログラムの性能評価指針 (Flop/Byte,計算律速,メモリ律速)
2015年度先端GPGPUシミュレーション工学特論 第6回 プログラムの性能評価指針(Flop/Byte,計算律速,メモリ律速)2015年度先端GPGPUシミュレーション工学特論 第6回 プログラムの性能評価指針(Flop/Byte,計算律速,メモリ律速)
2015年度先端GPGPUシミュレーション工学特論 第6回 プログラムの性能評価指針 (Flop/Byte,計算律速,メモリ律速)
 
2015年度GPGPU実践プログラミング 第15回 GPU最適化ライブラリ
2015年度GPGPU実践プログラミング 第15回 GPU最適化ライブラリ2015年度GPGPU実践プログラミング 第15回 GPU最適化ライブラリ
2015年度GPGPU実践プログラミング 第15回 GPU最適化ライブラリ
 
2015年度GPGPU実践基礎工学 第11回 GPUでの並列 プログラミング(ベクトル和)
2015年度GPGPU実践基礎工学 第11回 GPUでの並列プログラミング(ベクトル和)2015年度GPGPU実践基礎工学 第11回 GPUでの並列プログラミング(ベクトル和)
2015年度GPGPU実践基礎工学 第11回 GPUでの並列 プログラミング(ベクトル和)
 
GPGPU Seminar (PyCUDA)
GPGPU Seminar (PyCUDA)GPGPU Seminar (PyCUDA)
GPGPU Seminar (PyCUDA)
 
PGI CUDA FortranとGPU最適化ライブラリの一連携法
PGI CUDA FortranとGPU最適化ライブラリの一連携法PGI CUDA FortranとGPU最適化ライブラリの一連携法
PGI CUDA FortranとGPU最適化ライブラリの一連携法
 
2015年度GPGPU実践基礎工学 第10回 GPUのプログラム構造
2015年度GPGPU実践基礎工学 第10回 GPUのプログラム構造2015年度GPGPU実践基礎工学 第10回 GPUのプログラム構造
2015年度GPGPU実践基礎工学 第10回 GPUのプログラム構造
 
2015年度GPGPU実践プログラミング 第6回 パフォーマンス解析ツール
2015年度GPGPU実践プログラミング 第6回 パフォーマンス解析ツール2015年度GPGPU実践プログラミング 第6回 パフォーマンス解析ツール
2015年度GPGPU実践プログラミング 第6回 パフォーマンス解析ツール
 
2015年度GPGPU実践基礎工学 第5回 ハードウェアによるCPUの高速化技術
2015年度GPGPU実践基礎工学 第5回 ハードウェアによるCPUの高速化技術2015年度GPGPU実践基礎工学 第5回 ハードウェアによるCPUの高速化技術
2015年度GPGPU実践基礎工学 第5回 ハードウェアによるCPUの高速化技術
 
2015年度先端GPGPUシミュレーション工学特論 第14回 複数GPUの利用
2015年度先端GPGPUシミュレーション工学特論 第14回 複数GPUの利用2015年度先端GPGPUシミュレーション工学特論 第14回 複数GPUの利用
2015年度先端GPGPUシミュレーション工学特論 第14回 複数GPUの利用
 
2015年度先端GPGPUシミュレーション工学特論 第4回 GPUのメモリ階層の詳細 (共有メモリ)
2015年度先端GPGPUシミュレーション工学特論 第4回 GPUのメモリ階層の詳細(共有メモリ)2015年度先端GPGPUシミュレーション工学特論 第4回 GPUのメモリ階層の詳細(共有メモリ)
2015年度先端GPGPUシミュレーション工学特論 第4回 GPUのメモリ階層の詳細 (共有メモリ)
 
2015年度GPGPU実践プログラミング 第11回 画像処理
2015年度GPGPU実践プログラミング 第11回 画像処理2015年度GPGPU実践プログラミング 第11回 画像処理
2015年度GPGPU実践プログラミング 第11回 画像処理
 
2015年度先端GPGPUシミュレーション工学特論 第1回 先端シミュレーションおよび産業界におけるGPUの役割
2015年度先端GPGPUシミュレーション工学特論 第1回 先端シミュレーションおよび産業界におけるGPUの役割2015年度先端GPGPUシミュレーション工学特論 第1回 先端シミュレーションおよび産業界におけるGPUの役割
2015年度先端GPGPUシミュレーション工学特論 第1回 先端シミュレーションおよび産業界におけるGPUの役割
 
2015年度GPGPU実践プログラミング 第2回 GPUのアーキテクチャとプログラム構造
2015年度GPGPU実践プログラミング 第2回 GPUのアーキテクチャとプログラム構造2015年度GPGPU実践プログラミング 第2回 GPUのアーキテクチャとプログラム構造
2015年度GPGPU実践プログラミング 第2回 GPUのアーキテクチャとプログラム構造
 
GPGPU Seminar (GPU Accelerated Libraries, 1 of 3, cuBLAS)
GPGPU Seminar (GPU Accelerated Libraries, 1 of 3, cuBLAS) GPGPU Seminar (GPU Accelerated Libraries, 1 of 3, cuBLAS)
GPGPU Seminar (GPU Accelerated Libraries, 1 of 3, cuBLAS)
 
2015年度GPGPU実践基礎工学 第14回 GPGPU組込開発環境
2015年度GPGPU実践基礎工学 第14回 GPGPU組込開発環境2015年度GPGPU実践基礎工学 第14回 GPGPU組込開発環境
2015年度GPGPU実践基礎工学 第14回 GPGPU組込開発環境
 
2015年度GPGPU実践基礎工学 第15回 GPGPU開発環境 (OpenCL)
2015年度GPGPU実践基礎工学 第15回 GPGPU開発環境(OpenCL)2015年度GPGPU実践基礎工学 第15回 GPGPU開発環境(OpenCL)
2015年度GPGPU実践基礎工学 第15回 GPGPU開発環境 (OpenCL)
 

Similar to 技術系大学におけるGPU教育の一試行

Introduction to argo
Introduction to argoIntroduction to argo
Introduction to argo
Shunya Ueta
 
20180729 Preferred Networksの機械学習クラスタを支える技術
20180729 Preferred Networksの機械学習クラスタを支える技術20180729 Preferred Networksの機械学習クラスタを支える技術
20180729 Preferred Networksの機械学習クラスタを支える技術
Preferred Networks
 
El text.tokuron a(2019).katagiri
El text.tokuron a(2019).katagiriEl text.tokuron a(2019).katagiri
El text.tokuron a(2019).katagiri
RCCSRENKEI
 
第1回 配信講義 計算科学技術特論A (2021)
第1回 配信講義 計算科学技術特論A (2021)第1回 配信講義 計算科学技術特論A (2021)
第1回 配信講義 計算科学技術特論A (2021)
RCCSRENKEI
 
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
DNA Data Bank of Japan center
 
機械学習プロジェクトにおける Cloud AI Platform の使い方 (2018-11-19)
機械学習プロジェクトにおける Cloud AI Platform の使い方 (2018-11-19)機械学習プロジェクトにおける Cloud AI Platform の使い方 (2018-11-19)
機械学習プロジェクトにおける Cloud AI Platform の使い方 (2018-11-19)
Yaboo Oyabu
 
HPC+AI ってよく聞くけど結局なんなの
HPC+AI ってよく聞くけど結局なんなのHPC+AI ってよく聞くけど結局なんなの
HPC+AI ってよく聞くけど結局なんなの
NVIDIA Japan
 
第13回 配信講義 計算科学技術特論B(2022)
第13回 配信講義 計算科学技術特論B(2022)第13回 配信講義 計算科学技術特論B(2022)
第13回 配信講義 計算科学技術特論B(2022)
RCCSRENKEI
 
Survey on OCP 2021
Survey on OCP 2021Survey on OCP 2021
Survey on OCP 2021
ShogoAsaba
 
Canonicalが支える、さくっと使えるUbuntu OpenStack - OpenStack Day in ITpro EXPO 2014
Canonicalが支える、さくっと使えるUbuntu OpenStack - OpenStack Day in ITpro EXPO 2014Canonicalが支える、さくっと使えるUbuntu OpenStack - OpenStack Day in ITpro EXPO 2014
Canonicalが支える、さくっと使えるUbuntu OpenStack - OpenStack Day in ITpro EXPO 2014
Nobuyuki Tamaoki
 
20160728 hyperscale #03
20160728 hyperscale #0320160728 hyperscale #03
20160728 hyperscale #03
ManaMurakami1
 
自動チューニングとビックデータ:機械学習の適用の可能性
自動チューニングとビックデータ:機械学習の適用の可能性自動チューニングとビックデータ:機械学習の適用の可能性
自動チューニングとビックデータ:機械学習の適用の可能性
Takahiro Katagiri
 
Open capi meetup20180409 (revised)
Open capi meetup20180409 (revised)Open capi meetup20180409 (revised)
Open capi meetup20180409 (revised)
Yutaka Kawai
 
コンテナ導入概要資料2018
コンテナ導入概要資料2018コンテナ導入概要資料2018
コンテナ導入概要資料2018
Masahito Zembutsu
 
スタートアップが提案する2030年の材料開発 - 2022/11/11 QPARC講演
スタートアップが提案する2030年の材料開発 - 2022/11/11 QPARC講演スタートアップが提案する2030年の材料開発 - 2022/11/11 QPARC講演
スタートアップが提案する2030年の材料開発 - 2022/11/11 QPARC講演
Preferred Networks
 
45分で理解する 最近のスパコン事情 斉藤之雄
45分で理解する 最近のスパコン事情 斉藤之雄45分で理解する 最近のスパコン事情 斉藤之雄
45分で理解する 最近のスパコン事情 斉藤之雄
Yukio Saito
 
ACRiウェビナー_ChipTip Technology様ご講演資料
ACRiウェビナー_ChipTip Technology様ご講演資料ACRiウェビナー_ChipTip Technology様ご講演資料
ACRiウェビナー_ChipTip Technology様ご講演資料
直久 住川
 
Edge Computing と k8s でなんか話すよ
Edge Computing と k8s でなんか話すよEdge Computing と k8s でなんか話すよ
Edge Computing と k8s でなんか話すよ
VirtualTech Japan Inc.
 

Similar to 技術系大学におけるGPU教育の一試行 (20)

Introduction to argo
Introduction to argoIntroduction to argo
Introduction to argo
 
20180729 Preferred Networksの機械学習クラスタを支える技術
20180729 Preferred Networksの機械学習クラスタを支える技術20180729 Preferred Networksの機械学習クラスタを支える技術
20180729 Preferred Networksの機械学習クラスタを支える技術
 
El text.tokuron a(2019).katagiri
El text.tokuron a(2019).katagiriEl text.tokuron a(2019).katagiri
El text.tokuron a(2019).katagiri
 
第1回 配信講義 計算科学技術特論A (2021)
第1回 配信講義 計算科学技術特論A (2021)第1回 配信講義 計算科学技術特論A (2021)
第1回 配信講義 計算科学技術特論A (2021)
 
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
 
組込みSW開発技術研究会キックオフミーティング
組込みSW開発技術研究会キックオフミーティング組込みSW開発技術研究会キックオフミーティング
組込みSW開発技術研究会キックオフミーティング
 
機械学習プロジェクトにおける Cloud AI Platform の使い方 (2018-11-19)
機械学習プロジェクトにおける Cloud AI Platform の使い方 (2018-11-19)機械学習プロジェクトにおける Cloud AI Platform の使い方 (2018-11-19)
機械学習プロジェクトにおける Cloud AI Platform の使い方 (2018-11-19)
 
HPC+AI ってよく聞くけど結局なんなの
HPC+AI ってよく聞くけど結局なんなのHPC+AI ってよく聞くけど結局なんなの
HPC+AI ってよく聞くけど結局なんなの
 
第13回 配信講義 計算科学技術特論B(2022)
第13回 配信講義 計算科学技術特論B(2022)第13回 配信講義 計算科学技術特論B(2022)
第13回 配信講義 計算科学技術特論B(2022)
 
Survey on OCP 2021
Survey on OCP 2021Survey on OCP 2021
Survey on OCP 2021
 
Canonicalが支える、さくっと使えるUbuntu OpenStack - OpenStack Day in ITpro EXPO 2014
Canonicalが支える、さくっと使えるUbuntu OpenStack - OpenStack Day in ITpro EXPO 2014Canonicalが支える、さくっと使えるUbuntu OpenStack - OpenStack Day in ITpro EXPO 2014
Canonicalが支える、さくっと使えるUbuntu OpenStack - OpenStack Day in ITpro EXPO 2014
 
20160728 hyperscale #03
20160728 hyperscale #0320160728 hyperscale #03
20160728 hyperscale #03
 
20130126 sc12-reading
20130126 sc12-reading20130126 sc12-reading
20130126 sc12-reading
 
自動チューニングとビックデータ:機械学習の適用の可能性
自動チューニングとビックデータ:機械学習の適用の可能性自動チューニングとビックデータ:機械学習の適用の可能性
自動チューニングとビックデータ:機械学習の適用の可能性
 
Open capi meetup20180409 (revised)
Open capi meetup20180409 (revised)Open capi meetup20180409 (revised)
Open capi meetup20180409 (revised)
 
コンテナ導入概要資料2018
コンテナ導入概要資料2018コンテナ導入概要資料2018
コンテナ導入概要資料2018
 
スタートアップが提案する2030年の材料開発 - 2022/11/11 QPARC講演
スタートアップが提案する2030年の材料開発 - 2022/11/11 QPARC講演スタートアップが提案する2030年の材料開発 - 2022/11/11 QPARC講演
スタートアップが提案する2030年の材料開発 - 2022/11/11 QPARC講演
 
45分で理解する 最近のスパコン事情 斉藤之雄
45分で理解する 最近のスパコン事情 斉藤之雄45分で理解する 最近のスパコン事情 斉藤之雄
45分で理解する 最近のスパコン事情 斉藤之雄
 
ACRiウェビナー_ChipTip Technology様ご講演資料
ACRiウェビナー_ChipTip Technology様ご講演資料ACRiウェビナー_ChipTip Technology様ご講演資料
ACRiウェビナー_ChipTip Technology様ご講演資料
 
Edge Computing と k8s でなんか話すよ
Edge Computing と k8s でなんか話すよEdge Computing と k8s でなんか話すよ
Edge Computing と k8s でなんか話すよ
 

More from 智啓 出川

Fortranが拓く世界、VSCodeが架ける橋
Fortranが拓く世界、VSCodeが架ける橋Fortranが拓く世界、VSCodeが架ける橋
Fortranが拓く世界、VSCodeが架ける橋
智啓 出川
 
Very helpful python code to find coefficients of the finite difference method
Very helpful python code to find coefficients of the finite difference methodVery helpful python code to find coefficients of the finite difference method
Very helpful python code to find coefficients of the finite difference method
智啓 出川
 
Why do we confuse String and Array of Characters in Fortran?
Why do we confuse String and Array of Characters in Fortran?Why do we confuse String and Array of Characters in Fortran?
Why do we confuse String and Array of Characters in Fortran?
智啓 出川
 
Pythonによる累乗近似
Pythonによる累乗近似Pythonによる累乗近似
Pythonによる累乗近似
智啓 出川
 
数値計算結果のPythonによる後処理について(1次元データのピーク値およびその位置の推定)
数値計算結果のPythonによる後処理について(1次元データのピーク値およびその位置の推定)数値計算結果のPythonによる後処理について(1次元データのピーク値およびその位置の推定)
数値計算結果のPythonによる後処理について(1次元データのピーク値およびその位置の推定)
智啓 出川
 
オブジェクト指向Fortranが拓く(はずだった)新しい世界
オブジェクト指向Fortranが拓く(はずだった)新しい世界オブジェクト指向Fortranが拓く(はずだった)新しい世界
オブジェクト指向Fortranが拓く(はずだった)新しい世界
智啓 出川
 
Schematic diagrams of GPUs' architecture and Time evolution of theoretical FL...
Schematic diagrams of GPUs' architecture and Time evolution of theoretical FL...Schematic diagrams of GPUs' architecture and Time evolution of theoretical FL...
Schematic diagrams of GPUs' architecture and Time evolution of theoretical FL...
智啓 出川
 
GPGPU Seminar (GPU Accelerated Libraries, 3 of 3, Thrust)
GPGPU Seminar (GPU Accelerated Libraries, 3 of 3, Thrust) GPGPU Seminar (GPU Accelerated Libraries, 3 of 3, Thrust)
GPGPU Seminar (GPU Accelerated Libraries, 3 of 3, Thrust)
智啓 出川
 
GPGPU Seminar (GPU Accelerated Libraries, 2 of 3, cuSPARSE)
GPGPU Seminar (GPU Accelerated Libraries, 2 of 3, cuSPARSE) GPGPU Seminar (GPU Accelerated Libraries, 2 of 3, cuSPARSE)
GPGPU Seminar (GPU Accelerated Libraries, 2 of 3, cuSPARSE)
智啓 出川
 
教育機関でのJetsonの活用の可能性
教育機関でのJetsonの活用の可能性教育機関でのJetsonの活用の可能性
教育機関でのJetsonの活用の可能性
智啓 出川
 
GPGPU Seminar (GPGPU and CUDA Fortran)
GPGPU Seminar (GPGPU and CUDA Fortran)GPGPU Seminar (GPGPU and CUDA Fortran)
GPGPU Seminar (GPGPU and CUDA Fortran)
智啓 出川
 
2015年度先端GPGPUシミュレーション工学特論 第15回 CPUとGPUの協調
2015年度先端GPGPUシミュレーション工学特論 第15回 CPUとGPUの協調2015年度先端GPGPUシミュレーション工学特論 第15回 CPUとGPUの協調
2015年度先端GPGPUシミュレーション工学特論 第15回 CPUとGPUの協調
智啓 出川
 
2015年度先端GPGPUシミュレーション工学特論 第13回 数値流体力学への応用 (高度な最適化)
2015年度先端GPGPUシミュレーション工学特論 第13回 数値流体力学への応用(高度な最適化)2015年度先端GPGPUシミュレーション工学特論 第13回 数値流体力学への応用(高度な最適化)
2015年度先端GPGPUシミュレーション工学特論 第13回 数値流体力学への応用 (高度な最適化)
智啓 出川
 
2015年度先端GPGPUシミュレーション工学特論 第11回 数値流体力学への応用 (支配方程式,CPUプログラム)
2015年度先端GPGPUシミュレーション工学特論 第11回 数値流体力学への応用(支配方程式,CPUプログラム)2015年度先端GPGPUシミュレーション工学特論 第11回 数値流体力学への応用(支配方程式,CPUプログラム)
2015年度先端GPGPUシミュレーション工学特論 第11回 数値流体力学への応用 (支配方程式,CPUプログラム)
智啓 出川
 
2015年度先端GPGPUシミュレーション工学特論 第10回 Poisson方程式の求解 (線形連立一次方程式)
2015年度先端GPGPUシミュレーション工学特論 第10回 Poisson方程式の求解(線形連立一次方程式)2015年度先端GPGPUシミュレーション工学特論 第10回 Poisson方程式の求解(線形連立一次方程式)
2015年度先端GPGPUシミュレーション工学特論 第10回 Poisson方程式の求解 (線形連立一次方程式)
智啓 出川
 
2015年度先端GPGPUシミュレーション工学特論 第9回 偏微分方程式の差分計算 (移流方程式)
2015年度先端GPGPUシミュレーション工学特論 第9回 偏微分方程式の差分計算(移流方程式)2015年度先端GPGPUシミュレーション工学特論 第9回 偏微分方程式の差分計算(移流方程式)
2015年度先端GPGPUシミュレーション工学特論 第9回 偏微分方程式の差分計算 (移流方程式)
智啓 出川
 
2015年度先端GPGPUシミュレーション工学特論 第8回 偏微分方程式の差分計算 (拡散方程式)
2015年度先端GPGPUシミュレーション工学特論 第8回 偏微分方程式の差分計算(拡散方程式)2015年度先端GPGPUシミュレーション工学特論 第8回 偏微分方程式の差分計算(拡散方程式)
2015年度先端GPGPUシミュレーション工学特論 第8回 偏微分方程式の差分計算 (拡散方程式)
智啓 出川
 
2015年度先端GPGPUシミュレーション工学特論 第7回 総和計算(Atomic演算)
2015年度先端GPGPUシミュレーション工学特論 第7回 総和計算(Atomic演算)2015年度先端GPGPUシミュレーション工学特論 第7回 総和計算(Atomic演算)
2015年度先端GPGPUシミュレーション工学特論 第7回 総和計算(Atomic演算)
智啓 出川
 
2015年度先端GPGPUシミュレーション工学特論 第5回 GPUのメモリ階層の詳細 (様々なメモリの利用)
2015年度先端GPGPUシミュレーション工学特論 第5回 GPUのメモリ階層の詳細(様々なメモリの利用)2015年度先端GPGPUシミュレーション工学特論 第5回 GPUのメモリ階層の詳細(様々なメモリの利用)
2015年度先端GPGPUシミュレーション工学特論 第5回 GPUのメモリ階層の詳細 (様々なメモリの利用)
智啓 出川
 
2015年度先端GPGPUシミュレーション工学特論 第2回 GPUによる並列計算の概念と メモリアクセス
2015年度先端GPGPUシミュレーション工学特論 第2回 GPUによる並列計算の概念とメモリアクセス2015年度先端GPGPUシミュレーション工学特論 第2回 GPUによる並列計算の概念とメモリアクセス
2015年度先端GPGPUシミュレーション工学特論 第2回 GPUによる並列計算の概念と メモリアクセス
智啓 出川
 

More from 智啓 出川 (20)

Fortranが拓く世界、VSCodeが架ける橋
Fortranが拓く世界、VSCodeが架ける橋Fortranが拓く世界、VSCodeが架ける橋
Fortranが拓く世界、VSCodeが架ける橋
 
Very helpful python code to find coefficients of the finite difference method
Very helpful python code to find coefficients of the finite difference methodVery helpful python code to find coefficients of the finite difference method
Very helpful python code to find coefficients of the finite difference method
 
Why do we confuse String and Array of Characters in Fortran?
Why do we confuse String and Array of Characters in Fortran?Why do we confuse String and Array of Characters in Fortran?
Why do we confuse String and Array of Characters in Fortran?
 
Pythonによる累乗近似
Pythonによる累乗近似Pythonによる累乗近似
Pythonによる累乗近似
 
数値計算結果のPythonによる後処理について(1次元データのピーク値およびその位置の推定)
数値計算結果のPythonによる後処理について(1次元データのピーク値およびその位置の推定)数値計算結果のPythonによる後処理について(1次元データのピーク値およびその位置の推定)
数値計算結果のPythonによる後処理について(1次元データのピーク値およびその位置の推定)
 
オブジェクト指向Fortranが拓く(はずだった)新しい世界
オブジェクト指向Fortranが拓く(はずだった)新しい世界オブジェクト指向Fortranが拓く(はずだった)新しい世界
オブジェクト指向Fortranが拓く(はずだった)新しい世界
 
Schematic diagrams of GPUs' architecture and Time evolution of theoretical FL...
Schematic diagrams of GPUs' architecture and Time evolution of theoretical FL...Schematic diagrams of GPUs' architecture and Time evolution of theoretical FL...
Schematic diagrams of GPUs' architecture and Time evolution of theoretical FL...
 
GPGPU Seminar (GPU Accelerated Libraries, 3 of 3, Thrust)
GPGPU Seminar (GPU Accelerated Libraries, 3 of 3, Thrust) GPGPU Seminar (GPU Accelerated Libraries, 3 of 3, Thrust)
GPGPU Seminar (GPU Accelerated Libraries, 3 of 3, Thrust)
 
GPGPU Seminar (GPU Accelerated Libraries, 2 of 3, cuSPARSE)
GPGPU Seminar (GPU Accelerated Libraries, 2 of 3, cuSPARSE) GPGPU Seminar (GPU Accelerated Libraries, 2 of 3, cuSPARSE)
GPGPU Seminar (GPU Accelerated Libraries, 2 of 3, cuSPARSE)
 
教育機関でのJetsonの活用の可能性
教育機関でのJetsonの活用の可能性教育機関でのJetsonの活用の可能性
教育機関でのJetsonの活用の可能性
 
GPGPU Seminar (GPGPU and CUDA Fortran)
GPGPU Seminar (GPGPU and CUDA Fortran)GPGPU Seminar (GPGPU and CUDA Fortran)
GPGPU Seminar (GPGPU and CUDA Fortran)
 
2015年度先端GPGPUシミュレーション工学特論 第15回 CPUとGPUの協調
2015年度先端GPGPUシミュレーション工学特論 第15回 CPUとGPUの協調2015年度先端GPGPUシミュレーション工学特論 第15回 CPUとGPUの協調
2015年度先端GPGPUシミュレーション工学特論 第15回 CPUとGPUの協調
 
2015年度先端GPGPUシミュレーション工学特論 第13回 数値流体力学への応用 (高度な最適化)
2015年度先端GPGPUシミュレーション工学特論 第13回 数値流体力学への応用(高度な最適化)2015年度先端GPGPUシミュレーション工学特論 第13回 数値流体力学への応用(高度な最適化)
2015年度先端GPGPUシミュレーション工学特論 第13回 数値流体力学への応用 (高度な最適化)
 
2015年度先端GPGPUシミュレーション工学特論 第11回 数値流体力学への応用 (支配方程式,CPUプログラム)
2015年度先端GPGPUシミュレーション工学特論 第11回 数値流体力学への応用(支配方程式,CPUプログラム)2015年度先端GPGPUシミュレーション工学特論 第11回 数値流体力学への応用(支配方程式,CPUプログラム)
2015年度先端GPGPUシミュレーション工学特論 第11回 数値流体力学への応用 (支配方程式,CPUプログラム)
 
2015年度先端GPGPUシミュレーション工学特論 第10回 Poisson方程式の求解 (線形連立一次方程式)
2015年度先端GPGPUシミュレーション工学特論 第10回 Poisson方程式の求解(線形連立一次方程式)2015年度先端GPGPUシミュレーション工学特論 第10回 Poisson方程式の求解(線形連立一次方程式)
2015年度先端GPGPUシミュレーション工学特論 第10回 Poisson方程式の求解 (線形連立一次方程式)
 
2015年度先端GPGPUシミュレーション工学特論 第9回 偏微分方程式の差分計算 (移流方程式)
2015年度先端GPGPUシミュレーション工学特論 第9回 偏微分方程式の差分計算(移流方程式)2015年度先端GPGPUシミュレーション工学特論 第9回 偏微分方程式の差分計算(移流方程式)
2015年度先端GPGPUシミュレーション工学特論 第9回 偏微分方程式の差分計算 (移流方程式)
 
2015年度先端GPGPUシミュレーション工学特論 第8回 偏微分方程式の差分計算 (拡散方程式)
2015年度先端GPGPUシミュレーション工学特論 第8回 偏微分方程式の差分計算(拡散方程式)2015年度先端GPGPUシミュレーション工学特論 第8回 偏微分方程式の差分計算(拡散方程式)
2015年度先端GPGPUシミュレーション工学特論 第8回 偏微分方程式の差分計算 (拡散方程式)
 
2015年度先端GPGPUシミュレーション工学特論 第7回 総和計算(Atomic演算)
2015年度先端GPGPUシミュレーション工学特論 第7回 総和計算(Atomic演算)2015年度先端GPGPUシミュレーション工学特論 第7回 総和計算(Atomic演算)
2015年度先端GPGPUシミュレーション工学特論 第7回 総和計算(Atomic演算)
 
2015年度先端GPGPUシミュレーション工学特論 第5回 GPUのメモリ階層の詳細 (様々なメモリの利用)
2015年度先端GPGPUシミュレーション工学特論 第5回 GPUのメモリ階層の詳細(様々なメモリの利用)2015年度先端GPGPUシミュレーション工学特論 第5回 GPUのメモリ階層の詳細(様々なメモリの利用)
2015年度先端GPGPUシミュレーション工学特論 第5回 GPUのメモリ階層の詳細 (様々なメモリの利用)
 
2015年度先端GPGPUシミュレーション工学特論 第2回 GPUによる並列計算の概念と メモリアクセス
2015年度先端GPGPUシミュレーション工学特論 第2回 GPUによる並列計算の概念とメモリアクセス2015年度先端GPGPUシミュレーション工学特論 第2回 GPUによる並列計算の概念とメモリアクセス
2015年度先端GPGPUシミュレーション工学特論 第2回 GPUによる並列計算の概念と メモリアクセス
 

技術系大学におけるGPU教育の一試行