SlideShare a Scribd company logo
1 of 34
Download to read offline
ppOpen‐HPCコードを
自動チューニングする言語
ppOpen‐ATの現状と新展開
片桐 孝洋 i),ii)
1
i) 東京大学情報基盤センター
ii)JST, CREST
第7回 自動チューニング技術の現状と応用に関するシンポジウム(ATTA2015)
日時:2015年12月25日(金)10:00~18:00、場所:東京大学山上会館
15:00~15:30 
共同研究者:松本 正晴 i),ii)、大島 聡史 i),ii)
発表の流れ
1. 背景
2. ppOpen‐HPCプロジェクトと
AT言語ppOpen‐AT
3. Seism3D(ppOpen‐APPL/FDM)の
コードチューニング手法
4. 階層型ATへの展開
5. 性能評価
6. おわりに
発表の流れ
1. 背景
2. ppOpen‐HPCプロジェクトと
AT言語ppOpen‐AT
3. Seism3D(ppOpen‐APPL/FDM)の
コードチューニング手法
4. 階層型ATへの展開
5. 性能評価
6. おわりに
「ポストムーアに向けた計算機
科学・計算科学の新展開」シンポジウム
http://www.cspp.cc.u‐tokyo.ac.jp/p‐moore‐201512/
Source: 
http://www.engadget.c
om/2011/12/06/the‐
big‐memory‐cube‐
gamble‐ibm‐and‐
micron‐stack‐their‐
chips/
Source:
http://www.theregister.c
o.uk/2015/07/28/intel_
micron_3d_xpoint/
 2020年頃のエクサスケールスパコンを境に
ムーアの法則での速度向上が終焉
– “One‐time Speedup”のメニーコア化、
配線微細化、による低電力化の終わり
→ノード内の計算性能(FLOPS)は増加しなくなる
 チップ内のメモリ量やメモリ帯域は
「3次元積層技術」により向上
 3次元積層メモリ:
– Z方向(積層方向)のバンド幅は増加、
アクセスレイテンシは維持(→高性能化)
– X‐Y方向は、低アクセスレイテンシ
 ノード間は、アクセスレイテンシは(相対的に)
悪化、だが光配線技術などでバンド幅は増加
できる
 以上は2020年後半(→ポストムーア)
HMC
Intel 3D Xpoint
ポストムーア時代のAT!?
 メモリバンド幅増加
 局所メモリ(キャッシュ量)
増加
 メモリアクセス
レイテンシ非均一
を考慮したアルゴリズム再構築
AT技術の課題
階層型AT方式
通信削減アルゴリズム
高バンド幅活用の
<新アルゴリズム探求> 
と <自動切替>
(アルゴリズム選択)
 古典アルゴリズム復活?
 キャッシュブロック化なし
アルゴリズム
 陽解法から陰解法へ
 アウト・オブ・コア(OoC)
アルゴリズム(主メモリ外)
演算量(FLOPS)増加ではなく
<データ移動量増加> の
アルゴリズム変更
が求められる!
ポストムーア時代のAT!?
チューニング知識
データベース 1. 仕様策定フェーズ
2. プログラミング
フェーズ
!ABCLib$ install unroll (i,k) region start
!ABCLib$ name MyMatMul
!ABCLib$ varied (i,k) from 1 to 8
do i=1, n
do j=1, n
do k=1, n
C( i, j ) = C( i, j ) + A( i, k ) * B( k, j )
enddo
enddo
enddo
!ABCLib$ install unroll (i,k) region end
do i=1, n
do j=1, n
do k=1, n
C( i, j ) = C( i, j ) + A( i, k ) * B( k, j )
enddo
enddo
enddo
do i=1, n, 2
do j=1, n
do k=1, n
C( i, j ) = C( i, j ) + A( i, k ) * B( k, j )
C( i+1, j ) = C( i+1, j ) + A( i+1, k ) * B( k, j )
enddo
enddo
enddo
do i=1, n, 2
do j=1, n
Ctmp1 = C( i, j )
Ctmp2 = C( i+1, j )
do k=1, n
Btmp = B( k, j )
Ctmp1 = Ctmp1 + A( i, k ) * Btmp
Ctmp2 = Ctmp2 + A( i+1, k ) * Btmp
enddo
C( i, j ) = Ctmp1
C( i+1, j ) = Ctmp2
enddo
enddo
do i=1, n, 2
do j=1, n
Ctmp1 = C( i, j )
Ctmp2 = C( i+1, j )
do k=1, n, 2
Btmp1 = B( k, j )
Btmp2 = B( k+1, j )
Ctmp1 = Ctmp1 + A( i, k ) * Btmp1
+ A( i, k+1) * Btmp2
Ctmp2 = Ctmp2 + A( i+1, k ) * Btmp1
+ A( i+1, k+1) * Btmp2
enddo
C( i, j )=Ctmp1
C( i+1, j )=Ctmp2
enddo
enddo
3. 最適化フェーズ
コード
生成
4. チューニングに
関する知識探索と
データベース化
のフェーズ
結果の解析
対象計算期
コンパイルと実行
コア数の増大、プ
ログラミングモデ
ルおよびコード最
適化の複雑化
(多様な計算機
アーキテクチャ)
HPCソフトウェア開発の流れ図
発表の流れ
1. 背景
2. ppOpen‐HPCプロジェクトと
AT言語ppOpen‐AT
3. Seism3D(ppOpen‐APPL/FDM)の
コードチューニング手法
4. 階層型ATへの展開
5. 性能評価
6. おわりに
ppOpen‐HPC プロジェクト
• HPCミドルウェアとAT技術の開発
– JST, CRESTによる支援(2011年度~ 2015年度)
– 代表者: 中島研吾 教授 (東大)
• ppOpen‐HPC 1)
– ポストペタpost‐peta (pp)スケール の並列計算機向けの
オープンソースで信頼できるシミュレーション基盤を開発
– 科学技術計算のための 5種類の離散化方式を基にした
コードのライブラリから構成される
• ppOpen‐AT 6),7),8) 
– ppOpen‐HPC コードのための自動チューニング言語
– 事前プロジェクト:ABCLibScript プロジェクト 4)の知見を引き継ぐ
– ATのためのディレクティブを基にしたAT言語 9
ppOpen‐HPC の
ソフトウェアアーキテクチャ
10
FVM DEMFDMFEM
メニーコア
CPU
GPU
マルチコア
CPU
MG
COMM
自動チューニング機構
最適化候補のコード生成
最適候補の探索
最適化の自動実行
ppOpen‐APPL
ppOpen‐MATH
BEM
ppOpen‐AT
ユーザープログラム
GRAPH VIS MP
STATIC DYNAMIC
ppOpen‐SYS FT
メモリ
アクセス
最適化
ppOpen‐AT System  (Based on FIBER 2),3),4),5) ) 
ppOpen‐APPL /*
ppOpen‐AT
ディレクティブ
ユーザ
知識ライブラリ
開発者
① リリース
前時
Candidate
1
Candidate
2
Candidate
3
候補
nppOpen‐AT
オートチューナー
ppOpen‐APPL / *
自動コード
生成
②
:対象計算期
実行時間④
ライブラリ
ユーザ
③
ライブラリコール
選択
⑤
⑥
自動
チューニング
された
カーネル
の実行
実
行
時
ATの恩恵
をうける
ユーザ
ppOpen‐APPL/FDMへの適用シナリオ
12
AT無しで、最適化された
カーネルの実行
ライブラリ
利用者
ATパラメタの指定と
ライブラリの実行
(OAT_AT_EXEC=1)
■オートチューナの実行
固定ループ長での実行
(行列サイズ、MPIプロセス数、
OpenMPスレッド数の固定による)
対象カーネルの実行時間の計測
最適パラメタ情報の収納
ATパラメタの指定と
ライブラリの実行
(OAT_AT_EXEC=0)
最速カーネル情報の
収納
ATなしで最速カーネルを使う
(行列サイズ、MPIプロセス数、
OpenMPスレッド数を変えない限り有効)
行列サイズ、
MPIプロセス数、
OpenMPスレッド数の指定
[FIBER方式、2003]
実行起動前時AT
発表の流れ
1. 背景
2. ppOpen‐HPCプロジェクトと
AT言語ppOpen‐AT
3. Seism3D(ppOpen‐APPL/FDM)の
コードチューニング手法
4. 階層型ATへの展開
5. 性能評価
6. おわりに
Target Application
• Seism3D: 
Simulation for seismic wave analysis.
• Developed by Professor T.Furumura
at the University of Tokyo.
–The code is re‐constructed as 
ppOpen‐APPL/FDM.
• Finite Differential Method (FDM) 
• 3D simulation
–3D arrays are allocated.
• Data type: Single Precision (real*4) 14
Flow Diagram of 
ppOpen‐APPL/FDM
15
),,,(
}],,,)
2
1
({},,)
2
1
({[
1
),,(
2/
1
zyxqp
zyxmxzyxmxc
x
zyx
dx
d
pqpq
M
m
m
pq



 


 Space difference by FDM.
),,(,
12
1
2
1
zyxptf
zyx
uu n
p
n
zp
n
yp
n
xpn
p
n
p 

















 


 Explicit time expansion by central 
difference.
Initialization
Velocity Derivative (def_vel)
Velocity Update (update_vel)
Stress Derivative (def_stress)
Stress Update (update_stress)
Stop Iteration?
NO
YES
End
Velocity PML condition (update_vel_sponge)
Velocity Passing (MPI) (passing_vel)
Stress PML condition (update_stress_sponge)
Stress Passing (MPI) (passing_stress)
Original Implementation (For Vector Machines)
call ppohFDM_pdiffx3_m4_OAT( VX,DXVX, NXP,NYP,NZP,NXP0,NXP1,NYP0,…)
call ppohFDM_pdiffy3_p4_OAT( VX,DYVX, NXP,NYP,NZP,NXP0,NXP1,NYP0,…)
call ppohFDM_pdiffz3_p4_OAT( VX,DZVX, NXP,NYP,NZP,NXP0,NXP1,NYP0,…)
call ppohFDM_pdiffy3_m4_OAT( VY,DYVY, NXP,NYP,NZP,NXP0,NXP1,NYP0,… )
call ppohFDM_pdiffx3_p4_OAT( VY,DXVY, NXP,NYP,NZP,NXP0,NXP1,NYP0,… )
call ppohFDM_pdiffz3_p4_OAT( VY,DZVY, NXP,NYP,NZP,NXP0,NXP1,NYP0,…)
call ppohFDM_pdiffx3_p4_OAT( VZ,DXVZ, NXP,NYP,NZP,NXP0,NXP1,NYP0,…)
call ppohFDM_pdiffy3_p4_OAT( VZ,DYVZ, NXP,NYP,NZP,NXP0,NXP1,NYP0,… )
call ppohFDM_pdiffz3_m4_OAT( VZ,DZVZ, NXP,NYP,NZP,NXP0,NXP1,NYP0,…)
if( is_fs .or. is_nearfs ) then
call ppohFDM_bc_vel_deriv( KFSZ,NIFS,NJFS,IFSX,IFSY,IFSZ,JFSX,JFSY,JFSZ )
end if
call ppohFDM_update_stress(1, NXP, 1, NYP, 1, NZP)
Fourth‐order accurate central‐difference scheme 
for velocity. (def_stress)
Process of model boundary. 
Explicit time expansion by leap‐frog scheme. (update_stress)
Original Implementation (For Vector Machines)
subroutine OAT_InstallppohFDMupdate_stress(..)
!$omp parallel do private(i,j,k,RL1,RM1,RM2,RLRM2,DXVX1,DYVY1,DZVZ1,…)
do k = NZ00, NZ01
do j = NY00, NY01
do i = NX00, NX01
RL1   = LAM (I,J,K); RM1   = RIG (I,J,K);  RM2   = RM1 + RM1; RLRM2 = RL1+RM2
DXVX1 = DXVX(I,J,K);  DYVY1 = DYVY(I,J,K);  DZVZ1 = DZVZ(I,J,K)
D3V3  = DXVX1 + DYVY1 + DZVZ1
SXX (I,J,K) = SXX (I,J,K) + (RLRM2*(D3V3)‐RM2*(DZVZ1+DYVY1) ) * DT
SYY (I,J,K) = SYY (I,J,K)  + (RLRM2*(D3V3)‐RM2*(DXVX1+DZVZ1) ) * DT
SZZ (I,J,K) = SZZ (I,J,K)  + (RLRM2*(D3V3)‐RM2*(DXVX1+DYVY1) ) * DT
DXVYDYVX1 = DXVY(I,J,K)+DYVX(I,J,K);  DXVZDZVX1 = DXVZ(I,J,K)+DZVX(I,J,K)
DYVZDZVY1 = DYVZ(I,J,K)+DZVY(I,J,K)
SXY (I,J,K) = SXY (I,J,K) + RM1 * DXVYDYVX1 * DT
SXZ (I,J,K) = SXZ (I,J,K) + RM1 * DXVZDZVX1 * DT
SYZ (I,J,K) = SYZ (I,J,K) + RM1 * DYVZDZVY1 * DT
end do
end do
end do
retuen
end
Explicit time 
expansion by 
leap‐frog scheme. 
(update_stress)
Input and output for arrays Input and output for arrays 
in each call ‐> Increase of 
B/F ratio: ~1.7
発表の流れ
1. 背景
2. ppOpen‐HPCプロジェクトと
AT言語ppOpen‐AT
3. Seism3D(ppOpen‐APPL/FDM)の
コードチューニング手法
4. 階層型ATへの展開
5. 性能評価
6. おわりに
階層型AT処理の例(2階層)
program main
….
<AT対象のループ>
do i=1, N
…
call LowerRoutine( ….)
…
enddo
subroutine 
LowerRoutine(….)
….
<AT記述の処理>
….
return
end
上位のAT指定 下位のAT指定
Select節によるコード選択と階層的なAT指定
Program main
….
!OAT$ install select region start
!OAT$ name ppohFDMupdate_vel_select
!OAT$ select sub region start
call ppohFDM_pdiffx3_p4( SXX,DXSXX,NXP,NYP,NZP,….)
call ppohFDM_pdiffy3_p4( SYY,DYSYY, NXP,NYP,NZP,…..)
…
if( is_fs .or. is_nearfs ) then
call ppohFDM_bc_stress_deriv( KFSZ,NIFS,NJFS,IFSX,….)
end if
call ppohFDM_update_vel    ( 1, NXP, 1, NYP, 1, NZP )
!OAT$ select sub region end
!OAT$ select sub region start
Call ppohFDM_update_vel_Intel  ( 1, NXP, 1, NYP, 1, NZP )
!OAT$ select sub region end
!OAT$ install select region end
上位のAT指定 Select節で
コード選択が
記述可能
subroutine ppohFDM_update_vel(….)
….
!OAT$ install LoopFusion region start
!OAT$ name ppohFDMupdate_vel
!OAT$ debug (pp)
!$omp parallel do private(i,j,k,ROX,ROY,ROZ)
do k = NZ00, NZ01
do j = NY00, NY01
do i = NX00, NX01
…..
….
下位のAT指定
subroutine ppohFDM_pdiffx3_p4(….)
….
!OAT$ install LoopFusion region start
….
Call tree graph by the AT
Start
Stress Derivative (def_stress)
Stress Update (update_stress)
Stop iteration?
NO
YES
End
Velocity PML condition (update_vel_sponge)
Velocity Passing (MPI) (passing_vel)
Stress PML condition (update_stress_sponge)
Stress Passing (MPI) (passing_stress)
Velocity Derivative (def_vel)
Velocity Update (update_vel)
Main
Program
Velocity Update (update_vel_Scalar)
Stress Update (update_stress_Scalar)
Selection
Selection
update_vel_select
update_stress_select
update_vel_select
update_stress_select
:auto‐generated codes
Velocity Update (update_vel_IF_free)
Selection
Stress Update (update_stress_IF_free)
Selection
CandidateCandidateCandidateCandidate
CandidateCandidateCandidateCandidate
CandidateCandidateCandidateCandidate
CandidateCandidateCandidateCandidate
CandidateCandidateCandidateCandidate
CandidateCandidateCandidateCandidate
CandidateCandidateCandidateCandidate
Execution Order of the AT
Velocity PML condition (update_vel_sponge)
Velocity Passing (MPI) (passing_vel)
Stress PML condition (update_stress_sponge)
Stress Passing (MPI) (passing_stress)
update_vel_select
update_stress_select
Stress Derivative 
(def_stress)
Stress Update 
(update_stress)
Velocity Derivative
(def_vel)
Velocity Update
(update_vel)
Velocity Update 
(update_vel_Scalar)
Stress Update
(update_stress_Scalar)
Def_* AT Candidates
Update_vel
AT Candidates
Update_stress
AT Candidates
Update_vel_sponge
AT Candidates
Update_stress_sponge
AT Candidates
Passing_vel
AT Candidates
Passing_stress
AT Candidates
①
②
②
③
③
④
④
④
④
Velocity Update 
(update_vel_IF_free)
Stress Update
(update_stress_IF_free)
We can specify the 
order via a directive of 
ppOpen‐AT.
(an extended function)
The Number of AT Candidates (ppOpen‐APPL/FDM)
23
Kernel Names AT Objects The Number of Candidates
1. update_stress ・Loop Collapses and Splits :8 Kinds
・Code Selections : 2 Kinds
10
2. update_vel ・Loop Collapses, Splits, and re‐
ordering of statements: :6 Kinds
・Code Selections: 2 Kinds
8
3. update_stress_sponge ・Loop Collapses:3 Kinds 3
4. update_vel_sponge ・Loop Collapses:3 Kinds 3
5. ppohFDM_pdiffx3_p4 Kernel Names:def_update、def_vel
・Loop Collapses:3 Kinds
3
6. ppohFDM_pdiffx3_m4 3
7. ppohFDM_pdiffy3_p4 3
8. ppohFDM_pdiffy3_m4 3
9. ppohFDM_pdiffz3_p4 3
10.ppohFDM_pdiffz3_m4 3
11. ppohFDM_ps_pack Data packing and unpacking
・Loop Collapses: 3 Kinds
3
12. ppohFDM_ps_unpack 3
13. ppohFDM_pv_pack 3
14. ppohFDM_pv_unpack 3
 Total:54 Kinds
 Hybrid 
MPI/OpenMP:
7 Kinds
 54×7 = 
378 Kinds
発表の流れ
1. 背景
2. ppOpen‐HPCプロジェクトと
AT言語ppOpen‐AT
3. Seism3D(ppOpen‐APPL/FDM)の
コードチューニング手法
4. 階層型ATへの展開
5. 性能評価
6. おわりに
Machine Environment 
(8 nodes of the Xeon Phi)
 The Intel Xeon Phi 
 Xeon Phi 5110P (1.053 GHz), 60 cores
 Memory Amount:8 GB (GDDR5)
 Theoretical Peak Performance:1.01 TFLOPS
 One board per node of the Xeon phi cluster
 InfiniBand FDR x 2 Ports 
 Mellanox Connect‐IB
 PCI‐E Gen3 x16
 56Gbps x 2
 Theoretical Peak bandwidth 13.6GB/s
 Full‐Bisection
 Intel MPI
 Based on MPICH2, MVAPICH2
 Version 5.0 Update 3 Build 20150128 
 Compiler:Intel Fortran version 15.0.3 20150407
 Compiler Options:
‐ipo20 ‐O3 ‐warn all ‐openmp ‐mcmodel=medium ‐shared‐intel –mmic
‐align array64byte
 KMP_AFFINITY=granularity=fine, balanced (Uniform Distribution of threads 
between sockets)
Execution Details of Hybrid 
MPI/OpenMP
• Target MPI Processes and OMP Threads on the Xeon Phi
– The Xeon Phi with 4 HT (Hyper Threading) 
– PX TY: X MPI Processes and Y Threads per process
– P8T240 : Minimum Hybrid MPI/OpenMP execution for 
ppOpen‐APPL/FDM, since it needs minimum 8 MPI Processes.
– P16T120
– P32T60
– P64T30
– P128T15  
– P240T8
– P480T4
– Less than P960T2 cause an MPI error in this environment.
#
0
#
1
#
2
#
3
#
4
#
5
#
6
#
7
#
8
#
9
#
1
0
#
1
1
#
1
2
#
1
3
#
1
4
#
1
5
P2T8
#
0
#
1
#
2
#
3
#
4
#
5
#
6
#
7
#
8
#
9
#
1
0
#
1
1
#
1
2
#
1
3
#
1
4
#
1
5
P4T4 Target of cores for 
one MPI Process
BREAK DOWN OF TIMINGS 
THE BEST IMPLEMENTATION
発表の流れ
1. 背景
2. ppOpen‐HPCプロジェクトと
AT言語ppOpen‐AT
3. Seism3D(ppOpen‐APPL/FDM)の
コードチューニング手法
4. 階層型ATへの展開
5. 性能評価
6. おわりに
オリジナリティ (AT言語)
AT Language 
/ Items
#
1
#
2
#
3
#
4
#
5
#
6
#
7
#
8
ppOpen‐AT OAT Directives ✔ ✔ ✔ ✔ ✔ なし
Vendor Compilers 対象外 Limited ‐
Transformation 
Recipes 
Recipe
Descriptions
✔ ✔ ChiLL
POET Xform Description ✔ ✔ POET translator, ROSE
X language 
Xlang Pragmas ✔ ✔ X Translation,
‘C and tcc
SPL SPL Expressions ✔ ✔ ✔ A Script Language
ADAPT
ADAPT 
Language
✔ ✔ Polaris
Compiler 
Infrastructure, 
Remote Procedure 
Call (RPC)
Atune‐IL
Atune Pragmas ✔ A Monitoring 
Daemon
PEPPHER
PEPPHER Pragmas
(interface)
✔ ✔ ✔ PEPPHER task graph
and run-time
Xevolver
Directive Extension
(Recipe Descriptions)
(✔) (✔) (✔) ROSE,
XSLT Translator
#1: 複数コンパイラ環境の支援手法 #2: 実行時のループ長の取得
#3: 演算回数の増加を認めるループ分割、および、その分割したループに対するループ融合
#4: 最内側ループの式並び変更 #5:実装選択(階層AT処理)の概念 #6: アルゴリズム選択
#7: 実行情報フィードバックによるコード生成 #8: ソフトウェアスタックの要求
(ユーザ自身で定義する )
Conclusion Remarks
 Propose an IF‐free kernel: An effective kernel 
implementation of an application with FDM by merging 
computations of central‐difference and explicit time 
expansion schemes. 
 Use AT language to adapt code selection for new kernels: 
The effectiveness of the new implementation depends 
on the CPU architecture and execution situation, such as 
problem size and the number of MPI processes and 
OpenMP threads. 
To obtain free code (MIT Licensing):
http://ppopenhpc.cc.u‐tokyo.ac.jp/
Future Work
• Improving Search Algorithm
– We use a brute‐force search in current implementation.
• This is feasible by applying knowledge of application.
– We have implemented a new search algorithm based on black box 
performance models.
• d‐Spline Model (interpolation and incremental addition
based) ,collaborated with Prof. Tanaka (Kogakuin U.)
• Surrogate Model (interpolation and probability based) collaborated 
with Prof. Wang (National Taiwan U.) 
• Off‐loading Implementation Selection 
(for the Xeon Phi)
– If problem size is too small to do off‐loading, the target execution is 
performed on CPU automatically.
• Adaptation of OpenACC for GPU computing
– Selection of OpenACC directives with ppOpenAT 
by Dr. Ohshima.
• gang, vector, parallel, etc. 
http://ppopenhpc.cc.u‐tokyo.ac.jp/
Thank you for your attention!
Questions?
参考文献
1) K. Nakajima, M. Satoh, T. Furumura, H. Okuda, T. Iwashita, H. Sakaguchi, T. Katagiri, M. Matsumoto, S. Ohshima, 
H. Jitsumoto, T. Arakawa, F. Mori, T. Kitayama, A. Ida and M. Y. Matsuo, ppOpen‐HPC: Open Source Infrastructure 
for Development and Execution of Large‐Scale Scientific Applications on Post‐Peta‐Scale Supercomputers with 
Automatic Tuning (AT), Optimization in the Real World, Mathematics for Industry 13, K. Fujisawa et al. (eds.), 
Springer, pp.15‐35 (2016)
2) Takahiro Katagiri, Kenji Kise, Hiroki Honda, Toshitsugu Yuba: FIBER: A general framework for auto‐tuning 
software, The Fifth International Symposium on High Performance Computing (ISHPC‐V), Springer LNCS 2858, pp. 
146‐159 (2003)
3) Takahiro Katagiri, Kenji Kise, Hiroki Honda, Toshitsugu Yuba: Effect of auto‐tuning with user's knowledge for 
numerical software, Proceedings of the ACM 1st conference on Computing frontiers (CF2004), pp.12‐25, (2004)
4) Takahiro Katagiri, Kenji Kise, Hiroki Honda, Toshitsugu Yuba: ABCLibScript: A directive to support specification of 
an auto‐tuning facility for numerical software, Parallel Computing ,32 (1), pp.92‐112 (2006)
5) Takahiro Katagiri, Kenji Kise, Hiroki Honda, and Toshitsugu Yuba: ABCLib_DRSSED: A Parallel Eigensolver with an 
Auto‐tuning Facility, Parallel Computing, Vol.32, Issue 3, pp.231‐250 (2006)
6) Takahiro Katagiri, Satoshi Ito, Satoshi Ohshima: Early experiences for adaptation of auto‐tuning by ppOpen‐AT to 
an explicit method, Special Session: Auto‐Tuning for Multicore and GPU (ATMG) (In Conjunction with the IEEE 
MCSoC‐13), Proceedings of MCSoC‐13, pp.123‐128 (2013) 
7) Takahiro Katagiri, Satoshi Ohshima, Masaharu Matsumoto: Auto‐tuning of computation kernels from an FDM 
Code with ppOpen‐AT, Special Session: Auto‐Tuning for Multicore and GPU (ATMG) (In Conjunction with the IEEE 
MCSoC‐14), Proceedings of MCSoC‐14, pp.253‐260 (2014) 
8) Takahiro Katagiri, Satoshi Ohshima, Masaharu Matsumoto: Directive‐based Auto‐tuning for the Finite Difference 
Method on the Xeon Phi, The Tenth International Workshop on Automatic Performance Tuning (iWAPT2015) (In 
Conjunction with the IEEE IPDPS2015 ), Proceedings of IPDPSW2015, pp.1221‐1230 (2015)

More Related Content

What's hot

メモリ抽象化フレームワークPyCoRAMを用いたソフトプロセッサ混載FPGAアクセラレータの開発
メモリ抽象化フレームワークPyCoRAMを用いたソフトプロセッサ混載FPGAアクセラレータの開発メモリ抽象化フレームワークPyCoRAMを用いたソフトプロセッサ混載FPGAアクセラレータの開発
メモリ抽象化フレームワークPyCoRAMを用いたソフトプロセッサ混載FPGAアクセラレータの開発Shinya Takamaeda-Y
 
200514material minami
200514material minami200514material minami
200514material minamiRCCSRENKEI
 
PyCoRAM: Python-Verilog高位合成とメモリ抽象化によるFPGAアクセラレータ向けIPコア開発フレームワーク (FPGAX #05)
PyCoRAM: Python-Verilog高位合成とメモリ抽象化によるFPGAアクセラレータ向けIPコア開発フレームワーク (FPGAX #05)PyCoRAM: Python-Verilog高位合成とメモリ抽象化によるFPGAアクセラレータ向けIPコア開発フレームワーク (FPGAX #05)
PyCoRAM: Python-Verilog高位合成とメモリ抽象化によるFPGAアクセラレータ向けIPコア開発フレームワーク (FPGAX #05)Shinya Takamaeda-Y
 
PyCoRAM (高位合成友の会@ドワンゴ, 2015年1月16日)
PyCoRAM (高位合成友の会@ドワンゴ, 2015年1月16日)PyCoRAM (高位合成友の会@ドワンゴ, 2015年1月16日)
PyCoRAM (高位合成友の会@ドワンゴ, 2015年1月16日)Shinya Takamaeda-Y
 
CMSI計算科学技術特論B(4) アプリケーションの性能最適化の実例1
CMSI計算科学技術特論B(4) アプリケーションの性能最適化の実例1CMSI計算科学技術特論B(4) アプリケーションの性能最適化の実例1
CMSI計算科学技術特論B(4) アプリケーションの性能最適化の実例1Computational Materials Science Initiative
 
アプリケーションの性能最適化の実例1
アプリケーションの性能最適化の実例1 アプリケーションの性能最適化の実例1
アプリケーションの性能最適化の実例1 RCCSRENKEI
 
Pythonによる高位設計フレームワークPyCoRAMでFPGAシステムを開発してみよう
Pythonによる高位設計フレームワークPyCoRAMでFPGAシステムを開発してみようPythonによる高位設計フレームワークPyCoRAMでFPGAシステムを開発してみよう
Pythonによる高位設計フレームワークPyCoRAMでFPGAシステムを開発してみようShinya Takamaeda-Y
 
2021 09 豆寄席:(公開用)長く生き残るitエンジニアの”リベラル・アーツ”
2021 09 豆寄席:(公開用)長く生き残るitエンジニアの”リベラル・アーツ”2021 09 豆寄席:(公開用)長く生き残るitエンジニアの”リベラル・アーツ”
2021 09 豆寄席:(公開用)長く生き残るitエンジニアの”リベラル・アーツ”Hideo Terada
 
CMSI計算科学技術特論B(5) アプリケーションの性能最適化の実例2
CMSI計算科学技術特論B(5) アプリケーションの性能最適化の実例2CMSI計算科学技術特論B(5) アプリケーションの性能最適化の実例2
CMSI計算科学技術特論B(5) アプリケーションの性能最適化の実例2Computational Materials Science Initiative
 
PyCoRAMを用いたグラフ処理FPGAアクセラレータ
PyCoRAMを用いたグラフ処理FPGAアクセラレータPyCoRAMを用いたグラフ処理FPGAアクセラレータ
PyCoRAMを用いたグラフ処理FPGAアクセラレータShinya Takamaeda-Y
 
アプリケーションの性能最適化2(CPU単体性能最適化)
アプリケーションの性能最適化2(CPU単体性能最適化)アプリケーションの性能最適化2(CPU単体性能最適化)
アプリケーションの性能最適化2(CPU単体性能最適化)RCCSRENKEI
 
Encoder-decoder 翻訳 (TISハンズオン資料)
Encoder-decoder 翻訳 (TISハンズオン資料)Encoder-decoder 翻訳 (TISハンズオン資料)
Encoder-decoder 翻訳 (TISハンズオン資料)Yusuke Oda
 
コンピュータアーキテクチャ研究の最新動向〜ISCA2015参加報告〜 @FPGAエクストリーム・コンピューティング 第7回 (#fpgax #7)
コンピュータアーキテクチャ研究の最新動向〜ISCA2015参加報告〜 @FPGAエクストリーム・コンピューティング 第7回 (#fpgax #7)コンピュータアーキテクチャ研究の最新動向〜ISCA2015参加報告〜 @FPGAエクストリーム・コンピューティング 第7回 (#fpgax #7)
コンピュータアーキテクチャ研究の最新動向〜ISCA2015参加報告〜 @FPGAエクストリーム・コンピューティング 第7回 (#fpgax #7)Shinya Takamaeda-Y
 
CMSI計算科学技術特論B(1) スーパーコンピュータとアプリケーションの性能
CMSI計算科学技術特論B(1) スーパーコンピュータとアプリケーションの性能CMSI計算科学技術特論B(1) スーパーコンピュータとアプリケーションの性能
CMSI計算科学技術特論B(1) スーパーコンピュータとアプリケーションの性能Computational Materials Science Initiative
 
Rtm講習会 140626 02
Rtm講習会 140626 02Rtm講習会 140626 02
Rtm講習会 140626 02openrtm
 
El text.tokuron a(2019).katagiri
El text.tokuron a(2019).katagiriEl text.tokuron a(2019).katagiri
El text.tokuron a(2019).katagiriRCCSRENKEI
 

What's hot (20)

メモリ抽象化フレームワークPyCoRAMを用いたソフトプロセッサ混載FPGAアクセラレータの開発
メモリ抽象化フレームワークPyCoRAMを用いたソフトプロセッサ混載FPGAアクセラレータの開発メモリ抽象化フレームワークPyCoRAMを用いたソフトプロセッサ混載FPGAアクセラレータの開発
メモリ抽象化フレームワークPyCoRAMを用いたソフトプロセッサ混載FPGAアクセラレータの開発
 
200514material minami
200514material minami200514material minami
200514material minami
 
PyCoRAM: Python-Verilog高位合成とメモリ抽象化によるFPGAアクセラレータ向けIPコア開発フレームワーク (FPGAX #05)
PyCoRAM: Python-Verilog高位合成とメモリ抽象化によるFPGAアクセラレータ向けIPコア開発フレームワーク (FPGAX #05)PyCoRAM: Python-Verilog高位合成とメモリ抽象化によるFPGAアクセラレータ向けIPコア開発フレームワーク (FPGAX #05)
PyCoRAM: Python-Verilog高位合成とメモリ抽象化によるFPGAアクセラレータ向けIPコア開発フレームワーク (FPGAX #05)
 
PyCoRAM (高位合成友の会@ドワンゴ, 2015年1月16日)
PyCoRAM (高位合成友の会@ドワンゴ, 2015年1月16日)PyCoRAM (高位合成友の会@ドワンゴ, 2015年1月16日)
PyCoRAM (高位合成友の会@ドワンゴ, 2015年1月16日)
 
CMSI計算科学技術特論B(4) アプリケーションの性能最適化の実例1
CMSI計算科学技術特論B(4) アプリケーションの性能最適化の実例1CMSI計算科学技術特論B(4) アプリケーションの性能最適化の実例1
CMSI計算科学技術特論B(4) アプリケーションの性能最適化の実例1
 
CMSI計算科学技術特論B(11) 大規模MD並列化の技術2
CMSI計算科学技術特論B(11) 大規模MD並列化の技術2CMSI計算科学技術特論B(11) 大規模MD並列化の技術2
CMSI計算科学技術特論B(11) 大規模MD並列化の技術2
 
アプリケーションの性能最適化の実例1
アプリケーションの性能最適化の実例1 アプリケーションの性能最適化の実例1
アプリケーションの性能最適化の実例1
 
Pythonによる高位設計フレームワークPyCoRAMでFPGAシステムを開発してみよう
Pythonによる高位設計フレームワークPyCoRAMでFPGAシステムを開発してみようPythonによる高位設計フレームワークPyCoRAMでFPGAシステムを開発してみよう
Pythonによる高位設計フレームワークPyCoRAMでFPGAシステムを開発してみよう
 
CMSI計算科学技術特論B(3) アプリケーションの性能最適化2
CMSI計算科学技術特論B(3) アプリケーションの性能最適化2CMSI計算科学技術特論B(3) アプリケーションの性能最適化2
CMSI計算科学技術特論B(3) アプリケーションの性能最適化2
 
2021 09 豆寄席:(公開用)長く生き残るitエンジニアの”リベラル・アーツ”
2021 09 豆寄席:(公開用)長く生き残るitエンジニアの”リベラル・アーツ”2021 09 豆寄席:(公開用)長く生き残るitエンジニアの”リベラル・アーツ”
2021 09 豆寄席:(公開用)長く生き残るitエンジニアの”リベラル・アーツ”
 
CMSI計算科学技術特論B(5) アプリケーションの性能最適化の実例2
CMSI計算科学技術特論B(5) アプリケーションの性能最適化の実例2CMSI計算科学技術特論B(5) アプリケーションの性能最適化の実例2
CMSI計算科学技術特論B(5) アプリケーションの性能最適化の実例2
 
PyCoRAMを用いたグラフ処理FPGAアクセラレータ
PyCoRAMを用いたグラフ処理FPGAアクセラレータPyCoRAMを用いたグラフ処理FPGAアクセラレータ
PyCoRAMを用いたグラフ処理FPGAアクセラレータ
 
CMSI計算科学技術特論B(2) アプリケーションの性能最適化1
CMSI計算科学技術特論B(2) アプリケーションの性能最適化1CMSI計算科学技術特論B(2) アプリケーションの性能最適化1
CMSI計算科学技術特論B(2) アプリケーションの性能最適化1
 
アプリケーションの性能最適化2(CPU単体性能最適化)
アプリケーションの性能最適化2(CPU単体性能最適化)アプリケーションの性能最適化2(CPU単体性能最適化)
アプリケーションの性能最適化2(CPU単体性能最適化)
 
Encoder-decoder 翻訳 (TISハンズオン資料)
Encoder-decoder 翻訳 (TISハンズオン資料)Encoder-decoder 翻訳 (TISハンズオン資料)
Encoder-decoder 翻訳 (TISハンズオン資料)
 
コンピュータアーキテクチャ研究の最新動向〜ISCA2015参加報告〜 @FPGAエクストリーム・コンピューティング 第7回 (#fpgax #7)
コンピュータアーキテクチャ研究の最新動向〜ISCA2015参加報告〜 @FPGAエクストリーム・コンピューティング 第7回 (#fpgax #7)コンピュータアーキテクチャ研究の最新動向〜ISCA2015参加報告〜 @FPGAエクストリーム・コンピューティング 第7回 (#fpgax #7)
コンピュータアーキテクチャ研究の最新動向〜ISCA2015参加報告〜 @FPGAエクストリーム・コンピューティング 第7回 (#fpgax #7)
 
CMSI計算科学技術特論B(1) スーパーコンピュータとアプリケーションの性能
CMSI計算科学技術特論B(1) スーパーコンピュータとアプリケーションの性能CMSI計算科学技術特論B(1) スーパーコンピュータとアプリケーションの性能
CMSI計算科学技術特論B(1) スーパーコンピュータとアプリケーションの性能
 
Rtm講習会 140626 02
Rtm講習会 140626 02Rtm講習会 140626 02
Rtm講習会 140626 02
 
El text.tokuron a(2019).katagiri
El text.tokuron a(2019).katagiriEl text.tokuron a(2019).katagiri
El text.tokuron a(2019).katagiri
 
CMSI計算科学技術特論B(10) 大規模MD並列化の技術1
CMSI計算科学技術特論B(10) 大規模MD並列化の技術1CMSI計算科学技術特論B(10) 大規模MD並列化の技術1
CMSI計算科学技術特論B(10) 大規模MD並列化の技術1
 

Viewers also liked

ATTA2014基盤B導入(片桐)
ATTA2014基盤B導入(片桐)ATTA2014基盤B導入(片桐)
ATTA2014基盤B導入(片桐)Takahiro Katagiri
 
Towards Auto‐tuning for the Finite Difference Method in Era of 200+ Thread Pa...
Towards Auto‐tuning for the Finite Difference Method in Era of 200+ Thread Pa...Towards Auto‐tuning for the Finite Difference Method in Era of 200+ Thread Pa...
Towards Auto‐tuning for the Finite Difference Method in Era of 200+ Thread Pa...Takahiro Katagiri
 
Towards Auto-tuning Facilities into Supercomputers in Operation - The FIBER a...
Towards Auto-tuning Facilities into Supercomputers in Operation - The FIBER a...Towards Auto-tuning Facilities into Supercomputers in Operation - The FIBER a...
Towards Auto-tuning Facilities into Supercomputers in Operation - The FIBER a...Takahiro Katagiri
 
Extreme‐Scale Parallel Symmetric Eigensolver for Very Small‐Size Matrices Usi...
Extreme‐Scale Parallel Symmetric Eigensolver for Very Small‐Size Matrices Usi...Extreme‐Scale Parallel Symmetric Eigensolver for Very Small‐Size Matrices Usi...
Extreme‐Scale Parallel Symmetric Eigensolver for Very Small‐Size Matrices Usi...Takahiro Katagiri
 
Impact of Auto-tuning of Kernel Loop Transformation by using ppOpen-AT
Impact of Auto-tuning of Kernel Loop Transformation by using ppOpen-ATImpact of Auto-tuning of Kernel Loop Transformation by using ppOpen-AT
Impact of Auto-tuning of Kernel Loop Transformation by using ppOpen-ATTakahiro Katagiri
 
Towards Automatic Code Selection with ppOpen-AT: A Case of FDM - Variants of ...
Towards Automatic Code Selection with ppOpen-AT: A Case of FDM - Variants of ...Towards Automatic Code Selection with ppOpen-AT: A Case of FDM - Variants of ...
Towards Automatic Code Selection with ppOpen-AT: A Case of FDM - Variants of ...Takahiro Katagiri
 
ppOpen-AT : Yet Another Directive-base AT Language
ppOpen-AT : Yet Another Directive-base AT LanguageppOpen-AT : Yet Another Directive-base AT Language
ppOpen-AT : Yet Another Directive-base AT LanguageTakahiro Katagiri
 
Auto‐Tuning of Hierarchical Computations with ppOpen‐AT
Auto‐Tuning of Hierarchical Computations with ppOpen‐ATAuto‐Tuning of Hierarchical Computations with ppOpen‐AT
Auto‐Tuning of Hierarchical Computations with ppOpen‐ATTakahiro Katagiri
 

Viewers also liked (10)

ATTA2014基盤B導入(片桐)
ATTA2014基盤B導入(片桐)ATTA2014基盤B導入(片桐)
ATTA2014基盤B導入(片桐)
 
Towards Auto‐tuning for the Finite Difference Method in Era of 200+ Thread Pa...
Towards Auto‐tuning for the Finite Difference Method in Era of 200+ Thread Pa...Towards Auto‐tuning for the Finite Difference Method in Era of 200+ Thread Pa...
Towards Auto‐tuning for the Finite Difference Method in Era of 200+ Thread Pa...
 
iWAPT2015_katagiri
iWAPT2015_katagiriiWAPT2015_katagiri
iWAPT2015_katagiri
 
Towards Auto-tuning Facilities into Supercomputers in Operation - The FIBER a...
Towards Auto-tuning Facilities into Supercomputers in Operation - The FIBER a...Towards Auto-tuning Facilities into Supercomputers in Operation - The FIBER a...
Towards Auto-tuning Facilities into Supercomputers in Operation - The FIBER a...
 
Extreme‐Scale Parallel Symmetric Eigensolver for Very Small‐Size Matrices Usi...
Extreme‐Scale Parallel Symmetric Eigensolver for Very Small‐Size Matrices Usi...Extreme‐Scale Parallel Symmetric Eigensolver for Very Small‐Size Matrices Usi...
Extreme‐Scale Parallel Symmetric Eigensolver for Very Small‐Size Matrices Usi...
 
Ase20 20151016 hp
Ase20 20151016 hpAse20 20151016 hp
Ase20 20151016 hp
 
Impact of Auto-tuning of Kernel Loop Transformation by using ppOpen-AT
Impact of Auto-tuning of Kernel Loop Transformation by using ppOpen-ATImpact of Auto-tuning of Kernel Loop Transformation by using ppOpen-AT
Impact of Auto-tuning of Kernel Loop Transformation by using ppOpen-AT
 
Towards Automatic Code Selection with ppOpen-AT: A Case of FDM - Variants of ...
Towards Automatic Code Selection with ppOpen-AT: A Case of FDM - Variants of ...Towards Automatic Code Selection with ppOpen-AT: A Case of FDM - Variants of ...
Towards Automatic Code Selection with ppOpen-AT: A Case of FDM - Variants of ...
 
ppOpen-AT : Yet Another Directive-base AT Language
ppOpen-AT : Yet Another Directive-base AT LanguageppOpen-AT : Yet Another Directive-base AT Language
ppOpen-AT : Yet Another Directive-base AT Language
 
Auto‐Tuning of Hierarchical Computations with ppOpen‐AT
Auto‐Tuning of Hierarchical Computations with ppOpen‐ATAuto‐Tuning of Hierarchical Computations with ppOpen‐AT
Auto‐Tuning of Hierarchical Computations with ppOpen‐AT
 

Similar to ppOpen-HPCコードを自動チューニングする言語ppOpen-ATの現状と新展開

PARI/GPの話 @ Ph/shh/bin CTF勉強会LT
PARI/GPの話 @ Ph/shh/bin CTF勉強会LTPARI/GPの話 @ Ph/shh/bin CTF勉強会LT
PARI/GPの話 @ Ph/shh/bin CTF勉強会LT__ytoku
 
第9回 配信講義 計算科学技術特論B(2022)
 第9回 配信講義 計算科学技術特論B(2022) 第9回 配信講義 計算科学技術特論B(2022)
第9回 配信講義 計算科学技術特論B(2022)RCCSRENKEI
 
X tapp lecture_20140226
X tapp lecture_20140226X tapp lecture_20140226
X tapp lecture_20140226xTAPP
 
有機ソフトクリスタルの弾性・光応答機構の解明
有機ソフトクリスタルの弾性・光応答機構の解明有機ソフトクリスタルの弾性・光応答機構の解明
有機ソフトクリスタルの弾性・光応答機構の解明Michio Katouda
 
有機ソフトクリスタルの弾性・光応答機構の解明
有機ソフトクリスタルの弾性・光応答機構の解明有機ソフトクリスタルの弾性・光応答機構の解明
有機ソフトクリスタルの弾性・光応答機構の解明Michio Katouda
 
Fftw誰得ガイド
Fftw誰得ガイドFftw誰得ガイド
Fftw誰得ガイドchunjp
 
2012研究室紹介(大川)
2012研究室紹介(大川)2012研究室紹介(大川)
2012研究室紹介(大川)猛 大川
 
第162回情報処理学会ハイパフォーマンスコンピューティング研究発表会
第162回情報処理学会ハイパフォーマンスコンピューティング研究発表会第162回情報処理学会ハイパフォーマンスコンピューティング研究発表会
第162回情報処理学会ハイパフォーマンスコンピューティング研究発表会Hitoshi Sato
 
GPU-FPGA 協調計算を記述するためのプログラミング環境に関する研究(HPC169 No.10)
GPU-FPGA 協調計算を記述するためのプログラミング環境に関する研究(HPC169 No.10)GPU-FPGA 協調計算を記述するためのプログラミング環境に関する研究(HPC169 No.10)
GPU-FPGA 協調計算を記述するためのプログラミング環境に関する研究(HPC169 No.10)Ryuuta Tsunashima
 
Devsumi2010 Ecmascript5 (ISO/IEC JTC1/SC22)
Devsumi2010 Ecmascript5 (ISO/IEC JTC1/SC22)Devsumi2010 Ecmascript5 (ISO/IEC JTC1/SC22)
Devsumi2010 Ecmascript5 (ISO/IEC JTC1/SC22)takesako
 
Python physicalcomputing
Python physicalcomputingPython physicalcomputing
Python physicalcomputingNoboru Irieda
 
非静力学海洋モデルkinacoのGPUによる高速化
非静力学海洋モデルkinacoのGPUによる高速化非静力学海洋モデルkinacoのGPUによる高速化
非静力学海洋モデルkinacoのGPUによる高速化Takateru Yamagishi
 
08. artisocレシピブック ダイクストラ法を高速化しよう
08. artisocレシピブック ダイクストラ法を高速化しよう08. artisocレシピブック ダイクストラ法を高速化しよう
08. artisocレシピブック ダイクストラ法を高速化しようMasaki Tamada
 
60分でわかるソケットプログラミング
60分でわかるソケットプログラミング60分でわかるソケットプログラミング
60分でわかるソケットプログラミングMasahiko Kimoto
 
CMSI計算科学技術特論A(8) 高速化チューニングとその関連技術1
CMSI計算科学技術特論A(8) 高速化チューニングとその関連技術1CMSI計算科学技術特論A(8) 高速化チューニングとその関連技術1
CMSI計算科学技術特論A(8) 高速化チューニングとその関連技術1Hiroshi Watanabe
 
LTspiceを活用した昇圧回路のトポロジーシミュレーション
LTspiceを活用した昇圧回路のトポロジーシミュレーションLTspiceを活用した昇圧回路のトポロジーシミュレーション
LTspiceを活用した昇圧回路のトポロジーシミュレーションTsuyoshi Horigome
 
ストリーム処理とSensorBee
ストリーム処理とSensorBeeストリーム処理とSensorBee
ストリーム処理とSensorBeeDaisuke Tanaka
 

Similar to ppOpen-HPCコードを自動チューニングする言語ppOpen-ATの現状と新展開 (20)

PARI/GPの話 @ Ph/shh/bin CTF勉強会LT
PARI/GPの話 @ Ph/shh/bin CTF勉強会LTPARI/GPの話 @ Ph/shh/bin CTF勉強会LT
PARI/GPの話 @ Ph/shh/bin CTF勉強会LT
 
第9回 配信講義 計算科学技術特論B(2022)
 第9回 配信講義 計算科学技術特論B(2022) 第9回 配信講義 計算科学技術特論B(2022)
第9回 配信講義 計算科学技術特論B(2022)
 
X tapp lecture_20140226
X tapp lecture_20140226X tapp lecture_20140226
X tapp lecture_20140226
 
有機ソフトクリスタルの弾性・光応答機構の解明
有機ソフトクリスタルの弾性・光応答機構の解明有機ソフトクリスタルの弾性・光応答機構の解明
有機ソフトクリスタルの弾性・光応答機構の解明
 
有機ソフトクリスタルの弾性・光応答機構の解明
有機ソフトクリスタルの弾性・光応答機構の解明有機ソフトクリスタルの弾性・光応答機構の解明
有機ソフトクリスタルの弾性・光応答機構の解明
 
Fftw誰得ガイド
Fftw誰得ガイドFftw誰得ガイド
Fftw誰得ガイド
 
2012研究室紹介(大川)
2012研究室紹介(大川)2012研究室紹介(大川)
2012研究室紹介(大川)
 
第162回情報処理学会ハイパフォーマンスコンピューティング研究発表会
第162回情報処理学会ハイパフォーマンスコンピューティング研究発表会第162回情報処理学会ハイパフォーマンスコンピューティング研究発表会
第162回情報処理学会ハイパフォーマンスコンピューティング研究発表会
 
GPU-FPGA 協調計算を記述するためのプログラミング環境に関する研究(HPC169 No.10)
GPU-FPGA 協調計算を記述するためのプログラミング環境に関する研究(HPC169 No.10)GPU-FPGA 協調計算を記述するためのプログラミング環境に関する研究(HPC169 No.10)
GPU-FPGA 協調計算を記述するためのプログラミング環境に関する研究(HPC169 No.10)
 
Devsumi2010 Ecmascript5 (ISO/IEC JTC1/SC22)
Devsumi2010 Ecmascript5 (ISO/IEC JTC1/SC22)Devsumi2010 Ecmascript5 (ISO/IEC JTC1/SC22)
Devsumi2010 Ecmascript5 (ISO/IEC JTC1/SC22)
 
Python physicalcomputing
Python physicalcomputingPython physicalcomputing
Python physicalcomputing
 
2016-ShowNet-PTP (Precision Time Protocol)
2016-ShowNet-PTP (Precision Time Protocol)2016-ShowNet-PTP (Precision Time Protocol)
2016-ShowNet-PTP (Precision Time Protocol)
 
非静力学海洋モデルkinacoのGPUによる高速化
非静力学海洋モデルkinacoのGPUによる高速化非静力学海洋モデルkinacoのGPUによる高速化
非静力学海洋モデルkinacoのGPUによる高速化
 
GTC Japan 2017
GTC Japan 2017GTC Japan 2017
GTC Japan 2017
 
08. artisocレシピブック ダイクストラ法を高速化しよう
08. artisocレシピブック ダイクストラ法を高速化しよう08. artisocレシピブック ダイクストラ法を高速化しよう
08. artisocレシピブック ダイクストラ法を高速化しよう
 
60分でわかるソケットプログラミング
60分でわかるソケットプログラミング60分でわかるソケットプログラミング
60分でわかるソケットプログラミング
 
CMSI計算科学技術特論B(12) 大規模量子化学計算(1)
CMSI計算科学技術特論B(12) 大規模量子化学計算(1)CMSI計算科学技術特論B(12) 大規模量子化学計算(1)
CMSI計算科学技術特論B(12) 大規模量子化学計算(1)
 
CMSI計算科学技術特論A(8) 高速化チューニングとその関連技術1
CMSI計算科学技術特論A(8) 高速化チューニングとその関連技術1CMSI計算科学技術特論A(8) 高速化チューニングとその関連技術1
CMSI計算科学技術特論A(8) 高速化チューニングとその関連技術1
 
LTspiceを活用した昇圧回路のトポロジーシミュレーション
LTspiceを活用した昇圧回路のトポロジーシミュレーションLTspiceを活用した昇圧回路のトポロジーシミュレーション
LTspiceを活用した昇圧回路のトポロジーシミュレーション
 
ストリーム処理とSensorBee
ストリーム処理とSensorBeeストリーム処理とSensorBee
ストリーム処理とSensorBee
 

Recently uploaded

モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)Hiroshi Tomioka
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NTT DATA Technology & Innovation
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 

Recently uploaded (9)

モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 

ppOpen-HPCコードを自動チューニングする言語ppOpen-ATの現状と新展開