SlideShare a Scribd company logo
1 of 24
Download to read offline
ACRi HLSチャレンジ 高速化テクニック紹介
ACRiルーム副室長 / ザイリンクス株式会社
安藤 潤
©︎ 2021 Adaptive Computing Research Initiative - ACRi 1
第 6 回 ACRi ウェビナー:高位合成にチャレンジしよう
ACRi HLS チャレンジとは?
• お題に沿った回路を HLS(高位合成)で設計し、
性能を競います
• HLS の活用促進
• ザイリンクス FPGA 向けの無償 HLS ツールを使用
• C++だけでFPGAアクセラレータの開発ができる
• HLS を学んでみたい方の練習の場
• 高速な回路の設計技術を共有する場
• ACRi ルームを活用
©︎ 2021 Adaptive Computing Research Initiative - ACRi 2
Alveo x 4
Professors
ACRi Founders
ACRi ルーム – 遠隔(東工大)に設置されたFPGAを無料で利用できる環境
3
• Digilent社 Arty A7-35T カード
• 1サーバにArtyを15枚接続
• ユーザ毎にVMを割り当て
ルーム FPGA Server
• CPU: Core i9 (8 core /16 thread)
• メモリ: DDR4 128GB (32GB x 4)
• ストレージ: SSD M.2 1TB x2
• 開発環境インストール済み
Arty A7-35T
• 3時間単位で機材を無償で貸出し
• リモートからアクセスして利用するスタイル
• Forumを通じて大学教員やACRi企業が技術支援を実施
• Xilinxアクセラレータカード
• Alveo U50 / U200 / U250 / U280
• Vitisで利用可能
Alveo
Server x 7
Arty x 100
Server x 4
ACRi
参加企業
一般企業
学生
若手技術者
Start-up企業
技術力向上
テスト利用
技術力向上
のため
技術力向上
テスト利用
• ジーデップ・アドバンス社 Alveo
U200 搭載のFPGA入門モデル
• CPU; Core i9 (14 core / 28 thread)
FPGA StarterBOX
StarterBOX
x 1
HLS チャレンジの利用方法
©︎ 2021 Adaptive Computing Research Initiative - ACRi 4
HLS チャレンジ
お題を選択
ACRi ルーム
ログイン
提出
採点
結果
ユーザー
コーディング・
仮採点
採点サーバー ランキング
Vitis HLS
ツールサーバー
(as101, as102, as103, as104)
より詳しくは
• 詳しい利用方法は前回のウェビナー動画をご覧ください
©︎ 2021 Adaptive Computing Research Initiative - ACRi 5
https://www.youtube.com/watch?v=v9TfLoM7cIA
利用状況(2021/10/27時点)
• ユーザー数:70名
©︎ 2021 Adaptive Computing Research Initiative - ACRi 6
17
33
43
46
52
56
63
66
69 70
12
16
10
3 6 4 7 3 3 1
2021-08-23 2021-08-30 2021-09-06 2021-09-13 2021-09-20 2021-09-27 2021-10-04 2021-10-11 2021-10-18 2021-10-25
週毎のユーザー数
ユーザー数 新規登録数
利用状況(2021/10/27時点)
• 提出数:631件
©︎ 2021 Adaptive Computing Research Initiative - ACRi 7
5 64
112
219
299
323
348
465
593
631
5 59 48
107
80
24 25
117 128
38
2021-08-23 2021-08-30 2021-09-06 2021-09-13 2021-09-20 2021-09-27 2021-10-04 2021-10-11 2021-10-18 2021-10-25
週毎の提出数
累計投稿数 週の投稿数
利用状況(2021/10/27時点)
• チャレンジごとの提出数
©︎ 2021 Adaptive Computing Research Initiative - ACRi 8
19 25
2
110
10 12 15 11 14
36
12
19
68
96
24
0
10
1
31
7
11 3
0
4
5
4
3
29
41
9
Pass Fail
① 141件
③ 97件
② 137件
人気チャレンジ bai-gaeshi
• 投稿数:141件
• 配列の値を倍にして
返すシンプルなお題
©︎ 2021 Adaptive Computing Research Initiative - ACRi 9
bai-gaeshi の解答例
• 素直なソフトウェア実装
• 採点結果
• 動作周波数:599.9 MHz
• サイクル数:1219 cycles
• タイム:2032.073 ns
©︎ 2021 Adaptive Computing Research Initiative - ACRi 10
bai-gaeshi のランキング
©︎ 2021 Adaptive Computing Research Initiative - ACRi 11
68.6
219.6 242.0
399.6
550.3 607.7
1684.0
2032.1
2528.8
0
500
1,000
1,500
2,000
2,500
3,000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
タイム(ns)
ランキング
コードの記述方法によって36倍の差!
どのような高速化テクニックが使われているかご紹介します
採点の仕組み
©︎ 2021 Adaptive Computing Research Initiative - ACRi 12
テストベンチ
カーネル
(RTL)
in
size
out
カーネル
(C++)
② HLS ④ 論理合成
(オプション)
カーネル
(Netlist)
③ シミュレーション
① ソフト実行
周波数見積もり 周波数見積もり
クロックサイクル
タイム算出の仕組み
©︎ 2021 Adaptive Computing Research Initiative - ACRi 13
入力
計算
出力
時刻
開始 終了
レイテンシ
スループット-1
タイム = クロックサイクル / 動作周波数
クロック
タイムを短縮するには
・スループット向上
・レイテンシ削減
・動作周波数向上
スループットを向上するには
• 入出力と計算のバランスが取れていること
• 計算だけではなくインターフェースも重要
• インターフェースの帯域にマッチする演算器を作る
©︎ 2021 Adaptive Computing Research Initiative - ACRi 14
計算
入力
計算
入力 出力 出力
計算がボトルネックに
入出力がボトルネックに
HLS プラグマ
ドキュメント:https://japan.xilinx.com/html_docs/xilinx2021_1/vitis_doc/hls_pragmas.html#okr1504034364623
• どのような回路にしたいかツールに伝える手段
• 例:#pragma HLS PIPELINE
©︎ 2021 Adaptive Computing Research Initiative - ACRi 15
ACRi ブログ:高位合成で加速するアクセラレータ開発 (2) ~ 高位合成と C ベース設計 1章 より
高速化テクニック①
インターフェースのデータ幅を増やす
• bai-gaeshi の入出力は float 型(32ビット)の配列
• 引数の型は変更できない
• そのままでは32ビット幅のインターフェースを持つ回路になる
©︎ 2021 Adaptive Computing Research Initiative - ACRi 16
void kernel(const float in[1024], float out[1024], int size) {
for (int i=0; i<size; i++) {
#pragma HLS PIPELINE
out[i] = in[i] * 2;
}
}
高速化テクニック①
インターフェースのデータ幅を増やす
• ツールによる推論を利用する
• まとまった単位で配列にアクセスすると、ツールが自動的に
インターフェースの幅を拡張する(512bitまで、条件あり)
©︎ 2021 Adaptive Computing Research Initiative - ACRi 17
void kernel(const float in[1024], float out[1024], int size) {
// 16の倍数に切り上げ
size = (size + 15) / 16 * 16;
for (int i=0; i<size; i++) {
#pragma HLS PIPELINE
#pragma HLS UNROLL factor=16
out[i] = in[i] * 2;
}
}
高速化テクニック①
インターフェースのデータ幅を増やす
• ツールによる推論を利用する(他の記述方法)
©︎ 2021 Adaptive Computing Research Initiative - ACRi 18
void kernel(const float in[1024], float out[1024], int size) {
for (int i=0; i<size; i++) {
#pragma HLS PIPELINE
#pragma HLS UNROLL factor=16 skip_exit_check
out[i] = in[i] * 2;
}
}
void kernel(const float in[1024], float out[1024], int size) {
const int chunk_size = 16;
const int num_chunk = (size + chunk_size - 1) / chunk_size;
for (int i=0; i<num_chunk; i++) {
#pragma HLS PIPELINE
float chunk[chunk_size];
// Input
for (int j=0; j<chunk_size; j++) {
chunk[j] = in[chunk_size * i + j];
}
// Calc
for (int j=0; j<chunk_size; j++) {
chunk[j] *= 2;
}
// Output
for (int j=0; j<chunk_size; j++) {
out[chunk_size * i + j] = chunk[j];
}
}
}
より明示的に記述 UNROLLプラグマのオプションを利用
高速化テクニック②
インターフェースを軽量化する
• 配列引数へのアクセスはデフォルトで
AXI-MMインターフェースになる(Vitis kernel flowのとき)
• 外部DRAMへのアクセスに相当するレイテンシが考慮される
©︎ 2021 Adaptive Computing Research Initiative - ACRi 19
FPGA
カーネル MC DRAM
リードコマンド
データ
AXI-MM
高速化テクニック②
インターフェースを軽量化する
• インターフェースをAXI-Sに変更する
• INTERFACEプラグマでインターフェースを指定
• ARRAY_PARTITIONプラグマでAXI-Sを並列化
©︎ 2021 Adaptive Computing Research Initiative - ACRi 20
void kernel(const float in[1024], float out[1024], int size) {
// インターフェースを指定するプラグマ
#pragma HLS INTERFACE mode=axis port=in
#pragma HLS INTERFACE mode=axis port=out
// 配列アクセスポートを並列化するプラグマ
#pragma HLS ARRAY_PARTITION variable=in type=cyclic factor=16 dim=1
#pragma HLS ARRAY_PARTITION variable=out type=cyclic factor=16 dim=1
for (int i=0; i<size; i++) {
#pragma HLS PIPELINE
#pragma HLS UNROLL factor=16
out[i] = in[i] * 2;
}
}
カーネル
AXI-S
AXI-S
AXI-S
AXI-S
AXI-S
AXI-S
AXI-S
AXI-S
AXI-S
AXI-S
…
…
高速化テクニック③
インターフェースへのアクセスを減らす
• 配列引数に繰り返しアクセスすると時間がかかる
• カーネル内に一時配列を作る(CPUのキャッシュに相当する役割)
©︎ 2021 Adaptive Computing Research Initiative - ACRi 21
FPGA
カーネル
MC DRAM
リードコマンド
データ
AXI-MM
キャッシュ
void kernel(const int in[1024], int out[1024]) {
// 一時配列
int tmp[1024];
// 入力
for (int i = 0; i < 1024; i++) { tmp[i] = in[i]; }
// バブルソート
for (int i = 0; i < 1024-1; i++) {
for (int j = 1024-1; j > i; j--) {
if (tmp[j] < tmp[j-1]) {
int t = tmp[j]; tmp[j] = tmp[j-1]; tmp[j-1] = t;
}
}
}
// 出力
for (int i = 0; i < 1024; i++) { out[i] = tmp[i]; }
}
高速化テクニック④
パイプラインのボトルネックを取り除く
• 浮動小数点数の累積演算がボトルネックに
• パイプラインの II(Initiation Interval)を 1 にできない状況
©︎ 2021 Adaptive Computing Research Initiative - ACRi 22
+
2サイクル(II=2)
float acc = 0;
for (int i = 0; i < 1024; i++) {
acc += in[i];
}
*out = acc;
float acc[2] = {};
for (int i = 0; i < 1024; i++) {
#pragma HLS UNROLL factor=2
acc[i % 2] += in[i];
}
*out = acc[0] + acc[1];
float acc = 0;
for (int i = 0; i < 1024; i += 2) {
acc += in[i] + in[i + 1];
}
*out = acc;
+
+
acc
in
+
+
+
acc[0]
acc[1]
in[i+0]
in[i+1]
in[i+0]
in[i+1]
acc
累積演算を並列化 足し合わせてから累積
さいごに
• 高速化テクニックをご紹介しました
1. インターフェースのデータ幅を増やす
2. インターフェースを軽量化する
3. インターフェースへのアクセスを減らす
4. パイプラインのボトルネックを取り除く
• 入門者の方へのアドバイス
• アーキテクチャを考えてコーディング
• ツールと対話しお気持ちを理解
• ぜひHLSにチャレンジしてみてください!
©︎ 2021 Adaptive Computing Research Initiative - ACRi 23
©︎ 2021 Adaptive Computing Research Initiative - ACRi 24

More Related Content

What's hot

組み込み関数(intrinsic)によるSIMD入門
組み込み関数(intrinsic)によるSIMD入門組み込み関数(intrinsic)によるSIMD入門
組み込み関数(intrinsic)によるSIMD入門Norishige Fukushima
 
PythonとPyCoRAMでお手軽にFPGAシステムを開発してみよう
PythonとPyCoRAMでお手軽にFPGAシステムを開発してみようPythonとPyCoRAMでお手軽にFPGAシステムを開発してみよう
PythonとPyCoRAMでお手軽にFPGAシステムを開発してみようShinya Takamaeda-Y
 
研究者のための Python による FPGA 入門
研究者のための Python による FPGA 入門研究者のための Python による FPGA 入門
研究者のための Python による FPGA 入門ryos36
 
Zynq mp勉強会資料
Zynq mp勉強会資料Zynq mp勉強会資料
Zynq mp勉強会資料一路 川染
 
Vivado hls勉強会3(axi4 lite slave)
Vivado hls勉強会3(axi4 lite slave)Vivado hls勉強会3(axi4 lite slave)
Vivado hls勉強会3(axi4 lite slave)marsee101
 
AIチップ戦国時代における深層学習モデルの推論の最適化と実用的な運用を可能にするソフトウェア技術について
AIチップ戦国時代における深層学習モデルの推論の最適化と実用的な運用を可能にするソフトウェア技術についてAIチップ戦国時代における深層学習モデルの推論の最適化と実用的な運用を可能にするソフトウェア技術について
AIチップ戦国時代における深層学習モデルの推論の最適化と実用的な運用を可能にするソフトウェア技術についてFixstars Corporation
 
「FPGA 開発入門:FPGA を用いたエッジ AI の高速化手法を学ぶ」
「FPGA 開発入門:FPGA を用いたエッジ AI の高速化手法を学ぶ」「FPGA 開発入門:FPGA を用いたエッジ AI の高速化手法を学ぶ」
「FPGA 開発入門:FPGA を用いたエッジ AI の高速化手法を学ぶ」直久 住川
 
TVMの次期グラフIR Relayの紹介
TVMの次期グラフIR Relayの紹介TVMの次期グラフIR Relayの紹介
TVMの次期グラフIR Relayの紹介Takeo Imai
 
CUDAのアセンブリ言語基礎のまとめ PTXとSASSの概説
CUDAのアセンブリ言語基礎のまとめ PTXとSASSの概説CUDAのアセンブリ言語基礎のまとめ PTXとSASSの概説
CUDAのアセンブリ言語基礎のまとめ PTXとSASSの概説Takateru Yamagishi
 
1076: CUDAデバッグ・プロファイリング入門
1076: CUDAデバッグ・プロファイリング入門1076: CUDAデバッグ・プロファイリング入門
1076: CUDAデバッグ・プロファイリング入門NVIDIA Japan
 
ZynqMPのブートとパワーマネージメント : (ZynqMP Boot and Power Management)
ZynqMPのブートとパワーマネージメント : (ZynqMP Boot and Power Management)ZynqMPのブートとパワーマネージメント : (ZynqMP Boot and Power Management)
ZynqMPのブートとパワーマネージメント : (ZynqMP Boot and Power Management)Mr. Vengineer
 
FPGAのトレンドをまとめてみた
FPGAのトレンドをまとめてみたFPGAのトレンドをまとめてみた
FPGAのトレンドをまとめてみたTakefumi MIYOSHI
 
CXL_説明_公開用.pdf
CXL_説明_公開用.pdfCXL_説明_公開用.pdf
CXL_説明_公開用.pdfYasunori Goto
 
Sw技術者に送るfpga入門
Sw技術者に送るfpga入門Sw技術者に送るfpga入門
Sw技術者に送るfpga入門直久 住川
 
ソフト高速化の専門家が教える!AI・IoTエッジデバイスの選び方
ソフト高速化の専門家が教える!AI・IoTエッジデバイスの選び方ソフト高速化の専門家が教える!AI・IoTエッジデバイスの選び方
ソフト高速化の専門家が教える!AI・IoTエッジデバイスの選び方Fixstars Corporation
 
CPU / GPU高速化セミナー!性能モデルの理論と実践:実践編
CPU / GPU高速化セミナー!性能モデルの理論と実践:実践編CPU / GPU高速化セミナー!性能モデルの理論と実践:実践編
CPU / GPU高速化セミナー!性能モデルの理論と実践:実践編Fixstars Corporation
 

What's hot (20)

組み込み関数(intrinsic)によるSIMD入門
組み込み関数(intrinsic)によるSIMD入門組み込み関数(intrinsic)によるSIMD入門
組み込み関数(intrinsic)によるSIMD入門
 
PythonとPyCoRAMでお手軽にFPGAシステムを開発してみよう
PythonとPyCoRAMでお手軽にFPGAシステムを開発してみようPythonとPyCoRAMでお手軽にFPGAシステムを開発してみよう
PythonとPyCoRAMでお手軽にFPGAシステムを開発してみよう
 
研究者のための Python による FPGA 入門
研究者のための Python による FPGA 入門研究者のための Python による FPGA 入門
研究者のための Python による FPGA 入門
 
Zynq mp勉強会資料
Zynq mp勉強会資料Zynq mp勉強会資料
Zynq mp勉強会資料
 
Vivado hls勉強会3(axi4 lite slave)
Vivado hls勉強会3(axi4 lite slave)Vivado hls勉強会3(axi4 lite slave)
Vivado hls勉強会3(axi4 lite slave)
 
AIチップ戦国時代における深層学習モデルの推論の最適化と実用的な運用を可能にするソフトウェア技術について
AIチップ戦国時代における深層学習モデルの推論の最適化と実用的な運用を可能にするソフトウェア技術についてAIチップ戦国時代における深層学習モデルの推論の最適化と実用的な運用を可能にするソフトウェア技術について
AIチップ戦国時代における深層学習モデルの推論の最適化と実用的な運用を可能にするソフトウェア技術について
 
プログラムを高速化する話
プログラムを高速化する話プログラムを高速化する話
プログラムを高速化する話
 
「FPGA 開発入門:FPGA を用いたエッジ AI の高速化手法を学ぶ」
「FPGA 開発入門:FPGA を用いたエッジ AI の高速化手法を学ぶ」「FPGA 開発入門:FPGA を用いたエッジ AI の高速化手法を学ぶ」
「FPGA 開発入門:FPGA を用いたエッジ AI の高速化手法を学ぶ」
 
TVMの次期グラフIR Relayの紹介
TVMの次期グラフIR Relayの紹介TVMの次期グラフIR Relayの紹介
TVMの次期グラフIR Relayの紹介
 
CUDAのアセンブリ言語基礎のまとめ PTXとSASSの概説
CUDAのアセンブリ言語基礎のまとめ PTXとSASSの概説CUDAのアセンブリ言語基礎のまとめ PTXとSASSの概説
CUDAのアセンブリ言語基礎のまとめ PTXとSASSの概説
 
1076: CUDAデバッグ・プロファイリング入門
1076: CUDAデバッグ・プロファイリング入門1076: CUDAデバッグ・プロファイリング入門
1076: CUDAデバッグ・プロファイリング入門
 
ZynqMPのブートとパワーマネージメント : (ZynqMP Boot and Power Management)
ZynqMPのブートとパワーマネージメント : (ZynqMP Boot and Power Management)ZynqMPのブートとパワーマネージメント : (ZynqMP Boot and Power Management)
ZynqMPのブートとパワーマネージメント : (ZynqMP Boot and Power Management)
 
Gpu vs fpga
Gpu vs fpgaGpu vs fpga
Gpu vs fpga
 
TVM の紹介
TVM の紹介TVM の紹介
TVM の紹介
 
私とOSSの25年
私とOSSの25年私とOSSの25年
私とOSSの25年
 
FPGAのトレンドをまとめてみた
FPGAのトレンドをまとめてみたFPGAのトレンドをまとめてみた
FPGAのトレンドをまとめてみた
 
CXL_説明_公開用.pdf
CXL_説明_公開用.pdfCXL_説明_公開用.pdf
CXL_説明_公開用.pdf
 
Sw技術者に送るfpga入門
Sw技術者に送るfpga入門Sw技術者に送るfpga入門
Sw技術者に送るfpga入門
 
ソフト高速化の専門家が教える!AI・IoTエッジデバイスの選び方
ソフト高速化の専門家が教える!AI・IoTエッジデバイスの選び方ソフト高速化の専門家が教える!AI・IoTエッジデバイスの選び方
ソフト高速化の専門家が教える!AI・IoTエッジデバイスの選び方
 
CPU / GPU高速化セミナー!性能モデルの理論と実践:実践編
CPU / GPU高速化セミナー!性能モデルの理論と実践:実践編CPU / GPU高速化セミナー!性能モデルの理論と実践:実践編
CPU / GPU高速化セミナー!性能モデルの理論と実践:実践編
 

Similar to ACRi HLSチャレンジ 高速化テクニック紹介

ACRiルーム副室長_安藤様_講演資料
ACRiルーム副室長_安藤様_講演資料ACRiルーム副室長_安藤様_講演資料
ACRiルーム副室長_安藤様_講演資料直久 住川
 
PyCoRAMを用いたグラフ処理FPGAアクセラレータ
PyCoRAMを用いたグラフ処理FPGAアクセラレータPyCoRAMを用いたグラフ処理FPGAアクセラレータ
PyCoRAMを用いたグラフ処理FPGAアクセラレータShinya Takamaeda-Y
 
Struggle against crossdomain data complexity in Recruit Group
Struggle against crossdomain data complexity in Recruit GroupStruggle against crossdomain data complexity in Recruit Group
Struggle against crossdomain data complexity in Recruit GroupDataWorks Summit/Hadoop Summit
 
Atc15_reading_networking_session
Atc15_reading_networking_sessionAtc15_reading_networking_session
Atc15_reading_networking_session紘也 金子
 
ONIC2017 プログラマブル・データプレーン時代に向けた ネットワーク・オペレーションスタック
ONIC2017 プログラマブル・データプレーン時代に向けた ネットワーク・オペレーションスタックONIC2017 プログラマブル・データプレーン時代に向けた ネットワーク・オペレーションスタック
ONIC2017 プログラマブル・データプレーン時代に向けた ネットワーク・オペレーションスタックKentaro Ebisawa
 
Struggle against cross-domain data complexity in Recruit group
Struggle against cross-domain data complexity in Recruit groupStruggle against cross-domain data complexity in Recruit group
Struggle against cross-domain data complexity in Recruit groupRecruit Technologies
 
ソフトウェア志向の組込みシステム協調設計環境
ソフトウェア志向の組込みシステム協調設計環境ソフトウェア志向の組込みシステム協調設計環境
ソフトウェア志向の組込みシステム協調設計環境Hideki Takase
 
ACRiウェビナー:岩渕様ご講演資料
ACRiウェビナー:岩渕様ご講演資料ACRiウェビナー:岩渕様ご講演資料
ACRiウェビナー:岩渕様ご講演資料直久 住川
 
レコメンドバッチ高速化に向けたSpark/MapReduceの機械学習ライブラリ比較検証
レコメンドバッチ高速化に向けたSpark/MapReduceの機械学習ライブラリ比較検証レコメンドバッチ高速化に向けたSpark/MapReduceの機械学習ライブラリ比較検証
レコメンドバッチ高速化に向けたSpark/MapReduceの機械学習ライブラリ比較検証Recruit Technologies
 
Spark/MapReduceの 機械学習ライブラリ比較検証
Spark/MapReduceの 機械学習ライブラリ比較検証Spark/MapReduceの 機械学習ライブラリ比較検証
Spark/MapReduceの 機械学習ライブラリ比較検証Recruit Technologies
 
メモリ抽象化フレームワークPyCoRAMを用いたソフトプロセッサ混載FPGAアクセラレータの開発
メモリ抽象化フレームワークPyCoRAMを用いたソフトプロセッサ混載FPGAアクセラレータの開発メモリ抽象化フレームワークPyCoRAMを用いたソフトプロセッサ混載FPGAアクセラレータの開発
メモリ抽象化フレームワークPyCoRAMを用いたソフトプロセッサ混載FPGAアクセラレータの開発Shinya Takamaeda-Y
 
さくらのDockerコンテナホスティング-Arukasの解説とインフラを支える技術(July Tech Festa 2016 『IoTxAIxインフラ時代...
さくらのDockerコンテナホスティング-Arukasの解説とインフラを支える技術(July Tech Festa 2016 『IoTxAIxインフラ時代...さくらのDockerコンテナホスティング-Arukasの解説とインフラを支える技術(July Tech Festa 2016 『IoTxAIxインフラ時代...
さくらのDockerコンテナホスティング-Arukasの解説とインフラを支える技術(July Tech Festa 2016 『IoTxAIxインフラ時代...さくらインターネット株式会社
 
Deep Dive into Spark SQL with Advanced Performance Tuning
Deep Dive into Spark SQL with Advanced Performance TuningDeep Dive into Spark SQL with Advanced Performance Tuning
Deep Dive into Spark SQL with Advanced Performance TuningTakuya UESHIN
 
Open capi meetup20180409 (revised)
Open capi meetup20180409 (revised)Open capi meetup20180409 (revised)
Open capi meetup20180409 (revised)Yutaka Kawai
 
ACRi_webinar_20220118_miyo
ACRi_webinar_20220118_miyoACRi_webinar_20220118_miyo
ACRi_webinar_20220118_miyoTakefumi MIYOSHI
 
第11回ACRiウェビナー_東工大/坂本先生ご講演資料
第11回ACRiウェビナー_東工大/坂本先生ご講演資料第11回ACRiウェビナー_東工大/坂本先生ご講演資料
第11回ACRiウェビナー_東工大/坂本先生ご講演資料直久 住川
 
研究用途でのAWSの利用事例と機械学習について
研究用途でのAWSの利用事例と機械学習について研究用途でのAWSの利用事例と機械学習について
研究用途でのAWSの利用事例と機械学習についてYasuhiro Matsuo
 

Similar to ACRi HLSチャレンジ 高速化テクニック紹介 (20)

ACRiルーム副室長_安藤様_講演資料
ACRiルーム副室長_安藤様_講演資料ACRiルーム副室長_安藤様_講演資料
ACRiルーム副室長_安藤様_講演資料
 
PyCoRAMを用いたグラフ処理FPGAアクセラレータ
PyCoRAMを用いたグラフ処理FPGAアクセラレータPyCoRAMを用いたグラフ処理FPGAアクセラレータ
PyCoRAMを用いたグラフ処理FPGAアクセラレータ
 
Struggle against crossdomain data complexity in Recruit Group
Struggle against crossdomain data complexity in Recruit GroupStruggle against crossdomain data complexity in Recruit Group
Struggle against crossdomain data complexity in Recruit Group
 
Atc15_reading_networking_session
Atc15_reading_networking_sessionAtc15_reading_networking_session
Atc15_reading_networking_session
 
ONIC2017 プログラマブル・データプレーン時代に向けた ネットワーク・オペレーションスタック
ONIC2017 プログラマブル・データプレーン時代に向けた ネットワーク・オペレーションスタックONIC2017 プログラマブル・データプレーン時代に向けた ネットワーク・オペレーションスタック
ONIC2017 プログラマブル・データプレーン時代に向けた ネットワーク・オペレーションスタック
 
Struggle against cross-domain data complexity in Recruit group
Struggle against cross-domain data complexity in Recruit groupStruggle against cross-domain data complexity in Recruit group
Struggle against cross-domain data complexity in Recruit group
 
DAS_202109
DAS_202109DAS_202109
DAS_202109
 
ICD/CPSY 201412
ICD/CPSY 201412ICD/CPSY 201412
ICD/CPSY 201412
 
ソフトウェア志向の組込みシステム協調設計環境
ソフトウェア志向の組込みシステム協調設計環境ソフトウェア志向の組込みシステム協調設計環境
ソフトウェア志向の組込みシステム協調設計環境
 
ACRiウェビナー:岩渕様ご講演資料
ACRiウェビナー:岩渕様ご講演資料ACRiウェビナー:岩渕様ご講演資料
ACRiウェビナー:岩渕様ご講演資料
 
レコメンドバッチ高速化に向けたSpark/MapReduceの機械学習ライブラリ比較検証
レコメンドバッチ高速化に向けたSpark/MapReduceの機械学習ライブラリ比較検証レコメンドバッチ高速化に向けたSpark/MapReduceの機械学習ライブラリ比較検証
レコメンドバッチ高速化に向けたSpark/MapReduceの機械学習ライブラリ比較検証
 
Spark/MapReduceの 機械学習ライブラリ比較検証
Spark/MapReduceの 機械学習ライブラリ比較検証Spark/MapReduceの 機械学習ライブラリ比較検証
Spark/MapReduceの 機械学習ライブラリ比較検証
 
メモリ抽象化フレームワークPyCoRAMを用いたソフトプロセッサ混載FPGAアクセラレータの開発
メモリ抽象化フレームワークPyCoRAMを用いたソフトプロセッサ混載FPGAアクセラレータの開発メモリ抽象化フレームワークPyCoRAMを用いたソフトプロセッサ混載FPGAアクセラレータの開発
メモリ抽象化フレームワークPyCoRAMを用いたソフトプロセッサ混載FPGAアクセラレータの開発
 
さくらのDockerコンテナホスティング-Arukasの解説とインフラを支える技術(July Tech Festa 2016 『IoTxAIxインフラ時代...
さくらのDockerコンテナホスティング-Arukasの解説とインフラを支える技術(July Tech Festa 2016 『IoTxAIxインフラ時代...さくらのDockerコンテナホスティング-Arukasの解説とインフラを支える技術(July Tech Festa 2016 『IoTxAIxインフラ時代...
さくらのDockerコンテナホスティング-Arukasの解説とインフラを支える技術(July Tech Festa 2016 『IoTxAIxインフラ時代...
 
IEEE/ACM SC2013報告
IEEE/ACM SC2013報告IEEE/ACM SC2013報告
IEEE/ACM SC2013報告
 
Deep Dive into Spark SQL with Advanced Performance Tuning
Deep Dive into Spark SQL with Advanced Performance TuningDeep Dive into Spark SQL with Advanced Performance Tuning
Deep Dive into Spark SQL with Advanced Performance Tuning
 
Open capi meetup20180409 (revised)
Open capi meetup20180409 (revised)Open capi meetup20180409 (revised)
Open capi meetup20180409 (revised)
 
ACRi_webinar_20220118_miyo
ACRi_webinar_20220118_miyoACRi_webinar_20220118_miyo
ACRi_webinar_20220118_miyo
 
第11回ACRiウェビナー_東工大/坂本先生ご講演資料
第11回ACRiウェビナー_東工大/坂本先生ご講演資料第11回ACRiウェビナー_東工大/坂本先生ご講演資料
第11回ACRiウェビナー_東工大/坂本先生ご講演資料
 
研究用途でのAWSの利用事例と機械学習について
研究用途でのAWSの利用事例と機械学習について研究用途でのAWSの利用事例と機械学習について
研究用途でのAWSの利用事例と機械学習について
 

Recently uploaded

[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。iPride Co., Ltd.
 
20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directoryosamut
 
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptxIoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptxAtomu Hidaka
 
UPWARD_share_company_information_20240415.pdf
UPWARD_share_company_information_20240415.pdfUPWARD_share_company_information_20240415.pdf
UPWARD_share_company_information_20240415.pdffurutsuka
 
PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000Shota Ito
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Danieldanielhu54
 
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
新人研修のまとめ       2024/04/12の勉強会で発表されたものです。新人研修のまとめ       2024/04/12の勉強会で発表されたものです。
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。iPride Co., Ltd.
 

Recently uploaded (9)

[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
 
20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory
 
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptxIoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
 
UPWARD_share_company_information_20240415.pdf
UPWARD_share_company_information_20240415.pdfUPWARD_share_company_information_20240415.pdf
UPWARD_share_company_information_20240415.pdf
 
PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
 
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
新人研修のまとめ       2024/04/12の勉強会で発表されたものです。新人研修のまとめ       2024/04/12の勉強会で発表されたものです。
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
 

ACRi HLSチャレンジ 高速化テクニック紹介