SlideShare a Scribd company logo
1 of 18
Download to read offline
FPGAを用いたフルパイプラインによる
バイラテラルフィルタの高速化手法
東京大学 大学院情報理工学系研究科
コンピュータ科学専攻
橋本 信歩・高前田 伸也
2021/06/09
リコンフィギャラブルシステム研究会 (RECONF)
本研究の概要
❖バイラテラルグリッドの改良手法を提案
Ø バイラテラルグリッドはバイラテラルフィルタを高速化する手法
Ø アルゴリズムレベルでの貢献
❖フルパイプラインによりバイラテラルグリッドの小規模で高速な
FPGA 実装を提案
Ø ハードウェアレベルでの貢献
❖提案手法の速度・回路規模を実機で評価
2021/6/29 1
バイラテラルフィルタの特徴
❖エッジを保持したまま平滑化ができる
❖応用範囲が広い
Ø ノイズ除去
Ø テクスチャ編集
Ø トーン制御
Ø デモザイク
Ø オプティカルフロー推定
2021/6/29 2
フィルタ前 フィルタ後
バイラテラルフィルタの定義
❖十分に高速とは言い難い
2021/6/29 3
C. Tomasi and R. Manduchi, “Bilateral filtering for gray and color images,” ICCV, 1998
空間カーネル 色カーネル
正規化項
空間的にも色的にも
近い画素に大きな重みがつく
計算上の問題点
❖ウィンドウ半径 𝑟 に応じて演算回数・回路規模が増大する
Ø 計算量はピクセルごとに 𝑂 𝑟!
❖非線形なフィルタなので次元ごとに分割できない
➜画素数が多く,ウィンドウ半径が大きくなりやすい大規模高解像
度画像のリアルタイム処理を小規模な回路で行うのは難しい
2021/6/29 4
高解像度 低解像度
本研究での取り組み
❖大規模高解像度画像であっても,小規模な回路で高速に動作する
バイラテラルフィルタの実現
Ø 回路規模がウィンドウ半径に応じて増加しない
l バイラテラルグリッドという手法を応用することによって達成
Ø 高スループット・低遅延
l II = 1 のパイプライン化,入力の逐次的処理によって達成
2021/6/29 5
II (Initiation Interval):
ある入力を処理し始めてから
次の入力を処理し始めるまでのクロック数
ある画素の処理
次の画素の処理
時間
II
バイラテラルグリッド
1. 画像を空間方向と輝度方向に離散化してグリッドに格納
2. グリッド上でフィルタリング
3. 補間することで元の座標での処理後の値を計算
2021/6/29 6
J Chen, S Paris, and F Durand, “Real-time edge-aware image processing with the bilateral grid,” ACM Trans. Graph., 2007
バイラテラルグリッドの改良
❖グリッド上でのウィンドウ半径のみ変化させることが可能
Ø 三次元なので,ウィンドウ半径を増加させたときの回路規模の増大が大
きい
Ø バイラテラルフィルタの出力と関連づけるのが難しい
❖元の画像上でのウィンドウ半径を変化させたい
Ø 𝒓 × 𝒓 の正方形を塊として見る
Ø グリッド上のウィンドウ半径を 1 に固定する
2021/6/29 7
既存手法 提案手法
元画像上の半径 考慮していない 可変
グリッド上の半径 可変 1 に固定
提案手法のアルゴリズム
1. グリッド生成: 入力画像をグリッド上に射影
Ø 入力画素ごとに実行
2. ガウシアンフィルタ: グリッド上でのガウシアンフィルタ
Ø グリッドの要素ごとに実行
3. 三次元線形補間: 入力画像の輝度値を元に三次元線形補間
Ø 入力画素ごとに実行
➜逐次的に行うと遅いので,これらのループを結合する
2021/6/29 8
提案アクセラレータアーキテクチャ
2021/6/29 9
バイラテラル
グリッドを用いた
バイラテラル
フィルタを
実装した例はない
ループの結合
❖2.5 𝑟 行分程度の遅延で 𝑟 行の入力に対して 𝑟 行の出力が得られる
2021/6/29 10
特に青色の部分に注目
同じ色で塗られた部分が順に完成する
※各色は画像の色を表すのではなく,
説明のために色分けを行っただけである
フルパイプライン化
❖色同士をパイプライン化
Ø マクロパイプライン
❖色ごとにパイプライン化
Ø マイクロパイプライン
2021/6/29 11
提案手法の最適化
❖グリッド生成では同じ要素に射影されることがあるため,Read-
Modify-Write 処理になる (各水色は同じ要素に射影)
Ø II = 1 では実現できない
❖y 軸方向には連続して 𝑟 回のアクセスがある (赤色) ことを利用
❖1.5~2倍程度の高速化
2021/6/29 12
各要素への
アクセスパターン
入力画像
実験
❖提案手法を ZCU 104 ボードに実装
❖使用したツール等
Ø Vivado HLS 2019.2
l 高位合成を行い,Verilog のコード等を生成
Ø Vivado 2019.2
l ビットストリームを生成
Ø PYNQ v2.6
l ボードとのデータのやりとり等を支援
2021/6/29 13
ZCU 104 ボード
(組み込みシステムで使える
程度の小規模な FPGA)
ノイズ除去性能
2021/6/29 14
元の画像 標準偏差30のガウシアンノイズをのせた画像
バイラテラルフィルタで処理後 バイラテラルグリッドで処理後
回路規模・速度とウィンドウ半径の比較
2021/6/29 15
ウィンドウ半径を
大きくしても各指
標に大きな変化は
見られない
ウィンドウ半径と回路規模・速度の関係
提案手法とGPU実装・既存手法の比較
❖回路規模を抑えつつ,
大きな画像・大きな
ウィンドウ半径で実際
に高速に処理可能
Ø 速度に関しては GPU
A100 PCIe よりも高速
2021/6/29 16
(2) A. Gabiger-Rose, M. Kube, R. Weigel, and R. Rose, “An
FPGA-based fully synchronized design of a bilateral filter
for real-time image denoising,” Transactions on Industrial
Electronics, 2014
(3) S. D. Dabhade, G. N. Rathna, and K. N. Chaudhury, “A
reconfigurable and scalable FPGA architecture for bilateral
filtering,” Transactions on Industrial Electronics, 2018 提案手法,既存手法における回路規模・速度の関係
まとめ
❖入力画像のウィンドウ半径が可変になるようにバイラテラルグ
リッドを拡張した
❖ハードウェア資源の増加を抑えられるように完全にパイプライン
化された FPGA 実装を提案した
❖提案手法を実際に FPGA 上に実装し,計算速度とハードウェア資
源の観点から他の既存手法を上回る性能を達成した
❖FPGA 系のトップ会議 FPL でも発表予定 (2021/08/30-09/03)
2021/6/29 17

More Related Content

Similar to FPGAを用いたフルパイプラインによるバイラテラルフィルタの高速化手法

High throughput implementations of cryptography algorithms on GPU and FPGA
High throughput implementations of cryptography  algorithms on GPU and FPGAHigh throughput implementations of cryptography  algorithms on GPU and FPGA
High throughput implementations of cryptography algorithms on GPU and FPGA
nitin3940
 
Achieve High-Performance with Optimizing Device Specifications in FPGA Design
Achieve High-Performance with Optimizing Device Specifications in FPGA DesignAchieve High-Performance with Optimizing Device Specifications in FPGA Design
Achieve High-Performance with Optimizing Device Specifications in FPGA Design
Logic Fruit Technologies
 
routing Protocols and Virtual private network
routing Protocols and Virtual private networkrouting Protocols and Virtual private network
routing Protocols and Virtual private network
hayenas
 

Similar to FPGAを用いたフルパイプラインによるバイラテラルフィルタの高速化手法 (20)

FPGA IMPLEMENTATION OF PRIORITYARBITER BASED ROUTER DESIGN FOR NOC SYSTEMS
FPGA IMPLEMENTATION OF PRIORITYARBITER BASED ROUTER DESIGN FOR NOC SYSTEMSFPGA IMPLEMENTATION OF PRIORITYARBITER BASED ROUTER DESIGN FOR NOC SYSTEMS
FPGA IMPLEMENTATION OF PRIORITYARBITER BASED ROUTER DESIGN FOR NOC SYSTEMS
 
FPGA IMPLEMENTATION OF PRIORITYARBITER BASED ROUTER DESIGN FOR NOC SYSTEMS
FPGA IMPLEMENTATION OF PRIORITYARBITER BASED ROUTER DESIGN FOR NOC SYSTEMSFPGA IMPLEMENTATION OF PRIORITYARBITER BASED ROUTER DESIGN FOR NOC SYSTEMS
FPGA IMPLEMENTATION OF PRIORITYARBITER BASED ROUTER DESIGN FOR NOC SYSTEMS
 
2013 06-ohkawa-heart-presen
2013 06-ohkawa-heart-presen2013 06-ohkawa-heart-presen
2013 06-ohkawa-heart-presen
 
Capture gigabytes from FPGA at speed
Capture gigabytes from FPGA at speedCapture gigabytes from FPGA at speed
Capture gigabytes from FPGA at speed
 
Power efficient and high throughput of fir filter using block least mean squa...
Power efficient and high throughput of fir filter using block least mean squa...Power efficient and high throughput of fir filter using block least mean squa...
Power efficient and high throughput of fir filter using block least mean squa...
 
Ijecet 06 08_003
Ijecet 06 08_003Ijecet 06 08_003
Ijecet 06 08_003
 
Ijecet 06 08_003
Ijecet 06 08_003Ijecet 06 08_003
Ijecet 06 08_003
 
High throughput implementations of cryptography algorithms on GPU and FPGA
High throughput implementations of cryptography  algorithms on GPU and FPGAHigh throughput implementations of cryptography  algorithms on GPU and FPGA
High throughput implementations of cryptography algorithms on GPU and FPGA
 
shang2017.pdf
shang2017.pdfshang2017.pdf
shang2017.pdf
 
RBADT: An RQA Based BGP Anomaly Detection Tool
RBADT: An RQA Based BGP Anomaly Detection ToolRBADT: An RQA Based BGP Anomaly Detection Tool
RBADT: An RQA Based BGP Anomaly Detection Tool
 
Hai Tao at AI Frontiers: Deep Learning For Embedded Vision System
Hai Tao at AI Frontiers: Deep Learning For Embedded Vision SystemHai Tao at AI Frontiers: Deep Learning For Embedded Vision System
Hai Tao at AI Frontiers: Deep Learning For Embedded Vision System
 
ENRZ Advanced Modulation for Low Latency Applications
ENRZ Advanced Modulation for Low Latency ApplicationsENRZ Advanced Modulation for Low Latency Applications
ENRZ Advanced Modulation for Low Latency Applications
 
Heterogeneous cloud framework for big data genome sequencing
Heterogeneous cloud framework for big data genome sequencingHeterogeneous cloud framework for big data genome sequencing
Heterogeneous cloud framework for big data genome sequencing
 
Achieve High-Performance with Optimizing Device Specifications in FPGA Design
Achieve High-Performance with Optimizing Device Specifications in FPGA DesignAchieve High-Performance with Optimizing Device Specifications in FPGA Design
Achieve High-Performance with Optimizing Device Specifications in FPGA Design
 
Fault Tolerance
Fault ToleranceFault Tolerance
Fault Tolerance
 
1
11
1
 
Jg3515961599
Jg3515961599Jg3515961599
Jg3515961599
 
transforming-wireless-system-design-with-matlab-and-ni.pdf
transforming-wireless-system-design-with-matlab-and-ni.pdftransforming-wireless-system-design-with-matlab-and-ni.pdf
transforming-wireless-system-design-with-matlab-and-ni.pdf
 
High-Performance Low-Energy Implementation of Cryptographic Algorithms on a P...
High-Performance Low-Energy Implementation of Cryptographic Algorithms on a P...High-Performance Low-Energy Implementation of Cryptographic Algorithms on a P...
High-Performance Low-Energy Implementation of Cryptographic Algorithms on a P...
 
routing Protocols and Virtual private network
routing Protocols and Virtual private networkrouting Protocols and Virtual private network
routing Protocols and Virtual private network
 

Recently uploaded

Easier, Faster, and More Powerful – Alles Neu macht der Mai -Wir durchleuchte...
Easier, Faster, and More Powerful – Alles Neu macht der Mai -Wir durchleuchte...Easier, Faster, and More Powerful – Alles Neu macht der Mai -Wir durchleuchte...
Easier, Faster, and More Powerful – Alles Neu macht der Mai -Wir durchleuchte...
panagenda
 
Tales from a Passkey Provider Progress from Awareness to Implementation.pptx
Tales from a Passkey Provider  Progress from Awareness to Implementation.pptxTales from a Passkey Provider  Progress from Awareness to Implementation.pptx
Tales from a Passkey Provider Progress from Awareness to Implementation.pptx
FIDO Alliance
 

Recently uploaded (20)

WebAssembly is Key to Better LLM Performance
WebAssembly is Key to Better LLM PerformanceWebAssembly is Key to Better LLM Performance
WebAssembly is Key to Better LLM Performance
 
Working together SRE & Platform Engineering
Working together SRE & Platform EngineeringWorking together SRE & Platform Engineering
Working together SRE & Platform Engineering
 
Event-Driven Architecture Masterclass: Integrating Distributed Data Stores Ac...
Event-Driven Architecture Masterclass: Integrating Distributed Data Stores Ac...Event-Driven Architecture Masterclass: Integrating Distributed Data Stores Ac...
Event-Driven Architecture Masterclass: Integrating Distributed Data Stores Ac...
 
The Metaverse: Are We There Yet?
The  Metaverse:    Are   We  There  Yet?The  Metaverse:    Are   We  There  Yet?
The Metaverse: Are We There Yet?
 
Easier, Faster, and More Powerful – Alles Neu macht der Mai -Wir durchleuchte...
Easier, Faster, and More Powerful – Alles Neu macht der Mai -Wir durchleuchte...Easier, Faster, and More Powerful – Alles Neu macht der Mai -Wir durchleuchte...
Easier, Faster, and More Powerful – Alles Neu macht der Mai -Wir durchleuchte...
 
Introduction to FIDO Authentication and Passkeys.pptx
Introduction to FIDO Authentication and Passkeys.pptxIntroduction to FIDO Authentication and Passkeys.pptx
Introduction to FIDO Authentication and Passkeys.pptx
 
How we scaled to 80K users by doing nothing!.pdf
How we scaled to 80K users by doing nothing!.pdfHow we scaled to 80K users by doing nothing!.pdf
How we scaled to 80K users by doing nothing!.pdf
 
Tales from a Passkey Provider Progress from Awareness to Implementation.pptx
Tales from a Passkey Provider  Progress from Awareness to Implementation.pptxTales from a Passkey Provider  Progress from Awareness to Implementation.pptx
Tales from a Passkey Provider Progress from Awareness to Implementation.pptx
 
Intro to Passkeys and the State of Passwordless.pptx
Intro to Passkeys and the State of Passwordless.pptxIntro to Passkeys and the State of Passwordless.pptx
Intro to Passkeys and the State of Passwordless.pptx
 
TopCryptoSupers 12thReport OrionX May2024
TopCryptoSupers 12thReport OrionX May2024TopCryptoSupers 12thReport OrionX May2024
TopCryptoSupers 12thReport OrionX May2024
 
2024 May Patch Tuesday
2024 May Patch Tuesday2024 May Patch Tuesday
2024 May Patch Tuesday
 
Human Expert Website Manual WCAG 2.0 2.1 2.2 Audit - Digital Accessibility Au...
Human Expert Website Manual WCAG 2.0 2.1 2.2 Audit - Digital Accessibility Au...Human Expert Website Manual WCAG 2.0 2.1 2.2 Audit - Digital Accessibility Au...
Human Expert Website Manual WCAG 2.0 2.1 2.2 Audit - Digital Accessibility Au...
 
Using IESVE for Room Loads Analysis - UK & Ireland
Using IESVE for Room Loads Analysis - UK & IrelandUsing IESVE for Room Loads Analysis - UK & Ireland
Using IESVE for Room Loads Analysis - UK & Ireland
 
Overview of Hyperledger Foundation
Overview of Hyperledger FoundationOverview of Hyperledger Foundation
Overview of Hyperledger Foundation
 
TEST BANK For, Information Technology Project Management 9th Edition Kathy Sc...
TEST BANK For, Information Technology Project Management 9th Edition Kathy Sc...TEST BANK For, Information Technology Project Management 9th Edition Kathy Sc...
TEST BANK For, Information Technology Project Management 9th Edition Kathy Sc...
 
AI mind or machine power point presentation
AI mind or machine power point presentationAI mind or machine power point presentation
AI mind or machine power point presentation
 
UiPath manufacturing technology benefits and AI overview
UiPath manufacturing technology benefits and AI overviewUiPath manufacturing technology benefits and AI overview
UiPath manufacturing technology benefits and AI overview
 
ERP Contender Series: Acumatica vs. Sage Intacct
ERP Contender Series: Acumatica vs. Sage IntacctERP Contender Series: Acumatica vs. Sage Intacct
ERP Contender Series: Acumatica vs. Sage Intacct
 
Extensible Python: Robustness through Addition - PyCon 2024
Extensible Python: Robustness through Addition - PyCon 2024Extensible Python: Robustness through Addition - PyCon 2024
Extensible Python: Robustness through Addition - PyCon 2024
 
1111 ChatGPT Prompts PDF Free Download - Prompts for ChatGPT
1111 ChatGPT Prompts PDF Free Download - Prompts for ChatGPT1111 ChatGPT Prompts PDF Free Download - Prompts for ChatGPT
1111 ChatGPT Prompts PDF Free Download - Prompts for ChatGPT
 

FPGAを用いたフルパイプラインによるバイラテラルフィルタの高速化手法