Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
marsee101
PDF, PPTX
3,406 views
SDSoC勉強会_170128_スライド「SDx 2016.3のプラグマによるハードウェアと性能」
SDSoC勉強会 2017年1月28日のスライドです。 タイトルは「SDx 2016.3のプラグマによるハードウェアと性能」です。
Technology
◦
Read more
4
Save
Share
Embed
Embed presentation
Download
Download as PDF, PPTX
1
/ 27
2
/ 27
3
/ 27
4
/ 27
5
/ 27
6
/ 27
7
/ 27
8
/ 27
9
/ 27
10
/ 27
11
/ 27
12
/ 27
13
/ 27
14
/ 27
15
/ 27
16
/ 27
17
/ 27
18
/ 27
19
/ 27
20
/ 27
21
/ 27
22
/ 27
23
/ 27
24
/ 27
25
/ 27
26
/ 27
27
/ 27
More Related Content
PPTX
ラプラシアンフィルタをZedBoardで実装(ソフトウェアからハードウェアにオフロード)
by
marsee101
PDF
Pynqでカメラ画像をリアルタイムfastx コーナー検出
by
marsee101
PDF
Vivado hlsのシミュレーションとhlsストリーム
by
marsee101
PDF
高位合成ツールVivado hlsのopen cv対応
by
marsee101
PDF
FPGAスタートアップ資料
by
marsee101
PDF
FPGAアクセラレータの作り方
by
Mr. Vengineer
PPTX
SDSoC でストリーム
by
ryos36
PDF
FPGA startup 第一回 LT
by
Yamato Kazuhiro
ラプラシアンフィルタをZedBoardで実装(ソフトウェアからハードウェアにオフロード)
by
marsee101
Pynqでカメラ画像をリアルタイムfastx コーナー検出
by
marsee101
Vivado hlsのシミュレーションとhlsストリーム
by
marsee101
高位合成ツールVivado hlsのopen cv対応
by
marsee101
FPGAスタートアップ資料
by
marsee101
FPGAアクセラレータの作り方
by
Mr. Vengineer
SDSoC でストリーム
by
ryos36
FPGA startup 第一回 LT
by
Yamato Kazuhiro
What's hot
PDF
Linux : PSCI
by
Mr. Vengineer
PPTX
研究者のための Python による FPGA 入門
by
ryos36
PDF
Vivado hls勉強会1(基礎編)
by
marsee101
PDF
Reconf 201506
by
Takefumi MIYOSHI
PDF
Xilinx SDSoC(2016.2)解体新書ソフトウェア編
by
Mr. Vengineer
PDF
Xilinx SDSoC(2016.3)解体新書ソフトウェア編
by
Mr. Vengineer
ODP
MPSoCのPLの性能について
by
marsee101
PDF
FPGAX6_hayashi
by
愛美 林
PDF
TensorFlow XLA : AOT編 チラ見版
by
Mr. Vengineer
PDF
Pynq祭り資料
by
一路 川染
PDF
Riscv+fpga200606
by
たけおか しょうぞう
PDF
FPGAによるHDMI to LVDS変換器
by
I_HaL
PDF
Zynq MPSoC勉強会 Codec編
by
Tetsuya Morizumi
PDF
ZynqMP勉強会
by
Hidemi Ishihara
ODP
NetBSD/Zynq
by
Kaz Nakamura
PDF
Ptt391
by
Takefumi MIYOSHI
PDF
SDSoC解体新書2016.2版ソフトウェア編 (チラ見) : Inside SDSoC v2016.2 (Software short edtion)
by
Mr. Vengineer
PDF
SDSoC 2016.3+yocto project
by
Hidemi Ishihara
PDF
PYNQ祭り
by
Mr. Vengineer
PDF
2017年のFPGA Community活動について
by
Mr. Vengineer
Linux : PSCI
by
Mr. Vengineer
研究者のための Python による FPGA 入門
by
ryos36
Vivado hls勉強会1(基礎編)
by
marsee101
Reconf 201506
by
Takefumi MIYOSHI
Xilinx SDSoC(2016.2)解体新書ソフトウェア編
by
Mr. Vengineer
Xilinx SDSoC(2016.3)解体新書ソフトウェア編
by
Mr. Vengineer
MPSoCのPLの性能について
by
marsee101
FPGAX6_hayashi
by
愛美 林
TensorFlow XLA : AOT編 チラ見版
by
Mr. Vengineer
Pynq祭り資料
by
一路 川染
Riscv+fpga200606
by
たけおか しょうぞう
FPGAによるHDMI to LVDS変換器
by
I_HaL
Zynq MPSoC勉強会 Codec編
by
Tetsuya Morizumi
ZynqMP勉強会
by
Hidemi Ishihara
NetBSD/Zynq
by
Kaz Nakamura
Ptt391
by
Takefumi MIYOSHI
SDSoC解体新書2016.2版ソフトウェア編 (チラ見) : Inside SDSoC v2016.2 (Software short edtion)
by
Mr. Vengineer
SDSoC 2016.3+yocto project
by
Hidemi Ishihara
PYNQ祭り
by
Mr. Vengineer
2017年のFPGA Community活動について
by
Mr. Vengineer
Similar to SDSoC勉強会_170128_スライド「SDx 2016.3のプラグマによるハードウェアと性能」
PDF
CPU / GPU高速化セミナー!性能モデルの理論と実践:実践編
by
Fixstars Corporation
PDF
ソフトウェア技術者から見たFPGAの魅力と可能性
by
Kenichiro MITSUDA
PDF
Fpga online seminar by fixstars (1st)
by
Fixstars Corporation
PDF
FPGA+SoC+Linux実践勉強会資料
by
一路 川染
PDF
FPGAのトレンドをまとめてみた
by
Takefumi MIYOSHI
PDF
OSC 2012 Hokkaido でのプレゼン資料
by
Shin-ya Koga
PDF
Tuning, etc.
by
Hiroshi Watanabe
PDF
Ultra96ボードでYOLOを高速化
by
Hiroyuki Okuhata
PPTX
Introduction about microsemi company FPGA and its RISC-V correspondence and s...
by
Takayasu Shibata
PDF
Halide, Darkroom - 並列化のためのソフトウェア・研究
by
Yuichi Yoshida
PPTX
Androidとfpgaを高速fifo通信させちゃう
by
ksk sue
PDF
Good Arm FPGA Board Ultra96 and Google AI YOLO
by
If_CQ
PPTX
Microsemi FPGA はいいぞ,FPGAの紹介とおさそい
by
Takayasu Shibata
PDF
Altera SDK for OpenCL解体新書 : ホストとデバイスの関係
by
Mr. Vengineer
PDF
High-speed Sorting using Portable FPGA Accelerator (IPSJ 77th National Conven...
by
Takuma Usui
PDF
IEICE technical report (RECONF), January 2015.
by
Takuma Usui
PPTX
Abstracts of FPGA2017 papers (Temporary Version)
by
Takefumi MIYOSHI
PDF
オープンハードセミナー
by
Kenichi Kurimoto
PDF
C base design methodology with s dx and xilinx ml
by
ssuser3a4b8c
PDF
Slide
by
Takefumi MIYOSHI
CPU / GPU高速化セミナー!性能モデルの理論と実践:実践編
by
Fixstars Corporation
ソフトウェア技術者から見たFPGAの魅力と可能性
by
Kenichiro MITSUDA
Fpga online seminar by fixstars (1st)
by
Fixstars Corporation
FPGA+SoC+Linux実践勉強会資料
by
一路 川染
FPGAのトレンドをまとめてみた
by
Takefumi MIYOSHI
OSC 2012 Hokkaido でのプレゼン資料
by
Shin-ya Koga
Tuning, etc.
by
Hiroshi Watanabe
Ultra96ボードでYOLOを高速化
by
Hiroyuki Okuhata
Introduction about microsemi company FPGA and its RISC-V correspondence and s...
by
Takayasu Shibata
Halide, Darkroom - 並列化のためのソフトウェア・研究
by
Yuichi Yoshida
Androidとfpgaを高速fifo通信させちゃう
by
ksk sue
Good Arm FPGA Board Ultra96 and Google AI YOLO
by
If_CQ
Microsemi FPGA はいいぞ,FPGAの紹介とおさそい
by
Takayasu Shibata
Altera SDK for OpenCL解体新書 : ホストとデバイスの関係
by
Mr. Vengineer
High-speed Sorting using Portable FPGA Accelerator (IPSJ 77th National Conven...
by
Takuma Usui
IEICE technical report (RECONF), January 2015.
by
Takuma Usui
Abstracts of FPGA2017 papers (Temporary Version)
by
Takefumi MIYOSHI
オープンハードセミナー
by
Kenichi Kurimoto
C base design methodology with s dx and xilinx ml
by
ssuser3a4b8c
Slide
by
Takefumi MIYOSHI
More from marsee101
PDF
Vivado hls勉強会4(axi4 master)
by
marsee101
PDF
Vivado hls勉強会3(axi4 lite slave)
by
marsee101
PDF
Vivado hls勉強会2(レジスタの挿入とpipelineディレクティブ)
by
marsee101
PDF
Vivado hls勉強会5(axi4 stream)
by
marsee101
PDF
「ゼロから作るDeep learning」の畳み込みニューラルネットワークのハードウェア化
by
marsee101
PDF
Fpgaでの非同期信号の扱い方とvivadoによるサポート(公開用)
by
marsee101
PDF
FPGAの部屋、slide share、xilinxツールのご紹介
by
marsee101
PDF
Ultra96 pmod expansion board
by
marsee101
PPTX
Ubuntuをインストールしたzyboボードにカメラを付けてopen cvで顔認識
by
marsee101
PDF
Camera input from_ultra_96's_slow_expansion_connector
by
marsee101
PDF
Robot car gabor_filter
by
marsee101
PDF
Fpga robot car
by
marsee101
Vivado hls勉強会4(axi4 master)
by
marsee101
Vivado hls勉強会3(axi4 lite slave)
by
marsee101
Vivado hls勉強会2(レジスタの挿入とpipelineディレクティブ)
by
marsee101
Vivado hls勉強会5(axi4 stream)
by
marsee101
「ゼロから作るDeep learning」の畳み込みニューラルネットワークのハードウェア化
by
marsee101
Fpgaでの非同期信号の扱い方とvivadoによるサポート(公開用)
by
marsee101
FPGAの部屋、slide share、xilinxツールのご紹介
by
marsee101
Ultra96 pmod expansion board
by
marsee101
Ubuntuをインストールしたzyboボードにカメラを付けてopen cvで顔認識
by
marsee101
Camera input from_ultra_96's_slow_expansion_connector
by
marsee101
Robot car gabor_filter
by
marsee101
Fpga robot car
by
marsee101
Recently uploaded
PDF
自転車ユーザ参加型路面画像センシングによる点字ブロック検出における性能向上方法の模索 (20260123 SeMI研)
by
Yuto Matsuda
PDF
第21回 Gen AI 勉強会「NotebookLMで60ページ超の スライドを作成してみた」
by
嶋 是一 (Yoshikazu SHIMA)
PDF
ST2024_PM1_2_Case_study_of_local_newspaper_company.pdf
by
akipii ogaoga
PDF
PMBOK 7th Edition_Project Management Context Diagram
by
akipii ogaoga
PDF
PMBOK 7th Edition Project Management Process Scrum
by
akipii ogaoga
PDF
100年後の知財業界-生成AIスライドアドリブプレゼン イーパテントYouTube配信
by
e-Patent Co., Ltd.
PDF
2025→2026宙畑ゆく年くる年レポート_100社を超える企業アンケート総まとめ!!_企業まとめ_1229_3版
by
sorabatake
PDF
Team Topology Adaptive Organizational Design for Rapid Delivery of Valuable S...
by
akipii ogaoga
PDF
Starlink Direct-to-Cell (D2C) 技術の概要と将来の展望
by
CRI Japan, Inc.
PDF
Reiwa 7 IT Strategist Afternoon I Question-1 3C Analysis
by
akipii ogaoga
PDF
Reiwa 7 IT Strategist Afternoon I Question-1 Ansoff's Growth Vector
by
akipii ogaoga
PDF
FY2025 IT Strategist Afternoon I Question-1 Balanced Scorecard
by
akipii ogaoga
PDF
PMBOK 7th Edition_Project Management Process_WF Type Development
by
akipii ogaoga
自転車ユーザ参加型路面画像センシングによる点字ブロック検出における性能向上方法の模索 (20260123 SeMI研)
by
Yuto Matsuda
第21回 Gen AI 勉強会「NotebookLMで60ページ超の スライドを作成してみた」
by
嶋 是一 (Yoshikazu SHIMA)
ST2024_PM1_2_Case_study_of_local_newspaper_company.pdf
by
akipii ogaoga
PMBOK 7th Edition_Project Management Context Diagram
by
akipii ogaoga
PMBOK 7th Edition Project Management Process Scrum
by
akipii ogaoga
100年後の知財業界-生成AIスライドアドリブプレゼン イーパテントYouTube配信
by
e-Patent Co., Ltd.
2025→2026宙畑ゆく年くる年レポート_100社を超える企業アンケート総まとめ!!_企業まとめ_1229_3版
by
sorabatake
Team Topology Adaptive Organizational Design for Rapid Delivery of Valuable S...
by
akipii ogaoga
Starlink Direct-to-Cell (D2C) 技術の概要と将来の展望
by
CRI Japan, Inc.
Reiwa 7 IT Strategist Afternoon I Question-1 3C Analysis
by
akipii ogaoga
Reiwa 7 IT Strategist Afternoon I Question-1 Ansoff's Growth Vector
by
akipii ogaoga
FY2025 IT Strategist Afternoon I Question-1 Balanced Scorecard
by
akipii ogaoga
PMBOK 7th Edition_Project Management Process_WF Type Development
by
akipii ogaoga
SDSoC勉強会_170128_スライド「SDx 2016.3のプラグマによるハードウェアと性能」
1.
SDx 2016.3のプラグマによる ハードウェアと性能 marseeこと小野 雅晃
2.
ソフトウェアとハードウェアの インターフェース ● Vivado HLSは明示的にハードウェアのインター フェースをINTERFACE指示子で定義 ●
SDSoCはソフトウェアなので、指示子は本来無い のだが、インターフェースを指示子で指定する ● SDSoCの指示子とハードウェアとの関係、性能と の関係を調べた – SDSoCは内部でVivado HLSを使っているが、Vivado HLSで性能が良かったコードはSDSoCでも性能が良い のか?
3.
今回やったこと ● SDx(SDSoC) 2016.3を使用 ● お馴染みのラプラシアンフィルタを使用した ●
ハードウェア化ラプラシアンフィルタ関数 vs ソフトウェ ア・ラプラシアンフィルタ関数の速度比較 – 比較用ソフトウェア・ラプラシアンフィルタ関数は固定 – ハードウェア化ラプラシアンフィルタ関数のデータ転送の指 定用プラグマを変更 ● ハードウェアの違い(Vivado、Vivado HLS) ● 性能の違い – ハードウェア化ラプラシアンフィルタ関数の記述を変更 ● 性能の違い ● 最高性能の組み合わせの条件は?
4.
今回使用したデータ転送にかかわる プラグマ ● #pragma SDS
data zero_copy(cam_fb[0:ALL_PIXEL_VALUE]) ● #pragma SDS data zero_copy(lap_fb[0:ALL_PIXEL_VALUE]) ● #pragma SDS data copy(cam_fb[0:ALL_PIXEL_VALUE]) ● #pragma SDS data copy(lap_fb[0:ALL_PIXEL_VALUE]) ● #pragma SDS data access_pattern(cam_fb:RANDOM, lap_fb:RANDOM) ● #pragma SDS data access_pattern(cam_fb:SEQUENTIAL, lap_fb:SEQUENTIAL) ● #pragma SDS data sys_port(cam_fb:AFI, lap_fb:AFI) ● int lap_filter_axim(int cam_fb[ALL_PIXEL_VALUE], int lap_fb[ALL_PIXEL_VALUE]) ● { – ハードウェア関数の引数が配列(要素数をどこかで明示しておかないとエラー) – 配列がメモリの領域を示している
5.
プラグマによる外部メモリとの 転送方法(copy, zero_copy) ● #pragma
SDS data copy(<ポート名>…) – データはブロックRAMに一時コピーされる? – 呼び出し側関数からはmalloc()で取得したメモリの先頭アド レスを配列のアドレスとして渡される – スキャッタ・ギャザー用DMA ● 4kバイトごとにアドレスが不連続の可能性 ● #pragma SDS data zero_copy(<ポート名>…) – データはDDRから転送されたそのままを使用 – 呼び出し側関数からはsds_alloc()で取得した連続領域のメ モリを配列のアドレスとして渡される – シンプルDMAでもOK
6.
プラグマによる外部メモリとの 転送方法(data access_pattern) ● #pragma
SDS data access_pattern(cam_fb:RANDOM, lap_fb:RANDOM) – RANDOM ー RAMインターフェースが生成される – デフォルトのアクセスパターン ● #pragma SDS data access_pattern(cam_fb:SEQUENTIAL, lap_fb:SEQUENTIAL) – SEQUNTIAL ー ストリーミング・インターフェースが生成される – 配列のエレメントの順番は守る必要がある(ストリーミングだから) ● zero_copyプラグマが無い引数にのみ適用できる
7.
使用するPSのポートの指定 (data sys_port) ● #pragma
SDS data sys_port(cam_fb:AFI, lap_fb:AFI) – portはACP、AFI(HP)、MIGのいずれか – sds_alloc_non_cacheable()かsds_register_dmabuf()で メモリをアロケートした場合はAFI(HP)ポートを使ったほう が良い – SDSoCでは自動的にデータ・ムーバーが適切なポートに 接続する – ラプラシアンフィルタではデフォルトではACPポートが使わ れる(malloc(), sds_alloc()使用)
8.
第1段階のラプラシアンフィルタ ● 性能の低いラプラシアンフィルタ – 1ピクセルずつRead –
ラプラシアンフィルタ処理 – 1ピクセルずつWrite ● プラグマ – 無し(copy, data access_pattern(RANDOM)) – data access_pattern(SEQUENTIAL) – zero_copy(sds_alloc()) ● 最初にプラグマ無しをやってみよう
9.
Vivado IPインテグレータ(プラグマ無し)
10.
Vivado HLSプロジェクト (プラグマ無し) ● ハードウェア化する関数のファイルがVivado
HLSのソースファイ ルになっている ● SDSoCがVivado HLSの指示子を追加している
11.
Vivado IPI(SEQUENTIAL)
12.
Vivado HLS(SEQUENTIAL)
13.
Vivado IPI(zero_copy)
14.
Vivado HLS(zero_copy)
15.
プラグマによるVivado HLSが生成す るインターフェース ● 無し(copy,
data access_pattern(RANDOM)) – ブロックRAMインターフェース ● data access_pattern(SEQUENTIAL) – ストリーミング・インターフェース(FIFO) ● zero_copy – AXI4 Masterインターフェース
16.
第1段階のラプラシアンフィルタの リソース使用量 プラグマ無し SEQUENTIAL ZERO_COPY LUT
46 46 21 LUTRAM 13 12 7 FF 35 35 15 BRAM 53 33 18 DSP 20 13 16 BUFG 3 3 3 (注:単位は パーセンテー ジ) 画像の大きさは 100x75 ピクセル
17.
第1段階のラプラシアンフィルタの リソース使用量(グラフ) LUT LUTRAM FF
BRAM DSP BUFG 0 10 20 30 40 50 60 プラグマ無し SEQUENTIAL ZERO_COPY
18.
性能比較 ● プラグマ無しとSEQUENTIALのハードウエア実行 時間は不安定。やるたびに変わる(SDSoC勉強会 でmalloc()を使っているためとの指摘あり) ● この状態では性能比較は無理だった プラグマ無し
SEQUENTIAL ZERO_COPY ハードウェア 実行時間 4.32 ~ 10.6 5.8 ~ 10.7 0.943 ソフトウェア 実行時間 0.922 0.906 0.824 単位は ms 画像の大きさは 100x75 ピクセル
19.
FPGAの部屋のブログの関連記事 ● http://marsee101.blog19.fc2.com/blog-entry-36 82.html ● http://marsee101.blog19.fc2.com/blog-entry-36 84.html ●
http://marsee101.blog19.fc2.com/blog-entry-36 85.html ● http://marsee101.blog19.fc2.com/blog-entry-36 87.html
20.
memcpy()を使用した第2段階の Cソースコード ● memcpy()を使ったのCソースコード(PIPELINEも) ● Vivado
HLSのプラグマだけでSDSoCで動作 – ハードウェア化関数の引数のvolatileを外した – INTERFACE指示子のbundleオプションを外した – malloc()をsds_alloc()に変更、free()も変更 ● つまりSDSoCのzero_copyと等価 ● ハードウエアの実行時間55.7ms、ソフトウェアの実行 時間 51.7ms、SW/HW 0.928≒ 倍(800x600ピクセル) ● http://marsee101.blog19.fc2.com/blog-entry-3688.h tml
21.
性能向上を図った第3段階の Cソースコード ● array_partition、3x3レジスタ実装 ● 前段階と同様の措置(volatile,
bundle, sds_alloc) ● SDSoCのzero_copyと等価 ● ハードウエアの実行時間14.9ms、ソフトウェアの実 行時間 51.8ms、SW/HW 3.48≒ 倍(800x600ピク セル) ● http://marsee101.blog19.fc2.com/blog-entry-36 89.html
22.
Vivado HLSのAXI4-Streamのコード ● Vivado
HLSのAXI4-Streamのコードは果たして動く のか? ● @ryosさんの記事を参考にSDSoC 2016.3でサイド チャネル付きAXI4-Streamを実装しようとしたが失敗 ● でも、今までもストリームにしてきた ● data access_pattern(SEQUENTIAL)のプラグマを付 けて、シーケンシャルに実行するコードだったらOKで は?(AXI4-Streamではないけど) ● AXI4-Streamのコードでやってみたらどうなんだろう?
23.
AXI4-Stream向きのコード1 ● AXI4-Streamのコードを使用した – サイドチャネルを使っているので、それを外した ●
SDSoCで使うので、Xilinxのビデオ用IPのことは考えない – 入力のストリームと出力のストリームにはif文がない – data access_pattern(SEQUENTIAL)プラグマ ● 結果 – ソフトウェアの実行時間は、約 47.7 ms – ハードウエアの実行時間は、約 5.54 ms – SW実行時間/HW実行時間≒8.61倍 ● 驚異的。。。ハードウエアの実行時間はReadもWriteも重なり合ったフル バーストしないと実現できない ● なぜならば、800ピクセルx600行x10 ns(クロック周期)= 4.8 ms – 1ピクセルは1クロックで転送(1ピクセルはint型、クロック周波数は100MHz) ● http://marsee101.blog19.fc2.com/blog-entry-3690.html
24.
AXI4-Stream向きのコード2 ● AXI4-Stream向きのコード1と同様 ● ただし、data
access_pattern(SEQUENTIAL)プラグマの代 わりにdata zero_copyプラグマ ● つまり、Vivado HLSでのメモリ・アクセスをAXI4 Masterに ● 結果 – ソフトウェアの実行時間は、約 47.7 ms – ハードウエアの実行時間は、約 6.04 ms – SW実行時間/HW実行時間≒7.90倍 ● AXI4-Stream向きのコード1よりも少し遅くなっている が、ReadとWriteが重なり合ってDMAされているはず ● http://marsee101.blog19.fc2.com/blog-entry-3691.html
25.
Vivado HLSで最速コードを確かめる ● 最速の結果が出たSDSoCのコードをVivado
HLSで INTERFACE m_axi指示子を入れて確かめた(つま り、AXI4 Master ) ● 確かに16バーストのReadとWriteが重なり合ったDMA(見 事なものだった。。。) ● if文無しでReadし、if文無しでWriteすれば最高性能(来たま まの順番でフィルタして出力) ● http://marsee101.blog19.fc2.com/blog-entry-3692.html ● http://marsee101.blog19.fc2.com/blog-entry-3694.html ● http://marsee101.blog19.fc2.com/blog-entry-3695.html
26.
ACPポートとAFI(HP)ポートの性能差 ● AXI4-Stream向きのコードではACPポートを使用してDMA ● それではHPポートを使ったらもっと性能が出るのではないだろ うか? ●
#pragma SDS data sys_port(cam_fb:AFI, lap_fb:AFI) – やってみたところ遅くなった ● 結果 – ソフトウェアの実行時間は、約 47.4 ms – ハードウエアの実行時間は、約 16.0 ms – SW実行時間/HW実行時間≒2.96倍 – ACPポートよりもHPポートを使用したほうが遅くなった – キャッシュのコヒーレンシを保つため?なぜ? ● http://marsee101.blog19.fc2.com/blog-entry-3690.html
27.
まとめ ● SDSoCでプラグマやCソースコードの違いによる ハードウェアの違いや性能を検証した ● シンプルなCソースコードが最速だということが分 かった ●
ACPポートをDMAに使用するよりもHPポートのほ うが速度的に遅かった
Download