FPGAを用いたEdge AIの現状

インテル株式会社プログラマブル・ソリューション営業本部
シニア・テクノロジー・スペシャリストアクセラレーション＆HLD
竹村幸尚

Programmable Solutions Group 3
インテル® FPGA ポートフォリオ
性能
低コストミッドレンジハイエンド
機能
▪ 2 ～ 50KLE
▪ 不揮発性メモリー
▪ デュアル・コンフィグ
レーション
▪ アナログハード IP
▪ DDR3 メモリー
▪ Nios II ソフト CPU
• 25 ～ 300KLE
• 3/6Gbps SERDES
• 12Mb エンベデッド・
メモリー
• DDR3/L メモリー
• PCIe Gen2 x4
• ARM HPS または
Nios® II ソフト CPU
• 560 個のユーザー I/O
• 160 ～ 1,150KLE
• 25Gbps SERDES
• 53Mb エンベデッド・メ
モリー
• DDR4 メモリー・
コントローラー
• PCIe Gen3 x8 (4)
• ハード FP DSP
Nios II ソフト CPU
• 768 個のユーザー I/O
• 378 ～ 5,510KLE
• GHz コア・ファブリック
• 28/56Gbps SERDES
メモリ
• DDR4 メモリー
• PCIe Gen3 x16 (6)
• HBM DRAM
Nios II ソフト CPU
• 1,640 個のユーザー
I/O
• 85 ～ 220KLE
• 12.5Gbps SERDES
メモリー
• DDR3/L メモリー・
コントローラー
• PCIe Gen2 x4
• Nios II ソフト CPU
• 284 個のユーザー I/O▪ 6 ～ 120KLE
▪ 528 個のユーザー I/O
▪ Nios II® ソフト CPU

FPGA概要
•Sea of programmable logic and routing
•DSPs (floating-point units)
•M20K SRAMs (2.5KB/SRAM)
•Range of devices:
- Intel® Stratix® 10 FPGA: 14 nm, high performance
- Intel Arria® 10 FPGA: 20 nm, mid range
- Intel Cyclone® 10 FPGA: 20 nm, low power
FPGAs are well positioned for deep learning…
X
+

インテル® FPGA が AI 分野で「勝る」理由（採用事例）
「マイクロソフト、自社の ‘Brainwave*’ AI-on-FPGA サービスを外部の試験機関に開放。」- ZDNet (2018年5
月)
https://www.zdnet.com/article/microsoft-opens-its-brainwave-ai-on-fpga-service-to-external-testers/
「弊社では新設計の AI NVR 製品上で、インテル® Core™ i5 プロセッサーをインテル® Arria®10 FPGA ととも
に使用中。インテル® FPGA により自社システムを加速化することで、リアルタイムなビジョンベースのソリュー
ションに対するディープラーニング能力が強化され、1 ドルあたりのワットごとのパフォーマンスが向上。」
– インテルニュースルーム (2018年5月) https://newsroom.intel.com/wp-content/uploads/sites/11/2018/05/intelvisionproducts-quotesheet.pdf
「OpenVINO™ ツールキット統合の Greengrass デバイスを使用することで、顧客はディープラーニング作業を
行うためにエッジで展開可能なクラウド式 ML モデルを構築でき、またこれらは特定の性能ニーズに合わせて
カスタマイズ可能。」– インテルニュースルーム (2018年5月)
https://newsroom.intel.com/wp-content/uploads/sites/11/2018/05/intelvisionproducts-quotesheet.pdf
「NeoFace Accelerator* の制作に際し・・エンジンのソフトウェア IP をインテル® Arria® 10 FPGA に統合し・・・
インテル® Xeon® プロセッサー・ベースのサーバー上で運用。」– インテルニュースルーム (2017年6月)
https://newsroom.intel.com/news/intel-fpga-technology-supports-nec-face-recognition-technology/
Alibaba
Cloud
「この中国のクラウド・サプライヤーは、FPGA ベースの超低レイテンシーかつハイパフォーマンスのディープ
ラーニング・プロセッサー (DLP) を開発。同社によれば、自社の DLP はスパース・コンボリューションと低精度
なデータ・コンピューティングを同時にサポートできるという・・・」 - ComputerWeekly (2018年8月)
https://www.computerweekly.com/blog/Eyes-on-APAC/An-inside-look-at-Alibabas-deep-learning-processor
NEC

Internet of Things Group 7
エッジ
コンピューター
インテルは性能、消費電力、価格の目標に応じ
柔軟にAIシステム構成できるソリューションを提供
機器アプリケーション、
メディア処理、AI推論
AI推論
アクセラレーター
共通のコード| 汎用的なアルゴリズム
CPU, GPU, AIアクセラレーターで共有可能

Internet of Things Group
既存インフラやプラットフォームに新しい拡張の波
20以上のOpenVINO™
Toolkitに基づく製品
5000名以上の
開発者
FPGA 及び VPUサポー
トを実装, ONNX 及びコ
ンテナのサポート
オープンソース化:
2018年10月16日
8

OpenVINO™ ツールキット
Visual Inferencing (視覚的推論) と Neural Network Optimization (ニューラル・ネットワークの最適化)
従来の CV ツール & ライブラリー
最適化コンピューター・ビジョン・ライブラリー
GPUCPU FPGA VPU
訓練済
みモデ
ル
FPGA 向け Linux* のみ
プロセッサーのグラフィック性能の向上 - Linux* のみ
GPU = インテグレーテッド・グラフィックス・プロセシング・ユニット搭載のインテル® CPU/
インテル® プロセッサー・グラフィックス
VPU = インテル® Movidius™ Vision Processing Unit (ビジョン・プロセシング・ユニット)
OpenVX および OpenVX ロゴは the Khronos Group Inc. の商標です。
OpenCL および OpenCL ロゴは Apple Inc. の商標であり、Khronos の許可を得て使用していま
す。
インテル® ディープラーニング・
デプロイメント・ツールキット
モデル・オプティマイザー
変換 & 最適化
IR
推論エンジン
(DLA で FPGA 用に最適化)
OpenCV OpenVX*
OpenCL*
インテル® インテグレーテッド・
グラフィックス・ドライバー & ランタイム
インテル® メディア SDK
(オープンソース版)
ビットストリームFPGA ランタイム環境 (RTE)
(インテル® FPGA SDK for OpenCL™ から)
IR =
Intermediate
Representation
(中間表現)
フォーマット
Photography Vision
コードサンプル & 10 個の事前訓練済みモデルコードサンプル
以下により H/W に実装：

Programmable Solutions Group
ディープラーニング・デプロイメント・ツールキット
Caffe
TensorFlow
MxNet
ONNX
全てのターゲットに
フィットするように
変換・最適化
InferenceEngine
共通API(C++,Python)
ロード、推論
CPU Plugin
GPU Plugin
FPGA Plugin
Model
Optimizer
.bin
IR
.XML
変換汎用的最適化ターゲット別最適化コンパイル実行
◼ 全ての関連インテル® 製品に対し、トレーニング済みモデルをデプロイ可能
◼ CPU, GPU, FPGA, Myriad
◼ 最大性能を得るためにモデル最適化
◼ 動作検証と最適化を可能に
◼ 使い勝手の良いランタイムAPI
Myriad Plugin

Internet of Things Group
**ボードベンダーの詳細についてはインテルの担当者にお問い合わせ下さい。
Intel、インテル、Intel ロゴは、アメリカ合衆国および／またはその他の国における Intel Corporation またはその子会社の商標です。
※ その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
11
M.2, Key E miniPCIe PCIe x4インターフェース
インテル® Movidius
MA2485 VPU
X 1
MA2485 VPUs
x2
MA2485 VPUs
x8
製品化予定
ボードベンダー*
インテル® Arria® 10 FPGA
1150GX/660GX
PCIe x8
OpenVINO™ ツールキット
エッジで実行するNN推論モデルの構築; インテル® CPU, GPU, VPU, FPGAで共通の開発環境
ソフトウェア
開発ツール
インテル® ビジョン・アクセラレーター・デザイン・プロダクト
（インテル® Movidius™ VPU搭載版)
インテル® ビジョン・アクセラ
レーター・デザイン・プロダクト
(インテル® Arria® 10 FPGA
搭載版)
インテル® ビジョン・
アクセラレーター・
デザインに基づく
アドインカード(例)

iEi® Mustang-F100-A10 + TANK AIoT Dev Kit

AAEON® UP Platform

16© 2019 Intel Corporation. 無断での引用、転載を禁じます。
Award-Winning*EdgeAISolutionbyLeapMind
1-bit Quantization and Compression Technology and Tool
Chain for Embedded Deep Learning
• Real-time Response, Low Latency
• Lower Power, Small Footprint
• No Internet Connection Required
Application Example:
• Food Inspection
• PCB Soldering Inspection
• Human Detection
• Powerline Inspection by Autonomous Drone
*Leapmind’s DeLTA family received ET Technology Award 2018 in Tokyo

Terasic DE10-Nano Kit
• Intel® Cyclone® V SoC
• 110K Les
• 1GB DDR3 SDRAM
• HDMI I/F
• Arduino expansion header
• Uno R3 compatibility
• $130
• OpenVINO is not supported

aws fpgaiot

Terasic DE10-Nano + Intel® Neural Compute Stick 2

FPGAを用いたEdge AIの現状

FPGAを用いたEdge AIの現状

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to FPGAを用いたEdge AIの現状

Similar to FPGAを用いたEdge AIの現状 (20)

FPGAを用いたEdge AIの現状