Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

FPGAを用いたEdge AIの現状

3,596 views

Published on

近年エッジ機器向けのキーデバイス候補として注目を集めているFPGAですが、業務でFPGAに関わっていないとなかなかその実態が見えづらいと思います。ここではFPGAとはどういうデバイスかについて簡単に触れた後、エッジ関連の応用事例や動向についてご紹介します。

Published in: Devices & Hardware
  • Hello! I have searched hard to find a reliable and best research paper writing service and finally i got a good option for my needs as ⇒ www.HelpWriting.net ⇐
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here
  • I absolutely agree with the above. In addition, I would encourage using a service like HelpWriting.net to proofread application essays. Never hurts to have a second pair of eyes on these docs!
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here

FPGAを用いたEdge AIの現状

  1. 1. インテル株式会社プログラマブル・ソリューション営業本部 シニア・テクノロジー・スペシャリスト アクセラレーション&HLD 竹村 幸尚
  2. 2. Programmable Solutions Group 3 インテル® FPGA ポートフォリオ 性能 低コスト ミッドレンジ ハイエンド 機能 ▪ 2 ~ 50KLE ▪ 不揮発性メモリー ▪ デュアル・コンフィグ レーション ▪ アナログハード IP ▪ DDR3 メモリー ▪ Nios II ソフト CPU • 25 ~ 300KLE • 3/6Gbps SERDES • 12Mb エンベデッド・ メモリー • DDR3/L メモリー • PCIe Gen2 x4 • ARM HPS または Nios® II ソフト CPU • 560 個のユーザー I/O • 160 ~ 1,150KLE • 25Gbps SERDES • 53Mb エンベデッド・メ モリー • DDR4 メモリー・ コントローラー • PCIe Gen3 x8 (4) • ハード FP DSP • ARM HPS または Nios II ソフト CPU • 768 個のユーザー I/O • 378 ~ 5,510KLE • GHz コア・ファブリック • 28/56Gbps SERDES • 137Mb エンベデッド・ メモリ • DDR4 メモリー • PCIe Gen3 x16 (6) • HBM DRAM • ハード FP DSP • ARM HPS または Nios II ソフト CPU • 1,640 個のユーザー I/O • 85 ~ 220KLE • 12.5Gbps SERDES • 11Mb エンベデッド・ メモリー • DDR3/L メモリー・ コントローラー • PCIe Gen2 x4 • ハード FP DSP • Nios II ソフト CPU • 284 個のユーザー I/O▪ 6 ~ 120KLE ▪ 528 個のユーザー I/O ▪ Nios II® ソフト CPU
  3. 3. Programmable Solutions Group 4 FPGA概要 •Sea of programmable logic and routing •DSPs (floating-point units) •M20K SRAMs (2.5KB/SRAM) •Range of devices: - Intel® Stratix® 10 FPGA: 14 nm, high performance - Intel Arria® 10 FPGA: 20 nm, mid range - Intel Cyclone® 10 FPGA: 20 nm, low power FPGAs are well positioned for deep learning… X +
  4. 4. Programmable Solutions Group 5 インテル® FPGA が AI 分野で「勝る」理由 (採用事例) 「マイクロソフト、自社の ‘Brainwave*’ AI-on-FPGA サービスを外部の試験機関に開放。」- ZDNet (2018年5 月) https://www.zdnet.com/article/microsoft-opens-its-brainwave-ai-on-fpga-service-to-external-testers/ 「弊社では新設計の AI NVR 製品上で、インテル® Core™ i5 プロセッサーをインテル® Arria®10 FPGA ととも に使用中。インテル® FPGA により自社システムを加速化することで、リアルタイムなビジョンベースのソリュー ションに対するディープラーニング能力が強化され、1 ドルあたりのワットごとのパフォーマンスが向上。」 – インテル ニュースルーム (2018年5月) https://newsroom.intel.com/wp-content/uploads/sites/11/2018/05/intelvisionproducts-quotesheet.pdf 「OpenVINO™ ツールキット統合の Greengrass デバイスを使用することで、顧客はディープラーニング作業を 行うためにエッジで展開可能なクラウド式 ML モデルを構築でき、またこれらは特定の性能ニーズに合わせて カスタマイズ可能。」– インテル ニュースルーム (2018年5月) https://newsroom.intel.com/wp-content/uploads/sites/11/2018/05/intelvisionproducts-quotesheet.pdf 「NeoFace Accelerator* の制作に際し・・エンジンのソフトウェア IP をインテル® Arria® 10 FPGA に統合し・・・ インテル® Xeon® プロセッサー・ベースのサーバー上で運用。」– インテル ニュースルーム (2017年6月) https://newsroom.intel.com/news/intel-fpga-technology-supports-nec-face-recognition-technology/ Alibaba Cloud 「この中国のクラウド・サプライヤーは、FPGA ベースの超低レイテンシーかつハイパフォーマンスのディープ ラーニング・プロセッサー (DLP) を開発。同社によれば、自社の DLP はスパース・コンボリューションと低精度 なデータ・コンピューティングを同時にサポートできるという・・・」 - ComputerWeekly (2018年8月) https://www.computerweekly.com/blog/Eyes-on-APAC/An-inside-look-at-Alibabas-deep-learning-processor NEC
  5. 5. Internet of Things Group 7 エッジ コンピューター インテルは性能、消費電力、価格の目標に応じ 柔軟にAIシステム構成できるソリューションを提供 機器 アプリケーション、 メディア処理、AI推論 AI推論 アクセラレーター 共通のコード| 汎用的なアルゴリズム CPU, GPU, AIアクセラレーターで共有可能
  6. 6. Internet of Things Group 既存インフラやプラットフォームに新しい拡張の波 20以上のOpenVINO™ Toolkitに基づく製品 5000名以上の 開発者 FPGA 及び VPUサポー トを実装, ONNX 及び コ ンテナのサポート オープンソース化: 2018年10月16日 8
  7. 7. Programmable Solutions Group 9 OpenVINO™ ツールキット Visual Inferencing (視覚的推論) と Neural Network Optimization (ニューラル・ネットワークの最適化) 従来の CV ツール & ライブラリー 最適化コンピューター・ビジョン・ライブラリー GPUCPU FPGA VPU 訓練済 みモデ ル FPGA 向け Linux* のみ プロセッサーのグラフィック性能の向上 - Linux* のみ GPU = インテグレーテッド・グラフィックス・プロセシング・ユニット搭載のインテル® CPU/ インテル® プロセッサー・グラフィックス VPU = インテル® Movidius™ Vision Processing Unit (ビジョン・プロセシング・ユニット) OpenVX および OpenVX ロゴは the Khronos Group Inc. の商標です。 OpenCL および OpenCL ロゴは Apple Inc. の商標であり、Khronos の許可を得て使用していま す。 インテル® ディープラーニング・ デプロイメント・ツールキット モデル・オプティマイザー 変換 & 最適化 IR 推論エンジン (DLA で FPGA 用に最適化) OpenCV OpenVX* OpenCL* インテル® インテグレーテッド・ グラフィックス・ドライバー & ランタイム インテル® メディア SDK (オープンソース版) ビットストリームFPGA ランタイム環境 (RTE) (インテル® FPGA SDK for OpenCL™ から) IR = Intermediate Representation (中間表現) フォーマット Photography Vision コードサンプル & 10 個の事前訓練済みモデル コードサンプル 以下により H/W に実装:
  8. 8. Programmable Solutions Group ディープラーニング・デプロイメント・ツールキット Caffe TensorFlow MxNet ONNX 全てのターゲットに フィットするように 変換・最適化 InferenceEngine 共通API(C++,Python) ロード、推論 CPU Plugin GPU Plugin FPGA Plugin Model Optimizer .bin IR .XML 変換 汎用的最適化 ターゲット別最適化 コンパイル 実行 ◼ 全ての関連インテル® 製品に対し、トレーニング済みモデルをデプロイ可能 ◼ CPU, GPU, FPGA, Myriad ◼ 最大性能を得るためにモデル最適化 ◼ 動作検証と最適化を可能に ◼ 使い勝手の良いランタイムAPI Myriad Plugin
  9. 9. Internet of Things Group **ボードベンダーの詳細についてはインテルの担当者にお問い合わせ下さい。 Intel、インテル、Intel ロゴは、アメリカ合衆国および/またはその他の国における Intel Corporation またはその子会社の商標です。 ※ その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 11 M.2, Key E miniPCIe PCIe x4インターフェース インテル® Movidius MA2485 VPU X 1 インテル® Movidius MA2485 VPUs x2 インテル® Movidius MA2485 VPUs x8 製品化予定 ボードベンダー* インテル® Arria® 10 FPGA 1150GX/660GX PCIe x8 OpenVINO™ ツールキット エッジで実行するNN推論モデルの構築; インテル® CPU, GPU, VPU, FPGAで共通の開発環境 ソフトウェア 開発ツール インテル® ビジョン・アクセラレーター・デザイン・プロダクト (インテル® Movidius™ VPU搭載版) インテル® ビジョン・アクセラ レーター・デザイン・プロダクト (インテル® Arria® 10 FPGA 搭載版) インテル® ビジョン・ アクセラレーター・ デザインに基づく アドインカード(例)
  10. 10. Programmable Solutions Group 12 iEi® Mustang-F100-A10 + TANK AIoT Dev Kit
  11. 11. Programmable Solutions Group 13
  12. 12. Programmable Solutions Group 14 AAEON® UP Platform
  13. 13. 16© 2019 Intel Corporation. 無断での引用、転載を禁じます。 Award-Winning*EdgeAISolutionbyLeapMind 1-bit Quantization and Compression Technology and Tool Chain for Embedded Deep Learning • Real-time Response, Low Latency • Lower Power, Small Footprint • No Internet Connection Required Application Example: • Food Inspection • PCB Soldering Inspection • Human Detection • Powerline Inspection by Autonomous Drone *Leapmind’s DeLTA family received ET Technology Award 2018 in Tokyo
  14. 14. Programmable Solutions Group 17 Terasic DE10-Nano Kit • Intel® Cyclone® V SoC • 110K Les • 1GB DDR3 SDRAM • HDMI I/F • Arduino expansion header • Uno R3 compatibility • $130 • OpenVINO is not supported
  15. 15. Programmable Solutions Group 18 aws fpgaiot
  16. 16. Programmable Solutions Group 19 Terasic DE10-Nano + Intel® Neural Compute Stick 2
  17. 17. Programmable Solutions Group 20
  18. 18. Programmable Solutions Group 21

×