SlideShare a Scribd company logo
1 of 15
Download to read offline
www.aps-web.jp
© inscape inc. All Rights Reserved.
1
低消費電力でハイパフォーマンスを実現する
エッジコンピューティング入門
ET&IoT展 2019 内
APSハンズオン・ワークショップ
インスケイプ株式会社 開発局 - 青柳 信吾
座学 セッション
- 1時間 -
www.aps-web.jp
© inscape inc. All Rights Reserved.
2
本日のアジェンダ
実際のプログラミングを体得
組み込み×マルチコア開発入門。
SONY SPRESENSE
“Not-GPU”の高速化技法の詳解。
エッジ・コンピューティングを極める
ハードウェア・アーキテクチャの基礎。
ソフトウェアを高速に実行するため、
必要となるハードウェアを学ぶ。
画像/音声解析を高速処理する、
Cortex-M4x6コアの特徴とは!
はじめてのマルチコア、
プログラムを高速化する。
www.aps-web.jp
© inscape inc. All Rights Reserved.
3
エッジ・コンピューティングを極めるための
ハードウェア・アーキテクチャの基礎。
座学 (前半)
www.aps-web.jp
© inscape inc. All Rights Reserved.
4
GPUってなんだろう(2/2)
Graphic-Processing-Unit
オブジェクト光源
モデルデータ
中間結果
中間結果
出力画像
微細な値を計測できる演算器
大容量のローカルメモリ
光の強さ
光の角度
光の集約
積和演算
www.aps-web.jp
© inscape inc. All Rights Reserved.
5
【ちょっと一息】 少し肩の力を抜きつつ…
畳み込み演算(コンボリューション)
CNN(コンボリューション・ニューラル・ネットワーク)は
画像解析を学ぶ上で欠かすことのできないネットワークです。
補足スライド
プーリング ソフトマックスコンボリューション プーリング ソフトマックス
コンボリューション
入力近辺の複数のピクセル、チャ
ネルを統合して代表値を生成。
プーリング
複数の値を入力として、最大値や
平均値(算術など)を選出。
ソフトマックス
確率データなど、合計値が100%
となるように正規化する。
300
250
100
50
150
150
0.30
0.25
0.10
0.05
0.15
0.15
合計 1.00(100%)
www.aps-web.jp
© inscape inc. All Rights Reserved.
6
ほとんど組み込みデバイスのレガシーコードはCPU向けに書かれているため、
「類似した演算ユニット(サブCPUコア)」 は 「移植しやすい」 というメリットがある。
CPU が得意なこと(2/2)
GPU/NPUとCPUを比較する
処理
1
CPU
すべて開発では、最初に「極力シンプル」な構造を実装する。
「2020年に作るコードも、最初はシングルコアを目指す。」
「オープンソース」を開発に取り入れたい。
大注目の「ラピッドプロトタイピング」 も 「マルチへの移行」 が鍵。
シングル・コア用に開発されたプログラムを、
「マルチコア・プログラミングへと統合、移植する方法」 × 「さらに高速化する方法」を知ることは、
最高の製品をリリースするための秘訣です。
CPU CPU CPU
NIC
処理
A
処理
B
処理
2
CPU CPU
www.aps-web.jp
© inscape inc. All Rights Reserved.
7
CPU が得意なこと(1/2)
GPU/NPUとCPUを比較する
機械・自走機・ロボットの姿勢制御では逆関数が頻繁に実行されます。
例えば、逆三角関数は、センサーから採取したXYZ値 から 機体や構造部の角度を算出するため
頻繁に利用される処理です。実のところ、関数内部では非常に多くの浮動小数点演算が実行されています。
< 三角関数 [順方向] は、角度入力を元に、機体や構造部の移動量を算出します。 >
補足スライド
θ
計測値
https://github.com/lattera/glibc/
blob/master/sysdeps/ieee754/ldbl-128/e_acosl.c
角度
www.aps-web.jp
© inscape inc. All Rights Reserved.
8
座学前半 の まとめ
GPU / NPU 注目されている理由 と 実際
• 「学習フェーズ」 のパラメータの微調整には、GPUが不可欠。
• 秘訣は、「並列処理」 と 「メモリの有効活用」。
• GPU/NPUにも弱点がある。
AIの推論処理は、それほどの演算量ではない。
マルチコア「CPU」を採用する理由と、選ぶコツ
• 既存の開発資産を活かせるのが、CPU/FPU。
• 組み込み/IoTには、浮動小数点演算が多い(FPUが必須)。
• 単なるCPUコアの複数搭載品でなく、電源・メモリ設計が重要。
SPRESENSE™
www.aps-web.jp
© inscape inc. All Rights Reserved.
9
SONY SPRESENSE
“Not-GPU”の高速化技法の詳解。
座学 (後半)
www.aps-web.jp
© inscape inc. All Rights Reserved.
10
ET&IoT展 2019 内
APSハンズオン・ワークショップ
インスケイプ株式会社 開発局 - 青柳 信吾
実習 セッション
- 1時間 -
低消費電力でハイパフォーマンスを実現する
エッジコンピューティング入門
www.aps-web.jp
© inscape inc. All Rights Reserved.
11
本日体験できる開発環境(1)
マルチコア・プログラミングを
体験するための機材
正面プロジェクタにて
デモンストレーション致します。
www.aps-web.jp
© inscape inc. All Rights Reserved.
12
本日体験いただく開発環境(3)
ハンズオン終了後に開発環境を利用するには。
ご自宅でも手順をお試しいただけるよう、Windows PC上へ開発環境を構築する手順を公開しております。
www.aps-web.jp
© inscape inc. All Rights Reserved.
13
シングルコア vs マルチコア
カメラ撮影 & LCD表示。
サンプルプログラム
aps_camera_asmp
(DISABLE_DUALBUFFERING)
画像変換
(YUV形式→RGB形式)
フレームバッファ
表示用バッファ
フレームバッファ
カメラで撮影
(YUV形式)
表示用バッファ
LCDへ表示
(RGB形式)
www.aps-web.jp
© inscape inc. All Rights Reserved.
14
マルチコアを活用した
高速化の手順(1/3)
参考として機能リストを添付いたします。ご自宅・職場へお戻りの後、ソースコードとセットでご活用ください。
【対応するソースコード】
関数名 機能
camera_prepare SPRESENSE™ Camera Boardを初期化します(YUV形式・ストリーム出力)。
alloc_buffer SPRESENSE™ Camera Boardから出力されたデータのバッファの予約します。
free_buffer SPRESENSE™ Camera Boardが利用していたバッファを解放します。
apsamp_camera_init 本アプリケーションに必要な撮影機能をすべて初期化します。
apsamp_camera_fini 本アプリケーションが利用していた撮影機能をすべて解放し、未使用状態にします。
apsamp_capdata_lock Camera Boardのバッファへの変更を抑制し、CPUから操作できるようにロックします。
apsamp_capdata_release Camera Boardのバッファへの変更を許可し、Camera Boardへのデータ格納を許可します。
apsamp_main_yuv2rgb YUV形式の画像をRGB565形式の画像へと変換します。
apsamp_nximage_image RGB565形式のデータをLCDへ出力します。
apsamp_nximage_initialize アプリケーションに依存するLCD機能を設定します。
www.aps-web.jp
© inscape inc. All Rights Reserved.
15
続きは会場にて。ご期待ください。

More Related Content

Similar to Aps ws edge201911_v2

AppPotモバイルアプリ開発『内製化』
AppPotモバイルアプリ開発『内製化』AppPotモバイルアプリ開発『内製化』
AppPotモバイルアプリ開発『内製化』Ryohei Sogo
 
第5回業開中心会議
第5回業開中心会議第5回業開中心会議
第5回業開中心会議Kaoru NAKAMURA
 
PCCC22:株式会社アックス テーマ1「俺ASICとロボットと論理推論AI」
PCCC22:株式会社アックス テーマ1「俺ASICとロボットと論理推論AI」PCCC22:株式会社アックス テーマ1「俺ASICとロボットと論理推論AI」
PCCC22:株式会社アックス テーマ1「俺ASICとロボットと論理推論AI」PC Cluster Consortium
 
ソニーのディープラーニングツールで簡単エッジコンピューティング
ソニーのディープラーニングツールで簡単エッジコンピューティングソニーのディープラーニングツールで簡単エッジコンピューティング
ソニーのディープラーニングツールで簡単エッジコンピューティングRyohei Kamiya
 
ACRi panel_discussion_xilinx_hayashida_rev1.0
ACRi panel_discussion_xilinx_hayashida_rev1.0ACRi panel_discussion_xilinx_hayashida_rev1.0
ACRi panel_discussion_xilinx_hayashida_rev1.0直久 住川
 
Angular でもっとAPIファースト・もっとモダンデザインなWebアプリケーションを作ろう!
Angular でもっとAPIファースト・もっとモダンデザインなWebアプリケーションを作ろう!Angular でもっとAPIファースト・もっとモダンデザインなWebアプリケーションを作ろう!
Angular でもっとAPIファースト・もっとモダンデザインなWebアプリケーションを作ろう!CData Software Japan
 
CoreMLによるiOS深層学習アプリの実装と性能分析
CoreMLによるiOS深層学習アプリの実装と性能分析CoreMLによるiOS深層学習アプリの実装と性能分析
CoreMLによるiOS深層学習アプリの実装と性能分析Ryosuke Tanno
 
Internetトラフィックエンジニアリングの現実
Internetトラフィックエンジニアリングの現実Internetトラフィックエンジニアリングの現実
Internetトラフィックエンジニアリングの現実J-Stream Inc.
 
Aws summits2014 nttデータaws上のシステムはこう作る!
Aws summits2014 nttデータaws上のシステムはこう作る!Aws summits2014 nttデータaws上のシステムはこう作る!
Aws summits2014 nttデータaws上のシステムはこう作る!Boss4434
 
ソフトウェア技術者から見たFPGAの魅力と可能性
ソフトウェア技術者から見たFPGAの魅力と可能性ソフトウェア技術者から見たFPGAの魅力と可能性
ソフトウェア技術者から見たFPGAの魅力と可能性Kenichiro MITSUDA
 
モバイル向けニューラルネットワーク推論エンジンの紹介
モバイル向けニューラルネットワーク推論エンジンの紹介モバイル向けニューラルネットワーク推論エンジンの紹介
モバイル向けニューラルネットワーク推論エンジンの紹介卓然 郭
 
モバイル(エッジ)向け ニューラルネットワーク推論エンジンの紹介
モバイル(エッジ)向け ニューラルネットワーク推論エンジンの紹介モバイル(エッジ)向け ニューラルネットワーク推論エンジンの紹介
モバイル(エッジ)向け ニューラルネットワーク推論エンジンの紹介kcnguo
 
金融業界向けセミナー 量子コンピュータ時代を見据えた組合せ最適化
金融業界向けセミナー 量子コンピュータ時代を見据えた組合せ最適化金融業界向けセミナー 量子コンピュータ時代を見据えた組合せ最適化
金融業界向けセミナー 量子コンピュータ時代を見据えた組合せ最適化Fixstars Corporation
 
Tokyo H2O.ai Meetup#2 by Iida
Tokyo H2O.ai Meetup#2 by IidaTokyo H2O.ai Meetup#2 by Iida
Tokyo H2O.ai Meetup#2 by IidaHidenori Fujioka
 
【Interop Tokyo 2016】 エコシステムですすめる レノボのSDIソリューション
【Interop Tokyo 2016】 エコシステムですすめる レノボのSDIソリューション【Interop Tokyo 2016】 エコシステムですすめる レノボのSDIソリューション
【Interop Tokyo 2016】 エコシステムですすめる レノボのSDIソリューションJuniper Networks (日本)
 
Rancherを活用した開発・運用効率の改善への取り組み
Rancherを活用した開発・運用効率の改善への取り組みRancherを活用した開発・運用効率の改善への取り組み
Rancherを活用した開発・運用効率の改善への取り組みMichitaka Terada
 
Web Component Framework Urushiのご紹介(OSC2017 Tokyo/Spring)
Web Component Framework Urushiのご紹介(OSC2017 Tokyo/Spring)Web Component Framework Urushiのご紹介(OSC2017 Tokyo/Spring)
Web Component Framework Urushiのご紹介(OSC2017 Tokyo/Spring)YuzoHirakawa
 
201110 01 Polytech Center 1
201110 01 Polytech Center 1201110 01 Polytech Center 1
201110 01 Polytech Center 1openrtm
 
FFRKを支えるWebアプリケーションフレームワークの技術
FFRKを支えるWebアプリケーションフレームワークの技術FFRKを支えるWebアプリケーションフレームワークの技術
FFRKを支えるWebアプリケーションフレームワークの技術dena_study
 
デバイスコネクト活用事例紹介
デバイスコネクト活用事例紹介デバイスコネクト活用事例紹介
デバイスコネクト活用事例紹介Device WebAPI Consortium
 

Similar to Aps ws edge201911_v2 (20)

AppPotモバイルアプリ開発『内製化』
AppPotモバイルアプリ開発『内製化』AppPotモバイルアプリ開発『内製化』
AppPotモバイルアプリ開発『内製化』
 
第5回業開中心会議
第5回業開中心会議第5回業開中心会議
第5回業開中心会議
 
PCCC22:株式会社アックス テーマ1「俺ASICとロボットと論理推論AI」
PCCC22:株式会社アックス テーマ1「俺ASICとロボットと論理推論AI」PCCC22:株式会社アックス テーマ1「俺ASICとロボットと論理推論AI」
PCCC22:株式会社アックス テーマ1「俺ASICとロボットと論理推論AI」
 
ソニーのディープラーニングツールで簡単エッジコンピューティング
ソニーのディープラーニングツールで簡単エッジコンピューティングソニーのディープラーニングツールで簡単エッジコンピューティング
ソニーのディープラーニングツールで簡単エッジコンピューティング
 
ACRi panel_discussion_xilinx_hayashida_rev1.0
ACRi panel_discussion_xilinx_hayashida_rev1.0ACRi panel_discussion_xilinx_hayashida_rev1.0
ACRi panel_discussion_xilinx_hayashida_rev1.0
 
Angular でもっとAPIファースト・もっとモダンデザインなWebアプリケーションを作ろう!
Angular でもっとAPIファースト・もっとモダンデザインなWebアプリケーションを作ろう!Angular でもっとAPIファースト・もっとモダンデザインなWebアプリケーションを作ろう!
Angular でもっとAPIファースト・もっとモダンデザインなWebアプリケーションを作ろう!
 
CoreMLによるiOS深層学習アプリの実装と性能分析
CoreMLによるiOS深層学習アプリの実装と性能分析CoreMLによるiOS深層学習アプリの実装と性能分析
CoreMLによるiOS深層学習アプリの実装と性能分析
 
Internetトラフィックエンジニアリングの現実
Internetトラフィックエンジニアリングの現実Internetトラフィックエンジニアリングの現実
Internetトラフィックエンジニアリングの現実
 
Aws summits2014 nttデータaws上のシステムはこう作る!
Aws summits2014 nttデータaws上のシステムはこう作る!Aws summits2014 nttデータaws上のシステムはこう作る!
Aws summits2014 nttデータaws上のシステムはこう作る!
 
ソフトウェア技術者から見たFPGAの魅力と可能性
ソフトウェア技術者から見たFPGAの魅力と可能性ソフトウェア技術者から見たFPGAの魅力と可能性
ソフトウェア技術者から見たFPGAの魅力と可能性
 
モバイル向けニューラルネットワーク推論エンジンの紹介
モバイル向けニューラルネットワーク推論エンジンの紹介モバイル向けニューラルネットワーク推論エンジンの紹介
モバイル向けニューラルネットワーク推論エンジンの紹介
 
モバイル(エッジ)向け ニューラルネットワーク推論エンジンの紹介
モバイル(エッジ)向け ニューラルネットワーク推論エンジンの紹介モバイル(エッジ)向け ニューラルネットワーク推論エンジンの紹介
モバイル(エッジ)向け ニューラルネットワーク推論エンジンの紹介
 
金融業界向けセミナー 量子コンピュータ時代を見据えた組合せ最適化
金融業界向けセミナー 量子コンピュータ時代を見据えた組合せ最適化金融業界向けセミナー 量子コンピュータ時代を見据えた組合せ最適化
金融業界向けセミナー 量子コンピュータ時代を見据えた組合せ最適化
 
Tokyo H2O.ai Meetup#2 by Iida
Tokyo H2O.ai Meetup#2 by IidaTokyo H2O.ai Meetup#2 by Iida
Tokyo H2O.ai Meetup#2 by Iida
 
【Interop Tokyo 2016】 エコシステムですすめる レノボのSDIソリューション
【Interop Tokyo 2016】 エコシステムですすめる レノボのSDIソリューション【Interop Tokyo 2016】 エコシステムですすめる レノボのSDIソリューション
【Interop Tokyo 2016】 エコシステムですすめる レノボのSDIソリューション
 
Rancherを活用した開発・運用効率の改善への取り組み
Rancherを活用した開発・運用効率の改善への取り組みRancherを活用した開発・運用効率の改善への取り組み
Rancherを活用した開発・運用効率の改善への取り組み
 
Web Component Framework Urushiのご紹介(OSC2017 Tokyo/Spring)
Web Component Framework Urushiのご紹介(OSC2017 Tokyo/Spring)Web Component Framework Urushiのご紹介(OSC2017 Tokyo/Spring)
Web Component Framework Urushiのご紹介(OSC2017 Tokyo/Spring)
 
201110 01 Polytech Center 1
201110 01 Polytech Center 1201110 01 Polytech Center 1
201110 01 Polytech Center 1
 
FFRKを支えるWebアプリケーションフレームワークの技術
FFRKを支えるWebアプリケーションフレームワークの技術FFRKを支えるWebアプリケーションフレームワークの技術
FFRKを支えるWebアプリケーションフレームワークの技術
 
デバイスコネクト活用事例紹介
デバイスコネクト活用事例紹介デバイスコネクト活用事例紹介
デバイスコネクト活用事例紹介
 

Recently uploaded

クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 

Recently uploaded (14)

クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 

Aps ws edge201911_v2

  • 1. www.aps-web.jp © inscape inc. All Rights Reserved. 1 低消費電力でハイパフォーマンスを実現する エッジコンピューティング入門 ET&IoT展 2019 内 APSハンズオン・ワークショップ インスケイプ株式会社 開発局 - 青柳 信吾 座学 セッション - 1時間 -
  • 2. www.aps-web.jp © inscape inc. All Rights Reserved. 2 本日のアジェンダ 実際のプログラミングを体得 組み込み×マルチコア開発入門。 SONY SPRESENSE “Not-GPU”の高速化技法の詳解。 エッジ・コンピューティングを極める ハードウェア・アーキテクチャの基礎。 ソフトウェアを高速に実行するため、 必要となるハードウェアを学ぶ。 画像/音声解析を高速処理する、 Cortex-M4x6コアの特徴とは! はじめてのマルチコア、 プログラムを高速化する。
  • 3. www.aps-web.jp © inscape inc. All Rights Reserved. 3 エッジ・コンピューティングを極めるための ハードウェア・アーキテクチャの基礎。 座学 (前半)
  • 4. www.aps-web.jp © inscape inc. All Rights Reserved. 4 GPUってなんだろう(2/2) Graphic-Processing-Unit オブジェクト光源 モデルデータ 中間結果 中間結果 出力画像 微細な値を計測できる演算器 大容量のローカルメモリ 光の強さ 光の角度 光の集約 積和演算
  • 5. www.aps-web.jp © inscape inc. All Rights Reserved. 5 【ちょっと一息】 少し肩の力を抜きつつ… 畳み込み演算(コンボリューション) CNN(コンボリューション・ニューラル・ネットワーク)は 画像解析を学ぶ上で欠かすことのできないネットワークです。 補足スライド プーリング ソフトマックスコンボリューション プーリング ソフトマックス コンボリューション 入力近辺の複数のピクセル、チャ ネルを統合して代表値を生成。 プーリング 複数の値を入力として、最大値や 平均値(算術など)を選出。 ソフトマックス 確率データなど、合計値が100% となるように正規化する。 300 250 100 50 150 150 0.30 0.25 0.10 0.05 0.15 0.15 合計 1.00(100%)
  • 6. www.aps-web.jp © inscape inc. All Rights Reserved. 6 ほとんど組み込みデバイスのレガシーコードはCPU向けに書かれているため、 「類似した演算ユニット(サブCPUコア)」 は 「移植しやすい」 というメリットがある。 CPU が得意なこと(2/2) GPU/NPUとCPUを比較する 処理 1 CPU すべて開発では、最初に「極力シンプル」な構造を実装する。 「2020年に作るコードも、最初はシングルコアを目指す。」 「オープンソース」を開発に取り入れたい。 大注目の「ラピッドプロトタイピング」 も 「マルチへの移行」 が鍵。 シングル・コア用に開発されたプログラムを、 「マルチコア・プログラミングへと統合、移植する方法」 × 「さらに高速化する方法」を知ることは、 最高の製品をリリースするための秘訣です。 CPU CPU CPU NIC 処理 A 処理 B 処理 2 CPU CPU
  • 7. www.aps-web.jp © inscape inc. All Rights Reserved. 7 CPU が得意なこと(1/2) GPU/NPUとCPUを比較する 機械・自走機・ロボットの姿勢制御では逆関数が頻繁に実行されます。 例えば、逆三角関数は、センサーから採取したXYZ値 から 機体や構造部の角度を算出するため 頻繁に利用される処理です。実のところ、関数内部では非常に多くの浮動小数点演算が実行されています。 < 三角関数 [順方向] は、角度入力を元に、機体や構造部の移動量を算出します。 > 補足スライド θ 計測値 https://github.com/lattera/glibc/ blob/master/sysdeps/ieee754/ldbl-128/e_acosl.c 角度
  • 8. www.aps-web.jp © inscape inc. All Rights Reserved. 8 座学前半 の まとめ GPU / NPU 注目されている理由 と 実際 • 「学習フェーズ」 のパラメータの微調整には、GPUが不可欠。 • 秘訣は、「並列処理」 と 「メモリの有効活用」。 • GPU/NPUにも弱点がある。 AIの推論処理は、それほどの演算量ではない。 マルチコア「CPU」を採用する理由と、選ぶコツ • 既存の開発資産を活かせるのが、CPU/FPU。 • 組み込み/IoTには、浮動小数点演算が多い(FPUが必須)。 • 単なるCPUコアの複数搭載品でなく、電源・メモリ設計が重要。 SPRESENSE™
  • 9. www.aps-web.jp © inscape inc. All Rights Reserved. 9 SONY SPRESENSE “Not-GPU”の高速化技法の詳解。 座学 (後半)
  • 10. www.aps-web.jp © inscape inc. All Rights Reserved. 10 ET&IoT展 2019 内 APSハンズオン・ワークショップ インスケイプ株式会社 開発局 - 青柳 信吾 実習 セッション - 1時間 - 低消費電力でハイパフォーマンスを実現する エッジコンピューティング入門
  • 11. www.aps-web.jp © inscape inc. All Rights Reserved. 11 本日体験できる開発環境(1) マルチコア・プログラミングを 体験するための機材 正面プロジェクタにて デモンストレーション致します。
  • 12. www.aps-web.jp © inscape inc. All Rights Reserved. 12 本日体験いただく開発環境(3) ハンズオン終了後に開発環境を利用するには。 ご自宅でも手順をお試しいただけるよう、Windows PC上へ開発環境を構築する手順を公開しております。
  • 13. www.aps-web.jp © inscape inc. All Rights Reserved. 13 シングルコア vs マルチコア カメラ撮影 & LCD表示。 サンプルプログラム aps_camera_asmp (DISABLE_DUALBUFFERING) 画像変換 (YUV形式→RGB形式) フレームバッファ 表示用バッファ フレームバッファ カメラで撮影 (YUV形式) 表示用バッファ LCDへ表示 (RGB形式)
  • 14. www.aps-web.jp © inscape inc. All Rights Reserved. 14 マルチコアを活用した 高速化の手順(1/3) 参考として機能リストを添付いたします。ご自宅・職場へお戻りの後、ソースコードとセットでご活用ください。 【対応するソースコード】 関数名 機能 camera_prepare SPRESENSE™ Camera Boardを初期化します(YUV形式・ストリーム出力)。 alloc_buffer SPRESENSE™ Camera Boardから出力されたデータのバッファの予約します。 free_buffer SPRESENSE™ Camera Boardが利用していたバッファを解放します。 apsamp_camera_init 本アプリケーションに必要な撮影機能をすべて初期化します。 apsamp_camera_fini 本アプリケーションが利用していた撮影機能をすべて解放し、未使用状態にします。 apsamp_capdata_lock Camera Boardのバッファへの変更を抑制し、CPUから操作できるようにロックします。 apsamp_capdata_release Camera Boardのバッファへの変更を許可し、Camera Boardへのデータ格納を許可します。 apsamp_main_yuv2rgb YUV形式の画像をRGB565形式の画像へと変換します。 apsamp_nximage_image RGB565形式のデータをLCDへ出力します。 apsamp_nximage_initialize アプリケーションに依存するLCD機能を設定します。
  • 15. www.aps-web.jp © inscape inc. All Rights Reserved. 15 続きは会場にて。ご期待ください。