SlideShare a Scribd company logo
1 of 14
Download to read offline
Vulkanを活用した高速AIフレームワーク実装
~ailia SDKでの事例~
2021.02.10 ax Inc.
名称 ax 株式会社 (エーエックス株式会社)
所在地 東京都渋谷区鶯谷町19-22塗装会館4F
代表者の
役職・氏名
代表取締役社長 寺田健彦
事業内容
AI に関するコンサルティング(AI アプリの開発等)
AI に関するフレームワークの開発、販売
ミドルウェア(AXIP)の販売
資本金 300 百万円(資本準備金含む)
決算期 3 月 31 日
設立年月日 2019 年 5 月 22 日
ailia SDKについて
ailia SDKはGPUを使用して高速にAI推論を行うAIフレームワーク
ONNX(opset=10、11)に対応しており、Vulkanを使用した高速推論が可能
100種類以上の学習済みモデルを提供しており、AI機能をお客様のアプリに簡単に実装可能
https://ailia.jp/
ailia SDKを使用するメリット
高速処理
クロスプラットフォーム対応
最適化された開発UX
・AIをリアルタイム処理させるために最適な高速動作。
・全てのプラットフォームに対して強力な高速処理チューニングを実施。
・サーバー/PC / スマートフォン / ボードコンピュータ各種に対応。
・オプションでFPGAやAIチップ、組み込み機器にも対応可能。
・全てのプラットフォームで統一されたAPI群、同一のAIモデル(ONNX)で動作。
・長期供給に対応し、後方互換性を重視。自社開発のため当社ライセンスのみで許諾可能。
マルチランゲージ対応
・C++ / C# (Unity) / Python / JNI に対応。
・Swift / Kotlin にも対応予定。
採用事例
CLIP STUDIO PAINT for Galaxyにailia SDKが採用
AndroidにおけるGPUを使用した高速推論をサポート
https://prtimes.jp/main/html/rd/p/000000038.000004053.html
AIデモソフト「ailia AI showcase」を提供開始
株式会社ユニットコムのAI 開発・ディープラーニング専用パソコン/ワークステーションに採用
https://prtimes.jp/main/html/rd/p/000000031.000004053.html
AXELL及びaxがBlaizeとAIソリューション領域で協力
https://www.blaize.com/press/axell-and-blaize-collaborate/
ailia SDKのアーキテクチャ
Vulkan Metal AVX / NEON
Accelerator (Convolution, Pooling, Resize, Add etc)
Runtime Graph Optimization
API (C++, Python, C#, JNI)
ONNX (opset=10, 11) (supporting over 100 layer)
ailia SDK
ailia MODELS
Vulkanを使用するモチベーション
GPUを選ばずに動作させたい
GeForce、Radeon、IrisGraphics、Mali、Adrenoなど全てに対応
OSを選ばずに動作させたい
Windows、Android、Linux(Mac、iOSはMetalを使用)
ユーザ環境に特殊なソフトウェアをインストールせずにGPU推論を行いたい
Vulkanはゲームで広く使用されているため標準ドライバのみで動作
配布するライブラリサイズを小さくしたい
cudnn_cnn_infer64_8.dllが444MBに対して、ailia_vulkan.dllは2.8MB
ailia AI showcase
Windows (RTX2080) + VulkanでAIの高速推論を行うデモ
各種のAIモデルをVulkanを使用して高速推論を行なうことが可能
物体認識:YOLOv3-tiny
顔認識:YOLOv3 Face
物体抽出:HRNetV2
髪検出:HairSegumentation
群衆計測:CrowdCounting
物体識別:ResNet50
骨格検出:LightWeightHumanPose
超解像:SRResNet
ノイズ除去:Noise2Noise
個人識別:VGGFace2
VulkanにおけるAI処理の高速化
ランタイムグラフ最適化とレイヤーフュージョンでAI処理を高速化
ConvolutionやPoolingなどの各種のレイヤーをVulkanのCompute Shaderを使用して実装
AI処理において最も重いConvolutionを高速化するため、Winograd Algorithmをシェーダ実装
Winograd Algorithmについて
Convolution の入出力に変換をかけることで行列積計算の計算量を減らすことができる
変換は少々重いが計算時間の大部分を占める行列積を減らすことができる
https://arxiv.org/abs/1509.09308
3x3 Convolutionにおいて、4 個の出力を得るのに36回の積和算が 16 回に削減可能
フィルタ係数
画像
変換
変換
行列積 変換
Convolutionの行列積の最適化
GEMMのブロックサイズは M=N=K=4
一部アーキテクチャ(Adreno)ではM=8
ブロック内の行列積を各Invocation(CUDAにおけるThread相当)で計算
Workgroupの同期などは行わない
メモリを16バイトにアラインしてvec4型として一命令で読み込み
以後の処理もできるだけベクトルを分解せずに扱うことでメモリアクセスを最適化
コマンドバッファ管理
vkQueueSubmitのオーバーヘッドが無視できないので、サブスレッド化で負荷を軽減
1. コマンドバッファを処理するスレッドを別に立てる
2. ailiaのAPI経由で処理が要求されると、専用スレッドにコマンドバッファがキューされる
3. 専用スレッドがアイドル時に、キューのコマンドバッファを一斉にvkQueueSubmit
ready_command_buffer_vector
vkQueueWaitIdle
vkQueueSubmit
Graph Parse
Convolution + Activation
Main Thread Sub Thread
Pooling
まとめ
Vulkanを使用することで、デバイスとOSを選ばず、標準ドライバのみでAIの高速推論を実現
100種類を超えるAIモデルでVulkanによる高速推論を実証
ailia SDKを使用することでVulkanを使用した高速推論を簡単にアプリに組み込み可能
最後に
ax株式会社ではコンサルティングからモデル作成、SDKの提供、AIを利用したアプリ・システム開
発、サポートまで、 AIに関するトータルソリューションを提供しています。お気軽にお問い合わ
せください。
ax Inc. ホームページ https://axinc.jp/(問い合わせ先)
ax Inc. BLOG https://medium.com/axinc
ailia SDK https://ailia.jp/(無償評価版も提供中)
ailia MODELS https://github.com/axinc-ai/ailia-models
ailia AI showcase https://www.youtube.com/watch?v=lRnWX1rDRQU

More Related Content

More from The Khronos Group Inc.

OpenCL Overview Japan Virtual Open House Feb 2021
OpenCL Overview Japan Virtual Open House Feb 2021OpenCL Overview Japan Virtual Open House Feb 2021
OpenCL Overview Japan Virtual Open House Feb 2021The Khronos Group Inc.
 
Vulkan ML Japan Virtual Open House Feb 2021
Vulkan ML Japan Virtual Open House Feb 2021Vulkan ML Japan Virtual Open House Feb 2021
Vulkan ML Japan Virtual Open House Feb 2021The Khronos Group Inc.
 
glTF Overview Japan Virtual Open House Feb 2021
glTF Overview Japan Virtual Open House Feb 2021glTF Overview Japan Virtual Open House Feb 2021
glTF Overview Japan Virtual Open House Feb 2021The Khronos Group Inc.
 
Khronos Overview Japan Virtual Open House Feb 2021
Khronos Overview Japan Virtual Open House Feb 2021Khronos Overview Japan Virtual Open House Feb 2021
Khronos Overview Japan Virtual Open House Feb 2021The Khronos Group Inc.
 

More from The Khronos Group Inc. (20)

OpenCL Overview Japan Virtual Open House Feb 2021
OpenCL Overview Japan Virtual Open House Feb 2021OpenCL Overview Japan Virtual Open House Feb 2021
OpenCL Overview Japan Virtual Open House Feb 2021
 
Vulkan ML Japan Virtual Open House Feb 2021
Vulkan ML Japan Virtual Open House Feb 2021Vulkan ML Japan Virtual Open House Feb 2021
Vulkan ML Japan Virtual Open House Feb 2021
 
glTF Overview Japan Virtual Open House Feb 2021
glTF Overview Japan Virtual Open House Feb 2021glTF Overview Japan Virtual Open House Feb 2021
glTF Overview Japan Virtual Open House Feb 2021
 
Khronos Overview Japan Virtual Open House Feb 2021
Khronos Overview Japan Virtual Open House Feb 2021Khronos Overview Japan Virtual Open House Feb 2021
Khronos Overview Japan Virtual Open House Feb 2021
 
SYCL 2020 Specification
SYCL 2020 SpecificationSYCL 2020 Specification
SYCL 2020 Specification
 
OpenCL 3.0 Reference Guide
OpenCL 3.0 Reference GuideOpenCL 3.0 Reference Guide
OpenCL 3.0 Reference Guide
 
OpenVX 1.3 Reference Guide
OpenVX 1.3 Reference GuideOpenVX 1.3 Reference Guide
OpenVX 1.3 Reference Guide
 
OpenXR 0.90 Overview Guide
OpenXR 0.90 Overview GuideOpenXR 0.90 Overview Guide
OpenXR 0.90 Overview Guide
 
Vulkan 1.1 Reference Guide
Vulkan 1.1 Reference GuideVulkan 1.1 Reference Guide
Vulkan 1.1 Reference Guide
 
SYCL 1.2.1 Reference Card
SYCL 1.2.1 Reference CardSYCL 1.2.1 Reference Card
SYCL 1.2.1 Reference Card
 
OpenCL 2.2 Reference Guide
OpenCL 2.2 Reference GuideOpenCL 2.2 Reference Guide
OpenCL 2.2 Reference Guide
 
OpenGL 4.6 Reference Guide
OpenGL 4.6 Reference GuideOpenGL 4.6 Reference Guide
OpenGL 4.6 Reference Guide
 
glTF 2.0 Reference Guide
glTF 2.0 Reference GuideglTF 2.0 Reference Guide
glTF 2.0 Reference Guide
 
OpenVX 1.2 Reference Guide
OpenVX 1.2 Reference GuideOpenVX 1.2 Reference Guide
OpenVX 1.2 Reference Guide
 
WebGL 2.0 Reference Guide
WebGL 2.0 Reference GuideWebGL 2.0 Reference Guide
WebGL 2.0 Reference Guide
 
OpenGL SC 2.0 Quick Reference
OpenGL SC 2.0 Quick ReferenceOpenGL SC 2.0 Quick Reference
OpenGL SC 2.0 Quick Reference
 
OpenVX 1.1 Reference Guide
OpenVX 1.1 Reference GuideOpenVX 1.1 Reference Guide
OpenVX 1.1 Reference Guide
 
Vulkan 1.0 Quick Reference
Vulkan 1.0 Quick ReferenceVulkan 1.0 Quick Reference
Vulkan 1.0 Quick Reference
 
OpenCL 2.1 Reference Guide
OpenCL 2.1 Reference GuideOpenCL 2.1 Reference Guide
OpenCL 2.1 Reference Guide
 
OpenGL ES 3.2 Reference Guide
OpenGL ES 3.2 Reference GuideOpenGL ES 3.2 Reference Guide
OpenGL ES 3.2 Reference Guide
 

Recently uploaded

NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NTT DATA Technology & Innovation
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsWSO2
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルCRI Japan, Inc.
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Hiroshi Tomioka
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video UnderstandingToru Tamaki
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptxsn679259
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...Toru Tamaki
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Gamesatsushi061452
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイスCRI Japan, Inc.
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 

Recently uploaded (12)

NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 

Vulkanを活用した高速AIフレームワーク実装 〜ailia SDKでの事例〜