cvpaper.challenge の Meta Study Group 発表スライド
cvpaper.challenge はコンピュータビジョン分野の今を映し、トレンドを創り出す挑戦です。論文サマリ・アイディア考案・議論・実装・論文投稿に取り組み、凡ゆる知識を共有します。2019の目標「トップ会議30+本投稿」「2回以上のトップ会議網羅的サーベイ」
http://xpaperchallenge.org/cv/
cvpaper.challenge の Meta Study Group 発表スライド
cvpaper.challenge はコンピュータビジョン分野の今を映し、トレンドを創り出す挑戦です。論文サマリ・アイディア考案・議論・実装・論文投稿に取り組み、凡ゆる知識を共有します。2019の目標「トップ会議30+本投稿」「2回以上のトップ会議網羅的サーベイ」
http://xpaperchallenge.org/cv/
学習ロジックとしては、Long Short Term MemoryやRecurrent Neural Networkが使用されることが多いようです。
音声の認識のためには前後の文脈が重要になりますが、これらのモデルは学習に前後のデータを使用し反映させるためコンテキストも考慮した推論ができるようになります。
CoreML ToolsはApple によって提供されているツールです。
PytorchやTensorFlowなど様々なライブラリによって作られたモデルをCore ML モデルに変換することができます。
Core ML モデルはNeural Engineが使用できることにより、パフォーマンスが高くなる可能性が高いため、まず検討したい方法です。
TensorFlow LiteはGoogleによって提供されています。
こちらも様々なライブラリで作成されたモデルをモバイル端末で実行可能なモデルに変換できます。
TensorFlow LiteのモデルはAndroidでも使用可能なため、両OSをサポートしている場合とくに候補に上がるかと思います。
最近では種々の制約はありますが、Core ML Delegateを使うことでCore ML モデル同様にNeural Engineを使用することができるようです。