Ruk Ruk Ke Saans Aati Hai Kholo Rasan Zara
Amma Nikalne Wala Hai Seene Se Dumm Mera
Kya Is Andhere Ghar Mein Mujhe Maut Aayegi
Amma Ye Raat Jaan Meri Leke Jayegi
Baba Na Aayenge Na, Mujhe Neend Aayegi.....
文献紹介:Benchmarking Neural Network Robustness to Common Corruptions and Perturb...Toru Tamaki
Dan Hendrycks, Thomas Dietterich, Benchmarking Neural Network Robustness to Common Corruptions and Perturbations, ICLR2019
https://openreview.net/forum?id=HJz6tiCqYm
Ruk Ruk Ke Saans Aati Hai Kholo Rasan Zara
Amma Nikalne Wala Hai Seene Se Dumm Mera
Kya Is Andhere Ghar Mein Mujhe Maut Aayegi
Amma Ye Raat Jaan Meri Leke Jayegi
Baba Na Aayenge Na, Mujhe Neend Aayegi.....
文献紹介:Benchmarking Neural Network Robustness to Common Corruptions and Perturb...Toru Tamaki
Dan Hendrycks, Thomas Dietterich, Benchmarking Neural Network Robustness to Common Corruptions and Perturbations, ICLR2019
https://openreview.net/forum?id=HJz6tiCqYm
「解説資料」MetaFormer is Actually What You Need for VisionTakumi Ohkuma
'MetaFormer is Actually What You Need for Vision' の論文の解説資料
近年画像認識において高い精度を実現しているVision TransformerやMLP-Mixer等の非CNN系のモデルを、Embedding、Tokenの混合、Channel毎のMLP の3つを構成要素としてもつモデル群「MetaFormer」として一般化し、このMetaFormerが高い精度を実現する為に必要な枠組みあると主張した研究。
MetaFormerの枠組みにおいて、その構成要素の一つである「Tokenの混合」としてAttentionを採用したものがTransformer、MLPを採用したものがMLP-Mixer等のMLP系モデルである。
さらに、本研究ではこのTokenの混合として、極力シンプルな演算であるPoolingを採用した「PoolFormer」を提案し、複数の画像認識タスクで従来のモデルに劣らない精度を実現した。
PoolFormerはMetaFormerとしての最低限の機能しか持ち合わせていないにもかかわらず高い精度を達成したことから、MetaFormerの枠組み自体が画像認識に対して高いパフォーマンスを発揮できると主張している。
Domain Adaptive Faster R-CNN for Object Detection in the Wild 論文紹介Tsukasa Takagi
Domain Adaptive Faster R-CNN for Object Detection in the Wild
第46回 コンピュータビジョン勉強会@関東 CVPR2018読み会(前編)にて発表したスライドです。
https://kantocv.connpass.com/event/88613/
Tennis swing recognition based on pose estimation and LightGBMYuya Mochimaru
We built a classification model for tennis swings.
There are four types of swings: forehand, backhand, fore slice, and back slice.
article: https://hampen2929.hatenablog.com/entry/2019/09/21/202026
movie: https://www.youtube.com/watch?v=vMhTL8vKuEQ
LiLz Gauge is a service that makes it easy for visual inspections using dedicated IoT cameras and machine learning.
LiLz Gauge : https://lilz.io/lilzgauge/
LiLz Gauge movie:https://youtu.be/ATmJc0DU2S0
Press Release : https://lilz.jp/news/press_release_20190311/
Toward a QoL improvement of ALS patients: Development of the Full-body P300-b...Takumi Kodama
Kodama T, Makino S, Rutkowski TM. Toward a QoL improvement of ALS patients: Development of the Full-body P300-based Tactile Brain--Computer Interface. In: Proceedings of 2016 AEARU Young Researchers International Conference (YRIC-2016). University of Tsukuba; 2016. p. 5.
「解説資料」MetaFormer is Actually What You Need for VisionTakumi Ohkuma
'MetaFormer is Actually What You Need for Vision' の論文の解説資料
近年画像認識において高い精度を実現しているVision TransformerやMLP-Mixer等の非CNN系のモデルを、Embedding、Tokenの混合、Channel毎のMLP の3つを構成要素としてもつモデル群「MetaFormer」として一般化し、このMetaFormerが高い精度を実現する為に必要な枠組みあると主張した研究。
MetaFormerの枠組みにおいて、その構成要素の一つである「Tokenの混合」としてAttentionを採用したものがTransformer、MLPを採用したものがMLP-Mixer等のMLP系モデルである。
さらに、本研究ではこのTokenの混合として、極力シンプルな演算であるPoolingを採用した「PoolFormer」を提案し、複数の画像認識タスクで従来のモデルに劣らない精度を実現した。
PoolFormerはMetaFormerとしての最低限の機能しか持ち合わせていないにもかかわらず高い精度を達成したことから、MetaFormerの枠組み自体が画像認識に対して高いパフォーマンスを発揮できると主張している。
Domain Adaptive Faster R-CNN for Object Detection in the Wild 論文紹介Tsukasa Takagi
Domain Adaptive Faster R-CNN for Object Detection in the Wild
第46回 コンピュータビジョン勉強会@関東 CVPR2018読み会(前編)にて発表したスライドです。
https://kantocv.connpass.com/event/88613/
Tennis swing recognition based on pose estimation and LightGBMYuya Mochimaru
We built a classification model for tennis swings.
There are four types of swings: forehand, backhand, fore slice, and back slice.
article: https://hampen2929.hatenablog.com/entry/2019/09/21/202026
movie: https://www.youtube.com/watch?v=vMhTL8vKuEQ
LiLz Gauge is a service that makes it easy for visual inspections using dedicated IoT cameras and machine learning.
LiLz Gauge : https://lilz.io/lilzgauge/
LiLz Gauge movie:https://youtu.be/ATmJc0DU2S0
Press Release : https://lilz.jp/news/press_release_20190311/
Toward a QoL improvement of ALS patients: Development of the Full-body P300-b...Takumi Kodama
Kodama T, Makino S, Rutkowski TM. Toward a QoL improvement of ALS patients: Development of the Full-body P300-based Tactile Brain--Computer Interface. In: Proceedings of 2016 AEARU Young Researchers International Conference (YRIC-2016). University of Tsukuba; 2016. p. 5.
32. 参考文献
• 山本圭一 (2013) サイレントスピーチBCI―Single-trial EEGs を利用したホルマント周波
数予測― 平成24年度修士論文.
• Deecke L et al. (1986) Bereitschaftspotential preceding speech after holding breath.
Experimental Brain Research 65:219-223.
• Young S et al. (2009) The HTK Book (for HTK Version 3.4). Cambridge University
Engineering Department.
• Wu W et al. (2006) Bayesian population decoding of motor cortical activity using a
Kalman filter. Neural Computation 18:80-118.
• Kalman RE (1960) A New Approach to Liner Filtering and Prediction Problems. J.
Basic Eng. 82:35-45.