3. どんなもの?(概要)
先行研究と比べて何がすごい?
技術の手法や肝は?
議論はある?
どうやって有効だと検証した?(実験内容)
次に読むべき論文は?
○[32] J. Kauffmann, K.-R. Müller, and G. Montavon. Towards explaining anomalies: a deep taylor
decomposition of one-class models. Pattern Recognition, 101:107198, 2020.
○[60] W. Samek, G. Montavon, S. Lapuschkin, C. J. Anders, and K.-R. Müller. Toward
interpretable machine learning: Transparent deep neural networks and beyond. arXiv preprint
arXiv:2003.07631, 2020. (深いdeep AD)
○一般的な画像異常検知で、古典的な教師あり学習を用いるべきと主張しているわけ
ではない。
○コミュニティが深いdeep AD(教師なし学習)の重要性を評価するために、それらはよ
り複雑で困難なタスクに移動する時が来たのではないか。
(工業用品質管理や医療診断で、異常位置に注釈をつける等)
【内容】
教師なし異常検知、教師なし異常検知+OE、教師あり異常検知の3手法の比較。
ネットワークアーキテクチャと最適化手法を揃えて実験を行う。
【評価指標】AUC (Area Under the ROC Curve)
【使用データセット】MNIST、CIFAR-10、ImageNet-1K
○異常検知では一般的に教師なし学習(ex.AutoEncoder)を用いていたが、
教師あり学習(単純な二値分類)をしてみた。
○異常サンプルは32枚以上が望ましい。
先行研究に見直しをかけて、各手法の向き不向きを明らかにしたということ
○「正常データのみで学習させる」という画像異常検知の従来のアプローチを再考する
○少量の異常サンプルと、正常サンプルで教師あり学習(二値分類)を行い、
SOTA(state-of-the-art : 最高水準)を達成
○異常サンプルの解像度が高い場合には、異常サンプルを使うアプローチは有効
Rethinking Assumptions in Deep Anomaly Detection
深い異常検出における仮定の再考
[Submitted on 30 May 2020] / Lukas Ruff, Robert A. Vandermeulen, Billy Joe Franks, Klaus-Robert Müller, Marius Kloft
https://arxiv.org/pdf/2006.00339.pdf
4. どんなもの?
先行研究と比べて何がすごい?
技術の手法や肝は?
議論はある?
どうやって有効だと検証した?
次に読むべき論文は?
[21] Elise van der Pol. Deep reinforcement learning for coordination in traffic light control.
Master’s thesis, University of Amsterdam, 2016.
○マトリックスの解像度が低いと、車両を認識できずに信号が不適切なをアクションを
起こす可能性がある
○DQnと転移学習の組み合わせは有望ではあるが、アプローチの信頼性を確保するには
さらに多くの作業が必要
[21] Elise van der Pol. Deep reinforcement learning for coordination in traffic light control.
Master’s thesis, University of Amsterdam, 2016.
○詳細については上記参照との記載
○この分野のディープラーニングを使わない先行研究の手法と、平均移動時間を指標に
比較
○交通情報を視覚的に捉えて画像として扱う
○報酬関数の工夫。必ず負の値をとるペナルティーとして定義。
(減速具合、信号待ちか、急ブレーキをかけているか、渋滞かどうか、信号機が色を変
えたか)
○複数の信号機を同時に学習させるのが困難なため転移学習を使用
○一定時間経つと、先行研究より平均移動時間が約半分という成果を上げた
○交通渋滞は大きな経済損失で、EUではGDPの1%に相当すると推測されている
○信号機の制御を深層強化学習(DQN)を用いて改善して、平均移動時間を少なくした
い
○学習の指標となる新しい報酬関数の提案
Deep Reinforcement Learning for Coordination in Traffic Light Control
信号制御のための協調型強化学習器
Published 2016 / Elise van der Pol, Frans A. Oliehoek
https://www.fransoliehoek.net/docs/VanDerPol16LICMAS.pdf
5. どんなもの?
先行研究と比べて何がすごい?
技術の手法や肝は?
議論はある?
どうやって有効だと検証した?
次に読むべき論文は?
134. Jason Y, Jef C, Anh N, Thomas F, Hod L. Understanding neural networks through deep
visualization. In: European
conference on computer vision (ECCV). Berlin: Springer; 2015. p. 818–33.
CNN視覚化に関すること論文。深い可視化方法によるニューラルネットワークの理解
○Data Augmentationの手法の中には、画像分類モデルを改善させる理由が明らかになっ
ていないものがある。(PatchSh uffleの正規化やSamplePairing等)
○ニューラルネットワークによって学習された表現の解釈が困難
○拡張アルゴリズムは、traindataとtestdataが同じ分布から抽出されているという仮定の
下で最もよく機能する
○各Data Augmentation手法について、有り無しの場合で精度比較
○geometric transformations, color space augmentations, kernel flters, mixing images, random
erasing, feature space augmentation, adversarial training, generative adversarial networks, neural
style transfer, and meta-learning
○メタ学習を用いたもの
AutoAugment(最適なgt), Smart Augment(最適なmi), Neural Augmentation(最適なnst)
○画像分類タスクの必要不可欠な「Data Augmentation」の体系
○Data Augmentationの各手法のメリット・デメリット
○Data Augmentationは実装が簡単な上に大きな効果を発揮
A survey on Image Data Augmentation for Deep Learning
ディープラーニング用の画像データ拡張に関する調査
Published: 06 July 2019 / Connor Shorten, Taghi M. Khoshgoftaar
https://link.springer.com/content/pdf/10.1186/s40537-019-0197-0.pdf
6. どんなもの?
先行研究と比べて何がすごい?
技術の手法や肝は?
議論はある?
どうやって有効だと検証した?
次に読むべき論文は?
[36] Anh Tuan Nguyen, Tung Thanh Nguyen, and Tien N Nguyen. Lexical statistical machine
translation for language migration. In Proceedings of the 2013 9th Joint Meeting on Foundations
of Software Engineering, pages 651–654, 2013.
プログラミング言語を機械翻訳で翻訳する可能性を調査している論文
○自動トランスコンパイルは、他の開発チームや他のオープンソースからのコードをよ
り簡単に統合出来るようにする事で、プログラマーの作業効率を高める事が期待される
。
○トランスコンパイルの進歩によって、古いプロジェクトを最先端の言語に更新し、将
来のイノベーションを促進する事ができる
○関数レベルでの翻訳を学習、評価
○評価基準:入力が与えられた時に適切な出力になっているかどうか
○C++,Java,Pythonの3言語間の翻訳を852個の並列関数で評価
○教師なし機械翻訳をソースコードに適用してトランスコンパイラを作成
○ベースとなるモデル(TransCoder Model)は、transformerによるエンコーダーとデコー
ダーで構成された、Attention機構を備えたsequence-to-sequence(seq2seq)
現在主流のトランスコンパイラは、ソース言語とターゲット言語の両方の専門知識が必
要で翻訳コストが高いが、
本手法を用いることで翻訳に必要な作業量と専門知識レベルの削減になる。
○プログラミング 言語間の翻訳を自然言語翻訳と同じ考えで実現
○プログラミング 言語の専門知識を必要とせずに、他言語への拡張が可能
○教師なし機械翻訳で翻訳を実現
Unsupervised Translation of Programming Languages
プログラミング言語の教師なし翻訳
[Submitted on 5 Jun 2020 (v1), last revised 5 Aug 2020 (this version, v2)] / Marie-Anne Lachaux, Baptiste Roziere, Lowik Chanussot, Guillaume
Lample
https://arxiv.org/pdf/2006.03511.pdf
7. どんなもの?
先行研究と比べて何がすごい?
技術の手法や肝は?
議論はある?
どうやって有効だと検証した?
次に読むべき論文は?
[So19] Song, Lingxue; Gong, Dihong; Li, Zhifeng; Liu, Changsong; Liu, Wei: Occlusion Robust Face
Recognition Based on Mask Learning With Pairwise Differential Siamese Network. In: 2019
IEEE/CVF International Conference on Computer Vision, ICCV 2019, Seoul, Korea (South),
October 27 - November 2, 2019. pp. 773–782, 2019.
ロバストな顔認識に関する論文
○適切な評価データベースと認識ソリューションを開発する必要がある
○3つの主要な顔認識アルゴリズム(ArcFace, SphereFaze, COST)を用いたマスク着用の影
響を検証
○BL(マスク無、照明無)、M1(マスク有、照明無)、M2(マスク有、照明有)の3パ
ターンを用意して比較
○Genuineスコア分布とImposeスコア分布をプロットし比較
○顔認識アルゴリズムの評価指標とよく使われるEqual Error Rate(EER)、False Match
Rate(FMR)、False Non Match Rate(FNMR)に加え、
顔を検出して特徴量を抽出するプロセスにおける失敗率を表すFailure to Extract Rate(
FTX)も導入している
○コロナウイルスの流行を背景に、非接触型の本人確認としてマスクのまま顔認証でき
るとするサービスが増加したが、性能検証は世界的に不十分。
○既存の顔認識アルゴリズムに対してマスク着用の影響を検証した初めての論文
○調査したすべての顔認識アルゴリズムにおいて、マスク着用によってGenuineとImpose
の分離が難しくなり信頼性が下がるという結果に。
The Effect of Wearing a Mask on Face Recognition Performance: an Exploratory Study
顔認識パフォーマンスに対するマスクの効果:探索的研究
[Submitted on 27 Jul 2020 (v1), last revised 20 Aug 2020 (this version, v2)] /
Naser Damer, Jonas Henry Grebe, Cong Chen, Fadi Boutros, Florian Kirchbuchner, Arjan Kuijper
https://arxiv.org/pdf/2007.13521.pdf