データ拡張 (Data Augmentation) を学習中に使い分けるRefined Data Augmentationについて解説しました。
He, Zhuoxun, et al. "Data augmentation revisited: Rethinking the distribution gap between clean and augmented data." arXiv preprint arXiv:1909.09148 (2019).
データ拡張 (Data Augmentation) を学習中に使い分けるRefined Data Augmentationについて解説しました。
He, Zhuoxun, et al. "Data augmentation revisited: Rethinking the distribution gap between clean and augmented data." arXiv preprint arXiv:1909.09148 (2019).
出典:Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, Sergey Zagoruyko
Facebook AI
公開URL : https://arxiv.org/abs/2005.12872
概要:Detection Transformer(DETRという)という新しいフレームワークによって,non-maximum-supressionやアンカー生成のような人手で設計する必要なく、End-to-Endで画像からぶった検出を行う手法を提案しています。物体検出を直接集合予測問題として解くためのtransformerアーキテクチャとハンガリアン法を用いて二部マッチングを行い正解と予測の組み合わせを探索しています。Attentionを物体検出に応用しただけでなく、競合手法であるFaster R-CNNと同等の精度を達成しています。
Variational Template Machine for Data-to-Text Generationharmonylab
公開URL:https://openreview.net/forum?id=HkejNgBtPB
出典:Rong Ye, Wenxian Shi, Hao Zhou, Zhongyu Wei, Lei Li : Variational Template Machine for Data-to-Text Generation, 8th International Conference on Learning Representations(ICLR2020), Addis Ababa, Ethiopia (2020)
概要:Table形式の構造化データから文章を生成するタスク(Data-to-Text)において、Variational Auto Encoder(VAE)ベースの手法Variational Template Machine(VTM)を提案する論文です。Encoder-Decoderモデルを用いた既存のアプローチでは、生成文の多様性に欠けるという課題があります。本論文では多様な文章を生成するためにはテンプレートが重要であるという主張に基づき、テンプレートを学習可能なVAEベースの手法を提案します。提案手法では潜在変数の空間をテンプレート空間とコンテンツ空間に明示的に分離することによって、正確で多様な文生成が可能となります。また、table-textのペアデータだけではなくtableデータのないraw textデータを利用した半教師あり学習を行います。
Invariant Information Clustering for Unsupervised Image Classification and Se...harmonylab
紹介論文
Invariant Information Clustering for Unsupervised Image Classification and Segmentation
Xu J, João F. Henriques, Andrea Vedaldi
出典:Xu J, João F. Henriques, Andrea Vedaldi:Invariant Information Clustering forUnsupervised Image Classification and Segmentation, International Conference on Computer Vision (ICCV 2019), Seoul, Korea
概要:本論文では、正解ラベルを必要としない教師なし学習手法IICを提案しています。元画像に一般的なランダム変換を加えたペアを作成し、元画像とペアの相互情報量を最大化するよう学習を行います。画像のクラス分類・セグメンテーションタスクにおいて、8つのベンチマークでSOTAを達成しています。さらに、半教師あり学習にすることで、従来の教師あり学習精度を超える結果を得ています
Towards Knowledge-Based Personalized Product Description Generation in E-comm...harmonylab
出典:Qibin Chen, Junyang Lin, Yichang Zhang, Hongxia Yang, Jingren Zhou, Jie Tang : Towards Knowledge-Based Personalized Product Description Generation in E-commerce, Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining (KDD2019), Anchorage, Alaska, USA, (2019)
公開URL:https://arxiv.org/abs/1903.12457
概要:ECサイトにおける商品説明文の自動生成に関する論文です。商品タイトルから商品説明文を生成するEncoder-Decoderモデル(Base lineモデル)を考えます。このBase lineモデルによって生成される文章は一般的で曖昧な記述をすることが多くあまり使い物にならないとされています。商品説明文に必要な要素は次の2点であると本論文では主張しています。1.顧客の興味を促進するために、商品説明文は顧客の好みに基づいてパーソナライズされる必要があるとされています。2.顧客の意思決定に役立つ説明文には、商品の関連知識が含まれている必要があります。本論文では、パーソナライズされた情報量の多い説明文を生成するために、ユーザカテゴリや外部の知識ベースから取得してきた知識に基づいて商品紹介文を生成するKnowledge Based Personalizedモデルを提案します。
出典:Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, Sergey Zagoruyko
Facebook AI
公開URL : https://arxiv.org/abs/2005.12872
概要:Detection Transformer(DETRという)という新しいフレームワークによって,non-maximum-supressionやアンカー生成のような人手で設計する必要なく、End-to-Endで画像からぶった検出を行う手法を提案しています。物体検出を直接集合予測問題として解くためのtransformerアーキテクチャとハンガリアン法を用いて二部マッチングを行い正解と予測の組み合わせを探索しています。Attentionを物体検出に応用しただけでなく、競合手法であるFaster R-CNNと同等の精度を達成しています。
Variational Template Machine for Data-to-Text Generationharmonylab
公開URL:https://openreview.net/forum?id=HkejNgBtPB
出典:Rong Ye, Wenxian Shi, Hao Zhou, Zhongyu Wei, Lei Li : Variational Template Machine for Data-to-Text Generation, 8th International Conference on Learning Representations(ICLR2020), Addis Ababa, Ethiopia (2020)
概要:Table形式の構造化データから文章を生成するタスク(Data-to-Text)において、Variational Auto Encoder(VAE)ベースの手法Variational Template Machine(VTM)を提案する論文です。Encoder-Decoderモデルを用いた既存のアプローチでは、生成文の多様性に欠けるという課題があります。本論文では多様な文章を生成するためにはテンプレートが重要であるという主張に基づき、テンプレートを学習可能なVAEベースの手法を提案します。提案手法では潜在変数の空間をテンプレート空間とコンテンツ空間に明示的に分離することによって、正確で多様な文生成が可能となります。また、table-textのペアデータだけではなくtableデータのないraw textデータを利用した半教師あり学習を行います。
Invariant Information Clustering for Unsupervised Image Classification and Se...harmonylab
紹介論文
Invariant Information Clustering for Unsupervised Image Classification and Segmentation
Xu J, João F. Henriques, Andrea Vedaldi
出典:Xu J, João F. Henriques, Andrea Vedaldi:Invariant Information Clustering forUnsupervised Image Classification and Segmentation, International Conference on Computer Vision (ICCV 2019), Seoul, Korea
概要:本論文では、正解ラベルを必要としない教師なし学習手法IICを提案しています。元画像に一般的なランダム変換を加えたペアを作成し、元画像とペアの相互情報量を最大化するよう学習を行います。画像のクラス分類・セグメンテーションタスクにおいて、8つのベンチマークでSOTAを達成しています。さらに、半教師あり学習にすることで、従来の教師あり学習精度を超える結果を得ています
Towards Knowledge-Based Personalized Product Description Generation in E-comm...harmonylab
出典:Qibin Chen, Junyang Lin, Yichang Zhang, Hongxia Yang, Jingren Zhou, Jie Tang : Towards Knowledge-Based Personalized Product Description Generation in E-commerce, Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining (KDD2019), Anchorage, Alaska, USA, (2019)
公開URL:https://arxiv.org/abs/1903.12457
概要:ECサイトにおける商品説明文の自動生成に関する論文です。商品タイトルから商品説明文を生成するEncoder-Decoderモデル(Base lineモデル)を考えます。このBase lineモデルによって生成される文章は一般的で曖昧な記述をすることが多くあまり使い物にならないとされています。商品説明文に必要な要素は次の2点であると本論文では主張しています。1.顧客の興味を促進するために、商品説明文は顧客の好みに基づいてパーソナライズされる必要があるとされています。2.顧客の意思決定に役立つ説明文には、商品の関連知識が含まれている必要があります。本論文では、パーソナライズされた情報量の多い説明文を生成するために、ユーザカテゴリや外部の知識ベースから取得してきた知識に基づいて商品紹介文を生成するKnowledge Based Personalizedモデルを提案します。
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matchingharmonylab
公開URL:https://arxiv.org/pdf/2404.19174
出典:Guilherme Potje, Felipe Cadar, Andre Araujo, Renato Martins, Erickson R. ascimento: XFeat: Accelerated Features for Lightweight Image Matching, Proceedings of the 2024 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) (2023)
概要:リソース効率に優れた特徴点マッチングのための軽量なアーキテクチャ「XFeat(Accelerated Features)」を提案します。手法は、局所的な特徴点の検出、抽出、マッチングのための畳み込みニューラルネットワークの基本的な設計を再検討します。特に、リソースが限られたデバイス向けに迅速かつ堅牢なアルゴリズムが必要とされるため、解像度を可能な限り高く保ちながら、ネットワークのチャネル数を制限します。さらに、スパース下でのマッチングを選択できる設計となっており、ナビゲーションやARなどのアプリケーションに適しています。XFeatは、高速かつ同等以上の精度を実現し、一般的なラップトップのCPU上でリアルタイムで動作します。
セル生産方式におけるロボットの活用には様々な問題があるが,その一つとして 3 体以上の物体の組み立てが挙げられる.一般に,複数物体を同時に組み立てる際は,対象の部品をそれぞれロボットアームまたは治具でそれぞれ独立に保持することで組み立てを遂行すると考えられる.ただし,この方法ではロボットアームや治具を部品数と同じ数だけ必要とし,部品数が多いほどコスト面や設置スペースの関係で無駄が多くなる.この課題に対して音𣷓らは組み立て対象物に働く接触力等の解析により,治具等で固定されていない対象物が組み立て作業中に運動しにくい状態となる条件を求めた.すなわち,環境中の非把持対象物のロバスト性を考慮して,組み立て作業条件を検討している.本研究ではこの方策に基づいて,複数物体の組み立て作業を単腕マニピュレータで実行することを目的とする.このとき,対象物のロバスト性を考慮することで,仮組状態の複数物体を同時に扱う手法を提案する.作業対象としてパイプジョイントの組み立てを挙げ,簡易な道具を用いることで単腕マニピュレータで複数物体を同時に把持できることを示す.さらに,作業成功率の向上のために RGB-D カメラを用いた物体の位置検出に基づくロボット制御及び動作計画を実装する.
This paper discusses assembly operations using a single manipulator and a parallel gripper to simultaneously
grasp multiple objects and hold the group of temporarily assembled objects. Multiple robots and jigs generally operate
assembly tasks by constraining the target objects mechanically or geometrically to prevent them from moving. It is
necessary to analyze the physical interaction between the objects for such constraints to achieve the tasks with a single
gripper. In this paper, we focus on assembling pipe joints as an example and discuss constraining the motion of the
objects. Our demonstration shows that a simple tool can facilitate holding multiple objects with a single gripper.
2. NeurIPS2019に参加してきたので参加報告
• Thirty-third Conference on Neural Information
Processing Systems
• Vancouver Convention Center, Vancouver CANADA
Schedule
• NeurIPS EXPO DEC 8th
• TUTORIALS DEC 9th
• CONFERENCE & DEMONSTRATIONS DEC 10th - 12th
• WORKSHOPS & COMPETITIONS DEC 13th - 14th
2
NeurIPS2019参加報告
18. Deep Learning with Bayesian
Principles
• Deep Learning+ベイズのチュートリアル.
• ベイジアンと深層学習の研究者の橋渡し
をして,両者の強みを組み合わせることで
より難しい問題を解決するために協力する
意欲を高めることが目的.
19. Interpretable Comparison of
Distributions and Models
• モデルおよび分布同士の評価を行うため
の,ノンパラメトリックな手法についての
チュートリアル
• Wasserstein distances
• The Maximum Mean Discrepancy
• 𝜙-divergence
23. NeurIPS2019
Paper Awards
23
Outstanding Paper Awards
• Distribution-Independent PAC Learning of Halfspaces with
Massart Noise
Outstanding New Directions Paper Awards
• Uniform convergence may be unable to explain
generalization in deep learning
• Fast and Accurate Least-Mean-Squares Solvers
Honorable Mention Outstanding New Directions Paper Award
• Putting An End to End-to-End: Gradient-Isolated Learning of
Representations
• Scene Representation Networks: Continuous 3D-Structure-
Aware Neural Scene Representations
Test of Time Award
• Dual Averaging Method for Regularized Stochastic Learning
and Online Optimization
24. Categories
24
Data, Challenges, Implementations, and Software
• Data Sets or Data Repositories
• Software Toolkits
• Benchmarks
• Virtual Environments
Applications
• Privacy, Anonymity, and Security
• Computer Vision
Theory
• Learning Theory
• Spaces of Functions and Kernels
Deep Learning
• Optimization for Deep Networks
• Generative Models
Algorithms
• Unsupervised Learning
• Regression
• Adaptive Data Analysis
37. The Cells Out of Sample (COOS) dataset
and benchmarks for measuring out-of-
sample generalization of image
classifiers
Alex Lu, et al.
Abstract
Out-of-samplesに対するモデルの汎化性能
を評価するため,共変量シフトを含むよ
うなデータセットであるCOOS-7(Cells
Out Of Sample 7-Class)を作成した.この
データセットは132,209件のマウスの細胞
データから成り,データの分布が推移す
るような問題設定におけるモデルのロバ
ストネスの評価に使われることを期待す
る.
37
Links & References
• 論文
38. ObjectNet: A large-scale bias-
controlled dataset for pushing the
limits of object recognition models
Andrei Barbu, et al.
Abstract
背景,角度,撮影視点が完全にランダム
な新しい物体認識用のデータセットであ
るObjectNetを提案.データセットのサイ
ズはImageNetのテストデータと同等の
50,000件で,多くの物体が画像の中央に
位置するImageNetとは異なり意図的に視
点にばらつきを持たせている.
38
Links & References
• 論文
39. Park: An Open Platform for
Learning-Augmented Computer
Systems
Hongzi Mao, et al.
Abstract
強化学習研究者の実験のためのプラット
フォームであるParkを提案.Parkは12の
最適化問題を含み,それらの全てを一つ
の統一的なインターフェースから扱うこ
とができる.加えて,既存の強化学習ア
ルゴリズムによるParkの12の問題に対す
るパフォーマンスを紹介.
39
Links & References
• 論文
• https://github.com/park-project/park
40. STREETS: A Novel Camera Network
Dataset for Traffic Flow
Corey Snyder, Minh Do
Abstract
交通流の新しいデータセットを提案.シ
カゴに設置してある定点webカメラの映
像を使って構築した. 既存の交通流デー
タセットの多くには,センサー間の関係
を説明する一貫したグラフデータは存在
しない.これに対して,提案データセッ
トではセンサー間の有向グラフを構築し,
有用性を高めた.
40
Links & References
• 論文
63. Learning Conditional Deformable
Templates with Convolutional
Networks
Adrian Dalca, Marianne Rakic, John Guttag, Mert
Sabuncu
63
Abstract
Deformable templateの構築のための学習
アルゴリズムの提案.既存の手法の多く
は反復法を採用しているために計算コス
トが非常に問題となっていた.CNNベー
スの提案手法は精度と計算コストを両立.
Links & References
• 論文
Contribution & Novelty
提案手法はMRIの被験者の年齢や性別などのインスタンス属性を指定した条件付き
template関数を学習可能.
64. Ask not what AI can do, but
what AI should do: Towards a
framework of task delegability
Brian Lubars · Chenhao Tan
64
Abstract
AIモデルが人間の意思決定に介入できる
ための必要な要素として,動機,難しさ,
リスクおよび信頼性を考察.人間の経験
的好みを分析するために,様々な分野か
ら100のタスクを調べた.傾向として,
全てをAIの決定に委ねてしまうような状
況よりも,人間がリードしてタスクを進
めるようなHuman-In-The-Loopの状況設定
が好まれることがわかった.
Links & References
• 論文
Contribution & Novelty
AIによる自動化についての人間が感じる好ましさについての分析.AI研究についての今
後の方向性を決める足がかりになることを目的とした研究.
65. References
• Diakonikolas, Ilias, Themis Gouleakis, and Christos Tzamos. "Distribution-Independent PAC Learning of Halfspaces with Massart
Noise." Advances in Neural Information Processing Systems. 2019.
• Nagarajan, Vaishnavh, and J. Zico Kolter. "Uniform convergence may be unable to explain generalization in deep learning." Advances in
Neural Information Processing Systems. 2019.
• Uppal, Ananya, Shashank Singh, and Barnabas Poczos. "Nonparametric Density Estimation & Convergence Rates for GANs under Besov IPM
Losses." Advances in Neural Information Processing Systems. 2019.
• Arpit, Devansh, Víctor Campos, and Yoshua Bengio. "How to initialize your network? robust initialization for weightnorm & resnets."
Advances in Neural Information Processing Systems. 2019.
• Lombardo, Salvator, et al. "Deep Generative Video Compression." Advances in Neural Information Processing Systems. 2019.
• Ravuri, Suman, and Oriol Vinyals. "Classification accuracy score for conditional generative models." Advances in Neural Information
Processing Systems. 2019.
• Yadav, Chhavi, and Léon Bottou. "Cold case: The lost mnist digits." Advances in Neural Information Processing Systems. 2019.
• Lu, Alex, et al. "The Cells Out of Sample (COOS) dataset and benchmarks for measuring out-of-sample generalization of image classifiers."
Advances in Neural Information Processing Systems. 2019.
• Barbu, Andrei, et al. "ObjectNet: A large-scale bias-controlled dataset for pushing the limits of object recognition models." Advances in
Neural Information Processing Systems. 2019.
• Mao, Hongzi, et al. "Park: An Open Platform for Learning-Augmented Computer Systems." Advances in Neural Information Processing
Systems. 2019.
• Snyder, Corey, and Minh Do. "STREETS: A Novel Camera Network Dataset for Traffic Flow." Advances in Neural Information Processing
Systems. 2019.
• Paszke, Adam, et al. "PyTorch: An imperative style, high-performance deep learning library." Advances in Neural Information Processing
Systems. 2019.
• Laue, Sören, Matthias Mitterreiter, and Joachim Giesen. "GENO--GENeric Optimization for Classical Machine Learning." Advances in Neural
Information Processing Systems. 2019.
• Raff, Edward. "A Step Toward Quantifying Independently Reproducible Machine Learning Research." Advances in Neural Information
Processing Systems. 2019.
65
66. References
• Löwe, Sindy, Peter O'Connor, and Bastiaan Veeling. "Putting An End to End-to-End: Gradient-Isolated Learning of Representations."
Advances in Neural Information Processing Systems. 2019.
• Gopalan, Parikshit, Vatsal Sharan, and Udi Wieder. "Pidforest: anomaly detection via partial identification." Advances in Neural Information
Processing Systems. 2019.
• Maalouf, Alaa, Ibrahim Jubran, and Dan Feldman. "Fast and accurate least-mean-squares solvers." Advances in Neural Information
Processing Systems. 2019.
• Roelofs, Rebecca, et al. "A Meta-Analysis of Overfitting in Machine Learning." Advances in Neural Information Processing Systems. 2019.
• Ligett, Katrina, and Moshe Shenfeld. "A necessary and sufficient stability notion for adaptive generalization dvances in Neural Information
Processing Systems. 2019.
• Mania, Horia, et al. "Model similarity mitigates test set overuse." Advances in Neural Information Processing Systems. 2019.
• Yun, Se-Young, and Alexandre Proutiere. "Optimal Sampling and Clustering in the Stochastic Block Model." Advances in Neural Information
Processing Systems. 2019.
• Ilyas, Andrew, et al. "Adversarial examples are not bugs, they are features." Advances in Neural Information Processing Systems. 2019.
• Song, Chunjin, et al. "ETNet: Error Transition Network for Arbitrary Style Transfer." Advances in Neural Information Processing Systems.
2019.
• Sitzmann, Vincent, Michael Zollhöfer, and Gordon Wetzstein. "Scene representation networks: Continuous 3D-structure-aware neural
scene representations." Advances in Neural Information Processing Systems. 2019.
• Bucher, Maxime, et al. "Zero-Shot Semantic Segmentation." Advances in Neural Information Processing Systems. 2019.
• Xu, Qiangeng, et al. "Disn: Deep implicit surface network for high-quality single-view 3d reconstruction." Advances in Neural Information
Processing Systems. 2019.
• Jiang, Yangbangyan, et al. "DM2C: Deep Mixed-Modal Clustering." Advances in Neural Information Processing Systems. 2019.
• Dalca, Adrian, et al. "Learning conditional deformable templates with convolutional networks." Advances in neural information processing
systems. 2019.
• Lubars, Brian, and Chenhao Tan. "Ask not what AI can do, but what AI should do: Towards a framework of task delegability." Advances in
Neural Information Processing Systems. 2019.
66