文献紹介：Efficient Multi-Domain Learning by Covariance Normalization

•

0 likes•6 views

Yunsheng Li, Nuno Vasconcelos; Efficient Multi-Domain Learning by Covariance Normalization, Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2019, pp. 5424-5433 https://openaccess.thecvf.com/content_CVPR_2019/html/Li_Efficient_Multi-Domain_Learning_by_Covariance_Normalization_CVPR_2019_paper.html

Technology

Efficient Multi-Domain
Learning by Covariance
Normalization
Yunsheng Li, Nuno Vasconcelos, La Jolla
CVPR2019
大見一樹（名工大玉木研）
論文紹介2021/11/5

概要
◼マルチドメイン学習とは
• 複数ドメインに有効な単一モデルの学習
• 通常の学習はドメイン毎にモデルが必要
◼マルチドメイン学習モデル
• ドメイン非依存パラメータ
• 割合が大きい
• ドメイン依存パラメータ（アダプタ）
• 割合が小さい
• 少量のパラメータで追加ドメインに対応
◼提案手法
• Covariance Normalization (CovNorm)
• 最適かつ小容量なアダプタの提案
ドメイン間で
共通のパラメータ
ドメイン依存
パラメータ

関連研究
◼series residual adapter (Rebuffi+, NIPS2017)
• アダプタを直列に追加
• スキップ構造でオーバーフィッティング防止
• アダプタがモデルの10%
◼parallel residual adapter (Rebuffi+, CVPR2018)
• アダプタを並列に追加
• SVD分解を用いた次元削減と近似
• あらかじめ次元の圧縮率を指定
• アダプタがモデルの5%
◼提案手法
• 主成分分析で最適な次元削減
• アダプタがモデルの0.51%
series adapter parallel adapter

提案手法の考え方
◼アダプタの目的
• 固有のドメインで学習したモデル（ドメイン特化型）と同じ特徴量の抽出
• ドメイン特化型モデルはそのドメインにおいて最適な特徴量と考えられるため
◼ ソースドメイン（大規模データセット）で学習
• ドメイン非依存パラメータとする
◼ ターゲットドメインで学習
• 最も最適な特徴量と考えられる
• しかしドメインごとにパラメータの保持が必要
◼ アダプタを追加
• 最適な特徴量に近づける
• 𝑦′′を𝑦′に近づける
ドメイン非依存パラメータ
最適な特徴量
ソース
ドメイン
ターゲット
ドメイン
ターゲット
ドメイン
最適な特徴量
とは言えない
アダプタで
最適な特徴量に近づける

CovNormの概要
ID ID
ドメインS
train train
1. ソースでドメイン非依存パラメータを学習
A
ドメインT
x y
train train train
2. アダプタを追加しターゲットで全パラメータを学習
ID ID
Anew
ドメインT
fix fix
train
5. アダプタのみを小さな学習率で学習
whitening
matrix
coloring
matrix
3. 中間特徴量を主成分分析
4. アダプタ作成
• 次元削減
• アダプタ近似

中間特徴量の主成分分析
1. 特徴量を主成分分析
2. 次元削減
累積寄与率を用いて次元削減
3. パラメータ近似
次元の
不一致を調整
whitening
matrix
coloring
matrix カラーリング
ホワイトニング

実験結果
◼デカスロンによる実験（下）
• 画像を72x72にリサイズ
◼7つのデータセットによる実験（右）
• 画像をリサイズしない
◼結果
• 既存手法より高性能
• 既存手法より低容量
7つのデータセットによる性能
デカスロンによる性能

まとめ
◼CovNorm
• 主成分分析を用いたマルチドメイン学習
• 累積寄与率を用いた次元削減
• 特異値分解より効果的
• 既存手法より高性能
• アダプタが既存手法より低容量

Recently uploaded

Generating Automatic Feedback on UI Mockups with Large Language Models

harmonylab

LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル

CRI Japan, Inc.

ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---

Matsushita Laboratory

我々はこれまで，新たなモノを産出する過程において「便利にすること」によって副次的に生じる課題を「便利の副作用」と定義し，その低減を目的としてアイディアの発想支援手法を提案してきた．これまでの研究では，便利前後の行為の増減に着目することにより便利の副作用への気づきの誘発が示唆されたものの，行為の増減の提示による便利の副作用への気づきへの影響は十分に検討できていなかった．そのため，本稿では行為の提示により便利の副作用に気づき，それを防いだアイディアの発想の支援が可能かの検証を目的として実験を行い，その有効性について検証する．実験では，行為の増減の提示の有無によりアイディア発想にどのような影響を与えるか検証を行う．

JSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさ

0207sukipio

This is the company presentation material of RIZAP Technologies, Inc.

chiefujita1

遺伝的アルゴリズムと知識蒸留による大規模言語モデル（LLM）の学習とハイパーパラメータ最適化

t m

オープンエンドな進化から着想を得て、個々の大規模言語モデル（LLM）が、グループとして学習を進めながら、ノームエージェントとして機能するという概念を探求しています。これは、単一のモデルでは難しい複雑な問題を解決することを目的としています。具体的な方法として、遺伝的アルゴリズムと知識蒸留を組み合わせた学習プロセスを提案しています。知識蒸留によって学習を進め、同時に遺伝的アルゴリズムでハイパーパラメータを最適化することで、より効率的な学習を目指します。ドメインタスクとして、指示からPythonコードを生成するコード生成タスクを選択しました。実験では、学習に3つの学習モデルと1つの教師モデルを使用しました。その結果、HumanEvalのpass@1で精度が1.2%向上し、学習が進むにつれて学習率が最適化された兆候が見られました。しかし、大幅な精度向上を達成し、さまざまなハイパーパラメータを最適化するには、まだ課題が残っています。

キンドリルネットワークアセスメントサービスご紹介今のネットワーク環境は大丈夫？調査〜対策までご支援します

Takayuki Nakayama