SlideShare a Scribd company logo
1 of 26
Download to read offline
Komachi Lab
M1 宮崎亮輔
2015/06/24
Representation Learning Using Multi-Task Deep Neural Networks

for Semantic Classification and Information Retrieval
!
Xiaodong Liu, Jianfeng Gao, Xiaodong He, Li Deng, Kevin Duh, Ye-Yi Wang
NAACL読み会2015
※このスライド中の図はこの論文中のものです
Komachi Lab
Abstract
✤ 最近のDNNって目的のタスクに対して直接最適化してなかったり!
✤ 任意のタスクへの教師ありもトレーニングデータの不足とかあるし!
✤ ということでMulti-Task DNN for Representation を提案!
- C&Wとの違い?→今回は処理の違うタスク同士!
- query classification(今回は4ドメイン)とranking for web search!
✤ データ量が増えるだけでなく、

正則化の効果も(ドメインアダプテーション)
2
Komachi Lab
Architecture
3
Komachi Lab
Input
✤ 入力はクエリ or ドキュメント (Bag-of-Words 500k次元)!
- つまり語彙数500kのOne hot vector
4
Komachi Lab
Word Hash Layer
✤ 次の層で文字trigramの空間にmapする(50k次元)!
- 未知語の問題が解消!
- 同単語の複数のspelingが近くにmapされる
5
※単語境界は”#”で表現
Komachi Lab
Semantic Representation Layer
✤ 意味表現(300次元)!
- l2 = f(W1・l1), f() = tanh
6
Komachi Lab
Task-Specific Layer
7
✤ タスク固有中間表現(128次元)!
- l3 = f(Wt
2・l2) , t = task!
- 入力がクエリ: l3 = Q, ドキュメント: l3 = D
クエリ分類タスク:
Komachi Lab
Task-Specific Layer
8
,クエリ分類クエリ分類
✤ タスク固有中間表現(128次元)!
- l3 = f(Wt
2・l2) , t = task!
- 入力がクエリ: l3 = Q, ドキュメント: l3 = D
タスク:
Komachi Lab
Task-Specific Layer
9
,web searchクエリ分類 ,クエリ分類
✤ タスク固有中間表現(128次元)!
- l3 = f(Wt
2・l2) , t = task!
- 入力がクエリ: l3 = Q, ドキュメント: l3 = D
タスク:
Komachi Lab
Task-Specific Layer
10
,web search,web searchクエリ分類 ,クエリ分類
✤ タスク固有中間表現(128次元)!
- l3 = f(Wt
2・l2) , t = task!
- 入力がクエリ: l3 = Q, ドキュメント: l3 = D
タスク:
Komachi Lab
Task-Specific Layer
11
,web search,web searchクエリ分類 ,クエリ分類 ,web search
✤ タスク固有中間表現(128次元)!
- l3 = f(Wt
2・l2) , t = task!
- 入力がクエリ: l3 = Q, ドキュメント: l3 = D
タスク:
Komachi Lab
Task-Specific Layer
12
✤ クエリ分類(ロジスティック回帰)!
- 二値分類(対応するドメインに属すか否か)!
- 一つのクエリは複数のドメインに属すことができる!
- ドメインの数だけ分類器,拡張性がある
g()はシグモイド関数
Komachi Lab
Task-Specific Layer
13
✤ クエリ分類(ロジスティック回帰)!
- 二値分類(対応するドメインに属すか否か)!
- 一つのクエリは複数のドメインに属すことができる!
- ドメインの数だけ分類器,拡張性がある
Komachi Lab
Task-Specific Layer
14
✤ Web検索!
- クエリとのコサイン類似度→softmax!
- P(D|Q)の降順でランキング γはハイパーパラメーター
Komachi Lab
Architecture
15
Komachi Lab
Training
✤ ミニバッチSGD!
✤ クエリ分類: 式(5)!
- クロスエントロピーロス最小化!
❖ Web検索: 式(6)!
- 負の対数尤度最小化!
❖ 初期化には以下の範囲から一様分布
16
※800k iterations, 13hours
Komachi Lab
Experimental Data Sets
✤ クエリ分類には商用検索エンジンのログ1年分

(人手のラベル付き)!
✤ Web検索は12,071のクエリを含み

クエリとドキュメントの組み合わせに5段階の関連度
17
Komachi Lab
Query Classification
✤ クエリ分類のベースライン!
- SVM-word

unigram, bigram, trigram, surface!
- SVM-letter

文字trigram!
- DNN

マルチタスクではないDNN
18
Komachi Lab
Query Classification Results
✤ SVM < DNN :意味表現が重要!
✤ DNN < MT-DNN :マルチタスクは有用
19
※評価はAUC
Komachi Lab
Web Search
✤ Web検索のベースライン!
- 一般的なベースライン

TF-IDF, LDA, etc.!
- DSSM

マルチタスクではないDNN
20
Komachi Lab
Web Search Results
✤ State-of-the-art(DSSM)を超えた

やはりマルチタスクは有用
21
※NDCGはrankingを評価する指標
Komachi Lab
Domain Adaptation
✤ クエリ分類のひとつのドメインを除いてMT-DNNで学習!
- 学習したSemantic Representationを素性にSVMで分類!
- ベースラインはSVM-Word, SVM-letter
22
✤ 一般的なFeed Forward DNNでも比較!
- Semantic RepresentationをW1にしてW2, Wt
3を学習!
- W1をランダムに初期化, W1, W2, Wt
3を学習!
- SVM-Word
Komachi Lab 23
Komachi Lab
Domain Adaptation
✤ クエリ分類のひとつのドメインを除いてMT-DNNで学習!
- 学習したSemantic Representationを素性にSVMで分類!
- ベースラインはSVM-Word, SVM-letter
24
✤ 一般的なFeed Forward DNNでも比較!
- Semantic RepresentationをW1にしてW2, Wt
3を学習!
- W1をランダムに初期化, W1, W2, Wt
3を学習!
- SVM-Word
Komachi Lab 25
Komachi Lab
Conclusion
✤ 分類とランキングという異なるタスクを合わせて

DNNでのマルチタスク学習を提案!
✤ ベースラインを上回り、Web検索ではState-of-the-art!
✤ マルチタスク学習により

ドメインアダプテーションされた表現を学習できた
26

More Related Content

Viewers also liked

Deep Learning for Information Retrieval: Models, Progress, & Opportunities
Deep Learning for Information Retrieval: Models, Progress, & OpportunitiesDeep Learning for Information Retrieval: Models, Progress, & Opportunities
Deep Learning for Information Retrieval: Models, Progress, & OpportunitiesMatthew Lease
 
Information Retrieval with Deep Learning
Information Retrieval with Deep LearningInformation Retrieval with Deep Learning
Information Retrieval with Deep LearningAdam Gibson
 
Instant Question Answering System
Instant Question Answering SystemInstant Question Answering System
Instant Question Answering SystemDhwaj Raj
 
Deep Neural Networks 
that talk (Back)… with style
Deep Neural Networks 
that talk (Back)… with styleDeep Neural Networks 
that talk (Back)… with style
Deep Neural Networks 
that talk (Back)… with styleRoelof Pieters
 
Neural Text Embeddings for Information Retrieval (WSDM 2017)
Neural Text Embeddings for Information Retrieval (WSDM 2017)Neural Text Embeddings for Information Retrieval (WSDM 2017)
Neural Text Embeddings for Information Retrieval (WSDM 2017)Bhaskar Mitra
 
Intro to Deep Learning for Question Answering
Intro to Deep Learning for Question AnsweringIntro to Deep Learning for Question Answering
Intro to Deep Learning for Question AnsweringTraian Rebedea
 
Deep Learning for Information Retrieval
Deep Learning for Information RetrievalDeep Learning for Information Retrieval
Deep Learning for Information RetrievalRoelof Pieters
 
NVIDIA – Inventor of the GPU
NVIDIA – Inventor of the GPUNVIDIA – Inventor of the GPU
NVIDIA – Inventor of the GPUNVIDIA
 
Deep Learning with GPUs in Production - AI By the Bay
Deep Learning with GPUs in Production - AI By the BayDeep Learning with GPUs in Production - AI By the Bay
Deep Learning with GPUs in Production - AI By the BayAdam Gibson
 
Artificial Intelligence: Predictions for 2017
Artificial Intelligence: Predictions for 2017Artificial Intelligence: Predictions for 2017
Artificial Intelligence: Predictions for 2017NVIDIA
 

Viewers also liked (10)

Deep Learning for Information Retrieval: Models, Progress, & Opportunities
Deep Learning for Information Retrieval: Models, Progress, & OpportunitiesDeep Learning for Information Retrieval: Models, Progress, & Opportunities
Deep Learning for Information Retrieval: Models, Progress, & Opportunities
 
Information Retrieval with Deep Learning
Information Retrieval with Deep LearningInformation Retrieval with Deep Learning
Information Retrieval with Deep Learning
 
Instant Question Answering System
Instant Question Answering SystemInstant Question Answering System
Instant Question Answering System
 
Deep Neural Networks 
that talk (Back)… with style
Deep Neural Networks 
that talk (Back)… with styleDeep Neural Networks 
that talk (Back)… with style
Deep Neural Networks 
that talk (Back)… with style
 
Neural Text Embeddings for Information Retrieval (WSDM 2017)
Neural Text Embeddings for Information Retrieval (WSDM 2017)Neural Text Embeddings for Information Retrieval (WSDM 2017)
Neural Text Embeddings for Information Retrieval (WSDM 2017)
 
Intro to Deep Learning for Question Answering
Intro to Deep Learning for Question AnsweringIntro to Deep Learning for Question Answering
Intro to Deep Learning for Question Answering
 
Deep Learning for Information Retrieval
Deep Learning for Information RetrievalDeep Learning for Information Retrieval
Deep Learning for Information Retrieval
 
NVIDIA – Inventor of the GPU
NVIDIA – Inventor of the GPUNVIDIA – Inventor of the GPU
NVIDIA – Inventor of the GPU
 
Deep Learning with GPUs in Production - AI By the Bay
Deep Learning with GPUs in Production - AI By the BayDeep Learning with GPUs in Production - AI By the Bay
Deep Learning with GPUs in Production - AI By the Bay
 
Artificial Intelligence: Predictions for 2017
Artificial Intelligence: Predictions for 2017Artificial Intelligence: Predictions for 2017
Artificial Intelligence: Predictions for 2017
 

Similar to Representation Learning Using Multi-Task Deep Neural Networks
for Semantic Classification and Information Retrieval

関数プログラミング入門
関数プログラミング入門関数プログラミング入門
関数プログラミング入門masatora atarashi
 
Domino Query Language (DQL)
Domino Query Language (DQL)Domino Query Language (DQL)
Domino Query Language (DQL)Haruyuki Nakano
 
[豆ナイト]Java small object programming
[豆ナイト]Java small object programming[豆ナイト]Java small object programming
[豆ナイト]Java small object programmingYuichi Hasegawa
 
教師なしオブジェクトマッチング(第2回ステアラボ人工知能セミナー)
教師なしオブジェクトマッチング(第2回ステアラボ人工知能セミナー)教師なしオブジェクトマッチング(第2回ステアラボ人工知能セミナー)
教師なしオブジェクトマッチング(第2回ステアラボ人工知能セミナー)STAIR Lab, Chiba Institute of Technology
 
2014 11-20 Machine Learning with Apache Spark 勉強会資料
2014 11-20 Machine Learning with Apache Spark 勉強会資料2014 11-20 Machine Learning with Apache Spark 勉強会資料
2014 11-20 Machine Learning with Apache Spark 勉強会資料Recruit Technologies
 
Javaはどのように動くのか~スライドでわかるJVMの仕組み
Javaはどのように動くのか~スライドでわかるJVMの仕組みJavaはどのように動くのか~スライドでわかるJVMの仕組み
Javaはどのように動くのか~スライドでわかるJVMの仕組みChihiro Ito
 
WWW2017論文読み会 Spam Detection と Question Answering &amp; Topic Modeling
WWW2017論文読み会 Spam Detection と Question Answering &amp; Topic ModelingWWW2017論文読み会 Spam Detection と Question Answering &amp; Topic Modeling
WWW2017論文読み会 Spam Detection と Question Answering &amp; Topic Modelingcyberagent
 
大規模ソーシャルゲーム開発から学んだPHP&MySQL実践テクニック
大規模ソーシャルゲーム開発から学んだPHP&MySQL実践テクニック大規模ソーシャルゲーム開発から学んだPHP&MySQL実践テクニック
大規模ソーシャルゲーム開発から学んだPHP&MySQL実践テクニックinfinite_loop
 
ACL2011読み会: Query Weighting for Ranking Model Adaptation
ACL2011読み会: Query Weighting for Ranking Model AdaptationACL2011読み会: Query Weighting for Ranking Model Adaptation
ACL2011読み会: Query Weighting for Ranking Model Adaptationsleepy_yoshi
 
Object Detection & Instance Segmentationの論文紹介 | OHS勉強会#3
Object Detection & Instance Segmentationの論文紹介 | OHS勉強会#3Object Detection & Instance Segmentationの論文紹介 | OHS勉強会#3
Object Detection & Instance Segmentationの論文紹介 | OHS勉強会#3Toshinori Hanya
 
SIGIR2011読み会 3. Learning to Rank
SIGIR2011読み会 3. Learning to RankSIGIR2011読み会 3. Learning to Rank
SIGIR2011読み会 3. Learning to Ranksleepy_yoshi
 
Deep learning for_extreme_multi-label_text_classification
Deep learning for_extreme_multi-label_text_classificationDeep learning for_extreme_multi-label_text_classification
Deep learning for_extreme_multi-label_text_classificationJunya Kamura
 
Scalaで萌える関数型プログラミング[完全版]
Scalaで萌える関数型プログラミング[完全版]Scalaで萌える関数型プログラミング[完全版]
Scalaで萌える関数型プログラミング[完全版]Ra Zon
 
Object-Funcational Analysis and design
Object-Funcational Analysis and designObject-Funcational Analysis and design
Object-Funcational Analysis and designTomoharu ASAMI
 
LINQ 概要 + 結構便利な LINQ to XML
LINQ 概要 + 結構便利な LINQ to XMLLINQ 概要 + 結構便利な LINQ to XML
LINQ 概要 + 結構便利な LINQ to XMLShinichiAoyagi
 
MySQL Casual Talks Vol.3 LT
MySQL Casual Talks Vol.3 LTMySQL Casual Talks Vol.3 LT
MySQL Casual Talks Vol.3 LTTomohiro Ikeda
 

Similar to Representation Learning Using Multi-Task Deep Neural Networks
for Semantic Classification and Information Retrieval (20)

ATN No.2 Scala事始め
ATN No.2 Scala事始めATN No.2 Scala事始め
ATN No.2 Scala事始め
 
関数プログラミング入門
関数プログラミング入門関数プログラミング入門
関数プログラミング入門
 
つぶLT20121215
つぶLT20121215つぶLT20121215
つぶLT20121215
 
Domino Query Language (DQL)
Domino Query Language (DQL)Domino Query Language (DQL)
Domino Query Language (DQL)
 
[豆ナイト]Java small object programming
[豆ナイト]Java small object programming[豆ナイト]Java small object programming
[豆ナイト]Java small object programming
 
教師なしオブジェクトマッチング(第2回ステアラボ人工知能セミナー)
教師なしオブジェクトマッチング(第2回ステアラボ人工知能セミナー)教師なしオブジェクトマッチング(第2回ステアラボ人工知能セミナー)
教師なしオブジェクトマッチング(第2回ステアラボ人工知能セミナー)
 
2014 11-20 Machine Learning with Apache Spark 勉強会資料
2014 11-20 Machine Learning with Apache Spark 勉強会資料2014 11-20 Machine Learning with Apache Spark 勉強会資料
2014 11-20 Machine Learning with Apache Spark 勉強会資料
 
Nds#24 単体テスト
Nds#24 単体テストNds#24 単体テスト
Nds#24 単体テスト
 
Javaはどのように動くのか~スライドでわかるJVMの仕組み
Javaはどのように動くのか~スライドでわかるJVMの仕組みJavaはどのように動くのか~スライドでわかるJVMの仕組み
Javaはどのように動くのか~スライドでわかるJVMの仕組み
 
WWW2017論文読み会 Spam Detection と Question Answering &amp; Topic Modeling
WWW2017論文読み会 Spam Detection と Question Answering &amp; Topic ModelingWWW2017論文読み会 Spam Detection と Question Answering &amp; Topic Modeling
WWW2017論文読み会 Spam Detection と Question Answering &amp; Topic Modeling
 
大規模ソーシャルゲーム開発から学んだPHP&MySQL実践テクニック
大規模ソーシャルゲーム開発から学んだPHP&MySQL実践テクニック大規模ソーシャルゲーム開発から学んだPHP&MySQL実践テクニック
大規模ソーシャルゲーム開発から学んだPHP&MySQL実践テクニック
 
ACL2011読み会: Query Weighting for Ranking Model Adaptation
ACL2011読み会: Query Weighting for Ranking Model AdaptationACL2011読み会: Query Weighting for Ranking Model Adaptation
ACL2011読み会: Query Weighting for Ranking Model Adaptation
 
Object Detection & Instance Segmentationの論文紹介 | OHS勉強会#3
Object Detection & Instance Segmentationの論文紹介 | OHS勉強会#3Object Detection & Instance Segmentationの論文紹介 | OHS勉強会#3
Object Detection & Instance Segmentationの論文紹介 | OHS勉強会#3
 
SIGIR2011読み会 3. Learning to Rank
SIGIR2011読み会 3. Learning to RankSIGIR2011読み会 3. Learning to Rank
SIGIR2011読み会 3. Learning to Rank
 
Deep learning for_extreme_multi-label_text_classification
Deep learning for_extreme_multi-label_text_classificationDeep learning for_extreme_multi-label_text_classification
Deep learning for_extreme_multi-label_text_classification
 
Scalaで萌える関数型プログラミング[完全版]
Scalaで萌える関数型プログラミング[完全版]Scalaで萌える関数型プログラミング[完全版]
Scalaで萌える関数型プログラミング[完全版]
 
ipsjifat201909
ipsjifat201909ipsjifat201909
ipsjifat201909
 
Object-Funcational Analysis and design
Object-Funcational Analysis and designObject-Funcational Analysis and design
Object-Funcational Analysis and design
 
LINQ 概要 + 結構便利な LINQ to XML
LINQ 概要 + 結構便利な LINQ to XMLLINQ 概要 + 結構便利な LINQ to XML
LINQ 概要 + 結構便利な LINQ to XML
 
MySQL Casual Talks Vol.3 LT
MySQL Casual Talks Vol.3 LTMySQL Casual Talks Vol.3 LT
MySQL Casual Talks Vol.3 LT
 

More from marujirou

Deep Multi-Task Learning with Shared Memory
Deep Multi-Task Learning with Shared MemoryDeep Multi-Task Learning with Shared Memory
Deep Multi-Task Learning with Shared Memorymarujirou
 
怖くない誤差逆伝播法 Chainerを添えて
怖くない誤差逆伝播法 Chainerを添えて怖くない誤差逆伝播法 Chainerを添えて
怖くない誤差逆伝播法 Chainerを添えてmarujirou
 
Cross-Lingual Sentiment Analysis using modified BRAE
Cross-Lingual Sentiment Analysis using modified BRAECross-Lingual Sentiment Analysis using modified BRAE
Cross-Lingual Sentiment Analysis using modified BRAEmarujirou
 
Learning Tag Embeddings and Tag-specific Composition Functions in Recursive N...
Learning Tag Embeddings and Tag-specific Composition Functions in Recursive N...Learning Tag Embeddings and Tag-specific Composition Functions in Recursive N...
Learning Tag Embeddings and Tag-specific Composition Functions in Recursive N...marujirou
 
2015 08 survey
2015 08 survey2015 08 survey
2015 08 surveymarujirou
 
Combining Distant and Partial Supervision for Relation Extraction (Angeli et ...
Combining Distant and Partial Supervision for Relation Extraction (Angeli et ...Combining Distant and Partial Supervision for Relation Extraction (Angeli et ...
Combining Distant and Partial Supervision for Relation Extraction (Angeli et ...marujirou
 
Semantic Compositionality through Recursive Matrix-Vector Spaces (Socher et al.)
Semantic Compositionality through Recursive Matrix-Vector Spaces (Socher et al.)Semantic Compositionality through Recursive Matrix-Vector Spaces (Socher et al.)
Semantic Compositionality through Recursive Matrix-Vector Spaces (Socher et al.)marujirou
 
Relation Classification via Convolutional Deep Neural Network (Zeng et al.)
Relation Classification via Convolutional Deep Neural Network (Zeng et al.)Relation Classification via Convolutional Deep Neural Network (Zeng et al.)
Relation Classification via Convolutional Deep Neural Network (Zeng et al.)marujirou
 
DL勉強会 01ディープボルツマンマシン
DL勉強会 01ディープボルツマンマシンDL勉強会 01ディープボルツマンマシン
DL勉強会 01ディープボルツマンマシンmarujirou
 

More from marujirou (9)

Deep Multi-Task Learning with Shared Memory
Deep Multi-Task Learning with Shared MemoryDeep Multi-Task Learning with Shared Memory
Deep Multi-Task Learning with Shared Memory
 
怖くない誤差逆伝播法 Chainerを添えて
怖くない誤差逆伝播法 Chainerを添えて怖くない誤差逆伝播法 Chainerを添えて
怖くない誤差逆伝播法 Chainerを添えて
 
Cross-Lingual Sentiment Analysis using modified BRAE
Cross-Lingual Sentiment Analysis using modified BRAECross-Lingual Sentiment Analysis using modified BRAE
Cross-Lingual Sentiment Analysis using modified BRAE
 
Learning Tag Embeddings and Tag-specific Composition Functions in Recursive N...
Learning Tag Embeddings and Tag-specific Composition Functions in Recursive N...Learning Tag Embeddings and Tag-specific Composition Functions in Recursive N...
Learning Tag Embeddings and Tag-specific Composition Functions in Recursive N...
 
2015 08 survey
2015 08 survey2015 08 survey
2015 08 survey
 
Combining Distant and Partial Supervision for Relation Extraction (Angeli et ...
Combining Distant and Partial Supervision for Relation Extraction (Angeli et ...Combining Distant and Partial Supervision for Relation Extraction (Angeli et ...
Combining Distant and Partial Supervision for Relation Extraction (Angeli et ...
 
Semantic Compositionality through Recursive Matrix-Vector Spaces (Socher et al.)
Semantic Compositionality through Recursive Matrix-Vector Spaces (Socher et al.)Semantic Compositionality through Recursive Matrix-Vector Spaces (Socher et al.)
Semantic Compositionality through Recursive Matrix-Vector Spaces (Socher et al.)
 
Relation Classification via Convolutional Deep Neural Network (Zeng et al.)
Relation Classification via Convolutional Deep Neural Network (Zeng et al.)Relation Classification via Convolutional Deep Neural Network (Zeng et al.)
Relation Classification via Convolutional Deep Neural Network (Zeng et al.)
 
DL勉強会 01ディープボルツマンマシン
DL勉強会 01ディープボルツマンマシンDL勉強会 01ディープボルツマンマシン
DL勉強会 01ディープボルツマンマシン
 

Recently uploaded

論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Gamesatsushi061452
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptxsn679259
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video UnderstandingToru Tamaki
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイスCRI Japan, Inc.
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...Toru Tamaki
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルCRI Japan, Inc.
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsWSO2
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Hiroshi Tomioka
 

Recently uploaded (11)

論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
 

Representation Learning Using Multi-Task Deep Neural Networks
for Semantic Classification and Information Retrieval

  • 1. Komachi Lab M1 宮崎亮輔 2015/06/24 Representation Learning Using Multi-Task Deep Neural Networks
 for Semantic Classification and Information Retrieval ! Xiaodong Liu, Jianfeng Gao, Xiaodong He, Li Deng, Kevin Duh, Ye-Yi Wang NAACL読み会2015 ※このスライド中の図はこの論文中のものです
  • 2. Komachi Lab Abstract ✤ 最近のDNNって目的のタスクに対して直接最適化してなかったり! ✤ 任意のタスクへの教師ありもトレーニングデータの不足とかあるし! ✤ ということでMulti-Task DNN for Representation を提案! - C&Wとの違い?→今回は処理の違うタスク同士! - query classification(今回は4ドメイン)とranking for web search! ✤ データ量が増えるだけでなく、
 正則化の効果も(ドメインアダプテーション) 2
  • 4. Komachi Lab Input ✤ 入力はクエリ or ドキュメント (Bag-of-Words 500k次元)! - つまり語彙数500kのOne hot vector 4
  • 5. Komachi Lab Word Hash Layer ✤ 次の層で文字trigramの空間にmapする(50k次元)! - 未知語の問題が解消! - 同単語の複数のspelingが近くにmapされる 5 ※単語境界は”#”で表現
  • 6. Komachi Lab Semantic Representation Layer ✤ 意味表現(300次元)! - l2 = f(W1・l1), f() = tanh 6
  • 7. Komachi Lab Task-Specific Layer 7 ✤ タスク固有中間表現(128次元)! - l3 = f(Wt 2・l2) , t = task! - 入力がクエリ: l3 = Q, ドキュメント: l3 = D クエリ分類タスク:
  • 8. Komachi Lab Task-Specific Layer 8 ,クエリ分類クエリ分類 ✤ タスク固有中間表現(128次元)! - l3 = f(Wt 2・l2) , t = task! - 入力がクエリ: l3 = Q, ドキュメント: l3 = D タスク:
  • 9. Komachi Lab Task-Specific Layer 9 ,web searchクエリ分類 ,クエリ分類 ✤ タスク固有中間表現(128次元)! - l3 = f(Wt 2・l2) , t = task! - 入力がクエリ: l3 = Q, ドキュメント: l3 = D タスク:
  • 10. Komachi Lab Task-Specific Layer 10 ,web search,web searchクエリ分類 ,クエリ分類 ✤ タスク固有中間表現(128次元)! - l3 = f(Wt 2・l2) , t = task! - 入力がクエリ: l3 = Q, ドキュメント: l3 = D タスク:
  • 11. Komachi Lab Task-Specific Layer 11 ,web search,web searchクエリ分類 ,クエリ分類 ,web search ✤ タスク固有中間表現(128次元)! - l3 = f(Wt 2・l2) , t = task! - 入力がクエリ: l3 = Q, ドキュメント: l3 = D タスク:
  • 12. Komachi Lab Task-Specific Layer 12 ✤ クエリ分類(ロジスティック回帰)! - 二値分類(対応するドメインに属すか否か)! - 一つのクエリは複数のドメインに属すことができる! - ドメインの数だけ分類器,拡張性がある g()はシグモイド関数
  • 13. Komachi Lab Task-Specific Layer 13 ✤ クエリ分類(ロジスティック回帰)! - 二値分類(対応するドメインに属すか否か)! - 一つのクエリは複数のドメインに属すことができる! - ドメインの数だけ分類器,拡張性がある
  • 14. Komachi Lab Task-Specific Layer 14 ✤ Web検索! - クエリとのコサイン類似度→softmax! - P(D|Q)の降順でランキング γはハイパーパラメーター
  • 16. Komachi Lab Training ✤ ミニバッチSGD! ✤ クエリ分類: 式(5)! - クロスエントロピーロス最小化! ❖ Web検索: 式(6)! - 負の対数尤度最小化! ❖ 初期化には以下の範囲から一様分布 16 ※800k iterations, 13hours
  • 17. Komachi Lab Experimental Data Sets ✤ クエリ分類には商用検索エンジンのログ1年分
 (人手のラベル付き)! ✤ Web検索は12,071のクエリを含み
 クエリとドキュメントの組み合わせに5段階の関連度 17
  • 18. Komachi Lab Query Classification ✤ クエリ分類のベースライン! - SVM-word
 unigram, bigram, trigram, surface! - SVM-letter
 文字trigram! - DNN
 マルチタスクではないDNN 18
  • 19. Komachi Lab Query Classification Results ✤ SVM < DNN :意味表現が重要! ✤ DNN < MT-DNN :マルチタスクは有用 19 ※評価はAUC
  • 20. Komachi Lab Web Search ✤ Web検索のベースライン! - 一般的なベースライン
 TF-IDF, LDA, etc.! - DSSM
 マルチタスクではないDNN 20
  • 21. Komachi Lab Web Search Results ✤ State-of-the-art(DSSM)を超えた
 やはりマルチタスクは有用 21 ※NDCGはrankingを評価する指標
  • 22. Komachi Lab Domain Adaptation ✤ クエリ分類のひとつのドメインを除いてMT-DNNで学習! - 学習したSemantic Representationを素性にSVMで分類! - ベースラインはSVM-Word, SVM-letter 22 ✤ 一般的なFeed Forward DNNでも比較! - Semantic RepresentationをW1にしてW2, Wt 3を学習! - W1をランダムに初期化, W1, W2, Wt 3を学習! - SVM-Word
  • 24. Komachi Lab Domain Adaptation ✤ クエリ分類のひとつのドメインを除いてMT-DNNで学習! - 学習したSemantic Representationを素性にSVMで分類! - ベースラインはSVM-Word, SVM-letter 24 ✤ 一般的なFeed Forward DNNでも比較! - Semantic RepresentationをW1にしてW2, Wt 3を学習! - W1をランダムに初期化, W1, W2, Wt 3を学習! - SVM-Word
  • 26. Komachi Lab Conclusion ✤ 分類とランキングという異なるタスクを合わせて
 DNNでのマルチタスク学習を提案! ✤ ベースラインを上回り、Web検索ではState-of-the-art! ✤ マルチタスク学習により
 ドメインアダプテーションされた表現を学習できた 26