Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
貴八
Uploaded by
貴之 八木
16,911 views
t-SNE
上智大学宮本研究室の勉強会発表資料です.
Data & Analytics
◦
Read more
22
Save
Share
Embed
Embed presentation
Download
Downloaded 78 times
1
/ 32
2
/ 32
3
/ 32
4
/ 32
5
/ 32
6
/ 32
7
/ 32
8
/ 32
9
/ 32
10
/ 32
Most read
11
/ 32
12
/ 32
13
/ 32
14
/ 32
Most read
15
/ 32
16
/ 32
17
/ 32
18
/ 32
19
/ 32
20
/ 32
21
/ 32
22
/ 32
23
/ 32
24
/ 32
25
/ 32
Most read
26
/ 32
27
/ 32
28
/ 32
29
/ 32
30
/ 32
31
/ 32
32
/ 32
More Related Content
PDF
t-SNE Explained
by
Kimura Takayuki
PDF
Visualizing Data Using t-SNE
by
Tomoki Hayashi
PDF
Bayesian Neural Networks : Survey
by
tmtm otm
PDF
Generative Models(メタサーベイ )
by
cvpaper. challenge
PDF
因果探索: 基本から最近の発展までを概説
by
Shiga University, RIKEN
PDF
変分推論法(変分ベイズ法)(PRML第10章)
by
Takao Yamanaka
PDF
強化学習その1
by
nishio
PDF
構造方程式モデルによる因果推論: 因果構造探索に関する最近の発展
by
Shiga University, RIKEN
t-SNE Explained
by
Kimura Takayuki
Visualizing Data Using t-SNE
by
Tomoki Hayashi
Bayesian Neural Networks : Survey
by
tmtm otm
Generative Models(メタサーベイ )
by
cvpaper. challenge
因果探索: 基本から最近の発展までを概説
by
Shiga University, RIKEN
変分推論法(変分ベイズ法)(PRML第10章)
by
Takao Yamanaka
強化学習その1
by
nishio
構造方程式モデルによる因果推論: 因果構造探索に関する最近の発展
by
Shiga University, RIKEN
What's hot
PDF
Optimizer入門&最新動向
by
Motokawa Tetsuya
PPTX
[DL輪読会]Life-Long Disentangled Representation Learning with Cross-Domain Laten...
by
Deep Learning JP
PDF
Stanコードの書き方 中級編
by
Hiroshi Shimizu
PDF
Stan超初心者入門
by
Hiroshi Shimizu
PDF
Contrastive learning 20200607
by
ぱんいち すみもと
PDF
ELBO型VAEのダメなところ
by
KCS Keio Computer Society
PDF
最適輸送の計算アルゴリズムの研究動向
by
ohken
PDF
最適輸送の解き方
by
joisino
PDF
Jubatus Casual Talks #2 異常検知入門
by
Shohei Hido
PPTX
【DL輪読会】ViT + Self Supervised Learningまとめ
by
Deep Learning JP
PDF
深層生成モデルを用いたマルチモーダル学習
by
Masahiro Suzuki
PDF
PRML学習者から入る深層生成モデル入門
by
tmtm otm
PDF
Recent Advances on Transfer Learning and Related Topics Ver.2
by
Kota Matsui
PDF
Transformerを多層にする際の勾配消失問題と解決法について
by
Sho Takase
PDF
Rでisomap(多様体学習のはなし)
by
Kohta Ishikawa
PDF
基礎からのベイズ統計学第5章
by
hiro5585
PPTX
[DL輪読会]Flow-based Deep Generative Models
by
Deep Learning JP
PDF
星野「調査観察データの統計科学」第3章
by
Shuyo Nakatani
PDF
[DL輪読会]Understanding Black-box Predictions via Influence Functions
by
Deep Learning JP
PPTX
ようやく分かった!最尤推定とベイズ推定
by
Akira Masuda
Optimizer入門&最新動向
by
Motokawa Tetsuya
[DL輪読会]Life-Long Disentangled Representation Learning with Cross-Domain Laten...
by
Deep Learning JP
Stanコードの書き方 中級編
by
Hiroshi Shimizu
Stan超初心者入門
by
Hiroshi Shimizu
Contrastive learning 20200607
by
ぱんいち すみもと
ELBO型VAEのダメなところ
by
KCS Keio Computer Society
最適輸送の計算アルゴリズムの研究動向
by
ohken
最適輸送の解き方
by
joisino
Jubatus Casual Talks #2 異常検知入門
by
Shohei Hido
【DL輪読会】ViT + Self Supervised Learningまとめ
by
Deep Learning JP
深層生成モデルを用いたマルチモーダル学習
by
Masahiro Suzuki
PRML学習者から入る深層生成モデル入門
by
tmtm otm
Recent Advances on Transfer Learning and Related Topics Ver.2
by
Kota Matsui
Transformerを多層にする際の勾配消失問題と解決法について
by
Sho Takase
Rでisomap(多様体学習のはなし)
by
Kohta Ishikawa
基礎からのベイズ統計学第5章
by
hiro5585
[DL輪読会]Flow-based Deep Generative Models
by
Deep Learning JP
星野「調査観察データの統計科学」第3章
by
Shuyo Nakatani
[DL輪読会]Understanding Black-box Predictions via Influence Functions
by
Deep Learning JP
ようやく分かった!最尤推定とベイズ推定
by
Akira Masuda
Viewers also liked
PDF
Deep Networks with Neuromorphic VLSI devices
by
Giacomo Indiveri
PDF
Embedding Watermarks into Deep Neural Networks
by
Yusuke Uchida
PDF
「人工知能で作る楽しい未来」
by
Romotive Japan
PDF
Network flow problems
by
Dr Sandeep Kumar Poonia
PPTX
Ford Fulkerson Algorithm
by
Adarsh Rotte
PDF
リクルート式 自然言語処理技術の適応事例紹介
by
Recruit Technologies
PDF
Kaggleのテクニック
by
Yasunori Ozaki
PDF
Low power vlsi design ppt
by
Anil Yadav
PDF
機械学習によるデータ分析まわりのお話
by
Ryota Kamoshida
Deep Networks with Neuromorphic VLSI devices
by
Giacomo Indiveri
Embedding Watermarks into Deep Neural Networks
by
Yusuke Uchida
「人工知能で作る楽しい未来」
by
Romotive Japan
Network flow problems
by
Dr Sandeep Kumar Poonia
Ford Fulkerson Algorithm
by
Adarsh Rotte
リクルート式 自然言語処理技術の適応事例紹介
by
Recruit Technologies
Kaggleのテクニック
by
Yasunori Ozaki
Low power vlsi design ppt
by
Anil Yadav
機械学習によるデータ分析まわりのお話
by
Ryota Kamoshida
Similar to t-SNE
PDF
t-SNE(t分布型確率的近傍埋め込み法)による高次元データの可視化について
by
Masato Miwada
PPTX
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
by
Satoshi Kato
PDF
慣性センサーログの効果的な可視化と分類
by
Masato Miwada
PDF
Domain Adaptive Faster R-CNN for Object Detection in the Wild 論文紹介
by
Tsukasa Takagi
PPTX
3 d object recognition
by
ssuserac4d0c
PPTX
Advanced medicalresearchcenterbioinformatics2
by
Jun Nakabayashi
PPTX
T-sne
by
takutori
t-SNE(t分布型確率的近傍埋め込み法)による高次元データの可視化について
by
Masato Miwada
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
by
Satoshi Kato
慣性センサーログの効果的な可視化と分類
by
Masato Miwada
Domain Adaptive Faster R-CNN for Object Detection in the Wild 論文紹介
by
Tsukasa Takagi
3 d object recognition
by
ssuserac4d0c
Advanced medicalresearchcenterbioinformatics2
by
Jun Nakabayashi
T-sne
by
takutori
More from 貴之 八木
PDF
トピックモデル
by
貴之 八木
PDF
混合ガウスモデルとEMアルゴリスム
by
貴之 八木
PDF
最適腕識別
by
貴之 八木
PDF
主成分分析
by
貴之 八木
PDF
線形識別モデル
by
貴之 八木
PDF
線形回帰モデル
by
貴之 八木
PDF
勾配法
by
貴之 八木
トピックモデル
by
貴之 八木
混合ガウスモデルとEMアルゴリスム
by
貴之 八木
最適腕識別
by
貴之 八木
主成分分析
by
貴之 八木
線形識別モデル
by
貴之 八木
線形回帰モデル
by
貴之 八木
勾配法
by
貴之 八木
t-SNE
1.
t-SNE
2.
今回はt-SNEについて簡単にまとめました. (※ 詳細を知りたい場合は原論文をご覧ください.) 今回読んだ論文はこれです. https://lvdmaaten.github.io/publications/papers/JMLR_2008.pdf
3.
本発表の目次です. 次元削減とは SNEの概要 t-SNEの概要 t-SNEの適用例
4.
t-SNE(t-Distributed Stochastic Neighbor
Embedding) は次元削減の一手法です. 特に高次元データの可視化によく用いられていてkaggleで人気です.
5.
次元削減とは高次元のデータ集合 を 低次元のデータ集合 X =
{ , , …, }x1 x2 xn に変換することを意味します.Y = { , , …, }y1 y2 yn その際,高次元のデータ集合の特徴をできる限り保持できるようにします.
6.
以下の手法は書籍でよく見る有名な次元削減手法です. 主成分分析 多次元尺度法 Isomap カーネル主成分分析 t-SNEはこれらの手法とは全く異なるアルゴリズムで次元削減を実現します.
7.
t-SNEはSNE(Stochastic Neighbor Embedding)という手法に改良を加えた手法です. SNEは2002年にHintonとRoweisによって提案されました. t-SNEを説明する前に,まずはSNEについて簡単に説明します.
8.
SNEの概要
9.
SNEの特徴は二点間の類似度を条件付き確率で表現するところにあります. (※ これは先ほど紹介した有名な手法にはない考え方です.)
10.
=pj|i exp(−|| − |
/2 )xi xj | 2 σ2 i exp(−|| − | /2 )∑k≠i xi xk | 2 σ2 i SNEは からxi の近さを条件付き確率xj で表します.pj|i は平均pj|i に従うガウス分布においてxi が抽出される確率密度とします. 数式で表すと以下のとおりです. xj ここで, は平均σ2 i のガウス分布の分散であり, 今は異なる二点間の類似度にのみ興味があるので xi とします. (※ ここで,一般に = 0pi|i であることに注意しましょう. そのため,距離でも類似度でもなく「近さ」という表現を用いています.) ≠pj|i pi|j
11.
= , =
0qj|i exp(−|| − | )yi yj | 2 exp(−|| − | )∑k≠i yi yk | 2 qi|i 次に,次元削減後の点 からyi の近さも同様に定義します. ただし,ガウス分布の分散をデータ点に関わらず yj とするところが異なります. 数式で表せば以下の通りです. 1 2√
12.
もし,次元削減後も元のデータ構造を完全に再現できていれば, となるはずです.(これが理想)=pj|i qj|i したがって,SNEでは とpj|i
の誤差がなるべく 小さくなるような次元削減を目指します. qj|i
13.
そこで,分布間の近さを測る指標があると便利です.SNEでは カルバック・ライブラー・ダイバージェンス(Kullback-Leibler-divergence)を用います. (※ カルバック・ライブラー情報量やカルバック・ライブラー擬距離と呼ばれることもあります.) これは対称性(距離の公理)を満たさないため正確な意味で距離とは言えませんが, 分布間の差異を表すことに利用されることがあります.
14.
KL(P||Q) = P(i)
log ∑ i P(i) Q(i) を離散確率分布とする時P, Q のP に対するカルバック・ライブラー情報量は 以下のように定義されます.( Q をΣ と置き換えれば連続確率分布にも拡張できます.)∫ (※ 詳細は情報理論(Information theory)についての書籍を参照してください.
15.
は常にKL(P||Q) 以上で,0 とP
の分布が似ているほど小さな値をとります.Q カルバック・ライブラー情報量を用いれば とpj|j の近さを 表現することができそうです. qj|i
16.
C = KL(
|| ) = log ∑ i Pi Qi ∑ i ∑ j pj|i pj|i qj|i そこで,SNEでは以下の目的関数の最小化を目指します. ここで, はデータ点Pi と他の全てのデータ点から得られる条件付き確率分布です. そして, xi はデータ点Qi と他の全てのデータ点から得られる条件付き確率分布です.yi
17.
= 2 (
− + − )( − ) δC δyi ∑ j pj|i qj|i pi|j qi|j yi yj SNEは目的関数 の最小解を勾配法により求めます.C = log∑i ∑j pj|i pj|i q j|i この目的関数の勾配は以下のようになります. 収束した後の がSNEの出力です.Y = { , , …, }y1 y2 yn
18.
t-SNEの概要
19.
先ほども言った通りt-SNEはSNEに改良を加えた手法です.
20.
C = KL(P||Q)
= log ∑ i ∑ j pji pji qji まず,目的関数が異なります.t-SNEの目的関数は以下の通りです. ※ SNEでは でした.C = log∑i ∑j pj|i pj|i qj|i
21.
= , =
, = 0pij +pi|j pj|i 2N pj|i exp(−|| − | /2 )xi xj | 2 σ2 i exp(−|| − | /2 )∑k≠i xi xk | 2 σ2 i pi|i そこで,t-SNEでは点 と点xi の近さを同時分布xj で以下のように定めます.pij の式はSNEと変わりありませんが,pj|i により, 二点間の近さ =pij +pi|j pj|i 2N に対称性が生まれます.pij
22.
=qij (1 + ||
− |yi yj | 2 ) −1 (1 + || − |∑k≠l yk yl | 2 ) −1 また,点 と点yi の近さを同時分布yj で以下のように定めます.qij ここで, とyi の近さを表現するために,ガウス分布ではなく 自由度1のt分布を用いることがt-SNEの名前の由来です. yj
23.
= 4 (
− )( − )(1 + || − | σC σyi ∑ j pij qij yi yj yi yj | 2 ) −1 t-SNEでは,この とpij を用いて, 目的関数 qij の最小化を行います.C = log∑i ∑j pji pji q ji これも解析的には最小解を求めることができないので,勾配法を使います. ちなみに,勾配は以下のようになります.
24.
t-SNEの適用例
25.
まずはt-SNEをMNISTデータセットに適用した結果を紹介します. MNISTは手書き数字 が書かれた pixelの画像データセットです.0
− 9 28 × 28
26.
画像は,(左上)t-SNE (右上)Sammon mapping (左下)Isomap (右下)LLEの出力結果です. t-SNEは784次元のデータをうまく2次元に集約することができています.
27.
次にCOIL-20データセットに適用した例を紹介します. COIL-20は20種類の物体を5度ずつ角度を変えて撮影した画像データセットです.
28.
画像は,(左上)t-SNE (右上)Sammon mapping (左下)Isomap (右下)LLEの出力結果です. 物体ごとの特徴が0°から360°までで一つの円を作っている様子が確認できます.
29.
おわりに
30.
今日はt-SNEの概要を説明しました. t-SNEはpythonやRにもパッケージが用意されているので, 次元圧縮をする際には是非使用するか検討してみてください.
31.
ただし,使用の際の注意点もあります. t-SNEは2次元もしくは3次元の次元圧縮には有効ですが, それ以上の次元には計算コストの都合上現実的ではありません. (※ 4次元以上の場合は別の手法を使いましょう.)
32.
以上です.
Download