Copyright © 2016 NTT DATA Mathematical Systems Inc.
2017/04/01 非公式ロマンティック数学ナイト
s.t.@simizut22
TDA やらnight!!
2Copyright © 2016 NTT DATA Mathematical Systems Inc.
目次
• Persistent Homology #とは
• Persistent Homology の表示と分解定理
• 応用例
Copyright © 2016 NTT DATA Mathematical Systems Inc. 3
Persistent Homology #とは
4Copyright © 2016 NTT DATA Mathematical Systems Inc.
問題設定
さて、
𝑌, 𝑑 を距離空間とし、 𝑋 ⊂ 𝑌 を有限集合とする(point cloud)
𝑋 がどのような空間/モデルから生成されたデータなのか、何かしらの情報
を 𝑋 から知りたい
例:
- 次元
- 連結度
5Copyright © 2016 NTT DATA Mathematical Systems Inc.
問題設定
一つの道具としての Persistent Homology
• 一般的なデータ分析手法はデータ(が埋め込まれたユークリッド空間)の
次元が高次元になると大変
• Persistent Homology はデータ(が埋め込まれたユークリッド空間)の次元
によらない
• データのスケールにも依存しない
• データがベクトル空間に存在してなくてもよい(多くの機械学習の手法は
ベクトル空間上のデータであることを使用する
6Copyright © 2016 NTT DATA Mathematical Systems Inc.
距離空間の例
例1 (ユークリッド空間)
𝑋 = ℝ 𝑁, 𝑑 𝑥, 𝑦 = ∑ 𝑥𝑖 − 𝑦𝑖
2
例2 (文字列の空間)
Σ: 文字の集合とし、 𝑋 を Σ 上の長さ 𝑁 の文字列のなす集合
𝑋 = { 𝑥𝑖 𝑖=1
𝑁
∣ 𝑥𝑖 ∈ Σ }
𝑑: 𝑋 × 𝑋 → ℝ を次で与える:
𝑑 𝑥, 𝑦 = #{ 𝑖 ∣ 𝑥𝑖 ≠ 𝑦𝑖 }
これは 𝑋 上の距離になる(ハミング距離)□
例3(metric グラフ)
計量グラフ, i.e. グラフの各辺に長さが定まっているとき
𝑑 𝑥, 𝑦 = min 𝑃 の長さ 𝑃: 𝑝𝑎𝑡ℎ 𝑓𝑟𝑜𝑚 𝑥 𝑡𝑜 𝑦}
7Copyright © 2016 NTT DATA Mathematical Systems Inc.
データが現れた。さてどうする??
Point cloud data
8Copyright © 2016 NTT DATA Mathematical Systems Inc.
太らせて見よう。
𝜖
2
-ballsPoint cloud data
9Copyright © 2016 NTT DATA Mathematical Systems Inc.
穴が現れた!!!
10Copyright © 2016 NTT DATA Mathematical Systems Inc.
もっと続けてみた
11Copyright © 2016 NTT DATA Mathematical Systems Inc.
もっと続けてみた
12Copyright © 2016 NTT DATA Mathematical Systems Inc.
もっと続けてみた
13Copyright © 2016 NTT DATA Mathematical Systems Inc.
もっと続けてみた
14Copyright © 2016 NTT DATA Mathematical Systems Inc.
もっと続けてみた
15Copyright © 2016 NTT DATA Mathematical Systems Inc.
もっと続けてみた
16Copyright © 2016 NTT DATA Mathematical Systems Inc.
もっと続けてみた
17Copyright © 2016 NTT DATA Mathematical Systems Inc.
続けてみた
太らせる過程で、離散点から始まり
a. つながりができる
b. 穴ができる
c. 穴がふさがる
を繰り返し最終的に全部つながった(上の例だと ball と同相)
18Copyright © 2016 NTT DATA Mathematical Systems Inc.
数学的なセッティング
計算機に乗せて計算したい→ 代数的な道具で表現
穴や連結具合をあらわす道具:基本群などの homotopy 群や homology 群
など。
Homotopy 群は一般に計算が難しい
→ 計算が簡単な homology (以下 𝐻∗ を使おう
19Copyright © 2016 NTT DATA Mathematical Systems Inc.
homology の性質
1. 空間 X に対しそのHomology 𝐻∗ 𝑋 はベクトル空間
2. Functorial(関手性)
特に、
包含写像 𝑖: 𝑋 ↪ 𝑌 に対し準同型
𝐻∗ 𝑖 : 𝐻∗ 𝑋 → 𝐻∗(𝑌)
が誘導され、次の自然性を持つ
𝑖: 𝑋 → 𝑌, 𝑗: 𝑌 → 𝑍 に対し
𝐻∗ 𝑗 ∘ 𝑖 = 𝐻∗ 𝑗 ∘ 𝐻∗ 𝑖
3. Homotopy 不変(または位相不変)
今日は明示的には使わないので略
20Copyright © 2016 NTT DATA Mathematical Systems Inc.
Persistent Homology
実数 𝑟 ≥ 0 に対し pt cloud X を r 太らせた空間を 𝑋 𝑟 と書くことにする
各 r に対し Homology を取ると、半直線 ℝ≥0 上のベクトル空間の図式
𝐻∗ 𝑋 = 𝐻∗ 𝑋0 → ⋯ → 𝐻∗ 𝑋𝑟 → 𝐻∗ 𝑋𝑟+𝜖 → ⋯
を与えたことになる
このベクトル空間の図式が (ℝ-indexed) Persistent Homology
21Copyright © 2016 NTT DATA Mathematical Systems Inc.
Persistent Homology
Persistent Homology において何が重要か??
矢印がどのくらい同型から外れるか。つまり
その点で
ある homology クラスは死に(穴がふさがった)
ある homology クラスは生まれる(新しい穴ができた)
と思える
Copyright © 2016 NTT DATA Mathematical Systems Inc. 22
Persistent Homology の表示
23Copyright © 2016 NTT DATA Mathematical Systems Inc.
計算できるかもしれないが...
データ解析してたら Visualization したくなるよね。
よしっ、可視化できる形 → わかりやすい形で表現
24Copyright © 2016 NTT DATA Mathematical Systems Inc.
Interval Module
Def(Interval Module)
0 ≤ 𝑏 ≤ 𝑑 ≤ ∞に対し Persistent Module 𝐼[𝑏,𝑑] を次の図式で与える:
𝐼 𝑖,𝑗 : 0 = 0 … 0 → 𝕜
𝑏
= 𝕜 = ⋯ = 𝕜
𝑑
→ 0 = ⋯ = 0
これを Interval Module という
これは時刻 b で発生し時刻 d まで生きる homology class に対応する
25Copyright © 2016 NTT DATA Mathematical Systems Inc.
Interval Module
何でこんなのがいるの???
1. Interval Module が既約な表現
2. PH はこの直和で表現できる
つまり…
26Copyright © 2016 NTT DATA Mathematical Systems Inc.
分解定理
Thm(Gabriel, Krull-Schmidt)
Persistent Module (of finite type) は次のような Interval Module による(既
約)分解を持つ:
𝑃𝐻∗ ≅⊕ 𝑆 𝑛 𝑆 𝐼𝑆
𝑛 𝑆 ∈ ℤ≥0 : multiplicity とし、この和は区間についてを渡る
この分解は(区間の index の付け替えを除いて)一意
27Copyright © 2016 NTT DATA Mathematical Systems Inc.
PH の表示
PH を interval Decomp. したときの interval を図示したものを、PH に対す
る bar-code という。
これで図示してみる
28Copyright © 2016 NTT DATA Mathematical Systems Inc.
bar-code の例
29Copyright © 2016 NTT DATA Mathematical Systems Inc.
分解定理の remark
Interval Decomposition 定理は
ℝ, ≤ -indexed Module (of finite type)だけでなく、
- 離散 indexed zigzag persistent(矢印は→と←が混じっててもよい)
でも成立
これは
1 変数多項式環 𝕜 𝑡 が単項イデアル整域(PID)であることによる ■
Copyright © 2016 NTT DATA Mathematical Systems Inc. 30
応用例
31Copyright © 2016 NTT DATA Mathematical Systems Inc.
応用例
 タンパク質の構造解析
 neural network(ホントの neural) の解析
 材料科学
 遺伝子解析
 系統樹
多様体学習
 最近 Edelsbrunner 先生が cosmic web の論文出してた(cosmology)

TDA やら Night!!

  • 1.
    Copyright © 2016NTT DATA Mathematical Systems Inc. 2017/04/01 非公式ロマンティック数学ナイト s.t.@simizut22 TDA やらnight!!
  • 2.
    2Copyright © 2016NTT DATA Mathematical Systems Inc. 目次 • Persistent Homology #とは • Persistent Homology の表示と分解定理 • 応用例
  • 3.
    Copyright © 2016NTT DATA Mathematical Systems Inc. 3 Persistent Homology #とは
  • 4.
    4Copyright © 2016NTT DATA Mathematical Systems Inc. 問題設定 さて、 𝑌, 𝑑 を距離空間とし、 𝑋 ⊂ 𝑌 を有限集合とする(point cloud) 𝑋 がどのような空間/モデルから生成されたデータなのか、何かしらの情報 を 𝑋 から知りたい 例: - 次元 - 連結度
  • 5.
    5Copyright © 2016NTT DATA Mathematical Systems Inc. 問題設定 一つの道具としての Persistent Homology • 一般的なデータ分析手法はデータ(が埋め込まれたユークリッド空間)の 次元が高次元になると大変 • Persistent Homology はデータ(が埋め込まれたユークリッド空間)の次元 によらない • データのスケールにも依存しない • データがベクトル空間に存在してなくてもよい(多くの機械学習の手法は ベクトル空間上のデータであることを使用する
  • 6.
    6Copyright © 2016NTT DATA Mathematical Systems Inc. 距離空間の例 例1 (ユークリッド空間) 𝑋 = ℝ 𝑁, 𝑑 𝑥, 𝑦 = ∑ 𝑥𝑖 − 𝑦𝑖 2 例2 (文字列の空間) Σ: 文字の集合とし、 𝑋 を Σ 上の長さ 𝑁 の文字列のなす集合 𝑋 = { 𝑥𝑖 𝑖=1 𝑁 ∣ 𝑥𝑖 ∈ Σ } 𝑑: 𝑋 × 𝑋 → ℝ を次で与える: 𝑑 𝑥, 𝑦 = #{ 𝑖 ∣ 𝑥𝑖 ≠ 𝑦𝑖 } これは 𝑋 上の距離になる(ハミング距離)□ 例3(metric グラフ) 計量グラフ, i.e. グラフの各辺に長さが定まっているとき 𝑑 𝑥, 𝑦 = min 𝑃 の長さ 𝑃: 𝑝𝑎𝑡ℎ 𝑓𝑟𝑜𝑚 𝑥 𝑡𝑜 𝑦}
  • 7.
    7Copyright © 2016NTT DATA Mathematical Systems Inc. データが現れた。さてどうする?? Point cloud data
  • 8.
    8Copyright © 2016NTT DATA Mathematical Systems Inc. 太らせて見よう。 𝜖 2 -ballsPoint cloud data
  • 9.
    9Copyright © 2016NTT DATA Mathematical Systems Inc. 穴が現れた!!!
  • 10.
    10Copyright © 2016NTT DATA Mathematical Systems Inc. もっと続けてみた
  • 11.
    11Copyright © 2016NTT DATA Mathematical Systems Inc. もっと続けてみた
  • 12.
    12Copyright © 2016NTT DATA Mathematical Systems Inc. もっと続けてみた
  • 13.
    13Copyright © 2016NTT DATA Mathematical Systems Inc. もっと続けてみた
  • 14.
    14Copyright © 2016NTT DATA Mathematical Systems Inc. もっと続けてみた
  • 15.
    15Copyright © 2016NTT DATA Mathematical Systems Inc. もっと続けてみた
  • 16.
    16Copyright © 2016NTT DATA Mathematical Systems Inc. もっと続けてみた
  • 17.
    17Copyright © 2016NTT DATA Mathematical Systems Inc. 続けてみた 太らせる過程で、離散点から始まり a. つながりができる b. 穴ができる c. 穴がふさがる を繰り返し最終的に全部つながった(上の例だと ball と同相)
  • 18.
    18Copyright © 2016NTT DATA Mathematical Systems Inc. 数学的なセッティング 計算機に乗せて計算したい→ 代数的な道具で表現 穴や連結具合をあらわす道具:基本群などの homotopy 群や homology 群 など。 Homotopy 群は一般に計算が難しい → 計算が簡単な homology (以下 𝐻∗ を使おう
  • 19.
    19Copyright © 2016NTT DATA Mathematical Systems Inc. homology の性質 1. 空間 X に対しそのHomology 𝐻∗ 𝑋 はベクトル空間 2. Functorial(関手性) 特に、 包含写像 𝑖: 𝑋 ↪ 𝑌 に対し準同型 𝐻∗ 𝑖 : 𝐻∗ 𝑋 → 𝐻∗(𝑌) が誘導され、次の自然性を持つ 𝑖: 𝑋 → 𝑌, 𝑗: 𝑌 → 𝑍 に対し 𝐻∗ 𝑗 ∘ 𝑖 = 𝐻∗ 𝑗 ∘ 𝐻∗ 𝑖 3. Homotopy 不変(または位相不変) 今日は明示的には使わないので略
  • 20.
    20Copyright © 2016NTT DATA Mathematical Systems Inc. Persistent Homology 実数 𝑟 ≥ 0 に対し pt cloud X を r 太らせた空間を 𝑋 𝑟 と書くことにする 各 r に対し Homology を取ると、半直線 ℝ≥0 上のベクトル空間の図式 𝐻∗ 𝑋 = 𝐻∗ 𝑋0 → ⋯ → 𝐻∗ 𝑋𝑟 → 𝐻∗ 𝑋𝑟+𝜖 → ⋯ を与えたことになる このベクトル空間の図式が (ℝ-indexed) Persistent Homology
  • 21.
    21Copyright © 2016NTT DATA Mathematical Systems Inc. Persistent Homology Persistent Homology において何が重要か?? 矢印がどのくらい同型から外れるか。つまり その点で ある homology クラスは死に(穴がふさがった) ある homology クラスは生まれる(新しい穴ができた) と思える
  • 22.
    Copyright © 2016NTT DATA Mathematical Systems Inc. 22 Persistent Homology の表示
  • 23.
    23Copyright © 2016NTT DATA Mathematical Systems Inc. 計算できるかもしれないが... データ解析してたら Visualization したくなるよね。 よしっ、可視化できる形 → わかりやすい形で表現
  • 24.
    24Copyright © 2016NTT DATA Mathematical Systems Inc. Interval Module Def(Interval Module) 0 ≤ 𝑏 ≤ 𝑑 ≤ ∞に対し Persistent Module 𝐼[𝑏,𝑑] を次の図式で与える: 𝐼 𝑖,𝑗 : 0 = 0 … 0 → 𝕜 𝑏 = 𝕜 = ⋯ = 𝕜 𝑑 → 0 = ⋯ = 0 これを Interval Module という これは時刻 b で発生し時刻 d まで生きる homology class に対応する
  • 25.
    25Copyright © 2016NTT DATA Mathematical Systems Inc. Interval Module 何でこんなのがいるの??? 1. Interval Module が既約な表現 2. PH はこの直和で表現できる つまり…
  • 26.
    26Copyright © 2016NTT DATA Mathematical Systems Inc. 分解定理 Thm(Gabriel, Krull-Schmidt) Persistent Module (of finite type) は次のような Interval Module による(既 約)分解を持つ: 𝑃𝐻∗ ≅⊕ 𝑆 𝑛 𝑆 𝐼𝑆 𝑛 𝑆 ∈ ℤ≥0 : multiplicity とし、この和は区間についてを渡る この分解は(区間の index の付け替えを除いて)一意
  • 27.
    27Copyright © 2016NTT DATA Mathematical Systems Inc. PH の表示 PH を interval Decomp. したときの interval を図示したものを、PH に対す る bar-code という。 これで図示してみる
  • 28.
    28Copyright © 2016NTT DATA Mathematical Systems Inc. bar-code の例
  • 29.
    29Copyright © 2016NTT DATA Mathematical Systems Inc. 分解定理の remark Interval Decomposition 定理は ℝ, ≤ -indexed Module (of finite type)だけでなく、 - 離散 indexed zigzag persistent(矢印は→と←が混じっててもよい) でも成立 これは 1 変数多項式環 𝕜 𝑡 が単項イデアル整域(PID)であることによる ■
  • 30.
    Copyright © 2016NTT DATA Mathematical Systems Inc. 30 応用例
  • 31.
    31Copyright © 2016NTT DATA Mathematical Systems Inc. 応用例  タンパク質の構造解析  neural network(ホントの neural) の解析  材料科学  遺伝子解析  系統樹 多様体学習  最近 Edelsbrunner 先生が cosmic web の論文出してた(cosmology)

Editor's Notes

  • #3 LiveSlide https://twitter.com/search?f=tweets&vertical=default&q=%23takataka_ssh&src=typd&lang=ja
  • #5 LiveSlide https://twitter.com/search?f=tweets&vertical=default&q=%23takataka_ssh&src=typd&lang=ja
  • #6 LiveSlide https://twitter.com/search?f=tweets&vertical=default&q=%23takataka_ssh&src=typd&lang=ja
  • #7 LiveSlide https://twitter.com/search?f=tweets&vertical=default&q=%23takataka_ssh&src=typd&lang=ja
  • #8 LiveSlide https://twitter.com/search?f=tweets&vertical=default&q=%23takataka_ssh&src=typd&lang=ja
  • #9 LiveSlide https://twitter.com/search?f=tweets&vertical=default&q=%23takataka_ssh&src=typd&lang=ja
  • #10 LiveSlide https://twitter.com/search?f=tweets&vertical=default&q=%23takataka_ssh&src=typd&lang=ja
  • #11 LiveSlide https://twitter.com/search?f=tweets&vertical=default&q=%23takataka_ssh&src=typd&lang=ja
  • #12 LiveSlide https://twitter.com/search?f=tweets&vertical=default&q=%23takataka_ssh&src=typd&lang=ja
  • #13 LiveSlide https://twitter.com/search?f=tweets&vertical=default&q=%23takataka_ssh&src=typd&lang=ja
  • #14 LiveSlide https://twitter.com/search?f=tweets&vertical=default&q=%23takataka_ssh&src=typd&lang=ja
  • #15 LiveSlide https://twitter.com/search?f=tweets&vertical=default&q=%23takataka_ssh&src=typd&lang=ja
  • #17 LiveSlide https://twitter.com/search?f=tweets&vertical=default&q=%23takataka_ssh&src=typd&lang=ja
  • #18 LiveSlide https://twitter.com/search?f=tweets&vertical=default&q=%23takataka_ssh&src=typd&lang=ja
  • #19 LiveSlide https://twitter.com/search?f=tweets&vertical=default&q=%23takataka_ssh&src=typd&lang=ja
  • #20 LiveSlide https://twitter.com/search?f=tweets&vertical=default&q=%23takataka_ssh&src=typd&lang=ja
  • #21 LiveSlide https://twitter.com/search?f=tweets&vertical=default&q=%23takataka_ssh&src=typd&lang=ja
  • #22 LiveSlide https://twitter.com/search?f=tweets&vertical=default&q=%23takataka_ssh&src=typd&lang=ja
  • #24 LiveSlide https://twitter.com/search?f=tweets&vertical=default&q=%23takataka_ssh&src=typd&lang=ja
  • #25 LiveSlide https://twitter.com/search?f=tweets&vertical=default&q=%23takataka_ssh&src=typd&lang=ja
  • #26 LiveSlide https://twitter.com/search?f=tweets&vertical=default&q=%23takataka_ssh&src=typd&lang=ja
  • #27 LiveSlide https://twitter.com/search?f=tweets&vertical=default&q=%23takataka_ssh&src=typd&lang=ja
  • #28 LiveSlide https://twitter.com/search?f=tweets&vertical=default&q=%23takataka_ssh&src=typd&lang=ja
  • #30 LiveSlide https://twitter.com/search?f=tweets&vertical=default&q=%23takataka_ssh&src=typd&lang=ja
  • #32 LiveSlide https://twitter.com/search?f=tweets&vertical=default&q=%23takataka_ssh&src=typd&lang=ja