Spring

248 views

Published on

部分列とデータストリームの比較手法

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
248
On SlideShare
0
From Embeds
0
Number of Embeds
5
Actions
Shares
0
Downloads
2
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Spring

  1. 1. SPRING の実装の説明 Lutfiana Sari Ariestien 池田研究室 - M2 1 13年10月31日木曜日
  2. 2. 問題設定 入力: •ある特定の時間で長さが n のデータストリーム X •固定長さ m のクエリ Y •距離の閾値 ε 出力: •クエリと類似するデータの部分列 但し、 •見つかった部分列は近くクエリと類似しないといけないため、 •見つかった類似した部分列のうち(複数見つかった場合)ローカルな最小 DTW 距離を 持っている方だけ取り出す 2 13年10月31日木曜日
  3. 3. SPRING の説明 数学の表現で書くと、 X = (x1 , . . . , xi , . . . , xn ) Y = (y1 , . . . , yj , . . . , ym ) に対し、長さが m x n の行列でその DTW のスコアを表す。 DTW のスコアは次のように計算される、 d(i, j) = ||xi yj || + dbest 8 d(i, j 1) < d(i 1, j) dbest = min : d(i 1, j 1) d(i, 0) = 0, d(0, j) = 1 これまでは、部分列のマッチング用の DTW とまったく同じが、行列の計算につれて パスのスタートも記録 8 s(i, j 1) < s(i 1, j) s(i, j) = : s(i 1, j 1) for for for d(i, j 1) = dbest d(i 1, j) = dbest d(i 1, j 1) = dbest 3 13年10月31日木曜日
  4. 4. SPRING の説明 行列の計算の流れは、 データストリーム長 クエリ長 ... 1 2 j 回目のループ 横方向のループではできない !! 1回ループが回ったらその列の要素の値 (d と s の値を見て)チェック。 条件を満たしたら、その時点の列を初期化する。 4 13年10月31日木曜日
  5. 5. SPRING の説明 例:i+a 回めのループで初期化が発生した ! データストリーム長 クエリ長 ... 1 2 ... i i+a 回目のループ a は 1 以上の値 意味: • d(i,m) ≤ ε  • i がエンドで、条件を満たしたパスができた → そのパスの DTW のスコア (dmin とする)とスタート(is)とエンド(ie)を 最適パスの候補に その時、i+a 回目のチェックで列 i+a が次の条件を満たす: 8j, d(n, j) 13年10月31日木曜日 dmin _ s(n, j) > ie 5
  6. 6. SPRING の説明 条件の意味 8j, d(n, j) dmin _ s(n, j) > ie 見つかった dmin よりもスコアが悪い スタートが見つかったパスよりも後 (DTW の距離が大きい) の方にある(見つかったパスと重ね 合わない) 2番目に見つかったパスが前に見つ かったパスとは重ね合わないように 6 13年10月31日木曜日
  7. 7. SPRING の説明 意味: j よりも前に、条件を満たしたパスができた → そのパスの DTW のスコア (dmin とする)とスタート(is)とエンド(ie)を 最適パスの候補に いくつかの候補の内、dmin が一番最小のものを出力 が、ハミング検索には dmin が小さければどうやら正解とは限らない •スタートとエンドの長さを考慮すべき •ε の値の調整にもよる • 用いた dbest の辞書式順序の優先にもよる 7 13年10月31日木曜日
  8. 8. dbest の辞書式順序について dbest 8 < d(i, j 1) d(i 1, j) = min : d(i 1, j 1) 優先度 論文で使われた優先度 違う優先度を用いると、違う結果へ 8 13年10月31日木曜日
  9. 9. 補足1:論文でのアルゴリズム Equation (7) & (8): 9 13年10月31日木曜日
  10. 10. 補足 2:論文での計算例 y4=4 54 (1) 110 (2) 14 (2) 38 (2) 6 (2) 7 (2) 88 (2) y3=9 53 (1) 46 (2) 10 (2) 2 (2) 10 (4) 17 (4) 18 (4) y2=6 37 (1) 37 (2) 1 (2) 17 (4) 1 (4) 2 (4) 51 (4) y1=11 36 (1) 1 (2) 25 (3) 1 (4) 25 (5) 36 (6) 4 (7) xt 5 12 6 10 6 5 13 t 1 2 3 4 5 6 7 特に、ここでは ||xi - yj|| は (x-y)2 で、 ε は 15 i=3 で、X(3,4) ≤ ε なので、X[2:3] (2~3までと読む)が候補になりそうなパスが 見つかったが、s(4,3) ≯ is なので、候補としない。 i=5 で、X(5,4) ≤ ε なので、X[2:5] が候補になりそう。i=7 がその前に見つかった パスが候補になるための条件を満たしたため、X[2:5] は候補。i=7 で初期化。 10 13年10月31日木曜日

×