Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

予測ラベルの分析

158 views

Published on

CNNで予測したラベルの精度について分析した

Published in: Data & Analytics
  • Be the first to comment

  • Be the first to like this

予測ラベルの分析

  1. 1. 予測ラベルの分析 岡山理科大学 総合情報学部 情報科学科 井上佳祐(I13I006)
  2. 2. アジェンダ • 分類機として使用したCNN • 正解ラベル • 予測ラベル • 正確性 • 今後
  3. 3. 分類機として使用したCNN 畳み込み 層 高:3 コメン ト 評価値Embed プーリング 層 全結合 層 入力層 出力層
  4. 4. 分類の処理過程 • 語彙にIDを振り、文章をIDで表現する • 埋め込み層でIDをもとに単語の埋め込み表現を学習 • 列は1単語、行に文章の単語を並べて行列とする • その行列を畳み込み層で畳み込む • 各フィルタで畳み込まれた結果をプーリング • 全結合してラベルの確率値へ • 一番大きい確率値のラベルが予測ラベル • それを出力
  5. 5. 分類機を通す例 畳み込み 層 高:3 コメン ト 評価値 1 Embed プーリング 層 全結合 層 入力層 出力層 56 3 78 ・ ・ ・ 1 0.x 0.y 0.z ・・・ 0.i 0.j 0.k 0.y 0.z 0.x ・・・ 0.k 0.i 0.j 0.z 0.y 0.x ・・・ 0.i 0.j 0.k ・ ・ ・ 0.y 0.x 0.z ・・・ 0.k 0.i 0.j 確率 [0.2 0.4 0.1 0.1 0.1 0.1] One-hot-Vec [0 1 0 0 0 0]
  6. 6. 正解ラベルについて • 0:0 • 1:18239 • 2:22364 • 3:96075 • 4:354051 • 5:725997
  7. 7. 予測ラベルについて • 0:0 • 1:21508 • 2:15938 • 3:85511 • 4:278595 • 5:815174
  8. 8. 正確性について • 全件数:1216726 • 正判定:814770 • 誤判定:401956 • 正確性:66.9% • 誤判定の誤差の最小値:0 • 誤判定の誤差の最大値:4 • 誤判定の誤差の平均:1.15 • 誤差1まで許容したときの正確性:95.9%
  9. 9. 今後 • 確率値を見てみる

×