Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

matsuo m

375 views

Published on

  • Be the first to comment

  • Be the first to like this

matsuo m

  1. 1. Twitterのコメント分析による広告の推薦 Recommendation of Advertisement with Twitter Comment 複雑系工学講座 調和系工学研究室 修士2年 松尾 潤
  2. 2. Twitter 背景 広告の配信 各メディアとの比較 リアルタイム性 Twitter 開示性 blog SNS chat ①高いリアルタイム性 ②情報の発信・収集 問題 広告主とその受け手との要求にミスマッチが発生 Twitterと広告 広告主 興味のある ものが欲しい 伝えたい人に 届けたい 広告の受け手 広告の提示 広 告 「明示された広告主が目的を持って,想定したター ゲットに情報を伝えるために,人間以外の媒体を, 料金を払って利用して行う情報提供活動」[嶋村 2006] 広告の利用 広告主 …… 50 広告の集合 49 1 広告の配信 2 広告の受け手 2 広告をひとつ選択 広告の提供 配信サービス Twitter 「全体の25%がURLつき コメント」(2010 9/15) 例) : ・配信時刻は10~11時 ・配信数は週に最低1回 ・配信期間は3月中 広告の媒体としても 用いられる 各広告に条件
  3. 3. 配信のアプローチ 実際の配信 現 在 どう計算する? ある瞬間において最もクリック数が大きくなるような広告をTweet Tweetする広告のクリック数の 総和を最大化したい 時刻 クリック数 理想の配信 ユーザが読む広告 未来に配信する広告 過去に配信した広告 興味のある広告を配信したい 時間の経過に伴って広告が追加される 追加される広告のことも考慮にいれて未来に配信する広告を考える クリック数が多い広告 理 想
  4. 4. Twitterの話題とクリック数 研究目的 Twitterのコメント分析による広告の推薦 Twitterの話題と広告の クリック数について調査 仮説と検証 i Twitterの話題に応じた広告を配信することで Tweetする広告のクリックの総和最大化を目指す 検 証 Twitterのコミュニケーション では話題が発生する Twitterの話題に応じて 広告のクリック数が変化する 仮 説 もうすぐ節分の季節ですね. 本日15時より落花生の大特価 セールを行います. Twitterであがっている話題と内容が 類似している広告はクリック数が多い可能性
  5. 5. 検証 検証事項 ① : Twitterで「話題」を検出できるのか? ② : Twitterの話題によって広告のクリック数は変化するのか? Server コメント の格納 コメントDB tweet Twitter crawler TwitterAPI Response Request 収集期間 : 2010 12/8 ~ 2011 2/8 コメントの総数 : 533,771 単語の種類 : 136,730 ユーザ数 : 2769人 Twitter上からコメントを収集した コメントの収集 システムの構成
  6. 6. 検証事項① Twitterで「話題」を検出できるのか Server コメント の格納 tweet コメントDB Twitter Twitter crawler API Response Request tfidf値 2/3のコメントにおける各単語のtfidf値 恋恋 1 単語 落花生 節分 八百長 0.000642 恵方 0.00141 0.00109 0.000771 0.000720 ≫manikoroを漢字75文字で表すと⇒恋恋恋恋恋恋恋恋恋恋恋恋恋恋恋恋恋恋恋恋恋恋 恋恋恋恋恋恋恋恋恋恋恋恋恋恋恋恋恋恋恋恋恋恋恋恋恋恋恋恋恋恋恋恋恋恋恋恋恋 恋恋恋恋恋恋恋恋恋恋恋恋恋超憂鬱 http://shindanmaker.com/18312 #kan75 「恵方」「落花生」「節分」など季節性の高いキーワードが検出できている 「八百長」といった時事問題に関するキーワードも検出できている 「恋恋」といった全く関係のないキーワードも検出してしまった コメントの中でtfidf値の高い単語を「話題」として検出する 例) : 3 4 5 2 |{ : }| i d d  t i  n  k k i i n n tf tfidf法により単語を重みづけ ドキュメント:1日の全コメント : 単語iを含む ドキュメント数 |{ : }| | | i i d d t D idf   |D|: 総ドキュメント数 : ドキュメント内の 単語iの出現回数
  7. 7. 検証事項① Twitterで「話題」を検出できるのか Server コメント の格納 tweet コメントDB Twitter Twitter crawler API Response Request tfidf値 日付ごとの「恵方」を含むTweetの数 恋恋 例) : 単語 落花生 節分 八百長 0.000642 恵方 0.00141 0.00109 0.000771 0.000720 コメントの中でtfidf値の高い単語を「話題」として検出する Twitterの話題はtfidf値で検出できる可能性 検証 結果 2/3のコメントにおける各単語のtfidf値 1 3 4 5 2 「恵方」を含むコメントの数は 2/3に大きく増加している 話題として上がっている |{ : }| i d d  t i  n  k k i i n n tf ドキュメント:1日の全コメント : 単語iを含む ドキュメント数 |{ : }| | | i i d d t D idf   |D|: 総ドキュメント数 : ドキュメント内の 単語iの出現回数 tfidf法により単語を重みづけ
  8. 8. 検証事項② 広告とTwitterの話題との類似度 先行研究 [owen 09] に基づいて決定 ある日の全コメント 形態素解析 名詞の抽出 tfidf値 単語 0.01845 豆 0.5169 0.4170 0.3128 0.2585 まき 節分 … 落花生 必要 必要 … 的0.01715 鬼0.1642 tweet 節分で落花生をまく由来について述べた広告 2.8854 落花生 雪 … 節分 広告とある日のTwitterの話題との類似度 ある日のTwitterに出現した 単語についてのみtfidf値を 足し合わせる Twitterの話題によって広告のクリック数は変化するのか 広告とTwitterの話題との類似度を算出 広告とTwitterの間の類似性と実際のクリック数を調査 |{ : }| i d d  t i n   k k i i n n tf tfidf法により単語を重みづけ : ある広告の単語iの 出現回数 : 単語iを含む 広告数 |{ : }| | | i i d d t D idf   |D|: 総広告数
  9. 9. 検証事項② 実験 クリック数 Twitterと広告の類似度 ランダムにTwitterで広告をTweetし,そのときの話題と広告の類似度とクリック数の関係を調べる 類似度とクリック数に関係が見られた例
  10. 10. 検証事項② 実験 クリック数 Twitterと広告の類似度 節分の日を過ぎてから 広告をTweet Twitterの話題に応じて 広告のクリック数が変化 TVの温泉番組で新得が紹介 節分と落花生 新得駅での イルミネーション 置戸町のイルミネーション の紹介記事 節分の日に広告をTweet Twitterの話題と広告の内容が連動してクリック数が増えたと考えられるケースがある 類似度とクリック数に関係が見られた例 ランダムにTwitterで広告をTweetし,そのときの話題と広告の類似度とクリック数の関係を調べる
  11. 11. 検証事項② 実験 クリック数 Twitterと広告の類似度 類似度とクリック数に関係が見られなかった例 ランダムにTwitterで広告をTweetし,そのときの話題と広告の類似度とクリック数の関係を調べる
  12. 12. 検証事項② 実験 クリック数 Twitterと広告の類似度 時計台の 歴史について 類似度の変化は小さいが クリック数が増加 Twitterの話題以外の 要素がクリック数に影響 類似度とクリック数に関係が見られなかった例 Twitterの話題とは別にクリック数が増えたと考えられるケースがある ランダムにTwitterで広告をTweetし,そのときの話題と広告の類似度とクリック数の関係を調べる
  13. 13. 検証結果 検証事項② 類似度と広告のクリック数に関係が見られなかったケース 類似度以外にもクリック数が変化する要因が考えられる ・TVなどのメディアでとりあげられやすい単語 新得 節分 イルミネーション Twitterの話題と連動 類似度と広告のクリック数に関係が見られたケース ・季節性を含む単語 「節分」「新得」「イルミネーション」のキーワードがTwitterと連動 ・広告のTweet時刻 ・同一広告におけるTweetの周期 ・ある広告における過去のTweet回数
  14. 14. まとめ おわりに ・広告のTweet時刻 ・過去のTweet数などの広告のクリック数に影響を与える要素も考慮することにより Twitterの類似度による推薦の有効性の可能性を示した 考察 ・Twitterのコメントと広告の類似度 と クリック数について関係を調査を行った ・Twitterのコメントを収集しtfidf法を用いて話題の抽出を行った 広告のクリック数の最大化 ・同一広告におけるTweetの周期 ・Twitterと広告の類似度 広告のクリックに影響を与える要素 ・ある広告における過去のTweet回数 単語の特徴に応じて クリック数が上昇 するものがある クリック数との関係を 検証する必要性

×