Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

バイラルメディアの可視化

1,811 views

Published on

PyConJP2014 LTの発表資料です。

Published in: Technology
  • Be the first to comment

バイラルメディアの可視化

  1. 1. バイラルメディアの可視化 PyConJP 2014 三上 悟 1
  2. 2. Who am I • 株式会社イノーバ • 三上 悟(Mikami Satoru) • 分析基盤を作ってます • Python歴は1年くらい • 趣味:テキストマイニング・可視化 2
  3. 3. バイラルメディアとは?
  4. 4. http://matome.naver.jp/odai/2139012994512952101/2140401540237604603 4
  5. 5. 話題性のある動画や画像を中心とした記 事に、短期間で爆発的なトラフィックを 集めることを目的としたブログメディア http://news.mynavi.jp/news/2014/08/01/051/
  6. 6. 流行ってる? 6
  7. 7. 7
  8. 8. 8
  9. 9. 知りたいこと 9
  10. 10. • FacebookとTwitterでどんな記事が最も多くシェア されているか? => バイラルした記事はなにか • 他にもいろいろあるけど続きはどこかで 10
  11. 11. 調べてみた 11
  12. 12. バイラルメディア 3 ̶̶̶ 35 12
  13. 13. ツール
  14. 14. • スクレイピング:Scrapy • 前処理・分析 :Pandas • 可視化    :Matplotlib 14
  15. 15. スクレイピング 15
  16. 16. Scrapy • スクレイピングフレームワーク • 早くて、簡単に、ウェブサイトのクローラーを作れる 16
  17. 17. $ pip install scrapy 17
  18. 18. $ scrapy startproject viral_media_spider 18
  19. 19. $ cd viral_media_spider $ scrapy genspider example example.com 19
  20. 20. 20
  21. 21. 21
  22. 22. sitemap.xmlを使ってクロールする 22
  23. 23. $ scrapy crawl example_spider 23
  24. 24. 可視化 24
  25. 25. Pandas • データ分析をするためのライブラリ • PyConJP 2014で、Pandasのデモ画面をたくさん 見たと思うので説明は飛ばします。 25
  26. 26. 26
  27. 27. FacebookとTwitterでどんな記事が 最も多くシェアされているか? 27
  28. 28. Facebook 28
  29. 29. 29
  30. 30. 初めての育児に不安だらけだった1年。1歳児検診の帰りにパパがママに贈った感謝のサプライズ http://spotlight-media.jp/article/45124077560088198 30
  31. 31. https://www.youtube.com/watch?v=uu3iM1azTj4 31
  32. 32. Twitter 32
  33. 33. 33
  34. 34. 観覧車から見下ろした景色に思わず涙。家族・友人勢揃いで仕掛けた感動サプライズ http://spotlight-media.jp/article/35520619585542170 34
  35. 35. https://www.youtube.com/watch?v=DfKqzcvMj_c 35
  36. 36. 36
  37. 37. 続きは? • 他にも、、 • 炎上した記事は? 数字が含まれているタイトルの比率は? タイトルの最小・最大は? • ご興味のある方は、こちらまで => http://twitter.com/saicologic 37

×