RPubs とその Bot たち
@hoxo_m
2013/11/30(土)
統計数理研究所共同研究集会
自己紹介
•

hoxo_m
某ECサイトでデータ分析をやっています

•

RPubsRecent
RPubs の新着エントリを流す Twitter Bot
自己紹介
•

hoxo_m
某ECサイトでデータ分析をやっています

今日はこれの話
•

RPubsRecent
RPubs の新着エントリを流す Twitter Bot
こんな悩み、ありませんか?
R を使って、他の人がどんな
解析をしているのか知りたい
R を使って、面白い解析を
したんだけど、この結果を
みんなに教えたい!
そんなときは、
RPubs !!!
RPubs
• Easy web publishing from R
• R のソースコードと実行結果を簡単に記事に
して投稿できる仕組みを提供するサービス
1 Click!

RStudio +
R Markdown

knitr

1 Click!

HTML

Publish

RPubs
website

• 詳しくは wdkz さんのスライド
http://www.slideshare.net/wdkz/rstudio-13866958
RPubs
• 要するに、R ユーザーなら誰でも超簡単に
R に関する記事を投稿できるサイト
• R に関する優良記事が多数投稿
– Plyr パッケージの使い方メモ (リンク)
– R で錯視 (リンク)
– コミケと R (リンク)
– 構造方程式モデリングによるパス解析 (リンク)
RPubs の問題点
• トップページは人気エントリー
• 投稿しても新着エントリーに載らない
• そもそも新着エントリーページが無い

• RPubs に投稿しても誰にも見られない!
※2012 年 8 月当時
(現在はトップページは新着エントリー)
というわけで、作っちゃいました
RPubsRecent
RPubs の新着記事を流す Bot
RPubsRecent
• 一定期間ごとに RPubs の新着記事をチェック
して、ツイート
• こいつをフォローしておけば、RPubs でどんな
記事が書かれたか、最新情報がわかっちゃう
• フォロワーが増えれば、新しく書いた記事が
Web の藻屑と消える可能性も低くなる
RPubsRecent
• 良い点
– RPubs の新着エントリが埋もれずに済む

• 問題点
– 全ての投稿が流れるので、玉石混交
問題点
• テスト投稿がたくさん流れる!
要求
どうでもいい投稿は流さないでほしい!
というわけで、
また作っちゃいました
RPubsHotEntry
RPubs のホットな記事を流す Bot
仕組み
•

RPubsRecent のツイートで、お気に入り
(fav) の付いたものだけを流す

• つまり、誰かが興味を持った投稿だけを流す
• どうでもいい投稿は流れない
• やったね!
まとめ
• RPubsRecent に妹ができました
• 是非フォローしてください!
• https://twitter.com/RPubsHotEntry
• 使い分け
–

RPubsRecent : ヘビーユーザ向け

–

RPubsHotEntry : ライトユーザ向け
RPubs の統計情報
(時間があったら)
投稿数
投稿言語
日本語

language-detection で
タイトルを言語判定
短いので判定ミスが多い
投稿日時(GMT)

土日が少ない?実は月ごとで見るとかなり違う

RPubs とその Bot たち