Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

もくもく執筆会☆出張版 REV.7 進捗報告

44 views

Published on

2018/04/02 に行われた「もくもく執筆会☆出張版 REV.7」にて、当日の進捗報告として発表したスライドです。
https://techbook-meetup.connpass.com/event/80182/

おかげさまで「技術書典4」にてこの内容の本を頒布することができました。
https://techbookfest.org/event/tbf04/circle/21050012

Published in: Engineering
  • Be the first to comment

  • Be the first to like this

もくもく執筆会☆出張版 REV.7 進捗報告

  1. 1. もくもく執筆会☆出張版 REV.7 進捗報告 (by SDD, Slide Driven Development) Osamu Takiya
  2. 2. やったこと •技術書典4 で出す本の原稿 「Twitterでツイートを収集するときのノウハウ本 」
  3. 3. 本の内容 • 載せること • Twitterでツイートを収集する際のノウハウ • 載せないこと • かき集めたデータを用いたサービスの開発や運用につい て
  4. 4. 本の内容の具体例 6点
  5. 5. 具体例 1 • Twitterのアプリケーション登録をする際の注意 • SMS認証が原則として必要 • しかしSMS番号を登録してなくても、一定の制限の 下では登録できる • できるのだが……
  6. 6. 具体例 2 • ツイートの検索は過去7日間までしかできない • 札束で殴ると伸びる • ツイートIDさえ保有していればツイートは後からいつで も取得できる • したがって、検索できる期間中にとにかくツイート( ID)をかき集めておくべき
  7. 7. 具体例 3 • 魔窟と化している JSON の取り扱い • RDBMS では地獄 • MongoDB でも地獄 • 同じ地獄なら道連れできそうな人が多い MySQL
  8. 8. 具体例 4 • 「おかしい……ツイートが取得できない……」 • 原因: アプリ登録した自分のアカウントにおいて、その ツイートをしたユーザにブロックされていたから • つまり、ツイートを収集するアプリの登録は、まっさら なアカウントを使うべき
  9. 9. 具体例 5 • 「おかしい……ユーザ検索ができない」 • 原因: スクリーンネーム(いわゆる @hogehoge)が以 前のものから変更されていたから • スクリーンネームではなく ユーザID で取得ればよい • ユーザID と スクリーンネーム の紐付け情報を常に更新 する手間は発生する(実はこれは結構やっかい)
  10. 10. 具体例 6 • 「おかしい……ツイートID は間違っていないのにツイー トが取得できない」 • 原因: https://twitter.com/tornev/status/978157438875529217 • ↑これは int じゃ足りない(ことがある)
  11. 11. まとめ • こんな内容がいろいろ載る予定です • 動機 • ツイートを収集することで実現される企画がどんどん 行われてほしいという願い • 余裕があればツイート収集のフレームワーク(的なもの )も作れたらいいなと
  12. 12. あと20日ほどです 💪💪がんばりましょう💪💪

×