Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

データマイニングの話詰め合わせ

12,559 views

Published on

埼玉工業大学にて、「情報の分析と活用」という講義でゲスト講師をした際の資料です。

Published in: Technology

データマイニングの話詰め合わせ

  1. 1. データマイニングの話 詰め合わせ 埼玉工業大学 情報の分析と活用 2018/11/21 中山心太
  2. 2. 自己紹介 • ところてん • @tokoroten • 株式会社NextInt 代表 • 怪文章職人 • 最近の活動 • データサイエンティスト養成読本 ビジネス活用編 • 最近のお仕事 • 機械学習顧問(4社) • スマホアプリミドルウェア屋 • SIer • ECプラットフォーム • データ分析企業 • 新規事業コンサルティング(1社) • ゲームディレクター(1社) ↓共著 ↓寄稿↓共著
  3. 3. 目次 • 相撲の八百長を統計で見つける • 演習:論文を探してみよう • ソシャゲのガチャが壊れた話 • ソシャゲのランキングイベントの話 • Kickstarterにおける不正を見つけよう • 人工衛星と画像処理と金融 • その他、雑多な話いろいろ
  4. 4. 目次 • 相撲の八百長を統計で見つける • 演習:論文を探してみよう • ソシャゲのガチャが壊れた話 • ソシャゲのランキングイベントの話 • Kickstarterにおける不正を見つけよう • 人工衛星と画像処理と金融 • その他、雑多な話いろいろ
  5. 5. 相撲の八百長(ヤバい経済学より) • 相撲の仕組みを雑に説明 • 各場所ごとに15戦 • 勝ち越す(8勝以上)と、番付が大きく上がる • 負け越す(7勝以下)と、番付が下がる • 番付の変化量は右の図のように歪んでいる • 基本的に番付が近い力士同士が取組 • 八百長はどこで起こりえる? • 千秋楽で、8勝6敗の力士Aと、7勝7敗の力士Bが取組 • 力士Aは勝っても負けても番付が上がる • 力士Bは勝たないと番付が下がる • 力士Bは、力士Aから星を売ってもらうと双方幸せ
  6. 6. 相撲の八百長を見つけるには? • 理想的な勝率と実際の勝率を比較する • 実力が近い者同士が組まれていると仮定すると、勝率は50% • 勝率が50%ということは、コイントスと同じ • コインを15回投げて、何回表が出るかを考える • コイントスであれば7回表と8回表は同じ回数出るはず • もし八百長が行われているとすると、8勝の力士が増えるはず • 余談:コイントスの分布 • 二項分布と呼ばれている • 詳しくは統計の講義を取ろう • コインを15回投げると19%の確率で 7回表と、8回表が出る
  7. 7. Winning Isn’t Everything: Corruption in Sumo Wrestling http://pricetheory.uchicago.edu/levitt/Papers/DugganLevitt2002.pdf 不正
  8. 8. 相撲の不正 • グラフからわかること • 7勝の人が理想値よりも少ない • 8勝の人が理想値よりも多い • 10勝の人が理想値よりも少ない • 千秋楽で8,9,10勝している人が、7勝の人に星を渡している可能性 • 実際の勝率はどうだったか?(ヤバい経済学より)
  9. 9. 相撲協会はどう反応したのか? • 相撲の不正告発論文は2002年発表 • 統計的に不正があることは明らかだが、 実証が無かったため放置された • 実際に八百長で問題になるのは2011年 • 野球賭博問題で携帯電話を押収 • 押収された携帯電話から、星のやり取りの情報が明るみに • 力士58人が引退、2人が解雇 • 正直なところ、対応遅すぎないすか……
  10. 10. 演習:論文を探してみよう • Google Scholar • https://scholar.google.co.jp/ • 世界中の論文が探せる • 「Corruption in Sumo Wrestling」 で検索して、今回の論文が出るか探してみよう • CiNii • https://ci.nii.ac.jp/ • この講義の先生の名前で検索してみよう
  11. 11. 目次 • 相撲の八百長を統計で見つける • 演習:論文を探してみよう • ソシャゲのガチャが壊れた話 • ソシャゲのランキングイベントの話 • Kickstarterにおける不正を見つけよう • 人工衛星と画像処理と金融 • その他、雑多な話いろいろ
  12. 12. ソシャゲのガチャが壊れた話 https://twitter.com/rpg_ae/status/1040601898376544256
  13. 13. 何が起こっていたのか? https://twitter.com/GARSON33496467/status/1040618546391220224
  14. 14. 運営はどんな運用をしていたのか?(推測)
  15. 15. 運営はどんな運用をしていたのか?(推測) • ゲーム全体で一つのガチャを運用していた • データベースに星3、星4、星5のカードを入れる • ガチャを引くと、データベースからランダムにカードが選ばれる • 選ばれたカードはデータベースから消える • いわゆる「非復元抽出」を行っていた • なぜこのような運用を行うのか? • 非復元抽出を行うことで、ゲーム全体でのカードの出現率を一定化 • 超超レアカードが偶然に何十枚と出てしまうことを防ぐ • 公表しているガチャ確率と、実測の確率を一致させる • 普通のガチャはどんな実装? • カードの排出確率に基づいて、その場で抽選を行ってカードを排出 • いわゆる「復元抽出」 • 偶然により、公表しているガチャ確率とズレる可能性がある
  16. 16. 実際には何が起こったのか?(推測)
  17. 17. 実際には何が起こったのか?(推測) • 星3は量が多いので、ガチャに入れるのに時間がかかる • 星3を入れるのに時間がかかりすぎて失敗と判断されて、無 かったことにされる(タイムアウト、ロールバック) • 星4、星5は量が少ないので、すぐに挿入が終わる • 星4、星5しか入っていないガチャが出来上がる https://twitter.com/GARSON33496467/status/1040618546391220224
  18. 18. データと実装 • データ的に正しいことを行おうとして、実装的に失敗 • 超レアカードが存在するため、復元抽出では枚数がバラける • ゲーム全体で1枚しか出る予定が無いカードが2枚出てしまったら、存在確率が大 きく異なることになってしまう。 • 非復元抽出を行うために、複雑なシステムを作った結果失敗 • その後の対応が微妙…… • 調査したら、星5が4枚以上入っていたら、再抽選というロジックが 見つかった • 滅多に起きない事象なので、ゲーム全体としてのカード排出枚数は、想定する確 率分布と差が無かったとレポート • この件について謝罪するも、景表法違反として大炎上 • 実装が腐っていたであろう話が有耶無耶に……
  19. 19. 目次 • 相撲の八百長を統計で見つける • 演習:論文を探してみよう • ソシャゲのガチャが壊れた話 • ソシャゲのランキングイベントの話 • Kickstarterにおける不正を見つけよう • 人工衛星と画像処理と金融 • その他、雑多な話いろいろ
  20. 20. ソシャゲのランキングイベントの話 • ランキングイベントのメリット • 人と人を競争させることで、売上が伸びる • 特攻カードを売ることで、儲けることができる • 簡単に稼ぐことができる • ランキングイベントのディメリット • 2週間~1カ月ごとにコンテンツを供給しないといけないので更新コス トが極めて高い • ユーザがランキングのためのプレイングで疲弊して逃げていく • ユーザがランキングのための課金圧に耐えられなくて逃げていく • ランキングイベントは諸刃の剣 • 短期的には儲かるが、長期的にはユーザが減る
  21. 21. ランキングの報酬設計手法 仕事ではじめる機械学習の コラムで触れている話
  22. 22. ランキングの報酬設計手法 • 報酬が存在しない場合のランキング、課金分布 • イベントでランキングがあったと仮定してグラフを作る • 実際はこんなキレイな曲線にはならないので、 10位ごとの平均値などで均すとよい 課金額 順位
  23. 23. ランキングの報酬設計手法 • ある順位以上に報酬を出すようにした場合 • ランキング境界付近の課金額が持ち上がる • あと少しで報酬がもらえる、というところで競争が生まれる 課金額 順位 報酬境界
  24. 24. ランキングの報酬設計手法 • ランキング境界による持ち上がりがオーバーラップしないように、ランキング境界 を切っていく • ランキングが適切に設計できると、オレンジ線のような歪みが生まれる • 曲線が歪んでいないのであれば、ランキングイベントの設計が失敗している • オレンジ線-灰色線=ランキングの効果 課金額 順位
  25. 25. ランキングの報酬設計手法 • ランキング=オークションシステムだと考える • 配布物の価値=ランキングのボーダーラインの課金額 • レアカードであれば、そのレアカードの価値が決定する • ユーザはガチャを回すよりも安いから、イベントに参加していると仮定する • イベント課金額が下がってきているのであればカードの強さ、絵柄が足りない • ガチャでの排出期待値と比較して、ランキングの価値が適当かどうかを考える • カード価値が下がってきていると分かったら、インフレさせることを考える 課金額 順位 ランキング報酬で レアカード配布 ボーダーライン の課金額
  26. 26. このような現象はどこで起こる? • 数値に対して、報酬や税制が非線形になっていると、その前後 で統計の値が歪む • 配偶者控除、130万円の壁 https://style.nikkei.com/article/DGXMZO11493970Q7A110C1PPD001
  27. 27. 目次 • 相撲の八百長を統計で見つける • 演習:論文を探してみよう • ソシャゲのガチャが壊れた話 • ソシャゲのランキングイベントの話 • Kickstarterにおける不正を見つけよう • 人工衛星と画像処理と金融 • その他、雑多な話いろいろ
  28. 28. 用語解説 • クラウドファンディング • 将来商品が受け取れる権利をもとに、資金調達を行う手法 • 工場で量産するためにはまとまった資金が必要 • 欲しい資金量を宣言して、その資金量に到達したら、資金調達できる • マーケットリサーチと、資金調達を同時に行う仕組み • Kickstarter • クラウドファンディングの最大手 • Backer(名詞) • 後ろにいる者=後援者、後ろ盾 • クラウドファンディングに投資した人 • Back(動詞) • 支持する、後押しする
  29. 29. Kickstarterの不正を見つける • クラウドファンディングは非線形 • 目標金額を達成すると、集めた資金が貰える • 達成できないと、資金はもらえない • All or Nothing • 達成率の軸でクラウドファンディングを見てみる • 集金金額/目標金額 で達成率に変換 • 達成率の軸でソートしてみる • ソシャゲのグラフと同じような分布になっていれば、 クラウドファンディングの効果が出ているはず • Kickstarterのデータを収集して分析してみる • 仕事ではじめる機械学習の中の分析レポート
  30. 30. データ収集 • KickstarterのAPIを利用して収集したデータ • Technologyカテゴリのプロジェクト、21404件 • データ収集日、2017/03/04 • データ収集方法 • Kickstarterの非公開APIを利用し、jsonデータを収集 • 通常検索 • https://www.Kickstarter.com/projects/search?term=3d+printer • 非公開API • https://www.Kickstarter.com/projects/search.json?term=3d+printer • ソースコード • https://github.com/oreilly-japan/ml-at-work/tree/master/chap08 • 備考:APIは4000件までしか結果を返さないので、Technologyカテゴリの下にある サブカテゴリを指定して検索件数を抑制し、新しいプロジェクト順でデータ収集を実 施 • データ欠損の可能性があり • 次のクエリでTechnologyタグ全体を検索した際のhit数は27000件であり、データ欠 損の可能性がある • https://www.Kickstarter.com/projects/search.json?term=&category_id=16
  31. 31. データ欠損の可能性 • カテゴリと年度のデータから、appsカテゴリがデータ欠損の可能性あり • 検索オーダーがNewestであるため、時系列を伴わない統計分析については問題ない と判断する。以後、時系列を利用した分析を行う際にはappsカテゴリを除外して実 施する データの個数 / category 年度 カテゴリー 2009年 2010年 2011年 2012年 2013年 2014年 2015年 2016年 2017年 総計 technology 2 6 44 102 172 201 221 224 45 1017 technology/3d printing 35 148 243 142 12 580 technology/apps 2 3 5 5 968 1842 1066 121 4012 technology/camera equipment 2 3 15 70 114 112 22 338 technology/diy electronics 1 4 15 24 195 256 218 33 746 technology/fabrication tools 1 5 2 2 45 77 64 11 207 technology/flight 1 6 7 99 166 87 10 376 technology/gadgets 6 10 480 977 773 126 2372 technology/hardware 9 49 101 199 697 829 742 559 79 3264 technology/makerspaces 1 2 3 38 94 55 11 204 technology/robots 1 8 21 15 118 179 116 24 482 technology/software 40 124 95 142 260 633 771 512 76 2653 technology/sound 5 11 11 103 188 192 33 543 technology/space exploration 1 5 15 10 65 94 72 12 274 technology/wearables 6 217 350 359 49 981 technology/web 7 944 1505 792 107 3355 総計 51 185 274 529 1279 5153 7819 5343 771 21404
  32. 32. プロジェクト数のトレンド • プロジェクト数は2015年第二四半期をピークに減少トレンドである • 他のクラウドファンディングサイトをクリエイターが使うようになった可能性 • Kickstarter内の他のタグにプロジェクトが流れている可能性がある。 • 決済通貨をUSDに限定しても同様の傾向であるため、海外案件が増えたわけではな い
  33. 33. 累計調達金額、成功プロジェクト数のトレン ド • 成功プロジェクト、調達金額(USDのプロジェクトに限定)は横ばい • Kickstarterが縮小傾向にあるとは言えない • 成功率の低いプロジェクトが2014年に多かっただけの模様
  34. 34. 達成率に現れる特異点 • 達成率=調達金額/目標金額 • 達成率順に並べて可視化を行う(縦軸:達成率) • 達成率100%近辺に特異点が発生している
  35. 35. 特異点は終了したプロジェクトに現れる • まだ募集中のプロジェクトに限定して達成率を算出 • 100%付近での特異点は消える • プロジェクト終了間際に特異点が生まれると考えられる
  36. 36. 年度ごとの達成率の分布 • フィルター条件 • 現在募集中のプロジェクトは除外 • 年度ごとの分析であるためappsカテゴリは除外 • 達成率の状況から、3つの異なる傾向が存在 • 2010年まで、2011~2013年、2014年以降 state (複数のアイテム) state (複数のアイテム) category (複数のアイテム) category (複数のアイテム) 件数 列ラベル 割合 列ラベル 達成率 2009年 2010年 2011年 2012年 2013年 2014年 2015年 2016年 2017年 総計 達成率 2009年 2010年 2011年 2012年 2013年 2014年 2015年 2016年 2017年 総計 0-0.1 28 99 101 130 376 2417 3624 2269 167 9211 0-0.1 54.90% 54.10% 37.27% 24.81% 29.51% 57.75% 60.63% 53.05% 57.19% 54.07% 0.1-0.2 5 16 16 38 97 271 311 302 13 1069 0.1-0.2 9.80% 8.74% 5.90% 7.25% 7.61% 6.48% 5.20% 7.06% 4.45% 6.28% 0.2-0.3 1 4 13 21 61 164 193 140 9 606 0.2-0.3 1.96% 2.19% 4.80% 4.01% 4.79% 3.92% 3.23% 3.27% 3.08% 3.56% 0.3-0.4 4 6 15 40 109 123 95 3 395 0.3-0.4 0.00% 2.19% 2.21% 2.86% 3.14% 2.60% 2.06% 2.22% 1.03% 2.32% 0.4-0.5 1 3 3 16 30 65 98 75 8 299 0.4-0.5 1.96% 1.64% 1.11% 3.05% 2.35% 1.55% 1.64% 1.75% 2.74% 1.76% 0.5-0.6 1 4 8 18 45 74 64 4 218 0.5-0.6 0.00% 0.55% 1.48% 1.53% 1.41% 1.08% 1.24% 1.50% 1.37% 1.28% 0.6-0.7 2 4 13 30 41 36 1 127 0.6-0.7 0.00% 1.09% 0.00% 0.76% 1.02% 0.72% 0.69% 0.84% 0.34% 0.75% 0.7-0.8 2 1 1 5 23 36 23 1 92 0.7-0.8 0.00% 1.09% 0.37% 0.19% 0.39% 0.55% 0.60% 0.54% 0.34% 0.54% 0.8-0.9 1 1 7 16 16 20 5 66 0.8-0.9 0.00% 0.00% 0.37% 0.19% 0.55% 0.38% 0.27% 0.47% 1.71% 0.39% 0.9-1 1 1 9 5 9 25 0.9-1 0.00% 0.00% 0.37% 0.00% 0.08% 0.22% 0.08% 0.21% 0.00% 0.15% 1-1.1 9 16 20 47 109 206 311 251 14 983 1-1.1 17.65% 8.74% 7.38% 8.97% 8.56% 4.92% 5.20% 5.87% 4.79% 5.77% 1.1-1.2 2 11 16 26 43 94 127 102 8 429 1.1-1.2 3.92% 6.01% 5.90% 4.96% 3.38% 2.25% 2.12% 2.38% 2.74% 2.52% 1.2-1.3 4 9 17 39 73 94 68 6 310 1.2-1.3 0.00% 2.19% 3.32% 3.24% 3.06% 1.74% 1.57% 1.59% 2.05% 1.82% 1.3-1.4 1 2 8 12 37 47 71 56 2 236 1.3-1.4 1.96% 1.09% 2.95% 2.29% 2.90% 1.12% 1.19% 1.31% 0.68% 1.39% 1.4-1.5 1 4 5 9 29 34 46 48 5 181 1.4-1.5 1.96% 2.19% 1.85% 1.72% 2.28% 0.81% 0.77% 1.12% 1.71% 1.06% 1.5-1.6 1 3 2 11 20 37 51 45 170 1.5-1.6 1.96% 1.64% 0.74% 2.10% 1.57% 0.88% 0.85% 1.05% 0.00% 1.00% 1.6-1.7 3 8 9 17 31 38 35 1 142 1.6-1.7 0.00% 1.64% 2.95% 1.72% 1.33% 0.74% 0.64% 0.82% 0.34% 0.83% 1.7-1.8 1 1 3 9 21 26 46 27 1 135 1.7-1.8 1.96% 0.55% 1.11% 1.72% 1.65% 0.62% 0.77% 0.63% 0.34% 0.79% 1.8-1.9 1 7 13 25 31 21 4 102 1.8-1.9 0.00% 0.00% 0.37% 1.34% 1.02% 0.60% 0.52% 0.49% 1.37% 0.60% 1.9-2 2 5 18 24 26 20 95 1.9-2 0.00% 0.00% 0.74% 0.95% 1.41% 0.57% 0.44% 0.47% 0.00% 0.56% >2 1 8 51 138 280 439 615 571 40 2143 >2 1.96% 4.37% 18.82% 26.34% 21.98% 10.49% 10.29% 13.35% 13.70% 12.58% 総計 51 183 271 524 1274 4185 5977 4277 292 17034 総計 100.00% 100.00% 100.00% 100.00% 100.00% 100.00% 100.00% 100.00% 100.00% 100.00%
  37. 37. 達成率の分布からわかること • 観測された事実 • 達成率10%未満で終わるプロジェクトが54%存在する • 達成率50%から100%で終わるプロジェクトは3%程度と少ない • 達成率100%~110%で終わるプロジェクトは5.7%と非常に多い • 達成率が200%超で終わるプロジェクトは12%以上ある • 達成率の変曲点は、募集中のプロジェクトには存在しない • 年度ごとに見ても、達成率に変曲点 • 達成率に応じて、プロジェクトは3種類に大別することができ る • 達成率50%未満 : 典型的な失敗プロジェクト • 達成率50%~200% : 終了間際にBackされるプロジェクト • 達成率200%超 : 大成功プロジェクト
  38. 38. 典型的な失敗プロジェクト • 達成率10%未満で終わるプロジェクトが54%存在する • プロジェクトの16.2%はBackerが0人、52%が10人以下 • 身内のご祝儀Backもできないような準備不足プロジェクトが多い • プロジェクトを成功させたいのであれば、Backer100人をどう やって集めるかを考える必要がある 割合 列ラベル Backer人数 canceled failed live suspended successful 総計 0 23.8% 20.7% 23.9% 18.8% 0.0% 16.2% 1 10.1% 14.3% 12.2% 10.0% 0.1% 10.4% 2 6.0% 9.8% 6.8% 4.2% 0.3% 7.0% 3 4.3% 6.5% 3.2% 3.3% 0.3% 4.7% 4 3.7% 4.9% 2.8% 4.6% 0.3% 3.6% 5~10 12.4% 14.7% 7.3% 4.6% 1.5% 11.0% 11~20 8.7% 9.6% 7.7% 10.0% 4.6% 8.3% 21~100 20.9% 14.8% 18.6% 20.9% 25.1% 18.1% 100~ 9.9% 4.7% 17.5% 23.4% 67.8% 20.8% 総計 100.00% 100.00% 100.00% 100.00% 100.00% 100.00%
  39. 39. 終了間際にBackされるプロジェクト • プロジェクト終了間際の広報活動によるBackerの増加 • プロジェクトメンバーが最後のお願いをして回る • Kickstarterが終了間際のプロジェクトをトップページで紹介している • ただし、これは達成率100%付近に変曲点が生まれる理由にはならない • 最後のひと押しを積極的に行っている人がいる可能性 • プロジェクトメンバーが自腹を切ってプロジェクトを成功させる • 「俺が成功させた」感を味わいたい人 • プロジェクトを達成させた、という一体感を楽しみたい人 • キャスティングボートを握るという稀有な体験ができる • クラウドファンディングをゲームとして楽しんでいる人 • クラウドファンディングを「成功するかどうかわからないゲーム」として考えた場合、 勝率の高いゲームである、達成率90%付近のプロジェクトにBackするのは合理的 • 自分がBackしたプロジェクトが失敗するのは嫌なので、達成率が低いプロジェクト にはBackしない • 達成率が100%を超えて成功確実の場合、ゲームにならないため、Backしない
  40. 40. ギリギリで失敗したプロジェクトの分析 • 達成率が70%から100%のプロジェクトは平均Back金額が250ドル超 • ギリギリで達成したプロジェクトは平均Back金額が200ドル未満 • Backプランの設計が成否を分けると考えられる state (複数のアイテム) currency USD 達成率 件数 件数(比率) 平均Back金額 平均Backer 0-0.1 8118 56.73% 48 8 0.1-0.2 858 6.00% 135 47 0.2-0.3 482 3.37% 181 64 0.3-0.4 318 2.22% 159 110 0.4-0.5 202 1.41% 160 140 0.5-0.6 153 1.07% 183 175 0.6-0.7 92 0.64% 182 169 0.7-0.8 68 0.48% 279 200 0.8-0.9 45 0.31% 254 144 0.9-1 20 0.14% 404 241 1-1.1 849 5.93% 192 175 1.1-1.2 357 2.49% 165 287 1.2-1.3 242 1.69% 169 334 1.3-1.4 188 1.31% 149 363 1.4-1.5 133 0.93% 115 422 1.5-1.6 133 0.93% 178 652 1.6-1.7 108 0.75% 166 480 1.7-1.8 106 0.74% 197 412 1.8-1.9 82 0.57% 179 406 1.9-2 69 0.48% 142 406 >2 1686 11.78% 183 1514 総計 14309 100.00% 102 246 平均Back金額をそろえる ために、決済通貨がUSD のプロジェクトに限定
  41. 41. 大成功プロジェクト • 平均Back金額は大きく変動しない • 達成率は基本的に平均Backer人数に依存する • 高額なBackプランを払う人が多いから成功するというわけではない
  42. 42. 国とプロジェクトの成功 • 英語が成功のカギを握る • アメリカが他国と比べて成功率が高い(件数の少ない香港を除く) • 英語圏と、ロマンス語の中でも英語に近いフランス語、英語がほぼ必須な小国は成功率が高い • イタリア、スペインのロマンス語圏は失敗率が高い • 説明文がイタリア語、スペイン語で書かれたプロジェクトがいくつか存在 件数 列ラベル 比率 列ラベル 国 canceled failed live successful suspended 総計 国 canceled failed live successful suspended 総計 US 1589 8705 276 3866 149 14585 US 10.89% 59.68% 1.89% 26.51% 1.02% 100.00% GB 255 1324 35 423 26 2063 GB 12.36% 64.18% 1.70% 20.50% 1.26% 100.00% CA 142 813 33 237 16 1241 CA 11.44% 65.51% 2.66% 19.10% 1.29% 100.00% AU 88 561 20 124 19 812 AU 10.84% 69.09% 2.46% 15.27% 2.34% 100.00% DE 44 276 21 96 4 441 DE 9.98% 62.59% 4.76% 21.77% 0.91% 100.00% NL 39 291 4 79 6 419 NL 9.31% 69.45% 0.95% 18.85% 1.43% 100.00% FR 51 243 13 83 2 392 FR 13.01% 61.99% 3.32% 21.17% 0.51% 100.00% IT 36 241 12 31 2 322 IT 11.18% 74.84% 3.73% 9.63% 0.62% 100.00% ES 15 169 8 21 4 217 ES 6.91% 77.88% 3.69% 9.68% 1.84% 100.00% DK 16 102 4 22 144 DK 11.11% 70.83% 2.78% 15.28% 0.00% 100.00% NZ 12 90 4 27 3 136 NZ 8.82% 66.18% 2.94% 19.85% 2.21% 100.00% SE 14 82 1 13 110 SE 12.73% 74.55% 0.91% 11.82% 0.00% 100.00% CH 12 66 3 22 1 104 CH 11.54% 63.46% 2.88% 21.15% 0.96% 100.00% IE 8 51 2 18 1 80 IE 10.00% 63.75% 2.50% 22.50% 1.25% 100.00% NO 11 58 7 1 77 NO 14.29% 75.32% 0.00% 9.09% 1.30% 100.00% AT 9 51 4 12 76 AT 11.84% 67.11% 5.26% 15.79% 0.00% 100.00% BE 7 51 2 5 2 67 BE 10.45% 76.12% 2.99% 7.46% 2.99% 100.00% HK 3 11 7 20 3 44 HK 6.82% 25.00% 15.91% 45.45% 6.82% 100.00% MX 5 17 14 7 43 MX 11.63% 39.53% 32.56% 16.28% 0.00% 100.00% SG 1 14 4 6 25 SG 4.00% 56.00% 16.00% 24.00% 0.00% 100.00% LU 4 1 1 6 LU 0.00% 66.67% 16.67% 16.67% 0.00% 100.00% 総計 2357 13220 468 5120 239 21404 総計 11.01% 61.76% 2.19% 23.92% 1.12% 100.00%
  43. 43. 目標金額と成功率 • 基本的には目標金額が小さいほど成功確率は増大する state (複数のアイテム) currency USD 件数 ゴール金額 達成率 1 10 100 1,000 10,000 100,000 1,000,000 10,000,000 100,000,000 総計 0-0.1 9.09% 32.56% 36.70% 51.29% 57.44% 70.38% 96.00% 100.00% 100.00% 56.73% 0.1-0.2 0.00% 4.65% 5.38% 5.96% 6.52% 4.53% 0.00% 0.00% 0.00% 6.00% 0.2-0.3 0.00% 6.98% 3.43% 3.93% 3.34% 2.45% 0.00% 0.00% 0.00% 3.37% 0.3-0.4 0.00% 2.33% 2.61% 2.21% 2.33% 1.75% 1.00% 0.00% 0.00% 2.22% 0.4-0.5 0.00% 0.00% 1.63% 1.48% 1.51% 0.87% 1.00% 0.00% 0.00% 1.41% 0.5-0.6 0.00% 0.00% 1.79% 1.02% 1.03% 1.20% 0.00% 0.00% 0.00% 1.07% 0.6-0.7 0.00% 0.00% 0.82% 0.55% 0.71% 0.55% 0.00% 0.00% 0.00% 0.64% 0.7-0.8 0.00% 0.00% 0.16% 0.52% 0.48% 0.49% 0.00% 0.00% 0.00% 0.48% 0.8-0.9 0.00% 0.00% 0.33% 0.44% 0.28% 0.22% 0.00% 0.00% 0.00% 0.31% 0.9-1 0.00% 0.00% 0.00% 0.08% 0.18% 0.16% 0.00% 0.00% 0.00% 0.14% 1-1.1 0.00% 2.33% 7.83% 8.12% 5.42% 3.44% 0.00% 0.00% 0.00% 5.93% 1.1-1.2 0.00% 9.30% 2.77% 2.73% 2.47% 2.02% 0.00% 0.00% 0.00% 2.49% 1.2-1.3 0.00% 2.33% 3.10% 1.43% 1.86% 1.15% 0.00% 0.00% 0.00% 1.69% 1.3-1.4 0.00% 2.33% 1.31% 1.54% 1.34% 0.82% 0.00% 0.00% 0.00% 1.31% 1.4-1.5 0.00% 2.33% 1.63% 1.15% 0.87% 0.55% 0.00% 0.00% 0.00% 0.93% 1.5-1.6 0.00% 2.33% 1.31% 0.86% 0.94% 0.87% 1.00% 0.00% 0.00% 0.93% 1.6-1.7 0.00% 0.00% 0.82% 1.02% 0.69% 0.55% 0.00% 0.00% 0.00% 0.75% 1.7-1.8 0.00% 2.33% 0.98% 0.78% 0.74% 0.60% 0.00% 0.00% 0.00% 0.74% 1.8-1.9 0.00% 0.00% 1.31% 0.68% 0.52% 0.38% 0.00% 0.00% 0.00% 0.57% 1.9-2 0.00% 0.00% 1.63% 0.78% 0.29% 0.33% 0.00% 0.00% 0.00% 0.48% >2 90.91% 30.23% 24.47% 13.43% 11.01% 6.71% 1.00% 0.00% 0.00% 11.78% 総計 100.00% 100.00% 100.00% 100.00% 100.00% 100.00% 100.00% 100.00% 100.00% 100.00%
  44. 44. 達成率とプロジェクトキャンセル • 達成率が100%を超えているにもかかわらず、 自らキャンセルしているプロジェクトがいくつか存在する state canceled データの個数 / category 列ラベル 行ラベル 2009年 2010年 2011年 2012年 2013年 2014年 2015年 2016年 2017年 総計 0-0.1 7 21 24 20 64 469 651 414 50 1720 0.1-0.2 2 3 1 6 11 63 72 63 5 226 0.2-0.3 1 2 5 31 44 31 2 116 0.3-0.4 2 3 19 35 19 78 0.4-0.5 1 4 8 21 12 2 48 0.5-0.6 5 8 15 11 2 41 0.6-0.7 2 7 7 3 1 20 0.7-0.8 1 1 5 7 1 15 0.8-0.9 1 2 4 4 4 2 17 0.9-1 2 3 5 1-1.1 1 1 4 4 2 12 1.1-1.2 2 4 6 1.2-1.3 3 3 6 1.3-1.4 1 2 3 1.4-1.5 1 1 2 1 5 1.5-1.6 1 1 2 1.6-1.7 1 3 4 1.7-1.8 1 1 2 1.8-1.9 2 1 3 1.9-2 1 1 >2 8 7 12 27 総計 9 26 26 31 98 625 881 593 68 2357
  45. 45. 達成後キャンセル事例 • 工場に発注してみたら、予算オーバーした • ロボット系、ドローン系 • 価格改定のためにプロジェクトを立て直す • 想定以上の注文により、量産効果により価格を下げられることが判明 • Weather Point 2.0 スマホのイヤホンジャックに付ける気象センサー • AnyTouch Blue USBドングルをPCに刺すと、スマホが仮想キーボード、マウスに なる • 9000ドルで500個のプランのBackerが減っているので、業者に直接取引を持ち掛けたと予 想 • このプロジェクトはindiegogoで成功した後にkickstaterに出品するという形で、 クラウドファンディング を流通網の一つとして利用しており、大変興味深い • 事故でプロジェクトの継続が一時的に困難になった • Dotlens smartphone microscope スマホのカメラに付けるレンズ • テキサス州の洪水にあり、製造設備と在庫を喪失 • その後プロジェクトを立て直し、無事成功
  46. 46. まとめ • Kickstarterは衰退はしていないものの横ばい • 他のクラウドファンディングサービスや、他国のローカルのクラウドファンディング サービスに顧客を奪われている可能性がある • Technologyカテゴリに限定しているので、他のカテゴリ次第では成長している可能性 • クラウドファンディングの効果を、達成率100%付近の歪みとして可視化 • 最後のひと押しをしてくれる人がいる • プロジェクト関係者が身銭を切っている可能性 • 「俺が育てた感」を味わうのが好きな人がいる • 最後のひと押しをするには、安いBackプランが必要 • 大成功プロジェクトは、基本的には大多数から支持されるもの • Kickstarterが販売チャネルになっているようなケースが多い • Kickstarterは商流の一種になっている
  47. 47. Kickstarterで成功させるコツ • 英語でコンテンツを用意する • 追加情報を探しに行っても母国語でしか出てこないケースではBackしにくい • 目標金額を小さくし、確実に成功できるようにする • プロジェクトが成功したことそのものをニュースにすることができ、広報活 動につながる • 大成功したら、プロジェクトをいったんキャンセルして、立て直す裏ワザも ある • プロジェクトを始める前に、最低でも10人はBackerを確保する • 盛り上がってる感を正しく演出する • 目標金額の30%を超えれば、「成功しそうだから」という理由でBackする人 が増え始める可能性が高い • 少額でリワードが得られるBackプランを用意しておく • 10ドル程度で何かがもらえる少額のBackプランを容易しておく • 平均Back金額が200ドル未満になるようにする • 最後のひと押しのための応援は、少額であれば気軽に行うことができる
  48. 48. 目次 • 相撲の八百長を統計で見つける • 演習:論文を探してみよう • ソシャゲのガチャが壊れた話 • ソシャゲのランキングイベントの話 • Kickstarterにおける不正を見つけよう • 人工衛星と画像処理と金融 • その他、雑多な話いろいろ
  49. 49. 人工衛星と画像処理と金融 • Orbital Insight社 • https://orbitalinsight.com/ • 民間企業が人工衛星をポンポン飛ばせるようになった • スパイ衛星みたいなことを民間ができるようになった • 人工衛星から撮影された画像を分析することで様々なことが分かるよ うになった • 人工衛星で撮影された画像の解析にコンピュータが使えるようになっ た • ウォルマートの売上 • 作物の収穫量 • 石油の消費量
  50. 50. ウォルマートの売上 • 人工衛星写真から駐車場に駐車している車をカウント • ウォルマートの客の入りを予測 • ウォルマートの業績を予測して、株取引に利用 https://blogs.wsj.com/moneybeat/2014/11/20/counting-cars-to-predict-earnings/https://www.itochu.co.jp/ja/news/press/2017/171115.html
  51. 51. 作物の収穫量の予測 • 農業には連作障害という問題がある • 作物によって必要となる栄養素が異なる • 同じ作物を育成し続けると、土の中の特定の栄養素が枯渇する • 栄養素の枯渇により、同じ作物を連続で作ると収穫量が下がる • 輪作や三圃式農法、ノーフォーク農法で解決 • 異なる性質の作物を順に植えることで、地力を維持して収穫量を上げる • 何を植えるのかは農家依存 • 何がどれくらい植えられているのかが分からない • どの作物がどれくらいの育成状況なのかが分からない • 何がどれくらい収穫できるか予想できない • 作物の将来の価格が予想できない
  52. 52. 作物の収穫量の予測 • 人工衛星にマルチスペクトルカメラを搭載 • 複数の波長を感知できるカメラを人工衛星に搭載 • 普通のカメラはRGBの3波長しか感知できない • 作物によって、返ってくる波長が異なる • 育成状況によって、返ってくる波長が異なる • どの作物が、どれくらい植えられていて、どれくらい収穫できるかが 予測できる → 穀物先物取引に利用 https://blogs.thomsonreuters.com/answerson/satellite-technology-predicting-crop-yields/
  53. 53. 石油の消費量の予測 • 石油タンクは、落とし蓋の構造 • 天井が上がり下がりする • 空間が空いていると、石油が気化して爆発の危険がある • 天井がどれくらい下がったかで、石油の消費量が分かる • 衛星写真からどうやって • タンクそのものの影と 内側の影の大きさを比較 • タンクが満杯なら内側の影は小さい • 太陽の位置で補正する • どうやって儲けるの? • 原油先物取引 https://www.zmescience.com/research/technology/eyes-up-above-you-cant-lie-satellite-imagery/
  54. 54. ほんとにできるの? • スズキ自動車工場の航空写真 by GoogleMap • 工場の隣に家を借りて、ドローン飛ばして空撮すれば、簡単に生産量や出荷量は分 かりそう https://www.google.com/maps/@34.7415631,138.169087,203m/data=!3m1!1e3
  55. 55. 目次 • 相撲の八百長を統計で見つける • 演習:論文を探してみよう • ソシャゲのガチャが壊れた話 • ソシャゲのランキングイベントの話 • Kickstarterにおける不正を見つけよう • 人工衛星と画像処理と金融 • その他、雑多な話いろいろ
  56. 56. その他雑多な話 • Computational Thinking • AIは何を奪うのか、人手不足は何が起こっているのか • 時代の変化 • 時代の変化を知るには? • AIによって消える職業、残る職業
  57. 57. Computational Thinking:計算機的思考 • Decomposition • 問題を分解して、コンピュータが実行可能な単位にする • Pattern Recognition • パターンの発見して、ループに落とし込む • Abstraction • 現実の問題を抽象化して、重要な要素や、共通する部分だけ取り出す • Algorithm Design • 手順を並べることで、問題を解けるようにする • CTのスキルが、これからの生産性を左右する • CTができるとワークフローの設計などができる • AIに指示をする側に回れる http://tannomizuki.hatenablog.com/entry/2016/10/18/125818
  58. 58. AIは何を奪うのか、人手不足は何が起こっているのか • 中間層が電子化・AI化によって不要になってきた • AIに指示を出せる人の不足 • AIの手足となって働く人の不足 • 君たちはどちらになりたい? https://twitter.com/fromdusktildawn/status/1059294513225560064
  59. 59. キュウリ分類は何故失敗したのか? • 問題は何か? • 人間の能力が高い • 人間の価値が安い • 専門家集約産業がから設備産業 に切り替わったことを理解して いない • 事業拡大や外販を指向していない https://news.mynavi.jp/article/20180606-642208/
  60. 60. 時代の変化1 • 重機の発明 • 肉体労働の簡易化 • 規格化 • 第二次大戦、大量生産、総力戦 • スプリングフィールドM1ガーランド • 鍛冶屋(一人で一気通貫で全部作る人)が消えた • 製図屋は増えた、職工は増えた • 規格化+重機+物流=コンテナの発明 • ベトナム戦争のころ • バラ積みから、コンテナへ、世界の物流が大幅改善 • 港湾労働者がいなくなった • 船のオーナー、船員、トラックは増えた • メインフレーム、アポロ計画 60年代 • 統計、集計の電子化 • Human Computerの消失 • 電子回路の生産
  61. 61. 時代の変化2 • パーソナルコンピュータ+プリンタ 70年代(Apple2とか) • ロケットサイエンティストのマーケット供給 • NASAがアポロ計画を終了したことにより、NASAの科学者が市場に放出された • コンピュータが大企業から中小企業へ • 手動経理、タイピスト、清書係が消えた • パーソナルコンピュータ 80年代(DOS/V互換機) • Factory Automation、産業の電子化 • 大量生産において熟練工が不要に • プログラマーの一般職業化
  62. 62. 時代の変化3 • ネットワーク化 90年代 • メッセンジャーボーイの消失 • 株式の立会所の電子化 • 20年かけて、立会所は消滅 • コンピュータの低コスト化、モバイル化、NWコストの低減 2000年 代 • レンタルビデオ屋の消失、デジカメにより写真屋の消失 • 2008年、リーマンショック • 金融業界が抱えていた、クオンツが市中に放出 • 金融取引のシステムが、インターネット上のサービスに普及、RTB広告の発明 • IoT、AI化、所有から共有、購買からSubscription 2010年 • 監視、モニタリング、認知にかかわる知的産業は真っ先に消える • 認知がメインで、IOがデジタル化されたものは消えやすい • 運転手、読影医 https://www.jpx.co.jp/corporate/about-jpx/history/01-02.html
  63. 63. 時代の変化を知るには?
  64. 64. AIによって消える職業、残る職業 • 消えにくいもの • 低単価 • 接客業 • 営業 • 介護 • 高単価 • コンサルティング • 医療 • 経営 • 人事マネージメント • 法的保護のある資格産業 • 介護、医療 • 会計士、税理士 • 運転手 • マンション管理 • 消えそうな仕事 • 「脳みそだけの仕事」 • 読影医(レントゲン、MRI) • 経理、会計 • 経営 • 保険外交員 • ウェブ購買へのシフト • 保険の審査担当 • 公務員系の事務処理
  65. 65. 課題 • この100年で消えた職業をリストアップする • この100年で増えた職業をリストアップする • 今後20年で消えそうな職業をリストアップする

×