ラブライブ!の各キャラクターのpixiv投稿数をみてみた(数式修正)
Upcoming SlideShare
Loading in...5
×
 

ラブライブ!の各キャラクターのpixiv投稿数をみてみた(数式修正)

on

  • 606 views

Webスクレイピング技術を使って、pixivの投稿数を集計。今回はキャラクター同士の投稿数の累計についてみてみます。

Webスクレイピング技術を使って、pixivの投稿数を集計。今回はキャラクター同士の投稿数の累計についてみてみます。

Statistics

Views

Total Views
606
Views on SlideShare
400
Embed Views
206

Actions

Likes
0
Downloads
0
Comments
0

3 Embeds 206

http://ryuichixp.hatenablog.com 192
http://www.slideee.com 12
http://feedly.com 2

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

ラブライブ!の各キャラクターのpixiv投稿数をみてみた(数式修正) ラブライブ!の各キャラクターのpixiv投稿数をみてみた(数式修正) Presentation Transcript

  • ラブライブ!の各キャラクターのpixiv投稿数を 見てみた 数値データをどう解釈するか?に力点を置いて 行く
  • 知識の確認(1):平均、分散、標準偏差 試行の結果によって,その値をとる確率が定まる変数のことを 確率変数と呼ぶ。このとき確率変数の平均、分散、標準偏差に ついて確認しよう。 以下n個の確率変数x1,x2,x3,……..,xnがあり、それに対応する確 率をp1,p2,p3, ……,pnとする。このとき 平均: 分散: 標準偏差: 標準偏差の値が低い程、それだけ平均の周りに確率変数が分布 している事を示す。各確率変数のばらつき具合を読み取ってい く。
  • 知識の確認(2):確率変数の平均と分散の例題 図のような立方体の展開図に1〜5の数字を書き込 んだサイコロがある。但し、各面の出方は同様に確 からしいものとする。 このサイコロ1回振り、出た目をXとする。この時 平均E(X)、分散V(X)を求めよ。 度数分布表は右のようになる。この事から、 X 1 2 3 4 5 p 1/6 1 / 6 1/6 1/6 2 / 6 0 0.1 0.2 0.3 0.4 1 2 3 4 5
  • 知識の確認(3):平均、分散、標準偏差をプログラムで 問題:6つの標本からなる母集団があり、各標本値は1,2,3,4,5,6とする。 このとき母集団Aの平均と分散を標本平均、標本分散と呼ぶ。 このときプログラム等を用いて母集団Aの標本平均、標本分散、標準偏 差を求めよ。 [1]:R言語の場合(R - 分散:まさるな日記を参考) var関数は不偏分散を求める関数なので、varp関数を定義 >varp <-function(x) { var(x) * (length(x)-1) / length(x) } >v<-c(1,2,3,4,5,6) > mean(v) #標本平均を計算 [1] 3.5 > varp(v) #標本分散を定義 [1] 2.916667 > sqrt(varp((v)) #標準偏差の定義を思い出す [1] 1.707825
  • 知識の確認(4):平均、分散、標準偏差をプログラムで 問題:6つの標本からなる母集団があり、各標本値は1,2,3,4,5,6とする。 このとき母集団Aの平均と分散を標本平均、標本分散と呼ぶ。 このときプログラム等を用いて母集団Aの標本平均、標本分散、標準偏 差を求めよ。 [2]:Excelの場合(備考の関数を使って求める) 標本値(確率変数) 備考 1 2 3 4 5 6 標本平均 3.5 AVERAGE関数 標本分散 2.916666667 VARP関数 標準偏差 1.707825128 STDEVP関数
  • 本題:ラブライブ!のpixiv投稿数を講評してみた(1) 6/8現在のラブライブの各種キャラクターのpixiv投稿数を見 てみた所以下のようになった。 図:6/8現在のラブライブのpixiv投稿数
  • 本題:ラブライブ!のpixiv投稿数を講評してみた(2) 各キャラクター毎の投稿数の標本平均、標本分散、標準偏 差を調べた所以下のようになったので講評する。 標本平均 4958 標本分散 4059128 標準偏差 2015 中央値 3902 講評 • 標本平均が中央値より大きい。南ことり(3位)より も右側なので、全体の66%が平均以下である事が 分かる。 • この事から投稿される子とされてない子とで、か なりの隔たりがある事が分かる。 0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000 3352 3504 3839 3879 3902 3992 4927 8037 9188
  • 本題:ラブライブ!のpixiv投稿数を講評してみた(3) 今度は現実の出来事とリンクして講評してみる。 • pixivはコミックマーケットへ出典する人が投稿している 場合がある。 • このため南ことり、西木野真姫、矢沢にこの同人誌を書 いている人が多いと見る事ができる。 追加調査が必要な事項 • このようにpixivの投稿数は、現実の同人誌の発行数の指 標としてどれだけ有為か?を調査したい(コミケに出典する サークルの何%がpixivに出典しているか?等)