Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
AZURE ML上のRにおける状
態空間法でのWEBサイトの
アクセス解析
池田 直哉
2015-3-28
対象データ
 BlogサイトのGoogle Analyticsからエクスポートしたアクセスユーザ
数
 対象期間: 2014-11-1 ~ 2015 – 3 - 25
方法
 Azure MLには状態空間法を実装したビルディングブロックは現状ない
(2015/3/25現在)
 Azure MLでR言語を使用しモデリングする
 R言語でのパッケージはdlmを用いる
 まず、ローカルレベルモデルでモデリン...
作成したEXPERIMENT
R CODE (LOCAL LEVEL MODEL)
# Load modules
require(dlm)
# Map 1-based optional input ports to variables
dataset <- maml.map...
出力結果と考察
ローカルレベルのみでほぼPVの
変動を説明可能だが、一部の投
稿によるスパイク上の変動が
残っているため、特定の投稿に
よるスパイクをモデル化するた
めの項を追加する必要性がある
と考える。
スパイク上の影響がロー
カルレベルに...
結論
 ローカルレベルモデルによる分析でサイトのPVは順調に伸びているこ
とが示唆される
 2014/12/25の突発的なアクセスの上昇はAdvent Calendarによる一
時的なものである可能性がある
 Advent Calenda...
参考文献
1. J.J.コマンダー、S.J.クープマン 状態空間 時系列分析入門
2. 北川源四郎 時系列解析入門
ONE MORE THING
 Jubatus .NET Client
 H2OのAzure Storage対応作ってます
Upcoming SlideShare
Loading in …5
×

Azure ml上のRにおける状態空間法でのwebのアクセス解析

2,055 views

Published on

Azure ML上のRによってWebのアクセス解析を状態空間モデルで試みる。

Published in: Data & Analytics
  • Be the first to comment

Azure ml上のRにおける状態空間法でのwebのアクセス解析

  1. 1. AZURE ML上のRにおける状 態空間法でのWEBサイトの アクセス解析 池田 直哉 2015-3-28
  2. 2. 対象データ  BlogサイトのGoogle Analyticsからエクスポートしたアクセスユーザ 数  対象期間: 2014-11-1 ~ 2015 – 3 - 25
  3. 3. 方法  Azure MLには状態空間法を実装したビルディングブロックは現状ない (2015/3/25現在)  Azure MLでR言語を使用しモデリングする  R言語でのパッケージはdlmを用いる  まず、ローカルレベルモデルでモデリングを行いその結果によって今 後の分析方針を決定する
  4. 4. 作成したEXPERIMENT
  5. 5. R CODE (LOCAL LEVEL MODEL) # Load modules require(dlm) # Map 1-based optional input ports to variables dataset <- maml.mapInputPort(1) # class: data.frame # Extract PV from data set pv <- dataset$access # Building function build.1 <- function(theta) { dlmModPoly(order=1, dV = exp(theta[1]), dW = exp(theta[2])) } # Fitting fit.1 <- dlmMLE(pv, parm=c(1,1), build.1) # Modeling by fitted parameters mod.pv <- build.1(fit.1$par) # Filtered pvFilt <- dlmFilter(pv, mod.pv) # Smoothed pvSmooth <- dlmSmooth(pvFilt) # Output plot(pv, type="o", col=8, ylab="", main="PV Smoothing") lines(dropFirst(pvSmooth$s), col=4, lwd=2) http://logics-of-blue.com/dlm%E3%81%AE%E4%BD%BF%E3%81%84%E6%96%B9/を参照
  6. 6. 出力結果と考察 ローカルレベルのみでほぼPVの 変動を説明可能だが、一部の投 稿によるスパイク上の変動が 残っているため、特定の投稿に よるスパイクをモデル化するた めの項を追加する必要性がある と考える。 スパイク上の影響がロー カルレベルに残っている ため、これを除去しない と説明しにくい。 突発的なアクセスの増加は2014/12/25のもので Advent Calendarの記事による一時的な現象と推 測される
  7. 7. 結論  ローカルレベルモデルによる分析でサイトのPVは順調に伸びているこ とが示唆される  2014/12/25の突発的なアクセスの上昇はAdvent Calendarによる一 時的なものである可能性がある  Advent Calendarの影響を説明するにはローカルレベルモデルに加え てスパイク上の上昇を説明するための項を加えてリモデルすることが 望ましい
  8. 8. 参考文献 1. J.J.コマンダー、S.J.クープマン 状態空間 時系列分析入門 2. 北川源四郎 時系列解析入門
  9. 9. ONE MORE THING  Jubatus .NET Client  H2OのAzure Storage対応作ってます

×