Successfully reported this slideshow.                                                   Upcoming SlideShare
×

# 状態空間モデルの実行方法と実行環境の比較

37,895 views

Published on

Published in: Data & Analytics
• Full Name
Comment goes here.

Are you sure you want to Yes No • Dating for everyone is here: ♥♥♥ http://bit.ly/2Qu6Caa ♥♥♥

Are you sure you want to  Yes  No
• Dating direct: ♥♥♥ http://bit.ly/2Qu6Caa ♥♥♥

Are you sure you want to  Yes  No

Are you sure you want to  Yes  No

Are you sure you want to  Yes  No

Are you sure you want to  Yes  No

### 状態空間モデルの実行方法と実行環境の比較

1. 1. 状態空間モデルの 実行方法と 実行環境の比較 森林総合研究所 伊東宏樹 2014年3月16日 第61回日本生態学会大会（広島） T13 生態学における状態空間モデルの利用
2. 2. 本日とりあつかうソフトウェア • Rパッケージ • dlm • KFAS • MCMC • BUGS言語 • Stan
3. 3. サンプルコードなどの置き場所 http://www001.upp.so-net.ne.jp/ito-hi/stat/2014ESJ/
4. 4. Statistical Software for State Space Models Commandeur et al. (2011) Journal of Statistical Software 41(1)
5. 5. State Space Models in R Petris & Petrone (2011) Journal of Statistical Software 41(4)
6. 6. dlm
7. 7. dlm • Dynamic Linear Model （動的線形モデル） • 線形+正規分布 • カルマンフィルタ • パラメータ推定 • 最尤推定／ベイズ推定
8. 8. dlmの記法 ✓0 ⇠ N(m0, C0) ✓t = Gt✓t 1 + wt, wt ⇠ N(0, Wt) t = 1, ... , n データモデル プロセスモデル yt = Ft✓t + vt, vt ⇠ N(0, Vt)
9. 9. ナイル川の流量の変化 data(Nile)
10. 10. dlmによるLocal Level Model Petris and Petrone (2011)より ## build functionの定義! BuildLLM <- function(theta) {! dlmModPoly(order = 1,! dV = theta,! dW = theta)! } このような関数を定義しておく。
11. 11. dlmによるLocal Level Model ## パラメーターの最尤推定! fit.llm <- dlmMLE(Nile, parm = c(100, 2),! build = BuildLLM,! lower = rep(1e-4, 2))! ! ## 推定したパラメーターをbuild functionで使用! model.llm <- BuildLLM(fit.llm\$par)! ! ## 平滑化! smooth.llm <- dlmSmooth(Nile, model.llm)
12. 12. 平滑化 dlmSmooth()
13. 13. ナイル川の流量の変化 data(Nile) アスワンダム着工
14. 14. dlmによる回帰モデル # アスワンダム着工の前後を変数に! x <- matrix(c(rep(0, 27),! rep(1, length(Nile) - 27)),! ncol = 1)
15. 15. dlmによる回帰モデル ## モデル定義! model.reg <- dlmModReg(x, dW = c(1, 0))! BuildReg <- function(theta) {! V(model.reg) <- exp(theta)! diag(W(model.reg)) <- exp(theta)! return(model.reg)! }
16. 16. dlmによる回帰モデル ## 最尤推定! fit.reg <- dlmMLE(Nile,! parm = rep(0, 2),! build = BuildReg)! model.reg <- BuildReg(fit.reg\$par)! smooth.reg <- dlmSmooth(Nile,! mod = model.reg)
17. 17. ナイル川の流量の変化 data(Nile) アスワンダム着工
18. 18. dlmの文献 • Petris G, Petrone S, Campagnoli (2009) Dynamic Linear Models with R Springer • 和合肇（監訳）・萩原淳一郎（訳）(2013)「R によるベイジアン動的線形モデル」朝倉書店 • Petris G (2010) An R package for dynamic linear models. Journal of Statistical Software 36(12)
19. 19. KFAS
20. 20. KFAS • Kalman Filter and Smoother for Exponential Family State Space Models • 正規分布以外の分布（ポアソン分布など）を扱 える • 最尤推定
21. 21. KFASの記法 t = 1, ..., n ↵1 ⇠ N(a1, P1) プロセスモデル データモデル yt = Zt↵t + ✏t, ✏t ⇠ N(0, Ht) ↵t+1 = Tt↵t + Rt⌘t, ⌘t ⇠ N(0, Qt)
22. 22. イギリスのバン運転手の死者・重傷者数 data(Seatbelts)
23. 23. KFASによるポアソン分布の状態空間モデル help(KFAS)より model.van <- SSModel(VanKilled ~ law +! SSMtrend(degree = 1,! Q = list(matrix(NA))) +! SSMseasonal(period = 12,! sea.type = “dummy",! Q = matrix(NA)),! data = Seatbelts,! distribution = "poisson")
24. 24. KFASによるポアソン分布の 状態空間モデル fit.van <- fitSSM(inits = c(-4, -7, 2),! model = model.van,! method = “BFGS")! ! pred.van <- predict(fit.van\$model,! states = 1:2) lawとSSMtrend()のみをつかう
25. 25. 季節変化をのぞいた予測値 シートベルト着用義務化
26. 26. BUGS WinBUGS, OpenBUGS, JAGS
27. 27. BUGS • MCMCによるベイズ推定 • 柔軟なモデリング • Rパッケージでは対応できないモデル
28. 28. 例題 • ある生物の個体数を推定する。 • 一定の発見確率にしたがって発見される。 Kéry & Schaub (2011) Bayesian Population Analysis using WinBUGS: A hierarchical perspective Chapter 5を参考にした。
29. 29. データ生成 set.seed(1234)! n.t <- 50 # 観察回数! N.lat <- rep(50, n.t) # 真の個体数! p <- 0.7 # 発見確率! N.obs <- rbinom(n.t, N.lat, p) # 観察個体数!
30. 30. 生成されたデータ Binomial(50, 0.7) 真の個体数 観測された個体数
31. 31. BUGSモデル var! N, # 観察回数! y[N], # 観察された個体数! y_hat[N], # 「真の個体数」の推定値! lambda[N], # log(y_hat)! p, # 発見確率! tau, sigma;
32. 32. BUGSモデル model {! ## データモデル! for (t in 1:N) {! y[t] ~ dbin(p, y_hat[t]);! y_hat[t] <- trunc(exp(lambda[t]));! }! ## プロセスモデル! for (t in 2:N) {! lambda[t] ~ dnorm(lambda[t - 1], tau);! }! ## 事前分布! lambda ~ dnorm(0, 1.0E-4);! p ~ dbeta(2, 2);! sigma ~ dunif(0, 100);! tau <- 1 / (sigma * sigma);! }
33. 33. JAGSによる実行 inits <- list()! inits[] <- list(p = 0.9, sigma = 1,! lambda = rep(log(max(N.obs) + 1), n.t))! inits[] <- list(p = 0.7, sigma = 3,! lambda = rep(log(max(N.obs) + 1), n.t))! inits[] <- list(p = 0.8, sigma = 5,! lambda = rep(log(max(N.obs) + 1), n.t))! ! model <- jags.model("ks51.bug.txt",! data = list(N = n.t, y = N.obs),! inits = inits, n.chains = 3,! n.adapt = 100000)! samp <- coda.samples(model,! variable.names = c("y_hat", “sigma",! "p"),! n.iter = 3000000, thin = 3000)!
34. 34. 推定結果 真の個体数 観測された個体数 「真の個体数」の推定値
35. 35. Stan
36. 36. http://mc-stan.org/
37. 37. Stan • MCMCによるベイズ推定 • Hamiltonian Monte Carlo (HMC) • No U-Turn Sampling (NUTS) • Stan → C++ → ネイティブバイナリ
38. 38. Stan • CmdStan • コマンドラインから • RStan • Rから • PyStan • Pythonから
39. 39. StanによるDLM data(Nile)を使用
40. 40. StanによるDLM data {! int<lower=0> N;! matrix[1, N] y;! }! transformed data {! matrix[1, 1] F;! matrix[1, 1] G;! vector m0;! cov_matrix C0;! ! F[1, 1] <- 1;! G[1, 1] <- 1;! m0 <- 0;! C0[1, 1] <- 1.0e+6;! } データ dlmと同様の データを用意
41. 41. StanによるDLM parameters {! real<lower=0> sigma;! }! transformed parameters {! vector V;! cov_matrix W;! ! V <- sigma * sigma;! W[1, 1] <- sigma * sigma;! }! パラメータ dlmと同様の パラメータを 用意
42. 42. StanによるDLM model {! y ~ gaussian_dlm_obs(F, G, V, W, m0, C0);! sigma ~ uniform(0, 1.0e+6);! } モデル
43. 43. StanによるDLM library(rstan)! ! model <- stan("kalman.stan",! data = list(y = matrix(c(Nile),! nrow = 1),! N = length(Nile)),! pars = c("sigma"),! chains = 3,! iter = 1500, warmup = 500,! thin = 1)
44. 44. MCMCの軌跡 traceplot(ﬁt, pars = "sigma", inc_warmup = FALSE)
45. 45. StanによるDLM > print(fit)! Inference for Stan model: kalman.! 3 chains, each with iter=1500; warmup=500; thin=1; ! post-warmup draws per chain=1000, total post-warmup draws=3000.! ! mean se_mean sd 2.5% 25% 50% 75% 97.5% n_eff Rhat! sigma 121.2 0.5 13.8 92.6 112.7 121.5 130.3 148.4 889 1! sigma 45.5 0.6 17.6 18.3 32.7 43.2 55.7 85.2 833 1! lp__ -541.6 0.0 1.1 -544.6 -542.0 -541.3 -540.9 -540.6 904 1! ! Samples were drawn using NUTS(diag_e) at Sun Feb 9 06:06:42 2014.! For each parameter, n_eff is a crude measure of effective sample size,! and Rhat is the potential scale reduction factor on split chains (at ! convergence, Rhat=1).!
46. 46. StanによるDLM sigma <- apply(extract(fit, "sigma")\$sigma, 2, mean)! ! library(dlm)! ! buildNile <- function(theta) {! dlmModPoly(order = 1, dV = theta, dW = theta)! }! modNile <- buildNile(sigma^2)! smoothNile <- dlmSmooth(Nile, modNile) ベイズ推定されたパラメータをdlmで使用
47. 47. 平滑化 Stanでベイズ推定されたパラメータをdlmで使用
48. 48. Stanによる状態空間モデルの解析 • gaussian_dlm_obs()でうまくいかないことも • 自分でモデルを記述することも当然可能
49. 49. Stanによる状態空間モデルの解析 data {! int<lower=0> N;! real y[N];! }! parameters {! real theta[N];! real<lower=0> sigma;! }!
50. 50. Stanによる状態空間モデルの解析 model {! // データモデル! for (t in 1:N) {! y[t] ~ normal(theta[t], sigma);! }! ! // プロセスモデル! for (t in 2:N) {! theta[t] ~ normal(theta[t - 1], sigma);! }! ! // 事前分布! theta ~ normal(0, 1.0e+4);! sigma ~ uniform(0, 1.0e+6);! }
51. 51. まとめ 状態空間モデルをあつかえるソフトウェア • Rパッケージ: dlm, KFAS • 関数に与える引数の意味を理解する。 • ベイズ推定: BUGS, Stan • 柔軟なモデリングが可能。 • 計算時間はかかる。 • 上記以外のソフトウェアもある。