Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

#みどりぼん 11章「空間構造のある階層ベイズモデル」後半

4,139 views

Published on

データ解析のための統計モデリング入門読書会 最終回
11章「空間構造のある階層ベイズモデル」後半
2014/10/21

Published in: Science
  • Be the first to comment

#みどりぼん 11章「空間構造のある階層ベイズモデル」後半

  1. 1. データ解析のための 統計モデリング入門 11章後半 @yamakatu 2014/10/21 #みどりぼん 11th
  2. 2. ざっくり前半の話 • 場所差が独立に決まる(10章)のでなく、空間相関があ る場合のGLMMを考える • 空間相関:「近くは似てて、遠くは似てない」とか(今 回は一次元) • 場所差を表すパラメータrj の階層事前分布(正規分布) のパラメータ平均μを、両隣のrj の平均値とすることで、 相互作用を表現 • このような自己回帰する事前分布をCARモデルと呼ぶ • 今回はその中でも色々制約ついたintrinsic gaussian CARモ デル • そんな感じの階層ベイズモデルをつくってみたら上手く いった
  3. 3. 11.4 空間統計モデルが作り出す 確率場 • 相互作用する確率変数で埋め尽くされた空間を確率場 (random field)と呼ぶ • 本章前半で利用したrjも確率場の一種 • rj の階層事前分布(正規分布)のパラメータ平均μjは μ j = rj−1 + rj+1 2 なので相互作用している • rj の階層事前分布は正規分布なので、確率場の中でもガ ウス確率場と呼ばれる
  4. 4. 確率場{rj}に対するsの影響を見て みる • 11章前半で定義 • ポアソン分布+対数リンク関数 • λj = exp(β + rj) • rjの階層事前分布は正規分布で • 平均 • 標準偏差 μ j = rj−1 + rj+1 2 • パラメータはβとsの二つ • パラメータβを固定(β = 2.27)してみる • ここでsを{0.0316, 0.224, 10.0}と変えてみる s = s nj
  5. 5. sが小さい程、rjは 両隣と似ている値 になる s = 0.0316 s = 0.224 s = 10.0 sが大きい程、rjは 両隣の値と関係な い値をとる
  6. 6. つまり • この確率場は少数の大域的パラメータ(今回はsのみ)に コントロールされていると言える。
  7. 7. 11.5 空間相関モデルと欠測のあ る観測データ • 空間相関を組み込んだ階層ベイズモデルの強み • パラメータの推定がより正確になる(前半の話) • 欠測のあるデータに対してより良い予測が得られることが ある(←イマココ)
  8. 8. 欠測しちゃった • 上:前半で利用した観測 値 • 下:上の観測値から意図 的にいくつかを欠測させ た(黒点が欠測値)
  9. 9. vs. 欠測データ • このような欠測があるデータに対する、あてはまりの良 さを、 • 空間相関モデル • 空間相関を無視した階層ベイズモデル • で比較するお
  10. 10. 結果 • 左:空間相関を考慮しているモデル(空間相関モデル) • 右:空間相関を考慮していないモデル • 空間相関を考慮したモデルの方がより欠測データが正し く予測できている • 予測区間の狭さ • 局所密度のなめらかさ
  11. 11. 空間相関モデルの場合 • パラメータrjの階層事前分布(正規分布)で、隣同士のrj の値を利用している • 結果、欠測がない場合とかなり近い分布になった • 左:欠測データなし(P.250 図11.4) • 右:欠測データあり
  12. 12. 空間相関を考慮しないモデルの場 合 • (10章と同じく)パラメータrj の階層事前分布(正規分 布)は平均0、標準偏差sの正規分布 • ➡手がかりがない • その結果、 • yiに合わせようとするので、局所密度はギザギザになる • 予測区間の範囲が広くなってしまう さーせん。この表現は イマイチ良くわかんなかった
  13. 13. 11.6 まとめ • 前半 • 空間構造のあるデータをモデル化する場合、空間相関を考 慮する • 空間相関のある場所差を生成するには intrincsic gaussian CAR モデルを使う • 後半 • 空間相関のある場所差は確率場を使って表現できる • 空間相関を考慮した階層ベイズモデルは、観測データの欠 測部分を予測するような用途にも使える。

×