3. 詩
It’s
normal
to
want
to
fit
in
with
your
friends
Behave
by
their
means
and
believe
all
their
ends.
But
I’ll
be
high
tailing
it,
fast
and
askew,
Precisely
‘cause
I
can’t
abide
what
you
do.
参考:The
end
jus*fies
the
means.目的は手段を正当化する;
友達の輪にとけ込もうとするのは普通のことだ
同じ志しを持っていると信じ、同じように振る舞うだろう
しかし私は(あなたを)軽蔑し、足早に逃去るだろう
だって、はっきり言ってあなたがすることが我慢できないのだ
4. 15.1
EsRmaRng
the
Mean
and
Precision
of
a
Normal
Likelihood
p y µ,σ( )=
1
Z
exp −
1
2
y −µ( )
2
σ 2
"
#
$
$
%
&
'
'
• 正規尤度関数
• の場合、
• Dが与えられたときペイズの定理より、各パラメータを次のように推測
• 適当な事前確率 の基で(15.2)を評価してみる
(15.1)
where Z =σ 2π
!
"
#
$
%
&
D = y1, y2, y3{ }
p yi µ,σ( )i
∏ = p D µ,σ( )
p µ,σ D( )=
p D µ,σ( )p µ,σ( )
dµ dσ p D µ,σ( )p µ,σ( )∫∫
(15.2)
p µ,σ( )
12. 15.1.2
ApproximaRon
by
MCMC
in
BUGS
• モデルを理解したり、デバッグしたりするにはあらかじめ決めたパラメータを使って
架空のデータを生成してみるのが役に立つ
– 事後分布を使ってパラメータを推測してみてその良さを確認する(SecRon
15.4.1)
13. 15.1.3
Outliers
and
Robust
EsRmaRon:
The
t
DistribuRon
• 異常値の扱い
– データに異常値が含まれている場合、その原因となる外部要因が分かっていれば修正できる
– しかしほとんどの場合、外部要因によるものなのか、異常値ではないのかの判断はつかない
– 何かの基準で異常値をデータから削除せず使う場合、正規分布より異常値の影響を受けにくい
尤度関数を使う
• t分布は、異常値が含まれるデータのモデルとして使える
– (Damgaard,
2007,
Meyer
&
Yu,
2000,
Tsionas
2002)
14. 15.1.3
Outliers
and
Robust
EsRmaRon:
The
t
DistribuRon
• Maximum
Likelihood
esRmates
– p(D|μ、τ)を最大化する正規分布、p(D|μ、τ、df)を最大化するt分布
65歳以上の177人を対象に、
体内の無機リン化合物の量を
量ったデータ。(単位:1mg/
10l)。数個のデータを意図的
に変更している。
15. 15.1.4
When
the
Data
Are
Non-‐normal:
TransformaRons
例)
• 光のない洞窟に住む、超音波を発生する新しい種の虫が発見された
• ある理論によると、発生する音の周波数の平均は22,000Hz
• ある昆虫学者は200個の周波数を測定した
• この理論は正しいと言えるか?
• やり方1:
– 周波数測定データをそのまま使った
– 結果は、「支持されない」
• やり方2:
– ピッチ(知覚される音の高さ)を使った
• ログをとる
– 結果は、「支持された」
17. 15.1.4
When
the
Data
Are
Non-‐normal:
TransformaRons
異常値の変換は大丈夫?
• 一つのグループからのデータセットの場合原則OK。
– 異常値(テールの部分)を圧縮し正常な範囲内に収めるが、変換後の事前分布を考慮しながら同
時にやるのが一般的に難しい
– 変換は一般的に大量の偏りを直すためであり、異常値を直すために使われない。
21. 15.2.1
Hierarchical
Model
① μjはグループレベルパラメータのμG,τGに依存する
② τjはグループレベルパラメータのsG,rGに依存する
③ グループレベルパラメータはより高レベルの分布に従っ
ている。
④ 利便性の為に、(形状、尺度)→(平均、標準偏差)に直
す
• 最初、グループレベルの事前確率の定数は具体的に
与えられる必要がある。その分野や手元にあるデータ
によって適切に決められる必要がある。
• 例えば、空調システムの故障なしで作動する機関はお
よそ100で1〜10000日の間に収まる場合μGはmsや無
限大の値を取らないようにする。(正規化したことも忘れ
ずに)
• パラメータ推測時に、そもそもの仮定を崩さないように。
各機体からのデータは正規分布に従っていること(ユニ
モーダルで対称性のある)。μjが正規分布に従っている
こと。τjがガンマ分布に従っていること。
①
②
③
④
• 顕著な異常値があった場合、t分布を使った方がい
いかもしれない
• 個別の機体のデータで現れる異常値と、平均の分
布で現れる異常値が考えられる。
• μjとμGの分布をt分布に変える
22. 15.2.2
ImplementaRon
in
BUGS
• データ配列Ndataの各値は、測定値と機体番号
のセットになっている
• 「機体jのi番目のデータ」という意味ではない!
• 事後平均:61.6日
• Means
of
Each
Aircrauを最も説明できるのは、平
均2.28、標準偏差0.33の正規分布
• Precisions
of
Each
Aircrauを最も説明できるのは、
平均3.83、標準偏差1.25のガンマ分布
(SecRon
15.4.2)
24. 15.4
R
Code
15.4.1
EsRmaRng
the
Mean
and
Precision
of
a
Normal
Likelihood
• 正規尤度関数の平均・精度の推測
15.4.2
Repeated
Measures:
Normal
Across
and
Normal
Within
• 階層モデルの実装(航空機の空調システム)