昔アラブの偉いお坊さんが 平均と分散を忘れた哀れな男に
しびれるような香りいっぱいの 琥珀色した分布を教えてあげました
やがて心ウキウキ とても不思議このムード
たちまち男は 事前分布におきました
コンガマラカス楽しいルンバのリズム 南の国の情熱のアロマ
それは不思議な分布
コーシー分布について
@kosugitti
オーギュスタン=ルイ・コーシー
• 解析学の分野に対する多大な貢献から
「フランスのガウス」と呼ばれること
もある。これは両者がともに数学の厳
密主義の開始者であった事にも関係す
る。他に天文学、光学、流体力学など
への貢献も多い。ーWikipediaより
Augustin Louis Cauchy
コーシー分布
• コーシー分布は位置母数μと尺度母数σが母数
• μ=0,σ=1が標準コーシー分布と呼ばれ,自由度1
のt分布に一致する
Cauchy(y|µ, ) =
1
⇡ [1 + (y µ
)2]
コーシー分布の特徴
• 平均と分散が定義されない。
• 最頻値と中央値は定義される。
平均がないわけあらへん
• 計算したったらええねん。
※別にrstanでなくても,rcauchy(n,mu,sigma)で出ます。
あるがな
標準偏差がとても大きい。
最大・最小値もびっくりするぐらい大きい。
「定義されない」のは
Cauchy(y|µ, ) =
1
⇡ [1 + (y µ
)2]
http://mathtrain.jp/cauchydist より
コーシー分布の特徴
• 「定義されない」のであって,サンプル平均,サン
プル分散はもちろん算出できます。
• より厳密な数学的説明はWikiや他書に譲るとして…
• 実際問題どういう振る舞いをしているのか,をみて
みたいと思います。
例えば正規分布の場合
• サンプルが得られるたびにその平均を取っていく,
ということを繰り返すと・・・
例えば正規分布の場合
• サンプルが得られるたびにその平均を取っていく,
ということを繰り返すと・・・
大数の法則!
コーシー分布の場合
• サンプルが得られるたびにその平均を取っていく,
ということを繰り返すと・・・
コーシー分布の場合
• 散らばりすぎ。分散に至っては枠外。
コーシー分布の場合
• ylimをなくすとびっくりすることが起きるよ
52943290
裾が重い分布
• さっきのに標準正規分布を重ねる。
裾が重い分布
Re:コーシー分布の特徴
• 時々とんでもない外れ値を出すことがある分布
• 実現値の場合,裾の方に必ず出現度数がある=裾が
重い分布。
• べき分布の一種
• 大数の法則が成立しない(大数の法則は期待値 平
均値の存在を前提としている)
コーシー分布の使い所
• ノーベル経済学賞をとったショールズとマートン(生
きていたらフィッシャー・ブラックも受賞したと言
われる)の「ブラック・ショールズ評価式」は式の
美しさのために正規分布を仮定した。
• 彼らが所属していた投資銀行が予測を外し破綻!
コーシー分布の使い所
• 分散投資の基礎は現代ポートフォ
リオ理論だが,これは株や債券の
価格分布が平均・分散をもつこと
を前提としている。
• 株価のように,時折大きな変動を
する(冪)分布については平均・
分散が存在しないことがあるで。
我々にとっての使い所
• 半Cauchy分布を分散の事前分布にするといいよ,と
いう話。
• Gelman,A.(2006) Prior distributions for variance
parameters in hierarchical models. Bayesian Analysis,
1,515-533.
• Polson N.G. and Scott J.G. (2012) On the Half-Cauchy
Prior for a Global Scale Parameter, Bayesian Analysis,
7,887-902.
半コーシー分布
この辺が「半」
Gelman(2006)
• 階層モデル(ex.8学校)で
• 逆ガンマを無情報事前分布においたりしてたやん。
• これ事前分布が逆ガンマなら事後分布も逆ガンマに
なるからつこてたけど,Jが小さい時は数字の決め
方にだいぶ左右されんで。
Gelman(2006)
• せやから非心t分布を半分に折った分布族を使った
ほうがええで。その代表格が半コーシーやわ。
• 尺度パラメタAを に飛ばしたら一様分布になるし
な,十分おっきかったら「ほとんど情報持ってない」
状態になるねん。裾がめっちゃ重いからな。
Gelman(2006)
逆ガンマまじでやめといたほうがええで。
裾がほとんどゼロになってまうやろ。
一様分布か半コーシーがええで。
まとめ
• コーシー分布は平均と分散が定義できない
• 裾の重い(heavy tail)分布
• 事前分布の影響がありそうな,小さなサンプルに対し
ては,分散の事前分布として半コーシー分布を選ぶと
良い。
• Polson and Scott(2012)は逆ガンマを駆逐する勢い。
Gelman(2006)は半t族で尺度パラメタはデータから考えるべき,
という立場(J=3の八学校はσ=25)
補遺)その他の特徴
• 中心極限定理が成立しない
• 確率変数がコーシー分布の時,その標本分布もコー
シー文になるので,標本平均の分散は
• 正規分布する確率変数同士の商の分布
• コーシー確率変数の逆数もコーシー分布
http://www.geocities.jp/ikuro_kotaro/koramu/1966_w7.htm
以上,
コーシー分布について
でした。

Cauchy分布について(ベイズ塾例会資料)2015.07.26