離散時間ロジスティック回帰モデル解説

“離散型”生存分析アプローチとしての
「離散時間ロジスティック回帰モデル」
～森平（2009）『信用リスクモデリング－測定と管理－』第5章を読む～
大國晃
※WEB閲覧用に編集していないため、フォントが小さく見難くなっていますが、ご了承ください。

1
本資料の目的（1/2）
• 対象文献：
森平爽一郎（2009）, デフォルト確率の期間構造推定～離散型
生存分析アプローチ
• 森平著『信用リスクモデリング－測定と管理－』, 朝倉書店に所収
• （参考）同書のその他の内容
– 0 目的と要約
– 1 信用リスクのある債権(債券)の評価:誘導型モデル
– 2 実績デフォルト率の推定
– 3 1期間デフォルト確率推定
– 4 デフォルト確率推計―拡張と検証
– 5 デフォルト確率の期間構造推定～離散型生存分析アプローチ
– 6 デフォルト確率推定のオプションアプローチ
– 7 デフォルト時損失率、回収率
– 8 デフォルト相関・資産相関
– 9 損失分布推定と経済所要資本決定
題材はコレ

2
本資料の目的（2/2）
• 「離散時間ロジスティック回帰モデル」の日本語による一級の解説文を読む
– 有用であるにもかかわらず、日本では（特に金融分野では）使われる機会が少ない「離散時
間ロジスティック回帰モデル」
• 柔軟性も高く、いろいろなことができるが、それほど難しいわけではない
• 知れば／やってみれば、もっと“分析の幅”が広がると思われるが、、、
• 整理された解説書はあまりない・・・
– 森平氏のこの文章は、日本語による一級の解説文であり啓蒙文
• 普通のロジスティック回帰モデルは使ったことがあるが、「離散時間・・・」は知らない／使ったことが
ないという読者を意識して書かれた解説文であり、
• もっと広く使われることを望んだ啓蒙文でもある（と思う）
• 自分はまさにその立場にあったので、同じような状況にある人たちがこの文章を読む際の“ガイド”
となればと考え、この資料を作成
• 生存時間解析モデルをもっと身近なものに
– 「生存時間解析モデルと言えば“比例ハザードモデル”」の風潮に風穴を
• 医薬以外の分野で生存時間解析モデルを使うとなったら、判で押したように“比例ハザードモデル”
という風潮が強いが、
• “比例ハザードモデル”が適当な場面もあれば、そうでない場面、むしろ「離散時間ロジスティック回
帰モデル」が適当な場面もある
– 「離散時間ロジスティック回帰モデル」を理解することにより、
生存時間解析（survival analysis）という手法そのものへの理解も深まると考えられる
⇒生存時間解析モデルをもっと身近なものに

3
５．デフォルト確率の期間構造推定（1/32）
• （イントロダクション）
• 第5章の目的
「（第3、4章で示した）1期間のデフォルト確率推定モデルに対し
て離散型の生存分析（パネルデータに基づくロジット分析）を適
用することにより、多期間に拡張できる」ことを示す
– 1期間ロジットモデル←（収斂拡張）→パネルデータに基づくロジットモデル
• 第5章の内容
– 5.1～5.4
「単純なロジット回帰への入力データを期間×企業のパネルデータ形式
にするだけでPD期間構造を推定できること」を示す
– 付録
理論的な背景・計量経済的な裏付けの説明
（イントロダクション）

4
• 1期間ロジットモデル
1
= L
(1) (0)
, i 1,2,3, ,
1 exp{ (1)}
(1)
i 0 i
i
i
Z X
N
Z
PD
ºa +b
=
+ -
• 現在（t=0）の時点で利用可能な情報Xi(0) により、1年後（t=1）のデフォルト確率PDi(1) を推計する
• 1期間の原因と結果との関係を示している
• パネルデータに基づくロジットモデル（→離散型の生存分析）
1
+ = L L
( 1) ( )
, i 1,2,3, , ; 1,2, ,
1 exp{ ( 1)}
( 1)
0 Z t X t
N t T
Z t
PD t
i i
i
i
+ ºa +b
= =
+ - +
• 式（5.1）を、時間に関して一般化→ t 時点で利用可能な情報を用いて、t+1 時点のデフォルト確率を計算
• 左辺は「条件付きデフォルト確率」
• t 時点でデフォルトしていない企業が、t+1 期（t ～ t+1）にデフォルトする確率
• 「限界デフォルト確率」、「フォワードデフォルト確率」、「ハザード確率」
（5.1）
（5.2）

5
• 例）リスクファクターが2つ、基底デフォルト確率が線形1次式のモデル
+ = L L
, i 1,2,3, , ; 1,2, ,
1
1 exp{ ( 1)}
( 1)
i
i
+ º a +a +b +g
( 1) [ ] ( ) ( )
0 1 Z t t X t F t
N t T
Z t
PD t
i i
= =
+ - +
• Xi(t)：与信先i のt 時点（t=1, 2, ・・・）のリスクファクター
•時間t により変化する→ 時間依存性の説明変数（共変量）
• （第3、4章ではリスクファクターが時間とともに変化することを考慮していない）
• F(t)：t 時点のマクロ経済・社会ファクター、あるいはセミマクロ（地域）経済ファクター
•時間t により変化する→ 時間依存性の説明変数（共変量）
• i には依存しない＝全てのi に共通
• [α0+α1t]：基底デフォルト確率、ベースラインハザード確率
•時間の経過とともにデフォルト確率が変化する部分を説明しようとするもの
•時間t 自体かつt のみがデフォルト確率に与える影響を示している
• より一般的な関数を想定することが可能（ここでは1次式を考えているが、1次式に限定する必要なし）
• デフォルト確率の期間構造推定
（5.3）
• 離散的な時間変化（t=1, 2, ・・・）
• 与信先i のリスクファクターの時間とともに変化する値（Xi(1), Xi(2), ・・・）
• マクロ経済ファクターの現在および将来の値（F(1), F(2), ・・・）
与信先iがそれぞれの時点で
デフォルトする確率の推定
PDi(1), PDi(2), ・・・

6
• デフォルト確率期間における構造推定の新しいアプローチ：
パネルデータを対象にする多期間ロジット回帰分析
– 従来用いられることの多かった手法
・・・Cox比例デフォルトモデル（比例ハザードモデル）
– 比例ハザードモデル適用に際して指摘される点
» 時間依存性共変量を用いる場合、比例ハザード性は維持されない
» （ベースラインハザード確率の推定）
– 「パネルデータを対象にする多期間ロジット回帰分析」
・・・計量社会学や計量政治学などで用いられてきた
• 「イベントヒストリー分析」、「デュレーション分析」
• 【離散的生存分析に関する文献展望】参照
– 新しいアプローチにより実現されるメリット
1. マクロ、セミマクロ（地域）経済変数の取り込み→ 組織的要因の考慮
2. 本質的に離散的な情報の“適切な”利用～財務変数、マクロ経済変数
3. ベースライン（基底）デフォルト確率の推定が容易

5.1 なぜ期間構造推定が
7
• 5.1 なぜ期間構造推定が必要なのか
– 5.1.1 時間とともに変化するデフォルト確率
– 5.1.2 組織的危険としてマクロ経済効果を取り入れる
– 5.1.3 離散型デフォルト確率期間推定の必要性；その他の理由
– 5.1.4 デフォルトT ≧2年前の財務データを用いることの問題点
必要なのか

8
• 5.1.1 時間とともに変化するデフォルト確率
– 信用リスク下にある資産のプライシング
→ 信用リスクを織り込んだ将来期待キャッシュフローの計算が不可欠
• “将来t 期間後のデフォルト確率＝期間構造の推定”が必要
– 基準時点から1期間（年）のデフォルト確率の推定のみではダメ
• 信用リスク下にある資産とは？
– 社債、ソブリン
– 各種消費性ローン・・・住宅ローン、目的ローン、カードローン（※満期不定）
– リース債権
– デフォルト確率の期間構造を水平とみなすことは一般に困難
必要なのか

9
• 5.1.2 組織的危険としてマクロ経済効果を取り入れる
– 「パネルデータを対象にする多期間ロジット回帰分析」
→ 時間とともに変動するマクロ／セミマクロ経済変数を取り入れられる
– マクロ経済変数がデフォルト確率に与える影響は「組織的危険」
• ポートフォリオに含まれる全ての与信先に等しく影響
デフォルトが“独立でない”
必要なのか

• 5.1.3 離散型デフォルト確率期間推定の必要性；その他の理由
1. 時間依存性のリスクファクター（説明変数、共変量）の取り扱いが容易
10
• 連続型の生存分析では特別な注意が必要
– Cox の比例ハザードモデル（のみ）で取り扱い可能
他の「生存分析」では基本的に不可能
– データの作成、プログラミング（※SAS以外は不明）が煩雑となる
– 時間依存性共変量を用いる場合、比例ハザード性は維持されない
• 本質的に離散的な情報の“適切な”利用
2. 1期間のPD推定方法と整合的
• 通常のロジット回帰と全く同じ方法でＯＫ
– プログラミングは全く同じ
– データも多少の注意・工夫は必要だが決して難しくはない（→5.2.1）
• T = 1 → 1期間のPD推定方法と同等
必要なのか

• 5.1.3 離散型デフォルト確率期間推定の必要性；その他の理由
11
3. ベースライン（基底）デフォルト確率の推定が容易
• 多用されるCox の比例ハザードモデルでは・・・
– かなり面倒
– カプラン・マイヤー法でもよいが・・・→ 同時に推定ができない
• 離散型の生存分析では、パラメトリック／ノンパラメトリックのいずれも
極めて容易
4. 複数イベントの取り扱いが容易
• 延滞、２次破綻、３次破綻、・・・
• プリペイメントなども同時考慮可能
5. 種々の拡張が容易
• 「観察されない異質性」、「異なるデフォルト要因別のデフォルト確率」、「期
限前償還率とデフォルト確率の期間構造の同時推定」、etc.
必要なのか

• 5.1.4 デフォルトT ≧2年前の財務データを用いることの問題点
12
– 「2年累積PD」、「3年累積PD」、・・・
• 「基準時点の財務情報等「のみ」を用いてT 年後のPDを推計する」
• この方法を2, 3, ･･･年に対して別々に適用すれば、PD期間構造を推定で
きるように“思われる”
• こうした方法は、デフォルトに至るまでの利用可能な全ての情報をPD推定
に用いていないという意味で問題がある
– 離散型の生存分析では・・・
• 利用可能な情報の全てを利用している
• 1つの式で全ての年度のPD推計が可能
→ より優れた方法
必要なのか

5.2 デフォルト確率の期間
構造推定モデル
13
• 5.2 デフォルト確率の期間構造推定モデル
【本節の内容】
– 「（分析のための）入力データをどのように用意したらよいか」を提示
↓
“直感的な理解”が可能であるような説明を行う
– 詳細→付録
【本節の構成】
– 5.2.1 ロジット回帰へのデータセット
• 基本データセット
– 5.2.2 基底デフォルト確率構造のみがリスクファクターの場合
– 5.2.3 基底デフォルト確率推定：ノンパラメトリックアプローチ
– 5.2.4 基底デフォルト確率推定：パラメトリックアプローチ
– 5.2.5 時間依存のリスクファクターを考える場合

14
• 5.2.1 ロジット回帰へのデータセット
– 基本データセット
会社番号期間倒産
(i) T(i) Y(i)
1 1 1
2 3 1
3 2 1
4 5 0
連番
1
会社番号期間倒産
1 1 1
2 2 1 0
3 2 2 0
4 2 3 1
5 3 1 0
6 3 2 1
7 4 1 0
8 4 2 0
9
10
11
4 3 0
4 4 0
4 5 0
「企業×年」
に展開
格付モデル構築などでいつも用意している
データの形式と同じ
・・・
「期間」、“経過した時間”を
明示的にデータに取り込むところが肝心
切断（打ち切り）
レコード

： i 番目の借り手の確率的な寿命
15
– 時間に関する変数名についての定義
デフォルト確率：
~
t
？？？
「i 番目の企業がtj 年までに倒産しなかったという条件の下で、tj 年に倒産する確率」
・・・条件付きデフォルト確率（ハザード確率）
i T
t0 = 0 t1 t2 t3 t4
・・・tj
特定の時点(t = t2)
時点tj ; j = 0,1,2
)
~ ~
( ) Pr( i j i j i j PD t º T = t T ³ t

• 5.2.2 基底デフォルト確率構造のみがリスクファクターの場合
16
1
+ -
1 exp{ Z ( t
)}
( )
PD t
=
= = L
Z t g t t T
i
i
i
( ) ( ), 1, ,
★「g(t)」の形をどのように決めたらよいか？
• ノンパラメトリックな方法・・・実績データに最も良く適合するように（、離散的に）
•パラメトリックな方法・・・具体的な関数の形状を事前に決める→そのパラメータを推定
★基底デフォルト確率は“時間だけに依存している”（個先にも、マクロ変数にも依存しない）
• 5.2.3 基底デフォルト確率推定：ノンパラメトリックアプローチ
i =a +a +a +a +a
( ) Z t D D D D
0 1 1 2 2 3 3 4 4 , ( )
1
PD t i
1 exp{ Z ( t
)}
i
+ -
=
• 最も容易なノンパラメトリック（※離散的）な方法・・・「年度別ダミー変数」の利用
• 式（5.8）は、5年度分（5期分）のデータを使用しているケース→データの形式は表5.3（p.93）
• 期間構造の形状に先験的な制約を必要としない→ 柔軟な推定方法
（5.7）
（5.8）

17
• 5.2.4 基底デフォルト確率推定：パラメトリックアプローチ
– 基底デフォルト確率構造のさまざまな形式（※簡単なもの）
• （正確には、基底ロジット、基底対数オッズと言った方が良いかもしれない）
• 時間にかかわらず一定の基底ロジット
– g(t) = α0 t = 0, 1, 2, ・・・
• 時間に関する1次式、2次式、3次式
– g(t) = α0+α1t, t = 0, 1, 2, ・・・
– g(t) = α0+α1t+α2t2, t = 0, 1, 2, ・・・
– g(t) = α0+α1t+α2t2+α3t3, t = 0, 1, 2, ・・・
• 対数時間
– g(t) = α0+α1lnt, t = 0, 1, 2, ・・・
• その他
– 何らかの確率分布－ワイブル分布、対数ロジスティック分布、etc.
– 離散化
– 折れ線化

18
• 5.2.5 時間依存のリスクファクターを考える場合
時間依存性（time-dependant）の
リスクファクター
会社番号t 倒産
t^2
1 1 1
1
連番
1
2 2 1 0
1
3 2 2 0
4
4 2 3 1
3
5 3 1 0
1
6 3 2 1
4
7 4 1 0
1
8 4 2 0
4
4 3 9
0
4 4 16
0
25
負債比率
0.60
0.10
0.20
0.10
0.40
0.80
0.10
0.00
0.00
0.01
0.02
ROE
0.00
0.08
0.09
0.11
0.01
-0.05
0.06
0.08
0.12
0.08
0.10
景気指標
100
100
80
120
100
80
100
80
120
130
120
9
10
11
4 5 0
説明変数被説明変数
i =a +a +a +b +b
( ) Z t t t X X
ロジット回帰分析1 1 2 2
2
0 1 2 , ( )
1
PD t i
1 exp{ Z ( t
)}
i
+ -
=

5.3 モデルの整理と拡張
19
• 5.3 モデルの整理と拡張
– モデルA：1期間モデル
– モデルB：期間構造モデル
– モデルC：マクロ経済効果を考慮した期間構造モデル
– モデルD：観察されない異質性を考慮したPD期間構造モデル
– モデルE：不確実なデフォルト確率期間構造推定モデル
（以下、詳細）
– モデルA：1期間モデル
= a b
º + = L
i , (1) '(0) , 0,1, ,
PD i i
Z x i N （5.16）
1 exp{ Z
(1)}
i
1
(1) 0
+ -
• Zi(0)は現在時点で観察可能な企業属性の線形結合としての「信用リスク度」と解釈できる
• 現在と将来の1時点を結ぶ1期間モデル

1
+ = a b
+ º + = L = L
i , ( 1) ( ) '( ) , 0,1, ; 0,1, ,
( 1) 0
PD t i i
Z t t x t t T i N （5.17）
20
– モデルB：期間構造モデル
+ - +
1 exp{ Z ( t
1)}
i
• 任意の時点（t≧1）におけるデフォルト確率の期間構造推定モデル
• 説明変数ベクトルxi’ と定数項α0(t) が時間依存になる
→ 後述参照
• 式（5.17）においてT=1とすると、式（5.16）に等しくなる
→ 従来の1期間デフォルト確率推定モデルの一般化となっている
– モデルC：マクロ経済効果を考慮した期間構造モデル
（5.18）
1
+ - +
1 exp{ Z ( t
1)}
i
+ =
( 1)
PD t
i
0 + º + +
( 1) a ( ) '( )b '( )b
Z t t x t f t
i i f
t = 0,1,L,T ; i = 0,1,L,N
• f(t)：時間とともに変わり得るマクロ経済変数（※企業i には依存しない）

（5.19）
21
– モデルD：観察されない異質性を考慮したPD期間構造モデル
1
+ - +
1 exp{ Z ( t
1)}
i
+ =
( 1)
PD t
i
0 + º + + +
( 1) a ( ) '( )b '( )b
Z t t c x t f t
i i i f
t = 0,1,L,T ; i = 0,1,L,N
• 「観察されない異質性（unobserved heterogeneity）」
•経営者の質、企業文化、内部統制（コンプライアンス意識など）、etc.
•その他にも、観察者が気付くことのできない変数が多く存在するはず
• 企業によって異なる定数項「ci」によって表現→ i 番目の企業に対するダミー変数により推定
– モデルE：不確実なデフォルト確率期間構造推定モデル
1
+ - +
i
i
+ =
( 1) ( ) '( ) '( ) ~
Z t t x t f t
• 個別企業における「観察されない異質性」が不確実である（“確率的に変動する”）場合
• σは推定すべきパラメータ
• PDi(t+1)も不確実な振る舞いをする
（5. 20）
~ ~ (0, 1)
1 exp{ ( 1)}
( 1)
0
N
Z t
PD t
i i f i
e
+ ºa + b + b +se
t = 0,1,L,T ; i = 0,1,L,N

22
• 5.4 実証分析
– 5.4.1 利用データ
– 5.4.2 デフォルト確率の期間構造推定結果
– 5.4.3 推定デフォルト確率の分布の比較
– 5.4.4 事例研究
（以下、詳細）
• 5.4.1 利用データ
• 日経NEEDS企業財務データファイル
– 2000～2008年の日本の上場企業
» 東証・大証・名証1／2部、ジャスダック、ヘラクレス、セントレクス
» 最長9年×企業数のパネルデータ
– 年次決算書データ→ 約40の財務指標と規模変数
• マクロ経済変数
– 104種類
– “対前年同期比”の形をとっている
5.4 実証分析

23
• 5.4.2 デフォルト確率の期間構造推定結果
– マクロ経済指標
• 104の指標から符号条件や有意性を考慮して選択
• 最終的に4指標を採用
– 日経平均株価指数（対前年同月比）
– WTI原油先物価格指数（対前年同月比）
» ⇒企業の収益構造に影響を与える組織的危険
– 景気動向指数（一致指数）（6ヶ月ラグ）（対前年同四半期比）
» ⇒マクロの実物経済に関する市場期待を表す変数
– 日経225株価指数変化率（ボラティリティ）
» ⇒資本市場全体にわたる組織的危険
– 結果概要
– 規模を表す変数（資産合計対数値）はあまり採用されず
– 年度ダミーを用いた基底デフォルト確率とマクロ変数は代替関係
5.4 実証分析

24
• 5.4.3 推定デフォルト確率の分布の比較
– マクロ経済効果を取り込むことにより、デフォルト確率の分布が変化
• 特に、デフォルト企業のデフォルト確率推定値にバイアスが生じる
• 5.4.4 事例研究
– 「クリード」と「ダイア建設」の事例→ 割愛
5.4 実証分析

5.A 付録：離散的な生存分析
25
• 5.A 付録：離散的な生存分析の理論的な背景
– （イントロダクション）
– デフォルト確率（条件付きデフォルト確率）
– 生存確率をデフォルト確率を用いて表現する
– デフォルト確率を用いて表現する
– 尤度関数：生存確率と限界デフォルト確率を統合した表現
の理論的な背景

26
• 「5.A 付録」の内容概説
準備１準備２本題
• （イントロダクション）
• デフォルト確率（条件付きデフォルト確率）
• 生存確率をデフォルト確率を用いて
表現する
• デフォルト確率を用いて表現する
• 尤度関数：生存確率と限界デフォルト確率を
統合した表現
• 記号の準備
• 生存時間解析の基本（の基本）
としての
◇Si (tj) ：生存確率
◇fi (tj) ：無条件デフォルト確率
◇PDi (tj)：条件付きデフォルト確率
• 「条件付きデフォルト確率：
PD 」による、
「生存確率： S 」と
「無条件デフォルト確率： f 」の
表現
• s およびf をPD で表現しておくこと
で、後続の尤度関数とロジットモデル
との関連が明らかとなる
• 限界デフォルト確率（→PD）の
期間構造推定のための
尤度関数の導出
↓
• パネルデータに基づくロジットモ
デルを行う場合の尤度関数と
同じ形式であることを示す
パネルデータに基づく
ロジットモデルにより
PDの期間構造推定が可能
であることを示す

27
• 【準備１】記号の準備と生存時間解析の基本（※離散時間）
基本要素意味備考
無条件デフォルト確率
fi (tj)
累積デフォルト確率
Fi (tj)
生存確率
Si (tj)
条件付きデフォルト確率
PDi (tj)
• fi (tj) = Pr(T = tj)
• イベントが正確に期間tj で発
生する確率
• 死亡する、デフォルトする、寿
命が尽きる、etc.
• 生存確率と条件付きデフォルト
確率との関係（※離散時間）は、
fi (tj) = Si (tj-1)・PDi (tj)
• 連続時間の場合、「確率密度
関数」に当たる
• Fi (tj) = Pr(T ≦ tj) = Σfi (tj)
• 期間tj までの累積イベント発
生確率
• Fi (0) = 0, Fi (∞) = 1
• 連続時間の場合、「分布関数」
に当たり、「確率密度関数」（上
記f ）を積分したものとなる
※Tの~は省略
• Si (tj) = Pr(T > tj)
= 1 - Pr(T ≦ tj) = 1- Fi (tj)
• 期間tj までの生存確率
＝イベントが発生しない確率
• Si (0) = 1, Fi (∞) = 0
• 生存時間解析においては、通常の
統計学とは異なり、T ≦ t となる確
率を示す確率分布関数ではなく、T
> t の生存関数の方が頻繁に用い
られる
• Si (tj) ≡ Pr(T = tj |T ≧ tj)
= Pr(T = tj) / Pr(T > tj-1)
• 期間tj 以上生存している条件
の下で、期間tj にイベントが発
生する確率
• 連続時間の場合と異なり、離散時間
における条件付きデフォルト「率」は
確率とみなすことができ、必ず0と1
の間の値をとる
• 連続時間におけるハザード率は1以上の値
を理論的にとり得る→ハザード「率」(hazard
rate)

28
• 【準備２】「PD」による「S」と「f」の表現
– S およびf をPD で表現しておくことで、後続の尤度関数とロジットモデルとの関連が明らか
となる
– 生存確率をデフォルト確率を用いて表現する
• (5.25) 、(5.28)、(5.29)を基に、(5.30)→(5.33)まで手を動かしてみる
• 「tj 期の生存確率は1からデフォルト確率を差し引いたもの、つまり条件付き生存確率を累積するこ
とによって計算できる」
• ・・・という(5.33)は、直感的に理解しやすい
むしろ、(5.30)の最初の式の関係を意識する方が、より理解の幅が広がるかもしれない
– 無条件デフォルト確率をデフォルト確率を用いて表現する
• デフォルト確率の期間構造を推計するための尤度関数を導くため
• (5.28) 、(5.30)、(5.33)により、容易に展開できる→手を動かしてみる
= - - - - = -
( ) (0)[1 ( )][1 ( )]L[1 ( )][1 ( )] [1 ( )]
S t S PD t PD t PD t PD t PD t
i j i i i j i j i k


-
( )
PD t
Õ Õ
Õ
=
-
i j i j i j i j i k
=
-
=
-
-  

 

= = - =
j
k
i k
i j
i j
j
k
j
k
PD t
PD t
f t PD t S t PD t PD t
1
1
1
1
1
1 2 1
[1 ( )]
1 ( )
( ) ( ) ( ) ( ) [1 ( )]

= >
S t T t
i j i j
( )
f t
29
( ) ( ) ( ) -1 = i j i j i j ■【準備２】の補助１： f t PD t S t
tj
×
・・・
○
tj-1
○
1
2
・・・
i ○ ○
・・・
I
t2 t1
Si(tj-1)
fi(tj)
PDi(tj)
Σ>
=
k j
i k
)
~
( ) Pr(
tj+3
×
○
・・・
・・・
S (t) f (t )
i i j
tj
○
○
○
○
tj+1
×
○
○
○
tj+2
×
○
○
・・・
○
○
○
○
tj-1
○
○
○
○
∞
×
t2 t1
i ○ ○
○ ○
・・・
○ ○
1
○ ○
fi(tj+1)
fi(tj+2)
fi(tj+3)
・・・
fi(∞)
Σ>=
t t
j
■【準備２】の補助２：

• 【本題】尤度関数：生存確率と限界デフォルト確率を統合した表現
30
• 限界デフォルト確率（→PD）の期間構造推定のための尤度関数の導出
↓
• パネルデータに基づくロジットモデルを行う場合の尤度関数と同じ形式であることを示す
パート１：
式（5.35）の考察
三つのパートに分かれている
パート２：
式（5.39）の導入
パート３：
式（5.42）の導出
~
i j T t T t
• 「i 番目の企業がtj 期にデフォル
トしたか、あるいは生存してい
るか」を考える
↓
• tj 期の1期のイベント発生のみ
を考える（＝他の期のイベント
発生は考えない）
1
• 指示関数yi,k の導入
（i 番目の企業がtk 期にデフォ
ルトしていれば1、それ以外0）
↓
• tj 期以外（tj 期より以前）の期に
おけるイベント発生も考慮に入
れる
ΣΣ
ln L y ln PD ( t
)
= =
+ - -
• 全ての企業i = 1, 2,･･･, n の
全ての期間k = 1, 2, ･･･, j の
イベント発生有無を考慮した尤度関
数の導出
↓
• 「PD の期間構造推定」はパネル
データ（企業×期間）に基づくロジット
モデルでＯＫであることを示す
  
=
0
(1) = )] [Pr(
> )]
- =L y i ,k ~
[Pr( i i d
i j
d
式（5.35）式（5.39）式（5.40） ΣΣ
= =
=
n
i
j
k
i k i k
n
i
j
k
i k i k
y PD t
1 1
,
1 1
,
(1 ) ln[1 ( )]
この項の
目的

31
• 尤度関数：生存確率と限界デフォルト確率を統合した表現～パート１
尤度要素
2
(生存)
表：n = 10( or 8) およびj = 5 とした場合の計算イメージ
t5
○
t3
○
t4
○
tk
i
1
t2 t1
○ ○
2 ○ ○ ○ ○
○
3 ○ ○ ○ × －
－
4 ○ ○ ○ ○
○
5 ○ ○ ○ ○
×
×
○
×
○
－
尤度要素
1
(デフォルト)
－
－
○
○
○
○
－
○
○
○
○
－
－
6 ○ ○
7 ○ ○
8 ○ ○
9 ○ ○
10
○ ×
• 「i 番目の企業がtj 期にデフォルトしたか、あ
るいは生存しているか」を考える
→tj 期の1期のイベント発生のみを考える
（＝他の期のイベント発生は考えない）



= =
T t d
d i j i
> =
= > - =
), 0
~
Pr(
), 1
~
Pr(
)]
~
)] [Pr(
~
[Pr( (1 )
i j i
T t i T t i
i j
d
i j T t d
Si(tjf ) i (tj)
L　　（詳細はテキスト参照）

= = >
L T t T t
)]
i i
[ ]
Õ



-
( )
PD t
i j
Õ Õ
= =

1 1

-
( )
PD t
Σ i j
i
ΣΣ [ ]
= = =
=
-
- +  

 

=
 

 

-  

 

=
=
n
i
j
k
i k
n
i i j
n
i
j
k
i k
d
i j
n
i
d
i j
d
i j
PD t
PD t
L d
PD t
PD t
i
1 1 1
1
(1 )
ln 1 ( )
1 ( )
ln ln
1 ( )
1 ( )
p.110 -111
~
)] [Pr(
~
[Pr(
両辺対数をとって、
式（5.35）
式（5.37）
式（5.38）
Õ=
[ -
] 5
1
1 1 ( )
k
k PD t
Õ=
[ -
] 5
1
2 1 ( )
k
k PD t
Õ=
[ -
] 5
1
4 1 ( )
k
k PD t
Õ=
[ -
] 4
1
5 1 ( )
k
k PD t
Õ=
[ -
] 4
1
6 1 ( )
k
k PD t
Õ=
[ -
] 5
1
7 1 ( )
k
k PD t
Õ=
[ -
] 4
1
8 1 ( )
k
k PD t
Õ=
[ -
] 5
1
9 1 ( )
k
k PD t
( ) 5 5 PD t
( ) 6 5 PD t
( ) 8 5 PD t
tj 期以前のイベント発生は考慮
に入っていない
tj 期の1期のイベント発生のみ
を考える

i t
番目の企業が期にデフォルトしている場合
k
番目の企業が最終年度まで生存している場合、
1,
　　　番目の企業が期にデフォルトしている場合のそれ以外の期
32
• 尤度関数：生存確率と限界デフォルト確率を統合した表現～パート２
拡張
尤度要素
2
(生存)
t5
○
○
－
○
×
×
○
×
○
－
尤度要素
1
(デフォルト)
t3
○
t4
○
tk
i
1
t2 t1
○ ○
2 ○ ○ ○ ○
3 ○ ○ ○ ×
4 ○ ○ ○ ○
5 ○ ○ ○ ○
○
○
○
○
－
○
○
○
○
－
6 ○ ○
7 ○ ○
8 ○ ○
9 ○ ○
10
○ ×
• 指示関数yi,k の導入
（i 番目の企業がtk 期にデフォルトしていれ
ば1、それ以外0）

=
1,


i t
番目の企業が期にデフォルトしている場合
番目の企業が期に生存している場合
j
j
i i t
d
0,
式（5.39）
（式（5.40）も参照）
Õ=
[ -
] 5
1
1 1 ( )
k
k PD t
Õ=
[ -
] 5
1
2 1 ( )
k
k PD t
Õ=
[ -
] 5
1
4 1 ( )
k
k PD t
Õ=
[ -
] 4
1
5 1 ( )
k
k PD t
Õ=
[ -
] 4
1
6 1 ( )
k
k PD t
Õ=
[ -
] 5
1
7 1 ( )
k
k PD t
Õ=
[ -
] 4
1
8 1 ( )
k
k PD t
Õ=
[ -
] 5
1
9 1 ( )
k
k PD t
( ) 5 5 PD t
( ) 6 5 PD t
( ) 8 5 PD t

=


k
tj 期以外（tj 期より以前）の期における
イベント発生も考慮に入れる
i k
i t
i
y 0,
,

33
• 尤度関数：生存確率と限界デフォルト確率を統合した表現～パート３
尤度要素
2
(生存)
t5
○
○
－
○
×
×
○
×
○
－
尤度要素
1
(デフォルト)
t3
○
t4
○
tk
i
1
t2 t1
○ ○
2 ○ ○ ○ ○
3 ○ ○ ○ ×
4 ○ ○ ○ ○
5 ○ ○ ○ ○
○
○
○
○
－
○
○
○
○
－
6 ○ ○
7 ○ ○
8 ○ ○
9 ○ ○
10
○ ×
• 全ての企業i = 1, 2,･･･, n の
全ての期間k = 1, 2, ･･･, j のイベント発生
有無を考慮した尤度関数の導出


-
( )
PD t
Σ ΣΣ [ ]
= = =
- +  

 
i PD t

=
n
1 i
1 1
j
k
i k
n
i j
PD t
L d
i i j
ln 1 ( )
1 ( )
ln ln
式（5.42）
Õ=
[ -
] 5
1
1 1 ( )
k
k PD t
Õ=
[ -
] 5
1
2 1 ( )
k
k PD t
Õ=
[ -
] 5
1
4 1 ( )
k
k PD t
Õ=
[ -
] 4
1
5 1 ( )
k
k PD t
Õ=
[ -
] 4
1
6 1 ( )
k
k PD t
Õ=
[ -
] 5
1
7 1 ( )
k
k PD t
Õ=
[ -
] 4
1
8 1 ( )
k
k PD t
Õ=
[ -
] 5
1
9 1 ( )
k
k PD t
( ) 5 5 PD t
( ) 6 5 PD t
( ) 8 5 PD t
（yi,k の導入；詳細はテキストp.111参照）


-
( )
PD t
ΣΣ ΣΣ
- +  

 

i k
ln ln
,
i k
ln 1 PD ( t
)
1 PD ( t
)
L y
= 1 = 1 = 1 =
1
= + - -
• デフォルト確率（PD）の期間構造推定のため
には、「企業×期間」の形のパネルデータを
用意すればよい
Õ=
[ -
] 3
1
3 1 ( )
k
k PD t
Õ=
[ -
] 1
1
10 1 ( )
k
k PD t
( ) 3 4 PD t
( ) 10 2 PD t
[ ]
ΣΣ ΣΣ [ ]
= = = =
=
n
i
j
k
i k i k
n
i
j
k
i k i k
n
i
j
k
i k
n
i
j
k i k
y PD t y PD t
1 1
,
1 1
,
ln ( ) (1 ) ln 1 ( )
1期間のロジット回帰分析の
対数尤度関数と同じ形
n 企業のj 期間に関する総計をとる



-
( )
PD t
( ) t を動かして先々のPD の推定値
34
• まとめ
– 離散時間ロジスティック回帰モデル（discrete time logistic regression model）
• （モデルの由来）
– Cox（1972）により比例ハザードモデルの拡張として提唱される
– Allison（1982）、Efron（1988）等により、“通常の”ロジスティック回帰モデルとの関係が明ら
かにされる
» 最尤法によるパラメータ推定→ “通常の”ロジスティック回帰モデルと同様の手順で
分析が可能
» （Cox は、比例ハザードモデルと同様、部分尤度法によるパラメータの推定を提唱）
• モデルの形
– 条件付きデフォルト確率PD のオッズが、基底オッズに比例する（比例定数はexp(x’β)）
– PD の対数オッズが、対数基底オッズとリスクファクター（共変量）の線形子により説明される
{ i i k ki}
( )
PD t
( )
PD t
0 exp
i j X X X
1 ( )
j
j
i j
PD t
PD t
b +b + +b
-
=
-
L
1 1 2 2
0
1 ( )

-
( )
PD t

i j t X X X
PD t
j i i k ki
i j
b b b q + + + + =  

 

L
0 1 1 2 2 ( )
1 ( )
ln
– デフォルト確率とその期間構造推定
1
( { }) j i i k ki
PD t
+ - q +b +b + +b
=
i j t X X L
X
0 1 1 2 2 1 exp ( )
を得る＝期間構造を推定する
 

 

º
1 ( )
( ) ln
0
0
0
j
j
j PD t
q t
両辺
対数をとる
対数基底オッズ：
リスクファクターの値が全て0の場
合の（＝リスクファクターに依存し
ない） PD の対数オッズ
★これをどういう形で表現するかが
このモデルのポイント・妙味の一つ

35
【参考情報】
• よく用いられる生存時間解析モデルの四つのタイプ
– 比例ハザードモデル（proportional hazard model）
– 加速モデル（accelerated failure time model; AFT model）
– 区分指数モデル（piecewise exponential model）
– 離散時間ロジスティック回帰モデル（discrete time logistic
regression model）

36
【参考情報】
• 比例ハザードモデル（proportional hazard model）
– イベント発生やイベント発生までの時間が連続的に観測されている場合
– 生存時間解析モデルの中で最も“ポピュラー”と言える
– 使用上の注意
• 時間依存性の共変量がある場合、比例ハザード性は成立しない
• ベースラインハザードの推定が難しい
• 加速モデル（accelerated failure time model; AFT model）
– イベント発生やイベント発生までの時間が連続的に観測されている場合
– パラメトリックな生存時間解析の手法
– 様々な生存時間分布の指定
– 時間依存性の共変量の取り扱いはできない

37
【参考情報】
• 区分指数モデル（piecewise exponential model）
– イベント発生やイベント発生までの時間が離散的に観測されている場合
– パラメトリックな生存時間解析の手法；加速モデルのうち、指数分布を指定したも
のに属する
– 時間依存性共変量の取り扱いが可能
– ポアソン回帰モデルによってもパラメータの推定が可能
• 離散時間ロジスティック回帰モデル（discrete time logistic regression
model）
– イベント発生やイベント発生までの時間が離散的に観測されている場合
– 本書で紹介した手法→ 説明は前記参照
– 「部分ロジスティック回帰モデル」も同類
• 「部分ロジスティック回帰モデル」とは？
– Coxにより比例ハザードモデルとともに提唱される→ Cox回帰モデルの一種（≠比例ハ
ザードモデル）
– SASのPHREGプロシージャで「TIES=DISCRETE」と指定→ タイデータの扱いの違いに
よる派生
– 部分尤度法（※最尤法ではない）によるパラメータ推定→ 生存時間分布（ベースラインハ
ザード）に関する推定は不要
– ニューラルネットワークとの併用→ Partial Logistic Artificial Neural Network (PLANN)

38
参考文献
[1]Allison, P. D.(1982), Discrete time methods for the analysis of event
histories, Sociological Methodology Vol. 13, pp. 61-98
[2]Allison, P. D.(2010), Survival Analysis Using SAS: A Practical Guide
Second Edition, SAS Institute Inc.
[3]Cox, D. R.(1972), Regression models and life-tables, J. R. Statist. Soc.
B 34, 187-220.
[4]Efron, B.(1988), Logistic regression, survival analysis, and the Kaplan-
Meier curve, Journal of the American Statistical Association, Vol.83,
414–425.
[5]大橋靖雄・浜田知久馬(1995), 生存時間解析－SASによる生物統計, 東京大
学出版会
[6]辻谷将明・左近賢人(2005), 時間依存型共変量を伴う生存データの解析, 応
用統計学Vol. 34, No. 1, 15-29

離散時間ロジスティック回帰モデル解説

More Related Content

What's hot

Viewers also liked

Similar to 離散時間ロジスティック回帰モデル解説

離散時間ロジスティック回帰モデル解説