More Related Content
Similar to 融資業務における顧客の信用度分析 (20)
More from IBM Analytics Japan (20)
融資業務における顧客の信用度分析
- 1. SPSS Statistics Small TIPS
より効果的にご利用いただくために
1/7
IBM SPSS Statistics Small TIPS
融資における顧客の信用度分析
~ IBM SPSS Decision Trees ~
- 2. SPSS Statistics Small TIPS
より効果的にご利用いただくために
2/7
顧客のセグメンテーション
With IBM SPSS Decision Trees
この資料でご紹介する統計分析手法は、決定木分析と呼ばれています。あまり耳慣れない分析手法かもしれません。
実は、この決定木分析手法は、医療や教育における研究活動や、企業のマーケティング活動のアプローチとしてよ
く使われているデータ分析手法です。
その一例をご紹介しましょう。みなさんは「介護認定制度」という制度について、テレビや新聞でニュースを目に
したことがお有りになると思います。また、身近な方々で、介護認定をお受けになった方などをご存知かもしれま
せん。実は、この介護認定制度を現在の形に整えるには、症例など具体的な証例(Evidence)を用いた研究が不可
欠でした。どのような症例グループには、どのような介護が必要とされるのか、そのグループの特徴をデータに基
づいて解明することにより、より事実を反映させた一般化ルールを制定することができるようになります。そこで
用いられたのが、決定木分析を実現するソフトウェア、IBM SPSS Decision Trees(旧製品名:AnswerTree)です。
この製品を用いることにより、さまざまなデータの関係性を重要な要素だけで簡潔に説明することが可能となりま
す。
決定木分析を使った画期的な分析アプローチを、ぜひ皆様のデータ活用のシナリオにも追加してみてください。
- 3. SPSS Statistics Small TIPS
より効果的にご利用いただくために
3/7
以下の例では製品に同梱されているサンプルファイル tree_credit.sav を使用します。このデータには以下の変数
が保存されています。
信用度 金融機関における顧客の信用度
年齢 顧客年齢
所得 所得カテゴリ
クレジットカード クレジット機能付きカード枚数
教育 学歴レベル
車ローン 車ローンの有無
ここでは、信用度に注目しています。顧客に融資を行った結果、きちんと返済できる人とそうでない人がいます。返済金の
支払いが困難な状況に陥ったり、支払いが滞ったり、そのような信用度が低い人にはできるだけ融資を実施せず、信用度
が高い人に融資をオファーしたいと考えてます。信用度を説明するのは、どのようなアプローチが考えられるでしょうか?
- 4. SPSS Statistics Small TIPS
より効果的にご利用いただくために
4/7
はじめに、信用度の分布を確認します。
分析 >> 記述統計 >> 度数分布表
2500 弱のデータがあることが分かりました。そのうち信用度が悪いと記録されているのは 41.4%です。次に、信用度を別の
変数と組み合わせて分布を確認してみましょう。
分析 >> 記述統計 >> クロス集計
セルボタンから、セル表示の設定を変更できます。
ここでは、行パーセントを追加しました。
- 5. SPSS Statistics Small TIPS
より効果的にご利用いただくために
5/7
信用度と関係がありそうな変数を4つ選び、クロス集計表を作成しました。一つ一つの結果をみて、信用度とその他の変数
の関係性を理解していくのはかなり手間がかかりそうです。2 次元(行と列)のクロス集計だけでなく、3 次元(行と列と層)ク
ロス集計表や、さらに 4 次元 5 次元など多次元クロス集計を作成するとなると、その解釈はかなり複雑になっていきます。
この多次元クロス集計を簡単に作成でき、その解釈も簡単にできるとしたら、どんな人が信用度が低いのか、そのセグメン
トの特徴を明らかにすることができるでしょう。
分析 >> 分類 >> ツリー
- 6. SPSS Statistics Small TIPS
より効果的にご利用いただくために
6/7
逆さまになった木のイメージに見えるでしょうか?決定木分析の名前は、このアウトプットのスタイルに由来しま
す。ノード0が全体のデータにおける信用度の分布を示しています。ノード0では「悪い」信用度は全体の41.4%
の割合を占めています。ノード0から、所得レベル変数で分割されたノード1、ノード2、ノード3に分岐してい
ます。所得レベルが低いセグメントでは、「悪い」信用度は、82.1%の割合を占めています。
さらにノード4に注目をしてみましょう。このノード4は、所得レベルが低く、かつクレジットカードを5枚以上
保持しているセグメントです。このセグメントでは、「悪い」信用度が90.1%を占めています。この構造を追ってい
くとどのような特徴を持つ人が信用度が高いのか、または低いのか、複数の変数の組合せの関係を簡潔に説明する
ことができます。
さらに、この分岐では、分析の目標変数(この例では「信用度」)に対して影響度の高い変数のみ使用される特長
があります。そのため決定木分析は、ある現象に対する要因を追求する分析手法として非常に効果的なアプローチ
です。例えば、「解約」における原因の分析や「故障」に対する原因の分析事例など、さまざまな分析目的に利用
されています。
- 7. SPSS Statistics Small TIPS
より効果的にご利用いただくために
7/7
© IBM Corporation 2017. All Rights Reserved.
ワークショップ、セッション、および資料は、IBM またはセッション発表者によって準備され、それぞれ独自の見解を反映した
ものです。それらは情報提供の目的のみで提供されており、いかなる参加者に対しても法律的またはその他の指導や助言
を意図したものではなく、またそのような結果を生むものでもありません。本講演資料に含まれている情報については、完
全性と正確性を期するよう努力しましたが、「現状のまま」提供され、明示または暗示にかかわらずいかなる保証も伴わな
いものとします。本講演資料またはその他の資料の使用によって、あるいはその他の関連によって、いかなる損害が生じた
場合も、IBM は責任を負わないものとします。 本講演資料に含まれている内容は、IBM またはそのサプライヤーやライセン
ス交付者からいかなる保証または表明を引きだすことを意図したものでも、IBM ソフトウェアの使用を規定する適用ライセン
ス契約の条項を変更することを意図したものでもなく、またそのような結果を生むものでもありません。
本講演資料で IBM 製品、プログラム、またはサービスに言及していても、IBM が営業活動を行っているすべての国でそれら
が使用可能であることを暗示するものではありません。本講演資料で言及している製品リリース日付や製品機能は、市場
機会またはその他の要因に基づいて IBM 独自の決定権をもっていつでも変更できるものとし、いかなる方法においても将
来の製品または機能が使用可能になると確約することを意図したものではありません。本講演資料に含まれている内容は、
参加者が開始する活動によって特定の販売、売上高の向上、またはその他の結果が生じると述べる、または暗示すること
を意図したものでも、またそのような結果を生むものでもありません。 パフォーマンスは、管理された環境において標準的
な IBM ベンチマークを使用した測定と予測に基づいています。ユーザーが経験する実際のスループットやパフォーマンスは、
ユーザーのジョブ・ストリームにおけるマルチプログラミングの量、入出力構成、ストレージ構成、および処理されるワークロ
ードなどの考慮事項を含む、数多くの要因に応じて変化します。したがって、個々のユーザーがここで述べられているものと
同様の結果を得られると確約するものではありません。
記述されているすべてのお客様事例は、それらのお客様がどのように IBM 製品を使用したか、またそれらのお客様が達成
した結果の実例として示されたものです。実際の環境コストおよびパフォーマンス特性は、お客様ごとに異なる場合があり
ます。
IBM、IBM ロゴ、ibm.com、SmarterPlanet アイコンは、世界の多くの国で登録された International Business Machines
Corporation の商標です。他の製品名およびサービス名等は、それぞれ IBM または各社の商標である場合があります。
現時点での IBM の商標リストについては、www.ibm.com/legal/copytrade.shtml をご覧ください。
Microsoft, Windows, Windows NT および Windows ロゴは Microsoft Corporation の米国およびその他の国における商標で
す。