Submit Search
Upload
Rで学ぶ離散選択モデル
•
32 likes
•
32,241 views
宏喜 佐野
Follow
37回Tokyo.Rの離散選択モデルの発表です。 多項ロジットモデルを中心に説明しています。
Read less
Read more
Marketing
Report
Share
Report
Share
1 of 78
Download now
Download to read offline
Recommended
2 4.devianceと尤度比検定
2 4.devianceと尤度比検定
logics-of-blue
pymcとpystanでベイズ推定してみた話
pymcとpystanでベイズ推定してみた話
Classi.corp
2 3.GLMの基礎
2 3.GLMの基礎
logics-of-blue
質的変数の相関・因子分析
質的変数の相関・因子分析
Mitsuo Shimohata
心理学におけるベイズ統計の流行を整理する
心理学におけるベイズ統計の流行を整理する
Hiroshi Shimizu
状態空間モデルの考え方・使い方 - TokyoR #38
状態空間モデルの考え方・使い方 - TokyoR #38
horihorio
Stanコードの書き方 中級編
Stanコードの書き方 中級編
Hiroshi Shimizu
一般化線形モデル (GLM) & 一般化加法モデル(GAM)
一般化線形モデル (GLM) & 一般化加法モデル(GAM)
Deep Learning Lab(ディープラーニング・ラボ)
Recommended
2 4.devianceと尤度比検定
2 4.devianceと尤度比検定
logics-of-blue
pymcとpystanでベイズ推定してみた話
pymcとpystanでベイズ推定してみた話
Classi.corp
2 3.GLMの基礎
2 3.GLMの基礎
logics-of-blue
質的変数の相関・因子分析
質的変数の相関・因子分析
Mitsuo Shimohata
心理学におけるベイズ統計の流行を整理する
心理学におけるベイズ統計の流行を整理する
Hiroshi Shimizu
状態空間モデルの考え方・使い方 - TokyoR #38
状態空間モデルの考え方・使い方 - TokyoR #38
horihorio
Stanコードの書き方 中級編
Stanコードの書き方 中級編
Hiroshi Shimizu
一般化線形モデル (GLM) & 一般化加法モデル(GAM)
一般化線形モデル (GLM) & 一般化加法モデル(GAM)
Deep Learning Lab(ディープラーニング・ラボ)
Stan超初心者入門
Stan超初心者入門
Hiroshi Shimizu
潜在クラス分析
潜在クラス分析
Yoshitake Takebayashi
Stanの便利な事後処理関数
Stanの便利な事後処理関数
daiki hojo
100614 構造方程式モデリング基本の「き」
100614 構造方程式モデリング基本の「き」
Shinohara Masahiro
階層ベイズとWAIC
階層ベイズとWAIC
Hiroshi Shimizu
Rによるベイジアンネットワーク入門
Rによるベイジアンネットワーク入門
Okamoto Laboratory, The University of Electro-Communications
Rで因子分析 商用ソフトで実行できない因子分析のあれこれ
Rで因子分析 商用ソフトで実行できない因子分析のあれこれ
Hiroshi Shimizu
アンサンブル木モデル解釈のためのモデル簡略化法
アンサンブル木モデル解釈のためのモデル簡略化法
Satoshi Hara
漸近理論をスライド1枚で(フォローアッププログラムクラス講義07132016)
漸近理論をスライド1枚で(フォローアッププログラムクラス講義07132016)
Hideo Hirose
社会心理学者のための時系列分析入門_小森
社会心理学者のための時系列分析入門_小森
Masashi Komori
StanとRでベイズ統計モデリング読書会 導入編(1章~3章)
StanとRでベイズ統計モデリング読書会 導入編(1章~3章)
Hiroshi Shimizu
関数データ解析の概要とその方法
関数データ解析の概要とその方法
Hidetoshi Matsui
effectsパッケージを用いた一般化線形モデルの可視化
effectsパッケージを用いた一般化線形モデルの可視化
Yu Tamura
混合モデルを使って反復測定分散分析をする
混合モデルを使って反復測定分散分析をする
Masaru Tokuoka
2012-1110「マルチレベルモデルのはなし」(censored)
2012-1110「マルチレベルモデルのはなし」(censored)
Mizumoto Atsushi
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
Yoshitake Takebayashi
機械学習で泣かないためのコード設計 2018
機械学習で泣かないためのコード設計 2018
Takahiro Kubo
ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介
Naoki Hayashi
StanとRでベイズ統計モデリング読書会Ch.9
StanとRでベイズ統計モデリング読書会Ch.9
考司 小杉
不均衡データのクラス分類
不均衡データのクラス分類
Shintaro Fukushima
プログラマー
プログラマー
Kouhei Sutou
Start!! Ruby
Start!! Ruby
mitim
More Related Content
What's hot
Stan超初心者入門
Stan超初心者入門
Hiroshi Shimizu
潜在クラス分析
潜在クラス分析
Yoshitake Takebayashi
Stanの便利な事後処理関数
Stanの便利な事後処理関数
daiki hojo
100614 構造方程式モデリング基本の「き」
100614 構造方程式モデリング基本の「き」
Shinohara Masahiro
階層ベイズとWAIC
階層ベイズとWAIC
Hiroshi Shimizu
Rによるベイジアンネットワーク入門
Rによるベイジアンネットワーク入門
Okamoto Laboratory, The University of Electro-Communications
Rで因子分析 商用ソフトで実行できない因子分析のあれこれ
Rで因子分析 商用ソフトで実行できない因子分析のあれこれ
Hiroshi Shimizu
アンサンブル木モデル解釈のためのモデル簡略化法
アンサンブル木モデル解釈のためのモデル簡略化法
Satoshi Hara
漸近理論をスライド1枚で(フォローアッププログラムクラス講義07132016)
漸近理論をスライド1枚で(フォローアッププログラムクラス講義07132016)
Hideo Hirose
社会心理学者のための時系列分析入門_小森
社会心理学者のための時系列分析入門_小森
Masashi Komori
StanとRでベイズ統計モデリング読書会 導入編(1章~3章)
StanとRでベイズ統計モデリング読書会 導入編(1章~3章)
Hiroshi Shimizu
関数データ解析の概要とその方法
関数データ解析の概要とその方法
Hidetoshi Matsui
effectsパッケージを用いた一般化線形モデルの可視化
effectsパッケージを用いた一般化線形モデルの可視化
Yu Tamura
混合モデルを使って反復測定分散分析をする
混合モデルを使って反復測定分散分析をする
Masaru Tokuoka
2012-1110「マルチレベルモデルのはなし」(censored)
2012-1110「マルチレベルモデルのはなし」(censored)
Mizumoto Atsushi
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
Yoshitake Takebayashi
機械学習で泣かないためのコード設計 2018
機械学習で泣かないためのコード設計 2018
Takahiro Kubo
ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介
Naoki Hayashi
StanとRでベイズ統計モデリング読書会Ch.9
StanとRでベイズ統計モデリング読書会Ch.9
考司 小杉
不均衡データのクラス分類
不均衡データのクラス分類
Shintaro Fukushima
What's hot
(20)
Stan超初心者入門
Stan超初心者入門
潜在クラス分析
潜在クラス分析
Stanの便利な事後処理関数
Stanの便利な事後処理関数
100614 構造方程式モデリング基本の「き」
100614 構造方程式モデリング基本の「き」
階層ベイズとWAIC
階層ベイズとWAIC
Rによるベイジアンネットワーク入門
Rによるベイジアンネットワーク入門
Rで因子分析 商用ソフトで実行できない因子分析のあれこれ
Rで因子分析 商用ソフトで実行できない因子分析のあれこれ
アンサンブル木モデル解釈のためのモデル簡略化法
アンサンブル木モデル解釈のためのモデル簡略化法
漸近理論をスライド1枚で(フォローアッププログラムクラス講義07132016)
漸近理論をスライド1枚で(フォローアッププログラムクラス講義07132016)
社会心理学者のための時系列分析入門_小森
社会心理学者のための時系列分析入門_小森
StanとRでベイズ統計モデリング読書会 導入編(1章~3章)
StanとRでベイズ統計モデリング読書会 導入編(1章~3章)
関数データ解析の概要とその方法
関数データ解析の概要とその方法
effectsパッケージを用いた一般化線形モデルの可視化
effectsパッケージを用いた一般化線形モデルの可視化
混合モデルを使って反復測定分散分析をする
混合モデルを使って反復測定分散分析をする
2012-1110「マルチレベルモデルのはなし」(censored)
2012-1110「マルチレベルモデルのはなし」(censored)
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
機械学習で泣かないためのコード設計 2018
機械学習で泣かないためのコード設計 2018
ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介
StanとRでベイズ統計モデリング読書会Ch.9
StanとRでベイズ統計モデリング読書会Ch.9
不均衡データのクラス分類
不均衡データのクラス分類
Similar to Rで学ぶ離散選択モデル
プログラマー
プログラマー
Kouhei Sutou
Start!! Ruby
Start!! Ruby
mitim
.NET Core 3.0 で使える C# 8
.NET Core 3.0 で使える C# 8
m ishizaki
1.29.user,user,user
1.29.user,user,user
Tonny Xu
ベイジアンモデリングによるマーケティングサイエンス〜状態空間モデルを用いたモデリング
ベイジアンモデリングによるマーケティングサイエンス〜状態空間モデルを用いたモデリング
宏喜 佐野
mruby を C# に 組み込んでみる
mruby を C# に 組み込んでみる
Ryosuke Akiyama
FutureKreateロボットシミュレータ
FutureKreateロボットシミュレータ
Kensei Demura
Jsug2015 summer spring適用におけるバッドノウハウとベタープラクティス
Jsug2015 summer spring適用におけるバッドノウハウとベタープラクティス
Yoichi KIKUCHI
LLVM overview 20110122
LLVM overview 20110122
nothingcosmos
Scheme Interpreter in Ruby
Scheme Interpreter in Ruby
Masato HORINOUCHI
テストとリファクタリングに関する深い方法論 #wewlc_jp
テストとリファクタリングに関する深い方法論 #wewlc_jp
kyon mm
Hello, C++ + JavaScript World! - Boost.勉強会 #11 東京
Hello, C++ + JavaScript World! - Boost.勉強会 #11 東京
hecomi
programming camp 2008, Debug
programming camp 2008, Debug
Hiro Yoshioka
Rubyでアプリ開発(2013 0430)
Rubyでアプリ開発(2013 0430)
Shinichirou Nakamura
Hiroshima Ruby Conference発表資料
Hiroshima Ruby Conference発表資料
Kakigi Katuyuki
2014 08-30 life with roslyn
2014 08-30 life with roslyn
shibuki
DLR言語によるSilverlightプログラミング
DLR言語によるSilverlightプログラミング
terurou
cs-12. 式の抽象化と関数,モジュール,算法(アルゴリズム)
cs-12. 式の抽象化と関数,モジュール,算法(アルゴリズム)
kunihikokaneko1
明治大学講演資料「機械学習と自動ハイパーパラメタ最適化」 佐野正太郎
明治大学講演資料「機械学習と自動ハイパーパラメタ最適化」 佐野正太郎
Preferred Networks
Pyconjp2014_implementations
Pyconjp2014_implementations
masahitojp
Similar to Rで学ぶ離散選択モデル
(20)
プログラマー
プログラマー
Start!! Ruby
Start!! Ruby
.NET Core 3.0 で使える C# 8
.NET Core 3.0 で使える C# 8
1.29.user,user,user
1.29.user,user,user
ベイジアンモデリングによるマーケティングサイエンス〜状態空間モデルを用いたモデリング
ベイジアンモデリングによるマーケティングサイエンス〜状態空間モデルを用いたモデリング
mruby を C# に 組み込んでみる
mruby を C# に 組み込んでみる
FutureKreateロボットシミュレータ
FutureKreateロボットシミュレータ
Jsug2015 summer spring適用におけるバッドノウハウとベタープラクティス
Jsug2015 summer spring適用におけるバッドノウハウとベタープラクティス
LLVM overview 20110122
LLVM overview 20110122
Scheme Interpreter in Ruby
Scheme Interpreter in Ruby
テストとリファクタリングに関する深い方法論 #wewlc_jp
テストとリファクタリングに関する深い方法論 #wewlc_jp
Hello, C++ + JavaScript World! - Boost.勉強会 #11 東京
Hello, C++ + JavaScript World! - Boost.勉強会 #11 東京
programming camp 2008, Debug
programming camp 2008, Debug
Rubyでアプリ開発(2013 0430)
Rubyでアプリ開発(2013 0430)
Hiroshima Ruby Conference発表資料
Hiroshima Ruby Conference発表資料
2014 08-30 life with roslyn
2014 08-30 life with roslyn
DLR言語によるSilverlightプログラミング
DLR言語によるSilverlightプログラミング
cs-12. 式の抽象化と関数,モジュール,算法(アルゴリズム)
cs-12. 式の抽象化と関数,モジュール,算法(アルゴリズム)
明治大学講演資料「機械学習と自動ハイパーパラメタ最適化」 佐野正太郎
明治大学講演資料「機械学習と自動ハイパーパラメタ最適化」 佐野正太郎
Pyconjp2014_implementations
Pyconjp2014_implementations
More from 宏喜 佐野
Rを用いたLTV(Life Time Value)の推定
Rを用いたLTV(Life Time Value)の推定
宏喜 佐野
マーケティングサイエンス徹底入門と実践Part2
マーケティングサイエンス徹底入門と実践Part2
宏喜 佐野
Tokyo webmining
Tokyo webmining
宏喜 佐野
第32回Tokyo.R#初心者セッション
第32回Tokyo.R#初心者セッション
宏喜 佐野
はじめよう多変量解析~主成分分析編~
はじめよう多変量解析~主成分分析編~
宏喜 佐野
第28回Tokyo.R
第28回Tokyo.R
宏喜 佐野
More from 宏喜 佐野
(6)
Rを用いたLTV(Life Time Value)の推定
Rを用いたLTV(Life Time Value)の推定
マーケティングサイエンス徹底入門と実践Part2
マーケティングサイエンス徹底入門と実践Part2
Tokyo webmining
Tokyo webmining
第32回Tokyo.R#初心者セッション
第32回Tokyo.R#初心者セッション
はじめよう多変量解析~主成分分析編~
はじめよう多変量解析~主成分分析編~
第28回Tokyo.R
第28回Tokyo.R
Rで学ぶ離散選択モデル
1.
Rで学ぶ離散選択モデル @sanoche16 第37回 Tokyo.R
2.
About me
3.
名前:佐野宏喜、sanoche16 職業:コンサルタント 出身:商学部卒業 得意:マーケティングサイエンス 経験:Linux, PHP, Python,
Java, Ruby 夢:修行が終わったら起業したいです^^ About me
4.
Agenda
5.
1. 離散選択モデルの導入 2. 2項ロジットモデルの活用 3.
離散選択モデル本格入門 4. Rを用いた多項ロジットモデルの利用 Agenda
6.
1. 離散選択モデルの導入
7.
私たちが日々直面している何らかの選択 1. 離散選択モデルの導入
8.
私たちが日々直面している何らかの選択 1. 離散選択モデルの導入
9.
私たちが日々直面している何らかの選択 1. 離散選択モデルの導入
10.
私たちが日々直面している何らかの選択 1. 離散選択モデルの導入
11.
私たちが日々直面している何らかの選択 =>これらの選択行動をモデル化したい! 1. 離散選択モデルの導入
12.
選択行動のモデル化の例 1. 離散選択モデルの導入
13.
選択行動のモデル化の例 1. 離散選択モデルの導入
14.
選択行動のモデル化の例 1680円2079円 Amazon星 4 284ページ Amazon星 4.5 152ページ 1.
離散選択モデルの導入
15.
選択行動のモデル化の例 1680円2079円 Amazon星 4 284ページ Amazon星 4.5 152ページ 年収○○万円 閲覧回数xx回 統計スキル
Lv.?? 1. 離散選択モデルの導入
16.
選択行動のモデル化の例 1680円2079円 Amazon星 4 284ページ Amazon星 4.5 152ページ 観測要因 年収○○万円 閲覧回数xx回 統計スキル
Lv.?? 1. 離散選択モデルの導入
17.
選択行動のモデル化の例 1680円2079円 Amazon星 4 284ページ Amazon星 4.5 152ページ 年収○○万円 閲覧回数xx回 統計スキル
Lv.?? 観測要因 非観測要因 1. 離散選択モデルの導入
18.
選択行動のモデル化の例 1680円2079円 Amazon星 4 284ページ Amazon星 4.5 152ページ 年収○○万円 閲覧回数xx回 統計スキル
Lv.?? 観測要因 非観測要因 要因と選択行動の関係は、、、? 1. 離散選択モデルの導入
19.
選択行動のモデル化 製品の価格 レビュー数 ページ数 ・・・ 年収 閲覧回数 統計スキル ・・・ 1. 離散選択モデルの導入
20.
選択行動のモデル化 製品の価格 レビュー数 ページ数 ・・・ 年収 閲覧回数 統計スキル ・・・ 観測要因 非観測要因 1. 離散選択モデルの導入
21.
選択行動のモデル化 処理 製品の価格 レビュー数 ページ数 ・・・ 年収 閲覧回数 統計スキル ・・・ 観測要因 非観測要因 1. 離散選択モデルの導入
22.
選択行動のモデル化 処理 製品の価格 レビュー数 ページ数 ・・・ 選択行動 年収 閲覧回数 統計スキル ・・・ 観測要因 非観測要因 1. 離散選択モデルの導入
23.
選択行動のモデル化 処理 製品の価格 レビュー数 ページ数 ・・・ 年収 閲覧回数 統計スキル ・・・ 観測要因 非観測要因 選択行動 1. 離散選択モデルの導入
24.
選択行動のモデル化 処理 製品の価格 レビュー数 ページ数 ・・・ 年収 閲覧回数 統計スキル ・・・ という関数を考えて 選択行動のモデル化出来る! 観測要因 非観測要因 選択行動 1. 離散選択モデルの導入
25.
• 選択行動を決めた要因は観測要因xと非観測要因εに分け られる • h(x,
ε) とはx, εを与えることで選択行動y(実現値)を決 定する関数とする • ただし、非観測要因は観測できないので、代わりに確率 変数を用いて表現する • y = h(x, ε) が成り立つ場合に1、成り立たない場合には 0を返す指示関数Iを利用すると 1. 離散選択モデルの導入 離散選択モデルの導入
26.
• 選択行動を決めた要因は観測要因xと非観測要因εに分け られる • h(x,
ε) とはx, εを与えることで選択行動y(実現値)を決 定する関数とする • ただし、非観測要因は観測できないので、代わりに確率 変数を用いて表現する • y = h(x, ε) が成り立つ場合に1、成り立たない場合には 0を返す指示関数Iを利用すると 1. 離散選択モデルの導入 離散選択モデルの導入
27.
• 選択行動を決めた要因は観測要因xと非観測要因εに分け られる • h(x,
ε) とはx, εを与えることで選択行動y(実現値)を決 定する関数とする • ただし、非観測要因は観測できないので、代わりに確率 変数を用いて表現する • y = h(x, ε) が成り立つ場合に1、成り立たない場合には 0を返す指示関数Iを利用すると 1. 離散選択モデルの導入 離散選択モデルの導入 xが与えられた時 のyの確率
28.
• 選択行動を決めた要因は観測要因xと非観測要因εに分け られる • h(x,
ε) とはx, εを与えることで選択行動y(実現値)を決 定する関数とする • ただし、非観測要因は観測できないので、代わりに確率 変数を用いて表現する • y = h(x, ε) が成り立つ場合に1、成り立たない場合には 0を返す指示関数Iを利用すると 1. 離散選択モデルの導入 離散選択モデルの導入 xが与えられた時 のyの確率 εの確率で yが決まる
29.
• y=h(x, ε)を考える •
x, εにより、享受できる効用(欲求)をUとすると、 - とかける • εがロジスティック分布に に従う場合 実際に使ってみる 1. 離散選択モデルの導入
30.
• y=h(x, ε)を考える •
x, εにより、享受できる効用(欲求)をUとすると、 - とかける • εがロジスティック分布に に従う場合 実際に使ってみる 1. 離散選択モデルの導入 ロジスティック回帰となる
31.
まとめ 1. 離散選択モデルの導入 • 選択行動はいくつかの要因に基づいて決定されると考え られる •
選択行動を決める要因は観測要因と非観測要因に分けら れる • 非観測要因を確率分布として考えることで、選択行動がy となる事象を観測要因だけを用いて確率を使って表現す ることが出来る • 非観測要因がロジスティック分布に従う場合、選択行動 がyとなる確率は ! と表せる
32.
まとめ 1. 離散選択モデルの導入 • 選択行動はいくつかの要因に基づいて決定されると考え られる •
選択行動を決める要因は観測要因と非観測要因に分けら れる • 非観測要因を確率分布として考えることで、選択行動がy となる事象を観測要因だけを用いて確率を使って表現す ることが出来る • 非観測要因がロジスティック分布に従う場合、選択行動 がyとなる確率は ! と表せる
33.
2. 実践!2項ロジットモデル
34.
• 選択行動として、yを選ぶ確率は観測要因xを使って次のよ うに考えられることが分かった ! • これは選択行動がyとなる確率を表しており、ここではyを 選ぶという選択肢とyを選ばないという選択肢の2択と なっている •
そのため、このモデルは2項ロジットモデルと呼ばれる 2項ロジットモデルとは 2. 実践!2項ロジットモデル
35.
• 例として、R関連書籍の購入回数から、とある新書の購入 確率を予測することを考える • 観測要因は購入回数のみなので、 は購入回数を用い て、
= と表せる • 非観測要因も考えると購入確率は、購入回数をx, 購入する 場合は1購入しない場合は0を表すyを利用して、 ! と表せる いざ、実践! 2. 実践!2項ロジットモデル
36.
データは以下のように人工データを用いて作成する 人工データの作成 2. 実践!2項ロジットモデル
37.
データは以下のように人工データを用いて作成する 人工データの作成 2. 実践!2項ロジットモデル 購入回数 買った
or 買ってない
38.
• 例として、購入回数が10回の人の購入確率を考えてみる , , をそれぞれ0.1,
0.05とすると、P=0.65となる , をそれぞれ0.05, 0.2とすると、P=0.89となる • また、購入回数が2回の人の購入確率も考える , , をそれぞれ0.1, 0.05とすると、P=0.55となる , をそれぞれ0.05, 0.2とすると、P=0.61となる いざ、実践! 2. 実践!2項ロジットモデル 係数が分かれば確率が求まる!
39.
• , が求まれば、購入回数毎に購入確率が求められる •
例えば、 が0.05, が0.1のとき、購入回数が10回の場 合の購入確率はP=0.65であり、これは購入の生起確率を 表している • そこで、この生起確率を用いて、実際に起きた事象のすべ ての実現値の確率を掛け合わせた値が、予測した確率から この購入が生まれた確率になる • この確率(=尤度)が最も高い , を求めればよい b0, b1はどう求めればよいか 2. 実践!2項ロジットモデル
40.
b0が0.05, b1が0.1の時 1. 離散選択モデルの導入 購入回数
8 7 4 … 購入確率 0.62 0.61 0.57 … 実際の購入有無 買った 買った 買ってない … 生起確率 0.62 0.61 0.43 … 尤度 = 0.62 0.61 0.43 … 尤度 = … 実際にはb0, b1は不明なので、 尤度が最も高くなるb0, b1の組み合わせが、 b0, b1の推定値としてよいはず!
41.
• Rではglmという関数を使い、b0, b1の最尤推定値を求め ることが出来る Rでの実行 2.
実践!2項ロジットモデル
42.
• Rではglmという関数を使い、b0, b1の最尤推定値を求め ることが出来る Rでの実行 2.
実践!2項ロジットモデル
43.
• Rではglmという関数を使い、b0, b1の最尤推定値を求め ることが出来る Rでの実行 2.
実践!2項ロジットモデル 係数が求まる
44.
求めたモデルを可視化してみる 2. 実践!2項ロジットモデル
45.
求めたモデルを可視化してみる 2. 実践!2項ロジットモデル 回数が分かると確率が分かる!
46.
• 2項ロジットモデルを用いることで、2択の選択肢におけ る選択行動をモデル化することが出来る • 観測要因の係数となる
, , は最尤推定を行うことで、 求めることが出来る • モデル化を行うことで、観測要因の新たな値に対して、特 定の選択行動を取る確率を予測することが出来る まとめ 2. 実践!2項ロジットモデル
47.
3. 離散選択モデル本格入門
48.
• 2項ロジットモデルは買う、買わないなど、2つの選択肢 からの選択をモデル化している • 実際には選択肢が複数存在することもあり、選択肢間の関 係は様々である •
複数の選択肢を同時に扱い、選択肢間の関係も同時に扱い たい! 2項ロジットモデルの限界 3. 離散選択モデル本格入門
49.
• 2項ロジットモデルは買う、買わないなど、2つの選択肢 からの選択をモデル化している • 実際には選択肢が複数存在することもあり、選択肢間の関 係は様々である •
複数の選択肢を同時に扱い、選択肢間の関係も同時に扱い たい! 2項ロジットモデルの限界 3. 離散選択モデル本格入門 => より柔軟なモデルの利用
50.
• 離散選択モデルでは選択肢について、大きく3つの前提を 置いている 1. 相互排他性 離散選択モデルの選択肢から選ばれる数は常に1つでな ければならない 2.
網羅性 離散選択モデルではすべての選択肢が選択可能なものと して網羅されている必要がある 3. 選択肢の数が有限である必要がある。 離散選択モデルの選択肢について 3. 離散選択モデル本格入門
51.
• 離散選択モデルでの3つの前提のうち、前者2つは問題な いが、3の条件により適用が難しい場合がある 1. 相互排他性 2つの商品を同時に買うという場合には、2つの商品を買 うという選択肢を入れればOK 2.
網羅性 選ばれない場合には選ばないという選択肢を入れればOK 3. 選択肢の数が有限である必要がある。 ※年収など、上限がないものには適用できない 離散選択モデルの選択肢 3. 離散選択モデル本格入門
52.
• 離散選択モデルでは、意思決定者は効用を最大化させる選 択肢を選ぶと考える • 効用は非観測要因からなる効用も加味したランダム効用モ デルというモデルで効用が表現される •
n人目の意思決定者の選択肢jに対する効用は と表現す る(j = 1, …, J) • 効用は観測要因に当たる確定的部分 と非観測要因に当 たる不確定的部分 の和として表現される 選択確率について 3. 離散選択モデル本格入門
53.
• 意思決定者nによってj個の選択肢からiが選ばれるのは以 下のように表現される ! ! ! • 観測要因にあたる
はパラメータに関して線形に考えら れることが多い • 非観測要因にあたる の確率分布の仮定の仕方によっ て、多項ロジットモデルやプロビットモデルなど様々なモ デルが表現される 選択確率について 3. 離散選択モデル本格入門
54.
• 車、バス、電車の交通手段の選択行動をモデル化する • 観測要因として、コストと時間を考えるとすると、確定的 効用は以下のようにかける ! ! •
このうち、車を選択する条件は以下のようになる 選択確率の例 3. 離散選択モデル本格入門 かつ
55.
• 不確定部分の分布がガンベル分布に従うとすると、 多項ロジットの導出 3. 離散選択モデル本格入門
56.
• 不確定部分の分布がガンベル分布に従うとすると、 多項ロジットの導出 3. 離散選択モデル本格入門 多項ロジットの導出
57.
• 先ほどの車、バス、電車のうち、車を交通手段として選択 する確率は次のようになる 多項ロジットモデルの例 3. 離散選択モデル本格入門
58.
• 先ほどの車、バス、電車のうち、車を交通手段として選択 する確率は次のようになる 多項ロジットモデルの例 3. 離散選択モデル本格入門
59.
• 多項ロジットモデルを用いることで複数の選択肢を同時に 比較することが可能になる • また、観測要因の変化に合わせてシェアがどうなるのか、 価格をいくらにさげたらどれだけ売り上げがあがるかなど の予測を行うことが出来る •
一方で、多項ロジットは非観測要因の商品間の関係は考慮 されていない(IIA)。そのため、非観測要因が相互に相関関 係を持っているデータの分析にはプロビットモデルや入れ 子ロジットモデルなど、非観測要因間の相関をモデルに組 み込める手法を利用する必要がある まとめ 3. 離散選択モデル本格入門
60.
4. Rを用いた多項ロジット モデルの利用
61.
• 離散選択モデルを扱うためのパッケージとしてmlogitパッ ケージがある • mlogitはmultinominal
logit(多項ロジット)の略だが、 実際にはプロビットモデルや入れ子ロジットモデルなど、 離散選択モデルを包括的に扱うためのオブジェクト・関数 群が充実している • 今回は多項ロジットモデルのご紹介に限定 mlogitパッケージについて 4. Rを用いた多項ロジットの利用
62.
mlogitパッケージのデータ型 4. Rを用いた多項ロジットの利用 • mlogitパッケージでは離散選択モデルを十分に扱うために、 データを独自のデータフレーム型で持つ •
mlogitパッケージのデータは選択肢・観測要因・意思決定 者の3つの行をキー(index)として持つ • また、データセットはwide形、long型というの2つの形式 を扱える
63.
wide型のデータ型 4. Rを用いた多項ロジットの利用 • wide型では選択した状況毎に1行ずつ記載する •
カラム数が増えてしまう代わりにlong型と比べると意思決 定者に共通のデータを繰り返す必要がない
64.
long型のデータ型 4. Rを用いた多項ロジットの利用 • long型では選択した意思決定の選択肢毎に1行ずつ記載する •
収入などの情報を選択肢の回数繰り返さなければいけないが、 カラム数を減らすことが出来る mlogitパッケージではこちらの形式の方が良い
65.
mlogitパッケージのデータ型変換 4. Rを用いた多項ロジットの利用 • mlogit.data関数を使うことでwide型のデータもlong型で 扱うことが出来る mlogit.data(Fishing,
shape = "wide", varying = 2:9, choice = "mode")
66.
mlogitパッケージのデータ型変換 4. Rを用いた多項ロジットの利用 • mlogit.data関数を使うことでwide型のデータもlong型で 扱うことが出来る mlogit.data(Fishing,
shape = "wide", varying = 2:9, choice = "mode") データ型(形式)を指定
67.
mlogitパッケージのデータ型変換 4. Rを用いた多項ロジットの利用 • mlogit.data関数を使うことでwide型のデータもlong型で 扱うことが出来る mlogit.data(Fishing,
shape = "wide", varying = 2:9, choice = "mode") データ型(形式)を指定 変数の場所を指定
68.
mlogitパッケージのデータ型変換 4. Rを用いた多項ロジットの利用 • mlogit.data関数を使うことでwide型のデータもlong型で 扱うことが出来る mlogit.data(Fishing,
shape = "wide", varying = 2:9, choice = "mode") データ型(形式)を指定 変数の場所を指定 選択行動を指定
69.
多項ロジットモデルの実行 4. Rを用いた多項ロジットの利用 • 利用するのはmlogitパッケージにあるFishというデータ 選択肢
結果 収入 選択肢 価格 釣率 選択ID
70.
多項ロジットモデルの実行 4. Rを用いた多項ロジットの利用 • 利用するのはmlogitパッケージにあるFishというデータ 選択肢
結果 収入 選択肢 価格 釣率 選択ID
71.
多項ロジットモデルの実行 4. Rを用いた多項ロジットの利用 • 利用するのはmlogitパッケージにあるFishというデータ 選択肢
結果 収入 選択肢 価格 釣率 選択ID 観測要因
72.
多項ロジットモデルの実行 4. Rを用いた多項ロジットの利用 • mlogitモデルの実行方法 共通係数を推定
個人に固有のもの それ以外 • 意思決定者・選択肢毎に異なる変数に対して共通の係数を推定 • 意思決定者に固有のものに対する係数を選択肢毎に推定 • 意思決定者・選択肢毎に異なる変数に対して選択肢毎に係数を推定
73.
多項ロジットモデルの実行 4. Rを用いた多項ロジットの利用 • mlogitモデルの結果確認
74.
多項ロジットモデルの実行 4. Rを用いた多項ロジットの利用 • mlogitモデルの結果確認 係数が推定出来る
75.
• mlogitパッケージを用いることで多項ロジットモデルを簡 単に実行することが出来る • また、この結果を用いることで価格弾力性や消費者余剰を 測定することも出来る •
ただし、非測定要因が相互に相関がある場合にはその他の モデルを使う必要がある まとめ 4. Rを用いた多項ロジットの利用
76.
• mlogitパッケージを用いることで多項ロジットモデルを簡 単に実行することが出来る • また、この結果を用いることで価格弾力性や消費者余剰を 測定することも出来る •
ただし、非測定要因が相互に相関がある場合にはその他の モデルを使う必要がある まとめ 4. Rを用いた多項ロジットの利用 次回以降に期待!?
77.
おすすめ資料 おわりに 階層ベイズを使った推定
78.
Thank you!
Download now