Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
EN
Uploaded by
Shota Yasui
4,694 views
Factorization machines with r
I introduced the Factorisation Machines and how to use it with R.
Data & Analytics
◦
Read more
12
Save
Share
Embed
Embed presentation
Download
Downloaded 18 times
1
/ 12
2
/ 12
3
/ 12
4
/ 12
5
/ 12
6
/ 12
7
/ 12
8
/ 12
9
/ 12
10
/ 12
11
/ 12
12
/ 12
More Related Content
PDF
可視化周辺の進化がヤヴァイ 〜2016〜
by
Takashi Kitano
PDF
ドラえもんでわかる統計的因果推論 #TokyoR
by
Shuyo Nakatani
PPTX
20160730tokyor55
by
Med_KU
PPTX
Tokyo r50 beginner_2
by
Takashi Minoda
PPTX
forestFloorパッケージを使ったrandomForestの感度分析
by
Satoshi Kato
PDF
10分で分かるr言語入門ver2 upload用
by
Nobuaki Oshiro
PDF
木と電話と選挙(causalTree)
by
Shota Yasui
PDF
星野「調査観察データの統計科学」第1&2章
by
Shuyo Nakatani
可視化周辺の進化がヤヴァイ 〜2016〜
by
Takashi Kitano
ドラえもんでわかる統計的因果推論 #TokyoR
by
Shuyo Nakatani
20160730tokyor55
by
Med_KU
Tokyo r50 beginner_2
by
Takashi Minoda
forestFloorパッケージを使ったrandomForestの感度分析
by
Satoshi Kato
10分で分かるr言語入門ver2 upload用
by
Nobuaki Oshiro
木と電話と選挙(causalTree)
by
Shota Yasui
星野「調査観察データの統計科学」第1&2章
by
Shuyo Nakatani
Viewers also liked
PPTX
Rによる特徴抽出 第48回R勉強会@東京(#TokyoR)
by
Keiku322
PDF
高速・省メモリにlibsvm形式で ダンプする方法を研究してみた
by
Keisuke Hosaka
PPTX
心理学における「再現性」の問題とBayes Factor
by
Shushi Namba
PPTX
てかLINEやってる? (Japan.R 2016 LT) #JapanR
by
cancolle
PDF
Rでセイバーメトリクス (イチローと松井 どっちが凄い?)
by
Takuma Hatano
PPTX
20161127 doradora09 japanr2016_lt
by
Nobuaki Oshiro
PDF
GBDTを使ったfeature transformationの適用例
by
Takanori Nakai
PDF
Kaggle boschコンペ振り返り
by
Keisuke Hosaka
PPTX
Tidyverseとは
by
yutannihilation
PDF
Randomforestで高次元の変数重要度を見る #japanr LT
by
Akifumi Eguchi
PDF
Estimating the effect of advertising with Machine learning
by
Shota Yasui
PDF
星野「調査観察データの統計科学」第3章
by
Shuyo Nakatani
PDF
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
by
Yohei Sato
PDF
傾向スコア:その概念とRによる実装
by
takehikoihayashi
PDF
計量経済学と 機械学習の交差点入り口 (公開用)
by
Shota Yasui
PDF
相関と因果について考える:統計的因果推論、その(不)可能性の中心
by
takehikoihayashi
PDF
統計的因果推論勉強会 第1回
by
Hikaru GOTO
PDF
人工知能と機械学習の違いって?
by
Shuyo Nakatani
PDF
10分で分かるr言語入門ver2.9 14 0920
by
Nobuaki Oshiro
PDF
10分で分かるr言語入門ver2 6
by
Nobuaki Oshiro
Rによる特徴抽出 第48回R勉強会@東京(#TokyoR)
by
Keiku322
高速・省メモリにlibsvm形式で ダンプする方法を研究してみた
by
Keisuke Hosaka
心理学における「再現性」の問題とBayes Factor
by
Shushi Namba
てかLINEやってる? (Japan.R 2016 LT) #JapanR
by
cancolle
Rでセイバーメトリクス (イチローと松井 どっちが凄い?)
by
Takuma Hatano
20161127 doradora09 japanr2016_lt
by
Nobuaki Oshiro
GBDTを使ったfeature transformationの適用例
by
Takanori Nakai
Kaggle boschコンペ振り返り
by
Keisuke Hosaka
Tidyverseとは
by
yutannihilation
Randomforestで高次元の変数重要度を見る #japanr LT
by
Akifumi Eguchi
Estimating the effect of advertising with Machine learning
by
Shota Yasui
星野「調査観察データの統計科学」第3章
by
Shuyo Nakatani
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
by
Yohei Sato
傾向スコア:その概念とRによる実装
by
takehikoihayashi
計量経済学と 機械学習の交差点入り口 (公開用)
by
Shota Yasui
相関と因果について考える:統計的因果推論、その(不)可能性の中心
by
takehikoihayashi
統計的因果推論勉強会 第1回
by
Hikaru GOTO
人工知能と機械学習の違いって?
by
Shuyo Nakatani
10分で分かるr言語入門ver2.9 14 0920
by
Nobuaki Oshiro
10分で分かるr言語入門ver2 6
by
Nobuaki Oshiro
More from Shota Yasui
PDF
L 05 bandit with causality-公開版
by
Shota Yasui
PDF
Contextual package
by
Shota Yasui
PDF
PaperFriday: The selective labels problem
by
Shota Yasui
PDF
TokyoR 20180421
by
Shota Yasui
PDF
何故あなたの機械学習はビジネスを改善出来ないのか?
by
Shota Yasui
PPTX
Prml nn
by
Shota Yasui
PPTX
Xgboost for share
by
Shota Yasui
PPTX
重回帰分析で頑張る
by
Shota Yasui
PDF
Dynamic panel in tokyo r
by
Shota Yasui
PDF
Rで部屋探し For slide share
by
Shota Yasui
PDF
Salmon cycle
by
Shota Yasui
L 05 bandit with causality-公開版
by
Shota Yasui
Contextual package
by
Shota Yasui
PaperFriday: The selective labels problem
by
Shota Yasui
TokyoR 20180421
by
Shota Yasui
何故あなたの機械学習はビジネスを改善出来ないのか?
by
Shota Yasui
Prml nn
by
Shota Yasui
Xgboost for share
by
Shota Yasui
重回帰分析で頑張る
by
Shota Yasui
Dynamic panel in tokyo r
by
Shota Yasui
Rで部屋探し For slide share
by
Shota Yasui
Salmon cycle
by
Shota Yasui
Recently uploaded
PPTX
What's New In Qlik ~ 2025年12月&2026年1月リリース最新機能のご紹介 ~
by
QlikPresalesJapan
PPTX
KNIMEは地味だが役に立つ_2026_0207_DojoMeeting_Kansai_#1.pptx
by
syk zassou
PPTX
KNIMEで奈良の気温を調べてみた_2026_0207_KNIMEST.pptx
by
syk zassou
PDF
研究資料ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
by
4fqg857pxh
PPTX
【Qlik 医療データ活用勉強会】医療の質可視化アプリの公開-その2- 20260128
by
QlikPresalesJapan
PDF
EspressReport Enterprise Server ホワイトペーパー
by
株式会社クライム
What's New In Qlik ~ 2025年12月&2026年1月リリース最新機能のご紹介 ~
by
QlikPresalesJapan
KNIMEは地味だが役に立つ_2026_0207_DojoMeeting_Kansai_#1.pptx
by
syk zassou
KNIMEで奈良の気温を調べてみた_2026_0207_KNIMEST.pptx
by
syk zassou
研究資料ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
by
4fqg857pxh
【Qlik 医療データ活用勉強会】医療の質可視化アプリの公開-その2- 20260128
by
QlikPresalesJapan
EspressReport Enterprise Server ホワイトペーパー
by
株式会社クライム
Factorization machines with r
1.
Factorization Machines with R Shota
Yasui @housecat442
2.
Factorization Machines(FMs)とは? ● ちゃんと知りたい人は下記の論文を参照 ○
Factorization machines ○ S Rendle ○ 2010 IEEE International Conference on Data Mining, 995-1000 ○ http://www.csie.ntu.edu.tw/~b97053/paper/Rendle2010FM.pdf ● Regression, Classification, Rankingに使える機械学習モデル。 ● 感覚的には「投入した特徴全ての組合せを加味してくれるモデル」。 ● Kaggleの”Display Advertisment Challenge”で優勝したチームがGBDTとスタッキ ングさせて使った。
3.
Factorization Machinesのモデル global bias 普通の回帰式での intercept 普通の回帰部分 n個の特徴。 全パターン交互作用項 の近似部分 Wがpositive
definiteなmatrixであれば、十分な サイズのkを持つmatrix,Vによって以下の様に分 解できる。 W = V・V^t 分解してモデルに代入すると求めるパラメーター の数がn*kへと減るので計算が楽になる。
4.
Rでの扱い方 ● libFMexeパッケージが利用可能 ● c++で実装されたlibFMをRから使うためのパッケージ。 ●
基本的な使い方は以下の流れ。 a. libFMをインストール b. libFMexeパッケージをgithubからインストール c. R内でlibFMの場所を指定して、libFM関数を使う。
5.
libFMのインストール ● http://www.libfm.org/ へ行きダウンロード ○ macであれば解凍して、cd
./解凍したディレクトリ/libfm-1.43.srcでディレクトリ を移動してから make all ○ windowsは解凍したらそのまま使える。 ● libFMexeのインストール ○ devtoolsがインストールされたRで以下を実行する。 ○ devtools::install_github("andland/libFMexe") ● 準備は一旦これでおk
6.
競馬の予測をしてみる ● データ:2014/3-2016/3のデータを地方中央問わず。 ○ あるサイトからスクレイピングしました汗 ●
1, 2着を1とし、それ以降を0とした分類問題として解く。 ● オッズの人気による予測をベースラインとして、オッズ予測よりも精度の高い分類 器を作りたい。 ● FMはデータ上で起きていなかった変数の組み合わせに対してもパラメーターが近 似されている。 ● なので、今までに起きていなかった馬の組み合わせでのレースにもちゃんと予測値 を出せる。。。ハズ。
7.
データの準備 sparseMatrix形式でデータを準備。 今回はあらかじめ整形してある。 labelにしたいデータだけ取り出して、 データセットからは削る。 sampleを使ってテストデータのフラグ を立てる。 sp_matrix_libFMでsparseMatix形式の データをlibFMで読み取り可能な形式に変 換する。 data.frameからも変換できる関数がある が圧倒的に遅い。
8.
学習 pathを通すのが面倒なので、 exe_locを 使ってlibFMの場所を指定。 kの大きさの指定 学習時のiteration 学習taskの種類 regression =
“r” ● libFMの結果としてtest_setに対する予測値が帰ってくる。
9.
結果 オッズの人気上位2位が勝つと想定した時の結果 precision = 3337/(3555+3337)
= 0.48 FMで予測し、閾値をtraining_dataでのlabelの平均と した場合の結果。 precision = 8965/(8965+5911) = 0.6 AUROCだと0.6程度。。。泣 ● ベースラインとなる戦略よりはマシな戦略を立てられそう。 ● でもしょぼい。 ● ちなみにxgboostでやったらAUROCは0.7程度。。。orz ● 実際に馬券を買う事を考えるとこの評価では正直微妙。
10.
まとめ ● libFMはRからでも使える。 ● まだ起きてない組み合わせへの予測は魅力的。 ●
けどとりあえずやってみたからといって何か良い結果が出るわけでもない。 ● あと、競馬で儲けようと思ったら予測を当てるだけでなく、当たった時にリターンが 大きくなるような買い方も考えなければいけない。 ● 人生は困難でいっぱい。
11.
(参考) ● libFMexeを動かすまで ○ http://qiita.com/siero5335/items/8a8eb8de8633041d865a ●
Rで競馬予想をやってみた ○ https://drive.google.com/file/d/0BzS0JN_XV85MVzFzSWszdTlwckk/view ● libFMexe(github) ○ https://github.com/andland/libFMexe
12.
Enjoy!
Download