機械学習の数理100問
R言語バージョン
大阪大学
鈴木 讓
R研究集会@統数研
2019年12月21日
@Joe_suzuki
鈴木 讓 (すずきじょう, Joe Suzuki)
大阪大学大学院基礎工学研究科 数理科学領域 教授
(基礎工学部情報科学科数理科学コース)
専門: データ科学、機械学習、グラフィカルモデル
開発CRAN パッケージ: BNSL
R言語は、Rstudioではなくコマンドライン
規模が大きくなると、Rcppに移植
user 2015@Aalbolg 参加
数学50% R言語50%
問題番号 分野
1-18 線形回帰
19-31 分類
32-39 リサンプリング
40-48 情報量基準
49-56 正則化
57-68 非線形
69-74 決定木
75-87 サポートベクトルマシン
88-100 教師なし学習
bayesnet.org/100.pdf
解く時間 阪大学部 阪大M1
30分以内 70% 90%
30分以上 2時間以内 25% 10%未満
2時間以上半日以内 5% 若干
丁寧すぎるヒントがついている
理系学部1年の線形代数を仮定
問題どうしつながっている
数学的な導出
ヒント盛りだくさん
R言語での実現
動作確認
数学で正確な判断をしたことが、正当化される
ロジスティック回帰の最尤法の例
講義の演習問題
R言語の学習と統計学の学習の相乗効果
時期 所属 科目
2016年後期 理学部数学科 実験数学 3
2017,2018,2019後期 基礎工数理科学 計算数理 B
基礎工 情報科学科 数理科学コース
(履修前に、R言語と数理の基礎)
G. James, D. Witten, R. Tibshrani, T.Hastie
``Introduction to Statistical Learning with R”
Rを使った統計教育の問題意識
• パッケージにデータを放り込むだけ
頭を使わない人生を奨励している
• 使い方を覚えるだけ
学問は毎日変化・成長している
学生を、明日の化石にしている
講義の目標
学生の頭の中に数理的なロジックを構築できないか
データ関連人材育成関西地区コンソーシアム(duex.jp)
神戸大、奈良先、和歌山大、滋賀大、阪大、阪府大+阪市大
通信教育(e-learning):
100問 + ビデオ教材
ビデオ@vimeo
(機械学習の数理、スパース、ベイズネット、統計学)
書籍としての出版
機械学習の数理100問: 統計的学習 with R (共立出版)
問題番号 分野 問題
0章 線形代数 なし
1章 線形回帰 1-18
2章 分類 19-31
3章 リサンプリング 32-39
4章 情報量基準 40-48
5章 正則化 49-56
6章 非線形 57-68
7章 決定木 69-74
8章 サポートベクトルマシン 75-87
9章 教師なし学習 88-100
bayesnet.org/main.pdf
B5 220ページ
2020年3月中旬発行予定
類似書籍との比較
分量が多い
数学的
コードがない
ロジックより直感
プレゼンがうまい
Rの使い方
しきいが高い プロには物足りない
新書の位置づけ
分量が少ない
Rのソース
数学的な感動
国内の既存の機械学習書籍への問題意識
• 「ななめ読み」を前提
• 「身につける」がない
新書のねらい: 手を動かす
数式を導出
Rコードを組立てる
(パッケージよりスクラッチ)
執筆における苦心: Rによる作図
Library(tikzDevice)
tikz(“fig1-7.tex”,width=4.0,height=3.2)
curve(soft.th(5,x),-5,5)
dev.off
documentclass[dvipdfmx,a4j]{jbook}
usepackage{tikz}
begin{figure}
input{fig1-7}
caption{label{fig1-7} 図を表示}
end{figure}
tikz形式(テキスト)を
fig1-7.texという
ファイル名にはきだす
出力されたtikz形式を
手で修正する
スパース推定と機械学習への応用 100問: 近日公開
数理 + R言語
2018年前期の大学院講義(90名が受講): 129問を提供
2019年11月行動計量学会セミナー(62名が受講): 86問を提供
2019年後期の学部3年, 学年4年, 博士のセミナーで93問を提供
bayesnet.org/sparse.pdf
書籍の将来展望
機械学習の数理100問シリーズ (共立出版)
1. 統計的学習 with R
2. 統計的学習 with Python
3. Lasso with R
4. Lasso with Python
5. 機械学習のためのカーネル with R
6. 機械学習のためのカーネル with Python
7. グラフィカルモデルと因果推論 with R
8. グラフィカルモデルと因果推論 with Python
対応する100問に対するビデオを公開予定
W○○○○○ful Rシリーズ
からの誘いもあったが。。。

R集会@統数研