ごあいさつ或いはMATLAB教徒がPythonistaに改宗した話（関東CV勉強会）

ごあいさつ
或いはMATLAB教徒がPythonistaに改宗した話
牛久祥孝
losnuevetoros 中二病みたいだ

ごあいさつ
或いはMATLAB教徒がPythonistaに改宗した話
牛久祥孝
los nueve toros
the nine bulls
牛玖 (玖は九の旧漢字)
中二病みたいだ
中二病みたいだ

お前は誰だ？
～2014.3 博士(情報理工学)、東京大学
• 画像説明文の自動生成
• 大規模画像分類
2014.4～ NTT コミュニケーション科学基礎研究所

お前は誰だ？
2014.4～ NTT コミュニケーション科学基礎研究所
という自己紹介スライドで
今年度も続けるつもりでした

お前は誰だ？
2014.4～2016.3 NTT コミュニケーション科学基礎
研究所

お前は誰だ？
2014.4～2016.3 NTT コミュニケーション科学基礎研究所
2016.4～東京大学大学院情報理工学系研究科
知能機械情報学専攻講師 (原田・牛久研究室)

お前は誰だ？
昨年度のkantocvイベント
5月有名論文読み会
7月 CVPR2015読み会
10月コンピュータビジョンのお仕事
2月 ICCV2015読み会
発表者枠で皆勤賞！

お前は誰だ？
昨年度のkantocvイベント
5月有名論文読み会
7月 CVPR2015読み会
10月コンピュータビジョンのお仕事
2月 ICCV2015読み会
発表者枠で皆勤賞！
前職ほど時間取れないかもしれない…

今年度からは…
関東CV会場確保のお手伝いを務めます
New!

新任教員のお仕事
• 授業
– 来月から
– 演習も座学も
• 大学運営
– ○○委員会
– ぱわぽわーどえくせるいられ職人
• 卒論指導
– 先週配属
– 修論/博論生はまだ
あれ、研究する時間…？

研究室新メンバー顔合わせ会にて
M2
B4
ここだとプログラミングはほとんど
pythonかMATLABだから。
原田先生も牛久先生も
MATLAB派だから
牛久
まあ、そうなる
だろうな～
あ。

LTの残り：改宗した話
• 学生時代は熱心なMATLAB教徒
– C/C++ は授業とバイトのみ
– 研究では少しだけJavaを使う
– 全てのアルゴリズムを行列演算にするのが信条
– for/while ループは悪魔の所業
• NTTに入って… Pythonistaに
– MATLAB少ない
– でもきっかけは100%ある人の影響
ACM Multimedia 2011 で実演したデモ
・画像ファイルをウィンドウにD&D
→説明文が出力される
・GUIをJavaで書き、MATLABから呼ぶ
・アルゴリズムはMATLABが担当
MATLAB
書かない

MATLAB
• 単体でなんでもできる
Mathworks社が本体以外にも多彩なToolboxを提供
– 画像処理
– 機械学習
– 最適化
– ディープラーニング
– 記号数学計算などなど…
• 値段がごっつい
– 初期導入費用数十万円
– ライセンス維持費用/年数万円

Python
• もとは身軽
– 基本的に無料
– 科学計算機能はあまり無い
• 装備をどんどん追加するイメージ
– NumPyないと死ぬ
– scikit-learnないと死ぬ
– matplotlib便利
– pandas便利
– SciPyあんまり使わない

NumPy
• 行列計算用モジュール
– 元MATLAB教徒には、行列積がたいそう気持ち悪い
• 行列の要素ごとの積
MATLAB: A .* B Python: A * B
• 行列の積
MATLAB: A * B Python: matrixmultiply(A, B)
• 実行速度は裏で叩くBLASに大きく依存
– MATLABもそれは同じ (Intel MKLの恩恵)
– Intel MKL の為だけに Anaconda Accelerate 購入
(当時約一万円)
→のちに無料提供されるように…

scikit-learn
• 多くの機械学習手法を提供
knn, kemans(++), regression, pca, pls, cca, svm, lasso, nmf,
ica, lda, adaboost, random forest, Gaussian process, mds,
lle, kdtree, decision tree, などなど
• より僕にとって重要：
BaseEstimator の継承による機械学習手法実装
僕の考えたかっこいメソッドを、scikit-learnの他の
メソッドと同等に扱える
→恩恵は様々
– パイプライン化
– クロスバリデーションによるパラメータ決定

たとえば…
僕の考えたかっこいいメソッドmymethod()用のハイ
パーパラメータを決めたい
→k分割クロスバリデーションしよう
for i in range(k):
# 訓練用とバリデーション用にデータを分割
for param1 in param1_set:
for param4 in param 4_set:
mymethod.fit()
# 性能評価
# パラメータと対で記録
# 一番良いパラメータの組み合わせを探す

scikit learn だと
from sklearn import grid_search
clf = grid_search.GridSearchCV( mynethod,
parameters,
cv=k )
clf.fit()
以上。
(最良パラメータはclf.best_params_に自動で入る)

最後に
今年度からお手伝いはじめます
• 顔と名前の一致が不得手ですが頑張ります。
• よろしくお願いいたします。
今はPythonistaです
• MATLABの構文を忘れつつある
• 便利モジュール情報随時募集中
• 改宗はAnacondaのおかげ
ｱｯ神だ![米谷, 2015]

ごあいさつ或いはMATLAB教徒がPythonistaに改宗した話（関東CV勉強会）

Recommended

Recommended

More Related Content

What's hot

What's hot (18)

Similar to ごあいさつ或いはMATLAB教徒がPythonistaに改宗した話（関東CV勉強会）

Similar to ごあいさつ或いはMATLAB教徒がPythonistaに改宗した話（関東CV勉強会） (20)

More from Yoshitaka Ushiku

More from Yoshitaka Ushiku (12)

Recently uploaded

Recently uploaded (15)