Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
ごあいさつ
或いはMATLAB教徒がPythonistaに改宗した話
牛久 祥孝
losnuevetoros 中二病みたいだ
ごあいさつ
或いはMATLAB教徒がPythonistaに改宗した話
牛久 祥孝
los nueve toros
the nine bulls
牛玖 (玖は九の旧漢字)
中二病みたいだ
中二病みたいだ
お前は誰だ?
~2014.3 博士(情報理工学)、東京大学
• 画像説明文の自動生成
• 大規模画像分類
2014.4~ NTT コミュニケーション科学基礎研究所
お前は誰だ?
~2014.3 博士(情報理工学)、東京大学
• 画像説明文の自動生成
• 大規模画像分類
2014.4~ NTT コミュニケーション科学基礎研究所
という自己紹介スライドで
今年度も続けるつもりでした
お前は誰だ?
~2014.3 博士(情報理工学)、東京大学
• 画像説明文の自動生成
• 大規模画像分類
2014.4~ NTT コミュニケーション科学基礎研究所
お前は誰だ?
~2014.3 博士(情報理工学)、東京大学
• 画像説明文の自動生成
• 大規模画像分類
2014.4~2016.3 NTT コミュニケーション科学基礎
研究所
お前は誰だ?
~2014.3 博士(情報理工学)、東京大学
• 画像説明文の自動生成
• 大規模画像分類
2014.4~2016.3 NTT コミュニケーション科学基礎研究所
2016.4~ 東京大学 大学院情報理工学系研究科
知能機械情報学専...
お前は誰だ?
昨年度のkantocvイベント
5月 有名論文読み会
7月 CVPR2015読み会
10月 コンピュータビジョンのお仕事
2月 ICCV2015読み会
発表者枠で皆勤賞!
お前は誰だ?
昨年度のkantocvイベント
5月 有名論文読み会
7月 CVPR2015読み会
10月 コンピュータビジョンのお仕事
2月 ICCV2015読み会
発表者枠で皆勤賞!
前職ほど時間取れないかもしれない…
今年度からは…
関東CV会場確保のお手伝いを務めます
New!
新任教員のお仕事
• 授業
– 来月から
– 演習も座学も
• 大学運営
– ○○委員会
– ぱわぽわーどえくせるいられ職人
• 卒論指導
– 先週配属
– 修論/博論生はまだ
あれ、研究する時間…?
研究室新メンバー顔合わせ会にて
M2
B4
ここだとプログラミングはほとんど
pythonかMATLABだから。
原田先生も牛久先生も
MATLAB派だから
牛久
まあ、そうなる
だろうな~
あ。
LTの残り:改宗した話
• 学生時代は熱心なMATLAB教徒
– C/C++ は授業とバイトのみ
– 研究では少しだけJavaを使う
– 全てのアルゴリズムを行列演算にするのが信条
– for/while ループは悪魔の所業
• NTTに入って...
MATLAB
• 単体でなんでもできる
Mathworks社が本体以外にも多彩なToolboxを提供
– 画像処理
– 機械学習
– 最適化
– ディープラーニング
– 記号数学計算 などなど…
• 値段がごっつい
– 初期導入費用 数十万円
...
Python
• もとは身軽
– 基本的に無料
– 科学計算機能はあまり無い
• 装備をどんどん追加するイメージ
– NumPyないと死ぬ
– scikit-learnないと死ぬ
– matplotlib便利
– pandas便利
– SciP...
NumPy
• 行列計算用モジュール
– 元MATLAB教徒には、行列積がたいそう気持ち悪い
• 行列の要素ごとの積
MATLAB: A .* B Python: A * B
• 行列の積
MATLAB: A * B Python: matri...
scikit-learn
• 多くの機械学習手法を提供
knn, kemans(++), regression, pca, pls, cca, svm, lasso, nmf,
ica, lda, adaboost, random forest...
たとえば…
僕の考えたかっこいいメソッドmymethod()用のハイ
パーパラメータを決めたい
→k分割クロスバリデーションしよう
for i in range(k):
# 訓練用とバリデーション用にデータを分割
for param1 in p...
scikit learn だと
from sklearn import grid_search
clf = grid_search.GridSearchCV( mynethod,
parameters,
cv=k )
clf.fit()
以上。...
最後に
今年度からお手伝いはじめます
• 顔と名前の一致が不得手ですが頑張ります。
• よろしくお願いいたします。
今はPythonistaです
• MATLABの構文を忘れつつある
• 便利モジュール情報随時募集中
• 改宗はAnaconda...
Upcoming SlideShare
Loading in …5
×

ごあいさつ 或いはMATLAB教徒がPythonistaに改宗した話 (関東CV勉強会)

3,006 views

Published on

学術的価値のほとんどない、2016年4月時点の自己紹介のようなもの。関東CVのツールLTに乗っかって話しました。

Published in: Technology
  • Be the first to comment

ごあいさつ 或いはMATLAB教徒がPythonistaに改宗した話 (関東CV勉強会)

  1. 1. ごあいさつ 或いはMATLAB教徒がPythonistaに改宗した話 牛久 祥孝 losnuevetoros 中二病みたいだ
  2. 2. ごあいさつ 或いはMATLAB教徒がPythonistaに改宗した話 牛久 祥孝 los nueve toros the nine bulls 牛玖 (玖は九の旧漢字) 中二病みたいだ 中二病みたいだ
  3. 3. お前は誰だ? ~2014.3 博士(情報理工学)、東京大学 • 画像説明文の自動生成 • 大規模画像分類 2014.4~ NTT コミュニケーション科学基礎研究所
  4. 4. お前は誰だ? ~2014.3 博士(情報理工学)、東京大学 • 画像説明文の自動生成 • 大規模画像分類 2014.4~ NTT コミュニケーション科学基礎研究所 という自己紹介スライドで 今年度も続けるつもりでした
  5. 5. お前は誰だ? ~2014.3 博士(情報理工学)、東京大学 • 画像説明文の自動生成 • 大規模画像分類 2014.4~ NTT コミュニケーション科学基礎研究所
  6. 6. お前は誰だ? ~2014.3 博士(情報理工学)、東京大学 • 画像説明文の自動生成 • 大規模画像分類 2014.4~2016.3 NTT コミュニケーション科学基礎 研究所
  7. 7. お前は誰だ? ~2014.3 博士(情報理工学)、東京大学 • 画像説明文の自動生成 • 大規模画像分類 2014.4~2016.3 NTT コミュニケーション科学基礎研究所 2016.4~ 東京大学 大学院情報理工学系研究科 知能機械情報学専攻 講師 (原田・牛久研究室)
  8. 8. お前は誰だ? 昨年度のkantocvイベント 5月 有名論文読み会 7月 CVPR2015読み会 10月 コンピュータビジョンのお仕事 2月 ICCV2015読み会 発表者枠で皆勤賞!
  9. 9. お前は誰だ? 昨年度のkantocvイベント 5月 有名論文読み会 7月 CVPR2015読み会 10月 コンピュータビジョンのお仕事 2月 ICCV2015読み会 発表者枠で皆勤賞! 前職ほど時間取れないかもしれない…
  10. 10. 今年度からは… 関東CV会場確保のお手伝いを務めます New!
  11. 11. 新任教員のお仕事 • 授業 – 来月から – 演習も座学も • 大学運営 – ○○委員会 – ぱわぽわーどえくせるいられ職人 • 卒論指導 – 先週配属 – 修論/博論生はまだ あれ、研究する時間…?
  12. 12. 研究室新メンバー顔合わせ会にて M2 B4 ここだとプログラミングはほとんど pythonかMATLABだから。 原田先生も牛久先生も MATLAB派だから 牛久 まあ、そうなる だろうな~ あ。
  13. 13. LTの残り:改宗した話 • 学生時代は熱心なMATLAB教徒 – C/C++ は授業とバイトのみ – 研究では少しだけJavaを使う – 全てのアルゴリズムを行列演算にするのが信条 – for/while ループは悪魔の所業 • NTTに入って… Pythonistaに – MATLAB少ない – でもきっかけは100%ある人の影響 ACM Multimedia 2011 で実演したデモ ・画像ファイルをウィンドウにD&D →説明文が出力される ・GUIをJavaで書き、MATLABから呼ぶ ・アルゴリズムはMATLABが担当 MATLAB 書かない
  14. 14. MATLAB • 単体でなんでもできる Mathworks社が本体以外にも多彩なToolboxを提供 – 画像処理 – 機械学習 – 最適化 – ディープラーニング – 記号数学計算 などなど… • 値段がごっつい – 初期導入費用 数十万円 – ライセンス維持費用/年 数万円
  15. 15. Python • もとは身軽 – 基本的に無料 – 科学計算機能はあまり無い • 装備をどんどん追加するイメージ – NumPyないと死ぬ – scikit-learnないと死ぬ – matplotlib便利 – pandas便利 – SciPyあんまり使わない
  16. 16. NumPy • 行列計算用モジュール – 元MATLAB教徒には、行列積がたいそう気持ち悪い • 行列の要素ごとの積 MATLAB: A .* B Python: A * B • 行列の積 MATLAB: A * B Python: matrixmultiply(A, B) • 実行速度は裏で叩くBLASに大きく依存 – MATLABもそれは同じ (Intel MKLの恩恵) – Intel MKL の為だけに Anaconda Accelerate 購入 (当時約一万円) →のちに無料提供されるように…
  17. 17. scikit-learn • 多くの機械学習手法を提供 knn, kemans(++), regression, pca, pls, cca, svm, lasso, nmf, ica, lda, adaboost, random forest, Gaussian process, mds, lle, kdtree, decision tree, などなど • より僕にとって重要: BaseEstimator の継承による機械学習手法実装 僕の考えたかっこいメソッドを、scikit-learnの他の メソッドと同等に扱える →恩恵は様々 – パイプライン化 – クロスバリデーションによるパラメータ決定
  18. 18. たとえば… 僕の考えたかっこいいメソッドmymethod()用のハイ パーパラメータを決めたい →k分割クロスバリデーションしよう for i in range(k): # 訓練用とバリデーション用にデータを分割 for param1 in param1_set: for param2 in param2_set: for param3 in param3_set: for param4 in param 4_set: mymethod.fit() # 性能評価 # パラメータと対で記録 # 一番良いパラメータの組み合わせを探す
  19. 19. scikit learn だと from sklearn import grid_search clf = grid_search.GridSearchCV( mynethod, parameters, cv=k ) clf.fit() 以上。 (最良パラメータはclf.best_params_に自動で入る)
  20. 20. 最後に 今年度からお手伝いはじめます • 顔と名前の一致が不得手ですが頑張ります。 • よろしくお願いいたします。 今はPythonistaです • MATLABの構文を忘れつつある • 便利モジュール情報随時募集中 • 改宗はAnacondaのおかげ アッ 神だ![米谷, 2015]

×