Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

実戦投入する機械学習

66,305 views

Published on

機械学習を実際にビジネスで利用するに当たり、使いやすいツールを3つ厳選して紹介。

Published in: Data & Analytics

実戦投入する機械学習

  1. 1. Copyright © 2014 TIS Inc. All rights reserved. 実戦投入する機械学習 2015年3月30日 TIS株式会社 コーポレート本部 戦略技術センター 久保 隆宏
  2. 2. Copyright © 2014 TIS Inc. All rights reserved. アジェンダ 1. 2014年度の導入事例 2. 機械学習でできること 3. 機械学習のメリット 4. 機械学習を手軽に実装するためのツール 1. 機械学習関連ツールの全体図 2. scikit-learn 3. Jubatus 4. Azure Machine Learning 5. 秘密の発表 2
  3. 3. Copyright © 2014 TIS Inc. All rights reserved. 2014年度の導入事例(1/2) 3 2015/3/20 「導入後の学習効果を考えると 90%も超えられるのではとの手応 えを得た。ワトソン君が銀行の内 定をつかんだ瞬間だった。」
  4. 4. Copyright © 2014 TIS Inc. All rights reserved. 2014年度の導入事例(2/2)  住友精密工業株式会社(2014/2/12)  住友精密が提供するビニールハウス温度管理サービスにおいて、ビッグデータのリアルタイム 分析基盤「Jubatus」を導入。各センサユニットから得られたセンサデータを機械学習し、 個々のビニールハウスにおける季節毎の異常値の自動検知や最適な温度管理の自動設定の実現 を目指す(現在は検証中)。  竹中工務店(2014/10/15)  建物などで使用される様々な設備や環境センサーを相互に接続し、統合的にモニタリングと分 析を実施(Azure Machine Learningを使用)。設備管理者の知見(知識とノウハウ)を学習す ることで、建物の管理負荷軽減と利用者の快適性、生産性の向上、エネルギー効率、運用管理 コストの最適化を実現する。  みずほ銀行(2014/12/15)  IBMの質問応答システムWatsonを利用し、オペレーターのマニュアルを学習させることで業 務の効率化と品質の向上を図る。 4 日本国内でも続々と事例が出てきた。 実稼働、あるいはそれにかなり近い位置での検証が行われている。 ⇒過去のAIのような、将来のための研究開発という色ではもはやない。
  5. 5. Copyright © 2014 TIS Inc. All rights reserved. 機械学習でできること 5 A B C データに基づく「予測」や「判断」 値の予測 気温・株価・売上etc 画像/音声認識 異常検知etc 分類の判断 機械:実体は数理/統計モデル 学習:モデルのパラメータを、過去データを基に調整する 強み:定式化できない問題への対応 弱み:高い精度で行うにはデータと専門的な知識が必要
  6. 6. Copyright © 2014 TIS Inc. All rights reserved. 機械学習のメリット 6 「自動化」によるコスト削減と、「高精度な予測」による効率化 機械学習は今まで人手に頼らざるを得なかった部分、つまり「定式化・ ルール化できない」部分をデータから学習する。 これにより、さらなる自動化とそれによるコスト削減が可能。 良く学習された学習機は人間には不可能な速度・精度での予測を可能にす る。これをマーケティングやサービスに活用することで、「最小限の労力 で最大限の効果」を上げることができる。 また、機械学習による予測は今までにないサービスや業務を可能にする可 能性があり(Amazonの”注文する前の発送”など)、新しいビジネスにもつな がりうる。
  7. 7. Copyright © 2014 TIS Inc. All rights reserved. 機械が「人間よりも優秀に仕事」をする 世界は目の前まで来ている (世間が思っているより多分ずっと早い)。 7
  8. 8. Copyright © 2014 TIS Inc. All rights reserved. 8 閑話休題
  9. 9. Copyright © 2014 TIS Inc. All rights reserved. 機械学習を手軽に実装するためのツール  メリットはわかるけれども、いざ提案となると技術面が不安なケースもあるはず。  そこで、本日は実装面に一歩踏み込み手軽に機械学習が実装できるツールを紹介する。 9 3大・導入/利用が簡単な機械学習関連ツール Jubatusscikit-learn Pythonの機械学習ラ イブラリ 機械学習アルゴリズム が利用できるサーバー Azure Machine Learning Drag&Dropで処理が 構築できるサービス
  10. 10. Copyright © 2014 TIS Inc. All rights reserved. 機械学習関連ツールの全体図(1/4) 10 導入のスピード 拡張性ライブラリ型 パッケージ型 サービス型 scikit-learn(Python) MLlib (Java等) mahout (Java) Jubatus Azure Machine Learning Google Prediction API Prediction I/O
  11. 11. Copyright © 2014 TIS Inc. All rights reserved. ライブラリ・プラットフォームの全体図(2/4)  前提  導入のスピードが速いほどあらかじめ提供されている機能を使う形になるので、基本的には導 入スピードが速いほど拡張性は低くなる。  ライブラリ型:プログラムに組み込むライブラリ形式で提供されているもの △:高い自由度でプログラムに組み込むことができる ▼:利用にあたっては専門的な知識が必要  パッケージ型:よく利用するアルゴリズムをサーバー等にまとめたもの △:目的 (推薦・異常検知など)に応じまとまった形で機能が提供されており、利用しやすい ▼:パッケージが提供するAPI・機能の範囲でのみカスタマイズが可能。  サービス型:クラウド経由で提供するもの △:クラウド上でサービスが提供されており、導入の敷居が低い ▼:手軽に導入できる分、機能・データ量等に制限がある場合がある。課金体系にも注意。 11
  12. 12. Copyright © 2014 TIS Inc. All rights reserved. ライブラリ・プラットフォームの全体図(3/4)  ライブラリ型は柔軟性は高いが、扱うのに専門知識が必要なため構築・テスト・ チューニングをこなせるようになるにはそれなりのトレーニングが必要。  サービス型は手軽に始めるのには良いが、実際ビジネスで使うとなった場合カスタマ イズ性や料金について不安が残る(もちろん、利用したいアルゴリズムが利用可能であ り料金もリーズナブルに済む場合はこの限りでない)。 12 ビジネスへの応用には、パッケージ型がお勧め
  13. 13. Copyright © 2014 TIS Inc. All rights reserved. 機械学習関連ツールの全体図(4/4) 13 導入のスピード 拡張性ライブラリ型 パッケージ型 サービス型 scikit-learn(Python) MLlib (Java等) mahout (Java) Jubatus Azure Machine Learning Google Prediction API Prediction I/O 手軽に試してみた いあなたに ビジネスへの応用 を考えるあなたに カスタマイズもし たいあなたに
  14. 14. Copyright © 2014 TIS Inc. All rights reserved. 各ツールの紹介
  15. 15. Copyright © 2014 TIS Inc. All rights reserved. scikit-learn(サイキット・ラーン)  機械学習をするならPythonでscikit-learn、がほぼデファクト・スタンダード。  アプリケーションに機械学習を組み込む場合には、最初に検討すべきライブラリ。  機械学習はアルゴリズムを利用するよりもデータの整形やパラメーターの調整にかけ る時間の方が多い。  scikit-learnはそれら周辺作業をサポートするための機能も充実しており、特にパラ メータの選択・探索(SelectKBestやGridSearch)を利用していると自分がやることは ほとんどないんじゃないかという気になる。  scikit-learnの各種機能を紹介したドキュメントを作成したので詳細はこちら参考。  scikit-learn-notebook 15 機械学習ライブラリのデファクト・スタンダードと言っても過言ではない、 Python製の代表的ライブラリ。
  16. 16. Copyright © 2014 TIS Inc. All rights reserved. scikit-learn(サイキット・ラーン) 16 SelectKBest 予測する値に対し貢献度が高いもの2つ を(k=2)選択 GridSearch 指定したパラメータの範囲から、 一番良いものを探索
  17. 17. Copyright © 2014 TIS Inc. All rights reserved. Jubatus(ユバタス)  株式会社Preferred NetworksとNTTソフトウェアイノベーションセンタが共同開発し た、日本発のオープンソースプロダクト。そのため、日本語情報も豊富。  サーバーとクライアントから構成され、サーバー側に実装されたアルゴリズムをクラ イアント側から使用する。 17 機械学習アルゴリズムが利用できるサーバー。分散環境に対応しており、セ ンサーデータなど大規模なデータの学習も可能。 ・レコメンド ・異常検知 etc… 良く使われる機能がパッ ケージ化されている Server Client (C++/Python/Rub y/Java) 分散環境でスケールする ように設計されている
  18. 18. Copyright © 2014 TIS Inc. All rights reserved. Jubatus(ユバタス) 18  Recommender(推薦)、Anomaly/Burst(異常検 知)といった目的に応じた機能が提供されており、 簡単に利用できるようになっている。  Classifier(分類)、Regression(線形回帰)、 Clustering(クラスタリング)といった一般的なもの も当然搭載されている ⇒目的特化で素早く利用するパッケージ型の利用以外 にも、一般的なアルゴリズムを実行するためのライブ ラリとしても活用できる。
  19. 19. Copyright © 2014 TIS Inc. All rights reserved. Azure Machine Learning (アジュール マシンラーニング)  オンラインですぐに始められ、操作も簡単。導入事例も多く、話としては持って いきやすい。  提供されている機能を組み合わせていく形なので拡張性はそれほど高くない。  ただ、2015年2月の正式リリースでRやPythonといった、機械学習でよく使われ る言語の処理を組み込むことが可能になったのである程度は対応可能。  作成したモデルはWeb APIとして利用できるため、Webアクセス可能なところか らはどこからでも利用できるという強みがある。  Azure Machine Learningを利用したアプリケーション開発についてまとめたので、 詳細はこちら参考。  Azure Machine Learning を利用したアプリケーション開発  Freeプランの場合、計算時間とデータ容量に上限がある(容量は10GB)。有料プラ ンの場合は、計算時間?に応じ課金。 19 Microsoftが提供する、Drag&Dropにより機械学習を利用した処理を構築可 能なオンラインプラットフォーム
  20. 20. Copyright © 2014 TIS Inc. All rights reserved. Azure Machine Learning (アジュール マシンラーニング) 20 こちらからアルゴリズムやデータ処理を選んで、組み合わせていく データの前処理などの欠かせない機能も提供されており、普通にプ ログラムで組むより精確で早く済むケースもおそらくあると思われ る。 データ整備に際してはグラフを書くことが多いが、Azure MLでは可 視化機能が充実しているため、これが容易。
  21. 21. Copyright © 2014 TIS Inc. All rights reserved. まとめ • 機械学習は、実際に応用される段階に入っている • 機械学習とは • 「機械」を「学習」させて、値の予測や分類を行うこと • 「機械」は実態としては数理/統計モデルであり、このパラメーターをデータに沿うよう調整 することを「学習」という • IF文の分岐で表現しきれないような、定式化できない領域に強みを持つ • 機械学習のメリット • 自動化:定式化できない、人手に頼っていた部分をシステム化し、自動化できる可能性がある • 効率化:人間に不可能な速さ・精度での予測により最小限の労力で最大限の効果が得られる • ただし、精度を出すにはそれなりのデータ量と専門的なチューニングが必要 • 機械学習を手軽に実装するためのツール • ライブラリ型:プログラムに組み込めるタイプのもの。scikit-learnがお勧め • パッケージ型:よく利用される機能がパッケージとして提供されてるもの。Jubatusがお勧め • サービス型:クラウド上で利用可能なもの。Azure Machine Learningがお勧め 21
  22. 22. Copyright © 2014 TIS Inc. All rights reserved. とはいえ実装できるか不安だ・・・というあなたに 22
  23. 23. Copyright © 2014 TIS Inc. All rights reserved. 秘密の発表  機械学習を実際のアプリケーションに適用する方法、にフォーカス  実際使うときに詰まるあんなこと、こんなことについてのノウハウを共有  ライブラリのチュートリアルから先に進みたい方  機械学習をアプリケーションやサービスに活かしたい方  実践的なノウハウを共有する仲間がほしい方 23 機械学習ライブラリ・プラットフォームを実際に使ってアプリケー ションを開発するハンズオン形式の勉強会を実施します Come on!!

×