Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

8,498 views

Published on

AzureML と AmazonML の機能比較と使用感の調査です

Published in: Engineering
  • Be the first to comment

最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

  1. 1. 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML GMOインターネット 次世代システム研究室 野田純一 1
  2. 2. 2 研究の目的 •自前で機械学習基盤を用意しなくても、機械学習での解析が できるクラウドAIサービスが2015年にAmazon、 Microsoftから相次いでリリースされた。 ! •それぞれのクラウドAIサービスを使って実際の機械学習の解 析を行うことで、機能比較調査を行い今後のクラウドAIのト レンドを掴みたい。
  3. 3. アジェンダ 1.クラウドAI概要 2. Azure Machine Learningについて 3. Amazon Machine Learningについて 4. Azure ML Project Oxfordについて 5. まとめ 3
  4. 4. 1.クラウドAI概要 4
  5. 5. 1.クラウドAI概要 機械学習の演算処理をクラウドに任せることができる。 クライアントはデータを送り処理結果を受け取るだけ。 機械学習のために大規模インフラを用意することが不要になる。 5
  6. 6. 1.クラウドAI概要 6
  7. 7. 1.クラウドAI概要 クラウドAI自体にWEBデプロイ機能(REST APIサーバー化) もあるが料金は比較的高額なので、料金を考慮し場合によって は自社サーバのデータベースにクラウドAIの結果を格納し、 REST APIを自前で作るほうがよい。 クラウドAIのWEBデプロイ機能について https://azure.microsoft.com/ja-jp/pricing/details/machine-learning/ https://aws.amazon.com/jp/machine-learning/pricing/ 7
  8. 8. 1.クラウドAI概要 クラウドAI 一覧 サービス名 サービス開始時期 概要 AzureML 2015年2月 データ分析だけでなく画 像、音声認識も追加 AmazonML 2015年4月 Amazonの既存サービス との連携可能 Google Prediction API 2010年 Google Cloud Platform との連携が可能 IBM Bluemix Watson 2014年6月 Watsonの一般開発者向け のバージョン、日本語向け の対応はこれから 8
  9. 9. 2. Azure Machine Learning 9
  10. 10. 2. AzureML マイクロソフトのクラウドAI Azure Machine Learning StudioというGUI操作で 機械学習を使った解析ができるのが特徴。 https://studio.azureml.net/ 10
  11. 11. 2. AzureML 料金について FREE STANDARD Authentication Microsoft account Azure subscription Max Number of Modules per Experiment 100 Unlimited Max Experiment Duration 1 hour None Max Storage Space 10 GB Unlimited - BYO Execution / Performance Single node Multiple nodes Staging Web API Yes (Throttled performance) Yes (Selectable performance) Production Web API No Yes SLA No Yes Free版、Standard版(有料)があるが、 試すにはFree版で十分、機能制限はほぼない。 https://azure.microsoft.com/en-us/pricing/details/machine-learning/ 11
  12. 12. 2. AzureML 例1: 回帰分析 為替レートを元にした日経平均株価予想 https://www.youtube.com/watch?v=c1NLhIzAgp8 2002年から2015年9月16日までの日経平均株価と為替レートの2軸グラフ 12
  13. 13. 2. AzureML 今回は米ドル/円為替レートが予めわかってる状態で、日経平 均株価が不明なシチュエーションがあったと想定して 米ドル/円為替レートを元に日経平均株価を予想するデータ分 析をAzure Machine Learningでやってみます。 ! 回帰分析は、過去データを使用するため過去の日経平均株価と 為替の情報をまずML Studioにアップロード する必要があります。 13
  14. 14. 2. AzureML 使用する過去データ(2012/1/12 - 2015/9/16)のCSVの形式 日付 USD 日経平均 2012/1/12 76.92 8385.59 2012/1/13 96.81 8500.02 2012/1/16 76.84 8378.36 未来予測したい対象の日付のデータファイル(CSV) 日付 USD 日経平均 2015/9/17 120.539 0 2015/9/18 120.539 0 14
  15. 15. 2. AzureML ML Studio にファイルをアップロード 15
  16. 16. 2. AzureML 16
  17. 17. 2. AzureML 17
  18. 18. 2. AzureML 予測結果 今回は為替ドルも予測して記入しているデータのため実際の値より 500円∼600円高い数値になってしまった。精度を高めるには為替以外の 要因も考慮し、数値列をCSVに増やしていく必要がある。 18
  19. 19. 2. AzureML 作成したモデルの精度を確認する方法 19
  20. 20. 2. AzureML 機械学習モデルが予測した過去の値と実際の値の乖離を確認 20
  21. 21. 2. AzureML 例2: 回帰分析 2015年度の千代田区の犯罪発生件数を未来予測する 平成 年度 犯罪発生件数 総人口 人口増加数 17 2005 5442 42968 1292 18 2006 5246 43933 965 19 2007 5068 43933 1021 20 2008 4475 45461 507 21 2009 4277 46060 599 22 2010 4156 47138 1078 23 2011 3813 47887 749 24 2012 3612 48538 651 25 2013 3735 52284 3746 26 2014 3593 54160 1876 http://www.city.chiyoda.lg.jp/koho/kuse/toke/kisotoke/h27-shiryo.html 21
  22. 22. 2. AzureML 犯罪発生件数と人口増加推移の関係 青軸が犯罪発生件数 緑軸が人口増加推移数 22
  23. 23. 2. AzureML グラフからから読み取れるのは ! • 犯罪発生件数は人口の数とは関係なく年々下がっている • 犯罪発生件数は年々さがっているものの、その数は人口増 加推移に左右されている • 人口増加が多い年は犯罪発生件数は下がり幅が弱くなり、 むしろ去年より大きくなったりしている ! 千代田区の人口増加推移と犯罪発生件数に関連性があると分 かったところでAzureMLの回帰分析で未来予測をしてみます 23
  24. 24. 2. AzureML Blank Experimentを選択 24
  25. 25. 2. AzureML [Saved Datasets]->[My Datasets]->過去履歴のCSVをキャンバスに配置 [Data Transformation]->[Manipulation]->[Project Column]を配置 25
  26. 26. 2. AzureML [Project Column]のLaunch column selectorを押して CSVヘッダカラムから解析に使用するカラムを選択 26
  27. 27. 2. AzureML 過去データを使って作成したモデルの精度を確認 27
  28. 28. 2. AzureML 誤差がほぼ100以下 28
  29. 29. 2. AzureML 比較グラフもほぼ垂直に 29
  30. 30. 2. AzureML 実際に未来予測を行う 実際に未来予測として2015年度の犯罪発生件数を予測しま す。千代田区のHPに平成27年-2015年の人口増加データは すでにあるため犯罪発生件数は予測可能になります。 chiyodaku_future_crime_rate.csv 平成 年度 犯罪発生件数 総人口 人口増加数 27 2015 0 56873 2713 30
  31. 31. 2. AzureML Train Model と chiyodaku_future_crime_rate.csvを接続 31
  32. 32. 2. AzureML RUNボタンをクリックし、 緑のチェックがついたらScore Model を右クリックし [Scored Dataset]->[Visualize]を選択 2015年度の千代田区の犯罪発生件数は3672人と予測されました。 32
  33. 33. 2. AzureML 平成 年度 犯罪発生件数 総人口 人口増加数 17 2005 5442 42968 1292 18 2006 5246 43933 965 19 2007 5068 43933 1021 20 2008 4475 45461 507 21 2009 4277 46060 599 22 2010 4156 47138 1078 23 2011 3813 47887 749 24 2012 3612 48538 651 25 2013 3735 52284 3746 26 2014 3593 54160 1876 27 2015 3672 56873 2713 33
  34. 34. 2. AzureML 今年度は人口増加が去年より多いので犯罪発生件数も少し多そうです。 納得の結果が解析できました。 34
  35. 35. 2. AzureML DEMO 例2: 回帰分析 人口増加率から今年度の犯罪率を予想 https://www.youtube.com/watch?v=-7YTTOlbS8I 35
  36. 36. 2. AzureML AzureMLを触ってみた感想 • データさえあればすぐに機械学習解析がブラウザでできるのが 画期的。 ! • 操作はGUIで直感的だが、それでもエキスパートに講習を受け ないと自由自在にモジュールを組み合わせるのは難しい。 ! • ML Studioでエラーが出るとログは閲覧できるがプログラムの エクセプションそのものでユーザーに解るようになっていない 不親切な設計。 ! ! 36
  37. 37. 3. Amazon Machine Learning 37
  38. 38. 3. AmazonML AmazonのクラウドAI S3 RDS Redshift といった既存のAmazonプラットフォー ムから解析データを取り込めるのが特徴。 https://aws.amazon.com/jp/machine-learning/ 38
  39. 39. 3. AmazonML 39
  40. 40. 3. AmazonML 40
  41. 41. 3. AmazonML 41 AzureMLと比較するため、千代田区の犯罪件数の予測を AmazonMLの回帰分析で行います。
  42. 42. 3. AmazonML 42 データソースにS3かRedshiftを選択
  43. 43. 3. AmazonML 43 カラムの型を選択
  44. 44. 3. AmazonML 44 予測対象のカラムを選択(今回は犯罪件数)
  45. 45. 3. AmazonML 45 モデルが作成され解析手法に「回帰分析」が自動的に選ばれる
  46. 46. 3. AmazonML 46 モデルを作成したら、「batch prediction」で予測を行う 平成 年度 犯罪発生件数 総人口 人口増加数 27 2015 0 56873 2713
  47. 47. 3. AmazonML 47 処理結果を配置するS3パスを指定
  48. 48. 3. AmazonML 48 S3にデータが格納される [usr1111]$ aws s3 ls testnoda/batch-prediction/result/ 2015-09-28 15:49:53 71 bp-W4x5H2hiRRG-chiyodaku_furure_crime_rate.csv.gz [usr1111]$ cat bp-BpVBzaTmWka-chiyodaku_furure_crime_rate_z.csv trueLabel,score 0,2.952443E3
  49. 49. 3. AmazonML Amazon MLまとめ2 • 解析手法(二項分類、多項分類、回帰分析)がファイル(CSVな ど)のデータによって自動選定される。 ! • AmazonMLの特徴=メリットが既存のAWSとの連携という点 ということは、逆にいうとAWSに熟知していないエンジニアや データ解析者はまず、AWSのお作法を覚える必要があり、本来 のデータ解析の時間をそれに費やされることになる。 ! 解析アイディアをすぐ試せないのは致命的。 49
  50. 50. 3. AmazonML 50
  51. 51. 4. Project Oxford 51
  52. 52. 4. Project Oxford 52 AzureML AmazonML 予測分析 あり あり 音声画像認識 Project Oxford なし
  53. 53. 4. Project Oxford Microsoft Azure OxfordとはAzure MLの 画像音声認識APIサービス https://dev.projectoxford.ai/ 53
  54. 54. 4. Project Oxford 54
  55. 55. 4. Project Oxford 機能名 概要 用途 Face API 顔写真から年齢と性別を判定 写真を比較し同一人物かを判定 監視カメラ、防犯、 店内の顧客解析 Speech API 音声のテキスト化、テキストの 音声化 コールセンター ロボット デジタイルサイネージ Computer Vision API 画像のサムネイル、文字の読み 取りなど。顔判定もあり。 ニュースキュレーションサ イトの画像サムネイル LUIS テキスト分析 ソーシャルメディア分析 55
  56. 56. 4. Project Oxford 各種APIにデモサイトが用意されている 56
  57. 57. 4. Project Oxford ポイント • REST APIでの呼び出し • 教師データを自前で用意するのではなくマイクロソフトが 持っている判定アルゴリズムを使う。(年齢性別判定が誤っ ていても修正はできない) • 画像解析に関してはマイクロソフトが力を入れているアダ ルト判定、児童ポルノ判定、犯罪対策系の分野が強い。 • 日本語対応はまちまち。 • 二次元のアニメ画像などには勿論対応していない。 • 顔判定は強いが逆に風景や食べ物などそれ以外は弱い。 57
  58. 58. 4. Project Oxford OCRの機能、日本語も可能 58
  59. 59. 4. Project Oxford Computer Vision API 以後はComputer Vision APIに絞って利用例を説明します 59
  60. 60. 4. Project Oxford 人間 VS AI を比較実験してみます。 次の画像に写っている女性の人数と年齢をできる だけ正確に数えてください。 (2秒) 60
  61. 61. 4. Project Oxford 61
  62. 62. 4. Project Oxford Project Oxfordを使えば精度は多少粗いが 1秒で画像に写った全ての 人物の年齢と性別の判定が行える。 残りの1秒で画像に情報を書き込み。 62
  63. 63. 4. Project Oxford 63
  64. 64. 4. Project Oxford • 精度は完璧ではなく、7∼8割の精度になります。 • たまに男性と女性を間違えたり、年齢が20歳以上ずれたり・・・。 • 粗い画像だったり、カメラのズーム機能でとった写真(荒くなる)などで は特に年齢性別が狂います。 • なので精度としてはPOSレジの精度と同レベル。 • POSレジでは性別を間違える事は通常ないはずだが、年齢の刻み幅が そこまで細かくはないので、精度としてはProjectOxfordと同レベルで しょう。 64
  65. 65. 4. Project Oxford 65
  66. 66. 4. Project Oxford 66 Computer Vision API の 性別年齢判定の活用事例として 秋葉原歩行者天国の性別と年齢の分布を調査しました
  67. 67. 4. Project Oxford 調査対象日: シルバーウィーク 日曜日 9/20 調査対象:無作為選択 122人 男性数 75 女性数 47 男性平均年齢 33 女性平均年齢 24 全体平均年齢 30 67
  68. 68. 4. Project Oxford 68 精度は荒いものの、納得のいく結果に
  69. 69. 4. Project Oxford http://imgur.tokyo/a/ デモサイト:Computer Vision APIを呼び出し画像に 年齢性別を書き込む 69
  70. 70. 4. Project Oxford Project Oxfordまとめ • 今まで人の手を介していた街頭の年齢調査の仕事やコンビニ のPOSレジの年齢ボタン押下の手間を無くす素晴らしい利用 方法があります。 ! • 画像認識システムや機械学習サーバーを構築せずとも一個人 が年齢性別識別機能を使ってデータ調査ができるようになっ た点が画期的です。 ! 70
  71. 71. 5.まとめ 71
  72. 72. 5. まとめ AzureML vs AmazonML AzureML AmazonML 機械学習手法選択 マニュアル 自動 機械学習手法の種類 豊富 少ない 画像解析 あり なし 音声解析 あり なし データ解析環境 ブラウザ ブラウザ 解析環境形式 GUI (ML Studio) 簡易ウィザード WEBデプロイ機能 あり あり 解析元データ 格納場所 ブラウザアップロード HDInsight SQL Data Warehouse S3 RDS Redshift 72
  73. 73. 5. まとめ 機械学習手法の比較 AzureML AmazonML 回帰分析 あり あり 二項分類 あり あり 多項分類 あり あり クラスタリング あり なし リコメンド あり なし(※) ※Amazonの見解では「既存のアルゴリズムでリコメンドも可能」 73
  74. 74. 5. まとめ 料金比較表 単位 AzureML AmazonML ML使用基本料金 月額 ¥1,018 なし バッチ予測 時間 ¥102 0.42USD 予測件数 なし 0.10 USD/1,000件 リアルタイム予測 時間 ¥204 なし 予測件数 ¥51/1000 0.1USD/1000 データサイズ なし 0.001USD/ モデルデータ10MBごと 74
  75. 75. 5. まとめ 75 AzureML AmazonML メリット • 機能が豊富で操作も直感的 • AWSサービスとの連携 デメリット • AWSに比べてAzureユーザ ーが少ない • 選択できる機械学習手法が少ない • データに日付型がない • 処理結果が何故かIEEE形式 • S3を経由しないと何もできない
  76. 76. 5. まとめ クラウドAI 所感 • クラウドAIを利用すれば、解析アイディアがすぐに試せるのは革新的。 • 解析対象のデータとアイディアがあればインフラもプログラムも不要。 • 最低限の機械学習の知識は必要だがブラウザ操作で誰でも未来予測が できるのは世界が変わるきっかけになりうる。 ! • 全データサイエンティスト時代に。 ! 76
  77. 77. 5. まとめ 参考文献 クラウドではじめる機械学習 Azure MLでらくらく体験 AzureML解説本の決定版、AzureMLその ものよりも機械学習アルゴリズムの説明が 豊富。 日経コンピュータ 2015年8月20日号 発売当時の最新のクラウドAI事情をまと めてる良本。クラウドAIを使う会社、自 社で機械学習を作る会社、専門の会社と 提携する会社など今後AIと向きあう3つ の選択肢についても紹介。 77
  78. 78. ご静聴ありがとうございました 78

×