Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

JAWSUG20171220

686 views

Published on

2017年12月20日に開催される「JAWS-UG名古屋 re:Inventに行ったつもりのLT大会&忘年会」で使う発表資料です。
SageMaker凄いですね!

Published in: Technology
  • Be the first to comment

JAWSUG20171220

  1. 1. Amazon SageMaker iret株式会社(cloudpack) 名古屋オフィス 2017.12.20 来栖川電算 取締役 山口陽平 J A W S - U G 名 古 屋 r e : I n v e n t に 行 っ た つ も り の L T 大 会 & 忘 年 会
  2. 2. 今日話すこと 1. はじめに 2. Amazon SageMaker 3. 気になる料金 4. まとめ 5. 付録 2
  3. 3. はじめに 自己紹介 & 会社紹介 3
  4. 4. 山 口 陽 平 @melleo1978 • 所属 & 経歴 – 有限会社 来栖川電算 取締役 – 名古屋工業大学大学院 博士前期課程修了 – IPA未踏ソフトウェア創造事業 採択 – Mashup Awards 9 優秀賞受賞 • 自己紹介 企画から実装まで全部やる人 – 人工知能技術の研究開発 • 文字認識,物体認識,動作認識 • 空間復元,シミュレーション – 言語処理系の研究開発 • 分散DB,仮想機械,コンパイラ ※実物に髪の毛はありません。 4
  5. 5. 山 口 陽 平 @melleo1978 • [実践]画像認識 を執筆 WEB+DB PRESS Vol.83 – これから画像認識をはじめる人におススメ 5 – OpenCV の使い 方や実装例 – SIFTなどの各種 アルゴリズムや 特定物体認識の しくみ – 精度改善への取 り組み方
  6. 6. 来栖川電算 設立 2003年(名古屋工業大学発ベンチャー) 従業員 45人 • SF世界の技術を実現し、社会に役立てる – AI技術のライセンス販売・研究・SI • 類似検索,物体認識,動作認識,文字認識,… – スマホアプリの企画・制作・運営 メイドさん もふくめて 6 走行データ解析 周辺環境を認識し、様々な解析に活用 動作推定API 加速度センサで人の行動を推定 車両メーカー様 NTTドコモ様
  7. 7. 7 なりきり2.0 ヒーローの動きでゲームを制御 毎朝体操 腕の動きで体操採点するアプリ 動作推定API 加速度センサで人の行動を推定 タンゴチュウ 写真に写る単語を抽出するサービス 地図生成 オルソ画像から地物・交通規則を抽出 走行データ解析 周辺環境を認識し、様々な解析に活用 AR付箋 書籍の中身を検索するアプリ Cellars ワインラベルで情報検索するアプリ 画像認識API 商品パッケージで情報検索するAPI AnnotationFactory 高品質な教師データを大量に作成可能 実験スケジューラ 大量の実験と計算資源を効率的に管理 DNNコンパイラ DNNの推論を10~1000倍も効率化
  8. 8. テクノロジー企業 様々なアルゴリズムを駆使する技術者集団 • 様々な AI 技術 – 類似検索,物体認識,動作認識,文字認識 • 限界性能を引き出す優れた実装技術 – 機械学習・コンパイラ・データベース・仮想 機械などのアルゴリズムとバイナリハック • 高速化,並列化,分散化,省空間化,高精度化 • ビジネスを差別化する認識エコシステム – スケールに応じた仕組,競争力の自動強化 8
  9. 9. コミュニティ活動 おせわになってたり、スタッフしてたりする 9
  10. 10. 機械学習 名古屋 http://machine-learning.connpass.com/ 10
  11. 11. TensorFlow User Group http://tfug-tokyo.connpass.com/ 11
  12. 12. 『FP in Scala』読書会@名古屋 http://fp-in-scala-nagoya.connpass.com/ 12
  13. 13. JAWS-UG https://jaws-ug.jp/ 13
  14. 14. Amazon SageMaker サンプルコードで学ぶ 14
  15. 15. Amazon SageMaker 機械学習プラットフォーム @ AWS re:Invent 2017 15
  16. 16. ん、どこかで・・・ KCI 実験スケジューラ @ JAWS-UG 名古屋 2016.7.29 16
  17. 17. ん、どこかで・・・ KCI 実験スケジューラ @ JAWS-UG 名古屋 2016.7.29 17 また同じの作っちゃったよ 毎朝体操のデータ同期基盤もヤラレタ Amazon Cognito Sync & AWS AppSync
  18. 18. Amazon SageMaker 気を取り直して紹介 18
  19. 19. KCI 実験スケジューラ たくさんの訓練・配備を安全かつ楽に管理する環境 • 計算資源・実験データの管理を自動化 19 ノートブック インスタンス ジョブ・エンドポイント インスタンス群 Amazon SageMaker
  20. 20. 実験の説明 MNIST(手書き文字認識タスク)をTensorflowで分散学習 1. コンソール(ノートブックインスタンス)の起動 2. ジョブ(データ&モデル)の実装 3. ジョブの実行(訓練) 4. サービス(エンドポイント)の起動(配備) 5. サービスの利用 6. サービスとコンソールの終了 20
  21. 21. 1. コンソールの起動 Jupyter Notebook からジョブやサービスを制御するために 21
  22. 22. 1. ダッシュボード 「ノートブックインスタンス」をクリック 22
  23. 23. 2. コンソール一覧 「ノートブックインスタンスの作成」をクリック 23
  24. 24. 3. コンソールの起動 インスタンスの名前と種類を決めて作成 24
  25. 25. 4. コンソールへ移動 「InService」になったら「オープン」をクリック 25
  26. 26. 5. コンソール フォルダを移動し、サンプルコードをクリック 26
  27. 27. 2. ジョブの実装 訓練に必要なデータやモデルの準備 27
  28. 28. 1. まじない SageMaker Python SDK を使うための準備 28
  29. 29. 2. データの入手 訓練・検証に使うデータをサイトから入手 29
  30. 30. 3. データの配置 データを S3 へ配置し、そのパスを覚えておく 30
  31. 31. 4. ジョブの実装 model_fn でモデルを定義&データや設定値を割当 31
  32. 32. 3. ジョブの実行(訓練) Jupyter Notebookを用いた制御と確認 32
  33. 33. 1. ジョブの実行 エントリポイントとインスタンスの種類と数を指定 33
  34. 34. 2. ジョブ一覧 実行したジョブをクリック 34
  35. 35. 3. ジョブ詳細 実行したジョブの状況や設定値など 35
  36. 36. 4. モデル一覧 獲得したモデルをクリック 36
  37. 37. 5. モデル詳細 獲得したモデルやジョブの出力の URL など 37
  38. 38. 4. サービスの起動(配備) Jupyter Notebookを用いた制御と確認 38
  39. 39. 1. サービスの起動 訓練済みモデルとインスタンスの種類と数を指定 39
  40. 40. 2. サービス一覧 起動したサービスをクリック 40
  41. 41. 3. サービス詳細 起動したサービスの URL など 41
  42. 42. 5. サービスの利用(予測) Jupyter Notebookを用いた制御と確認 42
  43. 43. 1. サービスの利用 稼働中のサービスの URL へリクエスト送信 43
  44. 44. 6. サービスとコンソールの終了 Jupyter Notebookを用いた制御と確認 44
  45. 45. 1. サービスの終了 不要になったサービスの後片付け 45
  46. 46. 2. コンソールの終了 起動したコンソールの「停止」をクリック 46
  47. 47. 3. ダッシュボード 実行中のものがないかを確認 47
  48. 48. 気になる料金 便利だけど 48
  49. 49. 料金 ML Instance への入出力にも課金 • 自前 EC2 より 40% + α ほど高い 49 計算資源 Building Training Hosting 自前 EC2 ML Instance / ml.t2.medium 0.0464 $/時 0.0065 $/時 0.0464 $/時 ML Instance / ml.m4.xlarge 0.2800 $/時 0.2800 $/時 0.2800 $/時 0.2000 $/時 ML Instance / ml.p2.xlarge 1.2600 $/時 1.2600 $/時 1.2600 $/時 0.9000 $/時 ML Instance / ml.p3.2xlarge 4.2800 $/時 4.2840 $/時 3.0600 $/時 ML Storage / EBS 0.140 $/GB月 0.140 $/GB月 0.140 $/GB月 0.100 $/GB月 Data Processed IN/OUT 0.016 $/GB月 0.016 $/GB月 0.016 $/GB月 0.000 $/GB月 US East (N.Virginia) での料金比較
  50. 50. まとめ Amazon SageMakerに関する 50
  51. 51. まとめ Amazon SageMaker はかなり便利 • 機能 – お手軽な Jupyter Notebook ハンズオンにいい! – 機械学習モデルの訓練・配備に関わる面倒な 部分をかなり自動化 • 料金 – 自前 EC2 より 40% + α ほど高い 51 小規模な組織ほど使うべき 大規模なら『KCI 実験スケジューラ』がいいんじゃないかな!
  52. 52. 求人 AIに関する技術・サービス・アプリを作りたい人! 52
  53. 53. スタッフ募集中 学生さん、転職者さん、力を貸して! • 職種 – 研究 機械学習,アルゴリズム,センサ – 開発 UI/UX,フロントエンド,サーバサイ ド,アーキテクチャ,インフラ,プロセス – 企画 新しい習慣を考える力・広める力 • よく使う技術 – 言語 Python,Scala,Java,C++,JavaScript – その他 Docker,Linux,Android,iOS,Git 53
  54. 54. オフィス 勉強会 もやってるよ! メイドさん お手製の夕食も出るよ! • 名古屋の中心 – 移転:2016 年 6 月 – 面積:以前の 2 倍! • 最寄駅 – JR中央線 鶴舞駅 – 名古屋市営地下鉄 • 鶴舞線 鶴舞駅 • 名城線 矢場町駅 • 桜通線 新栄駅 54 いつでも 見学OK
  55. 55. 情景画像文字認識 技術紹介① 55
  56. 56. 情景画像文字認識とは スマホなどで撮影した画像から文字を読み取る 56
  57. 57. 情景画像文字認識とは 様々なパース、様々なレイアウト、様々な書体 57
  58. 58. 情景画像文字認識とは いわゆる “OCR” とは ”扱う画像” が違う • 悪環境下での文字認識 – 手書き・様々な書体・かすれ・点描・きつい パース・統一性のない並び・逆光・陰・影・ グラデーション・モアレなど • 使える場面 – 屋外でのスマホカメラを使った棚卸し – 車載カメラからの標識認識 – 商品パッケージからの成分情報抽出 – キーワードによるアルバム・ビデオの頭出し 58
  59. 59. 事例:タンゴチュウ Twitter で情景画像文字認識を体験できるサービス 59
  60. 60. 物体認識 技術紹介② 60
  61. 61. 物体認識とは 画像中の物体の種類・位置・姿勢を推定 61
  62. 62. 物体認識とは 様々な向き・ポーズを学習させ見えの多様性を獲得 • 特定物体認識は素人でも簡単に使える – どんな画像を学習に使うかを学べばOK 62
  63. 63. 物体認識とは モノをカウント、見た目で分からない情報を表示 • 使える場面 工場内で箱の仕分け 体験や評判の調査 ワインラベルで情報検索 AR付箋 集めて応募キャンペーン ARフィギュア 63
  64. 64. 事例:1000sors 誰でも簡単に使えるクラウド型物体認識エンジン • 広い適用範囲 – 照明姿勢の変化に強く、様々な撮影環境に対応 • 驚異的な精度 – 数十万種類をほぼ完ぺきに識別 • 圧倒的な性能 – たった1台のPCで100万種類を瞬時に識別 – 台数を増やせばリニアにスケールアウト 64
  65. 65. 事例:1000sors 手元の画像で精度や速度をすぐに確認可能 • ShotPreview for Android / iOS ①設定 ②撮影 ③確認 65
  66. 66. 事例:ShotSearch 表紙を撮影すると発売日や口コミが分かるアプリ • きついパースも、帯による隠れも、OK 66
  67. 67. 事例:ShotSearch 表紙を撮影すると発売日や口コミが分かるアプリ • よく似ていても、複数冊同時も、OK 67
  68. 68. 事例:Cellars 18万件のワインラベルを認識するアプリ • 世界で賞を獲得したアプリをダウンロード! – Asia Smartphone Apps Contest • 広告マーケティング部門 Silver Award 2位 – 立命館大学 学生ベンチャーコンテスト • 最優秀賞 NICT賞 68
  69. 69. 事例:画像認識API 画像を送るだけで写っている商品の情報を取得 • 登録商品:500 万件以上(昨年10月)の市販商品 – 書籍,DVD,CD,PCソフト,ゲームソフト, 食品パッケージ,… どんどん増加中 • 定期更新:網羅性 と 認識精度 の改善 – データ追加,パラメータ・アルゴリズム改良 69
  70. 70. 事例:画像認識API だれでも、かんたんに、マッシュアップ! • docomo Developer support より提供中 画像認識 画像に写っている物体の情報を取得 環境センサー 日本全国の気温、降水量、紫外線量を取得 音声認識 話した内容を即座に文字に変換 雑談対話 自然な会話をやり取り 知識Q&A 今知りたいことをピンポイントで回答 音声合成 入力した文字を読み上げ トレンド記事抽出 今人気の話題をジャンルやキーワードで検索 文字認識 画像の文字を読み取り 発話理解 要求を理解して、適切な機能を提示 動作推定 行っていた動作の推定 70
  71. 71. 事例:運転補助 車載カメラに映る車や人などを検出・識別・追跡 • 単眼でも高精度、大きさ・距離も推定 世界中の走行データを活用 71
  72. 72. 事例:注目領域抽出 『人の視線を集めそう』な領域をヒートマップ化 • 認識の事前処理に – 交通標識・道路標示・ 信号・看板・商品パッ ケージなど • 教師作成の省力化に – 抽出領域をクラスタリ ングすることで、教師 がなくても類似物体を 検索可能 72 交通標識 がありそう German Traffic Sign Dataset
  73. 73. 事例:地図生成 株式会社トヨタマップマスター様との研究 • 自動運転に使用可能な高品質な地図(地 物・交通規則)をオルソ画像から抽出 73
  74. 74. モーション認識 技術紹介③ 74
  75. 75. モーション認識とは センサー値から動作や行動の種類や発生時刻を推定 75
  76. 76. 事例:動作推定API ドコモ と 来栖川電算 の共同研究 • 加速度データから人の動作や行動を検出 – 静止,歩き,走り,自転車,睡眠,食事 • 動作と直接対応しない行動も検出可能 • スマホ・スマートウォッチに対応 – Android,Android Wear,… • 加速度データにアクセスできるウェアラブル機器 76
  77. 77. 事例:動作推定API だれでも、かんたんに、マッシュアップ! • docomo Developer support より提供中 画像認識 画像に写っている物体の情報を取得 環境センサー 日本全国の気温、降水量、紫外線量を取得 音声認識 話した内容を即座に文字に変換 雑談対話 自然な会話をやり取り 知識Q&A 今知りたいことをピンポイントで回答 音声合成 入力した文字を読み上げ トレンド記事抽出 今人気の話題をジャンルやキーワードで検索 文字認識 画像の文字を読み取り 発話理解 要求を理解して、適切な機能を提示 動作推定 行っていた動作の推定 77
  78. 78. 事例:ライフログ ドコモの動作推定APIの応用例 78 開発者は今すぐ確認! ⇒ https://dev.smt.docomo.ne.jp/?p=docs.api.page&api_docs_id=127
  79. 79. 事例:毎朝体操 だれでも、いつでも、どこでも、すぐできる • Android & iPhone ⇒ http://maiasa.jp/ 79
  80. 80. 事例:なりきり 2.0 ウェアラブルで現実のモノを操作する作品 • ゲームコントローラへの応用 – 格闘ゲームが遊べる程、応答が速く、精度もよい。 80
  81. 81. 研究環境 技術紹介④ 81
  82. 82. 実験スケジューラ 深層学習の実験環境 82
  83. 83. 実験スケジューラ たくさんの実験を安全かつ楽に管理する環境 • 計算資源・実験データの管理を自動化 83
  84. 84. 研究が捗る 実験サイクルが高速化 実験の再現性が向上 • 計算資源の隔離 – 実験スクリプトが他と干渉しないので、実験が失 敗したり、出力が混じったりしない。 • 計算資源の抽象化 – 計算資源(自社・お客様・クラウドなど)の変化 に頑健な実験スクリプトを作りやすい。 • 便利な機能 – 実験が自動的に永続化され、すぐに再現できる。 – テンプレートから簡単に実験をはじめられる。 84
  85. 85. どんどん拡大 実験スケジューラのハイブリッドクラウド化 • 効率的な計算資源の割当 – 個人で計算資源を専有せず、全員で共有 • 様々な計算資源への対応 – クラウドの計算資源:普段使い – 自社で購入した計算資源:上記の節約 – お客様が弊社に設置する計算資源 – お客様の敷地にある計算資源 • 大量に使わせてもらえる。ありがたや。 85
  86. 86. DNNコンパイラ かなり前からモバイルでの活用実績がある 86
  87. 87. DNNコンパイラ DNN を効率的な実行形式へ変換するツール • DNN の推論計算を近似し て、高速化・省メモリ化 – 量子化,パラメータ削減, 計算順序変更,計算共有, 基底分解,確率的近似,カ スケード,… • 限界性能を引き出す実装 – アーキテクチャに最適化さ れたコード(専用命令, キャッシュ戦略),… 87
  88. 88. 配布が捗る スマホやサーバへの組み込みがスムーズに • DNN の推論計算の効率化 – スマホなどに収まるように演算量やメモリ使用量 を抑えることができる。 – 計算共有・順序変更・部分計算など応用に合わせ た実装に変更できる。 • DNN のアーキテクチャの隠蔽 – ハックやノウハウを解析しづらくできる。 • コンパクトな実装・依存関係 – 容量が小さいのでアプリにも組み込める。 – 依存物が少なく実行環境で問題が起こりにくい。 88
  89. 89. AnnotationFactory 近いうちに公開予定 来栖川電算のノウハウが詰まったクラウドサービス 89

×