Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

0517 TECH & BRIDGE MEETING

339 views

Published on

2017年5月17日(水)に行われた
"Tech And Bridge 〜講演会〜 人工知能・機械学習・ディープラーニング"の講演資料です。

講演講師 :高橋 建三様(データサイエンティスト)
主催・運営:株式会社エージェントゲート

Published in: Engineering
  • Be the first to comment

  • Be the first to like this

0517 TECH & BRIDGE MEETING

  1. 1. Tech And Bridge 〜講演会〜 テーマ:人工知能・機械学習・ディープラーニング 講演会主催・運営会社:株式会社エージェントゲート 講演者:高橋 建三様(イタンジ株式会社)
  2. 2. 1990年4月 岩手県に生まれる 2009年4月 ミュージシャンを目指し上京 2011年11月 音楽の道を諦めアメリカへ留学 2013年1月 プログラミングに目覚める 2014年12月 大学を卒業しシリコンバレーに移住 2015年3月 帰国し英語講師をしながら機械学習を独学 2016年5月 イタンジ株式会社に入社 経歴
  3. 3. 会社概要 ITANDIとは 商号 イタンジ株式会社(ITANDI, Inc.) 本社 〒106-0043 港区麻布永坂町1番地麻布パークサイドビル3F 代表取締役 伊藤 嘉盛 設立 2012年6月 資本金 48,000万円 従業員数 18名 事業概要 ■ ネット特化型不動産サービス「ノマド」 ■ 音声による自動物件確認システム「ぶっかくん」 ■ 自動賃貸接客サービス「ノマドクラウド」 ■ 人工知能による物件価格査定システム「VALUE」 主要株主 代表取締役、GCP、NCP、SMBCVP 社名に込めた思い 社名の由来は「IT and Innovation」。略して「ITANDI」 我々はテクノロジーの力によって不動産業務の分業化、細分化、 自動化を推し進め、不動産取引を滑らかにする。不動産の価値は 使用と交換によって生まれる。世界中の人々が必用なときに、必用な 単位で使用・交換できるようにすることで、不動産の使用価値と資産 価値は最大化する。 1. ミッション テクノロジーの力によって不動産取引を滑らかにする 2. ビジョン 2018年までに、不動産取引の意思決定において必ず利用される企業 になる 3. バリュー ✓ Is There a VALUE? ✓ FAST-MOVER advantage ✓ Output YOURSELF ✓ Be The FIRSTPENGUIN ✓ CRAZY Enough?
  4. 4. ポータルサイト (SUUMO / HOME’S) 仲介会社 業者間DB (レインズ/ATBB) 管理会社 ユーザー ぶっかくん 物件DB 集客 接客(AI) 内見 契約 法人向け 個人向け 不動産取引のオンライン化を支援 nomad プラットフ ォーム 自社
  5. 5. 本日の流れ 第一部 AI入門 第二部 機械学習モデルの解説 第三部 データサイエンティストへの道のり • AIで出来ること • AI、機械学習、Deep Learningの違い • 3種類の機械学習 • k-Nearest Neighbors (途中休憩あり) • データサイエンティストとは • 必要な数学の知識とプログラミングスキル • 自分がどうやって機械学習を勉強したか • データサイエンティストになるには
  6. 6. AI入門 第一部
  7. 7. AIで出来ること Watson Siri AlphaGo Atari Game
  8. 8. AIで出来ること Baxter フォルフェウス 自動運転 Amazon Prime Air
  9. 9. • レコメンドエンジン(Amazon, Netflix) • 機器の故障予測 • 価格予測(不動産、株) • チャーン予測 • 評判分析(映画や本のレビュー) • ニュースの作成 • 診断 • アドテク AIで出来ること
  10. 10. ディスカッションタイム! 二人一組でどのAIが一番興味があるか話してみ ましょう。 ユーザーとして使ってみたいもの、エンジニア として作ってみたいものどちらでも構いません 時間 - 5分
  11. 11. AI、機械学習、Deep Learning Artificial Intelligence(人口知能) 人間の知能を必要とされるタスクを 行うコンピューターシステム Machine Learning(機械学習) データや経験から学習することが出来るAI Deep Learning 人間の脳の作りを元に作られた機械学習のアルゴリズム 元々はArtificial Neural Networkと呼ばれていた
  12. 12. AI、機械学習、Deep Learning AI 機械学習 Deep Learning
  13. 13. 3種類の機械学習 Supervised Learning(教師あり学習) Unsupervised Learning(教師なし学習) Reinforcement Learning(強化学習)
  14. 14. Supervised Learning(教師あり学習) タスク インプット アウトプット 自動翻訳 English Japanese 音声認識 Audio Text 画像認識 Image Category Question Answering Question Answer Stock Market Prediction Past Future レコメンドエンジン 過去の行動 好み インプットからアウトプットを予測する機械学習
  15. 15. Unsupervised Learning(教師なし学習) クラスタリング
  16. 16. Reinforcement Learning(強化学習) Agentのactionに対するstateとrewardをデータにする ゲームAIによく使われる
  17. 17. 機械学習モデルの解説 第二部
  18. 18. k-Nearest Neighbors 一番簡単に理解出来る教師あり学習のモデル 似ているデータ(Neighbors)を参考にする
  19. 19. 住所(緯度と経度)から一人暮らしかどうかを予測する
  20. 20. 経度 緯度 一人暮らしか -1 -1 Yes -2 -1 Yes -3 -2 Yes 1 1 No 2 1 No 3 2 No 1 0 ? -2 -2 ?
  21. 21. 経度 緯度 一人暮らしか -1 -1 Yes -2 -1 Yes -3 -2 Yes 1 1 No 2 1 No 3 2 No 1 0 ? -2 -2 ? Feature(説明変数)
  22. 22. 経度 緯度 一人暮らしか -1 -1 Yes -2 -1 Yes -3 -2 Yes 1 1 No 2 1 No 3 2 No 1 0 ? -2 -2 ? Target(目的変数)
  23. 23. 経度 緯度 一人暮らしか -1 -1 Yes -2 -1 Yes -3 -2 Yes 1 1 No 2 1 No 3 2 No 1 0 ? -2 -2 ? Training Data (教師データ)
  24. 24. 経度 緯度 一人暮らしか -1 -1 Yes -2 -1 Yes -3 -2 Yes 1 1 No 2 1 No 3 2 No 1 0 ? -2 -2 ? Test Data テストデータ)
  25. 25. 全教師データとの距離を計算する
  26. 26. ユークリッド距離マンハッタン距離
  27. 27. 経度 緯度 一人暮らしか マンハッタン距離 ユークリッド距離 -3 -2 Yes |-3 - 1| + |-2 - 0| = 6 √20 -2 -1 Yes -1 -1 Yes 1 1 No 2 1 No 3 2 No 距離を計算してみよう! テストデータ:(1, 0)
  28. 28. 経度 緯度 一人暮らしか マンハッタン距離 ユークリッド距離 -3 -2 Yes 6 √20 -2 -1 Yes 4 √10 -1 -1 Yes 3 √5 1 1 No 1 √1 2 1 No 2 √2 3 2 No 4 √8 テストデータ:(1, 0) 距離を計算してみよう!
  29. 29. 経度 緯度 一人暮らしか マンハッタン距離 ユークリッド距離 -3 -2 Yes 6 √20 -2 -1 Yes 4 √10 -1 -1 Yes 3 √5 1 1 No 1 √1 2 1 No 2 √2 3 2 No 4 √8 k=1
  30. 30. 経度 緯度 一人暮らしか マンハッタン距離 ユークリッド距離 -3 -2 Yes 6 √20 -2 -1 Yes 4 √10 -1 -1 Yes 3 √5 1 1 No 1 √1 2 1 No 2 √2 3 2 No 4 √8 k=3 k > 1の場合は大多数を選ぶ
  31. 31. Scikit-learnの例 import numpy as np from sklearn.neighbors import KNeighborsClassifier ## Inputは2d array(N, number of features) x_train = np.array([[-3,-2],[-2,-1],[-1,-1],[1,1],[2,1],[3,2]]) ## Targetは1d array(N, ) y_train = np.array([1,1,1,0,0,0]) ## モデルのinitialization. neighbor = KNeighborsClassifier() neighbor.fit(x_train, y_train) ## predictは複数のデータを取るので2d arrayを渡す x_test = np.array([[1, 0], [-2, -2]]) print(neighbor.predict(x_test))
  32. 32. 距離を考慮する k=3だとルームシェアと予測してしまう
  33. 33. 緯度 経度 一人暮らしか マンハッタン距離 1/d 1 1 Yes 2 1/2 4 4 No 8 1/8 5 5 No 10 1/10 距離を考慮する 一人暮らし : 1/2 ルームシェア: 1/8 + 1/10 = 9/40 1/2 = 20/40 > 9/40
  34. 34. データサイエンティストへの道の り 第三部
  35. 35. データサイエンティストと は
  36. 36. 必要な数学の知識 •統計 •微分積分 •線形代数 •確率
  37. 37. 必要なプログラミングスキル •PythonかR •SQL •分散処理 •API開発 •クローリング Must Want
  38. 38. 自分がどうやって機械学習を勉強したか Stanfordのクラス(CS231n)、教科書、ブログ等で勉強し た LibraryはKerasを使用 数学 教科書を読んで問題を解いた 教科書、ブログ、MOOC(Courseraなど)を参考にし scikit-learnをリバースエンジニアして勉強した 機械学習 Deep Learning
  39. 39. データサイエンティストになる方 法 •現職でデータサイエンスのタスクを見つける •AI系の会社にエンジニアとして入る •機械学習を勉強してからデータサイエンティスト として入る •新卒?
  40. 40. Thank you! #techandbridge

×