Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

実世界の人工知能@DeNA TechCon 2017

19,588 views

Published on

実世界の人工知能の適用例を紹介しています
・自動車
・ロボット
・異常検知
・ライフサイエンス
・コミュニケーション
・クリエーター
・Chainer

Published in: Engineering
  • Visit this site: tinyurl.com/sexinarea and find sex in your area for one night)) You can find me on this site too)
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here
  • Sex in your area for one night is there tinyurl.com/hotsexinarea Copy and paste link in your browser to visit a site)
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here
  • Girls for sex are waiting for you https://bit.ly/2TQ8UAY
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here
  • Meetings for sex in your area are there: https://bit.ly/2TQ8UAY
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here
  • Hi there! Essay Help For Students | Discount 10% for your first order! - Check our website! https://vk.cc/80SakO
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here

実世界の人工知能@DeNA TechCon 2017

  1. 1. 実世界の⼈人⼯工知能 Preferred  Networks 岡野原 ⼤大輔 hillbig@preferred.jp 2017/2/10  @DeNA TechCon
  2. 2. アジェンダ l 会社紹介 l 深層学習と⼈人⼯工知能 l 実世界の事例例(今⽇日紹介する事例例は殆どが弊社の事例例です) ̶— ⾃自動⾞車車 ̶— ロボット ̶— バイオ・ヘルスケア ̶— クリエーター ̶— コミュニケーション l Chainer ̶— ChainerMN:  分散学習
  3. 3. 会社紹介:Preferred Networks (PFN) l IoT時代に合わせた分散知能を備えた新しいコンピュータを創造する l 2014年年3⽉月創業 l 東京オフィス,  シリコンバレーオフィス l 従業員:約60⼈人 殆どが研究者、エンジニア l 主な出資者 FANUC,  Toyota,  NTT 3
  4. 4. AutomotiveHumanoid  Robot Preferred Networks’ positioning in AI: Industrial IoT 4 Consumer Industrial Cloud Device PhotoGame Text Speech Infrastructure Factory Robot Automotive Healthcare Smart  City Industry4.0 Industrial IoT
  5. 5. ディープラーニング(深層学習)とは l 層が深く、幅も広いニューラルネットワーク を利利⽤用した機械学習⼿手法 l 2012年年の⼤大ブレーク以来、研究コミュニティ のみならず産業界に多く使われてきた – 2014〜~2015年年中に出された関連論論⽂文数は1500を超える* l 画像認識識、⾳音声認識識などで劇的な精度度向上を果たし、そ の多くが既に実⽤用化されている 5 2014年の一般画像認識コンテストで優勝した 22層からなるのGoogLeNetの例 [Google 2014] *http://memkite.com/deep-‐‑‒learning-‐‑‒bibliography/
  6. 6. 急激に複雑化するニューラルネットワーク 2012年年〜~2014年年 6 AlexNet, Kryzyevsky+, 2012 ImageNet winner(8層) GoogLeNet, Szegedy+, 2014
  7. 7. 形は可変、多様な計算⼿手法、つながり⽅方 2015年年〜~現在 x_1 h y_1 x_2 h y_2 x_3 h y_3 x_4 h y_4 BPTT length = 3 Input word OutputRecurrent state Stochastic Residual Net, Huang+, 2016 Recurrent NN FractalNet, Larsson+, 2016 RoR, Zhang+, 2016 7 Dense CNN, Huang+, 2016
  8. 8. ⾃自動⾞車車
  9. 9. ロボット
  10. 10. 認識識の問題は解けつつある l Occlusionがある場合や、対象が ⼩小さくても検出できるように l APCでも画像認識識が重要だった
  11. 11. 異異常検知
  12. 12. 12 異異常検知の難しさ:単⼀一⼿手法で様々な種類の正常状態と 異異なるタイプの異異常パターンに対応するのが困難 l 基本:特定の異異常を⾒見見つけるために⼿手法の選択や設定が必要 ̶— 注⽬目する特徴量量 u センサー値の⼤大⼩小、周波数成分の⼤大⼩小、分布 l ⼈人でもセンサの意味を理理解したり異異常を定義 するのは難しい l 疑問:もっと汎⽤用的に使える異異常検知⼿手法はないか? ̶— 例例:下記異異常を全て検出し、右の正常ケースでは無反応 正常ケース(2) 異異常を含むケース(3) numenta/NABの人工ベンチマーク時系列データセット スパイク 異異常振動 ⽴立立ち上がり 失敗
  13. 13. 提案異異常検知⼿手法の特徴 l 正常なデータのみから異異常検知モデルを作れる ̶— 故障データは必要ない,教師なし学習 ̶— 異異常を検知後、実際の故障が発⽣生するタイミングを予測するに は故障データが必要 l ⽣生の⾼高次元データをそのまま利利⽤用可能 ̶— ⼈人間による特徴設計は必要ない. 特に周波数解析後のスペクトルや画像などが利利⽤用可能 l 正規化された異異常度度スコア(尤度度)を出⼒力力する ̶— システムが正常だった場合に、そのセンサデータがどのぐらい の確率率率で観測されるかを出⼒力力する l 複数センサを組み合わせた異異常検知が可能 13
  14. 14. 実例例:FANUC減速器のセンサー異異常検知 14 異異常な部分を抽出する ディープラーニング技術 異異常は発⾒見見されない 異異常を検出 正常時の波形 異異常時の波形 実際の減速機から得られた センサデータ
  15. 15. 15 既存⼿手法で検出が遅かった異異常を事前に検出 提案⼿手法 経過時間 異異常スコア 故障の約40⽇日前に 故障予兆を捉える 判定閾値 既存⼿手法 経過時間 ロボット 故障 ロボット 故障 15⽇日前 故障直前まで スコアがほぼ 反応しない
  16. 16. バイオ・ヘルスケア
  17. 17. 乳がん検査の精度度 90% 99% 80%マンモグラフィー リキッドバイオプシー (血液中のmicroRNA) [Shimomura+ Cancer Science 2016] リキッドバイオプシー + Deep Learning
  18. 18. ディープラーニングmiRNA診断のさらなる可能性 l さらなるデータにより、13種のがんを⼀一挙に正確に予測 l 良良性、悪性のがんを⾒見見分ける l がんのステージ予測 l miRNAはガンのみならず、様々な疾患を診断することが可能 アルツハイマー、⼼心筋梗塞塞、脳卒中などの診断・予測 l ⾎血中miRNA分析により、治療療⽅方針の決定や最適治療療薬の選定など個別 化医療療の強⼒力力な⼿手法になりうる l がん向けの創薬につながる ̶— どのmiRNAやその組み合わせの変化が、がんに影響を与えるか
  19. 19. 「⼈人⼯工知能(AI)を活⽤用した統合的がん医療療システム開発 プロジェクト開始」2016/11/29 with 国⽴立立がん研究センター, 産総研AIセンター 臨臨床情報、マルチオミックスデータ、医⽤用画像,、疫学デー タを利利⽤用しPrecision Medicineの実現を⽬目指す 19
  20. 20. ゲノム解析によるガンの診断、治療療にフォーカス l なぜゲノム解析なのか ̶— 客観的な情報で、データに基づく医療療を実現できる ̶— 情報量量が多く、これまで⾒見見えなかった情報に基づいた診断がで きる u 特に、RNA解析,miRNA解析 l なぜガンなのか ̶— もっともゲノム解析がインパクトを与える領領域、ゲノム変異異が ガンの本質であり、それを解析することで診断、治療療を⼤大きく 改善できる ̶— 最も、個⼈人化医療療が進む、個⼈人事にガン特異異的変異異は異異なる また、ガン免疫の場合、個⼈人毎にMHCも変わってくる 20
  21. 21. ディープラーニングによるガン診断の⾼高度度化 l ゲノム情報に基づくガン診断,及び分⼦子標的薬の効果予測 の⾼高度度化 ̶— ガンマーカー検出とフェーズの判定 ̶— 治療療効果の予測と治療療⽅方法の提案 ̶— 従来の統計分析、機械学習では実現不不可能だった少数サンプルから の推定 c.f.  パラメータ数に対してサンプル数が少ない問題(新NP問題) l ディープラーニングの利利⽤用によって⾒見見込まれる効果 ̶— ディープラーニングは、半教師あり学習が可能である。 →教師無しデータを使ってゲノム情報の表現を獲得する ̶— ディープラーニングは、⾼高次元データを扱える。 →⾮非常に⾼高次元なゲノム情報であっても、機械学習のための特徴設 計が可能である。 21
  22. 22. PFNがん研究所 (PCRI) l 東京⼤大学産業連携プラザ内に設⽴立立 l PCRIでは、次世代シークエンサー を利利⽤用したウェットラボを⽴立立ち上げ、最新 最先端のAIとバイオテクノロジーの 研究・産業化を進めている 特に次の分野に注⼒力力します 1)新規がん診断法の確⽴立立 2)ゲノム分析によるがん治療療 ⽅方針の決定、最適治療療薬の 選択や術後の予測、 3)それぞれの患者に適応した 個別化創薬 22 2016年年10⽉月3⽇日設⽴立立
  23. 23. コミュニケーション (詳しくはこの後の海野のセッションで)
  24. 24. 社内での対話システムの実験の様⼦子 からの抜粋(bot-‐‑‒elikaが対話システム) 直前の⾔言葉葉に反応できている ⽂文の意味や⽂文脈は理理解できていない
  25. 25. 偶然それらしい会話に なることもある。
  26. 26. クリエーター
  27. 27. 画像の⾃自動⽣生成 l Chainer-­goph https://github.com/mattya/chainer-­gogh l 深層学習は 画像も⽣生成できる l 左の画像からスタイル だけを抽出し、ネコの 画像を⽣生成 27
  28. 28. chainer-DCGAN 学習30分後 画像を0から⽣生成するNN https://github.com/mattya/chainer-DCGAN 28
  29. 29. 学習2時間後 29
  30. 30. 学習1⽇日後 30
  31. 31. ⽣生成の最前線 l 先程の結果 から1年年後 様々な改良良
  32. 32. 別⼿手法
  33. 33. ⾃自然画像はまだ難しい 現在のVAEやGANは 1発で生成しているが 複数物体、前景/背景 が含まれる場合は困難か
  34. 34. PaintsChainer (#PaintsChainer) l 線画に着⾊色する学習をしたNN l U-­Net+絵の拡⼤大の学習 l 1⽇日あたり最初は20〜~30万枚、現在でも2〜~3万枚の線画 が着⾊色されている http://free-illustrations.gatag.net/2014/01/10/220000.html
  35. 35. PaintsChainerの例例(⾵風景画像) l @munashihciさんのtweetより引⽤用
  36. 36. Chainer
  37. 37. Chainer as an open-source project l https://github.com/pfnet/chainer l 101  contributors l 2,128  stars  &  564  fork l 7,335  commits l Active  development  &  release   ̶— v1.0.0  (June  2015)  to    v1.20.1  (January  2017) 38 Original developer Seiya Tokui
  38. 38. ChainerMN マルチノード分散学習 Imagenetの学習が20⽇日超から4.4時間に
  39. 39. 分散・⾼高速化しても精度度は変わらない
  40. 40. 41 今後の機械学習/深層学習が必要とする計算リソース 1E〜100E Flops ⾃自動運転⾞車車1台あたり1⽇日 1TB 10台〜~1000台,  100⽇日分の⾛走⾏行行データの学習 バイオ・ヘルスケア ⾳音声認識識 ロボット/ドローン 10P〜~ Flops 1万⼈人の5000時間分の⾳音声データ ⼈人⼯工的に⽣生成された10万時間の ⾳音声データを基に学習 [Baidu 2015] 100P  〜 1E Flops ⼀一⼈人あたりゲノム解析で約10M個のSNPs 100万⼈人で100PFlops、1億⼈人で1EFlops 10P(画像)  〜~ 10E(映像) Flops 学習データ:1億枚の画像 10000クラス分類 数千ノードで6ヶ⽉月 [Google  2015] 画像/ 映像認識識 1E〜~100E Flops 1台あたり年間1TB 100万台〜1億台から得られた データで学習する場合 ⾃自動運転 10PF 100EF100PF 1EF 10EF P:Peta   E:Exa F:Flops 機械学習、深層学習は学習データが大きいほど高精度になる 現在は人が生み出したデータが対象だが、今後は機械が生み出すデータが対象となる 各種推定値は1GBの学習データに対して1日で学習するためには 1TFlops必要だとして計算 学習を1⽇日で終わらせるのに必要な計算リソース
  41. 41. まとめ
  42. 42. まとめ l 深層学習・強化学習の進化は著しい ̶— 新しい理理論論、新しいアルゴリズム、新しいソフトウェア ̶— 世界中で同時多発的に進化が起きている l 深層学習は様々な分野で利利⽤用されていく ̶— 想像しなかったアプリケーションも増えている ̶— 様々な分野で速く試⾏行行錯誤するのが⼤大切切 l 研究と実⽤用化とビジネス化が同時に起こっている ̶— 実⽤用レベルになってからビジネス化が速い(例例 Amazon  Alexa) ̶— 研究の段階から実⽤用化、ビジネス化のチームが付き添うのが重要

×