Successfully reported this slideshow.
Your SlideShare is downloading. ×

東大大学院 戦略ソフトウェア特論2021「ロボットで世界を計算可能にする」海野裕也

Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad

Check these out next

1 of 70 Ad

東大大学院 戦略ソフトウェア特論2021「ロボットで世界を計算可能にする」海野裕也

PFN執行役員 ロボットソリューションズ担当VPの海野裕也が、2021年7月6日の東京大学大学院 情報理工学系研究科 戦略ソフトウェア特論(稲葉真理先生)にオンライン登壇し、「ロボットで世界を計算可能にするー計算機の中の世界と、現実世界のすりあわせ」と題して、PFNのロボット関連技術や自然言語処理技術についてお話しさせていただきました。
講義動画はこちらです https://youtu.be/73W_rJLlfw8

PFN執行役員 ロボットソリューションズ担当VPの海野裕也が、2021年7月6日の東京大学大学院 情報理工学系研究科 戦略ソフトウェア特論(稲葉真理先生)にオンライン登壇し、「ロボットで世界を計算可能にするー計算機の中の世界と、現実世界のすりあわせ」と題して、PFNのロボット関連技術や自然言語処理技術についてお話しさせていただきました。
講義動画はこちらです https://youtu.be/73W_rJLlfw8

Advertisement
Advertisement

More Related Content

Slideshows for you (20)

Similar to 東大大学院 戦略ソフトウェア特論2021「ロボットで世界を計算可能にする」海野裕也 (20)

Advertisement

More from Preferred Networks (20)

Recently uploaded (20)

Advertisement

東大大学院 戦略ソフトウェア特論2021「ロボットで世界を計算可能にする」海野裕也

  1. 1. (株)Preferred Networks 海野 裕也 ロボットで世界を計算可能にする ― 計算機の中の世界と、現実世界のすりあわせ 2020/07/06 戦略ソフトウェア特論
  2. 2. 海野裕也 自然言語処理、機械学習、深層学習、ロボット、OSS 自己紹介 2
  3. 3. 2006 - 2008 東大院情報理工 修士課程 2008 - 2011 日本アイ・ビー・エム株式会社 2011 - 2016 (株)Preferred Infrastructure 2016 - (株)Preferred Networks 経歴を少し 3
  4. 4. Preferred Networks 現実世界を計算可能にする
  5. 5. 全ての人にロボットを
  6. 6. 6
  7. 7. ● なんでロボットやることになったの? ● 今何を考えてこういうことをしているのか? ● 技術は授業で習うので、思想的な部分をお話したい 今日話すこと 8
  8. 8. ロボットの話
  9. 9. 10 自然言語処理
  10. 10. ● 学会に行っても企業の人がほとんどいない ● 重要なアプリケーションがなかなか生み出されな い ● 大きな産業になっていない 自然言語処理は役に立っているのか 11
  11. 11. ● SIGRAPH 2013のUCLAとディズニーの論 文 ● 雪のシミュレーション ● どこからどうみても、 2013年にヒットしたあの 映画で使われている技術 社会に影響を与える研究開発 12
  12. 12. 言語はプロトコル 13 言語 背後の問題 人が言葉を使うのは、伝えたいことがある、蓄えたい知識がある 背後の問題に目を向けないと役にはたてない
  13. 13. ロボットの「意味」は色々 14 ● 仕事をするロボット ● コミュニケーションロボッ ト、二足歩行ロボットは今 日は対象外 ● 大きく分けるとアーム型と 移動型 © KUKA Systems GmbH - KUKA Systems GmbH © Carmenter
  14. 14. ● 事前にティーチングペンダントで正確なx,y,z座標を 入力する(教示) ● 実際に動くときは同じ動作を繰り返すだけで、全く 認識を行わない ● 教示のときに人間が代わりに認識をしているともい える ティーチングプレイバック
  15. 15. 16
  16. 16. 教示型のロボットは難しい部分を人間が肩代わりしている 17 要求 環境 教示 人が理解して設計 目で見て位置を確認
  17. 17. 教示型から自律型へ 18 要求 環境 要求を理解するための技術 環境を把握するための技術
  18. 18. ポイントは目と耳の技術 19
  19. 19. 深層学習 Deep Learning
  20. 20. 深層学習による画像認識技術の発展 オレンジ Categorization 種類がわかる Segmentation 領域がわかる Detection 位置がわかる Instance segmentation 個々の領域がわかる
  21. 21. ● 2013年ころから画像認識の研究開 発をしていた ● Boostingを利用してリアルタイム人 物検出、タグ付け、時系列DBに格 納、集計、可視化 古典的な画像認識を昔やっていた 24
  22. 22. どこに何がどう置かれているか理解できないと モノをつかんだり避けられない
  23. 23. 静的なシステムから動的なシステムへ 環境を合わせる 環境に合わせる
  24. 24. 27
  25. 25. 何のための言語なのか 28 言語 言語処理の多くは知識の表現としての言葉を扱っていた 意図の伝達手段としての言語について考えるようになった 背後の問題 知識の蓄積 意図の伝達
  26. 26. 現実世界に紐付いた言葉の理解が必要 29 データの世界 現実の世界
  27. 27. 30
  28. 28. 言葉の意図からプログラムを生成する技術も進化している 31 https://copilot.github.com/
  29. 29. 32 どこでも使える 誰でも使える
  30. 30. 全ての人にロボットを
  31. 31. コピー機を使うような感覚でロボットを使えるように 34 © Solomon203
  32. 32. 物流の現場にロボットを入れていく 35
  33. 33. 36
  34. 34. ● 最初のコンピュータはディスプレイもキーボードもない ● 昔はアセンブリ言語を手書きした、ディスプレイもなかった ● 最初のコンパイラは1957年 ● 対話シェルは1960年代? ● GUIは1960年代に生まれて、80年代以降に普及 ● タッチパネルが普及するのは2000年以降 ● 音声入力が普及するのは2010年くらい コンピュータはいかにして誰でも使えるようになったか 37
  35. 35. 38 © SRI International
  36. 36. 徐々に利用者が自ら操作できるようになった 39 要求 要求
  37. 37. 1971: Intel 4004発売(初のマイクロプロセッサ) 1974: Altair 8800発売(初のパーソナルコンピュータ) 1975: Microsoft創業 1977: Apple II 発売 1978: Intel 8086発売 1995: Windows95発売 2001: iPod発売 2007: iPhone発売 パーソナルコンピュータの歴史は意外と浅い(?) 40
  38. 38. 41 Dynabook: Alan Kay, 1972
  39. 39. 42 © Rafael Fernandez iPhone 2007
  40. 40. 言語処理の人間が ロボットの仕事をできるのだろうか 43
  41. 41. ● 人間にとっては非常に簡単なことを機械にやらせようとしている ● 人間と同等にはできないので落とし所を探さないといけない ● 泥臭いチューニングがたくさんある ● 多数のモジュールがそれぞれがエラーを起こすので、全体を動かすのが難しい 自然言語処理とロボットは似ている 44
  42. 42. 深い深いソフトウェアスタック 45 S. Jabin, S. Samak, K. Sokphyrum. How to Translate from English to Khmer using Moses. http://wiki.ros.org/ja/navigation/Tutorials/RobotSetup Moses: 統計的機械翻訳のツールキット ROSの自律移動のソフトウェアスタック
  43. 43. 認識・行動した結果はすべてデータベース化される 46
  44. 44. ファイルを触るように現実のモノに触る 47
  45. 45. Preferred Networks 現実世界を計算可能にする
  46. 46. どこでも動く、誰でも使えるロボットを実現しようとしている 今のロボットは昔のメインフレーム、マウスやマイクロプロセッサのような技術革新 が必要 ロボットは現実世界と計算機の世界を結びつけるインターフェース 前半のまとめ 49
  47. 47. 心構えの話
  48. 48. チャンスかピンチか 51 ◯◯プロジェクトをやるぞ〜 失敗しそうだ・・・
  49. 49. ● うまくいった場合 ○ 未踏の領域を達成するのに貢献できた ● うまくいかなかった場合 ○ 解雇される? 本当に? ○ 会社が潰れて路頭に迷う? 本当に? ● やらなかった場合 ○ 別の重要な仕事ができる ○ 他人がうまく行った時に後悔する 本当にリスクがあるのかどうかちゃんと考える 52
  50. 50. 技術の下地 適切な投資と期待 実行できる環境 挑戦できるときに挑戦できるか 53
  51. 51. ● 人工知能関連技術は閉塞感が有りできることは限られていた ● 誰も技術に期待しておらず、「そういうのはいらない」と言われ続けた ● 特定の技術領域でも難しすぎて、分野横断的なチームを構成できない 15年前の「人工知能」はどうだったか 54
  52. 52. 挑戦できるタイミングは一瞬 56 http://blog.livedoor.jp/lunarmodule7/archives/4504511.html ● ちょうど今、一部の分野では十分な精 度になるかどうかの過渡期 ● 技術は進歩し続ける、できることが減 ることはない ● 挑戦できるタイミングは一瞬、早すぎ ても遅すぎてもだめ
  53. 53. 57
  54. 54. 58 © Kuha455405
  55. 55. ● 私が中高生の時(20年前)にMDは流行した ● 高校生のときにMP3プレイヤーが出現したが、1, 2曲しか入らず、絶対に流行 らないと思った ● 今、「ちょっと頭おかしい」とおもうような技術に投資するくらいがちょうどよい 未来の当たり前は今の非常識 59
  56. 56. ● 探索と活用のトレードオフ ● 全部そこそこ上手く行っている状態は、過剰にリスクを回避している ● 組織が失敗に寛容にならないと一番良い期待値を取れない 全部成功しなくていい 60 「50%は失敗しないといけません」
  57. 57. 61
  58. 58. 枯れた技術 ● 安定している ● 問題点が明らかで制御しやすい ● 効率や機能で劣るかもしれない 技術の選択は簡単ではない 62 新しい技術 ● 不安定で動かないかもしれない ● 未知の問題に遭遇するリスクがある ● 効率や機能で劇的な改善が期待される
  59. 59. 63 最先端の技術を 最短路で実用化する
  60. 60. ● 技術の水準は上がり続ける、戻ることはない ● 事業の流行り廃りが早く、生涯同じ仕事がつづく ことはない ● 今何を学ぶかより、学び続けることが大事 Learn or Die 64
  61. 61. 65
  62. 62. 継続的に学び続ける文化を醸成する ● 社内技術カンファレンス:年3回 ● テックトーク、技術トーク:隔週 ● 読書会:週1 ● 社内勉強会:不定期 技術力は1日にしてならず 66
  63. 63. ● 社会と繋がっていないと社会に価値のある ものは作れないと感じる ● 視野を広げる、他の分野、仕事も知る 誰のための技術? 67
  64. 64. ● 企業の安定と従業員の安定は違う ● リストラは企業を安定化させるための手段 だと知ろう ● 常に必要とされるようにスキルを磨き続け る方が安定する 大企業とベンチャー 68
  65. 65. ● 挑戦できる時に挑戦しよう、過度に失敗を恐れない ● タイミングは大事、挑戦は一瞬 ● 技術は学び続けるもの、変化の多い時代に適用しよう 後半のまとめ 69

×