Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
みんな大好き機械学習 2013.03.24 第23回 オープンラボ岡山 貞松 政史
自己紹介 ■ 貞松 政史 ■ @sady_nitro ■ 株式会社リゾーム      ※俗に言う#R社でない ■ どうも、統計学の人です。 ■ 統計学が嫌い   正しく使われない統計手法が嫌い
統計手法(というほどのものでない)あるある■ 平均値        【売上前年比】        平均:80%        自店:70%
統計手法(というほどのものでない)あるある■ 相関係数                   相関係数                    0.94 施設・フロ              外部要因 ア・業種比               は…?...
閑話休題~本日のお話
閑話休題~本日のお話■機械学習入門編■最新の手法でなく古典的な手法■ちょっとした発想で実践、実装できそうなもの
機械学習その前に
機械学習その前に■人工知能あれこれ ・ゲーム(将棋・チェス・テレビゲームのCPU等) ・家電(ファジー制御等) ・ロボット(お掃除ロボット等) ・画像認識(顔検出等) ・自然言語処理(スパムフィルター等)
チェスに対する人工知能       評価関数により       全ての打ち手の        評価値を計算          【ゲーム木】
お掃除ロボットの人工知能        ●ランダム型        ●パターン型        ●人工知能+パターン型        ●人工知能+マッピング型
顔認識■テンプレートマッチング           顔画像のテンプレートとマッチング
人工知能は意外と手ごねが多い■シンプルなロジックだけだと精度が上がらない■精度を上げようとすると膨大なパターンを想定したプログラミングが必要■知能という以上は自ら学習して最良な行動を獲得しないとイケてない         そうだ、機械学習を使おう。
ようやく機械学習のお話
機械学習とは人工知能における研究課題の一つで、人間が自然に行っている学習能力と同様の機能をコンピュータで実現しようとする技術・手法のこと
機械学習手法あれこれ■ベイズ理論               今回は対象外■ニューラルネットワーク■遺伝的アルゴリズム               今回はこちらのお話■強化学習
一応触れておく最近の話題
一応触れておく最近の話題 ■ニューラルネットワーク  ・3層パーセプトロン   誤差逆伝搬法(バックプロパゲーション)           重みを更新する
一応触れておく最近の話題■ Deep Learning  従来より多層のニューラルネットワークを  用いた機械学習手法。  Googleが猫を認識させたのが有名 一般的にはHinton(2012)のDBM(Deep Boltzmann Mach...
遺伝的アルゴリズム
遺伝的アルゴリズムとは■遺伝子(というか染色体というか)の仕組みを模倣して  さまざまな問題の解(近似解)を得るためのアルゴリズム   染色体を模した01のデータを持つビット列⇒個体  1世代目           2世代目          ...
遺伝的アルゴリズムとは■遺伝子(というか染色体というか)の仕組みを模倣して  さまざまな問題の解(近似解)を得るためのアルゴリズム 【遺伝的アルゴリズムのプロセス】     交叉     1   0   1   0   1   0       ...
遺伝的アルゴリズムのイメージ…              継承!
遺伝的アルゴリズムの適用例■ナップザック問題 容量に制限のあるナップザックの中に価値が最大に なるように荷物を詰めこむ問題            重さ 10    1   2   5 15 7            価値 20    2   5...
遺伝的アルゴリズムの適用例【遺伝的アルゴリズムでグラディウスをクリア(1面)】 http://www.nicovideo.jp/watch/sm19443458
遺伝的アルゴリズムの適用例  【遺伝的アルゴリズムでブランコの漕ぎ方を学習さ  せた】  http://www.youtube.com/watch?v=w1MF0Iz0p40
強化学習
強化学習とは ある環境内におけるエージェントが、現在の状態を観測し 取るべき行動を決定する問題を扱う機械学習の一種 【強化学習エージェント】
強化学習エージェントの適用例■迷路問題■追跡問題
状態認識器 状態認識器   状態1   状態2   状態3                     …
行動選択器 行動選択器   ★ルーレット選択法   状態1              上          左          右              下
学習器 学習器  状態1                    ★Profit Sharing            上          目標達成1つ前の行動:100pt        左       右                右  ...
デモやります          ■状態認識器:全マスの状態が認識できる■3目並べ          ■行動選択器:ルーレット選択法          ■学習器:Profit Sharing               0      1     ...
ここで突然RoboCup Soccerなるもの              西暦2050年までにサッカーの世界チャン              ピオンチームに勝てる自律型ロボットの              チームを作る!
RoboCup Soccer シミュレーションリーグ                     ■プレイヤーは全て自律型の                       エージェント(外部からの                       操作はさ...
機械学習の全般的な課題
機械学習の全般的な課題・調整すべきパラメータが多い・CPUやメモリが不足する・学習に時間が掛かる・問題のモデル化や部分問題への切り分けが難しい   新しい技術やハードウェアの性能向上により   改善可能な部分も多い
まとめ
まとめ・機械学習は人工知能の枠組みの一つ・機械学習の手法は様々・小規模な問題から大規模な問題まで適用・時として人間の発想を超越した行動を獲得することも
Upcoming SlideShare
Loading in …5
×

みんな大好き機械学習

9,205 views

Published on

2013-03-24 第23回オープンラボ岡山

Published in: Technology

みんな大好き機械学習

  1. 1. みんな大好き機械学習 2013.03.24 第23回 オープンラボ岡山 貞松 政史
  2. 2. 自己紹介 ■ 貞松 政史 ■ @sady_nitro ■ 株式会社リゾーム ※俗に言う#R社でない ■ どうも、統計学の人です。 ■ 統計学が嫌い 正しく使われない統計手法が嫌い
  3. 3. 統計手法(というほどのものでない)あるある■ 平均値 【売上前年比】 平均:80% 自店:70%
  4. 4. 統計手法(というほどのものでない)あるある■ 相関係数 相関係数 0.94 施設・フロ 外部要因 ア・業種比 は…? 較は…?
  5. 5. 閑話休題~本日のお話
  6. 6. 閑話休題~本日のお話■機械学習入門編■最新の手法でなく古典的な手法■ちょっとした発想で実践、実装できそうなもの
  7. 7. 機械学習その前に
  8. 8. 機械学習その前に■人工知能あれこれ ・ゲーム(将棋・チェス・テレビゲームのCPU等) ・家電(ファジー制御等) ・ロボット(お掃除ロボット等) ・画像認識(顔検出等) ・自然言語処理(スパムフィルター等)
  9. 9. チェスに対する人工知能 評価関数により 全ての打ち手の 評価値を計算 【ゲーム木】
  10. 10. お掃除ロボットの人工知能 ●ランダム型 ●パターン型 ●人工知能+パターン型 ●人工知能+マッピング型
  11. 11. 顔認識■テンプレートマッチング 顔画像のテンプレートとマッチング
  12. 12. 人工知能は意外と手ごねが多い■シンプルなロジックだけだと精度が上がらない■精度を上げようとすると膨大なパターンを想定したプログラミングが必要■知能という以上は自ら学習して最良な行動を獲得しないとイケてない そうだ、機械学習を使おう。
  13. 13. ようやく機械学習のお話
  14. 14. 機械学習とは人工知能における研究課題の一つで、人間が自然に行っている学習能力と同様の機能をコンピュータで実現しようとする技術・手法のこと
  15. 15. 機械学習手法あれこれ■ベイズ理論 今回は対象外■ニューラルネットワーク■遺伝的アルゴリズム 今回はこちらのお話■強化学習
  16. 16. 一応触れておく最近の話題
  17. 17. 一応触れておく最近の話題 ■ニューラルネットワーク ・3層パーセプトロン 誤差逆伝搬法(バックプロパゲーション) 重みを更新する
  18. 18. 一応触れておく最近の話題■ Deep Learning 従来より多層のニューラルネットワークを 用いた機械学習手法。 Googleが猫を認識させたのが有名 一般的にはHinton(2012)のDBM(Deep Boltzmann Machines)が有名らしい
  19. 19. 遺伝的アルゴリズム
  20. 20. 遺伝的アルゴリズムとは■遺伝子(というか染色体というか)の仕組みを模倣して さまざまな問題の解(近似解)を得るためのアルゴリズム 染色体を模した01のデータを持つビット列⇒個体 1世代目 2世代目 N世代目親集団 親集団 親集団 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 … … … … 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0子集団 子集団 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 … … 1 0 1 0 1 0 1 0 1 0 1 0
  21. 21. 遺伝的アルゴリズムとは■遺伝子(というか染色体というか)の仕組みを模倣して さまざまな問題の解(近似解)を得るためのアルゴリズム 【遺伝的アルゴリズムのプロセス】 交叉 1 0 1 0 1 0 親 1 0 0 1 1 1 1 選択 親 1 0 1 1 1 1 突然変異 子 0 0 1 0 1 0
  22. 22. 遺伝的アルゴリズムのイメージ… 継承!
  23. 23. 遺伝的アルゴリズムの適用例■ナップザック問題 容量に制限のあるナップザックの中に価値が最大に なるように荷物を詰めこむ問題 重さ 10 1 2 5 15 7 価値 20 2 5 10 25 15 選択 0 0 0 1 1 0
  24. 24. 遺伝的アルゴリズムの適用例【遺伝的アルゴリズムでグラディウスをクリア(1面)】 http://www.nicovideo.jp/watch/sm19443458
  25. 25. 遺伝的アルゴリズムの適用例 【遺伝的アルゴリズムでブランコの漕ぎ方を学習さ せた】 http://www.youtube.com/watch?v=w1MF0Iz0p40
  26. 26. 強化学習
  27. 27. 強化学習とは ある環境内におけるエージェントが、現在の状態を観測し 取るべき行動を決定する問題を扱う機械学習の一種 【強化学習エージェント】
  28. 28. 強化学習エージェントの適用例■迷路問題■追跡問題
  29. 29. 状態認識器 状態認識器 状態1 状態2 状態3 …
  30. 30. 行動選択器 行動選択器 ★ルーレット選択法 状態1 上 左 右 下
  31. 31. 学習器 学習器 状態1 ★Profit Sharing 上 目標達成1つ前の行動:100pt 左 右 右 目標達成2つ前の行動:50pt 左 下 目標達成3つ前の行動:25pt …
  32. 32. デモやります ■状態認識器:全マスの状態が認識できる■3目並べ ■行動選択器:ルーレット選択法 ■学習器:Profit Sharing 0 1 2 3 4 5 6 7 8 1 2 2 0 1 1 2 0 0 … … 0 0 10 0 0 0 0 5 5
  33. 33. ここで突然RoboCup Soccerなるもの 西暦2050年までにサッカーの世界チャン ピオンチームに勝てる自律型ロボットの チームを作る!
  34. 34. RoboCup Soccer シミュレーションリーグ ■プレイヤーは全て自律型の エージェント(外部からの 操作はされない) ■2D(平面)で高さの概念はない ■動作は回転・前進・キックのみ 回転角や前進スピード、 キックの強さでドリブル・パス シュートなどを行う このRoboCup Soccerプレイヤーに 強化学習を適用したところ… 正面の敵にパスをして奪い返す! そしてそのままキーパーと1対1に!
  35. 35. 機械学習の全般的な課題
  36. 36. 機械学習の全般的な課題・調整すべきパラメータが多い・CPUやメモリが不足する・学習に時間が掛かる・問題のモデル化や部分問題への切り分けが難しい 新しい技術やハードウェアの性能向上により 改善可能な部分も多い
  37. 37. まとめ
  38. 38. まとめ・機械学習は人工知能の枠組みの一つ・機械学習の手法は様々・小規模な問題から大規模な問題まで適用・時として人間の発想を超越した行動を獲得することも

×