Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

機械学習キャンバス0.1

3,245 views

Published on

「機械学習や人工知能で解決できないか」という相談を
しばしば受ける。特にエンジニアではない人に経営学の言葉で
説明する時に、手持ちの道具では不足を感じる。
「ビジネスモデル」という漠然としたものの設計をわかりやすく
するために「リーンキャンバス」というフレームワークが生まれ
たみたいに「機械学習・人工知能」 に対してもキャンバスがあれ
ばいいのではないか?そこでver. 0.1を作ってみた。

Published in: Education
  • Dear Sir- Madame, Please let me know how I can be of help to you? Kind Regards, Fredrick. Fredrick Anold Director - Consultant idealtropical.com +1 813-713-0615 Hello, It is my pleasure to reach out to you with the following offer of appointment. Shenergy (Group) Company Limited, are currently seeking Reputable Company/Individual that can act as their Company Representative/Account Receivable Agent in Canada and in USA (Intermediary between Shenergy (Group) Co, Ltd and its clients in the Northern America region). If interested, kindly indicate your interest by responding directly to the Company's Deputy General Manager and Director details below: Xu Weiquan Deputy General Manager and Director Shenergy (Group) Co, Ltd E-mail: representative-department@shenergygroup.com.cn http://www.shenergy.com.cn/ Note: The job will only take few minutes of your time daily. You can Earn Extra income while doing your normal Job/Business. Management Shenergy (Group) CSS, Company Limited
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here

機械学習キャンバス0.1

  1. 1. 機械学習キャンバス ver. 0.1 2016-11-08 サイボウズラボ 西尾泰和
  2. 2. 目的 「機械学習や人工知能で解決できないか」という相談を しばしば受ける。特にエンジニアではない人に経営学の言葉で 説明する時に、手持ちの道具では不足を感じる。 「ビジネスモデル」という漠然としたものの設計をわかりやすく するために「リーンキャンバス」というフレームワークが生まれ たみたいに「機械学習・人工知能」に対してもキャンバスがあれ ばいいのではないか?そこでver. 0.1を作ってみた。 リーンキャンバスの肝は「方法に固執するな」だと思うので、 こちらも方法は最後に考える仕組みにした。 2
  3. 3. 機械学習キャンバス ver. 0.1 3 (1) Customer Happiness:顧客は何がどうなるとうれしいのか (2) Solution by hand:人手でそれを実現する方法 (3) Input:使え る入力データ (5) Output:得 たい出力データ (7) Solution by computer:コンピュータで実現する方法(素朴な アルゴリズム、ルールベースなど) (10) Solution by ML/AI:機械学習や人工知能で実現する方法 (8) Training data:正解データ の獲得方法・量 (9) Target Function:評価関数 (出力がどうだと好ましいのか) (4) 入力データ をどう得るか (6) 出力データ をどう顧客価値 に結びつけるか
  4. 4. スパムフィルタ スパムフィルタを世界で初めて設計する人の立場に立って このキャンバスを埋めていきながら考えてみよう。 4
  5. 5. スパムフィルタ 5 (1) Customer Happiness:顧客は何がどうなるとうれしいのか スパムメールがInboxからなくなってほしい (2) Solution by hand:人手でそれを実現する方法 (3) Input:使え る入力データ (5) Output:得 たい出力データ (7) Solution by computer:コンピュータで実現する方法(素朴な アルゴリズム、ルールベースなど) (10) Solution by ML/AI:機械学習や人工知能で実現する方法 (8) Training data:正解データ の獲得方法・量 (9) Target Function:評価関数 (出力がどうだと好ましいのか) (4) 入力データ をどう得るか (6) 出力データ をどう顧客価値 に結びつけるか
  6. 6. スパムフィルタ 6 (1) Customer Happiness:顧客は何がどうなるとうれしいのか スパムメールがInboxからなくなってほしい (2) Solution by hand:人手でそれを実現する方法 秘書がメールの内容を見て、スパムとそうでないものに分ける(3) Input:使え る入力データ (5) Output:得 たい出力データ (7) Solution by computer:コンピュータで実現する方法(素朴な アルゴリズム、ルールベースなど) (10) Solution by ML/AI:機械学習や人工知能で実現する方法 (8) Training data:正解データ の獲得方法・量 (9) Target Function:評価関数 (出力がどうだと好ましいのか) (4) 入力データ をどう得るか (6) 出力データ をどう顧客価値 に結びつけるか
  7. 7. スパムフィルタ 7 (1) Customer Happiness:顧客は何がどうなるとうれしいのか スパムメールがInboxからなくなってほしい (2) Solution by hand:人手でそれを実現する方法 秘書がメールの内容を見て、スパムとそうでないものに分ける(3) Input:使え る入力データ メールの文面 (5) Output:得 たい出力データ (7) Solution by computer:コンピュータで実現する方法(素朴な アルゴリズム、ルールベースなど) (10) Solution by ML/AI:機械学習や人工知能で実現する方法 (8) Training data:正解データ の獲得方法・量 (9) Target Function:評価関数 (出力がどうだと好ましいのか) (4) 入力データ をどう得るか (6) 出力データ をどう顧客価値 に結びつけるか
  8. 8. スパムフィルタ 8 (1) Customer Happiness:顧客は何がどうなるとうれしいのか スパムメールがInboxからなくなってほしい (2) Solution by hand:人手でそれを実現する方法 秘書がメールの内容を見て、スパムとそうでないものに分ける (3) Input:使え る入力データ メールの文面 (5) Output:得 たい出力データ (7) Solution by computer:コンピュータで実現する方法(素朴な アルゴリズム、ルールベースなど) (10) Solution by ML/AI:機械学習や人工知能で実現する方法 (8) Training data:正解データ の獲得方法・量 (9) Target Function:評価関数 (出力がどうだと好ましいのか) (4) 入力データ をどう得るか 顧客のメール文 面を見る権限が 必要、メール サーバかメーラ かに手を加える (6) 出力データ をどう顧客価値 に結びつけるか
  9. 9. スパムフィルタ 9 (1) Customer Happiness:顧客は何がどうなるとうれしいのか スパムメールがInboxからなくなってほしい (2) Solution by hand:人手でそれを実現する方法 秘書がメールの内容を見て、スパムとそうでないものに分ける (3) Input:使え る入力データ メールの文面 (5) Output:得 たい出力データ 「スパムである /ない」の情報(7) Solution by computer:コンピュータで実現する方法(素朴な アルゴリズム、ルールベースなど) (10) Solution by ML/AI:機械学習や人工知能で実現する方法 (8) Training data:正解データ の獲得方法・量 (9) Target Function:評価関数 (出力がどうだと好ましいのか) (4) 入力データ をどう得るか 顧客のメール文 面を見る権限が 必要、メール サーバかメーラ かに手を加える (6) 出力データ をどう顧客価値 に結びつけるか
  10. 10. スパムフィルタ 10 (1) Customer Happiness:顧客は何がどうなるとうれしいのか スパムメールがInboxからなくなってほしい (2) Solution by hand:人手でそれを実現する方法 秘書がメールの内容を見て、スパムとそうでないものに分ける (3) Input:使え る入力データ メールの文面 (5) Output:得 たい出力データ 「スパムである /ない」の情報 (7) Solution by computer:コンピュータで実現する方法(素朴な アルゴリズム、ルールベースなど) (10) Solution by ML/AI:機械学習や人工知能で実現する方法 (8) Training data:正解データ の獲得方法・量 (9) Target Function:評価関数 (出力がどうだと好ましいのか) (4) 入力データ をどう得るか 顧客のメール文 面を見る権限が 必要、メール サーバかメーラ かに手を加える (6) 出力データ をどう顧客価値 に結びつけるか 「スパムであ る」と判定され たメールを自動 でInboxから別 のフォルダに移 動する
  11. 11. スパムフィルタ 11 (1) Customer Happiness:顧客は何がどうなるとうれしいのか スパムメールがInboxからなくなってほしい (2) Solution by hand:人手でそれを実現する方法 秘書がメールの内容を見て、スパムとそうでないものに分ける (3) Input:使え る入力データ メールの文面 (5) Output:得 たい出力データ 「スパムである /ない」の情報 (7) Solution by computer:コンピュータで実現する方法(素朴な アルゴリズム、ルールベースなど) 怪しいキーワードが含まれているメールをスパムと判定。キー ワードは人間が追加する。 (10) Solution by ML/AI:機械学習や人工知能で実現する方法 (8) Training data:正解データ の獲得方法・量 (9) Target Function:評価関数 (出力がどうだと好ましいのか) (4) 入力データ をどう得るか 顧客のメール文 面を見る権限が 必要、メール サーバかメーラ かに手を加える (6) 出力データ をどう顧客価値 に結びつけるか 「スパムであ る」と判定され たメールを自動 でInboxから別 のフォルダに移 動する
  12. 12. 素朴アルゴリズム 怪しいキーワードが含まれているメールをスパムと判定。キー ワードは人間が追加する。 実現可能性:簡単に実装できそう 計算コスト:各メールをキーワードの個数だけ全文検索 必要なデータ:「怪しいキーワードのリスト」 これどうやって準備する?→サブタスク発生! 12
  13. 13. サブタスク 顧客が「スパムフィルタの利用者」ではなく 「スパムフィルタの設計者」である自分に変わる。 それによって得られるデータも変わる。 達成したい目標もかわる 13
  14. 14. スパムフィルタのサブタスク 14 (1) Customer Happiness:顧客は何がどうなるとうれしいのか スパムっぽい怪しいキーワードのリストが欲しい (2) Solution by hand:人手でそれを実現する方法 メールの内容を見て、スパムによく出て来て普通のメールに出 てこない単語をリストアップする (3) Input:使え る入力データ メールの文面と それがスパムで あるかどうか (5) Output:得 たい出力データ スパムっぽい怪 しい単語(7) Solution by computer:コンピュータで実現する方法(素朴な アルゴリズム、ルールベースなど) (10) Solution by ML/AI:機械学習や人工知能で実現する方法 (8) Training data:正解データ の獲得方法・量 (9) Target Function:評価関数 (出力がどうだと好ましいのか) (4) 入力データ をどう得るか 自分のメールを 使う (6) 出力データ をどう顧客価値 に結びつけるか 単にリストを作 るだけ
  15. 15. 機械的に作る方法 スパムメールと普通のメールをそれぞれ単語分割して 各単語の「スパムメール中の出現頻度」と 「普通のメール中の出現頻度」をカウント。 スパムメール中での出現頻度が普通の出現頻度より 大きいほど「スパムっぽい度」が高いと考えて 適当な閾値以上のものを選択。 実現可能性:できそう。 15
  16. 16. 作者の誤算 ナイーブベイズでのスパムフィルタを作る話になる予定だったが ナイーブベイズを使わないまま解決してしまった。 実際にこのスパムフィルタを作って実験してみると • 「キーワードが含まれていたら問答無用でスパム」という処理 のために誤判定が多い • キーワードリストの更新やパーソナライズが行われないので、 新しいパターンのスパムや、特定の人だけが受け取るスパムに 対処ができない。 という問題が起きるはず。 16
  17. 17. ルールの確率化 >「キーワードが含まれていたら問答無用でスパム」という処理 のために誤判定が多い こういう「TrueかFalseかで判断しているルールの誤判定が起きて しまう問題」を緩和するために、真偽値の代わりに確率値を使う ことはよく行われている。 ナイーブベイズでのスパムフィルタも「スパムである/ない」の真 偽値の代わりに「スパムである確率が高い/低い」の確率値を使う 17 see: 「ルールベースから機械学習への道 公開用」 http://www.slideshare.net/nishio/ss-53221829

×