0
第1回 集合知プログラミング
12016 園田 成良
目次
1.集合知とは?
2.集合知の利用例
3.機械学習とは?
4.機械学習の弱点
5.実生活における例
6.その他の使用例
7.1~6までのまとめ
8.協調フィルタリング
9.Pythonの実行方法
10.映画の評者と評価点の表示
10.映画...
1.集合知とは?
• 今までにない知見を生み出すために
「集団の振る舞い・嗜好・アイディア」
を結びつけること
▫ 世論調査
 多くの人からの回答を基に,統計的な結論を引き出す
 新たな結論を作り上げる
▫ 経済市場
 最も利益を得られる...
2.集合知の利用例
• Wikipedia(ウィキペディア)
▫ 利用者によって作り上げられているオンライン辞書
▫ 誰でも作成・編集が可能
▫ 多くの利用者の知識で成長していく
▫ アルゴリズムなし
4
Wikipedia
ペリーが
好きな人...
3.機械学習とは?
• 人工知能の一分野でコンピュータに学習させる
▫ 機械学習の例
 コンピュータの漢字変換時における入力ミス
5
機会学習
機械学習と入力したかったが
間違えてしまった
機械学習
次から
「きかい」を
変換した時に
「機械...
4.機械学習の弱点
• 機械が知らないパターンは誤って解釈されてし
まうことが多い
▫ 人間
 似たような状況を思い出して決断できる
▫ 機械
 既に見たデータを基にしか決断できない
6
5.実生活における例
• Googleの検索エンジン(PageRank)[1]
▫ 利用者が求めている内容を上位に結果表示させる
 色々なサイトからリンクされていると上位に表示
▫ どんな人がどんな広告をクリックしたのか
▫ アルゴリズムあり...
6.その他の使用例
• クレジット詐欺の発見
▫ 詐欺取引を検知
▫ 取引や現金の動きが不適切かどうかを判断
• 株式市場の分析
▫ 参加者がパターンを発見するために,高度な技術
が使われるようになっている
8
この他にも多くの例があり
多くの...
7.1~6までのまとめ
• 様々なデータを蓄積し,情報を引き出して利用
▫ データマイニングの分野
▫ 多くのユーザの意見で情報が構成
• Googleでも利用されている
▫ PageRankシステム
9
8.協調フィルタリング
• 多くのユーザの嗜好情報を蓄積
▫ ユーザとユーザの嗜好が類似した情報を自動で推
論を行う方法論
• 協調フィルタリングの手法
▫ 「ユーグリッド距離」
▫ 「ピアソン相関」
▫ 「Jacard係数」
▫ 「マンハッタ...
9.pythonの実行方法
• 実行環境はUbuntu12.10
▫ 拡張子は.py
▫ 始めからpythonの環境は構築されている
▫ # !/usr/bin/env python
▫ # cording:utf-8 の2つを記入
▫ pyt...
10.映画の評者と評価点を表示
• test.pyに評者と評価点を記述
▫ 尚,映画の評価は1.0から5.0とする
12
11.実行
• test.pyをpythonのインタプリタで実行
• ①の実行結果
▫ AkiraSonodaさんは,Lady in the Waterという映画の評価
を2.5にした.
• ②の実行結果
▫ AkiraSonodaさんは,La...
12.ユーグリッド距離(数値)
• 嗜好空間上の距離の近さで類似度を計算
▫ 園田と薄井の映画の評価点の類似度を算出
▫ 園田と小柳の映画の評価点の類似度を算出
14
13.ユーグリッド距離(グラフ)
• 園田,薄井,小柳の映画の嗜好をグラフ化
▫ は園田
▫ は薄井
▫ は小柳
15
Snakes
Dupree
5
4
3
2
1
0 1 2 3 4 5
点と点が近いほどその
人と嗜好が似ている!!
14.評者をランキングする
• 映画の好みにもっとも似ている映画の評者を探
し出し,好みの近い順に並べたリストを得れる.
• 佐藤が映画を見るとき小柳のレビューを参考に
して映画を見ると,嗜好が近いので参考になる.
16
15.8~14までのまとめ
• 数多くの強調フィルタリングの手法があるが,
今回はユーグリッド距離を使用
• 数値が近ければ近いほど嗜好が類似している
17
ご清聴ありがとうございました
18
おまけ
• 集合知プログラミングの本の通りに実行不能
▫ pythonのversionが違うから?
▫ 園田のversionは2.7.3(2013年4月11日現在)
▫ 書籍の発行日(2012年5月1日)
• 実行方法(11ページ)
▫ imp...
Upcoming SlideShare
Loading in...5
×

kic_python_programming

752

Published on

http://www.slideshare.net/slideshow/embed_code/24971794

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
752
On Slideshare
0
From Embeds
0
Number of Embeds
5
Actions
Shares
0
Downloads
0
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Transcript of "kic_python_programming"

  1. 1. 第1回 集合知プログラミング 12016 園田 成良
  2. 2. 目次 1.集合知とは? 2.集合知の利用例 3.機械学習とは? 4.機械学習の弱点 5.実生活における例 6.その他の使用例 7.1~6までのまとめ 8.協調フィルタリング 9.Pythonの実行方法 10.映画の評者と評価点の表示 10.映画の評者と評価点の表示 11.実行 12.ユーグリッド距離(数値) 13.ユーグリッド距離(グラフ) 14.評者をランキングする 15.8~14までのまとめ 2
  3. 3. 1.集合知とは? • 今までにない知見を生み出すために 「集団の振る舞い・嗜好・アイディア」 を結びつけること ▫ 世論調査  多くの人からの回答を基に,統計的な結論を引き出す  新たな結論を作り上げる ▫ 経済市場  最も利益を得られると信じて行動する振る舞い  多くの人々の「知識・経験・洞察力」の組み合わせ 3
  4. 4. 2.集合知の利用例 • Wikipedia(ウィキペディア) ▫ 利用者によって作り上げられているオンライン辞書 ▫ 誰でも作成・編集が可能 ▫ 多くの利用者の知識で成長していく ▫ アルゴリズムなし 4 Wikipedia ペリーが 好きな人たち ペリー の記事 を編集 ペリーの記事の内容が 更に詳しくなった
  5. 5. 3.機械学習とは? • 人工知能の一分野でコンピュータに学習させる ▫ 機械学習の例  コンピュータの漢字変換時における入力ミス 5 機会学習 機械学習と入力したかったが 間違えてしまった 機械学習 次から 「きかい」を 変換した時に 「機械」と最 初に出る
  6. 6. 4.機械学習の弱点 • 機械が知らないパターンは誤って解釈されてし まうことが多い ▫ 人間  似たような状況を思い出して決断できる ▫ 機械  既に見たデータを基にしか決断できない 6
  7. 7. 5.実生活における例 • Googleの検索エンジン(PageRank)[1] ▫ 利用者が求めている内容を上位に結果表示させる  色々なサイトからリンクされていると上位に表示 ▫ どんな人がどんな広告をクリックしたのか ▫ アルゴリズムあり 7 [1] http://dorubako.nishitokyo-city.com/googlepagerank.html バットを購入 機械が判断 グローブの購入を薦める
  8. 8. 6.その他の使用例 • クレジット詐欺の発見 ▫ 詐欺取引を検知 ▫ 取引や現金の動きが不適切かどうかを判断 • 株式市場の分析 ▫ 参加者がパターンを発見するために,高度な技術 が使われるようになっている 8 この他にも多くの例があり 多くの可能性を秘めている
  9. 9. 7.1~6までのまとめ • 様々なデータを蓄積し,情報を引き出して利用 ▫ データマイニングの分野 ▫ 多くのユーザの意見で情報が構成 • Googleでも利用されている ▫ PageRankシステム 9
  10. 10. 8.協調フィルタリング • 多くのユーザの嗜好情報を蓄積 ▫ ユーザとユーザの嗜好が類似した情報を自動で推 論を行う方法論 • 協調フィルタリングの手法 ▫ 「ユーグリッド距離」 ▫ 「ピアソン相関」 ▫ 「Jacard係数」 ▫ 「マンハッタン距離」 10 他にも数多くの類似性検出方法がある
  11. 11. 9.pythonの実行方法 • 実行環境はUbuntu12.10 ▫ 拡張子は.py ▫ 始めからpythonの環境は構築されている ▫ # !/usr/bin/env python ▫ # cording:utf-8 の2つを記入 ▫ pythonコマンドでインタプリタを起動させる 11
  12. 12. 10.映画の評者と評価点を表示 • test.pyに評者と評価点を記述 ▫ 尚,映画の評価は1.0から5.0とする 12
  13. 13. 11.実行 • test.pyをpythonのインタプリタで実行 • ①の実行結果 ▫ AkiraSonodaさんは,Lady in the Waterという映画の評価 を2.5にした. • ②の実行結果 ▫ AkiraSonodaさんは,Lady in the Waterという映画の評価 を2.5と評価したが,それを4.0と修正した. 13 ① ②
  14. 14. 12.ユーグリッド距離(数値) • 嗜好空間上の距離の近さで類似度を計算 ▫ 園田と薄井の映画の評価点の類似度を算出 ▫ 園田と小柳の映画の評価点の類似度を算出 14
  15. 15. 13.ユーグリッド距離(グラフ) • 園田,薄井,小柳の映画の嗜好をグラフ化 ▫ は園田 ▫ は薄井 ▫ は小柳 15 Snakes Dupree 5 4 3 2 1 0 1 2 3 4 5 点と点が近いほどその 人と嗜好が似ている!!
  16. 16. 14.評者をランキングする • 映画の好みにもっとも似ている映画の評者を探 し出し,好みの近い順に並べたリストを得れる. • 佐藤が映画を見るとき小柳のレビューを参考に して映画を見ると,嗜好が近いので参考になる. 16
  17. 17. 15.8~14までのまとめ • 数多くの強調フィルタリングの手法があるが, 今回はユーグリッド距離を使用 • 数値が近ければ近いほど嗜好が類似している 17
  18. 18. ご清聴ありがとうございました 18
  19. 19. おまけ • 集合知プログラミングの本の通りに実行不能 ▫ pythonのversionが違うから? ▫ 園田のversionは2.7.3(2013年4月11日現在) ▫ 書籍の発行日(2012年5月1日) • 実行方法(11ページ) ▫ import recommendations ▫ reload(recommendations) ▫ recommendations.sim_distance(recommendation s.critics, ‘Lisa Rose’, ‘Gene Seymor’I 19 これを追加する
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×