Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Atsushi KOMIYA
4,649 views
第3回集合知プログラミング勉強会 #TokyoCI グループを見つけ出す
2012/10/30 に開催された第3回集合知プログラミング勉強会「グループを見つけ出す」の発表資料です。
Technology
◦
Read more
22
Save
Share
Embed
Embed presentation
1
/ 43
2
/ 43
3
/ 43
4
/ 43
5
/ 43
6
/ 43
7
/ 43
8
/ 43
9
/ 43
10
/ 43
11
/ 43
12
/ 43
13
/ 43
14
/ 43
15
/ 43
16
/ 43
17
/ 43
18
/ 43
19
/ 43
20
/ 43
21
/ 43
22
/ 43
23
/ 43
24
/ 43
25
/ 43
26
/ 43
27
/ 43
28
/ 43
29
/ 43
30
/ 43
31
/ 43
32
/ 43
33
/ 43
34
/ 43
35
/ 43
36
/ 43
37
/ 43
38
/ 43
39
/ 43
40
/ 43
41
/ 43
42
/ 43
43
/ 43
More Related Content
PDF
DSIRNLP #3 LZ4 の速さの秘密に迫ってみる
by
Atsushi KOMIYA
PDF
ここが変わる!Unity 5のスマホ開発 ~アセットバンドル、ビルド、プラグイン~
by
MakotoItoh
PDF
AssetBundle (もどき) の作り方
by
Mori Tetsuya
PDF
Introduction to Recommender Systems 2012.1.30 Zansa #3
by
Atsushi KOMIYA
PDF
集合知プログラミング第2章推薦を行う
by
Hiroko Onari
PPT
2章推薦を行う(後編)
by
Tanaka Hidenori
PDF
KDD 2015読み会
by
正志 坪坂
PPTX
NETGEAR ReadyNAS - 5段階のデータ保護
by
NETGEAR Japan
DSIRNLP #3 LZ4 の速さの秘密に迫ってみる
by
Atsushi KOMIYA
ここが変わる!Unity 5のスマホ開発 ~アセットバンドル、ビルド、プラグイン~
by
MakotoItoh
AssetBundle (もどき) の作り方
by
Mori Tetsuya
Introduction to Recommender Systems 2012.1.30 Zansa #3
by
Atsushi KOMIYA
集合知プログラミング第2章推薦を行う
by
Hiroko Onari
2章推薦を行う(後編)
by
Tanaka Hidenori
KDD 2015読み会
by
正志 坪坂
NETGEAR ReadyNAS - 5段階のデータ保護
by
NETGEAR Japan
Viewers also liked
PDF
みんなビックデータビックデータって言ってるけど 名寄せとかどうしてんの?
by
Kazuaki SAKAI
PDF
PMフォーラム2011大阪_maekawa_20110731
by
Naoya Maekawa
PPTX
5年後のデータサイエンティスト
by
Drecom Co., Ltd.
KEY
魅せる! How to fascinate audiences by your Lightning Talk
by
Hiromu Shioya
KEY
お客様とコードの間
by
Moriyuki Hirata
PDF
計量時系列分析の立場からビジネスの現場のデータを見てみよう - 30th Tokyo Webmining
by
Takashi J OZAKI
PDF
xDev2010 早い安い新しい「Fast IT」を使いこなせ! クラウドを楽しめるエンジニアの条件
by
Yusuke Suzuki
PDF
アジャイルサムライ他流試合 - 道場紹介
by
Kiichi Kajiura
PDF
勉強会カンファレンス2011、企業と勉強会
by
Hiro Yoshioka
PDF
パタン・ランゲージからプロジェクト・ランゲージへ Part1
by
Takeshi Kakeda
PDF
たのしい宿題発表会 〜慣れない言語で車輪の再開発しよう〜
by
Hiromu Shioya
PDF
アジャイル×パターン=ぼくたちの現場 イントロダクション
by
Takeshi Kakeda
PDF
20130423 #devlove 職場を劇的にさせる四十八手 —「n次請けSIerでも出来ること」のその続き—
by
陽一 滝川
PDF
デブサミ2013の明後日な楽しみ方
by
陽一 滝川
PPTX
20140925ついうっかりよさようなら
by
kishitaku
PDF
米国のスマートフォンアプリ市場とプロモーション
by
Hiromitsu Ishimori
PDF
リーンスタートアップを実践してのこれまでとこれから
by
Yoshihito Kuranuki
PDF
小さな幸せの集め方ForDevLOVE
by
Yuji Tomiyama
PDF
とべとべ vol.9【第一部】「エンジニアの成長戦略 in ブラック」
by
Hiromu Shioya
みんなビックデータビックデータって言ってるけど 名寄せとかどうしてんの?
by
Kazuaki SAKAI
PMフォーラム2011大阪_maekawa_20110731
by
Naoya Maekawa
5年後のデータサイエンティスト
by
Drecom Co., Ltd.
魅せる! How to fascinate audiences by your Lightning Talk
by
Hiromu Shioya
お客様とコードの間
by
Moriyuki Hirata
計量時系列分析の立場からビジネスの現場のデータを見てみよう - 30th Tokyo Webmining
by
Takashi J OZAKI
xDev2010 早い安い新しい「Fast IT」を使いこなせ! クラウドを楽しめるエンジニアの条件
by
Yusuke Suzuki
アジャイルサムライ他流試合 - 道場紹介
by
Kiichi Kajiura
勉強会カンファレンス2011、企業と勉強会
by
Hiro Yoshioka
パタン・ランゲージからプロジェクト・ランゲージへ Part1
by
Takeshi Kakeda
たのしい宿題発表会 〜慣れない言語で車輪の再開発しよう〜
by
Hiromu Shioya
アジャイル×パターン=ぼくたちの現場 イントロダクション
by
Takeshi Kakeda
20130423 #devlove 職場を劇的にさせる四十八手 —「n次請けSIerでも出来ること」のその続き—
by
陽一 滝川
デブサミ2013の明後日な楽しみ方
by
陽一 滝川
20140925ついうっかりよさようなら
by
kishitaku
米国のスマートフォンアプリ市場とプロモーション
by
Hiromitsu Ishimori
リーンスタートアップを実践してのこれまでとこれから
by
Yoshihito Kuranuki
小さな幸せの集め方ForDevLOVE
by
Yuji Tomiyama
とべとべ vol.9【第一部】「エンジニアの成長戦略 in ブラック」
by
Hiromu Shioya
Similar to 第3回集合知プログラミング勉強会 #TokyoCI グループを見つけ出す
PDF
Newman アルゴリズムによるソーシャルグラフのクラスタリング
by
Atsushi KOMIYA
PDF
データマイニング勉強会3
by
Yohei Sato
PPTX
[機械学習]文章のクラス分類
by
Tetsuya Hasegawa
PDF
各言語の k-means 比較
by
y-uti
PDF
Datamining 8th Hclustering
by
sesejun
PDF
クラスタリングとレコメンデーション資料
by
洋資 堅田
PDF
PFI Christmas seminar 2009
by
Preferred Networks
PPTX
距離とクラスタリング
by
大貴 末廣
PPT
Tokyo r#10 Rによるデータサイエンス 第五章:クラスター分析
by
hnisiji
PDF
Cluster Analysis at REQUIRE 26, 2016/10/01
by
Shuhei Ichikawa
PDF
距離まとめられませんでした
by
Haruka Ozaki
PDF
線形回帰と階層的クラスタリングの実装
by
Yuya Takashina
PDF
Pfi last seminar
by
Hidekazu Oiwa
PPTX
集合知プログラミング輪講 第3章復習資料
by
Yoshiomi Kurisu
PDF
はじパタLT2
by
Tadayuki Onishi
PDF
DS Exercise Course 4
by
大貴 末廣
PDF
Datamining 5th knn
by
sesejun
PDF
はじパタLT3
by
Tadayuki Onishi
PDF
SSA-SOINN
by
SOINN Inc.
PDF
T08
by
anonymousouj
Newman アルゴリズムによるソーシャルグラフのクラスタリング
by
Atsushi KOMIYA
データマイニング勉強会3
by
Yohei Sato
[機械学習]文章のクラス分類
by
Tetsuya Hasegawa
各言語の k-means 比較
by
y-uti
Datamining 8th Hclustering
by
sesejun
クラスタリングとレコメンデーション資料
by
洋資 堅田
PFI Christmas seminar 2009
by
Preferred Networks
距離とクラスタリング
by
大貴 末廣
Tokyo r#10 Rによるデータサイエンス 第五章:クラスター分析
by
hnisiji
Cluster Analysis at REQUIRE 26, 2016/10/01
by
Shuhei Ichikawa
距離まとめられませんでした
by
Haruka Ozaki
線形回帰と階層的クラスタリングの実装
by
Yuya Takashina
Pfi last seminar
by
Hidekazu Oiwa
集合知プログラミング輪講 第3章復習資料
by
Yoshiomi Kurisu
はじパタLT2
by
Tadayuki Onishi
DS Exercise Course 4
by
大貴 末廣
Datamining 5th knn
by
sesejun
はじパタLT3
by
Tadayuki Onishi
SSA-SOINN
by
SOINN Inc.
T08
by
anonymousouj
第3回集合知プログラミング勉強会 #TokyoCI グループを見つけ出す
1.
集合知 プログラミング #3 グループを見つけ出す (前半) 2012.10.30 集合知プログラミング勉強会
#TokyoCI @komiya_atsushi https://github.com/komiya-atsushi/TokyoCI-study
2.
Supervised
and Unsupervised learning Photo by cybrarian77 http://www.flickr.com/photos/cybrarian77/6284181389/
3.
教師あり学習 •「正解」が明らかになっている入力 データをもとにモデルを構築する(学 習) •「正解」があるが、明らかになってい
ないデータを入力として、「正解」を 予測する
4.
教師あり学習 •「正解」が明らかになっている入力 データをもとにモデルを構築する(学 習) •「正解」があるが、明らかになってい
ないデータを入力として、「正解」を 予測する データを『分類』したり 結果を『予測』する
5.
教師なし学習 •「正解」が存在しない •データをごにょごにょして「なにか」 を見つける
6.
教師なし学習 •「正解」が存在しない •データをごにょごにょして「なにか」 を見つける
データ全体の『特徴』や 『特性』を明らかにする
7.
目的・問題に応じて使いわけよう •「がく」の長さと幅、そして「花弁」 の長さと幅から既知のアヤメの種類を 判別してくれる高精度な分類器が欲し
いなあ… •うちの EC サイトで商品を買ってくれ る人たちって、どんな傾向の人が多い んだろう?
8.
目的・問題に応じて使いわけよう •「がく」の長さと幅、そして「花弁」 の長さと幅から既知のアヤメの種類を 判別してくれる高精度な分類器が欲し
いなあ… •うちの EC サイトで商品を買ってくれ 教師あり学習向き る人たちって、どんな傾向の人が多い んだろう?
9.
目的・問題に応じて使いわけよう •「がく」の長さと幅、そして「花弁」 の長さと幅から既知のアヤメの種類を
教師なし学習向き 判別してくれる高精度な分類器が欲し いなあ… •うちの EC サイトで商品を買ってくれ る人たちって、どんな傾向の人が多い んだろう?
10.
教師あり学習と教師なし学習の例 •教師あり •ニューラルネットワーク、決定木、サ
ポートベクトルマシン、ベイジアンフィ ルタなど •教師なし •クラスタリング、非負値行列因子分解、 自己組織化マップなど
11.
教師あり学習と教師なし学習の例 •教師あり •ニューラルネットワーク、決定木、サ
ポートベクトルマシン、ベイジアンフィ ルタなど •教師なし •クラスタリング、非負値行列因子分解、 自己組織化マップなど
12.
Clustering Photo by tjuel
http://www.flickr.com/photos/tjuel/5805997664/
13.
クラスタリング 概要 •「似たもの同士でグループにしてみま しょう」
14.
クラスタリング 概要 •「似たもの同士でグループにしてみま しょう」
15.
クラスタリング 概要 •「似たもの同士でグループにしてみま しょう」
16.
クラスタリング 概要 •「似たもの同士でグループにしてみま しょう」
色が同じ
17.
クラスタリング 概要 •「似たもの同士でグループにしてみま しょう」
18.
クラスタリング 概要 •「似たもの同士でグループにしてみま しょう」
形が同じ
19.
クラスタリングに必要な「もの」 •データをよく表現する「特徴」 •【例】
• 人:年齢、伸長、体重、性別… •似ているかどうかを判断する/測る 「ものさし」 •「類似度」のこと •ピアソン相関係数、コサイン類似度、 Jaccard 係数…
20.
クラスタリングの手順 どのように進めていくのか? 1. 個々のデータから「特徴ベクトル」
を抽出する 2. ふたつの「特徴ベクトル」間の 「距離・類似度」を計算する 3. 距離・類似度の近いものをまとめる
21.
問題設定と準備 Photo by kakissel
http://www.flickr.com/photos/kakissel/7182285229/
22.
書籍中での問題設定(前半) •「ブログサイト」を一つ一つのデータ と見立てる •ブログ中で使われている単語の傾向で ブログをクラスタリングしてみる
•ブログエントリ中に出てくる単語の 「出現回数」からなる特徴ベクトルを 用意する
23.
準備 •feedparser を使って、100ほどのサイトの RSS
フィードを取得する •取得したフィードから単語を抽出し、かつ 出現回数をカウントする •ブログのサイト名とともに、出現回数を特 徴ベクトルとしてファイル出力する •ソースコード • http://goo.gl/Pn6aS (generatefeedvector.py)
24.
Hierarchical
Clustering Photo by pretendtious http://www.flickr.com/photos/27273053@N05/4646753786/
25.
階層的クラスタリング •そのときもっともよく似ているものを2つ くっつけましょう 1.
すべての2つの特徴ベクトルの組み合わせ について、 2. 距離が最小となるものを選び、 3. 一つの新たなグループとする 4. 特徴ベクトルは二者の平均とする • 上記をグループがひとつになるまで繰り返す
26.
階層的クラスタリング
C D E A B 平面上の距離の近さを「類似度」とします
27.
階層的クラスタリング
C D E A B 平面上の距離の近さを「類似度」とします
28.
階層的クラスタリング
C D E A B 平面上の距離の近さを「類似度」とします
29.
階層的クラスタリング
C D E A B 平面上の距離の近さを「類似度」とします
30.
階層的クラスタリング
C D E A B 平面上の距離の近さを「類似度」とします
31.
デンドログラム
A B C D E A B C D E
32.
階層的クラスタリングの実装 •距離関数を用意する
33.
階層的クラスタリングの実装 •距離関数を用意する
34.
階層的クラスタリングの実装 • 距離計算→最小距離の2つをマージ…を繰り返す
35.
階層的クラスタリングの実装 • 距離計算→最小距離の2つをマージ…を繰り返す ソースコード https://github.com/komiya-atsushi/TokyoCI-study/blob/master/chap.3/clusters.py
36.
階層的クラスタリングのデモ
demo
37.
k-Means Clustering
38.
k-means(k平均法) •クラスタの数 k を事前に決める •最初にランダムに
k 個の重心を配置する 1. データを最寄りの重心に割り当てる 2. 重心に割り当てられたデータの平均を、 次の重心とする •上記を重心が収束するか、一定回数繰り返 したところで終了する
39.
すばらしいオンラインデモが! http://tech.nitoyon.com/ja/blog/2009/04/09/kmeans-visualise/
40.
k-Means の実装 ソースコード https://github.com/komiya-atsushi/TokyoCI-study/blob/master/chap.3/clusters.py
41.
Thanks !
& Any questions? Photo by tjuel http://www.flickr.com/photos/tjuel/5805421265/
42.
おまけ
43.
Emacs で Python
コードを書きたい方へ https://github.com/komiya-atsushi/TokyoCI-study/blob/master/EmacsPythonEnvironment.md