Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Takashi J OZAKI
6,303 views
『手を動かしながら学ぶ ビジネスに活かすデータマイニング』で目指したもの・学んでもらいたいもの
2014/10/22に社内で行った講演会のスライドです。
Data & Analytics
◦
Related topics:
Data Science Insights
•
Read more
33
Save
Share
Embed
Embed presentation
1
/ 74
2
/ 74
3
/ 74
4
/ 74
5
/ 74
6
/ 74
7
/ 74
8
/ 74
9
/ 74
10
/ 74
11
/ 74
12
/ 74
13
/ 74
14
/ 74
15
/ 74
16
/ 74
17
/ 74
18
/ 74
19
/ 74
20
/ 74
21
/ 74
22
/ 74
23
/ 74
24
/ 74
25
/ 74
26
/ 74
27
/ 74
28
/ 74
29
/ 74
30
/ 74
31
/ 74
32
/ 74
33
/ 74
34
/ 74
35
/ 74
36
/ 74
37
/ 74
38
/ 74
39
/ 74
40
/ 74
41
/ 74
42
/ 74
43
/ 74
44
/ 74
45
/ 74
46
/ 74
47
/ 74
48
/ 74
49
/ 74
50
/ 74
51
/ 74
52
/ 74
53
/ 74
54
/ 74
55
/ 74
56
/ 74
57
/ 74
58
/ 74
59
/ 74
60
/ 74
61
/ 74
62
/ 74
63
/ 74
64
/ 74
65
/ 74
66
/ 74
67
/ 74
68
/ 74
69
/ 74
70
/ 74
71
/ 74
72
/ 74
73
/ 74
74
/ 74
More Related Content
PDF
なぜ統計学がビジネスの 意思決定において大事なのか?
by
Takashi J OZAKI
PDF
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
by
Hajime Sasaki
PDF
「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る
by
Takashi J OZAKI
PDF
おしゃスタ@リクルート
by
Issei Kurahashi
PDF
データサイエンティスト養成勉強会 こんな僕がデータサイエンティストになれた秘密
by
Ryo Matsuura
PDF
(道具としての)データサイエンティストのつかい方
by
Shohei Hido
PDF
計量経済学と 機械学習の交差点入り口 (公開用)
by
Shota Yasui
PDF
いまさら聞けない機械学習の評価指標
by
圭輔 大曽根
なぜ統計学がビジネスの 意思決定において大事なのか?
by
Takashi J OZAKI
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
by
Hajime Sasaki
「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る
by
Takashi J OZAKI
おしゃスタ@リクルート
by
Issei Kurahashi
データサイエンティスト養成勉強会 こんな僕がデータサイエンティストになれた秘密
by
Ryo Matsuura
(道具としての)データサイエンティストのつかい方
by
Shohei Hido
計量経済学と 機械学習の交差点入り口 (公開用)
by
Shota Yasui
いまさら聞けない機械学習の評価指標
by
圭輔 大曽根
What's hot
PPTX
【スクー】業務改善のためのデータサイエンス
by
Issei Kurahashi
PDF
おしゃスタat銀座
by
Issei Kurahashi
PDF
データサイエンティスト協会 木曜勉強会 #09 『意志の力が拓くシステム~最適化の適用事例から見たデータ活用システムの現在と未来~』
by
The Japan DataScientist Society
PDF
TokyoWebmining統計学部 第1回
by
Issei Kurahashi
PDF
何故あなたの機械学習はビジネスを改善出来ないのか?
by
Shota Yasui
PDF
機械学習によるデータ分析まわりのお話
by
Ryota Kamoshida
PDF
データ分析というお仕事のこれまでとこれから(HCMPL2014)
by
Takashi J OZAKI
PDF
データサイエンスの全体像
by
The Japan DataScientist Society
PDF
セレンディピティと機械学習
by
Kei Tateno
PDF
機械学習チュートリアル@Jubatus Casual Talks
by
Yuya Unno
PPTX
強化学習エージェントの内発的動機付けによる探索とその応用(第4回 統計・機械学習若手シンポジウム 招待公演)
by
Shota Imai
PDF
[DSO]勉強会_データサイエンス講義_Chapter8
by
tatsuyasakaeeda
PDF
ビジネスの現場のデータ分析における理想と現実
by
Takashi J OZAKI
PPTX
重回帰分析で頑張る
by
Shota Yasui
PDF
機械学習 入門
by
Hayato Maki
PDF
データサイエンスの全体像とデータサイエンティスト
by
The Japan DataScientist Society
PDF
DARM勉強会第3回 (missing data analysis)
by
Masaru Tokuoka
PDF
20190721 gaussian process
by
Yoichi Tokita
PPTX
機械学習 / Deep Learning 大全 (1) 機械学習基礎編
by
Daiyu Hatakeyama
PDF
[DSO]勉強会_データサイエンス講義_Chapter5
by
tatsuyasakaeeda
【スクー】業務改善のためのデータサイエンス
by
Issei Kurahashi
おしゃスタat銀座
by
Issei Kurahashi
データサイエンティスト協会 木曜勉強会 #09 『意志の力が拓くシステム~最適化の適用事例から見たデータ活用システムの現在と未来~』
by
The Japan DataScientist Society
TokyoWebmining統計学部 第1回
by
Issei Kurahashi
何故あなたの機械学習はビジネスを改善出来ないのか?
by
Shota Yasui
機械学習によるデータ分析まわりのお話
by
Ryota Kamoshida
データ分析というお仕事のこれまでとこれから(HCMPL2014)
by
Takashi J OZAKI
データサイエンスの全体像
by
The Japan DataScientist Society
セレンディピティと機械学習
by
Kei Tateno
機械学習チュートリアル@Jubatus Casual Talks
by
Yuya Unno
強化学習エージェントの内発的動機付けによる探索とその応用(第4回 統計・機械学習若手シンポジウム 招待公演)
by
Shota Imai
[DSO]勉強会_データサイエンス講義_Chapter8
by
tatsuyasakaeeda
ビジネスの現場のデータ分析における理想と現実
by
Takashi J OZAKI
重回帰分析で頑張る
by
Shota Yasui
機械学習 入門
by
Hayato Maki
データサイエンスの全体像とデータサイエンティスト
by
The Japan DataScientist Society
DARM勉強会第3回 (missing data analysis)
by
Masaru Tokuoka
20190721 gaussian process
by
Yoichi Tokita
機械学習 / Deep Learning 大全 (1) 機械学習基礎編
by
Daiyu Hatakeyama
[DSO]勉強会_データサイエンス講義_Chapter5
by
tatsuyasakaeeda
Viewers also liked
PDF
Deep Learningと他の分類器をRで比べてみよう in Japan.R 2014
by
Takashi J OZAKI
PDF
Taste of Wine vs. Data Science
by
Takashi J OZAKI
PDF
Granger因果による時系列データの因果推定(因果フェス2015)
by
Takashi J OZAKI
PDF
直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する
by
Takashi J OZAKI
PDF
最新業界事情から見るデータサイエンティストの「実像」
by
Takashi J OZAKI
PDF
Jc 20141003 tjo
by
Takashi J OZAKI
PDF
Visualization of Supervised Learning with {arules} + {arulesViz}
by
Takashi J OZAKI
PDF
計量時系列分析の立場からビジネスの現場のデータを見てみよう - 30th Tokyo Webmining
by
Takashi J OZAKI
PDF
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
by
Takashi J OZAKI
PPTX
21世紀で最もセクシーな職業!?「データサイエンティスト」の実像に迫る
by
Takashi J OZAKI
PDF
Rで計量時系列分析~CRANパッケージ総ざらい~
by
Takashi J OZAKI
PDF
Tech Lab Paak講演会 20150601
by
Takashi J OZAKI
PDF
R言語で学ぶマーケティング分析 競争ポジショニング戦略
by
Yohei Sato
PPTX
Simple perceptron by TJO
by
Takashi J OZAKI
PPT
Wab090225a
by
サイバーエリアリサーチ 株式会社
PDF
【Inception-Deck】野球Hack! - Pythonを用いたデータ分析と可視化
by
Shinichi Nakagawa
PDF
行動ターゲティングと嗜好推測
by
Ken Yasumatsu
PDF
第1回多変量解析・標本調査勉強会
by
t_inaba_zemi
PPT
楽天ad4U 行動スキミング広告
by
rakuten
PPTX
潜在トピックとネットワーク分析
by
s tanaka
Deep Learningと他の分類器をRで比べてみよう in Japan.R 2014
by
Takashi J OZAKI
Taste of Wine vs. Data Science
by
Takashi J OZAKI
Granger因果による時系列データの因果推定(因果フェス2015)
by
Takashi J OZAKI
直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する
by
Takashi J OZAKI
最新業界事情から見るデータサイエンティストの「実像」
by
Takashi J OZAKI
Jc 20141003 tjo
by
Takashi J OZAKI
Visualization of Supervised Learning with {arules} + {arulesViz}
by
Takashi J OZAKI
計量時系列分析の立場からビジネスの現場のデータを見てみよう - 30th Tokyo Webmining
by
Takashi J OZAKI
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
by
Takashi J OZAKI
21世紀で最もセクシーな職業!?「データサイエンティスト」の実像に迫る
by
Takashi J OZAKI
Rで計量時系列分析~CRANパッケージ総ざらい~
by
Takashi J OZAKI
Tech Lab Paak講演会 20150601
by
Takashi J OZAKI
R言語で学ぶマーケティング分析 競争ポジショニング戦略
by
Yohei Sato
Simple perceptron by TJO
by
Takashi J OZAKI
Wab090225a
by
サイバーエリアリサーチ 株式会社
【Inception-Deck】野球Hack! - Pythonを用いたデータ分析と可視化
by
Shinichi Nakagawa
行動ターゲティングと嗜好推測
by
Ken Yasumatsu
第1回多変量解析・標本調査勉強会
by
t_inaba_zemi
楽天ad4U 行動スキミング広告
by
rakuten
潜在トピックとネットワーク分析
by
s tanaka
Similar to 『手を動かしながら学ぶ ビジネスに活かすデータマイニング』で目指したもの・学んでもらいたいもの
PPTX
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで
by
Shunsuke Nakamura
PDF
全部見せます、データサイエンティストの仕事
by
Shunsuke Nakamura
PDF
20180807_全部見せます、データサイエンティストの仕事
by
Shunsuke Nakamura
PDF
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V k-1
by
Shunsuke Nakamura
PDF
あなたの業務に機械学習を活用する5つのポイント
by
Shohei Hido
PDF
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性
by
BrainPad Inc.
PPTX
20181219_全部見せます、データサイエンティストの仕事
by
Shunsuke Nakamura
PDF
マーケティングサイエンス徹底入門と実践Part2
by
宏喜 佐野
PPTX
【schoo WEB-campus】#49業務改善のためのデータサイエンス 先生:倉橋一成
by
webcampusschoo
PDF
SAS Viya Deep Dive: 予測モデリング
by
SAS Institute Japan
PPTX
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V6
by
Shunsuke Nakamura
PDF
ビジネス活用事例で学ぶデータサイエンス入門 #6
by
you shimajiro
PPTX
「ビジネス活用事例で学ぶ データサイエンス入門」輪読会#7資料
by
Shintaro Nomura
PPTX
ディープラーニングによるユーザーの行動予測
by
澪標アナリティクス
PDF
分析のリアルがここに!現場で使えるデータ分析
by
webcampusschoo
PDF
確率統計-機械学習その前に v2.0
by
Hidekatsu Izuno
PDF
20120326 zansa勉強会発表資料 (公開用) 02 04-38
by
tetsuro ito
PDF
Webマーケティングを通じたデータサイエンティストの価値発揮方法
by
E2D3.org
PDF
tut_pfi_2012
by
Preferred Networks
PDF
東大計数特別講義20130528
by
Yoichi Motomura
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで
by
Shunsuke Nakamura
全部見せます、データサイエンティストの仕事
by
Shunsuke Nakamura
20180807_全部見せます、データサイエンティストの仕事
by
Shunsuke Nakamura
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V k-1
by
Shunsuke Nakamura
あなたの業務に機械学習を活用する5つのポイント
by
Shohei Hido
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性
by
BrainPad Inc.
20181219_全部見せます、データサイエンティストの仕事
by
Shunsuke Nakamura
マーケティングサイエンス徹底入門と実践Part2
by
宏喜 佐野
【schoo WEB-campus】#49業務改善のためのデータサイエンス 先生:倉橋一成
by
webcampusschoo
SAS Viya Deep Dive: 予測モデリング
by
SAS Institute Japan
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V6
by
Shunsuke Nakamura
ビジネス活用事例で学ぶデータサイエンス入門 #6
by
you shimajiro
「ビジネス活用事例で学ぶ データサイエンス入門」輪読会#7資料
by
Shintaro Nomura
ディープラーニングによるユーザーの行動予測
by
澪標アナリティクス
分析のリアルがここに!現場で使えるデータ分析
by
webcampusschoo
確率統計-機械学習その前に v2.0
by
Hidekatsu Izuno
20120326 zansa勉強会発表資料 (公開用) 02 04-38
by
tetsuro ito
Webマーケティングを通じたデータサイエンティストの価値発揮方法
by
E2D3.org
tut_pfi_2012
by
Preferred Networks
東大計数特別講義20130528
by
Yoichi Motomura
『手を動かしながら学ぶ ビジネスに活かすデータマイニング』で目指したもの・学んでもらいたいもの
1.
『手を動かしながら学ぶ ビジネスに活かす データマイニング』で目指したもの・学んで
もらいたいもの 株式会社リクルートコミュニケーションズ ICTソリューション局 アドテクノロジーサービス開発部 尾崎 隆
2.
本日のお題 最近本を出しました
3.
内容はこんな感じです 1.データマイニングとは 2.Rを使ってみよう
3.その2つのデータ,本当に差があるの? ~仮説検定~ 4.ビールの生産計画を立てよう ~重回帰分析~ 5.自社サービス登録会員をグループ分けしてみよう ~クラスタリング~ 6.コンバージョン率を引き上げる要因はどこに? ~ロジスティック回帰~ 7.どのキャンペーンページが効果的だったのか? ~決定木~ 8.新規ユーザーの属性データから今後のアクティブユーザー数を予測しよう ~SVM/ランダムフォレスト~ 9.ECサイトの購入カテゴリデータから何が見える? ~アソシエーション 分析~ 10.Rでさらに広がるデータマイニングの世界 ~その他の分析メソッドにつ いて~
4.
内容はこんな感じです 1.データマイニングとは 2.Rを使ってみよう
3.その2つのデータ,本当に差があるの? ~仮説検定~ 4.ビールの生産計画を立てよう ~重回帰分析~ 5.自社サービス登録会員をグループ分けしてみよう ~クラスタリング~ 6.コンバージョン率を引き上げる要因はどこに? ~ロジスティック回帰~ 7.どのキャンペーンページが効果的だったのか? ~決定木~ 8.新規ユーザーの属性データから今後のアクティブユーザー数を予測しよう ~SVM/ランダムフォレスト~ 9.ECサイトの購入カテゴリデータから何が見える? ~アソシエーション 分析~ 10.Rでさらに広がるデータマイニングの世界 ~その他の分析メソッドにつ いて~
5.
内容はこんな感じです 1.データマイニングとは 2.Rを使ってみよう
3.その2つのデータ,本当に差があるの? ~仮説検定~ 4.ビールの生産計画を立てよう ~重回帰分析~ 5.自社サービス登録会員をグループ分けしてみよう ~クラスタリング~ 6.コンバージョン率を引き上げる要因はどこに? ~ロジスティック回帰~ 7.どのキャンペーンページが効果的だったのか? ~決定木~ 8.新規ユーザーの属性データから今後のアクティブユーザー数を予測しよう ~SVM/ランダムフォレスト~ 9.ECサイトの購入カテゴリデータから何が見える? ~アソシエーション 分析~ 10.Rでさらに広がるデータマイニングの世界 ~その他の分析メソッドにつ いて~ データマイニングとRの紹介
6.
内容はこんな感じです 1.データマイニングとは 2.Rを使ってみよう
3.その2つのデータ,本当に差があるの? ~仮説検定~ 4.ビールの生産計画を立てよう ~重回帰分析~ 5.自社サービス登録会員をグループ分けしてみよう ~クラスタリング~ 6.コンバージョン率を引き上げる要因はどこに? ~ロジスティック回帰~ 7.どのキャンペーンページが効果的だったのか? ~決定木~ 8.新規ユーザーの属性データから今後のアクティブユーザー数を予測しよう ~SVM/ランダムフォレスト~ 9.ECサイトの購入カテゴリデータから何が見える? ~アソシエーション 分析~ 10.Rでさらに広がるデータマイニングの世界 ~その他の分析メソッドにつ いて~ 統計学の基礎と応用
7.
内容はこんな感じです 1.データマイニングとは 2.Rを使ってみよう
3.その2つのデータ,本当に差があるの? ~仮説検定~ 4.ビールの生産計画を立てよう ~重回帰分析~ 5.自社サービス登録会員をグループ分けしてみよう ~クラスタリング~ 6.コンバージョン率を引き上げる要因はどこに? ~ロジスティック回帰~ 7.どのキャンペーンページが効果的だったのか? ~決定木~ 8.新規ユーザーの属性データから今後のアクティブユーザー数を予測しよう ~SVM/ランダムフォレスト~ 9.ECサイトの購入カテゴリデータから何が見える? ~アソシエーション 分析~ 10.Rでさらに広がるデータマイニングの世界 ~その他の分析メソッドにつ いて~ 機械学習の基礎と応用
8.
内容はこんな感じです 1.データマイニングとは 2.Rを使ってみよう
3.その2つのデータ,本当に差があるの? ~仮説検定~ 4.ビールの生産計画を立てよう ~重回帰分析~ 5.自社サービス登録会員をグループ分けしてみよう ~クラスタリング~ 6.コンバージョン率を引き上げる要因はどこに? ~ロジスティック回帰~ 7.どのキャンペーンページが効果的だったのか? ~決定木~ 8.新規ユーザーの属性データから今後のアクティブユーザー数を予測しよう ~SVM/ランダムフォレスト~ 9.ECサイトの購入カテゴリデータから何が見える? ~アソシエーション 分析~ 10.Rでさらに広がるデータマイニングの世界 ~その他の分析メソッドにつ いて~ 古典的データマイニングと発展的課題
9.
しかし… 解説がないと、やさしく見えて 意外と難しい本だという声多数
思ったより 難しくね? 初心者向け にしては… 後半は結構 難しいよー
10.
そこで…
11.
そこで…
12.
最初に踏まえるべき最も基礎的なポイント 統計学は何をするもの? 機械学習は何をするもの?
13.
最初に踏まえるべき最も基礎的なポイント 統計学は何をするもの?
14.
最初に踏まえるべき最も基礎的なポイント 統計学は何をするもの? •例えば…
•そもそも「集計」とはどう違うのか? •統計学を使わなければ分からないことは あるのか?
15.
「集計」と「統計学的分析」の違い CVユーザー数の時系列 3種の広告投下額の時系列
こんなデータが あるとする
16.
「集計」と「統計学的分析」の違い 7日ごと(週次)に平均値を集計してプロットした 結果からは、何となくトレンドが見えるがイマイチ
はっきりしない
17.
本当にそれだけ分かればいいの?
18.
ちなみに…
19.
「集計」と「統計学的分析」の違い (線形)重回帰分析を行っても、トレンドが説明できない
20.
「集計」と「統計学的分析」の違い ベイジアンモデリングで二階トレンドつきモデルをやってみる (※動的線形モデルならもっと簡単にやれます&単に将来の発展に備えてMCサンプラー入れただけです)
広告予算1 広告予算2 広告予算3 日次 CV数 a b c 正規線形モデル オフセット項d 累積トレンド項 cum_trend + ベイジアン モデリング トレンド項trend Σ
21.
「集計」と「統計学的分析」の違い 3種類の広告それぞれの 効果の比
相関係数 0.99 階層ベイズモデルにより、トレンドを表現した上で正確にモデリング ※サンプルデータ作る時にノイズ乗せ忘れましたごめんなさい
22.
「集計」と「統計学的分析」の違い トレンド自体が時期ごとで変化している様子 までもがモデリングされる
相関係数 0.99
23.
「集計」と「統計学的分析」の違い 統計学は何をするもの?
24.
「集計」と「統計学的分析」の違い 統計学は何をするもの? 「集計」では分からないような、
ノイズに埋もれた「真の値」を推定 するためのもの
25.
最初に踏まえるべき最も基礎的なポイント 統計学は何をするもの? 機械学習は何をするもの?
26.
最初に踏まえるべき最も基礎的なポイントagain 機械学習は何をするもの?
27.
最初に踏まえるべき最も基礎的なポイントagain 機械学習は何をするもの? •例えば…
•普通にコード書いて処理するのとは どう違うのか? •そもそも「何」を学習するのか?
28.
28 分かりやすいパーセプトロンを例に
29.
「学習する」ということ •例えば識別モデル系であれば「識別関数」 の値の大小で分類する。
푦=풘푇풙 29
30.
「学習する」ということ •例えば識別モデル系であれば「識別関数」 の値の大小で分類する。
푦=풘푇풙 30 返値 (「±の符号」が大事!) 重みベクトル (こいつが学習結果) 入力信号 (これから識別したいもの)
31.
「学習する」ということ •「識別関数」の値の大小で分類するとは どういうこと?
푦=풘푇풙 31
32.
「学習する」ということ •識別関数から見て「どちら側か」で分類 するということ
푦=풘푇풙 32
33.
「学習する」ということ •例としてここではメールのSPAM判定を 想定する。
푦=풘푇풙 33 返値 (正なら非SPAM 負ならSPAM) 重みベクトル 入力信号 (メールの単語頻度)
34.
「学習する」ということ •まず、入力信号の例。 「メールの単語頻度」と仮定する。
풙= 「会議」という語の数 「目標」という語の数 「お買い得」という語の数 = 210 34
35.
「学習する」ということ •次に、重み信号の例。 풘=
푤1 푤2 푤3= 11−1 35
36.
「学習する」ということ •次に、重み信号の例。 풘=
푤1 푤2 푤3= 11−1 36 「会議」は非SPAM 「目標」は非SPAM 「お買い得」はSPAM
37.
「学習する」ということ •そこで識別関数を計算してみる。 풚=풘푇풙=11−1210=3
これは非SPAMだ! 37
38.
「学習する」ということ •ところが、SPAMじゃないはずなのにこう いうメールが来たら?
풙= 「会議」という語の数 「目標」という語の数 「お買い得」という語の数 = 113 38
39.
「学習する」ということ •識別関数を計算してみると… 풚=풘푇풙=11−1113=−1
あれ?非SPAMのはずなのに SPAM判定だ! 39
40.
「学習する」ということ •識別関数を計算してみると… 풚=풘푇풙=11−1113=−1
あれ?非SPAMのはずなのに SPAM判定だ! これは重みベクトルを変えなきゃ! 40
41.
「学習する」ということ •そこで、重み信号を以下のように更新する。 풘풏풆풘=풘표푙푑+휇
113= 11−1+ 휇 휇 3휇 = 1+휇 1+휇 −1+3휇 (휇は学習係数) 41 誤判定した時の入力信号の値
42.
「学習する」ということ •例えば学習係数휇が0.2なら… 풘풏풆풘=
1+휇 1+휇 −1+3휇 = 1.21.2−0.4 42
43.
「学習する」ということ •改めて同じ入力信号で識別関数を計算して みると…
풚=풘푇풙=1.21.2−0.4113=1.2 非SPAMだと正しく判定された! 43
44.
「学習する」ということ •改めて同じ入力信号で識別関数を計算して みると…
풚=풘푇풙=1.21.2−0.4113=1.2 非SPAMだと正しく判定された! こんな感じでパーセプトロンは学習していく。 44
45.
最初に踏まえるべき最も基礎的なポイントagain 機械学習は何をするもの?
46.
最初に踏まえるべき最も基礎的なポイントagain 機械学習は何をするもの? 学習データに基づいてパラメータ
を順次変えていくことで自動的に (例えば)分類するもの
47.
ここからは拙著の各章のポイントを 駆け足で紹介します
48.
第1章 データマイニングとは
49.
第1章 データマイニングとは 「分布」の概念を
覚えましょう!
50.
第2章 Rを使ってみよう
51.
第2章 Rを使ってみよう 1.Linuxへのインストールはしんどいかも…。
2.コーディング苦手でも大丈夫です。ここで forとifを取り上げていますが、実はこの後 一度もforもifも出てきません。
52.
第3章 その2つのデータ、 本当に差があるの?
~仮説検定~
53.
第3章 仮説検定 表3-2
表3-3 真の分布をシミュレート してみると、A/Bテスト の「集計値」を鵜呑みに してはいけないことが分 かります。 特に大事なのが、 カイ二乗検定と A/Bテストの下り。
54.
第4章 ビールの生産計画 を立てよう
~重回帰分析~
55.
第4章 重回帰分析 푓(푦푖)~훽0+훽1푥1푖+훽2푥2푖+훽3푥3푖+훽4푥4푖+⋯훽푛푥푛푖
CV数を適切に数理的に変換 してモデルの精度を上げる 102 78 91 84 110 CV数 1 2 0 1 3 広告1 3 0 2 1 4 広告2 0 1 0 0 1 広告3 2 1 2 1 2 広告4 1 3 3 2 3 広告n このβたちを推定する
56.
第4章 重回帰分析 푓(푦푖)←훽0+훽1푥1푖+훽2푥2푖+훽3푥3푖+훽4푥4푖+⋯훽푛푥푛푖
CV数を適切に数理的に変換 してモデルの精度を上げる 105 予測CV数 1 広告1 4 広告2 0 広告3 2 広告4 3 広告n このβたちから逆に CV数を予測できる 事前に計画された広告出稿計画
57.
第5章 自社サービス登録 会員をグループ分け
してみよう ~クラスタリング~
58.
第5章 クラスタリング ここでは「似ている・
似ていない」を表す 「距離」という考え方 への理解が大事。 これさえ分かればどの クラスタリングについ てもイメージを思い描 くことができるはず。
59.
第6章 コンバージョン率を 引き上げる要因は
どこに? ~ロジスティック回帰~
60.
第6章 ロジスティック回帰 푓(푦푖)~훽0+훽1푥1푖+훽2푥2푖+훽3푥3푖+훽4푥4푖+⋯훽푛푥푛푖
CVRを適切に数理 的に変換してモデル の精度を上げる 0.2 0.01 0 0.02 0.3 CVR 1 2 0 1 3 広告1 3 0 2 1 4 広告2 0 1 0 0 1 広告3 2 1 2 1 2 広告4 1 3 3 2 3 広告n このβたちを推定する
61.
第6章 ロジスティック回帰 直線(いわゆる普通の重回帰分析)
では当てはまらないからこそ、ここ で学ぶ一般化線形モデル(ロジス ティック回帰)を使うということへ の理解が大事。 一般化線形モデル全体 については難解なので 第10章で軽くまとめて あります。
62.
第7章 どのキャンペーンページが 効果的だったのか?
~決定木~
63.
第7章 決定木 非常に簡単な構造の機械学習で、なおかつ計算負荷も軽
いということを知っておけば概ねOK。
64.
第8章 新規ユーザーの属性データ から今後のアクティブ
ユーザー数を予測しよう ~SVM/ ランダムフォレスト~
65.
第8章 SVM /
ランダムフォレスト マージン最大化 カーネルトリック 2つの基礎を 組み合わせた ものがSVM
66.
第8章 SVM /
ランダムフォレスト ランダムフォレスト =決定木+相関低減バギング
67.
第9章 ECサイトの購入カテゴリ データから何が見える?
~アソシエーション分析~
68.
第9章 アソシエーション分析 Support
Confidence Lift とっつきにくいかもしれませんが、 これだけは覚えてください。
69.
第9章 アソシエーション分析 本命はこちらのグラフ表現。
データマイニング+アドホック分析の本流。
70.
第10章 Rでさらに広がる データマイニングの世界
~その他の分析メソッドに ついて~
71.
第10章 その他のデータ分析メソッドについて この章は完全に
尾崎の趣味なので 忘れて大丈夫です。
72.
最後に、本書全体を通じて
73.
最後に、本書全体を通じて 発展的内容は、ブログ同様 に出来るだけ脚注やコラム
の形でおさめてあります。 本書の「その先」を目指す には、是非脚注やコラムの 内容にも目を通していただ ければ幸いです。
74.
ということで、 今後本書を題材 にした質疑つき
勉強会が定期的 に開催…される かも?