• Save
Japan r2 tokyor
Upcoming SlideShare
Loading in...5
×

Like this? Share it with your network

Share
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
    Be the first to like this
No Downloads

Views

Total Views
2,297
On Slideshare
1,249
From Embeds
1,048
Number of Embeds
3

Actions

Shares
Downloads
0
Comments
0
Likes
0

Embeds 1,048

http://d.hatena.ne.jp 1,033
http://dl.dropboxusercontent.com 14
http://translate.googleusercontent.com 1

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. 2011年 X.R 活動報告 Tokyo.R @yokkuns Nagoya.R @sakaue Hiroshima.R @sakaue Osaka.R @langstat Tsukuba.R @wakuteka kashiwa.R @tsutatsuta2011年11月28日月曜日
  • 2. AGENDA • Tokyo.R • Nagoya.R & Hiroshima.R • Osaka.R • Tsukuba.R • Kashiwa.R2011年11月28日月曜日
  • 3. Tokyo.R 主催者 @yokkuns2011年11月28日月曜日
  • 4. Tokyo.R AGENDA • 自己紹介 • 2011年のTokyo.R2011年11月28日月曜日
  • 5. Tokyo.R AGENDA • 自己紹介 • 2011年のTokyo.R2011年11月28日月曜日
  • 6. 里 洋平 • ID : @yokkuns • 名前 : 里 洋平 • 職業 : データマイニング エンジニア2011年11月28日月曜日
  • 7. Video Recommendation2011年11月28日月曜日
  • 8. 市場予測2011年11月28日月曜日
  • 9. 活動例(抜粋): Time Series Analysis Anomaly detection 複数時系列から異常な振る舞いを検知する C A 時系列のモデリング 複数時系列の異常検知 B 時系列A 時系列A 異常な振る舞い 時系列B 時系列C 時系列B 時系列C 異常な振る舞いの時系列を検出 例1:トラフィック異常検知 例2:CM効果のノイズ除去 トラフィックA ケースA CM効果 トラフィックB ケースB トラフィックC 調査 ケースC 異常な振る舞いをしている 異常な振る舞いをしているケースを トラフィックの原因を調査する 除外して、CMの効果を算出する 852011年11月28日月曜日
  • 10. 活動例(抜粋): Time Series Analysis Anomaly detection 新しいデータと過去時系列モデルの乖離から異常検出 8000.0000 異常スコア推移 3.0000 モデル構築 異常値 ◇例 : ARIMAモデル 2.2500 5970.7500 1.5000 0.7500 3941.5000 0 異常スコアの算出 -0.7500 ◇例 : 対数損失 1912.2500 -1.5000 -2.2500 -117.0000 -3.0000 t 4/ 週 4/ 1 週 4/ 8 週 5/ 週 2週 5/ 週 5/ 6 週 5/ 3 週 6/ 週 6/ 週 6/ 3 週 6/ 0 週 7/ 週 7/ 週 7/ 1 週 7/ 週 週 4 25 9 30 6 27 4 18 25 4/ 1 1 5/ 1 2 1 2 1 862011年11月28日月曜日
  • 11. 活動例(抜粋): Time Series Analysis TV Commercial Effects 時系列的な振る舞いの特徴から各KPIへのCMの影響度を算出 イベン CM時系列 ト 新規 登録 CM ARPPU ARPU 各KPIの時系列 その他 外部 継続率 要因 ケース 872011年11月28日月曜日
  • 12. Tokyo.R AGENDA • 自己紹介 • 2011年のTokyo.R2011年11月28日月曜日
  • 13. Tokyo.Rとは ◆ 数少ない社会人中心のRコミュニティ ◆ 2010年に設立し、現在第19回まで開催 ◆ 様々な業種•職種の方が参加2011年11月28日月曜日
  • 14. 参加人数推移 参加人数 キャンセル 開催日2011年11月28日月曜日
  • 15. 告知日と参加人数 参加人数 告知日から開催日までの日数2011年11月28日月曜日
  • 16. 告知日と参加人数 参加人数 告知日から開催日までの日数2011年11月28日月曜日
  • 17. 告知日と参加人数 参加人数 上半期 告知日から開催日までの日数2011年11月28日月曜日
  • 18. 告知日と参加人数 パッケージ本 著者サイン会 参加人数 上半期 告知日から開催日までの日数2011年11月28日月曜日
  • 19. 告知日と参加人数 パッケージ本 著者サイン会 参加人数 上半期 告知日から開催日までの日数2011年11月28日月曜日
  • 20. 告知日と参加人数 下半期は パッケージ本 1週間前に告知すれば 著者サイン会 60名水準? 参加人数 上半期 告知日から開催日までの日数2011年11月28日月曜日
  • 21. 発表テーマ • テキスト: Rによるデータサイエンス • 金融・時系列解析 • 計量経済・マーケティング • 機械学習•最適化 • パターン認識 • テキストマイニング • 異常検知 • 大規模データ・高速化 • その他いろいろ2011年11月28日月曜日
  • 22. Rによるデータサイエンス ・第6章 自己組織化マップ ・Rによる回帰分析入門 ・線形判別分析 ・非線形判別の勉強をしてみました ・テキスト第11章 生存分析 ・第12章「時系列」 ・第13章「樹木モデル」 ・第14章 ニューラルネットワーク2011年11月28日月曜日
  • 23. 金融・時系列解析 • Rで学ぶ回帰分析と単位根検定 • xtsパッケージで時系列解析 • Rで学ぶ現代ポートフォリオ理論 • デリバティブについて2011年11月28日月曜日
  • 24. 計量経済・マーケティング • Rで学ぶ傾向スコア解析入門 • Rによる計量経済学入門 • Rで計量経済 (操作変数を使ったバイアス調整)2011年11月28日月曜日
  • 25. 機械学習•最適化 • caretパッケージの紹介 • R言語による Random Forest 徹底入門 • Rで解く最適化問題 ‒ 線型計画問題編 ‒ • 近似ベイズ計算でカジュアルなベイズ推定 • 部分的最小二乗法 • 最適化アレ コレ ソレ2011年11月28日月曜日
  • 26. パターン認識 • 判別能力の評価 • K-平均法 • 混合正規分布モデル • k-近傍法、学習ベクトル量子化2011年11月28日月曜日
  • 27. テキストマイニング • Rで始めるテキストマイニング • YjdnJlpの紹介とか2011年11月28日月曜日
  • 28. 異常検知 • Rによる異常検知入門 • 異常行動検出入門 • サーバ異常検知入門2011年11月28日月曜日
  • 29. 大規模データ・高速化 • RにおけるHPC 並列計算編 • Rが黄色い象に出会った • 大規模データマイニングでのモデル探索手法: K-sample plot • Rで大規模データ解析 • RHadoopの紹介 • RでGPU使ってみるわ∼2011年11月28日月曜日
  • 30. 発表資料2011年11月28日月曜日
  • 31. 次回以降の 発表者を募集しています2011年11月28日月曜日