Submit Search
Upload
TokyoR LT Rで連続データを離散化
•
5 likes
•
3,813 views
tetsuro ito
Follow
2015/10/10 Tokyo.R #51のLT資料です
Read less
Read more
Data & Analytics
Slideshow view
Report
Share
Slideshow view
Report
Share
1 of 18
Download now
Download to read offline
Recommended
Visual Studio CodeでRを使う
Visual Studio CodeでRを使う
Visual Studio CodeでRを使う
Atsushi Hayakawa
Osaka.stan #5 LT 馬蹄事前分布の話です
馬に蹴られるモデリング
馬に蹴られるモデリング
Shushi Namba
R, Random Forest, ranger, Rborist
最近のRのランダムフォレストパッケージ -ranger/Rborist-
最近のRのランダムフォレストパッケージ -ranger/Rborist-
Shintaro Fukushima
第2回PEACEにて発表した資料です。
Rはいいぞ!むしろなぜ使わないのか!!
Rはいいぞ!むしろなぜ使わないのか!!
Shushi Namba
九州数学教育会 第6回算数・数学研修会 於. 福岡県立修猷館高等学校 2012年4月15日
行列計算を利用したデータ解析技術
行列計算を利用したデータ解析技術
Yoshihiro Mizoguchi
Anova君を使った分散分析
Anova君を使った分散分析
Takashi Yamane
Tokyo.Rの42回にて、かんたんにダミー変数がつくれるパッケージを試してみた
Dummiesパッケージ
Dummiesパッケージ
weda654
2015.5.24 Hijiyama.R #2 での発表資料です。 架空のサンプルデータを発生させる方法について紹介しています。
Rで架空データの発生
Rで架空データの発生
Makoto Hirakawa
Recommended
Visual Studio CodeでRを使う
Visual Studio CodeでRを使う
Visual Studio CodeでRを使う
Atsushi Hayakawa
Osaka.stan #5 LT 馬蹄事前分布の話です
馬に蹴られるモデリング
馬に蹴られるモデリング
Shushi Namba
R, Random Forest, ranger, Rborist
最近のRのランダムフォレストパッケージ -ranger/Rborist-
最近のRのランダムフォレストパッケージ -ranger/Rborist-
Shintaro Fukushima
第2回PEACEにて発表した資料です。
Rはいいぞ!むしろなぜ使わないのか!!
Rはいいぞ!むしろなぜ使わないのか!!
Shushi Namba
九州数学教育会 第6回算数・数学研修会 於. 福岡県立修猷館高等学校 2012年4月15日
行列計算を利用したデータ解析技術
行列計算を利用したデータ解析技術
Yoshihiro Mizoguchi
Anova君を使った分散分析
Anova君を使った分散分析
Takashi Yamane
Tokyo.Rの42回にて、かんたんにダミー変数がつくれるパッケージを試してみた
Dummiesパッケージ
Dummiesパッケージ
weda654
2015.5.24 Hijiyama.R #2 での発表資料です。 架空のサンプルデータを発生させる方法について紹介しています。
Rで架空データの発生
Rで架空データの発生
Makoto Hirakawa
関数データ解析とはどういうものか、どのような場面で用いられるかについてまとめてみました。
関数データ解析の概要とその方法
関数データ解析の概要とその方法
Hidetoshi Matsui
R初心者向け講座「Rによるやさしい統計学第20章『検定力分析によるサンプルサイズの決定』」20140222 TokyoR #36
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
Takashi J OZAKI
第74回 Tokyo.R LT recipesパッケージの紹介
Rパッケージ recipes の紹介 「うまい飯を作る」
Rパッケージ recipes の紹介 「うまい飯を作る」
Yutaka Kuroki
機械学習アルゴリズムと教師データの関係を表すのがバイアス・バリアンス分解であり、これによって機械学習の結果得られた識別や回帰システムの予測性能の傾向を把握する。
クラシックな機械学習の入門 4. 学習データと予測性能
クラシックな機械学習の入門 4. 学習データと予測性能
Hiroshi Nakagawa
関連スライド一覧 https://github.com/nishio/reinforcement_learning
強化学習その3
強化学習その3
nishio
(The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition. Springer, 2009.)
統計的学習の基礎_3章
統計的学習の基礎_3章
Shoichi Taguchi
書籍「わかりやすいパターン認識, 石井健一郎」勉強会で作成した4章のスライドです
わかりやすいパターン認識 4章
わかりやすいパターン認識 4章
Motokawa Tetsuya
20170618論文読み会 伊藤
20170618論文読み会 伊藤
20170618論文読み会 伊藤
Tomoki Itou
15.7.11 HiRoshima.R #4 Lightning Talks @imyuaotiの発表資料です。 ※注意※(2015.7.19追記) Rでは処理速度が遅いという理由で for関数の使用は避けるべきと考えられています。 本来は,処理を高速化をしたい場合,以下をうまく活用してください。 ・apply関数 ・foreachパッケージ,pforeachパッケージ 【参考資料】 「勝手に添削:for関数を使った繰り返し処理によるヒストグラムの一括出力 #rstatsj」 http://qiita.com/hoxo_m/items/5127c31f3eafd6be7428 (hoxo_mさんに本スライドの内容を添削してもらいました!) 「for を捨てよ、foreach を書こう」 http://www.slideshare.net/hoxo_m/for-foreach 「R で超簡単に並列処理を書けるpforeach パッケージ」 http://www.slideshare.net/hoxo_m/pforeach -------------- @imuyaotiはR初心者です!まだまだ勉強不足です!
for関数を使った繰り返し処理によるヒストグラムの一括出力
for関数を使った繰り返し処理によるヒストグラムの一括出力
imuyaoti
変分推論法(変分ベイズ法)(PRML第10章)
変分推論法(変分ベイズ法)(PRML第10章)
Takao Yamanaka
最適輸送問題(Wasserstein 距離)を解く方法についてのさまざまなアプローチ・アルゴリズムを紹介します。 線形計画を使った定式化の基礎からはじめて、以下の五つのアルゴリズムを紹介します。 1. ネットワークシンプレックス法 2. ハンガリアン法 3. Sinkhorn アルゴリズム 4. ニューラルネットワークによる推定 5. スライス法 このスライドは第三回 0x-seminar https://sites.google.com/view/uda-0x-seminar/home/0x03 で使用したものです。自己完結するよう心がけたのでセミナーに参加していない人にも役立つスライドになっています。 『最適輸送の理論とアルゴリズム』好評発売中! https://www.amazon.co.jp/dp/4065305144 Speakerdeck にもアップロードしました: https://speakerdeck.com/joisino/zui-shi-shu-song-nojie-kifang
最適輸送の解き方
最適輸送の解き方
joisino
第2回Rでつなぐ次世代オミックス情報統合解析研究会「R+igraphではじめる生物ネットワーク解析」 使い方の補足情報やスクリプトなどは以下のページをご覧下さい。 https://sites.google.com/site/kztakemoto/r-seminar-on-igraph---supplementary-information
R seminar on igraph
R seminar on igraph
Kazuhiro Takemoto
研究室で説明した「パターン認識と機械学習(下)」の第9章混合モデルとEMアルゴリズムについてです.
混合モデルとEMアルゴリズム(PRML第9章)
混合モデルとEMアルゴリズム(PRML第9章)
Takao Yamanaka
Lasso, R package, rigorous Lasso, Oracle property
Oracle property and_hdm_pkg_rigorouslasso
Oracle property and_hdm_pkg_rigorouslasso
Satoshi Kato
日本応用数理学会 2017年度 年会 2017年9月8日(金) [ [研究部会 OS] 機械学習] http://annual2017.jsiam.org/program#1422 グラフとして表現された対象が多数ある場合、そのデータセットの統計的トレンドを理解するための情報技術が必要となる。この目的のため、様々な教師付き学習方式が現在までに研究されてきた。本発表では、発表者が関わってきた生命科学・材料科学の例について、低分子化合物のグラフエンコードや特徴量計算の手法、スパース学習や回帰森を用いた教師付き学習、及び最近の話題についての概要を紹介する。
グラフデータの機械学習における特徴表現の設計と学習
グラフデータの機械学習における特徴表現の設計と学習
Ichigaku Takigawa
社内向けセミナーの内容です。株価変動の予想を、従来の手法 (GARCH) と、新しい手法 (Deep Learning; LSTM) を用いて行い、その比較した結果を発表しました。
Deep Learningによる株価変動の予想
Deep Learningによる株価変動の予想
Junichiro Katsuta
機械学習プロフェッショナルシリーズ輪読回の資料 2015-11-18 異常検知と変化検知 井手剛/杉山将・著 http://www.kspub.co.jp/book/detail/1529083.html
異常検知と変化検知 9章 部分空間法による変化点検知
異常検知と変化検知 9章 部分空間法による変化点検知
hagino 3000
第33回R勉強会@東京(#TokyoR)の発表内容です。 http://atnd.org/events/42438 当日見ながら実行できるように先行公開します。
Rで計量時系列分析~CRANパッケージ総ざらい~
Rで計量時系列分析~CRANパッケージ総ざらい~
Takashi J OZAKI
ARG 第7回Webインテリジェンスとインタラクション研究会 企画セッション2「不揃いなデータ達の分析を行う前のTips」
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
Hajime Sasaki
「はじめてのパターン認識」読書会の発表資料です。 第3章(前半):ベイズの識別規則
20130716 はじパタ3章前半 ベイズの識別規則
20130716 はじパタ3章前半 ベイズの識別規則
koba cky
20150217 イタンジプログラミング講座テキスト第3回
20150217 イタンジプログラミング講座テキスト第3回
20150217 イタンジプログラミング講座テキスト第3回
Yusuke Yokozawa
第1回 Hubot×ChatOps勉強会で発表した資料です。 Cloudn PaaSチームで実践しているChatOps,そしてIRC Botについて紹介します
Cloudn PaaSチームのChatOps実践
Cloudn PaaSチームのChatOps実践
Kazuto Kusama
More Related Content
What's hot
関数データ解析とはどういうものか、どのような場面で用いられるかについてまとめてみました。
関数データ解析の概要とその方法
関数データ解析の概要とその方法
Hidetoshi Matsui
R初心者向け講座「Rによるやさしい統計学第20章『検定力分析によるサンプルサイズの決定』」20140222 TokyoR #36
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
Takashi J OZAKI
第74回 Tokyo.R LT recipesパッケージの紹介
Rパッケージ recipes の紹介 「うまい飯を作る」
Rパッケージ recipes の紹介 「うまい飯を作る」
Yutaka Kuroki
機械学習アルゴリズムと教師データの関係を表すのがバイアス・バリアンス分解であり、これによって機械学習の結果得られた識別や回帰システムの予測性能の傾向を把握する。
クラシックな機械学習の入門 4. 学習データと予測性能
クラシックな機械学習の入門 4. 学習データと予測性能
Hiroshi Nakagawa
関連スライド一覧 https://github.com/nishio/reinforcement_learning
強化学習その3
強化学習その3
nishio
(The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition. Springer, 2009.)
統計的学習の基礎_3章
統計的学習の基礎_3章
Shoichi Taguchi
書籍「わかりやすいパターン認識, 石井健一郎」勉強会で作成した4章のスライドです
わかりやすいパターン認識 4章
わかりやすいパターン認識 4章
Motokawa Tetsuya
20170618論文読み会 伊藤
20170618論文読み会 伊藤
20170618論文読み会 伊藤
Tomoki Itou
15.7.11 HiRoshima.R #4 Lightning Talks @imyuaotiの発表資料です。 ※注意※(2015.7.19追記) Rでは処理速度が遅いという理由で for関数の使用は避けるべきと考えられています。 本来は,処理を高速化をしたい場合,以下をうまく活用してください。 ・apply関数 ・foreachパッケージ,pforeachパッケージ 【参考資料】 「勝手に添削:for関数を使った繰り返し処理によるヒストグラムの一括出力 #rstatsj」 http://qiita.com/hoxo_m/items/5127c31f3eafd6be7428 (hoxo_mさんに本スライドの内容を添削してもらいました!) 「for を捨てよ、foreach を書こう」 http://www.slideshare.net/hoxo_m/for-foreach 「R で超簡単に並列処理を書けるpforeach パッケージ」 http://www.slideshare.net/hoxo_m/pforeach -------------- @imuyaotiはR初心者です!まだまだ勉強不足です!
for関数を使った繰り返し処理によるヒストグラムの一括出力
for関数を使った繰り返し処理によるヒストグラムの一括出力
imuyaoti
変分推論法(変分ベイズ法)(PRML第10章)
変分推論法(変分ベイズ法)(PRML第10章)
Takao Yamanaka
最適輸送問題(Wasserstein 距離)を解く方法についてのさまざまなアプローチ・アルゴリズムを紹介します。 線形計画を使った定式化の基礎からはじめて、以下の五つのアルゴリズムを紹介します。 1. ネットワークシンプレックス法 2. ハンガリアン法 3. Sinkhorn アルゴリズム 4. ニューラルネットワークによる推定 5. スライス法 このスライドは第三回 0x-seminar https://sites.google.com/view/uda-0x-seminar/home/0x03 で使用したものです。自己完結するよう心がけたのでセミナーに参加していない人にも役立つスライドになっています。 『最適輸送の理論とアルゴリズム』好評発売中! https://www.amazon.co.jp/dp/4065305144 Speakerdeck にもアップロードしました: https://speakerdeck.com/joisino/zui-shi-shu-song-nojie-kifang
最適輸送の解き方
最適輸送の解き方
joisino
第2回Rでつなぐ次世代オミックス情報統合解析研究会「R+igraphではじめる生物ネットワーク解析」 使い方の補足情報やスクリプトなどは以下のページをご覧下さい。 https://sites.google.com/site/kztakemoto/r-seminar-on-igraph---supplementary-information
R seminar on igraph
R seminar on igraph
Kazuhiro Takemoto
研究室で説明した「パターン認識と機械学習(下)」の第9章混合モデルとEMアルゴリズムについてです.
混合モデルとEMアルゴリズム(PRML第9章)
混合モデルとEMアルゴリズム(PRML第9章)
Takao Yamanaka
Lasso, R package, rigorous Lasso, Oracle property
Oracle property and_hdm_pkg_rigorouslasso
Oracle property and_hdm_pkg_rigorouslasso
Satoshi Kato
日本応用数理学会 2017年度 年会 2017年9月8日(金) [ [研究部会 OS] 機械学習] http://annual2017.jsiam.org/program#1422 グラフとして表現された対象が多数ある場合、そのデータセットの統計的トレンドを理解するための情報技術が必要となる。この目的のため、様々な教師付き学習方式が現在までに研究されてきた。本発表では、発表者が関わってきた生命科学・材料科学の例について、低分子化合物のグラフエンコードや特徴量計算の手法、スパース学習や回帰森を用いた教師付き学習、及び最近の話題についての概要を紹介する。
グラフデータの機械学習における特徴表現の設計と学習
グラフデータの機械学習における特徴表現の設計と学習
Ichigaku Takigawa
社内向けセミナーの内容です。株価変動の予想を、従来の手法 (GARCH) と、新しい手法 (Deep Learning; LSTM) を用いて行い、その比較した結果を発表しました。
Deep Learningによる株価変動の予想
Deep Learningによる株価変動の予想
Junichiro Katsuta
機械学習プロフェッショナルシリーズ輪読回の資料 2015-11-18 異常検知と変化検知 井手剛/杉山将・著 http://www.kspub.co.jp/book/detail/1529083.html
異常検知と変化検知 9章 部分空間法による変化点検知
異常検知と変化検知 9章 部分空間法による変化点検知
hagino 3000
第33回R勉強会@東京(#TokyoR)の発表内容です。 http://atnd.org/events/42438 当日見ながら実行できるように先行公開します。
Rで計量時系列分析~CRANパッケージ総ざらい~
Rで計量時系列分析~CRANパッケージ総ざらい~
Takashi J OZAKI
ARG 第7回Webインテリジェンスとインタラクション研究会 企画セッション2「不揃いなデータ達の分析を行う前のTips」
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
Hajime Sasaki
「はじめてのパターン認識」読書会の発表資料です。 第3章(前半):ベイズの識別規則
20130716 はじパタ3章前半 ベイズの識別規則
20130716 はじパタ3章前半 ベイズの識別規則
koba cky
What's hot
(20)
関数データ解析の概要とその方法
関数データ解析の概要とその方法
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
Rパッケージ recipes の紹介 「うまい飯を作る」
Rパッケージ recipes の紹介 「うまい飯を作る」
クラシックな機械学習の入門 4. 学習データと予測性能
クラシックな機械学習の入門 4. 学習データと予測性能
強化学習その3
強化学習その3
統計的学習の基礎_3章
統計的学習の基礎_3章
わかりやすいパターン認識 4章
わかりやすいパターン認識 4章
20170618論文読み会 伊藤
20170618論文読み会 伊藤
for関数を使った繰り返し処理によるヒストグラムの一括出力
for関数を使った繰り返し処理によるヒストグラムの一括出力
変分推論法(変分ベイズ法)(PRML第10章)
変分推論法(変分ベイズ法)(PRML第10章)
最適輸送の解き方
最適輸送の解き方
R seminar on igraph
R seminar on igraph
混合モデルとEMアルゴリズム(PRML第9章)
混合モデルとEMアルゴリズム(PRML第9章)
Oracle property and_hdm_pkg_rigorouslasso
Oracle property and_hdm_pkg_rigorouslasso
グラフデータの機械学習における特徴表現の設計と学習
グラフデータの機械学習における特徴表現の設計と学習
Deep Learningによる株価変動の予想
Deep Learningによる株価変動の予想
異常検知と変化検知 9章 部分空間法による変化点検知
異常検知と変化検知 9章 部分空間法による変化点検知
Rで計量時系列分析~CRANパッケージ総ざらい~
Rで計量時系列分析~CRANパッケージ総ざらい~
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
20130716 はじパタ3章前半 ベイズの識別規則
20130716 はじパタ3章前半 ベイズの識別規則
Similar to TokyoR LT Rで連続データを離散化
20150217 イタンジプログラミング講座テキスト第3回
20150217 イタンジプログラミング講座テキスト第3回
20150217 イタンジプログラミング講座テキスト第3回
Yusuke Yokozawa
第1回 Hubot×ChatOps勉強会で発表した資料です。 Cloudn PaaSチームで実践しているChatOps,そしてIRC Botについて紹介します
Cloudn PaaSチームのChatOps実践
Cloudn PaaSチームのChatOps実践
Kazuto Kusama
軽量仮想環境を用いてNGSデータの解析再現性を担保する 講師:大田達郎(ライフサイエンス統合データベースセンター 特任研究員) 2015年6月12日「第31回 DDBJing 講習会 in 東京」 @国立研究開発法人 科学技術振興機構 東京本部別館 YouTube:YouTube:http://youtu.be/pGtAGOjN2rw DDBJing 講習会:http://www.ddbj.nig.ac.jp/ddbjing/ddbjing.html
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
DNA Data Bank of Japan center
東京Ruby会議03のワークショップ用。
Rubyの仕事で食べていくために僕らは!
Rubyの仕事で食べていくために僕らは!
Ouka Yuka
2021/11/10開催 PHPerのための「PHP カンファレンス 2021を振り返る」PHP TechCafe で発表したPostgresqlチューニングのLTに関する資料です。
PHPerのためのpostgresqlチューニングmini
PHPerのためのpostgresqlチューニングmini
Takhisa Hirokawa
こんな出来損ないの俺を何十年も支えてくれた perl や python。 普段使いから面倒なお仕事まで、文句ひとつ言わずこなしてきてくれた古女房に別れを告げ Scala に浮気、結局泣いて帰ってきたのも、もう8年前のこと。 2016年の暮れも押し迫る中、また性懲りもなくふらふらと彷徨いでたその先には、、、 謎の看板とあなたを手招きして待っている極上の美女達! 「スクリプト言語禁止縛りスクリプティング バトルロイヤル coming in 2017」へようこそ ...これは罠だ! 『あなたに私が使いこなせるかしら...』 蠱惑的な笑みからこぼれ出るは知性、麗しき才媛 F# on .NET Core/mono 『私、まだ何も知らないの、あなた色に染め上げて...』 未成熟な躰に美しいUIをまとったロリータ Swift with CoreFoundation 『$#->%@!?』 それは安定を母とし混沌から産まれた - ジャングルの奥地で出会った青天の霹靂、ブラックスワン 制御できない野生の魅力に振り回されたい Perl6 on JVM
YAPC::Hokkaido 2016 「普段使い言語環境」更新によるスキルリセットサバイバルガイド
YAPC::Hokkaido 2016 「普段使い言語環境」更新によるスキルリセットサバイバルガイド
keroyonn
2017/05/27 Y8 2017 Spring in Shibuyaでのセッション
20170527 inside .NET Core on Linux
20170527 inside .NET Core on Linux
Takayoshi Tanaka
Presentation slide for #pyconjp2014
"Continuous Publication" with Python: Another Approach
"Continuous Publication" with Python: Another Approach
Daisuke Miyakawa
ビジネスの要求にアプリケーションは追随できていますか。「やりたいこと」のためにデータベースは動いていますか。データベースシステムは目的のための手段です。実は継続稼働に心血注いでいたりしませんか。今一度ビジネス目的のために進化可能なデータベースを考えてみませんか。そしてそのデータベースが真の自立型、自働型(誤字ではないんです) だったらもっとすごいって思いませんか。そう言い続けて4年(このイベント第一回からいい続けています)、是非このセッションで体感してください。
[db tech showcase Tokyo 2014] L34: そのデータベース 5年後大丈夫ですか by 日本ヒューレット・パッカード株式会社 後藤宏
[db tech showcase Tokyo 2014] L34: そのデータベース 5年後大丈夫ですか by 日本ヒューレット・パッカード株式会社 後藤宏
Insight Technology, Inc.
2011年10月21日
2011年10月21日
nukaemon
Learn MapReduce and YARN on Hadoop/MapR (HPE Ezmeral Data Fabric)
MapReduce/YARNの仕組みを知る
MapReduce/YARNの仕組みを知る
日本ヒューレット・パッカード株式会社
Rails勉強会でRailsにまったく関係ない話をするテロ。
Rubyの会社でPythonistaが3ヶ月生き延びた話
Rubyの会社でPythonistaが3ヶ月生き延びた話
Tokoroten Nakayama
@tokorotenによるRails勉強会でPythonの話をするテロ。データマイニングについてのゆるいお話。 以下のプレゼンと同様の内容になります。 http://www.slideshare.net/TokorotenNakayama/rubypythonista3
Rubyの会社でPythonistaが三ヶ月生き延びた話
Rubyの会社でPythonistaが三ヶ月生き延びた話
Drecom Co., Ltd.
Japan Azure User Group Fukuoka(ふくあず) DocumentDBを今から初めても遅くない!
今から始めるDocument db
今から始めるDocument db
Kazunori Hamamoto
http://www.wankuma.com/seminar/20101016nagoya15/ 今はやりのHadoopについて、MapReduceや分散ファイルシステムといった基盤技術から紹介したいと思います。
Hadoop事始め
Hadoop事始め
You&I
Okayama Ruby Kaigi01 Nomura laboratory
nomlab_okayamaruby_slide
nomlab_okayamaruby_slide
nomlab
DLR言語によるSilverlightプログラミング
DLR言語によるSilverlightプログラミング
terurou
NVDAの紹介と日本語化プロジェクトの活動状況
Nishimotz pycon2011jan
Nishimotz pycon2011jan
Takuya Nishimoto
■Hadoopの理解にちょっと自信のない皆さんに贈る 40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料) 日本Hadoopユーザー会 濱野 賢一朗/Kenichiro Hamano (NTTデータ)
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
hamaken
早稲田大学情報理工学科講演会 20210515
私とOSSの25年
私とOSSの25年
MITSUNARI Shigeo
Similar to TokyoR LT Rで連続データを離散化
(20)
20150217 イタンジプログラミング講座テキスト第3回
20150217 イタンジプログラミング講座テキスト第3回
Cloudn PaaSチームのChatOps実践
Cloudn PaaSチームのChatOps実践
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
Rubyの仕事で食べていくために僕らは!
Rubyの仕事で食べていくために僕らは!
PHPerのためのpostgresqlチューニングmini
PHPerのためのpostgresqlチューニングmini
YAPC::Hokkaido 2016 「普段使い言語環境」更新によるスキルリセットサバイバルガイド
YAPC::Hokkaido 2016 「普段使い言語環境」更新によるスキルリセットサバイバルガイド
20170527 inside .NET Core on Linux
20170527 inside .NET Core on Linux
"Continuous Publication" with Python: Another Approach
"Continuous Publication" with Python: Another Approach
[db tech showcase Tokyo 2014] L34: そのデータベース 5年後大丈夫ですか by 日本ヒューレット・パッカード株式会社 後藤宏
[db tech showcase Tokyo 2014] L34: そのデータベース 5年後大丈夫ですか by 日本ヒューレット・パッカード株式会社 後藤宏
2011年10月21日
2011年10月21日
MapReduce/YARNの仕組みを知る
MapReduce/YARNの仕組みを知る
Rubyの会社でPythonistaが3ヶ月生き延びた話
Rubyの会社でPythonistaが3ヶ月生き延びた話
Rubyの会社でPythonistaが三ヶ月生き延びた話
Rubyの会社でPythonistaが三ヶ月生き延びた話
今から始めるDocument db
今から始めるDocument db
Hadoop事始め
Hadoop事始め
nomlab_okayamaruby_slide
nomlab_okayamaruby_slide
DLR言語によるSilverlightプログラミング
DLR言語によるSilverlightプログラミング
Nishimotz pycon2011jan
Nishimotz pycon2011jan
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
私とOSSの25年
私とOSSの25年
More from tetsuro ito
japan.R2017noLT資料です
[Up用]rでqr
[Up用]rでqr
tetsuro ito
データアナリストミートアップで発表したDataOps in MoneyForwardの資料です
20170912 data analyst meetup tokyo vol.5
20170912 data analyst meetup tokyo vol.5
tetsuro ito
20170714 丸の内アナリティクスバンビーノ登壇資料
DataOps in Moneyforward
DataOps in Moneyforward
tetsuro ito
2017年2月7日に六本木アカデミーヒルズで行われたBigData Analytics Tokyoで発表したスライドです。
20170207 bigdata analytics_tokyo講演資料
20170207 bigdata analytics_tokyo講演資料
tetsuro ito
『機械学習エンジニア向け勉強会』の発表資料です
20161029 dots machine learning in money forward
20161029 dots machine learning in money forward
tetsuro ito
GCP_NEXT後のBQ_Sushiで発表した資料です
20160906 bq sushi
20160906 bq sushi
tetsuro ito
2015/05/31 Bizreach✕Cookpad✕Gunosy✕UserLocal 分析プラットホームとその技術で発表した内容です
20150531分析プラットホームとその技術(bizreach) cookpad ito #dcube_analysis
20150531分析プラットホームとその技術(bizreach) cookpad ito #dcube_analysis
tetsuro ito
続わかりやすいパターン認識5章後半部分
20150303続パタ5章後半
20150303続パタ5章後半
tetsuro ito
社内における読書会のスライドです。 毎回この作り込んだスライドは辛いので、以後はpublicには鳴り得ないのですが、せっかく作ったので、公開しています。
PRML読書会1スライド(公開用)
PRML読書会1スライド(公開用)
tetsuro ito
20140614 tokyo r lt
20140614 tokyo r lt
tetsuro ito
20140329 tokyo r lt 「カーネルとsvm」
20140329 tokyo r lt 「カーネルとsvm」
tetsuro ito
LTという名のステマ
20140204はじパタlt
20140204はじパタlt
tetsuro ito
20131207 Japan.R発表
Japan.r 2013 「実ビジネスデータへのrの活用とその限界」
Japan.r 2013 「実ビジネスデータへのrの活用とその限界」
tetsuro ito
はじパタ8章 svm
はじパタ8章 svm
tetsuro ito
2013年11月9日 第35回TokyoRのLT 「ロバスティーヌのお悩み」(ロバスト推定)
Tokyo R LT 20131109
Tokyo R LT 20131109
tetsuro ito
はじパタ2章
はじパタ2章
tetsuro ito
第31回TokyoR LT資料
第31回TokyoR LT資料
tetsuro ito
集合知プログラミング5章発表
集合知プログラミング5章発表
tetsuro ito
集合知プログラミング11章
集合知プログラミング11章
tetsuro ito
集合知プログラミング勉強会キックオフMTGの第1章LT資料です
集合知プログラミング勉強会キックオフMTG LT用資料
集合知プログラミング勉強会キックオフMTG LT用資料
tetsuro ito
More from tetsuro ito
(20)
[Up用]rでqr
[Up用]rでqr
20170912 data analyst meetup tokyo vol.5
20170912 data analyst meetup tokyo vol.5
DataOps in Moneyforward
DataOps in Moneyforward
20170207 bigdata analytics_tokyo講演資料
20170207 bigdata analytics_tokyo講演資料
20161029 dots machine learning in money forward
20161029 dots machine learning in money forward
20160906 bq sushi
20160906 bq sushi
20150531分析プラットホームとその技術(bizreach) cookpad ito #dcube_analysis
20150531分析プラットホームとその技術(bizreach) cookpad ito #dcube_analysis
20150303続パタ5章後半
20150303続パタ5章後半
PRML読書会1スライド(公開用)
PRML読書会1スライド(公開用)
20140614 tokyo r lt
20140614 tokyo r lt
20140329 tokyo r lt 「カーネルとsvm」
20140329 tokyo r lt 「カーネルとsvm」
20140204はじパタlt
20140204はじパタlt
Japan.r 2013 「実ビジネスデータへのrの活用とその限界」
Japan.r 2013 「実ビジネスデータへのrの活用とその限界」
はじパタ8章 svm
はじパタ8章 svm
Tokyo R LT 20131109
Tokyo R LT 20131109
はじパタ2章
はじパタ2章
第31回TokyoR LT資料
第31回TokyoR LT資料
集合知プログラミング5章発表
集合知プログラミング5章発表
集合知プログラミング11章
集合知プログラミング11章
集合知プログラミング勉強会キックオフMTG LT用資料
集合知プログラミング勉強会キックオフMTG LT用資料
TokyoR LT Rで連続データを離散化
1.
Rで連続データを離散化 #51 Tokyo.R 2015/10/10 ニフティ株式会社
2.
伊藤 徹郎 (@tetsuroito) 食欲の秋、ハロウィンですね 最近運動不足気味 自己紹介
3.
ありがたいご恵贈の数々 近況
4.
みなさんの素晴らしい 成果によって 日々助けられてます
5.
ありがとうございます
6.
データ分析よくあるパターン 1. WindowsのGUIアプリやWebサービスの管理画面 2. Windows上でのプログラミング 3.
Linux上でのコマンド操作 4. Linux上でのプログラミング 5. DBとかKVSとかを自前で用意する 6. Hiveとか、最近だとMPP 7. Hadoop/Sparkなどの環境下でのプログラミング 上記2,3のギャップを埋める書籍です。 コマンドラインでの記述がメインですが、 Rも関連したコマンドラインの紹介もあります ggplot2の話もいっぱい
7.
もうこの会では何度も紹介されてきた名著 Rの基礎から可視化、データ加工、分析、 パッケージ作成までを網羅した1冊! 現在、第3版! 最新版はさらに内容がよくなっているそうです! もう説明は不要ですよね? Tokyo.Rテキストシリーズで採用しても良さそう!
8.
よくあるデータ分析の手法 (多変量解析、機械学習)の解説書ではなく 適切な分析計画の立案、データ収集・蓄積、 データ加工やデータ変換などの前処理、 その後の分析手法の適用、活用までを 幅広く解説したall in oneの書籍 本日のLTはこちらから 「連続データの離散化」の箇所を紹介します
9.
データの離散化のメリット データ記述の簡略 データ及びその処理結果に対する理解向上 多くの数値属性を含むデータ処理の実行
10.
データ離散化の手法の分類 ・・・・・・・・・ ・・・・・・・・・ ・・・・・・・・・ トップダウンアプローチ ボトムアップアプローチ ・・・・・・・・・ 全データを1区間からスタート 逐次的に分割 ・・・・・・・・・ ・・・・・・・・・ 複数区間からスタート 必要に応じて区間を併合
11.
連続データの離散化手法 教師データなし 教師データあり トップダウン 等間隔区間による 離散化(EWD) 等頻度区間による 離散化(EFD)など エントロピーを用いた 離散化 (CAIM,CACC,Aeva) 最小記述長原理による 離散化(MDLP)など ボトムアップ k-meansなど
カイマージ、カイ2など k-meansは割愛します
12.
連続データ離散化を実現するRパッケージ discretization パッケージ infotheo パッケージ >install.packages("infotheo",quiet=TRUE) >install.packages("discretization",quiet=TRUE)
13.
等間隔区間による離散化 irisデータで試してみる 分割数はnbins引数で指定可能
14.
等頻度区間による離散化 irisデータで試してみる 分割数はnbins引数で指定可能 引数を変更
15.
カイマージによる離散化 カイマージとは‥ χ二乗検定を用いて分割点を決定するもの 具体的には‥ 属性を離散化して隣接する区間で各クラスの確率に 有意な違いはないと判断されたら2区間を併合する discretization パッケージ chiM関数で実行可能
16.
カイマージによる離散化 irisデータで試してみる
17.
情報エントロピーを用いた離散化 おそらく、5分で説明するには時間が足らない と思うので、知りたい方は書籍を読んでください 最小記述長原理を用いた離散化 http://d.hatena.ne.jp/sfchaos/20131208/p1 もしくは著者のブログをチェック!
18.
Enjoy!
Download now