Home
Explore
Submit Search
Upload
Login
Signup
Advertisement
Check these out next
Hiroshimar4_Rintro
SAKAUE, Tatsuya
Tokyo r30 beginner
Takashi Minoda
Rstudio事始め
Takashi Yamane
初心者のためのRとRStudio入門 vol.2
OWL.learn
Gensim
saireya _
10分で分かるr言語入門ver2.8 14 0712
Nobuaki Oshiro
Rとデータベース 第61回 Tokyo.R
Takashi Minoda
dplyrとは何だったのか
yutannihilation
1
of
18
Top clipped slide
TokyoR LT Rで連続データを離散化
Oct. 11, 2015
•
0 likes
5 likes
×
Be the first to like this
Show More
•
3,785 views
views
×
Total views
0
On Slideshare
0
From embeds
0
Number of embeds
0
Download Now
Download to read offline
Report
Data & Analytics
2015/10/10 Tokyo.R #51のLT資料です
tetsuro ito
Follow
Director & Data Analysis
Advertisement
Advertisement
Advertisement
Recommended
20170312 r言語環境構築&dplyr ハンズオン
Nobuaki Oshiro
1.1K views
•
36 slides
10分で分かるr言語入門ver2.15 15 1010
Nobuaki Oshiro
3.2K views
•
107 slides
20161127 doradora09 japanr2016_lt
Nobuaki Oshiro
8.3K views
•
33 slides
10分で分かるr言語入門ver2.14 15 0905
Nobuaki Oshiro
2.2K views
•
111 slides
10分で分かるr言語入門ver2 6
Nobuaki Oshiro
9.8K views
•
105 slides
rstanで個人のパラメーターを推定した話
Yuya Matsumura
6K views
•
19 slides
More Related Content
Slideshows for you
(20)
Hiroshimar4_Rintro
SAKAUE, Tatsuya
•
1.1K views
Tokyo r30 beginner
Takashi Minoda
•
16.5K views
Rstudio事始め
Takashi Yamane
•
77.6K views
初心者のためのRとRStudio入門 vol.2
OWL.learn
•
21.1K views
Gensim
saireya _
•
55.2K views
10分で分かるr言語入門ver2.8 14 0712
Nobuaki Oshiro
•
3K views
Rとデータベース 第61回 Tokyo.R
Takashi Minoda
•
1K views
dplyrとは何だったのか
yutannihilation
•
4.4K views
Rでダイエット
Tatsuya Tojima
•
2.6K views
AutoEncoderで特徴抽出
Kai Sasaki
•
37.5K views
Jenkins によるレポートスクリプト管理
Tatsuya Tojima
•
12.2K views
HiroshimaR5_Intro
SAKAUE, Tatsuya
•
1.6K views
HiRoshimaR3_IntroR
SAKAUE, Tatsuya
•
1.9K views
Sendai r01 beginnerssession1
kotora_0507
•
156 views
LDA入門
正志 坪坂
•
76.1K views
Web エンジニアが postgre sql を選ぶ 3 つの理由
Soudai Sone
•
19.7K views
Tokyo r33 beginner
Takashi Minoda
•
17.8K views
HiroshimaR6_Introduction
SAKAUE, Tatsuya
•
1.1K views
トピックモデルの話
kogecoo
•
28.3K views
OSC2015 Tokyo/Spring セミナー「初めてのLibreOffice L10N UI/ヘルプ翻訳」予告編
Kazumi Ohhashi
•
876 views
Similar to TokyoR LT Rで連続データを離散化
(20)
20150217 イタンジプログラミング講座テキスト第3回
Yusuke Yokozawa
•
993 views
Cloudn PaaSチームのChatOps実践
Kazuto Kusama
•
7.6K views
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
DNA Data Bank of Japan center
•
1.3K views
Rubyの仕事で食べていくために僕らは!
Ouka Yuka
•
9.4K views
PHPerのためのpostgresqlチューニングmini
Takhisa Hirokawa
•
113 views
YAPC::Hokkaido 2016 「普段使い言語環境」更新によるスキルリセットサバイバルガイド
keroyonn
•
1.9K views
20170527 inside .NET Core on Linux
Takayoshi Tanaka
•
1.4K views
"Continuous Publication" with Python: Another Approach
Daisuke Miyakawa
•
4.6K views
[db tech showcase Tokyo 2014] L34: そのデータベース 5年後大丈夫ですか by 日本ヒューレット・パッカード株式会社 後藤宏
Insight Technology, Inc.
•
1.9K views
2011年10月21日
nukaemon
•
308 views
MapReduce/YARNの仕組みを知る
日本ヒューレット・パッカード株式会社
•
661 views
Rubyの会社でPythonistaが3ヶ月生き延びた話
Tokoroten Nakayama
•
9.2K views
Rubyの会社でPythonistaが三ヶ月生き延びた話
Drecom Co., Ltd.
•
3.7K views
今から始めるDocument db
Kazunori Hamamoto
•
2.7K views
Hadoop事始め
You&I
•
1K views
nomlab_okayamaruby_slide
nomlab
•
1K views
DLR言語によるSilverlightプログラミング
terurou
•
1.1K views
Nishimotz pycon2011jan
Takuya Nishimoto
•
1K views
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
hamaken
•
100K views
私とOSSの25年
MITSUNARI Shigeo
•
11.8K views
Advertisement
More from tetsuro ito
(20)
[Up用]rでqr
tetsuro ito
•
1K views
20170912 data analyst meetup tokyo vol.5
tetsuro ito
•
1.6K views
DataOps in Moneyforward
tetsuro ito
•
1.3K views
20170207 bigdata analytics_tokyo講演資料
tetsuro ito
•
973 views
20161029 dots machine learning in money forward
tetsuro ito
•
1.4K views
20160906 bq sushi
tetsuro ito
•
877 views
20150531分析プラットホームとその技術(bizreach) cookpad ito #dcube_analysis
tetsuro ito
•
3.6K views
20150303続パタ5章後半
tetsuro ito
•
4.4K views
PRML読書会1スライド(公開用)
tetsuro ito
•
11.8K views
20140614 tokyo r lt
tetsuro ito
•
2.5K views
20140329 tokyo r lt 「カーネルとsvm」
tetsuro ito
•
9.7K views
20140204はじパタlt
tetsuro ito
•
9.2K views
Japan.r 2013 「実ビジネスデータへのrの活用とその限界」
tetsuro ito
•
3.1K views
はじパタ8章 svm
tetsuro ito
•
23.2K views
Tokyo R LT 20131109
tetsuro ito
•
2.1K views
はじパタ2章
tetsuro ito
•
21.5K views
第31回TokyoR LT資料
tetsuro ito
•
9.2K views
集合知プログラミング5章発表
tetsuro ito
•
1K views
集合知プログラミング11章
tetsuro ito
•
1.7K views
集合知プログラミング勉強会キックオフMTG LT用資料
tetsuro ito
•
1.4K views
Recently uploaded
(20)
2渥太华大学.pdf
dsadasd17
•
3 views
#国外文凭办理Baylor学位证成绩单
losapab511ockdiaom
•
2 views
39.思克莱德大学.pdf
dsadasd17
•
2 views
43圣玛丽大学.pdf
dsadasd17
•
2 views
#国外文凭办理Seneca学位证成绩单
08e9d7528d5drman
•
3 views
#国外留学文凭购买Tulane假毕业证书
14zw8z53qmm
•
0 views
#国外留学文凭购买Brandon假毕业证书
fc2c0f2b1mymailol
•
0 views
#国外文凭办理Suffolk学位证成绩单
losapab511ockdiaom
•
2 views
#专业办证《Dal毕业证学位证原版精仿》
mibiri4418mevor
•
2 views
#国外留学文凭购买约克大学假毕业证书
fc2c0f2b1mymailol
•
0 views
#国外文凭办理U of U学位证成绩单
losapab511ockdiaom
•
2 views
46圣文森山大学.pdf
dsadasd17
•
2 views
2022年度エネルギー白書資料集
ssuser1323ea1
•
3 views
#国外文凭办理Duquesne学位证成绩单
losapab511ockdiaom
•
2 views
11墨尔本.pdf
dsadasd17
•
2 views
22.诺丁汉大学.pdf
dsadasd17
•
2 views
Drive-by Sensingによる都市のモニタリング
Takuma Oda
•
6 views
74拉萨尔学院.pdf
dsadasd17
•
2 views
#专业办证《梅西大学毕业证学位证原版精仿》
ee61223771acdrman
•
2 views
2022年度エネルギー白書資料集
ssuser1323ea1
•
5 views
Advertisement
TokyoR LT Rで連続データを離散化
Rで連続データを離散化 #51 Tokyo.R 2015/10/10 ニフティ株式会社
伊藤 徹郎 (@tetsuroito) 食欲の秋、ハロウィンですね 最近運動不足気味 自己紹介
ありがたいご恵贈の数々 近況
みなさんの素晴らしい 成果によって 日々助けられてます
ありがとうございます
データ分析よくあるパターン 1. WindowsのGUIアプリやWebサービスの管理画面 2. Windows上でのプログラミング 3.
Linux上でのコマンド操作 4. Linux上でのプログラミング 5. DBとかKVSとかを自前で用意する 6. Hiveとか、最近だとMPP 7. Hadoop/Sparkなどの環境下でのプログラミング 上記2,3のギャップを埋める書籍です。 コマンドラインでの記述がメインですが、 Rも関連したコマンドラインの紹介もあります ggplot2の話もいっぱい
もうこの会では何度も紹介されてきた名著 Rの基礎から可視化、データ加工、分析、 パッケージ作成までを網羅した1冊! 現在、第3版! 最新版はさらに内容がよくなっているそうです! もう説明は不要ですよね? Tokyo.Rテキストシリーズで採用しても良さそう!
よくあるデータ分析の手法 (多変量解析、機械学習)の解説書ではなく 適切な分析計画の立案、データ収集・蓄積、 データ加工やデータ変換などの前処理、 その後の分析手法の適用、活用までを 幅広く解説したall in oneの書籍 本日のLTはこちらから 「連続データの離散化」の箇所を紹介します
データの離散化のメリット データ記述の簡略 データ及びその処理結果に対する理解向上 多くの数値属性を含むデータ処理の実行
データ離散化の手法の分類 ・・・・・・・・・ ・・・・・・・・・ ・・・・・・・・・ トップダウンアプローチ ボトムアップアプローチ ・・・・・・・・・ 全データを1区間からスタート 逐次的に分割 ・・・・・・・・・ ・・・・・・・・・ 複数区間からスタート 必要に応じて区間を併合
連続データの離散化手法 教師データなし 教師データあり トップダウン 等間隔区間による 離散化(EWD) 等頻度区間による 離散化(EFD)など エントロピーを用いた 離散化 (CAIM,CACC,Aeva) 最小記述長原理による 離散化(MDLP)など ボトムアップ k-meansなど
カイマージ、カイ2など k-meansは割愛します
連続データ離散化を実現するRパッケージ discretization パッケージ infotheo パッケージ >install.packages("infotheo",quiet=TRUE) >install.packages("discretization",quiet=TRUE)
等間隔区間による離散化 irisデータで試してみる 分割数はnbins引数で指定可能
等頻度区間による離散化 irisデータで試してみる 分割数はnbins引数で指定可能 引数を変更
カイマージによる離散化 カイマージとは‥ χ二乗検定を用いて分割点を決定するもの 具体的には‥ 属性を離散化して隣接する区間で各クラスの確率に 有意な違いはないと判断されたら2区間を併合する discretization パッケージ chiM関数で実行可能
カイマージによる離散化 irisデータで試してみる
情報エントロピーを用いた離散化 おそらく、5分で説明するには時間が足らない と思うので、知りたい方は書籍を読んでください 最小記述長原理を用いた離散化 http://d.hatena.ne.jp/sfchaos/20131208/p1 もしくは著者のブログをチェック!
Enjoy!
Advertisement