Introduction of sensitivity analysis for randamforest regression, binary classification and multi-class classification of random forest using {forestFloor} package
Introduction of sensitivity analysis for randamforest regression, binary classification and multi-class classification of random forest using {forestFloor} package
DB TechShowcase Tokyo - Intelligent Data PlatformDaiyu Hatakeyama
AI (Artificial Intelligence) が様々なアプリケーション/サービスに組み込まれ始めて、それをうみだす原動力ともいえるデータプラットフォームもその立ち位置を変えてきています。次期SQL Server 2017には、Machine Learning Servicesが同梱され、まさに次世代のデータプラットフォームの一つの形といえるでしょう。このセッションでは、System of Record から、System of Insight へとその価値を変えていく最新のData Platformの世界をご紹介します。
14. 補足: merge 関数①
14
2つのデータを結合する
merge(x, y, by, all)
• x: データ1
• y: データ2
• by: 結合に用いる項目(キー)名を配列で指定
• by.x: x 側で用いる結合のキーを指定 ※x, y 側で項目名が異なる場合に使用
• by.y: y 側で用いる結合のキーを指定 ※x, y 側で項目名が異なる場合に使用
• by: x, y 共に指定された結合のキーを用いる
• all: 結合する際に主軸とするデータ(x, y)を指定
• all.x=TRUE x に y を紐付ける ※左外部結合に相当
• all.y=TRUE y に x を紐付ける ※右外部結合に相当
• all=T x, y の両方が主軸になる ※両側外部結合に相当
※指定しない場合は内部結合に相当
# データの準備
x <- data.frame(id=1:5, value=seq(10, 50, 10))
y <- data.frame(key=4:8, score=seq(400, 800, 100))
x
id value
1 10
2 20
3 30
4 40
5 50
y
key scoer
4 400
5 500
6 600
7 700
8 800
15. 補足: merge 関数②
15
y
x
#内部結合: 合致する行だけが残る
merge(x, y, by.x= id , by.y= key )
id value score
4 40 400
5 50 500
#左外部結合: x の側だけ全て残る
merge(x, y, by.x= id , by.y= key , all.x=T)
id value score
1 10 NA
2 20 NA
3 30 NA
4 40 400
5 50 500
#両側外部結合: x, y の両方とも全て残る
merge(x, y, by.x= id , by.y= key , all=T)
id value score
1 10 NA
2 20 NA
3 30 NA
4 40 400
5 50 500
6 NA 600
7 NA 700
8 NA 800
#右外部結合: y の側だけ全て残る
merge(x, y, by.x= id , by.y= key , all.y=T)
id value score
4 40 400
5 50 500
6 NA 600
7 NA 700
8 NA 500
T
T
F
F