Radiantによる
データ分析入門
Tokyo.R 2019-05-25
タナカ ケンタ
https://mana.bi/
1 Radiantとは (1)
"Business analytics" のためのRパッケージ
ShinyによるブラウザベースのGUIで、容易に
"EDA" や "Reproducible research" が可能
UCSDのMBAコースで使用されている
インストール、アップデートは関数1つで簡単 (後述)
https://vnijs.github.io/radiant/
1 Radiantとは (2)
 ブラウザ上でのマウス操作で、グラフ作成、クロス集計、データ加工などができる
2 探索的データ解析 (EDA) (1)
John W. Tukeyによるデータ分析の考え方
データの観察を基に、仮説立案、手法選択、高度
な分析のためのデータ収集計画などを検討する
2018年の「Kaggle流行語大賞」に選ばれた
 (Wikipediaいわく) EDAに触発されて "S" が作られ、
Sを基にRが作られたので、ある種Rの源流と言える
2 探索的データ解析 (EDA) (2)
 1970年代に提唱された古典的な方法論だが、現在あらためて注目が集まっている
3 Radiantのインストール・アップデート
RadiantはCRANに登録されており、基本的に
install.packages("radiant") だけで
インストールできる
RadiantのWebサイトから、開発版のインストール、
アップデートもできる
radiant::launcher() 関数でデスクトップに
起動用のショートカットを作成できる (Win, macOS)
4 Radiantの起動・終了
1. Rのコンソールからパッケージを読み込み、起動する
2. RStudioのアドインとして動作するので、UIのボタンから起動する
3. launcher() 関数で作ったショートカットから起動する
> library(radiant)
> radiant()
5 データの読み込み
5.1 サンプルデータの読み込み
Radiantには起動時点で diamonds と titanic
データセットが読み込まれている
その他、examples データを読み込み、多数のサン
プルデータセットを使用可能
5.2 CSVファイルの読み込み
 ローカルのファイルまたはURLから、CSVファイルを読み込める
 区切り文字、見出し行の有無、読み込む行数なども指定可能
5.3 クリップボードからの読み込み
 Excelなどのデータについては、クリップボード経由でも読み込める
6 データの観察
 高度なデータ分析も、まずはデータを眺めるところから
 Radiantでは、グラフによる可視化と、ピボットテーブルによる集計が簡単にできる
7 データの可視化
 Radiantでは、ヒストグラム、確率密度曲線、散布図、3D曲面プロット、
折れ線グラフ、棒グラフ、箱ひげ図を描くことができる
 軸やラベル、外観のテーマ設定などもGUIで選択、設定できる
8 データの集計
8.1 ピボットテーブル
 ピボットテーブルも集計軸を選択するだけで簡単に作成できる
 平均以外に標準偏差、尖度、歪度、四分位数など様々な観点で集計可能
8.2 集計関数の適用
 "Explore" タブでデータをグループ化し、様々な集計関数を適用して観察できる
9 データの加工
 "Transform" タブで既存のデータを加工し、新しい列を追加するなどができる
 "Combine" タブで複数のデータフレームを結合 (Join) できる
10 モデリング
10.1 回帰モデル
 "Model" - "Estimate" - "Linear Regression" から様々なパラメータを選択
して回帰モデルを作成できる
 モデルの精度評価も、数値とグラフをGUIで操作して行える
10.2 分類モデル (1)
 "Logistic Regression" など、いくつかの分類アルゴリズムをサポートしている
10.2 分類モデル (2)
 決定木のプロットも簡単にできる
11 多変量解析
11.1 クラスタリング
 "Multivariate" - "Cluster" でクラスタリングができる
 k-means法、階層的クラスタリングに対応している
11.2 因子分析
 "Multivariate" - "Factor" で因子分析ができる
 最尤法、主成分分析による方法 (?) が選択でき、多くの回転法をサポートする
11.3 コンジョイント分析
 マーケティングにおいて、最適な商品設計をする際の判断基準として行われる
 "Multivariate" - "Conjoint" で容易に実行可能
12 レポートの作成
 ここまでGUIで行ってきた操作の結果をRMarkdownで書き出せる
 日本語にも対応しており、様々な形式でエクスポート可能
13 まとめ
Radiantは "Business analytics" のためのRパッケージ
インストール、アップデートは関数1つで簡単
RStudioのアドインとして動作する
可視化、集計がGUIで簡単にできる
回帰、分類、クラスタリングなど一般的なデータ分析手法を
サポートしている
操作の結果をRMarkdownで書き出せる

78th Tokyo.R Radiantによるデータ分析入門