SlideShare a Scribd company logo
1 of 25
「ビジネス活用事例で学ぶ
データサイエンス入門」輪読会 #7
25 PAGES
Shintaro Nomura
R で 学 ぶ
2016.05.13 @ Akiba Code
使用テキストとソースコードの場所 2
「ビジネス活用事例で学ぶ
データサイエンス入門」
http://amzn.to/1Y73Y52
(kindle版あり)
使用データおよび
ソースコードのDL
SBクリエイティブサイト
http://www.sbcr.jp/support/11915.html
データ分析の模範フロー(復習)
現状と
あるべ
き姿
問題
発見
データ
収集と
加工
データ
分析
アク
ション
3
ギャップから
問題の構造を把握
データ分析を活用した機能の実装
今回の分析ストーリー
目的 チーム内で同時間帯にゲームを遊んでいる人が多くなるよう
にプレイヤーにチーム編成をさせたい
分析アプローチ 過去のサービス利用状況から、ユーザごとに翌日サービスを
利用する時間帯の予測を行う
アクション 分析結果をもとに、同じ時間帯にアクセスするであろうユー
ザ同士でチームを作らせる
4
安定期に入った自社開発ゲームあるある
PDCA回したくなりがち
Plan(企画)→Do(実施)→Check(検証)→Action(改善)
新企画:チーム編成のサジェスト機能
中間データ読み込み用の関数の作成 5
readActionHourly <- function(app.name, date.from, date.to) {
date.from <- as.Date(date.from)
date.to <- as.Date(date.to)
ldply(foreach(day = seq.Date(date.from, date.to, by = "day"),
combine = rbind) %do%
{
f <- sprintf("sample-
data/section10/action_hourly/%s/%s/action_hourly.tsv“
, app.name, day)
read.csv(f, header = T, stringsAsFactors = F, sep = "t")
})
}
あくまでデータの読み込みを統一的に処理するための関数を作成しているだけ。
・readActionHourlyは処理方法を指定する関数(function)となっている
・as.Dateは()内のデータ型式を日付型データに変換するコマンド
・foreachとldplyを使ってforループの記述から脱却しよう - kensuke-miの日記
sprintf関数と「function」
sprintf("まず %s, その次に %s", "最初の文字列", "次の文字列")
[1] "まず 最初の文字列, その次に 次の文字列"
6
hello <- function(name){
+ print(sprintf("Hello %s", name))
+ }
hello(“ジャニーさん”) #定義した関数で出力
[1] "Hello ジャニーさん"
詳しくは
・「みんなのR データ分析と統計解析の新しい
教科書」第8章
・RPubs - R の文字列結合が面倒くさいので色々
考えてみた
実際に実行してみた方が理解が早い
action.hourly
<- readActionHourly("game-01", "2013-08-01", "2013-08-08")
head(action.hourly)
functionにより定義したreadActionHourly関数を使用し、app.name, date.from,
date.toを指定した上で、「sample-data/section10/action_hourly/%s/%s/
action_hourly.tsv」を読み込んでみた結果
そもそもの「sample-data/section10/action_hourly/」以下の構造
7
時間帯が列になるように整形
dates <- unique(action.hourly$log_date)
train.list <- lapply(1:(length(dates) - 1), function(i) {
day <- dates[i]
x <- action.hourly[action.hourly$log_date == day, ]
df <- dcast(x, user_id ~ log_hour, value.var = "count",
function(x) {ifelse(sum(x) >= 7, 1, 0)}
)
names(df) <- c("user_id", paste0("p", i, "_", 0:23))
df})
head(train.list[[1]])
過去の下処理の集大成みたいなコードが続きますが、いくつかは#5資料を参照
ください
http://www.slideshare.net/ShintaroNomura/5-59987223
applyファミリー | apply,sapply,lapplyの使い方とその例
length(XXX): XXXの中にある要素の個数
dates[k]: 「dates」のk番目の要素を取り出す
x <- action.hourly[action.hourly$log_date == day, ]:
8
print(dates)
[1] "2013-08-01"
"2013-08-02"
"2013-08-03"
"2013-08-04"
"2013-08-05"
"2013-08-06"
"2013-08-07"
"2013-08-08"
Rにおけるforループ
for(i in 1:10){
print(i)
}
出力結果:
[1] 1
[1] 2
[1] 3
[1] 4
[1] 5
[1] 6
[1] 7
[1] 8
[1] 9
[1] 10
9
同じ曜日の別の日のデータと結合
# 説明(変数)用のデータを作成
train.data <- train.list[[1]]
for (i in 2:length(train.list)) {
df <- train.list[[i]] # train.list[2] ~ train.list[7] をdfに格納→新 train.data にマージ
train.data <- merge(train.data, df, by = "user_id", all.x = T)
train.data[is.na(train.data)] <- 0 }
names(train.data)
# 答えとなるデータを作成
ans0 <- action.hourly[action.hourly$log_date == dates[length(dates)], ]
# 時間帯が列になるように整形
ans <- dcast(ans0, user_id ~ log_hour, value.var = "count", function(x) {
ifelse(sum(x) >= 7, 1, 0)
})
names(ans) <- c("user_id", paste0("a_", 0:23))
# 説明用のデータとくっつける
train.data <- merge(train.data, ans, by = "user_id", all.x = T)
train.data[is.na(train.data)] <- 0
names(train.data)
10
この場合、「2013-08-08」になる
最終train.data
head(train.data)
・train.data と ans がマージされた最終 train.data
※画像はテキストp.244より
11
今回の分析アプローチ(おさらい)
今回の分析ストーリー
目的
チーム内で同時間帯にゲームを遊んでいる人
が多くなるようにプレイヤーにチーム編成を
させたい
分析
アプローチ
過去のサービス利用状況から、ユーザごとに
翌日サービスを利用する時間帯の予測を行う
アクション
分析結果をもとに、同じ時間帯にアクセス
するであろうユーザ同士でチームを作らせる
12
予測モデル構築 → 検証 → 予測モデルを分析アルゴリズムに実装
予測モデルの構築
 予測モデルの構築がそもそも可能か?
扱うデータに「規則性」「まとまり」が存在しない
ならばモデル構築は厳しい
 ノイズの除去
ビジネスデータにはノイズが多く、モデリングに悪
影響を及ぼす可能性も
 利用ツールの選定
構築モデルにどのツールを用いるべきか予想がつか
ない場合は、なるべく多くのツールで実際に検証
13
分類モデルの性能比較(利用ツールの選定)
複数のツール同士の性能を比較する方法
は、分析者が構築したいモデルへのニー
ズ(正解率が高い方が良いとか、不正解
を極力減らしたいとか etc…)によって、
用いる指標が異なる
今回は指標にF1-measure(値)を使用し
ている
14
F1-measure(値)
𝐹1‐ 𝑚𝑒𝑎𝑠𝑢𝑟𝑒 =
2 𝑅𝑒𝑐𝑎𝑙𝑙 ∗𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛
1
𝑅𝑒𝑐𝑎𝑙𝑙
+
1
𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛
Recall = 正解率( TP+TN / 全体 )
Precision = 適合率( TP / 陽性判定全体)
逆相関になりやすいので調和平均をとる
15
正解は「1」 正解は「0」
予測が「1」 TP(真陽性) FP(偽陽性)
予測が「0」 FN(偽陰性) TN(真陰性)
F値基準によるノイズの除去
F1値を使用して分類モデルにおけるノイ
ズの閾値を決定(直近3日間PV≧7だと翌
日訪問/同PV<7だと来ないモデル)
これにより、同PVが7未満の箇所をノイ
ズと決定し、そのデータを0に換える
16
決定木
第9章(今回はスルー)では、決定木を
用いた分析が行われた(p.215)
17
決定木:分類と回帰
分類ルールを木構造で表したもの
目的変数がカテゴリデータなどの場合は
「分類木」、連続値などの量的データの
場合は「回帰木」と呼ばれる
参考:決定木 – 分類木 | トライフィールズ
⇨ひとまずRで動かして見てみましょう
ソースコード
18
「タイタニック」データと決定木
タイタニック号事故で生死を分けた要因
を属性情報から分類(「分類木」)
19
ランダムフォレスト
集団(アンサンブル)学習のひとつ
ランダムに抽出した決定木を複数つくり、
その中から精度の高いモデルを1つ作成
する手法
今回のコードでは、”e1071”というパッ
ケージが必要になるかも
20
randomForestとクロスバリデーション
# 学習のカスタマイズ
fit.control <- trainControl(method = "LGOCV", p = 0.75, number = 30)
リサンプリング方法:Leave-Group-Out クロスバリデーション
p:LGO クロスバリデーションにて学習(訓練)に用いるデータの割合
number:指定したリサンプリング方法において学習を繰り返す回数
21
Wikipedia: クロスバリデーション
交差検証(英: Cross-validation)とは、統計学において標本データを分割し、
その一部をまず解析して、残る部分でその解析のテストを行い、解析自身の妥
当性の検証・確認に当てる手法を指す。
データの解析(および導出された推定・統計的予測)がどれだけ本当に母集団
に対処できるかを良い近似で検証・確認するための手法である。
最初に解析するデータを「訓練事例集合(training set)」などと呼び、他の
データを「テスト事例集合(testing set、テストデータ)」などと呼ぶ。
randomForestによる学習コード
# ランダムフォレストによる学習
rf.fit.list <- lapply(0:23, function(h) {
df <- train.data[, c(paste0("p", 1:7, "_", h), paste0("a_", h))]
df1 <- df[df[, ncol(df)] == 1, ]
df0.orig <- df[df[, ncol(df)] == 0, ]
df0 <- df0.orig[sample(1:nrow(df0.orig), nrow(df1)), ]
df <- rbind(df1, df0)
fit <- train(x=df[, -ncol(df)], y=df[, ncol(df)],
method = "rf", preProcess = c("center", "scale"),
trControl = fit.control)
fit
})
ncol(XXX): XXXの行数(n×m次元であるXXXベクトルにおけるn)
nrow(XXX): XXXの列数(n×m次元であるXXXベクトルにおけるm)
train(): 予測モデルのフィッティングを行う関数({caret} が必要)
method:予測方法の指定(rf = ランダムフォレスト)
trControl:trainingデータをどうやって選ぶか(fit.control にて指定済み)
22
構築された最終モデルによる予測精度
# 作成したモデルの予測値と実際の値との比較結果の表示
for (i in 0:23) {
result.rf <- predict(rf.fit.list[[(i + 1)]]$finalModel, train.data)
result.rf.pred <- ifelse(result.rf >= 0.5, 1, 0)
print(confusionMatrix(result.rf.pred, train.data[, paste0("a_",
i)]))
}
Confusion Matrix and Statistics ( i = 0 のとき;結果はモデル計算の都度変わる)
Accuracy : 0.815 ←( 389 + 47 ) / ( 389 + 20 + 79 + 47 )
95% CI : (0.7794, 0.847)
No Information Rate : 0.8748
P-Value [Acc > NIR] : 1
… (こうした結果が各時間帯ごとに出力される:最終的に26×24行出力)
23
Prediction\Reference
正解は「1」 正解は「0」
予測が「1」 389 20
予測が「0」 79 47
アクション(10.5)
 テキストでは、構築された予測モデルの精度に問
題がないとの判断から、それにより各ユーザごと
に「翌日どの時間帯にどの程度の確率でゲームを
利用するか」を出力するアルゴリズムを実装
 その出力データに基づき、各ユーザが入るチーム
探しの際に、翌日そのユーザが来た際にアクティ
ブユーザー率が高くなる確率が高いチームを推薦
する機能を導入することにした
24
長期間おつかれさまでした
Q. 今後、当グループで学習したいこと(n=11; 最終回の参加希望者・回答者)
以下の書籍をクリックするとAmazonに飛びます。
25
1 2 3
11 9 7

More Related Content

What's hot

データベース09 - データベース設計
データベース09 - データベース設計データベース09 - データベース設計
データベース09 - データベース設計Kenta Oku
 
さくっとはじめるテキストマイニング(R言語)  スタートアップ編
さくっとはじめるテキストマイニング(R言語)  スタートアップ編さくっとはじめるテキストマイニング(R言語)  スタートアップ編
さくっとはじめるテキストマイニング(R言語)  スタートアップ編Yutaka Shimada
 
20140708 オンラインゲームソリューション
20140708 オンラインゲームソリューション20140708 オンラインゲームソリューション
20140708 オンラインゲームソリューションTakahiro Inoue
 
RedisのBitCountとHyperLogLogを使用した超高速Unique User数集計
RedisのBitCountとHyperLogLogを使用した超高速Unique User数集計RedisのBitCountとHyperLogLogを使用した超高速Unique User数集計
RedisのBitCountとHyperLogLogを使用した超高速Unique User数集計tmatsuura
 
データベース11 - データベースとプログラム
データベース11 - データベースとプログラムデータベース11 - データベースとプログラム
データベース11 - データベースとプログラムKenta Oku
 
Big Data Bootstrap (ICML読み会)
Big Data Bootstrap (ICML読み会)Big Data Bootstrap (ICML読み会)
Big Data Bootstrap (ICML読み会)正志 坪坂
 
MP Joinを使った類似データ抽出
MP Joinを使った類似データ抽出MP Joinを使った類似データ抽出
MP Joinを使った類似データ抽出JAVA DM
 
最近のRのランダムフォレストパッケージ -ranger/Rborist-
最近のRのランダムフォレストパッケージ -ranger/Rborist-最近のRのランダムフォレストパッケージ -ranger/Rborist-
最近のRのランダムフォレストパッケージ -ranger/Rborist-Shintaro Fukushima
 
ルールベースから機械学習への道 公開用
ルールベースから機械学習への道 公開用ルールベースから機械学習への道 公開用
ルールベースから機械学習への道 公開用nishio
 
機械学習 / Deep Learning 大全 (2) Deep Learning 基礎編
機械学習 / Deep Learning 大全 (2) Deep Learning 基礎編機械学習 / Deep Learning 大全 (2) Deep Learning 基礎編
機械学習 / Deep Learning 大全 (2) Deep Learning 基礎編Daiyu Hatakeyama
 
エンジニアのための機械学習の基礎
エンジニアのための機械学習の基礎エンジニアのための機械学習の基礎
エンジニアのための機械学習の基礎Daiyu Hatakeyama
 
DeltaCubeにおけるユニークユーザー集計高速化(理論編)
DeltaCubeにおけるユニークユーザー集計高速化(理論編)DeltaCubeにおけるユニークユーザー集計高速化(理論編)
DeltaCubeにおけるユニークユーザー集計高速化(理論編)BrainPad Inc.
 
機械学習を用いた予測モデル構築・評価
機械学習を用いた予測モデル構築・評価機械学習を用いた予測モデル構築・評価
機械学習を用いた予測モデル構築・評価Shintaro Fukushima
 
R超入門機械学習をはじめよう
R超入門機械学習をはじめようR超入門機械学習をはじめよう
R超入門機械学習をはじめよう幹雄 小川
 
オンラインゲームソリューション@トレジャーデータ
オンラインゲームソリューション@トレジャーデータオンラインゲームソリューション@トレジャーデータ
オンラインゲームソリューション@トレジャーデータTakahiro Inoue
 
トレジャーデータのバッチクエリとアドホッククエリを理解する
トレジャーデータのバッチクエリとアドホッククエリを理解するトレジャーデータのバッチクエリとアドホッククエリを理解する
トレジャーデータのバッチクエリとアドホッククエリを理解するTakahiro Inoue
 
[機械学習]文章のクラス分類
[機械学習]文章のクラス分類[機械学習]文章のクラス分類
[機械学習]文章のクラス分類Tetsuya Hasegawa
 
第2回 R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜相関分析による需要予測編〜
第2回 R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜相関分析による需要予測編〜第2回 R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜相関分析による需要予測編〜
第2回 R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜相関分析による需要予測編〜Yasuyuki Sugai
 

What's hot (20)

データベース09 - データベース設計
データベース09 - データベース設計データベース09 - データベース設計
データベース09 - データベース設計
 
さくっとはじめるテキストマイニング(R言語)  スタートアップ編
さくっとはじめるテキストマイニング(R言語)  スタートアップ編さくっとはじめるテキストマイニング(R言語)  スタートアップ編
さくっとはじめるテキストマイニング(R言語)  スタートアップ編
 
20140708 オンラインゲームソリューション
20140708 オンラインゲームソリューション20140708 オンラインゲームソリューション
20140708 オンラインゲームソリューション
 
RedisのBitCountとHyperLogLogを使用した超高速Unique User数集計
RedisのBitCountとHyperLogLogを使用した超高速Unique User数集計RedisのBitCountとHyperLogLogを使用した超高速Unique User数集計
RedisのBitCountとHyperLogLogを使用した超高速Unique User数集計
 
データベース11 - データベースとプログラム
データベース11 - データベースとプログラムデータベース11 - データベースとプログラム
データベース11 - データベースとプログラム
 
Big Data Bootstrap (ICML読み会)
Big Data Bootstrap (ICML読み会)Big Data Bootstrap (ICML読み会)
Big Data Bootstrap (ICML読み会)
 
StreamGraph
StreamGraphStreamGraph
StreamGraph
 
MP Joinを使った類似データ抽出
MP Joinを使った類似データ抽出MP Joinを使った類似データ抽出
MP Joinを使った類似データ抽出
 
最近のRのランダムフォレストパッケージ -ranger/Rborist-
最近のRのランダムフォレストパッケージ -ranger/Rborist-最近のRのランダムフォレストパッケージ -ranger/Rborist-
最近のRのランダムフォレストパッケージ -ranger/Rborist-
 
ルールベースから機械学習への道 公開用
ルールベースから機械学習への道 公開用ルールベースから機械学習への道 公開用
ルールベースから機械学習への道 公開用
 
機械学習 / Deep Learning 大全 (2) Deep Learning 基礎編
機械学習 / Deep Learning 大全 (2) Deep Learning 基礎編機械学習 / Deep Learning 大全 (2) Deep Learning 基礎編
機械学習 / Deep Learning 大全 (2) Deep Learning 基礎編
 
エンジニアのための機械学習の基礎
エンジニアのための機械学習の基礎エンジニアのための機械学習の基礎
エンジニアのための機械学習の基礎
 
Rで学ぶロバスト推定
Rで学ぶロバスト推定Rで学ぶロバスト推定
Rで学ぶロバスト推定
 
DeltaCubeにおけるユニークユーザー集計高速化(理論編)
DeltaCubeにおけるユニークユーザー集計高速化(理論編)DeltaCubeにおけるユニークユーザー集計高速化(理論編)
DeltaCubeにおけるユニークユーザー集計高速化(理論編)
 
機械学習を用いた予測モデル構築・評価
機械学習を用いた予測モデル構築・評価機械学習を用いた予測モデル構築・評価
機械学習を用いた予測モデル構築・評価
 
R超入門機械学習をはじめよう
R超入門機械学習をはじめようR超入門機械学習をはじめよう
R超入門機械学習をはじめよう
 
オンラインゲームソリューション@トレジャーデータ
オンラインゲームソリューション@トレジャーデータオンラインゲームソリューション@トレジャーデータ
オンラインゲームソリューション@トレジャーデータ
 
トレジャーデータのバッチクエリとアドホッククエリを理解する
トレジャーデータのバッチクエリとアドホッククエリを理解するトレジャーデータのバッチクエリとアドホッククエリを理解する
トレジャーデータのバッチクエリとアドホッククエリを理解する
 
[機械学習]文章のクラス分類
[機械学習]文章のクラス分類[機械学習]文章のクラス分類
[機械学習]文章のクラス分類
 
第2回 R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜相関分析による需要予測編〜
第2回 R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜相関分析による需要予測編〜第2回 R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜相関分析による需要予測編〜
第2回 R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜相関分析による需要予測編〜
 

Similar to 「ビジネス活用事例で学ぶ データサイエンス入門」輪読会#7資料

データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで Vm 1
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで Vm 1データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで Vm 1
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで Vm 1Shunsuke Nakamura
 
Pysparkで始めるデータ分析
Pysparkで始めるデータ分析Pysparkで始めるデータ分析
Pysparkで始めるデータ分析Tanaka Yuichi
 
『逆転オセロニア』における運用効率化支援 〜デッキログのデータマイニング〜
『逆転オセロニア』における運用効率化支援  〜デッキログのデータマイニング〜『逆転オセロニア』における運用効率化支援  〜デッキログのデータマイニング〜
『逆転オセロニア』における運用効率化支援 〜デッキログのデータマイニング〜DeNA
 
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V e-1
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V e-1データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V e-1
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V e-1Shunsuke Nakamura
 
TensorFlowをもう少し詳しく入門
TensorFlowをもう少し詳しく入門TensorFlowをもう少し詳しく入門
TensorFlowをもう少し詳しく入門tak9029
 
【3時間で学ぶ! スモールサクセス型 『カスタマージャーニー分析』】 slideshare公開用
【3時間で学ぶ! スモールサクセス型『カスタマージャーニー分析』】 slideshare公開用【3時間で学ぶ! スモールサクセス型『カスタマージャーニー分析』】 slideshare公開用
【3時間で学ぶ! スモールサクセス型 『カスタマージャーニー分析』】 slideshare公開用Akihiko Uchino
 
Spanner移行について本気出して考えてみた
Spanner移行について本気出して考えてみたSpanner移行について本気出して考えてみた
Spanner移行について本気出して考えてみたtechgamecollege
 
Azure Machine Learning Services 概要 - 2019年3月版
Azure Machine Learning Services 概要 - 2019年3月版Azure Machine Learning Services 概要 - 2019年3月版
Azure Machine Learning Services 概要 - 2019年3月版Daiyu Hatakeyama
 
【IISAテクニカルカンファレンス2014】 オープンデータ×オープンソース ~WEB上でのインタラクティブ可視化手法について~
【IISAテクニカルカンファレンス2014】 オープンデータ×オープンソース ~WEB上でのインタラクティブ可視化手法について~【IISAテクニカルカンファレンス2014】 オープンデータ×オープンソース ~WEB上でのインタラクティブ可視化手法について~
【IISAテクニカルカンファレンス2014】 オープンデータ×オープンソース ~WEB上でのインタラクティブ可視化手法について~中洞 友希
 
クラウド上のデータ活用デザインパターン
クラウド上のデータ活用デザインパターンクラウド上のデータ活用デザインパターン
クラウド上のデータ活用デザインパターンAmazon Web Services Japan
 
Big data解析ビジネス
Big data解析ビジネスBig data解析ビジネス
Big data解析ビジネスMie Mori
 
運用中のゲームにAIを導入するには〜プロジェクト推進・ユースケース・運用〜 [DeNA TechCon 2019]
運用中のゲームにAIを導入するには〜プロジェクト推進・ユースケース・運用〜 [DeNA TechCon 2019]運用中のゲームにAIを導入するには〜プロジェクト推進・ユースケース・運用〜 [DeNA TechCon 2019]
運用中のゲームにAIを導入するには〜プロジェクト推進・ユースケース・運用〜 [DeNA TechCon 2019]DeNA
 
【日商USA】Webinar 2023.12.13 AWS re:Invent ハイライト ~データ活用の最先端を垣間見る~
【日商USA】Webinar 2023.12.13 AWS re:Invent ハイライト ~データ活用の最先端を垣間見る~【日商USA】Webinar 2023.12.13 AWS re:Invent ハイライト ~データ活用の最先端を垣間見る~
【日商USA】Webinar 2023.12.13 AWS re:Invent ハイライト ~データ活用の最先端を垣間見る~NISSHO USA
 
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しようMicrosoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しようHideo Takagi
 
Oracle Data Minerハンズオンセミナー170927:②Oracle data minerハンズオン資料
Oracle Data Minerハンズオンセミナー170927:②Oracle data minerハンズオン資料Oracle Data Minerハンズオンセミナー170927:②Oracle data minerハンズオン資料
Oracle Data Minerハンズオンセミナー170927:②Oracle data minerハンズオン資料オラクルエンジニア通信
 
ElasticSearch勉強会 第6回
ElasticSearch勉強会 第6回ElasticSearch勉強会 第6回
ElasticSearch勉強会 第6回Naoyuki Yamada
 
Splunk 7.0の概要及び新機能
Splunk 7.0の概要及び新機能Splunk 7.0の概要及び新機能
Splunk 7.0の概要及び新機能Kunihiko Ikeyama
 
おしゃスタ@リクルート
おしゃスタ@リクルートおしゃスタ@リクルート
おしゃスタ@リクルートIssei Kurahashi
 
分散グラフデータベース DataStax Enterprise Graph
分散グラフデータベース DataStax Enterprise Graph分散グラフデータベース DataStax Enterprise Graph
分散グラフデータベース DataStax Enterprise GraphYuki Morishita
 
Amazon Kinesis Analytics によるストリーミングデータのリアルタイム分析
Amazon Kinesis Analytics によるストリーミングデータのリアルタイム分析Amazon Kinesis Analytics によるストリーミングデータのリアルタイム分析
Amazon Kinesis Analytics によるストリーミングデータのリアルタイム分析Amazon Web Services Japan
 

Similar to 「ビジネス活用事例で学ぶ データサイエンス入門」輪読会#7資料 (20)

データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで Vm 1
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで Vm 1データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで Vm 1
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで Vm 1
 
Pysparkで始めるデータ分析
Pysparkで始めるデータ分析Pysparkで始めるデータ分析
Pysparkで始めるデータ分析
 
『逆転オセロニア』における運用効率化支援 〜デッキログのデータマイニング〜
『逆転オセロニア』における運用効率化支援  〜デッキログのデータマイニング〜『逆転オセロニア』における運用効率化支援  〜デッキログのデータマイニング〜
『逆転オセロニア』における運用効率化支援 〜デッキログのデータマイニング〜
 
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V e-1
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V e-1データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V e-1
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V e-1
 
TensorFlowをもう少し詳しく入門
TensorFlowをもう少し詳しく入門TensorFlowをもう少し詳しく入門
TensorFlowをもう少し詳しく入門
 
【3時間で学ぶ! スモールサクセス型 『カスタマージャーニー分析』】 slideshare公開用
【3時間で学ぶ! スモールサクセス型『カスタマージャーニー分析』】 slideshare公開用【3時間で学ぶ! スモールサクセス型『カスタマージャーニー分析』】 slideshare公開用
【3時間で学ぶ! スモールサクセス型 『カスタマージャーニー分析』】 slideshare公開用
 
Spanner移行について本気出して考えてみた
Spanner移行について本気出して考えてみたSpanner移行について本気出して考えてみた
Spanner移行について本気出して考えてみた
 
Azure Machine Learning Services 概要 - 2019年3月版
Azure Machine Learning Services 概要 - 2019年3月版Azure Machine Learning Services 概要 - 2019年3月版
Azure Machine Learning Services 概要 - 2019年3月版
 
【IISAテクニカルカンファレンス2014】 オープンデータ×オープンソース ~WEB上でのインタラクティブ可視化手法について~
【IISAテクニカルカンファレンス2014】 オープンデータ×オープンソース ~WEB上でのインタラクティブ可視化手法について~【IISAテクニカルカンファレンス2014】 オープンデータ×オープンソース ~WEB上でのインタラクティブ可視化手法について~
【IISAテクニカルカンファレンス2014】 オープンデータ×オープンソース ~WEB上でのインタラクティブ可視化手法について~
 
クラウド上のデータ活用デザインパターン
クラウド上のデータ活用デザインパターンクラウド上のデータ活用デザインパターン
クラウド上のデータ活用デザインパターン
 
Big data解析ビジネス
Big data解析ビジネスBig data解析ビジネス
Big data解析ビジネス
 
運用中のゲームにAIを導入するには〜プロジェクト推進・ユースケース・運用〜 [DeNA TechCon 2019]
運用中のゲームにAIを導入するには〜プロジェクト推進・ユースケース・運用〜 [DeNA TechCon 2019]運用中のゲームにAIを導入するには〜プロジェクト推進・ユースケース・運用〜 [DeNA TechCon 2019]
運用中のゲームにAIを導入するには〜プロジェクト推進・ユースケース・運用〜 [DeNA TechCon 2019]
 
【日商USA】Webinar 2023.12.13 AWS re:Invent ハイライト ~データ活用の最先端を垣間見る~
【日商USA】Webinar 2023.12.13 AWS re:Invent ハイライト ~データ活用の最先端を垣間見る~【日商USA】Webinar 2023.12.13 AWS re:Invent ハイライト ~データ活用の最先端を垣間見る~
【日商USA】Webinar 2023.12.13 AWS re:Invent ハイライト ~データ活用の最先端を垣間見る~
 
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しようMicrosoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
 
Oracle Data Minerハンズオンセミナー170927:②Oracle data minerハンズオン資料
Oracle Data Minerハンズオンセミナー170927:②Oracle data minerハンズオン資料Oracle Data Minerハンズオンセミナー170927:②Oracle data minerハンズオン資料
Oracle Data Minerハンズオンセミナー170927:②Oracle data minerハンズオン資料
 
ElasticSearch勉強会 第6回
ElasticSearch勉強会 第6回ElasticSearch勉強会 第6回
ElasticSearch勉強会 第6回
 
Splunk 7.0の概要及び新機能
Splunk 7.0の概要及び新機能Splunk 7.0の概要及び新機能
Splunk 7.0の概要及び新機能
 
おしゃスタ@リクルート
おしゃスタ@リクルートおしゃスタ@リクルート
おしゃスタ@リクルート
 
分散グラフデータベース DataStax Enterprise Graph
分散グラフデータベース DataStax Enterprise Graph分散グラフデータベース DataStax Enterprise Graph
分散グラフデータベース DataStax Enterprise Graph
 
Amazon Kinesis Analytics によるストリーミングデータのリアルタイム分析
Amazon Kinesis Analytics によるストリーミングデータのリアルタイム分析Amazon Kinesis Analytics によるストリーミングデータのリアルタイム分析
Amazon Kinesis Analytics によるストリーミングデータのリアルタイム分析
 

「ビジネス活用事例で学ぶ データサイエンス入門」輪読会#7資料