Cloud Onr
Cloud OnAir
Cloud OnAir
そのデータ、今すぐ分析したくありませんか?
クラウドを活用したリアルタイムなデータ分析方法を
お教えします
2018 年 5 月 17 日 放送 e-Learning 補助資料
Agenda
Cloud OnAir
1
3
2
4
振り返り
E-learning その1 (BigQuery)
E-learning その2 (Dataprep)
まとめ
Cloud OnAir
Cloud OnAir
振り返り
Cloud OnAir
おさらい:データウェアハウスとデータレイク
データ レイク データ ウェアハウス
Cloud OnAir
データ分析から分析結果の活用までの流れ
アドホック分析 定型分析
統計分析の
アプリケーション
ダッシュボード
データウェアハウス
● アドホック分析によってデータに対して仮説検証を実行
● アドホック分析の結果、有用性が認められたものが
定型分析として定期的に実行
機械学習の
アプリケーション
Cloud OnAir
データパイプライン
● バッチ処理やストリーム処理を組み合わせて実現されるデータ処理の全体像
バッチ処理
ストリーム処理
DB
DB
ファイル
ログデータ 処理結果
Cloud OnAir
GCP でパイプラインを実現するには?
データウェアハウス データレイク
メッセージング基盤 バッチ処理・ストリーム処理
BigQuery Cloud Storage
Cloud Pub/Sub Cloud Dataflow
Cloud OnAir
Cloud OnAir
本日の手順(BigQuery)
Cloud OnAir
GCS から BigQuery へのデータインポート
CSVファイル
1. CSV ファイルを GCS にアップロード(前回実施済み)
2. GCS 上のファイルを BigQuery にインポート
3. インポートしたデータに対してクエリを発行
1 2
3
Cloud OnAir
BigQuery の基本構造
Dataset
table
table
table
・・・
・・・
Project
Dataset
table
table
table
・・・
Cloud OnAir
前回 GCS にアップロードしたデータ
Cloud OnAir
GCS から BigQuery へのインポート
▼ボタンをクリック ▼ボタンをクリック
データセットの作成 テーブルの作成
Cloud OnAir
GCS から BigQuery へのインポート
Automatically detect にチェック
Cloud OnAir
GCS から BigQuery へのインポート
インポート処理の確認
Cloud OnAir
GCS から BigQuery へのインポート
インポート結果の確認
Cloud OnAir
GCS から BigQuery へのインポート
実際にクエリを発行してみる
Cloud OnAir
Cloud OnAir
本日の手順(Dataprep)
Cloud OnAir
Dataprep によるパイプライン処理
1. 2 以降の手順を Dataprep で設定
2. CSV ファイルを Dataflow にロード
3. Dataflow で ETL 処理
4. ETL 処理結果を BigQuery にロード
2
3
4
1
Cloud OnAir
1. 処理対象となる入力データセットの登録
2. 処理全体を表すフローを登録
3. フロー内に処理を表すレシピを登録
4. 処理結果の出力先を登録
5. フローの実行( Dataflow のジョブとして実行 )
Dataprep の基本的な流れ
Cloud OnAir
Dataprep によるパイプライン処理
Cloud OnAir
Dataprep によるパイプライン処理
処理対象データの登録
Cloud OnAir
Dataprep によるパイプライン処理
処理対象データの登録
Cloud OnAir
Dataprep によるパイプライン処理
Cloud OnAir
Dataprep によるパイプライン処理
Cloud OnAir
Dataprep によるパイプライン処理
パイプライン処理の設定
Cloud OnAir
Dataprep によるパイプライン処理
Cloud OnAir
Dataprep によるパイプライン処理
パイプライン処理の設定
Cloud OnAir
Dataprep によるパイプライン処理
Cloud OnAir
Dataprep によるパイプライン処理
パイプライン処理の設定
Cloud OnAir
Dataprep によるパイプライン処理
パイプライン処理の設定
Cloud OnAir
Dataprep によるパイプライン処理
Cloud OnAir
Dataprep によるパイプライン処理
Cloud OnAir
Dataprep によるパイプライン処理
Cloud OnAir
Dataprep によるパイプライン処理
出力先の設定
Cloud OnAir
Dataprep によるパイプライン処理
出力先の設定
Cloud OnAir
Dataprep によるパイプライン処理
出力先の設定
Cloud OnAir
Dataprep によるパイプライン処理
出力先の設定
Cloud OnAir
Dataprep によるパイプライン処理
実行中のジョブの確認
Cloud OnAir
Dataprep によるパイプライン処理
実行中のジョブの確認
Cloud OnAir
Dataprep によるパイプライン処理
実行中のジョブの確認
Cloud OnAir
Dataprep によるパイプライン処理
実行中のジョブの確認
Cloud OnAir
Dataprep によるパイプライン処理
結果の確認
Cloud OnAir
Dataprep によるパイプライン処理
実行中のジョブの確認
Cloud OnAir
Cloud OnAir
まとめ
Cloud OnAir
● データパイプラインの振り返り
● BigQuery によるアドホック分析
● Dataprep によるデータパイプラインの実現
本日のまとめ

[Cloud OnAir] そのデータ、今すぐ分析したくありませんか? クラウドを活用したリアルタイムなデータ分析の方法をお教えします (e-Learning) 2018年5月17日 放送