SlideShare a Scribd company logo
1 of 47
Download to read offline
Confidential & Proprietary
Google Cloud ベストプラクティス
Google BigQueryData ingestion into BigQuery / Writing Queries in BigQuery
/ Data extraction and exportation from BigQuery
Google Cloud カスタマーエンジニア
Confidential & Proprietary
Agenda
● Data Ingestion into BigQuery
● Writing Queries in BigQuery
● Data extraction and exportation
from BigQuery
Google Cloud ベストプラクティス Google BigQuery
※このスライドは 2017 年 12 月時点の情報に基づき作成しています。最新情報は Google Cloud Platform のドキュメントをご参照ください。
 https://cloud.google.com/docs/
Confidential & Proprietary
Google Cloud ベストプラクティス Google BigQuery
Data Ingestion into BigQuery
Google Cloud ベストプラクティス Google BigQuery
Confidential & Proprietary
Cloud Logs
Google App Engine
Google Analytics
Premium
Cloud Pub/Sub
BigQuery Storage
(tables)
Cloud Bigtable
(NoSQL)
Cloud Storage
(files)
BigQuery Analytics
(SQL)
Capture Store Analyze
Batch
Cloud DataStore
Process
Stream
Cloud Monitoring
Cloud
Bigtable
Real time analytics
and Alerts
Cloud Dataflow
Cloud Dataproc
Cloud Dataproc
In some cases data can end
up in storage and then again
be processed or enriched by
Cloud Dataflow
GCP におけるデータ処理
Google Cloud ベストプラクティス Google BigQuery
Confidential & Proprietary
<POST>
データソース
● Google Cloud Storage (GCS)
● アップロード (POST request)
● Google Cloud Datastore のバックアップ
● Google Analytics Premium
● Stackdriver Logging からのログエクスポート
● Firebase
Google Cloud ベストプラクティス Google BigQuery
Confidential & Proprietary
データの取り込み方法
Data Loading
● データをジョブでまとめて取り込む
Streaming Insert
● リアルタイムに近い方式でデータを取り込む
共通のポイント
● 両者ともクエリ実行環境とはリソース分離
● データ取り込み/クエリ実行のパフォーマンスは互いに影響しない
Google Cloud ベストプラクティス Google BigQuery
Confidential & Proprietary
jobid
データを一括で取り込む
Data Loading
● 実行自体は無料
○ (データのストレージには課金有 )
Google Cloud ベストプラクティス Google BigQuery
Confidential & Proprietary
データをストリーム
Streaming Insert
● 小規模かつ頻繁なテーブル更新は Data Loadingには向かない
● すぐにデータを見たいという場合も同様
● 有料 ($0.05/GB*month)
● Fluentdなどを利用して実装するのが楽
● データ増加してもジョブが終わらない、という心配がなくなる
Google Cloud ベストプラクティス Google BigQuery
Confidential & Proprietary
[Consistency|Availability|Speed|Cost] はトレードオフ:
Consistency Availability Speed Cost
Data Loading
スループット最適化
強整合性
Load Job が完了し
たらすぐ使える
Job が完了しない
と読み込めない
Free
Streaming Insert
レイテンシー最適化
結果整合性
Insert から分析ま
で数 ms 秒, Export
や Copy まで Max
90min
リアルタイム
$0.05/GB
*month
データ取り込み方法の選択
Google Cloud ベストプラクティス Google BigQuery
Confidential & Proprietary
Cloud
Pub/Sub
大規模データの取り込み
Data Loading
● Google Cloud Storage (GCS) を経由してロード
○ BigQuery の Loading Jobは Upload と Table への挿入の2要素
○ どちらかが失敗すると Upload からやり直しになる
○ そのため GCS を経由することが推奨される
○ 同リージョンの GCS - BigQuery のロードは Upload よりも非常に高速
Streaming Insert
● 10 万行/秒 * Project, 1 万行 / 秒 * Tableのクオータを超えないよう設計
○ 超えそうな場合は担当エンジニアに相談
○ Cloud Pub/Sub を利用してキューイング、スロットリング
○ リアルタイムに近い方式でデータを取り込む
https://cloud.google.com/bigquery/quota-policy
Google Cloud ベストプラクティス Google BigQuery
Confidential & Proprietary
大規模データの取り込み - クオータ
変更できないクオータはアーキテクチャ設計で対応
● ロードジョブの最大サイズ :
○ ファイルを分割, or 制限のより大きな形式に変更
○ Avro: block size で 16MB, CSV: row と cell で 2MB
● すべてのテーブルクオータ : Table を Shard
○ Streaming insert
■ maximum rows per second per table, maximum bytes per second per table
○ Load jobs
■ maximum number of loads per table per day
https://cloud.google.com/bigquery/quota-policy
Google Cloud ベストプラクティス Google BigQuery
Confidential & Proprietary
大規模データの取り込み - クオータ
https://cloud.google.com/bigquery/quota-policy
クオータ変更リクエスト : API Managerより実施
Google Cloud ベストプラクティス Google BigQuery
Confidential & Proprietary
Cloud
Dataflow
データの加工
Pub/Sub等からのロード, ETL処理を行いたい
● Cloud Dataflow , Cloud Dataprep を利用
Cloud Dataflow
● Batch, Streaming 処理を Apache Beam のコードで記述可能なマネージドサービス
● Cloud PubSub より BigQuery への挿入を行うためにも利用できる
● BigQuery UDF で並列実行できる数にヒットする場合にも検討
Cloud Dataprep
● GUI で利用できるデータ加工ツール
● レシピを作成し、 Engine として Dataflow がバッチで動作する
Google Cloud ベストプラクティス Google BigQuery
Confidential & Proprietary
Compute
App
Engine
Container
Engine
Compute
Engine
BigQuery
Stream Insert
Data Load
Stackdriver
Logging
Storage and Databases
Cloud
Storage
Cloud
Datastore
Cloud
Pub/Sub
Cloud
Dataflow
データ取り込みの実装 (GCP 内部)
Google Cloud ベストプラクティス Google BigQuery
Confidential & Proprietary
On Premise
Other Cloud Service
BigQuery
Stream Insert
Data Load
Logging
Storage and Databases
Cloud
Storage
Server
Instance
Cloud
Storage
SQL
Database
Cloud
Pub/Sub
Bq
Command,
3rd pary tools
etc.
Storage
Transfer
Service
Cloud
Dataflow
データ取り込みの実装 (GCP 外部)
Google Cloud ベストプラクティス Google BigQuery
Confidential & Proprietary
データの取り込み方法の選択 - まとめ
Data Loading
● リアルタイム分析をしないデータに適用
● バッチでの分析データ更新 /追加を許容
● ジョブの処理に時間がかかるようになったらどうするかを考慮する
● クリティカルなロードには Federated Query (後述) によるロードも検討
Streaming Insert
● ジョブが回しきれない規模 /リアルタイム分析が必要なデータに適用
● 結果整合性であることを考慮する
● データ量爆発に備え Pub/Sub を緩衝材として利用することも考慮する
どちらの場合も制限があるので確認をしておく
https://cloud.google.com/bigquery/quota-policy
Google Cloud ベストプラクティス Google BigQuery
Confidential & Proprietary
{JSON}
BigQuery ドキュメント - 読み込み用のデータを準備する
CSV
データフォーマット
データフォーマット
● CSV
● JSON
● Apache Avro [Beta]
圧縮の有無
● 非圧縮
● gzip [Avroは対象外]
エンコードについての制約もあるので確認する
Google Cloud ベストプラクティス Google BigQuery
Confidential & Proprietary
データフォーマットのベストプラクティス
ロードの高速化:
● Avro はロードが 10 倍程度高速
● CSV の場合は Encode を UTF-8 にする
○ ISO-8859-1 などの場合、BigQuery で変換処理が行われるので遅くなる
● 非圧縮でロードする
○ gzip はロードパフォーマンスが落ちる
Google Cloud ベストプラクティス Google BigQuery
Confidential & Proprietary
マスタデータの更新のベストプラクティス
3 つの選択肢
● BigQuery のテーブルを delete して再度ロード
○ データ更新が多い際に利用
● Data Loading を利用して追加
○ WRITE_APPEND モードで、追記してロード
○ 更新されたマスタのレコードを timestamp 付きで Loading
○ Timestamp が最新のマスタを表示する View を作る
● DML で更新
○ DML の Quota にかからないか確認して設計
Google Cloud ベストプラクティス Google BigQuery
Confidential & Proprietary
Direct query
Paying it Forward — How BigQuery’s Data Ingest Breaks Tech Norms
外部データソースの解析
フェデレーション データソース
● BigQuery 自身のストレージではない場所に格納されたデータをクエリできる機能
● データ取り込みの必要なく手軽に分析
● ロードの代わりに高速な有料ロード としても利用可
● 対象ソース
○ Google Cloud Storage
○ Google Drive
○ Cloud BigTable
● 制限
○ クエリ実行速度はネイティブより遅い
○ クエリ実行中にデータの整合性が保証されない
参考: Creating and Querying Federated Data Sources
Confidential & Proprietary
Google Cloud ベストプラクティス Google BigQuery
Writing Queries in BigQuery
Google Cloud ベストプラクティス Google BigQuery
Confidential & Proprietary
BigQuery におけるクエリ
Legacy SQL
● SELECT のみサポート
● ビッグデータ解析のために独自に拡張
Standard SQL ( 2016 年 9 月 GA, 新機能追加のため推奨 )
● SQL 2011準拠
● DML (Data Manipulation Language) 対応
Google Cloud ベストプラクティス Google BigQuery
Confidential & Proprietary
● SELECT のみ
● SQL ライクな構文 (ビッグデータを扱うために拡張 )
● クエリ対象のテーブル指定
○ カンマによる UNION
○ テーブルワイルドカード関数
● ネストテーブル
● 集計関数
○ テーブル集計、グループ集計、スコープ集計
● 日付/時刻関数
● IP 関数, URL 関数
● JSON 関数 / 正規表現関数
● 文字列関数
● ウィンドウ関数
Legacy SQLの特徴
Google Cloud ベストプラクティス Google BigQuery
Confidential & Proprietary
Legacy SQL - SQLライクな構文
● BigQuery クエリ リファレンス
○ 英語版、日本語版
Google Cloud ベストプラクティス Google BigQuery
Confidential & Proprietary
Standard SQL
● SQL 2011 準拠
● DML: Update, Delete, Insert をサポート
○ DMLにはクオータあり
○ Max UPDATE/DELETE /day /table : 48
○ Max UPDATE/DELETE / day /project: 500
○ Max INSERT / day / table: 1000
○ Max INSERT / day / project: 10,000
● Standard SQL クエリ リファレンス
Google Cloud ベストプラクティス Google BigQuery
Confidential & Proprietary
SELECT lower(word) as word,
word_count AS frequency, corpus
FROM [publicdata:samples.shakespeare]
WHERE corpus CONTAINS “king” and
LENGTH(word) > 5
ORDER BY frequency DESC
SELECT lower(word) as word,
word_count AS frequency, corpus
FROM `publicdata.samples.shakespeare`
WHERE corpus LIKE ‘%king%’ and
LENGTH(word) > 5
ORDER BY frequency DESC;
Query Examples - Filtering
Standard SQL BigQuery SQL (Legacy)
Google Cloud ベストプラクティス Google BigQuery
Confidential & Proprietary
SELECT emp.Name AS EMPLOYEE,
dep.Name AS DEPARTMENT
FROM EMPLOYEE emp, DEPARTMENT dep
WHERE emp.dept_id = dep.dept_id
ORDER BY emp.NAME
SELECT emp.Name AS EMPLOYEE,
dep.Name AS DEPARTMENT
FROM [myproject:mycompany.EMPLOYEE] as emp
JOIN [myproject:mycompany.DEPARTMENT] as dep
ON emp.dept_id = dep.dept_id
ORDER BY EMPLOYEE
Standard SQL BigQuery SQL (Legacy)
Note: このクエリ構造はテーブル参照を除きANSI SQL
syntaxに似ています
Query Examples - Joins
Confidential & Proprietary
Google Cloud ベストプラクティス Google BigQuery
● JOIN は 2 つのテーブルを指定して、 1 つ目のテーブルと 2 つ目のテーブルのすべての行のマッチしま
す
● ON 句が必要です ( CROSS JOINを除く )
● BigQuery は INNER, [FULL|RIGHT|LEFT] OUTER と CROSS JOIN をサポートします。 デフォルトは
INNER です
SELECT …
FROM DATASET.TABLE1
[INNER|[FULL|RIGHT|LEFT] OUTER|CROSS] JOIN
DATASET.TABLE2
[ON join_condition_1 [... AND join_condition_n]
SELECT FROM - Joins
Google Cloud ベストプラクティス Google BigQuery
Confidential & Proprietary
SELECT DISTINCT dept_id
FROM ( SELECT dept_id FROM EMPLOYEE
UNION ALL
SELECT dept_id FROM DEPARTMENT)
SELECT dept_id FROM
(SELECT dept_id FROM mycompany.EMPLOYEE),
(SELECT dept_id FROM mycompany.DEPARTMENT)
GROUP BY dept_id
Query Examples - Unions
Standard SQL BigQuery SQL (Legacy)
Confidential & Proprietary
Google Cloud ベストプラクティス Google BigQuery
● 出産した年齢が最も高い母親を探す; state, year, と ageを表示
SELECT state, source_year AS year, mother_age AS age
FROM `publicdata.samples.natality`
ORDER BY age DESC
LIMIT 1
● 最新年の州の略称で集計した出生数で検索する
SELECT state, source_year AS year, COUNT(*) as number
FROM `publicdata.samples.natality`
WHERE state IS NOT NULL AND year IS NOT NULL
GROUP BY state, year
ORDER BY year DESC
LIMIT 5
BigQuery Example- Limit
Confidential & Proprietary
Google Cloud ベストプラクティス Google BigQuery
● 公的な天候データから、月ごとのパリの Hot days (> 83 degrees) をカウントする
SELECT year, month, count(round(mean_temp)) AS num_hot_days
FROM `publicdata.samples.gsod`
WHERE station_number = 071490 AND mean_temp > 83
GROUP BY year, month
ORDER BY num_hot_days DESC, month DESC
LIMIT 10
More Examples
Confidential & Proprietary
Google Cloud ベストプラクティス Google BigQuery
● bq command line tool を使い、ロンドン・ヒースロー空港 (station 037720)の最新
10 日で雷雨の日を見つける
> bq query “SELECT year, month, day, thunder, rain FROM
`publicdata.samples.gsod` WHERE thunder = TRUE AND rain =
TRUE AND station_number = 037720 ORDER BY year DESC, month
DESC, day DESC LIMIT 10”
More Examples
Confidential & Proprietary
Google Cloud ベストプラクティス Google BigQuery
● 複雑なプロセスの場合には sub-select 分を使ったほうが簡単なときがある
● sub-select 句の結果は、外部の SQL Select 句のソーステーブルとして使われる
SELECT …
FROM (
SELECT …
FROM ..
)
SELECT FROM – Sub-Select
Confidential & Proprietary
Google Cloud ベストプラクティス Google BigQuery
● シンプルなクエリを使うと複合クエリを使える
● Joins の Sub-Select
SELECT …
FROM
[dataset.table1] as T1
JOIN
[dataset.table2] as T2 ON T1.x = T2.x
JOIN
(SELECT … FROM dataset.table3) as T3 ON T1.y = T3.y
WHERE ...
SELECT FROM – Sub-Select Join
Confidential & Proprietary
Google Cloud ベストプラクティス Google BigQuery
● 他の SQL ベースのシステムとは違い、BigQuery は Join ではなくテーブルの
Union をカンマで示します。
● 同様のスキーマを持つ複数テーブルへのクエリ
● Join と Union
SELECT …
FROM
[dataset.table1],[dataset.table2],[dataset.table3] AS T1
JOIN
(SELECT … FROM dataset.table4) as T4 ON T1.y = T4.y
WHERE ...
SELECT FROM – Union
Google Cloud ベストプラクティス Google BigQuery
Confidential & Proprietary
● Dry Run によりスキャンサイズが確認可能 (Web UI | bq コマンド | API)
● エラーも事前検出出来る
Click
Query Tips
Google Cloud ベストプラクティス Google BigQuery
Confidential & Proprietary
● BigQuery Mate (3rd party Chrome Extention) で更に便利に
○ スキャン費用概算表示
○ デフォルト SQL の設定
○ SQL の replace
○ パラメータ設定
○ 等
Query Tips
Confidential & Proprietary
Google Cloud ベストプラクティス Google BigQuery
Data extraction and exportation
from BigQuery
Google Cloud ベストプラクティス Google BigQuery
Confidential & Proprietary
抽出の方法:
● データをエクスポートする目的
○ 3rd パーティツールを使うため
○ スナップショット
○ バックアップ
● エクスポートに使うもの
○ WebUI
○ CLI
○ REST API
BigQuery からのデータ抽出
Google Cloud ベストプラクティス Google BigQuery
Confidential & Proprietary
抽出の方法:
● 他のテーブルやGoogle Cloud Storage へのエクスポート
● 圧縮または、非圧縮CSV / JSON / AVRO
● 複数のテーブルまたは複数のファイルへのシャード
BigQuery からのデータ抽出
Google Cloud ベストプラクティス Google BigQuery
Confidential & Proprietary
Configuration Options
2 つの観点: デフォルト:
● デフォルトはCSV.
● ネストされたフィールドまたは繰り返しフィー
ルドを持つテーブルは、CSVとしてエクス
ポートできません。
● デフォルトの圧縮は NONE.
● CSV
● JSON
● Avro*
● GZIP
● NONE
圧縮
出力Format
*Avro フォーマットは GZIP 圧縮できません
Google Cloud ベストプラクティス Google BigQuery
Confidential & Proprietary
テキサスで”J”で始まる人気の名前トップ100
BigQuery からのデータ抽出 - 他のテーブルへのエクスポート
Google Cloud ベストプラクティス Google BigQuery
Confidential & Proprietary
テキサスで”J”で始まる人気の名前トップ100
BigQuery からのデータ抽出 - 他のテーブルへのエクスポート
Google Cloud ベストプラクティス Google BigQuery
Confidential & Proprietary
BigQuery からのデータ抽出 - Cloud Storage へのエクスポート
テーブルの GCS へのエクスポート
Google Cloud ベストプラクティス Google BigQuery
Confidential & Proprietary
BigQuery からのデータ抽出 - Cloud Storage へのエクスポート
テーブルの GCS へのエクスポート
Google BigQuery
Google Cloud ベストプラクティス
Thank you
1 : Introduction / BigQuery Organization / Exploring and Interacting with BigQuery
2 : Data ingestion into BigQuery / Writing Queries in BigQuery / Data extraction and exportation from BigQuery
3 : Best Practices and Performance Optimization / Cost Optimization
Google Cloud ベストプラクティス:Google BigQuery 編 - 02 : データ処理 / クエリ / データ抽出

More Related Content

What's hot

イマドキ!ユースケース別に見るAWS IoT への接続パターン
イマドキ!ユースケース別に見るAWS IoT への接続パターンイマドキ!ユースケース別に見るAWS IoT への接続パターン
イマドキ!ユースケース別に見るAWS IoT への接続パターンseiichi arai
 
20190206 AWS Black Belt Online Seminar Amazon SageMaker Basic Session
20190206 AWS Black Belt Online Seminar Amazon SageMaker Basic Session20190206 AWS Black Belt Online Seminar Amazon SageMaker Basic Session
20190206 AWS Black Belt Online Seminar Amazon SageMaker Basic SessionAmazon Web Services Japan
 
[Cloud OnAir] BigQuery へデータを読み込む 2019年3月14日 放送
[Cloud OnAir] BigQuery へデータを読み込む 2019年3月14日 放送[Cloud OnAir] BigQuery へデータを読み込む 2019年3月14日 放送
[Cloud OnAir] BigQuery へデータを読み込む 2019年3月14日 放送Google Cloud Platform - Japan
 
AWS Black Belt Online Seminar 2017 AWS X-Ray
AWS Black Belt Online Seminar 2017 AWS X-RayAWS Black Belt Online Seminar 2017 AWS X-Ray
AWS Black Belt Online Seminar 2017 AWS X-RayAmazon Web Services Japan
 
20190424 AWS Black Belt Online Seminar Amazon Aurora MySQL
20190424 AWS Black Belt Online Seminar Amazon Aurora MySQL20190424 AWS Black Belt Online Seminar Amazon Aurora MySQL
20190424 AWS Black Belt Online Seminar Amazon Aurora MySQLAmazon Web Services Japan
 
202106 AWS Black Belt Online Seminar 小売現場のデータを素早くビジネス に活用するAWSデータ基盤
202106 AWS Black Belt Online Seminar 小売現場のデータを素早くビジネス に活用するAWSデータ基盤202106 AWS Black Belt Online Seminar 小売現場のデータを素早くビジネス に活用するAWSデータ基盤
202106 AWS Black Belt Online Seminar 小売現場のデータを素早くビジネス に活用するAWSデータ基盤Amazon Web Services Japan
 
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...Google Cloud Platform - Japan
 
20190821 AWS Black Belt Online Seminar AWS AppSync
20190821 AWS Black Belt Online Seminar AWS AppSync20190821 AWS Black Belt Online Seminar AWS AppSync
20190821 AWS Black Belt Online Seminar AWS AppSyncAmazon Web Services Japan
 
RDBMSより高速なNoSQLを実際に使ってみた話
RDBMSより高速なNoSQLを実際に使ってみた話RDBMSより高速なNoSQLを実際に使ってみた話
RDBMSより高速なNoSQLを実際に使ってみた話犬 クジラ
 
分散トレーシングAWS:X-Rayとの上手い付き合い方
分散トレーシングAWS:X-Rayとの上手い付き合い方分散トレーシングAWS:X-Rayとの上手い付き合い方
分散トレーシングAWS:X-Rayとの上手い付き合い方Recruit Lifestyle Co., Ltd.
 
ログ管理のベストプラクティス
ログ管理のベストプラクティスログ管理のベストプラクティス
ログ管理のベストプラクティスAkihiro Kuwano
 
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)Noritaka Sekiyama
 
ゲームのインフラをAwsで実戦tips全て見せます
ゲームのインフラをAwsで実戦tips全て見せますゲームのインフラをAwsで実戦tips全て見せます
ゲームのインフラをAwsで実戦tips全て見せますinfinite_loop
 
これでBigQueryをドヤ顔で語れる!BigQueryの基本
これでBigQueryをドヤ顔で語れる!BigQueryの基本これでBigQueryをドヤ顔で語れる!BigQueryの基本
これでBigQueryをドヤ顔で語れる!BigQueryの基本Tomohiro Shinden
 
Day 1 with Amazon Web Services - AWSご利用開始時に最低限おさえておきたい10のこと
Day 1 with Amazon Web Services - AWSご利用開始時に最低限おさえておきたい10のことDay 1 with Amazon Web Services - AWSご利用開始時に最低限おさえておきたい10のこと
Day 1 with Amazon Web Services - AWSご利用開始時に最低限おさえておきたい10のことAmazon Web Services Japan
 
ゼロトラスト・アーキテクチャを無料で(やれるだけ)実現する
ゼロトラスト・アーキテクチャを無料で(やれるだけ)実現するゼロトラスト・アーキテクチャを無料で(やれるだけ)実現する
ゼロトラスト・アーキテクチャを無料で(やれるだけ)実現するKeioOyama
 
Amazon SNS+SQSによる Fanoutシナリオの話
Amazon SNS+SQSによる Fanoutシナリオの話Amazon SNS+SQSによる Fanoutシナリオの話
Amazon SNS+SQSによる Fanoutシナリオの話Yoichi Toyota
 
20190320 AWS Black Belt Online Seminar Amazon EBS
20190320 AWS Black Belt Online Seminar Amazon EBS20190320 AWS Black Belt Online Seminar Amazon EBS
20190320 AWS Black Belt Online Seminar Amazon EBSAmazon Web Services Japan
 
「GraphDB徹底入門」〜構造や仕組み理解から使いどころ・種々のGraphDBの比較まで幅広く〜
「GraphDB徹底入門」〜構造や仕組み理解から使いどころ・種々のGraphDBの比較まで幅広く〜「GraphDB徹底入門」〜構造や仕組み理解から使いどころ・種々のGraphDBの比較まで幅広く〜
「GraphDB徹底入門」〜構造や仕組み理解から使いどころ・種々のGraphDBの比較まで幅広く〜Takahiro Inoue
 

What's hot (20)

イマドキ!ユースケース別に見るAWS IoT への接続パターン
イマドキ!ユースケース別に見るAWS IoT への接続パターンイマドキ!ユースケース別に見るAWS IoT への接続パターン
イマドキ!ユースケース別に見るAWS IoT への接続パターン
 
20190206 AWS Black Belt Online Seminar Amazon SageMaker Basic Session
20190206 AWS Black Belt Online Seminar Amazon SageMaker Basic Session20190206 AWS Black Belt Online Seminar Amazon SageMaker Basic Session
20190206 AWS Black Belt Online Seminar Amazon SageMaker Basic Session
 
[Cloud OnAir] BigQuery へデータを読み込む 2019年3月14日 放送
[Cloud OnAir] BigQuery へデータを読み込む 2019年3月14日 放送[Cloud OnAir] BigQuery へデータを読み込む 2019年3月14日 放送
[Cloud OnAir] BigQuery へデータを読み込む 2019年3月14日 放送
 
AWS Black Belt Online Seminar 2017 AWS X-Ray
AWS Black Belt Online Seminar 2017 AWS X-RayAWS Black Belt Online Seminar 2017 AWS X-Ray
AWS Black Belt Online Seminar 2017 AWS X-Ray
 
20190424 AWS Black Belt Online Seminar Amazon Aurora MySQL
20190424 AWS Black Belt Online Seminar Amazon Aurora MySQL20190424 AWS Black Belt Online Seminar Amazon Aurora MySQL
20190424 AWS Black Belt Online Seminar Amazon Aurora MySQL
 
AWS Black Belt Techシリーズ Amazon EMR
AWS Black Belt Techシリーズ  Amazon EMRAWS Black Belt Techシリーズ  Amazon EMR
AWS Black Belt Techシリーズ Amazon EMR
 
202106 AWS Black Belt Online Seminar 小売現場のデータを素早くビジネス に活用するAWSデータ基盤
202106 AWS Black Belt Online Seminar 小売現場のデータを素早くビジネス に活用するAWSデータ基盤202106 AWS Black Belt Online Seminar 小売現場のデータを素早くビジネス に活用するAWSデータ基盤
202106 AWS Black Belt Online Seminar 小売現場のデータを素早くビジネス に活用するAWSデータ基盤
 
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
 
20190821 AWS Black Belt Online Seminar AWS AppSync
20190821 AWS Black Belt Online Seminar AWS AppSync20190821 AWS Black Belt Online Seminar AWS AppSync
20190821 AWS Black Belt Online Seminar AWS AppSync
 
RDBMSより高速なNoSQLを実際に使ってみた話
RDBMSより高速なNoSQLを実際に使ってみた話RDBMSより高速なNoSQLを実際に使ってみた話
RDBMSより高速なNoSQLを実際に使ってみた話
 
分散トレーシングAWS:X-Rayとの上手い付き合い方
分散トレーシングAWS:X-Rayとの上手い付き合い方分散トレーシングAWS:X-Rayとの上手い付き合い方
分散トレーシングAWS:X-Rayとの上手い付き合い方
 
ログ管理のベストプラクティス
ログ管理のベストプラクティスログ管理のベストプラクティス
ログ管理のベストプラクティス
 
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)
 
ゲームのインフラをAwsで実戦tips全て見せます
ゲームのインフラをAwsで実戦tips全て見せますゲームのインフラをAwsで実戦tips全て見せます
ゲームのインフラをAwsで実戦tips全て見せます
 
これでBigQueryをドヤ顔で語れる!BigQueryの基本
これでBigQueryをドヤ顔で語れる!BigQueryの基本これでBigQueryをドヤ顔で語れる!BigQueryの基本
これでBigQueryをドヤ顔で語れる!BigQueryの基本
 
Day 1 with Amazon Web Services - AWSご利用開始時に最低限おさえておきたい10のこと
Day 1 with Amazon Web Services - AWSご利用開始時に最低限おさえておきたい10のことDay 1 with Amazon Web Services - AWSご利用開始時に最低限おさえておきたい10のこと
Day 1 with Amazon Web Services - AWSご利用開始時に最低限おさえておきたい10のこと
 
ゼロトラスト・アーキテクチャを無料で(やれるだけ)実現する
ゼロトラスト・アーキテクチャを無料で(やれるだけ)実現するゼロトラスト・アーキテクチャを無料で(やれるだけ)実現する
ゼロトラスト・アーキテクチャを無料で(やれるだけ)実現する
 
Amazon SNS+SQSによる Fanoutシナリオの話
Amazon SNS+SQSによる Fanoutシナリオの話Amazon SNS+SQSによる Fanoutシナリオの話
Amazon SNS+SQSによる Fanoutシナリオの話
 
20190320 AWS Black Belt Online Seminar Amazon EBS
20190320 AWS Black Belt Online Seminar Amazon EBS20190320 AWS Black Belt Online Seminar Amazon EBS
20190320 AWS Black Belt Online Seminar Amazon EBS
 
「GraphDB徹底入門」〜構造や仕組み理解から使いどころ・種々のGraphDBの比較まで幅広く〜
「GraphDB徹底入門」〜構造や仕組み理解から使いどころ・種々のGraphDBの比較まで幅広く〜「GraphDB徹底入門」〜構造や仕組み理解から使いどころ・種々のGraphDBの比較まで幅広く〜
「GraphDB徹底入門」〜構造や仕組み理解から使いどころ・種々のGraphDBの比較まで幅広く〜
 

Similar to Google Cloud ベストプラクティス:Google BigQuery 編 - 02 : データ処理 / クエリ / データ抽出

Google BigQueryのターゲットエンドポイントとしての利用
Google BigQueryのターゲットエンドポイントとしての利用Google BigQueryのターゲットエンドポイントとしての利用
Google BigQueryのターゲットエンドポイントとしての利用QlikPresalesJapan
 
[Cloud OnAir] 最新アップデート Google Cloud データ関連ソリューション 2020年5月14日 放送
[Cloud OnAir] 最新アップデート Google Cloud データ関連ソリューション 2020年5月14日 放送[Cloud OnAir] 最新アップデート Google Cloud データ関連ソリューション 2020年5月14日 放送
[Cloud OnAir] 最新アップデート Google Cloud データ関連ソリューション 2020年5月14日 放送Google Cloud Platform - Japan
 
[Cloud OnAir] Google Cloud における RDBMS の運用パターン 2020年11月19日 放送
[Cloud OnAir] Google Cloud における RDBMS の運用パターン 2020年11月19日 放送[Cloud OnAir] Google Cloud における RDBMS の運用パターン 2020年11月19日 放送
[Cloud OnAir] Google Cloud における RDBMS の運用パターン 2020年11月19日 放送Google Cloud Platform - Japan
 
Managed Instance チートシート
Managed Instance チートシートManaged Instance チートシート
Managed Instance チートシートMasayuki Ozawa
 
No-Ops で大量データ処理基盤を簡単に実現する
No-Ops で大量データ処理基盤を簡単に実現するNo-Ops で大量データ処理基盤を簡単に実現する
No-Ops で大量データ処理基盤を簡単に実現するKiyoshi Fukuda
 
6 月 18 日 Next - Google が描く、MapReduce を超えたビッグデータの世界
6 月 18 日 Next -  Google が描く、MapReduce を超えたビッグデータの世界6 月 18 日 Next -  Google が描く、MapReduce を超えたビッグデータの世界
6 月 18 日 Next - Google が描く、MapReduce を超えたビッグデータの世界Google Cloud Platform - Japan
 
MySQL Technology Cafe #14 MySQL Shellを使ってもっと楽をしようの会
MySQL Technology Cafe #14 MySQL Shellを使ってもっと楽をしようの会MySQL Technology Cafe #14 MySQL Shellを使ってもっと楽をしようの会
MySQL Technology Cafe #14 MySQL Shellを使ってもっと楽をしようの会オラクルエンジニア通信
 
SQL Azure Management and Security
SQL Azure Management and SecuritySQL Azure Management and Security
SQL Azure Management and Securityjunichi anno
 
オープンソースカンファレンス OSC 2014 エンタープライズ 東京 ownCloud 法人向けオンラインストレージ マルチデバイスファイル共有ソリューション
オープンソースカンファレンス OSC 2014 エンタープライズ 東京 ownCloud 法人向けオンラインストレージ マルチデバイスファイル共有ソリューションオープンソースカンファレンス OSC 2014 エンタープライズ 東京 ownCloud 法人向けオンラインストレージ マルチデバイスファイル共有ソリューション
オープンソースカンファレンス OSC 2014 エンタープライズ 東京 ownCloud 法人向けオンラインストレージ マルチデバイスファイル共有ソリューションTetsurou Yano
 
BigQuery Query Optimization クエリ高速化編
BigQuery Query Optimization クエリ高速化編BigQuery Query Optimization クエリ高速化編
BigQuery Query Optimization クエリ高速化編sutepoi
 
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)日本マイクロソフト株式会社
 
20120822_dstn技術交流会_dstnのご紹介と最新技術情報
20120822_dstn技術交流会_dstnのご紹介と最新技術情報20120822_dstn技術交流会_dstnのご紹介と最新技術情報
20120822_dstn技術交流会_dstnのご紹介と最新技術情報dstn
 
AzureとDatadogとこれからのモニタリング - Next Gen Monitoring with Azure and Datadog 20180922
AzureとDatadogとこれからのモニタリング - Next Gen Monitoring with Azure and Datadog 20180922AzureとDatadogとこれからのモニタリング - Next Gen Monitoring with Azure and Datadog 20180922
AzureとDatadogとこれからのモニタリング - Next Gen Monitoring with Azure and Datadog 20180922Masahiro Hattori
 
Microsoft Azure build & ignight update summary
Microsoft Azure build & ignight update summary Microsoft Azure build & ignight update summary
Microsoft Azure build & ignight update summary Hirano Kazunori
 
FutureTechNight_GoogleCloudデータ活用勉強会.pptx
FutureTechNight_GoogleCloudデータ活用勉強会.pptxFutureTechNight_GoogleCloudデータ活用勉強会.pptx
FutureTechNight_GoogleCloudデータ活用勉強会.pptxshotamiyazaki6
 

Similar to Google Cloud ベストプラクティス:Google BigQuery 編 - 02 : データ処理 / クエリ / データ抽出 (20)

G gencorp
G gencorpG gencorp
G gencorp
 
Google BigQueryのターゲットエンドポイントとしての利用
Google BigQueryのターゲットエンドポイントとしての利用Google BigQueryのターゲットエンドポイントとしての利用
Google BigQueryのターゲットエンドポイントとしての利用
 
[Cloud OnAir] 最新アップデート Google Cloud データ関連ソリューション 2020年5月14日 放送
[Cloud OnAir] 最新アップデート Google Cloud データ関連ソリューション 2020年5月14日 放送[Cloud OnAir] 最新アップデート Google Cloud データ関連ソリューション 2020年5月14日 放送
[Cloud OnAir] 最新アップデート Google Cloud データ関連ソリューション 2020年5月14日 放送
 
[Cloud OnAir] Google Cloud における RDBMS の運用パターン 2020年11月19日 放送
[Cloud OnAir] Google Cloud における RDBMS の運用パターン 2020年11月19日 放送[Cloud OnAir] Google Cloud における RDBMS の運用パターン 2020年11月19日 放送
[Cloud OnAir] Google Cloud における RDBMS の運用パターン 2020年11月19日 放送
 
BigQuery ハンズオン
BigQuery ハンズオンBigQuery ハンズオン
BigQuery ハンズオン
 
Managed Instance チートシート
Managed Instance チートシートManaged Instance チートシート
Managed Instance チートシート
 
No-Ops で大量データ処理基盤を簡単に実現する
No-Ops で大量データ処理基盤を簡単に実現するNo-Ops で大量データ処理基盤を簡単に実現する
No-Ops で大量データ処理基盤を簡単に実現する
 
No-Ops で大量データ処理基盤
No-Ops で大量データ処理基盤No-Ops で大量データ処理基盤
No-Ops で大量データ処理基盤
 
6 月 18 日 Next - Google が描く、MapReduce を超えたビッグデータの世界
6 月 18 日 Next -  Google が描く、MapReduce を超えたビッグデータの世界6 月 18 日 Next -  Google が描く、MapReduce を超えたビッグデータの世界
6 月 18 日 Next - Google が描く、MapReduce を超えたビッグデータの世界
 
MySQL Technology Cafe #14 MySQL Shellを使ってもっと楽をしようの会
MySQL Technology Cafe #14 MySQL Shellを使ってもっと楽をしようの会MySQL Technology Cafe #14 MySQL Shellを使ってもっと楽をしようの会
MySQL Technology Cafe #14 MySQL Shellを使ってもっと楽をしようの会
 
Bigquery
BigqueryBigquery
Bigquery
 
SQL Azure Management and Security
SQL Azure Management and SecuritySQL Azure Management and Security
SQL Azure Management and Security
 
Google Cloud Dataflow を理解する - #bq_sushi
Google Cloud Dataflow を理解する - #bq_sushiGoogle Cloud Dataflow を理解する - #bq_sushi
Google Cloud Dataflow を理解する - #bq_sushi
 
オープンソースカンファレンス OSC 2014 エンタープライズ 東京 ownCloud 法人向けオンラインストレージ マルチデバイスファイル共有ソリューション
オープンソースカンファレンス OSC 2014 エンタープライズ 東京 ownCloud 法人向けオンラインストレージ マルチデバイスファイル共有ソリューションオープンソースカンファレンス OSC 2014 エンタープライズ 東京 ownCloud 法人向けオンラインストレージ マルチデバイスファイル共有ソリューション
オープンソースカンファレンス OSC 2014 エンタープライズ 東京 ownCloud 法人向けオンラインストレージ マルチデバイスファイル共有ソリューション
 
BigQuery Query Optimization クエリ高速化編
BigQuery Query Optimization クエリ高速化編BigQuery Query Optimization クエリ高速化編
BigQuery Query Optimization クエリ高速化編
 
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
 
20120822_dstn技術交流会_dstnのご紹介と最新技術情報
20120822_dstn技術交流会_dstnのご紹介と最新技術情報20120822_dstn技術交流会_dstnのご紹介と最新技術情報
20120822_dstn技術交流会_dstnのご紹介と最新技術情報
 
AzureとDatadogとこれからのモニタリング - Next Gen Monitoring with Azure and Datadog 20180922
AzureとDatadogとこれからのモニタリング - Next Gen Monitoring with Azure and Datadog 20180922AzureとDatadogとこれからのモニタリング - Next Gen Monitoring with Azure and Datadog 20180922
AzureとDatadogとこれからのモニタリング - Next Gen Monitoring with Azure and Datadog 20180922
 
Microsoft Azure build & ignight update summary
Microsoft Azure build & ignight update summary Microsoft Azure build & ignight update summary
Microsoft Azure build & ignight update summary
 
FutureTechNight_GoogleCloudデータ活用勉強会.pptx
FutureTechNight_GoogleCloudデータ活用勉強会.pptxFutureTechNight_GoogleCloudデータ活用勉強会.pptx
FutureTechNight_GoogleCloudデータ活用勉強会.pptx
 

More from Google Cloud Platform - Japan

Google Cloud でアプリケーションを動かす.pdf
Google Cloud でアプリケーションを動かす.pdfGoogle Cloud でアプリケーションを動かす.pdf
Google Cloud でアプリケーションを動かす.pdfGoogle Cloud Platform - Japan
 
[External] 2021.12.15 コンテナ移行の前に知っておきたいこと @ gcpug 湘南
[External] 2021.12.15 コンテナ移行の前に知っておきたいこと  @ gcpug 湘南[External] 2021.12.15 コンテナ移行の前に知っておきたいこと  @ gcpug 湘南
[External] 2021.12.15 コンテナ移行の前に知っておきたいこと @ gcpug 湘南Google Cloud Platform - Japan
 
【Dialogflow cx】はじめてみよう google cloud dialogflow cx 編
【Dialogflow cx】はじめてみよう google cloud dialogflow cx 編【Dialogflow cx】はじめてみよう google cloud dialogflow cx 編
【Dialogflow cx】はじめてみよう google cloud dialogflow cx 編Google Cloud Platform - Japan
 
[Cloud OnAir] 事例紹介 : 株式会社マーケティングアプリケーションズ 〜クラウドへのマイグレーションとその後〜 2020年12月17日 放送
[Cloud OnAir] 事例紹介 : 株式会社マーケティングアプリケーションズ  〜クラウドへのマイグレーションとその後〜 2020年12月17日 放送[Cloud OnAir] 事例紹介 : 株式会社マーケティングアプリケーションズ  〜クラウドへのマイグレーションとその後〜 2020年12月17日 放送
[Cloud OnAir] 事例紹介 : 株式会社マーケティングアプリケーションズ 〜クラウドへのマイグレーションとその後〜 2020年12月17日 放送Google Cloud Platform - Japan
 
[Cloud OnAir] 【実演】Google Cloud VMware Engine と VMware ソリューションを組み合わせたハイブリッド環境の...
[Cloud OnAir] 【実演】Google Cloud VMware Engine と VMware ソリューションを組み合わせたハイブリッド環境の...[Cloud OnAir] 【実演】Google Cloud VMware Engine と VMware ソリューションを組み合わせたハイブリッド環境の...
[Cloud OnAir] 【実演】Google Cloud VMware Engine と VMware ソリューションを組み合わせたハイブリッド環境の...Google Cloud Platform - Japan
 
[Cloud OnAir] Google Workspace でできる データ分析と業務自動化のご紹介 2020年12月3日 放送
[Cloud OnAir] Google Workspace でできる データ分析と業務自動化のご紹介 2020年12月3日 放送[Cloud OnAir] Google Workspace でできる データ分析と業務自動化のご紹介 2020年12月3日 放送
[Cloud OnAir] Google Workspace でできる データ分析と業務自動化のご紹介 2020年12月3日 放送Google Cloud Platform - Japan
 
[Cloud OnAir] Google Cloud へのマイグレーション ツールの紹介 2020年11月26日 放送
[Cloud OnAir] Google Cloud へのマイグレーション ツールの紹介 2020年11月26日 放送[Cloud OnAir] Google Cloud へのマイグレーション ツールの紹介 2020年11月26日 放送
[Cloud OnAir] Google Cloud へのマイグレーション ツールの紹介 2020年11月26日 放送Google Cloud Platform - Japan
 
[Cloud OnAir] 事例紹介: 株式会社オープンハウス 〜Google サービスを活用したオープンハウスの AI の取り組み〜 2020年11月1...
[Cloud OnAir] 事例紹介: 株式会社オープンハウス 〜Google サービスを活用したオープンハウスの AI の取り組み〜 2020年11月1...[Cloud OnAir] 事例紹介: 株式会社オープンハウス 〜Google サービスを活用したオープンハウスの AI の取り組み〜 2020年11月1...
[Cloud OnAir] 事例紹介: 株式会社オープンハウス 〜Google サービスを活用したオープンハウスの AI の取り組み〜 2020年11月1...Google Cloud Platform - Japan
 
[Cloud OnAir] 【Anthos 演習】 解説を聞きながら Anthos を体験しよう 2020年11月5日 放送
[Cloud OnAir] 【Anthos 演習】 解説を聞きながら Anthos を体験しよう 2020年11月5日 放送[Cloud OnAir] 【Anthos 演習】 解説を聞きながら Anthos を体験しよう 2020年11月5日 放送
[Cloud OnAir] 【Anthos 演習】 解説を聞きながら Anthos を体験しよう 2020年11月5日 放送Google Cloud Platform - Japan
 
[Cloud OnAir] 【Google Kubernetes Engine 演習】解説を聞きながら GKE を体験しよう 2020年10月29日 放送
[Cloud OnAir] 【Google Kubernetes Engine 演習】解説を聞きながら GKE を体験しよう 2020年10月29日 放送[Cloud OnAir] 【Google Kubernetes Engine 演習】解説を聞きながら GKE を体験しよう 2020年10月29日 放送
[Cloud OnAir] 【Google Kubernetes Engine 演習】解説を聞きながら GKE を体験しよう 2020年10月29日 放送Google Cloud Platform - Japan
 
[Cloud OnAir] Google Cloud の AI / IoT 最新事例紹介 2020年10月22日 放送
[Cloud OnAir] Google Cloud の AI / IoT 最新事例紹介 2020年10月22日 放送[Cloud OnAir] Google Cloud の AI / IoT 最新事例紹介 2020年10月22日 放送
[Cloud OnAir] Google Cloud の AI / IoT 最新事例紹介 2020年10月22日 放送Google Cloud Platform - Japan
 
[Cloud OnAir] Google Cloud Next '20: OnAir 特別編 〜世界で人気のあったセッション特集〜 2020年9月24日 放送
[Cloud OnAir] Google Cloud Next '20: OnAir 特別編 〜世界で人気のあったセッション特集〜 2020年9月24日 放送[Cloud OnAir] Google Cloud Next '20: OnAir 特別編 〜世界で人気のあったセッション特集〜 2020年9月24日 放送
[Cloud OnAir] Google Cloud Next '20: OnAir 特別編 〜世界で人気のあったセッション特集〜 2020年9月24日 放送Google Cloud Platform - Japan
 
[Cloud OnAir] Talks by DevRel Vol.5 アプリケーションのモダナイゼーション 2020年9月3日 放送
[Cloud OnAir] Talks by DevRel Vol.5 アプリケーションのモダナイゼーション 2020年9月3日 放送[Cloud OnAir] Talks by DevRel Vol.5 アプリケーションのモダナイゼーション 2020年9月3日 放送
[Cloud OnAir] Talks by DevRel Vol.5 アプリケーションのモダナイゼーション 2020年9月3日 放送Google Cloud Platform - Japan
 
明日から役立つ BigQuery ML 活用 5 つのヒント | Google Cloud INSIDE Games & Apps: Online
明日から役立つ  BigQuery ML 活用 5 つのヒント | Google Cloud INSIDE Games & Apps: Online明日から役立つ  BigQuery ML 活用 5 つのヒント | Google Cloud INSIDE Games & Apps: Online
明日から役立つ BigQuery ML 活用 5 つのヒント | Google Cloud INSIDE Games & Apps: OnlineGoogle Cloud Platform - Japan
 
今だから知りたい BigQuery 再入門 | Google Cloud INSIDE Games & Apps: Online
今だから知りたい BigQuery 再入門 | Google Cloud INSIDE Games & Apps: Online今だから知りたい BigQuery 再入門 | Google Cloud INSIDE Games & Apps: Online
今だから知りたい BigQuery 再入門 | Google Cloud INSIDE Games & Apps: OnlineGoogle Cloud Platform - Japan
 
『MAGELLAN BLOCKS』を使って BigQuery を使い倒す!| Google Cloud INSIDE Games & Apps: Online
『MAGELLAN BLOCKS』を使って BigQuery を使い倒す!| Google Cloud INSIDE Games & Apps: Online『MAGELLAN BLOCKS』を使って BigQuery を使い倒す!| Google Cloud INSIDE Games & Apps: Online
『MAGELLAN BLOCKS』を使って BigQuery を使い倒す!| Google Cloud INSIDE Games & Apps: OnlineGoogle Cloud Platform - Japan
 

More from Google Cloud Platform - Japan (20)

ServerlessDays Tokyo 2022 Virtual.pdf
ServerlessDays Tokyo 2022 Virtual.pdfServerlessDays Tokyo 2022 Virtual.pdf
ServerlessDays Tokyo 2022 Virtual.pdf
 
20221105_GCPUG 女子会 Kubernets 編.pdf
20221105_GCPUG 女子会 Kubernets 編.pdf20221105_GCPUG 女子会 Kubernets 編.pdf
20221105_GCPUG 女子会 Kubernets 編.pdf
 
Google Cloud でアプリケーションを動かす.pdf
Google Cloud でアプリケーションを動かす.pdfGoogle Cloud でアプリケーションを動かす.pdf
Google Cloud でアプリケーションを動かす.pdf
 
[External] 2021.12.15 コンテナ移行の前に知っておきたいこと @ gcpug 湘南
[External] 2021.12.15 コンテナ移行の前に知っておきたいこと  @ gcpug 湘南[External] 2021.12.15 コンテナ移行の前に知っておきたいこと  @ gcpug 湘南
[External] 2021.12.15 コンテナ移行の前に知っておきたいこと @ gcpug 湘南
 
What’s new in cloud run 2021 後期
What’s new in cloud run 2021 後期What’s new in cloud run 2021 後期
What’s new in cloud run 2021 後期
 
【Dialogflow cx】はじめてみよう google cloud dialogflow cx 編
【Dialogflow cx】はじめてみよう google cloud dialogflow cx 編【Dialogflow cx】はじめてみよう google cloud dialogflow cx 編
【Dialogflow cx】はじめてみよう google cloud dialogflow cx 編
 
Google Cloud で実践する SRE
Google Cloud で実践する SRE  Google Cloud で実践する SRE
Google Cloud で実践する SRE
 
[Cloud OnAir] 事例紹介 : 株式会社マーケティングアプリケーションズ 〜クラウドへのマイグレーションとその後〜 2020年12月17日 放送
[Cloud OnAir] 事例紹介 : 株式会社マーケティングアプリケーションズ  〜クラウドへのマイグレーションとその後〜 2020年12月17日 放送[Cloud OnAir] 事例紹介 : 株式会社マーケティングアプリケーションズ  〜クラウドへのマイグレーションとその後〜 2020年12月17日 放送
[Cloud OnAir] 事例紹介 : 株式会社マーケティングアプリケーションズ 〜クラウドへのマイグレーションとその後〜 2020年12月17日 放送
 
[Cloud OnAir] 【実演】Google Cloud VMware Engine と VMware ソリューションを組み合わせたハイブリッド環境の...
[Cloud OnAir] 【実演】Google Cloud VMware Engine と VMware ソリューションを組み合わせたハイブリッド環境の...[Cloud OnAir] 【実演】Google Cloud VMware Engine と VMware ソリューションを組み合わせたハイブリッド環境の...
[Cloud OnAir] 【実演】Google Cloud VMware Engine と VMware ソリューションを組み合わせたハイブリッド環境の...
 
[Cloud OnAir] Google Workspace でできる データ分析と業務自動化のご紹介 2020年12月3日 放送
[Cloud OnAir] Google Workspace でできる データ分析と業務自動化のご紹介 2020年12月3日 放送[Cloud OnAir] Google Workspace でできる データ分析と業務自動化のご紹介 2020年12月3日 放送
[Cloud OnAir] Google Workspace でできる データ分析と業務自動化のご紹介 2020年12月3日 放送
 
[Cloud OnAir] Google Cloud へのマイグレーション ツールの紹介 2020年11月26日 放送
[Cloud OnAir] Google Cloud へのマイグレーション ツールの紹介 2020年11月26日 放送[Cloud OnAir] Google Cloud へのマイグレーション ツールの紹介 2020年11月26日 放送
[Cloud OnAir] Google Cloud へのマイグレーション ツールの紹介 2020年11月26日 放送
 
[Cloud OnAir] 事例紹介: 株式会社オープンハウス 〜Google サービスを活用したオープンハウスの AI の取り組み〜 2020年11月1...
[Cloud OnAir] 事例紹介: 株式会社オープンハウス 〜Google サービスを活用したオープンハウスの AI の取り組み〜 2020年11月1...[Cloud OnAir] 事例紹介: 株式会社オープンハウス 〜Google サービスを活用したオープンハウスの AI の取り組み〜 2020年11月1...
[Cloud OnAir] 事例紹介: 株式会社オープンハウス 〜Google サービスを活用したオープンハウスの AI の取り組み〜 2020年11月1...
 
[Cloud OnAir] 【Anthos 演習】 解説を聞きながら Anthos を体験しよう 2020年11月5日 放送
[Cloud OnAir] 【Anthos 演習】 解説を聞きながら Anthos を体験しよう 2020年11月5日 放送[Cloud OnAir] 【Anthos 演習】 解説を聞きながら Anthos を体験しよう 2020年11月5日 放送
[Cloud OnAir] 【Anthos 演習】 解説を聞きながら Anthos を体験しよう 2020年11月5日 放送
 
[Cloud OnAir] 【Google Kubernetes Engine 演習】解説を聞きながら GKE を体験しよう 2020年10月29日 放送
[Cloud OnAir] 【Google Kubernetes Engine 演習】解説を聞きながら GKE を体験しよう 2020年10月29日 放送[Cloud OnAir] 【Google Kubernetes Engine 演習】解説を聞きながら GKE を体験しよう 2020年10月29日 放送
[Cloud OnAir] 【Google Kubernetes Engine 演習】解説を聞きながら GKE を体験しよう 2020年10月29日 放送
 
[Cloud OnAir] Google Cloud の AI / IoT 最新事例紹介 2020年10月22日 放送
[Cloud OnAir] Google Cloud の AI / IoT 最新事例紹介 2020年10月22日 放送[Cloud OnAir] Google Cloud の AI / IoT 最新事例紹介 2020年10月22日 放送
[Cloud OnAir] Google Cloud の AI / IoT 最新事例紹介 2020年10月22日 放送
 
[Cloud OnAir] Google Cloud Next '20: OnAir 特別編 〜世界で人気のあったセッション特集〜 2020年9月24日 放送
[Cloud OnAir] Google Cloud Next '20: OnAir 特別編 〜世界で人気のあったセッション特集〜 2020年9月24日 放送[Cloud OnAir] Google Cloud Next '20: OnAir 特別編 〜世界で人気のあったセッション特集〜 2020年9月24日 放送
[Cloud OnAir] Google Cloud Next '20: OnAir 特別編 〜世界で人気のあったセッション特集〜 2020年9月24日 放送
 
[Cloud OnAir] Talks by DevRel Vol.5 アプリケーションのモダナイゼーション 2020年9月3日 放送
[Cloud OnAir] Talks by DevRel Vol.5 アプリケーションのモダナイゼーション 2020年9月3日 放送[Cloud OnAir] Talks by DevRel Vol.5 アプリケーションのモダナイゼーション 2020年9月3日 放送
[Cloud OnAir] Talks by DevRel Vol.5 アプリケーションのモダナイゼーション 2020年9月3日 放送
 
明日から役立つ BigQuery ML 活用 5 つのヒント | Google Cloud INSIDE Games & Apps: Online
明日から役立つ  BigQuery ML 活用 5 つのヒント | Google Cloud INSIDE Games & Apps: Online明日から役立つ  BigQuery ML 活用 5 つのヒント | Google Cloud INSIDE Games & Apps: Online
明日から役立つ BigQuery ML 活用 5 つのヒント | Google Cloud INSIDE Games & Apps: Online
 
今だから知りたい BigQuery 再入門 | Google Cloud INSIDE Games & Apps: Online
今だから知りたい BigQuery 再入門 | Google Cloud INSIDE Games & Apps: Online今だから知りたい BigQuery 再入門 | Google Cloud INSIDE Games & Apps: Online
今だから知りたい BigQuery 再入門 | Google Cloud INSIDE Games & Apps: Online
 
『MAGELLAN BLOCKS』を使って BigQuery を使い倒す!| Google Cloud INSIDE Games & Apps: Online
『MAGELLAN BLOCKS』を使って BigQuery を使い倒す!| Google Cloud INSIDE Games & Apps: Online『MAGELLAN BLOCKS』を使って BigQuery を使い倒す!| Google Cloud INSIDE Games & Apps: Online
『MAGELLAN BLOCKS』を使って BigQuery を使い倒す!| Google Cloud INSIDE Games & Apps: Online
 

Google Cloud ベストプラクティス:Google BigQuery 編 - 02 : データ処理 / クエリ / データ抽出

  • 1. Confidential & Proprietary Google Cloud ベストプラクティス Google BigQueryData ingestion into BigQuery / Writing Queries in BigQuery / Data extraction and exportation from BigQuery Google Cloud カスタマーエンジニア
  • 2. Confidential & Proprietary Agenda ● Data Ingestion into BigQuery ● Writing Queries in BigQuery ● Data extraction and exportation from BigQuery Google Cloud ベストプラクティス Google BigQuery ※このスライドは 2017 年 12 月時点の情報に基づき作成しています。最新情報は Google Cloud Platform のドキュメントをご参照ください。  https://cloud.google.com/docs/
  • 3. Confidential & Proprietary Google Cloud ベストプラクティス Google BigQuery Data Ingestion into BigQuery
  • 4. Google Cloud ベストプラクティス Google BigQuery Confidential & Proprietary Cloud Logs Google App Engine Google Analytics Premium Cloud Pub/Sub BigQuery Storage (tables) Cloud Bigtable (NoSQL) Cloud Storage (files) BigQuery Analytics (SQL) Capture Store Analyze Batch Cloud DataStore Process Stream Cloud Monitoring Cloud Bigtable Real time analytics and Alerts Cloud Dataflow Cloud Dataproc Cloud Dataproc In some cases data can end up in storage and then again be processed or enriched by Cloud Dataflow GCP におけるデータ処理
  • 5. Google Cloud ベストプラクティス Google BigQuery Confidential & Proprietary <POST> データソース ● Google Cloud Storage (GCS) ● アップロード (POST request) ● Google Cloud Datastore のバックアップ ● Google Analytics Premium ● Stackdriver Logging からのログエクスポート ● Firebase
  • 6. Google Cloud ベストプラクティス Google BigQuery Confidential & Proprietary データの取り込み方法 Data Loading ● データをジョブでまとめて取り込む Streaming Insert ● リアルタイムに近い方式でデータを取り込む 共通のポイント ● 両者ともクエリ実行環境とはリソース分離 ● データ取り込み/クエリ実行のパフォーマンスは互いに影響しない
  • 7. Google Cloud ベストプラクティス Google BigQuery Confidential & Proprietary jobid データを一括で取り込む Data Loading ● 実行自体は無料 ○ (データのストレージには課金有 )
  • 8. Google Cloud ベストプラクティス Google BigQuery Confidential & Proprietary データをストリーム Streaming Insert ● 小規模かつ頻繁なテーブル更新は Data Loadingには向かない ● すぐにデータを見たいという場合も同様 ● 有料 ($0.05/GB*month) ● Fluentdなどを利用して実装するのが楽 ● データ増加してもジョブが終わらない、という心配がなくなる
  • 9. Google Cloud ベストプラクティス Google BigQuery Confidential & Proprietary [Consistency|Availability|Speed|Cost] はトレードオフ: Consistency Availability Speed Cost Data Loading スループット最適化 強整合性 Load Job が完了し たらすぐ使える Job が完了しない と読み込めない Free Streaming Insert レイテンシー最適化 結果整合性 Insert から分析ま で数 ms 秒, Export や Copy まで Max 90min リアルタイム $0.05/GB *month データ取り込み方法の選択
  • 10. Google Cloud ベストプラクティス Google BigQuery Confidential & Proprietary Cloud Pub/Sub 大規模データの取り込み Data Loading ● Google Cloud Storage (GCS) を経由してロード ○ BigQuery の Loading Jobは Upload と Table への挿入の2要素 ○ どちらかが失敗すると Upload からやり直しになる ○ そのため GCS を経由することが推奨される ○ 同リージョンの GCS - BigQuery のロードは Upload よりも非常に高速 Streaming Insert ● 10 万行/秒 * Project, 1 万行 / 秒 * Tableのクオータを超えないよう設計 ○ 超えそうな場合は担当エンジニアに相談 ○ Cloud Pub/Sub を利用してキューイング、スロットリング ○ リアルタイムに近い方式でデータを取り込む https://cloud.google.com/bigquery/quota-policy
  • 11. Google Cloud ベストプラクティス Google BigQuery Confidential & Proprietary 大規模データの取り込み - クオータ 変更できないクオータはアーキテクチャ設計で対応 ● ロードジョブの最大サイズ : ○ ファイルを分割, or 制限のより大きな形式に変更 ○ Avro: block size で 16MB, CSV: row と cell で 2MB ● すべてのテーブルクオータ : Table を Shard ○ Streaming insert ■ maximum rows per second per table, maximum bytes per second per table ○ Load jobs ■ maximum number of loads per table per day https://cloud.google.com/bigquery/quota-policy
  • 12. Google Cloud ベストプラクティス Google BigQuery Confidential & Proprietary 大規模データの取り込み - クオータ https://cloud.google.com/bigquery/quota-policy クオータ変更リクエスト : API Managerより実施
  • 13. Google Cloud ベストプラクティス Google BigQuery Confidential & Proprietary Cloud Dataflow データの加工 Pub/Sub等からのロード, ETL処理を行いたい ● Cloud Dataflow , Cloud Dataprep を利用 Cloud Dataflow ● Batch, Streaming 処理を Apache Beam のコードで記述可能なマネージドサービス ● Cloud PubSub より BigQuery への挿入を行うためにも利用できる ● BigQuery UDF で並列実行できる数にヒットする場合にも検討 Cloud Dataprep ● GUI で利用できるデータ加工ツール ● レシピを作成し、 Engine として Dataflow がバッチで動作する
  • 14. Google Cloud ベストプラクティス Google BigQuery Confidential & Proprietary Compute App Engine Container Engine Compute Engine BigQuery Stream Insert Data Load Stackdriver Logging Storage and Databases Cloud Storage Cloud Datastore Cloud Pub/Sub Cloud Dataflow データ取り込みの実装 (GCP 内部)
  • 15. Google Cloud ベストプラクティス Google BigQuery Confidential & Proprietary On Premise Other Cloud Service BigQuery Stream Insert Data Load Logging Storage and Databases Cloud Storage Server Instance Cloud Storage SQL Database Cloud Pub/Sub Bq Command, 3rd pary tools etc. Storage Transfer Service Cloud Dataflow データ取り込みの実装 (GCP 外部)
  • 16. Google Cloud ベストプラクティス Google BigQuery Confidential & Proprietary データの取り込み方法の選択 - まとめ Data Loading ● リアルタイム分析をしないデータに適用 ● バッチでの分析データ更新 /追加を許容 ● ジョブの処理に時間がかかるようになったらどうするかを考慮する ● クリティカルなロードには Federated Query (後述) によるロードも検討 Streaming Insert ● ジョブが回しきれない規模 /リアルタイム分析が必要なデータに適用 ● 結果整合性であることを考慮する ● データ量爆発に備え Pub/Sub を緩衝材として利用することも考慮する どちらの場合も制限があるので確認をしておく https://cloud.google.com/bigquery/quota-policy
  • 17. Google Cloud ベストプラクティス Google BigQuery Confidential & Proprietary {JSON} BigQuery ドキュメント - 読み込み用のデータを準備する CSV データフォーマット データフォーマット ● CSV ● JSON ● Apache Avro [Beta] 圧縮の有無 ● 非圧縮 ● gzip [Avroは対象外] エンコードについての制約もあるので確認する
  • 18. Google Cloud ベストプラクティス Google BigQuery Confidential & Proprietary データフォーマットのベストプラクティス ロードの高速化: ● Avro はロードが 10 倍程度高速 ● CSV の場合は Encode を UTF-8 にする ○ ISO-8859-1 などの場合、BigQuery で変換処理が行われるので遅くなる ● 非圧縮でロードする ○ gzip はロードパフォーマンスが落ちる
  • 19. Google Cloud ベストプラクティス Google BigQuery Confidential & Proprietary マスタデータの更新のベストプラクティス 3 つの選択肢 ● BigQuery のテーブルを delete して再度ロード ○ データ更新が多い際に利用 ● Data Loading を利用して追加 ○ WRITE_APPEND モードで、追記してロード ○ 更新されたマスタのレコードを timestamp 付きで Loading ○ Timestamp が最新のマスタを表示する View を作る ● DML で更新 ○ DML の Quota にかからないか確認して設計
  • 20. Google Cloud ベストプラクティス Google BigQuery Confidential & Proprietary Direct query Paying it Forward — How BigQuery’s Data Ingest Breaks Tech Norms 外部データソースの解析 フェデレーション データソース ● BigQuery 自身のストレージではない場所に格納されたデータをクエリできる機能 ● データ取り込みの必要なく手軽に分析 ● ロードの代わりに高速な有料ロード としても利用可 ● 対象ソース ○ Google Cloud Storage ○ Google Drive ○ Cloud BigTable ● 制限 ○ クエリ実行速度はネイティブより遅い ○ クエリ実行中にデータの整合性が保証されない 参考: Creating and Querying Federated Data Sources
  • 21. Confidential & Proprietary Google Cloud ベストプラクティス Google BigQuery Writing Queries in BigQuery
  • 22. Google Cloud ベストプラクティス Google BigQuery Confidential & Proprietary BigQuery におけるクエリ Legacy SQL ● SELECT のみサポート ● ビッグデータ解析のために独自に拡張 Standard SQL ( 2016 年 9 月 GA, 新機能追加のため推奨 ) ● SQL 2011準拠 ● DML (Data Manipulation Language) 対応
  • 23. Google Cloud ベストプラクティス Google BigQuery Confidential & Proprietary ● SELECT のみ ● SQL ライクな構文 (ビッグデータを扱うために拡張 ) ● クエリ対象のテーブル指定 ○ カンマによる UNION ○ テーブルワイルドカード関数 ● ネストテーブル ● 集計関数 ○ テーブル集計、グループ集計、スコープ集計 ● 日付/時刻関数 ● IP 関数, URL 関数 ● JSON 関数 / 正規表現関数 ● 文字列関数 ● ウィンドウ関数 Legacy SQLの特徴
  • 24. Google Cloud ベストプラクティス Google BigQuery Confidential & Proprietary Legacy SQL - SQLライクな構文 ● BigQuery クエリ リファレンス ○ 英語版、日本語版
  • 25. Google Cloud ベストプラクティス Google BigQuery Confidential & Proprietary Standard SQL ● SQL 2011 準拠 ● DML: Update, Delete, Insert をサポート ○ DMLにはクオータあり ○ Max UPDATE/DELETE /day /table : 48 ○ Max UPDATE/DELETE / day /project: 500 ○ Max INSERT / day / table: 1000 ○ Max INSERT / day / project: 10,000 ● Standard SQL クエリ リファレンス
  • 26. Google Cloud ベストプラクティス Google BigQuery Confidential & Proprietary SELECT lower(word) as word, word_count AS frequency, corpus FROM [publicdata:samples.shakespeare] WHERE corpus CONTAINS “king” and LENGTH(word) > 5 ORDER BY frequency DESC SELECT lower(word) as word, word_count AS frequency, corpus FROM `publicdata.samples.shakespeare` WHERE corpus LIKE ‘%king%’ and LENGTH(word) > 5 ORDER BY frequency DESC; Query Examples - Filtering Standard SQL BigQuery SQL (Legacy)
  • 27. Google Cloud ベストプラクティス Google BigQuery Confidential & Proprietary SELECT emp.Name AS EMPLOYEE, dep.Name AS DEPARTMENT FROM EMPLOYEE emp, DEPARTMENT dep WHERE emp.dept_id = dep.dept_id ORDER BY emp.NAME SELECT emp.Name AS EMPLOYEE, dep.Name AS DEPARTMENT FROM [myproject:mycompany.EMPLOYEE] as emp JOIN [myproject:mycompany.DEPARTMENT] as dep ON emp.dept_id = dep.dept_id ORDER BY EMPLOYEE Standard SQL BigQuery SQL (Legacy) Note: このクエリ構造はテーブル参照を除きANSI SQL syntaxに似ています Query Examples - Joins
  • 28. Confidential & Proprietary Google Cloud ベストプラクティス Google BigQuery ● JOIN は 2 つのテーブルを指定して、 1 つ目のテーブルと 2 つ目のテーブルのすべての行のマッチしま す ● ON 句が必要です ( CROSS JOINを除く ) ● BigQuery は INNER, [FULL|RIGHT|LEFT] OUTER と CROSS JOIN をサポートします。 デフォルトは INNER です SELECT … FROM DATASET.TABLE1 [INNER|[FULL|RIGHT|LEFT] OUTER|CROSS] JOIN DATASET.TABLE2 [ON join_condition_1 [... AND join_condition_n] SELECT FROM - Joins
  • 29. Google Cloud ベストプラクティス Google BigQuery Confidential & Proprietary SELECT DISTINCT dept_id FROM ( SELECT dept_id FROM EMPLOYEE UNION ALL SELECT dept_id FROM DEPARTMENT) SELECT dept_id FROM (SELECT dept_id FROM mycompany.EMPLOYEE), (SELECT dept_id FROM mycompany.DEPARTMENT) GROUP BY dept_id Query Examples - Unions Standard SQL BigQuery SQL (Legacy)
  • 30. Confidential & Proprietary Google Cloud ベストプラクティス Google BigQuery ● 出産した年齢が最も高い母親を探す; state, year, と ageを表示 SELECT state, source_year AS year, mother_age AS age FROM `publicdata.samples.natality` ORDER BY age DESC LIMIT 1 ● 最新年の州の略称で集計した出生数で検索する SELECT state, source_year AS year, COUNT(*) as number FROM `publicdata.samples.natality` WHERE state IS NOT NULL AND year IS NOT NULL GROUP BY state, year ORDER BY year DESC LIMIT 5 BigQuery Example- Limit
  • 31. Confidential & Proprietary Google Cloud ベストプラクティス Google BigQuery ● 公的な天候データから、月ごとのパリの Hot days (> 83 degrees) をカウントする SELECT year, month, count(round(mean_temp)) AS num_hot_days FROM `publicdata.samples.gsod` WHERE station_number = 071490 AND mean_temp > 83 GROUP BY year, month ORDER BY num_hot_days DESC, month DESC LIMIT 10 More Examples
  • 32. Confidential & Proprietary Google Cloud ベストプラクティス Google BigQuery ● bq command line tool を使い、ロンドン・ヒースロー空港 (station 037720)の最新 10 日で雷雨の日を見つける > bq query “SELECT year, month, day, thunder, rain FROM `publicdata.samples.gsod` WHERE thunder = TRUE AND rain = TRUE AND station_number = 037720 ORDER BY year DESC, month DESC, day DESC LIMIT 10” More Examples
  • 33. Confidential & Proprietary Google Cloud ベストプラクティス Google BigQuery ● 複雑なプロセスの場合には sub-select 分を使ったほうが簡単なときがある ● sub-select 句の結果は、外部の SQL Select 句のソーステーブルとして使われる SELECT … FROM ( SELECT … FROM .. ) SELECT FROM – Sub-Select
  • 34. Confidential & Proprietary Google Cloud ベストプラクティス Google BigQuery ● シンプルなクエリを使うと複合クエリを使える ● Joins の Sub-Select SELECT … FROM [dataset.table1] as T1 JOIN [dataset.table2] as T2 ON T1.x = T2.x JOIN (SELECT … FROM dataset.table3) as T3 ON T1.y = T3.y WHERE ... SELECT FROM – Sub-Select Join
  • 35. Confidential & Proprietary Google Cloud ベストプラクティス Google BigQuery ● 他の SQL ベースのシステムとは違い、BigQuery は Join ではなくテーブルの Union をカンマで示します。 ● 同様のスキーマを持つ複数テーブルへのクエリ ● Join と Union SELECT … FROM [dataset.table1],[dataset.table2],[dataset.table3] AS T1 JOIN (SELECT … FROM dataset.table4) as T4 ON T1.y = T4.y WHERE ... SELECT FROM – Union
  • 36. Google Cloud ベストプラクティス Google BigQuery Confidential & Proprietary ● Dry Run によりスキャンサイズが確認可能 (Web UI | bq コマンド | API) ● エラーも事前検出出来る Click Query Tips
  • 37. Google Cloud ベストプラクティス Google BigQuery Confidential & Proprietary ● BigQuery Mate (3rd party Chrome Extention) で更に便利に ○ スキャン費用概算表示 ○ デフォルト SQL の設定 ○ SQL の replace ○ パラメータ設定 ○ 等 Query Tips
  • 38. Confidential & Proprietary Google Cloud ベストプラクティス Google BigQuery Data extraction and exportation from BigQuery
  • 39. Google Cloud ベストプラクティス Google BigQuery Confidential & Proprietary 抽出の方法: ● データをエクスポートする目的 ○ 3rd パーティツールを使うため ○ スナップショット ○ バックアップ ● エクスポートに使うもの ○ WebUI ○ CLI ○ REST API BigQuery からのデータ抽出
  • 40. Google Cloud ベストプラクティス Google BigQuery Confidential & Proprietary 抽出の方法: ● 他のテーブルやGoogle Cloud Storage へのエクスポート ● 圧縮または、非圧縮CSV / JSON / AVRO ● 複数のテーブルまたは複数のファイルへのシャード BigQuery からのデータ抽出
  • 41. Google Cloud ベストプラクティス Google BigQuery Confidential & Proprietary Configuration Options 2 つの観点: デフォルト: ● デフォルトはCSV. ● ネストされたフィールドまたは繰り返しフィー ルドを持つテーブルは、CSVとしてエクス ポートできません。 ● デフォルトの圧縮は NONE. ● CSV ● JSON ● Avro* ● GZIP ● NONE 圧縮 出力Format *Avro フォーマットは GZIP 圧縮できません
  • 42. Google Cloud ベストプラクティス Google BigQuery Confidential & Proprietary テキサスで”J”で始まる人気の名前トップ100 BigQuery からのデータ抽出 - 他のテーブルへのエクスポート
  • 43. Google Cloud ベストプラクティス Google BigQuery Confidential & Proprietary テキサスで”J”で始まる人気の名前トップ100 BigQuery からのデータ抽出 - 他のテーブルへのエクスポート
  • 44. Google Cloud ベストプラクティス Google BigQuery Confidential & Proprietary BigQuery からのデータ抽出 - Cloud Storage へのエクスポート テーブルの GCS へのエクスポート
  • 45. Google Cloud ベストプラクティス Google BigQuery Confidential & Proprietary BigQuery からのデータ抽出 - Cloud Storage へのエクスポート テーブルの GCS へのエクスポート
  • 46. Google BigQuery Google Cloud ベストプラクティス Thank you 1 : Introduction / BigQuery Organization / Exploring and Interacting with BigQuery 2 : Data ingestion into BigQuery / Writing Queries in BigQuery / Data extraction and exportation from BigQuery 3 : Best Practices and Performance Optimization / Cost Optimization