SlideShare a Scribd company logo
1 of 27
Download to read offline
本 格 的 な デ ー タ 民 主 化 を 成 す ツ ー ル
dbt Cloud
P a u l H a l l a s t e
Table of Contents
ETL → ELT
現状の課題とその背景
成功事例 Q&A
ソリューション 料金体系
DATA
WAREHOUSE
TRANS-
FORM
DATA
SOURCES
ETL -> ELT: データ変換の革命
従来のETLでは、T(変換)の部分は曖昧な立場。
ETL
Extract Load
課題あり
BI/ML/Ops
TRANS-
FORM (in
Warehouse)
DATA
SOURCES
ELT
Load
Extract BI/ML/Ops
課題あり
ELの後は?
全体像が
不明
データ元
が不明
ベンダー
ロックイン
コラボし
にくい
ブラック
ボックス
ELの後は?
全体像が
不明
データ元
が不明
コラボし
にくい
ブラック
ボックス
オープンソース
ELの後は?
全体像が
不明
データ元
が不明
ブラック
ボックス
オープンソース
SQLだけで
完結
ELの後は?
全体像が
不明
データ元
が不明
オープンソース
SQLだけで
完結
Git連携
ELの後は?
全体像が
不明
オープンソース
Git連携
SQLだけで
完結 データリネージュ
可視化
変換ステップ


一気通貫で可視化
オープンソース
データリネージュ
可視化
Git連携
SQLだけで
完結
ELの後は?
dbt機能その1:すべてのSQL文(モデル)がSELECT文
簡単なSQL
ボイラープレート
コードを書く必要は
ない
再現性
Jinjaを使い、
複雑なパターン
の標準化
dbtは実行時にDDLを生成する
{{ config(materialized=table) }}


select


…


from accounts
CREATE TABLE … AS (


select


…


from accounts


);
dbtで書いたクエリ dbtは実際に実行するクエリ
Jinjaで簡単に標準化
Jinjaを使う場合
SQLのみで書く場合
…
527行が3行に!
dbt機能その2:{{ref()}}文でクエリの関係を表現する
自動的に
schema名を
補間する
select * from {{ ref(‘stg_orders’) }}
select * from raw.dbt_paulh.stg_orders
dbtで書いたクエリ
dbtは実際に実行するクエリ
dbt機能その2:{{ref()}}でクエリの関係を図解
依存関係を
作る
どのモデルがどの
モデルを参照する
かを一括で分かる
dbt機能その3:簡単なテスティング
データに関する
推定をテストで
検証できる
失敗した行を
確認できる
• unique(値は一意か)
• not_null(NULLが含まれていないか)
• accepted_values(特定の値であるか)
• relationships(参照整合性があるか)
テストできる
ことの事例:
モデル名(SELECT文名)
列名
テスト名
dbt機能その3:簡単なテスティング
dbt機能その4:自動ドキュメンテーション
dbtの情報 DWHの情報
dbt機能その4:自動ドキュメンテーション
ドキュメンテーションのサイトが生成される
dbt機能その4:自動ドキュメンテーション
データリネージュを可視化できる
成功事例①
稼働時間
99.9% ヶ月で移行
3
トータルの追加コスト
$0
毎日6∼8時間
のメンテナン
ス時間がほぼ
ゼロに短縮。
1200モデル
26のデータソース
を d b t に 移 行 。
6300のデータ品
質テストを設定。
業界最高のデータ
インフラストラク
チャツールである
ため選んだが、追
加のコストなく導
入できた。
成功事例②
移行されたコード行数
100,000 dbtを共用している
アナリスト
30+
年間節約
£72,000*
*1,155万円相当
2人のデータエ
ンジニアがdbt
を導入し10万行
以上のコードを
移行した。
すべてのアナリスト
はdbtのおかげで生
産性飛躍的に向上。
変換の効率化で、
毎月のBigQueryの
請求額を6,000ポ
ンド節約できた。
料金体系
DEVELOPER
$0
ブラウザベースのIDE
ジョブスケジューリング
無制限の毎日の実行
ロギングとアラート
自動ドキュメンテーション
GitHub/GitLabと連携
ソースの鮮度レポート
プルリクエストに基づいて構築
TEAM
$50/人/月
Developer +
Read-Onlyユーザー50名
最大ジョブ5件並行実行可能
APIアクセス
ENTERPRISE
お問い合わせ
ください
Team +
シングルサインオン(SSO)
複数の展開オプション
カスタムSLA
コンサルサービス
役割ベースのACL
きめ細かいGit権限
FOREVER
FREE
• ローデータを最小限の手間で、効率良く開発す
るにはdbt Cloudがおすすめ
• オープンソース、SQLベース、Git連携、データ
リネージュと変換の全てのステップを可視化で
きるdbt
• これらの機能により、本格的なデータの民主化
を実現できる
最後に
変換ステップ


一気通貫で可視化
データリネージュ可視化
Git連携
SQLだけで完結
オープンソース
?
Trusted by the best
Q&A
Appendix
Feature Developer Team Enterprise
Baseline Features
Browser-based IDE
Job scheduling & reporting
Unlimited daily runs
Logging & alerting
Data documentation
GitHub & GitLab integrations
Source freshness reporting
Advanced Features
Build on pull requests
dbt Cloud API Access
Up to 5 concurrently running jobs
Security Controls
Single Sign On (SSO)
Role-based ACLs
Fine-grained git permissions
Premium Support
Implementation assistance
Dedicated account management
Priority tech support
dbt Labs Security and Legal review
Custom Deployments
Custom SLAs
Option for single-tenant (add-on)
Access to professional services (add-on)
Invoicing (e.g. AWS marketplace)

More Related Content

What's hot

そんなトランザクションマネージャで大丈夫か?
そんなトランザクションマネージャで大丈夫か?そんなトランザクションマネージャで大丈夫か?
そんなトランザクションマネージャで大丈夫か?takezoe
 
Lookerユーザー会#7 RefinementsとExtendsを活用したExplore構築 ~JOINを跨いだフィールドをすっきり実装しよう〜 / L...
Lookerユーザー会#7 RefinementsとExtendsを活用したExplore構築 ~JOINを跨いだフィールドをすっきり実装しよう〜 / L...Lookerユーザー会#7 RefinementsとExtendsを活用したExplore構築 ~JOINを跨いだフィールドをすっきり実装しよう〜 / L...
Lookerユーザー会#7 RefinementsとExtendsを活用したExplore構築 ~JOINを跨いだフィールドをすっきり実装しよう〜 / L...Chikako Hirayama
 
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...NTT DATA Technology & Innovation
 
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現Ryoma Nagata
 
ビジネスパーソンのためのDX入門講座エッセンス版
ビジネスパーソンのためのDX入門講座エッセンス版ビジネスパーソンのためのDX入門講座エッセンス版
ビジネスパーソンのためのDX入門講座エッセンス版Tokoroten Nakayama
 
ドメイン駆動設計 ( DDD ) をやってみよう
ドメイン駆動設計 ( DDD ) をやってみようドメイン駆動設計 ( DDD ) をやってみよう
ドメイン駆動設計 ( DDD ) をやってみよう増田 亨
 
リクルートが実践で学んできた“セルフBI”推進に求められる3つの要素
リクルートが実践で学んできた“セルフBI”推進に求められる3つの要素リクルートが実践で学んできた“セルフBI”推進に求められる3つの要素
リクルートが実践で学んできた“セルフBI”推進に求められる3つの要素Recruit Technologies
 
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)Yosuke Katsuki
 
「関心の分離」と「疎結合」 ソフトウェアアーキテクチャのひとかけら
「関心の分離」と「疎結合」   ソフトウェアアーキテクチャのひとかけら「関心の分離」と「疎結合」   ソフトウェアアーキテクチャのひとかけら
「関心の分離」と「疎結合」 ソフトウェアアーキテクチャのひとかけらAtsushi Nakamura
 
DMBOKをベースにしたデータマネジメント
DMBOKをベースにしたデータマネジメントDMBOKをベースにしたデータマネジメント
DMBOKをベースにしたデータマネジメントKent Ishizawa
 
ドメイン駆動設計の正しい歩き方
ドメイン駆動設計の正しい歩き方ドメイン駆動設計の正しい歩き方
ドメイン駆動設計の正しい歩き方増田 亨
 
PostgreSQLアンチパターン
PostgreSQLアンチパターンPostgreSQLアンチパターン
PostgreSQLアンチパターンSoudai Sone
 
Delta Lake with Synapse dataflow
Delta Lake with Synapse dataflowDelta Lake with Synapse dataflow
Delta Lake with Synapse dataflowRyoma Nagata
 
DXとかDevOpsとかのなんかいい感じのやつ 富士通TechLive
DXとかDevOpsとかのなんかいい感じのやつ 富士通TechLiveDXとかDevOpsとかのなんかいい感じのやつ 富士通TechLive
DXとかDevOpsとかのなんかいい感じのやつ 富士通TechLiveTokoroten Nakayama
 
DDD x CQRS 更新系と参照系で異なるORMを併用して上手くいった話
DDD x CQRS   更新系と参照系で異なるORMを併用して上手くいった話DDD x CQRS   更新系と参照系で異なるORMを併用して上手くいった話
DDD x CQRS 更新系と参照系で異なるORMを併用して上手くいった話Koichiro Matsuoka
 
フロー効率性とリソース効率性について #xpjug
フロー効率性とリソース効率性について #xpjugフロー効率性とリソース効率性について #xpjug
フロー効率性とリソース効率性について #xpjugItsuki Kuroda
 
リクルートにおけるデータのインフラ化への取組
リクルートにおけるデータのインフラ化への取組リクルートにおけるデータのインフラ化への取組
リクルートにおけるデータのインフラ化への取組Recruit Technologies
 
JapanTaxiにおけるML Ops 〜機械学習の開発運用プロセス〜
JapanTaxiにおけるML Ops 〜機械学習の開発運用プロセス〜JapanTaxiにおけるML Ops 〜機械学習の開発運用プロセス〜
JapanTaxiにおけるML Ops 〜機械学習の開発運用プロセス〜Tetsutaro Watanabe
 

What's hot (20)

そんなトランザクションマネージャで大丈夫か?
そんなトランザクションマネージャで大丈夫か?そんなトランザクションマネージャで大丈夫か?
そんなトランザクションマネージャで大丈夫か?
 
Lookerユーザー会#7 RefinementsとExtendsを活用したExplore構築 ~JOINを跨いだフィールドをすっきり実装しよう〜 / L...
Lookerユーザー会#7 RefinementsとExtendsを活用したExplore構築 ~JOINを跨いだフィールドをすっきり実装しよう〜 / L...Lookerユーザー会#7 RefinementsとExtendsを活用したExplore構築 ~JOINを跨いだフィールドをすっきり実装しよう〜 / L...
Lookerユーザー会#7 RefinementsとExtendsを活用したExplore構築 ~JOINを跨いだフィールドをすっきり実装しよう〜 / L...
 
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
 
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
 
ビジネスパーソンのためのDX入門講座エッセンス版
ビジネスパーソンのためのDX入門講座エッセンス版ビジネスパーソンのためのDX入門講座エッセンス版
ビジネスパーソンのためのDX入門講座エッセンス版
 
ドメイン駆動設計 ( DDD ) をやってみよう
ドメイン駆動設計 ( DDD ) をやってみようドメイン駆動設計 ( DDD ) をやってみよう
ドメイン駆動設計 ( DDD ) をやってみよう
 
リクルートが実践で学んできた“セルフBI”推進に求められる3つの要素
リクルートが実践で学んできた“セルフBI”推進に求められる3つの要素リクルートが実践で学んできた“セルフBI”推進に求められる3つの要素
リクルートが実践で学んできた“セルフBI”推進に求められる3つの要素
 
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
 
「関心の分離」と「疎結合」 ソフトウェアアーキテクチャのひとかけら
「関心の分離」と「疎結合」   ソフトウェアアーキテクチャのひとかけら「関心の分離」と「疎結合」   ソフトウェアアーキテクチャのひとかけら
「関心の分離」と「疎結合」 ソフトウェアアーキテクチャのひとかけら
 
MLOpsはバズワード
MLOpsはバズワードMLOpsはバズワード
MLOpsはバズワード
 
DMBOKをベースにしたデータマネジメント
DMBOKをベースにしたデータマネジメントDMBOKをベースにしたデータマネジメント
DMBOKをベースにしたデータマネジメント
 
ドメイン駆動設計の正しい歩き方
ドメイン駆動設計の正しい歩き方ドメイン駆動設計の正しい歩き方
ドメイン駆動設計の正しい歩き方
 
PostgreSQLアンチパターン
PostgreSQLアンチパターンPostgreSQLアンチパターン
PostgreSQLアンチパターン
 
Delta Lake with Synapse dataflow
Delta Lake with Synapse dataflowDelta Lake with Synapse dataflow
Delta Lake with Synapse dataflow
 
DXとかDevOpsとかのなんかいい感じのやつ 富士通TechLive
DXとかDevOpsとかのなんかいい感じのやつ 富士通TechLiveDXとかDevOpsとかのなんかいい感じのやつ 富士通TechLive
DXとかDevOpsとかのなんかいい感じのやつ 富士通TechLive
 
DDD x CQRS 更新系と参照系で異なるORMを併用して上手くいった話
DDD x CQRS   更新系と参照系で異なるORMを併用して上手くいった話DDD x CQRS   更新系と参照系で異なるORMを併用して上手くいった話
DDD x CQRS 更新系と参照系で異なるORMを併用して上手くいった話
 
MLOps入門
MLOps入門MLOps入門
MLOps入門
 
フロー効率性とリソース効率性について #xpjug
フロー効率性とリソース効率性について #xpjugフロー効率性とリソース効率性について #xpjug
フロー効率性とリソース効率性について #xpjug
 
リクルートにおけるデータのインフラ化への取組
リクルートにおけるデータのインフラ化への取組リクルートにおけるデータのインフラ化への取組
リクルートにおけるデータのインフラ化への取組
 
JapanTaxiにおけるML Ops 〜機械学習の開発運用プロセス〜
JapanTaxiにおけるML Ops 〜機械学習の開発運用プロセス〜JapanTaxiにおけるML Ops 〜機械学習の開発運用プロセス〜
JapanTaxiにおけるML Ops 〜機械学習の開発運用プロセス〜
 

dbt Cloud intro 日本語 202206