• ニーズ:サイロ化した業務システムの分析のためにデータを統合・集約した DWHが必要と
なった
• 問題:高コスト、スキーマオンライト(後述)、ML対応が困難
従来のDWH型情報基盤
• What is a Data Lakehouse? – Databricks
データソース:サイロ化した業務システム
統合:様々なデータを抽出、変換、ロード(ETL)
DWH:データマートの集合体としてRDBMSに保管
BI、可視化:ユーザライクなツールによるデータの分析
Azure BIデータ基盤ソリューション例
Azure SynapseAnalytics
Synapse Pipelines
SQL Pool
Spark Pool
Data Lake Storage
Spark ETL(GUI)
データレイクに
直接 クエリ
Spark ETL
(コードファースト)
Overview Data Develop Monitor
Pipeline Manage
Synapse Studio
統合管理
データCopy
Power BI Report
Power BI
Dataset
セマンティック層
論理DWH
/物理DWH
可視化