SlideShare a Scribd company logo
1 of 12
AWS朝会2022/1
セッション① 数年間、レイクハウスを設計運用してみた
2
本日の内容と目的
• 数年間、データ分析基盤の設計・運用・コンサルティングをしてきました。
• 技術としてかなりこなれてきた部分もありますが、ノウハウを共有したいと思っています。
3
そもそも、データ分析基盤、データレイクって?(座学)
4
そもそもデータ分析基盤とは?
• 社内外の様々なデータを一元的に保管され、データ加工ツールや分析ツール(AI/BI) が統合
されている基盤
• 代表的なデータ分析基盤のアーキテクチャ
Enterprise
System/
Services
データ分析基盤
収集 蓄積 集計 活用
データ
ウェアハウス
(Redshift,
EMR,
S3etc)
分析・学習/推論
(Quick Sight,
SageMaker etc)
構造
Data
準構造
Data
非構造
Data
データレイク
(S3,EMR
etc)
Data Send tool
(DMS,
Data Sync,
Cloud watch
logs,
Kinesis,
Storage
Gateway,
EFS,
IoT Core,etc)
Enterprise
System
WEB services
Client device
IoT device
準構造
Data
分析
データ
マート
(RDS、
Redshift,
S3 etc)
Glue Glue
5
レイクハウスアーキテクチャとは?
• データレイク+DWH(データウェアハウス)のアーキテクチャ。AWSの狭義では、Redshift
+S3やLake Formation。
• ローデータ、加工済みデータを広大な空間(S3)に様々な形
にて保管
• BI,AI等多様なアプリケーションから接続(専用でない)
• ローデータを広大な空間(S3)に様々な形にて保管
• BI,AI等多様なアプリケーションの用途に合わせた形に加工し
たのをDWH(Redshift)に保存
• データレイクの概念 • レイクハウスの概念
データレイク解説シリーズ 第 3 回: AWS でデータレイクを作ってみよう -
builders.flash☆ - 変化を求めるデベロッパーを応援するウェブマガジン |
AWS (amazon.com)
データレイクとは (amazon.com)
6
レイクハウスアーキテクチャとは? そもそもデータストアの種類
• 各データストアにおけるデータの状態、性能の傾向と代表的な用途は下記。
レイクハウスにおけるデータストアの代表的な用途
S3 EMR Redshift RDS
• 元データの保存
• 加工済みデータ
や履歴データの
保存
• AI/BIサービス参
照用データや学
習済みデータの
保存
• 作業場
• バックアップ
• 加工済みデータ
や履歴データの
保存
• Hadoop分析ライ
ブラリや分散処
理の作業場
• 加工済みデータ
や履歴データの
保存
• AI/BIサービス参
照用データや学
習済みデータの
保存
• AI/BIサービス参
照用データや学
習済みデータの
保存
データウェアハウス
(Redshift,EMR,
S3etc)
データレイク
(S3,EMRetc)
データマート
(RDS、Redshift,
S3 etc)
Throughput Response
Raw Data Processed Data
7
よくある課題
8
超えるべきよくある課題
1. せっかく構築したが誰にも利用されない
2. 性能追求・データストア乱立で「統合基盤」のはずが
サイロ化
9
せっかく構築したが誰にも利用されない
• 分析基盤を構築する前にヒアリングを行い、機能要件/非機能要件を明らかにする
• 運用後でも、活用候補の方にヒアリングし、課題と分析基盤の合致点を探り、併走支援する
• 分析業務 ヒアリングの例
# カテゴリ 質問
1 分析業務の概要 貴殿の主たる業務の概要をお聞かせください。
2 分析業務の概要
貴殿の分析業務の概要をお聞かせください。
・分析の目的
・分析の形(定型レポーティング(月次レポート等)、非定型分析(アドホック分析)、予測等のシュミレーション)
・分析に係る作業時間
・報告先と分析結果確認者の行動
4 分析業務の概要データ・環境
分析業務に係る可視化、集計、加工、蓄積の作業は、内省と外部委託のどちらでしょうか?内省の場合、どのようなアプリケーション、環境を利用し
ておりますでしょうか?
例:・アプリケーション 可視化集計はTableau、加工はExcel、蓄積はAccess
5 分析業務の概要データ・環境
分析業務で利用するデータをご教示ください。
例:・社内データ(社内システムの提供するデータ)の対象とデータ量 ・社外データ(オープンデータや調査会社発行のデータ等)の利用
6 分析業務の課題
分析計画・目的、分析データ(データそのものやマスタの統一軸等)に対する課題があればお聞かせください。
例:・もっと鮮度の高いレポーティングをしたいが、データ取得や更新に時間を要する
・各国間のマスタが異なり、横ぐし・統一軸でのレポート作成や評価ができない
・データの粒度鮮度精度が分析担当者によりばらばらで、恣意的なデータ選択・加工等、データが怪しい
・予測精度を向上させたいが、適切な分析をデザインできない
7 分析業務の課題
分析ツール・環境やそのサポートに対する課題があればお聞かせください。
例:・分析しているPCのスペックやネットワーク、ファイルサーバが貧弱。 ・加工がExcel手動の為に、品質や効率が人依存
・アプリケーションは部の個別調達の為、高性能な分析ツールを利しづらい ・ヘルプデスクではSW動作のサポートにとどまる
8 分析業務の課題
利用・定着面での課題があればお聞かせください。
例:・そもそも作成したレポートが、想定読者に読まれていない ・全て非定型分析の分析が求められる
・高度な分析を行いたいが、分析担当者の分析スキルが高くない ・ベテランのデータ分析者はいるが、独自のExcelマクロを組んでいるため、他人
の利用や再利用が困難。その方は職人気質であり、使い慣れたExcel・Access以外を利用する気がない
10
性能追求・データストア乱立で「統合基盤」のはずがサイロ化
• 画一的な解はまだ存在しないと思われる。
• 迷ったらシンプルなアーキテクチャを推したい。特に、Redshift + S3の基本アーキテクチャ
• 推奨のアーキテクチャ データ分析基盤
収集 蓄積 集計 活用
データ
ウェアハウス
(Redshift)
分析・学習/推論
(Quick Sight,
SageMaker etc)
データレイク
(S3)
Data Send tool
(DMS,
Data Sync,
Cloud watch
logs,
Kinesis,
Storage
Gateway,
EFS,
IoT Core,etc)
分析
データ
マート
(Redshift)
Glue Glue
11
性能追求・データストア乱立で「統合基盤」のはずがサイロ化
• Redshiftは高機能化が著しく、より一層のユースケースに対応できる。
• Redshiftの進化
# あるある 1昔前(2017)くらいの対処方法 2021の対処方法
1 Redshiftを一時停止したい
一時停止ができないので、スナップショット+
クラスタ削除(あるいは、このバッチ)
一時停止が可能(バックアップ中は失敗する)
2 materialized viewを使いたい 物理テーブルで作成する materialized view機能が利用可能
3 ストアドプロシージャを使いたい あきらめる ストアドプロシージャ機能が利用可能
4
Redshift以外のデータも使い分析し
たい
Redshiftにすべてのデータを移行。あるいはS3
にエクスポートしてSpectrum
RedshiftでFederated Queryが可能。あるいは
AthenaからFederated queryを発行
5 Redshiftのデータを機械学習したい
Redshiftへの学習、推論プッシュダウンができな
いので、機械学習AP側でデータをFetchして処理
Redshift MLがプレビュー→GAしました
6
ソートキー、分散キーの設定になじ
みがない(INDEXはわかるけど)
分散キーの設定が必要だけどよくわからないか
ら、とりあえずEVEN
AUTO設定が利用可能
7
同時実行数は静的かつリソースも分
割固定であり、低く設定すると、処
理待ちキューが発生
WLM設計を緻密に行う、割り切る Concurrency Scailingで自動スケール
8
ディスクの料金が高い。かといって
Spectrumは使いずらい
DSノードを利用する
RA3ノードによるS3とRedshift内ディスクの自動
最適化を利用する
Redshift Serverlessが登場
12
(参考)Redshift MLを使ってみました
• Redshift中のデータから予測モデルを使いたい場合、簡易で非常に便利。
• CREATE TABLEのように、説明変数と目的変数
を定義したモデルを定義。(SQL実行により学習)
• 学習モデルをストアドプロシジャのように利用
可能。
学習モデルの作成 推論の実行
アカウント数字
Redshiftクラスタに必要な設定:
• Elasitc ipアドレスの付与
• クラスタバージョン「sql_preview」の
指定

More Related Content

What's hot

20190517 Spark+AI Summit2019最新レポート
20190517 Spark+AI Summit2019最新レポート20190517 Spark+AI Summit2019最新レポート
20190517 Spark+AI Summit2019最新レポートRyoma Nagata
 
BigData Architecture for Azure
BigData Architecture for AzureBigData Architecture for Azure
BigData Architecture for AzureRyoma Nagata
 
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)Yosuke Katsuki
 
データ分析を支える技術 DWH再入門
データ分析を支える技術 DWH再入門データ分析を支える技術 DWH再入門
データ分析を支える技術 DWH再入門Satoru Ishikawa
 
ビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年versionビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年versionTetsutaro Watanabe
 
Data platformdesign
Data platformdesignData platformdesign
Data platformdesignRyoma Nagata
 
Power Query Online
Power Query OnlinePower Query Online
Power Query OnlineRyoma Nagata
 
【輪読会】実践的データ基盤への処方箋
【輪読会】実践的データ基盤への処方箋【輪読会】実践的データ基盤への処方箋
【輪読会】実践的データ基盤への処方箋Momota Sasaki
 
DX認定制度システム開発裏話:技術編
DX認定制度システム開発裏話:技術編DX認定制度システム開発裏話:技術編
DX認定制度システム開発裏話:技術編Arichika TANIGUCHI
 
データ分析基盤運⽤チームの 運⽤業務を改善してみた話
データ分析基盤運⽤チームの 運⽤業務を改善してみた話データ分析基盤運⽤チームの 運⽤業務を改善してみた話
データ分析基盤運⽤チームの 運⽤業務を改善してみた話Recruit Lifestyle Co., Ltd.
 
ビックデータ分析基盤の成⻑の軌跡
ビックデータ分析基盤の成⻑の軌跡ビックデータ分析基盤の成⻑の軌跡
ビックデータ分析基盤の成⻑の軌跡Recruit Lifestyle Co., Ltd.
 
Databricks の始め方
Databricks の始め方Databricks の始め方
Databricks の始め方Ryoma Nagata
 
データ分析を支える技術 データ分析基盤再入門
データ分析を支える技術 データ分析基盤再入門データ分析を支える技術 データ分析基盤再入門
データ分析を支える技術 データ分析基盤再入門Satoru Ishikawa
 
Data Factory V2 新機能徹底活用入門
Data Factory V2 新機能徹底活用入門Data Factory V2 新機能徹底活用入門
Data Factory V2 新機能徹底活用入門Keisuke Fujikawa
 
Ignite update databricks_stream_analytics
Ignite update databricks_stream_analyticsIgnite update databricks_stream_analytics
Ignite update databricks_stream_analyticsRyoma Nagata
 
Glue DataBrewでデータをクリーニング、加工してみよう
Glue DataBrewでデータをクリーニング、加工してみようGlue DataBrewでデータをクリーニング、加工してみよう
Glue DataBrewでデータをクリーニング、加工してみようtakeshi suto
 
性能問題を起こしにくい信頼されるクラウド RDB のつくりかた
性能問題を起こしにくい信頼されるクラウド RDB のつくりかた性能問題を起こしにくい信頼されるクラウド RDB のつくりかた
性能問題を起こしにくい信頼されるクラウド RDB のつくりかたTomoyuki Oota
 
Azure Antenna はじめての Azure Data Lake
Azure Antenna はじめての Azure Data LakeAzure Antenna はじめての Azure Data Lake
Azure Antenna はじめての Azure Data LakeHideo Takagi
 
データウェアハウス・BI の再構築から見る情報系基盤の再構築ポイント
データウェアハウス・BI の再構築から見る情報系基盤の再構築ポイントデータウェアハウス・BI の再構築から見る情報系基盤の再構築ポイント
データウェアハウス・BI の再構築から見る情報系基盤の再構築ポイントUNIRITA Incorporated
 

What's hot (20)

Delta lakesummary
Delta lakesummaryDelta lakesummary
Delta lakesummary
 
20190517 Spark+AI Summit2019最新レポート
20190517 Spark+AI Summit2019最新レポート20190517 Spark+AI Summit2019最新レポート
20190517 Spark+AI Summit2019最新レポート
 
BigData Architecture for Azure
BigData Architecture for AzureBigData Architecture for Azure
BigData Architecture for Azure
 
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
 
データ分析を支える技術 DWH再入門
データ分析を支える技術 DWH再入門データ分析を支える技術 DWH再入門
データ分析を支える技術 DWH再入門
 
ビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年versionビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年version
 
Data platformdesign
Data platformdesignData platformdesign
Data platformdesign
 
Power Query Online
Power Query OnlinePower Query Online
Power Query Online
 
【輪読会】実践的データ基盤への処方箋
【輪読会】実践的データ基盤への処方箋【輪読会】実践的データ基盤への処方箋
【輪読会】実践的データ基盤への処方箋
 
DX認定制度システム開発裏話:技術編
DX認定制度システム開発裏話:技術編DX認定制度システム開発裏話:技術編
DX認定制度システム開発裏話:技術編
 
データ分析基盤運⽤チームの 運⽤業務を改善してみた話
データ分析基盤運⽤チームの 運⽤業務を改善してみた話データ分析基盤運⽤チームの 運⽤業務を改善してみた話
データ分析基盤運⽤チームの 運⽤業務を改善してみた話
 
ビックデータ分析基盤の成⻑の軌跡
ビックデータ分析基盤の成⻑の軌跡ビックデータ分析基盤の成⻑の軌跡
ビックデータ分析基盤の成⻑の軌跡
 
Databricks の始め方
Databricks の始め方Databricks の始め方
Databricks の始め方
 
データ分析を支える技術 データ分析基盤再入門
データ分析を支える技術 データ分析基盤再入門データ分析を支える技術 データ分析基盤再入門
データ分析を支える技術 データ分析基盤再入門
 
Data Factory V2 新機能徹底活用入門
Data Factory V2 新機能徹底活用入門Data Factory V2 新機能徹底活用入門
Data Factory V2 新機能徹底活用入門
 
Ignite update databricks_stream_analytics
Ignite update databricks_stream_analyticsIgnite update databricks_stream_analytics
Ignite update databricks_stream_analytics
 
Glue DataBrewでデータをクリーニング、加工してみよう
Glue DataBrewでデータをクリーニング、加工してみようGlue DataBrewでデータをクリーニング、加工してみよう
Glue DataBrewでデータをクリーニング、加工してみよう
 
性能問題を起こしにくい信頼されるクラウド RDB のつくりかた
性能問題を起こしにくい信頼されるクラウド RDB のつくりかた性能問題を起こしにくい信頼されるクラウド RDB のつくりかた
性能問題を起こしにくい信頼されるクラウド RDB のつくりかた
 
Azure Antenna はじめての Azure Data Lake
Azure Antenna はじめての Azure Data LakeAzure Antenna はじめての Azure Data Lake
Azure Antenna はじめての Azure Data Lake
 
データウェアハウス・BI の再構築から見る情報系基盤の再構築ポイント
データウェアハウス・BI の再構築から見る情報系基盤の再構築ポイントデータウェアハウス・BI の再構築から見る情報系基盤の再構築ポイント
データウェアハウス・BI の再構築から見る情報系基盤の再構築ポイント
 

Similar to AWS朝会2022/1 セッション① 数年間、レイクハウスを設計運用してみた

実案件で見る データ分析用AWS基盤の構築方法 - Developers.IO 2017 (20170701)
実案件で見る データ分析用AWS基盤の構築方法 - Developers.IO 2017 (20170701)実案件で見る データ分析用AWS基盤の構築方法 - Developers.IO 2017 (20170701)
実案件で見る データ分析用AWS基盤の構築方法 - Developers.IO 2017 (20170701)Yosuke Katsuki
 
データ分析基盤におけるOpsのためのDev with event driven + serverless
データ分析基盤におけるOpsのためのDev with event driven + serverlessデータ分析基盤におけるOpsのためのDev with event driven + serverless
データ分析基盤におけるOpsのためのDev with event driven + serverlessShoji Shirotori
 
アプリケーション開発者のためのAzure Databricks入門
アプリケーション開発者のためのAzure Databricks入門アプリケーション開発者のためのAzure Databricks入門
アプリケーション開発者のためのAzure Databricks入門Yoichi Kawasaki
 
データ分析基盤を支えるエンジニアリング
データ分析基盤を支えるエンジニアリングデータ分析基盤を支えるエンジニアリング
データ分析基盤を支えるエンジニアリングRecruit Lifestyle Co., Ltd.
 
【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(前編)
【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(前編)【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(前編)
【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(前編)日本マイクロソフト株式会社
 
祝★AWSスタンダードコンサルティングパートナーに認定されました
祝★AWSスタンダードコンサルティングパートナーに認定されました祝★AWSスタンダードコンサルティングパートナーに認定されました
祝★AWSスタンダードコンサルティングパートナーに認定されましたCore Concept Technologies
 
PDF版 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう Db tech showcase2020
PDF版 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう Db tech showcase2020PDF版 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう Db tech showcase2020
PDF版 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう Db tech showcase2020Daisuke Masubuchi
 
ビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo Fall
ビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo Fallビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo Fall
ビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo FallYusukeKuramata
 
[db tech showcase Tokyo 2015] B12:カラムストアデータベースの技術と活用法 by 日本電気株式会社 田村稔
[db tech showcase Tokyo 2015] B12:カラムストアデータベースの技術と活用法 by 日本電気株式会社 田村稔[db tech showcase Tokyo 2015] B12:カラムストアデータベースの技術と活用法 by 日本電気株式会社 田村稔
[db tech showcase Tokyo 2015] B12:カラムストアデータベースの技術と活用法 by 日本電気株式会社 田村稔Insight Technology, Inc.
 
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...Insight Technology, Inc.
 
データを集めて貯めて分析する… 最先端のテクノロジーが詰まったIBMクラウドのご紹介
データを集めて貯めて分析する…  最先端のテクノロジーが詰まったIBMクラウドのご紹介データを集めて貯めて分析する…  最先端のテクノロジーが詰まったIBMクラウドのご紹介
データを集めて貯めて分析する… 最先端のテクノロジーが詰まったIBMクラウドのご紹介IBM Analytics Japan
 
PPT Full version: 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう
PPT Full version: 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみようPPT Full version: 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう
PPT Full version: 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみようDaisuke Masubuchi
 
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)Mineaki Motohashi
 
わんくま東京勉強会#46 Azureセッション資料
わんくま東京勉強会#46 Azureセッション資料わんくま東京勉強会#46 Azureセッション資料
わんくま東京勉強会#46 Azureセッション資料Shinichiro Isago
 
わんくま東京勉強会#46 Azureセッション資料
わんくま東京勉強会#46 Azureセッション資料わんくま東京勉強会#46 Azureセッション資料
わんくま東京勉強会#46 Azureセッション資料guest628c07
 
Datalake最新情報セミナー
Datalake最新情報セミナーDatalake最新情報セミナー
Datalake最新情報セミナーmtanaka0111
 
BigObjectsで大量データのチャンピオンになる
BigObjectsで大量データのチャンピオンになるBigObjectsで大量データのチャンピオンになる
BigObjectsで大量データのチャンピオンになるToshiyasu Kuwada
 
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)日本マイクロソフト株式会社
 
Glueの開発環境(zeppelin)をrancherで作ってみる
Glueの開発環境(zeppelin)をrancherで作ってみるGlueの開発環境(zeppelin)をrancherで作ってみる
Glueの開発環境(zeppelin)をrancherで作ってみるcloudfish
 

Similar to AWS朝会2022/1 セッション① 数年間、レイクハウスを設計運用してみた (20)

実案件で見る データ分析用AWS基盤の構築方法 - Developers.IO 2017 (20170701)
実案件で見る データ分析用AWS基盤の構築方法 - Developers.IO 2017 (20170701)実案件で見る データ分析用AWS基盤の構築方法 - Developers.IO 2017 (20170701)
実案件で見る データ分析用AWS基盤の構築方法 - Developers.IO 2017 (20170701)
 
データ分析基盤におけるOpsのためのDev with event driven + serverless
データ分析基盤におけるOpsのためのDev with event driven + serverlessデータ分析基盤におけるOpsのためのDev with event driven + serverless
データ分析基盤におけるOpsのためのDev with event driven + serverless
 
アプリケーション開発者のためのAzure Databricks入門
アプリケーション開発者のためのAzure Databricks入門アプリケーション開発者のためのAzure Databricks入門
アプリケーション開発者のためのAzure Databricks入門
 
データ分析基盤を支えるエンジニアリング
データ分析基盤を支えるエンジニアリングデータ分析基盤を支えるエンジニアリング
データ分析基盤を支えるエンジニアリング
 
【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(前編)
【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(前編)【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(前編)
【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(前編)
 
祝★AWSスタンダードコンサルティングパートナーに認定されました
祝★AWSスタンダードコンサルティングパートナーに認定されました祝★AWSスタンダードコンサルティングパートナーに認定されました
祝★AWSスタンダードコンサルティングパートナーに認定されました
 
PDF版 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう Db tech showcase2020
PDF版 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう Db tech showcase2020PDF版 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう Db tech showcase2020
PDF版 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう Db tech showcase2020
 
ビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo Fall
ビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo Fallビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo Fall
ビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo Fall
 
[db tech showcase Tokyo 2015] B12:カラムストアデータベースの技術と活用法 by 日本電気株式会社 田村稔
[db tech showcase Tokyo 2015] B12:カラムストアデータベースの技術と活用法 by 日本電気株式会社 田村稔[db tech showcase Tokyo 2015] B12:カラムストアデータベースの技術と活用法 by 日本電気株式会社 田村稔
[db tech showcase Tokyo 2015] B12:カラムストアデータベースの技術と活用法 by 日本電気株式会社 田村稔
 
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
 
データを集めて貯めて分析する… 最先端のテクノロジーが詰まったIBMクラウドのご紹介
データを集めて貯めて分析する…  最先端のテクノロジーが詰まったIBMクラウドのご紹介データを集めて貯めて分析する…  最先端のテクノロジーが詰まったIBMクラウドのご紹介
データを集めて貯めて分析する… 最先端のテクノロジーが詰まったIBMクラウドのご紹介
 
PPT Full version: 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう
PPT Full version: 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみようPPT Full version: 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう
PPT Full version: 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう
 
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
 
【2018年3月時点】Oracle Data Visualizaion ご紹介
【2018年3月時点】Oracle Data Visualizaion ご紹介【2018年3月時点】Oracle Data Visualizaion ご紹介
【2018年3月時点】Oracle Data Visualizaion ご紹介
 
わんくま東京勉強会#46 Azureセッション資料
わんくま東京勉強会#46 Azureセッション資料わんくま東京勉強会#46 Azureセッション資料
わんくま東京勉強会#46 Azureセッション資料
 
わんくま東京勉強会#46 Azureセッション資料
わんくま東京勉強会#46 Azureセッション資料わんくま東京勉強会#46 Azureセッション資料
わんくま東京勉強会#46 Azureセッション資料
 
Datalake最新情報セミナー
Datalake最新情報セミナーDatalake最新情報セミナー
Datalake最新情報セミナー
 
BigObjectsで大量データのチャンピオンになる
BigObjectsで大量データのチャンピオンになるBigObjectsで大量データのチャンピオンになる
BigObjectsで大量データのチャンピオンになる
 
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
 
Glueの開発環境(zeppelin)をrancherで作ってみる
Glueの開発環境(zeppelin)をrancherで作ってみるGlueの開発環境(zeppelin)をrancherで作ってみる
Glueの開発環境(zeppelin)をrancherで作ってみる
 

AWS朝会2022/1 セッション① 数年間、レイクハウスを設計運用してみた