Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
EN
Uploaded by
Tsubasa Yoshino
PPTX, PDF
4,682 views
Data Factoryの勘所・大事なところ
JAZUG Tokyo Night 11月 発表資料
Technology
◦
Related topics:
Microsoft Azure
•
Read more
1
Save
Share
Embed
Embed presentation
Download
Downloaded 31 times
1
/ 44
2
/ 44
3
/ 44
4
/ 44
5
/ 44
6
/ 44
7
/ 44
8
/ 44
9
/ 44
10
/ 44
11
/ 44
12
/ 44
13
/ 44
14
/ 44
15
/ 44
16
/ 44
17
/ 44
18
/ 44
19
/ 44
20
/ 44
21
/ 44
22
/ 44
23
/ 44
24
/ 44
25
/ 44
26
/ 44
27
/ 44
28
/ 44
29
/ 44
30
/ 44
31
/ 44
32
/ 44
33
/ 44
34
/ 44
35
/ 44
36
/ 44
37
/ 44
38
/ 44
39
/ 44
40
/ 44
41
/ 44
42
/ 44
43
/ 44
44
/ 44
More Related Content
PDF
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
by
Ryoma Nagata
PDF
【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(前編)
by
日本マイクロソフト株式会社
PDF
クラウドDWHにおける観点とAzure Synapse Analyticsの対応
by
Ryoma Nagata
PDF
3分でわかるAzureでのService Principal
by
Toru Makabe
PDF
Data platformdesign
by
Ryoma Nagata
PDF
Databricks の始め方
by
Ryoma Nagata
PPTX
BigData Architecture for Azure
by
Ryoma Nagata
PPTX
え!? Power BI の画面からデータ更新なんてできるの!? ~PowerApps カスタムビジュアルの可能性~
by
Yugo Shimizu
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
by
Ryoma Nagata
【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(前編)
by
日本マイクロソフト株式会社
クラウドDWHにおける観点とAzure Synapse Analyticsの対応
by
Ryoma Nagata
3分でわかるAzureでのService Principal
by
Toru Makabe
Data platformdesign
by
Ryoma Nagata
Databricks の始め方
by
Ryoma Nagata
BigData Architecture for Azure
by
Ryoma Nagata
え!? Power BI の画面からデータ更新なんてできるの!? ~PowerApps カスタムビジュアルの可能性~
by
Yugo Shimizu
What's hot
PPTX
Data Factory V2 新機能徹底活用入門
by
Keisuke Fujikawa
PDF
今こそ知りたい!Microsoft Azureの基礎
by
Trainocate Japan, Ltd.
PDF
20200218 AWS Black Belt Online Seminar Next Generation Redshift
by
Amazon Web Services Japan
PDF
[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装
by
de:code 2017
PPTX
え!?データがオンプレにあるけどPower BI で BI したいの?
by
Yugo Shimizu
PDF
Cognito、Azure ADと仲良くしてみた
by
Takafumi Kondo
PPTX
SQL Server 使いのための Azure Synapse Analytics - Spark 入門
by
Daiyu Hatakeyama
PPTX
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
by
NTT DATA Technology & Innovation
PDF
今だからこそ見直そうAzureコスト最適化
by
Tomotaka Suzuki(御成門プログラマー)
PDF
20210127 AWS Black Belt Online Seminar Amazon Redshift 運用管理
by
Amazon Web Services Japan
PPTX
アプリケーション開発者のためのAzure Databricks入門
by
Yoichi Kawasaki
PDF
Microsoft Azure Storage 概要
by
Takeshi Fukuhara
PDF
Datadog による Container の監視について
by
Masaya Aoyama
PDF
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
by
Yosuke Katsuki
PPTX
Databricksを初めて使う人に向けて.pptx
by
otato
PDF
DMBOKをベースにしたデータマネジメント
by
Kent Ishizawa
PPTX
今こそ知りたいSpring Batch(Spring Fest 2020講演資料)
by
NTT DATA Technology & Innovation
PDF
Snowflake Architecture and Performance
by
Mineaki Motohashi
PDF
データ分析を支える技術 DWH再入門
by
Satoru Ishikawa
PPTX
大規模データ活用向けストレージレイヤソフトのこれまでとこれから(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)
by
NTT DATA Technology & Innovation
Data Factory V2 新機能徹底活用入門
by
Keisuke Fujikawa
今こそ知りたい!Microsoft Azureの基礎
by
Trainocate Japan, Ltd.
20200218 AWS Black Belt Online Seminar Next Generation Redshift
by
Amazon Web Services Japan
[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装
by
de:code 2017
え!?データがオンプレにあるけどPower BI で BI したいの?
by
Yugo Shimizu
Cognito、Azure ADと仲良くしてみた
by
Takafumi Kondo
SQL Server 使いのための Azure Synapse Analytics - Spark 入門
by
Daiyu Hatakeyama
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
by
NTT DATA Technology & Innovation
今だからこそ見直そうAzureコスト最適化
by
Tomotaka Suzuki(御成門プログラマー)
20210127 AWS Black Belt Online Seminar Amazon Redshift 運用管理
by
Amazon Web Services Japan
アプリケーション開発者のためのAzure Databricks入門
by
Yoichi Kawasaki
Microsoft Azure Storage 概要
by
Takeshi Fukuhara
Datadog による Container の監視について
by
Masaya Aoyama
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
by
Yosuke Katsuki
Databricksを初めて使う人に向けて.pptx
by
otato
DMBOKをベースにしたデータマネジメント
by
Kent Ishizawa
今こそ知りたいSpring Batch(Spring Fest 2020講演資料)
by
NTT DATA Technology & Innovation
Snowflake Architecture and Performance
by
Mineaki Motohashi
データ分析を支える技術 DWH再入門
by
Satoru Ishikawa
大規模データ活用向けストレージレイヤソフトのこれまでとこれから(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)
by
NTT DATA Technology & Innovation
More from Tsubasa Yoshino
PDF
AZ-305 Microsoft Azure Infrastructure Solutions 取得学習会 第3回.pdf
by
Tsubasa Yoshino
PDF
AZ-305 Microsoft Azure Infrastructure Solutions 取得学習会 第8回.pdf
by
Tsubasa Yoshino
PDF
AZ-305 Microsoft Azure Infrastructure Solutions 取得学習会 第6回.pdf
by
Tsubasa Yoshino
PDF
AZ-305 Microsoft Azure Infrastructure Solutions 取得学習会 第5回.pdf
by
Tsubasa Yoshino
PDF
AZ-305 Microsoft Azure Infrastructure Solutions 取得学習会 第4回.pdf
by
Tsubasa Yoshino
PDF
AZ-305 Microsoft Azure Infrastructure Solutions 取得学習会 第7回.pdf
by
Tsubasa Yoshino
PDF
AZ-305 Microsoft Azure Infrastructure Solutions 取得学習会 第2回.pdf
by
Tsubasa Yoshino
PDF
AZ-305 Microsoft Azure Infrastructure Solutions 取得学習会 第1回.pdf
by
Tsubasa Yoshino
PDF
AZ-104 Microsoft Azure Infrastructure Solutions 取得学習会 2024 第4回.pdf
by
Tsubasa Yoshino
PDF
AZ-104 Microsoft Azure Infrastructure Solutions 取得学習会 2024 第8回.pdf
by
Tsubasa Yoshino
PDF
AZ-104 Microsoft Azure Infrastructure Solutions 取得学習会 2024 第5回.pdf
by
Tsubasa Yoshino
PDF
AZ-104 Microsoft Azure Infrastructure Solutions 取得学習会 2024 第1回.pdf
by
Tsubasa Yoshino
PDF
AZ-104 Microsoft Azure Infrastructure Solutions 取得学習会 2024 第7回.pdf
by
Tsubasa Yoshino
PDF
AZ-104 Microsoft Azure Infrastructure Solutions 取得学習会 2024 第2回.pdf
by
Tsubasa Yoshino
PDF
AZ-104 Microsoft Azure Infrastructure Solutions 取得学習会 2024 第6回.pdf
by
Tsubasa Yoshino
PPTX
Azure Datbase for MySQL の接続は難しい
by
Tsubasa Yoshino
PPTX
Azure Static Web Apps 入門
by
Tsubasa Yoshino
PPTX
App service コトハジメ
by
Tsubasa Yoshino
PPTX
雑談会議 Azure AD B2C 第一回
by
Tsubasa Yoshino
PPTX
AADのお話第一回
by
Tsubasa Yoshino
AZ-305 Microsoft Azure Infrastructure Solutions 取得学習会 第3回.pdf
by
Tsubasa Yoshino
AZ-305 Microsoft Azure Infrastructure Solutions 取得学習会 第8回.pdf
by
Tsubasa Yoshino
AZ-305 Microsoft Azure Infrastructure Solutions 取得学習会 第6回.pdf
by
Tsubasa Yoshino
AZ-305 Microsoft Azure Infrastructure Solutions 取得学習会 第5回.pdf
by
Tsubasa Yoshino
AZ-305 Microsoft Azure Infrastructure Solutions 取得学習会 第4回.pdf
by
Tsubasa Yoshino
AZ-305 Microsoft Azure Infrastructure Solutions 取得学習会 第7回.pdf
by
Tsubasa Yoshino
AZ-305 Microsoft Azure Infrastructure Solutions 取得学習会 第2回.pdf
by
Tsubasa Yoshino
AZ-305 Microsoft Azure Infrastructure Solutions 取得学習会 第1回.pdf
by
Tsubasa Yoshino
AZ-104 Microsoft Azure Infrastructure Solutions 取得学習会 2024 第4回.pdf
by
Tsubasa Yoshino
AZ-104 Microsoft Azure Infrastructure Solutions 取得学習会 2024 第8回.pdf
by
Tsubasa Yoshino
AZ-104 Microsoft Azure Infrastructure Solutions 取得学習会 2024 第5回.pdf
by
Tsubasa Yoshino
AZ-104 Microsoft Azure Infrastructure Solutions 取得学習会 2024 第1回.pdf
by
Tsubasa Yoshino
AZ-104 Microsoft Azure Infrastructure Solutions 取得学習会 2024 第7回.pdf
by
Tsubasa Yoshino
AZ-104 Microsoft Azure Infrastructure Solutions 取得学習会 2024 第2回.pdf
by
Tsubasa Yoshino
AZ-104 Microsoft Azure Infrastructure Solutions 取得学習会 2024 第6回.pdf
by
Tsubasa Yoshino
Azure Datbase for MySQL の接続は難しい
by
Tsubasa Yoshino
Azure Static Web Apps 入門
by
Tsubasa Yoshino
App service コトハジメ
by
Tsubasa Yoshino
雑談会議 Azure AD B2C 第一回
by
Tsubasa Yoshino
AADのお話第一回
by
Tsubasa Yoshino
Data Factoryの勘所・大事なところ
1.
Data Factoryの勘所・大事なところ @papemk2
2.
注意 • 本セッションは、2017/11/21時点の情報です。 • 最新の情報は、公式のドキュメントなどを参 照のほど
3.
About me • 吉野翼(よしのつばさ) •
シグマコンサルティング株式会社 • Microsoft MVP for Azure (2016/10~) • Twitter : @papemk2
4.
今日のお話 • Azure Data
Factoryの簡単な概要 • お金の話 • Azure Data Factoryの使いどころとは? • Data Factory v2について
5.
今日のまとめ • それADFの必要ありますか?
6.
Demonstration
7.
What is Azure
Data Factory ?
8.
What is Azure
Data Factory • データの読み込み、加工、出力をするためのツー ル – ETLツールに近い立ち位置 • 正確にはELとTLを組み合わせたツール • 週間、月間単位など低頻度での処理向き – 頻度がポイント
10.
頻度の考え方 • 高頻度 or
低頻度 • 高頻度 – 1日2回以上の実行 • 低頻度 – 高頻度以外
11.
ADFの大事な用語(ざっくり) • データセット • アクティビティ •
パイプライン
12.
データセット • データのインプット、アウトプット部分 • Blob、SQL
DB、No SQL etc。。。 • 要するにデータストア
13.
アクティビティ • データに対するアクション – データ移動アクティビティ –
カスタム.NETアクティビティ • データコピー処理 – データ変換アクティビティ • Hive, Sparkなどのデータ加工処理 • v2で拡張されます。(後述) • 0個以上の入力(データセット)を受け取る。 • 1個以上の出力を返す
14.
カスタムアクティビティ • コピーアクティビティでサポートされていないデー タストア間のデータ移動に使う • データコピーにカスタムロジックを組み込める •
バックエンドでAzure Batchが動いて処理 • サポートされているデータストア
15.
複数アクティビティの連動 • パイプライン内に複数アクティビティを含める • アクティビティの入力をもう一つのアクティビ ティの出力に含める •
複数アクティビティの入出力が繋がらない場 合は並列に稼働
16.
パイプライン • アクティビティの論理的グループ • 複数のアクティビティの塊 •
アクティビティをセット管理するのに便利 – デプロイ、実行等を一塊にできる • JSONでまとめられる
17.
それぞれの関係
18.
Demonstration
19.
ポイント 1. 複数のデータソースを入力にできる 2. 複数の出力先を指定できる 3.
実行頻度が少ない処理向き
20.
よくある勘違い • データ処理はData Factoryの仕事ではない •
データ処理 = HDInsightとか • Data Factory = ベルトコンベア
21.
使用上の注意 • リアルタイム実行は保証されない – 99.9%で予定時間から4分以内に実行が保証さ れる –
予定時刻から4分が許容できない場合は注意
22.
使えるリージョン • 米国東部 • 米国中西部 •
米国西部 • ヨーロッパ西部
23.
料金体系
24.
料金の計算方法 • アクティビティの頻度 • アクティビティの実行場所 –
オンプレ or クラウド • パイプラインがアクティブかどうか • アクティビティの再実行の有無
25.
実行場所による料金(v1) 低頻度 高頻度 クラウドサービスのオーケストレー ション 61.20/アクティビティ/月 102/アクティビティ/月 オンプレミスのオーケストレーション
153/アクティビティ/月 255/アクティビティ/月 ※一か月で100アクティビティを超えると20%割引 低頻度は、月5回まで無料
26.
データ移動料金(v1) 料金 クラウドデータストア間 25.50/時間 オンプレとのハイブリッド 10.20/時間
27.
非アクティブパイプライン • 実行時間の範囲外のパイプラインは非アク ティブ • 非アクティブパイプラインは、81.60/月
28.
アクティビティの再実行 料金 クラウド 139.35/1000 オンプレミス 348.37/1000
30.
ダメだったパターン • 一日一回顧客データをSQL DBからBlobに 全件移動したい –
顧客データは、5万件(仮定) – データの加工はなし(CSV出力) – データソースは一つ
31.
何がダメだったか • ADFでは、オーバースペック過ぎた – 大したデータ量ではない •
Functionsで十分 • ノンコーディングで行ける – 大したコーディング量ではなかった
32.
料金比較 Data Factory Functions
WebJobs(S1) 月額料金 2646.57 0 8954.79 実行辺り料金 88.219 0 時間辺り料金 12.04
33.
比較 • 扱うデータが小さい – Functionsはほぼ0円 •
タイマーの信頼性を考えて、実行回数を増やしてもこの作業量では、大した金 額になることがなかった • Web Jobsは無駄な時間が多い – App Serviceで既に何か動いていて、それに付随するものならWeb JobsでもOK(追加料金なしなので) • Data Factoryは、実行辺り料金が大きい – データが大きくなればData Factoryが強い – Web Appsでは、メモリを増やそうとすると値段が跳ね上がる
34.
まとめ • ADFはHPC向け – 小規模データソースの変換は無駄かも
35.
個人的見解 • 単純なデータ移動のみの処理は、本当にADFが必要か見定 める必要あり – 本当にADFが必要なサイズのデータなのか –
ADFよりシンプルにできるやつがあるかも • 複数のデータソースを統合できるところがミソ – 単一のデータソースの場合、大半はADFはオーバースペックかも
36.
Azure Data Factory
v2
37.
What’s new • フロー制御の追加 •
Webアクティビティの追加 • SSISパッケージのデプロイ、実行 • SDKの拡充
38.
フロー制御 • 結果によるフローの分岐が可能に • 例 –
成功 : 成功メールの送信 – 失敗 : 失敗メールの送信
39.
Webアクティビティ • アクティビティ内で任意のREST呼び出しが可 能に • JSONを返すサービスからデータを取得可能に –
JSONを返してくれればカスタム.NETアクティビ ティが不要に – Logic Appなども呼び出せる
40.
SSISパッケージ • ADF上でSSISが実行可能に • 既存のパッケージもデプロイ可能 –
既存資産のPaaS移行に便利
41.
現状 • ポータルからの操作がまだ少ない – パイプライン作成等できない •
手軽に試すには面倒 – PowerShell or C# or etc…
42.
料金体系の変更 • アクティビティの再実行に関する項目が消滅 – 再実行も通常の実行と同じ扱いになった? •
SSISパッケージは、別途VM料金が必要 • プレビューのためGA後に金額が変わるので 注意
43.
まとめ • 使いどころを見極めて使おう • 実務で使うための知見が足りない気がする –
みんなで使って色々発信していきましょう – バッドプラクティスのノウハウが欲しい(
44.
http://bit.ly/jazugnight9
Editor's Notes
#15
https://docs.microsoft.com/ja-jp/azure/data-factory/v1/data-factory-data-movement-activities
Download