Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
MI
Uploaded by
Masaki Imura
213 views
101210_データ分析初学者から見たAzure Databricks
2019年12月10日に日本マイクロソフト社と共同で開催しました、『【Azureデータ分析シリーズ】非専門家向け/利用部門主導で始めるデータ分析セミナー』での公開資料です。
Data & Analytics
◦
Read more
0
Save
Share
Embed
Embed presentation
Download
Download to read offline
1
/ 40
2
/ 40
3
/ 40
4
/ 40
5
/ 40
6
/ 40
7
/ 40
8
/ 40
9
/ 40
10
/ 40
11
/ 40
12
/ 40
13
/ 40
14
/ 40
15
/ 40
16
/ 40
17
/ 40
18
/ 40
19
/ 40
20
/ 40
21
/ 40
22
/ 40
23
/ 40
24
/ 40
25
/ 40
26
/ 40
27
/ 40
28
/ 40
29
/ 40
30
/ 40
31
/ 40
32
/ 40
33
/ 40
34
/ 40
35
/ 40
36
/ 40
37
/ 40
38
/ 40
39
/ 40
40
/ 40
More Related Content
PPTX
いまできるデータ分析を Power BI ではじめよう
by
Yugo Shimizu
PPTX
アプリケーション開発者のためのAzure Databricks入門
by
Yoichi Kawasaki
PDF
Raspberry Pi用コンテナをさくらのクラウドでビルドする
by
Shunsuke Kikuchi
PDF
Business Innovation cases driven by AI and BigData technologies
by
DataWorks Summit/Hadoop Summit
PPTX
Azure Data Platform
by
Daiyu Hatakeyama
PDF
[Microsoft Tech Summit 2018] Azure Machine Learning サービスと Azure Databricks で実...
by
Naoki (Neo) SATO
PDF
Geonamesjp_0312
by
yoichi takahashi
PDF
Spark Analytics - スケーラブルな分散処理
by
Tusyoshi Matsuzaki
いまできるデータ分析を Power BI ではじめよう
by
Yugo Shimizu
アプリケーション開発者のためのAzure Databricks入門
by
Yoichi Kawasaki
Raspberry Pi用コンテナをさくらのクラウドでビルドする
by
Shunsuke Kikuchi
Business Innovation cases driven by AI and BigData technologies
by
DataWorks Summit/Hadoop Summit
Azure Data Platform
by
Daiyu Hatakeyama
[Microsoft Tech Summit 2018] Azure Machine Learning サービスと Azure Databricks で実...
by
Naoki (Neo) SATO
Geonamesjp_0312
by
yoichi takahashi
Spark Analytics - スケーラブルな分散処理
by
Tusyoshi Matsuzaki
Similar to 101210_データ分析初学者から見たAzure Databricks
PPTX
え?まだフルスクラッチで開発してるの!?Power Platform をフル活用すると普通にシステムができるんですよ
by
Yugo Shimizu
PDF
[Oracle Innovation Summit Tokyo 2018] 水環境の持続を支えるクラウド型ICTプラットフォーム「Water Busine...
by
オラクルエンジニア通信
PDF
[de:code 2019 振り返り Night!] Data Platform
by
Naoki (Neo) SATO
PPTX
Azure Datalake 大全
by
Daiyu Hatakeyama
PDF
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
by
Hideo Takagi
PPTX
Power BI のいろいろな活用パターン
by
Yugo Shimizu
PPTX
え、毎月手作業でレポートを作ってるの?Power BI を使えば自動化できますよ!
by
Yugo Shimizu
PDF
Big Data Visual Analytics Realized By Hadoop and Tableau
by
DataWorks Summit
PPTX
毎月更新されるデータを Excel で集計してレポートを作ってるですって? それ、Power BI と SharePoint フォルダーで自動化できますよー
by
Yugo Shimizu
PDF
Azure Data Explorer
by
Daisuke Masubuchi
PDF
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
by
Techon Organization
PDF
DLLAB Ignite Update Data Platform
by
Deep Learning Lab(ディープラーニング・ラボ)
PDF
DBP-017_Power BI Service のアーキテクチャとエンタープライズ利用におけるデザイン パターン
by
decode2016
PPTX
Pysparkで始めるデータ分析
by
Tanaka Yuichi
PDF
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
by
Atsushi Tsuchiya
PDF
【ウェブ セミナー】AI / アナリティクスを支えるビッグデータ基盤 Azure Data Lake [概要編]
by
Hideo Takagi
PDF
Two Dataflows
by
Yugo Shimizu
PPTX
【日商USA】データ活用の最新トレンド解説セミナー ~ユースケースもご紹介~
by
Sojitz Tech-Innovation USA
PDF
[Developers Festa Sapporo 2018] Azure AI ~Microsoft AzureでのAI開発のイマ~
by
Naoki (Neo) SATO
PDF
Apache Spark on Azure
by
Tusyoshi Matsuzaki
え?まだフルスクラッチで開発してるの!?Power Platform をフル活用すると普通にシステムができるんですよ
by
Yugo Shimizu
[Oracle Innovation Summit Tokyo 2018] 水環境の持続を支えるクラウド型ICTプラットフォーム「Water Busine...
by
オラクルエンジニア通信
[de:code 2019 振り返り Night!] Data Platform
by
Naoki (Neo) SATO
Azure Datalake 大全
by
Daiyu Hatakeyama
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
by
Hideo Takagi
Power BI のいろいろな活用パターン
by
Yugo Shimizu
え、毎月手作業でレポートを作ってるの?Power BI を使えば自動化できますよ!
by
Yugo Shimizu
Big Data Visual Analytics Realized By Hadoop and Tableau
by
DataWorks Summit
毎月更新されるデータを Excel で集計してレポートを作ってるですって? それ、Power BI と SharePoint フォルダーで自動化できますよー
by
Yugo Shimizu
Azure Data Explorer
by
Daisuke Masubuchi
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
by
Techon Organization
DLLAB Ignite Update Data Platform
by
Deep Learning Lab(ディープラーニング・ラボ)
DBP-017_Power BI Service のアーキテクチャとエンタープライズ利用におけるデザイン パターン
by
decode2016
Pysparkで始めるデータ分析
by
Tanaka Yuichi
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
by
Atsushi Tsuchiya
【ウェブ セミナー】AI / アナリティクスを支えるビッグデータ基盤 Azure Data Lake [概要編]
by
Hideo Takagi
Two Dataflows
by
Yugo Shimizu
【日商USA】データ活用の最新トレンド解説セミナー ~ユースケースもご紹介~
by
Sojitz Tech-Innovation USA
[Developers Festa Sapporo 2018] Azure AI ~Microsoft AzureでのAI開発のイマ~
by
Naoki (Neo) SATO
Apache Spark on Azure
by
Tusyoshi Matsuzaki
101210_データ分析初学者から見たAzure Databricks
1.
@2019 Knowledge Communication
Co. Ltd 2019年12月10日 株式会社 ナレッジコミュニケーション 井村 真樹 データ分析初学者視点から見た Azure Databricks 【Azure データ分析シリーズ】
2.
@2019 Knowledge Communication
Co. Ltd 自己紹介 名前: 井村 真樹 (いむら まさき) 所属: 株式会社 ナレッジコミュニケーション 興味: 新しい技術、音楽、キーボード 初学者目線で技術ブログを発信 https://qiita.com/Catetin0310 github.com/catetin/dbh/wiki ハンズオン資料公開中
3.
@2019 Knowledge Communication
Co. Ltd 自己紹介 2019/3 まで 楽器音響機器メーカー 営業・マーケ系業務 ツール:Excelメイン、SQLすこし 2019/4 から ナレコム入社 データ関連の情報発信、資料作成、PMなどなど ツール:Databricks など
4.
@2019 Knowledge Communication
Co. Ltd つまり、 エンジニアリング・データ分析 初学者 自己紹介
5.
@2019 Knowledge Communication
Co. Ltd データ分析 初学者の目線から、 Azure Databricks を使ってみて感動したこと をお話しします アジェンダ
6.
@2019 Knowledge Communication
Co. Ltd アジェンダ 1. エクセルでのデータ分析 ここがつらかった 2. Azure Databricks ここがすごい 3. データ処理業務がどう変わったか 4. ハンズオンで行う内容 5. さいごに
7.
@2019 Knowledge Communication
Co. Ltd 1. エクセルでのデータ分析 Microsoft Excel 言わずと知れた表計算ソフト
8.
@2019 Knowledge Communication
Co. Ltd 1. エクセルでのデータ分析 – 前提 ex. 業務システムからデータを抽出 → 月次のレポート作成
9.
@2019 Knowledge Communication
Co. Ltd 1. エクセルでのデータ分析 – ロジックが埋もれがち • 複数テーブルを結合する 際には、vlookup 関数を 使用することが多い • 数式が入れ子になること も多く、結局この列で何 を計算しているのか不明 瞭になりやすい • 他のメンバーが引き継ぐ と、謎エクセルシートに なりがち
10.
@2019 Knowledge Communication
Co. Ltd 1. エクセルでのデータ分析 – 運用の人的コストが高い グラフ化やピボット テーブル作成 → 結構な工数
11.
@2019 Knowledge Communication
Co. Ltd 1. エクセルでのデータ分析 – 運用の人的コストが高い 慣れているほど、 気が付かない バージョン管理が難しい どれが最新かわからない。 作成者もわからない (あ りがち) 運用フローの整備 が必要。再現性維 持が大変
12.
@2019 Knowledge Communication
Co. Ltd 1. エクセルでのデータ分析 – not スケーラブル • 処理の可否がローカルマシ ンのスペックに依存する • データ増える → フリーズ → 再設計 (工数) • 解消のためにPCメモリを増 設、はよく聞く話
13.
@2019 Knowledge Communication
Co. Ltd 1. エクセルでのデータ分析 – まとめ • ロジックが埋もれがち • 運用の人的コストが高い • not スケーラブル
14.
@2019 Knowledge Communication
Co. Ltd 2. Azure Databricks ここがすごい Azure Databricks データ加工から分析までを一体化したサービス
15.
@2019 Knowledge Communication
Co. Ltd 2. Azure Databricks ここがすごい – 安心感のある環境 クラスタのオートター ミネーション有効化で、 従量課金化
16.
@2019 Knowledge Communication
Co. Ltd 2. Azure Databricks ここがすごい – 安心感のある環境 タイムマシーン的な機 能がつかえるので、 バージョン管理が楽
17.
@2019 Knowledge Communication
Co. Ltd 2. Azure Databricks ここがすごい – 安心感のある環境 コメントを Jupyter Notebook ライクに残 せるので、 ロジックが散逸しない
18.
@2019 Knowledge Communication
Co. Ltd 2. Azure Databricks ここがすごい – 安心感のある環境 エンタープライズレベ ルのセキュリティ Azure Active Directory ID の管理とセキュリティ保護のため のユニバーサル プラットフォーム
19.
@2019 Knowledge Communication
Co. Ltd 2. Azure Databricks ここがすごい – データの可視化が容易 発行したクエリの結果 を数クリックで視覚化 = すぐにデータの傾 向を確認可能
20.
@2019 Knowledge Communication
Co. Ltd 2. Azure Databricks ここがすごい – 高速&スケーラブル ・Spark を作った人たちが 最適化、最新のバージョン で動作 ・雑なクエリを書いても、 自動的に最適化してくれる ・自動的にスケールアップ &スケールダウン分散処理コンピューティングフレームワーク。 データ並列性と対故障性を備えたクラスタ全体を構成
21.
@2019 Knowledge Communication
Co. Ltd 2. Azure Databricks ここがすごい – Azure 内の連携 Cosmos DB (NoSQL DB) Azure Databricks (データ加工&簡易分析) Blob Data Lake (データレイク) Power BI (分析ダッシュボード) Azure Synapse (次世代データウェアハウス) Azure Machine Learning (機械学習) Data Factory (データ移動、パイプライン、 オーケストレーション) SQL Database (リレーショナルDB)
22.
@2019 Knowledge Communication
Co. Ltd 2. Azure Databricks ここがすごい – Azure 内の連携 Power BI https://app.powerbi.com/view?r=eyJrIjoiOGFmOTM5NDEtNTZkMi00MmYxLWFmZDAtYzgzNWYxNjFlN2FlIiwidCI6IjYxNTc5NTU5LWNiM2EtNGZmYy1hOTVmLTkwNzYzMmJhNDRlOCJ9
23.
@2019 Knowledge Communication
Co. Ltd 2. Azure Databricks ここがすごい – Azure 内の連携 Power BI https://app.powerbi.com/view?r=eyJrIjoiOGFmOTM5NDEtNTZkMi00MmYxLWFmZDAtYzgzNWYxNjFlN2FlIiwidCI6IjYxNTc5NTU5LWNiM2EtNGZmYy1hOTVmLTkwNzYzMmJhNDRlOCJ9
24.
@2019 Knowledge Communication
Co. Ltd 2. Azure Databricks ここがすごい – Azure 内の連携 Power BI https://app.powerbi.com/view?r=eyJrIjoiOGFmOTM5NDEtNTZkMi00MmYxLWFmZDAtYzgzNWYxNjFlN2FlIiwidCI6IjYxNTc5NTU5LWNiM2EtNGZmYy1hOTVmLTkwNzYzMmJhNDRlOCJ9
25.
@2019 Knowledge Communication
Co. Ltd 余談: Databricks ここが大変 – 初学者向けの情報が少ない • PySpark の進化が早く、 バージョン1系と2.0の情報 がウェブ上で混在 • そもそも PySpark を使い は玄人が多く、かみ砕いた 日本語の記事は少ない 公式ドキュメントを参照すれ ばOK (初心者向けの記事も発 信してるので見てね)
26.
@2019 Knowledge Communication
Co. Ltd 2. Azure Databricks ここがすごい – まとめ • 安心感のある環境 • 簡単にデータを可視化 • 高速&スケーラブル • Azure 内の連携
27.
@2019 Knowledge Communication
Co. Ltd 3. データ分析業務がどう変わったか
28.
@2019 Knowledge Communication
Co. Ltd 3. データ分析業務がどう変わったか • 安心感 • 簡単にデータを可視化 • 高速&スケーラブル • Azure 内の連携 • ロジックが埋もれがち • 運用の人的コストが高い • not スケーラブル
29.
@2019 Knowledge Communication
Co. Ltd 3. データ分析業務がどう変わったか • 安心感 • 簡単にデータを可視化 • 高速&スケーラブル • Azure 内の連携 • ロジックが埋もれがち • 運用の人的コストが高い • not スケーラブル
30.
@2019 Knowledge Communication
Co. Ltd 3. データ分析業務がどう変わったか • 安心感 • 簡単にデータを可視化 • 高速&スケーラブル • Azure 内の連携 • ロジックが埋もれがち • 運用の人的コストが高い • not スケーラブル
31.
@2019 Knowledge Communication
Co. Ltd 3. データ分析業務がどう変わったか • 安心感 • 簡単にデータを可視化 • 高速&スケーラブル • Azure 内の連携 • ロジックが埋もれがち • 運用の人的コストが高い • not スケーラブル
32.
@2019 Knowledge Communication
Co. Ltd 3. データ分析業務がどう変わったか • 安心感 • 簡単にデータを可視化 • 高速&スケーラブル • Azure 内の連携 • ロジックが埋もれがち • 運用の人的コストが高い • not スケーラブル
33.
@2019 Knowledge Communication
Co. Ltd 4. ハンズオンで行う内容 – 使用データ概要 出典元:Kaggle データ概要: Azure ブラジル市場最 大のデパートのeコマー スストアの売上情報 https://www.kaggle.com/olistbr/brazilian-ecommerce
34.
@2019 Knowledge Communication
Co. Ltd 4. ハンズオンで行う内容 – 使用データ概要 出典元:Kaggle データ概要: Azure ブラジル市場最 大のデパートのeコマー スストアの売上情報 https://www.kaggle.com/olistbr/brazilian-ecommerce
35.
@2019 Knowledge Communication
Co. Ltd 4. ハンズオンで行う内容 – ペルソナ 最近顧客満足度 (レビュースコア) が下がっているようだ原因を探って 改善策を練ろう。 ざっと見る限り、デリバリの遅れと 製品カテゴリに相関しそうだ。 まずは定量的に評価しやすいように、 視覚化してみよう。 Eコマースサイト運営者
36.
@2019 Knowledge Communication
Co. Ltd 4. ハンズオンで行う内容 – Azure 環境 (再掲) Cosmos DB (NoSQL DB) Azure Databricks (データ加工&簡易分析) Blob Data Lake (データレイク) Power BI (分析ダッシュボード) Azure Synapse (次世代データウェアハウス) Azure Machine Learning (機械学習) Data Factory (データ移動、パイプライン、 オーケストレーション) SQL Database (リレーショナルDB)
37.
@2019 Knowledge Communication
Co. Ltd 4. ハンズオンで行う内容 – スコープ Azure Databricks (データ加工&簡易分析) Blob Data Lake (データレイク) Power BI (分析ダッシュボード) ・このアーキテクチャを構築 ・ペルソナの課題に応じた簡易分析 ・分析ダッシュボードの作成 までを行います!
38.
@2019 Knowledge Communication
Co. Ltd Azure Databricks から データ分析に入ったっていい! Excel で複雑な処理をしてる人 → すぐに導入を検討しましょう! 5. さいごに
39.
@2019 Knowledge Communication
Co. Ltd さいごのさいごに データパイプライン AI / 機械学習 BI ツール 弊社で導入支援行っています。 本セミナーの後にもご相談を承ります!
40.
@2019 Knowledge Communication
Co. Ltd ご清聴ありがとうございました
Download