Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Yuta Inamura
2,384 views
データ分析基盤について
企業におけるデータ分析基盤のための基礎情報をまとめました
Technology
◦
Read more
5
Save
Share
Embed
Embed presentation
Download
Downloaded 20 times
1
/ 18
2
/ 18
3
/ 18
4
/ 18
5
/ 18
6
/ 18
7
/ 18
8
/ 18
9
/ 18
10
/ 18
11
/ 18
12
/ 18
13
/ 18
14
/ 18
15
/ 18
16
/ 18
17
/ 18
18
/ 18
More Related Content
PDF
データ分析を支える技術 データ分析基盤再入門
by
Satoru Ishikawa
PDF
データ分析を支える技術 DWH再入門
by
Satoru Ishikawa
PPTX
ビッグデータ処理データベースの全体像と使い分け 2018年version
by
Tetsutaro Watanabe
PDF
JDMC LT#1 - なぜモノタロウでデータマネジメントが必要になったのか
by
株式会社MonotaRO Tech Team
PDF
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
by
Techon Organization
PPTX
データサイエンティスト養成読本の解説+書き忘れたこと
by
Tokoroten Nakayama
PDF
Data platformdesign
by
Ryoma Nagata
PDF
全社のデータ活用を一段階上げる取り組み
by
株式会社MonotaRO Tech Team
データ分析を支える技術 データ分析基盤再入門
by
Satoru Ishikawa
データ分析を支える技術 DWH再入門
by
Satoru Ishikawa
ビッグデータ処理データベースの全体像と使い分け 2018年version
by
Tetsutaro Watanabe
JDMC LT#1 - なぜモノタロウでデータマネジメントが必要になったのか
by
株式会社MonotaRO Tech Team
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
by
Techon Organization
データサイエンティスト養成読本の解説+書き忘れたこと
by
Tokoroten Nakayama
Data platformdesign
by
Ryoma Nagata
全社のデータ活用を一段階上げる取り組み
by
株式会社MonotaRO Tech Team
What's hot
PDF
ビジネスパーソンのためのDX入門講座エッセンス版
by
Tokoroten Nakayama
PPTX
事業の進展とデータマネジメント体制の進歩(+プレトタイプの話)
by
Tokoroten Nakayama
PDF
MonotaRO のデータ活用と基盤の過去、現在、未来
by
株式会社MonotaRO Tech Team
PDF
クラウドDWHにおける観点とAzure Synapse Analyticsの対応
by
Ryoma Nagata
PDF
失敗から学ぶ機械学習応用
by
Hiroyuki Masuda
PDF
マッチングサービスにおけるKPIの話
by
cyberagent
PPTX
Spanner移行について本気出して考えてみた
by
techgamecollege
PDF
データウェアハウスモデリング入門(ダイジェスト版)(事前公開版)
by
Satoshi Nagayasu
PDF
データ仮想化を活用したデータ分析のフローと分析モデル作成の自動化のご紹介
by
Denodo
PPTX
データ収集の基本と「JapanTaxi」アプリにおける実践例
by
Tetsutaro Watanabe
PPTX
DXとかDevOpsとかのなんかいい感じのやつ 富士通TechLive
by
Tokoroten Nakayama
PDF
データサイエンティストのつくり方
by
Shohei Hido
PDF
Data Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組み
by
cyberagent
PPTX
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
by
NTT DATA Technology & Innovation
PDF
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
by
Yosuke Katsuki
PPTX
データ分析基盤を支えるエンジニアリング
by
Recruit Lifestyle Co., Ltd.
PDF
データ活用を加速するAWS分析サービスのご紹介
by
Amazon Web Services Japan
PDF
心理的安全性を 0から80ぐらいに上げた話
by
Yusuke Hisatsu
PDF
AWSではじめるMLOps
by
MariOhbuchi
PDF
[Cloud OnAir] BigQuery の仕組みからベストプラクティスまでのご紹介 2018年9月6日 放送
by
Google Cloud Platform - Japan
ビジネスパーソンのためのDX入門講座エッセンス版
by
Tokoroten Nakayama
事業の進展とデータマネジメント体制の進歩(+プレトタイプの話)
by
Tokoroten Nakayama
MonotaRO のデータ活用と基盤の過去、現在、未来
by
株式会社MonotaRO Tech Team
クラウドDWHにおける観点とAzure Synapse Analyticsの対応
by
Ryoma Nagata
失敗から学ぶ機械学習応用
by
Hiroyuki Masuda
マッチングサービスにおけるKPIの話
by
cyberagent
Spanner移行について本気出して考えてみた
by
techgamecollege
データウェアハウスモデリング入門(ダイジェスト版)(事前公開版)
by
Satoshi Nagayasu
データ仮想化を活用したデータ分析のフローと分析モデル作成の自動化のご紹介
by
Denodo
データ収集の基本と「JapanTaxi」アプリにおける実践例
by
Tetsutaro Watanabe
DXとかDevOpsとかのなんかいい感じのやつ 富士通TechLive
by
Tokoroten Nakayama
データサイエンティストのつくり方
by
Shohei Hido
Data Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組み
by
cyberagent
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
by
NTT DATA Technology & Innovation
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
by
Yosuke Katsuki
データ分析基盤を支えるエンジニアリング
by
Recruit Lifestyle Co., Ltd.
データ活用を加速するAWS分析サービスのご紹介
by
Amazon Web Services Japan
心理的安全性を 0から80ぐらいに上げた話
by
Yusuke Hisatsu
AWSではじめるMLOps
by
MariOhbuchi
[Cloud OnAir] BigQuery の仕組みからベストプラクティスまでのご紹介 2018年9月6日 放送
by
Google Cloud Platform - Japan
Similar to データ分析基盤について
PDF
tut_pfi_2012
by
Preferred Networks
PDF
利用者主体で行う分析のための分析基盤
by
Sotaro Kimura
PDF
データ活用をもっともっと円滑に!~データ処理・分析基盤編を少しだけ~
by
NTT DATA OSS Professional Services
PPTX
Watson summit 2016_j2_5
by
Tanaka Yuichi
PPTX
Oracle Advanced Analytics 概要
by
オラクルエンジニア通信
PDF
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
by
Dell TechCenter Japan
PPTX
AWSで作る分析基盤
by
Yu Otsubo
PPTX
ビジネスに役立つデータ分析
by
Issei Kurahashi
PDF
オープンセミナー岡山 これから始めるデータ活用
by
syou6162
PDF
実案件で見る データ分析用AWS基盤の構築方法 - Developers.IO 2017 (20170701)
by
Yosuke Katsuki
PDF
プログラムせずに実現する!Amazon Redshift分析・活用環境
by
Kazuya Mori
PDF
データを事業に活かすために必要なデータ基盤とは
by
griddb
PPTX
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
by
Insight Technology, Inc.
PDF
データウェアハウス入門 (マーケティングデータ分析基盤技術勉強会)
by
Takeshi Mikami
PDF
[Oracle Innovation Summit Tokyo 2018] 水環境の持続を支えるクラウド型ICTプラットフォーム「Water Busine...
by
オラクルエンジニア通信
PDF
クラウドを活用した自由自在なデータ分析
by
aiichiro
PDF
現場の”今”を知る、これからのビッグデータ分析・活用のすすめ
by
yuji suzuki
PDF
Smart data integration to hybrid data analysis infrastructure
by
DataWorks Summit
PPTX
リクルートライフスタイルが考える、万人に使ってもらえる分析基盤の作り方
by
Yu Yamada
PPTX
ITインフラsummit 2017発表資料
by
Masayuki Hyugaji
tut_pfi_2012
by
Preferred Networks
利用者主体で行う分析のための分析基盤
by
Sotaro Kimura
データ活用をもっともっと円滑に!~データ処理・分析基盤編を少しだけ~
by
NTT DATA OSS Professional Services
Watson summit 2016_j2_5
by
Tanaka Yuichi
Oracle Advanced Analytics 概要
by
オラクルエンジニア通信
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
by
Dell TechCenter Japan
AWSで作る分析基盤
by
Yu Otsubo
ビジネスに役立つデータ分析
by
Issei Kurahashi
オープンセミナー岡山 これから始めるデータ活用
by
syou6162
実案件で見る データ分析用AWS基盤の構築方法 - Developers.IO 2017 (20170701)
by
Yosuke Katsuki
プログラムせずに実現する!Amazon Redshift分析・活用環境
by
Kazuya Mori
データを事業に活かすために必要なデータ基盤とは
by
griddb
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
by
Insight Technology, Inc.
データウェアハウス入門 (マーケティングデータ分析基盤技術勉強会)
by
Takeshi Mikami
[Oracle Innovation Summit Tokyo 2018] 水環境の持続を支えるクラウド型ICTプラットフォーム「Water Busine...
by
オラクルエンジニア通信
クラウドを活用した自由自在なデータ分析
by
aiichiro
現場の”今”を知る、これからのビッグデータ分析・活用のすすめ
by
yuji suzuki
Smart data integration to hybrid data analysis infrastructure
by
DataWorks Summit
リクルートライフスタイルが考える、万人に使ってもらえる分析基盤の作り方
by
Yu Yamada
ITインフラsummit 2017発表資料
by
Masayuki Hyugaji
データ分析基盤について
1.
2018/07/19 稲村 勇太 データ分析基盤についての 基礎知識
2.
目次 2 1.基礎情報 2.データ分析基盤の構築事例
3.
基礎情報 3
4.
データ分析基盤とは 4 ビジネスを有利に進めるために 大量のデータを保管・分析する基盤 データ分析基盤 分析 売上 画像・動画データ 外部データ (天気、SNSなど) 分析 経営企画ユーザ部門
5.
データ分析基盤が必要になっている背景 5 データ分析基盤を構築する主な理由 ビッグデータ処理 データの価値化 PDCA サイクルの高速化 インターネットの発展や、スマート デバイス・IoTの普及に伴い、解析 対象となるデータが膨大に増加し ており、それに耐えうる処理基盤 が必要になっている。 企業内で活用できずに眠っている データや外部データを組み合わ せ、ビジネスに役立てるよう「価値 化」するため、各部門のデータを横 通しで解析できる基盤が必要に なっている。 市場の変化が激しい今、これまで 以上に高速にPDCAサイクルを回 し、業務改善・方針転換をする必 要があり、その意思決定をするた めの情報分析基盤が求められて いる。
6.
データ分析基盤の構成要素 6 データ分析基盤は 主に下記のような構成で構築されます Strage (データ収集) DWH (アドホック分析用) DataMart (用途別データ) ETL (データ抽出・変換) アドホッククエリ BI
7.
構築の流れ 7 ①現状データの調査 ②方針策定 ③データ構築 ④運用 既存のデータを調査し、 データの欠陥・重複状況を把握する 調査を踏まえ、データ状態の改善計画の立案/データ整備・ 業務改善方法/アプリ改修などの必要な対策を検討する 活用しやすい形にデータを整形(クレンジング) しながら、分析基盤を構築する 通常業務の中で、 汚れたデータを適宜クレンジングする コンサルティング SI
8.
構成例 8 AWSとGCPそれぞれの特性を活かした ハイブリッド構成 Strage (データ収集) DWH (アドホック分析用) DataMart (用途別データ) ETL (データ抽出・変換) アドホッククエリ BI AWS S3 AWS Redshift AWS
EMR AWS RDS ※上記構成はあくまで一例です。
9.
(参考)DataLake/DWH/DataMart 9 DataLake rawデータを蓄積・保存するストレージ。 将来どんな活用が出来るかは未知数だが、データ の形式や内容は問わず集積する。 各種ログ DWH (DataWareHouse) データレイクから必要な情報のみを抽出・集約した データの集まり。アドホック分析の際に用いる。 最終的なデータ利用者のためのデータの集まり。 DWHは大量データを分析には特化しているが、1度 に多くのリクエストに対して同時に処理することには 不向きなので、それぞれの利用者にあわせたデー タウェアハウスデータの集出・集約結果を登録する 必要がある。 DataMart
10.
(参考)各種パブリッククラウドの機能比較一覧 10 AWS GCP Azure
Alibaba Cloud IBM Cloud Object Strage Amazon S3 Cloud Storage ・Azure Strage ・Data Lake Store OSS IBM Cloud Object Storage - - - - - ETL ・Amazon Glue ・AWS DataPipeline ・DataFlow ・CloudDataPREP DataFactory DataWorks (DataIntegration) IBM Data Connect ETL処理を支援する フレームワークサービス ストリーミング処理に強み - 帯域幅の設定まで可能 - DWH Amazon Redshift BigQuery Azure SQL Data Warehouse ・HybridDB ・MaxCompute Db2 Warehouse on Cloud 導入事例が豊富 データを保存するだけなら ほぼ無料で使える インスタンスの一時停止が可 能 下記DataWorksとセットで 利用することを想定 超並列処理(MPP)により スケーラビリティを実現 アドホッククエリ Amazon Athena BigQuery Azure Data Lake Analytics DataWorks ・Knowledge Catalog S3に対するクエリも可能 RedShiftより高速に実行可能 - 使いやすいUIもセットで 提供可能な点が強み 厳密な意味でのアドホックサー ビスではない(BI機能一部) DataMart ・Amazon RDS ・DynamoDB ・Cloud SQL ・Cloud DataStore ・Azure SQL Database ・DocumentDB ・RDS ・OTS ・Cloudant NoSQL DB ・Compose系 MySQL PostgreSQL RabbitMQ 他と大差なし 他と大差なし 他と大差なし 他と大差なし OSS系DBのクラウド版 BI Amazon QuickSight DataStudio Azure PowerBI ・DataV ・QuickBI Knowledge Catalog モバイルでも利用可能 リアルタイム分析には不向き モバイルでも利用可能 QuickBIは主に アドホック分析に用いる データストア、 解析の統合環境 IaaSだけでなくPaaSとしての機能比較もした上で それぞれの特性を活かした基盤構築が必要
11.
データ分析基盤の構築事例 11
12.
無印良品さん-AWS,TreasureData 12 出典は下記URL。2014年の記事なので少し古いです。 http://ascii.jp/elem/000/000/890/890206/index-2.html https://www.treasuredata.co.jp/customers/muji/
13.
あきんどスシローさん-AWS,TreasureData 13 出典は下記URL。 https://aws.amazon.com/jp/solutions/case-studies/akindo-sushiro/
14.
Rettyさん-AWS,GCP,TreasureData 14 出典は下記URL。 https://speakerdeck.com/chie8842/karamunahuomatutofalsekihon-2 AWS EC2 TreasureDate AWS RDS AWS
DataPipeline AWS Kinesis AWS DataPipeline AWS RDS GCP Big Query GCP Cloud Strage GCP Cloud Strage fluented
15.
リクルートライフスタイルさん-AWS,GCP 15 出典は下記URL。設計思想も明かしてくれており、参考になります。 https://www.slideshare.net/RecruitLifestyle/ss-84149204 https://engineer.recruit-lifestyle.co.jp/techblog/2017-08-07-how-to-load-data-into-bigquer/ GCP DataFlow
16.
ドリコムさん-AWS,TreasureData 16 出典は下記URL。TD,GCP,AWSの比較もあります。 https://tech.drecom.co.jp/migrate-to-treasure-data-and-aws/
17.
参考URL 17 1)基礎から始めるDB入門セミナー(基礎の基礎) http://www.oracle.com/technetwork/jp/articles/index-155234-ja.html 2)AWSのデータ分析入門 https://d0.awsstatic.com/events/jp/2017/summit/slide/D4T3-2.pdf 3)分析基盤の導入に不可欠なデータ統合の進め方 https://enterprisezine.jp/dbonline/detail/10085
18.
EOF 18
Download