Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
EN
Uploaded by
Minero Aoki
46,209 views
Cookpad TechConf 2016 - DWHに必要なこと
Cookpad TechConf 2016での青木の発表資料。大量のデータを最大限に活用するためのデータ処理システムの構築方針について
Technology
◦
Read more
53
Save
Share
Embed
Embed presentation
1
/ 40
2
/ 40
3
/ 40
4
/ 40
5
/ 40
6
/ 40
7
/ 40
8
/ 40
9
/ 40
10
/ 40
11
/ 40
12
/ 40
13
/ 40
14
/ 40
15
/ 40
16
/ 40
17
/ 40
18
/ 40
Most read
19
/ 40
20
/ 40
21
/ 40
22
/ 40
23
/ 40
24
/ 40
25
/ 40
26
/ 40
27
/ 40
28
/ 40
29
/ 40
30
/ 40
31
/ 40
32
/ 40
33
/ 40
34
/ 40
35
/ 40
36
/ 40
37
/ 40
38
/ 40
39
/ 40
40
/ 40
More Related Content
PPTX
ファイルサーバーを SharePoint に移行するためのアプローチ
by
日本マイクロソフト株式会社
PDF
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
by
Techon Organization
PDF
機密データとSaaSは共存しうるのか!?セキュリティー重視のユーザー層を取り込む為のネットワーク通信のアプローチ
by
Amazon Web Services Japan
PDF
Snowflake Architecture and Performance
by
Mineaki Motohashi
PDF
Azure Monitor Logで実現するモダンな管理手法
by
Takeshi Fukuhara
PPTX
データ収集の基本と「JapanTaxi」アプリにおける実践例
by
Tetsutaro Watanabe
PDF
20210216 AWS Black Belt Online Seminar AWS Database Migration Service
by
Amazon Web Services Japan
PDF
20191001 AWS Black Belt Online Seminar AWS Lake Formation
by
Amazon Web Services Japan
ファイルサーバーを SharePoint に移行するためのアプローチ
by
日本マイクロソフト株式会社
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
by
Techon Organization
機密データとSaaSは共存しうるのか!?セキュリティー重視のユーザー層を取り込む為のネットワーク通信のアプローチ
by
Amazon Web Services Japan
Snowflake Architecture and Performance
by
Mineaki Motohashi
Azure Monitor Logで実現するモダンな管理手法
by
Takeshi Fukuhara
データ収集の基本と「JapanTaxi」アプリにおける実践例
by
Tetsutaro Watanabe
20210216 AWS Black Belt Online Seminar AWS Database Migration Service
by
Amazon Web Services Japan
20191001 AWS Black Belt Online Seminar AWS Lake Formation
by
Amazon Web Services Japan
What's hot
PDF
20200212 AWS Black Belt Online Seminar AWS Systems Manager
by
Amazon Web Services Japan
PDF
RDF Semantic Graph「RDF 超入門」
by
オラクルエンジニア通信
PDF
データ分析を支える技術 データ分析基盤再入門
by
Satoru Ishikawa
PDF
20190806 AWS Black Belt Online Seminar AWS Glue
by
Amazon Web Services Japan
PPTX
AWSで作る分析基盤
by
Yu Otsubo
PDF
Amazon S3を中心とするデータ分析のベストプラクティス
by
Amazon Web Services Japan
PDF
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
by
Ryoma Nagata
PDF
アサヒのデータ活用基盤を支えるデータ仮想化技術
by
Denodo
PDF
Kinesis + Elasticsearchでつくるさいきょうのログ分析基盤
by
Amazon Web Services Japan
PDF
20200526 AWS Black Belt Online Seminar AWS X-Ray
by
Amazon Web Services Japan
PDF
AWSではじめるMLOps
by
MariOhbuchi
PDF
データ分析を支える技術 DWH再入門
by
Satoru Ishikawa
PDF
クラウドDWHにおける観点とAzure Synapse Analyticsの対応
by
Ryoma Nagata
PPTX
[社内勉強会]ELBとALBと数万スパイク負荷テスト
by
Takahiro Moteki
PDF
NetflixにおけるPresto/Spark活用事例
by
Amazon Web Services Japan
PDF
[Aurora事例祭り]Amazon Aurora を使いこなすためのベストプラクティス
by
Amazon Web Services Japan
PPTX
データ履歴管理のためのテンポラルデータモデルとReladomoの紹介 #jjug_ccc #ccc_g3
by
Hiroshi Ito
PDF
こんなに使える!今どきのAPIドキュメンテーションツール
by
dcubeio
PDF
PHPからgoへの移行で分かったこと
by
gree_tech
PPTX
イベント・ソーシングを知る
by
Shuhei Fujita
20200212 AWS Black Belt Online Seminar AWS Systems Manager
by
Amazon Web Services Japan
RDF Semantic Graph「RDF 超入門」
by
オラクルエンジニア通信
データ分析を支える技術 データ分析基盤再入門
by
Satoru Ishikawa
20190806 AWS Black Belt Online Seminar AWS Glue
by
Amazon Web Services Japan
AWSで作る分析基盤
by
Yu Otsubo
Amazon S3を中心とするデータ分析のベストプラクティス
by
Amazon Web Services Japan
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
by
Ryoma Nagata
アサヒのデータ活用基盤を支えるデータ仮想化技術
by
Denodo
Kinesis + Elasticsearchでつくるさいきょうのログ分析基盤
by
Amazon Web Services Japan
20200526 AWS Black Belt Online Seminar AWS X-Ray
by
Amazon Web Services Japan
AWSではじめるMLOps
by
MariOhbuchi
データ分析を支える技術 DWH再入門
by
Satoru Ishikawa
クラウドDWHにおける観点とAzure Synapse Analyticsの対応
by
Ryoma Nagata
[社内勉強会]ELBとALBと数万スパイク負荷テスト
by
Takahiro Moteki
NetflixにおけるPresto/Spark活用事例
by
Amazon Web Services Japan
[Aurora事例祭り]Amazon Aurora を使いこなすためのベストプラクティス
by
Amazon Web Services Japan
データ履歴管理のためのテンポラルデータモデルとReladomoの紹介 #jjug_ccc #ccc_g3
by
Hiroshi Ito
こんなに使える!今どきのAPIドキュメンテーションツール
by
dcubeio
PHPからgoへの移行で分かったこと
by
gree_tech
イベント・ソーシングを知る
by
Shuhei Fujita
Viewers also liked
PDF
クラウド運用のベストプラクティスを考える - OpenStack最新情報セミナー(2016年12月)
by
VirtualTech Japan Inc.
PPT
第6回 itil講義資料
by
Mugen Fujii
PDF
実務で活かせる AWSアーキテクチャ設計 〜AWS re:Invent 2016アップデート最新版〜
by
真吾 吉田
PDF
手っ取り早くプロジェクトをなんとかしたい人のためのnanapi流ツール活用術~WebSig会議 vol.34「Webディレクター必見!プロジェクトを成功に...
by
WebSig24/7
PDF
仕事の成果は「聞き方」で9割決まる
by
Katsuhito Okada
PDF
クックパッドの開発プロセス
by
Hiroyuki Inoue
PPTX
オブジェクト指向を学んで図解力、仕事力アップ
by
Haruo Sato
PDF
今年のOss業界10大ニュース
by
Yukio Yoshida
PDF
仕事に活きる数学講座(第四回:予測力編)
by
schoowebcampus
PDF
日々の気づきをふりかえり、 個人とチームの成長につなげる方法
by
株式会社コパイロツト COPILOT Inc.
PDF
AWS クックパッドの運用事例
by
Satoshi Takada
PDF
[DO05] システムの信頼性を上げるための新しい考え方 SRE ( Site Reliability Engineering ) in Azure, o...
by
de:code 2017
PDF
4時間で学ぶ、効率的な自動テストスクリプトのメンテナンス
by
Nozomi Ito
PPTX
5分で分かるサイボウズのSRE
by
uchan_nos
PPTX
hbstudy 74 Site Reliability Engineering
by
Ryuji Tamagawa
PDF
全文検索でRedmineをさらに活用!
by
Kouhei Sutou
PDF
Cookpadの料理画像を分類した話
by
Shunsuke KITADA
PDF
いまの Office 365 ってこんな感じ?
by
Hirofumi Ota
PDF
ITサービスマネジメントとSRE
by
真吾 吉田
PPTX
技術者の自分が11年間会社を経営して学んだ7つのこと
by
Haruo Sato
クラウド運用のベストプラクティスを考える - OpenStack最新情報セミナー(2016年12月)
by
VirtualTech Japan Inc.
第6回 itil講義資料
by
Mugen Fujii
実務で活かせる AWSアーキテクチャ設計 〜AWS re:Invent 2016アップデート最新版〜
by
真吾 吉田
手っ取り早くプロジェクトをなんとかしたい人のためのnanapi流ツール活用術~WebSig会議 vol.34「Webディレクター必見!プロジェクトを成功に...
by
WebSig24/7
仕事の成果は「聞き方」で9割決まる
by
Katsuhito Okada
クックパッドの開発プロセス
by
Hiroyuki Inoue
オブジェクト指向を学んで図解力、仕事力アップ
by
Haruo Sato
今年のOss業界10大ニュース
by
Yukio Yoshida
仕事に活きる数学講座(第四回:予測力編)
by
schoowebcampus
日々の気づきをふりかえり、 個人とチームの成長につなげる方法
by
株式会社コパイロツト COPILOT Inc.
AWS クックパッドの運用事例
by
Satoshi Takada
[DO05] システムの信頼性を上げるための新しい考え方 SRE ( Site Reliability Engineering ) in Azure, o...
by
de:code 2017
4時間で学ぶ、効率的な自動テストスクリプトのメンテナンス
by
Nozomi Ito
5分で分かるサイボウズのSRE
by
uchan_nos
hbstudy 74 Site Reliability Engineering
by
Ryuji Tamagawa
全文検索でRedmineをさらに活用!
by
Kouhei Sutou
Cookpadの料理画像を分類した話
by
Shunsuke KITADA
いまの Office 365 ってこんな感じ?
by
Hirofumi Ota
ITサービスマネジメントとSRE
by
真吾 吉田
技術者の自分が11年間会社を経営して学んだ7つのこと
by
Haruo Sato
Similar to Cookpad TechConf 2016 - DWHに必要なこと
PDF
福岡クラウドUG-BigQuery
by
Wasaburo Miyata
PPTX
BigData Architecture for Azure
by
Ryoma Nagata
PDF
Amazon Redshiftへの移行方法と設計のポイント(db tech showcase 2016)
by
Amazon Web Services Japan
PPTX
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
by
Tetsutaro Watanabe
PDF
マルチビッグデータの活用を支える DWHの作り方
by
Yahoo!デベロッパーネットワーク
PDF
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
by
Mineaki Motohashi
PDF
オンプレミスDWHは今すぐ止めよう!ここまで進化したクラウドDWH (Oracle Cloudウェビナーシリーズ: 2021年8月4日)
by
オラクルエンジニア通信
福岡クラウドUG-BigQuery
by
Wasaburo Miyata
BigData Architecture for Azure
by
Ryoma Nagata
Amazon Redshiftへの移行方法と設計のポイント(db tech showcase 2016)
by
Amazon Web Services Japan
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
by
Tetsutaro Watanabe
マルチビッグデータの活用を支える DWHの作り方
by
Yahoo!デベロッパーネットワーク
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
by
Mineaki Motohashi
オンプレミスDWHは今すぐ止めよう!ここまで進化したクラウドDWH (Oracle Cloudウェビナーシリーズ: 2021年8月4日)
by
オラクルエンジニア通信
Cookpad TechConf 2016 - DWHに必要なこと
1.
DWHに必要なこと ∼1人で始めるCIO∼ Minero Aoki
2.
自己紹介 ‣ 青木峰郎(あおき みねろう) ‣
元Rubyコミッター ‣ 分析システム「たべみる」開発 ‣ データ分析基盤エンジニア ‣ 著書多数→
3.
データ活用基盤 今日のテーマ
4.
やりたいこと 大量のデータを 最高に活用したい
5.
やりたいこと 大量のデータを 最高に活用したい ユーザーコンタク トの一元管理 ターゲティング広告 ユーザー行動の分析 アプリのA/Bテスト
6.
DWH (Data Warehouse) が
その解となる
7.
DWHとは ‣ 90年代に提唱されたデータ分析アーキテクチャ ‣ 大量のデータを集めて部署横断で分析 ‣
Bill Inmonが定義(DWHの父と呼ばれている)
8.
DWH = 分析用のきれいなDB
9.
(DWHでない) 普通のDBは汚い
10.
DWHをどう作るか
11.
がんばる
12.
基本方針1. データは一箇所に集める
13.
アプリB ターゲティ ング広告 DB アプリC 行動分析 DB アプリD ABテスト DB アプリA コンタクト 管理 DB 乱立する分析システム
14.
アプリB ターゲティ ング広告 DB アプリC 行動分析 DB アプリD ABテスト DB アプリA コンタクト 管理 DB 乱立する分析システム ダメ
15.
なぜダメか ‣ データを集めるのがつらすぎ…… ‣ 指標の定義が違う!(PVって?
UUって?) ‣ 元データがよくわからない
16.
あるべきすがた アプリA アプリB アプリC
アプリD コンタクト 管理 ターゲティ ング広告 行動分析 ABテスト データベース
17.
DBなににする? • クックパッドでは全面的にRedshiftをDWHとして 使うことにした • 速い •
安い • 普通のSQLが使える
18.
アーキテクチャ Redshift (DWH) マスター Cookpad 広告配信システム ログ マスター ログ マスター ログ マスター ログ ログ マスター 各種サービス ログ マスター 連携システム Re:dash Jupyter Tableau 独自バッチシステム (Bricolage)
19.
データを集めれば DWHか?
20.
もちろん違う
21.
データを集めただけ
22.
DWH
23.
データは加工しないと DWHにはならない
24.
どのように加工するか?
25.
DWHの4つの条件 Integrated Subject- Oriented Time- Variant Non- Volatile
26.
DWHの4つの条件 Integrated Subject- Oriented Time- Variant Non- Volatile略
27.
10年戦える データ分析入門 青木峰郎著 ソフトバンククリエイティブ 詳細は本で
28.
基本方針2. DWHはなりゆきで作る
29.
アプリケーションが先! DWHがあと! Redshift 元データ DWH 活用先ごと Cookpad 広告配信 動画配信 …… コンタクト 管理 ターゲティ ング広告 ユーザー 行動分析 ABテスト as-is
3NF 3NF/Star 構築順(1) 構築順(2)構築順(3)
30.
共通ライブラリ としてのDWH
31.
基本方針3. SQLですべてを処理する
32.
よい例 Redshift テーブル テーブル テーブル INSERT SELECT INSERT SELECT
33.
Redshift テーブル テーブル テーブル ダメな例 RubyRuby SELEC T IN SER T SELEC T IN SER T
34.
ポイント ウェブとDWHでは 同じSQL/RDBでも 使いかたが違う
35.
まとめ
36.
DWHに必要なこと
37.
データは 一箇所に集める
38.
DWHは なりゆきでつくる
39.
すべてをSQLで処理
40.
同じSQLでも ウェブとDWHは別物