Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
EN
Uploaded by
Minero Aoki
46,208 views
Cookpad TechConf 2016 - DWHに必要なこと
Cookpad TechConf 2016での青木の発表資料。大量のデータを最大限に活用するためのデータ処理システムの構築方針について
Technology
◦
Read more
53
Save
Share
Embed
Embed presentation
1
/ 40
2
/ 40
3
/ 40
4
/ 40
5
/ 40
6
/ 40
7
/ 40
8
/ 40
9
/ 40
10
/ 40
11
/ 40
12
/ 40
13
/ 40
14
/ 40
15
/ 40
16
/ 40
17
/ 40
18
/ 40
Most read
19
/ 40
20
/ 40
21
/ 40
22
/ 40
23
/ 40
24
/ 40
25
/ 40
26
/ 40
27
/ 40
28
/ 40
29
/ 40
30
/ 40
31
/ 40
32
/ 40
33
/ 40
34
/ 40
35
/ 40
36
/ 40
37
/ 40
38
/ 40
39
/ 40
40
/ 40
More Related Content
PDF
Apache Airflow 概要(Airflowの基礎を学ぶハンズオンワークショップ 発表資料)
by
NTT DATA Technology & Innovation
PDF
ストリーム処理を支えるキューイングシステムの選び方
by
Yoshiyasu SAEKI
PDF
Elasticsearchを使うときの注意点 公開用スライド
by
崇介 藤井
PDF
ログ管理のベストプラクティス
by
Akihiro Kuwano
PDF
Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)
by
NTT DATA OSS Professional Services
PDF
データ分析を支える技術 DWH再入門
by
Satoru Ishikawa
PPTX
PostgreSQLのロール管理とその注意点(Open Source Conference 2022 Online/Osaka 発表資料)
by
NTT DATA Technology & Innovation
PDF
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
by
NTT DATA OSS Professional Services
Apache Airflow 概要(Airflowの基礎を学ぶハンズオンワークショップ 発表資料)
by
NTT DATA Technology & Innovation
ストリーム処理を支えるキューイングシステムの選び方
by
Yoshiyasu SAEKI
Elasticsearchを使うときの注意点 公開用スライド
by
崇介 藤井
ログ管理のベストプラクティス
by
Akihiro Kuwano
Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)
by
NTT DATA OSS Professional Services
データ分析を支える技術 DWH再入門
by
Satoru Ishikawa
PostgreSQLのロール管理とその注意点(Open Source Conference 2022 Online/Osaka 発表資料)
by
NTT DATA Technology & Innovation
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
by
NTT DATA OSS Professional Services
What's hot
PDF
Data Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組み
by
cyberagent
PDF
運用してわかったLookerの本質的メリット : Data Engineering Study #8
by
Masatoshi Abe
PDF
Amazon Redshift パフォーマンスチューニングテクニックと最新アップデート
by
Amazon Web Services Japan
PDF
AWSのログ管理ベストプラクティス
by
Akihiro Kuwano
PDF
実運用して分かったRabbit MQの良いところ・気をつけること #jjug
by
Yahoo!デベロッパーネットワーク
PDF
[Aurora事例祭り]Amazon Aurora を使いこなすためのベストプラクティス
by
Amazon Web Services Japan
PPTX
Databricksを初めて使う人に向けて.pptx
by
otato
PPT
Cassandraのしくみ データの読み書き編
by
Yuki Morishita
PDF
A5 SQL Mk-2の便利な機能をお教えします
by
ester41
PDF
20191001 AWS Black Belt Online Seminar AWS Lake Formation
by
Amazon Web Services Japan
PDF
NTT DATA と PostgreSQL が挑んだ総力戦
by
NTT DATA OSS Professional Services
PPTX
Redshift勉強会
by
yuya-nakamura
PDF
YugabyteDBを使ってみよう(NewSQL/分散SQLデータベースよろず勉強会 #1 発表資料)
by
NTT DATA Technology & Innovation
PDF
Grafana LokiではじめるKubernetesロギングハンズオン(NTT Tech Conference #4 ハンズオン資料)
by
NTT DATA Technology & Innovation
PPTX
グラフ構造のデータモデルをPower BIで可視化してみた
by
CData Software Japan
PPTX
事業の進展とデータマネジメント体制の進歩(+プレトタイプの話)
by
Tokoroten Nakayama
PDF
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
by
Google Cloud Platform - Japan
PDF
インフラCICDの勘所
by
Toru Makabe
PPT
Raft
by
Preferred Networks
PDF
基幹業務もHadoopで!! -ローソンにおける店舗発注業務へのHadoop + Hive導入と その取り組みについて-
by
Keigo Suda
Data Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組み
by
cyberagent
運用してわかったLookerの本質的メリット : Data Engineering Study #8
by
Masatoshi Abe
Amazon Redshift パフォーマンスチューニングテクニックと最新アップデート
by
Amazon Web Services Japan
AWSのログ管理ベストプラクティス
by
Akihiro Kuwano
実運用して分かったRabbit MQの良いところ・気をつけること #jjug
by
Yahoo!デベロッパーネットワーク
[Aurora事例祭り]Amazon Aurora を使いこなすためのベストプラクティス
by
Amazon Web Services Japan
Databricksを初めて使う人に向けて.pptx
by
otato
Cassandraのしくみ データの読み書き編
by
Yuki Morishita
A5 SQL Mk-2の便利な機能をお教えします
by
ester41
20191001 AWS Black Belt Online Seminar AWS Lake Formation
by
Amazon Web Services Japan
NTT DATA と PostgreSQL が挑んだ総力戦
by
NTT DATA OSS Professional Services
Redshift勉強会
by
yuya-nakamura
YugabyteDBを使ってみよう(NewSQL/分散SQLデータベースよろず勉強会 #1 発表資料)
by
NTT DATA Technology & Innovation
Grafana LokiではじめるKubernetesロギングハンズオン(NTT Tech Conference #4 ハンズオン資料)
by
NTT DATA Technology & Innovation
グラフ構造のデータモデルをPower BIで可視化してみた
by
CData Software Japan
事業の進展とデータマネジメント体制の進歩(+プレトタイプの話)
by
Tokoroten Nakayama
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
by
Google Cloud Platform - Japan
インフラCICDの勘所
by
Toru Makabe
Raft
by
Preferred Networks
基幹業務もHadoopで!! -ローソンにおける店舗発注業務へのHadoop + Hive導入と その取り組みについて-
by
Keigo Suda
Viewers also liked
PDF
クラウド運用のベストプラクティスを考える - OpenStack最新情報セミナー(2016年12月)
by
VirtualTech Japan Inc.
PPT
第6回 itil講義資料
by
Mugen Fujii
PDF
実務で活かせる AWSアーキテクチャ設計 〜AWS re:Invent 2016アップデート最新版〜
by
真吾 吉田
PDF
手っ取り早くプロジェクトをなんとかしたい人のためのnanapi流ツール活用術~WebSig会議 vol.34「Webディレクター必見!プロジェクトを成功に...
by
WebSig24/7
PDF
仕事の成果は「聞き方」で9割決まる
by
Katsuhito Okada
PDF
クックパッドの開発プロセス
by
Hiroyuki Inoue
PPTX
オブジェクト指向を学んで図解力、仕事力アップ
by
Haruo Sato
PDF
今年のOss業界10大ニュース
by
Yukio Yoshida
PDF
仕事に活きる数学講座(第四回:予測力編)
by
schoowebcampus
PDF
日々の気づきをふりかえり、 個人とチームの成長につなげる方法
by
株式会社コパイロツト COPILOT Inc.
PDF
AWS クックパッドの運用事例
by
Satoshi Takada
PDF
[DO05] システムの信頼性を上げるための新しい考え方 SRE ( Site Reliability Engineering ) in Azure, o...
by
de:code 2017
PDF
4時間で学ぶ、効率的な自動テストスクリプトのメンテナンス
by
Nozomi Ito
PPTX
5分で分かるサイボウズのSRE
by
uchan_nos
PPTX
hbstudy 74 Site Reliability Engineering
by
Ryuji Tamagawa
PDF
全文検索でRedmineをさらに活用!
by
Kouhei Sutou
PDF
Cookpadの料理画像を分類した話
by
Shunsuke KITADA
PDF
いまの Office 365 ってこんな感じ?
by
Hirofumi Ota
PDF
ITサービスマネジメントとSRE
by
真吾 吉田
PPTX
技術者の自分が11年間会社を経営して学んだ7つのこと
by
Haruo Sato
クラウド運用のベストプラクティスを考える - OpenStack最新情報セミナー(2016年12月)
by
VirtualTech Japan Inc.
第6回 itil講義資料
by
Mugen Fujii
実務で活かせる AWSアーキテクチャ設計 〜AWS re:Invent 2016アップデート最新版〜
by
真吾 吉田
手っ取り早くプロジェクトをなんとかしたい人のためのnanapi流ツール活用術~WebSig会議 vol.34「Webディレクター必見!プロジェクトを成功に...
by
WebSig24/7
仕事の成果は「聞き方」で9割決まる
by
Katsuhito Okada
クックパッドの開発プロセス
by
Hiroyuki Inoue
オブジェクト指向を学んで図解力、仕事力アップ
by
Haruo Sato
今年のOss業界10大ニュース
by
Yukio Yoshida
仕事に活きる数学講座(第四回:予測力編)
by
schoowebcampus
日々の気づきをふりかえり、 個人とチームの成長につなげる方法
by
株式会社コパイロツト COPILOT Inc.
AWS クックパッドの運用事例
by
Satoshi Takada
[DO05] システムの信頼性を上げるための新しい考え方 SRE ( Site Reliability Engineering ) in Azure, o...
by
de:code 2017
4時間で学ぶ、効率的な自動テストスクリプトのメンテナンス
by
Nozomi Ito
5分で分かるサイボウズのSRE
by
uchan_nos
hbstudy 74 Site Reliability Engineering
by
Ryuji Tamagawa
全文検索でRedmineをさらに活用!
by
Kouhei Sutou
Cookpadの料理画像を分類した話
by
Shunsuke KITADA
いまの Office 365 ってこんな感じ?
by
Hirofumi Ota
ITサービスマネジメントとSRE
by
真吾 吉田
技術者の自分が11年間会社を経営して学んだ7つのこと
by
Haruo Sato
Similar to Cookpad TechConf 2016 - DWHに必要なこと
PDF
福岡クラウドUG-BigQuery
by
Wasaburo Miyata
PPTX
BigData Architecture for Azure
by
Ryoma Nagata
PDF
Amazon Redshiftへの移行方法と設計のポイント(db tech showcase 2016)
by
Amazon Web Services Japan
PPTX
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
by
Tetsutaro Watanabe
PDF
マルチビッグデータの活用を支える DWHの作り方
by
Yahoo!デベロッパーネットワーク
PDF
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
by
Mineaki Motohashi
PDF
オンプレミスDWHは今すぐ止めよう!ここまで進化したクラウドDWH (Oracle Cloudウェビナーシリーズ: 2021年8月4日)
by
オラクルエンジニア通信
福岡クラウドUG-BigQuery
by
Wasaburo Miyata
BigData Architecture for Azure
by
Ryoma Nagata
Amazon Redshiftへの移行方法と設計のポイント(db tech showcase 2016)
by
Amazon Web Services Japan
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
by
Tetsutaro Watanabe
マルチビッグデータの活用を支える DWHの作り方
by
Yahoo!デベロッパーネットワーク
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
by
Mineaki Motohashi
オンプレミスDWHは今すぐ止めよう!ここまで進化したクラウドDWH (Oracle Cloudウェビナーシリーズ: 2021年8月4日)
by
オラクルエンジニア通信
Cookpad TechConf 2016 - DWHに必要なこと
1.
DWHに必要なこと ∼1人で始めるCIO∼ Minero Aoki
2.
自己紹介 ‣ 青木峰郎(あおき みねろう) ‣
元Rubyコミッター ‣ 分析システム「たべみる」開発 ‣ データ分析基盤エンジニア ‣ 著書多数→
3.
データ活用基盤 今日のテーマ
4.
やりたいこと 大量のデータを 最高に活用したい
5.
やりたいこと 大量のデータを 最高に活用したい ユーザーコンタク トの一元管理 ターゲティング広告 ユーザー行動の分析 アプリのA/Bテスト
6.
DWH (Data Warehouse) が
その解となる
7.
DWHとは ‣ 90年代に提唱されたデータ分析アーキテクチャ ‣ 大量のデータを集めて部署横断で分析 ‣
Bill Inmonが定義(DWHの父と呼ばれている)
8.
DWH = 分析用のきれいなDB
9.
(DWHでない) 普通のDBは汚い
10.
DWHをどう作るか
11.
がんばる
12.
基本方針1. データは一箇所に集める
13.
アプリB ターゲティ ング広告 DB アプリC 行動分析 DB アプリD ABテスト DB アプリA コンタクト 管理 DB 乱立する分析システム
14.
アプリB ターゲティ ング広告 DB アプリC 行動分析 DB アプリD ABテスト DB アプリA コンタクト 管理 DB 乱立する分析システム ダメ
15.
なぜダメか ‣ データを集めるのがつらすぎ…… ‣ 指標の定義が違う!(PVって?
UUって?) ‣ 元データがよくわからない
16.
あるべきすがた アプリA アプリB アプリC
アプリD コンタクト 管理 ターゲティ ング広告 行動分析 ABテスト データベース
17.
DBなににする? • クックパッドでは全面的にRedshiftをDWHとして 使うことにした • 速い •
安い • 普通のSQLが使える
18.
アーキテクチャ Redshift (DWH) マスター Cookpad 広告配信システム ログ マスター ログ マスター ログ マスター ログ ログ マスター 各種サービス ログ マスター 連携システム Re:dash Jupyter Tableau 独自バッチシステム (Bricolage)
19.
データを集めれば DWHか?
20.
もちろん違う
21.
データを集めただけ
22.
DWH
23.
データは加工しないと DWHにはならない
24.
どのように加工するか?
25.
DWHの4つの条件 Integrated Subject- Oriented Time- Variant Non- Volatile
26.
DWHの4つの条件 Integrated Subject- Oriented Time- Variant Non- Volatile略
27.
10年戦える データ分析入門 青木峰郎著 ソフトバンククリエイティブ 詳細は本で
28.
基本方針2. DWHはなりゆきで作る
29.
アプリケーションが先! DWHがあと! Redshift 元データ DWH 活用先ごと Cookpad 広告配信 動画配信 …… コンタクト 管理 ターゲティ ング広告 ユーザー 行動分析 ABテスト as-is
3NF 3NF/Star 構築順(1) 構築順(2)構築順(3)
30.
共通ライブラリ としてのDWH
31.
基本方針3. SQLですべてを処理する
32.
よい例 Redshift テーブル テーブル テーブル INSERT SELECT INSERT SELECT
33.
Redshift テーブル テーブル テーブル ダメな例 RubyRuby SELEC T IN SER T SELEC T IN SER T
34.
ポイント ウェブとDWHでは 同じSQL/RDBでも 使いかたが違う
35.
まとめ
36.
DWHに必要なこと
37.
データは 一箇所に集める
38.
DWHは なりゆきでつくる
39.
すべてをSQLで処理
40.
同じSQLでも ウェブとDWHは別物