Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
EN
Uploaded by
株式会社MonotaRO Tech Team
PDF, PPTX
3,373 views
「指標」を支えるエンジニアリング: DataOpsNight #1
DataOps Night#1 https://finatext.connpass.com/event/233494/
Technology
◦
Read more
0
Save
Share
Embed
Embed presentation
Download
Download as PDF, PPTX
1
/ 18
2
/ 18
3
/ 18
4
/ 18
5
/ 18
6
/ 18
7
/ 18
8
/ 18
9
/ 18
10
/ 18
11
/ 18
12
/ 18
13
/ 18
14
/ 18
15
/ 18
16
/ 18
17
/ 18
18
/ 18
More Related Content
PDF
MonotaRO のデータ活用と基盤の過去、現在、未来
by
株式会社MonotaRO Tech Team
PDF
全社のデータ活用を一段階上げる取り組み
by
株式会社MonotaRO Tech Team
PDF
データ基盤に関わる問い合わせ対応を仕組みで解決する
by
株式会社MonotaRO Tech Team
PDF
DMBOKをベースにしたデータマネジメント
by
Kent Ishizawa
PDF
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
by
NTT DATA Technology & Innovation
PDF
データウェアハウスモデリング入門(ダイジェスト版)(事前公開版)
by
Satoshi Nagayasu
PDF
JDMC LT#1 - なぜモノタロウでデータマネジメントが必要になったのか
by
株式会社MonotaRO Tech Team
PPTX
信頼できるAIシステム開発の勘どころ ~AI開発方法論×AI品質保証~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
by
NTT DATA Technology & Innovation
MonotaRO のデータ活用と基盤の過去、現在、未来
by
株式会社MonotaRO Tech Team
全社のデータ活用を一段階上げる取り組み
by
株式会社MonotaRO Tech Team
データ基盤に関わる問い合わせ対応を仕組みで解決する
by
株式会社MonotaRO Tech Team
DMBOKをベースにしたデータマネジメント
by
Kent Ishizawa
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
by
NTT DATA Technology & Innovation
データウェアハウスモデリング入門(ダイジェスト版)(事前公開版)
by
Satoshi Nagayasu
JDMC LT#1 - なぜモノタロウでデータマネジメントが必要になったのか
by
株式会社MonotaRO Tech Team
信頼できるAIシステム開発の勘どころ ~AI開発方法論×AI品質保証~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
by
NTT DATA Technology & Innovation
What's hot
PPTX
データ履歴管理のためのテンポラルデータモデルとReladomoの紹介 #jjug_ccc #ccc_g3
by
Hiroshi Ito
PDF
データ管理に重要なことは事業と組織の理解だった(Data Engineering Study #11 発表資料)
by
株式会社MonotaRO Tech Team
PDF
Mercari JPのモノリスサービスをKubernetesに移行した話 PHP Conference 2022 9/24
by
Shin Ohno
PDF
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
by
Techon Organization
PPTX
事業の進展とデータマネジメント体制の進歩(+プレトタイプの話)
by
Tokoroten Nakayama
PDF
DeNAの分析を支える分析基盤
by
Kenshin Yamada
PPTX
Amazon SageMakerでカスタムコンテナを使った学習
by
西岡 賢一郎
PPTX
チャットコミュニケーションの問題と心理的安全性の課題 #EOF2019
by
Tokoroten Nakayama
PDF
BigQuery で 150万円 使ったときの話
by
itkr
PDF
Dapr × Kubernetes ではじめるポータブルなマイクロサービス(CloudNative Days Tokyo 2020講演資料)
by
NTT DATA Technology & Innovation
PPTX
Apache Avro vs Protocol Buffers
by
Seiya Mizuno
PDF
datatech-jp Casual Talks#3 データエンジニアを採用するための試行錯誤
by
株式会社MonotaRO Tech Team
PDF
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
by
Ryoma Nagata
PPTX
ラボラトリーオートメーションのためのソフトウェア思想教育(非プログラマ―が知っておくべきプログラミングの本質)
by
Tokoroten Nakayama
PDF
SQLアンチパターン 幻の第26章「とりあえず削除フラグ」
by
Takuto Wada
PDF
Kubernetesによる機械学習基盤への挑戦
by
Preferred Networks
PDF
機械学習で泣かないためのコード設計
by
Takahiro Kubo
PDF
シリコンバレーの「何が」凄いのか
by
Atsushi Nakada
PPTX
ビッグデータ処理データベースの全体像と使い分け 2018年version
by
Tetsutaro Watanabe
PPTX
RLSを用いたマルチテナント実装 for Django
by
Takayuki Shimizukawa
データ履歴管理のためのテンポラルデータモデルとReladomoの紹介 #jjug_ccc #ccc_g3
by
Hiroshi Ito
データ管理に重要なことは事業と組織の理解だった(Data Engineering Study #11 発表資料)
by
株式会社MonotaRO Tech Team
Mercari JPのモノリスサービスをKubernetesに移行した話 PHP Conference 2022 9/24
by
Shin Ohno
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
by
Techon Organization
事業の進展とデータマネジメント体制の進歩(+プレトタイプの話)
by
Tokoroten Nakayama
DeNAの分析を支える分析基盤
by
Kenshin Yamada
Amazon SageMakerでカスタムコンテナを使った学習
by
西岡 賢一郎
チャットコミュニケーションの問題と心理的安全性の課題 #EOF2019
by
Tokoroten Nakayama
BigQuery で 150万円 使ったときの話
by
itkr
Dapr × Kubernetes ではじめるポータブルなマイクロサービス(CloudNative Days Tokyo 2020講演資料)
by
NTT DATA Technology & Innovation
Apache Avro vs Protocol Buffers
by
Seiya Mizuno
datatech-jp Casual Talks#3 データエンジニアを採用するための試行錯誤
by
株式会社MonotaRO Tech Team
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
by
Ryoma Nagata
ラボラトリーオートメーションのためのソフトウェア思想教育(非プログラマ―が知っておくべきプログラミングの本質)
by
Tokoroten Nakayama
SQLアンチパターン 幻の第26章「とりあえず削除フラグ」
by
Takuto Wada
Kubernetesによる機械学習基盤への挑戦
by
Preferred Networks
機械学習で泣かないためのコード設計
by
Takahiro Kubo
シリコンバレーの「何が」凄いのか
by
Atsushi Nakada
ビッグデータ処理データベースの全体像と使い分け 2018年version
by
Tetsutaro Watanabe
RLSを用いたマルチテナント実装 for Django
by
Takayuki Shimizukawa
More from 株式会社MonotaRO Tech Team
PDF
20240522 Findy Event ビジネスの構造をアーキテクチャに落とし込みソフトウェアに可変性を注入する.pdf
by
株式会社MonotaRO Tech Team
PDF
本番環境でやらかしちゃった選手権_MonotaRO社内LT会利用スライド.pdf
by
株式会社MonotaRO Tech Team
PDF
この技術書がすごい!2023夏(おすすめの技術書をペライチで紹介する選手権) .pdf
by
株式会社MonotaRO Tech Team
PDF
PyConAPAC2023 ワークフローエンジン Apache Airflowを用いた 大規模データパイプライン構築と改善
by
株式会社MonotaRO Tech Team
PDF
【TECHTRACKJP】私ってデータエンジニアなんですか?気づいたらデータエンジニアと呼ばれるようになった私がこの職種について考えた【20230725】
by
株式会社MonotaRO Tech Team
PDF
【マーケティング・テクノロジーフェア 大阪 2023】 データから正しい意思決定を行うために 〜全社横断で実施したデータ活用プロジェクトの取...
by
株式会社MonotaRO Tech Team
PDF
[ITmedia Cloud Native 2023] モノタロウのクラウドネイティブ.pdf
by
株式会社MonotaRO Tech Team
PDF
datatech-jp Casual Talks #5_データ基盤の立ち位置を考えるのに チームトポロジーの概念を活用した話
by
株式会社MonotaRO Tech Team
PDF
モノタロウの1900万商品を検索する Elasticsearch構築運用事例(2022-10-26 第50回Elasticsearch 勉強会発表資料)
by
株式会社MonotaRO Tech Team
PDF
信頼性とアジリティを同時に上げろ!モノタロウのカナリアリリース導入.pdf
by
株式会社MonotaRO Tech Team
PDF
モノタロウの開発・リリースサイクルを支えるJenkinsの活用事例 - Jenkins Day Japan 2021
by
株式会社MonotaRO Tech Team
PDF
データ基盤グループを支えるチームビルディング
by
株式会社MonotaRO Tech Team
PDF
MonotaRO LT - ESLintの仕組み
by
株式会社MonotaRO Tech Team
PDF
モノタロウECプラットフォームを支える開発運用モダナイゼーションの取り組み #devsumi
by
株式会社MonotaRO Tech Team
PDF
ITPと、その他cookie関連のこと / ITP and cookie
by
株式会社MonotaRO Tech Team
PDF
WSL2使ってみた / Preview for WSL2
by
株式会社MonotaRO Tech Team
PDF
WebApp個人開発のすゝめ / Recommendation of personal web app development
by
株式会社MonotaRO Tech Team
PDF
大規模フロントエンドのクリーンアーキテクチャ化 ~ 年間売上1,000億円企業モノタロウの取組み ~
by
株式会社MonotaRO Tech Team
PPTX
レガシーコードに向き合ってみた話
by
株式会社MonotaRO Tech Team
PDF
モノタロウ AIストアのひみつ #devsumiA
by
株式会社MonotaRO Tech Team
20240522 Findy Event ビジネスの構造をアーキテクチャに落とし込みソフトウェアに可変性を注入する.pdf
by
株式会社MonotaRO Tech Team
本番環境でやらかしちゃった選手権_MonotaRO社内LT会利用スライド.pdf
by
株式会社MonotaRO Tech Team
この技術書がすごい!2023夏(おすすめの技術書をペライチで紹介する選手権) .pdf
by
株式会社MonotaRO Tech Team
PyConAPAC2023 ワークフローエンジン Apache Airflowを用いた 大規模データパイプライン構築と改善
by
株式会社MonotaRO Tech Team
【TECHTRACKJP】私ってデータエンジニアなんですか?気づいたらデータエンジニアと呼ばれるようになった私がこの職種について考えた【20230725】
by
株式会社MonotaRO Tech Team
【マーケティング・テクノロジーフェア 大阪 2023】 データから正しい意思決定を行うために 〜全社横断で実施したデータ活用プロジェクトの取...
by
株式会社MonotaRO Tech Team
[ITmedia Cloud Native 2023] モノタロウのクラウドネイティブ.pdf
by
株式会社MonotaRO Tech Team
datatech-jp Casual Talks #5_データ基盤の立ち位置を考えるのに チームトポロジーの概念を活用した話
by
株式会社MonotaRO Tech Team
モノタロウの1900万商品を検索する Elasticsearch構築運用事例(2022-10-26 第50回Elasticsearch 勉強会発表資料)
by
株式会社MonotaRO Tech Team
信頼性とアジリティを同時に上げろ!モノタロウのカナリアリリース導入.pdf
by
株式会社MonotaRO Tech Team
モノタロウの開発・リリースサイクルを支えるJenkinsの活用事例 - Jenkins Day Japan 2021
by
株式会社MonotaRO Tech Team
データ基盤グループを支えるチームビルディング
by
株式会社MonotaRO Tech Team
MonotaRO LT - ESLintの仕組み
by
株式会社MonotaRO Tech Team
モノタロウECプラットフォームを支える開発運用モダナイゼーションの取り組み #devsumi
by
株式会社MonotaRO Tech Team
ITPと、その他cookie関連のこと / ITP and cookie
by
株式会社MonotaRO Tech Team
WSL2使ってみた / Preview for WSL2
by
株式会社MonotaRO Tech Team
WebApp個人開発のすゝめ / Recommendation of personal web app development
by
株式会社MonotaRO Tech Team
大規模フロントエンドのクリーンアーキテクチャ化 ~ 年間売上1,000億円企業モノタロウの取組み ~
by
株式会社MonotaRO Tech Team
レガシーコードに向き合ってみた話
by
株式会社MonotaRO Tech Team
モノタロウ AIストアのひみつ #devsumiA
by
株式会社MonotaRO Tech Team
「指標」を支えるエンジニアリング: DataOpsNight #1
1.
「指標」を支えるエンジニアリング 株式会社 MonotaRO: 竹野
峻輔 1 2022.02.17 Data Ops Night #1 © 2020 MonotaRO Co., Ltd. All Rights Reserved.
2.
発表者: 竹野 峻輔 2 ソフトウェアエンジニア 株式会社
MonotaRO (2021年2月より) ← ベンチャー 推薦システムの開発/分析やってます。 Web開発〜データ基盤あたりが守備範囲です 興味あること - 継続的実験: いかに組織的に素早く実験を回せるか - データアーキテクティング
3.
3 事業: - toBのEC事業. 売上1900億
(2021) - YoY+約20%: 3~4年で2倍 組織: - 490 ~ (のべ1680)人の規模 MonotaRO: 事業とデータの関わり 2021年12月期 決算発表 より モノタロウ エンジニア採用情報 MonotaRO、データマイニングツールに KXENを採用 (2008) 常識破りのデータドリブン企業・モノタロウが分析から施策まで を直結させ、PDCAを3倍速にできた理由(2019) 売り上げ5000億円を支えるシステムを目指して (2019)
4.
「指標」は「プロダクト」 ● 組織で最も使われるデータアプリケーション ○ 事業サービスのパフォーマンスのモニタリング ○
チームや個人でのKPIやKGI, OKRといったコミュニケーション ○ ABテストでの評価 ● 開発者/ユーザ、どちらも増えると大変になる ○ 開発の観点: 属人化。一貫性や整合性。 ○ ユーザの観点: 認知負荷の問題 ○ 流行り廃りが激しい 4
5.
INSIDE Metric System:
OVERVIEW BIツール DWH SaaS App ユーザ 「指標」を支えるのは複数の長大なシステムの依存関係。 指標 1〜K 神ダッシュボード (壊れると世が乱れる) 指標K+1 指標K+2 神の子ダッシュボード DRYではない大量の集計SQL (指標にも依存関係がある) 有象無象 … Transaction Tables Frontend App Backend App RDB Event Tables
6.
6 INSIDE Metric System:
FACT TABLES Transaction Tables 神ダッシュボード (壊れると世が乱れる) 神の子ダッシュボード 有象無象 BIツール App Frontend App Backend App RDB ユーザ Event Tables ディメンショナルモデリングを通じた スノーフレーク/スタースキーマによる実装 セグメントと集計テーブルに分けて正規化 FACT FACT FACT DWH SaaS Dims Dimension tables Fact table
7.
7 INSIDE Metric System:
WIDE TABLES Transaction Tables 神ダッシュボード (壊れると世が乱れる) 神の子ダッシュボード 有象無象 BIツール App Frontend App Backend App RDB ユーザ WIDE TABLE Event Tables ディメンジョンは非正規化された 結合操作が不要の集計テーブル DWH SaaS WIDE
8.
8 FACT TABLES V.S.
WIDE TABLES ユーザの利便性の観点: 中長期の開発・運用に向いている - テーブル数は多い - 再利用性が高い - 認知負荷は低い - セグメント追加/削除はコスト低い 短期的の開発・運用に向いている - テーブル数は単一 - 再利用性は低い - テーブルの認知負荷は高い - セグメントの追加/削除はコスト高い 探索用途に向いている - ユーザによる実装コストは低い - 複雑なフィルタ操作が実現可能 - 集計は都度必要 モニタリング用途に向いている - ユーザによる実装コストは低い - フィルタ操作は択一 - 集計が不要 開発の利便性の観点:
9.
9 INSIDE Metric System:
HYBRID Model Transaction Tables 神ダッシュボード (壊れると世が乱れる) 神の子ダッシュボード 有象無象 BIツール App Frontend App Backend App RDB ユーザ Event Tables ファクトテーブルとワイドテーブルのいいところを 取れればどのような用途でも対応できる! WIDE TABLE FACT FACT FACT DWH SaaS Dims
10.
10 こうして世界は救われた... fin.
11.
世界は救われた...? 11 ユーザの観点では実はそんなに便利になってない可能性が高い。 - ユーザが生産者&消費者 →
役割分担によるサイロ化 - 依存構造の適切な把握、指標の集計パイプラインの認知負荷の問題 こう分割しがち
12.
世界は救われた...? 12 ユーザの観点では実はそんなに便利になってない可能性が高い - ユーザが生産者&消費者 →
役割分担によるサイロ化 - 依存構造の適切な把握、指標の集計パイプラインの認知負荷の問題 ダッシュボードAでは+Xだけど ダッシュボードBでは+Yなんだけどなんで? ダッシュボードAは 「Xページランディング異常値処理として 過去12週間の売上上位0.1%を除去して 推薦枠のポジションバイアスを系。 訪問セッション回数が分母、クリックセッション回数が分 子のユーザ別CTR平均をブートストラップ平均法」により 算出してます
13.
13 指標テーブルは再利用可能か? チーム用ダッシュボード 全社用ダッシュボード 社外用ダッシュボード 施策用ダッシュボード 1. ダッシュボードのライフサイクルに応じたステージング戦略が必要 2. コンテキストや用途よって同じ指標でも作り分けが必要 3.
事業フェーズに応じた指標の開発が必要 コンバージョンとは? 検索サービスのファネル 新規ユーザのファネル 異常値処理 オフライン/ABテストの指標 長期指標の代替指標の開発 指標の介入容易性・検出力の評価 ガードレール/デバッグメトリクス 計測とは何か(JIS): 指標をとりまくサイエンスの観点: “特定の目的をもって,事物を量的にとらえるための方法・手段を考究し,実施し, その結果を用い所期の目的を達成させること。” https://kikakurui.com/z8/Z8103-2000-01.html 用途 計測の目的 目的達成のための方法・手段 → 「指標」テーブルは実は再利用性が高くない
14.
14 「指標」のためにすべきこと データの流れに対して水平分割はサイロ化をうみやすい。垂直分割化が理想 - 標準化と標準の上のツール開発が必要 - 指標の命名、処理のモジュール化、I/Fの定義、ドキュメンテーション -
透過的なバッチシステムの用意 - 集計済みテーブル よりも 集計前のシグナル / エンティティのテーブルの整備 - シグナル: 検索や新規ユーザのファネルイベント. イベントとunion可能 - エンティティ: ディメンジョン(階層構造)や状態遷移(Slowly Changing D.) 指標 1〜K 神ダッシュボード (壊れると世が乱れる) 指標K+1 指標K+2 神の子ダッシュボード 有象無象 … Transaction Frontend App Backend App RDB Event シグナル エンティティ 探索向け
15.
15 シグナル, エンティティの開発 (時間があれば) -
エンティティ: イベントに関わるオブジェクト。クリーンな命名 - 単位の整理: 顧客 ~ ブラウザ, 会員ID, 会員ID[デバイス別] … - 属性やセグメント、それに伴う状態管理(Slowly Changing Dimension) - シグナル: 着目するエンティティの重要な動きの定義、重みづけ。 おすすめ: ファネルをイベントテーブルとして作る - 検索用ファネル: 検索 → クエリ入力 → 結果表示 → クリック → カートイン [成功] - 新規登録のファネル: 未登録 → 訪問 → 購入手続き → 情報入力 → アクティベート[成功] → 集計: 分析単位シグナルとエンティティがあれば集計の仕方は大体一緒 - 異常値の除去などはしない処理前のテーブル
16.
本日の発表まとめ 「指標」をエンジニアリングの観点を紹介 ○ ファクトテーブル /
ワイドテーブル だけ用意すればよいわけではない → 罠にハマるかも 「指標」の再利用は容易ではない ○ 計測 = 用途 x 計測の目的 x 方法・手段 ○ 標準化/開発が大事 16
17.
参考資料: ● [レポート] モダンデータウェアハウスにおける「キンボール」〜残す価値のあるもの、ないもの #dbtcoalesce ●
Keynote: The Metric System: #dbtcoalesce ● 過去 - 発表資料など ○ ベンチャー企業におけるDWH DevOps @ Retty ○ カルチャーとエンジニアリングをつなぐデータプラットフォーム ○ toC企業におけるデータ活用 17
18.
18 © 2020 MonotaRO
Co., Ltd. All Rights Reserved.
Download