Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
EN
Uploaded by
株式会社MonotaRO Tech Team
PDF, PPTX
3,373 views
「指標」を支えるエンジニアリング: DataOpsNight #1
DataOps Night#1 https://finatext.connpass.com/event/233494/
Technology
◦
Read more
0
Save
Share
Embed
Embed presentation
Download
Download as PDF, PPTX
1
/ 18
2
/ 18
3
/ 18
4
/ 18
5
/ 18
6
/ 18
7
/ 18
8
/ 18
9
/ 18
10
/ 18
11
/ 18
12
/ 18
13
/ 18
14
/ 18
15
/ 18
16
/ 18
17
/ 18
18
/ 18
More Related Content
PDF
Data Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組み
by
cyberagent
PDF
Statistical Semantic入門 ~分布仮説からword2vecまで~
by
Yuya Unno
PPTX
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
by
NTT DATA Technology & Innovation
PDF
データ基盤に関わる問い合わせ対応を仕組みで解決する
by
株式会社MonotaRO Tech Team
PDF
異次元のグラフデータベースNeo4j
by
昌桓 李
PPTX
グラフ構造のデータモデルをPower BIで可視化してみた
by
CData Software Japan
PDF
大規模データ時代に求められる自然言語処理
by
Preferred Networks
PPTX
マルチクラウドDWH(Snowflake)のすすめ
by
Yuuta Hishinuma
Data Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組み
by
cyberagent
Statistical Semantic入門 ~分布仮説からword2vecまで~
by
Yuya Unno
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
by
NTT DATA Technology & Innovation
データ基盤に関わる問い合わせ対応を仕組みで解決する
by
株式会社MonotaRO Tech Team
異次元のグラフデータベースNeo4j
by
昌桓 李
グラフ構造のデータモデルをPower BIで可視化してみた
by
CData Software Japan
大規模データ時代に求められる自然言語処理
by
Preferred Networks
マルチクラウドDWH(Snowflake)のすすめ
by
Yuuta Hishinuma
What's hot
PPTX
AWSで作る分析基盤
by
Yu Otsubo
PDF
シリコンバレーの「何が」凄いのか
by
Atsushi Nakada
PDF
アサヒのデータ活用基盤を支えるデータ仮想化技術
by
Denodo
PDF
リクルートライフスタイル流!分析基盤との賢い付き合い方
by
Recruit Lifestyle Co., Ltd.
PPTX
DXとかDevOpsとかのなんかいい感じのやつ 富士通TechLive
by
Tokoroten Nakayama
PDF
「UXデザインとは」からはじめる「本流」のUXデザインはじめの一歩 | UXデザイン基礎セミナー 第1回
by
Yoshiki Hayama
PPTX
データサイエンティスト向け性能問題対応の基礎
by
Tetsutaro Watanabe
PDF
ビッグデータ処理データベースの全体像と使い分け
by
Recruit Technologies
PPTX
先駆者に学ぶ MLOpsの実際
by
Tetsutaro Watanabe
PDF
MLOps Yearning ~ 実運用システムを構築する前にデータサイエンティストが考えておきたいこと
by
Rakuten Group, Inc.
PDF
【メタサーベイ】数式ドリブン教師あり学習
by
cvpaper. challenge
PPTX
画像キャプションの自動生成
by
Yoshitaka Ushiku
PDF
アプリを成長させるためのログ取りとログ解析に必要なこと
by
Takao Sumitomo
PDF
入門 Kubeflow ~Kubernetesで機械学習をはじめるために~ (NTT Tech Conference #4 講演資料)
by
NTT DATA Technology & Innovation
PPTX
学習時に使ってはいないデータの混入「リーケージを避ける」
by
西岡 賢一郎
PDF
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
by
Google Cloud Platform - Japan
PDF
Apache Airflow 概要(Airflowの基礎を学ぶハンズオンワークショップ 発表資料)
by
NTT DATA Technology & Innovation
PDF
Active Learning 入門
by
Shuyo Nakatani
PPTX
データ履歴管理のためのテンポラルデータモデルとReladomoの紹介 #jjug_ccc #ccc_g3
by
Hiroshi Ito
PPTX
データ収集の基本と「JapanTaxi」アプリにおける実践例
by
Tetsutaro Watanabe
AWSで作る分析基盤
by
Yu Otsubo
シリコンバレーの「何が」凄いのか
by
Atsushi Nakada
アサヒのデータ活用基盤を支えるデータ仮想化技術
by
Denodo
リクルートライフスタイル流!分析基盤との賢い付き合い方
by
Recruit Lifestyle Co., Ltd.
DXとかDevOpsとかのなんかいい感じのやつ 富士通TechLive
by
Tokoroten Nakayama
「UXデザインとは」からはじめる「本流」のUXデザインはじめの一歩 | UXデザイン基礎セミナー 第1回
by
Yoshiki Hayama
データサイエンティスト向け性能問題対応の基礎
by
Tetsutaro Watanabe
ビッグデータ処理データベースの全体像と使い分け
by
Recruit Technologies
先駆者に学ぶ MLOpsの実際
by
Tetsutaro Watanabe
MLOps Yearning ~ 実運用システムを構築する前にデータサイエンティストが考えておきたいこと
by
Rakuten Group, Inc.
【メタサーベイ】数式ドリブン教師あり学習
by
cvpaper. challenge
画像キャプションの自動生成
by
Yoshitaka Ushiku
アプリを成長させるためのログ取りとログ解析に必要なこと
by
Takao Sumitomo
入門 Kubeflow ~Kubernetesで機械学習をはじめるために~ (NTT Tech Conference #4 講演資料)
by
NTT DATA Technology & Innovation
学習時に使ってはいないデータの混入「リーケージを避ける」
by
西岡 賢一郎
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
by
Google Cloud Platform - Japan
Apache Airflow 概要(Airflowの基礎を学ぶハンズオンワークショップ 発表資料)
by
NTT DATA Technology & Innovation
Active Learning 入門
by
Shuyo Nakatani
データ履歴管理のためのテンポラルデータモデルとReladomoの紹介 #jjug_ccc #ccc_g3
by
Hiroshi Ito
データ収集の基本と「JapanTaxi」アプリにおける実践例
by
Tetsutaro Watanabe
More from 株式会社MonotaRO Tech Team
PDF
20240522 Findy Event ビジネスの構造をアーキテクチャに落とし込みソフトウェアに可変性を注入する.pdf
by
株式会社MonotaRO Tech Team
PDF
本番環境でやらかしちゃった選手権_MonotaRO社内LT会利用スライド.pdf
by
株式会社MonotaRO Tech Team
PDF
この技術書がすごい!2023夏(おすすめの技術書をペライチで紹介する選手権) .pdf
by
株式会社MonotaRO Tech Team
PDF
PyConAPAC2023 ワークフローエンジン Apache Airflowを用いた 大規模データパイプライン構築と改善
by
株式会社MonotaRO Tech Team
PDF
【TECHTRACKJP】私ってデータエンジニアなんですか?気づいたらデータエンジニアと呼ばれるようになった私がこの職種について考えた【20230725】
by
株式会社MonotaRO Tech Team
PDF
【マーケティング・テクノロジーフェア 大阪 2023】 データから正しい意思決定を行うために 〜全社横断で実施したデータ活用プロジェクトの取...
by
株式会社MonotaRO Tech Team
PDF
[ITmedia Cloud Native 2023] モノタロウのクラウドネイティブ.pdf
by
株式会社MonotaRO Tech Team
PDF
datatech-jp Casual Talks #5_データ基盤の立ち位置を考えるのに チームトポロジーの概念を活用した話
by
株式会社MonotaRO Tech Team
PDF
モノタロウの1900万商品を検索する Elasticsearch構築運用事例(2022-10-26 第50回Elasticsearch 勉強会発表資料)
by
株式会社MonotaRO Tech Team
PDF
JDMC LT#1 - なぜモノタロウでデータマネジメントが必要になったのか
by
株式会社MonotaRO Tech Team
PDF
datatech-jp Casual Talks#3 データエンジニアを採用するための試行錯誤
by
株式会社MonotaRO Tech Team
PDF
信頼性とアジリティを同時に上げろ!モノタロウのカナリアリリース導入.pdf
by
株式会社MonotaRO Tech Team
PDF
モノタロウの開発・リリースサイクルを支えるJenkinsの活用事例 - Jenkins Day Japan 2021
by
株式会社MonotaRO Tech Team
PDF
データ管理に重要なことは事業と組織の理解だった(Data Engineering Study #11 発表資料)
by
株式会社MonotaRO Tech Team
PDF
MonotaRO のデータ活用と基盤の過去、現在、未来
by
株式会社MonotaRO Tech Team
PDF
全社のデータ活用を一段階上げる取り組み
by
株式会社MonotaRO Tech Team
PDF
データ基盤グループを支えるチームビルディング
by
株式会社MonotaRO Tech Team
PDF
MonotaRO LT - ESLintの仕組み
by
株式会社MonotaRO Tech Team
PDF
モノタロウECプラットフォームを支える開発運用モダナイゼーションの取り組み #devsumi
by
株式会社MonotaRO Tech Team
PDF
ITPと、その他cookie関連のこと / ITP and cookie
by
株式会社MonotaRO Tech Team
20240522 Findy Event ビジネスの構造をアーキテクチャに落とし込みソフトウェアに可変性を注入する.pdf
by
株式会社MonotaRO Tech Team
本番環境でやらかしちゃった選手権_MonotaRO社内LT会利用スライド.pdf
by
株式会社MonotaRO Tech Team
この技術書がすごい!2023夏(おすすめの技術書をペライチで紹介する選手権) .pdf
by
株式会社MonotaRO Tech Team
PyConAPAC2023 ワークフローエンジン Apache Airflowを用いた 大規模データパイプライン構築と改善
by
株式会社MonotaRO Tech Team
【TECHTRACKJP】私ってデータエンジニアなんですか?気づいたらデータエンジニアと呼ばれるようになった私がこの職種について考えた【20230725】
by
株式会社MonotaRO Tech Team
【マーケティング・テクノロジーフェア 大阪 2023】 データから正しい意思決定を行うために 〜全社横断で実施したデータ活用プロジェクトの取...
by
株式会社MonotaRO Tech Team
[ITmedia Cloud Native 2023] モノタロウのクラウドネイティブ.pdf
by
株式会社MonotaRO Tech Team
datatech-jp Casual Talks #5_データ基盤の立ち位置を考えるのに チームトポロジーの概念を活用した話
by
株式会社MonotaRO Tech Team
モノタロウの1900万商品を検索する Elasticsearch構築運用事例(2022-10-26 第50回Elasticsearch 勉強会発表資料)
by
株式会社MonotaRO Tech Team
JDMC LT#1 - なぜモノタロウでデータマネジメントが必要になったのか
by
株式会社MonotaRO Tech Team
datatech-jp Casual Talks#3 データエンジニアを採用するための試行錯誤
by
株式会社MonotaRO Tech Team
信頼性とアジリティを同時に上げろ!モノタロウのカナリアリリース導入.pdf
by
株式会社MonotaRO Tech Team
モノタロウの開発・リリースサイクルを支えるJenkinsの活用事例 - Jenkins Day Japan 2021
by
株式会社MonotaRO Tech Team
データ管理に重要なことは事業と組織の理解だった(Data Engineering Study #11 発表資料)
by
株式会社MonotaRO Tech Team
MonotaRO のデータ活用と基盤の過去、現在、未来
by
株式会社MonotaRO Tech Team
全社のデータ活用を一段階上げる取り組み
by
株式会社MonotaRO Tech Team
データ基盤グループを支えるチームビルディング
by
株式会社MonotaRO Tech Team
MonotaRO LT - ESLintの仕組み
by
株式会社MonotaRO Tech Team
モノタロウECプラットフォームを支える開発運用モダナイゼーションの取り組み #devsumi
by
株式会社MonotaRO Tech Team
ITPと、その他cookie関連のこと / ITP and cookie
by
株式会社MonotaRO Tech Team
「指標」を支えるエンジニアリング: DataOpsNight #1
1.
「指標」を支えるエンジニアリング 株式会社 MonotaRO: 竹野
峻輔 1 2022.02.17 Data Ops Night #1 © 2020 MonotaRO Co., Ltd. All Rights Reserved.
2.
発表者: 竹野 峻輔 2 ソフトウェアエンジニア 株式会社
MonotaRO (2021年2月より) ← ベンチャー 推薦システムの開発/分析やってます。 Web開発〜データ基盤あたりが守備範囲です 興味あること - 継続的実験: いかに組織的に素早く実験を回せるか - データアーキテクティング
3.
3 事業: - toBのEC事業. 売上1900億
(2021) - YoY+約20%: 3~4年で2倍 組織: - 490 ~ (のべ1680)人の規模 MonotaRO: 事業とデータの関わり 2021年12月期 決算発表 より モノタロウ エンジニア採用情報 MonotaRO、データマイニングツールに KXENを採用 (2008) 常識破りのデータドリブン企業・モノタロウが分析から施策まで を直結させ、PDCAを3倍速にできた理由(2019) 売り上げ5000億円を支えるシステムを目指して (2019)
4.
「指標」は「プロダクト」 ● 組織で最も使われるデータアプリケーション ○ 事業サービスのパフォーマンスのモニタリング ○
チームや個人でのKPIやKGI, OKRといったコミュニケーション ○ ABテストでの評価 ● 開発者/ユーザ、どちらも増えると大変になる ○ 開発の観点: 属人化。一貫性や整合性。 ○ ユーザの観点: 認知負荷の問題 ○ 流行り廃りが激しい 4
5.
INSIDE Metric System:
OVERVIEW BIツール DWH SaaS App ユーザ 「指標」を支えるのは複数の長大なシステムの依存関係。 指標 1〜K 神ダッシュボード (壊れると世が乱れる) 指標K+1 指標K+2 神の子ダッシュボード DRYではない大量の集計SQL (指標にも依存関係がある) 有象無象 … Transaction Tables Frontend App Backend App RDB Event Tables
6.
6 INSIDE Metric System:
FACT TABLES Transaction Tables 神ダッシュボード (壊れると世が乱れる) 神の子ダッシュボード 有象無象 BIツール App Frontend App Backend App RDB ユーザ Event Tables ディメンショナルモデリングを通じた スノーフレーク/スタースキーマによる実装 セグメントと集計テーブルに分けて正規化 FACT FACT FACT DWH SaaS Dims Dimension tables Fact table
7.
7 INSIDE Metric System:
WIDE TABLES Transaction Tables 神ダッシュボード (壊れると世が乱れる) 神の子ダッシュボード 有象無象 BIツール App Frontend App Backend App RDB ユーザ WIDE TABLE Event Tables ディメンジョンは非正規化された 結合操作が不要の集計テーブル DWH SaaS WIDE
8.
8 FACT TABLES V.S.
WIDE TABLES ユーザの利便性の観点: 中長期の開発・運用に向いている - テーブル数は多い - 再利用性が高い - 認知負荷は低い - セグメント追加/削除はコスト低い 短期的の開発・運用に向いている - テーブル数は単一 - 再利用性は低い - テーブルの認知負荷は高い - セグメントの追加/削除はコスト高い 探索用途に向いている - ユーザによる実装コストは低い - 複雑なフィルタ操作が実現可能 - 集計は都度必要 モニタリング用途に向いている - ユーザによる実装コストは低い - フィルタ操作は択一 - 集計が不要 開発の利便性の観点:
9.
9 INSIDE Metric System:
HYBRID Model Transaction Tables 神ダッシュボード (壊れると世が乱れる) 神の子ダッシュボード 有象無象 BIツール App Frontend App Backend App RDB ユーザ Event Tables ファクトテーブルとワイドテーブルのいいところを 取れればどのような用途でも対応できる! WIDE TABLE FACT FACT FACT DWH SaaS Dims
10.
10 こうして世界は救われた... fin.
11.
世界は救われた...? 11 ユーザの観点では実はそんなに便利になってない可能性が高い。 - ユーザが生産者&消費者 →
役割分担によるサイロ化 - 依存構造の適切な把握、指標の集計パイプラインの認知負荷の問題 こう分割しがち
12.
世界は救われた...? 12 ユーザの観点では実はそんなに便利になってない可能性が高い - ユーザが生産者&消費者 →
役割分担によるサイロ化 - 依存構造の適切な把握、指標の集計パイプラインの認知負荷の問題 ダッシュボードAでは+Xだけど ダッシュボードBでは+Yなんだけどなんで? ダッシュボードAは 「Xページランディング異常値処理として 過去12週間の売上上位0.1%を除去して 推薦枠のポジションバイアスを系。 訪問セッション回数が分母、クリックセッション回数が分 子のユーザ別CTR平均をブートストラップ平均法」により 算出してます
13.
13 指標テーブルは再利用可能か? チーム用ダッシュボード 全社用ダッシュボード 社外用ダッシュボード 施策用ダッシュボード 1. ダッシュボードのライフサイクルに応じたステージング戦略が必要 2. コンテキストや用途よって同じ指標でも作り分けが必要 3.
事業フェーズに応じた指標の開発が必要 コンバージョンとは? 検索サービスのファネル 新規ユーザのファネル 異常値処理 オフライン/ABテストの指標 長期指標の代替指標の開発 指標の介入容易性・検出力の評価 ガードレール/デバッグメトリクス 計測とは何か(JIS): 指標をとりまくサイエンスの観点: “特定の目的をもって,事物を量的にとらえるための方法・手段を考究し,実施し, その結果を用い所期の目的を達成させること。” https://kikakurui.com/z8/Z8103-2000-01.html 用途 計測の目的 目的達成のための方法・手段 → 「指標」テーブルは実は再利用性が高くない
14.
14 「指標」のためにすべきこと データの流れに対して水平分割はサイロ化をうみやすい。垂直分割化が理想 - 標準化と標準の上のツール開発が必要 - 指標の命名、処理のモジュール化、I/Fの定義、ドキュメンテーション -
透過的なバッチシステムの用意 - 集計済みテーブル よりも 集計前のシグナル / エンティティのテーブルの整備 - シグナル: 検索や新規ユーザのファネルイベント. イベントとunion可能 - エンティティ: ディメンジョン(階層構造)や状態遷移(Slowly Changing D.) 指標 1〜K 神ダッシュボード (壊れると世が乱れる) 指標K+1 指標K+2 神の子ダッシュボード 有象無象 … Transaction Frontend App Backend App RDB Event シグナル エンティティ 探索向け
15.
15 シグナル, エンティティの開発 (時間があれば) -
エンティティ: イベントに関わるオブジェクト。クリーンな命名 - 単位の整理: 顧客 ~ ブラウザ, 会員ID, 会員ID[デバイス別] … - 属性やセグメント、それに伴う状態管理(Slowly Changing Dimension) - シグナル: 着目するエンティティの重要な動きの定義、重みづけ。 おすすめ: ファネルをイベントテーブルとして作る - 検索用ファネル: 検索 → クエリ入力 → 結果表示 → クリック → カートイン [成功] - 新規登録のファネル: 未登録 → 訪問 → 購入手続き → 情報入力 → アクティベート[成功] → 集計: 分析単位シグナルとエンティティがあれば集計の仕方は大体一緒 - 異常値の除去などはしない処理前のテーブル
16.
本日の発表まとめ 「指標」をエンジニアリングの観点を紹介 ○ ファクトテーブル /
ワイドテーブル だけ用意すればよいわけではない → 罠にハマるかも 「指標」の再利用は容易ではない ○ 計測 = 用途 x 計測の目的 x 方法・手段 ○ 標準化/開発が大事 16
17.
参考資料: ● [レポート] モダンデータウェアハウスにおける「キンボール」〜残す価値のあるもの、ないもの #dbtcoalesce ●
Keynote: The Metric System: #dbtcoalesce ● 過去 - 発表資料など ○ ベンチャー企業におけるDWH DevOps @ Retty ○ カルチャーとエンジニアリングをつなぐデータプラットフォーム ○ toC企業におけるデータ活用 17
18.
18 © 2020 MonotaRO
Co., Ltd. All Rights Reserved.
Download