datatech-jp Casual Talks #2
株式会社MonotaRO IT部門 データ基盤グループ 吉本 直人
データ基盤に関わる問い合わせ対応
を仕組みで解決する
1
2022.5.17
© 2020 MonotaRO Co., Ltd. All Rights Reserved.
いろんな人からデータ基盤にくる
バラエティに富んだ問い合わせに
どう対応しているのかについてお話します。
2
話すこと
● 名前:吉本 直人(よしもと なおと)
● 2020年2月にMonotaRO入社
○ BigQueryを中心としたデータ基盤の構築・運用
○ データ管理の体制、仕組みづくり
○ 採用広報(編集)
● 過去の発表(MonotaROのslideshare)
○ Data Engineering Study #11 :
データ管理に重要なことは事業と組織の理解だった
○ MonotaRO Tech Talk #9 : 全社のデータ活用を一段階上げる取り組み
3
自己紹介
アジェンダ
4
● MonotaROのデータ基盤と利用状況について
● データ基盤においてどんな問い合わせがあるか
● 問い合わせ対応における課題
● 課題に対しての取り組み、アクション
● 結果と今後のアクション
MonotaROのデータ基盤と
利用状況について
5
自動連携
個別の同期システム
(個別の組織で管理)
Log パイプライン
Real-Time DB
Pipeline
個別の同期システム
6
BigQuery
基幹, ECサイト RDB
受発注, 顧客, 商品, 在庫, …
Google Analytics
内製システムデータ
顧客行動ログ収集,
検索エンジン …
その他パッケージ
システムデータ
WMS, カスタマーサポート …
Log
CDN, WebServer, Application
Data Lake
DWH
Data Mart
プロジェクト個別
その他
(合計 100程度)
マーケター
データ
サイエンティスト
物流
Apps Script
Sheets
Data Portal
SQL
Python など
その他 ツール
エンジニア
その他 全部門
レポーティング
SQL による分析
ML での最適化や予測
業務オペレーション
大規模データ処理
他システムとの連携
などなど
データソース 同期 データ管理 利用ツール 利用者 ユースケース
以下のデータが Google Cloud BigQuery に集約
● 基幹システム, ECサイトシステムのMySQL (約30スキーマ 1200超の
テーブルがニアリアルタイムで同期)
○ 受注, 発注, 商品, 顧客, 在庫, 販促 ...
● Webサーバ, アプリケーションサーバ のLog, CDN(Akamai) のログ
● Google Analytics (ECサイト行動データ)
● WMS(Warehouse Management System)
● 顧客からの問い合わせ
● 各種サブシステムがもつシステム情報
● 業務やプロジェクトで生成したデータ
7
どんなデータがどれくらいあるのか
● 利用ユーザ: 400人以上/月
○ 部門問わず全社員の 2 / 3 程度が日常的に利用
○ 習熟度は異なる
8
どれくらい利用されているのか
機械学習
エンジニア
マーケター
システム開発
エンジニア
カスタマーサポート
エンジニアリングに詳しい
エンジニアリングに詳しくない
データ分析に
詳しい
データ分析に
詳しくない
● 各種KPIレポート
● ECサイトのレコメンデーション
● 検索エンジンの Indexing 用データ作成
● 販促対象顧客選定
● 需要予測、在庫最適化
● 業務オペレーション用のツール
● …
9
利用例
データ基盤において
どんな問い合わせがあるか
10
● 内容に関わらずデータ基盤グループが対応
11
問い合わせ対応
エンジニアリングに詳しい
エンジニアリングに詳しくない
データ分析に
詳しい
データ分析に
詳しくない
データ基盤
グループ
12
問い合わせ例
同じ指標なのに
BigQueryとLooker
で値が違っている
クエリを実行
したら
エラーがでる
実行したクエリが
終わらない
〇〇の分析
したいけど
どうしたらいい?
問い合わせ対応における課題
13
● 問い合わせの数が多い
● 部門、業務、分析スキル、ドメイン知識が様々
なので背景理解が必要
データ基盤主導で並列で非同期にヒアリング
14
コンテキストスイッチが大きい
〇〇の売上を
知りたい
〇〇の需要予測
をしたい
● 部署やグループ内で解決されている
○ 知見が共有されない→スキルに差がでてくる
● その結果、同じような質問が多方面からくる
15
ナレッジの局所化
Aグループ
〇〇のテーブルに2022年
から値が入っていない
〇〇のテーブルは
△△のテーブルに移行し
てる
Bグループ
Cグループ
〇〇のテーブルに2022年
から値が入っていない
〇〇のテーブルに2022年
から値が入っていない
課題に対しての取り組み、
アクション
16
● データ基盤グループのみで対応し続けるのは限界
● 部門ごとにデータ分析、SQLに詳しい人が一定いる
問い合わせ対応をスケールさせる体制、
仕組みづくりを実施
   
17
問い合わせ対応の体制、仕組みづくり
問い合わせの分散対応 ナレッジの集約
● 分析に長けているメンバーを巻き込む
● データ活用やデータ管理の観点であるべき姿
(ビジョン)を議論
● 問い合わせ対応にも参加してもらう
18
データ活用/管理プロジェクト
● Slackに分析やツールの
質問をできるチャンネルを用意
● 相互扶助で解決するようにする
19
相互扶助の仕組み
#bigquery Bグループ
Aグループ
〇〇のテーブルに2022年から
値が入っていない
〇〇のテーブルは△△のテー
ブルに移行してる
● Slackでデータ分析に関わる質問、
Tipsなどを特定のチャンネルに集約
○ Reacji Channelerを活用
● よく使われる分析指標は
DWHで吸収
20
ナレッジの集約
#GroupA
#GroupB
〇〇の分析
どうすればいいですか
△△の指標はこの
ロジックで集計できます!
#data-inquiry
〇〇の分析
どうすればいいですか
△△の指標はこのロジックで
集計できます!
● BigQueryの利用で知っておいてほしいことを
講習会として実施
○ BigQueryの仕組み、権限、課金、Tips
● 便利な機能紹介を定期開催
○ INFORMATION_SCHEMA、
監査ログ
○ BQ Script, UDF, TVF
21
講習会、勉強会の開催
● データ基盤に関する情報を集約
○ BigQueryなど各ツールの利用方法
○ FAQ
○ 問い合わせ方法
○ 過去の勉強会資料
22
ポータルの作成
● チャンネルできた質問をデータ基盤以外の
メンバーが対応するケースが増えてきた
● 誰が何に困っているかをより把握しやすくなった
23
アクションの結果
● まだまだ問い合わせの数が多い
● 問い合わせの回答がボランティアベース
データ活用の組織、体制作りをさらに推進
その一方で...
今後のアクション
24
● グループ、部署を超えて
データ活用の本質的な課題を解決する仕組み
25
CoEと Hub-and-Spoke
Hub
(CoE)
Spoke
Spoke
Spoke
展開
展開
展開
● データ活用に積極的に取り組んでいたり、
データ分析の知見を使って共有など
フォローしている人を評価する
26
データ活用を評価に含める
✔ ビジネス上の課題や背景を把握し、問題提起(分析課題を設定)できる
✔ 周囲を巻き込んで課題について正しく説明し、分析実行に導ける
✔ 分析手段を選択でき、適切な部署へ相談や依頼ができる、ヒアリングに対応できる
✔ 分析の設計を議論、選択できる
✔ データを正しく解釈できる
✔ 分析結果をビジネス活用(新規業務、施策)につなげられる
分析リテラシーの向上
● 分析の設計をどう組み立てるか
● 課題を分析につなげていくために
必要な考え方を身につける
○ ダッシュボードの設計
○ データ分析のプロセス
○ データの使い方
27
データ基盤グループではデータ活用をさらに
推し進めていくための活動を行っています!
興味のある方はぜひ
カジュアル面談にご応募ください!
28
最後に
面談フォームリンク
29
© 2020 MonotaRO Co., Ltd. All Rights Reserved.

データ基盤に関わる問い合わせ対応を仕組みで解決する