Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
株式会社MonotaRO Tech Team
PDF, PPTX
14,744 views
MonotaRO のデータ活用と基盤の過去、現在、未来
2021/10/28 MonotaRO Tech Talk #9 (データマネジメント編) https://monotaro.connpass.com/event/226592/
Data & Analytics
◦
Related topics:
Data Management Insights
•
Read more
1
Save
Share
Embed
Embed presentation
Download
Download as PDF, PPTX
1
/ 49
2
/ 49
Most read
3
/ 49
4
/ 49
5
/ 49
6
/ 49
7
/ 49
8
/ 49
9
/ 49
10
/ 49
11
/ 49
12
/ 49
13
/ 49
14
/ 49
15
/ 49
16
/ 49
17
/ 49
18
/ 49
19
/ 49
20
/ 49
21
/ 49
22
/ 49
23
/ 49
24
/ 49
25
/ 49
26
/ 49
27
/ 49
28
/ 49
29
/ 49
30
/ 49
31
/ 49
32
/ 49
33
/ 49
34
/ 49
35
/ 49
36
/ 49
37
/ 49
38
/ 49
39
/ 49
40
/ 49
41
/ 49
42
/ 49
43
/ 49
44
/ 49
45
/ 49
46
/ 49
47
/ 49
48
/ 49
49
/ 49
More Related Content
PDF
全社のデータ活用を一段階上げる取り組み
by
株式会社MonotaRO Tech Team
PDF
データ基盤に関わる問い合わせ対応を仕組みで解決する
by
株式会社MonotaRO Tech Team
PDF
JDMC LT#1 - なぜモノタロウでデータマネジメントが必要になったのか
by
株式会社MonotaRO Tech Team
PPTX
事業の進展とデータマネジメント体制の進歩(+プレトタイプの話)
by
Tokoroten Nakayama
PDF
データ管理に重要なことは事業と組織の理解だった(Data Engineering Study #11 発表資料)
by
株式会社MonotaRO Tech Team
PDF
データ分析を支える技術 DWH再入門
by
Satoru Ishikawa
PPTX
マルチクラウドDWH(Snowflake)のすすめ
by
Yuuta Hishinuma
PDF
開発速度が速い #とは(LayerX社内資料)
by
mosa siru
全社のデータ活用を一段階上げる取り組み
by
株式会社MonotaRO Tech Team
データ基盤に関わる問い合わせ対応を仕組みで解決する
by
株式会社MonotaRO Tech Team
JDMC LT#1 - なぜモノタロウでデータマネジメントが必要になったのか
by
株式会社MonotaRO Tech Team
事業の進展とデータマネジメント体制の進歩(+プレトタイプの話)
by
Tokoroten Nakayama
データ管理に重要なことは事業と組織の理解だった(Data Engineering Study #11 発表資料)
by
株式会社MonotaRO Tech Team
データ分析を支える技術 DWH再入門
by
Satoru Ishikawa
マルチクラウドDWH(Snowflake)のすすめ
by
Yuuta Hishinuma
開発速度が速い #とは(LayerX社内資料)
by
mosa siru
What's hot
PPTX
データ収集の基本と「JapanTaxi」アプリにおける実践例
by
Tetsutaro Watanabe
PDF
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
by
NTT DATA Technology & Innovation
PDF
ビッグデータ処理データベースの全体像と使い分け
by
Recruit Technologies
PDF
データ仮想化を活用したデータ分析のフローと分析モデル作成の自動化のご紹介
by
Denodo
PDF
Data-Centric AIの紹介
by
Kazuyuki Miyazawa
PDF
リクルートにおけるデータのインフラ化への取組
by
Recruit Technologies
PDF
datatech-jp Casual Talks#3 データエンジニアを採用するための試行錯誤
by
株式会社MonotaRO Tech Team
PPTX
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
by
NTT DATA Technology & Innovation
PDF
Snowflakeって実際どうなの?数多のDBを使い倒した猛者が語る
by
Ryota Shibuya
PDF
失敗から学ぶ機械学習応用
by
Hiroyuki Masuda
PDF
Data-Centric AI開発における データ生成の取り組み
by
Takeshi Suzuki
PPTX
データサイエンティスト向け性能問題対応の基礎
by
Tetsutaro Watanabe
PDF
Data-centricなML開発
by
Takeshi Suzuki
PDF
Apache Airflow 概要(Airflowの基礎を学ぶハンズオンワークショップ 発表資料)
by
NTT DATA Technology & Innovation
PPTX
オーバーエンジニアリングって何? #devsumi #devsumiA
by
Ore Product
PDF
はじめてのPRD
by
Takuya Oikawa
PPTX
優れた研究論文の書き方―7つの提案
by
Masanori Kado
PDF
ビジネスパーソンのためのDX入門講座エッセンス版
by
Tokoroten Nakayama
PDF
機械学習モデルのサービングとは?
by
Sho Tanaka
PPTX
DockerコンテナでGitを使う
by
Kazuhiro Suga
データ収集の基本と「JapanTaxi」アプリにおける実践例
by
Tetsutaro Watanabe
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
by
NTT DATA Technology & Innovation
ビッグデータ処理データベースの全体像と使い分け
by
Recruit Technologies
データ仮想化を活用したデータ分析のフローと分析モデル作成の自動化のご紹介
by
Denodo
Data-Centric AIの紹介
by
Kazuyuki Miyazawa
リクルートにおけるデータのインフラ化への取組
by
Recruit Technologies
datatech-jp Casual Talks#3 データエンジニアを採用するための試行錯誤
by
株式会社MonotaRO Tech Team
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
by
NTT DATA Technology & Innovation
Snowflakeって実際どうなの?数多のDBを使い倒した猛者が語る
by
Ryota Shibuya
失敗から学ぶ機械学習応用
by
Hiroyuki Masuda
Data-Centric AI開発における データ生成の取り組み
by
Takeshi Suzuki
データサイエンティスト向け性能問題対応の基礎
by
Tetsutaro Watanabe
Data-centricなML開発
by
Takeshi Suzuki
Apache Airflow 概要(Airflowの基礎を学ぶハンズオンワークショップ 発表資料)
by
NTT DATA Technology & Innovation
オーバーエンジニアリングって何? #devsumi #devsumiA
by
Ore Product
はじめてのPRD
by
Takuya Oikawa
優れた研究論文の書き方―7つの提案
by
Masanori Kado
ビジネスパーソンのためのDX入門講座エッセンス版
by
Tokoroten Nakayama
機械学習モデルのサービングとは?
by
Sho Tanaka
DockerコンテナでGitを使う
by
Kazuhiro Suga
Similar to MonotaRO のデータ活用と基盤の過去、現在、未来
PPTX
ビッグデータ処理データベースの全体像と使い分け 2018年version
by
Tetsutaro Watanabe
PPTX
リクルートを支える横断データ基盤と機械学習の適用事例
by
Tetsutaro Watanabe
PDF
Data platformdesign
by
Ryoma Nagata
PDF
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
by
Preferred Networks
PPTX
02_2_20240611_Qlik Cloud データ統合 しっかり学ぶ勉強会 #2 - データパイプラインの作成「データマートの作成」
by
QlikPresalesJapan
PDF
[Oracle Innovation Summit Tokyo 2018] 水環境の持続を支えるクラウド型ICTプラットフォーム「Water Busine...
by
オラクルエンジニア通信
PDF
変わる!? リクルートグループのデータ解析基盤
by
Recruit Technologies
PDF
Developers Summit 2018: ストリームとバッチを融合したBigData Analytics ~事例とデモから見えてくる、これからのデー...
by
オラクルエンジニア通信
PDF
データエンジニアのお仕事、過去現在未来 / Yokohama North Meetup #12「LT新年会2026」 2026.1.15 @大倉山記念...
by
Takeshi Mikami
PDF
基調講演:「多様化する情報を支える技術」/西川徹
by
Preferred Networks
PDF
避けては通れないビッグデータ周辺の重要課題
by
kurikiyo
PDF
Hadoop最新事情とHortonworks Data Platform
by
Yuta Imai
PDF
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォーム
by
Preferred Networks
PDF
ビッグデータとデータマート
by
株式会社オプト 仙台ラボラトリ
PDF
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
by
Atsushi Tsuchiya
PDF
オープンセミナー岡山 これから始めるデータ活用
by
syou6162
PDF
S01 t3 data_engineer
by
Takeshi Akutsu
KEY
Strata conference 2012
by
Junya Yamaguchi
PDF
[Oracle Cloud Days Tokyo2015]成功事例に学べ! ビッグデータ活用のための最新ベストプラクティス
by
オラクルエンジニア通信
PDF
ビッグデータ・データマートとは
by
株式会社オプト 仙台ラボラトリ
ビッグデータ処理データベースの全体像と使い分け 2018年version
by
Tetsutaro Watanabe
リクルートを支える横断データ基盤と機械学習の適用事例
by
Tetsutaro Watanabe
Data platformdesign
by
Ryoma Nagata
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
by
Preferred Networks
02_2_20240611_Qlik Cloud データ統合 しっかり学ぶ勉強会 #2 - データパイプラインの作成「データマートの作成」
by
QlikPresalesJapan
[Oracle Innovation Summit Tokyo 2018] 水環境の持続を支えるクラウド型ICTプラットフォーム「Water Busine...
by
オラクルエンジニア通信
変わる!? リクルートグループのデータ解析基盤
by
Recruit Technologies
Developers Summit 2018: ストリームとバッチを融合したBigData Analytics ~事例とデモから見えてくる、これからのデー...
by
オラクルエンジニア通信
データエンジニアのお仕事、過去現在未来 / Yokohama North Meetup #12「LT新年会2026」 2026.1.15 @大倉山記念...
by
Takeshi Mikami
基調講演:「多様化する情報を支える技術」/西川徹
by
Preferred Networks
避けては通れないビッグデータ周辺の重要課題
by
kurikiyo
Hadoop最新事情とHortonworks Data Platform
by
Yuta Imai
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォーム
by
Preferred Networks
ビッグデータとデータマート
by
株式会社オプト 仙台ラボラトリ
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
by
Atsushi Tsuchiya
オープンセミナー岡山 これから始めるデータ活用
by
syou6162
S01 t3 data_engineer
by
Takeshi Akutsu
Strata conference 2012
by
Junya Yamaguchi
[Oracle Cloud Days Tokyo2015]成功事例に学べ! ビッグデータ活用のための最新ベストプラクティス
by
オラクルエンジニア通信
ビッグデータ・データマートとは
by
株式会社オプト 仙台ラボラトリ
More from 株式会社MonotaRO Tech Team
PDF
モノタロウECプラットフォームを支える開発運用モダナイゼーションの取り組み #devsumi
by
株式会社MonotaRO Tech Team
PDF
【マーケティング・テクノロジーフェア 大阪 2023】 データから正しい意思決定を行うために 〜全社横断で実施したデータ活用プロジェクトの取...
by
株式会社MonotaRO Tech Team
PDF
信頼性とアジリティを同時に上げろ!モノタロウのカナリアリリース導入.pdf
by
株式会社MonotaRO Tech Team
PDF
PyConAPAC2023 ワークフローエンジン Apache Airflowを用いた 大規模データパイプライン構築と改善
by
株式会社MonotaRO Tech Team
PDF
「指標」を支えるエンジニアリング: DataOpsNight #1
by
株式会社MonotaRO Tech Team
PDF
モノタロウの1900万商品を検索する Elasticsearch構築運用事例(2022-10-26 第50回Elasticsearch 勉強会発表資料)
by
株式会社MonotaRO Tech Team
PDF
大規模フロントエンドのクリーンアーキテクチャ化 ~ 年間売上1,000億円企業モノタロウの取組み ~
by
株式会社MonotaRO Tech Team
PDF
モノタロウの開発・リリースサイクルを支えるJenkinsの活用事例 - Jenkins Day Japan 2021
by
株式会社MonotaRO Tech Team
PDF
[ITmedia Cloud Native 2023] モノタロウのクラウドネイティブ.pdf
by
株式会社MonotaRO Tech Team
PDF
【TECHTRACKJP】私ってデータエンジニアなんですか?気づいたらデータエンジニアと呼ばれるようになった私がこの職種について考えた【20230725】
by
株式会社MonotaRO Tech Team
PPTX
レガシーコードに向き合ってみた話
by
株式会社MonotaRO Tech Team
PDF
WSL2使ってみた / Preview for WSL2
by
株式会社MonotaRO Tech Team
PDF
本番環境でやらかしちゃった選手権_MonotaRO社内LT会利用スライド.pdf
by
株式会社MonotaRO Tech Team
PDF
ITPと、その他cookie関連のこと / ITP and cookie
by
株式会社MonotaRO Tech Team
PDF
MonotaRO LT - ESLintの仕組み
by
株式会社MonotaRO Tech Team
PDF
20240522 Findy Event ビジネスの構造をアーキテクチャに落とし込みソフトウェアに可変性を注入する.pdf
by
株式会社MonotaRO Tech Team
PDF
この技術書がすごい!2023夏(おすすめの技術書をペライチで紹介する選手権) .pdf
by
株式会社MonotaRO Tech Team
PDF
データ基盤グループを支えるチームビルディング
by
株式会社MonotaRO Tech Team
PDF
datatech-jp Casual Talks #5_データ基盤の立ち位置を考えるのに チームトポロジーの概念を活用した話
by
株式会社MonotaRO Tech Team
PDF
WebApp個人開発のすゝめ / Recommendation of personal web app development
by
株式会社MonotaRO Tech Team
モノタロウECプラットフォームを支える開発運用モダナイゼーションの取り組み #devsumi
by
株式会社MonotaRO Tech Team
【マーケティング・テクノロジーフェア 大阪 2023】 データから正しい意思決定を行うために 〜全社横断で実施したデータ活用プロジェクトの取...
by
株式会社MonotaRO Tech Team
信頼性とアジリティを同時に上げろ!モノタロウのカナリアリリース導入.pdf
by
株式会社MonotaRO Tech Team
PyConAPAC2023 ワークフローエンジン Apache Airflowを用いた 大規模データパイプライン構築と改善
by
株式会社MonotaRO Tech Team
「指標」を支えるエンジニアリング: DataOpsNight #1
by
株式会社MonotaRO Tech Team
モノタロウの1900万商品を検索する Elasticsearch構築運用事例(2022-10-26 第50回Elasticsearch 勉強会発表資料)
by
株式会社MonotaRO Tech Team
大規模フロントエンドのクリーンアーキテクチャ化 ~ 年間売上1,000億円企業モノタロウの取組み ~
by
株式会社MonotaRO Tech Team
モノタロウの開発・リリースサイクルを支えるJenkinsの活用事例 - Jenkins Day Japan 2021
by
株式会社MonotaRO Tech Team
[ITmedia Cloud Native 2023] モノタロウのクラウドネイティブ.pdf
by
株式会社MonotaRO Tech Team
【TECHTRACKJP】私ってデータエンジニアなんですか?気づいたらデータエンジニアと呼ばれるようになった私がこの職種について考えた【20230725】
by
株式会社MonotaRO Tech Team
レガシーコードに向き合ってみた話
by
株式会社MonotaRO Tech Team
WSL2使ってみた / Preview for WSL2
by
株式会社MonotaRO Tech Team
本番環境でやらかしちゃった選手権_MonotaRO社内LT会利用スライド.pdf
by
株式会社MonotaRO Tech Team
ITPと、その他cookie関連のこと / ITP and cookie
by
株式会社MonotaRO Tech Team
MonotaRO LT - ESLintの仕組み
by
株式会社MonotaRO Tech Team
20240522 Findy Event ビジネスの構造をアーキテクチャに落とし込みソフトウェアに可変性を注入する.pdf
by
株式会社MonotaRO Tech Team
この技術書がすごい!2023夏(おすすめの技術書をペライチで紹介する選手権) .pdf
by
株式会社MonotaRO Tech Team
データ基盤グループを支えるチームビルディング
by
株式会社MonotaRO Tech Team
datatech-jp Casual Talks #5_データ基盤の立ち位置を考えるのに チームトポロジーの概念を活用した話
by
株式会社MonotaRO Tech Team
WebApp個人開発のすゝめ / Recommendation of personal web app development
by
株式会社MonotaRO Tech Team
MonotaRO のデータ活用と基盤の過去、現在、未来
1.
MonotaRO のデータ活用と基盤の 過去、現在、未来 1 2021.10.28 © 2021
MonotaRO Co., Ltd. All Rights Reserved.
2.
● 名前: 香川和哉 ●
データ基盤グループ マネージャ ● 入社 6年目 (マネージャ 4年目) ● 販促(マーケ)基盤運用 → データ基盤構築/運用 → データ管理 ● データエンジニアリング, クラウドインフラ あたりの経験が多め ● 前職は社員5人の会社でWebアプリ(フロントからインフラまで), スマホアプリ, 企画から営業まで担当 ● 2歳の娘がいます 2 自己紹介
3.
● MonotaRO について ●
データ基盤の過去と現在 ● データ基盤の未来 3 今日話すこと
4.
MonotaRO について 4
5.
5 ● 2000年 10月設立 ●
BtoB を対象に、自ら間接資材の 在庫を持ち、自らオンラインで売る EC 企業 ● コールセンター、商品採用、物流、 マーケティング、データサイエンス、 IT など多くの業務とシステムを 自社開発、自社運用している フルスタック EC カンパニー ● 商品数 :1,800 万点 (在庫 50万点) 市場規模:5~10 兆円 MonotaROについて
6.
6 2021年 1,800億円超を計画 リーマンショック コロナウイルス MonotaROの成長 ● 年率 20%以上の成長を11年継続 ●
システムは常にキャパシティとの戦いでもある
7.
❏ 管理部門 ❏ サプライチェーンマネジメント部門 ❏
商品部門 ❏ 商品開発部門 ❏ データマーケティング部門 ❏ ECシステムエンジニアリング部門 ❏ 海外事業部門 ❏ カスタマーサポート部門 ❏ エンタープライズビジネス部門 ❏ IT部門 ❏ 物流部門 7 MonotaROの組織 ● 全 11部門 ● 社員数 576人 (2021年 10月) ● 30%程度がテック職
8.
8 EC サイト 商品情報管理 CRM 受注管理 マーケティング 倉庫管理 その他 サブシステム 人事 会計 Data Platform MonotaROのシステム全体のイメージ
9.
データ基盤の歴史 9
10.
10 データ基盤の歴史: 全体像 ~ 2010 基幹システムか らの抽出と Excel 2010
~ 2015 販促基盤 2016 ~ 2017 BigQuery 導入 2020~2021 データ管理導入 Looker導入 DWH構築 2018 ~ 2019 BigQuery展開 2018 ~ 2019 他システム連携 DDP EC基盤への展開 2020~2021 サーチ基盤 2022 ~ データ管理展開 Looker展開 DWH展開 2022 ~ ??
11.
販促基盤によるデータ活用高度化 2010 ~ 2015 11
12.
12 データ基盤の歴史: 全体像 ~ 2010 基幹システムか らの抽出と Excel 2010
~ 2015 販促基盤 2016 ~ 2017 BigQuery 導入 2020~2021 データ管理導入 Looker導入 DWH構築 2018 ~ 2019 BigQuery展開 2018 ~ 2019 他システム連携 DDP EC基盤への展開 2020~2021 サーチ基盤 2022 ~ データ管理展開 Looker展開 DWH展開 2022 ~ ??
13.
13 販促基盤とDWH (2010 ~
2015頃) システム ● 基幹, ECサイトのシステムからデータを集約して 販促 用DWH を構築 (同期は 日次, 100テーブル程度) ● KXEN(今は SAP Predictive Analytics) による機械学 習を用いたレコメンドなど高度なマーケティングが可 能になった ● また SQL Server Analysis Service を用いたBIを構 築。 KPI ベースでの施策立案がより簡単に可能に。 データ利用者 ● データ分析スキルをもつ従業員はマーケティング 部門に集中しており全社のデータ活用をマーケ ティング部門がサポート マーケ用 MySQL Campaign Managment その他DB その他DB 基幹/EC DB ML (KXEN) BI SQLによる分析 MLによる予測 BIレポート マーケティング部門 の一部のメンバー 日次でのデータ同期 (100テーブル程度) DWH として機能
14.
課題 ● マシンリソースの枯渇 ○ 負荷軽減のためのハックが複雑化を招き運用コスト高 ○
複雑さにより変更コスト高く、データ同期対象も追加 も困難に ○ 利用ユーザ管理も限定 → 全社のデータ活用の基盤としては利用ができない 14 販促基盤とDWHでの成果と課題 成果 ● DWH, 機械学習基盤, BI という構成を小規模ながら 構築 ● マーケティング部門に SQL を使ってデータを利用 する文化が根付いた ● BIを社内展開することでマーケティング部門以外で もデータをみて意思決定できる環境が一定できた マーケ用 MySQL Campaign Managment その他DB その他DB 基幹/EC DB ML (KXEN) BI SQLによる分析 MLによる予測 BIレポート マーケティング部門 の一部のメンバー DWH として機能 日次でのデータ同期 (100テーブル程度)
15.
BigQuery の導入 2016 ~
2017 15
16.
16 データ基盤の歴史: 全体像 ~ 2010 基幹システムか らの抽出と Excel 2010
~ 2015 販促基盤 2016 ~ 2017 BigQuery 導入 2020~2021 データ管理導入 Looker導入 DWH構築 2018 ~ 2019 BigQuery展開 2018 ~ 2019 他システム連携 DDP EC基盤への展開 2020~2021 サーチ基盤 2022 ~ データ管理展開 Looker展開 DWH展開 2022 ~ ??
17.
マーケティング部門 17 データ分析人材の他部門への展開 (2016) ● 組織の拡大と事業規模の拡大に合わせて新規部門を設立 ●
マーケティング部門に所属していたデータ分析人材は新部門や別部門に異動することでデー タ分析の機能を全社の部門に展開 ● それまでの販促基盤ではなく全社レベルでのデータ基盤が必要に A部門 B部門 C部門 分析依頼 データ マーケティング部門 A部門 B部門 C部門 新メンバーの入社 分析スキルをもつメ ンバーの他部門への 展開
18.
18 BQ導入とデータ同期システムの開発(2017) EngineerScientist (50人 ~ ) Users
(40人 ~ ) 基幹システム & EC アプリケーション DWH & DataMart BigQuery Application Cloud Storage Apps Script Sheets Data Portal マーチャンダイ ザー マーケター カスタマサ ポート 物流 Application Database Database リアルタイム データパイプライン by (遅延:3分, テーブル:1,000~) ITエンジニア SQL データ サイエンティスト ● 社内のMySQL からニアリアルタイムにBigQueryにデータを同期するシステムを開発 ○ MySQL の Binary log を利用(Change Data Capture) ● BigQueryによって販促基盤DWHと比較して圧倒的なスケーラビリティを獲得 ● Google Workspace(当時はGSuite) と GCP のアカウント連携によって利用ユーザの管理も簡単にな り利用者も増加
19.
19 BigQuery 導入における成果と課題 扱えるデータ量 作成されたレポート数
SQL 業務利用者人数 10× 10× 4× ~ 100 テーブル 1000 テーブル~ ~ 30 レポート 300 レポート~ ~ 10 人 40 人~ ( IT エンジニア以外)
20.
BigQuery の展開 2018 ~
2020 20
21.
21 データ基盤の歴史: 全体像 ~ 2010 基幹システムか らの抽出と Excel 2010
~ 2015 販促基盤 2016 ~ 2017 BigQuery 導入 2020~2021 データ管理導入 Looker導入 DWH構築 2018 ~ 2019 BigQuery展開 2018 ~ 2019 他システム連携 DDP EC基盤への展開 2020~2021 サーチ基盤 2022 ~ データ管理展開 Looker展開 DWH展開 2022 ~ ??
22.
データ同期システムv2 (2018) ● Binlogを利用するというアプローチはそのままに実装としては完全にリプレース ●
誰でもニアリアルタイムのデータを利用できるように ○ 分析以外での用途(業務上必要なデータの抽出) でも利用されるように ■ 分析 → オペレーションのサイクルがより早くなった ● 監視や運用自動化をすすめ体制強化し、空いた工数でMySQL以外のデータの拡 充にも着手 (WMSのデータ, ウェブサーバログ など) Engineer, Scientist (100人 ~ ) Users (100人 ~ ) 基幹システム & EC アプリケーション DWH & DataMart BigQuery Application Apps Script Sheets Data Portal マーチャンダイ ザー マーケター カスタマサ ポート 物流 Application Database Database リアルタイムデータパイプラインV2 by (遅延: ~1分, テーブル:1,000~) ITエンジニア SQL データ サイエンティスト Pub/Sub Compute Engine
23.
23 ● サポート体制の構築 ○ Slack
でのヘルプデスク用チャネルの運用 ○ データ基盤Gによる業務利用のサポート ● SpreadSheetとGASで作成したジョブスケジュールツールの 提供 ● BigQuery とデータ基盤の説明会の実施 ● その他勉強会の実施(全社, グループ個別, 新入社員) ○ BigQuery + SQL 勉強会 ○ Data Studio 勉強会 データ基盤の全社展開 (2018, 2019)
24.
現在の状況と課題 24
25.
25 データ基盤の歴史: 全体像 ~ 2010 基幹システムか らの抽出と Excel 2010
~ 2015 販促基盤 2016 ~ 2017 BigQuery 導入 2020~2021 データ管理導入 Looker導入 DWH構築 2018 ~ 2019 BigQuery展開 2018 ~ 2019 他システム連携 DDP EC基盤への展開 2020~2021 サーチ基盤 2022 ~ データ管理展開 Looker展開 DWH展開 2022 ~ ??
26.
● 基幹システム, ECサイトシステムのMySQL
(約30スキーマ 1200超の テーブル) ○ 受注, 発注, 商品, 顧客, 在庫, 販促 ... ● Webサーバ, アプリケーションサーバ のLog, CDN(Akamai) のログ ● Google Analytics (ECサイト行動データ) ● WMS(Warehouse Management System) ● 顧客からの問い合わせ ● 各種サブシステムがもつシステム情報 ● 業務やプロジェクトで生成したデータ 26 どんなデータがどれくらいあるのか
27.
● 利用ユーザ: 350人以上/月 ○
全部門が利用 ○ 分析から 業務オペレーション用ツール , システムの メトリクスの保存までユースケースは様々 ● クエリ実行数: 270万 以上/月 ○ 一日 9万回実行されている 27 どれくらい利用されているのか
28.
● 各種KPIレポート ● ECサイトのレコメンデーション ●
検索エンジンの Indexing 用データ作成 ● 販促対象顧客選定 ● 需要予測、在庫最適化 ● … 28 利用例
29.
29 課題: データ/指標が管理されていない データに関する情報が集約管理されておらず、次のような問題が 発生している。 ● データ管理やデータ定義の局所最適化が進んでいる ○
個別・グループ内の管理に留まっている ○ 業務/組織等を横断した共有や活用が困難 ● データの使い方がわからない ○ データに関する情報が散在し、アクセスできない ○ SQLを書けなければ集計・分析できない
30.
~ 2010 基幹システムか らの抽出と Excel 2010 ~
2015 販促基盤 2016 ~ 2017 BigQuery 導入 2020~2021 データ管理導入 Looker導入 DWH構築 2018 ~ 2019 BigQuery展開 2018 ~ 2019 他システム連携 DDP EC基盤への展開 2020~2021 サーチ基盤 2022 ~ データ管理展開 Looker展開 DWH展開 2022 ~ ?? 30 データ基盤の歴史: ユーザの利用状況の変遷 特定の人だけ 使える 特定の部署だ け使える 自由に 使える より自由に 使える 自由, 安心, 安全, 簡 単に使える 自由に使えるが 難しい ● データが集約される仕組みはできた ● ユーザのユースケースもスキルレベルの幅も広がったため 誰もが簡単に利用するには難しくなってきた → より簡単に、安心して使えるようにする必要がある
31.
現在の取り組み 2020~2021 31
32.
● 2021年 5月よりデータ管理にフォーカスする組織として新 たに体制を構築 ●
課題とあるべき体制について経営層に説明と合意 ● ミッションを新たに定め、チームビルディングを実施 データ管理組織の立ち上げ
33.
● データ管理は領域も広く計画なしには効率的にすすめられない ● DMBOKをベースとしたアセスメントを実施し課題を把握 ●
課題の重要度、緊急度を評価してロードマップを作成する 33 データ管理中長期ロードマップの作成 アセスメントの結果を基に 依存関係を整理してロード マップを構築
34.
34 データ基盤とDWH / BI
(2021) ● Looker/LookML(モデル定義言語) を利用して全社統一された データマート を構築し更に BIとしても活用しSQLなどの分析スキルに関わらずデータを活用できる環境の実現を目標と して実施。現在継続中。 ● 並行して、IT部門や業務部門と協力しながら DWH を構築 ○ 他部門の既存の独自DWHを分解して再構成 ○ dbt (ツール) によって BigQuery でのDWH構築処理を管理 Looker (データマート) BigQuery Data Lake DWH データモデル (LookML) ダッシュボード Looker上ではモデルの定義のみ存在。 動的にBigQueryに対してクエリを実行 しデータモデルを元にデータを作る。 dbt
35.
MonotaROのデータ基盤の未来 35
36.
36 データ基盤の今後 ~ 2010 基幹システムか らの抽出と Excel 2010 ~
2015 販促基盤 2016 ~ 2017 BigQuery 導入 2020~2021 データ管理導入 Looker導入 DWH構築 2018 ~ 2019 BigQuery展開 2018 ~ 2019 他システム連携 DDP EC基盤への展開 2020~2021 サーチ基盤 2022 ~ データ管理展開 Looker展開 DWH展開 2022 ~ ?? より自由に 使える 自由, 安心, 安全, 簡 単に使える 自由に使えるが 難しい 特定の人だけ 使える 特定の部署だ け使える 自由に 使える
37.
P: 計画 D:
実行 C: 評価 A: 改善立案
38.
P: 計画 D:
実行 C: 評価 A: 改善立案 新機能作成, 既 存機能変更など の要求 ビジネス戦略/戦 術 プロジェクト計 画 概要設計書 システムと DB プロジェクト化 計画立案 概要設計 詳細設計/実装 データ収集 分析 レポート 施策立案 戦略/戦術立案 分析用 データ
39.
P: 計画 D:
実行 C: 評価 A: 改善立案 新機能作成, 既 存機能変更など の要求 ビジネス戦略/戦 術 プロジェクト計 画 概要設計書 システムと DB プロジェクト化 計画立案 概要設計 詳細設計/実装 データ収集 分析 レポート 施策立案 戦略/戦術立案 分析用 データ ボトルネック ~ 2015年(販促基盤とDWH)
40.
P: 計画 D:
実行 C: 評価 A: 改善立案 新機能作成, 既 存機能変更など の要求 ビジネス戦略/戦 術 プロジェクト計 画 概要設計書 システムと DB プロジェクト化 計画立案 概要設計 詳細設計/実装 データ統合 分析 レポート 施策立案 戦略/戦術立案 データレイク 2016 ~ 2018年(データ基盤の導入)
41.
P: 計画 D:
実行 C: 評価 A: 改善立案 新機能作成, 既 存機能変更など の要求 ビジネス戦略/戦 術 プロジェクト計 画 概要設計書 システムと DB プロジェクト化 計画立案 概要設計 詳細設計/実装 データ統合 分析 レポート 施策立案 戦略/戦術立案 データレイク ボトルネック 2019 ~ 2020年(データ基盤の展開)
42.
P: 計画 D:
実行 C: 評価 A: 改善立案 新機能作成, 既 存機能変更など の要求 ビジネス戦略/戦 術 プロジェクト計 画 概要設計書 システムと DB プロジェクト化 計画立案 概要設計 詳細設計/実装 データ統合 分析 施策立案 戦略/戦術立案 DWH データレイク データマート 業務指標 モデリング 分析ドメイン モデリング 2021年(現在)
43.
P: 計画 D:
実行 C: 評価 A: 改善立案 新機能作成, 既 存機能変更など の要求 ビジネス戦略/戦 術 プロジェクト計 画 概要設計書 システムと DB プロジェクト化 計画立案 概要設計 詳細設計/実装 データ統合 分析 施策立案 戦略/戦術立案 DWH データレイク データマート 業務指標 モデリング 分析ドメイン モデリング 2021年(見えてきた課題) システムアーキテクチャ の大規模な変更 ボトルネック 業務とシステムの複雑 化とナレッジの偏在 ボトルネック
44.
P: 計画 新機能作成, 既 存機能変更など の要求 ビジネス戦略/戦 術 プロジェクト計 画 概要設計書 システムと DB プロジェクト化 計画立案 概要設計 詳細設計/実装 データ統合 分析 施策立案 戦略/戦術立案 DWH データレイク データマート 業務指標 モデリング 分析ドメイン モデリング エンジニア プロデューサ/部門長 分析官
データ基盤 システムアーキテクチャ の大規模な変更 ボトルネック 業務とシステムの複雑 化とナレッジの偏在 ボトルネック 担当者と責任範囲
45.
P: 計画 新機能作成, 既存 機能変更などの要 求 ビジネス戦略/戦術 プロジェクト計画 概要設計書 システムと DB プロジェクト化 計画立案 概要設計 詳細設計/実装 データ統合 分析 施策立案 戦略/戦術立案 DWH データレイク データマート 業務指標 モデリング 分析ドメイン モデリング エンジニア プロデューサ/部門長 分析官 データ基盤 プロデューサ体制 (2019) これまでの取り組み システムアーキテク チャの大規模な変更 ボトルネック 業務とシステムの複雑 化とナレッジの偏在 ボトルネック
46.
P: 計画 新機能作成, 既存 機能変更などの要 求 ビジネス戦略/戦術 プロジェクト計画 概要設計書 システムと DB プロジェクト化 計画立案 概要設計 詳細設計/実装 データ統合 分析 施策立案 戦略/戦術立案 DWH データレイク データマート 業務指標 モデリング 分析ドメイン モデリング エンジニア プロデューサ/部門長 分析官 データ基盤 プロデューサ体制 (2019) DWH,
データマート構築 (2021) これまでの取り組み システムアーキテク チャの大規模な変更 ボトルネック 業務とシステムの複雑 化とナレッジの偏在 ボトルネック
47.
P: 計画 新機能作成, 既存 機能変更などの要 求 ビジネス戦略/戦術 プロジェクト計画 概要設計書 システムと DB プロジェクト化 計画立案 概要設計 詳細設計/実装 データ統合 分析 施策立案 戦略/戦術立案 DWH データレイク データマート 業務指標 モデリング 分析ドメイン モデリング エンジニア プロデューサ/部門長 分析官 データ基盤 プラットフォームベース
IT組織 とデータメッシュを指向した基盤と 組織 データ活用管理のための全社 横断CoE プロダクトマネージャ体制 DWH, データマート構築 データ管理の展開 これからの取組み システムアーキテク チャの大規模な変更 ボトルネック 業務とシステムの複雑 化とナレッジの偏在 ボトルネック
48.
データ基盤の未来まとめ ● システムも組織もデータ管理をすすめることで解 決できる課題領域が全社にまたがって存在する ● よってデータ管理の課題に全社で取り組む ●
データ基盤グループは組織とシステムと両方で リーダーシップをとってこれらを達成する 48
49.
49 © 2021 MonotaRO
Co., Ltd. All Rights Reserved.
Download