Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
TF
Uploaded by
Taisuke Fukawa
PPTX, PDF
590 views
20200630 Monotaro Data Platform & EC Platform
20200630 Monotaro Data Platform & EC Platform
Software
◦
Read more
0
Save
Share
Embed
Embed presentation
Download
Download to read offline
1
/ 51
2
/ 51
3
/ 51
4
/ 51
5
/ 51
6
/ 51
7
/ 51
8
/ 51
9
/ 51
10
/ 51
11
/ 51
12
/ 51
13
/ 51
14
/ 51
15
/ 51
16
/ 51
17
/ 51
18
/ 51
19
/ 51
20
/ 51
21
/ 51
22
/ 51
23
/ 51
24
/ 51
25
/ 51
26
/ 51
27
/ 51
28
/ 51
29
/ 51
30
/ 51
31
/ 51
32
/ 51
33
/ 51
34
/ 51
35
/ 51
36
/ 51
37
/ 51
38
/ 51
39
/ 51
40
/ 51
41
/ 51
42
/ 51
43
/ 51
44
/ 51
45
/ 51
46
/ 51
47
/ 51
48
/ 51
49
/ 51
50
/ 51
51
/ 51
More Related Content
PPTX
Minitabへようこそ 製造向け
by
KOZO KEIKAKU ENGINEERING Inc., Minitab
PDF
全社のデータ活用を一段階上げる取り組み
by
株式会社MonotaRO Tech Team
PPTX
[自己PR]12/23 エンジニア"1on1"面談会
by
Toshi Matsumoto
PDF
データ管理に重要なことは事業と組織の理解だった(Data Engineering Study #11 発表資料)
by
株式会社MonotaRO Tech Team
PPTX
モバイルゲームのためのデータ分析
by
AtsushiTakada1
PDF
MonotaRO のデータ活用と基盤の過去、現在、未来
by
株式会社MonotaRO Tech Team
PPTX
3ヶ月で50%の社員が利用するツールに
by
KOTARO TAKAHASHI
PDF
モノタロウの開発・リリースサイクルを支えるJenkinsの活用事例 - Jenkins Day Japan 2021
by
株式会社MonotaRO Tech Team
Minitabへようこそ 製造向け
by
KOZO KEIKAKU ENGINEERING Inc., Minitab
全社のデータ活用を一段階上げる取り組み
by
株式会社MonotaRO Tech Team
[自己PR]12/23 エンジニア"1on1"面談会
by
Toshi Matsumoto
データ管理に重要なことは事業と組織の理解だった(Data Engineering Study #11 発表資料)
by
株式会社MonotaRO Tech Team
モバイルゲームのためのデータ分析
by
AtsushiTakada1
MonotaRO のデータ活用と基盤の過去、現在、未来
by
株式会社MonotaRO Tech Team
3ヶ月で50%の社員が利用するツールに
by
KOTARO TAKAHASHI
モノタロウの開発・リリースサイクルを支えるJenkinsの活用事例 - Jenkins Day Japan 2021
by
株式会社MonotaRO Tech Team
What's hot
PDF
オープンセミナー岡山 これから始めるデータ活用
by
syou6162
PPTX
【Zeal】azure + power biで始めるbigdata分析の第一歩 20171115版 公開用
by
yuuki takizawa
PDF
データ基盤グループを支えるチームビルディング
by
株式会社MonotaRO Tech Team
PPTX
ビジネスに役立つデータ分析
by
Issei Kurahashi
PDF
正確な意思決定を阻む 問題・障害との向き合い方
by
syou6162
PDF
マルチクラウドで実演するカスタマーセントリックな分析基盤
by
Recruit Lifestyle Co., Ltd.
PPTX
Glue DataBrewでデータをクリーニング、加工してみよう
by
takeshi suto
PPTX
サービス×現場
by
真一 牛島
PDF
D1-2-S07 オンプレミスのデータウェアハウス基盤を BigQuery へ
by
Hideaki Tokida
PDF
アプリを成長させるためのログ取りとログ解析に必要なこと
by
Takao Sumitomo
PDF
モノタロウの商品データ連携について
by
株式会社MonotaRO Tech Team
PDF
Tableau Desktop データ準備の新機能: ユニオン、ピボット、データインタープリタ、など
by
Ryusuke Ashiya
PDF
モノタロウを支える Solr による商品検索システム
by
株式会社MonotaRO Tech Team
PPTX
Saga Smart Center: データ分析の基礎
by
Daiyu Hatakeyama
PDF
マイクロアドのデータ基盤について アドテクを支える基盤〜10Tバイト/日のビッグデータを処理する〜
by
MicroAd, Inc.(Engineer)
PDF
運用してわかったLookerの本質的メリット : Data Engineering Study #8
by
Masatoshi Abe
PPTX
データウェアハウス・BI の再構築から見る情報系基盤の再構築ポイント
by
UNIRITA Incorporated
PDF
楽天のデータサイエンス/AIによるビッグデータ活用
by
Rakuten Group, Inc.
PPTX
サイエンス視点からのデータアーキテクト
by
Masaharu Horino
PDF
楽天におけるビッグデータを対象としたデータサイエンス&AIの最新応用事例
by
Rakuten Group, Inc.
オープンセミナー岡山 これから始めるデータ活用
by
syou6162
【Zeal】azure + power biで始めるbigdata分析の第一歩 20171115版 公開用
by
yuuki takizawa
データ基盤グループを支えるチームビルディング
by
株式会社MonotaRO Tech Team
ビジネスに役立つデータ分析
by
Issei Kurahashi
正確な意思決定を阻む 問題・障害との向き合い方
by
syou6162
マルチクラウドで実演するカスタマーセントリックな分析基盤
by
Recruit Lifestyle Co., Ltd.
Glue DataBrewでデータをクリーニング、加工してみよう
by
takeshi suto
サービス×現場
by
真一 牛島
D1-2-S07 オンプレミスのデータウェアハウス基盤を BigQuery へ
by
Hideaki Tokida
アプリを成長させるためのログ取りとログ解析に必要なこと
by
Takao Sumitomo
モノタロウの商品データ連携について
by
株式会社MonotaRO Tech Team
Tableau Desktop データ準備の新機能: ユニオン、ピボット、データインタープリタ、など
by
Ryusuke Ashiya
モノタロウを支える Solr による商品検索システム
by
株式会社MonotaRO Tech Team
Saga Smart Center: データ分析の基礎
by
Daiyu Hatakeyama
マイクロアドのデータ基盤について アドテクを支える基盤〜10Tバイト/日のビッグデータを処理する〜
by
MicroAd, Inc.(Engineer)
運用してわかったLookerの本質的メリット : Data Engineering Study #8
by
Masatoshi Abe
データウェアハウス・BI の再構築から見る情報系基盤の再構築ポイント
by
UNIRITA Incorporated
楽天のデータサイエンス/AIによるビッグデータ活用
by
Rakuten Group, Inc.
サイエンス視点からのデータアーキテクト
by
Masaharu Horino
楽天におけるビッグデータを対象としたデータサイエンス&AIの最新応用事例
by
Rakuten Group, Inc.
Similar to 20200630 Monotaro Data Platform & EC Platform
PDF
モノタロウ AIストアのひみつ #devsumiA
by
株式会社MonotaRO Tech Team
PDF
[ITmedia Cloud Native 2023] モノタロウのクラウドネイティブ.pdf
by
株式会社MonotaRO Tech Team
PDF
MonotaROが向かうクラウド活用の今後 2016-04-21 関西スタートアップAWS勉強会
by
株式会社MonotaRO Tech Team
PPTX
尼崎から世界へ!モノタロウの海外展開を支えるDevOps基盤 (デブサミ関西2016)
by
株式会社MonotaRO Tech Team
PDF
20240522 Findy Event ビジネスの構造をアーキテクチャに落とし込みソフトウェアに可変性を注入する.pdf
by
株式会社MonotaRO Tech Team
PDF
202106 AWS Black Belt Online Seminar 小売現場のデータを素早くビジネス に活用するAWSデータ基盤
by
Amazon Web Services Japan
PPTX
データフィードマーケティング概要
by
Go Sugihara
PDF
Bigdata_conference_2014_autumn_20140903_nishikawa_presentation
by
Shinji Nishikawa
PDF
マーケティング・マネージメント part3
by
shotamura
PDF
ドメイン駆動設計と要求開発
by
Kent Ishizawa
PDF
20171030 #miyagisap
by
Masahiro Furusawa
モノタロウ AIストアのひみつ #devsumiA
by
株式会社MonotaRO Tech Team
[ITmedia Cloud Native 2023] モノタロウのクラウドネイティブ.pdf
by
株式会社MonotaRO Tech Team
MonotaROが向かうクラウド活用の今後 2016-04-21 関西スタートアップAWS勉強会
by
株式会社MonotaRO Tech Team
尼崎から世界へ!モノタロウの海外展開を支えるDevOps基盤 (デブサミ関西2016)
by
株式会社MonotaRO Tech Team
20240522 Findy Event ビジネスの構造をアーキテクチャに落とし込みソフトウェアに可変性を注入する.pdf
by
株式会社MonotaRO Tech Team
202106 AWS Black Belt Online Seminar 小売現場のデータを素早くビジネス に活用するAWSデータ基盤
by
Amazon Web Services Japan
データフィードマーケティング概要
by
Go Sugihara
Bigdata_conference_2014_autumn_20140903_nishikawa_presentation
by
Shinji Nishikawa
マーケティング・マネージメント part3
by
shotamura
ドメイン駆動設計と要求開発
by
Kent Ishizawa
20171030 #miyagisap
by
Masahiro Furusawa
20200630 Monotaro Data Platform & EC Platform
1.
https://www.monotaro.co モノタロウのクラウド活用 データ基盤とECプラットフォーム 2020/6/30 株式会社MonotaRO 1
2.
https://www.monotaro.co 2020.2.13 自己紹介 2
3.
https://www.monotaro.co 2020.2.13 目次 3 ●モノタロウのご紹介 ●データマーケティングを支えるデータ基盤 ●ECサイトを支えるシステムのリアーキテクチ ャリング ●まとめ
4.
https://www.monotaro.co 2020.2.13 4
5.
https://www.monotaro.co 2020.2.13 5 間接資材とは 工具・消耗品 事務用品 科学用品 カー用品 原材料以外は、間接資材
6.
https://www.monotaro.co 2020.2.13 6 間接資材購買 –
モノタロウ以前 人的コスト時間がかかる 商品がほしい 複数・多種な 営業に連絡 見積 価格交渉 発注 納期確定 納品 いくら?? いつ届くの!?
7.
https://www.monotaro.co 2020.2.13 7 間接資材購買 –
モノタロウ以後 商品がほしい 翌日届く すぐ届く価格交渉なし 購買に関わるコストを大きく下げる
8.
https://www.monotaro.co 2020.2.13 企業における間接資材の調達プロセスをテクノロジーとデ ータで圧倒的に簡単にする モノタロウの提供している価値 One Price One Stop Easy to Buy 価格透明性がある 必要なもの全部ある
すぐ見つかる、買える 8
9.
https://www.monotaro.co 2020.2.13 9 20%以上成長を10年継続 ・データマーケティングが成長を牽引 ・システムは常にキャパシティとの戦いでもある 2019年 1,200億円を突破
10.
https://www.monotaro.co 2020.2.13 あらゆる顧客接点をデータを活用して最適化していく モノタロウのデータマーケティング 10 SEO/SEM プッシュ型マーケティング 検索 リコメンド 業種別最適化 パーソナライズ 特価・クーポン施策 誰に 何を いつ どのくらい
11.
https://www.monotaro.co 2020.2.13 11 例1:ユーザの業種で検索の表 示順を最適化する 検索最適化のほんの一例 例2:商品のマスタにない専門ワード、 業界用語も検索可能にする 医療系ユーザ 製造業ユーザ ・データ、アルゴリズムによって検索の顧客体験の最適化を行う ・しかし商品数は1800万SKUあるため、手動でのチューニングは不可能 ・それをエンジニアリングによって自動化・仕組化していくことが重要
12.
https://www.monotaro.co 2020.2.13 AI無人店舗 12 エンジニアリングドリブンなカルチャー 自動倉庫 ピッキング
13.
https://www.monotaro.co 2020.2.13 https://www.monotaro.co モノタロウのデータマーケティングを 支えるデータ基盤 13
14.
https://www.monotaro.co 2020.2.13 旧データ基盤(〜2017)の問題点 ● データ保存場所が分散 →
データ移動が大変 ● オンプレデータ基盤のサーバスペックが足りない ● 分析に必要なデータが揃っていない データが集約されていて、スケールできて、使いやすく、 管理しやすく、コストも安いデータ基盤がほしい! 14
15.
https://www.monotaro.co 2020.2.13 15 扱えるデータ量 作成されたレポート数
SQL 業務利用者人数 10× 10× 5× ~ 100 テーブル 1000 テーブル~ ~ 30 レポート 300 レポート~ ~ 10 人 50 人~ ( IT エンジニア以外 ) データ基盤導入の成果
16.
https://www.monotaro.co 2020.2.13 1. 全ての必要なデータを1箇所に集約 2. CDC(Change
Data Capture)による安定し たデータ連携 3. 業務担当者(非エンジニア)によるSQLデータ 分析の浸透 16 データ基盤が活用されたポイント
17.
https://www.monotaro.co 2020.2.13 その1 あらゆるデータを1箇所に集めた 17 データ基盤が活用されたポイント
18.
https://www.monotaro.co 2020.2.13 18 BigQuery Export Binlog Connector Raw Data DWH EC
Site Application Data Source ETL DWH/DataMart Application Kinesis Lambda Cloud Dataproc BigQuery Compute Engine
19.
https://www.monotaro.co 2020.2.13 BigQueryの利用 ●フルマネージド ●シンプル ●圧倒的スケーラビリティ ● GSuite 連携
(アカウントの準備とか不要) ● Google Analytics 連携 (Google Marketing Platform) 19 BigQuery
20.
https://www.monotaro.co 2020.2.13 その2 CDC(Change Data Capture)による安定した データ連携 20 データ基盤が活用されたポイント
21.
https://www.monotaro.co 2020.2.13 CDCによるデータ連携 ● データの変更情報のみを取得、処理を行うCDC (Change Data
Caputure)を行い、擬似的にSlaveDB作成 ● マスターのDBに負荷をかけず、安定してデータを連携で きた ● メインとなる基幹のDB(MySQL)でBinLog Connectorを利 用して実現している 21
22.
https://www.monotaro.co 2020.2.13 22 Cloud Pub/Sub 基幹システム, EC
サイト MySQL Binlog Connector MySQL BigQuery Binlog Connector MySQL Binlog Connector Schematizer App Engine Processor Compute Engine Bookkeeper Compute Engine DDL DML Schema Schema Merge JobSchema Updates Row Data BinLog Connectorの仕組み
23.
https://www.monotaro.co 2020.2.13 ● データ基盤に出来るだけリアルタイムに近いデータ利用 のニーズがあった。 ● 従来の方法(mysqldump
や select 結果を同期) だと物理 削除に対応できないケースがある ● 従来の方法だと差分更新できないケースがある ○ 更新時間の値が信用できない ○ 更新されたレコードを把握するためのクエリが負荷が高い 23 BinLog Connectorを使った理由
24.
https://www.monotaro.co 2020.2.13 その3 業務担当者(非エンジニア)によるSQLデータ分析 24 データ活用が社内で浸透した3つのポイント
25.
https://www.monotaro.co 2020.2.13 ●もともと業務担当者にニーズがあった ●分析依頼を行なっているとスピードが遅い ●業務担当者が直接クエリを流せれば的確な分析 ができる ●BiqQueryの場合、同時実行クエリの増加によ る遅延がおきづらいという利点もあった 25 なぜ非エンジニアにDB基盤を解放したか
26.
https://www.monotaro.co 2020.2.13 ●定期的なSQL/BigQuery/DataStudio 研修 ●もともとデータ分析を行う社風 ●SlackのHelpチャネルでQAを色々な 人が行う文化 26 どうやってSQLを組織的に学んだのか
27.
https://www.monotaro.co 2020.2.13 データ活用現状 27 ❏ マーケター ❏ マーチャンダイザー ❏
カスタマーサポート ❏ 物流 ❏ セールス (全ての部門で利用) レポート 作成 分析(SQL) データソース として利用 業務アプリケ ーション 参照 or ダウンロード ❏全社的に利用 ❏全社的に利用 (ユーザ数は全社員の約30 %)
28.
https://www.monotaro.co 2020.2.13 IAM管理 ● あらゆるデータを基盤上に持ってきたが秘匿データは適切な人にだ け見るようにする →マスキングとAuthorized
View コスト管理 ● あらゆる人にアドホックなクエリを許可している →ハイコストなクエリをリアルタイムで検知 ● 全体の利用状況は把握できるようにしたい →GCP Censusで利用状況を可視化/チェック 28 データ基盤運用での管理ポイント
29.
https://www.monotaro.co 2020.2.13 29 さらにECアプリケーションでの活用 EC App
DWH BigQuery Application(API) GKEApplication Cloud Bigtable パーソナライズ化したデータをAPIを通してECのアプリケ ーションで利用可能にした データサイエンテ ィストがパーソナ ライズを生成
30.
https://www.monotaro.co 2020.2.13 ・データ基盤が整い活用も進んだ。これをより広げ全ての顧 客接点での活用をより素早くできるようにしたい。 ・より高度な顧客接点での最適化 - パーソナライズの拡充と リアルタイム化を実現したい →そのためには現状のECアプリケーションをリアーキテクチ ャリングする必要がある 30 ECアプリケーション刷新の必要性の高まり
31.
https://www.monotaro.co 2020.2.13 https://www.monotaro.co これからのECサイトの成長を支える システムのリアーキテクチャリング 31
32.
https://www.monotaro.co 2020.2.13 https://www.monotaro.com/ セッション数: 数千万/月 注文数: 数十万/月 32 モノタロウ
ECサイトとは
33.
https://www.monotaro.co 2020.2.13 モノタロウ ECサイトの構成要素 33 ● トップページ ●
商品ページ ● 検索 ● カート ● マイページ ● お気に入り ● 商品レビュー etc. 在庫 商品 価格 注文顧客キャン ペーン レビュー 請求 出荷 問い合 わせ 倉庫 カート 納期
34.
https://www.monotaro.co 2020.2.13 ECサイトを取り巻く状況 34 セキュリティ ● Chrome SameSite ●
Apple iTP2.1 システム関係 ● 既存コードのリファクタリング ● APIエンドポイント・リクエスト数増加 ● リアルタイムマーケティング施策増 ファーストパーティー のデータ活用 スケーラビリティと アジリティの両立
35.
https://www.monotaro.co 2020.2.13 モノタロウのマーケティング 35 様々なデータを活用して ● SEM/リスティング広告 ● 業種別リコメンド ●
検索結果最適化 ● キャンペーン・特価 ● プッシュマーケティング などをリアルタイムに最適化していきたい Life Time Value
36.
https://www.monotaro.co 2020.2.13 36 現在のシステムの全体像 EC システム 基幹システム MySQL
MySQL MySQL マーケティング システム BigQuery App Engine Cloud Bigtable Application Application Application Application Application Application Web API
37.
https://www.monotaro.co 2020.2.13 データ活用に適したアーキテクチャへ 37 ● 非対称なマルチクラウド ○ AWSにECサイト ○
GCPにデータ基盤 ○ オンプレに基幹システム ● ReadModel、更新頻度のばらつき ● DBスキーマ ● フロントエンド ● マーケターのダッシュボード
38.
https://www.monotaro.co 2020.2.13 REST API化は進んだが問題も出てきた ● エンドポイント増加 ●
コール数増加/依存の複雑化 ● ロジックの属人化 ● DBのスケーラビリティ ● 検索インデックスへの負荷集中 ● データモデルのばらつき データ活用に適したアーキテクチャへ 38
39.
https://www.monotaro.co 2020.2.13 39 目指すシステムの全体像 Data Platform BigQuery Cloud Bigtable
API Platform Kubernetes Engine API Gateway Real-Time Data Pipeline Cloud Pub/Sub Cloud Dataflow Cloud Bigtable Cloud Pub/Sub Applications Kubernetes Engine App Engine サブシステム群 EC アプリケーション Database DatabaseCDC Application Application オーダーマネジメントシステム DatabaseDatabaseConnector Application 商品情報管理システム DatabaseDatabaseConnector Application マーケティングシステム DatabaseDatabaseConnector Application その他サブシステム DatabaseDatabaseConnector Application
40.
https://www.monotaro.co 2020.2.13 データ活用に適したアーキテクチャへ 40 例: リコメンド、パーソナライズ ● リリースが容易でスケーラブルなAPI ●
常に最新のデータが反映されたストレージ ● 持続的な成長を支えるインフラ -> システムとデータ基盤が共通のアーキテクチャに
41.
https://www.monotaro.co 2020.2.13 既存API群のMicroservice化 41 サイトでのデータ活用とスケーリングのため One database per
Microservice化 Monolithic DB Web App Web App Web API Web App Web App Web API Microservice Microservice Microservice
42.
https://www.monotaro.co 2020.2.13 巨大バッチのEvent-Driven化 42 購入、出荷などUXに関わるイベントでビューを逐次更新し たい。マーケティングもリアルタイム化したい。 購入 逐次処理 出荷 マイページ 逐次処理
43.
https://www.monotaro.co 2020.2.13 システムへのChange Data Captureの活用 43 データ基盤同様、MySQLのbinlogのイベントを使う サブシステム MySQL サブシステム MySQL サブシステム MySQL Table Table Table Cloud Bigtable Cloud Pub/Sub binlogを使ってテ ーブルをそのまま レプリケート Microservice (詳細は”binlog
stream”でggってみましょう)
44.
https://www.monotaro.co 2020.2.13 CDCによるデータパイプライン 44 サブシステム MySQL サブシステム MySQL サブシステム MySQLCloud Pub/Sub Table Table Table Application 変更イベントごとにビ ューを更新 KVS データ パイプライン Cloud Dataflow Cloud Spanner 様々なデータで イベントをEnrich 常に最新 のデータ Cloud Bigtable
45.
https://www.monotaro.co 2020.2.13 リアーキテクチャリングと技術スタック 45 データ基盤のスタック ECサイトのスタック 漸進的にギャップを埋める ->
リアーキテクチャリング Cloud Dataflow Cloud Pub/Sub Kubernetes Engine Cloud Bigtable
46.
https://www.monotaro.co 2020.2.13 運用のデータドリブン化 46 変化への柔軟な対応 ● ユーザー数・売上の伸び ● 新たな施策やトラフィックの変動 ●
A/Bテスト・カナリアリリース -> SLO/SLIによるデータドリブンな運用 BigQuery Kubernetes Engine
47.
https://www.monotaro.co 2020.2.13 47 目指すシステムの全体像 Data Platform BigQuery Cloud Bigtable
API Platform Kubernetes Engine API Gateway Real-Time Data Pipeline Cloud Pub/Sub Cloud Dataflow Cloud Bigtable Cloud Pub/Sub Applications Kubernetes Engine App Engine サブシステム群 EC アプリケーション Database DatabaseCDC Application Application オーダーマネジメントシステム DatabaseDatabaseConnector Application 商品情報管理システム DatabaseDatabaseConnector Application マーケティングシステム DatabaseDatabaseConnector Application その他サブシステム DatabaseDatabaseConnector Application
48.
https://www.monotaro.co 2020.2.13 ● データ基盤とシステムを(アーキテクチャ的に)統合 ● リファクタリング+リアーキテクチャリング ○
データ活用のためのMicroservice化 ○ データの価値を高めるイベントドリブン化 ● 変化に強いデータドリブンなインフラ ○ SRE 48 まとめ
49.
エンジニア募集中 本社(尼崎)/東京オフィス(赤坂)
50.
https://www.monotaro.co 2020.2.13 急成長するモノタロウと一緒に働いてみませんか? ● 自社開発・自社運用で、全社/全業務でITを駆使する テクノロジー企業です ● 本社は関西ですが、東京も開発の中心になるべく幅広い 職種を募集しています ○
ITエンジニア、データサイエンティスト、デジタルマ ーケター、プロダクトマネージャー ● 詳しくは https://recruit.monotaro.com/ 50
51.
https://www.monotaro.co 51
Editor's Notes
#2
https://docs.google.com/document/d/13iVw8Ie1Xx-rxbogPKrPZC79ov03BG3gTwz7c13IKoM/edit
#4
前提条件として技術概念の説明はいるかも CDCとは何かとか
#5
CMをみていただいたかたいるかもしれません。
#6
モノタロウは間接資材を主にECサイトで取り扱うのをメインの業務としている
#9
1800万SKU
#12
1800万商品あるので、この辺りを仕組みで解決している。 同じ手袋でも業種によって求めている商品は全然違う
#14
モノタロウのGCPの活用の最初の成功体験として データ基盤の活用事例を紹介。 ビジネス的にデータが大事と言っていた話を受けてその根拠として ちゃんとやっている感をだす。 またデータ活用は進んでいるが、これをさらに高度化したい。 アプリケーションのアーキテクチャにも連携するという後段の藤本さんのシステムアーキテクトの話につなげる。
#19
Webでの行動データの取得はGoogleAnalyticsを利用、BigQueryに連携しています。 詳細の行動データは別途自作の取得ツールも利用これもBigQueryに連携 サーバやアプリケーションのログデータも集約1日に1億行以上。1箇所に集約することとログに独自のリクエストIDを付与することで複数サーバの横断的な検索を可能にしている 一部のOracleDBにあるものはDigDag embulk を通してBIgQueryni入れている 中心となる基幹DBがMySQLでこれはBinglog ConnectorでリアルタイムキャプチアリングしてBigQueryに送っている 必要となるデータを全てBiguQueryに集約しています。 またDataLake的に集めたものにさらにデータをデータサイエンティストエンジニアが加工してDWH/DataMartを形成しています 一部はComputeEngine/ BIとして分析データ
#22
CDCによるメリットとは? システムの動作が安定していている。 カラムの変更の追従できる マスターに負荷をかけない。
#23
MySQLの変更情報、Binary Log のイベントデータををBinlogConnectorというプロセスが監視。変更イベントを受け取るとそれをGCP上のCloud pub sub に通知、イベントデータをprocessorプロセスと呼ばれるプロセスがRowDataに変換してBigQueryにInsertをかけます。 DDLやAlterといったデータベースのスキーマの変更も、割と発生すると思いますが、その場合は、その情報をSchematizerに送信します。 SchematimzeがBiqQueryのSchemaをUpdateするということでBigQueryのスキーマをMySQLを自動追従できるようにしています。
#24
運用コストが少ない
#29
専門用語なし
#30
データサイエンティストやエンジニアがさまざなデータを作っている BigTableにデータにデータをインサート GKE上のApp Engineを介して
#33
聞いてほしい人のスキル感 Webエンジニア データエンジニア アプリエンジニア SRE セキュリティ、DBAは今回はあまり触れない
#34
だくさんのドメインがあり、データ更新の主体も時間軸もまちまち。
#35
高度化するマーケティングに対応するにはリファクタリングは必要。APIのコール数が増えるだけでなく、シスエム同士が密結合になってしまう。
#36
最適化するのはコストやコンバージョン。LTV向上につながる。
#37
一つのものを見てはいるがスケーラブルでない。それぞれがバラバラに改善していっている。スター型
#38
S3からコピーしたりレプリカを作ったりのコストが大きい同じデータを見ていてもモデルや更新頻度の違いで結果にばらつきが出る
#39
売り上げ・アクセスの伸び、マーケ施策の増加が複雑化を加速してしまう。アプリの複雑化はリニアではない。 APIのロジックが複雑化するほどダッシュボードから乖離
#40
本来ECのデータの流れには複数のスケールでサイクルがあり、それをアーキテクチャに落とし込む。スパイラル型
#41
自社リコメンドの改善。アルゴリズム変えていきたいね。 共通のアーキテクチャにすることでデータモデルや更新頻度が共通化されて使いやすくなるね
#42
やりたいことベースでMicroserviceこうあるべき論
#43
イベントドリブンによって最近買った商品が出たり出荷が早くなったり
#44
CDC+Microserviceデータ基盤で実績のあるCDC(Change Data Capture)を利用したデータパイプラインをバックエンドとしたMicroservice
#45
さらに進んでCDC+Microservice+データパイプライン 巨大バッチからの脱却、MLとの融合
#46
さらっとこんなの使ってます。みんな使ってるよねくらいで。
#47
伸びを支えるにはMeasurableなインフラが必要
#48
そこまでやればこれが実現できると考えている。
#49
そもものを統合するというよりは、アーキテクチャを揃えることで時系列やモデルが合うようにしていくいろんなレベルでスケーラブルに。
Download