Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
syou6162
PDF, PPTX
3,096 views
正確な意思決定を阻む 問題・障害との向き合い方
Data Engineering Study #4「データ分析基盤の障害対応事例LT祭り」 での登壇資料です
Technology
◦
Read more
2
Save
Share
Embed
Embed presentation
Download
Download as PDF, PPTX
1
/ 12
2
/ 12
3
/ 12
4
/ 12
5
/ 12
6
/ 12
7
/ 12
8
/ 12
9
/ 12
10
/ 12
11
/ 12
12
/ 12
More Related Content
PDF
オープンセミナー岡山 これから始めるデータ活用
by
syou6162
PPTX
モバイルゲームのためのデータ分析
by
AtsushiTakada1
PDF
カスタマーサクセスのためのデータ整備人の活動記録
by
syou6162
PDF
Tableau Desktop データ準備の新機能: ユニオン、ピボット、データインタープリタ、など
by
Ryusuke Ashiya
PDF
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
by
Techon Organization
PDF
MonotaRO のデータ活用と基盤の過去、現在、未来
by
株式会社MonotaRO Tech Team
PPTX
Glue DataBrewでデータをクリーニング、加工してみよう
by
takeshi suto
PPTX
Minitabへようこそ 製造向け
by
KOZO KEIKAKU ENGINEERING Inc., Minitab
オープンセミナー岡山 これから始めるデータ活用
by
syou6162
モバイルゲームのためのデータ分析
by
AtsushiTakada1
カスタマーサクセスのためのデータ整備人の活動記録
by
syou6162
Tableau Desktop データ準備の新機能: ユニオン、ピボット、データインタープリタ、など
by
Ryusuke Ashiya
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
by
Techon Organization
MonotaRO のデータ活用と基盤の過去、現在、未来
by
株式会社MonotaRO Tech Team
Glue DataBrewでデータをクリーニング、加工してみよう
by
takeshi suto
Minitabへようこそ 製造向け
by
KOZO KEIKAKU ENGINEERING Inc., Minitab
What's hot
PDF
データ管理に重要なことは事業と組織の理解だった(Data Engineering Study #11 発表資料)
by
株式会社MonotaRO Tech Team
PPTX
20200630 Monotaro Data Platform & EC Platform
by
Taisuke Fukawa
PDF
マルチクラウドで実演するカスタマーセントリックな分析基盤
by
Recruit Lifestyle Co., Ltd.
PPTX
ビジネスに役立つデータ分析
by
Issei Kurahashi
PDF
データエンジニアとデータアナリストを兼任して良かったこと
by
Masatoshi Ida
PDF
データ分析を支える技術 データ分析基盤再入門
by
Satoru Ishikawa
PPTX
[自己PR]12/23 エンジニア"1on1"面談会
by
Toshi Matsumoto
PDF
全社のデータ活用を一段階上げる取り組み
by
株式会社MonotaRO Tech Team
PDF
プロトタイプで終わらせない死の谷を超える機械学習プロジェクトの進め方 #MLCT4
by
shakezo
PDF
既存Redshift/ETLからSpectrum/Glueへの移行を徹底解明!
by
Recruit Lifestyle Co., Ltd.
PDF
「HOME'Sデータセット」提供開始の背景 〜産学間データ共有の課題〜
by
Yoji Kiyota
PDF
データサイエンス業務と「ツール」
by
The Japan DataScientist Society
PDF
ビッグデータはどこまで効率化できるか?
by
Shohei Hido
PPTX
【Zeal】azure + power biで始めるbigdata分析の第一歩 20171115版 公開用
by
yuuki takizawa
PPTX
キャリアコンサルタント向け「企業で求められるITスキルの実態」と実践スキル向上研修
by
Daiyu Hatakeyama
PPTX
データウェアハウス・BI の再構築から見る情報系基盤の再構築ポイント
by
UNIRITA Incorporated
PDF
リクルートライフスタイル流!分析基盤との賢い付き合い方
by
Recruit Lifestyle Co., Ltd.
PDF
データウェアハウスモデリング入門(ダイジェスト版)(事前公開版)
by
Satoshi Nagayasu
PPTX
Saga Smart Center: データ分析の基礎
by
Daiyu Hatakeyama
PDF
Machine Learning Casual Talks #4 ビッグデータチームを発足するにあたって気をつけておきたいn個のこと
by
Naoto Tamiya
データ管理に重要なことは事業と組織の理解だった(Data Engineering Study #11 発表資料)
by
株式会社MonotaRO Tech Team
20200630 Monotaro Data Platform & EC Platform
by
Taisuke Fukawa
マルチクラウドで実演するカスタマーセントリックな分析基盤
by
Recruit Lifestyle Co., Ltd.
ビジネスに役立つデータ分析
by
Issei Kurahashi
データエンジニアとデータアナリストを兼任して良かったこと
by
Masatoshi Ida
データ分析を支える技術 データ分析基盤再入門
by
Satoru Ishikawa
[自己PR]12/23 エンジニア"1on1"面談会
by
Toshi Matsumoto
全社のデータ活用を一段階上げる取り組み
by
株式会社MonotaRO Tech Team
プロトタイプで終わらせない死の谷を超える機械学習プロジェクトの進め方 #MLCT4
by
shakezo
既存Redshift/ETLからSpectrum/Glueへの移行を徹底解明!
by
Recruit Lifestyle Co., Ltd.
「HOME'Sデータセット」提供開始の背景 〜産学間データ共有の課題〜
by
Yoji Kiyota
データサイエンス業務と「ツール」
by
The Japan DataScientist Society
ビッグデータはどこまで効率化できるか?
by
Shohei Hido
【Zeal】azure + power biで始めるbigdata分析の第一歩 20171115版 公開用
by
yuuki takizawa
キャリアコンサルタント向け「企業で求められるITスキルの実態」と実践スキル向上研修
by
Daiyu Hatakeyama
データウェアハウス・BI の再構築から見る情報系基盤の再構築ポイント
by
UNIRITA Incorporated
リクルートライフスタイル流!分析基盤との賢い付き合い方
by
Recruit Lifestyle Co., Ltd.
データウェアハウスモデリング入門(ダイジェスト版)(事前公開版)
by
Satoshi Nagayasu
Saga Smart Center: データ分析の基礎
by
Daiyu Hatakeyama
Machine Learning Casual Talks #4 ビッグデータチームを発足するにあたって気をつけておきたいn個のこと
by
Naoto Tamiya
More from syou6162
PDF
自分の目的に合った統計量と そのバラ付きを計算しよう ~NPSを例に~(統計学勉強会)
by
syou6162
PDF
Mackerel Drink Up #9 ロール内異常検知の正式化
by
syou6162
PDF
Mackerelのロール内異常検知の設計と運用
by
syou6162
PDF
教師なし学習によるMackerelの異常検知機能について〜設計/運用/評価の観点から〜
by
syou6162
PDF
機械学習を活用したサービスにおける工夫紹介
by
syou6162
PDF
機械学習を使った趣味サービスにおける工夫紹介
by
syou6162
PDF
今日から始める機械学習〜はてなの事例〜
by
syou6162
PDF
機械学習を用いたMackerelの異常検知機能について
by
syou6162
PDF
Mackerel Anomaly Detection at PyCon mini Osaka
by
syou6162
PDF
はてなにおける機械学習の取り組み
by
syou6162
PDF
はてなにおける機械学習の取り組み
by
syou6162
PDF
異常検知ナイト LT登壇資料 はてな id:syou6162
by
syou6162
PDF
Duolingo.pptx
by
syou6162
PDF
今日からできる構造学習(主に構造化パーセプトロンについて)
by
syou6162
PDF
Kernel20110619
by
syou6162
PDF
Optimization In R
by
syou6162
PDF
Syou6162 Dbcls
by
syou6162
PDF
半教師あり学習
by
syou6162
PDF
R User Group 2009 Yoshida
by
syou6162
PDF
Tsukuba
by
syou6162
自分の目的に合った統計量と そのバラ付きを計算しよう ~NPSを例に~(統計学勉強会)
by
syou6162
Mackerel Drink Up #9 ロール内異常検知の正式化
by
syou6162
Mackerelのロール内異常検知の設計と運用
by
syou6162
教師なし学習によるMackerelの異常検知機能について〜設計/運用/評価の観点から〜
by
syou6162
機械学習を活用したサービスにおける工夫紹介
by
syou6162
機械学習を使った趣味サービスにおける工夫紹介
by
syou6162
今日から始める機械学習〜はてなの事例〜
by
syou6162
機械学習を用いたMackerelの異常検知機能について
by
syou6162
Mackerel Anomaly Detection at PyCon mini Osaka
by
syou6162
はてなにおける機械学習の取り組み
by
syou6162
はてなにおける機械学習の取り組み
by
syou6162
異常検知ナイト LT登壇資料 はてな id:syou6162
by
syou6162
Duolingo.pptx
by
syou6162
今日からできる構造学習(主に構造化パーセプトロンについて)
by
syou6162
Kernel20110619
by
syou6162
Optimization In R
by
syou6162
Syou6162 Dbcls
by
syou6162
半教師あり学習
by
syou6162
R User Group 2009 Yoshida
by
syou6162
Tsukuba
by
syou6162
Recently uploaded
PDF
Reiwa 7 IT Strategist Afternoon I Question-1 3C Analysis
by
akipii ogaoga
PDF
Reiwa 7 IT Strategist Afternoon I Question-1 Ansoff's Growth Vector
by
akipii ogaoga
PDF
さくらインターネットの今 法林リージョン:さくらのAIとか GPUとかイベントとか 〜2026年もバク進します!〜
by
法林浩之
PDF
第21回 Gen AI 勉強会「NotebookLMで60ページ超の スライドを作成してみた」
by
嶋 是一 (Yoshikazu SHIMA)
PDF
Starlink Direct-to-Cell (D2C) 技術の概要と将来の展望
by
CRI Japan, Inc.
PDF
100年後の知財業界-生成AIスライドアドリブプレゼン イーパテントYouTube配信
by
e-Patent Co., Ltd.
PDF
Drupal Recipes 解説 .
by
iPride Co., Ltd.
PPTX
ddevについて .
by
iPride Co., Ltd.
PDF
2025→2026宙畑ゆく年くる年レポート_100社を超える企業アンケート総まとめ!!_企業まとめ_1229_3版
by
sorabatake
Reiwa 7 IT Strategist Afternoon I Question-1 3C Analysis
by
akipii ogaoga
Reiwa 7 IT Strategist Afternoon I Question-1 Ansoff's Growth Vector
by
akipii ogaoga
さくらインターネットの今 法林リージョン:さくらのAIとか GPUとかイベントとか 〜2026年もバク進します!〜
by
法林浩之
第21回 Gen AI 勉強会「NotebookLMで60ページ超の スライドを作成してみた」
by
嶋 是一 (Yoshikazu SHIMA)
Starlink Direct-to-Cell (D2C) 技術の概要と将来の展望
by
CRI Japan, Inc.
100年後の知財業界-生成AIスライドアドリブプレゼン イーパテントYouTube配信
by
e-Patent Co., Ltd.
Drupal Recipes 解説 .
by
iPride Co., Ltd.
ddevについて .
by
iPride Co., Ltd.
2025→2026宙畑ゆく年くる年レポート_100社を超える企業アンケート総まとめ!!_企業まとめ_1229_3版
by
sorabatake
正確な意思決定を阻む 問題・障害との向き合い方
1.
正確な意思決定を阻む 問題・障害との向き合い方 id:syou6162 2020/11/04 Data Engineering Study
#4「データ分析基盤の障害対応事例 LT祭り」 登壇資料
2.
自己紹介 ● 吉田 康久 ○
Twitterやはてなidは@syou6162 / id:syou6162 ● 前職: NTTコミュニケーション科学基礎研究所 ○ 自然言語処理や機械学習の研究に従事 ● 株式会社はてな ○ アプリケーションエンジニアとして入社 ○ はてなブックマーク ○ サーバー管理/監視システムMackerel ■ 教師なし学習による異常検知機能開発 ● 2020年2月よりMackerelチームのCRE (Customer Reliability Engineer) ○ 主にデータ基盤整備 / データ分析 2
3.
この発表での話題 ● 1: RDBMSでは担保できていた制約がデータ基盤に入れられなかったために集計の 差異が発生した例 ●
2: データマートで利用されていないリソースが氾濫、目的に不適合なデータを元に 意思決定されてしまった例 3 地味だけど、あるあるっぽい話題とそ の対応方法について話します !
4.
RDBMSでの制約 ● PRIMARY KEY制約やUNIQUE制約などで一意性の担保 ○
例: このカラムに同じメールアドレスが二個以上含まれることはない ● チェック制約による値の条件の制約 ○ 例: この機能のフラグがonにできるのは、有料プランのユーザーだけ ● アプリケーションのロジックでも担保されるが、RDBMSはデータを守る最後の砦 4
5.
制約が付けられないデータストア ● データに制約を付けられないデータストアもたくさんある ○ 例:
Salesforceやスプレッドシート ● 制約がないと困る例 ○ 同じ会社名が複数存在しまくると困る ■ 同名企業は存在し得る。とはいえ... ■ あまりに多いと入力時の確認ミスの可能性 ○ 商談が次のフェイズに移ったのに完了日が未記入 ■ リードタイムの計算ができない ■ 本来は入力必須の項目になっていて欲しい ○ ある月のある企業の売上が複数行に存在 ■ スプレッドシート上の手動オペレーション(コピペ)時のミス ● RDBMSが恋しくなるときもあるが、それぞれのデータストアのよさはある 5
6.
制約が付けられないと、問題・障害が時々起こる... ● 制約が付けられないデータストアをデータ基盤に転送していると、たまに問題が発生 する ○ 例「このダッシュボードで出てる売上、あっちの値より大きいの何で?」 ■
意図せぬスプレッドシートの行の重複があった ○ 例「株式会社XXXさん、ダッシュボードに出てこないの何で?」 ■ Salesforceのとあるカラムのステータスの変更漏れがあった ● 仕組み的にどうしようもない場合もあるが、少なくとも問題が起こったら早期に気付 きたい ○ 問題が発生してから発覚したのは1ヶ月後、だと調査も大変 6
7.
対策: 満たして欲しい制約と期待する結果をvalidation 7 定期的にCloud Schedulerで実行。 制約を満たしていなかったら、
Slackに通知。会社 ブログに詳しく書いてます 私「データの重複がありますね ...」 事務の方「データ直しておきます」 私「あれ、このカラムって必須のものではな い...?NULLが入ってきた」 事務の方「そういうユースケースがあるなら Salesforceで入力必須にしておきますね」
8.
データの民主化とデータマート ● データ基盤が使われだすようになると、データマートにテーブルやビューがたくさん 作られる ○ 基本的にはよいこと! ●
とはいえ、お試しで作ったものや一時的な調査のためのものも多数存在 8 データマート テーブルA 最終利用日: 2020/09 テーブルB 最終利用日: 2018/04 ビューC 最終利用日: 2020/07 テーブルD 最終利用日: 2019/01 テーブルE 最終利用日: 2020/10 ビューF 最終利用日: 2019/06
9.
使われていないリソースが氾濫すると... ● データ分析者 ○ よーし、この分析をしよう! ○
ゼロからSQL書くの面倒だな... ○ データマートに何かあった気がするぞ ○ それっぽい名前のものがあったからこれでダッシュボードにしてみよう ● データマートにあったのは実は調査用に作られたテーブル。集約の条件が目的と異 なるものであった... ○ 意思決定の目的に似わないデータによって、誤った意思決定がされてしまう ○ ある種の障害 9
10.
対策: データマートの定期的な掃除 ● 四半期に一度、利用頻度の低いテーブルやビューを削除する ●
以下の情報を元に削除対象を決定 ○ クエリが最後に発行されたのはいつか ○ クエリが最後に発行したのは誰か ○ クエリが何回発行されたか ● いきなり消えると困る場合もあるので、2週間後にexpireするように設定 ○ 必要な場合はexpireを自分で外してもらう ○ expire後に泣きつかれた場合(?)用に、viewならSQLを手元にバックアップ 10 GCP(BigQuery)ならAudit Logや INFORMATION_SCHEMAでメタ情報が取 れる!
11.
困り事: これ、本当に削除して大丈夫...? ● クエリ統計量だけ出されても、消して大丈夫か自信が持てない場合は多い ○
参照しているダッシュボードやviewは存在しない? あったら壊れそう... ● 安心して消せるように補助情報を出してあげる データリネージを元にどこで 使われているかさっと分かる。 ビューの目的がメタデータで分か る 11 このデータ(左側)がここで使われている (右側)とい う情報をデータリネージとして整備 依存元がなくなってビューが壊れたら slackに通知 してすぐに気付けるように 詳細はブログをご参照ください
12.
この発表のまとめ ● 1: RDBMSでは担保できていた制約がデータ基盤に入れられなかったために集計の 差異が発生した例 ●
2: データマートで利用されていないリソースが氾濫、目的に不適合なデータを元に 意思決定されてしまった例 12 地味ではあるけど、あるあるな事例だと思うので 参考になればうれしいです !
Download