Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

b→tech Lab. #1_takasu

12 views

Published on

b→tech Lab. #1 LT資料

Published in: Technology
  • Be the first to comment

  • Be the first to like this

b→tech Lab. #1_takasu

  1. 1. b→dashを支える 監視システム 2018/09/19 株式会社フロムスクラッチ 髙須公仁
  2. 2. 自己紹介 名前:髙須公仁 [2017年] 慶應義塾大学理工学部卒業 株式会社フロムスクラッチ 新卒入社(2年目) インフラエンジニア 趣味:合気道、登山
  3. 3. 監視システムの前提 課題
  4. 4. 監視システムの前提 課題 サーバーが多すぎて 管理しきれない問題
  5. 5. b→dashの全体像
  6. 6. b→dashの全体像 API ログ集計 SFTP アップ ロード DWH作成 レコメンド メール LINE レポート セグメント データ マート WEBサイト
  7. 7. b→dashの全体像 API ログ集計 SFTP アップ ロード DWH作成 レコメンド メール LINE レポート セグメント データ マート WEBサイト
  8. 8. b→dashの全体像 API ログ集計 SFTP アップ ロード DWH作成 レコメンド メール LINE レポート セグメント データ マート WEBサイト アプリケーションごとに サーバーを立てている
  9. 9. b→dashの全体像 API ログ集計 SFTP アップ ロード DWH作成 レコメンド メール LINE レポート セグメント データ マート WEBサイト アプリケーションごとに サーバーを立てている 安定化のための冗長化 処理速度改善の並列化
  10. 10. b→dashの全体像 API ログ集計 SFTP アップ ロード DWH作成 レコメンド メール LINE レポート セグメント データ マート WEBサイト 安定化のための冗長化 処理速度改善の並列化 アプリケーションごとに サーバーを立てている
  11. 11. b→dashの全体像 API ログ集計 SFTP アップ ロード DWH作成 レコメンド メール LINE レポート セグメント データ マート WEBサイト 安定化のための冗長化 処理速度改善の並列化 アプリケーションごとに サーバーを立てている 1000以上の サーバーが稼働している
  12. 12. 目的 インフラエンジニアの命題
  13. 13. 目的 インフラエンジニアの命題 安定稼働
  14. 14. b→dashの全体像 API ログ集計 SFTP アップ ロード DWH作成 レコメンド メール LINE レポート セグメント データ マート WEBサイト
  15. 15. b→dashの全体像 API ログ集計 SFTP アップ ロード DWH作成 レコメンド メール LINE レポート セグメント データ マート WEBサイト メモリ ディスク 生死 プロセス エラー
  16. 16. b→dashの全体像 API ログ集計 SFTP アップ ロード DWH作成 レコメンド メール LINE レポート セグメント データ マート WEBサイト 全部のサーバーの 稼働状況を見る
  17. 17. b→dashの全体像 API ログ集計 SFTP アップ ロード DWH作成 レコメンド メール LINE レポート セグメント データ マート WEBサイト ちょっと無理
  18. 18. 監視システムの紹介
  19. 19. 監視システム アプリケーション インフラ
  20. 20. 監視システム アプリケーション インフラ
  21. 21. アプリケーション ゴール アプリケーション エンジニアが 対処しやすい状態
  22. 22. アプリケーション 方針 すぐにエラーが 分かる
  23. 23. アプリケーション Slack
  24. 24. アプリケーション Slack エラーログは 全部Slackに
  25. 25. アプリケーション
  26. 26. アプリケーション Slack 構成 Filebeat Filebeat Filebeat Logstash Slack Slack
  27. 27. アプリケーション Filebeat • agent型 • Elasticsearch社のログ収集 ツール • 特徴は軽量性
  28. 28. アプリケーション Logstash • オープンソースのサーバー サイドデータ処理パイプライ ン • 様々なデータソースの入力 を変換・送信するツール • 特徴は、どんなデータも同 じフォーマットにまとめられ ること
  29. 29. アプリケーション Slack 構成 Filebeat Filebeat Filebeat Logstash Slack Slack
  30. 30. 監視システム アプリケーション インフラ
  31. 31. インフラ ゴール 稼働状況に応じて 先手を打って 対応できる状態
  32. 32. インフラ 方針 稼働状況を 楽に見る
  33. 33. インフラ Orangesys
  34. 34. インフラ • grafanaを利用した可視化メ トリクス可視化ツール • 様々なデータソースをダッ シュボード上に表示できる • 特徴は、様々なデータを一 元的に可視化できることOrangesys
  35. 35. インフラ Orangesys 数値は全部まとめて 見える化
  36. 36. インフラ
  37. 37. アプリケーション 構成 Oragesys telegraf influxDB Cloudwatch
  38. 38. インフラ • AWSのリソースモニタリ ングツール • 各サーバーのパフォーマ ンスの数値や利用率の 確認を行うことができる Cloudwatch
  39. 39. インフラ
  40. 40. インフラ
  41. 41. アプリケーション 構成 Oragesys telegraf influxDB Cloudwatch
  42. 42. インフラ • 時系列DB • jsonでデータ登録が可能 influxDB
  43. 43. インフラ • agent型 • influxDB専用のメトリクス コレクタ • プラグインアーキテク チャのため取得メトリク スを容易に追加できるtelegraf
  44. 44. インフラ shellで書くことができる
  45. 45. インフラ
  46. 46. インフラ
  47. 47. 監視システム アプリケーション インフラ
  48. 48. 監視システム すぐにエラーが分かる 稼働状況を楽に見る
  49. 49. 最後に 監視システムの大方針
  50. 50. 最後に 監視システムの大方針 いかに楽するか
  51. 51. 最後に 監視システムの大方針 いかに楽するか
  52. 52. 最後に 残課題 ・リソースの利用にぶれがある 分散処理の適正スケーリング ・取得数値を使っての自動ス ケーリング
  53. 53. ご清聴ありがとうございました

×