監視基盤
ZabbixとCloudWatch
BEELT : BEENOS LT会 #1 サービス基盤
自己紹介
▪ PN:九龍真乙
▪ Twitter: @qryuu
▪ SlideShre: https://www.slideshare.net/qryuu
▪ GitHub: https://github.com/qryuu
▪ クックパッド: https://cookpad.com/kitchen/4142562
▪ Youtube: https://www.youtube.com/channel/UCcPidyLCfGp49pmF4Zb761Q
▪ 専門:Zabbix, テクニカルサポート, クラウドアーキテクト
▪ 好きなサービス:SystemsManager、CloudWatch、RDS、Amplify Console
2
このLTは
Zabbix Advent Calendar 2018
の記事を元にしています。
https://qiita.com/qryuu/items/858e59ebafac589d6011
3
メトリクス収集
監視データの収集について
4
Zabbix
▪ クラウド
▪ オンプレミス
▪ ネットワーク機器(SNMP,SSH,Telnet)
▪ WEBサービス(HTTPエージェント)のデータ収集が可能
▪ テンプレートやユーザーマクロによって一元管理を行う事がで
きます。
5
CloudWatch
▪ CloudWatchは基盤監視としてCPU使用率、Networkトラフィック、
EBS I/O 等が監視出来ます。
▪ CloudWatchエージェントによりOS内部のメモリクスが監視出来
ます。
▪ CloudWatchエージェントによりオンプレミスのサーバも監視可
能です。
▪ 収集アイテムの設定はSystemsManagerのパラメータストアに
よって一元管理することが可能です。
6
ログ監視
7
Zabbix
▪ 正規表現を用いたキーワード一致でのログ監視が可能
▪ ログ本文を収集せずにlog.countアイテムを使うことで
キーワードの件数のみを収集することも可能
▪ タグ機能を利用することによって1つのログファイルからアプ
リ別の判定や障害・復旧判定が可能
8
CloudWatch
▪ CloudWatch Logsでキーワードの件数判定が可能
▪ CloudWatch Logs Insightsで時間毎のキーワード出現傾向が可視化
可能
9
メトリクス同士の計算
10
Zabbix
▪ 計算アイテム
▪ アグリゲーションアイテム
▪ 値の前処理
▪ 依存アイテム
▪ トリガーでの計算
▪ 複数のアイテムを組み合わせたり、値の換算を行って監視を行
うことが可能です。
▪ Forecast関数を使うことによって未来値の判定も可能です。
11
CloudWatch
▪ CloudWatch Metric Mathにより値同士を使った演算が可能です。
▪ Auto Scalingグループでの値集計が可能です。
▪ Amazon ML からCloudWatchへのメトリクス送信ができます。
– ただし、Amazon ML自体が現在新規停止中でSageMakerへの移行が推奨されて
いるので……
12
値の保存期間
13
Zabbix
▪ 保存期間を自由に設定可能
▪ Housekeeperが動作しても、値収集の遅延などはほとんど発生し
なくなっています。
14
CloudWatch
▪ 以前は14日間となっていましたが、現在は455 日 (15ヶ月)の
データが保存されるようになっています。
15
構築
16
Zabbix
▪ User Dataで2分で構築できます。
▪ Zabbix 4.0 対応 Amazon Linux / Amazon Linux 2 でのZabbix Server
自動構築
▪ https://qiita.com/qryuu/items/c3fb49b33068d6cbabf1
17
CloudWatch
▪ Systems ManagerのRun Commandで
AmazonCloudWatch-ManageAgentドキュメントを実行し
▪ パラメータストアのJSONファイルをconfigとして紐付けます。
18
費用
19
Zabbix
▪ t3.smallインスタンスで100インスタンス程度監視可能です。
▪ t3.smallインスタンスの月額利用料は$20/月程度です。
20
CloudWatch
▪ CloudWathAgentのデフォルト設定でLinuxのメトリクスを収集し
た場合の費用は$8.5/インスタンスです。
21
まとめ
機能 Zabbix CloudWatch
OS情報の収集 ZabbixAgent CloudWatchAgent
AWS以外の統合監視
ZabbixAgent,SNMP,IPMI,HTT
Pアイテム
CloudWatchAgent
メトリクスの演算 ○ ○
未来値の予測 Forecast関数 Amazon Machine Learning※
閾値のテンプレートと個別
変更
○ ○
メンテナンス設定 ○ ×
障害通知
メール Jabber SMS 任意スク
リプト
Amazon SNS、Lambda
データの保存期間 設定により長期間保持可能 15ヶ月
22

監視基盤 ~ZabbixとCloudWatch~