cloudpack監視項目一覧表(サンプル)

1,964 views

Published on

cloudpackのフルマネージドサービス内に含まれる監視項目またはスピンオフ・サービス「監視職人」の基本監視項目の一覧表となります。
一覧表以外のご希望項目についても対応可能ですので、お問い合わせください。

お問い合わせ先
https://www.cloudpack.jp/contact/
support@cloudpack.jp

Published in: Business
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,964
On SlideShare
0
From Embeds
0
Number of Embeds
327
Actions
Shares
0
Downloads
22
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

cloudpack監視項目一覧表(サンプル)

  1. 1. cloudpack 2011.7.25
  2. 2. 閾値 閾値# 項⽬ コマンド NRPE 通報 備考 Nagios 通知内容 Warning Critical 5分に1回ロードアベレージのチェックを⾏う 5分前に5% 10分前に4% 15分前に3%の閾値を超えた場合 Waning ロードアベレー ◯ ◯ となる CRITICAL - load average1 check_load 5,4,3 10,6,4 ジ 5分前に10% 10分前に6% 15分前に4%の閾値を超えた場合 Critical WARNING - load average となる 5分に1回ルートディスク使⽤量のチェックを⾏う DISK WARNING - free space: /2 ルートディスクcheck_disk ◯ 0.2 0.1 ◯ ルートディスク使⽤量70%を超えた場合 Warningメール送信 ルートディスク使⽤量80%を超えた場合 Criticalメール送信 DISK CRITICAL free space:/ 5分に1回データディスク使⽤量のチェックを⾏う DISK WARNING - free space: /mnt/hdd13 データディスクcheck_disk ◯ 0.2 0.1 ◯ データディスク使⽤量70%を超えた場合 Warningメール送信 データディスク使⽤量80%を超えた場合 Criticalメール送信 DISK CRITICAL - free space: /mnt/hdd1 USERS WARNING - 5 users currently 5分に1回ログインユーザ数チェックを⾏う ログインユー ◯ logged in4 check_users 5 10 ◯ 5ユーザ以上ログインしていた場合 Warningメール送信 ザー数 USERS WARNING - 10 users currently 10ユーザ以上ログインしていた場合 Criticalメール送信 logged in 5分に1回全プロセス数チェックを⾏う PROCS WARNING: 301 processes5 全プロセス数 check_procs ◯ 300 350 ◯ プロセス数300以上起動していた場合 Warningメール送信 プロセス数350以上起動していた場合 Criticalメール送信 PROCS CRITICAL: 350 processes6 SSH check_ssh ◯ 5分に1回SSH起動チェックを⾏う CRITICAL - Socket timeout after 10 sshが起動していない場合 Criticalメール送信 seconds 5分に1回死活チェックを⾏う 250ms 300ms ◯ 返り値が250msもしくは50%かけた場合 Warningメール送信 PING WARNING - Packet loss = 50%7 死活監視 check_ping 50% 90% 返り値が300msもしくは90%かけた場合 Criticalメール送信 PING CRITICAL - Packet loss = 100% 2分に1回 /var/log/messageログをチェック messagesログ ◯ ◯ アラートキーワード「kernel」が1回書きこまれたらWarningメール送 CRITICAL kernel8 check_log2 監視 信 CRITICAL Error 「Error」も 5分にメモリチェックを⾏う check_memor CRITICAL - memory free9 メモリ監視 ◯ 80 90 ◯ メモリ80%使⽤していた場合 Warningメール送信 y メモリ90%使⽤していた場合 Criticalメール送信 WARNING - memory free PROCS WARNING: 0 process with args 5分にcronのチェックを⾏う crond10 crond プロセス ◯ ◯ crond プロセスが確認できない場合 Criticalメール送信 PROCS CRITICAL: 0process with args crond 1
  3. 3. URL# HOST/ドメイン コマンド NRPE 通報 URL 備考 Nagios 通知内容 備考 5分に1回http//の監視を⾏う 返り値が200の場合はOK1 check_http ◯ HTTP CRITICAL 返り値が200以外の場合 Criticalメール送信 5分に1回http//の監視を⾏う 返り値が200の場合はOK2 check_http ◯ HTTP CRITICAL 返り値が200以外の場合 Criticalメール送信 5分に1回http//の監視を⾏う 返り値が200の場合はOK3 check_http ◯ HTTP CRITICAL 返り値が200以外の場合 Criticalメール送信 5分に1回http//の監視を⾏う 返り値が200の場合はOK4 check_http ◯ HTTP CRITICAL 返り値が200以外の場合 Criticalメール送信 2
  4. 4. DB 閾値 閾値 Nagios 通知内容# 項⽬ コマンド NRPE 通報 備考 Warning Critical 5分に1回httpd起動確認を⾏う1 Apache check_http ◯ HTTP CRITICAL httpdが起動していない場合 Criticalメール送信 5分に1回httpdプロセスチェックを⾏う Apacheのプロ PROCS WARNINGL: 230 processes2 check_procs ◯ 230 250 ◯ httpd プロセス230個起動していた場合 Warningメール送信 セス数 PROCS CRITICAL: 250 processes httpd プロセス250個起動していた場合 Criticalメール送信 5分に1回 ポート8009監視を⾏う3 Tomcat check_tcp ◯ 接続を拒否されました ポート8009が解放されていない場合はWarningメール送信 5分に1回javaプロセスを監視を⾏う キーワード 「/usr/bin/java」 PROCS CRITICAL: 0 processes4 Java プロセス ◯ ◯ の⽂字列で監視 with args /usr/bin/java 上記プロセスが確認できない場合はCriticalメール送信 3
  5. 5. URL 閾値 閾値 Nagios 通知内容 備考# 項⽬ コマンド NRPE 通報 備考 Warning Critical1 MySQL check_mysql ◯ ◯ 5分に1回 MySQL監視を⾏う CRITICAL - no connection MySQLが起動していない場合 Criticalメール送信 5分に1回PostgreSQL起動確認を⾏う2 PostgreSQL check_pgsql ◯ ◯ CRITICAL - no connection PostgreSQLが起動していない場合 Criticalメール送信 4

×