System Center Operations Manager による
       仮想環境の監視と高度な運用
            2009年12月11日

                           マイクロソフト株式会社
                                エバンジェリスト
                 安納 順一(あんのう じゅんいち)
              http://blogs.technet.com/junichia/
                                               1
本日のテーマ

• [おさらい] 物理環境をどう監視するか?

• 仮想環境を監視するには特別な手法が必要なのか?

• 仮想環境の監視は物理環境以上に面倒なのか?




                            2
Agenda

 • 物理環境の監視
 • 仮想環境の監視
 • パフォーマンスとリソースの最適化(PRO)




                       3
デモ環境 システム構成

                                                   ゲスト無し
   192.168.10.20   192.168.10.21




 192.168.10.12         フェールオーバークラスター                     192.168.10.13
                                   192.168.10.50



                                       CSV




                                                    192.168.10.11
                                                                         4
おさらい
物理環境の監視




          5
ITの混沌 その1
OSやデバイスによって監視ツールが異なる




                       6
ITの混沌 その2
どんどん増えていくデバイスに追いつけない




                       7
マイクロソフトの解

            クライアントとネットワークを含め
            ITシステム全体を包括的に監視




                           8
ITの混沌 その3
・ソフトウェアや機能ごとに監視ツールが異なる



                 A社用


                  B社用                                Office
 Security
                                                   Application
                       C社用         E社用


                             D社用
  MAIL                                              LOB

            DB
                                         Network

                             WWW
                                                                 9
マイクロソフトの解
  1つの監視コンソールでシステム全体を監視




                                   Office
 Security
                                 Application




  MAIL                            LOB

            DB
                       Network

                 WWW
                                               10
一極集中の秘密~管理パック
製品開発元が提供する監視用ナレッジ & アクション
•   Operations Manager に組み込んで利用する
•   監視対象の製品/サービスに最適化されたルールセット
•   製品や機能の監視ポイントをビルトイン
•   多くの管理パックが無償で提供
    ※サードベンダー製の有償管理パックもある

                              ナレッジ
                        ビュー          タスク




                       モニタ/          レポート
                       ルール




                                            11
管理エージェントと管理パックが動的監視を可能にする

 •   監視するサーバーは?
 •   監視する製品/機能は?
 •   監視する箇所は?
 •   監視のポイント(閾値)は?
 •   監視した結果なにをしたらいいの?




                        12
デバイスの発見
エージェントのインストール
ルール送付




                13
仮想環境の監視




          14
仮想システムの監視は?
 System Center Operations Manager




                                    15
仮想化により ITはさらに動的に変化する

 •   仮想サーバーの発生と消滅
 •   物理サーバー間の移動
 •   物理サーバーの急激なリソース変化
 •   新しいソフトウェアの追加

     特に、マイクロソフトの
         Dynamic IT
                   により顕著に


                            16
監視/管理にも「ダイナミック」さが必要
 動的監視/管理の要件
 •   デバイスの自動検出
 •   エージェントの自動インストール
 •   ソフトウェアの自動認識
 •   インベントリやログの自動収集
 •   パフォーマンスの監視
 •   エラーの自動検出と自動回復


     仮想化されているからこその要件



                       17
パフォーマンスとリソースを最適化するには
パフォーマンスを維持できる物理環境に、仮想マシンを移動する

 (例)
 CPUの高負荷状態が一定時間続いた場合には、
 パフォーマンスに余裕のあるコンピューターに仮想マシンを移動する
 ことで、リソースを最適化する




        PRO : Performance and Resource Optimization
                                                      18
最適化を自動で行うカギ
モニターと復元タスク              SC Operations Manager



    状態:CPU使用率90%                   別の物理マシンに
    継続時間:60秒
    サンプリング数:3回                     仮想OSを   移動
 移動の要件
  • 仮想マシンを停止しない
    → Live Migration Hyper-V 2.0 + Failover Cluster

   • リソースに余裕のある物理マシンを自動検出
     → 物理サーバーのレーティング
           SC Virtual Machine Manager

                                                      19
Live Migration の実行方法

  • クラスターノードを停止する

  • [フェールオーバークラスター]管理コンソール

  • Virtual Machine Manager 管理コンソール

  • Windows PowerShell コマンドレット




                                      20
PowerShell で Live Migration
 クラスターグループ「CLUSTERGRP」クラスタノード「NODE-A」から
 「NODE-B」に仮想マシン「GYOUMU」を移動する場合

方法1:フェールオーバークラスターのコマンドレットを使用
PS>Get-Cluster CLUSTERGRP | Move-ClusterVirtualMachineRole –Name “GYOMU”
-Node “NODE-B”



方法2:Virtual Machine Managerのコマンドレットを使用
 PS>$VM = Get-VM –Name “GYOMU” | Where {$_.VMHost.Name –eq “NODE-A”}

 PS>$GUID = [guid]::NewGUID()

 PS>$VMHOST = Get-VMHost | Where {$_.Name –eq “NODE-B”}

 PS>MOVE-VM –vm $VM –vmhost $VMHOST –RunAsynchronously –jobgroup $GUID




                                                                           21
パフォーマンスとリソースの最適化(PRO)




                        22
PRO の動作イメージ
      仮想マシン管理   サーバー監視




                         23
PROとは?
PRO とは、
   OpsMgr 2007/R2 で仮想環境のパフォーマンスを監視し、
   SCVMM 2008/R2 と連携してリソースを最適化するしくみ。
   セルフチェック、自動リカバリ機能により、問題解決までの所要時間を
   短縮し、ダウンタイムを最小限に抑える




                                自
                                動
                                化




                                    24
PRO を実現するためのシステム構成(管理側)




  SCVMM 2008/R2          OpsMgr 2007/R2
                  MP:Management Pack(管理パック) 25
PRO用管理パックの構造
PRO 用 管理パック
  診断タスク

  回復タスク                         監視              ナレッジ




PRO ライブラリ


 Hyper-V    Virtual Server   Vmware
  ホスト                                 仮想マシン     カスタム
                ホスト           ホスト
 ターゲット                                ターゲット     ターゲット
              ターゲット          ターゲット




 Hyper-V    Virtual Server   Vmware           Hardware/Softw
                              ホスト     仮想マシン   are Component 26
  ホスト           ホスト
PROによる監視対象とエージェント




             VMware Infrastructure API
              を使用したリモート監視                27
PRO 動作の流れ



            仮想化環境




                    28
PRO モニター 一覧
    モニタ名        閾値    間隔       アラート条件                   監視詳細
PRO Hyper-V ホスト ターゲット
                                            【WMIクエリ】 SELECT * from
                                            Win32_PerfFormattedData_HvStats_Hyper
  PRO CPU 使用率   80%   60秒 連続3回エラーで重大アラート    VHypervisorLogicalProcessor WHERE
                                            Name ='_Total'
                                            【パフォーマンス カウンタ】
  PRO メモリ使用率    90%   60秒 連続3回エラーで重大アラート    オブジェクト:Memory
                                            カウンタ:% Committed Bytes Is Use

PRO Virtual Server ホスト ターゲット
                                            【パフォーマンス カウンタ】
  PRO CPU 使用率   80%   60秒 連続3回エラーで重大アラート    オブジェクト:Processor
                                            カウンタ:% Processor Time
                                            【パフォーマンス カウンタ】
  PRO メモリ使用率    90%   60秒 連続3回エラーで重大アラート    オブジェクト:Memory
                                            カウンタ:% Committed Bytes Is Use

PRO VMware ホスト ターゲット
                                            【XML 構成】
  PRO CPU 使用率   80%   180秒 連続3回エラーで重大アラート   PerfCounterGroupName:cpu
                                            Instance:*
                                            【XML 構成】
  PRO メモリ使用率    90%   180秒 連続3回エラーで重大アラート   PerfCounterGroupName:mem
                                            Instance:*

PRO バーチャル マシン ターゲット
                                            【パフォーマンス カウンタ】
  PRO CPU 使用率   90%   60秒 連続3回エラーで警告アラート    オブジェクト:Processor
                                            カウンタ:% Processor Time
                                            【パフォーマンス カウンタ】                   29
  PRO メモリ使用率    90%   60秒 連続3回エラーで警告アラート    オブジェクト:Memory
                                            カウンタ:% Committed Bytes Is Use
レーティング:Intelligent Placement
• 配置する物理サーバーをレーティング
• 無理な配置を回避




                               30
PRO ヒント(PRO Tips)
 ホスト(Hyper-V/Virtual Server/VMWare)用
    リソースの乏しくなったホストに推奨されるアクショ
    ンが含まれており、仮想マシンを別のホストに移動す
    ることによりリソースの最適化を行おうとする。
    自動化が可能。

 仮想マシン用
   リソースの乏しくなった「仮想マシン」に推奨される
   構成情報が含まれており、仮想マシンの環境設定を変
   えることで最適化を行おうとする。
   自動的には行われない。


                                       31
PRO適用時の考慮事項

ホストグループの定義
  VMの移行はホストグループ内で行われることに注意
どのホストグループ/クラスタをPRO対象とするか
  「PRO対象としない」という選択肢も当然ありえます
自動移行か手動移行か
  高負荷状態が継続する傾向を見極めましょう
  短時間で高負荷が解消するならば手動移行を選択
基幹業務を移行対象から除外
  重要なVMは移行対象から除外し、別のVMの移行に
  よって負荷を低減

                              32
まとめ
• OpsMgr+VMM は物理と仮想の
            動的な管理/監視を実現します
• 仮想環境の監視手法は
       物理環境と全く同じです
• ただし仮想環境だからこそ
       さらに柔軟な監視と管理が行えます




                             33
34

System Center Operations Managerによる仮想環境の高度な管理