オンプレミスからAWS上のSAP
HANAまで高信頼DBシステム構築に
HAクラスタリング技術を活用しよう
2015年6月12日
日本電気株式会社
クラウドプラットフォーム事業部
CLUSTERPROグループ
船田泰伸
[B37] db tech showcase Tokyo 2015
(SAP HANA / AWS / Clustering)
Yasunobu Funada
1. システム障害の発生が増加!なぜ?
2. 業務継続のニーズが高まる、HAクラスタって何?
3. 切替に失敗するケース
4. 切替失敗を回避する高信頼性技術を深堀りする
5. HAクラスタの適用領域の拡大と事例
(仮想化、DR、クラウド)
6. クラウド時代の今なぜHAクラスタなのか?
7. SAP HANA on AWS連携
8. その他の導入事例
9. まとめ
© NEC Corporation 2015Page 2
アジェンダ
1. システム障害の発生が増加!
なぜ?
© NEC Corporation 2015Page 3
システム障害に関する最近の大きなニュース
▐ 2015年6月9日: ブックオフオンラインで集荷トラブルが発生、
システム障害が原因
▐ 2015年5月: 金融庁、カブコムに対して業務改善命令
「システム障害の管理が極めて不適切な状況」
▐ 2015年4月: ブルームバーグでシステム障害、
世界に「前例なき」影響
▐ 2014年8月: Microsoft Azure、広い地域で数時間の
システム障害
▐ 2014年6月: 「スカパー!」 システム障害で各種手続き不能。
個人情報漏えいの可能性にも影響。
Page 4 © NEC Corporation 2015
システム障害での損失額
▐データロスとダウンタイムでの損失は
1社あたり 2億1900万円
▐ 調査対象企業の中で、過去1年間にデータロスまたはダウンタイムを
経験したのは国内企業で48%、全世界では64%。
▐ 国内企業では過去1年間に発生 した予定外のダウンタイムが
平均19時間(約2営業日)。
▐ 全世界では過去1年間に発生 した予定外のダウンタイムが
平均25時間(約3営業日)。
(2015年1月23日 EMCジャパン発表より)
Page 5 © NEC Corporation 2015
サーバ障害発生の増加する原因は?
▐ ITシステムを基盤とする社会インフラが増えている
 銀行オンライン、e-Japan、新幹線運行システム、航空管制システム、
運行業務支援システム、通信システム
 システム障害による社会影響の増大とノンストップオペレーションの要求
▐ ITシステム・ソフトウェアが巨大化・複雑化している
 ソフトウェアの巨大化・複雑化
 専用ソフトからパッケージソフトへ
 仮想化・ネットワーク技術の進歩とクラウド化
 マルチベンダー
 ネットワークを介した System of Systems
 要求に答えるためのアジャイル開発・DevOps
2014年5月19日 IDCジャパン発行
「国内x86のサーバサポートに関する調査結果」より
Page 6 © NEC Corporation 2015
サーバ障害発生の起因の変化
Page 7 © NEC Corporation 2015
▐ 2012年調査
ハードウェアに起因する
障害が最多
▐ 2014年調査
ソフトウェアに起因する
障害が最多
2014年5月19日 IDCジャパン発行
「国内x86のサーバサポートに関する調査結果」より
2. HA クラスタって何?
© NEC Corporation 2015Page 8
ロードバランスクラスタ
HPCクラスタ
計算ノード
データ データノード
データ
ロードバランサ
業務継続障害発生
フェイルオーバ
アクセスする宛先
はそのままでよい
・ 別のサーバが自動的に業務継続
・ ビジネス機会の損失を最小限に抑える
・ 導入した企業は安心してビジネスに臨める
HAクラスタ
その他のクラスタシステム
ハイアベイラビリティ(高可用性)が主目的
業務システムを冗長化させ、障害発生時に自動で切り替える
© NEC Corporation 2015Page 9
HAクラスタとは
LinuxはHAクラスタ市場全体をけん引。Windowsも拡大が続く
© NEC Corporation 2015Page 10
HAクラスタ市場 伸長
UNIX
Linux
Windows
2,000
4,000
6,000
8,000
10,000
12,000
14,000
2013 2014 2015 2016 2017 2018
HAクラスタ市場の稼働環境別 売上予測
(年)
(百万円)
出典:IDC Japan、2014年6月 「国内システムソフトウェア市場 2013年の分析と2014年~2018年の予測」 (J14350103)
(CAGR: 2013~2018)
© NEC Corporation 2015Page 11
クラスタ構成 ①共有ディスク型
共有ディスク
障害発生時は、
スタンバイサーバで起動
アクティブ スタンバイ
障害発生
▐ サーバ台数 最大32台での共有ディスク構成
が可能
▐ M:N構成が可能でミッションクリティカルの要
求に応じて待機系をN台用意
:
:
アクティブ
スタンバイ
▐ 共有ディスクを業務データ引継ぎに利用したクラスタ
▐ 共有ディスクの特長である高性能/高信頼/大容量を活かしたシステムが構築可能
アクティブ
アクティブ
業務AP
拡張性に富み、大規模構成が可能な共有ディスク型構成
© NEC Corporation 2015Page 12
クラスタ構成 ②ミラーディスク型
内蔵ディスク 内蔵ディスク
障害発生時は、
スタンバイサーバで起動
更新処理は両サーバの
ディスクに書き込み
障害発生
業務AP
アクティブ スタンバイ
▐ サーバの内蔵ディスクを業務データ引継ぎに利用したクラスタ
▐ 内蔵ディスクを専用インタコネクトでネットワークミラーリングすることで、低コストか
つ省スペースで、高可用なシステムが構築可能
スタンバイ
▐ サーバ台数 最大9台でのN:1ミラー構成が
可能(MAX: 8:1)
▐ 待機系を1台で集約
アクティブ
アクティブ
アクティブ
(※ミラーの書き出し頻度の多い業務は不向き)
ハイ・コストパフォーマンスのミラーディスク型構成
業務AP
© NEC Corporation 2015Page 13
スタンバイアクティブ
②アプリケーション停止
④仮想(フローティング)IPアドレス非活性
③共有ディスク(ミラーディスク)非活性
①障害検出
OSシステムログに記録、AlertServiceによる通報
①障害検出 ②アプリ停止
④フローティング
IP非活性
③切替ディスク
非活性 ⑦アプリ開始
⑤フローティング
IP活性
⑥切替ディスク
活性
ここまでの目安1分前後
フェイルオーバグループ非活性
⑦アプリケーション開始
⑤仮想(フローティング)IPアドレス活性
⑥共有ディスク(ミラーディスク)活性
フェイルオーバグループ活性
●フェイルオーバグループ
クラスタサーバが利用するリソースの集ま
りです。フェイルオーバグループがノード間
を移動します。同一グループに属するリ
ソースは必ず一緒にノード間を移動しま
す。
切替所要時間の目安は約1分前後
フェイルオーバの状態遷移
© NEC Corporation 2015Page 14
(4)(5)アプリケーション/
サービス異常
(2)OS異常
NIC
NIC
電源
(1)電源異常
業務継続
(6)パブリックLAN異常
(7)CLUSTERPRO X
自体の異常
NIC
★待機系でも常に監視!
・(7)CLUSTERPRO X自体
・(2)OS
・(3)ディスク
・(6)NIC
・(6)パブリックLAN
・(8)ユーザカスタマイズ監視
(6)NIC異常
(3)ディスク異常
※番号は次ページの項目に対応
InterConnect
フェイルオーバ
(8)ユーザカスタ
マイズ監視異常
OS障害、DB障害など様々な障害を検知し、フェイルオーバ
検出する主な障害発生
© NEC Corporation 2015Page 15
以下の障害時には、フェイルオーバが発生し、業務の継続運用が可能です。
また、アラートサービスによる通報で、迅速な障害対応が可能です。 *1
(1) サーバのシャットダウン/電源ダウン
(2) OSのパニック/完全ハングアップ
(3) OSの部分的な障害(ディスクI/Oのハングアップ)
(4) アプリケーションあるいはサービスの停止
(5) アプリケーションあるいはサービスのハングアップ *2
(7) CLUSTERPRO Xサーバモジュール自体の異常
(6) NIC や Public LANの異常
*2 エージェント製品が
必要になります。
・データベース
・インターネットサーバ
・ファイルサーバ
・アプリケーションサーバ
の各エージェントを提供
(8)ユーザカスタマイズ監視の異常
*1 アラートサービス製品あ
るいは通報製品が必要。
OSの部分的な障害(ディスクI/Oのハングアップ以外)
以下の障害時には、フェイルオーバは発生しません。
アプリケーションあるいはサービスのハングアップ *3
*3 エージェント製品を
使用すればフェイル
オーバ可能です。
検出できる障害とできない障害があります
検出する主な障害
© NEC Corporation 2015Page 16
× アプリケーションのハングアップ検出
× アプリケーションからのレスポンス異常検出
○ アプリケーションの異常終了(要:存在監視設定)
○ アプリケーションのハングアップ検出
○ アプリケーションからのレスポンス異常検出
○ アプリケーションの異常終了 (要:存在監視設定)
アプリケー
ション起動
プロセスが消滅すると
異常と判定
アプリケーションの
ハングアップは
検出しない
ハング
アップ アプリケー
ション起動
Agent Agent
Agentが定期的に対象の
アプリケーションをチェック
アプリケーションの
ハングアップを
検出できる。
Agent(オプション)なしの場合 Agent(オプション)ありの場合
障
害
発
生
単なるアプリケーションの存在監視だけでなく、定期的に正常応答が返るか確認します。
もしもハングアップや異常を検知した場合、フェイルオーバして業務継続できます。
監視Agent(オプション)の導入によりハングアップ・異常状態まで
きっちり監視できる!
特定アプリケーションの障害発生監視
© NEC Corporation 2015Page 17
アンチウイルスソフト (Anti-Virus Agent)
アプリケーションサーバ (Application Server Agent)ファイルサーバ (File Server Agent)
インターネットサーバ (Internet Server Agent)
Oracle, SQL Server, DB2, ODBC, PowerGresなど
Windows
Linux
Oracle, MySQL, PostgreSQL, PowerGresPlus, DB2,
Sybase
IIS, SMTP/POP/IMAP4, HTTP,HTTPSなど
Windows
Linux
apache, httpd, sendmail, postfix, popdなど
Linux
Samba, NFS
Linux
WebLogic, WebSphere, WebOTX, Tuxedo, Oracle ASな
ど
Windows
ウイルスバスター コーポレートエディション
Windows
▐ 利用ケースの多い、6つのカテゴリーに対応
大切なアプリケーションのハングアップや異常状態まで詳細に監視します!
データベース (Database Agent)
監視オプション製品
Solaris
Solaris
Oracle, MySQL, PostgreSQL
JavaVM、OSのリソース監視
(System Resource Agent / Java Resource Agent)
・Java Resource Agent
Java実行環境のリソース監視(Heap領域など)
・System Resource Agent
CPU使用率、メモリー使用率、ファイルハンドル数
Linux
Windows
3. 切替に失敗するケース
© NEC Corporation 2015Page 18
稼働系から待機系、切替が失敗するケース
Page 19 © NEC Corporation 2015
情報処理推進機構(2014年5月13日公開、2015年3月27日更新)
「情報処理システム高信頼化教訓集(ITサービス編)2014年度版」より
4. 切替失敗を回避する高信頼性技
術を深堀りする
© NEC Corporation 2015Page 20
OSストール時、フェイルオーバを成功させる工夫①
ストール
共有ディスク
を握ったまま
SCSIリザーブで
共有ディスクを
取得できない!
フェイルオーバ失敗!
ストール
フェイルオーバ成功!
▐ SCSIリザーブを利用する他社のクラスタソフトの場合
 SCSIリザーブにより現用系が共有ディスクを握ったまま中途半端にOSストールした場合、待機系がリザーブで
きずにフェイルオーバは失敗します。
▐ CLUSTERPROの場合
 SCSIリザーブを利用せず、ブロックデバイスに対する ioctl() を発行することにより共有
ディスクをアクセス制御します。
• 共有ディスク活性時は、読み書き可能(Read/Write)を発行
• 共有ディスク非活性時は、読み込み専用(Read Only)を発行
 OSストール時の業務継続を可能にします。
 HW依存しないため、どのような共有ストレージも利用可能にします。
共有ストレージのアクセス制御にSCSIコマンドを用いず、独自工夫で業務継続
読み込み専用を
解除し、共有
ディスクをマウン
トできる!
Page 21 © NEC Corporation 2015
▐ CLUSTERPROはユーザ空間の状態を定期監視する機能があります。
▐ ユーザ空間のストールを検出した場合、OSをソフトリセットします。
▐ 現用系で業務の非活性が失敗し、仮想IPアドレスなどの資源をリリースできなかった場合でも、以下の機能
によりOSを強制的にリセットし、安全に業務を引き継ぎます。
 非活性異常による緊急シャットダウンのストールを監視する「シャットダウンストール監視」機能
 リソース非活性異常時のアクションにOSをリセットする項目を選択
ストール
検出
OSストール時、フェイルオーバを成功させる工夫②
①OSリセット
②フェイルオーバ成功!
旧現用系はリセットし
たので、安全に資源を
利用可能フェイルオーバ成功!
ユーザ空間ストール時は、kernel空間よりOSをリセットしフェイルオーバできる
Page 22 © NEC Corporation 2015
フェイルオーバ
▐ 現用系サーバのダウンを認識したときに待機系サーバから、IPMIの機能を使用して強制的に
サーバを停止させることができます。
現用系は
ストール?
OSストール時、フェイルオーバを成功させる工夫③
ノードマネージメントモジュール
電源Off実行
BMC
(Baseboard
Management
Controller)
相手サーバのBMCへ
IPMIの電源Offの
パケット送信
▐ ダウンを認識したサーバを確実に停止することで、OSのストールによる待機系でのフェイル
オーバ失敗を回避します。
ストールしたサーバをハードウェアより、電源 Off できるので、安心です
Page 23 © NEC Corporation 2015
▐ サーバ1とサーバ2間のハートビート通信がタイムアウトした時点で、スプリットブレイン状態となる。
▐ お互いのサーバはそれぞれ、「相手ノードがダウンした」とみなし、業務をフェイルオーバする。
業務の両系活性となり、業務データの破壊が起こりうる
▐ この状態で万が一通信が復活した場合、リソース排他によるデータ保護の観点から、両サーバとも緊急
シャットダウンを実行する。(CLUSTERPROの仕様)
業務停止に至る
ハートビートが届かない!
→両系活性・・・業務
スプリットブレインを解決する工夫①
CLUSTERPROにはスプリットブレイン状態を解決する機能が
備わっています!
スプリットブレインの解決はクラスタソフトの「キモ」、CLUSTERPROなら安心
Page 24 © NEC Corporation 2015
業務
スプリットブレインを解決する工夫②
pingが届かない!
GW
GWなどping先
業務
pingが届く
▐ スプリットブレイン状態になった場合、
 GWなどの ping先に ping 疎通できるサーバは「自分はネットワークから切り離されていない」と判断し、
業務をフェイルオーバする。(既に起動済みの場合は、そのまま)
 GWなどの ping先に ping 疎通できないサーバは、「自分はネットワークから切り離された」と判断し、
OSをシャットダウンする。
OSシャットダウン
両系活性によるデータ破壊を防止できて、安心です
スプリットブレイン状態時に、ハートビート断線経路を自動判別し、業務LANの接
続が健全なサーバが業務継続する
Page 25 © NEC Corporation 2015
Public LAN
Interconnect
LAN
Server #1 Server #2
Server #1 Server #2
write
read read
write
多彩なスプリットブレイン防止方法を用意
スプリットブレインを解決する工夫③
多様なハートビート経路を設定でき、サーバダウンと
スプリットブレイン状態を高精度で区別できて、安心です
ディスクハートビート
LANハートビート
Server #1 Server #2
COM Port
(RS-232C)
COMハートビート
Public LAN
Interconnect
LAN
Server #1 Server #2
driver driver
LAN HBより負荷に強いLANカーネルハートビート
共有ディスク排他制御のキモ
次頁で詳しく解説
Page 26 © NEC Corporation 2015
スプリットブレインを解決する工夫④
ストール
OSダウン
etc…
ディスクハートビートが共有ディスクを守る!
②安心して共有ディスク
をマウントできる!ディスク
ハートビート
が届かない
業務
read
write
①相手がダウン
したと判断
mount
▐ ディスクハートビートとは
 共有ディスク上に専用のRAWパーティションを用意し、両サーバからアクセスすることでサーバ間の死活監
視をする仕組みです。
 両サーバからのアクセスが禁止される共有ディスクの排他制御を確実にします。
 LANなどの他のハートビートの全滅に加え、ディスクハートビートが届かなくなって初めて、業務をフェイル
オーバするので、安心して共有ディスクをマウントできます。
両サーバから共有ディスクをマウントする危険性を排除し、
大切なデータを守ります
Sv#1 Sv#2
Server #1 Server #2
Page 27 © NEC Corporation 2015
計画的な負荷による誤認タイムアウトを防ぐ工夫
計画的で一時的な高負荷によって起こりうる
誤認タイムアウトを防ぐことができます
バックアップ
装置
高負荷
一時的な高負荷によって誤って
監視タイムアウトが起こるかも・・・
監視遅延が発生
タイムアウト倍率
を動的に変更
バックアップ
装置
一時的な高負荷によって誤って
監視タイムアウトしないので安心
監視
監視タイムアウト値
60秒
監視タイムアウト値
180秒
高負荷
システムのバックアップ時など一時的に高負荷になる場合、クラスタ稼働中に各
種タイムアウト値を動的に変更することで、誤ったフェイルオーバを防止できます
▐ 動的に変更できるタイムアウト値
 ハートビートタイムアウト
 監視タイムアウト
 ミラー機能のタイムアウト
 アラート同期および、WebManagerのタイムアウト
Page 28 © NEC Corporation 2015
稼働系から待機系、切替が失敗するケース
Page 29 © NEC Corporation 2015
情報処理推進機構(2014年5月13日公開、2015年3月27日更新)
「情報処理システム高信頼化教訓集(ITサービス編)2014年度版」より
OK
OK OK
OK
5. HAクラスタの適用領域拡大と事例
© NEC Corporation 2015Page 30
多様な利用シーンで大切なシステムの『業務継続』を実現する
▐ 業務継続には、複雑化するIT環境への対応と、様々な脅威への備えが必要です
© NEC Corporation 2015Page 31
② 地震、火災、停電、災害時
の業務継続
(p.34~p.35)
クラウド
仮想化環境仮想化環境
物理環境物理環境
アプリケーション障害
(OS・業務ソフトウェア)
災害
(停電・火災・地震)
ハードウェア障害
(サーバ・ネットワーク・ストレージ)
① 障害対策でビジネス機会損失を最小化
(p.32~p.33)
③ 仮想化で高まった業務停止のリスク回避
(p.36~p.39)
④ クラウドの信頼性向上
(p.40~p.41)
障害・災害から物理・仮想・クラウド環境のITシステムを守る
CLUSTERPROの適用シーンと導入事例をご紹介
① 障害対策でビジネス機会損失を最小化
▐ 障害を監視し、異常発生時にはスタンバイ機が自動で切り替わる!
© NEC Corporation 2015Page 32
業務継続
シングルサーバの場合 クラスタリングの場合
復旧作業が終わるまで業務停止 予備サーバへ自動的に切り替え、
すぐに業務再開
ディスク障害
OSハングアップ
アプリケーション障害
ネットワーク接続障害
電源障害
ディスク障害
OSハングアップ
アプリケーション障害
ネットワーク接続障害
電源障害
業務停止
障
害
検
出
スタンバイ
ユーザの接続先も
自動的に切り替わる!
自動
① 障害対策でビジネス機会損失を最小化
© NEC Corporation 2015Page 33
繁忙期の負荷集中に対応するため、高可用性クラスタリングソフトウェア
「CLUSTERPRO」を採用。停止や遅延のない堅牢なシステムを実現しました。
導入の目的
運営するショップとオンラインプリンタサービ
スは年賀状の時期になると注文が集中し、
負荷集中によるシステム停止を避けるため、
システム強化を検討されていた。
導入によるメリット/システム構成
事例詳細
http://www.nec.co.jp/library/jirei/plazacreate/
バックエンドシステムにNECの高可用クラスタリン
グソフトウェア「CLUSTERPRO」を採用し、データ
ベース「MySQL」を組み合わせた堅牢なシステム
に更新。停止や遅延なくサービスを提供できる環
境を実現しました。
【事例】
株式会社プラザクリエイト様
② 地震、火災、停電、災害時の業務継続
▐ サーバ2台の最小構成で簡単災害対策
▐ 業務データも業務アプリケーションも自動引継
© NEC Corporation 2015Page 34
メインサイト
バックアップサイト
WAN・VPN
障害
同期データ
地
震
火
災
ウイルス
業務AP
業務AP
停電
災害
予備サーバ
予備サーバ
② 地震、火災、停電、災害時の業務継続
© NEC Corporation 2015Page 35
導入の目的
ゲート認証システムにおいて、万一の災害
によるサイトダウンに備え、バックアップサ
イトでの業務継続を可能とする災害対策
が求められていた。
導入によるメリット/システム構成
CLUSTERPROによる遠隔クラスタリングによ
り、災害によるサイトダウンが発生しても「最
小限のダウンタイムで」、「データは完全保障
したまま」バックアップサイトでの業務継続を
可能とするDR(災害対策)ソリューションを
構築。
さらに、メインサイトのサーバにはFTサーバを
採用することにより更なる高可用システムを
実現。
(※1)CLUSTERPROは、海外ではEXPRESSCLUSTERの名称で販売しています。
(※2)上記Webページに関するお問い合わせは<global@soft.jp.nec.com>まで
お願いいたします。
LAN LAN
(待機系)
FTサーバ
(現用系)
New York, NY Newark, NJ
iStorage Sシリーズ
40 Km
T1 WAN (1.5Mbps)
クラスタ Interconnect
SQL Server 2000
Windows 2000
2 OnGuard Clients
4 OnGuard Panels
Value 1
99.999%
Value 2
データの同期ミラーリング
Value 3
2分以内の
自動フェイルオーバ
Corporate Network
SQL Server 2000
Windows 2000
EXPRESSCLUSTER
EXPRESSCLUSTER
NEC Corporation of America
EXPRESSCLUSTER製品ページ(英語)
http://www.necam.com/entsw/ExpressCluster/
Lenel社のOnGuardを使用したアメリカ連邦政府機関のゲート認証システムにおいて、
FTサーバとCLUSTERPROを使用した遠隔クラスタリングで、災害対策を実現。
【事例】
アメリカ連邦政府機関様
③ 仮想化で高まった業務停止のリスク回避
▐ ライブマイグレーションだけで業務システムが救えると勘違いしていませんか?
© NEC Corporation 2015Page 36
仮想化基盤のHA機能 クラスタリングの場合
仮想マシンのマイグレーションは、
障害時には使えません
予備の仮想マシンに切り替えて、業務継続
仮想化基盤と連携したゼロダウンタイムでの切
り替え
仮想マシン
ゲストOS
アプリケーション
仮想マシン
マイグレーション
不可
仮想マシン
ゲストOS
アプリケーション
仮想マシン
アプリケーション
ゲストOS
ルータ
ルータ
仮想化基盤 仮想化基盤 仮想化基盤 仮想化基盤
手動
自動
vMotion等と連携して、ゼロダウンタイム切り替えができるのはCLUSTERPROだけ!
ホスト・ゲストそれぞれ適用可能
▐ ホストクラスタ構成なら、ハードウェア、ネットワーク、仮想化基盤の障害から、仮想マシンを保護
▐ ゲストクラスタ構成なら、物理サーバのクラスタ化と同じように、仮想マシンのクラスタ化が可能
XenServer
Hyper-V
VMware vSphere
KVM
Sun Solaris x86 コンテナ (ゾーン)
IBM PowerVM
仮想化環境型
(ホストクラスタ構成)
Fibre Channel
仮想化基盤仮想化基盤
VM
2
VM
1
G
仮想化環境型
(ゲストクラスタ構成)
Fibre Channel
仮想化基盤 仮想化基盤
VM
2
VM
3
VM
1
VM
2
VM
3
障害
障害
対応仮想化ソフト
仮想化基盤と仮想マシン、それぞれの可用性を向上させる構成
© NEC Corporation 2015Page 37
© NEC Corporation 2015Page 38
ライブマイグレーション連携(無停止フェイルオーバ)に対応する仮想化基盤を拡充
Hyper-V, vSphere 4, KVM, XenServer vSphere 5
▐ Windows Server 2012 R2 Hyper-V* に対応
(VMware, KVM, XenServerは従来バージョンより対応済)
仮想化基盤 仮想化基盤
片パス
障害
片パス
障害
VM
2
VM
3
VM
1
SAN / NAS
ホストで障害を検出すると、CLUSTERPROが
フェイルオーバの前にライブマイグレーションを試行
CLUSTERPROはハイパーバイザ(ホストOS)から
物理資源やゲストOSを監視
VM
2
VM
3
仮想化基盤 仮想化基盤
片パス
障害
片パス
障害
VM
1
ホストで障害を検出すると、CLUSTERPROが
フェイルオーバの前にライブマイグレーションを試行
VM
1
監視用
VM
監視用
VM
CLUSTERPROの監視用VMを各ホストに割り当て、
監視用VM内から監視及びVMの制御を実施
VM
2
VM
2
*Windows Server 2012/2012 R2 Hyper-VではNASを利用した構成でライブマイグレー
ションに対応。Hyper-V 2.0/1.0は従来バージョンよりクイックマイグレーションに対応済。
SAN / NAS
Windows Server 2012 R2対応
VMware vSphere 5.5対応
仮想化ハイパーバイザーのライブマイグレ機能と連携可能
③ 仮想化で高まった業務停止リスク回避
▐ 直線距離5km程度に隣接する工場の遠隔クラスタ(敷地内クラスタ)
▐ バックアップサイトの仮想化統合により、サーバの投資コスト削減
© NEC Corporation 2015Page 39
メインサイト バックアップサイト
ファイルサーバ
グループウェア
データベース
ファイルサーバ
グループウェア
データベース データベースの切り替え
グループウェアの切り替え
独自アプリケーション 独自アプリケーション
独自アプリケーションの切り替え
VMware
【事例】
某アパレル業様
④ クラウドの信頼性を向上
▐レンタルサーバサービスでの大規模障害の発生など、クラウドにおいても信頼性の
確保が課題となっています。
▐CLUSTERPROは主要クラウドサービスに対応し、クラウドを利用したシステムの
信頼性を向上します。
© NEC Corporation 2015Page 40
InstanceInstance
業務 業務
ミラーリング
アクティブ
スタンバイ
データ データ
NOAHプラットフォームサービス
Bizホスティングベーシック
U-Cloud IaaS
TechnoCUVIC
BIGLOBEクラウドホスティング
アマゾン ウェブ サービス
© NEC Corporation 2015Page 41
導入の目的
導入によるメリット/システム構成
事例詳細
http://www.nec.co.jp/library/jirei/restaurantexpress/
従来のシステムでは、新しい業態が増えたと
きのシステム追加・拡張に大きなコストが掛
かった。事業の成長に合わせてスケーラブル
に拡張できるシステムが必要だった。
既存のシステムをクラウド化し、柔軟性と拡張性
を確保。さらにクラウド環境の動作をサポートして
いるCLUSTERPROを用いて基幹システムに求め
られる可用性を確保した。
従来のシステムを拡張するのに比べ10分の1の
コストで同機能を実現できた。以下コメント抜粋
『操作性がよく、まるで空気のような存在。』
『全てのサーバを一度で設定変更できて、管理者
が本来の運用管理業務に集中できる。」
(IDCフロンティア社のNOAHプラットフォームサービスを利用)
仮想OSは CentOS
クラウド上にオープンソースソフトウェアを用いて基幹システムを構築。
事業成長や事業の追加へ柔軟に対応できる高可用でスケーラブルな仕組みを実現
④ クラウドの信頼性を向上
【事例】
株式会社レストラン・エクスプレス様
6. クラウド時代の今、なぜHAクラス
タなのか?
© NEC Corporation 2015Page 42
なぜクラウドでCLUSTERPROが求められているのか?
▐ 企業によるクラウド活用が着実に進んでいます。
▐ クラウド活用における冗長性確保の必要性に注目が集まっています。
 クラウドサービスのSLA(Service Level Agreement)適用
 クラウドサービスの計画停止対策
 災害対策
▐ CLUSTERPROは多くのクラウドサービスに対応。
さらに費用や移行容易性で他の冗長化手段にない優位性をもっていま
す。
InstanceInstance
業務 業務
スタンバイ
データデータ
アクティブ
Page 43 © NEC Corporation 2015
クラウドサービスのSLA(*)について
▐ クラウドサービスは高いサービスレベルが1つの特長(99.95%など)
▐ 主要クラウドサービスでは、SLAの適用条件として冗長化を求めている
▼AWS
http://aws.amazon.com/jp/ec2/sla/
▼Azure
http://azure.microsoft.com/ja-jp/support/legal/sla/
(ダウンタイム計上条件)
サービス利用者がインスタンスを実
行している複数のAvailability
Zoneが、サービス利用者にとって
「使用不能」となることをいう。
異なるフォールト ドメインおよびアッ
プグレード ドメインで複数のロール
インスタンスをデプロイした場合、
(中略) 99.95% 以上外部に接続さ
れることを保証します。
(*)SLA(Service Level Agreement):
クラウドベンダが提示するクラウドサービスの内容と範囲、品質に対する達成水準
Page 44 © NEC Corporation 2015
冗長化パターン比較(クラウド)
① PaaS ② IaaS
+アプリケーション
+アプリケーションの
冗長化オプション
③ IaaS
+アプリケーション
+他社HAクラスタソフト
IaaS
+アプリケーション
+CLUSTERPRO
製品例、サービス例 ・Amazon RDS
・Microsoft Azure SQL
Database
(冗長化オプション)
・Oracle Data Guard
・Microsoft SQLServer
AlwaysOn
(HAクラスタソフト)
・Windows Server
Failover Cluster(WSFC)
(HAクラスタソフト)
・CLUSTERPRO X
クラウド対応 ◎ ○ 製品による × 共有ディスクが必要な
製品は厳しい
○ データミラー型で対応
費用 ◎ × 上位エディションへの
変更等が必要になる製
品あり
- ○
データ保護 ◎ クラウドに最適化 ◎ アプリケーションに最
適化
- ○ 同期ミラーリングで最
新データを保持
業務との相性 × 仕様や諸元があわな
い場合は業務アプリ改修
○ - ○
一般アプリケーションの
冗長化
- 特定アプリケーション
専用
- 特定アプリケーション
専用
- ○
▌クラウドサービスへのニーズの高まりにあわせて、SLA対応や計画停止対策から
冗長化のニーズも増加。
▌CLUSTERPROはクラウド対応状況や業務との相性で優位。
(※負荷分散構成を除く)
Page 45 © NEC Corporation 2015
IaaS + CLUSTERPRO
RDS
冗長化パターン比較 ①PaaSとの比較
PaaS (ex.Amazon RDS)
Availability Zone BAvailability Zone A
業務
データ ミラーリング
クラスタ
ノード
(待機系)
業務
データ
クラスタ
ノード
(現用系)
データベース
業務アプリ
データベース
業務アプリ
オンプレミスと同様にローカル
でデータベースを操作
Availability Zone BAvailability Zone A
業務アプリ
データ同期
DB DB
フェイルオーバ
ログ
▐ オンプレミスからの移行が容易なIaaS(仮想マシン)で冗長性確保できる
のがCLUSTERPRO
ローカルファイルへの直接アクセス
不可 ⇒ アクセスが必要な業務アプ
リは改修(APIのコール等)
▌ クラウドならではのコストパフォーマンス
▌ クラウドに最適化された冗長性、データ保護
▌ 通常のソフトウェアと比べて機能や諸元に制限が
あり、既存業務をそのまま移行できない場合も
▌ オンプレミスと同様に業務環境を構築可能
▌ CLUSTERPROの同期ミラーリングでデータ保護
Page 46 © NEC Corporation 2015
CLUSTERPRO
Availability Zone BAvailability Zone A
AlwaysOn
可用性グループ
冗長化パターン比較 ②冗長化オプションとの比較
▐ クラウドのコストパフォーマンスを活かせるのがCLUSTERPRO
Availability Zone BAvailability Zone A
業務
データ ミラーリング
クラスタ
ノード
(待機系)
業務
データ
SQLServer
Standard
SQLServer
Standard
フェイルオーバ
業務
データ
データ同期
クラスタ
ノード
(セカンダリ)
業務
データ
クラスタ
ノード
(プライマリ)
SQLServer
Enterprise
¥1,010,000
合計 ¥3,678,000合計
SQLServer 2012 Enterprise ¥10,240,000 SQLServer 2012 Standard ¥2,668,000
¥10,240,000
SQLServer
Enterprise
クラスタ
ノード
(現用系)
「AlwaysOn可用性グループ」を利用可 ⇒ Enterprise必須
試算条件:Amazon EC2 仮想マシン2ノード、各ノード4仮想コア(※SQLServerの最小構成)。
SQLServerはボリュームライセンスの価格。CLUSTERPROはデータミラー型の最小構成価格。価格はすべて税抜のLP。
冗長化オプション (ex.SQLServer
AlwaysOn)
Page 47 © NEC Corporation 2015
CLUSTERPRO
冗長化パターン比較 ③他社HAクラスタソフトとの比較
▐ 様々なクラウドサービスに対応しているのがCLUSTERPRO
他社HAクラスタソフト (ex.WSFC)
Availability Zone BAvailability Zone A
業務
データ ミラーリング
クラスタ
ノード
(待機系)
業務
データ
クラスタ
ノード
(現用系)
フェイルオーバ
Availability Zone BAvailability Zone A
WSFC
クラスタ
ノード
(待機系)
クラスタ
ノード
(現用系)
フェイルオーバ
共有ディスク
▌ 主要クラウドサービスでは共有ディスクが提供され
ていない
▌ 共有ディスクが必須なクラスタソフトはクラウドへ
の対応が困難
▌ CLUSTERPROのデータミラー機能でクラウドでも
冗長構成が作れる
▌ AWS等の主要クラウドサービスに対応
▌ 仮想アドレスの切替方法もクラウド毎に最適化
CLUSTERPROのクラウド対応状況についてはWebサイトでご確認ください
http://jpn.nec.com/clusterpro/clp/cloud/cloud_sysrep.html
Page 48 © NEC Corporation 2015
クラウドプラットフォームの対応が豊富
▐ 国内外の多くのクラウドサービス(IaaS)で動作確認済み
詳しくはこちら →
http://jpn.nec.com/clusterpro/clp/cloud/cloud_sysrep.html
Page 49 © NEC Corporation 2015
CLUSTERPROクラスタ構築ガイド
▐ クラウドサービス毎の構築手順をWebで公開
▐ オンプレミスとの違いを中心にポイントを整理 (ex.仮想アドレスの切替方法)
詳しくはこちら → http://jpn.nec.com/clusterpro/clp/cloud/cloud_sysrep.html
※クラスタ構築ガイド未掲載のクラウドサービスについてはお問合せください。
Page 50 © NEC Corporation 2015
© NEC Corporation 2015Page 51
設定集により構築時間 短縮 CLUSTERPRO Startup Kit
構築に便利な『クラスタシステム生成仕様書』や『システムチェックリスト』を収録
■システム事(共有型/データミラー型)にチェック可能
なチェックシートを収録
■クラスタ状態遷移表(Windows/Linux)も完全収録
■各グループリソースの詳細
な仕組み
■各監視オプションや各モニ
タリソースの詳細な仕組み
■ネットワークパーティション
解決補足資料
■ウィザード形式によりスクリプト
テンプレートを収録
■若干の修正を行うだけで、個
別なシステムに最適なスクリプト
を作成することが可能
■無駄な環境構築時間の増加を防ぎ、導入をスムーズ
に実現することが可能
1.クラスタシステム生成仕様書 2. システムチェックリスト
3. 機能解説資料 4. スクリプトテンプレート
SAP HANA on AWS連携 のホワイトペーパー&連携スクリプトは 4.スクリプトテンプレートに収録されています。
4. WSFCとは違うの?
© NEC Corporation 2015Page 52
データミラー機能も用意されています
▐ disk to disk、ブロック単位、ネットワーク越しにデータ同期
▐ アプリケーションに依存せず様々な業務でデータ保護
▐ 遠隔地を結んで災害対策
▐ 最大で 8:1 クラスタ構成 (1クラスタあたり最大8個のディスク)
▐ Active/Standby が切り替わると、同期の方向も自動的に切り替わる
Availability Zone B
クラスタ
ノード
(待機系)
業務
データ
Availability Zone A
業務
データ
クラスタ
ノード
(現用系)
ミラーリング
差分ブロック
Page 53 © NEC Corporation 2015
データミラーの方式
同期モード 同期タイミング 特長 ターゲット
同期 リアルタイム • バックアップサイトへの書き込み完了を待ち合わ
せるため、常にメインサイトと同じデータを保持。
• 書き込み性能は、ネットワーク性能に依存
• データベースなど、バック
アップサイトにも最新の
データを持ちたいシステム。
• データ更新量が少ない参
照メインのシステム。
非同期 キャッシュ後、随時 • 待機系への書き込み完了を待たないため、ネッ
トワーク性能に依存しない。
• 待機系へはキャッシュした直後から随時転送し
同期。
• ファイルサーバなど、データ
更新量が多いシステム。
• パフォーマンス重視のシス
テム。
スケジュール 開始・停止タイミングを
ジョブ管理製品でスケ
ジューリング
• ジョブ管理製品と組み合わせ、任意のタイミング
で静止点を取ったデータを同期。
• 同期完了までの時間は、前回の同期時点から
の差分データ量に依存。
• 重複排除(ブロック単位)により転送量を削減。
• 切り替え時に、整合性のと
れたデータで確実に起動し
たいデータベースシステム。
• 特定の時間に更新が集中
するバッチ処理システム。
▐ 業務のデータ更新パターンやネットワーク性能にあわせて、3つの同期
モードから選択
Page 54 © NEC Corporation 2015
データミラーの方式
書き込みの流れ 読み込みの流れ
①アプリケーションからの書き込みをCLUSTERPRO
が受け取ります。
②現用系サーバへの書き込みと同時に、ネットワーク
を通じて待機系サーバへも書き込みを行います。
③両方の書き込みが揃った時点で、書き込み完了と
なります。
cp : 差分情報管理用のクラスタパーティション
mp : 業務データ用のミラーパーティション
mp
cp
mp
cp
業務AP
ミラーリング
NIC NIC
現用系への書き込み
待機系への書き込み
① ③
②
mp
cp
mp
cp
業務AP
ミラーリング
NIC NIC
現用系からの読み込み
①
①アプリケーションからの読み込みは、現用系の
ディスクから読み込まれます。
したがって、書き込みの場合のようにネットワーク
の待ち合わせは起こりません。
現用系 待機系 現用系 待機系
同期ミラーリングにより、最新のデータを確実に保護!
① 同期ミラーリング
Page 55 © NEC Corporation 2015
データミラーの方式
遠隔クラスタのように通信遅延の大きい狭帯域ネットワークを使ってディスク
ミラーリングを行う場合、非同期モードのミラーリングにより書き込み性能の
大幅な低下を避けることができます。
書き込みデータを一旦キュー
イング。バックグラウンドで
リモートディスクに書き出し
mp
cp
mp
cp
業務AP
ミラーリング
NIC NIC
① ③
②
現用系 待機系
キュー
現用系への書き込み
待機系への書き込み
キューへの書き込み
④
①アプリケーションからの書き込みをCLUSTERPROが
受け取ります。
②現用系のミラーパーティションへの書き込みと同時
に、キューへ書き込みを行います。
③現用系のミラーパーティションへの書き込みと、
キューへの書き込みが揃った時点で書き込み完了
となります。
④バックグラウンドで随時、待機系のミラーパーティ
ションへ書き込みます。
書き込みの流れ
狭帯域ネットワークでも、非同期*ミラーリングならディスク性能を落とさない!
※ 本機能に相当する機能をセミ同期と呼ぶ製品もあります。
② 非同期ミラーリング
Page 56 © NEC Corporation 2015
データミラーの方式 ③ スケジュールミラーリング
データベースなどで静止点を確保した状態でのみミラーリングを行いたい場合
には、スケジュールミラーリングが可能です。
スケジュール*ミラーリングなら、静止点を高速に同期!
※ 本機能に相当する機能を非同期と呼ぶ製品もあります。
mp
cp
mp
cp
業務AP
NIC NIC
現用系 待機系
▌ 業務稼働中は、ミラーリングをOFFにしておくことで、
待機系のデータの変更を防ぎます。
①業務稼働中
ミラーリング
OFF
差分ブロックのみ
ミラーリング
現用系への書き込み
待機系への書き込み
データ更新により
生じた差分ブロック
mp
cp
mp
cp
静止
NIC NIC
現用系 待機系
▌業務の静止点を確保した後、前回以降に更新され
た差分ブロックのみをミラーリングします。
データベース(Oracle, SQLServer, MySQL)の静止点コマンドを用意
②静止点でミラーリング
ミラーリング
ON
①②をバッチジョブとしてスケジューリングすることで、自動的に静止点のミラーリングが可能です。
Page 57 © NEC Corporation 2015
障害後のデータ復旧
障害で損傷したサーバの修復後、自動的にディスクの再同期を行い、正常なク
ラスタ状態に復帰します。
ディスクに損傷が無い場合
差分コピー、使用域コピーにより迅速に復旧!
ディスクを交換した場合
業務AP
NIC NIC
メインサイト
①バックアップサイトで業務を稼動させたまま、バック
グランドでミラーリングします。
②障害発生以降にバックアップサイトで更新された
差分ブロックのみをミラーリングします。
バックアップサイト
①
空領域
業務AP
NIC NIC
メインサイト
② 使用域コピー
①バックアップサイトで業務を稼動させたまま、バック
グランドでミラーリングします。
②ミラーディスクの使用域のみミラーリングします。
ファイルシステム上の空領域はミラーリングしません。
使用域
cp
バックアップサイト
①
使用域
mp
cp
mp
cp
② 差分コピー
空領域
cp
差分ブロック
mpmp
使用域コピー差分コピー
Page 58 © NEC Corporation 2015
導入時のポイント ①同期ミラーリング
▌ 業務アプリケーションからのデータ書き込みをストレスなく同期するためには、
ネットワークの実効速度(B)が業務アプリケーションの最大書込みデータ量(A1)を
上回る環境が必要です (A1 < B) 。
▌ A1 > B となる場合、業務アプリケーション見えにデータ同期待ちが発生します。
A1>B:
データ同期待ち
mp
cp
mp
cp
業務AP
ミラーリング
NIC NIC
現用系への書き込み
待機系への書き込み
① ③
②
現用系 待機系
B:ネットワーク
の実効速度
A1:ディスクへ
の書込み量
Page 59 © NEC Corporation 2015
導入時のポイント ②非同期ミラーリング
▌ ある時点でデータが同期されている状態に到達するためには、
ネットワークの実効速度(B)が業務アプリケーションの平均書込みデータ量(A2)
を上回る環境が必要です (A2 < B) 。
▌ 非同期ミラーリングでは、書込データをキューイングして遅延同期します。
キューがあふれると書込順序不定の差分転送にモードが切り替わります。
▌ データ保護の観点からバックアップなどの対策を行ってください。
現用系への書き込み
待機系への書き込み
キューへの書き込み
mp
cp
mp
cp
業務AP
ミラーリング
NIC NIC
① ③
②
現用系 待機系
キュー
④
B:ネットワークの
実効速度
A2:ディスクへ
の書込み量
Page 60 © NEC Corporation 2015
© NEC Corporation 2015Page 61
視覚的な運用ツールにより、一目で
問題点を把握可能
・ツリービューによる表示
・Javaベースのため、環境を問わず
利用可能
CLUSTERPRO Builder
視覚的な構築ツールにより、環境を
問わず構築が可能
・ツリービューによる表示
・Javaベースのため、環境を問わず
利用可能
CLUSTERPRO WebManager
GUIで一元参照・操作が可能(コマンド)でも可能
クラスタの作成、設定、管理が簡単
© NEC Corporation 2015Page 62
横展開が非常に簡単!
Builder
構成情報
USBメモリやCD媒体等の外部
メディアにエクスポート可能
業務
サスペンド機能による、業務を止めず
に設定反映、アップグレードが可能
サスペンドレジューム
1度作った構成の
設定情報を、同じ
構成のサーバに横
展開可能!
コマンドや
ボタン一
つでサー
バに反映
運用中サーバ
から設定ファ
イル取得も可
能
設定のインポート・エクスポート機能によりデプロイが容易
クラウドリソース (*)
Availability Zone BAvailability Zone A
業務
データ ミラーリング
クラスタ
ノード
(待機系)
業務
データ
クラスタ
ノード
(現用系)
データベースデータベース
業務アプリケーション 業務アプリケーション
仮想IP
(ルータ)
障害、災害時に自動切替
画面に値を入れるだけ!
(*)
クラウドリソースは、パブリッククラウド上にCLUSTERPROを導入する
際に使用するグループリソース、モニタリソースの総称です。製品中で
は下記の名称で表示されます。
「AWS Elastic IPリソース」、「AWS 仮想IPリソース」、「Azure プローブ
ポートリソース」、「AWS Elastic IP監視リソース」、「AWS 仮想IP監視
リソース」、「AWS AZ監視リソース」、「Azure プローブポート監視リ
ソース」、「Azure ロードバランス監視リソース」
CLUSTERPROのクラウド対応状況についてはWebサイトでご確認ください
http://jpn.nec.com/clusterpro/clp/cloud/cloud_sysrep.html
パブリッククラウド向けの設定が容易になりました。
▐ 仮想IPアドレスの切替等、クラウドサービスのAPI知識が求められる操作もGUI
に必要な値を入れるだけで設定完了。
▐ アマゾン ウェブ サービス(AWS)、Microsoft Azure に対応。
© NEC Corporation 2015Page 63
CLUSTERPRO X 3.3 新機能
6. SAP Business suite powered by
SAP HANA high availability with
CLUSTERPRO on AWS
© NEC Corporation 2015Page 64
Page 65 © NEC Corporation 2015
2015/1/30 NECプレスリリース配信!
▌本ソリューションの導入により、CLUSTERPROが、AWS
上で稼働するSAP HANAを活用したシステム全体の
障害を自動的に検知し、待機サーバに自動的に切替
えることが可能となり、基幹業務システムに求められる
高可用性および運用効率化を実現。
▌本ソリューションは、日本を含むアジア・パシフィックで
5年連続シェアNo.1を獲得している、NECの高可用性
クラスタリングソフト「CLUSTERPRO」を活用して提供。
http://jpn.nec.com/press/201501/20150130_01.html
NEC、AWS上で稼働するSAP HANA®の可用性を
向上するソリューションを販売開始
~クラウド基盤上での高信頼な基幹業務システムを実現~
Page 66 © NEC Corporation 2015
本ソリューションの背景と概要
▌Business Suiteの本稼働がサポート
2014/2より、SoHのAWS上での本番稼働サポート開始
▌SAP HANAのHA機能として、標準でSystem Replicationが提供
System Replicationの機能を使った、
SoHのAWS上での評価事例はほぼ無し
System Replicationの機能だけでは、
効率的な運用という面において、問題
がある
Business Suite on HANAの本番環境での利用が
サポートされた今、より確実な高可用性機能が求められている
https://blogs.saphana.com/2014/02/19/sap-hana-on-
aws-certification/
Page 67 © NEC Corporation 2015
本ソリューションの背景と概要
- SAP HANAのクラスターの現状
(出典) http://www.saphana.com/docs/DOC-4351
System Replication
 データ/ログ領域の同期
HW/SW(OS/ミドル)障害検知
自動Failover機能
~Client/AP Server接続先切替
System Replicationでは、本番稼働時には必要である一部の
機能は提供されておらず、HA Solution Partnerからの提供が
求められている
CLUSTERPROは、
この部分の機能を提供
Page 68 © NEC Corporation 2015
本ソリューションのポイント(1/2)
• SAP HANAソフトウェアを除く、OS/ミドルウェア障害やレスポンス低下監視機能は
提供されない
• ディスク/CPU/ネットワークといったハードウェア障害の検知機能は提供されない
SAP HANAのみ
• SAP HANAのデータベースやレプリケーションの障害に加え、OS/ミドルウェア障害
を検知可能
• ディスク/CPU/ネットワーク等のハードウェア障害を検知可能
SAP HANA+CLUSTERPRO
広範囲な障害監視を実現
~OSレイヤの障害からSAP HANAの障害までいち早く検出できます~
Page 69 © NEC Corporation 2015
本ソリューションのポイント(2/2)
• 障害発生後の自動フェイルオーバの機能は提供されていない
(オペレータがセカンダリノードで 切り替えコマンドを手動実行する)
• クライアント/アプリケーションサーバからの接続先切り替えは、自動では行われない
SAP HANAのみ
• 障害検出し、プロセス復旧が不可能である場合、自動でセカンダリノードへのフェイ
ルオーバを実施
• クライアント/アプリケーションサーバからの接続先切り替えを自動で行う
SAP HANA+CLUSTERPRO
障害発生時の自動フェイルオーバの実現
~障害発生時は自動的に切り替えて業務を継続できます~
Page 70 © NEC Corporation 2015
基本動作イメージ
- 構成イメージ
フェイルオーバグループ02
• SAP HANAをセカンダリとして起動/停止す
る
フェイルオーバグループ01
• SAP HANAをプライマリとして起動/停止する
• 仮想IPの割り当てを行う
• フェイルオーバグループ2と同じサーバへ移動
した際にTakeoverを実行
プライマリ
サーバ1
セカンダリ
サーバ2
SAP HANA用
スクリプト
フェイルオーバ
グループ01
SAP HANA
スクリプト
(プライマリ)
フェイルオーバ
グループ02
SAP HANA
スクリプト
(セカンダリ)
Page 71 © NEC Corporation 2015
サーバ1
基本動作イメージ
- 障害発生時の遷移シーケンス
プライマリ
サーバ1
セカンダリ
サーバ2
フェイルオーバ02
-
フェイルオーバ01
HANAスクリプト
(プライマリ)
サーバ2
フェイルオーバ02
HANAスクリプト
(セカンダリ)
フェイルオーバ01
HANAスクリプト
(プライマリ)
フェイルオーバ
サーバ2のSAP HANAを”プライマリ”に変更
プライマリ
[正常時]
サーバ1:SAP HANAをプライマリとして起動
:仮想IPを割り当て
サーバ2:SAP HANAをセカンダリとして起動
[サーバ1(現用系)で障害発生]
サーバ1:SAP HANAを停止(プロセス障害時)
サーバ2:SAP HANAをプライマリに変更
(takeoverコマンド実行)
:仮想IPを割り当て
フェイルオーバ01
HANAスクリプト
(プライマリ)
HANAスクリプト
(セカンダリ)
Page 72 © NEC Corporation 2015
サーバ1
基本動作イメージ
- 復旧時の遷移シーケンス
-
フェイルオーバ01
HANAスクリプト
(プライマリ)
サーバ2
フェイルオーバ02
HANAスクリプト
(セカンダリ)
プライマリ
サーバ1
フェイルオーバ02
HANAスクリプト
(セカンダリ)
セカンダリ
サーバ2
手動フェイルオーバ
フェイルオーバ01
HANAスクリプト
(プライマリ)
プライマリ
[縮退時]
サーバ1:SAP HANAが停止状態
サーバ2:SAP HANAはプライマリとして起動
:仮想IPを割り当て
[サーバ1を復旧]
サーバ1:SAP HANAをセカンダリとして起動
サーバ2:SAP HANAはプライマリとして動作を
継続
:仮想IPの割り当てを継続
フェイルオーバ01
HANAスクリプト
(プライマリ)
フェイルオーバ02
HANAスクリプト
(セカンダリ)
9. その他の導入事例
© NEC Corporation 2015Page 73
CLUSTERPROの「データミラー
型クラスタ」で冗長化しました。
クラウドのSLA(99.95+%)が適
用される冗長構成が作れたの
で、安心してクラウドに移行でき
ます。
既設システムをクラウドに移行します。いま使ってい
る某クラスタソフトが移行できるか問合せたら、動
作しないと言われました(某M社)。そ
のクラウドでは共有ディスクが提供さ
れないためだと。。。
VM を分散配置した上で
CLUSTERPROで冗長化することにより
クラウドの高いサービスレベルを享受
事例. 某情報通信業導入事例
Page 74 © NEC Corporation 2015
事例. 某情報通信業導入事例
Oracleは仮想マシン
(IaaS)に入れて、
CLUSTERPROで冗長
化しました。
さらに、Data Guardよ
りも安価に冗長化でき
ました(約1/5)。
クラウドでOracleを使おうと思っています。
冗長化も必要。クラウドサービス(PaaS)で
提供されているOracleを使おうと思ったのですが、リモー
トでアクセスできるデータしか扱えない仕
様なので、自社の業務アプリでは使えませ
んでした。
Page 75 © NEC Corporation 2015
導入事例
※事例詳細はこちらから→ http://jpn.nec.com/case/fujiyakuhin/
CLUSTERPRO XとスケーラブルHAサーバで卓越した性能と可用性を両立
ドラッグストア事業の躍進を支える全社のデータベース基盤を刷新
 ミッションクリティカルな既存DBサーバの能力が上限に近づいた
 事業拡張に伴う円滑な経営統合などに適した運用管理
 約1200店舗の発注業務の効率化
導入の背景
選定の理由
導入の効果
 既存システムの処理性能を飛躍的に上回るDB基盤の提案
 筐体障害を考慮したクラスタ設定や
仮想マシン上のDBサーバの障害対策まで施した可用性
 高速DB製品(InterSystems Caché®)提供のベンダーと
NEC本社での実機合同評価による、スケーラビリティへの安心感
 ftサーバをはじめ多数の業務サーバの稼働実績や
SI力、10年以上にわたるサポート力からの安心感
 本社分だけでも20時間かかっていた販売管理データのバッチ処理が2時間程度で終了など、
全社の月次会計処理のスピード短縮化に大きく貢献し、経営判断も迅速化
 仮想化環境でグループ会社用の新規業務システムが立ち上げ可能となり、M&Aで重要となるシステム統合が迅速化
 DBの高い処理性能により、これまでやりたかった発注業務の自動化などが推進可能
小売業,医療
販売,その他業務
事例. 株式会社富士薬品様
© NEC Corporation 2015Page 76
レジ用のサーバーがダウンした場合、システム
復帰に3時間以上の時間がかかり、1時間あた
り100万元相当(日本円にして約1,400万円)
の売上げを損失していた。
ある支店で開催された設立2周年の記念式典
の日に、POSシステム内のデータベースに障害
が発生したが、2分という短い間に、業務はス
タンバイサーバーに切り替わり、大きな損失を
回避できた。
事例詳細
http://www.nec.co.jp/library/jirei/mzdol/
事例.広西南寧夢之島商業管理有限公司様(海外事例)
CLUSTERPROを提案(海外では、
ExpressClusterブランドで販売)。サーバー間
のクラスタ構成(ミラー型、共有ディスク型)で
基幹システムの可用性を高め、社の核心業務
に関わるPOSシステムの運用安定とTCO削減
を同時に実現。
導入事例
© NEC Corporation 2015Page 77
導入の目的
導入によるメリット/システム構成
POSシステムにかかる負荷が増大することで発生するレジサーバのダウンを、既存の資産を
活用して解消すべく、高可用なシステムを構築するためNECのCLUSTERPROを導入
10.製品WEB/お問い合わせ先
© NEC Corporation 2015Page 78
試用版/動作環境/マニュアル/主要ソフトウェアのクラスタ構築ガイドなど、
豊富な情報を公開しています!
▐ CLUSTERPROホームページ
http://jpn.nec.com/clusterpro/
▐ 試用版
http://jpn.nec.com/clusterpro/clp/data/trial.html
フル機能が使える試用版をダウンロードいただけます!
▐ 動作環境
http://jpn.nec.com/clusterpro/clp/environment.html
▐ マニュアル (システム構成ガイド)
http://jpn.nec.com/clusterpro/clp/manual.html
▐ ソフトウェア構築ガイド (PPガイド)
Oracle、SQL Server他、主要ソフトウェアのクラスタ構築ガイドを公開!
(Windows) http://jpn.nec.com/clusterpro/clp/windows/document/pp_x.html
(Linux) http://jpn.nec.com/clusterpro/clp/linux/document/howto_x30.html
▐ FAQ
http://www.support.nec.co.jp/View.aspx?id=3140101267
※一部、コンテンツの閲覧にはCLUSTERPROのPP・サポートサービスのご契約が必要です。
© NEC Corporation 2015Page 79
製品ご紹介サイト/お問い合わせ先
製品ご紹介サイト
クラサバ市場秋葉原店
http://jpn.nec.com/ichiba/
サーバ/PC等、こだわりの展示品もご覧になれます
▐ CLUSTERPRO プリセールスお問合せ窓口
info@clusterpro.jp.nec.com
© NEC Corporation 2015Page 80
製品ご紹介サイト/お問い合わせ先
お問合せ先
秋葉原でデモをご覧いただけます
11.まとめ
© NEC Corporation 2015Page 81
まとめ
体制・メニュー 経験値・ノウハウ
業界No1の技術の
活用
パートナー様との
取組み
NECは高可用性技術の開発・強化に
これからも全力で取り組んでまいります
• 自社製品の筆頭とし
て当初よりWORKS
活動を展開
• 適宜専門の保守体制
• ソリューションメニュー
• 合格者数No1
• 高可用性ソリュー
ション
• 運用実装の実際
• ハンズオンセミナー
技術認定制度の
展開
CLUSTERPRO
高可用性技術
• HAクラスタをはじめ
高可用性技術を磨き
さらなる可用性向上
• 障害検出範囲の拡大化
• 自動切替で業務停止縮小
© NEC Corporation 2015
Page 82
Page 83 © NEC Corporation 2015
CLUSTERPROプリセールス支援窓口
E-mail: info@clusterpro.jp.nec.com
URL: http://jpn.nec.com/clusterpro/
ご清聴ありがとうございました
© NEC Corporation 2015Page 84
講師プロフィール
日本電気株式会社
クラウドプラットフォーム事業部 CLUSTERPROグループ
マネージャー 船田泰伸
NECで2001年より高可用性ソフトウェア 'CLUSTERPRO
(クラスタープロ)' の製品ビジネスに従事している。
製販一体の体制のもと多様化する現場の声やニーズを吸上げ設計に
反映し、製品の機能強化に取組むための橋渡しを担っている。
[DB tech showcase Tokyo 2015] B37 :オンプレミスからAWS上のSAP HANAまで高信頼DBシステム構築にHAクラスタリング技術を活用しよう by 日本電気株式会社 船田泰伸
[DB tech showcase Tokyo 2015] B37 :オンプレミスからAWS上のSAP HANAまで高信頼DBシステム構築にHAクラスタリング技術を活用しよう by 日本電気株式会社 船田泰伸

[DB tech showcase Tokyo 2015] B37 :オンプレミスからAWS上のSAP HANAまで高信頼DBシステム構築にHAクラスタリング技術を活用しよう by 日本電気株式会社 船田泰伸