HPE Integrity Superdome X
「誰でも使える」
信頼性技術ご紹介
日本ヒューレット・パッカード株式会社
サーバー事業統括本部
ミッションクリティカルソリューション製品部
プロダクトマネージャー
日野 創
2
Agenda
1. 拡大するx86 Mission Critical市場に関して
Hewlett Packard Enterprise
アジアパシフィック&ジャパンリージョン
ミッションクリティカルサーバー テクノロジーエバンジェリスト
山中 伸吾
2. 新製品紹介と「誰でも使える」信頼性技術ご紹介
日本ヒューレット・パッカード株式会社サーバー事業統括本部
ミッションクリティカルソリューション製品部プロダクトマネージャー
日野 創
• 新製品アップデート
• 信頼性技術ご紹介とデモ
-PCI Live Error Recovery
-HPE Serviceguard for Linux
• 施策のご紹介
1. 製品アップデート
従来モデル
CPU:インテル® Xeon® プロセッサー
E7 v4 ファミリー搭載
2016年 新モデル 本日販売開始
CPU:インテル® Xeon® プロセッサー
E7 v3 ファミリー搭載
HPE Integrity Superdome X
(最大288CPUコア/12TB)
HPE Integrity Superdome X
(最大384CPUコア/24TB)
業界唯一、99.999%の可用性
CPU、メモリ拡張性の向上
ブレード間通信の性能33%向上
Linux/Windows/VMwareのサポート
New
New
最小構成価格:28,517,000円(税抜)
新CPU搭載 HPE Superdome X ブレードをリリース!
5種類の Intel® Xeon® E7 v4 プロセッサー (Broadwell)をサポート
14-core processor
• E7-8855 v4 (14 nm)
• 14 Cores / 28 Threads
• 2.1 GHz Core Frequency (2.8 GHz
Turbo)
• 35 MB cache, 8.0 GT/s QPI, 140 W
10-core processor
• E7-8891 v4 (14 nm)
• 10 Cores / 20 Threads
• 2.8 GHz Core Frequency (3.5 GHz
Turbo)
• 60 MB cache, 9.6 GT/s QPI, 165 W
4-core processor
• E7-8893 v4 (14 nm)
• 4 Cores / 8 Threads
• 3.2GHz Core Frequency (3.5 GHz
Turbo)
• 60 MB cache, 9.6 GT/s QPI, 140 W
24-core processor
• E7-8890 v4 (14 nm)
• 24 Cores / 48 Threads
• 2.2 GHz Core Frequency (3.4 GHz
Turbo)
• 60 MB cache, 9.6 GT/s QPI, 165 W
22-core processor
• E7-8880 v4 (14 nm)
• 22 Cores / 44 Threads
• 2.2 GHz Core Frequency (3.3 GHz
Turbo)
• 55 MB cache, 9.6 GT/s QPI, 150 W
前世代 Intel® Xeon® E7 v3と比較して平均 1.3 倍のパフォーマンス向上
新クロスバー・ファブリック・モジュール(XFM)
ブレード間通信を最大33%高速化
新クロスバー・ファブリック・モジュール(XFM)
• ブレード1枚あたりのクロスバー帯域を
これまでの最大75GB/s から
最大100GB/s に拡大
• 筐体全体に換算すると 最大600GB/s か
ら最大800GB/s への向上
• これまでの HPE Superdome X ブレード
との互換性も確保
• 既存の筐体に対するアップグレードキット
も提供(投資保護)
同じシステムを少ないコア数で稼動、TCOを削減
HPE Integrity Superdome X
年間約6分程度のシステムダウンタイム
業界唯一、Linux/Windowsサーバーで99.999%の可用性を実現
実環境において実績値ベースで
唯一無二の高信頼性を実証
(2014年12月販売開始からのお客様実環境における実績値)
某金融業
通信業
製造業
2. 「誰でも使える」信頼性技術ご紹介
確実・超高速にスタンバイ機に
切り替えるクラスタリング機能
HPE Integrity Superdome X 信頼性機能の活躍シーン
様々なコンポーネント故障、
エラー、半死によるシステム停止
原因報告、再発防止策を行いた
いが、そもそもログ情報が
システムに残っていない
スタンバイ機を用意していたのに
切り替わらなかった
様々な障害を「封じ込め」、
「走りきる」技術
恒久対策を可能にする
「自動分析」、「詳細ログ取得」機能
HPE Superdome Xの信頼性機能の一覧
機能 説明 一般的な x86
HPE
Superdome X
メモリ保護 SDDC (Single Device Data Correction) DRAM チップが一つ壊れても大丈夫 〇 〇
メモリ保護 DDDC (Double Device Data Correction) DRAM チップが二つ壊れても大丈夫 〇
OS と連携した深刻な障害の復旧
(Advanced Error Recovery)
ハードウェアで直せない場合でも OS、
アプリと連携して障害を復旧 〇
I/O エラーの封じ込め (Error Containment) 不良データによる処理を防止 〇
I/O エラーのリカバリ(PCIe Live Error Recovery) PCIeエラーでも継続稼動 〇
物理パーティション (nPars) 電気的に隔離できる 〇
セルフヒーリング・ファブリック(End-to-end Retry) CPU 間経路の障害を自動的に復旧 〇
クロックの二重化(動的切り替え&ホットプラグ) クロック障害に対応 〇
故障箇所の自動切り離し(CPU、メモリ、ブレード) 障害箇所を切り離して稼動 〇
FW による自己診断機能(Analysis Engine) エラーの根本原因を自動的に分析 〇
ハードウェアダンプ機能 詳細なハードウェアログを自動取得 〇
これらのRAS機能により
99.999%の稼働率を実現
基幹系システムに必須な信頼性機能をユーザー側が意識する事なく利用可能
“封じ込め”
“走りきる”
自動分析
ログ取得
HPEだからできた、
「誰でも使える」信頼性技術 その1
PCIe Live Error Recovery
PCIe Live Error Recoveryとは
• PCIカードの障害をリカバリーする信頼性機能
• PCIカードが故障している場合にOSに返す不良データを
HPE Superdome X のFWがOSに届く前に自動で検知
• HPE Superdome X のFWからOSに故障しているPCIカードの初期化を命令
• PCIカードを初期化、正常な状態に復帰した段階で再度処理を実行
• これによりPCIカードの故障によるシステムダウンを回避し継続稼動を可能に
業界唯一
ユーザー側での設定は一切不要
I/O
card
(NIC,FC)
PCIe Live Error Recoveryがエラーを回避
I/O
card
(NIC,FC)
CPU
OS
(Linux)
I/O
card
(NIC,FC)
HPE Integrity Superdome X一般的なx86サーバー
ファームウェア
②不良データ
I/O
card
(NIC,FC)
CPU
OS
(Linux)
カード故障
③不良データが
到達すると、
データ保護の為に
再起動
①データ
リクエスト
①データ
リクエスト
②不良データ
③不良データをOSに
届く前に感知。
カードの初期化を実行。
④カードを初期化をして
正常な状態に復帰
データベースの信頼性向上
HPEだからできた、
「誰でも使える」信頼性技術 その2
課題
・障害発生時の切り替えに時間がかかる
スタンドアローン型データベース vs パラレル型データベース
スタンドアローン型データベース パラレル型データベース
優位点
・専門知識が不要、構築やメンテナンスが容易
・SWライセンスが安価
優位点
・障害発生時の高速な切り替え
ミッションクリティカルなシステムで使われることが多い
HPEがこの課題を解決
汎用的なシステムで使われることが多い
Stand-ByActive ActiveActive Active
課題
・設計・構築・運用の難易度が高く、
人的障害が発生するリスクが高い
・SWライセンス・保守コストが高価
確実・超高速な切り替えを実現、HPE Serviceguard for Linux
HPE Serviceguard
スタンドアローン型データベースで
パラレル型データベースシステムと
同等の切り替え時間を実現
Active Stand-by
HPE自社開発のクラスタリングSW、元々HP-UX向けに開発されナレッジを蓄積、現在はLinuxもサポート
本当にシステムが壊れたのか
システムの生死の判定が早い
=超高速な切り替え
HWベンダーとして組み合わせテストを
厳密に実施 = 確実な切り替え
HPE Serviceguard はスクリプトが
パッケージ化され、構築も容易
HPE Serviceguardはインメモリデータベースとの親和性も抜群
メモリ上でデータを同期
プライマリ
SAP HANA
SAP HANAのレプリケーション機能
・H/W,プロセス監視
・自動切り替え(インスタンス起動、停止制御)
・クライアントアクセス制御
障害
発生
SAP HANAとの高い親和性、HW障害のみならずアプリレベルの障害も検知
リアルタイムの切り替えを実現
HPE Serviceguard
セカンダリ
SAP HANA
3. 施策のご紹介
第1回 誰でも使える、HPE Integrity Superdome X セミナー
日程:
2016年10月18日(火)15:00-19:00
場所:
日本ヒューレット・パッカード株式会社 大島本社
対象:
オープン技術を活用した基幹系システムの導入・運用・移行に関わられる
ITマネージャー、ご担当者
定員:
20名
主催:
日本ヒューレット・パッカード株式会社
お申し込みURL:
http://www.hpe.com/jp/sdx-seminar
(近日公開)
参加費:
無料
本日のまとめ
• 新世代ミッションクリティカルシステムの需要が広がる中で
専門知識不要で「誰でも使える」
ミッションクリティカルインフラが求められています。
• 新CPUを搭載、メモリ容量を2倍(24TB)に増やした
HPE Integrity Superdome Xを本日発表します。
• HPE Integrity Superdome Xは、
地球上の全てのx86アプリケーションを特殊なスキル不要で
ミッションクリティカル化することが可能です。
(99.999%の可用性)
• HPE Serviceguardを用いれば、構築・管理が簡単なスタンド
アローン型データベースで、パラレル型データベースと同様の
切り替え時間の高信頼性をシステムを容易に構築することが
可能です。
Mission Critical to Everyone
Thank you

HPE Superdome X 製品技術説明会(その2)

  • 1.
    HPE Integrity SuperdomeX 「誰でも使える」 信頼性技術ご紹介 日本ヒューレット・パッカード株式会社 サーバー事業統括本部 ミッションクリティカルソリューション製品部 プロダクトマネージャー 日野 創
  • 2.
    2 Agenda 1. 拡大するx86 MissionCritical市場に関して Hewlett Packard Enterprise アジアパシフィック&ジャパンリージョン ミッションクリティカルサーバー テクノロジーエバンジェリスト 山中 伸吾 2. 新製品紹介と「誰でも使える」信頼性技術ご紹介 日本ヒューレット・パッカード株式会社サーバー事業統括本部 ミッションクリティカルソリューション製品部プロダクトマネージャー 日野 創 • 新製品アップデート • 信頼性技術ご紹介とデモ -PCI Live Error Recovery -HPE Serviceguard for Linux • 施策のご紹介
  • 3.
  • 4.
    従来モデル CPU:インテル® Xeon® プロセッサー E7v4 ファミリー搭載 2016年 新モデル 本日販売開始 CPU:インテル® Xeon® プロセッサー E7 v3 ファミリー搭載 HPE Integrity Superdome X (最大288CPUコア/12TB) HPE Integrity Superdome X (最大384CPUコア/24TB) 業界唯一、99.999%の可用性 CPU、メモリ拡張性の向上 ブレード間通信の性能33%向上 Linux/Windows/VMwareのサポート New New 最小構成価格:28,517,000円(税抜)
  • 5.
    新CPU搭載 HPE SuperdomeX ブレードをリリース! 5種類の Intel® Xeon® E7 v4 プロセッサー (Broadwell)をサポート 14-core processor • E7-8855 v4 (14 nm) • 14 Cores / 28 Threads • 2.1 GHz Core Frequency (2.8 GHz Turbo) • 35 MB cache, 8.0 GT/s QPI, 140 W 10-core processor • E7-8891 v4 (14 nm) • 10 Cores / 20 Threads • 2.8 GHz Core Frequency (3.5 GHz Turbo) • 60 MB cache, 9.6 GT/s QPI, 165 W 4-core processor • E7-8893 v4 (14 nm) • 4 Cores / 8 Threads • 3.2GHz Core Frequency (3.5 GHz Turbo) • 60 MB cache, 9.6 GT/s QPI, 140 W 24-core processor • E7-8890 v4 (14 nm) • 24 Cores / 48 Threads • 2.2 GHz Core Frequency (3.4 GHz Turbo) • 60 MB cache, 9.6 GT/s QPI, 165 W 22-core processor • E7-8880 v4 (14 nm) • 22 Cores / 44 Threads • 2.2 GHz Core Frequency (3.3 GHz Turbo) • 55 MB cache, 9.6 GT/s QPI, 150 W 前世代 Intel® Xeon® E7 v3と比較して平均 1.3 倍のパフォーマンス向上
  • 6.
    新クロスバー・ファブリック・モジュール(XFM) ブレード間通信を最大33%高速化 新クロスバー・ファブリック・モジュール(XFM) • ブレード1枚あたりのクロスバー帯域を これまでの最大75GB/s から 最大100GB/sに拡大 • 筐体全体に換算すると 最大600GB/s か ら最大800GB/s への向上 • これまでの HPE Superdome X ブレード との互換性も確保 • 既存の筐体に対するアップグレードキット も提供(投資保護) 同じシステムを少ないコア数で稼動、TCOを削減
  • 7.
    HPE Integrity SuperdomeX 年間約6分程度のシステムダウンタイム 業界唯一、Linux/Windowsサーバーで99.999%の可用性を実現 実環境において実績値ベースで 唯一無二の高信頼性を実証 (2014年12月販売開始からのお客様実環境における実績値) 某金融業 通信業 製造業
  • 8.
  • 9.
    確実・超高速にスタンバイ機に 切り替えるクラスタリング機能 HPE Integrity SuperdomeX 信頼性機能の活躍シーン 様々なコンポーネント故障、 エラー、半死によるシステム停止 原因報告、再発防止策を行いた いが、そもそもログ情報が システムに残っていない スタンバイ機を用意していたのに 切り替わらなかった 様々な障害を「封じ込め」、 「走りきる」技術 恒久対策を可能にする 「自動分析」、「詳細ログ取得」機能
  • 10.
    HPE Superdome Xの信頼性機能の一覧 機能説明 一般的な x86 HPE Superdome X メモリ保護 SDDC (Single Device Data Correction) DRAM チップが一つ壊れても大丈夫 〇 〇 メモリ保護 DDDC (Double Device Data Correction) DRAM チップが二つ壊れても大丈夫 〇 OS と連携した深刻な障害の復旧 (Advanced Error Recovery) ハードウェアで直せない場合でも OS、 アプリと連携して障害を復旧 〇 I/O エラーの封じ込め (Error Containment) 不良データによる処理を防止 〇 I/O エラーのリカバリ(PCIe Live Error Recovery) PCIeエラーでも継続稼動 〇 物理パーティション (nPars) 電気的に隔離できる 〇 セルフヒーリング・ファブリック(End-to-end Retry) CPU 間経路の障害を自動的に復旧 〇 クロックの二重化(動的切り替え&ホットプラグ) クロック障害に対応 〇 故障箇所の自動切り離し(CPU、メモリ、ブレード) 障害箇所を切り離して稼動 〇 FW による自己診断機能(Analysis Engine) エラーの根本原因を自動的に分析 〇 ハードウェアダンプ機能 詳細なハードウェアログを自動取得 〇 これらのRAS機能により 99.999%の稼働率を実現 基幹系システムに必須な信頼性機能をユーザー側が意識する事なく利用可能 “封じ込め” “走りきる” 自動分析 ログ取得
  • 11.
  • 12.
    PCIe Live ErrorRecoveryとは • PCIカードの障害をリカバリーする信頼性機能 • PCIカードが故障している場合にOSに返す不良データを HPE Superdome X のFWがOSに届く前に自動で検知 • HPE Superdome X のFWからOSに故障しているPCIカードの初期化を命令 • PCIカードを初期化、正常な状態に復帰した段階で再度処理を実行 • これによりPCIカードの故障によるシステムダウンを回避し継続稼動を可能に 業界唯一 ユーザー側での設定は一切不要
  • 13.
    I/O card (NIC,FC) PCIe Live ErrorRecoveryがエラーを回避 I/O card (NIC,FC) CPU OS (Linux) I/O card (NIC,FC) HPE Integrity Superdome X一般的なx86サーバー ファームウェア ②不良データ I/O card (NIC,FC) CPU OS (Linux) カード故障 ③不良データが 到達すると、 データ保護の為に 再起動 ①データ リクエスト ①データ リクエスト ②不良データ ③不良データをOSに 届く前に感知。 カードの初期化を実行。 ④カードを初期化をして 正常な状態に復帰
  • 14.
  • 15.
    課題 ・障害発生時の切り替えに時間がかかる スタンドアローン型データベース vs パラレル型データベース スタンドアローン型データベースパラレル型データベース 優位点 ・専門知識が不要、構築やメンテナンスが容易 ・SWライセンスが安価 優位点 ・障害発生時の高速な切り替え ミッションクリティカルなシステムで使われることが多い HPEがこの課題を解決 汎用的なシステムで使われることが多い Stand-ByActive ActiveActive Active 課題 ・設計・構築・運用の難易度が高く、 人的障害が発生するリスクが高い ・SWライセンス・保守コストが高価
  • 16.
    確実・超高速な切り替えを実現、HPE Serviceguard forLinux HPE Serviceguard スタンドアローン型データベースで パラレル型データベースシステムと 同等の切り替え時間を実現 Active Stand-by HPE自社開発のクラスタリングSW、元々HP-UX向けに開発されナレッジを蓄積、現在はLinuxもサポート 本当にシステムが壊れたのか システムの生死の判定が早い =超高速な切り替え HWベンダーとして組み合わせテストを 厳密に実施 = 確実な切り替え HPE Serviceguard はスクリプトが パッケージ化され、構築も容易
  • 17.
    HPE Serviceguardはインメモリデータベースとの親和性も抜群 メモリ上でデータを同期 プライマリ SAP HANA SAPHANAのレプリケーション機能 ・H/W,プロセス監視 ・自動切り替え(インスタンス起動、停止制御) ・クライアントアクセス制御 障害 発生 SAP HANAとの高い親和性、HW障害のみならずアプリレベルの障害も検知 リアルタイムの切り替えを実現 HPE Serviceguard セカンダリ SAP HANA
  • 18.
  • 19.
    第1回 誰でも使える、HPE IntegritySuperdome X セミナー 日程: 2016年10月18日(火)15:00-19:00 場所: 日本ヒューレット・パッカード株式会社 大島本社 対象: オープン技術を活用した基幹系システムの導入・運用・移行に関わられる ITマネージャー、ご担当者 定員: 20名 主催: 日本ヒューレット・パッカード株式会社 お申し込みURL: http://www.hpe.com/jp/sdx-seminar (近日公開) 参加費: 無料
  • 20.
    本日のまとめ • 新世代ミッションクリティカルシステムの需要が広がる中で 専門知識不要で「誰でも使える」 ミッションクリティカルインフラが求められています。 • 新CPUを搭載、メモリ容量を2倍(24TB)に増やした HPEIntegrity Superdome Xを本日発表します。 • HPE Integrity Superdome Xは、 地球上の全てのx86アプリケーションを特殊なスキル不要で ミッションクリティカル化することが可能です。 (99.999%の可用性) • HPE Serviceguardを用いれば、構築・管理が簡単なスタンド アローン型データベースで、パラレル型データベースと同様の 切り替え時間の高信頼性をシステムを容易に構築することが 可能です。 Mission Critical to Everyone
  • 21.

Editor's Notes

  • #6 Tour the Product
  • #13 ■プロセス 1.障害が起こった際にFWが障害を検知してOSとやりとりをして待ってもらう 2.FWがPCIカードの初期化を実施する。 3.初期化がうまくいかなかった場合に壊れているカードを切り離す
  • #14 ■プロセス 1.障害が起こった際にFWが障害を検知してOSとやりとりをして待ってもらう 2.FWがPCIカードの初期化を実施する。 3.初期化がうまくいかなかった場合に壊れているカードを切り離す
  • #18 基幹システムはクラスタリングが必須