[A32] NonStop SQL インターナル: レガシーにして最新テクノロジーが明かされる by Toshimitsu Hara

566 views
456 views

Published on

Published in: Technology
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
566
On SlideShare
0
From Embeds
0
Number of Embeds
7
Actions
Shares
0
Downloads
18
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

[A32] NonStop SQL インターナル: レガシーにして最新テクノロジーが明かされる by Toshimitsu Hara

  1. 1. A32: 垂直統合垂直統合のメリットとは? - OSと統合されたDBMSの実力- OSと統合されたDBMSの実力 2014年6月20日2014年6月20日 日本ヒューレット・パッカード株式会社 プリセールス統括本部 サーバー技術本部 © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 原 敏光
  2. 2. HP NonStop SQLって何? なにそれ?! どっかで聞いた ことあるかも・・・ PostgreSQLの クラ タセ ト ぶっちゃけ全く 知らない す o サ バ 上 稼動する クラスタセット? 知らないっす orz HP Integrity NonStopサーバー上で稼動する 高可用でスケーラブルな商用RDBMSです! © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.2 高可用 ケ ラ な商用 す
  3. 3. HP Integrity NonStopサーバーとは 40年間の実績を誇るの実績を誇るHPHPブランドの無停止型コンピューターシステムですブランドの無停止型コンピューターシステムです 2014 HP Integrity NonStop NS2400/NS2300 発表 !!2014 HP Integrity NonStop NS2400/NS2300 発表 !! 2013 HP Integrity NonStop BladeSystem 56000c 発表 !! 2011 HP Integrity NonStop BladeSystem 54000c 発表 2008 ブレードアーキティクチャを採用HP Integrity NonStop BladeSystem NB50000c 発表 2005 インテル® Itanium® プロセッサー搭載 HP Integrity NonStop NS16000 サーバー 発表 2002 HPとCompaqが合併し新生HP誕生 1998 CompaqとTANDEM COMPUTERSが合併 1993 NonStop Himalaya Kシリーズ 発表 1979 日本タンデムコンピューターズ 設立 1975 NonStop System 誕生1975 NonStop System 誕生 1974 TANDEM COMPUTERS 設立 © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.3
  4. 4. ワ ルドワイドでのお客様ご利用状況 NonStopサーバーによるミッションクリティカルシステム ワールドワイドでのお客様ご利用状況 金融サービス 通信・メディア 流通・製造 サービス ヘルスケア 政府・公共機関サ ビス 政府 公共機関 – ペイメントシステム: クレジッ ト、デビット、POS、資金決済 – 為替取引、証券取引 – HLR (Home Location Register) – インテリジェント・ネットワーク、 第3世代サービス – メッセージング – 生産管理、製造制御 – 受発注、チケット予約 – EDI、データ集配信 – 電子患者記録 – 国防関連 – 警察、消防の緊急指示 システム– メッセ ジング システム – 全世界の ATM トランザク ションの 70% を処理 全世界のクレジットカード – 世界最大の ISP における メッセージングシステム – HLR ソリューションで管理 – 世界最大規模の自動車 メーカにおける生産管理 システム – 多くの世界最大級の大 学付属病院を含む、200 以上の病院 © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.4 – 全世界のクレジットカ ド トランザクションの 2/3 を 処理 – HLR ソリュ ションで管理 されている端末は3億以上 – 世界規模の旅行予約シ ステム – 国家安全保障
  5. 5. (参考) HP NonStopサーバーラインナップ !! NEW !! NB56000c 4core •2~4CPU /1ノード NS2400/ NS2300 !! NEW !! NB56000c 2core •2~16CPU /1ノード •最大255ノード =4080CPU •Blade Enclosure / •最大255ノード =1020CPU •Rack Mount CPU •2~16CPU /1ノード •最大255ノード =4080CPU •Blade Enclosure •最新Itaniumプロセッサを搭載した ハイスペックサーバー。最高の パフォーマンスを提供 ブレ ドア キテクチャの採用に •NonStop サーバーの特長はすべ て継承しつつ、最高のプライス パフォーマンスを実現した、ロー エンドクラスの NonStop サーバー •最新Itaniumプロセッサを搭載した ハイスペックサーバー。高いコスト パフォーマンスと拡張性を提供 ブレ ドア キテクチ の採用に•ブレードアーキテクチャの採用に より、柔軟な構成と、リニアな スケーラビリティーを実現 •ブレードクラスター(FCメッシュ接続)に より超大規模システムを容易に構築 エンドクラスの NonStop サ バ •拡張性を制限し、標準コンポー ネントの採用を進めたことにより 最高のプライスパフォーマンス を実現。UNIX サーバと同等価格 •ブレードアーキテクチャの採用に より、柔軟な構成と、リニアな スケーラビリティーを実現 •4Coreにオンラインアップグレード が 可能 © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.5 より超大規模システムを容易に構築 が 可能
  6. 6. NonStopSQLとは 「HPNonStopサーバー上で NonStopOSと一体化して稼動するNonStopOSと 体化して稼動する ANSI準拠のRDBMSです」 「リアルタイム性にすぐれ データの一貫性を保障するデ タの 貫性を保障する ミッションクリティカル用途に最適な DBMSです」 © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. DBMSです」
  7. 7. 他DBMSでは実現できないことがHP NonStop SQLでは実現可能です HP NonStop SQLの4大特徴 他DBMSでは実現できないことがHP NonStop SQLでは実現可能です 24時間×365日 絶対的な高可用 スケールアウトが容易なDB • NonStopサーバーHWとNonStop OSが実現する高い 可用性をそのまま受け継いだNonStop SQL •1台のサーバのみで、他では実現できない可用性 を提供 • NonStopサーバーの特徴であるシェアード・ナッシ ング・コンセプトを活かした超並列データベース • HWリソースを足せば足しただけ直線的に性能の 増加が期待できる 運用負荷が軽減→TCO削減 立す バを 台 が 能 安心のサポート体制 ま• 乱立するDB/周辺サーバを1台にコンソリが可能 • バージョンUP時は上位コンパチをhpが保証 • HW増設・交換、DBバックアップや再編成など ほぼすべての作業がオンライン中に可能 • HWからOS、DBMS、JVMやFrameworkまで、 すべてHPによる1社サポートを実現 • 問題発生時の切り分けや原因追求がスムースに © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.7
  8. 8. 直線的拡張性 「スケールアウト可能なDB」 HWリソースの追加で容易にパフォーマンス増強HWリソ スの追加で容易にパフォ マンス増強 他DBMS では NonStop SQLでは • クラスター構成の場合 サーバーを増設するとクラスタウェア • 共有要素のないシェアードナッシングがコンセプトなので• クラスタ 構成の場合、サ バ を増設するとクラスタウェア や、共有DISKなどでボトルネックがおきすい • HWリソースを追加しても性能は頭打ちになりがち • DBサーバーをスケールアウトさせるのは難しい • 共有要素のないシェア ドナッシングがコンセプトなので、 HWリソースを追加すれば線形に性能がえられる • 処理増にはスケールアウトで対応できるので、キャパシ ティープランや投資計画が容易。スモールスタートでトランザ クションの伸びに応じて柔軟に増設可能 ServerServer Server Server • 性能を出すためにはスケールアップか、別のクラスタセットを 立てて対応せざるをえない e クションの伸びに応じて柔軟に増設可能 • HW増設もサービスを止めることなくオンラインで可能 Server Server Server e Add-on Server Add-on DB DB DB HW Add on Performanc スケールしない Cluster OS DB HW Add on Performanc ServerNet OS DB OS DB スケール アウト OS DB © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.8 HW Add-on HW Add-on 複数サーバー構成 1台のサーバー
  9. 9. 他者DBクラスタ 構成と 同等性能 同等処理条件で拡張性のベンチマ クを行 た (参考)他DBとのスケーラビリティー比較 他者DBクラスター構成と、同等性能、同等処理条件で拡張性のベンチマークを行った 結果、NonStop SQLはメンバー(Blade CPU)追加に応じてリニアに性能が伸びました Oracle RAC Scalability < HIGH Load > 10,000 12,000 14,000 Throughput (TPS) Oracle RAC vs SQL/MX Scalability < HIGH Load > 10,000 12,000 14,000 Throughput (TPS)他DB クラスター NonStop SQL 4,000 6,000 8,000 直線的に伸びない サチュレーション 4,000 6,000 8,000 他DB 0 2,000 1 2 3 4 # of Nodes ( Each 2 CPU) 1node 2node 3node 4node 0 2,000 1 2 3 4 # of Nodes ( Each 2 CPU) 2CPU 4CPU 6CPU 8CPU © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.9 1node (4core) 2node (8core) 3node (12core) 4node (16core) 2CPU (4core) 4CPU (8core) 6CPU (12core) 8CPU (16core)
  10. 10. 他DBMSとのダウンタイムの比較 データベース可用性に関する実績 <あるDBMSの User Groupの調査結果> 他DBMSとのダウンタイムの比較 • 1年間のうちに、ユーザーの 50% は4時間以上のシステム 停止を経験 うち 12% は24時間以上の業務影響 <N St サ バ 継続性> • そのうち、12% は24時間以上の業務影響 <NonStop サーバー継続性> • NonStop SQL のシステム可用性は、年間99.999%以上 • 27年間サービス無停止の顧客事例も © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.10
  11. 11. 高可用性 「サービスは継続できる」 システム構成の違いでアベイラビリティーに差が • NonStopサーバーのSW無停止性がDBMS内に実装• HA構成やクラスタリングによる可用性 ノ ド障害時にはフェルオ バ やクラスタ 再構成 他DBMS では NonStop SQLでは システム構成の違いでアベイラビリティ に差が • 障害の起きたプロセッサーのDBエンジン(DAM)は数秒 のうちに他プロセッサーにて処理を継続(Takeover) • プロセッサー障害時でも業務処理は続行 • ノード障害時にはフェルオーバーやクラスター再構成 や、データベース・リカバリーが行われる • 障害復旧中は数分レベルで全業務停止を伴う プロセ サ プロセ サ プロセ サ プロセ サプロセッサー OLTP CRM Batch プロセッサー OLTP CRM Batch プロセッサー OLTP CRM Batch プロセッサー OLTP CRM Batch ストレージ製品 FC Switch Batch DAM Batch DAM Batch DAM Batch DAM ServerNet DAM © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.11 全業務停止 シングルデータベース
  12. 12. NonStop OSに組み込まれたソフトウ ア冗長化機能 HP NonStopサーバー無停止実現のアーキテクチャー NonStop OSに組み込まれたソフトウェア冗長化機能 プロセスペア技術による 基本ソフトウェアの無停止化 CPU 0 CPU 1 CPU 2 CPU 3 PrimaryBackup PrimaryBackup • フェイルオーバー(再起動)ではなく、テイクオー バー(処理継続)がコンセプト • NonStop OS や、基幹ミドルウェアは、すべてプロ セスペアにて実装 Primary Backup Primary Backup Primary Backup セスペアにて実装 • 2CPUに、2プロセスがペアとして存在する • 実稼動するのは、Primaryプロセスのみ • Backupプロセスは継続に必要となる情報を Primaryプロセスから定期的に受信 CPU 0 CPU 1 CPU 2 CPU 3 CPU 障害 OSレベルでの実装により 即時・確実に障害を検出 Primaryプロセスから定期的に受信 • 論理的には、1プロセスとして扱える • Primaryプロセスの異常終了や、CPUダウンが起 きると、自動的にBackupがPrimaryに昇格して、ダ ウン直前の状態から処理を継続実行する Primary Primary Primary PrimaryBackup Primary Backup © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.12 ウン直前の状態から処理を継続実行する • データの整合性もトランザクション保護製品により、 自動的に一貫性を保持 Primary
  13. 13. NonStop SQLの容易な管理 サーバ管理の負荷を究極的にコンソリデーション 他DBMSでは HP NonStop SQLでは DB Server#1 DB Server#2 DB Server#3 サ バ管理の負荷を究極的にコンソリデ ション ALL IN ONE! DB Server DB Server#1 DB Server#2 DB Server#3 FC Switch × 2共有Storage#1 共有Storage#2 Storage 管理 Server 同期 Storage Batch Server Backup Server 同期 DB Server#4 DB Server#5 Backup Server •1台のサーバーで比類なき可用性を実現 •1台のデータベースサーバーで複数業務の混在が可能 •ログ監視も1台、SW管理も1台が対象 •DBサーバーは ×業務数 ×HA構成と多数に •仮想化でコンソリしてもログやSW管理対象は多数 Batch Server#1 Batch Server#2 Batch 制御 Server © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.13 •クラスタウェア等の煩雑な設定は不要 •仮想化でコンソリしてもログやSW管理対象は多数 •現用/待機管理や、クラスタの設定などタスクは複雑
  14. 14. HPNonStopSQL OS統合により実現している付加価値OS統合により実現している付加価値 「優先度制御機能」 「データの保護–LostWrite防止」 「トランザクション制御負荷の最適化」 © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
  15. 15. HPNonStopSQL OS統合により実現している付加価値OS統合により実現している付加価値 「優先度制御機能」 「データの保護–LostWrite防止」 「トランザクション制御負荷の最適化」 © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
  16. 16. 統合DBを容易に構築 ~優先度制御機能 多種多様なデータベース処理 管理作業の混在を容易にします 他DBMSでは NonStop SQLでは Server プロセッサ プロセッサ プロセッサ プロセッサ 多種多様なデ タベ ス処理、管理作業の混在を容易にします OS • 複数業務からの要求を1つのDB サーバーで混在させると、互いに 悪影響をおよぼす • OLTPはBatchなどが同時に動くとレ データベース OLTP 分析 Batch OS データベース Batch 分析 OLTP 190 120 50 要求に与えた優先度 が、DISKアクセスにま で引き継がれる 競合 は などが同時に動くとレ スポンスを担保できない • 優先度をつけたとしてもDISKアクセ スまでは制御できない Server ServerServer シングル・データベース 高優先度のデ タアクセスは 他のアクセスによるシステ OS DB OLTP OS DB OS DB 分析 Batch • 業務が複数ある場合には、業務ご とにサーバーとデータベースを 別々に構築 • データベース間をどう連携するか 考慮が必 • 高優先度のデータアクセスは、他のアクセスによるシステ ム高負荷時にもレスポンスを維持 • 1台のサーバー、シングルDBで複数業務の混在が可能 • 同じ鮮度のデータが誰からも共有できる「統合DB」の構築 が © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.16 の考慮が必要 • 統合DBの構築は難しい が容易に可能
  17. 17. “古くて新しい” 技術的な課題があります 複合処理の効率的稼働のための要件 古くて新しい 技術的な課題があります 1. 高優先度のDBアクセスは、低優先度のDBアクセスより常に優先的に処理される 必要があります必要があります − CPU時間に加えI/Oバンド幅を高優先度の処理に優先的に割り当てることが必要です 2. 低優先度の処理も、高優先度の処理がない状況では100%のシステム性能を活 用できるべきです − 使用可能なリソース制限枠を設ける方式では不十分です 高率的な複合処理システムを実現するには、プロセスのディスパッチ、 システムリソースの制御を司るOSとの緊密な統合が必要です 高率的な複合処理システムを実現するには、プロセスのディスパッチ、 システムリソースの制御を司るOSとの緊密な統合が必要です © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.17 システムリソ スの制御を司るOSとの緊密な統合が必要です。システムリソ スの制御を司るOSとの緊密な統合が必要です。
  18. 18. 単純なプロセス優先度では解決できない複数の課題があります 複合処理最適化の主な課題 単純なプロセス優先度では解決できない複数の課題があります < CPUリソースの割り当て問題 > 1. プロセス優先度の逆転 < I/Oリソースの割り当て問題 > 2. 過剰な先読みI/Oの発生 © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.18
  19. 19. 単純なプロセス優先度では解決できない複数の課題があります 1. プロセス優先度の逆転問題 単純なプロセス優先度では解決できない複数の課題があります 問題① pri=50のプロセスへのサービス実行がpri=220の プロセス優先度、もしくは データソース優先度 OLTP BATCH pri 50のプロセスへのサ ビス実行がpri 220の DAMで実行されることで優先度が逆転し、pri=180 のプロセスの実行を妨げる 問題② OLTP 優先度高 pri=180 優先度低 pri=50 問題①問題② 問題② 同一のDAMにリクエストが届く場合、実行順が単純 なFIFOではpri=180のプロセスへのサービスを優先 処理することができない DAM: Data Access Manager 論理ディスク毎に起動されるDBエンジン機能とDisk I/O DAM 優先度高 pri=220 DAM 優先度高 pri=220 © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.19 論理ディスク毎に起動されるDBエンジン機能とDisk I/O 機能を内包するNonStop SQL中核プロセス論理 ディスク 論理 ディスク
  20. 20. 単純なプロセス優先度では解決できない複数の課題があります 1. プロセス優先度の逆転問題 – NonStop SQLでの解決 単純なプロセス優先度では解決できない複数の課題があります 解決① プロセスディスパッチを制御するReady Listへの プロセス優先度、もしくは データソース優先度 OLTP BATCH DAMの登録にリクエスト優先度を用いる 定期的に(1ブロック処理毎など)Ready Listを チェックし、処理中のリクエスト優先度より高い優 先度のプロセスが待っている場合、自発的にCPU 解決① DAMをリク スト解決② OLTP 優先度高 pri=180 優先度低 pri=50 先度のプロセスが待っている場合、自発的にCPU をリリースする 解決② DAMをリクエスト 優先度でディス パッチし、高優先 度リクエスト到着 をチェック 解決② 優先度順の リクエスト キューを実装 50 DAMが管理するリクエストキューはクライアントプロ セスの優先度順で管理する 高い優先度リクエストに抜かれる度に優先度は1 つ加算され キュー内の長時間滞留を防止 DAM 優先度高 pri=50 (220) DAM 優先度高 pri=180 (220) 180 © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.20 つ加算され、キュ 内の長時間滞留を防止 論理 ディスク 論理 ディスク
  21. 21. 単純なプロセス優先度では解決できない複数の課題があります 2. 過剰な先読みI/Oの発生問題と解決 単純なプロセス優先度では解決できない複数の課題があります • 多量データのスキャン等を高速化するため、多数の 先読みディスクI/Oがキューイングされます CPUブレード キューイング先読みディスクI/Oがキ イングされます • 低優先度のプロセスから過剰な先読みI/Oが発生す ると、高優先度のサービスのためのI/Oが遅延します OLTP 優先度高 pri=180 BATCH 優先度低 pri=50 キュ イング I/O情報 • DAMがCPU内のキューイングI/O状況をチェックでき DAM 優先度高 pri=50 (220) DAM 優先度高 pri=180 (220) DAM 優先度高 pri=100 (220) る制御メモリを実装 • 高優先度のI/O発生時はキューイング数を抑止し、 過剰なキューイング要求発生時には優先度に従っ 論理論理 pri 180 (220) 論理 制御 された 先読み I/O 制御 された 先読み I/O 制御 された 先読み I/O © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.21 たWAITを入れます 論理 ディスク 論理 ディスク 論理 ディスク
  22. 22. HW OS DBMSの統合により最適なソリ ションを提供 複合処理最適化機能実装のポイント HW, OS, DBMSの統合により最適なソリューションを提供 1. OSの実装するプロセス間通信が、プロセス優先度を確実 にDAMに伝達され 優先度順リク ストキ を実装にDAMに伝達され、優先度順リクエストキューを実装 2. OSのディスパチャーに機能を実装することで、高優先度の リクエスト処理に優先的にCPUリソースを配分 3 DAMがリクエストをチェックする間隔は、HW機種、DBMS3. DAMがリクエストをチェックする間隔は、HW機種、DBMS バージョン毎に最適化されることで、最小のオーバーヘッド で最高の効果を実現 © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.22
  23. 23. HPNonStopSQL OS統合により実現している付加価値OS統合により実現している付加価値 「優先度制御機能」 「データの保護–LostWrite防止」 「トランザクション制御負荷の最適化」 © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
  24. 24. Lost Write ディスクへのWrite処理がDBMSからは完了に見えながら完了していない状態ディスクへのWrite処理がDBMSからは完了に見えながら完了していない状態 Writeデータを失う原因の所在により、以下の2つのケースがあります。 < 狭義のL t W it >< 狭義のLost Write > OS、デバイスドライバ、コントローラの不備で、CPUがWrite完了通知を受けたにも関わらず、 ディスクへのWriteが完了していない状況が発生する問題 < 広義のLost Write > DBMS等がWriteしたデータが、SW障害やHW障害により完全なWriteがされていないのに Write完了通知がなされること いずれもデータ損失を招く重大な問題の原因になり得る事象です。 HP NonStopサーバーは、HDD, デバイスドライバー, OS, DBMSをHP NonStopサーバーは、HDD, デバイスドライバー, OS, DBMSを © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.24 HP NonStopサ バ は、HDD, デバイスドライバ , OS, DBMSを 統合して製品開発を行うことで、データ損失のリスクを回避しています。 HP NonStopサ バ は、HDD, デバイスドライバ , OS, DBMSを 統合して製品開発を行うことで、データ損失のリスクを回避しています。
  25. 25. HP NonStop OSの提供するLost Write防止機能 確実なディスクへのWrite実行 : 狭義のLost Writeへの対応確実なディスク のWrite実行 : 狭義のLost Write の対応 汎用OSでは、OSそのもの、デバイスドライバー、もしくはコントローラの不備により、DBMSからのWrite 要求に完了を通知していながら、実際にはWriteが完了していない状況が発生することがあります。 その状況下で障害が発生するとデ タ整合性が破れ デ タ損失につながる危険性がありますその状況下で障害が発生するとデータ整合性が破れ、データ損失につながる危険性があります。 HP NonStopサーバーは、HDD、コントローラ、デバイスドライバー、OSを統合して製品開発を行っており、 必要な際には確実にHDD内までデータを書き込む機能を実現しており、このようなデータ破損のリスク はありませんはありません。 DBMS DBMS < Lost Write防止機能無し> < HP NonStopサーバー > ドライバー O S Write命令 Write完了 ドライバー (Disk Process) NonStop OS Write命令 Write完了 コントロ ラ ントロ ラ 確実なデータフラッシュ SCSI命令の発行 コントローラはキャッ シュを持たずHDDから の応答をそのまま通知 © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.25 ? 遅延Write ○ 確実なWrite Write完了 コントローラ コントローラ の応答をそのまま通知 HDDの書き込み完了応 答を待ってWrite完了
  26. 26. HDD故障によるLost Write(書き込みデータ喪失)への対応 HDDの稀な故障状態によるLost Writeの発生: 広義のLost WriteHDDの稀な故障状態によるLost Writeの発生: 広義のLost Write HDDのインターフェースは稼働しているが、メディアに障害が発生する稀な故障においては、ドライ バーからのWrite要求にHDDが完了を通知していながら、実際にはWriteが完了していない(一部もしく は全データがWriteされていない)状況が発生することがありますは全デ タがWriteされていない)状況が発生することがあります。 そのような障害が発生すると、片系ディスクのデータは破損していながらCPUはそれを検知せず、その データを後続の処理で使用してしまう危険性があります。 NonStopサーバーは このようなケースを含め 2段階の堅牢なチェックサム機能を適用することでNonStopサーバーは、このようなケースを含め、2段階の堅牢なチェックサム機能を適用することで データ破損を確実に検知し、データ整合性を保証する機能を提供しています。(詳細後述) DBMS ドライバー (Disk Process) NonStop OS Write命令 Write完了 命令 コントローラ © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.26 Write命令 Write完了 I/F チップ ? HW障害 (一過性 or 恒久的)
  27. 27. HDD故障によるLost Write(書き込みデータ喪失)防止機能 全ディスクファイルに2段階のチェックサムを適用 NonStop OSのファイルシステムは、堅牢性、データ保全性を第一に設計されています。 データ破損検知のため全ディスクファイル(プログラム、テキストファイル等を含む全て)に、通常のブ ロック内チェックサムに加え ブロック単位のチェックサムをファイル中の専用領域(チェックサムブロッロック内チェックサムに加え、ブロック単位のチェックサムをファイル中の専用領域(チェックサムブロッ ク)に保持し、READ実行時に毎回チェックを行います。これにより、HP NonStopサーバーではブロック データ全体のLost、ブロックデータの一部破損の両方を確実に検知します。 デ スクプ セス機能の動作を以下に記述します 1. ディスクからデータブロックをREADする 2. ディスクプロセスはREAD時にチェックサムを 再計算しデータ破損を確実に検出 1. データREAD 2. チェックサム データ 破損検出 3. ミラーディスク データREAD ディスクプロセス 再計算しデ タ破損を確実に検出 3. ディスクプロセスはミラーディスクから再度READ 4. ミラーディスクのデータが正常な場合、それを アプリケーションに返し、プライマリーディスクの 破損デ タブロックを上書きして修復を実行 破損検出 4. データ 修復 I/Oパス分離、 シリアルWRITE機 能を備えたミラー ディスク © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.27 破損データブロックを上書きして修復を実行 チェックサムブロック ・ セクターチェックサムを 格納 する専用領域 ・ブロックデータの喪失を検出 ブロック内チェックサム ・ ブロックデータの 一部破損を検出
  28. 28. HPNonStopSQL OS統合により実現している付加価値OS統合により実現している付加価値 「優先度制御機能」 「データの保護–LostWrite防止」 「トランザクション制御負荷の最適化」 © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
  29. 29. HP NonStop SQLの実装 OSとの統合によりオーバーヘッドを限界まで削減OSとの統合によりオーバーヘッドを限界まで削減 CPU間通信にHWベースの高速通信機能を採用 HP ServerNet™− HP ServerNet™ • DMAベースのASIC実装により低遅延を実現 • チェックサムによるデータ保護機能を内蔵 • ネットワーク型接続によりブレード数に応じた通信帯域を提供 • TCP/IP通信と比較し80%以上CPU負荷を低減 ※1 © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.29 < HP ServerNet ASIC > ※1 … メッセージ長4KB、弊社社内性能試験結果より
  30. 30. HP NonStop SQLの実装 OSとの統合によりオ バ ヘッドを限界まで削減OSとの統合によりオーバーヘッドを限界まで削減 トランザクション制御機能をOSに統合 ザ ブ プ− トランザクション管理テーブルの更新機能をインタラプト処理内 に実装 プロセスディスパ チのオ バ ヘ ドを削減• プロセスディスパッチのオーバーヘッドを削減 • カーネルモードとユーザーモードのスイッチオーバーヘッド を削減を削減 © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.30
  31. 31. OSレベルでのトランザクション管理 実装例 フェーズ1 : コミット要求フェーズ トランザクションフ ズ1 : ミット要求フ ズ コーディネータ CPU宛て特殊 ServerNetパケット トランザクション 全体でコミットOK 全CPUで同期されたトランザクション制御テー ブルを保持 Trx 101 Act CPU 0,1,2 Trx 100 Act ServerNet 特殊パケット で返信 完了! コミット準備! コミット 準備! 完了! ブルを保持 ServerNet 割り込み ンドラ ServerNet 割り込みハンドラ 同時実行トランザクション数が多い 時は、複数パケットを単一パケット に詰めて送信 割り込みハンドラ割り込みハンドラ 割り込みハンドラ 制御テーブルを 更新 Trx 101 CPU 0,1,2 Trx 100 Act Trx 101 Act Act CPU 0,1,2 Trx 100 Act プロセス WAKE システムで1つのログファ に詰めて送信 (待ち時間を自動で調節) データ DBMS Trx 101: ph1 DBMS Trx 101 制御テーブルを 参照し処理実行 データ DBMS Trx 10: Redo/Undo ログバッファ システムで1つのログファ イル ログ ディスク プロセス ログ ディスク プロセスWALフラッシュ © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.31 データ Redo/Undo ログ Redo/Undo ログバッファ -B-P WALフラッシュ
  32. 32. まとめ - HP NonStop SQL !! 以下のようなお悩みをお持ちのお客様以下のようなお悩みをお持ちのお客様 従来のDBMSと一味違う「HP NonStop SQL」をぜひご検討ください! DBサ バ の可用性に不安DBサーバーの可用性に不安 DBがスケールアウトしない DB運用に工数がかかりすぎる マルチベンダ環境でサポートに難マルチベンダ環境でサポ トに難 万全なデータ保護機能を探している © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.32 DB統合の実現に懸念
  33. 33. N St SQL & インメモリ テクノロジ セッション Check out our other sessions !!! NonStop SQL & インメモリーテクノロジーセッション 6月20日 14:00~14:50 Room D NonStop SQL月 p Q 「そのデータベース 5年後大丈夫ですか」 日本ヒューレット・パッカード 後藤 宏 6月20日 1 00 1 0 R A インメ リ6月20日 15:00~15:50 Room A インメモリー 「HDDからインメモリーテクノジーへ」 日本ヒューレット・パッカード 三宅祐典 6月20日 16:00~16:50 Room D インメモリー 「インメモリーデータベース徹底比較」 日本ヒュ レット パッカ ド 小森 博之 © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.33 日本ヒューレット・パッカード 小森 博之
  34. 34. ご清聴ありがとうございましたご清聴ありがとうございました。 © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
  35. 35. 原 敏光 プリセールス統括本部 サーバー技術本部 サーバー技術二部 THara@hp.com 直通 050 3138 0879 携帯 090 8309 2834直通 050 3138 0879 携帯 090 8309 2834 FAX 03 5628 2698 日本ヒューレット・パッカード株式会社 本社 〒136‐8711〒136‐8711 東京都江東区大島2‐2‐1 Thank you! © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. T n y !

×