Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

[de:code 2017] ダウンタイムを最小に! 〜 Azure における障害/災害に耐えうるアーキテクチャ設計のポイント 〜

1,180 views

Published on

https://www.microsoft.com/ja-jp/events/decode/2017/sessions.aspx#DI13
https://channel9.msdn.com/Events/de-code/2017/DI13
https://www.slideshare.net/decode2017/di13-azure-76990944

de:code 2017 > ダウンタイムを最小に! 〜 Azure における障害/災害に耐えうるアーキテクチャ設計のポイント 〜 (2017/05/24)

ハードウェアは壊れ、ソフトウェアにはバグがあり、人間はミスをします。Azure が提供するさまざまなサービスにも障害が発生する可能性があり、データセンターや Azure リージョン全体に影響を与える災害の可能性もあります。

本セッションでは、Azure Virtual Machiines、Azure Storage、Azure SQL Databaseといった大経的な Azure サービスを取り上げ、Azure リージョン内での高可用性 (HA)、複数の Azure リージョンにわたる災害復旧 (DR)、耐障害性、回復性を考慮したアーキテクチャ設計のポイントをご紹介します。

Published in: Software
  • DOWNLOAD THIS BOOKS INTO AVAILABLE FORMAT (Unlimited) ......................................................................................................................... ......................................................................................................................... Download Full PDF EBOOK here { https://tinyurl.com/yyxo9sk7 } ......................................................................................................................... Download Full EPUB Ebook here { https://tinyurl.com/yyxo9sk7 } ......................................................................................................................... ACCESS WEBSITE for All Ebooks ......................................................................................................................... Download Full PDF EBOOK here { https://tinyurl.com/yyxo9sk7 } ......................................................................................................................... Download EPUB Ebook here { https://tinyurl.com/yyxo9sk7 } ......................................................................................................................... Download doc Ebook here { https://tinyurl.com/yyxo9sk7 } ......................................................................................................................... ......................................................................................................................... ......................................................................................................................... .............. Browse by Genre Available eBooks ......................................................................................................................... Art, Biography, Business, Chick Lit, Children's, Christian, Classics, Comics, Contemporary, Cookbooks, Crime, Ebooks, Fantasy, Fiction, Graphic Novels, Historical Fiction, History, Horror, Humor And Comedy, Manga, Memoir, Music, Mystery, Non Fiction, Paranormal, Philosophy, Poetry, Psychology, Religion, Romance, Science, Science Fiction, Self Help, Suspense, Spirituality, Sports, Thriller, Travel, Young Adult,
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here
  • DOWNLOAD THIS BOOKS INTO AVAILABLE FORMAT (Unlimited) ......................................................................................................................... ......................................................................................................................... Download Full PDF EBOOK here { https://tinyurl.com/yyxo9sk7 } ......................................................................................................................... Download Full EPUB Ebook here { https://tinyurl.com/yyxo9sk7 } ......................................................................................................................... ACCESS WEBSITE for All Ebooks ......................................................................................................................... Download Full PDF EBOOK here { https://tinyurl.com/yyxo9sk7 } ......................................................................................................................... Download EPUB Ebook here { https://tinyurl.com/yyxo9sk7 } ......................................................................................................................... Download doc Ebook here { https://tinyurl.com/yyxo9sk7 } ......................................................................................................................... ......................................................................................................................... ......................................................................................................................... .............. Browse by Genre Available eBooks ......................................................................................................................... Art, Biography, Business, Chick Lit, Children's, Christian, Classics, Comics, Contemporary, Cookbooks, Crime, Ebooks, Fantasy, Fiction, Graphic Novels, Historical Fiction, History, Horror, Humor And Comedy, Manga, Memoir, Music, Mystery, Non Fiction, Paranormal, Philosophy, Poetry, Psychology, Religion, Romance, Science, Science Fiction, Self Help, Suspense, Spirituality, Sports, Thriller, Travel, Young Adult,
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here

[de:code 2017] ダウンタイムを最小に! 〜 Azure における障害/災害に耐えうるアーキテクチャ設計のポイント 〜

  1. 1. 回復性 アーカイブ 災害復旧 (DR) 高可用性 (HA) RPO/RTO RTO >> 0 RTO > 0 RTO = 0 コスト/複雑さ Best For: データの削除 データの破損 コンプライアンス 計画外障害の保護 HA のために再設計できない HA のコストの問題 大規模障害 ミッション クリティカルな アプリ ローカル障害
  2. 2. $$$$
  3. 3. 従来型のオンプレミス アプリ モダンなクラウド アプリ リレーショナル データベース ポリグロット永続化 強い整合性 (一貫性) 結果整合性 予測可能なスケーラビリティのための設計 無限のスケーラビリティのための設計 シリアル、同期処理 並列、非同期処理 モノリシック、集中 分解、分散 スノーフレーク サーバー イミュータブル インフラ 統合認証 フェデレーション認証 アプリを稼働し続けるための設計 (MTBF) 障害のための設計 (MTTR) ビッグ バン リリース 頻繁で小規模なアップデート 手動管理 自動化、自己管理 https://docs.microsoft.com/azure/architecture/guide/
  4. 4. 計画 設計 実装 テスト デプロイ 監視 対応 要件定義 障害を 識別 復旧戦略 を実装 障害を 注入 フェール オーバー をシミュ レート 信頼できる 方法で アプリを デプロイ 障害を 監視 問題を 修正する ために 対処
  5. 5. インシデント発生 サービス復旧 データ バックアップ データ バックアップ データ バックアップ RTO (目標復旧時間) RPO (目標復旧時点) MTO (最大許容停止時間/ Maximum Tolerable Outage)
  6. 6. アップタイム SLA 年間の ダウンタイム 月間の ダウンタイム 99% 3.65 日 7.2 時間 99.9% 8.76 時間 43.2 分 99.95% 4.38 時間 21.6 分 99.99% 52.56 分 4.32 分 99.999% 5.26 分 25.9 秒
  7. 7. Cache フォールバック: ローカル キャッシュから データを返す 99.95% × 99.99% = 99.94% 2 リージョンの複合 SLA = (1 − (1 − N) (1 − N)) x Traffic Manager SLA (100% – (0.05% ×0.05%) x 99.99% = 99.9899% https://docs.microsoft.com/azure/architecture/resiliency/ 100% - (0.001% × 0.1%) = 99.99999% 99.95% × 99.99999% = 99.95%
  8. 8. 発生年 発生日 リージョン 復旧時間 概要と原因 2015 (特になし) 2016 9/15 複数 約2時間 • ネットワークの輻輳と名前解決機能不全 • ネットワーク制御ソフトの不具合 2017 3/8 東日本 約2時間 • ストレージクラスター停止 • ストレージクラスター制御ソフトの不具合 3/28 西日本 約3時間 • サービス間通信不全 • 増設時のネットワーク設定プロセスでのミス 3/31 東日本 約9時間 • データセンター収容設備の強制シャットダウン • 冗長化UPSの障害復旧プロセスでのミス
  9. 9. https://docs.microsoft.com/azure/best-practices-availability-paired-regions
  10. 10. 1. 2. 3. データベースからの データ読み取りに失敗 Web サーバーが ダウン NVA が ダウン
  11. 11. https://azure.microsoft.com/documentation/articles/guidance-resiliency-failure-mode-analysis/
  12. 12. Web 層 可用性セット 中間層 可用性セット データ層 可用性セット FD 1 Replica #1 Replica #1 Replica #2 FD 2 FD 3 Shard #2Shard #1
  13. 13. • •
  14. 14. Traffic Manager 優先順位 ルーティング Web Application Data Web Application Data 自 動 フ ェ ー ル オ ー バ ー 手 動 フ ェ ー ル バ ッ ク プライマリ リージョン セカンダリ リージョン (ペア リージョン) WebWebWeb Data ApplicationApplication Data
  15. 15. Azure Storage 地理レプリカ (RA-GRS) LocationMode = PrimaryThenSecondaryLocationMode = SecondaryOnly
  16. 16. < E2E のレイテンシ要件 https://docs.microsoft.com/azure/architecture/patterns/retry
  17. 17. リモート サービス アプリ ユーザー リトライ操作中にリソースを保持 連鎖障害につながる エラー
  18. 18. https://github.com/App-vNext/Polly https://docs.microsoft.com/azure/architecture/patterns/circuit-breaker
  19. 19. • メモリ • CPU • ディスク • スレッド プール • 接続プール • ネットワーク接続
  20. 20. • • • • • • https://docs.microsoft.com/azure/ architecture/patterns/ http://ec.nikkeibp.co.jp/item/book s/P98330.html
  21. 21. http://principlesofchaos.org/ 制御グループ 実験グループ HW/SW 障害 トラフィックのスパイク 定常状態に関する 違いを確認 本番トラフィック
  22. 22. • • •
  23. 23. Web App DB Web App DB ブルー/グリーン デプロイメント Web App DB Web App DB カナリア リリース 90% 10% 現行バージョン 新バージョン 現行バージョン 新バージョン ロ ー ド バ ラ ン サ ー リ バ ー ス プ ロ キ シ
  24. 24. • • • • • •
  25. 25. https://docs.microsoft.com/azure/storage/storage-redundancy https://docs.microsoft.com/azure/storage/storage-disaster-recovery-guidance https://docs.microsoft.com/azure/storage/storage-designing-ha-apps-with-ragrs
  26. 26. 読み書き可能 プライマリ アカウント accountname. <service>.core.windows.net プライマリ リージョン セカンダリ リージョン アプリ クライアント ライブラリ 読み取りリトライ オプション • PrimaryOnly • SecondaryOnly • PrimaryThenSecondary • SecondaryThenPrimary 読み取り専用 セカンダリ アカウント accountname-secondary. <service>.core.windows.net 非同期 レプリ ケーション 書き込み 読み取り
  27. 27. 読み書き可能 プライマリ アカウント プライマリ リージョン セカンダリ リージョン アプリ 非同期 レプリケーション 読み取り専用 セカンダリ アカウント 読み書き可能 プライマリ アカウント データを コピー (アプリ固有) ルックアップ テーブル 書き込み 読み取り
  28. 28. Azure Cosmos DB: Table API Azure Storage: Standard Table API Azure Storage SDK 100% 後方互換、シームレスなエクスプレス
  29. 29. Azure Storage SDK Azure Cosmos DB: Table API 近日対応予定: Standard Table のアップデート (ストレージ最適化)、シームレスな移行
  30. 30. 機能 ERT (推定 復旧時間) RPO (目標 復旧時点) 地理レプリケーション バック アップからの地理リストア <12時間 <1時間 アクティブ地理レプリケーション <30秒 <5秒
  31. 31. パターン ERT (推定 復旧時間) RPO (目標 復旧時点) アクティブ/パッシブ デプロイと DB 併置によるDR 障害検出時間 + DNS TLL <5秒 アクティブ/アクティブ デプロイによる アプリ負荷分散 障害検出時間 + DNS TLL <5秒 アクティブ/パッシブ デプロイによる データ保存 (読み取り専用) 0 <5秒 アクティブ/パッシブ デプロイによる データ保存 (読み書き) 障害検出時間 + データ消失の 猶予期間 0 https://docs.microsoft.com/azure/sql-database/sql-database-designing-cloud-solutions-for-disaster-recovery
  32. 32. https://docs.microsoft.com/azure/sql-database/sql-database-business-continuity https://docs.microsoft.com/azure/sql-database/sql-database-disaster-recovery-drills https://docs.microsoft.com/azure/sql-database/sql-database-geo-replication-overview https://docs.microsoft.com/azure/sql-database/sql-database-disaster-recovery
  33. 33. https://docs.microsoft.com/azure/sql-database/sql-database-designing-cloud- solutions-for-disaster-recovery https://docs.microsoft.com/azure/sql-database/sql-database-recovery-using-backups https://docs.microsoft.com/azure/sql-database/sql-database-automated-backups
  34. 34. https://docs.microsoft.com/azure/documentdb/documentdb-distribute-data-globally https://docs.microsoft.com/azure/documentdb/documentdb-regional-failovers https://docs.microsoft.com/azure/documentdb/documentdb-online-backup-and- restore
  35. 35. App Service Cosmos DB SQL Database Redis Cache Storage (Contents) Storage (Log, Config, etc) CDN App Service Cosmos DB SQL Database Redis Cache Storage (Contents) Storage (Log, Config, etc) Traffic Manager Active Region Standby Region https://docs.microsoft.com/azure/architecture/reference-architectures/managed-web-app/multi-region-web-app
  36. 36. https://docs.microsoft.com/azure/ architecture/reference-architectures/ virtual-machines-windows/ multi-region-application
  37. 37. https://docs.microsoft.com/azure/ architecture/reference-architectures/ virtual-machines-linux/ multi-region-application
  38. 38. https://docs.microsoft.com/azure/architecture/
  39. 39. セッションアンケートにご協力ください ➢ 専用アプリからご回答いただけます。 decode 2017 ➢ スケジュールビルダーで受講セッションを 登録後、アンケート画面からご回答ください。 ➢ アンケートの回答時間はたったの 15 秒です!
  40. 40. Ask the Speaker のご案内 本セッションの詳細は『Ask the Speaker Room』各コーナーカウンタにて ご説明させていただきます。是非、お立ち寄りください。
  41. 41. © 2017 Microsoft Corporation. All rights reserved. 本情報の内容(添付文書、リンク先などを含む)は、作成日時点でのものであり、予告なく変更される場合があります。

×