Copyright © 2015 AGREX INC. All rights reserved.
EC2 Auto Recovery
2015-06-04
札幌事業所 古山浩司
第15回 JAWS-UG札幌 勉強会
…で発表する予定だった
Copyright © 2015 AGREX INC. All rights reserved. 2
自己紹介
 AGREX 札幌事業所
・AWSグループ マネージャー
・2010年~AWSユーザー
・AWS Certified
Solution Architect (Associate)
SysOps Administrator (Associate)
 JAWS-UG 札幌支部 代表
 好きなAWSサービス : Workspaces
古山 浩司 (Hiroshi Koyama)
(AWS User Group Japan)
Copyright © 2015 AGREX INC. All rights reserved. 3
2012-1-12 AWS発表!
東京リージョン 3月~
Copyright © 2015 AGREX INC. All rights reserved.
従来のRecovery (≠Auto)
物理ホスト
仮想サーバー (EC2)
Stop
別の物理ホストに移動
→ Recovery完了
・Management Console
・CLI、API
Start
Copyright © 2015 AGREX INC. All rights reserved.
【補足】 "Stop & Start" と "Reboot"
Reboot
物理ホストは変わらない
Copyright © 2015 AGREX INC. All rights reserved. 6
"Auto" な Recovery ということは・・・
Stop & Start
これに相当することを
AWSが勝手にやってくれる…のか??
Copyright © 2015 AGREX INC. All rights reserved. 7
"耐障害性" の考え方が少し変わる??
用途次第では
シングル・サーバーで十分なケースも?
(おそらく)
数分待ち
ダウンタイム
なし
Copyright © 2015 AGREX INC. All rights reserved. 8
AWS documentation 曰く
(参考 http://docs.aws.amazon.com/ja_jp/AWSEC2/latest/UserGuide/ec2-instance-recover.html)
 CloudWatch の "システムステータスチェック" アラームがトリガー。
 リカバリ後も、Instance ID、Private IP、Elastic IP、インスタンスメタ
データ等、すべて元のインスタンスと同じ。
 インスタンスは再起動され、その際インスタンスは移行される。
 Auto Recovery が発動する要因
 ネットワーク接続の喪失
 システム電源の喪失
 物理ホストのソフトウェアの問題
 物理ホストのハードウェアの問題
Copyright © 2015 AGREX INC. All rights reserved. 9
システムステータスチェック
Copyright © 2015 AGREX INC. All rights reserved. 10
Auto Recovery を設定する
↑
正常値は0
Copyright © 2015 AGREX INC. All rights reserved. 11
設定完了
Copyright © 2015 AGREX INC. All rights reserved. 12
動作確認!
システムステータスチェック ⇒ "ALARM"
 ネットワーク接続の喪失
 システム電源の喪失
 物理ホストのソフトウェアの問題
 物理ホストのハードウェアの問題
唯一、
これならできそう
Copyright © 2015 AGREX INC. All rights reserved. 13
システムステータスはOKのまま!!!
(インスタンスステータスはALARM)
ネットワークをダウン!
$ ifconfig eth0 down
ちなみに… " ifdown eth0 " もダメ。
Copyright © 2015 AGREX INC. All rights reserved. 14
結局のところ・・・
 100台を1年くらい動かせば、運が良ければ見れる…かも?
Auto Recovery、設定はできても試せず。。
「トリガー条件="INSUFFICIENT DATA (不足)" + インスタンスを "STOP"」
これで Recovery アクションが走ることは確認できました・・・が、
STOPはSTOPのまま、⇒ 意味なし。。
 意図的に Auto Recovery させる方法、誰か知っていたら
是非教えてください。
 「手動 Auto Recovery??」機能の追加に期待!
THANK YOU

EC2 Auto Recovery (第15回JAWS-UG札幌勉強会)

  • 1.
    Copyright © 2015AGREX INC. All rights reserved. EC2 Auto Recovery 2015-06-04 札幌事業所 古山浩司 第15回 JAWS-UG札幌 勉強会 …で発表する予定だった
  • 2.
    Copyright © 2015AGREX INC. All rights reserved. 2 自己紹介  AGREX 札幌事業所 ・AWSグループ マネージャー ・2010年~AWSユーザー ・AWS Certified Solution Architect (Associate) SysOps Administrator (Associate)  JAWS-UG 札幌支部 代表  好きなAWSサービス : Workspaces 古山 浩司 (Hiroshi Koyama) (AWS User Group Japan)
  • 3.
    Copyright © 2015AGREX INC. All rights reserved. 3 2012-1-12 AWS発表! 東京リージョン 3月~
  • 4.
    Copyright © 2015AGREX INC. All rights reserved. 従来のRecovery (≠Auto) 物理ホスト 仮想サーバー (EC2) Stop 別の物理ホストに移動 → Recovery完了 ・Management Console ・CLI、API Start
  • 5.
    Copyright © 2015AGREX INC. All rights reserved. 【補足】 "Stop & Start" と "Reboot" Reboot 物理ホストは変わらない
  • 6.
    Copyright © 2015AGREX INC. All rights reserved. 6 "Auto" な Recovery ということは・・・ Stop & Start これに相当することを AWSが勝手にやってくれる…のか??
  • 7.
    Copyright © 2015AGREX INC. All rights reserved. 7 "耐障害性" の考え方が少し変わる?? 用途次第では シングル・サーバーで十分なケースも? (おそらく) 数分待ち ダウンタイム なし
  • 8.
    Copyright © 2015AGREX INC. All rights reserved. 8 AWS documentation 曰く (参考 http://docs.aws.amazon.com/ja_jp/AWSEC2/latest/UserGuide/ec2-instance-recover.html)  CloudWatch の "システムステータスチェック" アラームがトリガー。  リカバリ後も、Instance ID、Private IP、Elastic IP、インスタンスメタ データ等、すべて元のインスタンスと同じ。  インスタンスは再起動され、その際インスタンスは移行される。  Auto Recovery が発動する要因  ネットワーク接続の喪失  システム電源の喪失  物理ホストのソフトウェアの問題  物理ホストのハードウェアの問題
  • 9.
    Copyright © 2015AGREX INC. All rights reserved. 9 システムステータスチェック
  • 10.
    Copyright © 2015AGREX INC. All rights reserved. 10 Auto Recovery を設定する ↑ 正常値は0
  • 11.
    Copyright © 2015AGREX INC. All rights reserved. 11 設定完了
  • 12.
    Copyright © 2015AGREX INC. All rights reserved. 12 動作確認! システムステータスチェック ⇒ "ALARM"  ネットワーク接続の喪失  システム電源の喪失  物理ホストのソフトウェアの問題  物理ホストのハードウェアの問題 唯一、 これならできそう
  • 13.
    Copyright © 2015AGREX INC. All rights reserved. 13 システムステータスはOKのまま!!! (インスタンスステータスはALARM) ネットワークをダウン! $ ifconfig eth0 down ちなみに… " ifdown eth0 " もダメ。
  • 14.
    Copyright © 2015AGREX INC. All rights reserved. 14 結局のところ・・・  100台を1年くらい動かせば、運が良ければ見れる…かも? Auto Recovery、設定はできても試せず。。 「トリガー条件="INSUFFICIENT DATA (不足)" + インスタンスを "STOP"」 これで Recovery アクションが走ることは確認できました・・・が、 STOPはSTOPのまま、⇒ 意味なし。。  意図的に Auto Recovery させる方法、誰か知っていたら 是非教えてください。  「手動 Auto Recovery??」機能の追加に期待!
  • 15.