azure障害は忘れたころにやってくる
- 3. Azure障害の歴史
日本時間 障害内容(概要) 影響 ダウンタイム 所感
2012/2/29 10:45
証明書のうるう年バグによりクラウドサービスが強制
再起動をし続けアクセス不能となった。 全リージョン 9時間
とあるサービスがサービスインした後だったので緊迫しました。
クラウドサービスが強制再起動している状態だったのですが、運がよかったのか全世界で順
番に強制再起動が走っていたため復旧までに再起動対象とはなりませんでした。閏年バグ
なんてあるもんなんですね。
https://satonaoki.wordpress.com/2012/03/11/20120229-azure-
disruption-summary/
2013/2/23 5:44
証明書の失効によりAzrueStorageアクセスが不
能となった。
全リージョン 11時間
AzureStorageに外からのアクセスが出来なくなりましたがDC内はHTTPさえ使っていれ
ばアクセスできる状態だったので影響はありませんでした。AzrueStorageは外部アクセス
は必ずHTTPSになるので証明書の失効によりアクセスできなくなったみたいです。
https://satonaoki.wordpress.com/2013/02/24/azure-storage-outage-
status/
2014/8/19 2:49
仮想マシン、クラウドサービスの性能低下、原因不
明
全リージョン 1時間未満
新人歓迎会で酔っ払って家帰って寝て2時間後に叩き起こされました。
確か深夜3時だったと思います。それから復旧する7時頃まで寝ずに対応してました。
平日の深夜だったのでサービス影響はたいしてなかったです。眠たかったのだけは覚えてます。
- 4. Azure障害の歴史
日本時間 障害内容(概要) 影響 ダウンタイム 所感
2014/11/19 1:49
性能改善ソフトのバグによりサービス中断や性能低
下が発生。
全リージョン 10時間
本障害は徐々に拡大していった障害です。
基本的にサービスの停止はなかったのですが著しい性能低下が発生しました。
会社で対応してたので後輩に障害対応時の対応フローを教えるいい機会になりました。
後輩君は仮眠をとりながら深夜対応してたみたいでいい経験になったみたいです。
https://satonaoki.wordpress.com/2014/11/20/storage-interruption/
2014/12/6 10:15
ネットワークスパイクによるネットワーク負荷が発生し
ネットワークアクセスがしづらい状況となった。
東アジア
日本リージョン
7時間
朝の10時半頃に映画を見に行こうと準備して携帯見たら夥しい程の着信とLINE通知が
来てました。
それから完全復旧する17時頃まで対応しました。休日の昼間だったのでかなり緊迫した
状態でした。
複数の顧客を持っていたので電話を受けながらPCでLINEとSKYPEでチャットをするという
アクロバティック対応したのを覚えてます。
2016/9/15 20:18
ネットワークデバイスのソフトウェアバグによるDNSエ
ラーが原因でネットワークアクセスが不能となった。
全リージョン 3時間
Azureと関係のない仕事についてたので静観してました。
世界規模の障害が2~3時間で復旧したのみて過去の経験がいきているなーとしみじみ
感じましたね。
http://itpro.nikkeibp.co.jp/atcl/news/16/091502706/