Submit Search
Upload
azure障害は忘れたころにやってくる
•
Download as PPTX, PDF
•
0 likes
•
2,552 views
裕之 木下
Follow
過去6年のAzure障害について話しました
Read less
Read more
Engineering
Report
Share
Report
Share
1 of 9
Download now
Recommended
MySQL 5.6への完全移行を実現したTritonnからMroongaへの移行体験記
MySQL 5.6への完全移行を実現したTritonnからMroongaへの移行体験記
Kentaro Yoshida
BIOSからUEFI
BIOSからUEFI
Yasuaki Sera
SIerにおけるKubernetes活用(OSSユーザーによる勉強会-公開版)
SIerにおけるKubernetes活用(OSSユーザーによる勉強会-公開版)
Tetsurou Yano
Eucalyptus on OpenStack
Eucalyptus on OpenStack
irix_jp
20180330 ガチラボ
20180330 ガチラボ
Satoshi Fujimoto
100GbE NICを使ったデータセンター・ネットワーク実証実験 -メモ-
100GbE NICを使ったデータセンター・ネットワーク実証実験 -メモ-
Naoto MATSUMOTO
nginx の導入 for Mac
nginx の導入 for Mac
塚本 昌弘
Report JAZUG activities 2010.08-2011.09
Report JAZUG activities 2010.08-2011.09
Saori Ando
Recommended
MySQL 5.6への完全移行を実現したTritonnからMroongaへの移行体験記
MySQL 5.6への完全移行を実現したTritonnからMroongaへの移行体験記
Kentaro Yoshida
BIOSからUEFI
BIOSからUEFI
Yasuaki Sera
SIerにおけるKubernetes活用(OSSユーザーによる勉強会-公開版)
SIerにおけるKubernetes活用(OSSユーザーによる勉強会-公開版)
Tetsurou Yano
Eucalyptus on OpenStack
Eucalyptus on OpenStack
irix_jp
20180330 ガチラボ
20180330 ガチラボ
Satoshi Fujimoto
100GbE NICを使ったデータセンター・ネットワーク実証実験 -メモ-
100GbE NICを使ったデータセンター・ネットワーク実証実験 -メモ-
Naoto MATSUMOTO
nginx の導入 for Mac
nginx の導入 for Mac
塚本 昌弘
Report JAZUG activities 2010.08-2011.09
Report JAZUG activities 2010.08-2011.09
Saori Ando
Rancherで簡単に作るk8s環境 Kubernetes meetup tokyo #4 LT kubernetes on rancher
Rancherで簡単に作るk8s環境 Kubernetes meetup tokyo #4 LT kubernetes on rancher
Tetsurou Yano
shinken monitoringについて真剣に調べてみた結果
shinken monitoringについて真剣に調べてみた結果
Tsuyoshi Torii
Installing docker on windows
Installing docker on windows
塚本 昌弘
Hokuriku.net 2013 01-26 node.js
Hokuriku.net 2013 01-26 node.js
Tadahiro Ishisaka
さくらのクラウドでUCARPを使う方法 -メモ-
さくらのクラウドでUCARPを使う方法 -メモ-
Naoto MATSUMOTO
マイクラ自動化枠第1回資料
マイクラ自動化枠第1回資料
Ryo Fujita
Durable Functions (Core) 気になっていたことを勉強がてら実装してみた
Durable Functions (Core) 気になっていたことを勉強がてら実装してみた
朋志 佐々木
Dockerイメージで誰でも気軽にMroonga体験
Dockerイメージで誰でも気軽にMroonga体験
yoku0825
NetBSD on Google Compute Engine
NetBSD on Google Compute Engine
Ryo ONODERA
マイクラ自動化枠第2回資料
マイクラ自動化枠第2回資料
Ryo Fujita
20160217 hbstudy73 linux on Azure
20160217 hbstudy73 linux on Azure
雄哉 吉田
さくらのクラウドAPIをsacloudつかってさわってみた
さくらのクラウドAPIをsacloudつかってさわってみた
Tak Nishikori
運用の現場での監視運用ツールの活用
運用の現場での監視運用ツールの活用
真治 米田
第6回 エンジニアのためのプレゼン技術研究会「今年の抱負」と「アンチプレゼンパターン」発表スライド
第6回 エンジニアのためのプレゼン技術研究会「今年の抱負」と「アンチプレゼンパターン」発表スライド
furandon_pig
MySQLをプロファイる(仮)
MySQLをプロファイる(仮)
yoku0825
For tokyo.ex #2 LT
For tokyo.ex #2 LT
Yohei Tanimoto
NetBSD on Conoha VPS at JNUG BoF 2014
NetBSD on Conoha VPS at JNUG BoF 2014
Ryo ONODERA
Hudson初心者向けデモ
Hudson初心者向けデモ
cactusman
RancherでMesosクラスタをデプロイしてみる的ななにか
RancherでMesosクラスタをデプロイしてみる的ななにか
Masataka Tsukamoto
Rancher jp1周年振り返り anniversary meetup slide summary
Rancher jp1周年振り返り anniversary meetup slide summary
Tetsurou Yano
AzureStorageのオブジェクトレプリケートを試してみた
AzureStorageのオブジェクトレプリケートを試してみた
裕之 木下
Azureもくもく会@東京のいままでとこれからと
Azureもくもく会@東京のいままでとこれからと
裕之 木下
More Related Content
What's hot
Rancherで簡単に作るk8s環境 Kubernetes meetup tokyo #4 LT kubernetes on rancher
Rancherで簡単に作るk8s環境 Kubernetes meetup tokyo #4 LT kubernetes on rancher
Tetsurou Yano
shinken monitoringについて真剣に調べてみた結果
shinken monitoringについて真剣に調べてみた結果
Tsuyoshi Torii
Installing docker on windows
Installing docker on windows
塚本 昌弘
Hokuriku.net 2013 01-26 node.js
Hokuriku.net 2013 01-26 node.js
Tadahiro Ishisaka
さくらのクラウドでUCARPを使う方法 -メモ-
さくらのクラウドでUCARPを使う方法 -メモ-
Naoto MATSUMOTO
マイクラ自動化枠第1回資料
マイクラ自動化枠第1回資料
Ryo Fujita
Durable Functions (Core) 気になっていたことを勉強がてら実装してみた
Durable Functions (Core) 気になっていたことを勉強がてら実装してみた
朋志 佐々木
Dockerイメージで誰でも気軽にMroonga体験
Dockerイメージで誰でも気軽にMroonga体験
yoku0825
NetBSD on Google Compute Engine
NetBSD on Google Compute Engine
Ryo ONODERA
マイクラ自動化枠第2回資料
マイクラ自動化枠第2回資料
Ryo Fujita
20160217 hbstudy73 linux on Azure
20160217 hbstudy73 linux on Azure
雄哉 吉田
さくらのクラウドAPIをsacloudつかってさわってみた
さくらのクラウドAPIをsacloudつかってさわってみた
Tak Nishikori
運用の現場での監視運用ツールの活用
運用の現場での監視運用ツールの活用
真治 米田
第6回 エンジニアのためのプレゼン技術研究会「今年の抱負」と「アンチプレゼンパターン」発表スライド
第6回 エンジニアのためのプレゼン技術研究会「今年の抱負」と「アンチプレゼンパターン」発表スライド
furandon_pig
MySQLをプロファイる(仮)
MySQLをプロファイる(仮)
yoku0825
For tokyo.ex #2 LT
For tokyo.ex #2 LT
Yohei Tanimoto
NetBSD on Conoha VPS at JNUG BoF 2014
NetBSD on Conoha VPS at JNUG BoF 2014
Ryo ONODERA
Hudson初心者向けデモ
Hudson初心者向けデモ
cactusman
RancherでMesosクラスタをデプロイしてみる的ななにか
RancherでMesosクラスタをデプロイしてみる的ななにか
Masataka Tsukamoto
Rancher jp1周年振り返り anniversary meetup slide summary
Rancher jp1周年振り返り anniversary meetup slide summary
Tetsurou Yano
What's hot
(20)
Rancherで簡単に作るk8s環境 Kubernetes meetup tokyo #4 LT kubernetes on rancher
Rancherで簡単に作るk8s環境 Kubernetes meetup tokyo #4 LT kubernetes on rancher
shinken monitoringについて真剣に調べてみた結果
shinken monitoringについて真剣に調べてみた結果
Installing docker on windows
Installing docker on windows
Hokuriku.net 2013 01-26 node.js
Hokuriku.net 2013 01-26 node.js
さくらのクラウドでUCARPを使う方法 -メモ-
さくらのクラウドでUCARPを使う方法 -メモ-
マイクラ自動化枠第1回資料
マイクラ自動化枠第1回資料
Durable Functions (Core) 気になっていたことを勉強がてら実装してみた
Durable Functions (Core) 気になっていたことを勉強がてら実装してみた
Dockerイメージで誰でも気軽にMroonga体験
Dockerイメージで誰でも気軽にMroonga体験
NetBSD on Google Compute Engine
NetBSD on Google Compute Engine
マイクラ自動化枠第2回資料
マイクラ自動化枠第2回資料
20160217 hbstudy73 linux on Azure
20160217 hbstudy73 linux on Azure
さくらのクラウドAPIをsacloudつかってさわってみた
さくらのクラウドAPIをsacloudつかってさわってみた
運用の現場での監視運用ツールの活用
運用の現場での監視運用ツールの活用
第6回 エンジニアのためのプレゼン技術研究会「今年の抱負」と「アンチプレゼンパターン」発表スライド
第6回 エンジニアのためのプレゼン技術研究会「今年の抱負」と「アンチプレゼンパターン」発表スライド
MySQLをプロファイる(仮)
MySQLをプロファイる(仮)
For tokyo.ex #2 LT
For tokyo.ex #2 LT
NetBSD on Conoha VPS at JNUG BoF 2014
NetBSD on Conoha VPS at JNUG BoF 2014
Hudson初心者向けデモ
Hudson初心者向けデモ
RancherでMesosクラスタをデプロイしてみる的ななにか
RancherでMesosクラスタをデプロイしてみる的ななにか
Rancher jp1周年振り返り anniversary meetup slide summary
Rancher jp1周年振り返り anniversary meetup slide summary
More from 裕之 木下
AzureStorageのオブジェクトレプリケートを試してみた
AzureStorageのオブジェクトレプリケートを試してみた
裕之 木下
Azureもくもく会@東京のいままでとこれからと
Azureもくもく会@東京のいままでとこれからと
裕之 木下
Client Side Balzorでツールを作ってみた
Client Side Balzorでツールを作ってみた
裕之 木下
Azure DevOpsで技術同人誌作成
Azure DevOpsで技術同人誌作成
裕之 木下
第15回JSSUG「Azure SQL Database 超入門」
第15回JSSUG「Azure SQL Database 超入門」
裕之 木下
Azure Functionsを業務利用する時の勘所
Azure Functionsを業務利用する時の勘所
裕之 木下
ノンコーディングでLineBotを作る MS FLOW編
ノンコーディングでLineBotを作る MS FLOW編
裕之 木下
クラウドで動画配信
クラウドで動画配信
裕之 木下
「Azure durable functions」の概要
「Azure durable functions」の概要
裕之 木下
Azureコスト管理機能のお話
Azureコスト管理機能のお話
裕之 木下
Xamrin de live2d
Xamrin de live2d
裕之 木下
Azure vs aws比較 エンコード ace用
Azure vs aws比較 エンコード ace用
裕之 木下
azure functionsでlinebotを作ってみた
azure functionsでlinebotを作ってみた
裕之 木下
azure functionsとcsx
azure functionsとcsx
裕之 木下
ノンプログラミングで楽したい
ノンプログラミングで楽したい
裕之 木下
azure botserviceをもっと身近に
azure botserviceをもっと身近に
裕之 木下
明日から役立つazure①
明日から役立つazure①
裕之 木下
昨今のpaas事情
昨今のpaas事情
裕之 木下
懲りずにazure functionsでlinebotを作ってみた
懲りずにazure functionsでlinebotを作ってみた
裕之 木下
build2017のazure関連情報まとめ
build2017のazure関連情報まとめ
裕之 木下
More from 裕之 木下
(20)
AzureStorageのオブジェクトレプリケートを試してみた
AzureStorageのオブジェクトレプリケートを試してみた
Azureもくもく会@東京のいままでとこれからと
Azureもくもく会@東京のいままでとこれからと
Client Side Balzorでツールを作ってみた
Client Side Balzorでツールを作ってみた
Azure DevOpsで技術同人誌作成
Azure DevOpsで技術同人誌作成
第15回JSSUG「Azure SQL Database 超入門」
第15回JSSUG「Azure SQL Database 超入門」
Azure Functionsを業務利用する時の勘所
Azure Functionsを業務利用する時の勘所
ノンコーディングでLineBotを作る MS FLOW編
ノンコーディングでLineBotを作る MS FLOW編
クラウドで動画配信
クラウドで動画配信
「Azure durable functions」の概要
「Azure durable functions」の概要
Azureコスト管理機能のお話
Azureコスト管理機能のお話
Xamrin de live2d
Xamrin de live2d
Azure vs aws比較 エンコード ace用
Azure vs aws比較 エンコード ace用
azure functionsでlinebotを作ってみた
azure functionsでlinebotを作ってみた
azure functionsとcsx
azure functionsとcsx
ノンプログラミングで楽したい
ノンプログラミングで楽したい
azure botserviceをもっと身近に
azure botserviceをもっと身近に
明日から役立つazure①
明日から役立つazure①
昨今のpaas事情
昨今のpaas事情
懲りずにazure functionsでlinebotを作ってみた
懲りずにazure functionsでlinebotを作ってみた
build2017のazure関連情報まとめ
build2017のazure関連情報まとめ
azure障害は忘れたころにやってくる
1.
Azure障害は忘れたころにやってくる 2016年10月21日 第1回 城東.NET勉強会
2.
まずは自己紹介 ・名前 木下 裕之 ・HN Kingkino(キンキーノと読みますが皆キングキノと読むのでそれでいいです) ・SNS Twitter @kingkinoko
FaceBookやってます。GitとLinkedInもちょこっと・・・。 ・Azure暦:5年
3.
Azure障害の歴史 日本時間 障害内容(概要) 影響
ダウンタイム 所感 2012/2/29 10:45 証明書のうるう年バグによりクラウドサービスが強制 再起動をし続けアクセス不能となった。 全リージョン 9時間 とあるサービスがサービスインした後だったので緊迫しました。 クラウドサービスが強制再起動している状態だったのですが、運がよかったのか全世界で順 番に強制再起動が走っていたため復旧までに再起動対象とはなりませんでした。閏年バグ なんてあるもんなんですね。 https://satonaoki.wordpress.com/2012/03/11/20120229-azure- disruption-summary/ 2013/2/23 5:44 証明書の失効によりAzrueStorageアクセスが不 能となった。 全リージョン 11時間 AzureStorageに外からのアクセスが出来なくなりましたがDC内はHTTPさえ使っていれ ばアクセスできる状態だったので影響はありませんでした。AzrueStorageは外部アクセス は必ずHTTPSになるので証明書の失効によりアクセスできなくなったみたいです。 https://satonaoki.wordpress.com/2013/02/24/azure-storage-outage- status/ 2014/8/19 2:49 仮想マシン、クラウドサービスの性能低下、原因不 明 全リージョン 1時間未満 新人歓迎会で酔っ払って家帰って寝て2時間後に叩き起こされました。 確か深夜3時だったと思います。それから復旧する7時頃まで寝ずに対応してました。 平日の深夜だったのでサービス影響はたいしてなかったです。眠たかったのだけは覚えてます。
4.
Azure障害の歴史 日本時間 障害内容(概要) 影響
ダウンタイム 所感 2014/11/19 1:49 性能改善ソフトのバグによりサービス中断や性能低 下が発生。 全リージョン 10時間 本障害は徐々に拡大していった障害です。 基本的にサービスの停止はなかったのですが著しい性能低下が発生しました。 会社で対応してたので後輩に障害対応時の対応フローを教えるいい機会になりました。 後輩君は仮眠をとりながら深夜対応してたみたいでいい経験になったみたいです。 https://satonaoki.wordpress.com/2014/11/20/storage-interruption/ 2014/12/6 10:15 ネットワークスパイクによるネットワーク負荷が発生し ネットワークアクセスがしづらい状況となった。 東アジア 日本リージョン 7時間 朝の10時半頃に映画を見に行こうと準備して携帯見たら夥しい程の着信とLINE通知が 来てました。 それから完全復旧する17時頃まで対応しました。休日の昼間だったのでかなり緊迫した 状態でした。 複数の顧客を持っていたので電話を受けながらPCでLINEとSKYPEでチャットをするという アクロバティック対応したのを覚えてます。 2016/9/15 20:18 ネットワークデバイスのソフトウェアバグによるDNSエ ラーが原因でネットワークアクセスが不能となった。 全リージョン 3時間 Azureと関係のない仕事についてたので静観してました。 世界規模の障害が2~3時間で復旧したのみて過去の経験がいきているなーとしみじみ 感じましたね。 http://itpro.nikkeibp.co.jp/atcl/news/16/091502706/
5.
Azure障害対応時の心得 ・AzrueDashBoardを確認する https://azure.microsoft.com/ja-jp/status/ ・TiwtterのAzureタグで検索してツイートログを参照する
6.
Azure障害対応時の心得 ・Facebookのコミュニティ(Jazug等)を参照する ・MSプレミアムサポート契約している場合はMSサポートに電話する ・RCA(RootCouseAnalisys)障害原因報告書の確認
7.
Azure障害検知 ・監視サービスの利用 有人監視 ・・・ 料金は高いですけど電話連絡や簡単な復旧作業等を実施してくれます。 最近はクラウド監視ができる監視会社さんが増えてきましたので監視サービスも多様化してきています。 深夜の障害で電話がかかってくる切なさはひとしおですが・・・。 無人監視
・・・ ハートビートやパフォーマンス監視を自動で行いメール通知を行ってくれるサービスです。 値段は安いのですがメールでの通知が主なため障害に気付かないことあるのは問題ですね。 ・クロスクラウド監視 Azure以外のクラウドで監視用のサーバを立てて監視する方法です。 AWSで立てた監視サーバでAzureのサービスを監視する方法などはよく実施されています。 監視用のソフトウェアはZabbix、Cacti等がよく使われています。
8.
Azure障害検知 ・お手軽ノンプログラミング監視(IFTTT) IFTTTを使ってAzureDashboardのRSSを監視し何か起きた時に通知を行う方法です。 以前はメール通知にしていたのですが最近Lineと連携したためLineに通知するようにしました。 簡単な手順でお手軽に監視できるので便利です。
9.
まとめ 基本的にインフラに障害はつきものです。 起きてくれないのであればそれにこしたことはありません。 しかし、障害は起きてしまいます。 プログラムのバグ、機器の故障、人的エラー、悪意のある攻撃など様々な障害発生要素に脅かされています。 障害を防ぐことが難しいのであればダウンタイムを短くするしかありません。 Azureは徐々にですが過去の障害から知見を得て障害復旧スピードが上がってきています。 実際に2016年9月15日の大規模障害の復旧速度の速さは目を見張るものがありました。 今後もマイクロソフト社の障害対応の充実に期待していきましょう。
Download now