Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
toshi_pp
PPTX, PDF
7,477 views
cybozu.com のデータバックアップとリストア、それを活用したリハーサル
cybozu.com のバックアップの取り組みについての紹介です。
Technology
◦
Read more
2
Save
Share
Embed
Embed presentation
Download
Download to read offline
1
/ 34
2
/ 34
3
/ 34
4
/ 34
5
/ 34
6
/ 34
7
/ 34
8
/ 34
9
/ 34
10
/ 34
11
/ 34
12
/ 34
13
/ 34
14
/ 34
15
/ 34
16
/ 34
17
/ 34
18
/ 34
19
/ 34
20
/ 34
21
/ 34
22
/ 34
23
/ 34
24
/ 34
25
/ 34
26
/ 34
27
/ 34
28
/ 34
29
/ 34
30
/ 34
31
/ 34
32
/ 34
33
/ 34
34
/ 34
More Related Content
PDF
Arukasの運用事例と、末永くインフラ運用していくためのTips(SRE Tech Talks #2)
by
さくらインターネット株式会社
PPTX
5分で分かるサイボウズのSRE
by
uchan_nos
PDF
自動構築と自動テスト〜インフラのコード化とクラウドの優位性
by
azumakuniyuki 🐈
PPTX
さくらインターネットベアメタル自動化への挑戦
by
Hiroki Ito
PDF
○ヶ月でできた!?さくらのクラウド開発秘話(【ヒカ☆ラボ】さくらインターネットとMilkcocoa!年末イベント:ここだけのウラ話)
by
さくらインターネット株式会社
PDF
さくらのクラウド開発と運用(九州インフラ交流勉強会(Kixs) Vol.005)
by
さくらインターネット株式会社
PDF
20210925_jazug_azure_what_to_do_first
by
TomoakiOno
PDF
「やってみました SoftLayer クラウドゲートウェイ / NetApp AltaVault」
by
softlayerjp
Arukasの運用事例と、末永くインフラ運用していくためのTips(SRE Tech Talks #2)
by
さくらインターネット株式会社
5分で分かるサイボウズのSRE
by
uchan_nos
自動構築と自動テスト〜インフラのコード化とクラウドの優位性
by
azumakuniyuki 🐈
さくらインターネットベアメタル自動化への挑戦
by
Hiroki Ito
○ヶ月でできた!?さくらのクラウド開発秘話(【ヒカ☆ラボ】さくらインターネットとMilkcocoa!年末イベント:ここだけのウラ話)
by
さくらインターネット株式会社
さくらのクラウド開発と運用(九州インフラ交流勉強会(Kixs) Vol.005)
by
さくらインターネット株式会社
20210925_jazug_azure_what_to_do_first
by
TomoakiOno
「やってみました SoftLayer クラウドゲートウェイ / NetApp AltaVault」
by
softlayerjp
What's hot
PDF
止めないためのWEBインフラ入門
by
Sho Okada
PDF
さくらのクラウドの研究活用
by
さくらインターネット株式会社
PDF
Janog37 Pattern BoF
by
Miya Kohno
PDF
JAZUG 4周年総会 「トラブルから学ぶAzure世渡り術」
by
Yui Ashikaga
PDF
Ansible はじめてみました
by
Takeshi Kuramochi
PDF
グローバルファイル転送のベストプラクティス
by
softlayerjp
PDF
さくらのクラウド活用事例 - 構成と運用のご紹介(Innovation EGG 第5回 『クラウド運用の本音』)
by
さくらインターネット株式会社
PPTX
Mackerel x Twilio ~レコチョクの場合~
by
recotech
PDF
クラウド運用3足の草鞋151102
by
Keiichi Hashimoto
PDF
これからはじめるインフラエンジニア
by
外道 父
PDF
ACE 第6回定例会 ショートプレゼン
by
Yui Ashikaga
PPTX
ストレージサービスからの情報漏えいにサヨナラ
by
Masato Nakamura
PDF
Rancher による社内向けテナントサービス基盤
by
Keita Shimada
PDF
Global azure boot camp 2015 in japan 妖怪はみた!実録 Azure事件簿
by
Yui Ashikaga
PPTX
Microsoft Azureで描く未来 !CLR/H &Windows女子部 ー lesson1
by
Yasuaki Matsuda
PPTX
もしSIerのエンジニアがSRE本を読んだら
by
Tomoki Ando
PDF
NetOpsCoding#5 introduction
by
Taiji Tsuchiya
PPTX
AI分野におけるコンテナオーケストレーションとは
by
Tetsurou Yano
PDF
zabbixを使ったクラウド環境の監視とツール連携
by
NHN テコラス株式会社
止めないためのWEBインフラ入門
by
Sho Okada
さくらのクラウドの研究活用
by
さくらインターネット株式会社
Janog37 Pattern BoF
by
Miya Kohno
JAZUG 4周年総会 「トラブルから学ぶAzure世渡り術」
by
Yui Ashikaga
Ansible はじめてみました
by
Takeshi Kuramochi
グローバルファイル転送のベストプラクティス
by
softlayerjp
さくらのクラウド活用事例 - 構成と運用のご紹介(Innovation EGG 第5回 『クラウド運用の本音』)
by
さくらインターネット株式会社
Mackerel x Twilio ~レコチョクの場合~
by
recotech
クラウド運用3足の草鞋151102
by
Keiichi Hashimoto
これからはじめるインフラエンジニア
by
外道 父
ACE 第6回定例会 ショートプレゼン
by
Yui Ashikaga
ストレージサービスからの情報漏えいにサヨナラ
by
Masato Nakamura
Rancher による社内向けテナントサービス基盤
by
Keita Shimada
Global azure boot camp 2015 in japan 妖怪はみた!実録 Azure事件簿
by
Yui Ashikaga
Microsoft Azureで描く未来 !CLR/H &Windows女子部 ー lesson1
by
Yasuaki Matsuda
もしSIerのエンジニアがSRE本を読んだら
by
Tomoki Ando
NetOpsCoding#5 introduction
by
Taiji Tsuchiya
AI分野におけるコンテナオーケストレーションとは
by
Tetsurou Yano
zabbixを使ったクラウド環境の監視とツール連携
by
NHN テコラス株式会社
Viewers also liked
PDF
Database sql
by
明 高橋
PDF
Dockerホスティング「Arukas」について(「さくらインターネット」のDockerホスティング「Arukas」と「Docker Machine」ドラ...
by
さくらインターネット株式会社
PDF
Aws×phpでの 高信頼かつハイパフォーマンスなシステム
by
KoteiIto
PDF
DMMのゲームプラットフォームで利用している技術やシステム構成、レガシーシステムが抱える課題、解決のためのシステムリプレイスの進め方
by
DMM_GAMES_PF
PDF
Elasticsearchを使うときの注意点 公開用スライド
by
崇介 藤井
PPTX
go-apt-cacher/mirror
by
yutannihilation
PDF
Dockerの基本と応用~快適コンテナライフを実現するArukas~
by
Masahito Zembutsu
PDF
Arukasのご紹介 for 『kintone Café 鹿児島 Vol. 4 × さくらクラブ鹿児島』
by
さくらインターネット株式会社
PDF
Arukas(Dockerホスティング)サービス概要資料2016年10月版
by
さくらインターネット株式会社
PDF
意外と知られていない AWSのメール配信 テクニック
by
Yamamoto Kazuhisa
PPTX
Elasticsearchインデクシングのパフォーマンスを測ってみた
by
Ryoji Kurosawa
PPTX
CloudWatch Eventを使ったamiの削除
by
淳 千葉
PDF
initramfsについて
by
Kazuhiro Nishiyama
PDF
トランザクションの並行処理制御
by
Takashi Hoshino
PPTX
20161208 Classmethod Codenize Tools
by
Kazuki Ueki
PDF
2017 0217 io tlt勉強会_発表用
by
yasuyuki_suzuki
PDF
「さくらのIoT Platform α」ハンズオン(さくらクラブIoT福岡 第1回勉強会~さくらのIoT Platformを体験しよう!)
by
さくらインターネット株式会社
PPTX
Sql server のバックアップとリストアの基礎
by
Masayuki Ozawa
PDF
Introducing in-house PaaS in SmartNews
by
Nobutoshi Ogata
PPTX
Github pagesでRPubsにサヨナラ!
by
yutannihilation
Database sql
by
明 高橋
Dockerホスティング「Arukas」について(「さくらインターネット」のDockerホスティング「Arukas」と「Docker Machine」ドラ...
by
さくらインターネット株式会社
Aws×phpでの 高信頼かつハイパフォーマンスなシステム
by
KoteiIto
DMMのゲームプラットフォームで利用している技術やシステム構成、レガシーシステムが抱える課題、解決のためのシステムリプレイスの進め方
by
DMM_GAMES_PF
Elasticsearchを使うときの注意点 公開用スライド
by
崇介 藤井
go-apt-cacher/mirror
by
yutannihilation
Dockerの基本と応用~快適コンテナライフを実現するArukas~
by
Masahito Zembutsu
Arukasのご紹介 for 『kintone Café 鹿児島 Vol. 4 × さくらクラブ鹿児島』
by
さくらインターネット株式会社
Arukas(Dockerホスティング)サービス概要資料2016年10月版
by
さくらインターネット株式会社
意外と知られていない AWSのメール配信 テクニック
by
Yamamoto Kazuhisa
Elasticsearchインデクシングのパフォーマンスを測ってみた
by
Ryoji Kurosawa
CloudWatch Eventを使ったamiの削除
by
淳 千葉
initramfsについて
by
Kazuhiro Nishiyama
トランザクションの並行処理制御
by
Takashi Hoshino
20161208 Classmethod Codenize Tools
by
Kazuki Ueki
2017 0217 io tlt勉強会_発表用
by
yasuyuki_suzuki
「さくらのIoT Platform α」ハンズオン(さくらクラブIoT福岡 第1回勉強会~さくらのIoT Platformを体験しよう!)
by
さくらインターネット株式会社
Sql server のバックアップとリストアの基礎
by
Masayuki Ozawa
Introducing in-house PaaS in SmartNews
by
Nobutoshi Ogata
Github pagesでRPubsにサヨナラ!
by
yutannihilation
Recently uploaded
PDF
20251210_MultiDevinForEnterprise on Devin 1st Anniv Meetup
by
Masaki Yamakawa
PDF
エンジニアが選ぶべきAIエディタ & Antigravity 活用例@ウェビナー「触ってみてどうだった?Google Antigravity 既存IDEと...
by
NorihiroSunada
PDF
Machine Tests Benchmark Suite. Explain github.com/alexziskind1/machine_tests #1
by
Tasuku Takahashi
PDF
Machine Tests Benchmark Suite. Explain github.com/alexziskind1/machine_tests #2
by
Tasuku Takahashi
PDF
流行りに乗っかるClaris FileMaker 〜AI関連機能の紹介〜 by 合同会社イボルブ
by
Evolve LLC.
PPTX
楽々ナレッジベース「楽ナレ」3種比較 - Dify / AWS S3 Vector / Google File Search Tool
by
Kiyohide Yamaguchi
20251210_MultiDevinForEnterprise on Devin 1st Anniv Meetup
by
Masaki Yamakawa
エンジニアが選ぶべきAIエディタ & Antigravity 活用例@ウェビナー「触ってみてどうだった?Google Antigravity 既存IDEと...
by
NorihiroSunada
Machine Tests Benchmark Suite. Explain github.com/alexziskind1/machine_tests #1
by
Tasuku Takahashi
Machine Tests Benchmark Suite. Explain github.com/alexziskind1/machine_tests #2
by
Tasuku Takahashi
流行りに乗っかるClaris FileMaker 〜AI関連機能の紹介〜 by 合同会社イボルブ
by
Evolve LLC.
楽々ナレッジベース「楽ナレ」3種比較 - Dify / AWS S3 Vector / Google File Search Tool
by
Kiyohide Yamaguchi
cybozu.com のデータバックアップとリストア、それを活用したリハーサル
1.
cybozu.com のデータバックアップとリストア、 それを活用したリハーサル SRE Tech
Talks #2 サイボウズ株式会社 深谷敏邦
2.
自己紹介 ▌深谷敏邦 (@toshi_pp) ▌運用本部・サービス運用部・SRE ▌弊社クラウドサービスネイティブ世代 新卒5年目
3.
アジェンダ ▌SRE とオペレーション ▌cybozu.com のバックアップについて ▌アップデートリハーサルの取り組み
4.
SRE とオペレーション
5.
SRE とオペレーション ▌SRE 本曰く、SRE
とはソフトウェアエンジニア オペレータとは違う ▌しかし、Google でさえ最大 50% はオペレーションを行っている ▌現実は厳しい
6.
なぜオペレーションを避けるのか ▌オペレーションはスケールしない ▌オペレーションは繰り返しで退屈 ▌オペレーションはミスを生む ▌しかしそれでもオペレーションしないといけない
7.
SRE とバックアップ ▌やらなければならないならできるだけ安全にやりたい 事前レビュー
ペアオペレーション バックアップ ▌バックアップがあれば最悪の事態でも復旧できる 安心感
8.
cybozu.com のバックアップについて
9.
cybozu.com について ▌企業向けクラウドアプリケーションサービス 契約社数17,000社以上
契約ユーザー数65万人以上 ▌データ量は270TB程度
10.
アーキテクチャ ▌マルチテナント ▌マルチアプリケーション ▌マルチバックエンド MySQL Solr
Blob server 独自データベース heysha.cybozu.com onsha.cybozu.com
11.
cybozu.com の運用環境 ▌ハウジングによる自社DC 東日本にメイン環境
西日本にバックアップサイト ▌ベアメタルサーバーの利用 ▌自社開発のクラウド基盤 KVM LVM+iSCSI
12.
cybozu.com のバックアップについて ▌ディスクイメージレベルのオンラインバックアップ(物理バックアップ) ▌インクリメンタルフォーエバー 14日分の増分を保持してその間の任意の時点がリストア可能 ▌メリット
ミドルウェア非依存 ▌デメリット バックアップ時間がかかる リストアが遅い full image … restore restore
13.
バックアップシステムについて ▌ベアメタルに最適化 ▌高速なスキャン HDDはシーケンシャルにアクセスすれば速い ディスク10本のRAID6ならシーケンシャルリードが1GB/sでる ▌ハッシュを使った高速な増分検出 ▌高速な圧縮
snappy
14.
010101010 010101001 … Backup server Backup client disk image hash incremental
diff storage server backup server
15.
遠隔レプリケーション ▌バックアップが1個しかないのは怖い オペミス 地震雷火事おやじ ▌DC間データレプリケーション
データ回線が細い(10Gbps v.s. 1Gbps) ▌CPU を活用して帯域を節約 並列gzip圧縮 LZMAは重すぎた…
16.
東 西 の 壁 東日本DC 西日本DC replication server replication client backup server
replication server snappy diff gzip diff
17.
リストアの工夫 ▌増分バックアップはリストアが遅い 1ボリュームのリストアに数十分~数時間かかる ▌データ量の観点で pre-restore
はコストが大きい ▌増分だけ保持するブロックデバイスがあれば、リストアがそもそも不要 ⇒ dm-thinp
18.
DM Thin Provisioning
(dm-thinp) ▌Linux kernel 3.2 から導入されたデバイスマッパー docker のストレージにも利用されている ▌書き込んだ部分だけ実容量を使用するブロックデバイス B木によって論理ブロック↔実ブロックをマッピングする ▌Incremental Diff を Thin デバイスとして保持する 保存容量を抑えることができる 利用時にリストアする必要がない ▌スナップショットのスナップショットが作れる 利用前にスナップショットを作ることで任意のバックアップを自由に書き換え可能
20.
DM-thinp の失敗談 ▌マッピング用のメタデータデバイスが最大16GBまでしか利用できない 大量のマッピングを保持できない ▌kernel
3.13 (Ubuntu trusty) ではいくつかバグを持っている B木の操作が間違っていてデータ破損が起こる upstream からバックポート済み メタデータスナップショットを使ったときメタデータが破損する場合がある 原因不明 ▌東日本のバックアップでは使わず、西日本のレプリケーション先でのみ使用
21.
バックアップデータの活用 ▌バックアップの運用環境への書き戻しは99%起こらない データを完全に破損してしまうほどのバグやオペミスはまれ ▌バックアップはコストではない 安全にお客様データに触れる手段 ▌活用法
障害調査 アップデートリハーサル
22.
アップデートリハーサルの取り組み
23.
アップデートリハーサル ▌データを更新するアップデート前に、本番手順を使ったリハーサルを行う 想定外のデータがあることでアップデートが失敗しないか まれによくある
アップデートに時間がかかりすぎないか ▌すべては安心のため
24.
リハーサルの流れ ▌本番環境のコピーを作成 バックアップデータから本番環境のスナップショットをリストア ▌アップデートスクリプトを流す ▌成功ならリリースへ ▌失敗なら開発チームにフィードバック データ依存ならリハーサル環境を使って調査
25.
リハーサルに求められるリストアの要件 1. 環境全体のリストア 2. リソースアロケーションの自動化 3.
グローバルに存在するサービスの扱い
26.
①環境全体のリストア ▌データのリストアがあってもアプリケーションは動かない ▌データのバックアップ時点のアプリケーションの構成情報が必要 ▌構成情報のリストアは単純ではない オリジナルのデータを向かないように、リストア先を見るようにする VM
などの ID をオリジナルとかぶらないようにする ▌リストアというよりも当時の構成情報を基にした再構築
27.
マルチテナント環境のリストア ▌1つのアプリケーションをリストアすると、オリジナル、リストアの2つができる ⇒マルチテナント ▌cybozu.com は最初からマルチテナント ▌マルチテナント環境をリストアすると? ①
マルチテナント ② マルチテナントのマルチテナント ▌ オリジナルとリストア環境を区別したいので② ① ②
28.
ワールドライン(WL) ▌マルチテナントのマルチテナントの名前 元ネタは某ゲーム ▌あるタイミングの環境全体を一意に特定するID 本番環境は現在を示す特別なWLを割り当てている ▌アプリケーションはWLとテナントの複合キーで識別される
(WL, tenant) -> application
29.
②リソースアロケーションの自動化 ▌本番は職人(SRE)による温かみのあるリソース割り当て ▌リストア環境構築ツールで使用メモリを元に貪欲法で割り当て まれにリソースが足りずにリハーサルが失敗する その場合は手動で割り当てなおす VM
VM VM VM VM VM
30.
③グローバルに存在するサービスの扱い ▌全テナントが共通に使うサービスがいくつか存在する 画像変換サービス 添付ファイルからの文章抽出サービス ▌WLが後づけでサービスはリクエスト元のテナントが識別できない ▌特定のWLだけを扱うように設定
少なくともリハーサルはできる (w1, a) (w2, a) image converter tenant:a tenant:a
31.
喜びの声
32.
今後に向けて ▌バックアップやリストアの仕組みを各サービスでネイティブに持つ 後づけは大変 ▌バックアップの高速化 ラボで開発した
WalB の導入 https://github.com/walb-linux/walb-driver ▌リソーススケジューラの導入 オペレーションやコードの複雑さを低減させる
33.
まとめ ▌サイボウズのバックアップの仕組みを紹介しました ベアメタル環境でのバックアップ、リストア ▌安心してオペレーションできる仕組みを作ろう バックアップツールの整備
アップデートリハーサル
34.
We are hiring! サイボウズでは一緒にサービスを育てていく仲間を 募集しています
Editor's Notes
#11
マルチテナント slack と同じようにサブドメインで分かれる
Download