Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

10分で分かるバックアップとレプリケーション

2,362 views

Published on

  • Be the first to comment

10分で分かるバックアップとレプリケーション

  1. 1. 10分で分かる バックアップとレプリケーション 星野  喬 サイボウズ・ラボ 2014-01-30
  2. 2. 内容 •  •  •  •  •  •  •  バックアップ レプリケーション ⽐比較 指標 ソフトウェア階層による分類 共通点 要素技術 2
  3. 3. バックアップ •  近過去のデータ複製を保持 •  ⽬目的: データロストの回避 メインストレージ バックアップストレージ バックアップ 7⽇日前 最新データ レストア 1⽇日前 3
  4. 4. バックアップの分類 data 0 data 1 data 2 time 差分バックアップ フルバックアップ 増分バックアップ 4
  5. 5. レプリケーション •  データを他ノードにオンライン複製 •  ⽬目的: 可⽤用性向上 Master-slave 型 Master 1  台,slave 1  台以上 Master 平等型 全ての複製が同等 今回こちらは考えない Replica Slave Slave Replica Repica 5
  6. 6. レプリケーションの分類 •  同期 –  Slave ストレージにも 書いてから write IO 完了了 •  ⾮非同期 –  Master ストレージに 書いたら write IO 完了了 6 1 2 5 3’ 2’ 4 Master 3 Slave 4 1 3 2 2’ 4’ 3’ •  準同期 –  ⾊色々な意味で使われるので注意 6
  7. 7. ⽐比較 バックアップ ⽬目的 復復旧可能な 障害の種類 最新データを 復復旧可能か レプリケーション データロストの回避 可⽤用性の向上 オペレーションミス, ソフトウェアバグも いいえ 機材故障 はい (同期) ⽚片⽅方だけでは不不⼗十分 7
  8. 8. 指標 •  RPO (recovery point objective) –  復復旧できる最新データの時刻⽬目標 •  RTO (recovery time objective) –  障害から復復旧までにかかる時間⽬目標 最終複製時刻 復復旧時刻 時間 RPO RTO •  コスト –  必要なリソースが少ないほど良良い 8
  9. 9. ソフトウェア階層による分類 容量量効率率率が良良い 適⽤用範囲が狭い アプリケーション ミドルウェア(データベースなど) ファイルシステム 容量量効率率率が悪い 適⽤用範囲が広い ストレージ(ブロックデバイス) アプリ固有の データ形式/プロトコル DBMS replication/backup ファイル単位の複製 Apple Time Machine ZFS/btrfs send/recv dm-snap, dm-thinp, DRBD • ⽤用途に応じて使い分けるべき 9
  10. 10. バックアップとレプリケーションの共通点 address 0 1 2 time full data diff 最初に全データを複製 diff diff その後増分データを複製 10
  11. 11. 要素技術: 増分データの作り⽅方 •  •  •  •  COW (Copy on write) ThinP (Thin provisioning) WAL (Write ahead logging) ... 11
  12. 12. COW (Copy on write) •  上書き時にデータをコピーして退避 0 メインストレージ 1 2 Overwrite data area (ODA) 0 0 0 2 2 ODA の索索引情報から変更更のあった領領域を取得できる 12
  13. 13. ThinP (Thin provisioning) •  索索引構造を持ち,必要時に領領域を確保 0 0 0 0 1 1 1 1 2 2 2 2 0 0 0 2 2 索索引⾛走査により増分を取得できる 13
  14. 14. WAL (Write ahead logging) •  ログを書いてからデータを書く 0 メインストレージ 1 2 ログストレージ 0 0 2 0 2 0 ログは増分データを含む 14
  15. 15. まとめ •  バックアップとレプリケーション –  ⽬目的が異異なる –  実現するソフトウェア層によって得失がある –  差分データを使うという共通点がある •  要素技術 –  COW, ThinP, WAL 15
  16. 16. 参考⽂文献 •  Wikipedia –  http://ja.wikipedia.org/ •  Linux Weekly News –  http://lwn.net/ •  IT技術者なら知っておきたいストレージの 原則と技術 –  EMC Education Services 16

×