Data Domain Backup & Recovery

3,810 views

Published on

EMC Backup & Recovery Solutions: Backup to the Future

Published in: Technology
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
3,810
On SlideShare
0
From Embeds
0
Number of Embeds
3
Actions
Shares
0
Downloads
180
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Data Domain Backup & Recovery

  1. 1. EMC Backup & Recovery Solutions: Backup to the Future Lucian Gavris Kurt Kraus Account Manager Advisory Technology Consultant EMC Backup Recovery Solution Divison EMC Backup Recovery Solution Divison lucian.gavris@datadomain.com kraus_kurt@emc.com +49 171 499 7171 © Copyright 2009 EMC Corporation. All rights reserved. 1
  2. 2. Backup entwickelt sich fort Backup/Recovery Anwendungs- Backup- und Backup- Disaster Architektur Backup- Medien- Speicher Recovery Klienten Verwaltung vor Ort Storage NetWorker Band Band Konventionell (bandbasiert) Disk NetWorker VTL/Band Library NetWorker Data Domain Neuartig (plattenbasiert) Avamar VM Data Protection Advisor Vor Ort Ausgelagert © Copyright 2009 EMC Corporation. All rights reserved. 2
  3. 3. Warum nutzen Großunternehmen immer noch Bänder? Primär- • Niedrige speicher Anschaffungskosten PLATTE • Bänder können die massive Menge an redundanten BAND Daten aus Backups speichern • Auslagerung an zweiten Backup Standort Speicher 5-10fache Kapazität © Copyright 2009 EMC Corporation. All rights reserved. 3
  4. 4. Kostenvorteile durch Deduplizierung Traditioneller Plattenspeicher Deduplizierungsspeicher © Copyright 2009 EMC Corporation. All rights reserved. 4
  5. 5. EMC BRS Marktpositionen  Avamar – Führende Deduplizierungs-Backupsoftware weltweit – 4.500 Installationen – 2.500 Kunden  Data Domain – Führender Deduplizierungsspeicher weltweit – 12.000 Installationen – 4.300 Kunden  Disk Library – Bestverkaufte VTL weltweit – Mehr als 1 Mrd. US-$ Umsatz  NetWorker – Unter den ersten drei Unternehmens-Backuplösungen – 30.000 Kunden © Copyright 2009 EMC Corporation. All rights reserved. 5
  6. 6. Analysten über Data Domain ―Data Domain has the largest market share, both in terms of customers and appliances in production.‖ ―Data Domain is a vendor that has the most ‘mind share’ in the deduplication space and was an early provider with this technology.‖ Source: Gartner Report ID Number: G00165744 ―Four Technologies That Mid-sized Businesses Should Consider‖ Feb 2009 ―Data Domain is the de facto leader in the market from a customer deployment perspective.‖ ―The leading supplier of data deduplication technology from a real-world implementation and market penetration perspective is Data Domain.‖ Source: IDC Opinion, Teck Buyer Case Study, Doc. # 216452 Feb 2009 ―Data Domain has 54% deduplication market share.‖ Source: The Taneja Group, September 2008 © Copyright 2009 EMC Corporation. All rights reserved. 6
  7. 7. Data Domain Deduplizierungsspeicher Backup & Archiv Anwendungen CIFS, NFS, NDMP, OpenStorage Ethernet Replication VTL over FC DD880 Appliance DD880 Appliance  4 Höheneinheiten  2 - 6 Ports  10 und 1 Gbit Ethernet; 4 Gbit Fibre Channel  RAID-6  5,4 bis 71 TByte nutzbare Kapazität  1 TByte oder 500 GByte 7,2k U/min SATA-Laufwerke  Dateisystem  NVRAM  N+1 Lüfter und redundante Hotplug-Netzteile Einfache Integration in bestehende Umgebungen © Copyright 2009 EMC Corporation. All rights reserved. 7
  8. 8. Hierarchie der Datenreduzierungs- möglichkeiten für Backups Standard-Speichersystem 1:1 Kompression LZ-Kompression ~ 2:1 Single-Instance-Speicher Dateiebene ~ 3:1 Fix-Block, Fix-Block Snapshots ~ 3:1 Variable Deduplizierung Backup-Ziel, Segmente Variable Segmente reduziert deutlich ~ 20:1 - die benötigte WAN Bandbreite - den Stromverbrauch - die Klimaaufwendungen - die Kühlung - die Verwaltung © Copyright 2009 EMC Corporation. All rights reserved. 8
  9. 9. De-Dup Faktor – was heisst das eigentlich? Faktor Space Saving 1 0% 2 50% 3 67% 4 75% 5 80% 6 83% 7 86% 8 87% 9 89% 10 90% 50 98% 100 99% 500 99.8% © Copyright 2009 EMC Corporation. All rights reserved. 9
  10. 10. DeDuplizierung – Grundlagen 1. Dateneingang 2. Aufteilung in variable Segmente 4- 12KB und Deduplizierung 3. Komprimierung 4. Schreiben und Verifizieren Index & Segmentinformationen © Copyright 2009 EMC Corporation. All rights reserved. 10
  11. 11. Recovery: ―Data Invulnerability‖ Architektur Datenüberprüfung Prüfsumme DeDup, auf Platte schreiben Verifizieren Selbstheilendes File System Cleaning Defrag Verifizieren Zusätzlicher Schutz • RAID-6 • NVRAM • N+1 Fan • n Ports • Snapshots Trust but verify – hope is not a strategy ! © Copyright 2009 EMC Corporation. All rights reserved. 11
  12. 12. Daten-DeDuplizierungseffekt Backup Logical Estimated Physical Friday Full Backup Data Reduction A B C D A E F G FRIDAY FULL 10 TB 2-4x 2.5 TB Mon Incr A B H Monday Incr 1 TB 7-10x 100 GB Tues Incr C B I Tuesday Incr 1 TB 7-10x 100 GB Weds Incr E G J Wednesday Incr 1 TB 7-10x 100 GB Thurs Incr A C K Thursday Incr 1 TB 7-10x 100 GB Second Friday Full Backup 2nd FRIDAY FULL 10 TB 50-60x 180 GB B C D E F L G H TOTAL 24 TB 7.8x 3.08 TB A BCDE FGH I J K L © Copyright 2009 EMC Corporation. All rights reserved. 12
  13. 13. Daten-DeDuplizierungseffekt Backup Logical Estimated Physical Data Reduction First Full 10.0 TB 4x 2.50 TB Week 1 April 7 24.0 TB 8x 3.08 TB Week 2 April 14 38.0 TB 10x 3.80 TB Week 3 April 21 52.0 TB 12x 4.33 TB Month 1 April 28 66.0 TB 14x 4.71 TB Month 2 May 31 122 TB 17x 7.18 TB Month 3 June 30 178 TB 19x 9.37 TB Month 4 Juli 31 234 TB 20x 11.7 TB TOTAL 234 TB 20x 11.7 TB Längere Aufbewahrungszeiten mit der selben Diskkapazität ! © Copyright 2009 EMC Corporation. All rights reserved. 13
  14. 14. De-duplication Beyond Backup Backup Archive Database Clients SQL File Mail VMware Virtual Machines LAN nfs App App App App SAN cifs OS OS OS OS VCB File Proxy Virtualisation VMware Infrastructure 3 vmdk Snapsho t Tier 2 VMware ESX Host Tier 1 CIFS NFS OST NDMP DR Site Primary FC/iSCSI/NFS Mainframe/ Storage iSeries/ AS400 ESCON WAN / Replikation FICON Aussenstellen Retention Lock © Copyright 2009 EMC Corporation. All rights reserved. 14
  15. 15. Replikation: WAN–Effizienz 90- 95% Bandbreitenreduzierung 5- 10% DIR A home 5- 10% WAN Backup Daten 5- 10% home Ziel: Data Center Hub Quelle: Remote Sites Echtes DR; reduziert WAN–Kosten; verbessert SLAs ! © Copyright 2009 EMC Corporation. All rights reserved. 15 15
  16. 16. DD Replicator Software: One-to-Many Directory Replication Replicates the same directory to multiple remote Data Domain systems  Increases protection—multiple copies to different disaster recovery sites  Data distribution for multi-site usage—QA, testing, development One-to-Many Cascaded Replication with One-to-Many Destination Source Destination Source and Source destination Destination © Copyright 2009 EMC Corporation. All rights reserved. 16
  17. 17. Inline- im Vergleich zu Post-Process- Deduplizierung Post Process: Inline: Deduplizierung nach dem Deduplizierung vor dem Speichern Speichern Speichern Deduplizierung Deduplizierung Dreifache Zugriffe auf Festplatten Konkurrierende Prozesse Andere Aktivitäten bleiben verlangsamen das System unbeeinflußt − Kopien auf Band: Zu langsam zum − Vorhersagbar Streamen − Einfacher − Recovery: SLAs nicht vorhersagbar − Replikation: findet erst nach Dedup statt − Deduplizierung selbst kollidiert mit Backup und Restore Daher höherer Verwaltungsaufwand © Copyright 2009 EMC Corporation. All rights reserved. 17
  18. 18. Online vs Post DeDuplizierung Online DeDuplizierung Post DeDuplizierung Backup DDUP Verifizierung Replikation Backup  DDUP  Verifizierung  Replikation   Kein zusätzlicher Plattenbedarf  geringere  Zusätzlicher Platzbedarf  höhereStromkosten Stromkosten  Höhere Software-Upgradegebühren notwendig  Geringere Software-Upgradegebühren  Extrem I/O-lastig notwendig  Anfällig für Datenkonstistenzprobleme / hohe Wahrscheinlichkeit für Diskfragmentierung  Replikation kann unmittelbar mit dem  Replikation kann erst nach Post-Deduplizierung Backup angestoßen werden  DR fähig angestoßen werden  DR fähig ? © Copyright 2009 EMC Corporation. All rights reserved. 18
  19. 19. Leistung: CPU-zentrisch im Vergleich CPU-zentrisch © Copyright 2009 EMC Corporation. All rights reserved. 19
  20. 20. New Q2 Capabilities: Building Upon Data Domain Architectural Advantages Data Domain SISL Scaling Architecture: CPU-Centric 5 Multi-controller systems with global 2011 (est.) deduplication 3 Throughput GB/s Distributed processing for single-controller systems 1.5 DD880, July 2009 Industry’s fastest backup storage controller 0.04 DD200 (2004) 1.25 70 > PB Addressable capacity in terabytes post-RAID (physical) © Copyright 2009 EMC Corporation. All rights reserved. 20
  21. 21. New Q2 Data Domain Systems and Software Retain, replicate, recover…better Available May 2010 Systems  New Data Domain Global Deduplication Array – Largest, fastest Data Domain deduplication storage system  Data Domain DD880 expansion – Double the capacity Software  New Data Domain Boost software – Speeds backups by distributing parts of deduplication process to backup server  New Data Domain Encryption software – Industry’s first encryption of deduplicated data at rest  Data Domain Replicator software enhancements – For small sites and one-to-many directory replication © Copyright 2009 EMC Corporation. All rights reserved. 21
  22. 22. Data Domain Global Deduplication Array Largest, fastest Data Domain deduplication storage system New  Global deduplication and single namespace across two DD880 controllers – Speed: Up to 12.8 TB per hour (3.5 GB/s) – Usable capacity: Up to 285 TB – Logical capacity: Up to 14.2 PB – Up to 270 concurrent write streams – As replication target, up to 270 originators  Simplifies backup administration  Managed replication  Upgrade single DD880 to Global Deduplication Array largest capacity • higher performance • simplified management © Copyright 2009 EMC Corporation. All rights reserved. 22
  23. 23. Also New: Data Domain DD880 Doubles Capacity Data Domain  Up to 142.5 TB (up to 7.1 PB logical) Operating System 4.8, DD880 12 shelves  Support for up to 12 shelves  Upgrade kit for existing DD880 DD880 Logical capacity 2.8–7.1 PB Raw capacity Up to 192 TB Usable capacity Up to 142.5 TB © Copyright 2009 EMC Corporation. All rights reserved. 23
  24. 24. DD Boost Software New  Distributes parts of deduplication process to backup server DD Boost – Licensable software works across Data Domain portfolio  Supports majority of backup software market – Symantec NetBackup and Backup Exec currently – EMC NetWorker support in 2H 2010  Speeds backups by up to 50%  Process more backups with existing resources – 20–40% less overall impact to backup server – 80–99% less LAN bandwidth  Enables Data Domain replication management from the backup application © Copyright 2009 EMC Corporation. All rights reserved. 24
  25. 25. DATA DOMAIN BOOST Distributes Deduplication Process Without DD Boost LAN LAN Application Backup server With DD Boost Software LAN DD Boost LAN Application Backup server Deduplication process distributed through DD Boost © Copyright 2009 EMC Corporation. All rights reserved. 25
  26. 26. DATA DOMAIN BOOST What Gets Distributed? With DD Boost Speeds backups Less backup ID Segment Unique? server impact Compress Write Less bandwidth LAN DD Boost LAN Application Backup server © Copyright 2009 EMC Corporation. All rights reserved. 26
  27. 27. DD Boost Across the Portfolio: Up to 50% Faster New Global Deduplication Array DD880 DD600 Appliance Series Software options: DDX Array Series DD Boost, DD Virtual Tape Library, Up to 16 Controllers DD140 Remote DD Replicator, DD Retention Lock, and Office Appliance DD Encryption Global DD140 DD610 DD630 DD660 DD690 DD880 Deduplication DDX Array Array Speed (other) 450 GB/hr 675 GB/hr 1.1 TB/hr 2.0 TB/hr 2.7 TB/hr 5.4 TB/hr 86.4. TB/hr Speed (DD Boost) 490 GB/hr 1.3 TB/hr 2.1 TB/hr 2.7 TB/hr 3.9 TB/hr 8.8 TB/hr 12.8 TB/hr 140 TB/hr Logical capacity 17–43 TB 75–195 TB 165–420 TB .520–1.31 PB .710–1.7 PB 2.8–7.1 PB 5.7–14 .2 PB 45.6–114 PB Raw capacity 1.5 TB Up to 6 TB Up to 12 TB Up to 36 TB Up to 48 TB Up to 192 TB Up to 384 TB Up to 3.07 PB Usable capacity 0.86 TB Up to 3.98 TB Up to 8.4 TB Up to 26.1 TB Up to 35.3 TB Up to 142.5 TB Up to 285 TB Up to 2.28 PB © Copyright 2009 EMC Corporation. All rights reserved. 27
  28. 28. DD Encryption Software Industry’s first encryption of deduplicated data at rest New Inline: deduplication and  Protects against loss of disk or system encryption before storing – Inline encryption provides immediate protection Deduplication + Encryption while preserving deduplication – Works with all protocols and applications  Software-based, user-selectable AES-128 or AES-256  Replicate encrypted data (payload only, not session) using DD Replicator © Copyright 2009 EMC Corporation. All rights reserved. 28
  29. 29. Data Domain Retention Lock Software Wandelt Data Domain Systeme in ein WORM Medium mit In-Line Deduplizierung  Schutz gegen alle logischen Fehler  Hohe Kosteneinsparung durch Deduplizierung Management auf Datei Ebene  Retention Policy’s auf Datei Ebene  Freigabe des Speicherplatzes nach Ablauf der Retention Zeit Umfangreiche Kompatibilität  Anbindung an alle gängigen Daten- und Archivierungsysteme Datenschutz in Verbindung mit Hochverfügbarkeit  Datensicherheit durch RAID6  Integrierte Daten Unverwundbarkeits Architektur mit einer mehrstufigen Datenverifizierung © Copyright 2009 EMC Corporation. All rights reserved. 29
  30. 30. Archivierung von NAS Daten – Einsparpotiential von bis zu 80% – Verlängerung der Lebenszeit der Primärspeichersysteme durch Auslagerung der Daten auf hoch effiziente Data Domain Systeme Clients Applikationen CIFS / NFS © Copyright 2009 EMC Corporation. All rights reserved. 30
  31. 31. Enterprise Manager GUI © Copyright 2009 EMC Corporation. All rights reserved. 31
  32. 32. Enterprise Manager GUI © Copyright 2009 EMC Corporation. All rights reserved. 32
  33. 33. Replication Monitoring © Copyright 2009 EMC Corporation. All rights reserved. 33
  34. 34. Kundenbeispiele File+Oracle Sicherungen auf Data Domain – die ersten 3 Wochen Pre-Comp Post-Comp Global-Comp Local-Comp Total-Comp Beispiel auf 3 Wochen Retention: 14.11- (GiB) (GiB) Factor Factor Factor (Reduction %) 07.12.09 --------------- -------- --------- ----------- ---------- ------------- Currently Used: 258311.3 26808.9 - - 9.4x (89.4) • 258TB gesichert - 27.3TB auf DD belegt Written:* • Overall Ergebnis 9.5x (89.4%) Last 7 days 67010.7 4743.8 6.2x 2.3x 14.1x (92.9) • Last 7 Day Ergebnis 14.1x (92.9%) Last 24 hrs 10970.0 687.7 7.2x 2.2x 16.0x (93.7) • Last 24 h Ergebnis 12.3x (91.9%) --------------- -------- --------- ----------- ---------- ------------- • Aus den höheren Last 7 days und last 24h Werten lässt sich erkennen, dass das tägliche Datenwachstum auf der Data Domain immer geringer wird. • Pre-Comp: Backup Datenvolumen, welches vom Backup Server geschrieben wurde und auf der Maschine gespeichert ist. • Post-Comp: Datenmenge die nach Dedupe und Compression auf den Platten gespeichert ist • Comp Ratio: Overall Datenreduktionsfaktor © Copyright 2009 EMC Corporation. All rights reserved. 34
  35. 35. Kundenbeispiele File+Oracle Sicherungen auf Data Domain – Zeitraum >1 Jahr Pre-Comp Post-Comp Global-Comp Local-Comp Total-Comp Beispiel auf >1 Jar Retention: (GiB) (GiB) Factor Factor Factor (Reduction %) • 735TB gesichert – 31TB auf DD belegt --------------- -------- --------- ----------- ---------- ------------- Currently Used: 735084.3 31090.5 - - 23.6x (95.8) • Overall Ergebnis 23.6x (95.8%) Written:* Last 7 days 28745.7 1731.4 12.3x 1.3x 16.6x (94.0) •Der Einbruch in der Graphik zeigt das Last 24 hrs 1747.5 102.2 11.2x 1.5x 17.1x (94.2) Ausaltern der Backup die Ihre Retention --------------- -------- --------- ----------- ---------- ------------- von 1 Jahr erreicht haben • Pre-Comp: Backup Datenvolumen, welches vom Backup Server geschrieben wurde und auf der Maschine gespeichert ist. • Post-Comp: Datenmenge die nach Dedupe und Compression auf den Platten gespeichert ist • Comp Ratio: Overall Datenreduktionsfaktor © Copyright 2009 EMC Corporation. All rights reserved. 35
  36. 36. Kundenbeispiel ... die ersten Tage Dedupe ratio of production data 1st Full Backup: 3.4x (70.6%) data reduction 45TB data saved => 14.3TB used on Data Domain disk Overall: 5.0x (80.0%) data reduction 77.8TB data saved => 15.6TB used on Data Domain disk Subsequential Backups: ~20x (95%) 20.4TB data saved => 991GB used on Data Domain disk © Copyright 2009 EMC Corporation. All rights reserved. 36
  37. 37. Kundenbeispiel Oracle DB’s mit ~10% Änderungsrate/ Tag auf Data Domain – Zeitraum 4 Wochen Pre-Comp Post-Comp Global-Comp Local-Comp Total-Comp (GiB) (GiB) Factor Factor Factor (Reduction %) --------------- -------- --------- ----------- ---------- ------------- Currently Used: 112830.2 10701.6 - - 10.5x (90.5) Written: Last 7 days 43718.3 2745.6 5.4x 3.0x 15.9x (93.7) Last 24 hrs 12197.0 815.3 4.6x 3.2x 15.0x (93.3) --------------- -------- --------- ----------- ---------- ------------- 113TB gesichert – 10.7TB auf DD belegt • Overall Ergebnis 10.5x (90.5%) • Pre-Comp: Backup Datenvolumen, welches vom Backup Server geschrieben wurde und auf der Maschine gespeichert ist. • Post-Comp: Datenmenge die nach Dedupe und Compression auf den Platten gespeichert ist • Comp Ratio: Overall Datenreduktionsfaktor © Copyright 2009 EMC Corporation. All rights reserved. 37
  38. 38. Zusammenfassend - Warum Data Domain ? • Marktführer mit + 4.300 Kunden, + 12.000 installierter Systeme und 54% Marktanteil (The Taneja Group, September 2008) • Entwicklung & Einsatz der besten DDUP-Technologie (In-Line, CPU-basiert etc.) • Datenreduktion von über 90% führt zu Verkürzung von Wiederherstellungs- zeiten durch viel längere Aufbewahrung der Backupläufe auf Platte • Sicherestes und am Markt verfügbares DDUP–System • Hohe Skalierbarkeit & Performance mit bis zu 12.8TB/hr • Umsetzung „echter― DR-Konzepte STORAGE MAGAZINE'S Products of the Year • Applikationsübergreifende Best Backup Hardware DeDuplizierung Data Domain DD690 Deduplication • Real Green-IT: Drastische Reduktion der Storage System Stromkosten, des Platzbedarfes http://searchstorage.techtarget.com/productsOfTheYear/0,294801,sid5_ayr2008,00.html und der Klimakosten durch online DDUP © Copyright 2009 EMC Corporation. All rights reserved. 38
  39. 39. DACH Kunden (Ausschnitt) © Copyright 2009 EMC Corporation. All rights reserved. 39

×