1. MỤC LỤC
I. HỆ THỐNG LƯU TRỮ...............................................................................................................2
I.1. Tổng quan ...........................................................................................................................2
I.2. Mô hình DAS: (Directly Attached Storage) ...........................................................................2
I.3. Mô hình NAS: (Network Attached Storage)...........................................................................3
I.4. Mô hình SAN: (Storage Area Networks) ...............................................................................4
I.4.1 Hệ thống mạng SAN bao gồm...........................................................................................6
I.4.2 Các loại mạng SAN hiện có ..............................................................................................7
I.4.3 Phân biệt công nghệ FC SAN và iSCSI SAN......................................................................7
II. GIẢI PHÁP SAO LƯU VÀPHỤC HỒI DỮ LIỆU.......................................................................8
II.1. Giải pháp sao lưu thông qua băng từ (Disk-to-Tape Backup) ..................................................8
II.2. Giải pháp sao lưu bằng đĩa cứng (Disk-to-Disk Backup).........................................................9
II.3. Giải pháp quản lý sao lưu và phục hồi dữ liệu......................................................................10
II.4. Các phương pháp sao lưu dữ liệu ........................................................................................11
II.4.1. Full Backup (Sao lưu toàn bộ) .....................................................................................11
II.4.2. Incremental Backup (Sao lưu gia tăng).........................................................................11
II.4.3. Differential Backup (Sao lưu khác biệt)........................................................................12
II.5. Các hình thức tổ chức sao lưu dữ liệu..................................................................................13
II.5.1. Sao lưu tập trung - Điều khiển / Quản lý tập trung ........................................................13
II.5.2. Sao lưu phân tán - Điều khiển / Quản lý tập trung .........................................................14
II.5.3. Sao lưu phân tán - Điều khiển phân tán - Quản lý tập trung ...........................................15
II.5.4. Sao lưu phân tán - Điều khiển phân tán - Quản lý phân tán............................................16
II.6. Quá trình phát triển của hệ thống sao lưu dữ liệu..................................................................17
II.6.1. Sao lưu độc lập (Standalone Backup)...........................................................................17
II.6.2. Sao lưu tự động (Automated Backup) ..........................................................................19
II.6.3. Sao lưu trên mạng cục bộ (LAN Backup).....................................................................20
II.6.4. Mạng cục bộ, độc lập cho sao lưu (Dedicated LAN Backup) .........................................21
II.6.5. Giải pháp mạng sao lưu SAN (Storage Area Network)..................................................21
2. I. HỆ THỐNG LƯU TRỮ
I.1. Tổng quan
Như chúng ta đã biết, dữ liệu của các tổ chức, doanh nghiệp là tài nguyên vô cùng quan
trọng. Nó vừa là dữ liệu chia sẻ của mỗi thành viên trong doanh nghiệp vừa là tài sản của doanh
nghiệp, ảnh hưởng đến sự sống còn của doanh nghiệp đó. Bởi vậy việc thiết lập hệ thống lưu trữ
trong các tổ chức, doanh nghiệp là điều vô cùng cần thiết. Hệ thống lưu trữ sẽ đem lại cho các tổ
chức, doanh nghiệp những lợi ích thiết thực như:
Dữ liệu luôn ở trạng thái sẵn sàng cao
Hiệu suất hoạt động của hệ thống được nâng cao rõ rệt
Hệ thống có khả năng mở rộng lớn
Đảm bảo an toàn dữ liệu
Việc nâng cấp hệ thống được thực hiện dễ dàng
Mang tới khả năng quản lý dễ dàng
Tiết kiệm chi phí đầu tư và bảo vệ đầu tư
Khả năng hỗ trợ lớn nhất đối với máy chủ, hệ điều hành và ứng dụng
Mang tới khả năng sẵn sàng cho việc phục hồi sau thảm họa
Hiện nay có một số mô hình lưu trữ điển hình được sử dụng trong mạng doanh nghiệp
như: DAS, NAS, SAN. Chúng tôi xin đưa ra những điều cơ bản nhất và một số ưu nhược điểm
của các mô hình lưu trữ nói trên.
I.2. Mô hình DAS: (0)
Đây là mô hình cơ bản nhất của thiết bị lưu trữ, trong mô hình lưu trữ này các thiết bị lưu
trữ thường là các đĩa cứng trong, đĩa cứng ngoài và USB. Về cơ bản mô hình DAS chỉ ra rằng tất
cả các thiết bị lưu trữ sẽ được kết nối trực tiếp tới máy chủ (hoặc máy tính), chứ không phải
thông qua bất cứ thiết bị gì (kể cả switch).
3. Các mô hình phổ biến của giải pháp DAS
Một thiết bị DAS có thể cho phép nhiều người dùng cùng truy cập dữ liệu một cách đồng
thời. Mô hình lưu trữ DAS cũng có thể được sử dụng trong các mạng lớn khi chúng được gắn với
các máy chủ cho phép nhiều người truy cập vào các thiết bị DAS.
I.3. Mô hình NAS: (Network Attached Storage)
Đây là công nghệ lưu trữ mà trong đó các thiết bị lưu trữ được gắn trực tiếp vào mạng IP
và sử dụng các giao thức chia sẻ file để cho các thiết bị trên mạng IP truy cập vào. Các thiết bị
NAS mang tới sự thuận tiện trong việc đặt tập chung các thiết bị lưu trữ. Mô hình DAS cũng có
thể mang tới tính năng này, tuy nhiên không thể dễ dàng thực thi trong một số tình huống.
Mô hình của một hệ thống NAS phổ biến
4. Thiết bị NAS về cơ bản là một máy tính đã được lược bớt. Mặc dù không có màn hình,
bàn phím nhưng chúng vẫn có hệ điều hành và chúng ta hoàn toàn có thể cấu hình chúng. Việc
kết nối tới các thiết bị này được thực hiện thông qua trình duyệt web từ một máy tính trong mạng.
Các hệ điều hành NAS là các phiên bản hệ điều hành UNIX đơn giản, chẳng hạn như FreeNAS.
FreeNAS hỗ trợ nhiều định dạng file, chẳng hạn như CIFS, FTP, NFS, TFTP, AFP, RSYNC và
iSCSI.
Do các thiết bị NAS tự quản lý các chức năng hệ thống file nên chúng không cần đến máy
chủ để thực hiện chức năng này. Các mạng sử dụng các thiết bị DAS được gắn với máy chủ sẽ
yêu cầu máy chủ quản lý các chức năng hệ thống file. Đây là một điểm mạnh của NAS so với
DAS. Thiết bị NAS sẽ giải phóng máy chủ để có thể thực hiện một số nhiệm vụ quan trọng khác.
Điều này cũng có nghĩa là thiết bị NAS sẽ đơn giản hơn trong việc cấu hình và bảo trì cho các
môi trường thực thi nhỏ vì chúng không yêu cầu các máy chủ chuyên dụng.
Các hệ thống NAS thường sử dụng các cấu hình RAID để cung cấp cho người dùng một
giải pháp lưu trữ mạnh mẽ. Trong tác vụ lưu trữ, backup dữ liệu của hệ thống NAS thì chúng
được sử dụng giống như là các thiết bị DAS, chỉ có một điều khác nhau duy nhất là các thiết bị
NAS được nối tới máy chủ thông qua các thiết bị mạng.
I.4. Mô hình SAN: (Storage Area Networks)
Storage Area Network là một mạng riêng được thiết kế cho việc mở rộng các thiết bị lưu
trữ một cách dễ dàng và các máy chủ khi kết nối với SAN sẽ nhận ra các khối ổ cứng giống như
là các ổ cứng đang chạy trực tiếp trên máy chủ.
Sự khác biệt lớn nhất giữa hệ thống NAS và hệ thống SAN là thiết bị NAS quản lý chức
năng hệ thống file của hệ điều hành còn hệ thống SAN chỉ cung cấp các dịch vụ lưu trữ theo khối
và để các chức năng hệ thống file được thực hiện bởi máy tính client. Một ưu điểm mà các hệ
thống SAN tỏ ra ưu việt hơn NAS là các hệ thống NAS không thể mở rộng một cách dễ dàng.
Còn hệ thống SAN có thể mở rộng hết sức đơn giản, mặc dù vậy các hệ thống NAS lại có giá
thành rẻ hơn so với hệ thống SAN. Ưu điểm lớn nhất mà hệ thống SAN mang lại cho người dùng
đó là chúng cung cấp cách thức quản lý đơn giản, khả năng mở rộng cao, linh hoạt, tốc độ
backup và truy cập dữ liệu được cải thiện rõ rệt. Chính vì lý do này, mô hình SAN đang ngày
càng phổ biến hơn trong các doanh nghiệp lớn thực sự quan tâm tới vấn đề lưu trữ dữ liệu.
5. Với nền tảng công nghệ hiện đại và tốc độ truyền dữ liệu lớn (4Gbps hoặc 8Gbps) mạng
lưu trữ SAN đã ngày cảng trở lên phổ biến và chiếm ưu thế hơn so với các chuẩn lưu trữ còn lại.
Công nghệ mạng SAN là công nghệ cho phép tạo ra một hệ thống mạng lưu trữ tài nguyên thông
tin qui mô lớn, an toàn và đáp ứng cho các môi trường có số lượng Server lớn với hàng TB dữ
liệu với các đặc điểm cơ bản: dữ liệu lưu trữ qui mô lớn, môi trường phức tạp nhiều hệ điều hành,
dễ dàng nâng cấp dung lượng hệ thống đĩa lưu trữ dữ liệu, an toàn dữ liệu cao thông qua sao lưu
dữ liệu tập trung.
Với số lượng lớn các Server và lượng dữ liệu hàng TB (Tera Byte) với mức tăng trưởng rất
nhanh, các hệ thống lưu trữ dữ liệu trong của Server hay hệ thống kết nối với từng Server sẽ
không thể đáp ứng được yêu cầu tăng trưởng của các nguồn tài nguyên cũng như các yêu cầu về
quản trị tập trung hệ thống lưu trữ. Công nghệ SAN với khả năng cho phép kết nối thống nhất và
dùng chung một mạng lưu trữ ngoài cho nhiều Server đồng thời đáp ứng yêu cầu dễ dàng nâng
cấp không gian lưu trữ dữ liệu lên tới hàng trăm TB.
Do mạng dữ liệu được thiết lập riêng biệt với hệ thống mạng và truyền thông do đó các tác
nghiệp sao lưu hoàn toàn không ảnh hưởng tới hoạt động của hệ thống mạng. Mặt khác do dữ
liệu được quản trị tập trung nên đảm bảo tính ổn định, an toàn, an ninh của nguồn dữ liệu.
Hệ thống mạng lưu trữ được thiết lập với hệ thống mạng và truyền thông, có khả năng tạo
ra mạng lưu trữ số liệu với các địa điểm lưu trữ cách xa nhau vài trăm mét đến nhiều km do đó
cho phép tạo ra các điểm lưu dữ liệu dự phòng có thể tránh được các hiểm hoạ như cháy cục bộ,
sự cố khu nhà ... Do vậy dữ liệu được đảm bảo an toàn mức rất cao.
Sau đây là mô hình lôgic hệ thống mạng SAN:
6. I.4.1 Hệ thống mạng SAN bao gồm
SAN Switch phục vụ việc triển khai hệ thống kết nối mạng SAN.
Cáp quang, các Card giao tiếp Fiber channel kết nối các Server và các hệ thống lưu
trữ, sao lưu trên mạng SAN.
Hệ thống tủ đĩa lưu trữ kết nối mạng SAN dung lượng tối đa vài chục TB
Máy chủ quản trị sao lưu và các module phần mềm quản trị sao lưu mạng SAN;
Hệ thống tủ đĩa sao lưu dữ liệu ra băng từ có khả năng sao lưu tốc độc cao GB/giờ với
dung lượng sao lưu lớn lên tới TB dữ liệu.
Máy chủ quản trị SAN cho phép quản trị thống nhất các tác nghiệp trên hệ thống lưu
trữ SAN cùng các phần mềm quản trị kèm theo.
Tủ đĩa lưu trữ SAN còn được kết nối tới các cặp máy chủ cần cluster để có thể triển
khai cấu hình cluster trên các máy chủ này.
7. I.4.2 Các loại mạng SAN hiện có
FC SAN
FC SAN là mạng SAN giựa trên công nghệ quang ( Fibre Channel) cho phép tạo môi
trường kết nối mạng tốc độ cao (4, 8Gbps). FC SAN yêu cầu người dùng tạo một mạng FC riêng
biệt nhằm cung cấp nền tảng hạ tầng ổn định, tách rời cho hệ thống lưu trữ.
iSCSISAN
iSCSI là Internet SCSI ( Small Computer System Interface ) là một chuẩn công nghiệp
phát triển để cho phép truyền tải các lệnh SCSI qua mạng IP hiện có bằng cách sử dụng giao
thức TCP/IP.
Các lệnh SCSI và đóng gói dữ liệu có thể truyền qua mạng cục bộ ( mạng LAN ) hoặc qua
cả mạng diện rộng ( WAN ) mà không cần một Fiber Chennel mạng riêng biệt
iSCSI sử dụng không gian lưu trữ như VHD's trong Windows Server Storage , giảm chi phí khi
tận dụng hạ tầng LAN sẵn có ( các thiết bị mạng, Swich ,... trên nền IP ) . Không như giải pháp
mạng Fiber Channel ( FC ) SAN là phải xây dựng hạ tầng mạng mới với khu vực khác với khu
vưc LAN.
Đặc biệt , iSCSI SAN cũng như Fiber Channer SAN là hệ thống lưu trữ hiện sẵn trong
Server như là những ổ cứng cục bộ
I.4.3 Phân biệt công nghệ FC SAN và iSCSI SAN
Có rất nhiều chuyên gia CNTT xem xét dựa trên IP-iSCSI SAN như là một phương tiện
để tập trung lưu trữ cho các máy chủ ứng dụng của họ. Trái ngược với FC-SAN, IP-SAN có lợi
ích của bị dựa trên TCP / IP cho phép doanh nghiệp sử dụng thiết bị tiêu chuẩn Ethernet, NIC,
các công cụ và cơ sở những kiến thức trong đội ngũ nhân viên CNTT của họ.
iSCSI SAN dễ dùng, linh hoạt, dễ mở rộng, vì hoạt động dựa trên nền IP và Ethernet /
Internet, không đòi hỏi phần cứng đặc biệt nên người dùng hoàn toàn có thể triển khai, vận hành,
quản trị hệ thống với những kỹ năng căn bản như khi quản trị hệ thống mạng.
FC SAN yêu cầu phần cứng đặc biệt ( chuẩn FC), yêu cầu người dùng cần phải có kỹ năng
chuyên biệt về hệ thống FC SAN mới có thể vận hành và quản trị hệ thống.
8. Nếu như giao thức iSCSI hoạt động trên nền IP, và từ lớp Internet trở lên, thì giao thức
Fiber Channel hoạt động ở mức Physical layer, nên phụ thuộc nhiều vào phần cứng, cần đến
phần cứng riêng biệt, bao gồm các Switch, NIC (HBA) và thiết bị lưu trữ/cáp hỗ trợ Fiber
channel. Vì không hoạt động trên nền IP nên không linh động và khó mở rộng, so với IP SAN.
Hiện nay, khi hạ tầng mạng với băng thông 10Gb E xuất hiện, iSCSI sẽ chiếm được ưu thế
về tốc độ so với FC SAN. Với băng thông cao hơn so với băng thông của các sản phẩm FC hôm
nay (tối đa 8GbE), hạ tầng mạng iSCSI SAN 10GbE sẽ là nền tảng cho sự phát triển vượt bậc
của iSCSI, đồng hành cùng với sự phát triển của mỗi doanh nghiệp.
II. GIẢI PHÁP SAO LƯU VÀ PHỤC HỒI DỮ LIỆU
II.1. Giải pháp sao lưu thông qua băng từ (Disk-to-Tape Backup)
Ngày nay, thực hiện sao lưu dữ liệu ra thiết bị lưu trữ băng từ là thành phần không thể
thiếu của bất kì hệ thống CNTT nào. Thiết bị lưu trữ băng từ cùng phần mềm quản lý, sao lưu và
phục hồi dữ liệu có nhiệm vụ quản lý các thiết bị Backup, thực hiện nhiệm vụ Backup cho tất cả
các thiết bị kết nối trong SAN và khôi phục lại dữ liệu sao lưu khi có sự cố trong hệ thống. Thiết
bị lưu trữ băng từ cùng phần mềm quản lý sao lưu cho phép quản lý các quá trình backup theo
lịch trình lập sẵn cho tất cả các thiết bị kết nối đến, thực hiện các chính sách sao lưu dữ liệu cũng
như sự phối hợp của các chính sách này.
Băng từ là thiết bị lưu trữ ngoại tuyến hoạt động theo chế độ truy nhập tuần tự
(Sequence Access Mode). Công nghệ băng từ đã được phát triển từ hơn 30 năm qua và đến nay,
LTO-4 là công nghệ băng từ tiên tiến nhất.
Một số đặc điểm của LTO-4:
- Dung lượng: 800/1600GB
- Tốc độ truyền dữ liệu: 80-120MBps
- Mã hóa dữ liệu: AES256-GCM
- Cơ chế mã hóa: PRML
- Độ dài: 820m
- WORM: Có
9. - Số track dữ liệu: 896
- Số kênh dữ liệu: 16
LTO là một chuẩn mở do HP, IBM, Certance đưa ra và hiện tại được coi là chuẩn công
nghiệp trong sao lưu bằng băng từ nhờ có nhiều ưu điểm vượt trội so với các chuẩn băng từ khác
như SDLT, DLT, DDS, VXA, AIT...
Các ổ băng từ đã trở nên dễ sử dụng và phù hợp hơn với việc sao lưu dữ liệu. Các phần
mềm điều khiển các ổ băng từ và quản lý lưu trữ trên băng từ đã được tích hợp ngày càng nhiều
trên các hệ điều hành phổ biến (như Windows 9x/2000/2003, Novell Netware, Unix, Linux...) và
các cơ sở dữ liệu như Microsoft SQL, Oracle, Sybase, Informix, DB2...Các hệ thống sao lưu
băng từ được nghiên cứu, phát triển và chế tạo phục vụ cho một mục đích duy nhất là sao lưu dữ
liệu do vậy phần cứng cũng như phần mềm đã được chuyên môn hoá phục vụ cho mục đích này.
Các phần mềm chuyên dụng có đầy đủ các chức năng cần thiết như: Sao lưu lên băng từ - Khôi
phục dữ liệu trở lại hệ thống, Khôi phục dữ liệu lên hệ thống khác, Tạo thêm bản lưu dự phòng...
ngoài ra còn có các tiện ích hỗ trợ sao lưu đối với các file đang sử dụng (các file đang mở), sao
lưu các cơ sở dữ liệu đang hoạt động (như Microsoft SQL Server, Oracle, Sybase, Informix,
DB2...).
Như vậy nhờ những tính năng ưu việt trên, băng từ hoàn toàn đảm bảo an toàn dữ liệu cho
bất cứ một đòi hỏi nào. Cho đến nay việc phát triển công nghệ cho kỹ thuật sao lưu trên băng từ
vẫn không ngừng phát triển, ngày càng đạt được những kết quả hoàn hảo hơn.
II.2. Giải pháp sao lưu bằng đĩa cứng (Disk-to-Disk Backup)
Ngày nay có một thực tế là cơ sở hạ tầng về công nghệ thông tin của nhiều cơ quan tổ chức
bao gồm nhiều nền tảng máy chủ khác nhau, sử dụng nhiều hệ điều hành khác nhau. Việc quản
trị, sao lưu và phục hồi dữ liệu trở nên khó khăn. Người quản trị hệ thống luôn đứng dưới áp lực
là phải phục hồi dữ liệu trong một khoảng thời gian nhất định. Nhiều tổ chức còn có các chi
nhánh nằm cách xa nhau, mỗi chi nhánh có 1 mạng LAN và nối với Trung tâm chính qua mạng
WAN. Mỗi chi nhánh lại có 1 hệ thống sao lưu bằng băng từ riêng biệt nhằm sao lưu/phục hồi dữ
liệu cho chính chi nhánh đó. Để thực hiện việc Phục hồi sau thảm họa - DR, các băng từ sau khi
chứa đầy dữ liệu sẽ được chuyển bằng tay về Trung tâm. Mỗi khi cần phục hồi dữ liệu, người
quản trị hệ thống lại phải xuống tận chi nhánh để hỗ trợ.
10. Và do đó, cần phải có một hệ thống có thể đáp ứng được các yêu cầu sau:
- Giảm sự phụ thuộc vào hệ thống băng từ
- Có tốc độ sao lưu / phục hồi dữ liệu nhanh
- Cho phép phục hồi dữ liệu hiệu quả hơn đối với các chi nhánh ở xa
- Phù hợp với cơ sở hạ tầng thông tin sẵn có
Đó chính là hệ thống sao lưu bằng đĩa cứng dựa trên giao thức iSCSI. Hệ thống này đáp
ứng được hết các yêu cầu trên nhờ những tính năng như:
- Hỗ trợ nhiều loại kết nối: Các thiết bị sao lưu bằng đĩa cứng đều có sẵn giao tiếp
Fast và Gigabit Ethernet, có tùy chọn cho Fibre Channel.
- Hỗ trợ nhiều hệ điều hành: các máy chủ cần sao lưu sẽ phải có “iSCSI initiator
driver”, driver này hiện đang có sẵn và miễn phí cho các hệ điều hành như
Microsoft Windows 2K/2003 Server, Linux, Sun Solaris...
- Cấu hình đơn giản: dựa trên giao diện Web
- Bao gồm khả năng tạo Thư viện ảo - Virtual Tape Library: cho phép tận dụng tối
đa khả năng của các phần mềm sao lưu như Bakbone Netvault Backup, Veritas
BackupExec...
- Tốc độ sao lưu / phục hồi dữ liệu nhanh chóng: nhờ cơ chế và tốc độ đọc - ghi của
ổ cứng cũng như tốc độ của mạng Gigabit Ethernet.
Các giải pháp sao lưu bằng đĩa cứng khi kết hợp với sao lưu bằng băng từ sẽ tạo ra một
giải pháp sao lưu an toàn và hiệu quả nhất. Khi đó dữ liệu sẽ được sao lưu tập trung qua mạng
WAN về Trung tâm chính bằng hệ thống sao lưu đĩa cứng, sau đó sẽ được chuyển sang băng từ
nhằm mục đích lưu trữ lâu dài và Phục hồi sau thảm họa.
II.3. Giải pháp quản lý sao lưu và phục hồi dữ liệu
Phần mềm quản lý sao lưu và phục hồi dữ liệu có nhiệm vụ quản lý các thiết bị Backup,
thực hiện nhiệm vụ Backup cho tất cả các thiết bị kết nối trong SAN và khôi phục lại dữ liệu sao
lưu khi có sự cố hệ thống. Phần mềm này cho phép quản lý các quá trình backup theo lịch trình
lập sẵn cho tất cả các thiết bị kết nối đến, thực hiện các chính sách sao lưu dữ liệu cũng như sự
phối hợp của các chính sách này.
11. Phần mềm quản trị sao lưu dữ liệu cung cấp giải pháp tích hợp và đồng bộ trong việc
backup và restore dữ liệu bảo vệ môi trường tính toán từ một máy chủ đơn lẻ cho tới hệ thống
phức tạp phân bố trên diện rộng.
Một giải pháp sao lưu phục hồi tốt cần đáp ứng những yêu cầu sau:
Tốc độ sao lưu và phục hồi nhanh, giảm thời gian sao lưu phục hồi xuống mức thấp nhất.
Tích hợp với hệ thống SAN để nâng cao tính sẵn sàng và tính mềm dẻo, nâng cao tốc độ
đọc ghi dữ liệu.
Kết hợp với giải pháp cluster, đảm bảo một hệ thống không có bất kỳ điểm lỗi (Single
Point of Failure - SPOF)
II.4. Các phương pháp sao lưu dữ liệu
Có 3 phương pháp sao lưu dữ liệu chủ yếu sau:
II.4.1. Full Backup (Sao lưu toàn bộ)
Theo phương pháp này, tất cả các tệp dữ liệu, các thư mục đã được lựa chọn sẽ được sao
lên băng từ không phụ thuộc loại dữ liệu và thời điểm khởi tạo cũng như cập nhật. Đây là
phương pháp an toàn nhất nhưng đây cũng là phương pháp tốn kém nhất (cả về thời gian cũng
như chi phí cho băng từ).
II.4.2. Incremental Backup (Sao lưu gia tăng)
Theo phương pháp này, trong số các tệp và các thư mục đã được chọn chỉ các tệp mới tạo
hoặc có sửa đổi, cập nhật so với lần sao lưu trước đó mới được sao lưu. Đây là phương pháp tiết
kiệm băng từ và thời gian nhất khi sao lưu nhưng ngược lại khi phục hồi dữ liệu sẽ là phương
pháp phức tạp và tốn thời gian nhất.
12. II.4.3. Differential Backup (Sao lưu khác biệt)
Thường được gọi là chế độ sao lưu khác biệt. Theo phương pháp này, trong số các tệp và
các thư mục đã được chọn chỉ các tệp mới tạo hoặc có sửa đổi, cập nhật so với lần sao lưu đầy đủ
trước đó mới được sao lưu.
Trong ba phương pháp trên Differential Backup được coi là phương pháp hiệu quả nhất vì
cân bằng được hai yếu tố thời gian sao lưu và thời gian phục hồi dữ liệu. Khi đặt lịch cho phương
pháp này người ta thường tiến hành sao lưu đầy đủ (full backup) vào cuối tuần (thứ bảy) sau đó
tất cả các ngày còn lại trong tuần sẽ tiến hành sao lưu khác biệt.
Chủ Nhật Thứ Hai Thứ Ba Thứ Tư Thứ Năm Thứ Sáu Thứ Bảy
Off Differential
Backup
Differential
Backup
Differential
Backup
Differential
Backup
Differential
Backup
Full
Backup
Thứ 7 Chủ nhật Thứ 2 Thứ 3 Thứ 4 Thứ 5 Thứ 6
Full Backup
Sao lưu khác biệt
Differential
Backup
Thø
7
Chñ
nhËt
Thø
2
Thø
3
Thø
4
Thø
5
Thø
6
H
×
n
h
3
:
S
a
o
l
-
u
g
i
a
t
¨
n
g
Full Backup
Incremental
Backup
13. Lịch sao lưu cho một tuần
Như vậy vừa đảm bảo tiết kiệm băng từ vừa đảm bảo thuận lợi khi khôi phục dữ liệu. Khi
có sự cố dữ liệu tại một ngày bất kỳ (giả sử là ngày thứ năm) ta chỉ cần băng từ của lần sao lưu
đầy đủ cuối cùng (thứ bảy trước) và một băng từ sao lưu khác biệt cuối cùng (thứ tư) là có thể
khôi phục được dữ liệu.
Phục hồi dữ liệu
II.5. Các hình thức tổ chức sao lưu dữ liệu
Có 4 hình thức tổ chức sao lưu dữ liệu chính:
II.5.1. Sao lưu tập trung - Điều khiển / Quản lý tập trung
Trong hình thức này toàn hệ thống sử dụng chung một máy chủ sao lưu với các hệ thống
thư viện băng từ lớn.
Máy chủ sao lưu sẽ đảm nhận toàn bộ hoạt động sao lưu trên toàn mạng lưới. Quản trị hệ
thống sẽ sao lưu dữ liệu tại trung tâm sẽ chịu trách nhiệm toàn bộ các hoạt động :
o Lựa chọn các dữ liệu cần sao lưu
o Đặt lịch cho hoạt động sao lưu
o Quản lý toàn bộ tình hình sao lưu tại trung tâm cũng như trên toàn mạng lưới.
o Khôi phục lại dữ liệu cho các mạng trong trường hợp có sự cố.
Ưu điểm:
Full Backup
Thø
7
Chñ
nhËt
Thø
2
Thø 3 Thø
4
Thø 5 Thø
6
H
×
n
h
6
:
P
h
ô
c
h
å
i
d
÷
l
i
Ö
u
on Saturday
Required
Tapes for
Resto
ring
Diferential
Backup on
wednesda
y
Server
Crash
14. o Hình thức sao lưu này có ưu điểm là toàn bộ các hoạt động sao lưu được thực
hiện, điều khiển và quản lý tập trung.
Tồn tại:
o Đòi hỏi hệ thống mạng WAN phải có hạ tầng cơ sở rất mạnh về truyền thông
và đường mạng.
o Phải đầu tư một máy chủ mạnh chỉ đảm nhiệm hoạt động sao lưu.
o Có thể gây ra hiện tượng tắc nghẽn trên mạng nếu hoạt động sao lưu diễn ra
liên tục với dung lượng lớn.
o Trong một số trường hợp sẽ không đảm bảo quĩ thời gian cho hoạt động sao
lưu (đặc biệt trong những ngày tiến hành sao lưu đầy đủ).
o Gặp khó khăn trong trường hợp các hệ thống mạng từ xa bị sự cố (hoạt động
khôi phục dữ liệu sẽ phải tiến hành từ trung tâm xuống chi nhánh qua mạng
WAN)
II.5.2. Sao lưu phân tán - Điều khiển / Quản lý tập trung
Trong hình thức này toàn hệ thống sử dụng chung một máy chủ sao lưu.
Các hệ thống băng từ được cài đặt trên nhiều máy chủ tại trung tâm cũng như tại các chi
nhánh (tạo thành các điểm sao lưu dữ liệu).
Máy chủ sao lưu sẽ đảm nhận toàn bộ hoạt động sao lưu trên toàn mạng lưới:
o Điều khiển hoạt động sao lưu từ máy chủ sao lưu lên hệ thống thư viện băng
từ
o Điều khiển hoạt động sao lưu từ các máy chủ tại chi nhánh
o Lưu trữ toàn bộ Backup Database
o Nhân viên phụ trách Sao lưu dữ liệu tại trung tâm sẽ chịu trách nhiệm toàn bộ
các hoạt động:
o Lựa chọn các dữ liệu cần sao lưu
o Đặt lịch cho hoạt động sao lưu
o Quản lý toàn bộ tình hình sao lưu tại trung tâm cũng như trên toàn mạng lưới.
o Khôi phục lại dữ liệu cho các mạng cục bộ chi nhánh khi có sự cố xảy ra.
Ưu điểm:
15. o Hình thức sao lưu này có ưu điểm là toàn bộ các hoạt động sao lưu điều khiển
và quản lý tập trung.
o Dữ liệu được sao lưu phân tán trên các điểm sao lưu nên giảm được các nhu
cầu truyền thông trên mạng.
Tồn tại:
o Đòi hỏi hệ thống mạng WAN phải có hạ tầng cơ sở mạnh và hoàn chỉnh.
o Phải đầu tư một máy chủ dành riêng cho các hoạt động sao lưu (lưu trữ toàn bộ
Backup Database và điều khiển các hoạt động sao lưu trên toàn mạng lưới).
o Có thể gây ra hiện tượng tắc nghẽn trên mạng trong quá trình sao lưu trên toàn
mạng lưới vì hoạt động sao lưu tuy được thực hiện phân tán tại các Tape
Storage Node nhưng vẫn phải cập nhật các thông tin về Backup Database trên
Máy chủ sao lưu (tạo ra các giao dịch trên mạng WAN).
o Gặp khó khăn trong trường hợp các hệ thống tại mạng cục bộ chi nhánh bị sự
cố. Không tiến hành được Disaster Recovery vì toàn bộ Backup Database nằm
tại Máy chủ sao lưu trên trung tâm. Trong trường hợp máy chủ tại chi nhánh có
sự cố sẽ phải tuần tự tiến hành các bước sau:
Sửa chữa về phần cứng
Cài đặt lại hệ điều hành
Cài đặt lại phần mềm sao lưu dữ liệu và Tape Storage Node
Khôi phục lại dữ liệu
II.5.3. Sao lưu phân tán - Điều khiển phân tán - Quản lý tập trung
Trong hình thức này hệ thống sử dụng nhiều máy chủ sao lưu phân tán với một hệ thống
quản lý tập trung các hoạt động sao lưu.
Thực chất tại mỗi mạng con của hệ thống là một mô hình tổ chức và quản lý sao lưu dữ
liệu dạng :
Sao lưu phân tán - Điều khiển / Quản lý tập trung.
Các hệ thống băng từ được cài đặt trên nhiều máy chủ tại trung tâm cũng như tại các chi
nhánh tạo thành các máy chủ sao lưu và các điểm sao lưu.
16. Các máy chủ sao lưu sẽ đảm nhận toàn bộ hoạt động sao lưu trên từng mạng:
o Điều khiển hoạt động sao lưu từ máy chủ cũng như các máy trạm trên mạng
lên các hệ thống Tape. Lưu trữ toàn bộ Backup Database của từng mạng.
Nhân viên phụ trách Sao lưu dữ liệu tại trung tâm sẽ chịu trách nhiệm:
o Toàn bộ hoạt động sao lưu dữ liệu tại trung tâm
o Quản lý, giám sát toàn bộ hoạt động sao lưu tại các chi nhánh qua hệ thống
GUI Domain Controller.
Nhân viên phụ trách Sao lưu dữ liệu tại các mạng cục bộ sẽ chịu trách nhiệm:
o Toàn bộ hoạt động sao lưu dữ liệu tại mạng cục bộ của mình.
o Phối hợp với nhân viên phụ trách sao lưu hệ thống tại trung tâm quản lý, giám
sát toàn bộ hoạt động sao lưu tại các chi nhánh.
Ưu điểm:
o Hình thức sao lưu này có ưu điểm là toàn bộ các hoạt động sao lưu được phân
cấp quản lý và điều khiển.
o Dữ liệu được sao lưu phân tán trên các Máy chủ sao lưu nên giảm được các
nhu cầu truyền thông trên mạng.
o Các chi nhánh có thể chủ động trong hoạt động sao lưu và khôi phục dữ liệu
của chính mình.
Tồn tại:
o Do điều khiển sao lưu phân tán nên đòi hỏi phải có sự phối hợp giám sát và
quản lý chặt chẽ giữa nhân viên quản trị hệ thống trung tâm và các nhân viên
quản trị tại mạng chi nhánh.
II.5.4. Sao lưu phân tán - Điều khiển phân tán - Quản lý phân tán
Trong hình thức này hệ thống sử dụng nhiều máy chủ sao lưu phân tán.
Các hệ thống băng từ được cài đặt trên nhiều máy chủ tại trung tâm cũng như tại các chi
nhánh tạo thành các máy chủ sao lưu (Backup Server).
Các máy chủ sao lưu sẽ đảm nhận toàn bộ hoạt động sao lưu trên từng mạng:
17. o Điều khiển hoạt động sao lưu từ máy chủ cũng như các máy trạm trên mạng
lên hệ thống băng từ.
o Lưu trữ toàn bộ Backup Database của từng mạng.
o Nhân viên phụ trách Sao lưu dữ liệu sẽ chịu trách nhiệm đối với toàn bộ hoạt
động sao lưu dữ liệu tại trung tâm hoặc chi nhánh của mình.
Ưu điểm:
o Dữ liệu được sao lưu phân tán trên các Máy chủ sao lưu nên giảm được các
nhu cầu truyền thông trên mạng.
o Các chi nhánh có thể chủ động trong hoạt động sao lưu và khôi phục dữ liệu
của chính mình.
Tồn tại:
o Do điều khiển và quản lý sao lưu phân tán nên trung tâm không giám sát được
hoạt động sao lưu tại các chi nhánh.
o Hệ thống sao lưu dữ liệu tại các chi nhánh và trung tâm là hoàn toàn độc lập
với nhau, thiếu tính thống nhất và khó khăn trong quản lý.
o Khi chi nhánh gặp sự cố mà không tự giải quyết được, trung tâm không thể hỗ
trợ từ xa.
II.6. Quá trình phát triển của hệ thống sao lưu dữ liệu
Kỹ thuật sao lưu dữ liệu đã phát triển đáng kể trong hơn 15 năm qua từ ổ băng từ đơn lẻ,
lưu trữ cho một máy tính độc lập đã phát triển thành hệ thống thư viện băng từ tự động lưu trữ và
sao lưu trên hệ thống mạng đa dạng với nhiều máy chủ, trên nền tảng hệ điều hành khác nhau.
Công nghệ hiện nay là các thiết bị lưu trữ mạng NAS – Network Attached Storage, mạng lưu trữ
SAN – Storage Area Network dựa trên FC hay iSCSI.
II.6.1. Sao lưu độc lập (Standalone Backup)
Hệ thống sao lưu mở xuất hiện vào năm 1987 bằng việc ra đời của ổ băng từ dung lượng
lớn 8mm SCSI. Trong khi đó các ổ đĩa cỡ Gigabyte SCSI mới chỉ bắt đầu chỉ sử dụng trong các
trạm làm việc UNIX (UNIX Workstations) và máy tính mini. Trong giai đoạn này, giải pháp tối
ưu nhất để bảo vệ dữ liệu là kết nối trực tiếp một ổ băng từ SCSI vào máy tính và chạy chế độ
sao lưu độc lập. Dung lượng lưu trữ lớn của công nghệ băng từ ổ giai đoạn này, đã cho phép sao
lưu trực tiếp mà không cần can thiệp của quản trị hệ thống, nhưng vẫn cần có sự giám sát tiến
18. trình sao lưu chẳng hạn như việc thay đổi băng một cách thủ công khi băng đã ghi đầy. Trong
một vài năm đầu, dung lượng của băng từ đã đáp ứng được dung lượng trên ổ đĩa cứng của hệ
thống. Nhưng có thể coi hoạt động sao lưu vẫn còn là thủ công.
Sự ra đời của mạng cục bộ (LAN) và máy chủ. đã làm thay đổi phương thức luân chuyển,
khai thác dữ liệu. Dữ liệu tại các máy trạm, lúc này đã được tập chung tại máy chủ. Ổ băng từ
được kết nối trực tiếp tới máy chủ. Sao lưu được diễn ra tại máy chủ thay vì tại các trạm làm
việc. Trong môi trường đa người dùng này, dữ liệu có sự gia tăng nhanh hơn cả dung lượng của
một băng từ đơn. Một lần nữa các nhà quản trị hệ thống lại phải thực hiện công việc thủ công,
ngay như việc thay đổi băng từ để hoàn thành sao lưu, trong khi đó công việc thường được tiến
hành vào buổi đêm khi mà giao dịch trên hệ thống giảm ở mức thấp nhất. Ngay khi dung lượng
dữ liệu sử dụng đã vượt qua dung lượng của một băng từ, nhu cầu cho sao lưu tự động ngày càng
bức thiết hơn.
SCSI
Dedicated tape
driv e attached to
a serv er
Ổ băng từ chuyên
dùng cho máy chủ
Dedicated tape
drive attached
to a w orkstation
SCSI
Ổ băng từ chuyên dùng
cho máy trạm
19. II.6.2. Sao lưu tự động (Automated Backup)
Năm 1990, thư viện băng từ hệ thống mở đầu tiên dựa trên giao tiếp SCSI được giới
thiệu. Thư viện này chứa 120 băng từ và một ổ băng có khả năng nén dữ liệu hoàn toàn mới, lần
đầu tiên thư viện này đã đưa dung lượng lưu trữ lên cỡ Terabyte. Kể từ đó, các sản phẩm phục vụ
cho việc tự động hoá sao lưu bằng băng từ với đủ kích cỡ và hình dáng đã được đưa ra thị
trường. Các thiết bị này có thể chia làm hai cấp, ở cấp thấp là các thiết bị tự động tải băng
(AutoLoader) chứa 5-7 băng có thể cho phép sao lưu không cần giám sát (unattended backup)
trong khoảng thời gian một tuần, cấp cao hơn là thư viện băng từ (Tape Library) có thể tự động
sao lưu cũng như đảm bảo về dung lượng, tốc độ và độ tin cậy thông qua việc sử dụng ổ băng từ
và những đặc tính kỹ thuật tiên tiến khác nhằm đáp ứng cho những hệ thống và cơ sỏ dữ liệu cỡ
lớn.
Cùng thời gian này, các nhà cung cấp phần mềm phục vụ sao lưu đã đưa thêm phần mềm
quản lý thư viện băng từ vào những ứng dụng của họ. Một lần nữa, việc sao lưu không cần giám
sát lại có thêm một bước hoàn thiện mới.
Trong suốt những năm 90, số lượng máy chủ trong một doanh nghiệp đã thực sự bùng nổ.
Sự kết hợp của phần cứng chi phí thấp, các ứng dụng chủ - khách mới và mạng Internet đã dẫn
đến việc các máy chủ PC - Server và UNIX trở nên phổ biến trong các tổ chức và doanh nghiệp.
Thiết bị nạp băng từ tự động chuyên
dùng cho máy chủ
Dedicated tape
library or autoloader
dirrectly attached to
a server
SCSI
20. Với hiện tượng này, một vấn đề mới đã nảy sinh - làm cách nào để quản lý một cách tối ưu hoạt
động sao lưu của một hệ thống? Việc quản lý sao lưu lại trở thành một hoạt động đòi hỏi nhiều
lao động. Mặc dù hệ thống đã có thể hoạt động tự động nhưng vẫn còn những hoạt động khác để
giám sát như việc: đảm bảo rằng băng từ được nạp, việc sao lưu đã hoàn thành, việc quản lý và
kiểm soát băng đã hoàn thành: ghi nhãn và lưu trữ băng từ, xác định lỗi...
II.6.3. Sao lưu trên mạng cục bộ (LAN Backup)
Một bước tiến mới của việc quản lý dữ liệu là hầu hết máy chủ trong tổ chức hay doanh
nghiệp được kết nối đồng thời trên mạng, cùng sử dụng mạng cục bộ hoặc mạng diện rộng. Việc
phát triển phần mềm sao lưu đã đáp ứng yêu cầu này bằng phiên bản phần mềm sao lưu mới,
thiết kế dành riêng, phục vụ cho quản lý sao lưu trên mạng. Các ứng dụng sao lưu mạng LAN
thực tế có thể gửi dữ liệu từ một máy chủ, qua mạng đến một máy chủ sao lưu mà tại đó có một
thiết bị sao lưu, như thư viện băng từ hay thiết bị tự động tải băng được kết nối vào.
Sao lưu trên mạng LAN có một số ưu điểm sau:
o Có thể chia sẻ một thư viện băng từ đơn giữa các máy chủ.
o Có thể dễ dàng cân đối được dung lượng sao lưu của thiết bị với tốc độ gia tăng
lưu trữ.
o Việc quản trị được đơn giản hoá.
o Giảm chi phí.
Tuy nhiên, vẫn có một số nhược điểm như sau:
o Mạng cục bộ LAN không phải được thiết kế để trở thành giao diện lưu trữ dữ
liệu đáng tin cậy.
LAN backup using a backup
server with directly attached
tape library or autoloader
Máy chủ sao lưu
LAN
Sao lưutrên mạng LAN
21. o Thông lượng của mạng LAN trung bình ở mức 100Mb/giây, dẫn đến việc kéo
dài thời gian sao lưu. Việc lưu thông dữ liệu trên mạng LAN làm cản trở hoạt
động của các ứng dụng chủ - khách hoạt động trên mạng LAN.
II.6.4. Mạng cục bộ, độc lập cho sao lưu (Dedicated LAN Backup)
Những vướng mắc trong việc lưu thông dữ liệu có thể giảm bớt nhờ việc triển khai một
mạng LAN thứ hai trực tiếp phục vụ cho việc lưu trữ và sao lưu dữ liệu. Tuy nhiên, giải pháp
này vẫn gặp phải khó khăn do hạn chế về băng thông trên mạng và thiếu độ tin cậy cần thiết để
đảm bảo việc backup dữ liệu.
II.6.5. Giải pháp mạng sao lưu SAN (Storage Area Network)
Mạng dữ liệu là một khái niệm đơn giản nhưng lại có ảnh hưởng rất lớn tới hoạt động của
hệ thống. Do đảm nhận việc khối lượng dữ liệu lớn, mạng SAN có thể giúp cho mạng sơ cấp
(mạng cục bộ) giải quyết được nguyên nhân đầu tiên gây nên hiện tượng tắc nghẽn. Dữ liệu luôn
sẵn có đối với những ai thực sự cần, hoạt động sao lưu và phục hồi thực hiện dễ dàng hơn và
việc lưu trữ dữ liệu cũng đã được tập trung hoá và dễ quản lý.
LAN
Dedicated
network
Mạng sao lưu chuyên dụng
22. Mạng SAN bao gồm một số các bộ phận như tủ RAID, thư viện băng từ, HBA, FC
switch... và phần mềm quản lý. Mấu chốt của mạng SAN là ở chỗ tất cả các bộ phận cấu thành
đó đều được tối ưu hoá cho việc lưu trữ dữ liệu và truyền thông tin, đồng thời tất cả các bộ phận
đó đều tương thích với nhau.
Thực tế kênh SCSI có thể có những lợi điểm trong những trường hợp nhất định, nhưng có
những hạn chế khiến SCSI không thể trở thành một sự lựa chọn tốt nhất cho mạng SAN hoạt
động có hiệu quả:
o Kênh SCSI hạn chế trong phạm vi 16 địa chỉ thiết bị. Một thư viện băng từ cỡ
vừa có thể sử dụng một nửa số đó, dành số còn lại cho máy chủ và các thiết bị
lưu trữ khác. Đối với tất cả các doanh nghiệp nhất là những doanh nghiệp quy
mô nhỏ, dung lượng thiết bị là không đủ. Một multiplexer có thể cung cấp truy
nhập bổ sung đến bus cho máy chủ, nhưng số lượng tối đa các thiết bị lưu trữ
vẫn chỉ là 15.
o Chiều dài tối đa của SCSI bus là 25 mét. Hạn chế này khiến cho việc tách biệt
lưu trữ với máy chủ gần như là không thể. Nó cũng hạn chế khả năng sao chép
RAID JBOD
SERVE
R
D
A
T
A
N
E
T
W
O
R
K
(
L
A
N
)
C
e
n
t
r
a
l
i
z
e
d
manageme
nt
application
s
Fibre Channel-based
Storage Area Network
Tape
Library
Giải pháp sao lưu SAN
(Storage Area Network)
23. dữ liệu từ xa. Multiplexer có thể giúp làm tăng thêm chiều dài, nhưng chỉ thêm
25 mét cho mỗi máy chủ được gắn trong mạng (attached host).
o Không thể thêm vào hay bớt đi các thiết bị trên kênh SCSI mà không làm
ngưng hoạt động của kênh dữ liệu.
o Việc nối cáp SCSI trở nên phức tạp khi nhiều loại thiết bị cùng tham gia.
Không có HUB hay Switch để đơn giản hoá việc kết nối.
o Tốc độ truyền dữ liệu đạt được thông qua SCSI sẽ không đủ trong tương lai
gần.
Rõ ràng rằng SCSI không phải là giải pháp kết nối tốt nhất cho SAN, nhưng thực tế,
nhiều đơn vị vẫn đầu tư vào các thiết bị SCSI và không muốn thay đổi. Tuy nhiên kênh cáp
quang luôn sẵn sàng hỗ trợ giao tiếp SCSI, đáp ứng khả năng kết nối các thiết bị SCSI hiện tại
tới mạng SAN sử dụng kênh quang thông qua Fibre-Channel-to-SCSI routers. Không cần có sự
thay đổi các thiết bị lưu trữ SCSI mà vẫn có được những lợi điểm của kênh cáp quang.
Công nghệ cho phép mạng SAN có được những lợi điểm đó là sử dụng kênh quang
(Fibre Channel). Kênh quang cung cấp băng thông, khả năng chịu lỗi cao hơn và hỗ trợ nhiều
nền tảng mà một mạng sơ cấp không có khả năng đáp ứng nhiệm vụ truyền dữ liệu :
o Thông lượng lớn.
o Số lượng các thiết bị hỗ trợ.
o Khoảng cách tối đa cho phép giữa các thiết bị.
o Khả năng thay thế nóng của các thiết bị.
o Khả năng hỗ trợ và quản lý việc truyền dữ liệu lớn.