HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG<br />BÁO CÁO ĐỀ TÀI: TÍNH TOÁN SONG SONG<br />TìmhiểuvềFault Tolerance<br />GVHD: ...
NỘI DUNG<br />Phần 1: Tổngquan Fault Tolerance.<br />Phần 2: Sơlượcvềhệthốngchịulỗi.<br />Phần 3: GiớithiệucôngnghệRAID.<b...
Trongthiếtkếnóichung, tùythuộcvàomứcđộquantrọng, tínhchấtsốngcòncủahệthống, đòihỏingườithiếtkếphảibảođámtínhliêntụctrongho...
Phần 1: Tổngquan Fault Tolerance<br />Mộtvàivídụdễthấynhưhệthốngđiềukhiển bay, hệthốngcơsởdữliệucủacácngânhàng, hệthống ac...
Phần 1: Tổngquan Fault Tolerance<br />Fault tolerance làkhảnăngđảmbảochohệthốngtiếptụcthựchiệnchứcnăngcủamìnhkhimộtphầncủa...
Phần 1: Tổngquan Fault Tolerance<br />Fault tolerance: Khảnăngchịuđựnglỗi: nếucómộtkếtnốithànhviênhoặcmột card mạngbịhỏng,...
Phần 1: Tổngquan Fault Tolerance<br />Còndữliệuthìchỉđitrênđườngchính (Chẳnghạnnhưngoàicáckếtnối leased line, người ta cót...
Phần 2:Sơ lượcvềhệthốngchịulỗi<br />Khả năng của hệ máy tính đối phó với các trục trặc của phần cứng bên trong máy, mà khô...
Phần 2:Sơ lượcvềhệthốngchịulỗi<br />Khả năng chịu đựng sai sót là một yêu cầu không thể thiếu khi máy tính được giao các n...
Phần 2:Sơ lượcvềhệthốngchịulỗi<br />Fault tolerance Là khả năng "chịu đựng" được các sai sót, hỏng hóc và một số "phong ba...
Phần 2:Sơ lượcvềhệthốngchịulỗi<br />Đĩa cứng có khả năng chịu lỗi (fault tolerant disk) là đĩa cứng có khả năng tạo cho hệ...
Phần 3:Giới thiệucôngnghệ RAID<br />Ngay thời điểm đầu tiên ứng dụng công nghệ RAID - năm 1988, người ta đã gọi RAID là Re...
Phần 3:Giới thiệucôngnghệ RAID<br />Ngày nay, tất cả các ổ đĩa cứng đều trở nên "rẻ tiền" khi so sánh với các thế hệ trước...
Phần 3:Giới thiệucôngnghệ RAID<br />Công nghệ RAID ban đầu được thiết kế chuyên dùng cho server (máy chủ) và các hệ thống ...
Phần 3:Giới thiệucôngnghệ RAID<br />Nhưng ngày nay, RAID cũng được sử dụng ngày càng phổ biến trong các máy tính để bàn nh...
Phần4: Mộtsốđặcđiểmcơbản<br />Fault Tolerance<br />Đểmộthệthốngcóđộsẵnsàngcao, ngườithiếtkếphảiquantâmđến Fault Tolerance,...
Phần4: Mộtsốđặcđiểmcơbản<br />Fault Tolerance<br />Hình minh họa: Mộthệthốngđápứngđộổnđịnhhoạtđộngcủahệthống.<br />
Lỗi khoan dung là khả năng của một ứng dụng để tiếp tục chạy hoặc làm cho tiến độ thậm chí nếu một vấn đề phần cứng hoặc p...
Ví dụ, một trong những nhiệm vụ bên trong một ứng dụng song song có thể nhận được một lỗi và hủy bỏ, nhưng phần còn lại củ...
Bởi vì cụm Beowulf được xây dựng từ các thành phần hàng hóa được thiết kế dành cho máy tính để bàn hơn là máy tính nặng, t...
Trong khi các chương trình khoan dung lỗi có thể được coi là thích ứng, các "chương trình hạn thích ứng" được sử dụng ở đâ...
Ví dụ như một ứng dụng thích nghi bằng cách thêm hoặc phát hành các nút của cluster theo nhu cầu hiện tại tính toán của mì...
Những đặc điểm cơ bản mà một hệ thống fault-tolerance đòi hỏi:<br />Hệthốngcóthểtiếptụchoạtđộngkhimộtthànhphầncủanóbịsựcố<...
Phần4: Mộtsốđặcđiểmcơbản<br />Fault Tolerance<br />Khảnăngcáchlylỗikhỏithànhphầnbịlỗi (yêucầuphảicócơchếriêngđểxácđịnhlỗic...
Phần4: Mộtsốđặcđiểmcơbản<br />Fault Tolerance<br />Mộtsốhìnhảnh minh hoạvềhệthống<br />Fault Tolerance<br />
Phần4: Mộtsốđặcđiểmcơbản<br />Fault Tolerance<br />
Phần4: Mộtsốđặcđiểmcơbản<br />Fault Tolerance<br />
Replication: cungcấpnhiềuthànhphầnphụgiốngnhưthànhphầnchính, hoạtđộng song song. Khithànhphầnchínhgặplỗi, hệthốngcóthểsửdụ...
Phần5: Một số phương pháp để đạt tới khả năng chịu đựng lỗi<br />Vídụtrongmôitrường Active Directory, bởitínhchấtquantrọng...
Phần5: Một số phương pháp để đạt tới khả năng chịu đựng lỗi<br />Hình minh họa: MộthệthốngcóDomainControllerdựphòng.<br />
Redundancy:cungcấpnhữngthànhphầnphụbổ sung chothànhphầnchính, mangtínhchấtdưthừa! Mộtvídụdễthấylàcôngnghệ RAID (trừ RAID 0...
Phần5: Một số phương pháp để đạt tới khả năng chịu đựng lỗi<br />Khimột ổ cứngchínhbịhỏng, chúng ta cóthểdựavàodữliệucủađĩ...
Phần5: Một số phương pháp để đạt tới khả năng chịu đựng lỗi<br />Hình minh họa: Sửdụngcôngnghệ RAID 1 đểlưutrữ song song.<...
Diversity: cungcấpnhữngthànhphầnđượccàiđặtkhácnhaunhằmthựchiệncùngmộtyêucầucủahệthống. Chúnghoạtđộng song songvàđồngbộdữli...
Vídụ, mộtngânhàngcóthểvừatriểnkhaicơsởdữliệu MS SQL Server song songvớicơsởdữliệu Oracle, khixảyramộtlỗinàođómangtínhchấtđ...
Upcoming SlideShare
Loading in …5
×

Bai lam

1,255 views

Published on

0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
1,255
On SlideShare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
43
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide

Bai lam

  1. 1. HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG<br />BÁO CÁO ĐỀ TÀI: TÍNH TOÁN SONG SONG<br />TìmhiểuvềFault Tolerance<br />GVHD: NguyễnNgọcTú<br />Nhóm SVTH: - NguyễnLêHiếu<br /> - LâmNgọcRạng<br /> - Lê Minh Trí<br /> - NguyễnThịBíchTrang<br />
  2. 2. NỘI DUNG<br />Phần 1: Tổngquan Fault Tolerance.<br />Phần 2: Sơlượcvềhệthốngchịulỗi.<br />Phần 3: GiớithiệucôngnghệRAID.<br />Phần4: Mộtsốđặcđiểmcơbản<br />Fault Tolerance.<br />Phần5: Mộtsốphươngphápđểđạttớikhảnăngchịulỗi.<br />
  3. 3. Trongthiếtkếnóichung, tùythuộcvàomứcđộquantrọng, tínhchấtsốngcòncủahệthống, đòihỏingườithiếtkếphảibảođámtínhliêntụctronghoạtđộngcủahệthống. <br />Phần 1: Tổngquan Fault Tolerance<br />
  4. 4. Phần 1: Tổngquan Fault Tolerance<br />Mộtvàivídụdễthấynhưhệthốngđiềukhiển bay, hệthốngcơsởdữliệucủacácngânhàng, hệthống active-directory củamộtdoanhnghiệp… Tínhsẵnsàng (High Availability) củahệthốngphụthuộcvàonhiềuquátrình, baogồmquátrìnhthiếtkế, quátrìnhcàiđặt, quátrìnhvậnhành, quátrìnhphụchồisaukhicósựcố.<br />
  5. 5. Phần 1: Tổngquan Fault Tolerance<br />Fault tolerance làkhảnăngđảmbảochohệthốngtiếptụcthựchiệnchứcnăngcủamìnhkhimộtphầncủahệthốnggặpsựcố.Fault tolerance baogồm disk subsystems, nguồncungcấpvàhệthốngcácbộđiềukhiểnđĩadựphòng (redundant disk controllers).<br />
  6. 6. Phần 1: Tổngquan Fault Tolerance<br />Fault tolerance: Khảnăngchịuđựnglỗi: nếucómộtkếtnốithànhviênhoặcmột card mạngbịhỏng, lưulượngsẽchuyển qua cáckếtnốicònlại. <br />Fault Tolerance làkhảnăngcungcấpthêmđườngdựphòngchođườngchínhđểphòngkhiđườngchínhbị down thôi. <br />
  7. 7. Phần 1: Tổngquan Fault Tolerance<br />Còndữliệuthìchỉđitrênđườngchính (Chẳnghạnnhưngoàicáckếtnối leased line, người ta cóthểdùngthêmkếtnối ISDN giárẻđểdựphòngkhiđường leased line gặpsựcố, sốliệuchỉchuyển qua đường ISDN khi leased line gặpsựcố)<br />
  8. 8. Phần 2:Sơ lượcvềhệthốngchịulỗi<br />Khả năng của hệ máy tính đối phó với các trục trặc của phần cứng bên trong máy, mà không ngưng hoạt động của hệthống, thường là bằng cách xử dụng các hệ thống backup (sao chép dự trữ) để tự động đưa vào tuyến làm việc khi có một sai sót được phát hiện. <br />
  9. 9. Phần 2:Sơ lượcvềhệthốngchịulỗi<br />Khả năng chịu đựng sai sót là một yêu cầu không thể thiếu khi máy tính được giao các nhiệm vụ khẩn cấp vídụnhư hướng dẫn máy bay hạ cách an toàn, hoặc bảo đảm một quá trình liên tục.<br />Khả năng chịu đựng sai sót này cũng rất có lợi đối với những ứng dụng thường ngày không đòi hỏi khẩn cấp.<br />
  10. 10. Phần 2:Sơ lượcvềhệthốngchịulỗi<br />Fault tolerance Là khả năng "chịu đựng" được các sai sót, hỏng hóc và một số "phong ba bão táp" thông thường khác mà vẫn bảo đảm "khả năng đứng vững" tại vị trí và vẫn thực hiện tốt công việc được giao. <br />
  11. 11. Phần 2:Sơ lượcvềhệthốngchịulỗi<br />Đĩa cứng có khả năng chịu lỗi (fault tolerant disk) là đĩa cứng có khả năng tạo cho hệ thống một số khả năng dự phòng để chống lại các sự cố lỗi. Khả năng chịu lỗi của đĩa cứng tùy thuộc vào công nghệ chế tạo đĩa cứng, các thiết bị phần cứng và cả các phần mềm trong máy tính. Khả năng chịu lỗi thường được sử dụng trong công nghệ RAID.<br />
  12. 12. Phần 3:Giới thiệucôngnghệ RAID<br />Ngay thời điểm đầu tiên ứng dụng công nghệ RAID - năm 1988, người ta đã gọi RAID là Redundant Array of Inexpensive Disks (Dãy các đĩa cứng rẻ tiền dự phòng). RAID đã được hiểu một cách tương phản với SLED (Single Large Expensive Disk - Đĩa cứng đơn đắt tiền) là một loại đĩa cứng rất đắt tiền được sử dụng cho các hệ thống máy tính lớn. <br />
  13. 13. Phần 3:Giới thiệucôngnghệ RAID<br />Ngày nay, tất cả các ổ đĩa cứng đều trở nên "rẻ tiền" khi so sánh với các thế hệ trước của chúng nên người ta (chính là tổ chức RAID Advisory Board - Ủy ban Tư vấn về RAID) đã quyết định đổi tên RAID thành "Independent" (độc lập) thay vì "Inexpensive" (rẻ tiền).<br />
  14. 14. Phần 3:Giới thiệucôngnghệ RAID<br />Công nghệ RAID ban đầu được thiết kế chuyên dùng cho server (máy chủ) và các hệ thống lưu trữ chuyên biệt (Stand-alone disk storage system, hệ thống lưu trữ dữ liệu bằng nhiều đĩa cứng được đặt trong một hộp chứa đĩa độc lập có hình dáng như một thùng máy tính, hộp chứa đĩa này được kết nối với máy tính "mẹ" thông qua một giao diện kết nối có tốc độ rất cao, xem hình bên: thiết bị lưu trữ của hãng AC&NC.)<br />
  15. 15. Phần 3:Giới thiệucôngnghệ RAID<br />Nhưng ngày nay, RAID cũng được sử dụng ngày càng phổ biến trong các máy tính để bàn nhằm cung cấp khả năng chịu lỗi cho các ứng dụng rất quan trọng (mission-critical applications). Ngày nay, chúng ta có thể mua mainboard có hỗ trợ RAID từ các thương hiệu mainboard phổ biến ở thị thường Việt Nam như: ASUS, DFI, ECS, MSI, SuperMicro v.v...<br />
  16. 16. Phần4: Mộtsốđặcđiểmcơbản<br />Fault Tolerance<br />Đểmộthệthốngcóđộsẵnsàngcao, ngườithiếtkếphảiquantâmđến Fault Tolerance, tạmhiểulàkhảnăngchịuđựnglỗi.<br />
  17. 17. Phần4: Mộtsốđặcđiểmcơbản<br />Fault Tolerance<br />Hình minh họa: Mộthệthốngđápứngđộổnđịnhhoạtđộngcủahệthống.<br />
  18. 18. Lỗi khoan dung là khả năng của một ứng dụng để tiếp tục chạy hoặc làm cho tiến độ thậm chí nếu một vấn đề phần cứng hoặc phần mềm gây ra một nút trong cluster không thành công. Đây cũng là khả năng chịu đựng được thất bại trong việc áp dụng chính nó. <br />Phần4: Mộtsốđặcđiểmcơbản<br />Fault Tolerance<br />
  19. 19. Ví dụ, một trong những nhiệm vụ bên trong một ứng dụng song song có thể nhận được một lỗi và hủy bỏ, nhưng phần còn lại của nhiệm vụ có thể mang về tính toán.<br />Phần4: Mộtsốđặcđiểmcơbản<br />Fault Tolerance<br />
  20. 20. Bởi vì cụm Beowulf được xây dựng từ các thành phần hàng hóa được thiết kế dành cho máy tính để bàn hơn là máy tính nặng, thất bại của các thành phần bên trong cluster một cao hơn trong một hệ thống đa đắt hơn có một RAS tích hợp (đáng tin cậy, sẵn có, bảo trì) hệ thống.<br />Phần4: Mộtsốđặcđiểmcơbản<br />Fault Tolerance<br />
  21. 21. Trong khi các chương trình khoan dung lỗi có thể được coi là thích ứng, các "chương trình hạn thích ứng" được sử dụng ở đây nói chung có nghĩa là song song (hoặc nối tiếp) chương trình tự động thay đổi đặc điểm của họ tốt hơn đáp ứng nhu cầu của ứng dụng và các nguồn lực sẵn có. <br />Phần4: Mộtsốđặcđiểmcơbản<br />Fault Tolerance<br />
  22. 22. Ví dụ như một ứng dụng thích nghi bằng cách thêm hoặc phát hành các nút của cluster theo nhu cầu hiện tại tính toán của mình và một ứng dụng tạo ra và giết chết các nhiệm vụ tính toán dựa trên những gì các nhu cầu.<br />Phần4: Mộtsốđặcđiểmcơbản<br />Fault Tolerance<br />
  23. 23. Những đặc điểm cơ bản mà một hệ thống fault-tolerance đòi hỏi:<br />Hệthốngcóthểtiếptụchoạtđộngkhimộtthànhphầncủanóbịsựcố<br />Hệthốngcóthểtiếptụchoạtđộngtrongkhimộtthànhphầnnàođóđangđượcsửachữa<br />Phần4: Mộtsốđặcđiểmcơbản<br />Fault Tolerance<br />
  24. 24. Phần4: Mộtsốđặcđiểmcơbản<br />Fault Tolerance<br />Khảnăngcáchlylỗikhỏithànhphầnbịlỗi (yêucầuphảicócơchếriêngđểxácđịnhlỗichomụcđíchcáchly)<br />Khảnăngcôlậplỗi (đểkhônggâyphảnứngdâychuyềntớinhữngthànhphầnkháctronghệthống)<br />Khảnăng roll-back lạihệthốngkhigặplỗi.<br />
  25. 25. Phần4: Mộtsốđặcđiểmcơbản<br />Fault Tolerance<br />Mộtsốhìnhảnh minh hoạvềhệthống<br />Fault Tolerance<br />
  26. 26. Phần4: Mộtsốđặcđiểmcơbản<br />Fault Tolerance<br />
  27. 27. Phần4: Mộtsốđặcđiểmcơbản<br />Fault Tolerance<br />
  28. 28. Replication: cungcấpnhiềuthànhphầnphụgiốngnhưthànhphầnchính, hoạtđộng song song. Khithànhphầnchínhgặplỗi, hệthốngcóthểsửdụngthànhphầnphụthaythếđểkhônglàmgiánđoạnhoạtđộngcủahệthống. <br />Phần5: Một số phương pháp để đạt tới khả năng chịu đựng lỗi<br />
  29. 29. Phần5: Một số phương pháp để đạt tới khả năng chịu đựng lỗi<br />Vídụtrongmôitrường Active Directory, bởitínhchấtquantrọngcủacác Domain Controller nênthườngthìngườithiếtkếhệthốngsẽbổ sung những Additional Domain Controller để backup cho Domain Controller chính, chúnghoạtđộng song songvà replicate/synchronize dữliệuvớinhau. Ngoàimụcđích load balancing, chúngcòntăngkhảnăngchịulỗicủahệthống.<br />
  30. 30. Phần5: Một số phương pháp để đạt tới khả năng chịu đựng lỗi<br />Hình minh họa: MộthệthốngcóDomainControllerdựphòng.<br />
  31. 31. Redundancy:cungcấpnhữngthànhphầnphụbổ sung chothànhphầnchính, mangtínhchấtdưthừa! Mộtvídụdễthấylàcôngnghệ RAID (trừ RAID 0), ngoàimột/nhiều ổ cứngchính, ta cóthểthêmmột ổ cứngphụnhằmmụcđíchpháthiệnvàsửalỗi. <br />Phần5: Một số phương pháp để đạt tới khả năng chịu đựng lỗi<br />
  32. 32. Phần5: Một số phương pháp để đạt tới khả năng chịu đựng lỗi<br />Khimột ổ cứngchínhbịhỏng, chúng ta cóthểdựavàodữliệucủađĩacứngphụđểphụchồidữliệugốccủahệthống.<br />
  33. 33. Phần5: Một số phương pháp để đạt tới khả năng chịu đựng lỗi<br />Hình minh họa: Sửdụngcôngnghệ RAID 1 đểlưutrữ song song.<br />
  34. 34. Diversity: cungcấpnhữngthànhphầnđượccàiđặtkhácnhaunhằmthựchiệncùngmộtyêucầucủahệthống. Chúnghoạtđộng song songvàđồngbộdữliệuvớinhau, giúpchohoạtđộngcủahệthốngkhôngphụthuộcvàomộtbảncàiđặtnàocả. <br />Phần5: Một số phương pháp để đạt tới khả năng chịu đựng lỗi<br />
  35. 35. Vídụ, mộtngânhàngcóthểvừatriểnkhaicơsởdữliệu MS SQL Server song songvớicơsởdữliệu Oracle, khixảyramộtlỗinàođómangtínhchấtđồngloạtnhư virus chẳnghạn, thìmộttrong 2 cơsởdữliệucòncóthểhoạtđộngđược.<br />Phần5: Một số phương pháp để đạt tới khả năng chịu đựng lỗi<br />

×