Webcast - Failover Cluster Architecture

2,070 views

Published on

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
2,070
On SlideShare
0
From Embeds
0
Number of Embeds
16
Actions
Shares
0
Downloads
42
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide
  • 1 dk
  • A failover cluster is a group of independent computers that work together to increase the availability of applications and services. If one of the clustered servers fails, another server begins to provide service (a process known as failover).Failover clusters are used by IT professionals who need to provide high availability for services or applications
  • 5 dk
  • Hizmet sürekliliği hedeflenmektedir.  Klasik clusterda sunucular tek storage ortamına erişirken geocluster her site üzerinde bibirine senkron replike edilmiş datalara erişirler. Replikasyon tipi senkron “anlık” yada asenkron “gecikmeli” olabilir.Replikasyon Seviyeleri ;Storage bazlı “block-level” Yazilimsal “host based”Bu tür uygulamalarda belirli DB, Applicationlar seçilebilirken bazılarında VSS ile OS bazda replikasyon yapabilmektedir. Farklı lokasyonlarda bulunan sunuculardan bir tanesi aktif olarak çalışmaktayken uygulama seviyesinde oluşan log dosyaları cluster’ın diğer üyeleri ile paylaşılarak uygulamanın transaction blokları halinde diğer sunuculara uygulanır.Uygulama “application based”Exchange 2007 CCR,SCRSenkron yapıda sunucu disk üzerine datayı yazdıktan sonra data anlık olarak 2.site üzerindeki storage üzerinede yazilir, 1.site üzerindeki storage 2.site üzerine datanin yazilmasi akabinde sunucuya yazdim bilgisi gönderir.
  • Webcast - Failover Cluster Architecture

    1. 1. Windows 2008 R2 <br />Failover Cluster Mimarisi ve<br />Sorun Çözümleme<br />Hakan YÜKSEL<br />hakan.yuksel@turkiyefinans.com.tr<br />http://yukselis.wordpress.com<br />
    2. 2. Ajanda<br /><ul><li>Cluster Nedir, Niçin Cluster Kullanıyoruz
    3. 3. Cluster Mimarisi ve Kavramlar
    4. 4. Failover Cluster Gereksinimleri ve Kurulum (Demo)
    5. 5. Cluster, Server Rollerinin Konfigure Edilmesi (Demo)
    6. 6. İyileştirme - Bakım Çalışmaları
    7. 7. Multi-Site Cluster (GeoCluster)
    8. 8. Soru – Cevap</li></li></ul><li>Cluster Nedir, Niçin Kullanıyoruz<br />Cluster birden fazla sunucununun kümelenerek tek bir sunucu gibi davranmasıdır. Bu şekilde yüksek erişilebilirlik ,yedeklilik sağlanmış olmaktadır.  Bu ortamda sunucular tarafından kullanılan veriyi ortak bir disk alanında saklamak ve bu ortak diske aynı anda cluster sisteminin yalnızca bir üyesinin erişimini sağlanması şeklinde çalışmaktadır.<br />High Availability HA Cluster üzerinde host ettiğimiz servis ve uygulamarın daimi ayakta olmasını garanti altına almak için kullanıyoruz. <br />Clusters improve manageability by:<br /> Disaster recovery: Clusters help recover applications in case of a failure <br />ü<br /> Update management: Clusters enable applications to continue to be available when updates are applied to applications or the node operating system <br />ü<br />
    9. 9. Cluster Kavramları<br />Node, Active, Passive<br />Virtual IP,Name<br />Group, Resource, Service, Application<br />Split Brain,SCSI Bus Reset,SCSI3 Reservation<br />Quorum, MNS, Arbitration Process<br />HeartBeat, Private, Public Network<br />Cluster Aware Software<br />Failover, Failback,Dependency<br />SAN Kavramlar<br />HBA, LUN,Multipath,Target,Inıtıator<br />
    10. 10. Failover Nedir?<br />Cluster üzerinde host edilen grup ve resourceların bir node üzerinde diğerine <br />taşınması durumudur<br /><ul><li>Herhangi sebepten aktif olan nodun inaktif duruma geçmesi
    11. 11. Grup yada grup içerisindeki resourceların fail, offline duruma geçmesi
    12. 12. Administrator tarafından manuel yapılan müdahale ile </li></ul>Failover durumu yaşanan durumlarda aşağıdaki kaynaklardan birinde problem <br />olduğu varsayılır;<br />Node,Interface, Group,Resource,Disk<br />
    13. 13. Cluster Failover<br />SQL fails overand is available to clients<br />Client PCs<br />Failure Occurs!<br />Node A<br />Node B<br />SQL<br />Heartbeat<br />Passive Node<br />SQL<br />Disk cabinet A<br />Disk cabinet B<br />SCSIReserveBroken<br />New Reservation Established<br />
    14. 14. Quorum ve Majority Node Set<br /><ul><li>Quorum cluster konfigürasyom ve durum bilgisinin olduğu alan.
    15. 15. Majority Node Set MNS demokratik bir sistemdir. Quorum da sadece bir oy var ise ve buna sahiplenen cluster a sahiplenebiliyorsa, MNS de çoğunluk clustera sahiplenir. Mesela 5 nodelu cluster da split brain senaryosu yaşanırsa her node toplam kaç node ila haberleşebildiğine bakar. Bir node iki node ile haberleşebiliyorsa, 3 node 5 nodedan çoğunluğu oluşturur ve cluster sahiplenir. Diğer iki node azınlıkta olduklarını anlar ve diğer 3 node un haberleşebildiğini varsayarlar. 
    16. 16. Windows Server 2008 ile yeni bir Quorum modelimiz de var (Node and Disk Majority), bu sefer Quorum diskin kullanımı biraz farklı oluyor: Quorumu node sayısı ile beraber bir oy hakkı olarak kullanıyoruz..
    17. 17. http://yukselis.wordpress.com/2010/06/28/quorum-nedir/#comments Başar Güner</li></li></ul><li>Quoruma Bakış<br /><ul><li>Majority is greater than 50%
    18. 18. Possible Voters:
    19. 19. Nodes (1 each), Disk Witness (1 max), File Share Witness (1 max)
    20. 20. 4 Quorum Types</li></ul>Node majority<br />Node and File Share majority<br />Disk only (not recommended)<br />Node and Disk majority<br />Vote<br />Vote<br />Vote<br />Vote<br />Vote<br />
    21. 21. Quorum Model Summary<br /><ul><li>No Majority: Disk Only</li></ul>Note Recommended<br />Only use as directed by vendor<br /><ul><li>Node and Disk Majority</li></ul>Only use as directed by vendor<br /><ul><li>Node Majority</li></ul>Odd number of nodes<br /><ul><li>Node and File Share Majority</li></ul>Best availability solution<br />Recommended for<br />Exchange Server 2007 CCR<br />
    22. 22. Quorum Modelini Seçme<br />Considerations for choosing a quorum mode include:<br /><ul><li> By default, failover clustering chooses:</li></ul> - Node Majority if there are an odd number of nodes in the cluster<br /> - Node and Disk Majority if there are an even number of nodes in the cluster<br /><ul><li> Node and File Share Majority is recommended for geographically dispersed clusters
    23. 23. No Majority: Disk Only is not recommended, because of the disk subsystem’s single point of failure
    24. 24. Plan changes to the quorum mode carefully to avoid a mode that may result in loss of quorum</li></li></ul><li>Windows Server 2008 R2 ile Gelen Özellikler<br />Validation processinde yapılan iyileştirmeler<br />Windows Server 2008 R2 includes a Best Practices Analyzer (BPA) for all major server roles, including Failover Clustering. This analyzer examines the best practices configuration settings for a cluster and cluster nodes.<br />Gelişmiş Cluster Node Hata Toleransı<br />Because of the architecture of CSV, there is improved cluster node connectivity fault tolerance that directly affects VMs running on the cluster. The CSV architecture implements a mechanism, known as dynamic I/O redirection, where I/O can be rerouted within the failover cluster based on connection availability<br />The addition of a Windows PowerShell interface.<br />Additional options for migrating settings from one cluster to another.<br />Administrators can migrate cluster workloads currently running on Windows Server 2003 and Windows Server 2008 to Windows Server 2008 R2. <br />
    25. 25. Cluster Gereksinimleri<br />Review hardware and infrastructure requirements for a failover cluster.<br /><ul><li>Servers: Microsoft supports a failover cluster solution only if all the hardware components are marked as "Certified for Windows Server 2008 R2." In addition, the complete configuration (servers, network, and storage) must pass all tests in the Validate a Configuration Wizard, which is included in the Failover Cluster Manager snap-in
    26. 26. Storage: You must use shared storage that is compatible with Windows Server 2008 R2
    27. 27. Network adapters and cable (for network communication): The network hardware, like other components in the failover cluster solution, must be marked as "Certified for Windows Server 2008 R2." If you use iSCSI, your network adapters should be dedicated to either network communication or iSCSI, not both
    28. 28. Account for administering the cluster: When you first create a cluster or add servers to it, you must be logged on to the domain with an account that has administrator rights and permissions on all servers in that cluster. The account does not need to be a Domain Admins account—it can be a Domain Users account that is in the Administrators group on each clustered server. In addition, if the account is not a Domain Admins account, the account (or the group that the account is a member of) must be delegated Create Computer Objects and Read All Properties permissions in the domain
    29. 29. Standart Edition üzerindeki sunucular üzerinde cluster activate edilebilir
    30. 30. SCSI-3 Commands
    31. 31. Basic GPT and MBR disks supported
    32. 32. Multipath IO (MPIO) recommended
    33. 33. Persistent Reservations (PRs) Required </li></li></ul><li>Failover Cluster Kurulum Adımları<br />demo<br />Failover Cluster Prerequisites<br />Establish a Network Naming Convention <br />TCP/IP Network Configuration <br />Public Network<br />Storage Network<br />Heartbeat Network <br />Procedures<br />Prepare the Failover Cluster<br />Create a Domain User Account<br />Add Nodes to an Active Directory Domain<br />Expose Storage to Cluster Nodes<br />Install the Failover Cluster Feature<br />Run Cluster Validation<br />Create and Configure the Failover Cluster<br />Create a Cluster<br />Set Cluster Network Properties and Apply Naming Convention<br />Create a Highly Available Services<br />-> Create a Highly Available iSCSI Target<br />Configuring Windows Firewall for Microsoft iSCSI Software Target<br />Installing the Microsoft iSCSI Software Target<br />Create the Failover iSCSI Target Resource Group<br />Create an iSCSI Target in the Microsoft iSCSI Target MMC<br />Create and Configure Virtual Disks<br />Connect Initiators<br />Testing Your Failover Cluster Configuration<br />
    34. 34. R2 ile Gelen Validation Özellikleri<br />demo<br />Cluster Configuration<br />List Information (Core Group, Networks, Resources, Storage, Services and Applications)<br />Validate Quorum Configuration<br />Validate Resource Status<br />Validate Service Principal Name<br />Validate Volume Consistency<br />Network<br />List Network Binding Order<br />Validate Multiple Subnet Properties<br />System Configuration<br />Validate Cluster Service & Driver Settings<br />Validate Memory Dump Settings<br />Validate OS Installation Options<br />Replaced Validate Operating Systems<br />Validate System Drive Variable<br />
    35. 35. Troubleshooting<br />demo<br /> Reviewing cluster events <br /> Reviewing hardware events <br /> Using the Validate a Configuration Wizard <br /> Reviewing storage/SAN events<br />Troubleshooting methodologies for cluster issues, whether in Windows 2003 or Windows 2008, are fairly similar. Most of the typical support issues in the cluster category fall under the following categories:<br />· Cluster Service fails to start.<br />· Cluster resources in a failed state or fail to come online.<br />· Determine root cause of cluster failure.<br />· Initial configuration of the cluster<br />The Win 2003 legacy CLUSTER.LOG text file no longer exists. In Win 2008 the cluster log is handled by the Windows Event Tracing (ETW) process. This is the same logging infrastructure that handles events for other aspects you are already well familiar with, such as the System or Application Event logs you view in Event Viewer.<br />Command Line<br />c:>cluster log /gen<br />Powershell<br />C:PS> Get-ClusterLog<br />ForceQuorum<br />net start clussvc /forcequorum (or /fq)<br />
    36. 36. Cluster Eventları<br />Cluster Events<br />Recent Cluster Events üzerinde son 24 saate ait eventlar görünmektedir. <br />Monitoring Cluster Events<br />Fully featured Failover Cluster Management Packs<br />Cluster logging level<br />Set-ClusterLog –level 3<br />
    37. 37. Failover Süreci<br /> 2 node birbirine ulaşamadiği durumda quarum diskine erişmeye çalışır bu duruma arbitration process denilir. Clusdisk.sys dosyası nodeların ikisininde disklere erişimin engellemek için yönetimi yapar. MNS mimarisi ile birlikte quarum bilgisi register replikasyonu ile sağlanmaktadır. Bu dosyalara %windowssystem32config altından erişilebilinir. Cluster açılması esnasında clusdb dosyasını registryden download edilerek cluster işletimi çalışmaya başlar. Bu konfigürasyon dosyasında hangi disklere erişebileceğinin bilgisi yer almaktadır. 2008 cluster sistemleri register replikasyona dayalı olarak çalışır.<br />
    38. 38. Scsi Bus Reset, SCSI3 Persistent Reservarion<br />Split Brain Senaryosu: İki node birbirleri arasındaki network iletişimi kaybetme durumu. Bu durumda Cluster servisi (clusdisk.sys) Challande/Defense protokolu ile SCSI reserver komutları vasıtasıyla önce reset komutu gönderir bundan sonra reserve komutu ile quorum diskini reserve eder online getirir akabinde ownershipliği alarak tüm resourceları online duruma çeker. <br />Windows Server 2008 ile birlikte artık scsi bus resetleri kullanılmıyor. Scsi 3 serial persistent reservation kullanılmaktadır. Scsi bus reset den sadece o disk değil aynı bus üzerindeki bütün diskler etkilenmekte, konfigürasyona bağlı olarak her disk için her node dan bir bus reset gönderilebilmekte bu durumda cluster kendisini online etme süreleri uzamakta ve offline kalabilmekteler bu durumda manuel online çekilmesi gerekebiliyor idi. <br />
    39. 39. Failover Cluster Mimari<br />Microsoft Cluster Service (MSCS) sharing nothing modelini kullanır. Bunun anlamı sadece bir server kaynakların sahibi olabilir bunlar disk,virtual server, IP vb..<br />Classdb file HKLMCluster registry hive üzerinden download eder. <br />When the computer is started, the Cluster Disk Driver (Clusdisk.sys) reads the following local registry key to obtain a list of the signatures of the shared disks under cluster management:HKEY_LOCAL_MACHINESYSTEMCurrentControlSetServicesClusDiskParameters Signatures<br />Recommandation private only hb public mix olmalı <br />Cluster üzerinde resource groupların doğru çalışıp çalışmadığını kontrol eden resource monitorler mevcuttur. Resource monitor clsusvc altinda çalişan dll lerden oluşmaktadır. 2008 ‘de bunun adi RHS.exe<br />The Resource Hosting Subsystem (RHS) conducts periodic health checks of all cluster resources to ensure they are functioning properly. This is accomplished by executing IsAlive and LooksAliveprocesses which are specific to the type of resource<br />
    40. 40. Microsoft Failover Cluster Virtual Adapter<br />Microsoft Cluster ortamlarda “Microsoft Failover Cluster Virtual Adapter” adında bir interface oluşturur, hidden bir interface’dir NetFT (Network Faut Tolerant) dosyasını simüle eder, clusterlar arası iletişimi yürütür, heartbeat için bir redundancy sağlar. Bu interface mevcut interface üzerine bind olur smb’den SAN’e olan trafik bu kart üzerinde utilize edilir. NetFT, ipconfig /All üzerinden görülür kendisine APIPA adresi tahsis (169.254.1.2) eder, bu ip üzerinden aslında data transferi yapılmaz bu IP fiziksel kart üzerine bind olduğunda TM üzerinden utilizasyon görülmektedir.<br />
    41. 41. Multi Site Cluster (GeoCluster) Nedir<br />Geographical Cluster’ın kısaltması olan geocluster yada multicluster coğrafik olarak dağıtılmış farklı bölgelerde bulunan sunucuların cluster olarak çalıştırılmasıdır.  Kavramsal olarak cluster üyelerinin iki ayrı lokasyonda bulunması durumuna Geo-Clustering ya da Multi Site Clustering adı verilmektedir. <br />Site B<br />Site A<br />2+ physically separate sites<br />1+ node at each site<br />Storage at each site with data replication<br />Application moves during a failover<br />SAN<br />SAN<br />
    42. 42. Multi-Site Cluster Faydaları<br />Hizmet sürekliliği hedeflenmektedir.  Klasik clusterda sunucular tek storage ortamına erişirken geocluster her site üzerinde bibirine senkron replike edilmiş datalara erişirler. Replikasyon tipi senkron “anlık” yada asenkron “gecikmeli” olabilir.Replikasyon Seviyeleri ;<br />Storage bazlı “block-level” <br />Yazilimsal “host based”<br />Senkron yapıda sunucu disk üzerine datayı yazdıktan sonra data anlık olarak 2.site üzerindeki storage üzerinede yazilir, 1.site üzerindeki storage 2.site üzerine datanin yazilmasi akabinde sunucuya yazdim bilgisi gönderir.<br />Protects Against Loss of an Entire Datacenter<br />Power outage, fires, hurricanes, floods, earthquakes, terrorism<br />Automates Failover<br />Reduced downtime<br />Lower complexity of disaster recovery plan<br />Reduces Administrative Overhead<br />Automatically synchronize application and cluster changes<br />Easier to keep consistent than unclustered servers<br />
    43. 43. Synchronous Replication<br />Host receives “write complete” response from the storage after the data is successfully written on both storage devices<br />Replication<br />WriteRequest<br />SecondaryStorage<br />WriteComplete<br />Acknowledgement<br />PrimaryStorage<br />
    44. 44. File Share Witness<br />Site C<br />4, 6, 8… nodes + FSW = odd # votes<br />Local failover first (preferred owner)<br />Site failover second (possible owner)<br />AntiAffinityClassNames<br />Faster DNS Updates<br />Register all IPs for a Network Name<br />Shorten client’s DNS record TTL<br />Ensure application tries all IPs<br />WAN<br />Site A<br />Site B<br />Encrypt WAN traffic for security<br />Adjust health checks for latency<br />Configure ‘OR’ dependencies<br />SAN<br />SAN<br />Replicated Storage from vendor<br />Multi-Site Clustering Review<br />
    45. 45. Sorular & Teşekkürler<br />Teşekkürler<br />http://yukselis.wordpress.com<br />
    46. 46. Cluster Nedir, Niçin Kullanıyoruz<br />Cluster Blog<br />http://blogs.msdn.com/b/clustering/<br />Technet Failover Cluster<br />http://technet.microsoft.com/en-us/library/cc754482.aspx<br />Configuring Auditing for a Windows Server 2008 Failover Cluster<br />http://blogs.technet.com/b/askcore/archive/2009/01/19/configuring-auditing-for-a-windows-server-2008-failover-cluster.aspx<br />Top Issues for Microsoft Support for Windows 2008 Failover Clusters<br />http://blogs.technet.com/b/askcore/archive/2008/10/13/top-issues-for-microsoft-support-for-windows-2008-failover-clusters.aspx<br />Checklist: Create a Clustered Virtual Machine<br />http://technet.microsoft.com/en-us/library/dd759220.aspx<br />Top Issues for Microsoft Support for Windows 2008 Failover Clusters<br />http://blogs.technet.com/b/askcore/archive/2008/10/13/top-issues-for-microsoft-support-for-windows-2008-failover-clusters.aspx<br />Failover Clusters in Windows Server 2008 R2<br />http://technet.microsoft.com/en-us/library/ff182338(WS.10).aspx<br />TechEd 2011 demo install step-by-step (Hyper-V, AD, DNS, iSCSI Target, File Server Cluster, SQL Server over SMB2)<br />http://blogs.technet.com/b/josebda/archive/2011/05/19/teched-2011-demo-install-step-by-step-hyper-v-ad-dns-iscsi-target-file-server-cluster-sql-server-over-smb2.aspx<br />

    ×