zrozumienie kworum klastra i puli

  • 01/18/2019
  • 11 protokół do czytania
    • a
    • e
    • v
    • C
    • J
    • +3

dotyczy: Windows Server 2019, Windows Server 2016

klaster pracy awaryjnej systemu Windows Server zapewnia wysoką dostępność obciążeń. Zasoby te są uważane za wysoce dostępne, jeśli węzły, na których znajdują się zasoby hosta; jednak klaster na ogół wymaga więcej niż połowy węzłów do działania, co jest znane jako posiadanie kworum.

Quorum ma na celu zapobieganie scenariuszom podziału mózgu, które mogą się zdarzyć, gdy w sieci znajduje się partycja, a podzbiory węzłów nie mogą się ze sobą komunikować. Może to spowodować, że oba podzbiory węzłów spróbują przejąć obciążenie i zapisać je na ten sam dysk, co może prowadzić do wielu problemów. Jednak zapobiega temu koncepcja kworum klastra przełączania awaryjnego, która zmusza tylko jedną z tych grup węzłów do dalszego działania, więc tylko jedna z tych grup pozostanie online.

Kworum określa liczbę awarii, które klaster może wytrzymać, pozostając w trybie online. Quorum jest przeznaczone do obsługi scenariusza, gdy występuje problem z komunikacją między podzbiorami węzłów klastra, dzięki czemu wiele serwerów nie próbuje jednocześnie hostować grupy zasobów i zapisywać na tym samym dysku w tym samym czasie. Mając taką koncepcję kworum, klaster zmusi usługę klastra do zatrzymania się w jednym z podzbiorów węzłów, aby upewnić się, że istnieje tylko jeden prawdziwy właściciel danej grupy zasobów. Gdy węzły, które zostały zatrzymane, będą mogły ponownie komunikować się z główną grupą węzłów, automatycznie ponownie dołączą do klastra i rozpoczną obsługę klastra.

w systemach Windows Server 2019 i Windows Server 2016 istnieją dwa składniki systemu, które mają własne mechanizmy kworum:

  • kworum klastra: działa na poziomie klastra (tj. Możesz stracić węzły i sprawić, że klaster pozostanie aktywny)
  • Pool Quorum: działa na poziomie puli, gdy włączona jest funkcja Storage Spaces Direct (tzn. możesz stracić węzły i dyski, a Pula pozostanie aktywna). Pule pamięci zostały zaprojektowane tak, aby mogły być używane zarówno w scenariuszach klastrowych, jak i nieklastrowych, dlatego mają inny mechanizm kworum.

przegląd kworum klastra

poniższa tabela zawiera przegląd wyników kworum klastra na scenariusz:

węzły serwera mogą przetrwać jedną awarię węzła serwera mogą przetrwać jedną awarię węzła serwera, a następnie inny może przetrwać dwie równoczesne awarie węzła serwera
2 50/50 nr nr
2 + świadek tak Nie Nie
3 tak. 50/50 Nie.
3 + świadek tak tak Nie
4 tak tak 50/50
4 + świadek tak tak tak
5 i powyżej tak tak tak

zalecenia dotyczące kworum klastra

  • jeśli masz dwa węzły, wymagany jest świadek.
  • jeśli masz trzy lub cztery węzły, witness jest zdecydowanie zalecane.
  • jeśli masz dostęp do Internetu, użyj świadka w chmurze
  • jeśli jesteś w środowisku IT z innymi maszynami i udziałami plików, użyj świadka udostępniania plików

jak działa kworum klastra

gdy węzły zawodzą lub gdy jakiś podzbiór węzłów traci kontakt z innym podzbiorem, przetrwałe węzły muszą sprawdzić, czy stanowią większość klastra, aby pozostać online. Jeśli tego nie zweryfikują, wyłączą się.

ale koncepcja większości działa czysto tylko wtedy, gdy całkowita liczba węzłów w klastrze jest nieparzysta (na przykład trzy węzły w klastrze pięciu węzłów). A co z klastrami o parzystej liczbie węzłów (powiedzmy, z czterema węzłami)?

są dwa sposoby na to, aby łączna liczba głosów była nieparzysta:

  1. po pierwsze, może wzrosnąć o jeden, dodając świadka z dodatkowym głosem. Wymaga to konfiguracji użytkownika.
  2. lub, może zejść o jeden, zerując głos jednego pechowego węzła (dzieje się to automatycznie w razie potrzeby).

ilekroć przetrwałe węzły pomyślnie zweryfikują, że są większością, definicja większości jest aktualizowana, aby być tylko wśród ocalałych. Pozwala to klastrowi stracić jeden węzeł, potem drugi, potem kolejny i tak dalej. Ta koncepcja całkowitej liczby głosów dostosowująca się po kolejnych porażkach znana jest jako kworum dynamiczne.

świadek dynamiczny

świadek dynamiczny włącza głos świadka, aby upewnić się, że całkowita liczba głosów jest nieparzysta. Jeśli jest nieparzysta liczba głosów, świadek nie ma głosu. Jeśli jest parzysta liczba głosów, świadek ma głos. Funkcja Dynamic witness znacznie zmniejsza ryzyko awarii klastra z powodu awarii. Klaster decyduje, czy użyć głosu świadka na podstawie liczby węzłów głosujących dostępnych w klastrze.

dynamiczne kworum działa z dynamicznym świadkiem w sposób opisany poniżej.

dynamiczne zachowanie kworum

  • jeśli masz parzystą liczbę węzłów i żadnego świadka, jeden węzeł dostaje swój głos zerowany. Na przykład tylko trzy z czterech węzłów otrzymują głosy, więc łączna liczba głosów wynosi trzy,a dwa pozostałe z głosami są uważane za większość.
  • jeśli masz nieparzystą liczbę węzłów i żadnego świadka, wszyscy dostają głosy.
  • jeśli masz parzystą liczbę węzłów plus świadek, świadek głosuje, więc suma jest nieparzysta.
  • jeśli masz nieparzystą liczbę węzłów plus świadek, świadek nie głosuje.

dynamiczne kworum pozwala na dynamiczne przypisanie głosu do węzła, aby uniknąć utraty większości głosów i umożliwić działanie klastra z jednym węzłem (znanym jako Last-man standing). Weźmy jako przykład klaster czteroprzęsłowy. Załóżmy, że kworum wymaga 3 głosów.

w tym przypadku klaster zostałby wyłączony, gdybyś stracił dwa węzły.

Diagram przedstawiający cztery węzły klastra, z których każdy otrzymuje głos

jednak dynamiczne kworum zapobiega temu. Całkowita liczba głosów wymaganych do kworum jest teraz określana na podstawie liczby dostępnych węzłów. Tak więc, przy dynamicznym kworum, klaster pozostanie nawet jeśli stracisz trzy węzły.

Diagram przedstawiający cztery węzły klastra, przy czym węzły nie działają pojedynczo, a liczba wymaganych głosów dostosowuje się po każdej awarii.

powyższy scenariusz dotyczy klastra ogólnego, który nie ma włączonej funkcji Storage Spaces Direct. Jednak gdy funkcja Storage Spaces Direct jest włączona, klaster może obsługiwać tylko dwie awarie węzłów. Jest to wyjaśnione bardziej w sekcji pool quorum.

przykłady

dwa węzły bez świadka.

jeden głos węzła jest zerowany, więc większość głosów jest określana z ogólnej liczby 1 głosu. Jeśli węzeł bez głosowania niespodziewanie upadnie, ocalały ma 1/1, a klaster przetrwa. Jeśli węzeł głosowania niespodziewanie upadnie, ocalały ma 0/1, a klaster spada. Jeśli węzeł głosowania jest wyłączony, głosowanie jest przenoszone do drugiego węzła, a klaster przetrwa. Dlatego tak ważne jest skonfigurowanie świadka.

 kworum wyjaśnione w sprawie z dwoma węzłami bez świadka

  • może przetrwać jedną awarię serwera: pięćdziesiąt procent szans.
  • może przetrwać jedną awarię serwera, a następnie inną: Nie.
  • może przetrwać dwie awarie serwera naraz: nie.

dwa węzły ze świadkiem.

oba węzły głosują, plus głosy świadków, więc większość jest ustalana z łącznej liczby 3 głosów. Jeśli któryś z węzłów upadnie, ocalały ma 2/3, a klaster przetrwa.

 kworum wyjaśnione w przypadku dwóch węzłów ze świadkiem

  • może przetrwać jedną awarię serwera: tak.
  • może przetrwać jedną awarię serwera, a następnie inną: Nie.
  • może przetrwać dwie awarie serwera naraz: nie.

trzy węzły bez świadka.

wszystkie węzły głosują, więc większość jest określana z 3 głosów. Jeśli jakikolwiek węzeł zostanie zniszczony, ocalałych będzie 2/3, a klaster przetrwa. Klaster staje się dwoma węzłami bez świadka – w tym momencie jesteś w scenariuszu 1.

 kworum wyjaśnione w sprawie z trzema węzłami bez świadka

  • może przetrwać jedną awarię serwera: tak.
  • może przetrwać jedną awarię serwera, a następnie inną: pięćdziesiąt procent szans.
  • może przetrwać dwie awarie serwera naraz: nie.

trzy węzły ze świadkiem.

wszystkie węzły głosują, więc świadek początkowo nie głosuje. Większość jest ustalana z 3 głosów. Po jednej awarii klaster ma dwa węzły ze świadkiem-co jest powrotem do scenariusza 2. Teraz dwa węzły i świadek głosują.

 kworum wyjaśnione w sprawie z trzema węzłami ze świadkiem

  • może przetrwać jedną awarię serwera: tak.
  • może przetrwać jedną awarię serwera, a następnie inną: tak.
  • może przetrwać dwie awarie serwera naraz: nie.

cztery węzły bez świadka

głos jednego węzła jest zerowany, więc większość jest określana z 3 głosów. Po jednej awarii klaster staje się trzema węzłami, a Ty jesteś w scenariuszu 3.

 kworum wyjaśnione w sprawie z czterema węzłami bez świadka

  • może przetrwać jedną awarię serwera: tak.
  • może przetrwać jedną awarię serwera, a następnie inną: tak.
  • może przetrwać dwie awarie serwera naraz: pięćdziesiąt procent szans.

cztery węzły ze świadkiem.

wszystkie głosy węzłowe i głosy świadków, więc większość jest ustalana z ogólnej liczby 5 głosów. Po jednej porażce jesteś w scenariuszu 4. Po dwóch jednoczesnych porażkach przeskakujesz do scenariusza 2.

 kworum wyjaśnione w sprawie z czterema węzłami ze świadkiem

  • może przetrwać jedną awarię serwera: tak.
  • może przetrwać jedną awarię serwera, a następnie inną: tak.
  • może przetrwać dwie awarie serwera jednocześnie: tak.

pięć węzłów i więcej.

wszystkie węzły głosują, lub wszystkie z wyjątkiem jednego głosu, cokolwiek czyni całość dziwną. Storage Spaces Direct i tak nie może obsłużyć więcej niż dwóch węzłów, więc w tym momencie żaden świadek nie jest potrzebny ani użyteczny.

 kworum wyjaśnione w przypadku pięciu węzłów i więcej

  • może przetrwać jedną awarię serwera: tak.
  • może przetrwać jedną awarię serwera, a następnie inną: tak.
  • może przetrwać dwie awarie serwera jednocześnie: tak.

teraz, gdy rozumiemy, jak działa kworum, spójrzmy na rodzaje świadków kworum.

typy świadków Kworum

klastrowanie przełączania awaryjnego obsługuje trzy typy świadków Kworum:

  • Usługa Cloud Witness – magazyn obiektów Blob na platformie Azure Dostępny dla wszystkich węzłów klastra. Przechowuje informacje grupowe w świadku.plik dziennika, ale nie przechowuje kopii bazy danych klastra.
  • File Share Witness – udział plików SMB skonfigurowany na serwerze plików z systemem Windows Server. Przechowuje informacje grupowe w świadku.plik dziennika, ale nie przechowuje kopii bazy danych klastra.
  • Disk Witness-mały klastrowy dysk znajdujący się w grupie Cluster Available Storage. Ten dysk jest wysoce dostępny i może przełączać się między węzłami. Zawiera kopię bazy danych klastra. Usługa Storage Spaces Direct nie obsługuje świadka dysku.

Pool quorum overview

właśnie rozmawialiśmy o kworum klastra, który działa na poziomie klastra. Teraz zagłębimy się w Kworum Puli, które działa na poziomie puli (tzn. możesz stracić węzły i dyski, a Pula pozostanie w górze). Pule pamięci zostały zaprojektowane tak, aby mogły być używane zarówno w scenariuszach klastrowych, jak i nieklastrowych, dlatego mają inny mechanizm kworum.

poniższa tabela zawiera przegląd wyników Kworum puli na scenariusz:

węzły serwera mogą przetrwać jedną awarię węzła serwera mogą przetrwać jedną awarię węzła serwera, a następnie inny może przetrwać dwie równoczesne awarie węzła serwera
2 nr nr nr
2 + świadek tak Nie Nie
3 tak Nie Nie
3 + świadek tak Nie Nie
4 tak Nie Nie
4 + świadek tak tak tak
5 i powyżej tak tak tak

jak działa pool quorum

gdy dyski ulegają awarii lub gdy jakiś podzbiór dysków traci kontakt z innym podzbiorem, Pozostałe dyski muszą zweryfikować, czy stanowią większość puli, aby pozostać online. Jeśli tego nie zweryfikują, wyłączą się. Pula to jednostka, która przechodzi do trybu offline lub pozostaje online w zależności od tego, czy ma wystarczającą ilość dysków do kworum (50% + 1). Właścicielem zasobu puli (aktywny węzeł klastra) może być +1.

ale kworum puli działa inaczej niż kworum klastra w następujący sposób:

  • pool używa jednego węzła w klastrze jako świadka jako tie-breaker, aby przetrwać połowę dysków, które zniknęły (ten węzeł, który jest właścicielem zasobu puli)
  • pool nie ma dynamicznego kworum
  • pool nie implementuje własnej wersji usuwania głosu

przykłady

cztery węzły o symetrycznym układzie.

każdy z 16 dysków ma jeden głos, a węzeł drugi ma również jeden głos (ponieważ jest to właściciel zasobu puli). Większość jest ustalana z ogólnej liczby 16 głosów. Jeśli węzły trzy i cztery upadną, przetrwały podzbiór ma 8 dysków i właściciela zasobu puli, co daje 9/16 głosów. Basen przetrwa.

Pool Quorum 1

  • może przetrwać jedną awarię serwera: tak.
  • może przetrwać jedną awarię serwera, a następnie inną: tak.
  • może przetrwać dwie awarie serwera jednocześnie: tak.

cztery węzły o symetrycznym układzie i awarii napędu.

każdy z 16 dysków ma jeden głos, a węzeł 2 ma również jeden głos (ponieważ jest to właściciel zasobu puli). Większość jest ustalana z ogólnej liczby 16 głosów. Po pierwsze, drive 7 idzie w dół. Jeśli węzły trzy i cztery upadną, przetrwały podzbiór ma 7 dysków i właściciela zasobu puli, co daje 8/16 głosów. Więc basen nie ma większości i spada.

 Pool Quorum 2

  • może przetrwać jedną awarię serwera: tak.
  • może przetrwać jedną awarię serwera, a następnie inną: Nie.
  • może przetrwać dwie awarie serwera naraz: nie.

cztery węzły o układzie niesymetrycznym.

każdy z 24 dysków ma jeden głos, a węzeł drugi ma również jeden głos (ponieważ jest to właściciel zasobu puli). Większość jest ustalana z 24 głosów. Jeśli węzły trzy i cztery upadną, przetrwały podzbiór ma 8 dysków i właściciela zasobu puli, co daje 9/24 głosów. Więc basen nie ma większości i spada.

 Pool Quorum 3

  • może przetrwać jedną awarię serwera: tak.
  • może przetrwać jedną awarię serwera, a następnie inny: **zależy * * (nie może przetrwać, jeśli oba węzły trzy i cztery zostaną uszkodzone, ale może przetrwać wszystkie inne scenariusze.
  • może przetrwać dwie awarie serwera naraz: ** Zależy * * (nie może przetrwać, jeśli oba węzły trzy i cztery spadną, ale może przetrwać wszystkie inne scenariusze.

Pool quorum recommendations

  • upewnij się, że każdy węzeł w klastrze jest symetryczny (każdy węzeł ma taką samą liczbę dysków)
  • Włącz serwer lustrzany trójdrożny lub podwójny parzystość, aby można było tolerować awarie węzła i utrzymywać dyski wirtualne w trybie online. Więcej informacji można znaleźć na naszej stronie ze wskazówkami dotyczącymi objętości.
  • jeśli więcej niż dwa węzły są wyłączone lub dwa węzły i dysk na innym węźle są wyłączone, woluminy mogą nie mieć dostępu do wszystkich trzech kopii swoich danych, a zatem mogą być wyłączone i niedostępne. Zaleca się szybkie przywrócenie serwerów lub wymianę dysków, aby zapewnić największą odporność wszystkich danych na woluminie.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.