Die LooksAlive und IsAlive Checks im Cluster

Wie überprüft der Cluster Service die Verfügbarkeit einzelner Ressourcen?

Um zu überprüfen, ob Cluster Ressourcen noch verfügbar sind gibt es im allgemeinen zwei Checks, die der Clusterdienst periodisch ausführt: Den LooksAlive check und den IsAlive check.
Der LooksAlive check ist eine einfache Überprüfung, ob eine Ressource ansprechbar ist. Der IsAlive check geht -je nach Ressourcentyp- darüber hinaus.

Die LooksAlive und IsAlive checks fallen je nach Ressourcentyp unterschiedlich aus, hier anhand des Beispiels einer Cluster Print Spooler Ressource:

LooksAlive
Der Windows Service Control Monitor (SCM) wird abgefragt, ob der Spooler Dienst läuft

IsAlive
Ein API Call auf das Printer Subsystem (localspl.dll) wird abgesetzt

Der LooksAlive-/IsAlive check einer Ressource ist also stark davon abhängig, welche Funktion eine Ressource inne hat. Folgender KB Artikel gibt einem eine gute Übersicht wie die üblichen Cluster Standardressourcen überprüft werden:

» Behavior of the LooksAlive and IsAlive functions… (KB 914458)

Im Falle einer Physical Disk Ressource prüft der Clusdisk.sys Clusterdienst zusätzlich alle 3 Sekunden mittels eines SCSI Reserve Kommandos, ob die LUN noch verfügbar ist. Weiterhin wird eine Lese-/Schreiboperation auf den sog. „Private Sector“, den Sektor 12 einer LUN, ausgeführt.

Um die LooksAlive-/IsAlive checks zu unterdrücken, um beispielsweise ein „chkdsk /f“ exklusiv und vor allem unterbrechungsfrei auf einer Shared Disk auszuführen zu können, gibt es seit Windows Server 2003 SP1 den Maintenance Mode. Mittels folgendem cluster.exe Parameter kann eine Disk in diesen Wartungsmodus versetzt werden:

cluster.exe . res "ADisk" /maint:on

Weiterführende Informationen zum Wartungsmodus:
» http://support.microsoft.com/kb/903650/en-us

Das LooksAlive-/IsAlive Intervall kann alternativ dazu über ein cluster.exe Parameter angepasst werden:

» Cluster.exe Parameters: LooksAlivePollInterval – IsAlivePollInterval

Die Defaultwerte sollten nur in begründeten Fällen angepasst werden, zB. um die Zeit für einen Restore zu erhöhen. In der Regel können ab W2K3 SP1 anstatt der manuellen Anpassung die Werte des Maintenance Mode verwendet werden.

Stay tuned,
N.Own

Recommended W2K3 SP2 Cluster Hotfixes

Nebst der Liste empfohlener Hotfixe für Windows 2000 Server und Windows Server 2003 SP1 Cluster gibt es inzwischen auch eine Liste empfohlener Hotfixe für Windows Server 2003 SP2 Cluster:

» Recommended hotfixes for Windows Server 2003 Service Pack 2-based server clusters

Ende letzter Woche wurde die Liste aktualisiert. Diese Liste sollte jeder Cluster Admin im Auge behalten und die Nodes entsprechend patchen.

Stay tuned,
N.Own

Hidden or Ghosted Network Adapter

Was tun, wenn nach einem Netzwerkkartentausch noch die alten TCP/IP Einstellungen im System vorhanden sind?

Dabei kann es zu folgender Fehlermeldung kommen:

The IP address XXX.XXX.XXX.XXX you have entered for this network adapter is already assigned to another adapter Name of adapter. Name of adapter is hidden from the network and Dial-up Connections folder because it is not physically in the computer or is a legacy adapter that is not working. (…)

Man kann sich die alte, nun versteckte Netzwerkkarte über den Device Manager wie folgt anzeigen:

1. Start > Run > cmd.exe
2. Umgebungsvariable über folgenden Befehl setzen:

set devmgr_show_nonpresent_devices=1

3. Device Manager in diesem Kontext aufrufen (nicht über die GUI!):

start devmgmt.msc

4. Im Gerätemanager über Menü ‚View‘ >
‚Show Hidden Devices‘ alle Geräte einblenden
5. Ausgegraute (physikalische) Netzwerkadapter deinstallieren

Nun sind die Überreste der alten Netzwerkkarte und deren Einstellungen gelöscht.

Diesen Tipp nutze ich schon seit vielen Jahren, ich habe das Verhalten bei vielen Systemen seit Windows 2000 beobachtet.

Es gibt zwei KB Artikel, die mir dazu bekannt sind – einen für Windows 2000 Server und einen für Windows Server 2003:

» Device Manager Does Not Display Devices Not Currently Present in Windows 2000 (KB 241257)

» Error message when you try to set an IP address on a network adapter (KB 269155)

Stay tuned,
N.Own

Cluster Knoten deinstallieren

Wie deinstalliert man eigentlich einen Clusterknoten rückstandslos?

Folgende Vorgehensweise über den Cluadmin empfiehlt sich, um einen Knoten zu deinstallieren:

  1. Ressourcen auf passiven Knoten schwenken
  2. Cluster Knoten anhalten: „Stop the Cluster Service“
  3. Knoten evicten: „Evict Node“

Das führt dazu, daß der Knoten entfernt wird und alle Clusterspezifischen Einstellungen gelöscht werden.
Der Clusterdienst an sich gehört zum Funktionsumfang eines Windows Servers und bleibt erhalten.

Falls dies fehlschlägt, kann die Kommandozeilen-Option forcecleanup gewählt werden:

cluster node nodename /forcecleanup

Vorsicht: Diesen Befehl keinesfalls auf einem aktiven Node ausführen. KB 282227 beschreibt diese Optionen:
» How to Uninstall the Cluster Service

Sinn macht ein forcecleanup auch, falls der Knoten ursprünglich mal einem anderen Cluster (KB 555216) angehört hat oder das evicten nicht vollständig abgeschlossen wurde.

Stay tuned,
N.Own