Windows Server Failover Clustering mit Longhorn Server Beta 3

Mit Erscheinen der Beta 3 von Longhorn Server sind die ersten Step-by-Step Guides der Windows Server Code Name „Longhorn“ Technical Library verfügbar.

Die folgenden beiden Guides sind momentan für Windows Server Failover Clustering online:

» Step-by-Step Guide for Configuring a Two-Node File Server Failover Cluster in Windows Server „Longhorn“

» Step-by-Step Guide for Configuring a Two-Node Print Server Failover Cluster in Windows Server „Longhorn“

Die Neuerungen zu WSFC hatte ich bereits in einem früheren Beitrag angesprochen und sind ebenfalls in dem Dokumentenzweig verfügbar:

» Longhorn Server: What’s New in Failover Clusters

Also – holt Euch die Beta 3 von Longhorn Server und testet die Neuerungen von Longhorn Clustering 😉

Stay tuned,
N.Own

„Giving a reprieve for resource…“

Wird ein Volume als dirty markiert, das als Clusterressource eingebunden ist, so läuft es in den checkdisk. Der chkdsk geschieht erst nach dem Systemstart und nicht, wie außerhalb des Clusters üblich, während des Bootens und wird vom ClusDisk Treiber initiiert.
Folgender Eintrag ist in einem solchen Fall im cluster.log sichtbar:

00000a24.00000220::2007/05/04-07:31:33.934 INFO Physical Disk <Datenträger F:>: DriveIsAlive called for Online check
00000a24.00000220::2007/05/04-07:31:34.091 INFO Physical Disk <Datenträger F:>: DriveIsAlive checking that file system is not corrupt. If so, chkdsk may run.
00000a24.00000220::2007/05/04-07:31:34.091 INFO Physical Disk <Datenträger F:>: DisksIsVolumeDirty: Volume is dirty
00000a24.00000220::2007/05/04-07:31:34.091 INFO Physical Disk <Datenträger F:>: DisksOpenChkdskLogFile: chkdsk.exe output is in file: C:\WINDOWS\Cluster\ChkDsk_Disk0_Sig7D01274F.log

Im Hintergrund läuft nun ein chkdsk Prozess, der aktuelle Status ist im chkdsk(…).log ersichtlich.

Die Ressourcen verbleiben solange im Status Online Pending, im cluster.log wird folgendes geloggt:

00000a24.00000df0::2007/05/04-07:36:55.915 WARN [RM] ChkdskNotRunning: Found process chkdsk.exe.
00000a24.00000df0::2007/05/04-07:36:55.915 INFO [RM] RmpTimerThread: Giving a reprieve for resource Datenträger F:…

Der Resource Monitor (RM) wartet solange auf die Resource DLL, solange diese Statusupdates meldet.
Das bedeutet, daß die Zeit für ein PendingTimeout erst ab dem Zeitpunkt läuft, wenn keine Rückmeldung mehr von einer Resource DLL zurückgegeben wird.
Siehe: » MSDN – PendingTimeout
In diesem Fall muss der chkdsk Prozess abgewartet werden, die Ressourcen verbleiben währenddessen wie gesagt im Status Online Pending.
Folgender Eintrag ist im cluster.log zu finden über den chkdsk status:

00000a24.00000220::2007/05/04-08:39:59.779 WARN Physical Disk <Datenträger F:>: FixCorruption: chkdsk.exe returned status of X (…)

Erläuterung zu den status codes:
» http://support.microsoft.com/kb/265533/en-us/
Allgemeines zum chkdsk im cluster:
» http://support.microsoft.com/kb/272244/en-us

Ein Failover würde hier keine Verbesserung des Status bewirken, da erst das Dateisystem sauber sein muss, bevor eine Disk Ressource online genommen werden kann.

Um zum Titel dieses Beitrags und den eingangs erwähnten Eintrag im cluster.log zurückzukommen („giving a reprieve for resource…“): Interessante Wortwahl 😉

Stay tuned,
N.Own

Erste Longhorn Cluster KB Artikel…

So langsam werden die ersten KB Artikel zu Windows Server Codename Longhorn publik:

» How to configure an IPv6 resource for a SQL Server 2005 cluster on a Windows Longhorn Server-based computer

Der KB Artikel beschreibt, wie man eine IPv6 Ressource im Cluster einbindet für Clustering mit dem SQL Server 2005.
Voraussetzung dafür ist der SQL Server 2005 Service Pack 2.

Infos bei TechNet zum Thema IPv6:
» http://www.microsoft.com/technet/network/ipv6/default.mspx

TechNet Einstiegsseite zu Longhorn Server:
» TechNet: Windows Server Code Name „Longhorn“

Stay tuned,
N.Own