Serverausfall neulich

Christian Ordig chr.ordig at gmx.net
Die Okt 10 01:25:02 CEST 2006


Hallo Liste,

für all die, die es vielleicht gar nicht mitbekommen hatten, und auch 
für diejenigen, die es mitbekommen haben, sich aber irgendwie noch 
nicht so richtig informiert fühlen...

Folgendes hatte sich ereignet:
Unser Server hat seinen Standort innerhalb des RZ gewechselt, beim 
erneuten Einschalten kam das System nicht mehr auf die Beine, weil der 
RAID-Controller stehenblieb, und ganz wild meldete, daß eine Platte 
defekt ist ... blöd nur, wenn er das meldet, das aber gar keiner sieht 
... nunja, jetzt ist er so konfiguriert, daß er brav hochfährt, auch 
wenn eine Platte tot ist :-)
Nach einigen Telefonaten war die Situation aufgeklärt, und die Kiste 
stand am nächsten Tag bei mir. Da ich der noch funktionierenden Platte 
auch nicht mehr sonderlich vertraue, habe ich kurzerhand eine neue zweite
Platte in das RAID gehängt, und die als defekt gemeldete entfernt. 
Und am nächsten Morgen lief der Rechner wieder. An dieser Stelle nochmal 
meinen Dank an Erik Heinz, der meine Anrufe ertragen, und auch noch 
kurzfristig eine per dhclient verkorkste resolv.conf reparieren durfte :-)

Nun zu der Situation der defekten Platte. Ein Oberflächentest ergab 
eine zweistellige Zahl defekter Sektoren. Allerdings sollte man laut 
Hersteller "Seagate", vor der Reklamation deren Seatools drüberlaufen 
lassen ... Ergebnis: keine SMART-Fehler, und es hat die defekten 
Sektoren "repariert" ... ist das jetzt eine neue Masche sich vor einem 
Garantieaustausch zu schützen, oder wie soll ich das verstehen? Ich 
dachte, wenn da schon defekte Sektoren auftauchen, ist das nur der Fall, 
wenn das Platten eigene Defekt-Management sie nicht selber remappen 
kann? 

Was sagt Ihr dazu, wie soll ich mich da jetzt sinnvollerweise weiter 
verhalten? Ein Protokoll über die vormals defekten Sektoren habe ich. 
Im Moment sagen die "Seatools", daß die Platte i.O. ist :-|

Garantie ist noch bis September 2009 ... aber so richtig traue ich dem 
Frieden nicht ...

Irgendwelche Ideen?

-- 
Christian Ordig
Germany