Serverausfall
Sicherlich werden es einige bemerkt haben, dass es gestern zu einem kompletten Serverausfall von blocati gekommen war. Am 7. April kurz nach 0 Uhr hatte der Server das Dateisystem zerlegt und dabei zahlreiche wichtige Verzeichnisse komplett verloren. Ãœber das Rescue-System konnte zwar vieles wiederhergestellt werden, allerdings verliert man dabei dann meist die Verzeichnis- bzw. Dateinamen. Auch die RAID1-Lösung (2x 400GB SATA-Platten) hatte nicht geholfen. Die Webinhalte und Datenbanken blieben zum Glück nahezu komplett erhalten, lediglich einige awstats-Dateien mußten aus älteren Kopien ersetzt werden. Da auf dem Server allerdings auch ein imap-Server (eMail) mit reichlich Inhalten lag und die zugehörigen eMails gut durchgewürfelt in den Wiederherstellungszerzeichnissen verstreut lagen, war dafür eine mühselige manuelle Nacharbeit angesagt, weshalb auch nach dem Neuaufsetzen des Servers noch fast der gesamte Tag verging, bis wir uns dann mit den Domains beschäftigen konnten. blocati ist seit gestern kurz nach 21:00 wieder erreichbar. Dafür, dass wir blocati wegen diverser Probleme erst kürzlich auf diesen Server (Wir brauchen mehr Serverpower) umgezogen hatten, war der plötzliche Ausfall recht unerwartet … Aber unverhofft kommt oft
Ich hoffe mal, dass jetzt alles wieder vernünftig läuft und wirklich keine Fehler in den Datenbanken drin sind, aufgefallen ist mir bisher jedenfalls nichts. Die ganzen WordPress-Dateien, Bilder und alles weitere, was zu blocati gehört, werde ich in den nächsten Tagen sicherheitshalber noch mal komplett aus einer lokalen Sicherung überschreiben. Um in Zukunft den Server bei ähnlichen Problemen schneller wieder einsatzbereit zu bekommen, werden wir demnächst eine gegenseitige automatische Sicherung der relevanten Inhalte zwischen dem Server von meinem Kumpel (auf dem blocati liegt) und meinem hardwareseitig identischen Server einrichten.
Am 10. April 2008 um 02:35 Uhr
Nach der Neuinstallation ist der Seitenaufbau hier übrigens fast doppelt so schnell gegenüber vorher. Entweder hatte das Dateisystem schon länger ein Ding weg oder vielleicht lag’s doch am (theoretisch beim Lesen etwas schnelleren) Software-RAID1 - weiß der Geier, in den Logfiles ließ sich ja nichts mehr über die Ursachen finden ^^ Trotz allem habe ich aber immer noch manchmal Probleme mit den 500er Fehlern im Adminbereich. Ob wir die wohl irgendwann mal los werden?