Thomas Kramer

IT-COW | Oktober 2010

Backup eines Blogs

By Administrator at Oktober 08, 2010 16:38
Filed Under: Administration, Backup, Blog

Ich schreibe einmal auf, wie ich das Backup meines Blogs erledigt habe – geht eigentlich sehr einfach. Mittlerweile steckt doch einiges an Arbeit da drin, daher ist das schon wichtig. Für meine Methode muss der Anbieter des Webservers einen FTP-Zugang anbieten, aber das ist heute ja immer der Fall.

 

Ich benutze dafür ein Batch-Skript, das über den Windows-Taskplaner zeitgesteuert aufgerufen wird und die Dateien über FTP herunterlädt. Das benutzte Programm ist das Utility wget, das für alle Betriebssysteme verfügbar ist. In meiner Batch-Datei steht dazu folgendes:


cd "$Lfwk$:\$Verzeichnis$"
$Lfwk$:
wget -r --ftp-user=$Benutzer$ --ftp-password=$Passwort$ --no-passive-ftp ftp://$Adresse$

 

Es muss nicht nur das Verzeichnis mit cd "..." gewechselt werden, sondern mit $Lfwk$: auch das Laufwerk. Für die Variablen sind natürlich die tatsächlichen Werte einzutragen. Wenn im Verzeichnisnamen ein Leerzeichen enthalten ist, muss er natürlich mit Anführungszeichen umklammert werden.

 

Ein Backup ist schon sinnvoll - ich nehme an mein Webhoster nimmt auch eines vor, aber darauf habe ich natürlich keinen direkten Zugriff. Jedoch schützt ein solches Backup nicht zwingend vor dem Fehler, das ich einen meiner eigenen Beiträge versehentlich lösche (... ist so ja kein inkrementelles Backup) - mir ist das einmal passiert und ich wollte den Beitrag rekonstruieren.

 

BlogEngine.NET legt die Beiträge (Konfigurationssache) als XML-Dateien unter ..\App_Data\posts ab, wobei jede Datei im Verzeichnis eine GUID als Dateinamen hat. Alternativ können die Einträge auch in einer SQL Server-Datenbank abgelegt werden, aber ich habe damals XML-Dateien bevorzugt (ist auch Default-Einstellung). Wenn nun ein Beitrag über das Webinterface gelöscht wird, wird keine Datei direkt gelöscht, sondern nur der Verweis weggenommen. Entsprechend bleiben dann auch die Dateien in der FTP-Kopie existent.

 

Jedenfalls, als ich den Beitrag rekonstruieren wollte hatte ich damals mehrere Dateien für diesen Beitrag gefunden - offenbar für jeden Bearbeitungsstand eine. Mein erster Gedanke war dann anhand des Erstellungs- /Änderungsdatums der Dateien den letzten Bearbeitungsstand herauszufinden, aber die Reihenfolge stimmte nicht. Ich bin dann manuell durch alle Dateien für diesen Beitrag durchgegangen und habe nach dem letzten Bearbeitungsstand gesucht...

 

Aufgrunddessen habe ich später bei mir zusätzlich noch eine Sicherung eingerichtet, die den RSS-Feed abonniert. Die gängigen RSS-Reader übernehmen ja Änderungen von bereits ausgelesenen Einträgen automatisch, so das ich da immer direkt den letzten Bearbeitungsstand ersichtlich habe. Wenn ich einen Beitrag lösche ist er dann auch immer noch im RSS-Reader zu sehen.

 

Ich empfehle also eine kombinierte Backup-Strategie.

 

Damit der Aufruf zeitgesteuert über den Windows-Taskplaner auch funktionieren kann, muss der Backup-Server zu der geplanten Zeit natürlich auch an sein.

 

Update 23.03.2011: Inkrementelle Sicherung hinzugefügt: Link.

 

Monats-Liste