Eine Drupal Website mit HTML Export und MAMP archivieren

Verfasst von Hagen Graf am 21. February 2010 - 16:54

Manchmal haben wir die Anforderung eine ältere Drupal Website zu archivieren. Es ist dabei nicht notwendig ein voll funktionsfähiges Archiv zu haben. Aus diesem Grund probierte ich mal das HTML Export Modul.

Die Idee ist einfach: Das Modul erzeugt eine HTML Seite aus jeder für einen Gast sichtbaren Drupal Seite.

Wenn man eine mehrsprachige Multisite installation hat ist es allerdings ein wenig komplizierter, weil HTML Export in diesen Fällen nicht gut funktioniert :-( Ich habe keine richtige Lösung für alles gefunden aber ich möchte beschreiben, was ich getan habe:

  • ein lokales mamp installiert.
  • eine genaue Kopie der produktiven Umgebung gebaut. In diesem Fall war es eine alte Drupal 5 Website - http://drupal5.cocoate.com. Es war eine Multisite mit vielen Websites im sites Ordner. Ich habe die anderen Websites Ordner gelöscht. Übrig geblieben ist nur /sites/drupal5.cocoate.com. Ich habe einen neuen sites/default Ordner für die notwendige settings.php angelegt. Ich hätte auch einen Apache Server Alias in der httpd.conf erzeugen können aber diese pragmatische Lösung war einfacher.
  • das I18N Modul deaktiviert und die primary language auf Deutsch gesetzt. In einem anderen Fall habe ich die primary language auf English gesetzt und so konnte ich die englische Version exportieren.
  • den Domainnamen in der hosts Datei eingetragen.

Exporting a Drupal website to HTML

  • einen <VirtualHost> Container in der lokalen httpd.conf eingefügt.

Exporting a Drupal website to HTML

  • die php.ini verändert um keine timeouts zu haben
  • die Website in Drupal mittels HTML Export exportiert

Exporting a Drupal website to HTML Exporting a Drupal website to HTML

  • hochgeladen in unser neues kleines Archiv - et voilà - fertig :-)

Hier ist das Ergebnis: http://drupal5.archive.cocoate.com

Manchmal haben wir die Anforderung eine &auml;ltere Drupal Website zu archivieren. Es ist dabei nicht notwendig ein voll funktionsf&auml;higes Archiv zu haben. Aus diesem Grund probierte ich mal das HTML Export Modul.Die Idee ist einfach: Das Modul erzeugt eine HTML Seite aus jeder f&uuml;r einen Gast sichtbaren Drupal Seite.Wenn man eine mehrsprachige Multisite installation hat ist es allerdings ein wenig komplizierter, weil HTML Export in diesen F&auml;llen nicht gut funktioniert :-( Ich habe keine richtige L&ouml;sung f&uuml;r alles gefunden aber ich m&ouml;chte beschreiben, was ich getan habe:

4 Kommentare

[UPDATE] viel bessere Lösung

Submitted by Hagen Graf on 21. February 2010 - 20:56.

Ich habe gerade httrack ausprobiert.
Das arbeitet perfekt und ist sooo viel einfacher als die HTML Export Lösung ... !
Danke Jürgen :-)

hmmm <- in deutsch :-)

Submitted by Hagen Graf on 22. February 2010 - 12:31.

I habe jetzt mal httrack und sitesucker ausprobiert.
Der erste Eindruck ist "WOW -  so super". Solange die alte Seite online ist werden auch alle CSS Files korrekt angezeigt. Wenn sie aber deaktiviert ist, sind die Pfade falsch ....

Wieder keine richtige Lösung :-(

HTML Export

Submitted by Guest (nicht überprüft) on 28. March 2010 - 10:55.

Hallo Hagen

Das ist wirklich schade.

Das Bloghouse Archiv sah super aus. Hoffentlich findet sich in der fleissigen Drupalgemeinde noch eine Lösung!

Liebe Grüsse kieselsteine

bloghouse archiv rumpelt vor sich hin

Submitted by Hagen Graf on 29. March 2010 - 10:34.

Ich versuche es momentan mit cocoawget von meinem lokalen Rechner aus.

Seit 10 Tagen läuft das Programm. Es hat bisher 23 Gigabyte an statischen Webseiten erzeugt und kein Ende in Sicht. Bloghouse war doch recht gross :-(

Ich lasse es noch ein paar Tage laufen ...

Viele Grüsse

Hagen

Kommentar hinzufügen

  • Internet- und E-Mail-Adressen werden automatisch umgewandelt.
  • Allowed HTML tags: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd> <img> <br><pre>
  • Zeilen und Absätze werden automatisch erzeugt.

Weitere Informationen über Formatierungsoptionen