WordPress-Beiträge und Seiten in Markdown umwandeln

Im letzten Jahr schrieb ich über ein Tool mit welchem die WordPress-Export-Datei in Markdown exportiert werden kann. Da das Tool einige Probleme mit bestimmten Konstellationen von Beiträgen hatte, habe ich ein eigenes Tool mit dem Namen WordPress2Markdown geschrieben. Dieses nimmt die Export-Datei, eine WordPress eXtended RSS (WXR)-Datei, entgegen und wandelt Posts und Pages in Markdown um. Ein beispielhafter Aufruf könnte dabei wie folgt aussehen:

java -jar WordPress2Markdown.jar -i wordpress-export.xml -s DATETIME -o /home/seeseekey/MarkdownExport

Der Quelltext findet sich auf GitHub zu finden und ist unter der GPL3 lizenziert. Dort findet sich ebenfalls ein entsprechendes Release.

OpenDocument-Dokumente nach Markdown konvertieren

Auf der Suche nach einer Möglichkeit mehrere hundert OpenDocument-Dokumente in Markdown zu konvertieren, bin ich schlussendlich bei Pandoc gelandet. Pandoc versteht sich als Konverter um Dokumente schnell und unkompliziert von A nach B zu konvertieren. Um nun eine OpenDocument-Datei in eine Markdown-Datei zu überführen, nutzt man folgende Syntax:

pandoc input.odt -t markdown -o output.md

Neben dieser Konvertierung, bietet Pandoc unzählige weitere Konvertierungen an. Pandoc ist unter der GPL in Version 2 lizenziert und somit freie Software. Verfügbar ist Pandoc für Linux, macOS und Windows.

WordPress-Beiträge als Markdown exportieren

Auf der Suche nach einer Möglichkeit um Beträge in WordPress als Markdown-Dateien zu exportieren, bin ich auf wp2md gestoßen. Dabei handelt sich um eine kleine Applikationen zur Umwandlung der WordPress-XML-Exportdatei zu Markdown. Zur Installation muss der Python-Paketmanager pip bemüht werden:

pip install git+https://github.com/dreikanter/wp2md

Anschließend kann wp2md für dem Export genutzt werden:

wp2md -d output/ export.xml

In der Minimalkonfiguration muss der Ausgabepfad und die Exportdatei angegeben werden. Die Export-Datei wird vorher unter WordPress über Werkzeuge -> Daten exportieren erzeugt. Anschließend erscheinen die Logmeldungen über den Exportfortschritt:

Dumping post to 'output/posts/20180616-pdfs-aus-bildern-mittels-imagemagick-erstellen.md'
Dumping post to 'output/posts/20180617-homebrew-deinstallieren-2.md'
Dumping post to 'output/posts/20180618-fernausloesung-der-kamera-am-iphone.md'
Dumping post to 'output/posts/20180619-transparente-verschluesselung-fuer-cloud-dienste.md'
Dumping post to 'output/posts/20180620-online-vektorisierer-fuer-rastergrafiken.md'
Dumping post to 'output/posts/20180711-zettlr-ein-flexibler-markdown-editor.md'
Dumping post to 'output/posts/20180712-bsnes-neu-aufgelegt.md'
Dumping post to 'output/posts/20180713-enpass-als-1password-alternative.md'
Dumping post to 'output/posts/20180720-ideentool-mit-neuen-generatoren-erschienen.md'
Dumping post to 'output/posts/20180723-cryptomator-laufwerk-verschwindet-unter-macos.md'
Dumping post to 'output/posts/20180725-puffer-fuer-streaming-im-vlc-mediaplayer-erhoehen.md'
Dumping index to 'output/index.md'

Total: posts: 3239; pages: 78; comments: 2878
Elapsed time: 30.55538 s

Neben den eigentlichen Artikeln, werden die dazugehörigen Kommentare exportiert. Daneben werde andere Inhalte wie Seiten und Entwürfe ebenfalls exportiert. Über die Kommandozeilenparameter kann der Export granulärer gesteuert werden. Der Quelltext des Projektes ist auf GitHub zu finden. Lizenziert ist das Projekt unter der GPL in der Version 3 und damit freie Software.

Zettlr – ein flexibler Markdown-Editor

Die letzten Tage verbrachte ich unter anderem damit mir unterschiedliche Markdown-Editoren anzuschauen. In die Kategorie sehenswert fiel der Markdown-Editor Zettlr. Bei Zettlr öffnet man einen Ordner und kann anschließend in diesem und seinen Unterordnern bestehende und neu anzulegende Dateien bearbeiten. Die Markdown-Formatierungen, wie Überschriften, Zitate, Fett- und Kursivstellungen, werden entsprechend hervorgehoben.

Die Darstellung der Markdown-Formatiierung

Die eingebauten Features sind eher übersichtlich in Zettlr angelegt; eine Rechtschreibprüfung und eine Exportmöglichkeit sind der einzige Zuckerguss neben den grundlegenden Bearbeitungsfunktionen. Das kann sich natürlich in der Zukunft noch ändern, da der Editor momentan in Version 0.17.1 vorliegt.

Zettlr unter Windows

Der Quelltext von Zettlr ist auf GitHub zu finden. Während er früher unter der MIT-Lizenz lizenziert war, wurde er vor einigen Monaten auf die GPL in der Version 3 umgestellt. Unter beiden Lizenzen handelt es sich bei Zettlr um freie Software. Bezogen werden kann die Applikation über die offizielle Projektseite unter zettlr.com.