Größe der Packdateien unter Git beschränken

Im Versionsverwaltungssystem Git existieren im Repository sogenannte Packfiles. Diese werden genutzt um mehrere Objekte, wie z.B. Commits, Trees, Blobs oder Tags, als einzelne Dateien abzulegen. Damit fasst Git viele Objekte zu einer einzelnen komprimierten Datei zusammen. Ergänzt wird das ganze durch einen Index, um einen schnellen Zugriff zu ermöglichen. Dabei nutzt Git Delta-Kompression, indem es ähnliche Objekte, z. B. verschiedene Versionen derselben Datei, nicht vollständig speichert, sondern nur die Unterschiede.

Eine Git-Pack-Datei im Schema

Dies reduziert die Repository-Größe erheblich, kann aber bei ungünstigen Repositorys mit vielen Binärdaten zu Repositorys führen, welche mehrere dutzend Gigabyte große Pack-Dateien besitzen. Eine Steuerung ist über den Konfigurationsparameter pack.packsizelimit möglich:

git config pack.packsizelimit 5g

Damit würde diese Einstellung für das aktuelle Repository gesetzt werden. Wer das Ganze global benötigt, kann dies ebenfalls einstellen:

git config --global pack.packsizelimit 5g

Allerdings gilt diese Einstellung nicht sofort, stattdessen muss für ein Repack gesorgt werden:

git repack -Ad --max-pack-size=5g

Anschließend kann die Größe der Packs kontrolliert werden:

ls -lh .git/objects/pack

Allerdings sollte beachtet werden, das die Option grundsätzlich nur in Ausnahmefällen sinnvoll ist:

Note that this option is rarely useful, and may result in a larger total on-disk size (because Git will not store deltas between packs) and worse runtime performance (object lookup within multiple packs is slower than a single pack, and optimizations like reachability bitmaps cannot cope with multiple packs).

gzip-Komprimierung unter Nginx aktivieren

Bei der Auslieferung einer Webseite, kann der Datenstrom mittels gzip komprimiert werden. Im Endeffekt kommt die Komprimierung der Performanz einer Webseite zu Gute, da weniger Daten ausgeliefert werden müssen. Um die gzip-Komprimierung unter Nginx zu aktivieren, muss die entsprechende Konfigurationsdatei bearbeitet werden:

nano /etc/nginx/nginx.conf

In dieser Konfigurationsdatei findet sich folgender Block:

gzip on;

#gzip_vary on;
#gzip_proxied any;
#gzip_comp_level 6;
#gzip_buffers 16 8k;
#gzip_http_version 1.1;
#gzip_types text/plain text/css application/json application/javascript text/xml application/xml application/xml+rss text/javascript;

Nachdem die auskommentierten Werte wieder einkommentiert wurden, kann Nginx neu gestartet werden:

service nginx restart

Anschließend ist die Komprimierung mittels gzip aktiv.

ZIP-Archive auf der Konsole unter Linux

ZIP-Archive können unter Linux nicht nur mithilfe von grafischen Anwendungen auf dem Desktop erzeugt werden, sondern ebenfalls über die Konsole. Dazu existieren die beiden Kommandos zip und unzip. Das Kommando zip dient der Komprimierung von Dateien und Ordnern. Soll eine oder mehreren Dateien zu einem Archiv verbunden werden, so sieht dies auf der Konsole wie folgt aus:

zip beispiel.zip text1.md text2.md

Auch die Komprimierung von ganzen Ordnern ist mit dem zip-Kommando möglich:

zip -r beispiel.zip texte

Neben der Erzeugung von normalen ZIP-Archiven, können auch verschlüsselte Archive mittels des Parameters -e erzeugt werden:

zip -e beispiel.zip text1.md text2.md

Nach der Eingabe des Kommandos wird der Nutzer nach einem entsprechenden Passwort für die Verschlüsselung gefragt. Soll ein Archiv wieder dekomprimiert werden, so wird das Kommando unzip genutzt.

unzip beispiel.zip

Das Kommando bietet nicht nur die Möglichkeit ein Archiv zu dekomprimieren, sondern kann den Inhalt des Archivs ausgeben, ohne dieses zu dekomprimieren:

unzip -l beispiel.zip