Java und die Speicherung von Unicode

Der Datentyp char ist unter Java 16 Bit, also zwei Byte groß. Laut dem Buch Java ist auch eine Insel, werden die Daten in 16-Bit-Unicode gespeichert. Doch was genau bedeutet das und ist das eine korrekte Aussage? Die grundlegende Aussage, dass ein char unter Java ein 16-Bit-Unicode Zeichen ist, stimmt. Wobei mittlerweile wird das ganze so betrachtet, dass ein char unter Java eine Unicode code unit repräsentiert. Echte Unicode-Zeichen benötigen mittlerweile bis zu 21 Bit und werden üblicherweise als 32 Bit gespeichert, was einer UCS-4 Kodierung entspricht.

Mit Unicode können nicht nur lateinische Buchstaben abgebildet werden

Mit Unicode können nicht nur lateinische Buchstaben abgebildet werden

Das bedeutet, dass in einem char nur Unicode-Zeichen gespeichert werden können, die in 16 Bit abgebildet werden können. Bei einem Array vom Typ char, einem StringBuffer und einem String sieht die Sache anders aus. Hier sind die Unicode-Zeichen in UTF-16 kodiert, damit können alle Zeichen des Unicode-Satzes kodiert werden. Das führt aber auch zu Problemen, so gibt die Methode length() einer String-Instanz die Anzahl der Unicode code units zurück, was gleichbedeutend ist mit der Anzahl Byte multipliziert mit zwei ergibt. Es bedeutet das die Methode nicht zwingend die Anzahl der Buchstaben zurück gibt, da manche Buchstaben mit zwei Unicode code units kodiert werden.

CHM-Dateien unter Linux und Mac OS X öffnen

Das CHM-Format ist vielen bekannt als das Windows-Hilfedatei-Format. Auch wenn das Format mittlerweile aus der Mode gekommen ist, findet man ab und an eine solche Datei und möchte sie anzeigen. Unter Linux und Mac OS X gibt es dafür die freie Anwendung xCHM.

xCHM unter Mac OS X

xCHM unter Mac OS X

Lizenziert ist xCHM unter der GPL in Version 2 und damit freie Software. Bezogen werden kann xCHM über die offiziellen Seite. Unter Mac OS X kann es alternativ über MacPorts (Port xCHM) installiert zu werden.

C64 Preservation Project

Die goldenen Zeiten des Commodore 64 sind (leider) schon seit knapp 30 Jahren vorbei. Software wurde damals auf Kassetten und Disketten ausgeliefert. Gemeinsam haben diese Datenträger, das sie die Daten magnetisch speichern. Diese Datenträger sind dabei nicht auf Langzeit-Archivierung ausgelegt. Damit das Erbe dieser Ära nicht verloren geht, gibt es Projekte wie das C64 Preservation Project. Ziel des Projektes ist es die Erhaltung originärer Spiele und Anwendungen. Dabei geht es auch um solche Dinge wie die Erhaltung des „Kopierschutzes“ der Spiele und Anwendungen.

Die überarbeitete Version des Commodore 64

Die überarbeitete Version des Commodore 64

Anlässlich des zehnjährigen Bestehens wurde die 10th Anniversary Collection vom Projekt herausgegeben. Sie wird beim Internet Archive gehostet. Die offizielle Seite des Projektes ist unter c64preservation.com zu finden.

SourceTree

Normalerweise nutze ich als grafische Git-Oberfläche für Mac OS X, die freie Software GitX. Allerdings scheint die Entwicklung des Clients (wieder mal) eingeschlafen zu sein, so das ich mich nach Alternativen umgeschaut habe.

SourceTree unter Windows

SourceTree unter Windows

Fündig geworden bin ich dann bei SourceTree vom Hersteller Atlassian, welcher vor allem durch seine Projekmanagmentlösungen bekannt geworden ist. Der Client verfügt über eine Menge Funktionalität, welche der normale Anwender sicherlich nicht auf Anhieb benötigen wird, ist aber ansonsten sehr solide aufgebaut. Neben Git unterstützt der Client auch das Versionsverwaltungssystem Mercurial. Der Client selbst ist dabei neben Mac OS X auch für Windows verfügbar.

NaNoWriMo — Tag 30 – vom Endspurt zum fertigen Entwurf

Es ist der dreizigste und damit der letzte Tag des NaNoWriMo. 50.000 Wörter sollten im Monat November in Form eines Romanentwurfes geschrieben werden. Während ich in der Mitte des Monats sehr nachgelassen hatte, gab es in den letzten Tagen dann einen kleinen Motivationsschub nach dem Motto: „Jetzt erst recht.“ Herausgekommen sind dabei am Ende 51.032 Wörter.

Am Ende ward alles gut

Am Ende ward alles gut

In den letzten Tagen schrieb ich im Durchschnitt zwischen 3000 und 4000 Wörter, was sich dann schonmal über den ganzen Tag hinzog, da wurde morgens vor der Arbeit geschrieben und abends nach der Arbeit ging es weiter.

In Papier sehen 51.032 Wörter schon recht eindrucksvoll aus

In Papier sehen 51.032 Wörter schon recht eindrucksvoll aus

Die letzten Sätze des Entwurfs bescherten mir persönlich ein Glückgefühl. Das Gefühl es endlich durchgezogen zu haben und nun etwas fertiges (auch wenn es noch vieler Überarbeitungen bedarf) in der Hand zu halten. Für alle die es trotz aller Anstrengungen nicht geschafft haben gibt es nur zwei Dinge zu sagen. Im nächsten Jahr gibt es wieder einen NaNoWriMo, aber was viel wichtiger ist schreibt euren Entwurf zu Ende, auch wenn ihr es erst am vierten oder fünften Dezember zu Ende bringt – bringt es auf alle Fälle zu Ende.