Twitter und die Probleme mit Unicode URLs

Wenn man bei Twitter einen Account anlegt, und diesen mit einer Mailadresse verbinden will, ist das im Normalfall kein Problem. Interessant wird das ganze wenn man dort eine Mail nach dem Schema „example@entität.org“ angeben möchte. In dieser Adresse sind Unicodezeichen enthalten, in diesem Fall das „ä“.

Die nicht funktionierende Unicode Variante

Die nicht funktionierende Unicode Variante

Diese akzeptiert Twitter nicht als „richtige“ Mailadresse. Abhilfe schafft die die Umwandelung in Punycode z.B. mit dem Tool unter http://idnaconv.phlymail.de. Damit lautet die Entsprechung der Beispieladresse „“.

Mit der Punycode Umschreibung funktioniert es auch mit Twitter

Mit der Punycode Umschreibung funktioniert es auch mit Twitter

Diese umgeschriebene Adresse wird dann auch von Twitter akzeptiert.

Weitere Informationen gibt es unter:
http://de.wikipedia.org/wiki/Punycode

Ungültige Byte-Sequenz für Kodierung »UTF8«

Bei einer Datenbankabfrage mittels PHP auf eine PostgreSQL Datenbank kam es zu folgender Fehlermeldung:

Ungültige Byte-Sequenz für Kodierung »UTF8«

Gelöst wurde das ganze in dem die Abfrage richtig kodiert wurde:

$query=mb_convert_encoding($query, 'UTF-8', mb_detect_encoding($query, "UTF-8, ISO-8859-1, ISO-8859-15", true));

Damit konnten die Abfragen ohne Probleme an die Datenbank übergeben werden.