Mit regulären Expressionen kann in einem String nach bestimmten Zeichenketten gesucht werden. Daneben ist es natürlich auch möglich diese Zeichenketten zu modifizieren und sie anschließend zu ersetzen. Unter Java würde das Ganze wie folgt aussehen:
private static String convertBlockquotes(String html) {
Pattern patternBlockquote = Pattern.compile("<blockquote>(.+?)</blockquote>", Pattern.DOTALL);
// Find all blockquote tags
final Matcher matcher = patternBlockquote.matcher(html);
StringBuffer stringBuffer = new StringBuffer(html.length());
// Translate each tag
while (matcher.find()) {
// Get complete tag
String group = matcher.group();
// Remove tags
group = group.replace("<blockquote>", "");
group = group.replace("</blockquote>", "");
// Replace old tag with markdown equivalent
matcher.appendReplacement(stringBuffer, group);
}
matcher.appendTail(stringBuffer);
return stringBuffer.toString();
}
Wenn nun in dem gefundenen String sich z.B. ein $-Zeichen (das Zeichen für Ersetzung im Kontext der Matcher-Klasse) befindet, wird spätestens bei der Zeile:
// Replace old tag with markdown equivalent
matcher.appendReplacement(stringBuffer, group);
ein Problem auftreten, welches sich in einer IllegalArgumentException äußert:
Exception in thread „main“ java.lang.IllegalArgumentException: Illegal group reference
Hintergrund ist das bestimmte Zeichen wie $ oder der Backslash maskiert werden müssen. Dies konnte manuell erledigt werden, bevor die Methode appendReplacement aufgerufen wird:
group = group.replace("$", "\\$");
Einfach ist es die integrierte Methode quoteReplacement zu nutzen:
group = Matcher.quoteReplacement(group);
Diese maskiert die entsprechenden Zeichen. Ein etwas andere Lösung ist es appendReplacement ohne neue Zeichenkette aufzurufen und diese anschließend an den StringBuffer anzufügen:
matcher.appendReplacement(stringBuffer, "");
stringBuffer.append(group);
Bei dieser Variante müssen keine Zeichen maskiert werden. Die vom JDK angedachte Variante ist allerdings die der Nutzung von quoteReplacement, so das diese bevorzugt werden sollte.