4.10 Zum Weiterlesen 

Wenn bei der Zeichenkettenverarbeitung sehr große Datenmengen verarbeitet werden, ist die Frage der Optimierung interessant. Die Standardimplementierung von Sun arbeitet nur mit einem naiven Suchalgorithmus, der bei großen Mustern und Suchstrings sehr ineffizient ist. Hier hat die Informatik in den letzten Jahrzehnten sehr interessante Ansätze hervorgebracht, wie zum Beispiel den Optimal-Mismatch-Algorithmus. Eine Applet-Visualisierung und kurze Beschreibung der Arbeitsweisen unterschiedlicher Suchalgorithmen bietet http://www.igm.univ-mlv.fr/~lecroq/string/. Ein gewisses Problem stellt aber der komplette Unicode-Standard dar, insbesondere Unicode 4.
Perl-Entwickler wachsen mit regulären Ausdrücken auf, während Java-Entwickler sich mit ihnen traditionell schwerer tun. Es lohnt sich auch für uns, sich mit diesem Bereich auseinanderzusetzen und zu üben, üben, üben – etwa an den unter http://regexlib.com/ gesammelten Ausdrücken. Bei http://www.rexv.org/ können die Ausdrücke über die Ajax-Technologie direkt im Webbrowser getestet werden. Sun bietet unter http://java.sun.com/docs/books/tutorial/essential/regex/index.html auch ein Tutorial an.