4.13 Zum Weiterlesen
Wenn bei der Zeichenkettenverarbeitung sehr große Datenmengen verarbeitet werden, ist die Frage der Optimierung interessant. Die Standardimplementierung vom JDK arbeitet nur mit einem einfachen Suchalgorithmus, der bei großen Mustern und Suchstrings sehr ineffizient ist. Hier hat die Informatik in den letzten Jahrzehnten sehr interessante Ansätze hervorgebracht, wie zum Beispiel den Optimal-Mismatch-Algorithmus. Eine Applet-Visualisierung und kurze Beschreibung der Arbeitsweisen unterschiedlicher Suchalgorithmen bietet http://www.igm.univ-mlv.fr/~lecroq/string/. Ein gewisses Problem stellt aber der komplette Unicode-Standard dar, insbesondere Unicode 4.
Perl-Entwickler wachsen mit regulären Ausdrücken auf, während Java-Entwickler sich mit ihnen traditionell schwerer tun. Es lohnt sich auch für uns, sich mit diesem Bereich auseinanderzusetzen und zu üben, üben, üben – etwa an den unter http://regexlib.com/ gesammelten Ausdrücken. Bei http://www.rexv.org/ können die Ausdrücke über die Ajax-Technologie direkt im Webbrowser getestet werden. Oracle bietet unter http://download.oracle.com/javase/tutorial/essential/regex/index.html auch ein Tutorial an. Für Entwicklungsumgebungen bietet es sich an, ein Plugin zu installieren, mit dem reguläre Ausdrücke einfach eingegeben, getestet und dann in den Java-Editor übernommen werden können. Für Eclipse leistet das zum Beispiel http://brosinski.com/regex/.
Ihr Kommentar
Wie hat Ihnen das <openbook> gefallen? Wir freuen uns immer über Ihre freundlichen und kritischen Rückmeldungen.