Weitere aktuelle Java-Titel finden Sie bei dpunkt.
 Inhaltsverzeichnis   Auf Ebene Zurück   Seite Zurück   Seite Vor   Auf Ebene Vor   Eine Ebene höher   Index


20.2.1

XML als Strukturierungsmittel



Die starke und durchgehende Strukturierung von XML-Dokumenten bietet sehr gute Voraussetzungen für einen effizienten Zugriff auf die Informationen, die in den Dokumenten enthalten sind. Zum einen kann man auf der Grundlage der Strukturen eine sehr anwenderfreundliche Navigation durch das Dokument ermöglichen, zum anderen kann man bei Suchvorgängen sehr gute Ergebnisse erzielen. Diese beiden Anwendungsfälle werden im folgenden noch weiter ausgeführt.

Beispiel für den Einsatz von Java

Die Strukturen von XML-Dokumenten können gut in Navigationselementen aufbereitet und dargestellt werden, um dem Benutzer einen Überblick und einfachen Zugriff auf die Teile des Dokuments zu ermöglichen.

So könnte ein Servlet beim Zugriff auf ein Dokument dessen Struktur analysieren und daraus einen Navigations-Frame generieren, der neben dem Dokument zum Browser geschickt wird. Noch leistungsfähiger und flexibler wäre man hier mit einem Navigations-Applet, das die Titel und Adressen der Dokumente, die es anzeigen soll, als Parameter übergeben bekommt oder aus einer Datenbank bezieht.

Ein solches Navigations-Applet könnte die Dokumentenstruktur in einer Tree-Komponente anzeigen. Diese Art der Präsentation bietet dem Benutzer die Möglichkeit, nur die für ihn relevanten Teile des Dokumentenbaums zu betrachten und den Rest auszublenden.

Tatsächlich gibt es Tools wie den in Java implementierten XML-Editor Xeena von IBM, die den Parse-Baum eines XML-Dokuments in einer Tree-Komponente darstellen.

Die durchgehende Strukturierung von XML-Dokumenten liefert die Grundlage für eine sehr gute Suchbarkeit. Da die Strukturen in XML-Dokumenten mit Elementen aufgebaut sind, die jeweils eine ganz bestimmte Bedeutung haben (z. B. ein Titel eines Abschnitts oder ein Bibliographieeintrag), kann man Suchprogramme schreiben, die einen Begriff nur in ganz bestimmten Strukturelementen suchen. Um bei den genannten Beispielen zu bleiben, kann man so Suchanfragen der Form »Suche alle Abschnitte, die das Wort »Parser« im Titel enthalten« oder »Suche alle Quellen in der Bibliographie, die aus dem Jahr 2002 stammen«.

Insbesondere am ersten Beispiel kann man sich gut vorstellen, dass die Ergebnisse der Suchanfrage viel präziser sind als bei einer Volltextsuche. In einem Buch über XML und Java wird das Wort »Parser« wohl sehr oft vorkommen, aber durch die Möglichkeit, die Suche auf ganz bestimmte Strukturelemente zu beschränken, werden wirklich nur die gewünschten Treffer geliefert.

Unter der Voraussetzung, dass die Auszeichnungselemente korrekt benutzt wurden, lassen sich so beim Retrieval sehr hohe Vollständigkeits- und Präzisionsraten erzielen.


 Inhaltsverzeichnis   Auf Ebene Zurück   Seite Zurück   Seite Vor   Auf Ebene Vor   Eine Ebene höher   Index

Copyright © 2002 dpunkt.Verlag, Heidelberg. Alle Rechte vorbehalten.