next up previous contents
Nächste Seite: Parser Aufwärts: eXtensible Markup Language Vorherige Seite: Dokumenttypdefinition   Inhalt

Das XML Dokument


Die DTD einer einfachen Literaturliste
<?xml version='1.0' encoding='UTF-8'?>
<!DOCTYPE Literaturliste SYSTEM 'Literaturliste.dtd'>
<Literaturliste>
    <Buch ISBN="3499130327" preis="12,50">
        <Titel>Hemmingway</Titel>
        <Autor>
            <Name>Lynn, Kenneth S.</Name>
            <EMail>lynn@net.de</EMail>
        </Autor>
    </Buch>

    <Zeitschrift language="EN">
	    <Titel>Proteins:Structure, Function and Genetics</Titel>
        <Autor>
            <Name>Sangjin Hong</Name>
        </Autor>
        <Autor>
            <Name>Peter L. Pedersen</Name>
        </Autor>
    </Zeitschrift>
</Literaturliste>

Im Quellcode 3.2 ist ein Dokument abgebildet, das aus Elementen der DTD aufgebaut ist, die im Quellcode 3.1 zu sehen ist. Das Dokument muß, wie jedes andere Dokument auch, durch einen Prolog eingeleitet werden, in dem zunächst die XML-Deklaration und die Deklaration des Dokumenttyps angegeben werden [Gopr2000]. In der XML-Deklaration wird die Versionsnummer und die Kodierung des Dokuments festgelegt. In der nachfolgenden Dokumenttypdeklaration wird dann entweder auf die DTD verwiesen oder sie wird hier direkt angegeben. Damit wird sichergestellt welche Elemente in diesem Dokument verwendet werden dürfen. Daran anschließend werden die eigentlichen Daten des Dokumentes abgelegt. In diesem Fall sind jeweils ein Buch und eine Zeitschrift in der Literaturliste angegeben. Wichtig ist dabei das ein Dokument wohlgeformt sein muß, d.h. die allgemeinen Syntaxregeln von XML müssen eingehalten werden. Dazu gehört z.B., daß Attributwerte in Anführungszeichen gesetzt und Elemente stets geschlossen werden. Des Weiteren wird auch auf die korrekte Verschachtelung der Elemente geachtet. Ein Element kann nicht innerhalb eines anderen Elementes geöffnet und dann außerhalb dieses Elementes geschlossen werden. Zusätzlich kann ein Dokument anhand seiner DTD geprüft werden. Dabei stellt man fest, ob die Elemente in einem Dokument die in der DTD festgelegte Reihenfolge einhalten. Genügt ein Dokument seiner DTD, bezeichnet man es als gültig oder auch als valid. Ein großer Vorteil von XML ist also, daß man ein Dokument relativ einfach auf seine Syntax hin überprüfen kann. Dies geschieht mit Hilfe von Parsern, die im weiteren Verlauf des Kapitels näher erklärt werden. Parser sind standardisiert und in verschiedenen Programmiersprachen verfügbar. Es sind verschiedene Parser entwickelt worden, die sich u.a. im Laufzeitverhalten unterscheiden. Durch die Standardisierung können sie leicht untereinander ausgetauscht werden.
Eine weitere große Stärke ist aber auch die frei definierbare Elementstruktur eines Dokuments. Dadurch lassen sich beliebige Daten gliedern und sie können in einer lesbaren Textdatei gespeichert werden. Durch das Tagformat wird zusätzlich die Lesbarkeit gesteigert. Wird der Name eines Elements passend zu seinem Inhalt gewählt, kann man beim Lesen mit den Daten die passende Bedeutung assoziieren. Obwohl XML-Dokumente eine komplexe Struktur haben können, sind sie dadurch noch relativ verständlich.


next up previous contents
Nächste Seite: Parser Aufwärts: eXtensible Markup Language Vorherige Seite: Dokumenttypdefinition   Inhalt
Oliver Krone 2003-04-28