next up previous contents
Nächste Seite: 2.2 Entstehung Aufwärts: 2 XML Schema Vorherige Seite: 2 XML Schema   Inhalt


2.1 Basis: XML

Die eXtensible Markup Language (XML) wurde 1998 in erster Version vom W3C [W3CXML] als Empfehlung verabschiedet. XML ist eine Metasprache, die es ermöglicht anhand von Auszeichnungen, sogenannten Tags, neue Markup-Sprachen zu definieren. Auf diese Weise definierte Sprachen werden XML-Anwendungen genannt. XML ist aus der Standard Generalized Markup Language (SGML) entstanden. SGML ist bereits 1986 als Metasprache zur Dokumentenbeschreibung [ISO8879] standardisiert worden. Mit SGML werden Vorschriften geliefert, um neue Auszeichnungssprachen zu definieren. 1990 ist aus den Ideen von SGML die erste Version von HTML entstanden und seit der Version 2.0 im Jahr 1995 wird HTML auch durch SGML definiert. Während sich allerdings HTML weit verbreitet hat, wird SGML nur von einem sehr eingeschränkten Benutzerkreis, beispielsweise von Verlagen, verwendet. Das ist insbesondere der hohen Komplexität und einer mehrere hundert Seiten langen Definition von SGML [Hof1998] zu verdanken. Zur Verringerung dieser Komplexität und zur Verkürzung der Definition des Standards ist XML entstanden1. XML ist ebenfalls eine Metasprache, vgl. Abbildung 1. Die wesentlichen Ideen von SGML wurden in XML aufgegriffen und erschwerende Eigenschaften abgeschafft. So verstößt beispielsweise die aus HTML bekannte Möglichkeit Tags wegzulassen, wenn sie aus dem Zusammenhang klar hervorgehen, gegen die Regeln von XML. Das stellt eine Vereinfachung in dem Sinne dar, dass keine Rückschlüsse auf die Struktur eines Dokumentes anhand des Kontextes gemacht werden müssen. Dadurch wird besonders die Entwicklung von Anwendungsprogrammen erleichtert. Dokumente, die gültige XML-Dokumente liefern, sind somit auch automatisch gültige SGML-Dokumente. XML stellt also eine vereinfachte Teilmenge von SGML dar, mit der Ausnahme, dass die bei SGML geforderte Angabe einer Document Type Definition (DTD) in XML-Dokumenten vernachlässigt werden kann, vgl. [Bry2001, Kapitel 4.1.1]. XML-Dokumente, die keine DTD angeben, sind somit keine gültigen SGML-Dokumente. Ansonsten ist XML aufwärtskompatibel zu SGML. Zur weiteren Unterscheidung vgl. [Cla1997]. Aus dieser Entwicklung stammt die optische Ähnlichkeit von HTML- und XML-Dokumenten, die sich in der Auszeichnung anhand von Tags ausdrückt.

Abbildung 1: Einordnung von XML
\includegraphics[scale=0.60]{bilder/XMLEntstehung}

Der Zweck, mit XML eine Metasprache zu entwickeln, die sich einer hohen Benutzung erfreut, ist gelungen. Schon heute werden zahlreiche XML-Anwendungen, beispielsweise XHTML, SVG, MathML und XSLT, definiert und benutzt. In [Zap2002] wird eine große Anzahl von XML-Anwendungen nach Einsatzgebieten sortiert dargestellt, wobei sich die Liste kontinuierlich verlängert. In XML werden strukturierte Informationen beschrieben, die mit Tags ausgezeichnet werden. Derartige Dokumente müssen die von XML aufgestellten Grundregeln befolgen. Erfüllt ein XML-Dokument die folgenden acht Regeln, so gilt es als well formed (wohlgeformt), vgl. [Har2000a, S.179 ff.]:
  1. Der Anfang des Dokumentes startet mit einer XML-Deklaration:
    <?xml version="1.0"?>
    
  2. Zu jedem öffnenden Tag gibt es ein schließendes Tag:
    <TAG> inhalt </TAG>
    
  3. Leere Elemente können in der folgenden Kurzform notiert sein:
    <LEERES_ELEMENT/>
    
    Diese Notation ist gleichbedeutend mit:
    <LEERES_ELEMENT></LEERES_ELEMENT>
    
  4. Das Wurzelelement des Dokumentes muss alle anderen Elemente enthalten.
  5. Elemente können ineinander verschachtelt, dürfen aber nicht verzahnt sein:
    richtig ist:

    <ELEMENT1><ELEMENT2></ELEMENT2></ELEMENT1>
    
    falsch ist:

    <ELEMENT1><ELEMENT2></ELEMENT1></ELEMENT2>
    
  6. Alle Attribute müssen in Anführungszeichen stehen.
  7. Die Zeichen < und & sind geschützte Zeichen und dürfen nur für den Beginn von Tags bzw. Entity2-Referenzen eingesetzt werden.
  8. Es dürfen nur die vordefinierten Entity-Referenzen &amp;, &apos;, &lt;, &gt;, &quot; benutzt werden.
Basierend auf diesen Grundlagen sind mittlerweile zahlreiche XML-Anwendungen entstanden. Die für die weitere Arbeit entscheidenen Anwendungen, werden in den folgenden Kapiteln ausführlich behandelt.
next up previous contents
Nächste Seite: 2.2 Entstehung Aufwärts: 2 XML Schema Vorherige Seite: 2 XML Schema   Inhalt
Tanja Schniederberend 2003-06-11