next up previous contents
Nächste Seite: Coordinate Section Aufwärts: Das PDB-Format Vorherige Seite: Das PDB-Format   Inhalt


Allgemeiner Aufbau des Formats

Im Allgemeinen werden in dem Format Proteindaten repräsentiert. Die genaue Struktur des Proteins wird zunächst mittels Röntgenuntersuchungen oder durch Spektroskopie ermittelt. Aber gerade mit der Röntgenuntersuchung kann man nicht die komplette Struktur aufdecken, denn Wasserstoffatome lassen sich damit nur schwer erkennen [Ried1990]. Daher werden oft die Wasserstoffatome in einem anschließenden Arbeitsschritt, der als Refinement-Prozeß bezeichnet wird, in die Struktur integriert. Trotzdem kann es vorkommen, daß nicht alle Wasserstoffatome eines Proteins im PDB-Format angegeben werden. Die genaue Beschreibung des Formats ist online abrufbar [PDB2003b]. Dabei fällt sofort ein wesentliches Merkmal des Formates auf: Die Daten werden spaltenorientiert abgelegt, d.h. in jeder Zeile wird in vorher definierten Spalten immer die gleiche Information abgespeichert. Daraus läßt sich schon erahnen, daß das Format auch wesentliche Nachteile mit sich bringt. Zum Einen lassen sich Informationen, für die keine Datenfelder reserviert sind, nicht ablegen. Zwar werden Spalten auch zweckentfremdet, aber dies widerspricht dem eigentlichen Sinn des strengen Dateiaufbaus und führt bei der Interpretation der Daten zu Mißverständnissen. Zum Anderen kann auch die Länge der Datenfelder nicht variiert werden. So sind z.B. in einer Zeile, in der die Daten eines bestimmten Atoms verwaltet werden, nur fünf Spalten für die Atomnummer vorgesehen. Dadurch sind nur Proteine mit weniger als 100.000 Atomen darstellbar. Einige Strukturen haben aber diese Grenze bereits überschritten. Grundsätzlich unterscheidet man in dem Format zwischen 51 Zeilentypen, die durch ein Schlüsselwort zu Anfang der Zeile gekennzeichnet werden. Die Reihenfolge der Zeilen ist fest vorgegeben, wobei einige Zeilen optional sind und nicht in jeder Datei erscheinen. Zeilen, die themenverwandte Inhalte behandeln, sind in Sektionen zusammengefaßt. Jede Datei wird z.B. mit einer Title-Section eingeleitet, in der u.a. der Autor der Datei erwähnt wird. Den größten Anteil einer Datei nimmt jedoch die Beschreibung der einzelnen Atome ein. Dies geschieht in der Coordinate Section, auf die hier besonders eingegegangen werden soll. Eine weitere wichtige Sektion ist die Connectivity Section, in der Bindungen zwischen einzelnen Atomen beschrieben werden. Sie wird ebenfalls genauer betrachtet. Die vollständige Liste aller Sektionen ist in Tabelle 4.1 abgebildet.

Tabelle 4.1: Sektionen des PDB-Formats
Sektionen Beschreibung
Title Zusammenfassende Beschreibung
Remark Anmerkungen
Primary structure Beschreibung der Primärstruktur
Heterogen Beschreibung von Nicht-Standardgruppen
Secondary structure Beschreibung der Sekundärstruktur
Connectivity annotation Anmerkungen zu speziellen chemischen Bindungen
Miscellaneous features Anmerkungen zu verschiedenen Besonderheiten
Crystallographic Beschreibung der kristallografischen Struktur
Coordinate transformation Beschreibung der Koordinatentransformation
Coordinate Beschreibung der einzelnen Atome
Connectivity Beschreibung der chemischen Bindungen
Bookkeeping Abschließende Bemerkungen



next up previous contents
Nächste Seite: Coordinate Section Aufwärts: Das PDB-Format Vorherige Seite: Das PDB-Format   Inhalt
Oliver Krone 2003-04-28