next up previous contents
Nächste Seite: Chemical Markup Language Aufwärts: Das PDB-Format Vorherige Seite: Coordinate Section   Inhalt


Connectivity Section

In der zuvor beschriebenen Coordinate Section werden die einzelnen Atome abgelegt und man kann sich fragen warum man dort zwischen Standard und Nicht-Standardgruppen unterscheidet. Der Grund dafür liegt in der unterschiedlichen Behandlung der Bindungen innerhalb dieser Gruppen. Man geht davon aus, daß Standardgruppen so bekannt sind, daß man deren Struktur als bekannt voraussetzt. Die Bindungverhältnisse in solch einer Gruppe sind immer gleich und würden sich in der Datei stets wiederholen. Und da ein Protein hauptsächlich aus diesen Aminosäuren besteht, verkleinert man somit den Inhalt einer Datei erheblich. Anders verhält es sich bei Atomen von Nicht-Standardgruppen. Hier muß man die einzelnen Bindungen einer Gruppe explizit angegeben, um keine Mißverständnisse bei der Struktur zu erzeugen. Realisiert wird das in der Connectivity Section mit der CONECT-Zeile. Wie jede Zeile wird sie durch ein Schlüsselwort eingeleitet, hier CONECT. Die darauffolgenden Einträge sind Atomnummern, die zuvor durch entsprechende Atome definiert werden müssen. Die erste Atomnummer stellt das zu betrachtende Atom dar, womit die restlichen Atome, repräsentiert durch ihre Nummer, eine Bindung eingehen. Die ersten vier Datenfelder werden dabei benutzt, um normale Bindungen zu beschreiben. Die restlichen Einträge beschreiben die selteneren Bindungsarten, wie z.B. Wasserstoffbrücken, und müssen in einer gesonderten Zeile spezifiziert werden. Der genaue Zeilenaufbau ist in Tabelle 4.4 zu sehen.

Tabelle 4.4: Aufbau einer CONECT-Zeile
Spalten Datentyp Feldtyp Beschreibung
1 - 6 Record name CONECT Schlüsselwort der Zeile
7 - 11 Integer serial fortlaufende Nummer des Atoms
12 - 16 Integer serial  
17 - 21 Integer serial fortlaufende Nummer des
22 - 26 Integer serial gebundenen Atoms
27 - 31 Integer serial  
32 - 36 Integer serial fortlaufende Nummer des über
37 - 41 Integer serial Wasserstoffbrücken gebundenen Atoms
42 - 46 Integer serial fortlaufende Nummer des über
      Salzbrücken gebundenen Atoms
47 - 51 Integer serial fortlaufende Nummer des über
52 - 56 Integer serial Wasserstoffbrücken gebundenen Atoms
57 - 61 Integer serial fortlaufende Nummer des über
      Salzbrücken gebundenen Atoms


Zum besseren Verständnis sind einige CONECT-Zeilen im Quellcode 4.2 abgebildet. Sie werden nach der ersten Atomnummer in steigender Reihenfolge sortiert. Auch die Atomnummern innerhalb einer Zeile sind aufsteigend sortiert. So geht das Atom mit der Nummer 1531 drei Bindungen ein, u.a. zu dem Atom mit der Nummer 1532. In der nachfolgenden Zeile werden die Bindungen des Atoms 1532 aufgelistet. Hier wird nochmals die Bindung zum Atom 1531 aufgeführt. Eine Bindung wird also doppelt in einer Datei abgelegt. Geht ein Atom so viele Bindungen ein, daß sie nicht in einer Zeile verwaltet werden können, wird eine neue Zeile angelegt, wie im Beispiel beim Atom mit der Nummer 1537 zu sehen ist.

Beispiel einiger CONECT-Zeilen
CONECT 1530 1527 1529                                                           
CONECT 1531 1529 1532 1533                                                      
CONECT 1532 1531                                                                
CONECT 1533 1531                                                                
CONECT 1534 1523                                                                
CONECT 1536  535  828  842  855                                                 
CONECT 1537  708  714  726  895                                                 
CONECT 1537  921                                                                
CONECT 1538  647  662  772  870                                                 
CONECT 1539 1086 1125 1174 1500                                                 
CONECT 1539 1502    

Diese Art Bindungen zu speichern, ist recht intuitiv, läßt aber einige Wünsche offen. Ein wesentlicher Nachteil des Formats ist, daß die Wertigkeit einer Bindung nicht angegeben ist. Zwischen Einfach- und Doppelbindung kann man also nicht unterscheiden. In einigen Fällen nutzen Chemiker aber das doppelte Abspeichern einer Bindung, um diesen Nachteil zu umgehen. Vereinbart man das eine Einfachbindung nur einmal abgelegt wird, so kann man wenigstens zwischen Doppel- und Einfachbindungen unterscheiden. Die so erzeugte Datei entspricht dann aber nicht mehr dem strengen Dateiaufbau.
Zusätzliche Informationen zu einer Bindung, wie die Bindungslänge, können ebenfalls nicht abgelegt werden. Sie läßt sich zwar aus den Raumkoordinaten berechnen, ist aber nicht direkt in der Datei verfügbar.


next up previous contents
Nächste Seite: Chemical Markup Language Aufwärts: Das PDB-Format Vorherige Seite: Coordinate Section   Inhalt
Oliver Krone 2003-04-28