next up previous contents
Nächste Seite: Connectivity Section Aufwärts: Das PDB-Format Vorherige Seite: Allgemeiner Aufbau des Formats   Inhalt


Coordinate Section

In dieser Sektion werden die Daten der einzelnen Atome verwaltet. Im Normalfall wird jedes Atom durch eine eigene Zeile beschrieben. Dies wird entweder durch eine ATOM-Zeile oder einer HETATM-Zeile realisiert. In selteneren Fällen wird ein Atom durch weitere Zeilen genauer erläutert. Dies kann durch die Zeilen ANISOU, SIGUIJ oder SIGATM, in der z.B. Standardabweichungen gespeichert werden, geschehen. Sie müssen direkt nach einer ATOM-Zeile angegeben werden, wodurch die exakte Zugehörigkeit signalisiert wird. Obwohl innerhalb einer ATOM-Zeile die Information gespeichert wird, zu welcher Kette das Atom gehört, wird das Ende einer Kette durch eine eigene Zeile, der TER-Zeile, angezeigt. Da in einer Datei auch mehrere Modelle desselben Proteins angegeben werden können, muß man sie formal voneinander trennen. Dies geschieht mit den Zeilen MODEL und ENDMDL. Erstere kennzeichnet den Anfang und letztere das Ende eines Modells. Zwischen beiden Zeilen werden dann die Informationen der Atome eines Modells gespeichert. Die Bindungsverhältnisse sind für jedes Modell gleich. In Tabelle 4.2 sind nochmals alle Zeilentypen aufgeführt, die in dieser Sektion definiert sind.

Tabelle 4.2: Aufbau der Coordinate Section
Zeilentyp Beschreibung
MODEL Leitet ein neues Proteinmodell ein
ATOM Beschreibt Atome von Standardgruppen
SIGATM Enthält Standardabweichungen des Atoms
ANISOU Enthält den anisotropischen Temperaturfaktor
SIGUIJ Beschreibt die Standardabweichungen des Temperaturfaktors
TER Zeigt das Ende einer Proteinkette an
HETATM Beschreibt Atome von Nicht-Standardgruppen
ENDMDL Schließt ein Proteinmodell ab


Es fällt auf, daß ein Atom durch zwei verschiedene Zeilen beschrieben werden kann. Durch die ATOM-Zeile werden Atome von Standardgruppen beschrieben. Darunter fallen die 20 häufigsten Aminosäuren. Atome anderer Aminosäuren werden durch eine HETATM-Zeile beschrieben. Der Aufbau beider Zeilen ist fast identisch und unterscheidet sich nur durch das Schlüsselwort am Anfang der Zeile.

Beispiel einiger ATOM-Zeilen
    12345678901234567890123456789012345678901234567890123456789012345678901234567890
    HETATM 1499  N   HMI I   1      25.697  59.973  53.918  1.00 12.70           N  
    HETATM 1500  OH  HMI I   1      24.724  58.994  54.017  1.00 11.87           O  
    HETATM 1501  C1  HMI I   1      26.992  59.633  53.901  1.00 13.88           C  
    HETATM 1502  O1  HMI I   1      27.389  58.441  53.948  1.00 12.90           O  
    HETATM 1503  CA  HMI I   1      27.937  60.755  53.438  1.00 14.42           C  
    HETATM 1504  CB  HMI I   1      29.227  60.870  54.309  1.00 14.78           C  
    HETATM 1505  CG  HMI I   1      30.099  62.106  54.126  0.00 14.84           C  
    HETATM 1506  CD1 HMI I   1      29.775  63.073  55.243  0.00 14.91           C  
    HETATM 1507  CD2 HMI I   1      31.553  61.693  54.166  0.00 14.91           C  
    HETATM 1508  C   HMI I   1      28.279  60.497  51.986  1.00 14.95           C  
    HETATM 1509  O   HMI I   1      27.804  61.206  51.098  1.00 14.61           O  
    HETATM 1510  HN  HMI I   1      25.471  60.873  53.524  0.00 20.00           H  
    HETATM 1511  HOH HMI I   1      23.840  59.483  53.964  0.00 20.00           H  
    ATOM   1512  N   ASN I   2      29.089  59.486  51.721  1.00 16.07           N  
    ATOM   1513  CA  ASN I   2      29.443  59.233  50.336  1.00 16.97           C  
    ATOM   1514  C   ASN I   2      28.350  58.408  49.630  1.00 17.75           C  
    ATOM   1515  O   ASN I   2      28.501  58.028  48.459  1.00 17.87           O  
    ATOM   1516  CB  ASN I   2      30.799  58.559  50.213  1.00 16.82           C  
    ATOM   1517  CG  ASN I   2      31.220  58.371  48.754  1.00 17.54           C  
    ATOM   1518  OD1 ASN I   2      31.567  57.266  48.361  1.00 18.37           O  
    ATOM   1519  ND2 ASN I   2      31.230  59.458  47.956  1.00 16.18           N  
    ATOM   1520  H   ASN I   2      29.406  58.921  52.411  0.00 20.00           H  
    ATOM   1521 1HD2 ASN I   2      31.516  59.315  47.030  0.00 20.00           H  
    ATOM   1522 2HD2 ASN I   2      30.987  60.325  48.314  0.00 20.00           H  
Im Quellcode 4.1 sind die zwei verschiedenen Zeilentypen zu sehen. Die wesentlichen Informationen werden in den ersten 54 Spalten angegeben. In den Spalten 7-11 wird dem Atom eine im ganzen Protein eindeutige Nummer zugewiesen. In den Spalten 13-16 wird der Atomname nach der IUPAC-Nomenklatur7 angegeben. Dadurch wird einem Atom ein eindeutiger Name zugewiesen, der jedoch nur innerhalb des Aminosäurerestes, in dem sich das Atom befindet, eindeutig ist. Da ein Protein aus hunderten von Aminosäureresten besteht, läßt sich auch ein Rest nicht eindeutig über seinen Namen, der in den Spalten 18-20 angegeben wird, identifizieren. Erst durch die Nummer in den Spalten 23-26 ist der Rest eindeutig definiert. In Spalte 22 wird die Bezeichnung der Proteinkette angegeben, in der sich das Atom befindet. Die einzelnen Raumkoordinaten sind in den Spalten 31-54 angegeben. Hierdurch ist die genaue Position des Atoms innerhalb des Moleküls festgelegt. Zwei weitere wichtige Angaben findet man in den Spalten 77-78 und 79-80. Hier wird das Elementsymbol und die Ladung des Atoms angegeben. Die Ladung eines Atoms wird jedoch in den seltensten Fällen mit angegeben. In Tabelle 4.3 ist der ganze Aufbau einer ATOM-Zeile nochmals zusammengefaßt.

Tabelle 4.3: Aufbau einer ATOM-Zeile
Spalten Datentyp Feldtyp Beschreibung
1 - 6 Record name ATOM Schlüsselwort der Zeile
7 - 11 Integer serial Fortlaufende Nummer des Atoms
13 - 16 Atom name Name des Atoms
17 Character altLoc Alternativer Positionsbezeichner
18 - 20 Residue name resName Name des Aminosäurerestes
22 Character chainId Bezeichner der Proteinkette
23 - 26 Integer resSeq Sequenznummer der Aminosäure
27 AChar iCode Code zum Einfügen eines Aminosäurerestes
31 - 38 Real(8,3) x X Koordinate in Ångström
39 - 46 Real(8,3) y Y Koordinate in Ångström
47 - 54 Real(8,3) z Z Koordinate in Ångström
55 - 60 Real(6,2) occupancy Belegungsfaktor
61 - 66 Real(6,2) tempFactor Temperaturefaktor
73 - 76 LString(4) segID Segmentbezeichner
77 - 78 LString(2) element Elementsymbol
79 - 80 LString(2) charge Ladung des Atoms


Man kann Dateien aus der Datenbank laden, in denen z.B. die letzten Spalten einer ATOM-Zeile zweckentfremdet werden. In den Spalten 73-76 ist dann der Dateiname und in den Spalten 77-80 die Zeilennummer der Datei angegeben. Die ursprünglichen Daten gehen dadurch natürlich verloren, weshalb auf die Angabe des Elementsymbols und der Ladung kein Verlaß ist. Das Elementsymbol läßt sich aber durch den Atomnamen rekonstruieren. Die ersten beiden Spalten des Atomnamens enthalten in der Regel das Symbol. Hier kann es aber in besonders großen Resten der Aminosäure zu Problemen kommen. Ein Wasserstoffatom mit den Namen HG11 wird so zu einem Quecksilberatom. Die Angabe des Elementsymbols in den Spalten 77-78 ist also sinnvoll.
next up previous contents
Nächste Seite: Connectivity Section Aufwärts: Das PDB-Format Vorherige Seite: Allgemeiner Aufbau des Formats   Inhalt
Oliver Krone 2003-04-28