next up previous contents
Nächste Seite: Klassenübersicht Aufwärts: Diplomarbeit Vorherige Seite: Anwendung   Inhalt


Resumée und Ausblick

Mit dieser Diplomarbeit wurde die Konvertierung von spezielllen Proteindaten in eine webfähige 3D-Beschreibungssprache realisiert. Die Konvertierung selber verläuft dabei in zwei Schritten. Im ersten Schritt werden die Proteindaten, die im PDB-Format beschrieben sind, in die chemische Beschreibungssprache CML umgewandelt. CML ist eine XML-Anwendung, mit der beliebige chemische Daten beschrieben werden können. Die Bindungen zwischen den Atomen sind in einer PDB-Datei fast nie aufgeführt, so daß sie während dieses Schrittes berechnet werden müssen. Die Wertigkeit einer Bindung kann dabei aber nicht bestimmt werden, so daß nur die Längenangabe zur Beschreibung des Bindungscharakters zur Verfügung steht.
Die Grundlage zur Bindungsberechnung sind die kovalenten Radien der Atome, die bei der Konvertierung angegeben werden müssen. Da jedoch für die meisten Atome keine eindeutigen Werte existieren, werden die Informationen dynamisch verarbeitet. Dadurch können Änderungen an den vorgegebenen Werten vorgenommen werden, womit auch Einfluß auf die Berechnung der Bindungen genommen werden kann.
CML soll auch weiteren chemischen Beschreibungssprachen als Schnittstelle dienen, so daß nicht für jedes Format eine eigene Konvertierung in ein 3D-Format implementiert werden muß. Dementsprechend wurde bei Implementierung des Konverters auf die Erweiterbarkeit geachtet. Im zweiten Schritt wird aus der CML-Datei eine dreidimensionale Szene erzeugt. Die neue 3D-Beschreibungssprache X3D ist für die Visualisierung der dreidimensionalen Szenen vorgesehen. X3D wurde jedoch noch nicht als Industriestandard verabschiedet. Da mittlerweile der letzte Entwurf der Spezifikation an die der International Organization for Standardization zur Review übergeben wurde, scheint die endgültige Beschreibung der Sprache festzustehen. Da mit X3D der neueste Stand der Technik verwendet wurde, sind zur Zeit noch keine Browser für X3D erhältlich, was sich allerdings mit der Verabschiedung zum Industriestandard schnell ändern sollte. Eine Konvertierung zum X3D-Vorgänger VRML wurde deshalb ebenfalls implementiert. Die einzelnen Schritte wurden in der plattformunabhängigen Sprache Java implementiert, wodurch die Programme auf nahezu jedem Betriebssystem ausgeführt werden können. Benötigt wird lediglich das Java Runtime Environment von Sun in der Version 1.4.0 oder höher. Zur Visualisierung der dreidimensionalen Szene wird ein entsprechendes Browser-Plug-In benötigt. Da X3D Plug-Ins bislang noch nicht erhältlich sind, ist die Visualisierung zur Zeit nur in VRML möglich. Beide Konvertierungsschritte wurden auf zwei unterschiedlichen Rechnern, auf denen das Betriebssystem Linux installiert ist, getestet. Der eine Rechner arbeitet mit einem AMD-K6 Prozessor mit einer Leistung von 366 Mhz und 64 MB Arbeitsspeicher. Die Konvertierung einer 94 KB großen PDB-Datei nach CML dauerte im Schnitt 6.3 Sekunden. Die anschließende Konvertierung nach VRML nimmt 5.5 Sekunden in Anspruch. Auf einem Rechner, der einen Celeron Prozessor mit 1.7 Ghz Leistung und 256 MB Arbeitsspeicher besitzt, dauern die Konvertierungen 2.8 bzw. 2.4 Sekunden. Die generierte Szene wird durch eine XML-Datei, die während der Konvertierung angegeben werden muß, konfiguriert. Darin wird u.a. festgelegt, mit welchem Farbwert ein Atom dargestellt wird. Zusätzlich kann der Farbwert für eine Einfach- bzw. Doppelbindung festgelegt werden. Der endgültige Farbwert einer Bindung wird anhand der Länge und dem daraus resultierendem Charakter der Bindung festgelegt. Da die Wertigkeit einer Bindung nicht in der CML-Datei abgelegt ist und jede Bindung von der Form her gleich dargestellt wird, spiegelt so der Farbwert den Bindungscharakter der Bindung wider. Dadurch können Einfachbindungen von Doppelbindungen in der Szene unterschieden werden.
Durch die verschiedenen Größenfaktoren kann zusätzlich die Darstellungsform verändert werden, wodurch Darstellungsarten wie Spacefill, Wireframe oder Ball and Stick generiert werden können. Mit einer separaten Konvertierung kann ebenfalls die Darstellungsart Backbone erzeugt werden. Über ein Hilfe-Fenster können bestimmte Informationen zu einem Objekt angezeigt werden. Bei einer Bindung wird z.B. die Länge angezeigt. Liegt der Farbwert einer Bindung zwischen denen einer Einfach- oder Doppelbindung, kann so die genaue Länge der Bindung Aufschluß über den Charakter der Bindung geben. Bei Atomen werden u.a. die einzelnen Koordinaten angezeigt. Des Weiteren können zu jedem Atom elementspezifische Informationen, wie z.B. der EN-Wert, angezeigt werden. Zusätzlich ist eine Webapplikation erstellt worden, bei der ein User eine PDB-Datei von seinem Dateisystem auf den Server laden und sich nach der Konvertierung direkt in einer 3D-Szene anzeigen lassen kann. Dadurch ist eine online Umwandlung möglich, bei der über eine Oberfläche die dreidimensionale Szene konfiguriert werden kann. Durch die Konfigurierbarkeit der 3D-Szene lassen sich, wie bereits erwähnt, verschiedene Darstellungsarten, wie z.B. Spacefill, Wireframe oder Backbone, erzeugen. Eine weitere spezifische Darstellungsform für Proteine ist z.B. Ribbon. Mit ihr wird ein Protein durch Bänder dargestellt, die ähnlich zu Backbone angeordnet werden. Denkbar wäre also, die Visualisierung um weitere spezifische Darstellungsformen zu erweitern. Auch bei den bisherigen Darstellungsformen kann noch genauer auf die Proteinstruktur eingegangen werden. Die Bindungen werden innerhalb eines Aminosäurerestes und zum jeweils nächsten Rest in der Proteinkette berechnet. Eine besondere Rolle spielen aber auch die Anziehungskräfte zwischen den verschiedenen Seitenketten der Aminosäurereste. Diese können zwischen beliebigen Aminosäureresten des Proteins auftreten, wobei insbesondere Wasserstoff- oder Disulfid-Brücken entstehen können. Eine Darstellung dieser Bindungen kann daher ebenfalls sinnvoll sein. Mit der bisherigen Visualisierung ist ist es möglich, Proteindaten im PDB-Format darzustellen. Eine naheliegende Erweiterungsmöglichkeit ist die Visualisierung weiterer chemische Formate, wie z.B. MOL. Dies wurde bereits bei der Implementierung des Konverters berücksichtigt, so daß eine Erweiterung einfach zu realisieren ist. Da die Konvertierung in zwei Schritten verläuft, muß lediglich die Konvertierung in das CML-Format programmiert werden.
next up previous contents
Nächste Seite: Klassenübersicht Aufwärts: Diplomarbeit Vorherige Seite: Anwendung   Inhalt
Oliver Krone 2003-04-28