2 Imperative Sprachkonzepte
»Wenn ich eine Oper hundertmal dirigiert habe, dann ist es Zeit, sie wieder zu lernen.«
– Arturo Toscanini (1867–1957)
Ein Programm in Java wird nicht umgangssprachlich beschrieben, sondern ein Regelwerk und eine Grammatik definieren die Syntax und die Semantik. In den nächsten Abschnitten werden wir kleinere Beispiele für Java-Programme kennenlernen, und dann ist der Weg frei für größere Programme.
2.1 Elemente der Programmiersprache Java

Wir wollen im Folgenden über das Regelwerk, die Grammatik und die Syntax der Programmiersprache Java sprechen und uns unter anderem über die Unicode-Kodierung, Tokens sowie Bezeichner Gedanken machen. Bei der Benennung einer Methode zum Beispiel dürfen wir aus einer großen Anzahl Zeichen wählen; der Zeichenvorrat nennt sich Lexikalik.
Die Syntax eines Java-Programms definiert die Tokens und bildet so das Vokabular. Richtig geschriebene Programme müssen aber dennoch nicht korrekt sein. Unter dem Begriff Semantik fassen wir daher die Bedeutung eines syntaktisch korrekten Programms zusammen. Die Semantik bestimmt, was das Programm macht. Die Abstraktionsreihenfolge ist also Lexikalik, Syntax und Semantik. Der Compiler durchläuft diese Schritte, bevor er den Bytecode erzeugen kann.
2.1.1 Token

Ein Token ist eine lexikalische Einheit, die dem Compiler die Bausteine des Programms liefert. Der Compiler erkennt an der Grammatik einer Sprache, welche Folgen von Zeichen ein Token bilden. Für Bezeichner heißt dies beispielsweise: »Nimm die nächsten Zeichen, solange auf einen Buchstaben nur Buchstaben oder Ziffern folgen.« Eine Zahl wie 1982 bildet zum Beispiel ein Token durch folgende Regel: »Lies so lange Ziffern, bis keine Ziffer mehr folgt.« Bei Kommentaren bilden die Kombinationen /* und */ ein Token.[48](Das ist in C(++) unglücklich, denn so wird ein Ausdruck *s/*t nicht wie erwartet geparst. Erst ein Leerzeichen zwischen dem Geteiltzeichen und dem Stern »hilft« dem Parser, die gewünschte Division zu erkennen.)
Whitespace
Problematisch wird es in einer Sprache immer dann, wenn der Compiler die Tokens nicht voneinander unterscheiden kann. Daher fügen wir Trennzeichen (engl. whitespace) ein, die auch Wortzwischenräume genannt werden. Zu den Trennern zählen Leerzeichen, Tabulatoren, Zeilenvorschub- und Seitenvorschubzeichen. Außer als Trennzeichen haben diese Zeichen keine Bedeutung. Daher können sie in beliebiger Anzahl zwischen die Tokens gesetzt werden. Das heißt auch, beliebig viele Leerzeichen sind zwischen Tokens gültig. Und da wir damit nicht geizen müssen, können sie einen Programmabschnitt enorm verdeutlichen. Programme sind besser lesbar, wenn sie luftig formatiert sind.
Folgendes ist alles andere als gut zu lesen, obwohl der Compiler es akzeptiert:
class _{static long _
(long __,long ___) {
return __==0 ?___+ 1:
___==0?_(__-1,1):_(__
-1,_(__, ___-1)) ; }
static {int _=2 ,___
= 2;System.out.print(
"a("+_+','+___+ ")="+
_ (_, ___) ) ;System
.exit(1);}}//(C) Ulli
Neben den Trennern gibt es noch 9 Zeichen, die als Separator definiert werden:
; , . ( ) { } [ ]
2.1.2 Textkodierung durch Unicode-Zeichen

Java kodiert Texte durch Unicode-Zeichen. Jedem Zeichen ist ein eindeutiger Zahlenwert (engl. code point) zugewiesen, sodass zum Beispiel das große A an Position 65 liegt. Der Unicode-Zeichensatz beinhaltet die ISO-US-ASCII-Zeichen[49](http://en.wikipedia.org/wiki/ASCII) von 0 bis 127 (hexadezimal 0x00 bis 0x7f, also 7 Bit) und die erweiterte Kodierung nach ISO 8859-1 (Latin-1), die Zeichen von 128 bis 255 hinzunimmt. Mehr Details zu Unicode liefert Kapitel 4, »Der Umgang mit Zeichenketten«.
2.1.3 Bezeichner

Für Variablen (und damit Konstanten), Methoden, Klassen und Schnittstellen werden Bezeichner vergeben – auch Identifizierer (von engl. identifier) genannt –, die die entsprechenden Bausteine anschließend im Programm identifizieren. Unter Variablen sind dann Daten verfügbar. Methoden sind die Unterprogramme in objektorientierten Programmiersprachen, und Klassen sind die Bausteine objektorientierter Programme.
Ein Bezeichner ist eine Folge von Zeichen, die fast beliebig lang sein kann (die Länge ist nur theoretisch festgelegt). Die Zeichen sind Elemente aus dem Unicode-Zeichensatz, und jedes Zeichen ist für die Identifikation wichtig.[50](Die Java-Methoden Character.isJavaIdentifierStart()/isJavaIdentiferPart() stellen auch fest, ob Zeichen Java-Identifier sind.) Das heißt, ein Bezeichner, der 100 Zeichen lang ist, muss auch immer mit allen 100 Zeichen korrekt angegeben werden. Manche C- und FORTRAN-Compiler sind in dieser Hinsicht etwas großzügiger und bewerten nur die ersten Stellen.
Beispiel |
Im folgenden Java-Programm sind die Bezeichner fett und unterstrichen gesetzt. class Application |
Aufbau der Bezeichner
Jeder Java-Bezeichner ist eine Folge aus Java-Buchstaben und Java-Ziffern,[51](Ob ein Zeichen ein Buchstabe ist, stellt die statische Methode Character.isLetter() fest; ob er ein gültiger Bezeichner-Buchstabe ist, sagen die Funktionen isJavaIdentifierStart() für den Startbuchstaben und isJavaIdentifierPart() für den Rest.) wobei der Bezeichner mit einem Java-Buchstaben beginnen muss. Ein Java-Buchstabe umfasst nicht nur unsere lateinischen Buchstaben aus dem Bereich »A« bis »Z« (auch »a« bis »z«), sondern auch viele weitere Zeichen aus dem Unicode-Alphabet, etwa den Unterstrich, Währungszeichen – wie die Zeichen für Dollar ($), Euro (€), Yen (¥) – oder griechische Buchstaben. Auch wenn damit viele wilde Zeichen als Bezeichner-Buchstaben grundsätzlich möglich sind, sollte doch die Programmierung mit englischen Bezeichnernamen erfolgen. Es ist noch einmal zu betonen, dass Java streng zwischen Groß- und Kleinschreibung unterscheidet.
Die folgende Tabelle listet einige gültige Bezeichner auf:
Gültige Bezeichner | Grund |
Mami | Mami besteht nur aus Alphazeichen und ist daher korrekt. |
__RAPHAEL_IST_LIEB__ | Unterstriche sind erlaubt. |
bóo-lêáñ | Ist korrekt, auch wenn es Akzente enthält. |
α | Das griechische Alpha ist ein gültiger Java-Buchstabe. |
REZE$$SION | Das Dollar-Zeichen ist ein gültiger Java-Buchstabe. |
¥€$ | Tatsächlich auch gültige Java-Buchstaben |
Ungültige Bezeichner dagegen sind:
Ungültige Bezeichner | Grund |
2und2macht4 | Das erste Symbol muss ein Java-Buchstabe sein und keine Ziffer. |
hose gewaschen | Leerzeichen sind in Bezeichnern nicht erlaubt. |
Faster! | Das Ausrufezeichen ist, wie viele Sonderzeichen, ungültig. |
null, class | Der Name ist schon von Java belegt. Null – Groß-/Kleinschreibung ist relevant – oder cláss wären möglich. |
2.1.4 Literale

Ein Literal ist ein konstanter Ausdruck. Es gibt verschiedene Typen von Literalen:
- die Wahrheitswerte true und false
- integrale Literale für Zahlen, etwa 122
- Zeichenliterale, etwa 'X' oder '\n'
- Fließkommaliterale, etwa 12.567 oder 9.999E-2
- Stringliterale für Zeichenketten, wie "Paolo Pinkas"
- null steht für einen besonderen Referenztyp.
Beispiel |
Im folgenden Java-Programm sind die beiden Literale fett und unterstrichen gesetzt. class Application |
2.1.5 Reservierte Schlüsselwörter

Bestimmte Wörter sind als Bezeichner nicht zulässig, da sie als Schlüsselwörter vom Compiler besonders behandelt werden. Schlüsselwörter bestimmen die »Sprache« eines Compilers.
Beispiel |
Reservierte Schlüsselwörter sind im Folgenden fett und unterstrichen gesetzt. class Application |
Schlüsselwörter und Literale in Java
Nachfolgende Zeichenfolgen sind Schlüsselwörter (beziehungsweise Literale im Fall von true, false und null)[52](Siehe dazu Abschnitt 3.9, »Keywords«, der Sprachdefinition unter http://java.sun.com/docs/ books/jls/third_edition/html/lexical.html#3.9.) und sind in Java daher nicht als Bezeichnernamen möglich.
abstract | continue | for | new | switch |
assert | default | goto† | package | synchronized |
boolean | do | if | private | this |
break | double | implements | protected | throw |
byte | else | import | public | throws |
case | enum | instanceof | return | transient |
catch | extends | int | short | try |
char | final | interface | static | void |
class | finally | long | strictfp | volatile |
const† | float | native | super | while |
Obwohl die mit † gekennzeichneten Wörter zurzeit nicht von Java benutzt werden, können doch keine Variablen dieses Namens deklariert werden.
2.1.6 Zusammenfassung der lexikalischen Analyse

Übersetzt der Compiler Java-Programme, so beginnt er mit der lexikalischen Untersuchung des Quellcodes. Wir haben dabei die zentralen Elemente schon kennengelernt, und diese sollen hier noch einmal zusammengefasst werden. Nehmen wir dazu das folgende einfache Programm:
class Application
{
public static void main( String[] args )
{
String text = "Hallo Welt " + 21;
System.out.println( text );
}
}
Der Compiler überliest alle Kommentare, und die Trennzeichen bringen den Compiler von Token zu Token. Folgende Tokens lassen sich im Programm ausmachen:
Token-Typ | Beispiel | Erklärung |
Bezeichner | Application, main, args, text, System, out, println | Namen für Klasse, Variable, Methode, ... |
Schlüsselwort | class, public, static, void | Reservierte Wörter |
Literal | "Hallo Welt", 21 | Konstante Werte, wie Strings, Zahlen, ... |
Operator | =, + | Operator für Zuweisungen, Berechnungen, ... |
Trennzeichen | (, ), {, }, ; | Symbole, die neben dem Trennzeichen die Tokens trennen |
2.1.7 Kommentare

Programmieren heißt nicht nur, einen korrekten Algorithmus in einer Sprache auszudrücken, sondern auch, unsere Gedanken verständlich zu formulieren. Dies geschieht beispielsweise durch eine sinnvolle Namensgebung für Programmobjekte wie Klassen, Methoden und Variablen. Ein selbsterklärender Klassenname hilft den Entwicklern erheblich. Doch die Lösungsidee und der Algorithmus werden auch durch die schönsten Variablennamen nicht zwingend klarer. Damit Außenstehende (und nach Monaten wir selbst) unsere Lösungsidee schnell nachvollziehen und später das Programm erweitern oder abändern können, werden Kommentare in den Quelltext geschrieben. Sie dienen nur den Lesern der Programme, haben aber auf die Abarbeitung keine Auswirkungen.
Unterschiedliche Kommentartypen
In Java gibt es zum Formulieren von Kommentaren drei Möglichkeiten:
- Zeilenkommentare: Sie beginnen mit zwei Schrägstrichen[53](In C++ haben die Entwickler übrigens das Zeilenkommentarzeichen // aus der Vor-Vorgängersprache BCPL wieder eingeführt, das in C entfernt wurde.) // und kommentieren den Rest einer Zeile aus. Der Kommentar gilt von diesen Zeichen an bis zum Ende der Zeile, also bis zum Zeilenumbruchzeichen.
- Blockkommentare: Sie kommentieren in /* */ Abschnitte aus. Der Text im Blockkommentar darf selbst kein */ enthalten, denn Blockkommentare dürfen nicht verschachtelt sein.
- JavaDoc-Kommentare: Das sind besondere Blockkommentare, die JavaDoc-Kommentare mit /** */ enthalten. Ein JavaDoc-Kommentar beschreibt etwa die Methode oder die Parameter, aus denen sich später die API-Dokumentation generieren lässt.
Schauen wir uns ein Beispiel an, in dem alle drei Kommentartypen vorkommen:
/*
* Der Quellcode ist public domain.
*/
// Magic. Do not touch.
/**
* @author Christian Ullenboom
*/
class DoYouHaveAnyCommentsToMake // TODO: Umbenennen
{
// When I wrote this, only God and I understood what I was doing
// Now, God only knows
public static void main( String[] args /* Kommandozeilenargument */ )
{
}
}
Für den Compiler sieht die Klasse mit den Kommentaren genauso aus wie ohne, also wie class DoYouHaveAnyCommentsToMake { }. Im Bytecode steht exakt das Gleiche – alle Kommentare werden vom Compiler verworfen.
Kommentare mit Stil
Alle Kommentare und Bemerkungen sollten in Englisch verfasst werden, um Projektmitgliedern aus anderen Ländern das Lesen zu erleichtern. Für allgemeine Kommentare sollten wir die Zeichen // benutzen. Sie haben zwei Vorteile:
- Bei Editoren, die Kommentare nicht farbig hervorheben, oder bei einer einfachen Quellcodeausgabe auf der Kommandozeile lässt sich ersehen, dass eine Zeile, die mit // beginnt, ein Kommentar ist. Den Überblick über einen Quelltext zu behalten, der für mehrere Seiten mit den Kommentarzeichen /* und */ unterbrochen wird, ist schwierig. Zeilenkommentare machen deutlich, wo Kommentare beginnen und wo sie enden.
- Der Einsatz der Zeilenkommentare eignet sich besser dazu, während der Entwicklungs- und Debug-Phase Codeblöcke auszukommentieren. Benutzen wir zur Programmdokumentation die Blockkommentare, so sind wir eingeschränkt, denn Kommentare dieser Form können wir nicht verschachteln. Zeilenkommentare können einfacher geschachtelt werden.
Die Tastenkombination +
– oder
+
, was das Kommentarzeichen »/« noch deutlicher macht – kommentiert eine Zeile aus.
Eclipse setzt dann vor die Zeile die Kommentarzeichen //. Sind mehrere Zeilen selektiert, kommentiert die Tastenkombination alle markierten
Zeilen mit Zeilenkommentaren aus. In einer kommentierten Zeile nimmt ein erneutes
+
die Kommentare einer Zeile wieder zurück.
+
+
in kommentiert eine Zeile bzw. einen Block in NetBeans ein und aus.
Ihr Kommentar
Wie hat Ihnen das <openbook> gefallen? Wir freuen uns immer über Ihre freundlichen und kritischen Rückmeldungen.