18.2 Fließkommaarithmetik in Java
Zahlen mit einem Komma nennen sich Gleitkomma-, Fließkomma-, Fließpunkt- oder Bruchzahlen (gebrochene Zahlen). Der Begriff »Gleitkommazahl« kommt daher, dass die Zahl durch das Gleiten (Verschieben) des Dezimalpunkts als Produkt aus einer Zahl und einer Potenz der Zahl 10 dargestellt wird (also 1,23 = 123 * 10–2).
Java unterstützt für Fließkommazahlen die Typen float und double, die sich nach der Spezifikation IEEE 754 richten. Diesen Standard des Institute of Electrical and Electronics Engineers gibt es seit Mitte der 1980er-Jahre. Ein float hat die Länge von 32 Bit und ein double die Länge von 64 Bit. Die Rechenoperationen sind im IEEE Standard for Floating-Point Arithmetic definiert.
Hinweis |
Wir sollten uns bewusst sein, dass die Genauigkeit von float wirklich nicht so toll ist. Schnell beginnt die Ungenauigkeit zuzuschlagen: System.out.println( 2345678.88f ); // 2345679.0 |
18.2.1 Spezialwerte für Unendlich, Null, NaN

Die Datentypen double und float können nicht nur »Standardzahlen« speichern. Java definiert Sonderwerte für eine positive oder negative Null, positives und negatives Unendlich (engl. infinity) und NaN, die Abkürzung für Not a Number.
Unendlich
Der Überlauf führt zu einem positiven oder negativen Unendlich.
Beispiel |
Multiplikation zweier wirklich großer Werte: System.out.println( 1E300 * 1E20 ); // Infinity |
Für die Werte deklariert die Java-Bibliothek in Double und Float zwei Konstanten; zusammen mit der größten und kleinsten darstellbaren Fließkommazahl sind das:
Wert für | Float | Double |
positiv unendlich | Float.POSITIVE_INFINITY | Double.POSITIVE_INFINITY |
negativ unendlich | Float.NEGATIVE_INFINITY | Double.NEGATIVE_INFINITY |
kleinster Wert | Float.MIN_VALUE | Double.MIN_VALUE |
größter Wert | Float.MAX_VALUE | Double.MAX_VALUE |
Das Minimum für double-Werte liegt bei etwa 10^–324 und das Maximum bei etwa 10^308. Weiterhin deklarieren Double und Float Konstanten für MAX_EXPONENT/MIN_EXPONENT.
Hinweis |
Die Anzeige des Über-/Unterlaufs und des undefinierten Ergebnisses gibt es nur bei Fließkommazahlen, nicht aber bei Ganzzahlen. |
Positive, negative Null
Es gibt eine positive Null (+0,0) und eine negative Null (–0,0), die etwa beim Unterlauf auftauchen.
Beispiel |
Der Unterlauf erzeugt: System.out.println( 1E-322 * 0.0001 ); // 0.0 |
Für den Vergleichsoperator == ist die positive Null gleich der negativen Null, sodass 0.0 == –0.0 das Ergebnis true ergibt. Damit ist auch 0.0 > –0.0 falsch. Die Bitmaske ist jedoch unterscheidbar, was der Vergleich Double.doubleToLongBits(+0.0) != Double.doubleToLongBits(?0.0) zeigt.
Es gibt einen weiteren kleinen Unterschied, den die Rechnung 1.0 / ?0.0 und 1.0 / 0.0 zeigt. Durch den Grenzwert geht das Ergebnis einmal gegen negativ unendlich und einmal gegen positiv unendlich.
NaN
NaN wird als Fehlerindikator für das Ergebnis von undefinierten Rechenoperationen benutzt, etwa 0/0.
Beispiel |
Erzeuge NaN durch den Versuch, die Wurzel einer negativen Zahl zu bilden, und durch eine Nullkommanix-Division: System.out.println( Math.sqrt(-4) ); // NaN |
NaN ist als Konstante in den Klassen Double und Float deklariert. Die statische Methode isNaN() testet, ob eine Zahl NaN ist. Die API-Dokumentation am Beispiel von Double sieht so aus:
public final class java.lang.Double |
- public static final double NaN = 0.0 / 0.0;
Deklaration von NaN bei Double. - boolean isNaN()
Liefert true, wenn das aktuelle Double-Objekt NaN ist. - public static boolean isNaN(double v)
Liefert true, wenn die übergebene Zahl v NaN ist.
Die Implementierung von isNan(double v) ist einfach: return v != v.
Alles hat seine Ordnung *
Außer für den Wert NaN ist auf allen Fließkommazahlen eine totale Ordnung definiert. Das heißt, sie lassen sich von der kleinsten Zahl bis zur größten aufzählen. Am Rand steht die negative Unendlichkeit, dann folgen die negativen Zahlen, negative Null, positive Null, positive Zahlen und positives Unendlich. Bleibt nur noch die einzige unsortierte Zahl NaN. Alle numerischen Vergleiche <, <=, >, >= mit der Java-NaN liefern false. Der Vergleich mit == ist false, wenn einer der Operanden NaN ist. != verhält sich umgekehrt, ist also true, wenn einer der Operanden NaN ist.
Beispiel |
NaN beim Gleichheitstest: System.out.println( Double.NaN == Double.NaN ); // false while ( d == d ) {} |
Ein NaN-Wert auf eine Ganzzahl angepasst, also etwa (int) Double.NaN, ergibt 0.
Stille NaNs *
Eine Problematik in der Fließkomma-Arithmetik ist, dass keine Ausnahmen die Fehler anzeigen; NaNs solcher Art heißen auch stille NaNs (engl. Quiet NaNs [qNaNs]). Als Entwickler müssen wir also immer selbst schauen, ob das Ergebnis während einer Berechnung korrekt bleibt. Ein durchschnittlicher numerischer Prozessor unterscheidet ein qNaN und ein signaling NaN (sNaN).
18.2.2 Standard-Notation und wissenschaftliche Notation bei Fließkommazahlen *

Zur Darstellung der Fließkommaliterale gibt es zwei Notationen: Standard und wissenschaftlich. Die wissenschaftliche Notation ist eine Erweiterung der Standardnotation. Bei ihr folgt hinter den Nachkommastellen ein »E« (oder »e«) mit einem Exponenten zur Basis 10. Der Vorkommateil darf durch die Vorzeichen »+« oder »–« eingeleitet werden. Auch der Exponent kann positiv oder negativ[218](LOGO verwendet für negative Exponenten den Buchstaben N anstelle des E. In Java steht das E mit einem folgenden unären Plus- oder Minuszeichen.) sein, muss aber eine Ganzzahl sein. Die Tabelle stellt drei Beispiele zusammen:
Standard | Wissenschaftlich |
123450.0 | 1.2345E5 |
123450.0 | 1.2345E+5 |
0.000012345 | 1.2345E–5 |
Beispiel |
Nutzen der wissenschaftlichen Notation: double x = 3.00e+8; |
18.2.3 Mantisse und Exponent *
Intern bestehen Fließkommazahlen aus drei Teilen: einem Vorzeichen, einem ganzzahligen Exponenten und einer Mantisse (engl. mantissa). Während die Mantisse die Genauigkeit bestimmt, gibt der Exponent die Größenordnung der Zahl an.
Die Berechnung für Fließkommazahlen aus den drei Elementen ist im Prinzip wie folgt: Vorzeichen × Mantisse × 2 ^ Exponent, wobei Vorzeichen –1 oder +1 sein kann. Die Mantisse m ist keine Zahl mit beliebigem Wertebereich, sondern normiert mit dem Wertebereich 1 <= m < 2, also eine Fließkommazahl, die mit 1 beginnt und daher auch 1-plus-Form heißt.[219](Es gibt eine Ausnahme durch denormalisierte Zahlen, aber das spielt für das Verständnis keine Rolle.) Auch der zunächst vorzeichenbehaftete Exponent wird nicht direkt gespeichert, sondern als angepasster Exponent (engl. biased exponent) in der IEEE-kodierten Darstellung abgelegt. Zu unserem Exponenten wird, abhängig von der Genauigkeit, +127 (bei float) und +1023 (bei double) addiert; nach der Berechnung steht in der Darstellung immer eine ganze Zahl. 127 und 1023 nennen sich Bias.
Das Vorzeichen kostet immer 1 Bit, und die Anzahl der Bits für Exponent und Mantisse richtet sich nach dem Datentyp.
Datentyp | Anzahl Bits für den Exponenten | Anzahl Bits für die Mantisse |
float | 8 | 23 |
double | 11 | 52 |
Beispiel |
Das Folgende sind Kodierungen für die Zahl 123456,789 als float und double. Das »·« trennt Vorzeichen, Exponent und Mantisse: 0·10001111·11100010010000001100101 BigInteger biasedExponent = new BigInteger( "10001111", 2 ); |
Der Exponent einer Fließkommazahl liefert auch die Methode getExponent() der Klassen Double und Float.
Zugang zum Bitmuster liefern die Methoden long doubleToLongBits(double) beziehungsweise int Float.floatToIntBits(float). Die Umkehrung ist double Double.longBitsToDouble(long) beziehungsweise float Float.intBitsToFloat(int).
Ihr Kommentar
Wie hat Ihnen das <openbook> gefallen? Wir freuen uns immer über Ihre freundlichen und kritischen Rückmeldungen.