Galileo Computing :: Java ist auch eine Insel - 18 Bits und Bytes und Mathematisches

18.2 Fließkommaarithmetik in Java

Zahlen mit einem Komma nennen sich Gleitkomma-, Fließkomma-, Fließpunkt- oder Bruchzahlen (gebrochene Zahlen). Der Begriff »Gleitkommazahl« kommt daher, dass die Zahl durch das Gleiten (Verschieben) des Dezimalpunkts als Produkt aus einer Zahl und einer Potenz der Zahl 10 dargestellt wird (also 1,23 = 123 * 10^–2).

Java unterstützt für Fließkommazahlen die Typen float und double, die sich nach der Spezifikation IEEE 754 richten. Diesen Standard des Institute of Electrical and Electronics Engineers gibt es seit Mitte der 1980er-Jahre. Ein float hat die Länge von 32 Bit und ein double die Länge von 64 Bit. Die Rechenoperationen sind im IEEE Standard for Floating-Point Arithmetic definiert.

Hinweis

Wir sollten uns bewusst sein, dass die Genauigkeit von float wirklich nicht so toll ist. Schnell beginnt die Ungenauigkeit zuzuschlagen:

System.out.println( 2345678.88f );   //  2345679.0

18.2.1 Spezialwerte für Unendlich, Null, NaN

Die Datentypen double und float können nicht nur »Standardzahlen« speichern. Java definiert Sonderwerte für eine positive oder negative Null, positives und negatives Unendlich (engl. infinity) und NaN, die Abkürzung für Not a Number.

Unendlich

Der Überlauf führt zu einem positiven oder negativen Unendlich.

Beispiel

Multiplikation zweier wirklich großer Werte:

System.out.println(  1E300 * 1E20 );    //  Infinity
System.out.println( –1E300 * 1E20 );    // -Infinity

Für die Werte deklariert die Java-Bibliothek in Double und Float zwei Konstanten; zusammen mit der größten und kleinsten darstellbaren Fließkommazahl sind das:

**Tabelle 18.8:** Spezialwerte und ihre Konstanten
Wert für	Float	Double
positiv unendlich	Float.POSITIVE_INFINITY	Double.POSITIVE_INFINITY
negativ unendlich	Float.NEGATIVE_INFINITY	Double.NEGATIVE_INFINITY
kleinster Wert	Float.MIN_VALUE	Double.MIN_VALUE
größter Wert	Float.MAX_VALUE	Double.MAX_VALUE

Das Minimum für double-Werte liegt bei etwa 10^–324 und das Maximum bei etwa 10^308. Weiterhin deklarieren Double und Float Konstanten für MAX_EXPONENT/MIN_EXPONENT.

Hinweis

Die Anzeige des Über-/Unterlaufs und des undefinierten Ergebnisses gibt es nur bei Fließkommazahlen, nicht aber bei Ganzzahlen.

Positive, negative Null

Es gibt eine positive Null (+0,0) und eine negative Null (–0,0), die etwa beim Unterlauf auftauchen.

Beispiel

Der Unterlauf erzeugt:

System.out.println( 1E-322 *  0.0001 );  //  0.0
System.out.println( 1E-322 * –0.0001 );  // –0.0

Für den Vergleichsoperator == ist die positive Null gleich der negativen Null, sodass 0.0 == –0.0 das Ergebnis true ergibt. Damit ist auch 0.0 > –0.0 falsch. Die Bitmaske ist jedoch unterscheidbar, was der Vergleich Double.doubleToLongBits(+0.0) != Double.doubleToLongBits(?0.0) zeigt.

Es gibt einen weiteren kleinen Unterschied, den die Rechnung 1.0 / ?0.0 und 1.0 / 0.0 zeigt. Durch den Grenzwert geht das Ergebnis einmal gegen negativ unendlich und einmal gegen positiv unendlich.

NaN

NaN wird als Fehlerindikator für das Ergebnis von undefinierten Rechenoperationen benutzt, etwa 0/0.

Beispiel

Erzeuge NaN durch den Versuch, die Wurzel einer negativen Zahl zu bilden, und durch eine Nullkommanix-Division:

System.out.println( Math.sqrt(-4) );     // NaN
System.out.println( 0.0 / 0.0);          // NaN

NaN ist als Konstante in den Klassen Double und Float deklariert. Die statische Methode isNaN() testet, ob eine Zahl NaN ist. Die API-Dokumentation am Beispiel von Double sieht so aus:

public final class java.lang.Double
extends Number
implements Comparable<Double>

public static final double NaN = 0.0 / 0.0;
Deklaration von NaN bei Double.
boolean isNaN()
Liefert true, wenn das aktuelle Double-Objekt NaN ist.
public static boolean isNaN(double v)
Liefert true, wenn die übergebene Zahl v NaN ist.

Die Implementierung von isNan(double v) ist einfach: return v != v.

Alles hat seine Ordnung *

Außer für den Wert NaN ist auf allen Fließkommazahlen eine totale Ordnung definiert. Das heißt, sie lassen sich von der kleinsten Zahl bis zur größten aufzählen. Am Rand steht die negative Unendlichkeit, dann folgen die negativen Zahlen, negative Null, positive Null, positive Zahlen und positives Unendlich. Bleibt nur noch die einzige unsortierte Zahl NaN. Alle numerischen Vergleiche <, <=, >, >= mit der Java-NaN liefern false. Der Vergleich mit == ist false, wenn einer der Operanden NaN ist. != verhält sich umgekehrt, ist also true, wenn einer der Operanden NaN ist.

Beispiel

NaN beim Gleichheitstest:

System.out.println( Double.NaN == Double.NaN );     // false
System.out.println( Double.NaN != Double.NaN );     // true

Da NaN nicht zu sich selbst gleich ist, wird die folgende Konstruktion, die üblicherweise eine Endloschleife darstellt, mit d als Double.NaN einfach übersprungen:

while ( d == d ) {}

Ein NaN-Wert auf eine Ganzzahl angepasst, also etwa (int) Double.NaN, ergibt 0.

Stille NaNs *

Eine Problematik in der Fließkomma-Arithmetik ist, dass keine Ausnahmen die Fehler anzeigen; NaNs solcher Art heißen auch stille NaNs (engl. Quiet NaNs [qNaNs]). Als Entwickler müssen wir also immer selbst schauen, ob das Ergebnis während einer Berechnung korrekt bleibt. Ein durchschnittlicher numerischer Prozessor unterscheidet ein qNaN und ein signaling NaN (sNaN).

18.2.2 Standard-Notation und wissenschaftliche Notation bei Fließkommazahlen *

Zur Darstellung der Fließkommaliterale gibt es zwei Notationen: Standard und wissenschaftlich. Die wissenschaftliche Notation ist eine Erweiterung der Standardnotation. Bei ihr folgt hinter den Nachkommastellen ein »E« (oder »e«) mit einem Exponenten zur Basis 10. Der Vorkommateil darf durch die Vorzeichen »+« oder »–« eingeleitet werden. Auch der Exponent kann positiv oder negativ[218](LOGO verwendet für negative Exponenten den Buchstaben N anstelle des E. In Java steht das E mit einem folgenden unären Plus- oder Minuszeichen.) sein, muss aber eine Ganzzahl sein. Die Tabelle stellt drei Beispiele zusammen:

**Tabelle 18.9:** Notationen der Fließkommazahlen
Standard	Wissenschaftlich
123450.0	1.2345E5
123450.0	1.2345E+5
0.000012345	1.2345E–5

Beispiel

Nutzen der wissenschaftlichen Notation:

double x = 3.00e+8;
float  y = 3.00E+8F;

18.2.3 Mantisse und Exponent *

Intern bestehen Fließkommazahlen aus drei Teilen: einem Vorzeichen, einem ganzzahligen Exponenten und einer Mantisse (engl. mantissa). Während die Mantisse die Genauigkeit bestimmt, gibt der Exponent die Größenordnung der Zahl an.

Die Berechnung für Fließkommazahlen aus den drei Elementen ist im Prinzip wie folgt: Vorzeichen × Mantisse × 2 ^ Exponent, wobei Vorzeichen –1 oder +1 sein kann. Die Mantisse m ist keine Zahl mit beliebigem Wertebereich, sondern normiert mit dem Wertebereich 1 <= m < 2, also eine Fließkommazahl, die mit 1 beginnt und daher auch 1-plus-Form heißt.[219](Es gibt eine Ausnahme durch denormalisierte Zahlen, aber das spielt für das Verständnis keine Rolle.) Auch der zunächst vorzeichenbehaftete Exponent wird nicht direkt gespeichert, sondern als angepasster Exponent (engl. biased exponent) in der IEEE-kodierten Darstellung abgelegt. Zu unserem Exponenten wird, abhängig von der Genauigkeit, +127 (bei float) und +1023 (bei double) addiert; nach der Berechnung steht in der Darstellung immer eine ganze Zahl. 127 und 1023 nennen sich Bias.

Das Vorzeichen kostet immer 1 Bit, und die Anzahl der Bits für Exponent und Mantisse richtet sich nach dem Datentyp.

**Tabelle 18.10:** Anzahl der Bits für Exponent und Mantisse
Datentyp	Anzahl Bits für den Exponenten	Anzahl Bits für die Mantisse
float	8	23
double	11	52

Beispiel

Das Folgende sind Kodierungen für die Zahl 123456,789 als float und double. Das »·« trennt Vorzeichen, Exponent und Mantisse:

0·10001111·11100010010000001100101
0·10000001111·1110001001000000110010011111101111100111011011001001

Um von dieser Darstellung auf die Zahl zu kommen, schreiben wir:

BigInteger biasedExponent = new BigInteger( "10001111", 2 );
BigInteger mantisse = new BigInteger( "11100010010000001100101", 2 );
int exponent = (int) Math.pow( 2, biasedExponent.longValue() – 127 );
double m = 1. + (mantisse.longValue() / Math.pow( 2, 23 ));
System.out.println( exponent * m );  // 123456.7890625

Den Exponenten (ohne Bias) einer Fließkommazahl liefert Math.getExponent(); auf unsere Zahl angewendet, ist das also 16.

Der Exponent einer Fließkommazahl liefert auch die Methode getExponent() der Klassen Double und Float.

Zugang zum Bitmuster liefern die Methoden long doubleToLongBits(double) beziehungsweise int Float.floatToIntBits(float). Die Umkehrung ist double Double.longBitsToDouble(long) beziehungsweise float Float.intBitsToFloat(int).

Ihr Kommentar

Wie hat Ihnen das <openbook> gefallen? Wir freuen uns immer über Ihre freundlichen und kritischen Rückmeldungen.

Name
E-Mail
Ihr Kommentar