Optimieren von Entscheidungbšumen durch GAs

Ein verbreitetes symbolisches Clusterverfahren ist ein Entscheidungsbaum, der mit sog. ID3 oder C4.5 trainiert wird. Grob gesprochen sind die Daten durch eine feste Menge von Merkmalen die unterschiedliche Ausprägungen haben können charakterisiert. Ein Entscheidungsbaum fragt in Baumartiger Weise sukzessive die Ausprägung einzelner Merkmale ab (entspricht einem Pfad im Baum), bis die zugehörige Klasse am Blatt gefunden wird. Es gibt schöne Methoden, so einen Baum zu erstellen. Natürlich kann der mehr oder weniger groß werden, je nachdem, in welcher geschickten Reihenfolge die Merkmale betrachtet werden.

Der entstehende Baum ist in der Regel nicht minimal.

>>> Implementieren Sie einen GA, der den so entstehenden Baum ummodelt, daß er möglichst klein wird, aber mindestens noch dieselbe Klassifikationsgüte hat. Die Entscheidungsbäme selbst können Sie leicht implementieren oder im Web vohandene Programme benutzen.


back