Neuronale Netze Praktikum SS 2000

Wein und Spam (LVQ mit Relevanzbestimmung)

Mithilfe von LVQs wird ein Klassifikator gegeben, indem die Eingabe mit einer Anzahl von Referenzvektoren für die einzelnen Klassen verglichen und auf die Klasse des ähnlichsten Vektors abgebildet wird. Training geschieht, indem die Referenzvektoren sukzessive den Eingabedaten ähnlicher oder unähnlicher gemacht werden, je nachdem, ob die Klasse stimmt oder nicht. So werden die Referenzvektoren zu typischen Repräsentanten der einzelnen Klassen.

Häufig sind die Daten hochdimensional, so daß die Klassifikation relativ lange dauert. Wünschensert wäre, wenn gleichzeitig mit den Referenzvektoren auch gelernt werden könnte, welche Koeffizienten relevant für die Abbildung sind. Dieses sind in der Regel nicht alle, häufig nur ein Bruchteil der Eingabekoeffizienten. Eine einfach zu implementierende Möglichkeit ist, die Metrik mit Gewichtungsfaktoren für die einzelnen Koeffizienten zu versehen, die mithilfe Hebbschem Lernens eingestellt werden. Koeffizienten mit kleinen Faktoren sind relativ unwichtig. Das kann man recht einfach in exakten Formeln aufschreiben (-> bitte nachfragen).

Mögliche Daten

Klassifikation von Wein anhand chemischer Daten nach Anbaugebieten, Informationen zu den Daten
Erkennen von Werbesendungen, die mails sind anhand der Worthäufigkeiten repräsentiert, Informationen.
Klassifikation der relevanten Abschnitte der DNA, Informationen, unter anderem sind die relevanten Abschnitte der DNA bekannt, die Daten also als Test sehr geeignet.

Um das Verfahren zu testen, sollte man zusätzlich zu den Daten gezielt überflüssige Koeffizienten hinzufügen.

Als Literatur können Standarddarstellungen für LVQ dienen, etwa Zell, Simulation Neuronaler Netze oder Kohonen, Self-organizing maps.

back