Überwachtes Lernen, unüberwachtes Lernen und Verstärkungslernen

Da das Lernen bei der KI im Mittelpunkt steht – nochmals, ein nicht lernendes und sich nicht verbesserndes System ist keine KI –, bie­tet sich eine weitere Unterscheidung an, die zwischen überwachtem, unüberwachtem Ler­nen und Verstärkungslernen.

Beim überwach­ten Lernen gibt der Mensch dem System vor, was es lernen soll, bspw. Pferde von Zebras zu unterscheiden. Hier werden Hunderte von als solchen klassifizierten Pferde- und Zebrabil­dern dem System vorgeliefert, das eine Ein­ordnung vornimmt und daraufhin ein Feed­back bekommt – war die Einordnung richtig oder falsch? –, anhand derer es dank Mus­tererkennung später „selbstständig“ anhand unklassifizierter Bilder entscheiden kann, ob es sich um ein Pferd oder ein Zebra handelt.(10)

Das unüberwachte Lernen kommt ohne solche Hinweise aus: Die Daten werden einge­scannt und das System versucht Regelmäßig­keiten und Muster zu erkennen. Eingesetzt werden solche Systeme im Bankenbereich, wo sie Abweichungen von Normalzuständen bei den Transaktionsdaten auf Girokonten erken­nen können. Meistens werden die beiden Ar­ten des überwachten und des unüberwachten Lernverfahrens zusammen eingesetzt, etwa wenn die oberste Ebene überwacht wird, die unteren Ebenen sich dann aber unüberwacht organisieren.(11)

Ein weiteres Lernverfahren ist das Reinforcement Learning (Verstärkungs­lernen), das ebenfalls mit unklassifizierten Daten arbeitet, aber weniger im Hinblick auf deren Klassifizierung als vielmehr auf das Er­lernen von Handlungsabläufen. Reinforce­ment Learning wird in der Robotik eingesetzt, wenn Roboter bestimmte Handgriffe erler­nen und verbessern oder beim Erlernen neuer Spiele. In diesem Fall probiert das System ver­schiedene Optionen durch und erhält „Beloh­nungen“ in Form von positiven Rückmeldun­gen. Es passt sein Verhalten an, um möglichst viele positive Rückmeldungen zu erhalten, lernt also den Handgriff oder Spielzug be­ständig zu verbessern.

Entlehnt wird das Re­inforcement Learning der Tierdressur, bei der auch viel mit Belohnungen gearbeitet wird, letztlich aber auch der menschlichen Pädago­gik. Eingesetzt wird es u. a. in der Games-Ent­wicklung, wo die Aktionen von Figuren bis­her aufwendig von Hand programmiert wer­den müssen. KI-Entwickler aus Berkeley und der University of British Columbia arbeiten an Verfahren, bei denen virtuelle Charaktere anhand menschlicher Vorbilder Kampfkunst und akrobatische Übungen so lange trainie­ren, bis sie die Bewegungen vollkommen be­herrschen. Durch das Verstärkungslernen lassen sich Entwicklungsaufwand und damit Kosten von Games drastisch senken. „Es wür­de ausreichen, wenn ein Künstler nur wenige Beispiele gibt. Das System kann sie dann für alle unterschiedlichen Situationen verallge­meinern“, erklärt Jason Peng, einer der Ent­wickler in Berkeley.(12)

Überwachtes, unüber­wachtes und Verstärkungslernen arbeiten mit künstlichen neuronalen Netzen, auf die noch einzugehen sein wird.


Lesen Sie auf der nächsten Seite:
Geschichte der KI

Quellen

10.) Vgl. J. Kaplan, S. 46
11.) Vgl. M. Lenzen, S. 51
12.) KI Figuren trainieren Kampfkunst, Technology Review vom 17.4.2018