Überwachtes Lernen, unüberwachtes Lernen und Verstärkungslernen
Da das Lernen bei der KI im Mittelpunkt steht – nochmals, ein nicht lernendes und sich nicht verbesserndes System ist keine KI –, bietet sich eine weitere Unterscheidung an, die zwischen überwachtem, unüberwachtem Lernen und Verstärkungslernen.
Beim überwachten Lernen gibt der Mensch dem System vor, was es lernen soll, bspw. Pferde von Zebras zu unterscheiden. Hier werden Hunderte von als solchen klassifizierten Pferde- und Zebrabildern dem System vorgeliefert, das eine Einordnung vornimmt und daraufhin ein Feedback bekommt – war die Einordnung richtig oder falsch? –, anhand derer es dank Mustererkennung später „selbstständig“ anhand unklassifizierter Bilder entscheiden kann, ob es sich um ein Pferd oder ein Zebra handelt.(10)
Das unüberwachte Lernen kommt ohne solche Hinweise aus: Die Daten werden eingescannt und das System versucht Regelmäßigkeiten und Muster zu erkennen. Eingesetzt werden solche Systeme im Bankenbereich, wo sie Abweichungen von Normalzuständen bei den Transaktionsdaten auf Girokonten erkennen können. Meistens werden die beiden Arten des überwachten und des unüberwachten Lernverfahrens zusammen eingesetzt, etwa wenn die oberste Ebene überwacht wird, die unteren Ebenen sich dann aber unüberwacht organisieren.(11)
Ein weiteres Lernverfahren ist das Reinforcement Learning (Verstärkungslernen), das ebenfalls mit unklassifizierten Daten arbeitet, aber weniger im Hinblick auf deren Klassifizierung als vielmehr auf das Erlernen von Handlungsabläufen. Reinforcement Learning wird in der Robotik eingesetzt, wenn Roboter bestimmte Handgriffe erlernen und verbessern oder beim Erlernen neuer Spiele. In diesem Fall probiert das System verschiedene Optionen durch und erhält „Belohnungen“ in Form von positiven Rückmeldungen. Es passt sein Verhalten an, um möglichst viele positive Rückmeldungen zu erhalten, lernt also den Handgriff oder Spielzug beständig zu verbessern.
Entlehnt wird das Reinforcement Learning der Tierdressur, bei der auch viel mit Belohnungen gearbeitet wird, letztlich aber auch der menschlichen Pädagogik. Eingesetzt wird es u. a. in der Games-Entwicklung, wo die Aktionen von Figuren bisher aufwendig von Hand programmiert werden müssen. KI-Entwickler aus Berkeley und der University of British Columbia arbeiten an Verfahren, bei denen virtuelle Charaktere anhand menschlicher Vorbilder Kampfkunst und akrobatische Übungen so lange trainieren, bis sie die Bewegungen vollkommen beherrschen. Durch das Verstärkungslernen lassen sich Entwicklungsaufwand und damit Kosten von Games drastisch senken. „Es würde ausreichen, wenn ein Künstler nur wenige Beispiele gibt. Das System kann sie dann für alle unterschiedlichen Situationen verallgemeinern“, erklärt Jason Peng, einer der Entwickler in Berkeley.(12)
Überwachtes, unüberwachtes und Verstärkungslernen arbeiten mit künstlichen neuronalen Netzen, auf die noch einzugehen sein wird.
Lesen Sie auf der nächsten Seite:
Geschichte der KI
Quellen
10.) Vgl. J. Kaplan, S. 46
11.) Vgl. M. Lenzen, S. 51
12.) KI Figuren trainieren Kampfkunst, Technology Review vom 17.4.2018