Deep Learning für den Wald

KI-Verfahren für eine nachhaltige Forstwirtschaft im Kontext des Klimawandels

von Benjamin Bischke und Patrick Helber

In Deutschland ist nicht nur ein Drittel der Landesfläche mit Wäldern bedeckt, sondern Wälder sind auch wichtige Ökosysteme und zugleich ein bedeutsamer Wirtschaftsfaktor. An einer nachhaltigen Bewirtschaftung von Wäldern in Anbetracht klimatischer Veränderungen besteht aus diesem Grund ein erhebliches nationales Interesse. In diesem Artikel wird herausgestellt, wie innovative Verfahren der künstlichen Intelligenz zur Auswertung von Fernerkundungsdaten eingesetzt werden können, um einen klaren Lösungsbeitrag zu ökologischen Herausforderungen im forstwirtschaftlichen Bereich zu bilden.

Die künstliche Intelligenz nimmt immens an Bedeutung zu

Ob künstliche Intelligenz, maschinelles Lernen oder Deep Learning, in der Praxis werden diese Begriffe häufig als Synonyme verwendet. Dabei besitzen die drei Begrifflichkeiten große Unterschiede in ihrer Bedeutung und stehen in einer strikten Hierarchie zueinander. Die künstliche Intelligenz ist der Oberbegriff für alle Methoden und Technologien, die ein intelligentes Verhalten vorweisen. Das maschinelle Lernen ist dabei ein Teilgebiet der KI, welches eine Vielzahl an (Lern-)Methoden basierend auf den Gebieten der mathematischen Optimierung und der Statistik umfasst. Deep Learning wiederum ist ein spezieller Teilbereich des maschinellen Lernens, welcher versucht, die statistischen Korrelationen in den Daten durch Künstliche Neuronale Netze abzubilden.

In der Fachliteratur teilt man die Methoden der KI in zwei Teilbereiche auf: die symbolische KI und die statistische KI.

Bei der symbolischen KI werden zunächst Fakten, Ereignisse und ihre Zusammenhänge gesammelt und als ein abstraktes Modell in einer eindeutigen Repräsentation dargestellt. Basierend auf dieser Repräsentation können mathematische Operationen definiert werden, die es erlauben, logische Schlussfolgerungen zu ziehen oder komplexere Vorgänge zu planen. Nachteilig bei einem solchen Ansatz ist jedoch, dass zunächst eine möglichst vollständige Wissensbasis erstellt werden muss, was in der Praxis häufig sehr zeitintensiv und fehleranfällig ist. Darüber hinaus sind die entsprechenden Algorithmen in ihren Entscheidungen häufig durch das vorab definierte Regelwerk begrenzt und können nur sehr schwer mit einer Unsicherheit in den Daten umgehen.
Im Gegensatz dazu steht die statistische KI, bei der versucht wird, intelligentes Verhalten mittels mathematischer Modelle und statistischer Verfahren (wie beispielsweise mit neuronalen Netzen) nachzubilden. Diese statistischen Lernverfahren extrahieren latente Strukturen und Korrelation in den Daten und bilden dieses Wissen in einem mathematischen Modell ab. Anschließend lassen sich mit dem gelernten Modell auf ähnliche Daten neue Entscheidungen sowie Vorhersagen über die Zukunft treffen.

Eine mögliche Hilfe bei der Erreichung dieser Nachhaltigkeitsziele bieten Erdbeobachtungsdaten. Der starke Anstieg an verfügbaren Daten, insbesondere durch Luft- und Satellitenbildaufnahmen ermöglicht eine niemals zuvor mögliche Analyse der Erde.
Benjamin Bischke und Patrick Helber

In diesem Kontext ist das maschinelle Lernen (ML) als eines der wichtigsten und nutzbringendsten Teilgebiete der statistischen KI besonders hervorzuheben. Gerade im Zuge der Digitalisierung steht das maschinelle Lernen bei vielen Unternehmen im Fokus der Aufmerksamkeit, um sich einen Vorsprung gegenüber den Wettbewerbern zu sichern. Die Anwendungen von maschinellen Verfahren sind vielschichtig und branchenübergreifend für zahlreiche Unternehmen relevant: So können beispielsweise im Bereich der Medizin mithilfe maschineller Lernverfahren die Wechselwirkungen mehrerer Medikamente vorhergesagt werden.

Die Verfahren des maschinellen Lernens bauen auf mathematischen Theorien auf, wobei insbesondere die Gebiete der Optimierung und Statistik zur Anwendung kommen. Dabei verarbeiten die Verfahren die Eingabedaten und erstellen je nach Anwendung ein spezifisches mathematisches Modell. Das Finden der besten Parameter für das entsprechende Modell nennt man in der Fachsprache das Trainieren oder Lernen eines Modells. Mithilfe der gelernten Modelle lassen sich dann Wahrscheinlichkeiten für zukünftige Ereignisse berechnen oder riesige Datenmengen auf relevante Informationen reduzieren und hinsichtlich bedeutender Eigenschaften gruppieren.

Großes Momentum im maschinellen Lernen durch Deep Learning

Ein Teilbereich des maschinellen Lernens ist Deep Learning, das besonders im Fokus rund um die aktuelle Hochphase der KI steht. Bei Deep Learning wird versucht, das menschliche Gehirn in einem vereinfachten mathematischen Modell mittels Künstlicher Neuronaler Netze abzubilden. Abstrakt betrachtet stellt Deep Learning hierfür ein sehr mächtiges Framework bereit, mit dem neuronale Netze mit unterschiedlichen Architekturen trainiert werden können. Diese Netze sind in der Lage, entscheidende Merkmale, die für die Lösung eines Problems relevant sind, automatisch aus den Daten zu lernen. Im Gegensatz zu klassischen Verfahren des maschinellen Lernens, bei dem die Merkmale von dem Menschen aufwendig entworfen und definiert werden müssen, lernen die neuronalen Netze selbstständig die Korrelationen und Merkmale aus den Daten.

Mathematisch kann gezeigt werden, dass die neuronalen Netze eine beliebige mathematische Funktion abbilden können. Zur Lösung komplexer und nicht-linearer Problemstellungen werden jedoch Netzwerke mit besonders vielen Schichten aus Neuronen (und somit ein tief-schichtiges Netzwerk) benötigt, woher auch der Begriff des „Deep Learnings“ resultiert. Diese vielschichtigen Netzwerke erlauben es zwar, komplexe Probleme näherungsweise besser zu lösen, gleichzeitig erfordert ein solcher Ansatz aber auch eine besonders hohe Anzahl an freien Parametern, die durch ein aufwendiges Training bestimmt werden müssen. Das eigentliche Training ist ein nicht konvexes Optimierungsproblem, bei dem die Netzwerkparameter näherungsweise bestimmt werden müssen.

Aufgrund der hohen Parameteranzahl werden hierfür zwei wichtige Voraussetzungen benötigt: Erstens eine strukturierte, repräsentative Datenbasis mit Labels und zweitens eine leistungsstarke Rechenkraft. Durch die Vielzahl an Sensoren und die Verfügbarkeit von Ressourcen über das Internet ist der erste Punkt mittlerweile oftmals einfach zu erfüllen. Bei der Rechenpower wurden ursprünglich Grafikkarten zweckentfremdet, um die mathematischen Operationen schneller zu berechnen als durch herkömmliche Prozessoren. Aktuell bieten führende Grafikkartenhersteller wie Nvidia dedizierte Prozessorchips an, die sich auf die mathematischen Operationen des Deep Learnings spezialisiert haben und es erlauben, Tausende von Operationen zu parallelisieren. Durch die Supercomputer von Nvidia wie die DGX-1- und DGX-2-Systeme(1), lassen sich neuronale Netze mittlerweile innerhalb von wenigen Minuten trainieren. Bis vor wenigen Jahren wurden hierfür mehrere Wochen oder gar Monate benötigt.

Deep Learning in der Erdbeobachtung für die Nachhaltigkeitsziele

Weltweit haben Wälder eine besondere Bedeutung für die biologische Vielfalt und für Natur, Klima und Umwelt. Sie sind nicht nur existenzielle Lebensräume und -grundlage für zahlreiche Tier- und Pflanzenarten, sondern leisten essenzielle Beiträge für Luft, Wasser und Boden. Wesentliche Voraussetzung für eine nachhaltige, auf klimatische Veränderungen angepasste Waldbewirtschaftung, die – wie in den Nachhaltigkeitszielen der Agenda 2030 der Vereinten Nationen(2) angestrebt – einen bedeutenden Beitrag zum Umwelt-, Klima-, Natur- und Ressourcenschutz leistet, sind aktuelle Informationen über den Zustand des Waldes. Derartige Informationen werden momentan aufgrund des hohen manuellen Aufwands allerdings nur selten im gebotenen Umfang erhoben (z. B. durch die Bundeswaldinventur, welche bisher ca. alle zehn Jahre bundesweit stattfand).

Patrick Helber promoviert am DFKI und dem Nvidia AI Lab an der KI-gestützten Auswertung von Luft- und Satellitenbilddaten.

Eine mögliche Hilfe bei der Erreichung dieser Nachhaltigkeitsziele bieten Erdbeobachtungsdaten, insbesondere in Form von Luft- und Satellitenbildern. Der starke Anstieg an verfügbaren Erdbeobachtungsdaten, insbesondere durch Luft- und Satellitenbilddaten, ermöglicht eine niemals zuvor mögliche Analyse der Erde. Heutzutage nehmen Satelliten eine riesige Datenmenge an Bildern pro Tag auf, welche in der Praxis händisch nicht auszuwerten sind. Die erzeugten Daten sowie der Fortschritt auf dem Gebiet der künstlichen Intelligenz erlauben die Entwicklung einer automatisierten Lösung. Durch die Auswertung dieser Daten können sowohl Aussagen über die Bestellung von forstwirtschaftlichen Flächen als auch über das aktuelle Lagebild nach extremen klimatischen Ereignissen wie Dürreperioden, Stürmen oder Waldbränden getroffen werden.

Deep Learning im Rahmen einer nachhaltigen Forstwirtschaft

Das Deutsche Forschungszentrum für Künstliche Intelligenz (DFKI) hat sich seit 2016 in dem Forschungsprojekt „Deep Eye“ insbesondere auf die KI-gestützte Auswertung von Fernerkundungsdaten unter der Zielsetzung „AI for Good“ fokussiert (3). So kann mit den entwickelten KI-Verfahren eine lokale Auswertung von einzelnen Waldflächen sowie eine globale Analyse über den Zustand der Wälder vorgenommen werden. Die Verfahren können als Grundpfeiler für eine global automatisierte Erdbeobachtungslösung dienen und somit zur Erreichung der von den Vereinten Nationen bestimmten Nachhaltigkeitsziele maßgeblich beitragen. Dabei ist hervorzuheben, dass nicht nur ein KI-Verfahren eingesetzt wird, sondern je nach Aspekt des Zustandes eine Vielzahl unterschiedlicher KI-Methoden zum Einsatz kommen.

Mittels der KI-gestützten Segmentierungsverfahren kann z. B. eine lokale Auswertung auf einzelnen Forstflächen erfolgen, um den Baumbestand sowie die Verteilung unterschiedlicher Baumarten automatisiert zu extrahieren. Je nach Auflösung des Luftbildes können auch baumspezifische Merkmale wie der Durchmesser der Baumkrone oder die Ermittlung der Baumhöhe gewonnen werden. Spezielle LSTM-Modelle aus dem Bereich des Deep Learnings, die primär zur Zeitreihenanalyse von Sensordaten eingesetzt werden, lassen sich ebenfalls auf die regelmäßigen Überfliegungen von Wäldern anwenden. Neben der Zustandsbestimmung können mit diesen KI-Verfahren auch Prognosemodelle erstellt werden, um Vorhersagen über Zustandsveränderungen zu treffen.

Benjamin Bischke ist ein Doktorand am DFKI und KI-Forscher im Nvidia AI Lab.

Die gewonnenen Informationen über Wälder sollen es Förstern, Forstämtern und Politikern erlauben, den Fortschritt von klima- und forstspezifischen Kriterien besser zu quantifizieren und zu bewerten. Auch Zertifizierungen sollen bei der Überwachung ihrer Richtlinien von diesen Informationen profitieren.

Das Deutsche Forschungszentrum für Künstliche Intelligenz (DFKI) hat zur Umsetzung dieser Zielsetzung das Start-up Vision Impulse GmbH (4) ausgegründet. Der Fokus des DFKI-Spin-offs liegt in der automatisierten Analyse von Luft- und Satellitenbilddaten mittels innovativer KI-Methoden. Neben der gewinnbringenden Informationsextraktion dieser Daten für die Forstwirtschaft unterstützen die zukunftsweisenden Technologien der Ausgründung andere Unternehmen, NGOs und die Politik bei dem Erreichen weiterer Nachhaltigkeitsziele.//

Quellen:
(1) https://blogs.nvidia.com/blog/2018/03/27/nvidia-gtc-2018-gv100-dgx2-hyperscale-datacenters/
(2) https://www.un.org/sustainabledevelopment/sustainable-development-goals/
(3) https://www.forbes.com/sites/nvidia/2018/06/11/how-deep-learning-is-helping-our-planet-and-saving-lives
(4) http://www.vision-impulse.com

Informationen und Kontakt zu den Autoren

Benjamin Bischke und Patrick Helber

Deep Learning für den Wald is licensed under a Creative Commons Attribution-NoDerivatives 4.0 International license. Autoren: Benjamin Bischke und Patrick Helber