Physik-KI schützt das Grundwasser

Inhalte

Intro

Geschrieben von Matthias Karlbauer

Bei te.ma veröffentlicht 12.05.2023

Geschrieben von Matthias Karlbauer
Bei te.ma veröffentlicht 12.05.2023

Die Kontamination von Grundwasser kann ganze Landstriche vergiften und unbewohnbar machen. Um die Ausbreitung von Substanzen im Boden vorherzusagen – und zwar auch dann, wenn bestimmte Bodeneigenschaften unbekannt sind – konzipierten Forscher aus Tübingen und Stuttgart ein maschinelles Lernmodell, dessen Vorhersagen den Gesetzen der Physik gehorchen.

In der Kleinstadt Kitchener in Kanada wurden auf einem Firmengrundstück in den 1970er Jahren große Mengen der krebserregenden Chemikalie Trichlorethen (TCE) verschüttet. Doch es war unklar, wann genau die Substanz in den Boden gelangt ist, wie sie sich weiter ausbreiten würde, ob ein Gesundheitsrisiko für die Bevölkerung besteht – und falls ja, wann.

Dieses Falls nahm sich der Stuttgarter Physik- und Simulationsprofessor Wolfgang Nowak in seiner Masterarbeit um die Jahrtausendwende an. Er entnahm Bodenproben, erhob Messungen und führte Experimente durch. Schließlich traf er zahlreiche Annahmen über den Boden und simulierte die TCE-Ausbreitung mittels eines physikalischen Modells. Anhand seiner Messungen und Simulationen konnte er den Zeitpunkt der Bodenkontaminierung schließlich rückdatieren. Um also zu bestimmen, wann das TCE auf dem Boden verschüttet worden war, musste ein Experte das Problem lange untersuchen und aufwändige Experimente durchführen.

Zwanzig Jahre später wird der Fall neu aufgerollt – in einer Zusammenarbeit der zwei Exzellenzcluster Machine Learning: New Perspectives for Science1 aus Tübingen und SimTech2 aus Stuttgart. Dieses Mal soll der Experte durch einen datengetriebenen Algorithmus ersetzt werden, um den Prozess der Entscheidungsfindung zu beschleunigen und womöglich neue Erkenntnisse zu generieren.

Dafür folgen die Forscher zunächst dem Beispiel Wolfgang Nowaks und legen ihrem Ansatz die allgemeine Advektions-Diffusionsgleichung aus der Physik zugrunde. Advektion beschreibt die Bewegung einer Menge von Partikeln innerhalb eines Mediums. Ein Beispiel ist der Golfstrom, der warme Wassermassen von Mexiko nach Europa transportiert. Diffusion beschreibt die Verbreitung von Substanzen in einem Medium. Wenn wir beispielsweise Salz (als Substanz) in einen Topf mit kochendem Wasser (als Medium) werfen, sorgt die Diffusion dafür, dass die Salzkonzentration nach einer gewissen Zeit im gesamten Topf homogen ist. Die Advektions-Diffusionsgleichung stellt einen Bezug zwischen diesen beiden Größen her und erlaubt es so, physikalische Ausbreitungsprozesse zu simulieren.

Veranschaulichung der Advektions- und Diffusionsprozesse in Rot und Blau. Oben die Ausgangssituation: Die Substanz konzentriert sich lokal in der linken Hälfte des Mediums. In der mittleren und unteren Zeile verschiebt und verteilt sich die Substanz mit kleinen und großen Advektions- und Diffusionsraten.

Um die klassische Advektions-Diffusionsgleichung anwenden zu können, müssen allerdings zahlreiche Eigenschaften der Substanz und des Ausbreitungsmediums bekannt sein, etwa wie dicht das Medium und wie dickflüssig die Substanz ist. Denn diese Eigenschaften beeinflussen die Ausbreitungsgeschwindigkeit maßgeblich. Wolfgang Nowak hatte diese Eigenschaften für sein Fallbeispiel experimentell und mithilfe seines Expertenwissens bestimmt.

Mit dem neuen Ansatz hingegen kommt nun maschinelles Lernen zum Einsatz. Die unbekannten Eigenschaften werden durch ein künstliches neuronales Netzwerk dargestellt und in einem Trainingsverfahren erlernt. Das kann zum Beispiel die Diffusionsrate der Substanz sein. Anschließend wird die gelernte Diffusionsrate in die Advektions-Diffusionsgleichung eingesetzt, um den Verbreitungsprozess der Substanz nach den bekannten physikalischen Gesetzmäßigkeiten zu simulieren. Für das hybride Verfahren ergeben sich damit Vorteile gegenüber reinen physikalischen und Machine-Learning-Ansätzen: Zum einen folgt das Modell den Gesetzen der Physik und generiert nachweislich realistische Vorhersagen. Keine Selbstverständlichkeit für pure maschinelle Lernverfahren.3 Gleichzeitig erspart die Lernkomponente zeitaufwändige und fehleranfällige Experimente zur Bestimmung der unbekannten Eigenschaften durch einen Experten.

Im Vergleich zu dem rein physikalischen Modell können Simulationen mit dem hybriden Modell also mit wesentlich geringerem Aufwand betrieben werden. Insbesondere sind keine Vorannahmen erforderlich, etwa über die Diffusionsrate. Falsche Vorannahmen üben sich fatal auf die gesamte Simulation aus und äußern sich in großen Vorhersagefehlern. Als kleines Extra lässt sich die von dem Modell gelernte Diffusionsrate sogar analysieren und gegebenenfalls in eine physikalische Formel überführen. So können wir feststellen, ob die Substanz mit konstanter Rate diffundiert, oder ob die Diffusion von anderen Variablen abhängt – und auf welche Weise. Diese Sachverhalte können schnell äußerst komplex werden.

Das Modell aus dem Raum Stuttgart-Tübingen zeigt anschaulich, wie physikalisches Know-how mit maschinellem Lernen kombiniert werden kann, um Prozesse sowohl besser verstehen als auch simulieren und vorhersagen zu können. Besonders vielversprechend ist dabei das Potential, Prozesse auch und gerade dann zu simulieren, wenn gewisse Eigenschaften unbekannt sind. So könnte uns dieser hybride Ansatz in Zukunft unter anderem helfen, komplexe Wetterphänomene besser zu beschreiben und vorherzusagen, obwohl bis heute unklar ist, wie genau zum Beispiel die Oberfläche der Erde mit der Atmosphäre interagiert.

Transparenzhinweis: Unser Kurator Matthias Karlbauer ist Ko-Autor des Papers, auf das sich dieses Intro bezieht.

Fußnoten
3

https://uni-tuebingen.de/en/research/core-research/cluster-of-excellence-machine-learning/home/

https://www.simtech.uni-stuttgart.de/

Ein maschinelles Lernverfahren ist typischerweise nur in genau den Bereichen zuverlässig, in denen es explizit trainiert wurde. Im physikalischen Kontext sind das etwa Wertebereiche, die durch das Training abgedeckt wurden. Wenn ein Modell also nur auf Zahlen zwischen 17 und 42 trainiert wurde, kann nicht garantiert werden, dass es später auch für Zahlenbereiche außerhalb davon stimmige Vorhersagen generiert. Die Kopplung an physikalische Gleichungen gibt dem Problem gewissermaßen einen Rahmen und schränkt die Anzahl an Möglichkeiten somit grundlegend ein. Eine solch isolierte Testumgebung nennt man Sandkasten. Darin löst das Lernverfahren die Aufgaben, die ihm vorgegeben werden. Alles andere erledigt das physikalische Modell, dessen Ausgabe für sämtliche Wertebereiche klar definiert ist.

Re-Web
Offener Zugang
Offener Zugang bedeutet, dass das Material öffentlich zugänglich ist.
Related Articles

Die farblose und klare Flüssigkeit Trichlorethen fand früher Einsatz in der Metallindustrie, da sie Fette löst und schnell verdunstet. Die Substanz ist jedoch krebserregend und diffundiert ins Grundwasser, wenn sie auf dem Boden verschüttet wird.

Diskussionen
1 Kommentar
There are new comments!

Neuer Kommentar

Der Ort für deinen Diskussionsbeitrag. Du kannst taggen, linken und Text formatieren. Bitte beachte unsere Community Guidelines.

Du antwortest auf den Beitrag: "Physik-KI schützt das Grundwasser".

Total 2

Tolles Beispiel, wie sich KI-Modelle in einem spezifischen Forschungs- und Expertenbereich einsetzen lassen. Besonders da sie auch bisher unbekannte Eigenschaften mitsimulieren können, stimme ich zu, dass sie ein interessantes und hilfreiches Werkzeug für Forschende darstellen.

Ich bin gespannt, wie sich damit die Arbeit in Forschungsbereichen verändern wird, in denen der Einsatz von KI möglich und sinnvoll ist. Werden nun alle Forschenden in diesen Gebieten zu KI-Experten und erlernen bereits im Studium mehr KI-Grundlagen und weniger fachspezifische Inhalte? Oder entwickeln sich wohl eher graphische Oberflächen, mit denen Forschende KI-Modelle intuitiv bauen und mit ihrem tiefem Fachwissen speisen können?

te.ma sammelt keine Cookies. Um mit der Allgemeinen Datenschutzgrundverordnung (DSGVO) übereinzustimmen, müssen wir dich aber informieren, dass von uns eingebundene externe Medien (z.B. von YouTube) möglicherweise Cookies sammeln. Mehr dazu in unserer Datenschutzerklärung.