te.ma ist seit dem 01. August 2024 bis auf Weiteres inaktiv und befindet sich im Archiv-Modus. Alle Publikationen sind weiter zugänglich. Der Kommentarbereich ist jedoch abgeschaltet. Bestehende Nutzerkonten bleiben bis 31. Juli 2025 weiter zugänglich, neue Nutzerkonten können nicht mehr angelegt werden. Unser Newsletter wird nicht mehr weiter bespielt.

Der Ursprung der Black-Box-KIs

Re-Paper
Leo Breiman2001
Re-Paper

Der Ursprung der Black-Box-KIs

»Statistical Modeling: The Two Cultures«

Inhalte

Intro

Geschrieben von Jan Lause

Bei te.ma veröffentlicht 04.04.2023

te.ma DOI 10.57964/xshf-x085

Geschrieben von Jan Lause
Bei te.ma veröffentlicht 04.04.2023
te.ma DOI 10.57964/xshf-x085

Moderne Machine-Learning-Algorithmen werden oft als Black Box bezeichnet, weil selbst ihre Entwickler*innen nicht genau nachvollziehen können, warum ein Algorithmus funktioniert. Wie begann die Geschichte dieser Black-Box-Verfahren? 2001 plädiert Leo Breiman in einem kontroversen Essay für diese neue Denkkultur: weg von einfachen, erklärbaren Algorithmen – hin zur leistungsfähigen Black Box.

Als Breiman den vorliegenden Essay schreibt, sind die Vorläufer des heutigen maschinellen Lernens noch einfache Modelle aus Statistik und Wahrscheinlichkeitstheorie. Er nennt diese „klassische“ Perspektive Data Modeling Culture

Doch was bedeutet das praktisch? Ein Beispiel: Wenn wir aus Messdaten wie Temperatur, Wolkendichte und Windstärke die Regenwahrscheinlichkeit vorhersagen möchten, brauchen wir zunächst ein Modell. Dieses bündelt unser Weltwissen über die Physik des Wetters. In der Natur gibt es nämlich einen Zusammenhang zwischen all unseren Messdaten. Diesen Zusammenhang bildet ein mathematisches Modell so genau wie möglich ab. Im Idealfall enthält das Wettermodell dann also eine exakte Beschreibung aller atmosphärischen Phänomene und Faktoren, die zu Regen führen könnten. 

Breiman sieht in diesem Data-Modeling-Verfahren einige Vorteile. Unser beispielhaftes Wettermodell lässt sich nämlich nicht nur zur Regenvorhersage  nutzen – zusätzlich können Meteorolog*innen mithilfe des Modells besser verstehen, wie genau einzelne Wetterphänomene zusammenwirken, oder die Auswirkungen von Extremwetter-Szenarien simulieren. Außerdem ermöglicht die mathematische Beschreibung des Systems, die Korrektheit der Vorhersagen zu garantieren. Das heißt: Man kann sogar mathematisch beweisen, wie gut eine Wettervorhersage sein wird.

Trotz dieser Vorteile kritisiert Breiman den Data-Modeling-Ansatz fundamental: Denn all seine Vorzüge ließen sich nur realisieren, wenn die Modelle auch wirklich korrekt seien. Und da die Welt meist deutlich komplexer sei als die Modelle von Statistiker*innen, könne man davon in der Regel nicht ausgehen. Damit wären aber laut Breiman sowohl die Interpretierbarkeit als auch die mathematisch garantierte Korrektheit dahin. 

Breiman wirft der klassischen Statistik außerdem vor, sich zu sehr auf ihre altbekannten Werkzeuge zu beschränken – in seinen eigenen Worten: „Es gibt ein altes Sprichwort: ‚Wenn ein Mann als Werkzeug nur einen Hammer hat, dann sieht jedes Problem wie ein Nagel aus.‘ Das Problem für Statistiker ist, dass in letzter Zeit einige Probleme nicht mehr wie Nägel aussehen.“1 Hiermit meint Breiman vor allem komplexer und größer werdende Datensätze, denen die klassischen Modelle nicht mehr gerecht werden können.

Im Kontrast dazu wirbt Breiman für die Kultur des Algorithmic Modeling: Aus seiner Sicht muss man sich nicht damit aufhalten, die Mechanismen der Natur exakt zu verstehen und nachzubauen. Vielmehr sollte man auf flexible Algorithmen setzen, die mit möglichst wenig Annahmen über die Welt möglichst präzise Vorhersagen liefern. Dabei legt Breiman kaum Wert darauf, ob die Algorithmen dafür denselben „Rechenweg“ wie die Natur  verwenden – oder ob sie eine völlig andere Lösung finden.

Im Algorithmic Modeling ersetzen wir also beispielsweise alle Regenmechanismen aus unserem Beispiel mit der Black Box des Algorithmus. Damit können wir aus dem Algorithmus nicht ohne Weiteres Neues über die Physik des Regens lernen. Und auch, wie genau der Algorithmus aus Messwerten Regenschauer vorhersagt, entzieht sich unserem Verständnis. Als Praktiker sieht Breiman darin keinen Nachteil, sondern fokussiert sich auf das, was aus seiner Sicht zählt: ob die Vorhersage stimmt. Schließlich interessiert uns in vielen Fällen nicht, welches Zusammenspiel von Wind und Luftdruck an einem bestimmten Tag zu besonders ergiebigen Regenwolken führt, sondern nur, ob wir einen Regenschirm einpacken sollten oder nicht. 

Diese von Breiman beworbene „Black Box“-Kultur prägt maschinelles Lernen bis heute. Viele KI-Ingenieur*innen trimmen Algorithmen allein auf beste Leistung. Welche Zusammenhänge in der Welt vorliegen und auf welchen Mechanismen die Vorhersagen beruhen, ist zweitrangig. Doch diese Perspektive ändert sich zunehmend: In immer mehr Anwendungen von künstlicher Intelligenz und maschinellem Lernen sind undurchschaubare Black Boxes nämlich mindestens fragwürdig. Beispielsweise wenn Computerprogramme automatisch über Krebsdiagnosen oder Kreditwürdigkeit entscheiden, aber keine Begründung für ihre Entscheidungen liefern können. Daher braucht es neue Ansätze, die die Black Boxes der KIs öffnen.

Fußnoten
1

„There is an old saying ‚If all a man has is a hammer, then every problem looks like a nail.‘ The trouble for statisticians is that recently some of the problems have stopped looking like nails.“

Re-Paper

Offener Zugang
Offener Zugang bedeutet, dass das Material öffentlich zugänglich ist.
Verwandte Artikel
Diskussionen
0 Kommentare
Es gibt neue Kommentare!
Te.ma befindet sich im Archiv-Modus und daher ist die Kommentarfunktion deaktiviert.

Noch keine Kommentare

te.ma sammelt keine Cookies. Um mit der Allgemeinen Datenschutzgrundverordnung (DSGVO) übereinzustimmen, müssen wir dich aber informieren, dass von uns eingebundene externe Medien (z.B. von YouTube) möglicherweise Cookies sammeln. Mehr dazu in unserer Datenschutzerklärung.