Der Traum vom eigenen Haus – fast jeder muss hierfür einen Kredit aufnehmen. Doch wie kreditwürdig ist jemand? Khandani und Kollegen forschten bereits 2010 dazu, wie maschinelles Lernen für diese Frage eingesetzt werden kann. Im folgenden Jahrzehnt wurden eine Vielzahl weiterer KI-Modelle zum Kreditscoring vorgestellt, die Grundidee blieb jedoch die gleiche. Wie funktionieren diese Modelle, und welche Chancen und Risiken ergeben sich, wenn sie Entscheidungen über Kreditwürdigkeit treffen?

Der Oscar-prämierte Spielfilm „The Big Short“ über die Finanzkrise 2008 porträtiert die damalige Vergabepraxis von Hauskrediten eindrücklich. Einer der Hauptcharaktere fragt zwei Hypothekenmakler: „Werden [Kredit-]Bewerber jemals abgelehnt?“ Alle Anwesenden lachen. Einer der Makler antwortet: „Wenn sie abgelehnt werden, würde ich meinen Job nicht richtig machen.“ Es wird weiter nachgebohrt: „Selbst wenn sie kein Geld haben?“ Darauf ein anderer Makler: „Meine Firma bietet NINJA-Darlehen an – no income no job (kein Einkommen, kein Job). Ich lasse den Abschnitt über das Einkommen einfach leer. Meiner Firma ist das egal.“

Keine Überprüfung der Bonität durchzuführen, ist offensichtlich hochriskant und kann ein ganzes Bankensystem destabilisieren. Die Beurteilung auf Basis einer subjektiven Bewertung eine*r Berater*in zu treffen ist fehleranfällig, intransparent und im Falle, dass sie voreingenommen ist, sogar diskriminierend. Es liegt somit nahe, auf Basis bestehender Daten und historischer Finanzinformationen der Kund*innen eine Vorhersage über das Ausfallrisiko von Krediten automatisch zu treffen. Dies umfasst nicht nur die einmalige Bewertung bei Vergabe von Krediten, sondern auch die kontinuierliche Berechnung der Wahrscheinlichkeit von Zahlungsrückständen. Wird einem Kunden ein hohes Risiko zugeschrieben, kann die Bank beispielsweise den Kreditrahmen seines Kontos begrenzen oder Zinssätze erhöhen.

Credit Scoring durch Kreditauskunfteien ist dabei keine Neuheit nach der Finanzkrise. So gibt es beispielsweise die Schufa bereits seit den 1920er Jahren in Deutschland.1 Khandani und Kollegen betrachten im vorliegenden Paper ebenfalls ein klassisches Scoringverfahren einer solchen Kreditauskunftei, den „CScore“. Dieser verwendet noch kein maschinelles Lernen. Die Autoren sehen zwar einen Zusammenhang zwischen dem CScore und Zahlungsrückständen, stellen jedoch fest, dass sich der Score nur langsam bei ändernden Bedingungen des Marktes anpasst. Sie sehen daher Bedarf für präzisere und schnellere Prognosemethoden – und schlagen den Einsatz von KI vor.

Doch womit die KI trainieren? Banken haben eine Reihe detaillierter Daten über ihre Kund*innen, die auch in der Studie von Khandani eingesetzt wurden. Diese beinhalten unter anderem die Anzahl an Krediten und die jeweils ausstehenden Beträge, unterteilt in Kategorien wie Kreditkarten-, Auto- oder Hauskredit. Zusätzlich sind Informationen zu Kontoständen und den gesamten eingehenden und ausgehenden Transaktionen eines Kontos (bzw. einer Kreditkarte) vorhanden. Anhand der eingehenden Transaktionen lässt sich das Einkommen abschätzen, die ausgehenden Transaktionen können weiter in Kategorien (z.B. Supermarkt, Restaurant, Kleidung, Telefonrechnung) unterteilt werden. Grundsätzlich besitzen Banken weitere demographische Informationen wie Alter, Postleitzahl oder die Wohnadresse. Diese wurden in der vorliegenden Studie aus Datenschutzgründen jedoch nicht verwendet.2

Auf Basis dieser Daten bewerten Banken die Bonität von Kund*innen klassischerweise mittels logistischer Regressionsmodelle. Diese können jedoch nur bedingt komplexe Zusammenhänge abbilden, wodurch auch ihre Genauigkeit begrenzt ist. Mit dem dritten „KI-Sommer“ rückten in den 2010er Jahren neue Möglichkeiten für präzisere Modelle auf Basis maschinellen Lernens wieder in den Fokus.

Khandani und Kollegen verwenden einen Entscheidungsbaum (decision tree) als maschinelles Lernmodell. Ein Entscheidungsbaum besteht dabei aus interpretierbaren Entscheidungsregeln. Wenn ich mich morgens entscheide, mit welchem Transportmittel ich zur Arbeit komme, mache ich dies eventuell unterbewusst ebenfalls anhand eines Entscheidungsbaumes: Regnet es? Ist die Antwort nein, so nehme ich das Fahrrad. Ist die Antwort ja, stelle ich mir die nächste Frage: Hat die Rush Hour bereits begonnen? Ist die Antwort nein, nehme ich das Auto. Ist die Antwort ja, nehme ich die U-Bahn. Dies ist natürlich ein sehr simples Beispiel und Entscheidungsbäume können deutlich komplexere Zusammenhänge abbilden.

Wird ein Entscheidungsbaum mittels maschinellem Lernen erzeugt, wird im ersten Schritt ein Modell „trainiert“, indem es an einzelnen Beispielen lernt. Ein Beispiel ist dabei eine Person und deren Informationen über Konten und Transaktionen (siehe die oben beschrieben verfügbaren Daten). Während der Trainingsphase erhält das Modell zusätzlich den erwarteten Ausgabewert des Beispiels, in diesem Fall die binäre Entscheidung, ob diese Person in den nächsten drei Monaten alle Kreditraten rechtzeitig bezahlt oder ob sie in einen Zahlungsrückstand gerät. Das heißt, es werden beispielsweise die Kontostände und Transaktionen aus Januar 2008 verwendet, um vorherzusagen, ob von Februar bis April 2008 ein Zahlungsrückstand eintreten wird. Anhand dieser Beispiele wird das Modell kalibriert, sodass es nach abgeschlossenem Training Prognosen für bis dahin ungesehene Fälle abgeben kann. Das heißt, es erhält nur noch die Eingabe-Attribute ohne den erwarteten Ausgabewert.

Die gute Interpretierbarkeit der Entscheidungsregeln ist dabei ein Vorteil von Entscheidungsbäumen im Vergleich zu anderen „Black Box“-Modellen, wie beispielsweise neuronalen Netzen und Deep-Learning-Verfahren, die in den vergangenen Jahren jedoch aufgrund besserer Resultate vielfältig für diesen Anwendungsfall erforscht wurden.3

Nach dem Training evaluieren die Autoren, wie zuverlässig der Entscheidungsbaum vorhersagt, ob jemand in Zahlungsrückstand gerät. Dazu berechnen sie den R2-Wert, der zwischen 0 Prozent (gar kein Zusammenhang) und 100 Prozent (perfekte Vorhersage) liegen kann. Der Entscheidungsbaum erreicht 85 Prozent, was von den Autoren als ein sehr guter Wert eingestuft wird. Sie schließen aus ihren Ergebnissen, dass Machine-Learning-Modelle große Potenziale bieten, um Kreditausfälle zu reduzieren. So ließen sich laut ihren Analysen Kosten von 6 bis 23 Prozent einsparen.

Der Fokus der Publikation von Khandani und Kollegen liegt auf den möglichen positiven Effekten, und sicherlich würden die meisten zustimmen, dass ein stabiles Bankensystem und die Vermeidung weiterer Finanzkrisen wünschenswert sind. Trotzdem sind auch solche Systeme limitiert und bergen Risiken. Kein Modell ist zu hundert Prozent akkurat. Es kann somit zu Fehlentscheidungen führen. Besonders problematisch ist hierbei, wenn die entsprechenden Entscheidungen bestimmte Gruppen diskriminieren.

Zusätzlich ist die Intransparenz solcher Modelle ein Risiko. Es stehen immer mehr Daten über Konsument*innen zur Verfügung, die potenziell für die Bewertung der Kreditwürdigkeit herangezogen werden können. So gibt es beispielsweise bereits Unternehmen4, die unseren „digitalen Fußabdruck“ zum Scoring verwenden. Die Anbieter argumentieren zwar, dass dadurch mehr Menschen als vorher Kredite bekommen könnten: Personengruppen, die aufgrund geringer oder gar keiner Finanzdaten-Historie bisher als zu risikoreich eingestuft wurden, insbesondere Personen aus dem globalen Süden, die nun auch ein positives Scoring erhalten können5. Jedoch führt dies andererseits zu größerer Intransparenz von Entscheidungen. Überspitzt formuliert: Kann ich den Kredit für mein Haus nicht bekommen, weil ich zufällig online das falsche Paar Schuhe gekauft oder den falschen Artikel gelesen habe?

Um diesem Risiko entgegenzuwirken, hat die Europäische Kommission im Rahmen des im Mai 2023 präsentierten AI Acts Richtlinien für die Entwicklung von vertrauenswürdiger KI entwickelt, bei denen der Anwendungsfall Kreditbewertung explizit als „hohes Risiko“ eingestuft wird und damit strikten Vorgaben unterliegen soll. So muss unter anderem sichergestellt sein, dass Systeme nicht diskriminierend sind, die Privatsphäre gewahrt wird sowie Transparenz und Erklärbarkeit der Modelle gegeben sind. Damit ist in der EU eine klare Positionierung für transparente und erklärbare Modelle gesetzt, selbst wenn dies potenziell zu Lasten der Modellgenauigkeit geht.

Fußnoten

Auch in den USA gibt es zu diesem Zeitpunkt bereits eine lange Geschichte von Kreditauskunfteien, anschaulich von Avery et al. (2003) zusammengefasst.

Das bedeutet nicht, dass diese Daten in der Praxis nicht trotzdem eingesetzt werden. Welche genau, ist oftmals nicht transparent. Es ist zum Beispiel wahrscheinlich, dass die Schufa die Bonität auch anhand der Postleitzahl bestimmt. Siehe z.B. diesen Deutschlandfunk-Beitrag: https://www.deutschlandfunkkultur.de/finanzexperte-dirk-ulbricht-ueber-die-schufa-die-haben-mich-100.html, sowie folgenden Fokus-Artikel: https://www.stern.de/digital/online/schufa-verraet-mehr-ueber-ihren-score---ein-geheimnis-behaelt-sie-fuer-sich-31805088.html

Eine Übersicht bietet beispielsweise Bathmore et al. (2020).

Z.B. ist LenddoEFL eine moderne Variante einer Kreditauskunftei, die anhand von diversen alternativen Datenquellen ein Kreditscoring anbietet. Branch ist eine Smartphone-App, die die Kreditwürdigkeit auf Basis von Smartphonedaten (Anruf- und Nachrichtenhistorie, GPS, Kontakte etc.) ermittelt, zu denen User ihnen Zugriff gewährt haben.

Auch die International Finance Cooperation hat sich in einem Artikel hierzu positiv ausgesprochen sowie Mhlanga (2021) in einer wissenschaftlichen Arbeit.

Re-Paper

Wenn KI über deine Kreditwürdigkeit entscheidet

Original Title

Consumer Credit-Risk Models Via Machine-Learning Algorithms

Autor(en)

Amir E. Khandani, Adlar J. Kim, Andrew W. Lo

KI und Nachhaltigkeit

Wenn KI über deine Kreditwürdigkeit entscheidet

Wenn KI über deine Kreditwürdigkeit entscheidet

Consumer Credit-Risk Models Via Machine-Learning Algorithms

Wenn KI über deine Kreditwürdigkeit entscheidet

»Consumer Credit-Risk Models Via Machine-Learning Algorithms«

Wenn KI über deine Kreditwürdigkeit entscheidet

Neuer Kommentar

Neuer Kommentar

Up-To-Date Bleiben?

KI und Nachhaltigkeit

Wenn KI über deine Kreditwürdigkeit entscheidet

Wenn KI über deine Kreditwürdigkeit entscheidet

Consumer Credit-Risk Models Via Machine-Learning Algorithms

Wenn KI über deine Kreditwürdigkeit entscheidet

»Consumer Credit-Risk Models Via Machine-Learning Algorithms«

Wenn KI über deine Kreditwürdigkeit entscheidet

ImageNet: Computer lernen sehen

Über das Potenzial von Klimanetzwerken. Ein Gespräch mit Bedarth…

Neuer Kommentar

Neuer Kommentar

Up-To-Date Bleiben?