Daten gelten als das Gold des 21. Jahrhunderts – mit dem Unterschied, dass es immer mehr davon gibt. Insbesondere unstrukturierte Daten bieten Finanzinstituten vielfältige neue Möglichkeiten. Doch es gilt auch, die Risiken im Blick zu behalten.

Das Potential unstrukturierter Daten für Banken und Sparkassen

Unstrukturierte Daten bieten Banken und Sparkassen vielfältige Möglichkeiten.

Partner des Bank Blogs

In einer Zeit, in der Daten zunehmend an Relevanz gewinnen, ist es von großer Bedeutung, die optimale Nutzung des Potenzials von Daten zu verstehen. Gleichzeitig ist es erforderlich, eine angemessene Regulierung aufrechtzuerhalten, um sowohl die Reduzierung von Risiken und den Schutz der Datenschutzrechte der Kunden als auch die Förderung von Innovationen sicherzustellen.

Treiber für Big Data in der Finanzindustrie

Big Data ist heute ein omnipräsenter Begriff, der im Wesentlichen den rasanten Anstieg und die Vielfalt von Daten umfasst, die für herkömmliche Analysemethoden oft zu umfangreich sind. Diese Datenwelt ist durch drei Hauptelemente geprägt.

  1. Die explosionsartige Zunahme der Daten. Das Volumen der jährlich generierten oder replizierten digitalen Datenmenge weltweit ist allein zwischen 2010 und 2022 um das 51-fache gestiegen.
  2. Innovative Speichertechnologien wie Cloud-Dienste, die die schnelle Verarbeitung dieser enormen Datenmengen erlauben.
  3. Fortschritte in Algorithmen und Künstlicher Intelligenz, die die Analyse sehr komplexer Daten ermöglichen.

Ein weiterer bedeutender Aspekt des Datenzeitalters ist der Wandel von aggregierten Informationen hin zu granularen, detaillierten Daten.

Aber nicht alle Daten sind gleich. Einige sind klar strukturiert, in der Regel geordnet, regelmäßig und leicht zu erfassen, wie z.B. die präzisen und systematischen Börsenkurse. Andere sind weniger klar definiert, wie Finanzberichte, die sowohl Tabellen als auch ausführliche Textabschnitte enthalten, wodurch sie als semi-strukturiert gelten. Und dann gibt es unstrukturierte Daten, die weder klar geordnet noch definiert sind. Beispiele sind Multimedia-Inhalte wie Podcasts, Videos, Audiodateien, Textnachrichten oder E-Mails. Diese Daten können oft nicht ohne weiteres in traditionelle Datenbanksysteme eingepflegt werden.

Die meisten Daten sind unstrukturiert

Etwa 80 Prozent der von Unternehmen gesammelten Daten sind unstrukturiert und diese Menge belief sich 2022 auf beachtliche 82 Zettabyte weltweit. Das ist eine Zahl mit 21 Nullen! Zum Vergleich: Wenn jedes Byte ein Tropfen Wasser wäre, könnte man damit einen Ozean befüllen, der 13 Mal so groß wie der Atlantik wäre! Und dieser Datenozean wächst: Für 2027 prognostizieren Experten etwa 228 Zettabyte an unstrukturierten Daten.

Nutzen und Nutzung von unstrukturierten Daten

Doch welchen Nutzen können die Akteure des Finanzsystems aus dieser Flut an unstrukturierten Daten ziehen? Ähnlich einem erfahrenen Fischer, der sein Netz in den Tiefen des Ozeans auswirft, um nach Fischen zu suchen, können Unternehmen mithilfe von Künstlicher Intelligenz (KI) und maschinellem Lernen wertvolle Erkenntnisse gewinnen, indem sie diese Datenströme gezielt analysieren. Diese Erkenntnisse können in Prognosen, Risikobewertungen und Entscheidungsfindung einfließen.

Die Bundesbank setzt auf unstrukturierte Daten und ermutigt Banken dazu, sie ebenfalls zu nutzen. Denn die Analyse dieser Daten kann dazu beitragen, dass sämtliche Akteure auf den Finanzmärkten zu fundierteren Ergebnissen und besseren Entscheidungen gelangen. Auf diese Weise können unstrukturierte Daten auch zur Stabilität des Finanzsystems beitragen.

Unstrukturierte Daten sind somit sowohl eine Herausforderung als auch eine großartige Chance. Sie können wertvolle Einsichten liefern, die es uns ermöglichen, unsere Aufgaben, von der Geldpolitik über die Bankenaufsicht bis hin zur Finanzstabilität, noch effektiver zu erfüllen.

Wie die Bundesbank unstrukturierte Daten nutzt

Über Jahrzehnte hinweg haben wir in der Bundesbank hauptsächlich mit strukturierten Daten gearbeitet, wie sie beispielsweise in Finanzmarktdaten vorzufinden sind. In jüngster Zeit haben wir unsere Datenquellen erweitert, um auch semi-strukturierte Informationen zu integrieren, die in Finanzberichten auftauchen und sowohl Tabellen als auch Textabschnitte enthalten. Darüber hinaus haben wir uns der Herausforderung gestellt, unstrukturierte Daten zu integrieren, die in verschiedenen Formaten wie Zeitungsartikeln und anderen Medien vorliegen. Ihre Menge und Komplexität machen KI und maschinelles Lernen unverzichtbar.

Für uns als Bundesbank stellt dieser Übergang von einer Welt mit aggregierten und strukturierten Daten hin zu einer Datenlandschaft mit umfangreichen, granularen und unstrukturierten Datenmengen einen signifikanten Paradigmenwechsel dar. Zwei Beispiele mögen dies verdeutlichen.

BUBA-Bot

Der erste analytische Anwendungsfall stammt aus dem Inneren der Bundesbank. Stellen Sie sich ein System vor, das täglich Tausende von Nachrichtenartikeln durchforstet, die meisten mit wirtschaftlichem oder politischem Bezug. Dieses System, das wir „BUBA-Bot“ nennen, stammt aus unserem Zentralbereich Märkte und nutzt neuronale Netze und Webscraping, um wertvolle Marktinformationen zu liefern.

Das Tool ist schon seit einigen Jahren in Betrieb. Es durchsucht Webseiten und lädt Nachrichtenartikel herunter. Durch Sentiment-Analysen – einem Prozess zur Ermittlung der Meinung, des Urteils oder der Emotion hinter einer Aussage – werden diese Artikel bewertet und mittels KI thematisch klassifiziert. Die Daten kombinieren wir anschließend mit Finanzmarktdaten und werden für Fragestellungen, die im Bereich „Market Intelligence“ und Marktanalyse relevant sind, nutzbar gemacht.

Und hier kommt der spannendste Teil: Der BUBA-Bot integriert aktuell eine ChatGPT KI. Dies ermöglicht es den Nutzern, mit der KI über aktuelle weltweite Entwicklungen zu diskutieren und Einschätzungen der KI zur Nachrichtenlage zu erhalten.

Medienanalyse

Der Prototyp „Medienanalyse“ aus dem Zentralbereich Bankenaufsicht ist ein weiteres Beispiel. Dieses Werkzeug dient uns zur Analyse unstrukturierter Daten, speziell in der Bankenaufsicht. Stellen Sie sich vor, wir können mittels modernster maschineller Textanalyse aus einer Flut tagesaktueller Informationen – seien es Nachrichten, Unternehmensmitteilungen, Artikel in Fachzeitschriften, Lokalzeitungen oder sogar Handelsregistereintragungen – Entwicklungen von Bankrisiken und aufkommende Trendthemen identifizieren.

Mit Hilfe von gezielten Stichwörtern können wir einzelnen Dokumenten verschiedene Risiken zuordnen, übergeordnete Themen herausfiltern und sogar feststellen, welche Finanzinstitute in dem jeweiligen Dokument Erwähnung finden.

Wie der Finanzsektor unstrukturierte Daten nutzt

In der Finanzwirtschaft hat die Analyse unstrukturierter Daten bereits Fuß gefasst. Die Analyse mittels KI hat sich von der Kundenschnittstelle, dem Frontend, bis in den Kern der Banken, den Maschinenraum, bewegt.

Wenn wir uns das Frontend ansehen, dann sind es vor allem kunden- und produktorientierte Anwendungen, die im Rampenlicht stehen. Beispiele sind Chatbots, die Kundenanfragen in Echtzeit bearbeiten und dabei sogar Cross-Selling von zusätzlichen Dienstleistungen übernehmen.

Im Back-End dominieren analytische sowie prozess- und risikoorientierte Anwendungen. Besonders im Bereich Kreditwürdigkeitsprüfung, Betrugserkennung und Risikomanagement spielen sie eine Rolle.

Zwei konkrete Beispiele möchte ich herausgreifen:

Geldwäschebekämpfung

Stellen Sie sich vor, KI-Systeme könnten nicht nur eine Vielzahl von Transaktionen wie Aus- und Inlandszahlungen, Wertpapiertransaktionen und Kreditanträge durchsuchen, sondern auch unstrukturierte Daten wie Audio- und Videoaufzeichnungen sowie Geodaten erfassen. Durch den Abgleich dieser Informationen mit anderen verfügbaren internen und externen Datenquellen können Auffälligkeiten und Anomalien erkannt werden.

In diesem Kontext wird die Technologie besonders effektiv, wenn relevante Daten mehrerer Organisationen zusammengeführt werden, wie es bei der gemeinsamen Nutzung von Daten durch über 2.000 Finanzbanken in den USA der Fall ist. Diese kollektive Verwendung ermöglicht eine noch effektivere Aufspürung von Geldwäsche.

Betrugsprävention

Stellen Sie sich vor, wir könnten den digitalen Ozean von E-Mails, Dokumenten, Transaktionsaufzeichnungen und Webprotokollen auf Muster und Anomalien durchforsten, die auf verdächtige Aktivitäten oder gar Betrug hindeuten könnten.

Als Beispiel dafür, dass sich diese Technologien bereits in anderen Wirtschaftssektoren etabliert haben, möchte ich die Versicherungsbranche hervorheben. Dort gibt es Unternehmen, die sich auf die Analyse dieser Art von Daten spezialisiert haben. Sie kombinieren unterschiedliche Datenquellen und setzen fortschrittliche Analysemethoden ein.

Und die Ergebnisse? Eine beeindruckende Reduzierung der Betrugsfälle und die Enttarnung organisierter Betrugsringe. KI wird darüber hinaus auch eingesetzt, um Schadensfälle besser zu bewerten, die Preisgestaltung zu optimieren und den Versicherungsschutz zu personalisieren.

Wie unstrukturierte Daten das Finanzsystem und den Wettbewerb verändern

Unstrukturierte Daten bergen große Chancen für unser Finanzsystem:

  • Unstrukturierte Daten eröffnen den Banken zahlreiche neue Möglichkeiten, wie datenbasierte, analytische Ansätze für präzisere Entscheidungen, etwa bei der Bonitätsprüfung oder der Kapitalanlage. Sie verbessern den Schutz vor Betrug oder Cyberattacken. Dies führt insgesamt zu stabileren Banken.
  • Mit Zugang zu wertvollen Markt- und Aufsichtsdaten können Zentralbanken die Vorteile der KI nutzen, um ihren Auftrag zur Wahrung von Preis- und Finanzstabilität noch besser zu erfüllen.
  • All diese Vorteile, von stabileren Banken bis hin zu effizienteren Zentralbanken, summieren sich zu einem insgesamt stabileren Finanzsystem, das durch die Analyse unstrukturierter Daten gestärkt wird.

Doch wir müssen auch die Risiken im Blick behalten.

  • Beim Maschinellen Lernen bestimmt die Qualität der Daten den Erfolg der Algorithmen. Wie oft in der IT gesagt wird: „Garbage in, garbage out. Ein Algorithmus ist nur so gut wie seine Daten. Unvollständige oder fehlerhafte Daten bergen das Risiko unzuverlässiger Ergebnisse. Genau hier bringt der Zentralbereich Daten und Statistik der Bundesbank seine wertvolle Expertise ein.
  • Es ist riskant, sich auf Datenauswertungen ohne tiefgreifende Expertise zu verlassen. Angesichts der Flut an unstrukturierten Daten könnten wir ohne dieses Know-how der „blinden“ Datenanalyse anheimfallen und einer Informationsillusion erliegen. Es genügt nicht, Daten zu besitzen – man muss sie auch richtig nutzen und verstehen können.
  • Ein nicht zu vernachlässigendes Risiko ist die öffentliche Wahrnehmung von Künstlicher Intelligenz. Laut einer Allensbach-Studie finden 58 Prozent den Begriff „Künstliche Intelligenz“ unsympathisch und nur 23 Prozent sehen eine effektive Regulierung als realisierbar. Gerade im Sektor des Finanzwesens, in dem Vertrauen eine wichtige Rolle spielt, könnten solche Akzeptanzprobleme die Einführung neuer Technologien deutlich behindern.

Unstrukturierte Daten haben viel Potenzial

Zusammenfassend lässt sich sagen, dass die facettenreiche Welt unstrukturierter Daten insgesamt ein großes Potenzial birgt, nicht nur für einzelne Institute, sondern für das gesamte Finanzsystem.

Das Nutzbarmachen dieser Daten ist nicht nur technisch, sondern auch strategisch essenziell für Banken. In einem intensiv umkämpften Markt ist eine Investition hier besonders lohnenswert. Die gezielte Analyse von unstrukturierten Daten trägt zur Kosteneffizienz, Automatisierung, Betrugsprävention und einem verbesserten Risikomanagement bei.

Der Mensch trägt die Verantwortung – auch für Künstliche Intelligenz

Doch mit diesen Neuerungen gehen auch Risiken einher. Schließlich ist es nicht nur eine Frage von Einzelrisiken wie Datenqualität. Die Funktionsweise von KI ist komplex. Sie kann uns durch unerwartete Fehler und prozyklische Effekte überraschen. Diese Herausforderungen, die sich aus der Nutzung von Big Data und unstrukturierten Daten ergeben, können weitreichende Auswirkungen auf unsere Finanzinstitutionen und die gesamte Stabilität des Systems haben.

Hier kommt wieder der Mensch ins Spiel, Er trägt letztlich die Verantwortung für Entscheidungen. Der Begriff der „Künstlichen Intelligenz“ war schon seit der ersten Verwendung 1955 eine maßlose Übertreibung. Und damals gab es noch gar kein „Big Data“. Die Analyse unstrukturierter Daten ist am Ende nur ein Werkzeug des Menschen, das er sich selbst geschaffen hat.

Datenqualität und ‑kompetenz sind das A und O. Es geht nicht nur um das Abwägen von Risiken und Vorteilen. Vielmehr sollten wir Innovation und Stabilität als zwei Seiten der gleichen Münze sehen. Unstrukturierte Daten bieten uns enormes Potenzial, das es voll auszuschöpfen gilt, um für künftige Chancen und Risiken gewappnet zu sein.

Vorteile maximieren – Risiken minimieren

Dabei ist entscheidend, dass wir diese Daten so nutzen, dass die Vorteile maximiert und die Risiken minimiert werden. In diesem Kontext möchte ich hervorheben, dass man bei der Regulierung der Künstlichen Intelligenz ein ausgewogenes Maß finden sollte. Der Gesetzgeber läuft im Moment Gefahr, bei der Regulierung „zu weit zu gehen“. Dadurch riskieren wir, die mit dem Potenzial verbundenen Chancen ein Stück weit zu vergeben.

Es wäre unklug, das immense Innovationspotenzial dieser Technologien durch übermäßige gesetzliche Einschränkungen zu dämpfen. Ähnlich unserem erfahrenen Fischer müssen wir wissen, wann wir unsere Netze auswerfen und zugleich wachsam gegenüber drohenden Stürmen sein.

Womöglich stehen wir an der Schwelle einer faszinierenden Ära. Die bevorstehenden Entwicklungen in KI und Finanzwesen bieten uns unglaubliche Möglichkeiten. Vor diesem Hintergrund freuen wir uns besonders auf den weiteren inspirierenden Austausch mit Ihnen – den Banken, Versicherern und FinTechs – um gemeinsam die Zukunft zu gestalten und den Datenozean zu erkunden.