SafeFBDC - Untersuchung der Eignung eines Financial Big Data Clusters zur Absicherung der Datensouveränität im Finanzsektor

Im Projekt safeFBDC entsteht eine Plattform, auf der KI-Anwendungen für den europäischen Finanzsektor entwickelt und bereitgestellt werden. Die Finanzdatenplattform ermöglicht einen sicheren Austausch von Daten unter Wahrung der individuellen Datensouveränität. Finanzdaten von Unternehmen, Behörden und Banken werden auf der FBDC-Plattform zusammengeführt und Anwendungen, etwa zur Geldwäschebekämpfung oder der Aufdeckung von Marktmanipulationen aufgesetzt.

Partner

Deloitte Consulting GmbH, Deutsche Börse AG, Frankfurt School of Finance and Management, Fraunhofer-Institut für Materialfluss und Logistik (IML), Hawk AI GmbH, Helaba Landesbank Hessen-Thüringen, Main Incubator GmbH, SAP SE, spotixx GmbH, Tech-Quartier – FinTech Community Frankfurt GmbH, TU Darmstadt

Herausforderung

Viele Unternehmen der Finanzwirtschaft speichern Daten zunehmend in großen Clouddatenspeichern von meist außereuropäischen Betreibern. Das bringt das Risiko mit sich, die Datenhoheit über diese Daten zu verlieren. Gleichzeitig schränken diese „Datensilos“ einzelner Unternehmen oder Banken die Möglichkeiten zur Entwicklung und Anwendung leistungsfähiger KI-Methoden deutlich ein. Für die Analyse komplexer Zusammenhänge im Finanzmarktkontext, wie etwa Lieferketten, werden zudem ergänzende Daten aus ganz unterschiedlichen Quellen benötigt. Der Lösungsansatz des safeFBDC ist die Entwicklung einer sicheren Plattform, auf der diese Daten DSGVO-konform zur Verfügung gestellt werden. So wird die Grundlage geschaffen, um KI-Anwendungen sicher zu entwickeln, zu trainieren und bereitzustellen.

Umsetzung

Im Rahmen des safeFBDC-Projekts entsteht ein ganzheitliches Plattformkonzept, das sowohl eine vertrauenswürdige IT-Infrastruktur als auch ein zukunftsweisendes KI-Konzept umfasst. Im Kern steht hierbei ein dedizierter Infrastruktur- und Technologie-Stack, der es ermöglicht sensible Daten teleologisch, d.h. zweckgebunden über Organisationen hinweg miteinander zu teilen. Hierbei entscheidet immer der Dateneigentümer für welchen Zweck die Daten verwendet werden dürfen, z. B. für bestimmte Anwendungsfälle, zentrales oder dezentrales Lernen.
Wie das funktioniert, wird im Folgenden genauer erläutert (Auszug Konzept, Stand 30.08.21):
Die Plattformarchitektur des safeFBDC sieht derzeit einen Private Data Space, einen Ecosystem Data Space (Portal & Marketplace) und einen Confidential Data Space vor. Innerhalb des Private Data Space verfügt jede Organisation über ihren eigenen Datenraum, indem die Daten zur gemeinsamen Nutzung vorbereitet werden können, bspw. durch Zuordnung zu einem bestimmten Datenmodell, Bereinigung und/oder Anonymisierung der Daten. Das safeFBDC Ökosystem bietet dann einen Metadatenkatalog und ein Repository über verfügbare Daten von Organisationen, ML-Modellen, Apps, APIs, etc. Hier können die Datenmodelle wie auf einem Marktplatz geteilt und konsumiert werden. Nicht-sensible Daten, Modelle, APIs oder Apps können über einfache Lizenzvereinbarungen zur Verfügung gestellt werden. Anwendungsfälle, die Datensätze von mehr als einer Organisation mit sensiblen Daten benötigen, können innerhalb einer vertrauenswürdigen Ausführungsumgebung umgesetzt werden, die auf Daten aus privaten Datenräumen arbeitet. Apps oder Algorithmen jeglicher Art halten sich an die beigefügten Datennutzungsrichtlinien (zertifiziert/ attestiert). Organisationen haben weiterhin die vollständige Souveränität über ihre Daten gemäß den beigefügten Richtlinien und dem definierten Anwendungsfall. Exemplarischer Prozess:

1. Daten und ML-Modelle können im privaten Datenraum von den Inhabern aufbereitet werden (Datenhoheit zu jederzeit gegeben).

2. Der Austausch von Metadaten erfolgt anschließend mit den safeFBDC Ecosystem Services. Hierbei können Informationen geteilt werden, wie:

  • Datenmodelle, Vokabular, Daten und ML-Modelle einschließlich ihrer Nutzungsrichtlinien

3. Plattformnutzer können die Daten verschiedener Organisationen über die safeFBDC Ecosystem Services auffinden und konsumieren:

  • Stöbern im Datenmarktplatz
  • Terms & Conditions akzeptieren
  • Virtueller Zugriff oder kopieren von Daten aus dem privaten Datenraum des Anbieters in den privaten Datenraum des Konsumenten
  • Nutzung der Daten gemäß den Nutzungsrichtlinien

4. Auffinden und Nutzen der Daten über Ecosystem Services für den vertraulichen Datenraum:

  • Durchsuchen des Datenmarktplatzes
  • Vorbereiten einer Anwendung, die im vertraulichen Datenraum läuft
  • Vertrauliche Anwendung zertifizieren
  • Vertrauliche Anwendungen kopieren Daten aus privaten Datenräumen in den vertraulichen Datenraum und arbeiten mit den Daten gemäß den festgelegten Nutzungsrichtlinien

5. Konsumieren der safeFBDC Use Cases:

  • Verbraucher durchsuchen den App- und API-Katalog
  • Apps und APIs können nach der Registrierung konsumiert werden

Auf Basis der Datenplattform werden KI-Algorithmen für eine Reihe konkreter Anwendungsfälle entwickelt und prototypisch erprobt. Das Projekt beteiligt sich zudem am Aufbau der Referenzarchitektur GAIA-X, um die Reichweite der Plattform zu erhöhen und die Möglichkeiten der KI-Entwicklung zu verbessern.

Aktuelle Referenzpapiere:

  • El-Hindi, M., Zhao, Z., Binnig, C. (2021). ACID-V: Towards a new class of DBMSs for Data Sharing. 47th International Conference on Very Large Data Bases. (Accepted for Publication)

Anwendung und Nutzen

Mit der FBDC-Plattform erhalten Akteure des Finanzsektors wie Banken, Behörden, sowie Unternehmen erstmals die Möglichkeit, KI-basierte Datenanalysen, Entscheidungsalgorithmen und Analysetools auf einer breiten Grundlage von europäischen Finanzdaten anzuwenden. Die Wettbewerbsfähigkeit des deutschen Finanzsektors wird entscheidend gestärkt, da durch die Entwicklung von neuen KI-basierten Finanzdienstleistungen oder Instrumenten etwa die Betrugsprävention erleichtert wird. Davon profitieren besonders auch Mittelständler und Start-ups.

Analyse von Klimarisiken im Risikomanagement von Finanzinstitutionen
Durch die Anwendung künstlicher Intelligenz sollen ESG ("Environmental Social Corporate Governance“) -Datenlücken geschlossen und neue Methoden zur verbesserten Berücksichtigung von ESG-bezogenen Chancen und Risiken entwickelt werden.

Bekämpfung von Geldwäsche
Die Weiterentwicklung sogenannter Anti-Money-Laundering (AML)-Softwareanwendungen ist der Fokus dieses Use Cases. Mithilfe von KI-Anwendungen sollen Transaktionen besser überwacht werden, um Geldwäsche schneller aufzudecken.

Erkennen und Verhindern von Marktmanipulation
Mithilfe von KI-Anwendungen können verdächtige Aktivitäten auf dem Wertpapiermarkt früher erkannt werden, um Preis- und Wettbewerbsverzerrung zu verhindern und deren Auswirkungen einzudämmen.

Datengestützte Einschätzung der Folgen geldpolitischer Entscheidungen
Die Informationsbasis zur Geldpolitik im Euro-Währungsraum weiter zu optimieren ist das Ziel dieses Use Cases. Besonders die Folgen geldpolitischer Entscheidungen der EZB sollen besser prognostiziert und eingeschätzt werden können. Dazu ergänzen KI-Algorithmen die bisher eingesetzten mathematischen und statistischen Werkzeuge.

Gestaltung neuer Risikomanagement- und Finanzierungsinstrumente entlang komplexer physischer Lieferketten
In diesem Teilprojekt werden neue Finanzierungslösungen entlang komplexer Supply Chains erforscht. Ein konkreter Use Case „Pay-per-Use Supply Chain Finance“ erprobt die im Teilprojekt erarbeiteten Grundlagen zur Gewinnung und gezielten Bereitstellung von finanzierungsrelevanten Daten in Industrie 4.0 Geschäftsmodellen.

Ohne SafeFBDCMit SafeFBDC
Unternehmen oder Banken speichern ihre Finanzdaten auf außereuropäischen Cloudspeichern, die oft nicht unter die DSGVO fallen. Die Datenhoheit ist gefährdet.Die Datenplattform von safeFBDC erfüllt alle Vorgaben der DSGVO.
Dem europäischen Finanzsektor fehlt eine gemeinsame Datengrundlage, um auf dieser Basis neue KI-Anwendungen zu entwickeln.Die FBDC-Plattform bündelt große Datenmengen so, dass die Entwicklung und Erprobung neuer KI-Anwendungen für den Finanzsektor ermöglicht wird. Die Zusammenarbeit erfolgt stets DSGVO-konform.
Finanzmarktinstrumente, etwa zur Bekämpfung von Geldwäsche oder Betrug, sind nicht so effizient, weil Anwendern die übergreifende Datenbasis fehlt. Auf Basis des Datenpools entstehen effiziente KI-gestützte Instrumente für Betrugsprävention, Risikomanagement, Nachhaltigkeit und mehr.
Start-ups und mittelständische Unternehmen fehlen Daten, um eigene KI-Anwendungen für den Finanzsektor aufzusetzen und zu trainieren.Die Daten auf der FBDC-Plattform können auch anderen Unternehmen zur Verfügung gestellt werden. Das Sicherheitskonzept garantiert eine datenschutzkonforme Nutzung der Daten. Die Datenhoheit bleibt gewahrt.

Ansprechpartner

SafeFBDC

FinTech Community Frankfurt GmbH
Dr. Sebastian Schäfer

01.01.2021-31.12.2023