KI verspricht Präzision, Geschwindigkeit und Automatisierung. Aber sie liefert nur dann, wenn die Datenbasis stimmt. Bei den meisten Instituten tut sie das nicht.

Sep 9, 2025
Transformation
Die unbequeme Wahrheit hinter jeder KI-Initiative
Kein KI-Projekt scheitert in der Präsentation. Es scheitert in der Datenlage. Das ist die Wahrheit, die in den meisten Kickoff-Meetings nicht ausgesprochen wird und die sich drei Monate später als teures Missverständnis erweist.
Wie verbreitet das ist, zeigt eine Studie von Dun & Bradstreet mit deutlicher Zahl: 61 Prozent der KI-Projekte bei Banken und 70 Prozent bei Versicherern scheitern an einer mangelhaften Datenbasis. Nur 35 Prozent der Banken und 27 Prozent der Versicherer können nach eigener Einschätzung auf Grundlage ihrer Daten verlässlich entscheiden. Finanzinstitute verfügen über enorme Datenmengen, und das ist ein Vorteil. Aber Menge ist nicht Qualität, und verteilte Daten sind nicht verfügbare Daten. Beides sind Probleme, die vor dem ersten KI-Modell gelöst werden müssen.
Das Siloproblem
In den meisten Finanzinstituten leben Daten in Systemen, die nicht miteinander sprechen: Kernbankensystem, CRM, Dokumentenmanagement, Risikomanagement, Reporting. Die Daten existieren, aber sie sind nicht nutzbar, weil niemand sie zusammenführt. KI braucht verbundene Daten. Wer keine Datenstrategie hat, baut KI auf einer Grundlage, die nicht trägt.
Das Silo ist selten ein technisches Problem allein. Es ist meist ein organisatorisches: Jeder Bereich besitzt seine Daten, definiert seine eigenen Felder und schützt seine Hoheit. Eine Datenstrategie, die nur die Technik adressiert und die Eigentumsfrage offen lässt, scheitert an genau diesem Besitzdenken. Die verbundene Datenbasis entsteht nicht durch eine Schnittstelle, sondern durch eine Entscheidung darüber, wem die Daten gehören und wer sie pflegen muss.
Das Qualitätsproblem
Daten sind so gut wie die Prozesse, die sie erzeugen. Wenn Kundendaten von zehn Beratern auf zehn verschiedene Arten erfasst werden, entsteht kein verlässlicher Datenbestand, sondern ein Flickenteppich, der jede Auswertung verzerrt. Eine KI, die auf solchen Daten lernt, lernt die Fehler mit und reproduziert sie im großen Maßstab.
Genau hier liegt der Grund, warum laut der genannten Studie 56 Prozent der Banken und 79 Prozent der Versicherer ihren eigenen Daten nur eingeschränkt vertrauen. Dieses Misstrauen ist die ehrlichste Kennzahl überhaupt, denn es bedeutet: Die Entscheider wissen, dass ihre Grundlage wackelt, und handeln trotzdem so, als wäre sie belastbar. Eine Datenstrategie macht dieses Misstrauen produktiv, indem sie die Qualität dort hebt, wo sie für die ersten Use Cases gebraucht wird, statt alles auf einmal sanieren zu wollen.
Was eine Datenstrategie konkret klärt
Eine brauchbare Datenstrategie ist kein 200-seitiges Konzept, sondern beantwortet wenige harte Fragen. Welche Daten brauchen die priorisierten KI-Anwendungsfälle wirklich, und nur diese zuerst? Wo liegen sie, wer besitzt sie, und wer ist für ihre Qualität verantwortlich? Welche Mindestqualität ist nötig, damit der Use Case trägt, und wie wird sie laufend überwacht? Und welche Definitionen gelten verbindlich, damit dasselbe Feld in jedem System dasselbe bedeutet?
Der Unterschied zwischen einer Datenstrategie und einem Datenprojekt liegt im Zuschnitt. Wer alle Daten des Hauses auf einmal in Ordnung bringen will, wird nie fertig. Wer die Datenarbeit an den priorisierten Use Cases ausrichtet, liefert schnell genug, um Vertrauen aufzubauen, und erweitert die saubere Basis Schritt für Schritt.
Die Reihenfolge entscheidet
Der häufigste Fehler ist, KI und Daten parallel oder in der falschen Reihenfolge anzugehen. Ein Institut kauft eine KI-Lösung, stellt fest, dass die Daten nicht passen, und beginnt mitten im Projekt mit der Datensanierung. Das ist der teuerste denkbare Zeitpunkt. Wer die Datenfrage vor dem ersten Modell klärt, zumindest für den ersten Use Case, spart sich genau diesen Bruch.
Das heißt nicht, jahrelang Daten aufzuräumen, bevor KI überhaupt ein Thema wird. Es heißt, beides verzahnt zu planen: die Datenarbeit so weit voranzutreiben, wie der erste Anwendungsfall sie braucht, und parallel die Strukturen zu schaffen, die den nächsten leichter machen. Daten und KI sind keine getrennten Projekte, sondern zwei Seiten derselben Initiative.
Verfügbarkeit ist nicht gleich Qualität
Es lohnt, zwei Dinge sauber zu trennen, die in der Praxis ständig vermischt werden. Verfügbarkeit bedeutet, dass die Daten technisch erreichbar und zusammengeführt sind. Qualität bedeutet, dass sie korrekt, vollständig und einheitlich erfasst sind. Ein Institut kann hervorragend verfügbare, aber miserabel erfasste Daten haben, oder umgekehrt saubere Daten, die in einem System eingeschlossen sind, an das niemand herankommt. Beide Fälle führen zum selben Ergebnis: Die KI liefert nicht.
Diese Unterscheidung ist nicht akademisch, sie bestimmt die Reihenfolge der Arbeit. Wo das Problem die Verfügbarkeit ist, geht es um Integration und Zugriff. Wo das Problem die Qualität ist, geht es um die Prozesse, die die Daten erzeugen. Wer beides in einen Topf wirft, behandelt das eine Symptom und wundert sich, dass das andere bleibt.
Datenqualität entsteht am Entstehungsort
Der entscheidende Hebel für Qualität liegt nicht in der nachträglichen Bereinigung, sondern an der Stelle, an der die Daten entstehen. Wenn die Erfassung im Beratungsgespräch, im Onboarding oder in der Sachbearbeitung sauber und einheitlich ist, braucht es später keine teuren Reinigungsprojekte. Wenn sie es nicht ist, wird jede nachgelagerte Bereinigung zur Sisyphusarbeit, weil ständig neue fehlerhafte Daten nachkommen.
Das verschiebt die Datenstrategie von einem IT-Thema zu einem Prozessthema. Die Frage ist nicht nur, wie man bestehende Daten ordnet, sondern wie man verhindert, dass schlechte Daten überhaupt erst entstehen. Klare Pflichtfelder, eindeutige Definitionen und eine Erfassung, die den Mitarbeitenden nicht zu Umgehungen zwingt, sind wirksamer als jedes Bereinigungsprojekt im Nachhinein.
Was der Verzicht auf eine Datenstrategie kostet
Der Verzicht ist selten eine bewusste Entscheidung, er ist meist ein Aufschub. Man will mit KI schnell sichtbare Ergebnisse, und die Datenarbeit erscheint als langweiliger Vorlauf, den man später nachholt. Die Rechnung kommt verlässlich: Das KI-Projekt startet, läuft auf die Datenlücke, und nun wird mitten im laufenden Projekt unter Zeitdruck saniert, zum höchsten denkbaren Preis und mit dem größten Frust.
Genau dieser Ablauf steckt hinter den 61 und 70 Prozent gescheiterter Projekte aus der Dun-&-Bradstreet-Studie. Es sind selten Projekte, die an einem zu schwachen Modell scheitern. Es sind Projekte, die an einer Datenbasis scheitern, deren Zustand man vorher gekannt, aber verdrängt hatte. Eine Datenstrategie ist deshalb keine Bremse vor der KI, sie ist die Versicherung gegen genau diesen teuersten aller Fehler.
Ein pragmatischer erster Schritt
Der Einstieg in eine Datenstrategie muss nicht das große Datenmodell für das gesamte Haus sein. Pragmatischer und wirksamer ist der umgekehrte Weg: Man nimmt den einen priorisierten Use Case, listet genau die Datenfelder auf, die er braucht, und prüft für jedes einzelne, wo es liegt, wer es besitzt und ob seine Qualität ausreicht. Schon diese kleine Übung deckt fast immer die entscheidenden Lücken auf, und sie tut es bevor Budget in Technik fließt.
Aus dieser punktuellen Prüfung wächst die breitere Strategie organisch. Felder und Definitionen, die für den ersten Use Case geklärt wurden, gelten oft auch für den nächsten. So entsteht Schritt für Schritt eine saubere, verbundene Basis, getrieben von echten Anwendungsfällen statt von einem abstrakten Datenideal, das nie fertig wird. Datenstrategie wird so vom unendlichen Großprojekt zu einer Abfolge konkreter, abgeschlossener Schritte.
Daten sind kein IT-Thema, sondern ein Führungsthema
Solange Datenqualität als Aufgabe der IT gilt, bleibt sie liegen, weil die IT die fachlichen Definitionen nicht setzen kann und die Fachbereiche sich nicht zuständig fühlen. Datenstrategie ist deshalb eine Führungsaufgabe. Sie verlangt eine Entscheidung darüber, wer welche Daten verantwortet, und ein Mandat, das diese Verantwortung durchsetzt. Ohne diese Klarheit bleibt jede KI-Initiative eine Wette auf eine Grundlage, die niemand pflegt.
Mehr zum Thema: KI-Betrugserkennung in der Versicherung: Warum 20 Prozent der Schäden verdächtig sind. und Prozessautomatisierung in der Finanzbranche: Warum es kein Effizienzthema ist.
Wir klären mit Ihnen, welche Daten Ihre wichtigsten Use Cases brauchen, wo die Lücken liegen und in welcher Reihenfolge Sie sie schließen. Strategie und Umsetzung aus einer Hand. Beginnen Sie mit einer Potenzialanalyse.
Ob Sie ein konkretes Projekt haben oder erst erkunden möchten, was möglich ist – sprechen Sie mit uns.


