Ein KI-Pilot ist günstig, der Regelbetrieb über Millionen Vorgänge ist es nicht. Wer die Kostenlogik von Sprachmodellen nicht versteht, kalkuliert den Business Case falsch.

Jun 16, 2026
Organisation
Der Pilot ist günstig, der Betrieb nicht
Ein KI-Pilot kostet im Test oft nur Centbeträge pro Vorgang, und genau das verleitet dazu, den Business Case zu schön zu rechnen. GenAI-Kosten skalieren jedoch mit jedem einzelnen Vorgang, weil Sprachmodelle nach verarbeiteter Textmenge abrechnen. Was im Piloten auf wenigen hundert Fällen unsichtbar bleibt, wird über Millionen Vorgänge im Jahr zu einem Posten, den niemand budgetiert hat. Wer die Kostenlogik von Sprachmodellen nicht versteht, kalkuliert den Nutzen falsch und erlebt die Rechnung erst im Regelbetrieb.
Warum die Kostenlogik anders ist als bei klassischer Software
Klassische Automatisierung wie RPA kostet im Kern eine feste Lizenz, danach ist jeder weitere Vorgang nahezu gratis. Bei Sprachmodellen ist es umgekehrt: Jeder Aufruf kostet, und der Preis steigt mit der Menge an Text, die hineingegeben und herausgegeben wird. Eine Anwendung, die viel Kontext mitschickt, lange Dokumente verarbeitet oder mehrere Modellaufrufe hintereinander braucht, vervielfacht diese Kosten pro Vorgang. Die Stückkosten sinken also nicht mit dem Volumen, sie bleiben, und das verändert die gesamte Wirtschaftlichkeitsrechnung.
Die Treiber, die die Rechnung aufblähen
Vier Faktoren treiben die Kosten besonders. Langer Kontext, der bei jeder Anfrage mitgeschickt wird. Retrieval-Schritte, die zusätzliche Aufrufe erzeugen. Mehrstufige Agenten, die für eine Aufgabe viele Modellaufrufe aneinanderreihen. Und der Griff zum größten verfügbaren Modell, wo ein kleineres die Aufgabe ebenso gut löst. Gerade bei autonomen Agenten summiert sich das schnell, was einer der Gründe ist, warum Gartner erwartet, dass mehr als 40 Prozent der Agentic-AI-Projekte bis Ende 2027 wieder eingestellt werden, unter anderem wegen unklarer Wirtschaftlichkeit. Mehr dazu in der Produktionslücke bei Agentic AI.
Was FinOps für KI bedeutet
FinOps überträgt die Kostensteuerung der Cloud auf KI-Workloads. Konkret heißt das, die Kosten pro Vorgang zu messen statt nur die Gesamtsumme, das richtig dimensionierte Modell für die jeweilige Aufgabe zu wählen, wiederkehrende Anfragen zwischenzuspeichern und feste Budgets sowie Grenzwerte zu setzen, bevor eine Anwendung in die Breite geht. Diese Steuerung gehört in jede Plattformentscheidung und in jeden Business Case, weil sie aus einer offenen Kostenposition eine planbare macht. Auch die Architektur entscheidet mit, etwa ob eine schlanke Plattform oder ein überdimensioniertes Setup zum Einsatz kommt.
Wenn Sie ein KI-Vorhaben vor der Skalierung auf seine echten Betriebskosten prüfen wollen, rechnen wir die Stückkosten mit Ihnen durch und benennen die Stellschrauben. Buchen Sie eine Sprechstunde, dann sehen wir uns Ihren Anwendungsfall an.
Ob Sie ein konkretes Projekt haben oder erst erkunden möchten, was möglich ist – sprechen Sie mit uns.


