Die Cloud-Rechnung kommt jeden Monat. Und jeden Monat ist sie höher als erwartet. Eine Studie von Flexera (State of the Cloud Report 2026) zeigt: 67% der Unternehmen überschreiten ihr Cloud-Budget. Durchschnittlich um 30%. Bei Unternehmen mit KI-Workloads sogar um 45%.
Das Problem ist nicht die Cloud selbst. Es ist die fehlende Transparenz und Governance.
Warum die Kosten explodieren
- KI-Compute: GPU-Instanzen für Inference und Training sind um Faktor 10-50x teurer als Standard-VMs. Ein einziger GPT-4-basierter Copilot kann bei hoher Nutzung 5.000 EUR/Monat an API-Kosten verursachen. Multipliziert mit 200 Mitarbeitenden: 1 Mio EUR/Jahr.
- Zombie-Ressourcen: VMs die laufen, aber niemand nutzt. Snapshots die niemand löscht. Testumgebungen die nach dem Projekt weiterlaufen. Laut Flexera: 27% aller Cloud-Ausgaben sind Verschwendung.
- Overprovisioning: VMs mit 8 vCPUs und 32 GB RAM, die zu 5% ausgelastet sind. Weil der Entwickler "sicherheitshalber" eine Nummer grösser gewählt hat.
- Datenausgang (Egress): Daten in die Cloud zu laden ist kostenlos. Daten herauszuholen kostet. Bei datenintensiven Anwendungen (Analytics, KI-Training, Backup) kann Egress 10-20% der Gesamtrechnung ausmachen.
- Reservierungen nicht genutzt: Unternehmen kaufen Reserved Instances oder Savings Plans, nutzen sie aber nicht vollständig aus. 35% aller Reservierungen sind laut AWS-Daten underutilized.
FinOps als Disziplin
FinOps (Financial Operations) ist kein Tool, sondern eine Praxis: Engineering, Finance und Business arbeiten zusammen, um Cloud-Kosten zu verstehen, zu optimieren und vorherzusagen. Die FinOps Foundation (Teil der Linux Foundation) hat 2026 über 10.000 zertifizierte Practitioner weltweit.
Die drei Phasen:
- Inform: Transparenz schaffen. Wer verbraucht was? Welches Team? Welches Projekt? Tagging-Standards durchsetzen. Dashboards aufbauen.
- Optimize: Right-Sizing (VMs verkleinern), Reservierungen kaufen, Spot-Instanzen nutzen, Zombie-Ressourcen eliminieren, Auto-Scaling konfigurieren.
- Operate: Kontinuierlicher Prozess. Monatliche Cost Reviews, Budget-Alerts, Governance-Policies, Showback/Chargeback an Teams.
KI-Workloads: Die neue FinOps-Herausforderung
KI-Workloads stellen FinOps vor neue Probleme: Die Kosten sind schlecht vorhersagbar (abhängig von Prompt-Länge, Token-Verbrauch, Modellwahl), die Nutzung variiert stark, und die ROI-Messung ist schwieriger als bei klassischen Workloads.
Best Practices für KI-FinOps:
- Token-Budgets pro Team/Projekt definieren
- Modell-Routing: Einfache Aufgaben an günstigere Modelle (GPT-4o-mini statt GPT-5.4)
- Prompt-Caching nutzen (spart 50-80% bei wiederholten Anfragen)
- Batch-APIs statt Echtzeit-APIs wo möglich (50% günstiger)
- Lokale Modelle für standardisierte Aufgaben (Ollama, siehe unser separater Artikel)
Cloud-Kosten sind 2026 der drittgrösste IT-Kostenblock nach Personal und Lizenzen. Wer sie nicht aktiv managed, verbrennt Geld. FinOps ist keine Option mehr.
Quellen: Flexera State of the Cloud Report 2026, FinOps Foundation Annual Report, AWS Cost Explorer Benchmark Data, Gartner Cloud Cost Management MQ.