Lokale KI: die vernünftige Wahl für Agenturen und Unternehmen
Im Juni war Claude Fable 5 über Nacht offline. Warum lokale KI 2026 die vernünftige Wahl für Agenturen und Unternehmen ist: Kontrolle, EU AI Act und Modellreife.

Als die Cloud über Nacht zumachte
Am 12. Juni war Claude Fable 5 weg. Drei Tage nach dem Release zwang eine US-Exportverfügung Anthropic, das Modell und seine größere Schwester Mythos abzuschalten. Nicht gedrosselt, nicht teurer geworden. Offline, für alle, von einem Tag auf den anderen. Wir haben den Fall damals im Newsroom auseinandergenommen (siehe „Claude Mythos und Fable 5 gesperrt").
Für uns war das mehr als eine Branchen-Anekdote. Es war der Moment, in dem ein abstraktes Risiko konkret wurde. Wer seine KI an dem Morgen lokal laufen hatte, hat den Editor aufgemacht und weitergearbeitet. Wer komplett auf einen einzelnen Cloud-Anbieter gesetzt hatte, saß da und konnte nichts tun.
Aus dieser Beobachtung ist eine Haltung geworden, die wir inzwischen offen vertreten. Lokale KI ist 2026 kein Bastler-Thema mehr, sondern die vernünftige Wahl für viele Agenturen und Unternehmen. Nicht für alles, aber für deutlich mehr, als die meisten annehmen. Drei Dinge sind im Lauf des Jahres gleichzeitig wahr geworden.
Kontrolle: Was auf deiner Hardware läuft, kann dir niemand abdrehen
Fable 5 war kein Ausreißer, sondern ein Vorgeschmack. Cloud-KI hängt an Bedingungen, die du nicht in der Hand hast. Eine Exportverfügung, eine Preiserhöhung über Nacht, ein abgekündigtes Modell, ein neues Rate-Limit, eine Region, die plötzlich gesperrt ist. Jede dieser Entscheidungen trifft jemand anderes, und du erfährst es erst, wenn dein Ablauf steht.
Ein Modell auf deiner eigenen Hardware kennt diese Abhängigkeit nicht. Es läuft, solange die Maschine läuft. Keine API, die sich unter dir ändert, kein Anbieter, der die Konditionen anzieht, sobald du abhängig genug bist. Für eine Agentur, die Kundenprojekte mit festen Zusagen fährt, ist diese Planbarkeit oft mehr wert als das letzte Quäntchen Modellqualität. Ein Werkzeug, das morgens vielleicht nicht da ist, ist im Projektalltag kein verlässliches Werkzeug.
Datenschutz: Was nicht rausgeht, kann nicht abfließen
Der zweite Grund wiegt für viele unserer Kunden noch schwerer, weil er ihre sensibelsten Daten betrifft. Mandantenunterlagen, Patientendaten, Personalakten, Verträge, interner Quellcode. Sobald so etwas an ein Cloud-Modell geht, verlässt es deinen Einflussbereich. Es wird übertragen, irgendwo verarbeitet, im Zweifel protokolliert, und du musst dem Anbieter glauben, dass damit nichts passiert, was nicht passieren soll. Läuft das Modell lokal, stellt sich die Frage gar nicht. Die Daten bleiben auf deiner Maschine, sie können unterwegs nicht abgefangen werden, niemand trainiert heimlich darauf, und die Angriffsfläche schrumpft auf das eigene Haus.
Dazu kommt die rechtliche Seite, die gerade enger wird. Ab August 2026 greifen die Pflichten des EU AI Act für höher eingestufte Systeme, etwa in Personal, Banking und Versicherung. Die Bußgelder liegen deutlich über dem, was die DSGVO vorsieht: bis zu 35 Millionen Euro oder 7 Prozent vom weltweiten Jahresumsatz. Und die DSGVO selbst macht aus jeder Übermittlung personenbezogener Daten an einen externen Anbieter eine Frage, die man beantworten können muss. Läuft das Modell im eigenen Haus, verschwindet diese Frage, weil die Übermittlung gar nicht erst stattfindet. Kein Transfer, kein Drittland, kein Auftragsverarbeitungsvertrag, der im Ernstfall hält oder eben nicht.
Der Markt hat das längst verstanden. Der europäische Spend für souveräne Cloud- und KI-Infrastruktur verdoppelt sich von 2025 auf 2026 nahezu, und über die Hälfte der westeuropäischen Unternehmen zieht ihre Abhängigkeit von außereuropäischen Anbietern aktiv neu auf. Das ist keine Ideologie, das ist Beschaffung.
Reife: Die offenen Modelle sind gut geworden
Lange war das stärkste Gegenargument die Qualität. Lokal lief, was man sich eben leisten konnte, und das war spürbar schlechter als die Cloud. 2026 stimmt das so nicht mehr. Offene Modelle wie Qwen3 mit sauberer Apache-2.0-Lizenz, Gemma 4 oder DeepSeek für anspruchsvolles Reasoning sind für den Großteil der täglichen Firmenarbeit gut genug. Texte zusammenfassen, E-Mails einsortieren, Code schreiben, Dokumente durchsuchen. Für diese Aufgaben brauchst du kein Frontier-Modell, du brauchst ein verlässliches.
Auf unserer Plattform kommt ein zweiter Vorteil dazu. Apple Silicon mit seinem geteilten Speicher lässt diese Modelle schnell und sparsam laufen. Bereits ein Mac Mini mit 64 GB ist eine ernsthafte KI-Maschine, die über MLX Modelle stemmt, die auf manch größerer Grafikkarte nicht passen. Du brauchst also keine teure Spezial-Hardware und kein Rechenzentrum, um anzufangen, sondern ein Gerät, das ohnehin auf vielen Schreibtischen steht.
Lokal heißt nicht gegen die Cloud
An dieser Stelle ein ehrliches Wort, damit kein falscher Eindruck entsteht. Bei den wirklich harten Aufgaben sind die großen Cloud-Modelle den lokalen klar überlegen, und zwar deutlich. Fable 5 war vor seiner Abschaltung das beste Coding-Modell der Welt, und ChatGPT 5.6, das diese Woche erscheint, zielt auf genau diese Spitze. Ein offenes Modell, das bei dir lokal läuft, spielt in dieser Liga nicht mit, und es wäre unseriös, das zu behaupten.
Genau deshalb framen wir das nicht als Entweder-oder. Die richtige Frage ist nicht „lokal oder Cloud", sondern „welches Modell an welchem Ort". Das stärkste Cloud-Modell darf die wirklich schweren Aufgaben übernehmen, wenn die Daten dafür unkritisch sind. Die sensible, wiederkehrende Arbeit, die den Großteil eines Firmenalltags ausmacht, gehört dahin, wo sie das Haus nicht verlässt. Die Richtung ist klar: Der Wechsel zwischen lokalem Modell, eigener Cloud und externem Anbieter wird zunehmend zur Konfigurationsfrage, nicht zur Architekturentscheidung.
Was wir Kunden raten
Der Einstieg ist auch hier klein und konkret, nicht das große Souveränitäts-Programm. Such dir die eine Aufgabe, bei der dir am unwohlsten ist, dass die Daten nach draußen gehen. Mandantenunterlagen, Patientendaten, interne Dokumente, Quellcode, Kundendaten. Lass dort ein lokales Modell laufen und behalte die Cloud für die Fälle, in denen sie wirklich der Hebel ist. Dann miss, was es bringt, bevor du erweiterst.
Genau das entwickeln wir in Apps und interne Tools ein, von On-Device-Funktionen bis zum vollständig souveränen Setup.
Fazit
Fable 5 wird nicht die letzte Cloud-KI sein, die über Nacht verschwindet. Wer seine wichtigsten Abläufe daran hängt, geht eine Wette ein, deren Regeln jemand anderes schreibt. Lokale KI ist 2026 die langweilige, verlässliche Alternative für die Arbeit, die das Haus nicht verlassen sollte. Sie ist gut genug geworden, sie hält sensible Daten im Haus, und sie läuft auch an dem Morgen, an dem die Cloud dich aussperrt.
Wenn du wissen willst, welcher Teil eurer KI sinnvoll lokal laufen könnte und was besser in der Cloud bleibt, melde dich. Wir rechnen das mit dir durch, bevor wir über Technik reden.

