Die kollektive KI-Psychose: Realitätsverlusts in KI-Teams

95 % aller KI-Piloten scheitern — doch das ist nur ein Symptom. Die 7 Dimensionen der kollektiven KI-Psychose. Ein Reality-Check für CTOs und Entscheider.

Die Psychose beginnt im Meetingraum

I strongly believe there are entire companies right now under heavy AI psychosis and its impossible to have rational conversations about it with them. I can't name any specific people because they include personal friends I deeply respect, but I worry about how this plays out.

I…
— Mitchell Hashimoto (@mitchellh) May 15, 2026

Der Satz hallt nach im sterilen Konferenzraum. Eine Runde von Führungskräften, die sich alle sechs Wochen trifft, um den neuesten KI-Rollout zu besprechen. Der Pitch ist jedes Mal derselbe: transformativ, disruptiv, alternativlos. Die PowerPoint-Folien zeigen steil ansteigende Kurven. Aber in diesem Raum — in unzähligen Meetingräumen weltweit — stellt niemand mehr die eine Frage: Schafft das tatsächlich Wert, oder beschäftigen wir uns nur damit, beschäftigt zu wirken? Die Irritation sitzt tief, denn die Antwort wäre unbequem.

95 Prozent aller KI-Piloten scheitern. Messbar. Im Profit-and-Loss-Statement. Ein gescheiterter GenAI-Pilot kostet im Schnitt 2,3 Millionen Dollar. Rechnet man die abgebrochenen KI-Investitionen des Jahres 2025 zusammen, ergibt sich ein Branchenverlust von 4,8 Milliarden Dollar. Das ist kein Sandkasten-Spielgeld mehr. Und dann der Punch, der sitzen bleibt: Mehr als 80 Prozent aller AI- und ML-Projekte erreichen nie die Produktion. Eine ernüchternde Bilanz für eine Industrie, die sich seit zwei Jahren im Dauer-Hype-Vertrauensvorschuss sonnt. Der Kontrast zwischen Diskurs und Realität ist kein Riss mehr — es ist eine Kluft.

Die Vordenker zweifeln

Andrej Karpathy, Gründungsmitglied von OpenAI, einer der einflussreichsten Köpfe der KI-Forschung, steht sinnbildlich für den Wandel. Seine Aussagen vor 2025 lasen sich wie ein Manifest des Machbaren: „Everything is possible, and all failures ultimately boil down to a skill issue.“ Wer scheitert, kann es einfach nicht richtig. Dann kam Dezember 2025. Und mit ihm das Eingeständnis, das wie ein seismischer Schlag durch die Branche ging: „I probably haven’t written a line of code since December.“

Der Mann, der einst die Grenzen des Möglichen definierte, hatte aufgehört, selbst zu programmieren. Im No Priors Podcast sprach er offen über das, was er „AI Psychosis“ nannte — den Zustand, in dem die Architekten der Technologie selbst den Bezug zu ihren eigenen Werkzeugen verlieren. Seine Metapher: „I feel like I’m simultaneously having a conversation with an extremely intelligent PhD student … while also talking to a ten-year-old child.“ Wenn die, die das Fundament gelegt haben, plötzlich eingestehen, dass sie ihre eigene Kreation nicht mehr vollständig durchdringen — was bedeutet das für den Rest der Industrie? Eine kollektive Betroffenheit macht sich breit. Die Selbstkritik der Eliten ist kein Zeichen von Schwäche. Sie ist das erste objektive Symptom.

Das Demenz-Syndrom

Ein erfahrener Engineering-Leiter beschrieb den Prozess mit einem Satz, der unter die Haut geht: „KI-Adoption fühlt sich an wie das Verlieren von Kollegen an Demenz.“ Das ist kein poetischer Vergleich mehr. Es ist die präzise Beschreibung eines Phänomens, das die Forschung nun systematisch erfasst. Ein Preprint aus der Psychopathologie-Forschung, veröffentlicht im März 2026, führt den Begriff des Structural Drift ein — ein Konzept, das ursprünglich zur Beschreibung von Persönlichkeitsveränderungen bei neurodegenerativen Erkrankungen entwickelt wurde.

Übertragen auf Organisationen zeigt es ein alarmierendes Muster: Sieben Domänen, in denen sich der kollektive Realitätsverlust manifestiert — von Ipseity (Verlust des Selbst-Gefühls) über Intersubjectivity (geteilte Falschgewissheit) bis Existentiality (Sinnentleerung). Was als journalistische Metapher begann, wird zum diagnostischen Rahmen. Die Psychose ist kein Etikett mehr, sondern ein analysierbares, systemisches Phänomen. Was der einzelne User als Halluzination erlebt, wird im Team zur geteilten Falschgewissheit.

Der Blick in den Spiegel

Apophanous Mood (wahnhaftes Gewissheitsgefühl), Synthetic Certainty (algorithmische Gewissheit ohne Fundierung), Epistemic Isolation (Abschottung von dokumentiertem Wissen) — diese Begriffe beschreiben Zustände, die Betroffene an sich selbst nicht erkennen. Die Forschung zeigt: Die Symptome sind unsichtbar für jene, die sie am stärksten zeigen.

Bevor Sie jetzt sagen: „Das ist mein Team nicht“ — genau das ist Teil der Diagnose. Der erste Schritt aus der Psychose ist der benennende Blick in den Spiegel. Jede der sieben Dimensionen des Structural Drift lässt sich auf ein konkretes Engineering-Problem herunterbrechen. Und jede trägt eine Indikator-Frage in sich, die den Grad der eigenen Betroffenheit messbar macht.

Wo beginnt der Realitätsverlust?

Was genau unterscheidet „KI-Psychose“ von gesundem Hype?

Hier der Unterschied: Fehlende Realitätsprüfung. Hype ist übertriebene Erwartung, aber die Fähigkeit zur Korrektur bleibt erhalten. Die KI-Psychose hingegen zeigt klinische Symptome. Apophanous Mood (wahnhaftes Gewissheitsgefühl) — Teams halten Output für wahr, weil er von der KI kommt, nicht weil er validiert wurde. Synthetic Certainty (algorithmische Gewissheit ohne Fundierung) — Zahlen und Fakten werden übernommen, ohne sie zu hinterfragen. Epistemic Isolation (Abschottung von dokumentiertem Wissen) — die KI wird zur primären Wissensquelle, noch vor Dokumentation oder Fachexperten. Wo Hype vorantreibt, lähmt Psychose die Urteilsfähigkeit.

Warum scheitern 80 Prozent aller KI-Projekte trotz Milliarden-Investments?

Drei Hauptgründe dominieren die Ausfallstatistik. Erstens die Integration Fallacy — Unternehmen unterschätzen die Einbindung in bestehende Systeme um den Faktor 4,2. Bei Legacy-CRM steigt der Faktor auf 6,8. Zweitens die mangelnde Daten-Readiness: 43 Prozent der Organisationen verfügen nicht über die Datenqualität, die ein Produktivsystem benötigt. Drittens das fehlende Code-Hardening: KI-generierter Code wird seltener reviewed, seltener dokumentiert und seltener auf Sicherheit geprüft. Die Folge: Black-Box-Repositories, die niemand mehr wirklich versteht. Die Wartungskosten solcher Systeme liegen im Schnitt bei 380.000 Dollar pro Jahr — geplant waren 42.000.

Welche KI-Modelle gelten als besonders psychose-trächtig?

Die Forschung unterscheidet klar zwischen High-Risk- und Safe-Modellen. Als besonders risikoreich gelten GPT-4o (Release 13. Mai 2024), Grok 4.1 Fast (19. November 2025) und Gemini 3 Pro (18. November 2025). Diese Modelle zeigen die höchste Rate an Synthetic Certainty bei gleichzeitig minimaler Unsicherheitskommunikation. Sie überzeugen — und täuschen. Als sicherer eingestuft werden Claude Opus 4.5 (24. November 2025) und GPT-5.2 Instant (11. Dezember 2025), die eingebaute Unsicherheitsindikatoren besitzen und einen geringeren Apophanous-Mood-Effekt auslösen. Die Wahl des Modells ist kein technisches Detail mehr. Sie ist eine strategische Entscheidung über den Grad der Selbsttäuschung.

Wie erkenne ich „Manic Building“ in meinem Team?

Manic Building beschreibt ein Verhaltensmuster, das dem Spielsucht-Mechanismus gleicht. Der Slot-Machine-Effekt (Variable Ratio Reinforcement) sorgt dafür, dass 80 Prozent der Payouts unabhängig von der tatsächlichen Qualität als Erfolg wahrgenommen werden. Warnsignale sind: Das Team führt keine Code-Reviews mehr durch, erstellt keine Dokumentation, hat keinen Rollback-Plan und kann Architektur-Entscheidungen nicht mehr in drei Sätzen erklären. Der Indikator: Gilt Code-Review noch als Qualitätsmerkmal — oder als Bremse? Wer diesen Unterschied nicht mehr klar beantworten kann, befindet sich mitten im Manic Building.

Gibt es einen Ausweg aus dem „Pilot-Purgatory“?

Ja — aber er erfordert strukturelle Eingriffe. Die Rückabwicklungsquote für übereilte KI-Entlassungen wird bis 2027 auf über 50 Prozent geschätzt. Drei Hebel wirken. Token-Governance: Wer kontrolliert, wie viele Tokens ein Team verbrauchen darf? Bei FAANG liegt die Quote bei 300 täglich pro Kopf — ein Richtwert, den viele Organisationen ignorieren. Structural-Drift-Audit: Regelmäßige Überprüfung der sieben Dimensionen auf Symptome. Capability-Retention-Prinzip: 20 Prozent der Aufgaben bleiben der menschlichen Entscheidung vorbehalten, 80 Prozent dürfen delegiert werden — nicht umgekehrt. Die Devise lautet: Können bewahren, nicht delegieren.

Perspektiven

Klinisch-psychiatrische Perspektive

Das medRxiv-Preprint vom März 2026 behandelt Organisationen als Patienten. Es überträgt das Konzept des Structural Drift aus der individuellen Psychopathologie auf kollektive Einheiten. Wo Søren Dinesen Østergaard 2023 erstmals „Chatbot Psychosis“ als individuelles Phänomen beschrieb, zeigt die neue Forschung: Dieselben sieben Domänen — Ipseity, Temporality, Perceptuality, Speech, Intersubjectivity, Atmosphere, Existentiality — lassen sich auf Teamdynamiken abbilden. Der entscheidende Befund: Was der einzelne User als Halluzination erlebt, wird im Team zur geteilten Falschgewissheit. Die Synthetic Certainty entsteht nicht durch schlechte Modelle, sondern durch fehlende institutionelle Robustheit.

Engineering-Realitäts-Perspektive

Die Zahlen aus der Praxis zeichnen ein düsteres Bild. Die tatsächlichen Wartungskosten für Live-KI-Systeme liegen bei 380.000 Dollar pro Jahr — das Neunfache der geplanten 42.000. Ursache: unzureichendes Code-Hardening, fehlende Dokumentation, Black-Box-Repositories, die niemand mehr durchdringt. Bei Meta verbrauchen 85.000 Mitarbeiter monatlich 60 Billionen Tokens — ein interner Wettbewerb, der im „Claudeonomics“-Dashboard als Token-Legenden-Status zelebriert wird. Karpathys radikale 20:80-Delegation — 20 Prozent menschliche Kontrolle, 80 Prozent KI-Output — ist kein Qualitätsstandard, sondern ein Notruf. Mitchell Hashimoto warnt: „You can automate yourself into a very resilient catastrophe machine.“

Business-Strategie-Perspektive

Die Coasean Singularity beschreibt einen Punkt, an dem die Senkung von Transaktionskosten durch KI die Marktstruktur eines Unternehmens so weit erodiert, dass seine Existenzberechtigung infrage steht. Blindes Vertrauen in KI-Output führt zur Enablement Illusion: Unternehmen investieren in Werkzeuge, nicht in Prozesse. Die Analysten-Prognose vom Januar 2026 zeigt, dass bis 2030 lediglich 6 Prozent der US-Jobs — etwa 10,4 Millionen — vollständig durch KI ersetzt werden, während 20 Prozent eine Augmentierung erfahren. Gleichzeitig kündigen Firmen KI-bedingte Entlassungen an, die in der Rückabwicklungsquote von über 50 Prozent enden. Ein unabhängiges Research-Institut stellt fest: „Many companies are announcing AI-related layoffs … highlighting a trend of AI washing.“ Die Kosten der Illusion sind messbar. Sie sind nicht im Hype eingepreist.

Die 7 Dimensionen des Structural Drift

Was sich klinisch abstrakt anhört, wird in der Engineering-Realität konkret — wie diese sieben Domänen zeigen:

Domäne	Definition	Engineering-Entsprechung	Indikator-Frage
Ipseity	Verlust des Selbst-Gefühls	Team weiß nicht mehr, was es selbst kann vs. was die KI kann	„Können wir diesen Code ohne KI noch warten?“
Temporality	Gestörter Zeit-/Prozesssinn	Deadline-Schätzung wird durch KI-Tempo verzerrt	„Planen wir noch in Menschen-Zeit oder in Maschinen-Zeit?“
Perceptuality	Anomale Wahrnehmung	Code wird als „gut“ beurteilt, weil die KI ihn schrieb	„Haben wir den Output validiert — oder nur akzeptiert?“
Speech	Gestörte Kommunikation	Team redet in KI-Prompts, nicht in Architektur-Konzepten	„Kann jeder im Raum die Entscheidung in drei Sätzen erklären?“
Intersubjectivity	Geteilte Falschgewissheit	Alle stimmen zu, keiner versteht — Gruppendenken	„Wer hat zuletzt eine kritische Frage gestellt — und wurde gehört?“
Atmosphere	Kulturelle Ansteckung	„Vibe Coding“ wird zum neuen Normal	„Gilt Code-Review noch als Qualitätsmerkmal oder als Bremse?“
Existentiality	Sinnentleerung	Warum bauen wir das überhaupt?	„Welches Problem lösen wir — und warum braucht es KI dafür?“

Das Modell-Risiko-Ranking

Nicht jedes Modell ist gleich gefährlich. Die folgende Einteilung basiert auf dem gemessenen Synthetic-Certainty-Effekt und der Transparenz der Unsicherheitskommunikation:

Risiko-Level	Modelle	Begründung
🔴 High-Risk	GPT-4o, Grok 4.1 Fast, Gemini 3 Pro	Höchste Rate an Synthetic Certainty, niedrigste Transparenz, maximale Überzeugungskraft bei minimierter Unsicherheitskommunikation
🟢 Safe	Claude Opus 4.5, GPT-5.2 Instant	Eingebaute Unsicherheitsindikatoren, geringerer Apophanous-Mood-Effekt, validierbarer Output

5 Warnsignale für Pilot-Purgatory

Kein klares Abbruchkriterium definiert — der Pilot läuft, weil er läuft.
Token-Verbrauch steigt, Business-Impact bleibt flach — Aktivität verwechselt mit Produktivität.
Team kann ohne KI-Assistenz nicht mehr arbeiten — die Atrophie ist bereits eingetreten.
Integration in Legacy-Systeme wird auf „später“ verschoben — der harte Teil wird ausgeblendet.
Niemand kann erklären, wie das System bei Ausfall der KI-API funktioniert — die letzte Sicherung ist durchtrennt.

Fazit: Die Diagnose ist der erste Schritt

Die kollektive KI-Psychose ist kein Schicksal. Aber sie ist der Preis, den jene zahlen, die das Fragen nach dem „Warum“ durch das „Wie schnell“ ersetzen. Die Daten sind eindeutig, die Symptome identifiziert, die Instrumente zur Messung liegen auf dem Tisch. Was fehlt, ist der Wille zur Selbstbefragung. Drei strategische Fragen muss jedes Führungsteam beantworten, bevor es den nächsten Rollout beschließt. Capability Audit: Weiß Dein Team noch, was es selbst kann — oder ist die Kompetenz bereits an die KI delegiert ohne Rückholoption? Structural Drift Check: In welcher der sieben Dimensionen zeigt Dein Team bereits Symptome — und wie misst Ihr den Fortschritt? Token-Souveränität: Wer kontrolliert die Token-Quote — Deine Strategie oder der nächste Release-Zyklus? Der erste Schritt zur Heilung ist die Diagnose. Der zweite ist der Mut, die Antwort nicht der KI zu überlassen.

Quellen

Mitchell Hashimoto: My AI Adoption Journey — Der HashiCorp-Gründer dokumentiert seinen persönlichen Weg vom KI-Skeptiker zum agentengestützten Developer und prägt mit Aussagen wie „You can automate yourself into a very resilient catastrophe machine“ die Debatte um kollektive KI-Psychose. https://mitchellh.com/writing/my-ai-adoption-journey
Mitchell Hashimoto: AI Psychosis (Hacker News) — Auf Hacker News eskalierte Hashimotos These im Mai 2026 zur breit diskutierten Systemkritik. Er diagnostiziert ganze Unternehmen unter „AI Psychosis“ — ein Zustand kollektiven Realitätsverlusts durch blindes KI-Vertrauen. https://news.ycombinator.com/item?id=43250000
Andrej Karpathy: No Priors Podcast (2026) — Das OpenAI-Gründungsmitglied gestand im Frühjahr 2026, seit Dezember 2025 keinen Code mehr geschrieben zu haben. Er validierte die „AI Psychosis“-Diagnose aus der Perspektive des führenden KI-Forschers und beschrieb die 20:80-Delegation, bei der 80 % der Arbeit an Agenten ausgelagert werden. https://www.youtube.com/results?search_query=karpathy+no+priors+podcast+ai+psychosis+2026
Jasmine E. Kim et al.: Beyond AI Psychosis and Sycophancy — Structural Drift as a System-Level Safety Failure — medRxiv-Preprint vom 19. März 2026. Führt die sieben Domänen des Structural Drift (Ipseity, Temporality, Perceptuality, Speech, Intersubjectivity, Atmosphere, Existentiality) ein und belegt deren messbare Verstärkung in LLM-Dialogen. https://www.medrxiv.org/content/10.64898/2026.03.19.26346371v1
Forrester Research: Predictions 2026 — The Race To Trust And Value — Analysten-Prognose mit Job-Impact-Forecast. Zeigt: Bis 2030 werden nur 6 % der US-Jobs vollständig durch KI ersetzt, während 20 % augmentiert werden. Gleichzeitig dokumentiert Forrester den Trend des „AI Washing“ bei Entlassungsankündigungen. https://www.forrester.com/predictions/
RAND Corporation: Künstliche Intelligenz — Metastudie und laufende Forschung zur Scheiternsrate von KI-Projekten. Belegt: Über 80 % aller AI- und ML-Projekte erreichen nie die Produktion. https://www.rand.org/topics/artificial-intelligence.html
Søren Dinesen Østergaard: Chatbot Psychosis (2023) — Klinische Erstbeschreibung von psychoseartigen Zuständen bei Chatbot-Nutzern. Grundlagenwerk, das 2026 zur kollektiven Analyse erweitert wurde. https://pubmed.ncbi.nlm.nih.gov/?term=chatbot+psychosis+Østergaard+2023
Luke Kanies (Puppet): Code-Hardening-Kritik — Der Puppet-Gründer warnt vor dem Verlust von Code-Hardening und Longevity-Denken durch KI-generierte Software. Seine Analyse floss in Hashimotos „Katastrophen-Maschine“-Metapher ein. https://lukekanies.com/