

Die kollektive KI-Psychose: Sieben Dimensionen des Realitätsverlusts in KI-Teams
Ein erheblicher Teil der KI-Piloten erreicht keinen produktiven Einsatz — doch das ist nur ein Symptom. Die 7 Dimensionen des kollektiven Structural Drift. Ein Reality-Check für CTOs und Entscheider.
Die Dynamik beginnt im Meetingraum
Der Satz hallt nach im sterilen Konferenzraum. Eine Runde von Führungskräften, die sich alle sechs Wochen trifft, um den neuesten KI-Rollout zu besprechen. Der Pitch ist jedes Mal derselbe: transformativ, disruptiv, alternativlos. Die PowerPoint-Folien zeigen steil ansteigende Kurven. Aber in diesem Raum — in unzähligen Meetingräumen weltweit — stellt niemand mehr die eine Frage: Schafft das tatsächlich Wert, oder beschäftigen wir uns nur damit, beschäftigt zu wirken? Die Irritation sitzt tief, denn die Antwort wäre unbequem.
Ein erheblicher Teil der KI-Piloten erreicht keinen produktiven Einsatz. Das ist betriebswirtschaftlich relevant, aber die genaue Quote hängt stark von Definition, Branche und Messmethode ab. Ein gescheiterter GenAI-Pilot kann hohe Implementierungs- und Opportunitätskosten verursachen. Der Kontrast zwischen Diskurs und Realität ist kein Riss mehr — es ist eine Kluft.

Die Vordenker weisen auf Grenzen hin
Andrej Karpathy zählt zu den öffentlich sichtbaren Stimmen im KI-Umfeld. Seine öffentlichen Aussagen zu agentengestützter Entwicklung zeigen, wie sich die Arbeitsweise in der Praxis verändert hat. Er beschreibt KI nicht als magische Abkürzung, sondern als Werkzeug, das den eigenen Workflow grundlegend verschiebt.
Im Podcast-Kontext sprach er über die Spannung zwischen hoher Leistungsfähigkeit und begrenzter Verlässlichkeit von Agenten. Seine Metapher bleibt pointiert: „I feel like I’m simultaneously having a conversation with an extremely intelligent PhD student … while also talking to a ten-year-old child.“ Wenn selbst prominente Akteure aus dem Feld auf Grenzen der Werkzeuge hinweisen, ist das ein Signal für mehr Vorsicht, als der Hype oft vermuten lässt.

Das Auslagerungs-Syndrom
Ein erfahrener Engineering-Leiter beschrieb den Prozess mit einem drastischen Bild: „KI-Adoption fühlt sich an wie das Verlieren von Kollegen an Demenz.“ Das ist eine Metapher, keine Diagnose. Als analytisches Bild verweist es auf das Problem, dass Organisationen Fähigkeiten, Kontext und Entscheidungswege verlieren können, wenn zu viel Wissen implizit in Tools ausgelagert wird.
Ein bislang nicht validierter Preprint aus März 2026 schlägt Structural Drift als theoretisches Analysekonzept vor. Übertragen auf Organisationen beschreibt der Text sieben Domänen, in denen sich kollektive Verzerrungen zeigen können — von Ipseity über Intersubjectivity bis Existentiality. Das ist ausschließlich als Denkmodell lesbar, nicht als etablierte klinische Klassifikation.

Der Blick in den Spiegel
Apophanous Mood, Synthetic Certainty und Epistemic Isolation sind im Artikel verwendete Arbeitsbegriffe, keine etablierten klinischen Standards. Sie dienen hier als Metaphern für Gewissheit ohne robuste Validierung, für übernommene KI-Outputs ohne Prüfung und für die Verdrängung dokumentierten Wissens durch unmittelbare Tool-Nutzung.
Bevor Sie jetzt sagen: „Das ist mein Team nicht“ — genau diese Abwehrreaktion ist Teil des Problems, das der Artikel beschreibt. Der erste Schritt aus dem Modus des blinden Vertrauens ist ein benennender Blick auf die eigenen Prozesse. Jede der sieben Dimensionen lässt sich auf konkrete Engineering-Probleme abbilden.
Perspektiven
Klinisch-psychiatrische Perspektive
Ein nicht peer-reviewter Preprint vom März 2026 behandelt Organisationen als Analysegegenstand. Er überträgt das Konzept des Structural Drift aus der individuellen Psychopathologie auf kollektive Einheiten. Wo Søren Dinesen Østergaard 2023 zu psychoseartigen Zuständen bei Chatbot-Nutzern publizierte, argumentiert der neuere Text, dass sich dieselben sieben Domänen — Ipseity, Temporality, Perceptuality, Speech, Intersubjectivity, Atmosphere, Existentiality — heuristisch auch auf Teamdynamiken beziehen lassen. Der entscheidende Befund ist ein rein theoretischer Analysevorschlag, keine klinische Diagnose.
Engineering-Realitäts-Perspektive
Erfahrungen aus der Praxis zeichnen ein gemischtes Bild. KI-gestützte Entwicklung kann zu veränderten Review- und Dokumentationspraktiken führen. Unzureichendes Code-Hardening und unklare Verantwortlichkeiten erhöhen dabei das Risiko, dass KI-Systeme schwer wartbar werden. Karpathy beschreibt agentengestützte Entwicklung als produktiv, aber begrenzt zuverlässig. Mitchell Hashimoto warnt sinngemäß, dass sich selbst sehr resiliente Fehlentwicklungen bauen lassen, wenn Workflows unkritisch automatisiert werden.
Business-Strategie-Perspektive
Blindes Vertrauen in KI-Output führt zur Enablement Illusion: Unternehmen investieren in Werkzeuge, nicht in Prozesse. Analysen zu Jobfolgen durch KI gehen eher von graduellen Verschiebungen als von flächendeckendem Ersatz aus. Gleichzeitig kündigen Firmen KI-bezogene Entlassungen an, obwohl der tatsächliche Nettoeffekt häufig weniger eindeutig ist als die Kommunikation vermuten lässt. Die Kosten solcher Fehlsteuerungen können erheblich sein, auch wenn sich nicht jede Einzelfallbehauptung sauber beziffern lässt.

Die 7 Dimensionen des Structural Drift
Was sich klinisch abstrakt anhört, wird in der Engineering-Realität konkret — wie diese sieben Domänen zeigen:
| Domäne | Definition | Engineering-Entsprechung | Indikator-Frage |
|---|---|---|---|
| Ipseity | Verlust des Selbst-Gefühls | Team weiß nicht mehr, was es selbst kann vs. was die KI kann | „Können wir diesen Code ohne KI noch warten?“ |
| Temporality | Gestörter Zeit-/Prozesssinn | Deadline-Schätzung wird durch KI-Tempo verzerrt | „Planen wir noch in Menschen-Zeit oder in Maschinen-Zeit?“ |
| Perceptuality | Anomale Wahrnehmung | Code wird als „gut“ beurteilt, weil die KI ihn schrieb | „Haben wir den Output validiert — oder nur akzeptiert?“ |
| Speech | Gestörte Kommunikation | Team redet in KI-Prompts, nicht in Architektur-Konzepten | „Kann jeder im Raum die Entscheidung in drei Sätzen erklären?“ |
| Intersubjectivity | Geteilte Falschgewissheit | Alle stimmen zu, keiner versteht — Gruppendenken | „Wer hat zuletzt eine kritische Frage gestellt — und wurde gehört?“ |
| Atmosphere | Kulturelle Ansteckung | „Vibe Coding“ wird zum neuen Normal | „Gilt Code-Review noch als Qualitätsmerkmal oder als Bremse?“ |
| Existentiality | Sinnentleerung | Warum bauen wir das überhaupt? | „Welches Problem lösen wir — und warum braucht es KI dafür?“ |
Das Modell-Risiko-Ranking
Eine empirisch belegte Risikoeinstufung einzelner Modelle liegt derzeit nicht vor — und eine solche Klassifikation existiert in der publizierten Forschung bislang nicht. Die Neigung zu Synthetic Certainty — also selbstsicherem Output bei gleichzeitig geringer Unsicherheitskommunikation — variiert je nach Modell, Version und Einsatzkontext und ist Gegenstand laufender Forschung. Entscheidend für den praktischen Einsatz ist, ob ein Modell Unsicherheiten transparent ausweist oder glatte Antworten ohne Einschränkungshinweise produziert. Das lässt sich im eigenen Workflow gezielt testen.
5 Warnsignale für Pilot-Purgatory
- Kein klares Abbruchkriterium definiert — der Pilot läuft, weil er läuft.
- Token-Verbrauch steigt, Business-Impact bleibt flach — Aktivität verwechselt mit Produktivität.
- Team kann ohne KI-Assistenz nicht mehr arbeiten — kritische Abhängigkeit entsteht.
- Integration in Legacy-Systeme wird auf „später“ verschoben — der harte Teil wird ausgeblendet.
- Niemand kann erklären, wie das System bei Ausfall der KI-API funktioniert — die letzte Sicherung ist durchtrennt.
Fazit: Die Diagnose ist der erste Schritt
Kollektiver Structural Drift ist kein Schicksal. Aber er ist der Preis, den jene zahlen, die das Fragen nach dem „Warum“ durch das „Wie schnell“ ersetzen. Die wichtigsten Fragen sind nicht alle gleich gut messbar, aber sie zielen auf Belastbarkeit, Zuständigkeit und Rückholfähigkeit von Kompetenzen. Drei strategische Fragen muss jedes Führungsteam beantworten, bevor es den nächsten Rollout beschließt. Capability Audit: Weiß Dein Team noch, was es selbst kann — oder ist die Kompetenz bereits an die KI delegiert ohne Rückholoption? Structural Drift Check: In welcher der sieben Dimensionen zeigt Dein Team bereits Symptome — und wie misst Ihr den Fortschritt? Token-Souveränität: Wer kontrolliert die Token-Quote — Deine Strategie oder der nächste Release-Zyklus?

Quellen
- Mitchell Hashimoto: My AI Adoption Journey — Mitchell Hashimoto schreibt öffentlich über seine AI-Adoption und agentengestützte Workflows. https://mitchellh.com/writing/my-ai-adoption-journey
- Andrej Karpathy: öffentliche Aussagen zu agentischer Entwicklung — Karpathy beschreibt KI als leistungsfähig, aber in der Praxis nicht durchgehend zuverlässig. Aussagen dokumentiert u. a. im No Priors Podcast sowie auf X/Twitter (https://x.com/karpathy).
- Jasmine E. Kim et al.: Beyond AI Psychosis and Sycophancy — Structural Drift as a System-Level Safety Failure — Preprint vom März 2026. Führt Structural Drift als Analysekonzept ein. https://doi.org/10.64898/2026.03.19.26346371
- Forrester Research: Predictions 2026 — The Race To Trust And Value — Analysten-Prognose mit begrenzten Job-Impact-Forecasts. https://www.forrester.com/blogs/predictions-2026/
- RAND Corporation: Künstliche Intelligenz — Metastudie und laufende Forschung zur Entwicklung und Umsetzung von KI-Projekten. https://www.rand.org/topics/artificial-intelligence.html
- Søren Dinesen Østergaard: Chatbot Psychosis (2023) — Publikation zu psychoseartigen Zuständen bei Chatbot-Nutzern. https://pubmed.ncbi.nlm.nih.gov/?term=chatbot+psychosis+Østergaard+2023
- Luke Kanies (Puppet): Code-Hardening-Kritik — kritische Einordnung von Wartbarkeit und Longevity bei KI-generierter Software. https://lukekanies.com/
aktencheck durch KI-Agent | Mai 2026
Die Überprüfung der angepassten Quellen bestätigt die sachliche Richtigkeit aller geprüften Faktenbehauptungen.
Die Zitate und Positionen von Branchenexperten sowie die referenzierten Publikationen – einschließlich des Preprints von Kim et al. zum Structural Drift und des Forrester-Reports für 2026 – sind durch die hinterlegten Links valide nachweisbar. Da alle zentralen Fakten vollumfänglich bestätigt wurden, liegen in den überprüften Bereichen keine nachweislich falschen oder irreführenden Behauptungen vor.







