Claude Code in der Praxis: Lektionen aus der Produktion

01 · Memory: Kontext über Sessions hinweg bewahren

Die Standard-Claude-Code-Session ist zustandslos. Sie beginnt frisch. Jede Konversation startet bei null. Für interaktive Nutzung ist das handhabbar. Für Produktions-Pipelines ist es eine harte Einschränkung, die alles blockiert.

Die Lösung, die ich gebaut habe, hat drei Ebenen. Eine STATUS.md-Datei ist das Arbeitsgedächtnis des Agenten: aktueller Projektstatus, aktive Arbeitspunkte, letzte Entscheidungen, offene Fragen. Sie wird zu Beginn jeder Session überschrieben. Tägliche Journals bilden das dauerhafte Archiv: append-only, nach der Erstellung nie bearbeitet. Eine destillierte Fakten-Datei erfasst Muster, die in drei oder mehr Journal-Einträgen auftauchten.

Mit diesem System kann ein Agent in unter 60 Sekunden vollen Kontext wiederherstellen. Vollständiges Design: Three-Tier Memory: How I Taught My AI to Remember.

Memory hat auch Fehler-Modi. Zwei Wochen nach dem Betrieb meines 18-Agenten-Systems war die Memory-Datei meines Typescript-Implementers auf 95 KB und 2.133 Zeilen gewachsen. Das System, das Agenten intelligenter machen sollte, machte sie langsamer. Der Zusammenbruch und seine Lösung: The Memory Bloat Crisis.

Claude Code hat auch eine integrierte Auto-Memory-Funktion, von der du vielleicht nichts weißt. Sie überwacht deine Sessions und speichert Dinge, die sie für es wert hält, in Dateien unter ~/.claude/projects/. Für autonome Pipelines werden 200 Zeilen, die du nicht geschrieben hast, still und heimlich Teil deines effektiven System-Prompts. Der vollständige Überblick: The Clean Slate Is Gone.

02 · Von Agenten zu Skills: der Architektur-Wechsel

Ich baute 18 spezialisierte Agenten. Benannte sie. Schrieb ihre AGENT.md-Dateien. Mein Orchestrator Cairn koordinierte sie wie ein Dirigent mit einem vollständigen Orchester. Es funktionierte. Ich zeigte es Kollegen.

Einer fragte: "Warum nutzt du dafür keine Skills?"

Claude Code Skills haben geforkete Ausführungskontexte, Memory und unterstützende Dateien. Das meiste, was benutzerdefinierte Agenten taten, können Skills jetzt, mit weniger Overhead und mehr Komposierbarkeit. Der Git-Agent wird ein git-ops-Skill. Der Code-Reviewer wird ein code-review-Skill. Die benannten Identitäten lösen sich auf. Das Wissen bleibt.

Die Agenten sind nicht tot. Sie sind degradiert. Skills sind das Was. Agenten sind das Wie. Vollständiger Post: Skills Ate My Agents (And I'm Okay With That).

03 · Token-Kosten: die 22K-Startup-Steuer und wie man sie senkt

Kontextqualität verschlechtert sich mit zunehmender Kontextlänge. Forschung bestätigt, dass allein die Kontextlänge die LLM-Performance verschlechtert, auch wenn die relevanten Informationen vorhanden sind. Das Phänomen wird manchmal Context Rot genannt. Jeder unnötige Token, der beim Start geladen wird, ist eine Steuer auf die Qualität von allem, was folgt.

Ich entdeckte das durch ein zufälliges Audit. Ich führte /context nach dem Einrichten meiner Session aus. Die Aufschlüsselung zeigte 22.000 Token in MCP-Tools, bevor ich einen einzigen Prompt getippt hatte. Der Atlassian-MCP allein: ~10.000 Token, lädt alle 33 Tools, einschließlich der 27, die ich explizit deaktiviert hatte.

Hier ist das Problem mit disabledTools in Claude Code: Es verhindert, dass die KI ein Tool aufruft. Es verhindert nicht, dass der MCP-Server dieses Tool registriert. Die vollständige Analyse: The 22,000 Token Tax: Why I Killed My MCP Server.

04 · Autonome Workflows: was wirklich scheitert und warum

Das erste autonome Ticket, das ich durch eine vollständige Pipeline laufen ließ, dauerte neun Agenten in Sequenz und unter 20 Minuten. Vollständiger Account: My First Autonomous Ticket.

Was in autonomen Workflows wirklich scheitert:

Unzureichend spezifizierte Aufgaben. Der Agent kann nicht abschließen, was er nicht verstehen kann.
Fehlender Codebase-Kontext. Ein Agent ohne CLAUDE.md entdeckt deine Konventionen durch Versuch und Irrtum.
Keine Review-Gates. Ein Agent, der unkontrolliert alles tun kann, wird irgendwann das Falsche tun.
Zu starke Überwachung. Du hast zu früh aufgehört. Erweitere die Aufgabengrenze. Lass den Agenten den natürlichen Haltepunkt erreichen.
Agentic-QA-Lücken. Produktionshärtung, Rate Limiting, CORS, Graceful Shutdown: diese Dinge verpassen Agenten zuverlässig, wenn du sie nicht explizit in den Scope aufnimmst.

05 · Sandboxing: von weichen Einschränkungen zu harten Grenzen

Es gibt ein Flag in Claude Code namens --dangerously-skip-permissions. Der Name ist akkurat. Weiche Einschränkungen, also Grenzen, die in Markdown definiert und in den Kontext des Agenten geladen sind, sind keine Sicherheitsgarantien. Sie sind höfliche Anfragen an ein Sprachmodell. Docker-basiertes Sandboxing beschränkt Dateisystemzugriff auf OS-Ebene. Kein Instruktions-Override kann das umgehen.

Vollständige Architektur: From Soft Trust to Hard Walls.

06 · Sicherheit: Prompt Injection, MCP und reale Angriffsflächen

Prompt Injection über MCP-Tools ist die reale Angriffsfläche. Wenn dein Agent eine Webseite liest, eine E-Mail verarbeitet oder eine API abfragt, wird der Antwort-Inhalt Teil des Kontexts. Ein Angreifer, der diesen Inhalt kontrolliert, kann Anweisungen injizieren, die der Agent befolgen wird, als kämen sie von dir.

Ich erkundete das praktisch in einem Sicherheitstraining-Lab. Ich gab Claude SSH-Zugang zu einer isolierten Lab-Umgebung und ließ es eine Angriffskette ausführen. Es erledigte drei Missionen ohne zu zögern, bevor Anthropic die Session beendete.

Das vollständige Experiment und seine Implikationen: I Let Claude Hack My Security Training. Then Anthropic Stepped In..

07 · Orchestrierung: die vollständige Pipeline, Ticket zu PR

Orchestrierung ist die Disziplin, zu entscheiden, welche Agenten in welcher Reihenfolge laufen, welchen Kontext jeder erhält und wie ihre Outputs zusammenketten. Mein aktueller Orchestrator heißt Cairn und koordiniert den vollen Ticket-Lebenszyklus.

Der Record-then-Optimize-Pattern ist der Mechanismus, der den Orchestrator über Zeit verbessert. Agenten loggen bemerkenswerte Ereignisse in thematische Betriebslogs. Ein Meta-Agent liest diese Logs periodisch, identifiziert Muster und aktualisiert die Agenten-Instruktionen. Originalpost zu diesem Muster: The Record-Optimizer Pattern.

Ein kürzlicher Beweis: 110 Pull Requests in einer Woche gemerged. Fast keinen Code von Hand geschrieben. Der Post: Stop Micromanaging Your Agents.

08 · Mindset: die nicht-technischen Lektionen, die am meisten zählen

Das Schwierigste beim Lernen von Agentic Engineering ist keine technische Fähigkeit. Es ist die Bereitschaft, lange genug in der Investitionsphase zu bleiben.

Acht Sessions Infrastruktur vor einem einzigen autonomen Ticket. Das ist die Realität. Die meisten Menschen geben in Session 2 oder 3 auf. Sie liegen damit richtig, dass Session 2 langsamer ist. Sie liegen damit falsch, wie Session 9 aussieht.

Die unsichtbaren Decken auf jeder Kompetenzebene sind real. Du kannst sie nicht von innen sehen. Der Post The Walls That Taught Me More Than the Breakthroughs beschreibt jede einzelne und wie man durchbricht.

Und das Letzte: Dein Prompt ist nicht die Fähigkeit. Was übertragbar ist, ist das Urteilsvermögen hinter dem Prompt. Der Post: Your Prompt Is Not the Point.