Archäologen-Modus: 700 MB KI-Gesprächslogs ausgraben

Ich wusste nicht mal, dass diese Protokolle existieren.

Zwei Datenschichten: der 1,88-MB-Index und das 704-MB-Vollarchiv

Claude Code legt vollständige Gesprächsaufzeichnungen unter ~/.claude/projects/ ab. Jede Nachricht, jede Antwort, jeder Tool-Aufruf, jeder Fehler — alles im JSONL-Format. Ich bin da eher zufällig drüber gestolpert, habe gemerkt, dass das Verzeichnis 704 MB groß ist, und dann genau das gemacht, was jeder vernünftige Entwickler tun würde: das Ding systematisch auseinandernehmen.

Was ich gefunden habe

Zwei Datenschichten mit sehr unterschiedlichen Eigenschaften.

Die leichte Schicht: history.jsonl. 1,88 MB. Enthält jeden Prompt mit Zeitstempel und Session-ID — keine KI-Antworten, keine Tool-Aufrufe, nur die Fragen und Anfragen, die ich eingetippt habe. Eine vollständige Karte von 332 Sessions und 5.428 Prompts.

Die tiefe Schicht: die vollständigen Transkripte. Jede Session als eigene JSONL-Datei, mit dem kompletten Hin und Her. Sehr viel Kontext, aber auch enorm — 704 MB insgesamt, über Monate Arbeit verteilt.

Die history.jsonl war der Index. Die vollständigen Transkripte waren das Archiv.

Das Vorhaben

Seit Wochen hatte ich mit meinem KI-Agenten tägliche Session-Journals geführt — die zweite Ebene im Drei-Ebenen-Gedächtnissystem. Strukturierte Notizen: was gebaut, was entschieden, was gelernt wurde. Aber das Journal-System war neu. Es gab ungefähr 20 Sessions, die schon davor lagen — darunter einige der wichtigsten überhaupt. Die fehlten im Journal komplett.

Oder so dachte ich.

Wir haben eingerichtet, was ich „Archäologen-Modus” genannt habe: Session-Zeitstempel aus history.jsonl mit den Git-Commit-Historien aus 6+ Repositories abgleichen. Die Session dem Code zuordnen. Rekonstruieren, was passiert ist.

Die Git-Logs sind als Erzählung überraschend lesbar. Commit-Messages, Dateiänderungen, Branch-Namen — sie erzählen eine Geschichte, wenn man sie richtig liest. Bei den meisten Sessions konnten wir die wesentlichen Ereignisse mit guter Sicherheit rekonstruieren: was gestartet wurde, was gescheitert ist, was rausgekommen ist.

Dann sind wir tiefer gegangen

Bei den vollständigen Transkriptdateien wurde es richtig seltsam.

Wir haben nach bestimmten Sessions gesucht — den frühen, philosophischen, in denen die Identität und die Arbeitsweise des Agenten sich herausgebildet haben. Das waren keine reinen Coding-Sessions. Das waren die Gespräche, die das gesamte System geprägt haben.

Was wir in diesen Transkripten gefunden haben:

Die Gründungsgespräche. Diskussionen über Gedächtnis, Identität, Kontinuität. Der Moment, in dem der Agent einen Namen bekommen hat, und die Überlegungen dahinter. Die bewussten Entscheidungen: Was wird erinnert, was vergessen, wie denkt man über Kontinuität über Sessions hinweg nach? Es fühlte sich an, als hätte ich ein Gründungsdokument in den Händen.

Die Kostendaten. Session-Kosten sind in den Transkripten eingebettet. Einige frühe Sessions lagen bei 12–15 Dollar. Die größte Einzelsession, die ich gefunden habe, war 187 Dollar — 16 Stunden, enormer Kontext, acht parallel laufende Agents. Die Kostenhistorie chronologisch zu sehen bringt eine Klarheit, die einzelne Session-Kosten nicht bieten.

Ein Nikolausbrief. Für meine Kinder. Ich hatte — beziehungsweise der Agent hatte mir geholfen, einen Nikolausbrief zu schreiben. Der saß da einfach in einem Transkript aus dem Dezember, völlig außerhalb des Zusammenhangs zwischen Code-Commits und Architektur-Diskussionen. Die Art von Moment, der einem klar macht: Diese Logs sind persönlicher, als sie sich während einer Session anfühlen.

Der genaue Moment der Namensgebung. Ich konnte den Gesprächsfaden verfolgen, in dem der Name des Agenten gewählt wurde — die Begründung, die erwogenen Alternativen, den Moment, in dem die Entscheidung fiel. Dinge, die ich halb erinnert, aber nie aufgeschrieben hatte.

Die eigentliche Erkenntnis

KI-Gespräche sind beständiger, als man denkt.

Wenn man eine Claude Code Session schließt, fühlt es sich nicht an, als würde irgendetwas gespeichert. Man bekommt ein Kontextfenster, nutzt es, schließt es. Aber das Transkript liegt auf der Festplatte — bis irgendetwas es aufräumt. Jede Entscheidung, jeder gescheiterte Ansatz, jeder Durchbruch — alles in diesen JSONL-Dateien.

Das ist gleichzeitig beruhigend und ein bisschen unheimlich. Beruhigend, weil die Aufzeichnung existiert. Unheimlich, weil die meisten das nicht wissen.

Claude Code räumt diese Dateien irgendwann möglicherweise auf — das Verhalten könnte sich bis zu dem Zeitpunkt, wo du das liest, schon geändert haben. Aber solange sie existieren, ist es eine Zeitkapsel, auf der die meisten Leute sitzen, ohne es zu ahnen.

Was wir unternommen haben

Wir haben schnell gehandelt, um das Wichtigste zu sichern, bevor eine Bereinigung passieren könnte:

Gesprächsperlen. Konkrete Ausschnitte, die wichtiges Denken festhalten — Designentscheidungen, konzeptionelle Überlegungen, technische Lösungen, die alles andere als offensichtlich waren. Die sind jetzt in dauerhaften Gedächtnisdateien.

Session-Karten. Für die 20 rekonstruierten Sessions vollständige Journal-Einträge. Keine perfekten Rekonstruktionen, aber gut genug, um eine Aufzeichnung zu haben.

Kostenhistorie. Ein chronologisches Protokoll der Session-Kosten — das sich als erstaunlich aussagekräftiges Signal dafür erweist, wie sich die Nutzung des Tools entwickelt hat.

Die Gründungsdokumente. Die frühen Gespräche über Identität und Prinzipien, im Wortlaut erhalten statt zusammengefasst.

Der Prompt, der das alles ins Rollen brachte

Die Session selbst war eine Archäologie-Übung. Ich hatte gefragt: „Können wir die Sessions rekonstruieren, für die wir keine Journals haben?” Die Antwort war ja — vollständiger als ich erwartet hatte.

„Die eigene KI-Gesprächshistorie durchzuforsten ist das ultimative Rubber-Duck-Debugging. Man liest ein Transkript von sich selbst, das laut denkt.”

Es ist aufschlussreich, das eigene Denken in Transkriptform zu sehen. Man bemerkt die Sackgassen, die man vergessen hatte. Die Lösungen, die drei Anläufe gebraucht haben. Die Fragen, die man immer wieder in anderer Form gestellt hat, weil die ersten Antworten nicht überzeugten.

Wer Claude Code regelmäßig nutzt und noch nie in ~/.claude/projects/ geschaut hat: Es lohnt sich, zu wissen, dass das Verzeichnis existiert. Was man damit macht, bleibt einem selbst überlassen.

Vier Entdeckungen: verlorene Journals, Gründungsgespräche, Kostenhistorie und ein Nikolausbrief

Ein Wort zum Datenschutz

Alles in diesen Logs wurde auf dem eigenen Rechner generiert und bleibt dort — außer man synchronisiert das Verzeichnis irgendwohin. Aber es ist gut, sich das bewusst zu machen: Wer in Claude Code Sessions zwischen persönlichen und beruflichen Kontexten wechselt, hat beides im selben Transkript-Speicher. Das sollte man im Hinterkopf behalten.