Eine Datenbankmigration mit KI planen: 11 Wochen, 15 Fragen

Es gibt ein Muster, das ich ständig beobachte, wenn Leute KI für Engineering-Aufgaben nutzen: Sie springen direkt zum Code. Problem erkannt, Prompt geschrieben, Implementierung generiert. Schnell, befriedigend, oft falsch. (Die Agenten-Pipeline, die diese Pläne später ausführen sollte, ist in Mein erstes autonomes Ticket beschrieben.)

Dreiphasiger Migrationsplan: 11 Wochen, null Breaking Changes

Die Migration, um die es hier geht, hat das Gegenteil gemacht. Wir haben eine ganze Planungssession im Q&A-Modus verbracht, bevor eine einzige Implementierungszeile geschrieben wurde. Das Ergebnis war ein 3-Phasen-Plan über 11 Wochen. Was wir danach gebaut haben, war sauber — genau wegen dieser Vorausinvestition.

Das Problem

Ein Konfigurationsservice bei meinem Enterprise-Arbeitgeber speicherte Properties als TEXT[]-Arrays in PostgreSQL. Jede Property hatte ein Array von String-Werten. Einfach, flexibel, gut genug — bis es das nicht mehr war.

Bei 223 Properties und 11.924 Werten zeigten sich die Grenzen des Modells. Queries über mehrere Properties hinweg waren umständlich. Filtern nach Wert bedeutete einen vollständigen Array-Scan. Defaults, Overrides und plattformspezifische Varianten mit einem flachen Array zu verwalten wurde immer schmerzhafter. Jedes neue Feature erforderte, das Datenmodell auf Weisen zu verbiegen, für die es nicht gemacht war.

Die richtige Lösung war relationale Normalisierung. Die Frage war, wie man das macht, ohne alles zu zerstören.

Die Q&A-Methode

Ich habe nicht mit „schreib mir eine Migration” angefangen. Ich habe angefangen mit: „Ich muss dieses Schema normalisieren. Stelle mir zuerst jede architektonische Frage, die du brauchst, um das korrekt zu entwerfen.”

Die KI stellte 15 Fragen. Ich antwortete aus meinem Domänenwissen.

Einige Fragen waren naheliegend:

Werden Properties nach Name oder nach ID identifiziert?
Gibt es plattformspezifische Property-Werte, oder sind Werte global?
Was ist der Rollback-Plan, wenn Phase 1 Probleme macht?

Andere brachten Constraints ans Licht, über die ich nicht explizit nachgedacht hatte:

Hängen Downstream-Konsumenten vom aktuellen Array-Format in API-Verträgen ab?
Erben Properties voneinander, oder ist jede Property unabhängig?
Wie sind Default-Werte geregelt — in der Anwendungslogik hart kodiert oder in der Datenbank gespeichert?

Jede Antwort floss ins Design ein. Nach Frage 15 hatten wir alle Constraints dokumentiert und konnten ein Modell entwerfen, das sie alle erfüllte.

Das entstandene Design

Drei Entscheidungen haben alles geprägt:

Namensbasierte Auflösung. Properties werden nach Name identifiziert, nicht nach generierter ID. Das ist wichtig für Migrationen: Wenn du die Daten renormalisierst, müssen Konsumenten ihre Lookup-Keys nicht anfassen. Das macht das System auch robuster gegenüber Schema-Änderungen.

3-stufige Vererbungskette. Ein Property-Wert kann auf drei Ebenen existieren: globaler Default, plattformspezifischer Override und property-spezifischer Wert. Die Auflösung geht die Kette entlang. Das ersetzte ein Gestrüpp von Conditional-Logik, das über die ganze Anwendung verteilt war.

Abwärtskompatibilität als harte Anforderung. Die v1-API durfte sich während der Migration nicht ändern. Jedes neue relationale Modell musste dieselben API-Antworten liefern wie das alte — bis v2 stabil war und Konsumenten migriert hatten.

Der 3-Phasen-Plan

Phase 1 — Nur Datenbank-Normalisierung. Neue relationale Tabellen, Migrations-Skript zum Übertragen der vorhandenen Daten, alte und neue Tabellen laufen gleichzeitig. Keine API-Änderungen. Die Anwendung liest weiterhin aus der alten Struktur. Dauer: 3 Wochen.

Phase 2 — API v2 neben v1. Neue Endpunkte nutzen das relationale Modell. Die v1-Endpunkte bleiben funktional und lesen aus einem Kompatibilitäts-View über die neuen Tabellen. Konsumenten migrieren in eigenem Tempo. Dauer: 5 Wochen.

Phase 3 — Deprecation und Bereinigung. v1 deprecated, dann entfernt. Altes Schema gedroppt. Dauer: 3 Wochen.

Elf Wochen insgesamt, keine Breaking Changes für Konsumenten.

Die Implementierung

Die Migration selbst: 223 Properties, 11.924 Werte, von flachen Arrays in ordentlich strukturierte relationale Zeilen überführt.

Dann 134 Compile-Fehler. Die Migration hat jede Schicht berührt — Repository, Service, Controller, DTO. Jede Schicht hatte Annahmen über die Datenstruktur eingebaut. Die meisten Fehler waren mechanisch: falsche Return-Types, fehlende Methodensignaturen, Aufrufe von Methoden, die im neuen Modell nicht mehr existierten. Der Agent arbeitete sich systematisch durch die Fehlerliste.

Ein Liquibase-Gotcha, das erwähnenswert ist: splitStatements=false ist für komplexe Migrations-Skripte erforderlich, die Semikolons innerhalb von SQL-Strings enthalten. Liquibase splittet standardmäßig an Semikolons, was Migrationen bricht, die Stored-Procedure-Syntax oder Inline-String-Werte mit Semikolons nutzen. Das hat uns einmal erwischt. Jetzt ist es das Erste, was ich prüfe.

Die Q&A-Methode: KI stellt Architekturfragen, Mensch liefert Domänenwissen

Warum dieser Ansatz funktioniert

Die besten Planungssessions mit KI fühlen sich an wie Pair-Programming mit einem Architekten, der unendlich geduldig ist und sich an alles erinnert. Du beschreibst eine Anforderung, sie wird für den Rest des Gesprächs behalten. Du widersprichst dir selbst, es fällt auf. Du übersiehst etwas, es wird nachgefragt.

Was die KI nicht kann, ist entscheiden. Sie weiß nicht, welche Kompromisse in deinem Kontext mehr wiegen. Sie kennt nicht die Toleranz deines Teams für Breaking Changes, deinen Zeitdruck oder welche technischen Schulden vertretbar sind. Das ist Domänenwissen — und das steckt in dir.

Der Q&A-Modus zwingt dich, dieses Wissen explizit zu machen. Die Fragen, die der Agent stellt, sind nicht immer die Fragen, die du dir selbst stellen würdest — und genau diese Überraschungen sind der Ort, wo nützliche Designentscheidungen entstehen.

Widersteh dem Impuls, direkt zum Code zu springen. Das Verhältnis von Planung zu Implementierung war hier ungefähr 1:8. Die Planungssession hat wahrscheinlich das Dreifache davon an Nacharbeit eingespart. (Wie eine vollständig gehärtete, produktionsreife Implementierung aussieht, nachdem die Agenten fertig sind — das beschreibe ich in Production Hardening.)