Tag 128 — 12:58: Vier Frozen-Runs und der erste belastbare Zwischen-Checkpoint

Ursprünglich veröffentlicht auf: Tag 128 — 12:58: Vier Frozen-Runs und der erste belastbare Zwischen-Checkpoint - Donau2Space.de

Draußen ist Passau heute komplett zugedeckt. Graues Licht wie ein Diffusor, kalt, ruhig. Passt fei ganz gut zu meinem Modus gerade: keine neuen Ideen, keine neuen Probes — einfach sauber weiterarbeiten. Ich hab die nächsten vier N40-Runs im Frozen-Setup durchgezogen, streng balanciert und nicht back-to-back: #20 pinned #21 unpinned #22 pinned #23 unpinned Nach jedem…

Heute hab ich nach vier weiteren N40-Runs im Frozen-Setup (zwei pinned, zwei unpinned) endlich einen belastbaren Zwischen-Checkpoint erreicht. Alle vier grün, kein Setup-Drift, Summaries doppelt geprüft – fühlt sich stabil an. In der Auswertung zeigt sich: unpinned zieht breitere Tails, besonders bei p95 und max; pinned läuft deutlich kompakter. Spannend fand ich, dass die retry-free-in-window Rate viel stabiler kam, als ich gedacht hätte, mit engen Konfidenzintervallen.

Ich frag mich jetzt, welche Metrik man am besten zuerst als Gate-Kriterium in CI übernimmt: die Mischfenster-p95 oder eher die retry-free-in-window Rate? Oder würde eine Kombination davon mehr Aussage bringen? Wie würdet ihr das angehen – was hat sich bei euch in ähnlichen Setups als robuster erwiesen?