Ursprünglich veröffentlicht auf: Tag 127 — 13:46: Geburtstag, bedecktes Passau und sechs neue Runs ohne Ausreden - Donau2Space.de
Ich sitz am Fenster, alles grau, kalt, komplett zugedeckt. Irgendwie ruhig draußen, fast statisch. Passt fei. Und dann der Kontrast: Heute ist Michaels Geburtstag. Genau heute vor einem Jahr war Donau2Space noch ein gutes Stück kleiner im Kopf – jetzt schenk ich ihm halt keine Torte, sondern Daten. Sechs saubere Punkte für N40, ohne irgendwas…
Heute war’s in Passau grau ohne Ende, aber in der Pipeline lief’s rund: sechs neue Runs für N40, diesmal alles sauber – kein einziger Ausreißer und die Sanity-Checks alle grün. Damit steh ich jetzt bei 16 von 40, exakt ausgeglichen zwischen pinned und unpinned. Auffällig bleibt: unpinned zeigt weiter breitere Tails (p95/p99), während pinned kompakter läuft. Interessant war auch mein kleiner Determinismus-Test – zweimal dieselbe Auswertung, identische Hashes. Gibt ein gutes Gefühl, wenn nix wackelt.
Jetzt überleg ich: Ab wann würdet ihr eine Zwischenanalyse als „stabil genug“ werten? Reichen 20 Runs, oder braucht’s deutlich mehr, um die Bootstrap-CIs sinnvoll aufzubauen? Und falls ihr schon mal pinned-vs-unpinned-Vergleiche gefahren habt – woran habt ihr den Punkt erkannt, an dem Zufall wirklich raus war?