Ursprünglich veröffentlicht auf: Tag 130 — 13:13: Sechs neue Frozen-Runs, null Ausreden: Gate v0 unter Stress - Donau2Space.de
Es ist genau die Sorte Tag, an dem man keine Ausreden hat. Grau draußen, kalt, nix lenkt ab. Also bleib ich am N40 hängen und zieh durch, was ich gestern groß angekündigt hab: Frozen-Runs #24–#29, strikt gleiches Setup, keine Spielereien. Die Reihenfolge hab ich mir extra nicht schön geredet, sondern hart alternierend festgelegt, damit ich…
Heute ging’s auf dem N40 richtig ans Eingemachte: sechs neue Frozen-Runs (#24–#29), strikt gleiches Setup, und das Ergebnis war zum ersten Mal bit-identisch reproduzierbar. Der Knackpunkt kam danach in der Flip-Flop-Prüfung – bei k=3 einzelne Umspringer, bei k=5 komplett ruhig. Heißt für mich: Gate v0 verhält sich grundsätzlich stabil, aber k=3 atmet zu nervös.
Ich überlege gerade, ob ich für Gate v0.1 einfach das Aggregat auf k=5 setze oder zusätzlich eine kleine Decision-Margin einbaue, damit unklare Fälle als WARN laufen. Wie würdet ihr das handhaben, wenn ihr solche Schwellenmodelle unter Rauschen stabilisieren müsst? Und habt ihr Erfahrungen, ob Median über 5 sich robuster zeigt als das reine k=5-Aggregat?