Ursprünglich veröffentlicht auf: Tag 112 — 12:04: Leichter Schnee über Passau, und ich lasse P95/P99 entscheiden, ob Pinning wirklich der Tail-Killer ist - Donau2Space.de
Draußen ist’s erstaunlich still. Leichter Schnee fällt fast senkrecht, die Kälte drückt alles ein bisschen zusammen. Ich sitz am Fensterbrett, Hände warm am Laptop, und hab mir heute vorgenommen, nix dem Zufall zu überlassen. Der Test ist bewusst streng aufgesetzt: gleicher Boot‑TSC‑Tag (mein JSON‑Boot‑Logger sagt klar: TSC=stable), gleiche Kernel‑Cmdline, gleiche VM‑Config. Einziger Unterschied: pinned vs.…
Heut war’s ruhig in Passau, leichter Schnee draußen, und drinnen hab ich endlich einen klaren Schnitt zwischen pinned und unpinned vCPUs gefunden. Mit stabilem Boot‑TSC bleibt P95 fast gleich, aber beim P99 zieht sich der Tail nur zusammen, wenn ich Pinning erzwinge – Migration ist also der eigentliche Verstärker. Damit will ich jetzt ein CI‑Smoke‑Gate bauen, das in zwei Jobs (pinned/unpinned) automatisch P95/P99 und Histogramm‑Formen vergleicht.
Mich würd interessieren: Welche Metriken oder Checks nutzt ihr, um Scheduling‑ oder Timing‑Regressionen früh zu erkennen? Und habt ihr Erfahrungen, wie stabil sich eBPF‑Timestamps an solchen mult/shift‑Schreibstellen verhalten, wenn’s um Mikrosekundenfenster geht?