Auch da kommst du nicht darum herum, die Ergebnisse nach den Ausgangsstellungen zu relativieren, es würde sich auch wieder nur um eine weitere Stellungstest- Variante handeln.
Übrigens aber gar keine schlechte, 40 Züge halte ich allerdings für übertrieben, wenn du nicht nur von Eröffnungs- sondern auch von Mittel- und Endspielstellungen ausgehst, reichen 10, 15 vollauf, bei entsprechend forcierten taktischen Stellungen auch mal 5.
Und statt einfach nur absolute Evalwerte heranzuziehen und zu mitteln, wäre ich für Evalratios, Ausgangseval zu Endeval, ab einer bestimmten Relation könnte man's als ganzen Punkt werten, drunter als halben.
Aber auch deine Idee (wenn du's so gemeint hast), gleich die Evalrelationen als Maßzahl statt der Schaselo (ich gewinne immer mehr Freude an Michaels klarer, deutlicher Diktion) zu nehmen, finde ich gut.
Z.B. SF steigert seine Eval gegen LC0 vom Ausgangswert in der bestimmten Zugzahl um das 3.75 fache, gewinnt aus der einzelnen Stellung 3.75 Evelo, LC0 verliert gleich viel gegen ihn.
Im Rückspiel gewinnt LC0, weil er sie es an und für sich gern numerisch klar und deutlich evaluiert, das 11.99 fache (obwohl SF, selbst schuld natürlich, wieder nur das dreifache hinschreibt) aus derselben Ausgangsstellung und seiner ihrer seiner Ausgangseval.
LC0 gewinnt bei ähnlichem Stellungstestverlauf der einzelnen Ausgangsstellung viel mehr Evelo, ist halt die modernere Engine und hat sich selbst beigebracht, Stellungstests für sich zu entscheiden.
Daher noch ein Verbesserungsversuch: man addiert zu den Gewinnevelo der einen die Verlustevelo der anderen Engine, dann gleichen einander Eigenarten in der numerischen Evalberechnung verschiedener Engines wieder teilweise aus.