Wie du Endspiel bzw. Ende vom Mittelspiel definierst, ist sowieso genau so wie am Anfang (Ende der Eröffnung) reine Willkür, das müsste man in Kauf nehmen.
Die Evals sind eigentlich das, was heimlich still und leise, obwohl es immer sowohl von Schachspieler- als auch von Programmiererseite hieß, auf die dürfe man sowieso nichts geben, zur wirklichen Blüte durch die A-B-Engines gebracht wurden, in den letzten 10 Jahren.
Natürlich muss man immer noch unterscheiden, ob eine Eval für die Eröffnung, fürs Mittel- oder fürs Endspiel gilt, und natürlich gibt's nach wie vor (eigentlich aber meistens ohnehin nur mehr fürs Endspiel anhand der tbs nachweisbar und für eindeutige taktische "Überseher" unter den echten game changing moves) richtige und falsche Evals, aber wenn die Engine (und Forward- Backward ist da einfach der way to go) die Stellung richtig berechnet, dann gibt sie auch hervorragende Evals ab heutzutage, meiner persönlichen Beurteilung nach.
Und das ist etwas, womit ich mich wirklich etwas auszukennen glaube, mit Output- Evals. Und natürlich sind die immer nur im Zusammenhang mit Output- Lines beurteilbar, dann sind sie aber heutzutage schon wirklich das Wort, bei dem man die Engines nehmen sollte können, und das, woran die Engine- Entwicklung weiter arbeiten sollte und beurteilt werden sollte, mehr als an Elo verschiedenster Provenienz und Bedeutung.
Übrigens auch neben der mangelhaften Taktik- Vielseitigkeit, dem Endspiel, der Hashlernfähigkeit (für mich der Schwachpunkt einer durch Lernen "klug" gewordenen Engine schlechthin), aus allen diesen Gründen vergleichsweise großen Unverlässlichkeit als Analyse- Werzeug, gerade auch in Hinblick auf die Analyse einer der Schwachpunkt der NN- Dingens : die Evals, die sind einfach Sch...wach, man kann's nicht anders nennen.
Man kann's zur Kenntnis nehmen, dass das eben andere Evals sind als die, die wir mittlerweile gewohnt sind, bei den "konventionellen" Dingens auf cp genau gelten zu lassen, mit denen muss man's aber dann eben doch auch vergleichen dürfen, wenn man nicht nur Punktezählen als einziges Kriterium der Spielstärke gelten lassen will.
Das muss Euch aber bei Euren Plänen für eine Eval- gestützte Enginetestung allerdings schon auch von vornherein klar sein, die NNis werden sich in der nächsten Zeit diesbezüglich dem Vergleich mit den A-Blis noch ziemlich entziehen, es sei denn, ihr lasst euch etwas einfallen, wie man das umrechnet.
Quotienten als Punktrechnung zwischen Anfangs- und Endeval wäre schon mal um eine Rechenart besser vergleichbar als die Strichrechnung Plus und Minus.
Dennoch wäre es LC0 gegenüber immer noch unfair, ständig im Zähler und im Nenner um Zehnerpotenzen größere Werte zu haben als bei den A-B-Engines.