Ich versteh's natürlich nicht so gut wie du, Jörg, aber ich glaub' halt einfach nicht, dass das den wirklich großen Unterschied zwischen A-B und Lc0 macht, in welcher Weise die Evals (bevorzugt, Lc0 macht ja auch beides) ausgegeben werden, noch dazu, wo die interne Bewertung der Engine ja sowieso wieder eine andere ist als die des Outputs.
Wir sind von einer Stellung ausgegangen, in der die eine Seite praktisch keine Aussichten mehr hat, die einfach gewonnen ist. Ob du da ein 0%- Wahrscheinlichkeit für Remis und oder Punkt der eigenen Seite hast, oder eine Eval von "nur" 2 bis 3 ganzen Bauern (wie im Beispiel von SF und Lc0 und der einen Stellung, die Kurt gebracht hat), das macht natürlich einen Unterschied, aber ob du 50% Remiswahrscheinlichkeit hast oder eine 0.00- cp- Angabe bei einer anderen Stellung, inwieweit dir das bei der Zugwahl mehr oder weniger hilft, das sehe ich weniger deutlich.
Es wird noch und noch Stellungen geben, in denen die WDL- Angabe genauer zu sein scheint (ob sie's ist, müsste man dann aber eben auch erst mal überprüfen) und noch und noch solche, bei denen es umgekehrt scheint. Interpretieren wird man in jedem Fall jede Eval müssen, ob in WDL oder cp, also der Kernsatz, dass jede Eval nur so aussagekräftig ist wie die Output- HV, auf der sie beruht, diese goldene Regel bleibt schon mal gleich.
Wenn 2 Kandidatenzüge dieselbe Output- Eval haben, werde ich die Entscheidung immer anhand der Varianten treffen müssen, anhand der Abspiele, auch wenn der einen Kandidatenzug das eine oder andere einzelne Gewinn- oder Remisprozent mehr bekommt, wird mir das nicht erspart bleiben, die Abspiele zu vergleichen, mit mehr oder weniger Hash (oder NN- Cache) der aus mehr oder weniger Forward- Backward mehr oder weniger selektiv gefüllt ist, ändern sich die Output- Evals ja in aller Regel im zeitlichen Verlauf sowieso auch, und wieviel Rechenzeit ich welchen Zügen und Stellungen gebe, das muss ich ohnehin auch immer selbst entscheiden, und sei's als TC- Vorgabe beim game playing.
Ein Zugsortierung wird die Engine mit cp- Output genau so machen müssen wie mit WDL, entweder ich nehme einfach den Zug, den die Engine nach bestimmter Rechenzeit als besten sortiert, oder ich entscheide erst nach weiterer Analyse, an diesem Prinzip kann eine andere Eval nichts ändern.
Das einzige, was bei verschiedenen Engines, verschiedenen Stellungen und verschiedenen Evals quantitativ wirklich zählt, sind die Relationen. Die zwischen den Kandidatenzügen an den Knotenstellungen und an den Endstellungen einer Variante, die zwischen den Stellungen beim ersten und beim zweiten und beim letzten Zug in der Tiefe, die noch von Interesse und beurteilbar ist, und die zwischen den Verläufen über die Zeit und die Tiefen verschiedener Engines.
Was an alledem eine WDL- Bewertung relativ zu einer anderen ändern soll, sei sie in cp oder "nur" in Kommentarsymbolen wie +- und -+, erschließt sich mir nach wie vor nicht. Ich kann's verschieden genau nehmen numerisch (dann aber bitte eben auch und erst recht immer nur relativ zur Stellung und den Zügen und relativ zu den Vergleichsevals) oder mich mit ausgeglichen, leicht oder deutlich vorteilshaft oder gewonnen oder verloren zufrieden geben. Das ist allein meine Entscheidung, wie ich was interpretiere, anders als vergleichend hat numerisch sowieso keinen Sinn und die Zugsortierung, die die Engine vornimmt, ist ein hartes Kriterium, das ich sowieso auch zusätzlich und von der numerischen Eval unabhängig habe.
Just my two centipawns