Tom Paul schrieb:
Jetzt das Problem beim der Turnierplatzierung:
Wenn zwei gleich starke Engines gegeneinander spielen z.B. Stockfish gegen Stockfish, dann ist das Ergebnis in einer +0.34 Stellung bei zwei gespielten Partien gleich, (99%), wenn man eine 0.00 Stellung verwendet, dann ist das der gleiche Fall.
Das Problem ist aber: Was passiert, wenn man zwei unterschiedlich starken Engines eine 0.00 Stellung gibt oder diese +0.34 Stellung.
Ergebnis:
+0.34 Spike vs Stockfish Remis, weil Vorteil - gegnerische Stärke löst sich auf.
+0.34 Stockfish vs Spike 1-0, weil ein doppelter Bonus zuviel und überflüssig ist.
Stockfish vs Spike 1.5 zu 0.5.
+0.00 Spike vs Stockfish 0-1, weil es keinen Vorteil für eine Seite gibt und Stockfish ist stärker.
+0.00 Stockfish vs Spike 1-0, weil es keinen Vorteil für eine Seite gibt und Stockfish ist stärker.
Stockfish vs Spike 2.0 zu 0.0.
Durch +0.__ bekommen schwächere Engines einen Vorteil bzw. stärkere Engines einen Nachteil.
Ich verwende nur 0.00 Teststellungen, dann werden die Ergebnisse nicht verfälscht und die Partien sind um ein vielfaches spannender, weil beide Seiten versuchen auf Sieg zu spielen und nicht das eine Engine in der Eröffnung ums Remis kämpfen muss.
Das sehe ich anders mit der 0.00 Bewertung. Differenziert betrachtet:
1) Vorgabestellung endet in früher Eröffnungsphase: Wenn Weiß dann mit 0.00 da steht, ist etwas schief gelaufen. Das Eröffnungstempo sollte nicht so früh schon wieder abgegeben worden sein. Hier wird also Weiß benachteiligt.
2) Vorgabestellung endet in fortgeschrittener Eröffnungsphase bzw. im frühen Mittelspiel: Hier mag 0.00 ok sein (keiner wird bevorteilt), allerdings führt so eine Bewertung dann nicht automatisch dazu, dass beide Seiten auf Sieg spielen, wie du schreibst. Spannung ist mit 0.00 nach Buchende nicht zwangsläufig gewährleistet.
Generell ist es schwierig einzuschätzen, was man auf eine Enginebewertung in einer Eröffnungsphase wirklich geben bzw. ob man daraus ableiten sollte, wie die Chancen in der Partie verteilt sind. Alles, was noch innerhalb von -0.5 / +0.5 ist, halte ich im Prinzip für ok zum Testen mit vertauschten Farben, so lange tatsächlich noch objektiv gesehen alles drin ist für beide Seiten (also kein Material- oder extremer Stellungsnachteil auf dem Brett ist).
Deine Schlussfolgerung, dass bei 0.00 nach Vorgabestellung zwei farbvertauschte Partien zwischen Stockfish (bzw. Engine A) und Spike (bzw. Engine B schwächer als A) in der Regel 2.0 zu 0.0 ausgehen müssten, kann ich auch nicht nachvollziehen. Das hängt von anderen Faktoren ab, aber man kann dies sicher nicht aus der ersten Bewertung direkt nach Buchende schließen (es sei denn, eine Seite kommt wirklich mit gewinnbringendem Vorteil aus dem Buch). Wenn dem so wäre, bräuchte man ja gar keine Partien mehr zu spielen, sondern bricht direkt nach Buchende ab und fällt sein Urteil.
Es gibt einen Fall, in welchem schwächere Engines tatsächlich relativ im Vorteil wären gegenüber stärkeren: Wenn die Vorgabestellung eine klare Gewinnstellung für eine Seite ist, mindestens aber von der stärkeren Seite praktisch nicht mehr verloren werden kann. Dann hätte die schwächere Engine ihr Remis sicher, während es im Normalfall so wäre, dass die stärkere Engine auch Aussicht auf einen Gewinn mit beiden Farben hätte. Aber das ist bei einer +0.34 Stellung, von der du berichtest, sicherlich längst noch nicht der Fall.