Reinhold Stibi schrieb:
Stefan Pohl ist mit seinem neuen Bewertungssystem der Zeit voraus.
Bis jetzt liegen die Gewinnpartien von Lc0 gegen Stockfish mit über 20 % gut.
Gegen die weiteren Spitzenengines erheblich darüber und gegen sehr gute und Mittelklasse-Engines
sehr deutlich darüber.
Für den jetzigen Zeitpunkt besteht keinen Grund für eine Umstellung.
Dass Remispartien in seiner jetzigen Bedeutung nicht mehr gewertet werden sollen ist sehr nachteilig
für die Beurteilung einer Engines.
Sehr wichtig finde ich bei Engine Wettkämpften dass jede Engine eine Eröffnung mit Weiß und Schwarz spielt.
Dies kann man bei der Fritz GUI prima einstellen.
Bei der Vielzahl der Eröffnungen kommt es natürlich öfters vor dass eine Engine mit -0,8 aus der Eröffnung kommt.
Dies ist auch teilweise erwünscht, denn dann kann die bessere Engine beweisen, dass sie trotz Eröffnungsnachteil
noch ein Remis erreichen kann.
Mit dem neuen Bewertungssystem von Stefan Pohl fällt dieser ganz wichtiger Gesichtspunkt unterm Tisch und es
kommen dann nicht optimale Bewertungen heraus.
Alles total falsch.
Natürlich werden Remispartien gewertet. Als Sieg für Schwarz.
Natürlich werden alle Eröffnungsvorgaben mit vertauschten Farben wiederholt.
Alle SALC Armageddon Vorgaben sind ein leichter Vorteil für Weiß. Daher kann jede Engine auch hier immer beweisen, daß sie nachteilige Eröffnungen Remis halten kann (wenn sie eben Schwarz spielt). Und das wird dann ja sogar als voller Punkt gewertet.
Zum jetzigen Zeitpunkt bestand sehr wohl die Notwendigkeit zur Umstellung. Aber
nur bei meinem Testsetup, wo nur Lc0 gegen SF spielt, also 2 superstarke Engines, die z.Zt. etwa auf Augenhöhe sind. Bei meiner langen Bedenkzeit hatte ich dort, wie schon beschrieben, über 85% Remisen, als ich HERT-Eröffnungen benutzt habe. Und wie auch schon (mehrfach!) ausgeführt, ist das absolutes Gift für jede Unterschiedsmessung und drückt alle Ergebnisse so stark Richtung 50%-50%, daß man das Testen dann auch gleich sein lassen kann.
Das gilt ausdrücklich nicht, wenn gegen viele, auch schwächere, Gegner getestet wird, noch dazu mit kürzeren Bedenkzeit, wie zum Beispiel in Andreas NN-Bulletrangliste. Dort wäre es völlig unötig, um nicht zu sagen idiotisch, mit Armageddon Eröffnungen zu testen.
Das war jetzt übrigens mein letztes Posting hier. Zumindest vorerst. Ich komme mir nämlich langsam vor wie ein Papagei, weil ich immer und immer wieder einfachste Gegebenheiten und Fakten wiederhole und wiederhole und wiederhole... Das wird mir echt zu blöd.
Wenn sich also weiter über meine ach so unpassenden Testbedingungen echauffiert werden soll, viel Spaß. Aber ohne mich.