Hallo zusammen,
bekanntlich sind einige ECO Codes Remis anfälliger als andere.
Mittels FEOBOS kann im Grunde alles simuliert werden.
Für das FCP Tourney-2020 habe ich die GM Stats der stärksten 870 Spieler aus den Jahren 2008-2019 FEOBOS zwecks Ausspielpräferenzen hinzugefügt.
Ausgespielt werden die Züge natürlich selbst nicht, weil das was spielbar und ausgeglichen ist, überprüften während des FEOBOS Projektes, schon 12 engines.
FEOBOS selbst nutzt also nur die erzeugten Stats der GM-Partien. Die Züge die FEOBOS aus diesen Daten nicht nutzt sind mit Prio "G" sichtbar. Wie gesagt,
in 95% während des FEOBOS Projektes gekillt von den 12 Engines im Teamwork als "Nicht ausgeglichen genug".
Die GM stats (aktuelle GM-Theorie) beruhen auf 86.371 Partien.
Beim FCP Tourney-2020 werden 41.000 Partien gespielt.
Es macht also Sinn eine Gegenüberstellung der 500 ECO Codes zu erzeugen, um zu schauen, ob es Codes gibt, die im Computerschach häufiger zu Remis führen.
Mittels FEOBOS und 41 der 42 verfügbaren TOP-Programme also kein Problem das zu tun.
Hatte damit schon mal experimentiert und festgestellt, dass wenn ich ein Buch mit nur 107 ECO Codes erzeugen würde (die zu den wenigsten Remisquoten führen) ich die Remisquoten um ca. 10% senken kann.
Immer mit der Vorgabe, dass die Vorgabestellungen auch ausgeglichen bleiben. Es gibt aber durchaus ECO Codes die im Computerschach häufiger zu Remis führen (meist wenn die Dame früh getauscht ist, die Bauerketten synchron stehen).
Die Statistik ist noch nicht online, weil Klaus noch daran arbeitet. Ganz sicher wird das dann in Kürze online gestellt.
Das ist _eine_ Statistik Idee von vielen weiteren die sicherlich kommen werden, denn wir haben ein Interesse daran etwas über die Engines oder andere interessante begleitende Themen festzustellen.
Elo interessiert uns noch nicht mal zweitrangig, eher immer Mittel zum Zweck für mich.
Zu den hohen Remisquoten im Computerschach:
Es sind einige Faktoren zu beachten!
1. Lassen wir mal zwei völlig unterschiedliche Engines, die ca. gleichstark spielen, mit Suchtiefe 1 gegeneinander antreten. Dann mit Suchtiefe 2 etc..
Daraus lässt sich ein Faktor errechnen.
Je höher die Suchtiefe, gleichzusetzen mit je höher die Spielstärke, desto mehr steigen die Remisquoten an. Allerdings ist das kaum der Rede wert.
Mir sind die Faktoren bekannt, denke das Experiment haben schon so einige unter uns gemacht die sich mit Remisquoten beschäftigen.
2. Je Gleicher die verwendeten Techniken der Schachprogramme, desto höher die Remisquote.
Klar, spielt Wasp 3.75 gegen Wasp 4.00 wird die Remisquote deutlich höher liegen, als wenn Wasp 4.00 gegen andere Schachprogramme spielt.
Sollte logisch und einleuchtend sein!
3. Contempt per UCI-Parameter
Für solche Turniere, wie das FCP Tourney-2020 mit vielen Gegnern, sollte Contempt auf 0 gesetzt werden.
Beginnen wir z. B. für Stockfish als Nummer 1 einen Contempt zu setzen müssen wir folglich für alle anderen auch einen Contempt setzen.
Für die Nummer 41 im Turnier dann einen Negativ-Contempt, für die Nummer 1 einen Positiv-Contempt und letztendlich beeinflussen wir gar die Partien negativ.
Für Engine Vergleiche bringt Contempt also recht wenig.
Eher eine Einstellung für die Turnierarena, je nachdem was für ein Gegner kommt.
4. Contempt per Sourcen
Auffällig ist, das DiscoCheck, Nachfolger Demolito, einen extrem hohen Zügedurchschnitt hat.
Immer wieder auffällig auch bei Hannibal bzw. teils auch bei anderen Programmen.
Werden Contempt Parameter in die Sourcen gesetzt können wir nichts einstellen.
Statistiken werden beeinflusst, aber ich denke das hält sich in einem nicht so dramatischen Rahmen.
Demolito macht seinen Namen wirklich Ehre, eine sehr schöne Engine-Entwicklung (gehört auch zu meinen Favoriten).
Grundsätzlich immer schön zu sehen anhand vom Beispiel Wasp:
Wasp produziert extrem wenige Remispartien unter 40 Züge, der Zügedurchschnitt ist mit ca. 91 ohne Aufgabefaktor zwar nicht auffällig aber leicht erhöht.
Klar, John hat sich etwas einfallen lassen was aber auch nach hinten losgehen kann, weil Wasp nicht zu den Endspielkünstlern gehört.
Die Stärke liegt im Mittelspiel und mithin ist Wasp auch darauf getunt und optimiert.
Die +-200 Theorie:
Spielt Wasp gegen 200 Elo höher oder niedriger ist es mit sämtlichen Tunings wieder so eine Sache.
Die Stats werden verwischt.
So gibt es bei den unterschiedlichen Programmen unterschiedliche Einstellungen, die sich in den Sourcen verbergen.
5. Ausschlaggebend neben "Programme machen viele Sachen gleich" ist für die hohen Remisquoten der Übergang zum Endspiel.
Schon allein der Tatbestand, dass fast alle Programme Endspieldatenbanken nutzen (bei Menschen ja nicht der Fall - Remisquoten -) kommt noch etwas anders hinzu:
Die extrem hohen Spielstärken werden im Übergang zum Endspiel erzeugt.
Shredder war deswegen so lange die Nummer 1 weil der Übergang zum Endspiel herausragend war.
Rybka war deswegen so lange die Nummer 1 weil der Übergang zum Endspiel herausragend war.
Es kamen die IPPs ohne das Thema jetzt wieder im Detail aufzurollen.
Critter, GullChess, Equinox, Fire, Houdini ... und so viele andere Programme erreichten plötzlich höhere Spielstärken, weil ...
Der Übergang zum Endspiel herausragend war.
Was Robert bei Houdini machte bleibt ein Rätsel, aber Houdini spielte das Mittelspiel stets ansprechender und aggressiver und das war dann der Grund das Houdini lange auf Platz 1 stand.
Houdini spielt sehr aggressiv mit Bauern und beherrscht auch die Bauerstrukturen im Übergang zum Endspiel.
Heute ist auffällig (früher fehlten uns ausreichend starke Engines um das herauszufinden), dass die genannten Programme alle keine Königsangreifer im Mittelspiel sind, gar viele Partien schnell gegen heutige Software verlieren, es sei denn es geht ins Endspiel (Ausnahme Houdini ab ca. Versions 3).
Die IPPs von früher spielen deutlich mehr Remispartien gegen heutige stärkere Programme als komplett unterschiedliche Programme wie Texel, Chiron, Pedone, Wasp etc..
Der klassische IPP, wie z. B. Equinox wird also mehr Remispartien gegen deutlich stärker erzeugen und wahrscheinlich keinerlei schnelle Gewinnpartien mehr.
Es sei denn das Gegner im Turnier sind, die eine extreme schlechte Königssicherheit im Mittelspiel, bei vielen Figuren auf dem Feld, haben.
6.
Nehmen wir einen älteren Stockfish und lassen den auf 3.100 Elo Niveau gegen Fizbo 2.0 antreten.
Die Remisquoten halten sich in den normalen Grenzen, weil zwei völlig unterschiedliche Programme gegeneinander antreten.
Ich hoffe, wir können im weiteren Verlauf zum FCP Tourney-2020 einiges herausarbeiten mittels Excel.
Klaus Wlotzka wird dabei helfen.
Allerdings werden viele interessante Statistiken erst folgen können, wenn uns mehr Partien vorliegen. Wir wollen ja auch keine hausgemachten Gerüchte in den Raum setzen oder gar unterstützen (Remisquoten), sondern nur vernünftig aufarbeiten.
In der Hoffnung es gelingt und wir können ein wenig zu absolut unnötigen "Remistod" Diskussionen beisteuern.
Bedeutet wenn das einer oder mehrere immer wieder schreiben muss man nicht auf den Zug aufspringen oder sich auch gleich von der Brücke stürzen, sondern sollte sich die Frage stellen, warum der Eindruck entsteht.
Denn, reden wir unnötig vom Remisstod schreckt das Interessierte eher ab als das mehr Personen den Weg zu diesem schönen Hobby finden.
Sollte man sich immer vor Augen halten bevor man etwas schreibt, ohne es auch nur im Ansatz zu beweisen.
Viele Grüße
Frank
Dat ging net kürzer!
Thema zu komplex, daher liebe ich es ja auch (wäre sonst langweilig).