Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Spielt Stockfish zu oft ein schlechtes Remis oder ist es doch gerechtfertigt?
- - By Max Siegfried Date 2022-08-26 08:54
Stockfish vom 17.08. spielt oft ein schlechtes Remis: 18.67%
https://www.sp-cc.de/files/statistix_eas_ratinglist.txt
Parent - - By Frank Quisinsky Date 2022-08-26 11:52
Hallo,

muss man berücksichtigen wie hoch die Remiswahrscheinlichkeit bei den herausgefundenen Varianten generell ist.
Sonst kann man nicht von einem schlechten Remis sprechen, zumidest bei den kurzen Remispartien.

Generell ärgert mich eher, dass der Zügedurchschnitt bei Stockfish bei den Remisen hoch gegangen ist.
Ein Contempt gibt es nicht mehr und mithin kann das nicht versucht werden nach unten zu regulieren.

Insofern ist Stockfish in den aktuellen Versionen kein Thema für mich.

Interessant ist bei Stockfish der Umstand, dass die Version 11 im Vergleich zur Version 15 die gleiche Anzahl an schnellen Gewinnen produziert.
An Stockfish ist sehr schön zu sehen woher der Zugewinn in Elo durch Neural Network kommt.
Man könnte auch sagen ... an Stockfish ist sehr schön zu sehen wie leistungsstark die Engine schon vor Neural Network im Eröffnungsspiel war.
Denn da kommt Komodo 14.1 (auch die letzte Version ohne Neural Network) nicht heran.

Schnelle Remispartien müssen also keine "schlechten Remispartien" sein.
Schlechte Remispartien sind eher die, wo trotz absolut klarer Remisstellung das Spiel nach hinten heraus getrieben wird um 3 Elo mehr herauszuholen.
So nach der Denke ... der Gegner könnte ja ein Zeitproblem bekommen oder einen Fehler im Programm haben.

Das ist mit Einsicht vorbei am Ziel.
Computerschach sollte stets interessant sein und niemals langweilig werden.

Was würde passieren wenn bei einem Match Carlsen - Nakamura die Herren über 200 Züge spielen.
Die große Schnarcherei würde bei den Zuschauern ausbrechen!

Zur Zeit versuchen die Fans oder Programmierer unsinnige Argumente zu finden, sich offenbar die Partien ohne Aufgabefaktor nicht bis zum Partieende anzusehen.
Oft denke ich einfach das sich einige noch nie Statistiken angesehen haben, anders kann ich mir teils ziemlich fragwürdige Argumente nicht mehr erklären.

Bei Stockfish fällt das weniger beim Zügedurchschnitt auf.
Stockfish spielt eine enorm hohe Zahl an kurzen Partien bis zum Matt und dann stimmt der Zügedurchschnitt augenscheinlich.
Schaut man sich aber speziell den Zügedurchschnitt bei den Remisen an stimmt etwas nicht.

In Anbetracht das Stockfish nicht der Nabel der Welt ist, ist das auch nicht so wichtig.
Wir haben eine schier unglaubliche Zahl an Engines die vieles richtig machen und Anwender begeistern können, das war noch nie anders!
Auch Stockfish aber der Zügedurchschnitt bei den Remisen ... da fabrizierte man ca. zur Jahreswende eine eher schlechte Änderung.

Und wie das so ist ... in diesem Fall springen direkt eine ganze Anzahl an Programmierern, die sich an Stockfish orientieren um es gelinde auszudrücken, mit auf den Zug.

Viele Grüße
Frank
Parent - By Stefan Pohl Date 2022-08-26 12:21 Edited 2022-08-26 13:02
Frank Quisinsky schrieb:

Hallo,

muss man berücksichtigen wie hoch die Remiswahrscheinlichkeit bei den herausgefundenen Varianten generell ist.
Sonst kann man nicht von einem schlechten Remis sprechen, zumidest bei den kurzen Remispartien.



Doch kann man. Wenn, wie in meinen Ranglistenpartien, immer die genau gleichen Eröffnungen benutzt werden,,schon. Dann ist es belanglos, ob einige Eröffnungen remislastiger als andere sind. Denn die EAS Punkte und die EAS-Rangliste liest man ja immer relativ, also die Werte einer Engine verglichen mit anderen Engines. Ebenso der Rang der Engine in der EAS Liste. Das alles ist ja immer relativ zu den anderen Engines, die eben mit denselben Eröffnungen gespielt haben. Alle Engines in der SPCC-Rangliste (und damit auch in der EAS-Rangliste) spielen gegen jede ihrer Gegner-Engines ja immer einen 1000er Testrun, wobei immer die 500 Stellungen des HERT-Sets von Thomas Zipproth doppelt (vertauschte Farben) abgespielt werden.
Zu sagen 18% bad draws ist schlecht oder gut per se ist demzufolge Quatsch. Man muß eben schauen,,wieviele bad draws haben die anderen Engines erzielt. Und das in Bezug setzen.
Wie ich immer schon sagte: Absolute Zahlen in Statistiken sind Quatsch. Nur relativ zu anderen Ergebnissen ergeben Statistiken Sinn. Daher basieren die EAS scores immer auf Prozentwerten, nicht absoluten Zahlen. Und selbst diese prozentualen Statistiken ergeben nur Aussagekraft,,wenn man sie relativ zu den (prozentualen) Ergebnissen der anderen Engines in der EAS Liste betrachtet.
Liest man die Liste so, also richtig, wird schnell klar, daß Stockfish eher wenige bad draws produziert.

Was sind bad draws? Hier nochmal die Erläuterung:
Bad draws are games, which were drawn before endgame was reached (except the games, were the engine had a material disadvantage of at least 1 pawn (because draws with material disadvantage prevented a possible loss)) and draws after the engine had a material advantage of at least 1 pawn (because the engine should win a game, if material was won) in the game.

Kurz: Remisen schon im Mittelspiel (Partien sollen ja ausgespielt werden und keine "Großmeisterremisen" sein) (es sei denn, die Engine hatte Materialnachteil, denn dann ist ein Remis ja Rettung eines halben Punktes) und alle Remisen, wo die Engine Materialvorteil in der Partie hatte (mit mehr Material sollte die Engine ja gewinnen, nicht remisieren). Wobei die Unterscheidung in Mittelspiel/Endspiel über einen Materialfilter von pgn-extract entschieden wird, nicht über Partielänge.
Parent - By Stefan Pohl Date 2022-08-26 12:05 Upvotes 1
Falsch. Nur eine Handvoll Engines (von 43) haben weniger bad draws in meiner EAS Liste. Insofern ist Stockfish 220817 bei den bad draws ziemlich gut, sogar deutlich besser als die Gesamtplatzierung in der EAS Rangliste dieses Stockfishes (12)
Up Topic Hauptforen / CSS-Forum / Spielt Stockfish zu oft ein schlechtes Remis oder ist es doch gerechtfertigt?

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill