Noch einer ...
schaue ich so auf meine Excel Tabellen fällt z. b. folgendes auf:
Sjeng, Zappa, IvanHoe, Rybka, Komodo, Shredder, Spark
spielen beständig!
Warum ist das so?
- höhere Remisquote
- Stärken und Schwächen sind eindeutig
- besser programmiert
- etc, etc.
Stockfish, Junior, Hannibal, GullChess, Spike ...
spielen z. B. launisch
- ausgeprägte Schwächen oder Stärken?
Bei Junior ist es das Endspiel, GullChess spielt total ruhig unauffällig und hat einige Aussetzer im Endspiel. Hannibal geht mit vielen Stellungstypen extrem gut um, bei anderen eher gegenteilig. Die Entwicklung scheint noch lange nicht abgeschlossen zu sein. Spike spielt sehr viele Stellungen extrem ausgeglichen und bei anderen ist alles möglich. Stockfish gibt zu viele Partien Remis ab, fällt durch eine gute Taktik auf. Stockfish hat auch ein gutes Endspiel aber gibt zu früh Remis, gerade in der Partienphase in der schwächere Engines patzen.
Um mal ein paar Beispiele zu nennen!
Das alles wirkt sich auf ein Rating aus. Die Engines beginnen meist zu schwanken, schön in den ELO-Entwicklungskurven zu erkennen. Wobei hier auch nur um 10 ELO wenn es schon über 1.000 Partien gegangen ist.
Um die Aussagen vom Vorposting etwas klarer in Position zu stellen.
Macht z. B. auch Aussagen deutlich schwieriger ...
Diese Engine gehört zu den Taktikern oder eher zu den positionellen Programmen. Cyclone wäre z. B. eher der Stratege mit fehlendem Wissen im Endspiel und viele Partien werden hier vergeigt. Kommen wir dann auch wieder zu der Aussage, auch Fruit spielt vergleichbar wie Cyclone, klar! Schauen wir uns die Mittelspielstatistiken an dann fällt auf, dass der Unterschied zwischen den TOPs und Cyclone / Fruit viel geringer ist als die ELO aussagt. Schauen wir auf das späte Mittelspiel und frühe Endspiel ... ja dann wissen wir wo her die extrem hohen Zahlen bei den derzeitigen TOP 7 mit Houdini, Critter, Komodo, Stockfish, Rybka, IvanHoe und Fire her kommen. Vom Thema abgedriftet.
Wahrscheinlich ist es so, dass ermittelte Ratings aus der Vergangenheit OK sind. Bei Engines die größere Schwankungen aufweisen vielleicht hier und dort etwas abweichen. Aber so sicher bin ich mir mit diesen Aussagen gar nicht. Es fällt auf beim Betrieb einer Ratingliste, Dinge die einfach nur auffallen.
Gruß
Frank