1 Stockfish dev-20250802-a37b38bd 28 17.5 62.5% 9 [9/0] 2 [0/2] 17 [5/12] 17.470 [-0.030] 225.25 3731 -6 [3725]
2 Integral 7.0.0-dev-0d55bc02 28 17 60.71% 8 [8/0] 2 [0/2] 18 [6/12] 16.909 [-0.091] 223 3576 15 [3591]
3 LCZero 0.31-dag-4d98c58-BT5-3700000 28 16.5 58.93% 6 [5/1] 1 [0/1] 21 [9/12] 16.309 [-0.191] 221 3692 -5 [3687]
4 Obsidian dev-16.14 28 16 57.14% 9 [9/0] 5 [0/5] 14 [5/9] 15.870 [-0.130] 213.25 3645 1 [3646]
5 PlentyChess 6.0.14 28 13.5 48.21% 6 [6/0] 7 [0/7] 15 [8/7] 13.780 [ 0.280] 178.75 3588 3 [3591]
6 Berserk 20250622 28 11.5 41.07% 4 [4/0] 9 [0/9] 15 [10/5] 11.586 [ 0.086] 160 3650 -12 [3638]
7 Ethereal 14.40 28 10 [2.5] 35.71% 4 [4/0] 12 [0/12] 12 [10/2] 10.069 [ 0.069] 136.75 3618 -16 [3602]
8 KomodoDragon 3.3 28 10 [1.5] 35.71% 3 [3/0] 11 [1/10] 14 [10/4] 10.007 [ 0.007] 140 3620 -17 [3603]
Hallo Lothar
Wenn das so bleibt, dann gehört neben Stockfish, Lc0 und Obsidian auch
Integral v7.0.0 neu und überraschend zur Spitze der heutigen Schachprogramme.
Und interessant, dass neben Stockfish und der ebenfalls sehr guten Engine Berserk 13
auch Integral v7.0.0 in allen Testsuites schlecht abschneidet und Welten hinter z.B.
Rems M-091224 M Random Op. MultiPV=4 liegt. Ein Beweis mehr, dass offenbar
die heutigen Testsuites nicht in der Lage sind, die reale spielerische Stärke der
Engines abzubilden.
Gruss
Kurt
Hallo Reinhold
Das sehe ich völlig anders. Oder willst du behaupten, dass die von mir genannten
Engines taktisch nicht stark sind? Keine nicht taktisch starke Engine könnte in
vielen Partien an der Spitze mitspielen. Nehmen wir es doch endlich zu Kenntnis,
dass es an den Testsuites liegt, die ganz offensichtlich keine reale Spielstärke
abzubilden vermögen.
Gruss
Kurt
Hallo Reinhold
Die logische Konsequenz davon: Testsuites, die wir heute kennen, bringen nichts, bzw.
sicher viel zu wenig. Demzufolge bleibt nur noch das Spielen von Tausenden Partien gegen
verschiedene Gegner, um gefestigte Erkenntnisse zu erhalten. Und da diese Arbeit sehr
zeitaufwändig ist, behilft man sich mit Bullet- und Blitzpartien und (sehr) kurzen Zeitvorgaben
für die Engines, welche dank schneller Hardware auch schon beachtliche Suchtiefen erreichen.
Können aber solche Partien einem Vergleich mit TCEC standhalten, bleibt für mich wenigstens
noch eine offene Frage. Man müsste untersuchen, ob bei TCEC-Partien vergleichsweise zu
Blitzpartien mehr Siege/Niederlagen produziert werden oder nicht. Und am Ende scheint
es schwer verständlich, weshalb wir sehen/glauben, dass Engine X gegenüber Engine Y bei
der Analyse von Partien so viel besser abschneidet als andere Engines. Computerschach
ist heute verdammt kompliziert geworden.
Gruss
Kurt
Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill