Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Neue SSDF-Liste...
- - By Frank Meißen Date 2022-01-08 14:37 Upvotes 1
..vom 6.1. ist wie immer zu finden unter
https://ssdf.bosjo.net/

Grüße und alles Gute für das neue Jahr,
Frank
Parent - - By Lothar Jung Date 2022-01-08 14:55 Edited 2022-01-08 15:01 Upvotes 2
Gute Ergebnisse neben SF für Lc0, Komodo, Arasan, Wasp, Boot und Pedone:
Nichts festzustellen von einem großen aktuellen Abstand von SF! Besonders nicht gegenüber Lc0!

THE SSDF RATING LIST 2022-01-06    158725 games played by  418 computers             
                                           Rating   +    -  Games   Won  Oppo
                                           ------  ---   --- -----   ---  ----
   1 Stockfish 13 x64 1800X 3.6 GHz          3578   42   -38   360   71%  3424
   2 Lc0 0.26.3 Cuda(67362) 3060Ti           3573   29   -27   680   68%  3445
   3 Dragon Komodo 2.51 x64 1800X 3.6 GHz    3569   49   -45   240   66%  3436
   4 Stockfish 12 NNUE x64 1800X 3.6 GHz     3558   30   -29   560   62%  3471
   5 Stockfish 14 x64 1800X 3.6 GHz          3554   51   -48   202   59%  3502
   6 Dragon by Komodo x64 1800X 3.6 GHz      3547   34   -32   460   63%  3456
   7 Stockfish 11 x64 1800X 3.6 GHz          3540   36   -34   450   70%  3398
   8 Stockfish 10 x64 1800X 3.6 GHz          3516   25   -24   880   68%  3383
   9 Dragon Komodo 2 MCTS x64 1800X 3.6 GHz  3482   45   -44   240   55%  3453
  10 Stockfish 9 x64 1800X 3.6 GHz           3477   26   -24   882   70%  3333
  11 Komodo 13.1 x64 1800X 3.6 GHz           3465   30   -29   560   62%  3383
  12 Komodo 14 x64 1800X 3.6 GHz             3464   33   -32   440   55%  3434
  13 Komodo 13.02 x64 1800X 3.6 GHz          3458   30   -29   600   65%  3349
  14 Komodo 12.3 x64 1800X 3.6 GHz           3449   27   -26   760   66%  3332
  15 Stockfish 9 x64 Q6600 2.4 GHz           3441   32   -31   480   56%  3398
  16 Arasan 23.01 x64 1800X 3.6 GHz          3437   45   -44   240   53%  3428
  17 Booot 6.5 x64 1800X 3.6 GHz             3432   48   -50   200   44%  3486
  18 Komodo 12.3 x64 Q6600 2.4 GHz           3425   34   -33   440   60%  3357
  19 Pedone 3.1 x64 1800X 3.6 GHz            3423   46   -47   220   48%  3420
  20 Stockfish 8 x64 1800X 3.6 GHz           3423   20   -19  1440   71%  3268
  21 Dragon Komodo MCTS x64 1800X 3.6 GHz    3415   41   -41   280   52%  3404
  22 Komodo 13.2.5 MCTS x64 1800X 3.6 GHz    3411   50   -48   200   56%  3372
  23 Stockfish 8 x64 Q6600 2.4 GHz           3407   31   -30   560   65%  3299
  24 Komodo 13.02 MCTS x64 1800X 3.6 GHz     3395   31   -30   520   57%  3344
  25 Komodo 11.01 x64 1800X 3.6 GHz          3391   19   -18  1516   66%  3277
  26 Pedone 3 x64 1800X 3.6 GHz              3386   44   -45   240   43%  3436
  27 Wasp 5 x64 1800X 3.6 GHz                3378   63   -73   120   32%  3526
  28 Pedone 3.1 x64 Q6600 2.4 GHZ            3376   45   -43   260   62%  3285
  29 Booot 6.4 x64 1800X 3.6 GHz             3368   36   -36   360   51%  3364
  30 Arasan 22.3 x64 1800X 3.6 GHz           3363   45   -49   240   35%  3467
  31 Booot 6.5 x64 Q6600 2.4 GHz             3359   48   -44   240   63%  3267
  32 Deep Shredder 13 x64 1800X 3.6 GHz      3355   24   -24   880   64%  3255
  33 Booot 6.3.1 x64 1800X 3.6 GHz           3355   19   -19  1340   46%  3381
  34 Komodo 9.1 x64 Q6600 2.4 GHz            3336   20   -19  1475   72%  3176
  35 Komodo 11.01 x64 Q6600 2.4 GHz          3336   27   -27   642   50%  3336
  36 Marvin 5.1.0 x64 1800X 3.6 GHz          3324   44   -47   240   37%  3416
  37 Stockfish 6 x64 Q6600 2.4 GHz           3323   21   -20  1256   69%  3189
  38 Pedone 3 x64 Q6600 2.4 GHz              3315   45   -43   247   57%  3263
  39 Deep Shredder 13 x64 Q6600 2.4 GHz      3300   22   -21  1044   63%  3211
  40 Booot 6.3.1 x64 Q6600 2.4 GHz           3291   30   -30   520   53%  3268
  41 Vajolet2 2.8 x64 1800X 3.6 GHz          3291   27   -28   650   38%  3376
  42 Arasan 21.2 x64 1800X 3.6 GHz           3285   25   -26   800   36%  3387
  43 Pedone 2.1 x64 1800X 3.6 GHz            3283   40   -43   320   31%  3424
  44 Komodo 7 x64 Q6600 2.4 GHz              3267   23   -23   974   65%  3158
  45 Wasp 4.5 x64 1800X 3.6 GHz              3264   64   -83   140   21%  3512
  46 Vajolet2 2.8 x64 Q6600 2.4 GHz          3263   41   -37   360   69%  3125
  47 Wasp 4 x64 1800X 3.6 GHz                3255   42   -45   280   33%  3377
  48 Arasan 21.2 x64 Q6600 2.4 GHz           3245   33   -34   420   43%  3294
  49 Komodo 5.1 x64 Q6600 2.4 GHz            3244   22   -22  1038   64%  3144
  50 Marvin 5.1.0 x64 Q6600 2.4 GHz          3225   56   -58   147   47%  3254
Parent - - By Reinhold Stibi Date 2022-01-08 15:28 Edited 2022-01-08 15:53 Upvotes 1
Diese Liste ist doch total veraltet und besagt gar nichts auch wenn das zwei, drei Leute nicht
wahrhaben wollen.

Stockfish 13 auf Platz 1 ? inzwischen sind 2 Jahre vergangen. Das sieht doch ein Blinder
mit Krückstock, dass das ein Schmarren ist. 

Die SSDF-Liste ist inzwischen vollkommen bedeutungslos.

Lc0 ist inzwischen mit mindestens 50 Elo von Stockfish abgehängt.

Momentan läuft gerade bei mir ein Match Stockfish gegen Lc0. Trotz riesiger Hardware-Überlegenheit
mit zwei RTX RTX 2070 im Verbund, 20 Min. + 4 Sek. Spiele, gegen Stockfish mit nur einem Core, gelingt es Lc0 nicht eine Partie zu gewinnen.
Lc0 spielt dabei mit dem besten Netz und besten Einstellungen.
Parent - By Lothar Jung Date 2022-01-08 15:57 Edited 2022-01-08 16:08
Die Liste wurde am 6.1.22 veröffentlicht.
Es werden und wurden verschiedene, aber auch aktuelle, Versionen der Engines getestet.
Das die Liste vollkommen bedeutungslos ist, ist deine (unmaßgebliche) Meinung.
Was ist dann das beste Netz und im einzelnen die besten Einstellungen?
Es sollten diese CCC Einstellungen sein:
Backend
demux
BackendOptions
backend=cuda-fp16,multi_stream=true,threads=2,(gpu=0),(gpu=1)
CPuct
1.473
CPuctBase
45669.0
CPuctFactor
3.973
FpuValue
0.279
MaxPrefetch
37
MinibatchSize
768
MoveOverheadMs
1000
NNCacheSize
20000000
PolicyTemperature
1.3
Ponder
false
SmartPruningFactor
3.6141
SmartPruningMinimumBatches
300
StrictTiming
true
SyzygyPath
/data/tablebases
Threads
2
TimeManager
alphazero(alphazero-time-pct=23.0629)
UCI_ShowMovesLeft
true
UCI_ShowWDL
true
VerboseMoveStats
true
WeightsFile
/weights/weights_run1_610826

Und schau dir mal dies an:

https://www.twitch.tv/navratil25

Und das:

https://www.chess.com/computer-chess-championship
Parent - - By Benno Hartwig Date 2022-01-08 16:58
Was ist eigentlich von dieser seltsamen Reihenfolge der Stockfish-Versionen zu halten:

   1 Stockfish 13 x64 1800X 3.6 GHz          3578   42   -38   360   71%  3424
   4 Stockfish 12 NNUE x64 1800X 3.6 GHz     3558   30   -29   560   62%  3471
   5 Stockfish 14 x64 1800X 3.6 GHz          3554   51   -48   202   59%  3502


Mir scheint, so kleine Partienumfänge (202 bei Stockfish 14!) sollten nicht für eine veröffentliche Liste genutzt werden.
Die Ergebnisse wirken doch schon auch ein Stück weit irre.
Parent - - By Lothar Jung Date 2022-01-08 17:08
Lies dies:

Comments

to the Swedish Rating List 1/2022, January 6

This last list of 2021 and first list of 2022, will be dedicated in honor of the late Guy Haworth.

On this new years list, we can present seven new programs on our two hardware levels.

First one out is Mark Lefler and Larry Kaufman's latest version of Dragon Komodo, named 2.51. We have initially tested the non-MCTS version and after the first 240 games it has reached a rating of 3569, that is 22 points stronger than the last non-MCTS Dragon Komodo we tested. It is now just four points behind the leader from the last rating list - Lc0. It is also nine points below Stockfish 13 - which now has taken over the leader spot in the rating list. Dragon Komodo 2.51 is now more than 100 points stronger than the best non-NNUE version of Komodo we have tested! As before we have used the opening book "out10-35.bin" of Erdogan Gunes for the testing of Dragon Komodo.

Next one out is the latest creation from team Stockfish, namely Stockfish 14. After the first 202 games it has reached a rating of 3554, which is 24 points behind Stockfish 13 in first place, and 4 points behind Stockfish 12. For the testing of Stockfish 14 we have used the opening book by Fauzi Dabat named "Aggressive 5.0 by Fauzi.abk". More games will probably be needed to stabilise the rating against the other engines in the top, lower the error bars and see if it will be able to supersede the older version as more games are played.

We have also tested two new engines from Jon Dart, named Arasan 22.3 and the neural network architecture (NNUE) version named 23.01. For the testing of these two engines, we have used Arasan's own opening book. Arasan 22.3 has reached the rating of 3363 after the 240 games. This is 78 points stronger than the last Arasan 21.2 version we have tested. The NNUE version: Arasan 23.01, has then gained a further 74 points on that, resulting in the rating of 3437 after the first 240 games.

We also have the latest (and last) free Pedone-version in this rating list. It is Pedone 3.1 by Fabio Gobbato. Like the 3.0-version of the same program, it uses NNUE in the search. We have tested it on both our hardware levels. On the 1800X - Pedone 3.1 has reached a rating of 3423 after 220 games played. On the Q6600 hardware, Pedone 3.1 has achieved a rating of 3376 after 260 games. The difference between the two hardware is 47 points, and Pedone 3.1 on the 1800X is 37 points stronger than Pedone 3.0 1800X. On the Q6600, the difference between Pedone 3.1 and 3.0 is 53 points. We have used Pedone's own opening book for the testing of Pedone 3.1.

We can also present a rating of Alex Morozov's latest Booot program, named Booot 6.5. We have tested this program on two of our hardware levels. On our 1800X hardware, Booot 6.5 has received a rating of 3432 after 200 games. On our Q6600 hardware, Booot 6.5 has reached a rating of 3359 after 240 games. The difference between the two different hardware is 73 points. The 6.5-version is 64 points ahead of the formerly tested Booot 6.4 on the 1800X and on the Q6600, the difference between Booot 6.5 and Booot 6.3.1 is 68 points. We have used Sedat Canbaz's "Perfect2021.abk" for the testing of Booot 6.5.

We are also able to welcome a Swedish newcomer in this rating list! Probably the first Swedish program in the list after Per Ola Valfridsson's - Ruffian, I guess? It is Martin Danielsson's engine: Marvin 5.1.0, which we have tested on both our hardware levels. We have used Marvin's own opening book for the testing. Marvin is from the 5.0.0-version a neural network architecture (NNUE)-program. On our 1800X hardware, Marvin 5.1.0 has reached a rating of 3324 after 240 games. On the Q6600 hardware, Marvin 5.1.0 has gotten a rating of 3225 after the first 147 games. The difference between the two hardware is just shy of 100 points.

Last, but not least, is the two Wasp-programs from John Stanback. The first one is Wasp 4.5, which uses ordinary search, and has received a rating of 3264 after the first 140 games. This is nine points ahead of the formerly tested Wasp 4. Wasp 5.0 has introduced NNUE in its search. This has proven to be valuable for Wasp (as for other NNUE engines), and Wasp 5.0 1800X has received a rating of 3378 after the first 120 games. Albeit it's early in the testing, the difference between the two versions is now 114 points at least!
Parent - By Benno Hartwig Date 2022-01-08 17:51

> For the testing of Stockfish 14 we have used the opening book by Fauzi Dabat named "Aggressive 5.0 by Fauzi.abk".


Verstehe ich richtig: Die Engines bekommen ganz verschiedene Bücher???
Na, das wäre ja mal originell, wenn man doch eigentlich etwas über die Engines erfahren möchte, wenn man dann eine Ratingliste der Eninges veröffentlicht!
Parent - - By Andreas Mader Date 2022-01-08 19:42 Edited 2022-01-08 19:59 Upvotes 5
Benno Hartwig schrieb:

Was ist eigentlich von dieser seltsamen Reihenfolge der Stockfish-Versionen zu halten:

<code>   1 Stockfish 13 x64 1800X 3.6 GHz          3578   42   -38   360   71%  3424
   4 Stockfish 12 NNUE x64 1800X 3.6 GHz     3558   30   -29   560   62%  3471
   5 Stockfish 14 x64 1800X 3.6 GHz          3554   51   -48   202   59%  3502</code>

Mir scheint, so kleine Partienumfänge (202 bei Stockfish 14!) sollten nicht für eine veröffentliche Liste genutzt werden.
Die Ergebnisse wirken doch schon auch ein Stück weit irre.


Hinter den ELO-Zahlen gibt es zwei Spalten, die beinhalten den "Margin of Error". Die wahre ELO-Zahl liegt demnach bei Stockfish 14 aufgrund der bisher gespielten Partien zwischen 3554-48 und 3554+51, und das auch "nur" mit einer 95%igen Wahrscheinlichkeit.

In einer Zeit, in der ELO-Angaben mit zwei Stellen hinter dem Komma erfolgen und jedes einzelne Turnier, in dem im Ergebnis die exakte Reihenfolge nach ELO-Rating nicht penibel eingehalten wird, als "wertlos" bezeichnet wird, mutet es wirklich vollkommen anachronistisch an, wenn sich die Schweden nach wie vor mathematisch und statistisch korrekt verhalten. Sie können keine endgültigen Antworten anbieten, weil es die nicht gibt, aber das wird überhaupt nicht gerne gesehen. Wenn man die Liste richtig liest und nicht stur ausschließlich auf das Rating und die Reihenfolge starrt, ist sie wertvoller als die meisten anderen Rankings.

Schöne Grüße
Andreas
Parent - - By Wilfried Eilmes Date 2022-01-10 19:39 Upvotes 1
Code:
In einer Zeit, in der ELO-Angaben mit zwei Stellen hinter dem Komma erfolgen und jedes einzelne Turnier, in dem im Ergebnis die exakte Reihenfolge nach ELO-Rating nicht penibel eingehalten wird, als "wertlos" bezeichnet wird, mutet es wirklich vollkommen anachronistisch an, wenn sich die Schweden nach wie vor mathematisch und statistisch korrekt verhalten. Sie können keine endgültigen Antworten anbieten, weil es die nicht gibt, aber das wird überhaupt nicht gerne gesehen. Wenn man die Liste richtig liest und nicht stur ausschließlich auf das Rating und die Reihenfolge starrt, ist sie wertvoller als die meisten anderen Rankings.

Gut gebrüllt Löwe! Danke!
Erinnert mich an die aufregenden MODUL-Zeiten mit den sauberen Analysen zu den Schachcomputern bzw. deren Spielweisen/Eigenarten.

Gruß
Wilfried Eilmes
Parent - By Volker Pittlik Date 2022-01-11 09:44 Upvotes 2
+1
Parent - By Kurt Utzinger Date 2022-01-11 09:51 Upvotes 1
Frank Meißen schrieb:

..vom 6.1. ist wie immer zu finden unter
<a class='ura' href='https://ssdf.bosjo.net/'>https://ssdf.bosjo.net/</a>

Grüße und alles Gute für das neue Jahr,
Frank


Die Liste hat einen "schlimmen" Fehler
Dragon Komodo 2.51 stat Dragon Komodo 2.5.1

 
Up Topic Hauptforen / CSS-Forum / Neue SSDF-Liste...

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill