Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / CEGT: 25'+8" - Liste
- - By Wolfgang Battig Date 2021-01-03 04:00 Upvotes 2
Unsere Liste mit der längsten Bedenkzeit, 25 Minuten/Partie + 8 Sekunden/Zug, wird nun nach einiger Pause - unser Webmaster und Haupttester dieser Liste ist im Umzugsstress - schrittweise wieder fortgesetzt.

Die aktuelle (Haupt)Liste findet Ihr hier

Aktuell im Test:
SlowChess Blitz Classic 2.4
Komodo Dragon 1.0
RubiChess 1.9.0 NNUE
Igel 2.8.0 NNUE
StoofvleesII a16
Parent - - By Benno Hartwig Date 2021-01-03 07:34
Wunderbar! Danke!
Faszinierend, dass hier in der Liste der neue Dragon so weit oben steht.
Mal schauen, wie es sich weiterentwickelt, wie sich die Verhältnisse nach dieser Pause jetzt entwickeln.
CEGT ist ganz bestimmt immer noch eine ganz, ganz wichtige und vielleicht auch die wichtigste Quelle für die spielstärkemäßige Einordnung von Engines!
Parent - - By Patrick Götz Date 2021-01-04 20:07
Benno Hartwig schrieb:

Faszinierend, dass hier in der Liste der neue Dragon so weit oben steht.

Das liegt nur daran das Dragon noch nicht gegen LCZero (LS15.0) gespielt hat.
Parent - - By Wolfgang Battig Date 2021-01-04 22:28 Upvotes 1
Sei mir nicht bös, Patrick, aber das ist Quatsch.
Dragon hat bereits 1000 Partien gespielt, da ändert ein (!!) Match über 100 Partien gegen einen (!) Gegner nur in extrem seltenen Fällen etwas substantielles. Selbst wenn das Match deutlich in die Hose gehen würude, also z.B. 50 Punkte schlechtere Performance als im Schnitt der anderen bisher 10 Matches, macht das in der Summe vielleicht 5 ELO aus. Also quasi nix.

Ich will ausdrücklich nicht ausschließen, dass Dragon nach Testende, also nach fast 2000 Partien noch etwas abgefallen sein wird.
An dem einen Match wird es nach aller Erfahrung aus jetzt 15 Jahren als CEGT Tester nicht liegen.
Parent - - By Patrick Götz Date 2021-01-04 23:19
Wolfgang Battig schrieb:

Sei mir nicht bös, Patrick, aber das ist Quatsch.

Sei mir nicht bös Wolfgang, aber ich bleibe dabei.
LC0 wird sich für Dragon als "Angstgegner" herausstellen, genauso wie LC0: für Stockfish der Angstgegner ist.
Parent - By Wolfgang Battig Date 2021-01-05 03:30 Upvotes 1
Hallo Patrick,

mich würde interessieren, wie Du zu dieser „Angstgegner“-Einschätzung kommst. Ist das ein Eindruck, ein (Bauch)Gefühl, eine Theorie oder...? Muss ja auf etwas basieren...

Letztlich zählt das alles – zumindest was Ranglisten angeht (und um die geht es hier ja) – nicht. Da geht es um (halbwegs) gleiche Bedingungen und letztlich um schnöde Zahlen (Ergebnisse). Klingt möglicherweise langweilig, ist es manchmal auch. Und die (unsere) bisherigen Zahlen geben die Angstgegnertheorie eben NICHT her.

Ich poste mal die bisher vorliegenden Ergebnisse von Dragon gegen LCZero mit verschiedenen Bedenkzeiten und verschiedenen LCZero-Netzen. Sind ausschließlich CEGT-Ergebnisse, weil ich die beurteilen kann und weiß wie sie zustandegekommen sind.
Immer schön nach dem Motto: „Traue keiner Statistik, die du nicht selbst gefälscht hast“

Dragon 1.0 vs. Leelenstein 15.0 (0.25.1)
40/4:  56,3% aus 200 Partien = +44 ELO für Dragon
5+3PB: 50,0% aus 100 Partien = +-0 ELO
25+8:  Match noch nicht gespielt, hoffe ich kann das bald starten, dauert dann aber 4-5 Tage


Dragon 1.0 vs. LCZero 0.26.3 mit 30x384 Netzen
40/4 : 47,0% aus 100 Partien gegen Netz J92-330 = -21 ELO
40/20: 49,0% aus 100 Partien gegen Netz J92-270 =  -7 ELO


LCZero ist mit den neueren Netzen bei etwa gleichen Bedingungen insgesamt etwas stärker als Dragon, da bin ich bei Dir. Aber "Angstgegner"? No way...

Aber selbst wenn es so wäre und Dragon würde das Match für die 25+8-Liste klar verlieren, hätte das für die Rangliste nach 1600 oder 1700 Partien nur geringe Auswirkungen. Wiederhole mich da gerne.

Beispiel:
Durchschnittliche Performance aus 1500 Partien: 3500
Das Angstgegner-Match (100 zusätzlich): 3400
Performance aus dann 1600 Partien: ca. 3494

Also selbst für den unwahrscheinlichen Fall, dass Dragon das Match gegen Leelenstein 15 mit minus 100 ELO (36:64) verliert, macht das in etwa unbedeutende 6 Punkte aus und ändert an der Position in der Spitze nichts.

Grüße
Parent - - By Wolfgang Battig Date 2021-01-09 19:01 Upvotes 1
Patrick Götz schrieb:

...
Das liegt nur daran das Dragon noch nicht gegen LCZero (LS15.0) gespielt hat.

Das Match ist nun gespielt und endete schiedlich-friedlich mit 50,0:50,0 (je 7 Siege bei 86 Remis). Die Bedingungen bei dieser Kombination (GTX1060 <=> i7-4770) sind leicht "leela-freundlich", zumal die mittelgroßen Netze (20x256) wie z.B. Leelenstein 15 auch auf dieser GPU gut laufen.

Dieses 50%-Ergebnis kostete Dragon übrigens "gigantische" 3 ELO in der - recht ungenauen - "Live"-Wertung, vorher 3497, jetzt 3494. Also quasi nix
Parent - - By Patrick Götz Date 2021-01-09 20:22
Du hast die Lage von Anfang an richtig eingeschätzt. Respekt!
Beste Grüße Patrick
Parent - - By Wolfgang Battig Date 2021-01-10 03:21
Danke!
Mal sehen wann ich eine neue(re) LC0-Version für diese Liste testen kann. Leelenstein 15 ist doch schon recht "alt" und eine neuere Version wird sich höchstwahrscheinlich vor Dragon platzieren.
Wird aber sicher noch etwas dauern (ein Durchlauf wie erwähnt ca. 3 Monate, puh...)
Jetzt ist erstmal Stoofvlees dran und das dauert auch
Parent - By Benno Hartwig Date 2021-01-10 08:02

>  (ein Durchlauf wie erwähnt ca. 3 Monate, puh...)


Ja, dieses "Puh" verstehe ich gut.
Ich bin schon dankbar, wenn es auch Ergebnisse und Listen mit längeren Zeiten gibt. Ja. Allein schon, um die Beziehung zwischen kurzen und langen Zeiten zu erahnen.
Aber ob es diese Mühe bis hin zu statistische relevanten Ergebnissen wirklich lohnt?
Parent - - By Clemens Keck Date 2021-01-03 10:31
Super Liste! Super Zeitkontrolle !

Alles gute im neuen Jahr CEGT 

Lc026.3 + 66740 könnte an Komodo Dragon vorbei ziehen.

C.K.
Parent - By Wolfgang Battig Date 2021-01-03 21:18 Edited 2021-01-03 21:21
Hallo Clemens,

vielen Dank für das Lob und die netten Wünsche, die ich natürlich gerne erwidere.
Selbiges natürlich auch an Benno.

Zu LCZero.
Ja, Du hast sicher Recht. Ich teste gerade eines der "großen" Netze LCZero 0.26.3 J92-330 für die 40/4.
Obwohl die 30/384-Netze auf meiner GTX-Hardware sehr langsam sind, was die Knoten/Sek. angeht, kann es sehr gut mithalten. Hatte ich so nicht erwartet.
Aber egal, langsam hin oder her, die Bedingungen für GPU und CPU sind in etwa gleich (evtl. minimal vorteilhaft für LC0). Das ist es, worauf es bei Ranglistentests ankommt.

Ich werde sicher bei Gelegenheit auch wieder ein neues LCZero Netz für die 25+8 testen, steht allerdings nicht oben auf der Prioritätenliste.
Hauptproblem ist nämlich, dass so ein Komplettdurchlauf auf einer Grafikkarte sehr lange dauert. Bei dieser Bedenkzeit schafft man auf einer Karte ca. 20 pro Tag, evtl. etwas mehr. Ein 100er-Match dauert also 4-5 Tage. Ein Komplettdurchlauf mit 1800 Partien somit ca. 3 Monate! Da muss ich schon genau nachdenken, bevor ich eine meiner beiden Karten so lange blockiere...

Kann gut nachvollziehen, dass z.B. Andreas Strangmüller in seinen Listen mit längerer Bedenkzeit gar keine LCZero-Version drin hat. Bei 60+15 dauert es bei gleicher Partienzahl ja locker ein halbes Jahr...

Zudem zähle ich mich nicht unbedingt zu den LCZero-Fans. Mich interessiert das, ja, aber mehr auch nicht. Gibt im Computerschach so viel was man machen kann.
Die Verengung auf eine Engine ist nichts für mich. Aber das muss natürlich jeder für sich entscheiden.

Grüße
- By Wolfgang Battig Date 2021-01-23 00:29
Ein neues Update ist online, Neueinsteiger sind:

RubiChess 1.9.0NN  (1500 von 1800 gespielt)
Igel 2.8.0NN       (900 von 1800 gespielt)
Stoofvlees II a16  (200 von 1800 gespielt, das dauert also noch...)
Up Topic Hauptforen / CSS-Forum / CEGT: 25'+8" - Liste

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill