TCEC Turnier

By Werner Schüle Date 2025-05-22 19:25 Upvotes 1

Der Engine Autor von Fritz 20 spielt aber mit seiner Engine mit.

By Stefan Pohl Date 2025-05-23 07:39

Genau. Ginkgo eben.
Und Torch hat noch nie am TCEC teilgenommen. Andrew Grant hat an dem Turnier kein so großes Interesse, weil er ja auf chesscom seine eigenen Engine-Turniere abhält, und chesscom gibt die Torch-Engine auch nur höchst ungern in fremde Hände. Ich bin ja einer der wenigen, die Torch überhaupt bekommen haben. Und ab V2.0 mußte ich sogar per Unterschrift dafür haften, daß ich Torch niemals weitergebe. Und A.Grant hat mir erzählt, daß es schon schwierig war, den CEO von chesscom zu überreden, Torch überhaupt an ein paar Ranglisten-Tester herauszugeben.
Ergo: Torch werden wir wohl nie im TCEC sehen.

By Lothar Jung Date 2025-05-25 09:59 Upvotes 1

Derzeit sieht es für Ginkgo mit Platz 25 im Turnier nicht besonders gut aus.
Gerade spielt er seine 10 Partie.
Statistisch ist der Ausgang dieses Turnier unerheblich.
Gleichwohl gewinnt man einen Überblick über die Welt der Schachengines.

By Peter Weise Date 2025-05-23 11:42 Upvotes 2

Lothar Jung schrieb:

Dort sehe ich weder Fritz 20, noch Torch, noch Ramms.
Wollen die Engine Autoren dort nicht mitspielen oder dürfen sie nicht.

Ich vermute sie meinen Rems oder Reems oder wie auch immer?
Diese Dinger stammen von keinem Engine Autoren sondern sind "Parameter-verdrehte-paste-and-copy-Teile"!
Gott sei Dank dürfen/sollen solche Machwerke nicht teilnehmen.

By Lothar Jung Date 2025-05-23 14:54

Ramms war das Synonym für Rems.
Dieses und andere Stockfish-Derivate nehmen zum Glück nicht an offiziellen Turnieren teil.
Da bei Lc0 alle wichtigen Parameter verändert werden können und die Veränderungen sichtbar sind, hat Lc0 kein Abkupferungsproblem.
Für die Verbesserung zur Lösung von Suites könnte man insbesondere die Suchparameter optimieren.
Vielleicht könnte das Fernschach davon ein wenig profitieren.
Derzeit befindet sich die Suche beim Lc0 im Umbau. Ziel ist Transparenz, Geschwindigkeit und Austausch und Wahl von verschiedenen Suchalgoritmen.
Aber daran arbeiten die KI Wissenschaftler von Lc0.

By Reinhold Stibi Date 2025-05-23 15:44 Upvotes 1

Meine Lieblingsengine ist Rems 091224.
Taktisch viel besser als Stockfish und spielerisch (positionell) gleichwertig
mit Stockfish. Mit hunderten Spielen mit verschiedenen PCs erfolgreich auf Playchess
im Internet getestet.
Mit Parameterveränderungen kann man bei Lc0 nur sehr wenig verbessern;
eher verschlimmbessern.
Da reicht Lc0 bei weitem nicht an Rems heran; auch nicht mit allerbester Hardware.

Natürlich wäre es schön von Rems bei offiziellen Turnieren eingesetzt würde;
besonders mit Vorgabestellungen im Vergleich zu Stockfish

By Kurt Utzinger Date 2025-05-25 10:31 Upvotes 2

Reinhold Stibi schrieb:

Meine Lieblingsengine ist Rems 091224.
[...]
Natürlich wäre es schön von Rems bei offiziellen Turnieren eingesetzt würde;
besonders mit Vorgabestellungen im Vergleich zu Stockfish

Hallo Reinhold
Habe ich nicht schon wiederholt darauf hingewiesen, dass die klare Überlegenheit
von Rems & Co. gegenüber Stockfish in Testsuites und in der Analyse sich bei
Spielen von Partien gegeneinander komischerweise in Luft auflöst? Das habe ich
in Hunderten von Partien genügend feststellen dürfen.  Deshalb kam dann meine
vielleicht etwas provokative Bemerkung, dass die gängigen Testsuites offenbar
die reale Spielstärke der Engines nicht abzubilden vermögen. Max Siegfried 
redet hier etwas von "Makro"-Vorteilen für Stockfish.
Beste Grüsse
Kurt

By Max Siegfried Date 2025-05-25 14:10

Kurt Utzinger schrieb:

Reinhold Stibi schrieb:

Meine Lieblingsengine ist Rems 091224.
[...]
Natürlich wäre es schön von Rems bei offiziellen Turnieren eingesetzt würde;
<code>besonders mit Vorgabestellungen im Vergleich zu Stockfish</code>

<code>Hallo Reinhold
Habe ich nicht schon wiederholt darauf hingewiesen, dass die klare Überlegenheit
von Rems & Co. gegenüber Stockfish in Testsuites und in der Analyse sich bei
Spielen von Partien gegeneinander komischerweise in Luft auflöst? Das habe ich
in Hunderten von Partien genügend feststellen dürfen. Deshalb kam dann meine
vielleicht etwas provokative Bemerkung, dass die gängigen Testsuites offenbar
die reale Spielstärke der Engines nicht abzubilden vermögen. Max Siegfried
redet hier etwas von "Makro"-Vorteilen für Stockfish.
Beste Grüsse
Kurt
</code>

Ob Mikro oder Makro, dass ist doch Jacke wie Hose.
Stockfish hat die genauere Bewertung im Mikrovorteilbereich, auch wenn er dadurch den einen oder anderen Zug in einer Testsuite übersieht.
Stelle dir vor das Stockfishs Bewertung pro Zug um +0.01 abweicht und ansteigt, unabhängig davon ob beide Engines den gleich Zug spielen oder unterschiedliche Züge.
Das ergibt nach 10 Züge +0.10
Das ergibt nach 100 Zügen +1.00
Das ergibt am Ende der Partie 1-0

Natürlich sind es nicht genau +0.01. manchmal sind es +0.02 +0.03 +0.04 +0.05 usw. und manchmal aber viel seltener ist es sogar ein -
Aber im Durchschnitt hat Stockfish ein ansteigendes +
Wenn also Stockfish nicht innerhalb der ersten 20 bis 30 Züge patzt, dann hat er zusätzlich +0.20 bis +0.30 Vorteil im Vergleich zu seinem leicht veränderten Klon Gegner.
Je höher das +, desto niedriger die Wahrscheinlichkeit das der Gegner etwas taktisches findet.

Reinhold hat übrigens von gleichwertig gesprochen, was auch richtig ist, denn gleichwertig ist nicht gleich, wie du ja selbst anhand der Ergebnisse siehst.
Wenn eine Engine so wie du es dir vorstellst die Spielstärke abbilden sollte, dann müsstest du am besten eine Testsuite erstellen, bei welcher der beste Zug +0.01 besser ist als der zweitbeste Zug.
Wenn du dann mehrere Engines darauf ansetzt, würdest du bzgl. der Spielstärke deutlich realistischere Ergebnisse erhalten. Aber um Teststellungen mit +0.01 Unterschieden richtig einschätzen zu können, sind Menschen nicht intelligent genug.
Da ist es für Menschen viel einfacher, wenn wir eine Stellungen mit 3 Gewinnzügen prüfen müssen, wo zwei mit +3.00 bewertet werden und einer mit +5.00 und diesen soll die Engine finden.

Was mich stört, ist, dass Stockfish öfters den Zug mit dem großen +
-selten, nicht sofort sieht
-sehr selten, erst nach 30 Sekunden sieht
-sehr sehr selten, erst nach 60 Sekunden bis 5 Minuten sieht
-sehr sehr sehr selten, gar nicht sehen wird

Ich plane deshalb das Problem mit einem der nachfolgenden MacBooks wie dem M5 MAX, M6 MAX zu beheben bzw. einzuschränken, aber es kommt darauf an ob Apple zusätzlich zur +20% Geschwindigkeitssteigerung beim M5 MAX auch SVE2 (30000 kN/s + 30% Geschwindigkeitssteigerung = 40000 kN/s) + Ultra Retina HDR... OLED Display mit 4.5K Auflösung oder höher, was inzwischen für Apple problemlos möglich ist sogar in bis zu 8K Auflösung.

Das ganze muss man natürlich x 2 rechnen wegen Dotprod. und hat somit einen fairen Vergleich zur Konkurrenz.

Außerdem ist zu erwarten das Apple auch den Bereich verbessern wird, wo Apple noch nicht an der Spitze ist = Parallelisierung. Da erwartet man Apple Multithreading was die Geschwindigkeit bei Stockfish und sehr sehr vielen anderen Anwendungen (z.B. Simulationen der Wissenschaftler und Studenten) deutlich erhöhen wird.

Außerdem steht ein Upgrade von PCIe 4.0 auf 5.0 an, sowie Apples eigener X3D Cache = mehr als die dreifache Cache Größe, wovon Stockfish deutlich profitieren sollte.

Außerdem könnten wir emuliertes AVX 256 und AVX 512 erhalten, da durch ein Update auf MacOS Sequoia, welches ein Rosetta Upgrade enthält, Rosetta in der Lage ist AVX2 extrem gut auf M1 bis M4 MacBooks zu emulieren.

By Lothar Jung Date 2025-05-26 20:35 Upvotes 1

Zur Halbzeit des Turniers steht Lc0 und Ceres auf dem 1. bzw. 3 Platz.
Gleichwohl liegt das Teilnehmerfeld eng zusammen.
Das liegt an den klassischen Eröffnungen.
Solche Turniere gefallen mir.

By Peter Martan Date 2025-05-26 20:56 Upvotes 1

Die Eröffnungen sind eine ganz angenehme Abwechslung zum ansonsten mittlerweile aus statistischen Gründen praktisch unausweichlichen Mix von Stellungen mit genau dosiertem Vorteil, aber das kann man sich hier auch dadurch eher leisten, weil die Spielstärkenunterschiede zwischen den vielen Engines dafür groß sind. Auf der anderen Seite verzichtet man auf solche statistische Relevanz halt gleich mal eher ganz, wenn man sie mit einem so großen Feld und den relativ dazu viel zu wenigen Partien ohnehin nicht erreicht und setzt ausschließlich auf den Unterhaltungswert der abwechslungsreichen Partien.
Und ohne die Performance der Engines schmälern zu wollen, die da jetzt gerade oben sind nach gerade mal 225 Partien unter 44 Engines, der Hauptgrund für genau die Reihung, die man da jetzt gerade hat und vermutlich auch diejenige, die dann zum Schluss bestehen wird, ist vor allem einer: Zufall.

By Lothar Jung Date 2025-05-26 21:22

Das die ersten 6 Engine dort oben stehen, ist kein Zufall.
Sie sind auch in den „schrägen“ Turnieren dort oben zu finden.
Die Spreizung ist halt bei wenigen Partien nicht gegeben.
Das kann sie auch nicht, da auch die „schwachen“ eine Elo von über 3.000 haben und die Hardware sehr stark und die Bedenkzeit komfortabel ist.
Leider wird die SSDF-Liste derzeit nicht mehr fortgeführt.
Sie war für mich der Gradmesser der Stärke über alle Engine Generationen hinweg.

By Peter Martan Date 2025-05-26 21:35 Edited 2025-05-26 21:55

Lothar Jung schrieb:

Das die ersten 6 Engine dort oben stehen, ist kein Zufall.
Sie sind auch in den „schrägen“ Turnieren dort oben zu finden.
Die Spreizung ist halt bei wenigen Partien nicht gegeben.

Wenn die Spreizung klein genug wird, wird sie irgendwann so klein, dass neben dem Rating, das hier sowieso eines ist, das aus der Luft gegriffen ist (wieder im Vergleich zu anderen Ratings und zur error bar natürlich, gerade ganz oben besteht schon irgendwie ein Zusammenhang, er ist halt recht lose) auch das Ranking zum Zufall wird. Und da rede ich noch nicht davon, dass du mit einem so bunten großen Teilnehmerfeld auch bei entsprechend ausreichend großen Partiezahlen ein anderes Rating und Ranking bekommst als bei einem kleineren selektiveren. Vordergründig, was das Ranking angeht, schon allein deshalb, weil du beim kleineren Feld weniger Plätze zu vergeben hast

Zufall ist überhaupt in dem Zusammenhang eine quantitative Frage, irgendwie spielt er immer eine Rolle, hier halt einer relativ große. Aber über groß und klein lässt sich in dem Zusammenhang trefflich streiten, bei 200 Partien (das war das letzte Mal, dass ich runtergeladen habe, das nächste Mal mach ich's wieder bei 250, um da dann auch wieder noch besonders schönen zu suchen) war die error bar zwischen dem damals Führenden und dem Zweiten eine von +250 und -128 laut EloStat. Anhand solcher Zahlen könnte man "Zufall" vielleicht ein bisschen besser quantifizieren als nur mit "groß" und "klein". Wieviele andere Rankings in so ein Rating, nämlich in diese error bar davon, dann auch noch innerhalb einer gewissen Wahrscheinlichkeit hineinpassen würden, als das eine allein, das zufällig gerade das gegebene ist, überlasse ich den Mathematikern.

Und ja, ich weiß schon, dass das Schweizer System wenigstens ganz oben und ganz unten mit weniger Partien bei vielen Teilnehmern die Relevanz der Ergebnisse etwas erhöhen soll und das in gewissen Grenzen auch tut, aber diese Grenzen gibt's halt trotzdem.

By Lothar Jung Date 2025-05-28 13:52 Upvotes 1

Lc0 rückt auf Platz 1 hoch.
Unabhängig davon würde ich Lc0 nicht unterschätzen.
Insbesondere für den privaten Bereich.
Im KI-Bereich wird heftig geforscht und die Hardware wird relativ schnell preiswerter.

By Max Siegfried Date 2025-05-28 15:33

Lothar Jung schrieb:

Es war doch schon lange klar das LC0 aus der Grundstellung heraus deutlich besser ist

By Lothar Jung Date 2025-06-01 18:44

Meine Favoriten für die Zukunft sind Integral und PlenyChess.
Sie sind nicht weit von den Medaillenränge entfernt.