Kurt Utzinger schrieb:
Reinhold Stibi schrieb:
Meine Lieblingsengine ist Rems 091224.
[...]
Natürlich wäre es schön von Rems bei offiziellen Turnieren eingesetzt würde;
<code>besonders mit Vorgabestellungen im Vergleich zu Stockfish</code>
<code>
Hallo Reinhold
Habe ich nicht schon wiederholt darauf hingewiesen, dass die klare Überlegenheit
von Rems & Co. gegenüber Stockfish in Testsuites und in der Analyse sich bei
Spielen von Partien gegeneinander komischerweise in Luft auflöst? Das habe ich
in Hunderten von Partien genügend feststellen dürfen. Deshalb kam dann meine
vielleicht etwas provokative Bemerkung, dass die gängigen Testsuites offenbar
die reale Spielstärke der Engines nicht abzubilden vermögen. Max Siegfried
redet hier etwas von "Makro"-Vorteilen für Stockfish.
Beste Grüsse
Kurt
</code>
Ob Mikro oder Makro, dass ist doch Jacke wie Hose.
Stockfish hat die genauere Bewertung im Mikrovorteilbereich, auch wenn er dadurch den einen oder anderen Zug in einer Testsuite übersieht.
Stelle dir vor das Stockfishs Bewertung pro Zug um +0.01 abweicht und ansteigt, unabhängig davon ob beide Engines den gleich Zug spielen oder unterschiedliche Züge.
Das ergibt nach 10 Züge +0.10
Das ergibt nach 100 Zügen +1.00
Das ergibt am Ende der Partie 1-0
Natürlich sind es nicht genau +0.01. manchmal sind es +0.02 +0.03 +0.04 +0.05 usw. und manchmal aber viel seltener ist es sogar ein -
Aber im Durchschnitt hat Stockfish ein ansteigendes +
Wenn also Stockfish nicht innerhalb der ersten 20 bis 30 Züge patzt, dann hat er zusätzlich +0.20 bis +0.30 Vorteil im Vergleich zu seinem leicht veränderten Klon Gegner.
Je höher das +, desto niedriger die Wahrscheinlichkeit das der Gegner etwas taktisches findet.
Reinhold hat übrigens von gleichwertig gesprochen, was auch richtig ist, denn gleichwertig ist nicht gleich, wie du ja selbst anhand der Ergebnisse siehst.
Wenn eine Engine so wie du es dir vorstellst die Spielstärke abbilden sollte, dann müsstest du am besten eine Testsuite erstellen, bei welcher der beste Zug +0.01 besser ist als der zweitbeste Zug.
Wenn du dann mehrere Engines darauf ansetzt, würdest du bzgl. der Spielstärke deutlich realistischere Ergebnisse erhalten. Aber um Teststellungen mit +0.01 Unterschieden richtig einschätzen zu können, sind Menschen nicht intelligent genug.
Da ist es für Menschen viel einfacher, wenn wir eine Stellungen mit 3 Gewinnzügen prüfen müssen, wo zwei mit +3.00 bewertet werden und einer mit +5.00 und diesen soll die Engine finden.
Was mich stört, ist, dass Stockfish öfters den Zug mit dem großen +
-selten, nicht sofort sieht
-sehr selten, erst nach 30 Sekunden sieht
-sehr sehr selten, erst nach 60 Sekunden bis 5 Minuten sieht
-sehr sehr sehr selten, gar nicht sehen wird
Ich plane deshalb das Problem mit einem der nachfolgenden MacBooks wie dem M5 MAX, M6 MAX zu beheben bzw. einzuschränken, aber es kommt darauf an ob Apple zusätzlich zur +20% Geschwindigkeitssteigerung beim M5 MAX auch SVE2 (30000 kN/s + 30% Geschwindigkeitssteigerung = 40000 kN/s) + Ultra Retina HDR... OLED Display mit 4.5K Auflösung oder höher, was inzwischen für Apple problemlos möglich ist sogar in bis zu 8K Auflösung.

Das ganze muss man natürlich x 2 rechnen wegen Dotprod. und hat somit einen fairen Vergleich zur Konkurrenz.

Außerdem ist zu erwarten das Apple auch den Bereich verbessern wird, wo Apple noch nicht an der Spitze ist = Parallelisierung. Da erwartet man Apple Multithreading was die Geschwindigkeit bei Stockfish und sehr sehr vielen anderen Anwendungen (z.B. Simulationen der Wissenschaftler und Studenten) deutlich erhöhen wird.

Außerdem steht ein Upgrade von PCIe 4.0 auf 5.0 an, sowie Apples eigener X3D Cache = mehr als die dreifache Cache Größe, wovon Stockfish deutlich profitieren sollte.

Außerdem könnten wir emuliertes AVX 256 und AVX 512 erhalten, da durch ein Update auf MacOS Sequoia, welches ein Rosetta Upgrade enthält, Rosetta in der Lage ist AVX2 extrem gut auf M1 bis M4 MacBooks zu emulieren.