Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / s22 - Superfinale: Stockfish vs. Dragon
1 2 3 Previous Next  
Parent - - By Benno Hartwig Date 2022-04-21 19:35
Und hatte dieser alte cfish wirklich mal 33% Geschwindigkeitsvorteil (Knotenleistung) vor dem seinerzeitigen Stockfish? Diese Zahl kommt mir doch reichlich gewagt vor.
Wobei ich mal vertrauensvoll davon ausgehe, dass bei jenem cfish nicht mutwillig an dieser Berechnung der Knotenleistung "herumoptimiert" wurde.
Parent - - By Detlef Uter Date 2022-04-21 20:12
Ja - der gute alte CFish war zu seiner Zeit, als er noch so ziemlich aktuell war,
tatsächlich rund 33% schneller als der damals aktuelle Stockfish!
Parent - - By Max Siegfried Date 2022-04-21 23:40
Detlef Uter schrieb:

Ja - der gute alte CFish war zu seiner Zeit, als er noch so ziemlich aktuell war,
tatsächlich rund 33% schneller als der damals aktuelle Stockfish!


Gerade deshalb sind heutzutage immer noch so viele Menschen an dem 33 % schnelleren Stockfisch interessiert.
Es macht schon einen gewissen Unterschied ob eine Engine mit 30000 kN/s oder mit 40000 kN/s läuft. Ohne das eine neue Hardware angeschafft werden muss.
Parent - - By Andreas Mader Date 2022-04-22 21:09 Upvotes 1
Max Siegfried schrieb:

Detlef Uter schrieb:

Ja - der gute alte CFish war zu seiner Zeit, als er noch so ziemlich aktuell war,
tatsächlich rund 33% schneller als der damals aktuelle Stockfish!


Gerade deshalb sind heutzutage immer noch so viele Menschen an dem 33 % schnelleren Stockfisch interessiert.
Es macht schon einen gewissen Unterschied ob eine Engine mit 30000 kN/s oder mit 40000 kN/s läuft. Ohne das eine neue Hardware angeschafft werden muss.


Ich persönlich glaube nicht, dass CFish durch irgendeinen Voodoo identisch mit Stockfish, aber um 33% schneller war. Mehr Knoten/Sekunde haben einen Preis, der gezahlt werden muss. Da muss irgendwo anders etwas weggelassen worden sein.

Schöne Grüße
Andreas Mader
Parent - - By Thomas Plaschke Date 2022-04-23 00:24
Ronald de Man hat Stockfish von C++ nach C übersetzt und dieses funktionsgleiche Programm Cfish genannt. Lediglich die UCI-Parameter sind um einige ergänzt worden. Namensgleiche sollten aber identische Funktionen haben.

Da die Benchmark-Funktion identische Ergebnisse (in kürzerer Zeit) für gleiche Parameter ausgibt, kann man sagen, Cfish und Stockfish sind schachlich identisch. Da wurde nichts "weggelassen". Ich behaupte, es hat nie einen Cfish gegeben, der 33 % schneller als seine Stockfish-Vorlage war.

Viele Grüße
Th. Plaschke

P.S.: Lässt man Cfish und die zugrundeliegende Stockfish-Version mit 1 Thread und mit ansonsten identischen Parametern sehr tief rechnen, beginnen irgendwann die Ausgaben, insbesondere die Stellungsbewertungen, doch zu differieren - jedenfalls auf meinem PC.
Parent - - By Andreas Mader Date 2022-04-23 00:36
Thomas Plaschke schrieb:

Da die Benchmark-Funktion identische Ergebnisse (in kürzerer Zeit) für gleiche Parameter ausgibt, kann man sagen, Cfish und Stockfish sind schachlich identisch. Da wurde nichts "weggelassen". Ich behaupte, es hat nie einen Cfish gegeben, der 33 % schneller als seine Stockfish-Vorlage war.


Die Erklärung, dass diese relativ großen Geschwindigkeitszuwächse reine Wunschvorstellungen sind und nicht auf Tatsachen beruhen macht natürlich ebenfalls Sinn.

Schöne Grüße
Andreas Mader
Parent - - By Thomas Plaschke Date 2022-04-23 12:28
Mein Postskriptum muss ich relativieren. Nach über 4 Stunden im Analysemodus aus der Grundstellung mit 64 MB Hash und 1 Thread sind alle Ausgaben von Stockfish-10 und Cfish-10 bis zum 46. Halbzug identisch. Die von asmFish-10 dagegen vom Anfang an nicht. Das verwundert nicht, denn der Autor hatte sich die Freiheit genommen, bei gleicher Funktionalität die Abarbeitungsreihenfolgen in verschiedenen Teilen des Programms zu ändern. Auf die Spielstärke wirkt sich das mE praktisch nicht aus.

Viele Grüße
Th. Plaschke
Parent - - By Andreas Mader Date 2022-04-23 15:18
Es würde mich auch wundern, wenn der C++ - Compiler derart ineffizient wäre, dass ihn der ältere C - Compiler übertrifft.

Schöne Grüße
Andreas Mader
Parent - - By Thomas Plaschke Date 2022-04-23 16:55
Da liegt möglicherweise ein Misverständnis vor. Die Ausgaben der Hauptvarianten waren identisch. Die vom Cfish waren nur schneller da.
Beispiel: Aus der Grundstellung (1 Thread, 64 MB Hash)
Code:
Stockfish 10:
32/43  02:03   249.162k  2.011k  +0,35  1.e4 c5 2.Sf3 d6 3.Lb5+ Ld7 4.Lxd7+ Sxd7 5.d3 e6 6.0-0 Le7 7.Sbd2 Sgf6 8.b3 0-0 9.Lb2 d5 10.h3 b5 11.De2 h6 12.Sh2 e5 13.a4 a6 14.Sg4 d4 15.axb5 axb5 16.Sxf6+ Sxf6 17.Txa8 Dxa8

Cfish 10:
32/43  01:54   249.162k  2.169k  +0,35  1.e4 c5 2.Sf3 d6 3.Lb5+ Ld7 4.Lxd7+ Sxd7 5.d3 e6 6.0-0 Le7 7.Sbd2 Sgf6 8.b3 0-0 9.Lb2 d5 10.h3 b5 11.De2 h6 12.Sh2 e5 13.a4 a6 14.Sg4 d4 15.axb5 axb5 16.Sxf6+ Sxf6 17.Txa8 Dxa8

Cfish gibt die Ausgabe von Stockfish 9 Sekunden früher aus. Anders gesagt Cfish ist knapp 8 % schneller als Stockfish.

>Es würde mich auch wundern, wenn der C++ - Compiler derart ineffizient wäre, dass ihn der ältere C - Compiler übertrifft.


Was die Compiler bzw. die Programmiersprachen angeht: C++ ist komfortabler in der Programmierung, aber der Luxus kostet etwas an Geschwindigkeit im Vergleich zum Vorgänger C. Das merkt man auch bei der Umsetzung von C++ nach C. Ich habe mich daran versucht und bin gescheitert. Ich wollte vor Ronald de Man einzelne Änderungen von Stockfish nach Cfish übertragen. Einige Male gelang es, aber recht schnell erreichte ich meine Grenzen. Als ich mir später ansah wie Ronald de Man die Patches - korrekt - umsetzte, schaute ich ein ums andere Mal wie ein Schwein ins Uhrwerk. Da man Programme, die von den Möglichkeiten von C++ Gebrauch machen, nicht 1:1 nach C umsetzen kann (umgekehrt mit Einschränkungen schon eher), sind solche Programme quasi neu geschrieben. Das hat er schon sehr gut gemacht!
Natürlich könnte man in C++ von vornherein "näher an C" programmieren. Aber damit würde man gegen etwas schnellere Programme die Möglichkeit zu eleganteren Problemlösungen, die bessere Modularisierung oder das leichtere Debuggung eintauschen. Stockfish stammt von einem C++-Programm ab. Damit kam für das Projekt C nicht mehr in Frage.

Viele Grüße
Th. Plaschke
Parent - By Benno Hartwig Date 2022-04-23 17:08
Die "Möglichkeit zu eleganteren Problemlösungen" ist schon ein sehr wichtiges Kriterium in der Softwareentwicklung.
Und ich habe immer noch allergrößten Respekt davor, wenn früher (bis wann eigentlich?) richtig starke Programme auch in Assembler geschrieben wurden. Womöglich noch für einen Prozessor, dessen Befehlssatz nicht so elegant war wie beispielsweise der des Motorola 68000. Hier denke ich beispielsweise an assembler-Programme für die Intel-Prozessoren oder auch den uralten 6502. Da gehörte dann wohl auch eine gute Portion Leidensfähigkeit dazu. Und vor allem: Können!!!
Parent - - By Andreas Matthies Date 2022-04-22 07:18 Edited 2022-04-22 07:46 Upvotes 3
Ich habe den letzten offiziellen CFish12 gerade mal gegen den entsprechenden Stockfish (ebenfalls Version 12, identische Benchsignatur) getestet. Auf einem Ryzon-3700x, entsprechend also die AVX2- Versionen:
Getestet habe ich einen Tiefe-20-Bench mit 512MB Hash

CFish12:
===========================
Total time (ms) : 23769
Nodes searched  : 54465349
Nodes/second    : 2291444

SF12:
===========================
Total time (ms) : 26492
Nodes searched  : 54465349
Nodes/second    : 2055916

Das sind gerade mal 11% Geschwindigkeitsunterschied.

Und für den Fall, dass mit "Vor NNUE war noch alles besser/schneller" argumentiert wird, hier die Ergebnisse für CFish11/SF11:

CFish11:
===========================
Total time (ms) : 25688
Nodes searched  : 66030876
Nodes/second    : 2570495

SF11:
===========================
Total time (ms) : 29275
Nodes searched  : 66030876
Nodes/second    : 2255538

Unterschied: 14%

Und das wurde schon mit einer für AVX2 optimierten CFish Version getestet, die für Stockfish gar nicht zum Download angeboten wird.
Parent - - By Benno Hartwig Date 2022-04-23 06:47 Edited 2022-04-23 06:58
Auf Basis von Stockfish 9 wurde hier mal ein Vergleich der Geschwindigkeiten durchgeführt:
https://www.reddit.com/r/chess/comments/7uw699/speed_benchmark_stockfish_9_vs_cfish_vs_asmfish/
Bei den Knotenleistung ergab sich (ich nahm jeweils die schnellsten Kompilate):

asmFishL_bmi2            2753770.3       118,1%
cfish9_bmi2_gcc          2413064.7       109,9%
stockfish9_bmi2_clang    2196171.1       100,0%


Das erscheint mir realistisch. Und diesen Tempounterschied fand ich damals auch schon überraschend groß.
Und ich kann gut verstehen, wenn jemand diese 10% extra nutzen möchte.

Aber mit Werten von über 30% gibt man sich wohl eher einer wohligen Traumvorstellung hin.
Oder man versucht kleine Kinder zu erschrecken.

PS:
Bei den profile-optimierten SF-Versionen war der Vorsprung noch mal sehr deutlich kleiner.

stockfish9_pgo_bmi2_clang   2351661.4    107,1%

Bot der cfish auch solch eine profile-Optimierung?
Oder sprechen wir hier tatsächlich über einen Tempounterschied 109,9% zu 107,1%, also über ein doch sehr übersichtliches Plus von 2,7%???
Parent - By Thomas Plaschke Date 2022-04-23 09:56

>Bot der cfish auch solch eine profile-Optimierung?


Ja. Wenn möglich, nehmeich immer solche Versionen.

Wer mingw unter MSYS2 nutzt, kann von Stockfish oder Cfish diese Version mit dem Komando make profile-build COMP=mingw erzeugen. Selbst die makefiles beider Versionen funktionieren ähnlich. Bei Cfish kann man mit extra=yes (make profile-build COMP=mingw extra=yes) aber noch einige zusätzliche Optimierungen aktivieren, die noch etwas schnellere EXEs erzeugen. Noch etwas drauflegen kann man mit Link Time Optimization. Das funktionierte mit älteren Compilern nur ausnahmesweise. Bei Cfish ergänzt man den make-Befehl um lto=yes. Das aktuelle Stockfish-makefile nutzt es immer (in der Kommentierung wird aber auf stabile Ergebnisse erst ab mingw 10.1 hingewiesen).

Viele Grüße
Th. Plaschke
Parent - By Thomas Plaschke Date 2022-04-22 08:56
Für Stockfish 11 ist die Cfish-Version noch nicht gefunden, die 33% schneller ist. Ich habe die Werte für Stockfish 10 ermittelt. Für diese Version gab es auch noch eine asmFish-Version, die erwartungsgemäß an der Spitze liegt:
Code:
No  Build                                    Average         Best        Worst      Std Dev  AvgTimePerRun  Failed Sig  Signature  rel. z. asmF  rel. z. Cfish  rel. z. SF
1  asmSF10.exe                           3.111.217,6    3.121.125    3.103.326      6.969,7           4,37  FALSCH     13.604.984       *100,0%*         90,7%       86,9%
2  Cfish-10[x86-64-bmi2-clang].exe       2.815.500,9    2.822.610    2.801.108      7.243,3           4,83  FALSCH     13.604.984         90,5%         100,2%       96,0%
3  Cfish-10[x86-64-bmi2-mingw].exe       2.822.047,3    2.835.553    2.810.947      8.376,4           4,82  FALSCH     13.604.984         90,7%        *100,0%*      95,8%
4  SFCfish-10[730p].exe                  2.772.327,5    2.796.502    2.728.636     21.908,1           4,91  FALSCH     13.604.984         89,1%         101,8%       97,5%
5  Stockfish-10[x86-64-bmi2-clang].exe   2.704.014,5    2.725.903    2.662.423     25.277,5           5,03  FALSCH     13.604.984         86,9%         104,4%     *100,0%*
6  Stockfish-10[x86-64-bmi2-mingw].exe   2.633.803,8    2.688.200    2.216.156    146.850,7           5,18  FALSCH     13.604.984         84,7%         107,1%      102,7%
7  Stockfish-10[730p].exe                2.645.576,4    2.692.456    2.265.609    133.585,4           5,16  FALSCH     13.604.984         85,0%         106,7%      102,2%
8  stockfish_10_x64_bmi2.exe             2.618.851,5    2.657.223    2.328.823    102.032,5           5,20  FALSCH     13.604.984         84,2%         107,8%      103,3%

Von 33% ist auch hier nichts zu erkennen. Auf Intel/AMD-CPUs bleibt das Wunschdenken. Wer setzt nur solche Gerüchte in Umlauf? Andererseits: Ich kann eine Stockfish-Version abliefern, die mehr als 33% langsamer ist als die entsprechende Cfish-Version

Zu den Versionen noch diese Hinweise:
Wo "clang" steht, ist der clang-Compiler in der Version 13.0.1 for mingw verwendet worden.
mingw ist in der Version 11.2.0 eingesetzt worden.
730p steht für den mingw-Compiler in der Version 7.3.0 mit der POSIX-Bibliothek.
stockfish_10_x64_bmi2 sollte die von der Stockfish-Webseite verteilte Version sein.

Viele Grüße
Th. Plaschke
- - By Ingo Althöfer Date 2022-04-21 21:41
Eine Partie für lange Diskussionen: Nr. 90 - Lavieren ohne Ende, und irgendwann scheint Komodo die Nerven zu verlieren.
Parent - By Max Siegfried Date 2022-04-21 23:30
Ingo Althöfer schrieb:

Eine Partie für lange Diskussionen: Nr. 90 - Lavieren ohne Ende, und irgendwann scheint Komodo die Nerven zu verlieren.


Was ist eigentlich mit der Bewertung von Stockfish passiert? Warum ist die Bewertung in gewonnener Stellung abgestürzt und erst einige Zeit später wieder nach oben gesprungen?
Hatte Stockfish tatsächlich noch eine Verteidigung mit Hilfe der 7-Steiner Syzygy Tablebases für KomodoDragon gefunden?
Parent - - By Peter Martan Date 2022-04-22 07:57 Edited 2022-04-22 08:21 Upvotes 1
Ingo Althöfer schrieb:

Eine Partie für lange Diskussionen: Nr. 90 - Lavieren ohne Ende, und irgendwann scheint Komodo die Nerven zu verlieren.

Dass es mehr die Zeit war, die anfing, knapp zu werden, glauben Sie nicht?
So um den 70ten rum, als die Festung begann, einzubrechen, (der erste Sprung ins annähernd +- fand bei SF beim 64. von Schwarz statt, da hatte SF noch 0.94, beim eigenen 65. dann 1.55) hatten beide Engines keine ganze Minute mehr auf der Uhr und lebten beide vom Bonus.
Das macht halt der Seite im Vorteil weniger aus als der im Nachteil.
Oder wie man auch gern sagt, mit vollen Hosen ist leicht stinken und mit guter Stellung ist die Uhr (sozusagen die Hose) immer etwas voller als mit schlechter.

Das ist der Output vom 65. bis zum 75. Zug aus dem TCEC- Archiv, ich habe Zeilen eingefügt, um die Züge voneinander zu unterscheiden. Immer in der letzten vor der leeren steht unter wv= die Eval der Engine, die zuletzt gezogen hat, zu ihr gehört sie aus weißer Sicht. Beim 64. und 65 Zug habe ich das für SF fett markiert, damit man es leichter findet.
Am leichtesten nachvollziehbar wird der Zusammenbruch der Festung mit dem Läuferopfer 75.Lxa5
Zitat:

64.Kb1 {d=40, sd=53, pd=Rd6, mt=24102, tl=25871, s=65282254, n=1573432902, pv=Kb1 Kg6 Bd2 Kh6 Bc3 Kg6 Ka2 Kh5 Be1 Qh6 Kb1 Qf8 Bc3 Qf6 Bxa5 bxa5 Rxc5 Bb6 Rcb5 Bd4 Qc2 Rc8 c5 Kh6 Rd3 Rd7 c6 Rdc7 Ka2 Qd8 Qb3 Kg6 Rd1 Rg7 Rb1 Rgc7 Rc1 Qe7 Rc4 Qd8 Qd3 Ra8 Rxd4 exd4 e5+ Kh6, tb=8211, h=8.1, ph=51.8, wv=0.97, R50=30, Rd=-11, Rr=-1000, mb=+0+0+0+0+0,} 

64...Kh7 {d=37, sd=37, pd=Bd2, mt=21643, tl=91516, s=96018901, n=2078041081, pv=Kh7 Bc3 Re7 Ka2 Kg7 Qc1 Rc7 Rb1 Ra7 Qb2 Re7 Qd2 Rf7 R1b3 Rfd7 Qf2 Re7 Qc2 Ra7 Ka3 Kf7 Qd2 Rad7 Qd1 Kg7 Qc2 Kh7 Kb2 Re7 Qb1 Kg7 Ka2 Ra7 Qa1 Re7 Ka3 Kh7 Qb1 Kg7 Qc2, tb=27, h=5.8, ph=46.2, wv=1.95, R50=29, Rd=-11, Rr=-1000, mb=+0+0+0+0+0,} 

65.Ka2 {d=39, sd=57, pd=Kg6, mt=10923, tl=26948, s=81380770, n=888840776, pv=Ka2 Re7 Qb1 Ra7 Bc3 Kg7 Qb2 Re7 Bxa5 bxa5 Rxc5 Bb6 Rcb5 Bd4 Qc2 Qg6 Qc1 Rc7 c5 Kh6 Rb1 g4 hxg4 Kg5 Qc4 Rc8 c6 Qg8 Qb3 Rh6 Rd1 h3 gxh3 Kh4 Rc1 Kg3 Rb7 Rxh3 d6 Rh2+ Kb1, tb=1673, h=2.9, ph=50.9, wv=1.55, R50=29, Rd=-11, Rr=-1000, mb=+0+0+0+0+0,}

65...Re7 {d=33, sd=33, pd=Bc3, mt=9673, tl=93843, s=100718155, n=974246755, pv=Re7 Bc3 Kg7 Qa3 Red7 Be1 Ra7 Qb2 Kh7 Bd2 Rg7 Qc1 Ra7 Bc3 Kg7 Qb1 Kh7 Qc2 Kg7 Ka3 Re7 Qb2 Kh7 Qb1 Ra7 Qc1 Re7 Ka2 Ra7 Rb1 Kg7 Qb2 Re7 Qa3, tb=10, h=2.9, ph=45.4, wv=1.95, R50=28, Rd=-11, Rr=-1000, mb=+0+0+0+0+0,} 

66.Bc3 {d=36, sd=56, pd=Re7, mt=16654, tl=22294, s=79223719, n=1319391828, pv=Bc3 Kg7 Qc2 Ra7 Qb1 Kh7 Qc1 Kg7 Qa1 Re7 Qb2 Kh7 Bxa5 bxa5 Rxc5 Bb6 Rcb5 Bd4 Qc1 Rd8 c5 Rc7 Rb7 Rc8 R3b5 Qe7 Rxc7 Rxc7 c6 g4 hxg4 Kg6 Qc2 Rc8 Kb3 Kg5 Rb7 Qd6 Ka2 Rh8 Rd7, tb=6887, h=3.1, ph=51.7, ]wv=1.41, R50=28, Rd=-11, Rr=-1000, mb=+0+0+0+0+0,} 
66...Kg7 {d=30, sd=30, pd=Bc3, mt=60063, tl=45780, s=102766623, n=6172471708, pv=Kg7 Qc1 Ra7 Qa1 Re7 Rb1 Kh7 Qb2 Kg7 Qa3 Red7 Ka1 Kh7 Qc1 Kg7 Qb2 Re7 Ka2 Kf7 Qa3 Ra7 R1b3 Kg7 Ka1 Kh6 Kb1 Rad7 Qa2 Kh7 Qf2 Rf7 Ka2 Rfd7, tb=0, h=0.0, ph=46.4, wv=1.95, R50=27, Rd=-11, Rr=-1000, mb=+0+0+0+0+0,} 
67.Qb1 {d=37, sd=52, pd=Kg7, mt=9555, tl=24739, s=84570379, n=807985406, pv=Qb1 Ra7 Qa1 Re7 Qb2 Kh7 Bxa5 bxa5 Rxc5 Bb6 Rcb5 Bd4 Qc1 Rd8 c5 Rc7 Rb7 Rc8 Rxc7+ Rxc7 c6 Qe7 Rb5 g4 hxg4 Kg6 Qc2 Rc8 Kb3 Kg5 Rb7 Qd6 Ka2 Rh8 Rg7+ Kf6 Rd7 Qb4 Rb7 Qd6 Qc1 Kg6 Qa3, tb=2020, h=1.5, ph=52.6, wv=1.37, R50=27, Rd=-11, Rr=-1000, mb=+0+0+0+0+0,} 

67...Ra7 {d=34, sd=34, pd=Qc1, mt=43757, tl=14023, s=102368706, n=4479347490, pv=Ra7 Qc2 Rc7 Qe2 Re7 Be1 Red7 Ka3 Re7 Bc3 Kh7 Qb2 Kg7 Ka2 Kh7 Qa3 Ra7 Rb1 Kg7 Qb2 Re7 Qc1 Ra7 R1b3 Kh7 Qc2 Rc7 Ka1 Kh6 Qb2 Re7 Qb1 Kg7 Qc1 Rf7 Qa3, tb=7, h=1.1, ph=45.6, wv=1.95, R50=26, Rd=-11, Rr=-1000, mb=+0+0+0+0+0,} 
68.Qa1 {d=37, sd=67, pd=Ra7, mt=18782, tl=17957, s=78293275, n=1470582592, pv=Qa1, tb=21358, h=3.4, ph=53.4, wv=1.85, R50=26, Rd=-11, Rr=-1000, mb=+0+0+0+0+0,}  68...Re7 {d=34, sd=34, pd=Qc2, mt=11333, tl=14690, s=105657946, n=1197421524, pv=Re7 Qe1 Ra7 Qf2 Rc7 Kb2 Rcd7 Ka3 Kh7 Qa2 Ra7 Qb1 Kg7 Ka2 Kh7 Qc2 Rc7 Qc1 Ra7 Rb1 Kg7 Qb2 Re7 Qa1 Kh7 R1b2 Qg6 R2b3 Qf6 Qf1 Rf7 Qd1 Ra7 Qd2 Rad7 Rb1, tb=4, h=3.0, ph=44.8, wv=1.95, R50=25, Rd=-11, Rr=-1000, mb=+0+0+0+0+0,} 

69.Qb2 {d=37, sd=43, pd=Re7, mt=11143, tl=18814, s=82046460, n=914325752, pv=Qb2, tb=2669, h=2.1, ph=54.2, wv=1.80, R50=25, Rd=-11, Rr=-1000, mb=+0+0+0+0+0,}  69...Kh7 {d=34, sd=34, pd=Qe1, mt=12037, tl=14653, s=104554214, n=1258414557, pv=Kh7 Qc1 Ra7 Rb1 Kg7 Qb2 Re7 Qa3 Rf7 Rc1 Ra7 Qb2 Re7 Rb1 Kf7 Qa3 Ra7 R1b3 Kg7 Kb1 Kh7 Ka1 Kh6 Qa2 Re7 Qf2 Kg7 Qb2 Kh6 Qc2 Rc7 Qb1 Ra7 Qc1 Kh7 Qb2 Re7 Qb1 Red7 Qa2, tb=4, h=2.1, ph=44.0, wv=1.95, R50=24, Rd=-11, Rr=-1000, mb=+0+0+0+0+0,} 

70.Qa3 {d=35, sd=53, pd=Kh7, mt=12211, tl=18603, s=78989573, n=964541679, pv=Qa3 Red7 Qb2 Re7 Qc1 Ra7 Rb1 Qg7 Qb2 Re7 Rc1 Rh6 Bxa5 bxa5 Rxc5 Bb6 Rb5 Bd4 Qc2 Be3 Rd1 Rd6 c5 Rc7 Rd3 Rd8 c6 Bd4 Rxa5 Kg6 Rb3 Rdc8 Rb4 Qf7 Rc4 g4, tb=8104, h=3.3, ph=55.0, wv=1.73, R50=24, Rd=-11, Rr=-1000, mb=+0+0+0+0+0,} 

70...Rf7 {d=35, sd=35, pd=Qc1, mt=8133, tl=18520, s=102540212, n=833959586, pv=Rf7 Rb1 Kg7 R1b2 Ra7 R2b3 Rc7 Be1 Rf7 Kb1 Kh7 Bd2 Rc7 Qb2 Rg7 Ka2 Re7 Qa3 Rg7 Be1 Rf7 Rb1 Ra7 Bc3 Kg7 Qb2 Re7 Qf2 Red7 Ka3 Kh6 R1b3 Re7 Qc2 Kh5 Ka2 Kh6, tb=18, h=2.7, ph=43.3, wv=1.95, R50=23, Rd=-11, Rr=-1000, mb=+0+0+0+0+0,} 

71.Rb2 {d=40, sd=48, pd=Red7, mt=11951, tl=18652, s=79925832, n=955193627, pv=Rb2 Ra7 Rb1 Rg7 R1b3 Ra7 Qb2 Re7 Qb1 Ra7 Qa1 Re7 Qd1 Ra7 Qb1 Kg7 Qc1 Kh7 Rb1 Rc7 Qc2 Ra7 Qb2 Re7 Rc1 Rdd7 Bxa5 bxa5 Rxc5 Rc7 Rb5 Re8 c5 Be7 Rb6, tb=4711, h=2.8, ph=54.0, wv=1.60, R50=23, Rd=-11, Rr=-1000, mb=+0+0+0+0+0,} 

71...Ra7 {d=36, sd=36, pd=Rb1, mt=9443, tl=21077, s=101437454, n=957975343, pv=Ra7 Rb1 Kg7 R1b3 Kh7 Ka1 Kh6 Qa2 Re7 Qc2 Rc7 Qd2 Kh7 Qc1 Re7 Qa3 Kg7 Qb2 Kh6 Qf2 Kg7 Qc2 Rc7 Kb2 Kh7 Qc1 Ra7 Ka2 Kg7 Qb1 Kh7 Qc2 Kg7 Qc1 Kh7 Rb1
Kg7 Qb2, tb=16, h=2.9, ph=42.6, wv=1.95, R50=22, Rd=-11, Rr=-1000, mb=+0+0+0+0+0,}  72.Rb1 {d=36, sd=46, pd=Ra7, mt=4893, tl=25759, s=81328927, n=398023770, pv=Rb1 Rg7 Qc1 Rc7 Qb2 Re7 Qc2 Rdd7 Qb3 Rd6 Qb2 Qg7 Rc1 Rh6 Bxa5 bxa5 Rxc5 Bb6 Rb5 Bd4 Qc2 Be3 Rd1 Qf7 Qb3 g4 fxg4 Bd4 c5 Kg7 Rc1 Rc7 c6 f3 gxf3 Rf6 Rb7 Rxf3 Rxc7 Rf2+ Rc2 Rxc2+ Kb1, tb=2718, h=1.6, ph=54.8, wv=1.71, R50=22, Rd=-11, Rr=-1000, mb=+0+0+0+0+0,} 

72...Kg7 {d=34, sd=34, pd=Rb1, mt=8551, tl=24526, s=103977484, n=889111432, pv=Kg7 Qb2 Re7 Qc1 Ra7 R1b3 Kh7 Kb1 Re7 Qd2 Kh6 Qb2 Kh7 Kc1 Re8 Kd1 Bc7 Kc2 Re7 Kd3 Re8 Kd2 Bd8 Ke2 Kg7 Qa1 Kh6 Qb1 Rf8 Kd3 Kg7 Kc2 Re8 Qb2 Kh6 Qa1, tb=2, h=2.2, ph=43.5, wv=1.95, R50=21, Rd=-11, Rr=-1000, mb=+0+0+0+0+0,} 

73.R1b3 {d=37, sd=65, pd=Rg7, mt=17794, tl=19965, s=78489176, n=1396636400, pv=R1b3 Rf7 Qc1 Rc7 Qa1 Re7 Qb2 Re8 Qb1 Bc7 Qc1 Kg6 Qa3 g4 hxg4 Rdd8 Be1 Rh8 Rd3 Kg5 Rb1 Rh6 Bc3 Qe7 Qb3 Qe8 Ka3 Qd7 Rbd1 Qe7 Qb5 Qd7 Qxd7 Rxd7 Kb2 Bd6 Rh1 Rh8 Kc2 Rdh7 Rh3, tb=7127, h=3.9, ph=53.9, wv=1.91, R50=21, Rd=-11, Rr=-1000, mb=+0+0+0+0+0,}  73...Kh7 {d=32, sd=32, pd=Qb2, mt=14636, tl=21890, s=106394132, n=1557184485, pv=Kh7 Kb1 Kh6 Kc2 Kh7 Kd1 Rf7 Qb2 Re7 Kc2 Kg7 Kd3 Kg6 Ke2 Kg7 Qa1 Re8 Kd3 Re7 Kd2 Kg8 Qb2 Kg7 Ke2 Bc7 Kd3 Re8 Kc2 Kh6 Kc1 Re7 Kb1 Kg7, tb=43, h=2.0, ph=42.8, wv=1.95, R50=20, Rd=-11, Rr=-1000, mb=+0+0+0+0+0,} 

74.Qb2 {d=31, sd=52, pd=Rf7, mt=2760, tl=29205, s=83989767, n=231811757, pv=Qb2 Re7 Bxa5 bxa5 Rxc5 Bb6 Rcb5 Bd4 Qa3 Rd8 c5 g4 hxg4 Rc7 c6 Kg6 Rb8 Kg5 R3b7 h3 gxh3 Rxb8 Rxb8 Kh4 Qc1 Kg3 h4 Qxh4 Qe1+ Bf2 Qe2 Qh1 g5 Bc5 g6 Qc1 g7 Rxg7 c7 Qa3+ Kb1 Qe3 Qxe3 fxe3 c8=Q e2 Ka2 e1=Q Qxc5 Kxf3 Rb3+ Kxe4, tb=2743, h=0.8, ph=53.1, wv=2.25, R50=20, Rd=-11, Rr=-1000, mb=+0+0+0+0+0,} 
74...Re7 {d=34, sd=34, pd=Kb1, mt=11130, tl=22760, s=107335091, n=1194639586, pv=Re7 Qb1 Ra7 Qc2 Kg7 Kb1 Kh7 Kc1 Re7 Qb2 Kg7 Kc2 Kh7 Kd3 Kg6 Kd2 Kh7 Kc2 Kg8 Kb1 Kg7 Qc1 Ra7 Ka1 Re7 Ka2 Ra7 Qc2 Kh7 Rb1 Kg7 Qb2 Re7 Qf2, tb=19, h=2.0, ph=42.1, wv=1.95, R50=19, Rd=-11, Rr=-1000, mb=+0+0+0+0+0,} 

75.Bxa5 {d=30, sd=45, pd=Re7, mt=5245, tl=35960, s=80758120, n=423657102, pv=Bxa5 bxa5 Rxc5 g4 hxg4 Bb6 Rcb5 Bd4 Qa3 Rc7 c5 Rd8 c6 Kg6 Rb8 Kg5 R3b7 h3 gxh3 Rxb8 Rxb8 Kh4 Qc1 Kg3 h4 Qxh4 Qe1+ Bf2 Qe2 Bd4 g5 Qh3 Qc2 Qh1 Rb1 Qh5, tb=3573, h=1.1, ph=53.8, wv=2.43, R50=50, Rd=-11, Rr=-1000, mb=+1+0+0+0+0,} 

75...bxa5 {d=35, sd=35, pd=Qb1, mt=17662, tl=17098, s=67405407, n=1190514347, pv=bxa5 Rxc5 Bb6 Rcb5 Bd4 Qc1 Rd8 c5 Rc8 c6 g4 hxg4 Kg6 Rb8 Rxb8 Rxb8 Qd6 Rb5 Rc7 Qd2 Ra7 Qd3 Rc7 Qb3 Rh7 Qa3 Qd8 d6 h3 gxh3 Rxh3 c7 Rh2+ Kb1 Rh1+ Kc2 Qd7 Qb3 Qc6+ Kd3 Qc1 Qg8+ Kh6 g5+ Kh5 Qh8+ Kxg5 Qg7+ Kh5 Qh7+ Kg5 Qe7+ Kg6 Qe8+ Kh6 Qe6+ Kg7, tb=8652, h=10.0, ph=41.5, wv=2.08, R50=50, Rd=-11, Rr=-1000, mb=+1+0-1+0+0,} 


Event:
Ort:
Datum:

Weiss:
Schwarz:

Ergebnis
Board
Parent - - By Ingo Althöfer Date 2022-04-22 08:49
Lieber Herr Martan,
danke für das Einhängen der pgn und die Kommentare.

Ein Schlüsselfehler von Komodo war sicherlich 43... Sxc4.
Das macht aus einer stabilen Festung eine labile. Ohne den
Springertausch auf c4 hätte Lxa5 nie gedroht.

In beidseitiger Zeitknappheit gingen gleichzeitig die Bewertungen
gegenläufig: die von Stockfish runter auf bis zu 0.84 (im Zug 62),
und die von Komodo hoch auf 1.95. In den 50er-Zügen waren
Stockfish (bei +1.55) und Komodo (bei +1.36) ganz lange mit
stabilen Werten, so dass viele Kiebitze schon an ein Festungsremis
glaubten (auch Jeroen Noomen).

Es scheint mir, als habe Stockfish irgendwelche Spezialroutinen,
die die Krisenmomente in die Phasen mit Zeitknappheit schieben.

Ingo Althöfer.
Parent - - By Peter Martan Date 2022-04-22 08:51
Ingo Althöfer schrieb:

Es scheint mir, als habe Stockfish irgendwelche Spezialroutinen,
die die Krisenmomente in die Phasen mit Zeitknappheit schieben.

Das Zeitmanagement von SF ist sicher eine seiner Stärken.
Hingegen hat Komodo da bei dieser Hardware- Zeit ein Manko, scheint's. Dietrich Kappe hatte sich in der letzten Zeit auch mal in diese Richtung geäußert, glaube ich mich zu erinnern, finde das Posting jetzt aber nicht auf die Schnelle.
Parent - - By Jörg Oster Date 2022-04-22 11:23
Peter Martan schrieb:

Ingo Althöfer schrieb:

Es scheint mir, als habe Stockfish irgendwelche Spezialroutinen,
die die Krisenmomente in die Phasen mit Zeitknappheit schieben.

Das Zeitmanagement von SF ist sicher eine seiner Stärken.
Hingegen hat Komodo da bei dieser Hardware- Zeit ein Manko, scheint's. Dietrich Kappe hatte sich in der letzten Zeit auch mal in diese Richtung geäußert, glaube ich mich zu erinnern, finde das Posting jetzt aber nicht auf die Schnelle.


Diese Aussage bezüglich des Zeitmanagements bei Stockfish lese ich immer wieder,
alleine verstehen kann ich sie nicht.
Meiner Meinung nach wurde es im Laufe der Jahre eher verschlimmbessert.

Schau dir doch mal die Spitzen bei TCEC an.
Oder aber die völlig unnötige und haarsträubende Zeitnahme in total entschiedener Stellung,
da werden teilweise dann mehr als 50% der verbliebenen Zeit investiert, nur um vielleicht ein Matt anzeigen zu können.

Die Zeiteinteilung bei Engines ist etwas sehr diffiziles, auch weil es ja mehrere, teils völlig unterschiedliche
Bedenkzeitkontrollen gibt. Da sollte man sich sehr genau überlegen, was man macht.
Parent - By Peter Martan Date 2022-04-22 11:30
Mag alles sein, Fakt ist, dass es Komodo mit dieser Hardware - Zeit immer wieder schlechter schafft, noch genug Zeit zu haben, die Fehler nach langem Herumziehen so zu vermeiden, dass SF dann nicht zum Schluss doch wieder den Vorteil, der von Anfang an besteht, in einen ganzen Punkt umwandelt.

Und natürlich zeigt sich diese Zeiteinteilungsschwäche im Nachteil mehr als im Vorteil, und natürlich kann's auch einfach daran liegen, dass SF über die Partie die besseren Züge in der verwendeten Zeit findet, aber irgendwann müssen Partien, die sonst ewig dauern würden, weil sie nicht und nicht Remis werden wollen, halt dann doch auch durch die Uhr entschieden werden.
Parent - By Max Siegfried Date 2022-04-22 11:46
Jörg Oster schrieb:

Peter Martan schrieb:

Ingo Althöfer schrieb:

Es scheint mir, als habe Stockfish irgendwelche Spezialroutinen,
die die Krisenmomente in die Phasen mit Zeitknappheit schieben.

Das Zeitmanagement von SF ist sicher eine seiner Stärken.
Hingegen hat Komodo da bei dieser Hardware- Zeit ein Manko, scheint's. Dietrich Kappe hatte sich in der letzten Zeit auch mal in diese Richtung geäußert, glaube ich mich zu erinnern, finde das Posting jetzt aber nicht auf die Schnelle.


Diese Aussage bezüglich des Zeitmanagements bei Stockfish lese ich immer wieder,
alleine verstehen kann ich sie nicht.
Meiner Meinung nach wurde es im Laufe der Jahre eher verschlimmbessert.

Schau dir doch mal die Spitzen bei TCEC an.
Oder aber die völlig unnötige und haarsträubende Zeitnahme in total entschiedener Stellung,
da werden teilweise dann mehr als 50% der verbliebenen Zeit investiert, nur um vielleicht ein Matt anzeigen zu können.

Die Zeiteinteilung bei Engines ist etwas sehr diffiziles, auch weil es ja mehrere, teils völlig unterschiedliche
Bedenkzeitkontrollen gibt. Da sollte man sich sehr genau überlegen, was man macht.


Das Zeitmanagement bei Stockfish finde ich auch nicht berauschend.
Jetzt nach einem halben Jahr wo Stockfisch 15 veröffentlicht ist und auch ein neues Netz endlich wieder vorhanden ist, wäre es an der Zeit einmal alle automatisieren Tuning Abläufe zu starten.
Parent - - By Ingo Althöfer Date 2022-04-22 12:40 Edited 2022-04-22 12:42
Hallo Herr Oster,

Jörg Oster schrieb:
Zitat:
Das Zeitmanagement von SF ist sicher eine seiner Stärken.
Hingegen hat Komodo da bei dieser Hardware- Zeit ein Manko, scheint's. Dietrich Kappe hatte sich in der letzten Zeit auch mal in diese Richtung geäußert, glaube ich mich zu erinnern, finde das Posting jetzt aber nicht auf die Schnelle.


Diese Aussage bezüglich des Zeitmanagements bei Stockfish lese ich immer wieder,
alleine verstehen kann ich sie nicht.
Meiner Meinung nach wurde es im Laufe der Jahre eher verschlimmbessert.


abstrakt gesehen mögen Sie recht haben.

Meine Beobachtung bezog sich nur auf das aktuelle SuFi mit dieser
ungewöhnlichen Regel 120 Minuten Basiszeit und dann nur 12 Sekunden
Increment.

Komodo scheint sich bei Zeitknappheit viel schwerer zu tun als
Stockfish. Vielleicht ist es auch einfach nur Zufall, dass Stockfish
"die" Partien durch Lavieren in Phasen der Zeitknappheit treibt -
aber oft bricht Komodo erst in dieser Phase ein.

Ingo Althöfer.
Parent - By Jörg Oster Date 2022-04-22 17:30
Ingo Althöfer schrieb:

Hallo Herr Oster,

Jörg Oster schrieb:
Zitat:
Das Zeitmanagement von SF ist sicher eine seiner Stärken.
Hingegen hat Komodo da bei dieser Hardware- Zeit ein Manko, scheint's. Dietrich Kappe hatte sich in der letzten Zeit auch mal in diese Richtung geäußert, glaube ich mich zu erinnern, finde das Posting jetzt aber nicht auf die Schnelle.


Diese Aussage bezüglich des Zeitmanagements bei Stockfish lese ich immer wieder,
alleine verstehen kann ich sie nicht.
Meiner Meinung nach wurde es im Laufe der Jahre eher verschlimmbessert.


abstrakt gesehen mögen Sie recht haben.

Meine Beobachtung bezog sich nur auf das aktuelle SuFi mit dieser
ungewöhnlichen Regel 120 Minuten Basiszeit und dann nur 12 Sekunden
Increment.

Komodo scheint sich bei Zeitknappheit viel schwerer zu tun als
Stockfish. Vielleicht ist es auch einfach nur Zufall, dass Stockfish
"die" Partien durch Lavieren in Phasen der Zeitknappheit treibt -
aber oft bricht Komodo erst in dieser Phase ein.

Ingo Althöfer.

Hallo Herr Althöfer,

gerade Engines sollten eigentlich mit jeder Zeiteinteilung zurechtkommen.
Aber es kann natürlich durchaus sein, dass KomodoDragon sich hier etwas schwerer tut als Stockfish.
Warum auch immer.

Es ist mir übrigens nicht bekannt, dass SF hier speziellen Code enthält,
um genau diese Situationen absichtlich herbeizuführen.

Jörg.
- - By Benno Hartwig Date 2022-04-22 13:35
Nach jetzt 93 Partien hat SF immerhin 19 volle Punkte Vorsprung!
Bin gespannt, ob er jetzt die 20 noch voll macht.
Parent - - By Kurt Utzinger Date 2022-04-22 17:43
Benno Hartwig schrieb:

Nach jetzt 93 Partien hat SF immerhin 19 volle Punkte Vorsprung!
Bin gespannt, ob er jetzt die 20 noch voll macht.


Das ist eine von mir nicht erwartete Überlegenheit von Stockfish, die den Rahmen des Üblichen sprengt.
Mfg Kurt
Parent - - By Benno Hartwig Date 2022-04-23 12:11
Nein, SF schafft den 20-Punkte-Vorsprung nicht.
Aber Dragon kämpft im letzten Spiel jetzt darum, ob ihm nicht doch auch mal ein 1.5 : 0.5 gelingt.
Mit weiß hatte Dragon gewonnen, und nun muss SF zeigen, dass er den Weiß-Vorteil ebenfalls nutzen kann.
Parent - - By Peter Martan Date 2022-04-23 13:37 Edited 2022-04-23 13:49
Benno Hartwig schrieb:

Aber Dragon kämpft im letzten Spiel jetzt darum, ob ihm nicht doch auch mal ein 1.5 : 0.5 gelingt.

Nein, das wird wieder nix, nämlich es wird wieder ein 1:1- Paar, SF ist beim 35. Zug deutlich im +-, vor dem 30...a5 hätte SF statt dessen ...Le7 als Ponderzug gehabt, danach war der erste deutlichere Eval- Sprung, den ich wahrgenommen habe, war aber auch nicht die ganze Partie online dabei.

Wenn das mit 1:0 geendet haben wird, hätten wir dieses Endergebnis aus SF- Sicht:

Wins   = 28
Draws  = 63
Losses = 9
Av.Op. Elo = 3500

Result     : 59.5/100 (+28,=63,-9)
Perf.      : 59.5 %
Margins    :
68 %       : (+  2.9,-  2.9 %) -> [ 56.6, 62.4 %]
95 %       : (+  5.6,-  5.7 %) -> [ 53.8, 65.1 %]
99.7 %     : (+  8.5,-  8.6 %) -> [ 50.9, 68.0 %]

Elo        : 3567
Margins    :
68 %       : (+ 21,- 21) -> [3546,3588]
95 %       : (+ 42,- 40) -> [3527,3609]
99.7 %     : (+ 64,- 61) -> [3506,3631]


Wären Elo- Messungen nicht bei diesem Match ausgesprochen verpönt, würde ich sagen, 67 bei einer error bar von 40, so what?

Durch die cleveren Eröffnungsstellungen gerade um nochmal 12 gespreizt zu dem, was Stefan Pohl Abstand zwischen SF 15 und der Dragon 2.6- Version hat, (3802-3746=56) zugegeben, die Elo von SP sind auch schon etwas gespreizt durch UHO, und die 2.6 in seiner Liste ist nicht dieselbe Version wie die von TCEC, aber neuerlich, so what?

Oder (was modernere Vergleichszahlen betriff, die jedenfalls noch nicht so in Verruf geraten sind) nicht einmal ganz 60% bei einer error bar von 5.6%  ist doch auch kein Beinbruch, oder?
Parent - - By Stefan Pohl Date 2022-04-24 12:22 Upvotes 1
Peter Martan schrieb:


Wären Elo- Messungen nicht bei diesem Match ausgesprochen verpönt, würde ich sagen, 67 bei einer error bar von 40, so what?

Durch die cleveren Eröffnungsstellungen gerade um nochmal 12 gespreizt zu dem, was Stefan Pohl Abstand zwischen SF 15 und der Dragon 2.6- Version hat, (3802-3746=56) zugegeben, die Elo von SP sind auch schon etwas gespreizt durch UHO, und die 2.6 in seiner Liste ist nicht dieselbe Version wie die von TCEC, aber neuerlich, so what?


??? Das einzige Ergebnis, das es auf meiner Website zwischen SF 15 und Dragon 2.6 gibt, ist das in der SPCC-Rangliste. In der SPCC-Rangliste werden die 500 HERT-Vorgaben von Thomas Zipproth benutzt und zwar seit nun fast 5 Jahren. Seit wann ist das UHO??? Diese Eröffnungen sind klassisch und damit ausbalanciert.
Und das Ergebnis dieser 1000 Partien ist so:
Stockfish 15 vs. KomodoDragon 2.6 avx2    : 1000 (+155,=836,-  9), 57.3 %
Parent - - By Peter Martan Date 2022-04-24 12:36 Edited 2022-04-24 12:41
Uups, was bin ich doch schon wieder uninformiert, aber gleich auf der ersten Site deiner hp

https://www.sp-cc.de/

steht unter SF- Testing das Rating bzw. Ranking, das ich zitiert habe mit SF 15 und Komodo Dragon 2.6 avx2, und UHO ist auf derselben Site ganz oben hervorgehoben im Text, dass es dennoch nur zum eigenen "UHO SF Regression- Testing" gehört und nicht auch zum "SF- Testing" ist vielleicht ein verzeihliches Missverständnis?
Parent - - By Stefan Pohl Date 2022-04-24 12:42 Edited 2022-04-24 12:51
Peter Martan schrieb:

Uups, was bin ich doch schon wieder uninformiert, aber gleich auf der ersten Site deiner hp

<a class='ura' href='https://www.sp-cc.de/'>https://www.sp-cc.de/</a>

steht unter SF- Testing das Rating bzw. Ranking, das ich zitiert habe mit SF 15 und Komodo Dragon 2.6 avx2, und UHO ist auf derselben Site gelb ganz oben hervorgehoben im Text, dass es dennoch nur zum eigenen UHO SF Regression- Testing gehört und nicht auch zum SF- Testing ist vielleicht ein verzeihliches Missverständnis?


Ich habe nun noch extra bei den Testbedingungen der SPCC-Rangliste eingefügt:
Openings: HERT_500 testset (by Thomas Zipproth) (download the file at the "Download & Links"-section or here). Mention, the HERT-set is not an Anti-Draw (UHO or something) opening-set, but a classical, balanced opening-set.

Also nochmals ganz klar: SPCC-Rangliste HERT-Eröffnungen, klassisch, ausbalanciert. Und die Stockfish-Regression-Tests (wo ja Stockfishe gegeneinander spielen): UHO Eröffnungen, weil man dort sonst 90%+ Remisen hätte.

In einer Rangliste braucht man zum Glück (noch) keine UHO-Eröffnungen. Man sieht ja, daß die Remisquoten dort ganz OK sind (so um 60%), natürlich aber auch wegen der kurzen Bedenkzeit auf singlethread... Hohe Remisquote gibts dort nur, wenn Stockfish gegen KomodoDragon spielt im Einzelvergleich (s.o. 83.6%). Aber das ist vertretbar.

Ich möchte nochmals betonen, daß selbst ich, als Macher der AntiDraw-Eröffnungen inklusive UHO, immer der Meinung war und bin, daß man solche Eröffnungen nur einsetzen sollte, wenn es wirklich nötig ist. Also wenn man mit ausbalancierten Eröffnungen in seinem Test/Spiel -Setup sehr hohe Remisquoten hätte. Und das ist in meiner Rangliste nicht der Fall. In den Stockfish-Regression-Tests und den NN-Tests von LC0 gegen Stockfish auf meiner Seite ist es aber nötig, da man ohne UHO hier jenseits 90% Remisen hätte. Gleiches gilt eben auch fürs TCEC in den höheren Ligen und fürs CCCC. Weswegen dort ja auch unbalancierte Eröffnungen benutzt werden. Im CCCC sind es meine UHOs. Ebenso im Stockfish-Framework. Auch dort wäre man sonst bei 90% Remisen.
Parent - - By Peter Martan Date 2022-04-24 12:49
Alles klar, Stephan, danke für die Richtigstellung, hätte ich gleich mal wieder nicht nur auf die Zahlen und die (falschen) Überschriften geschaut, sondern auch den Text ordentlich gelesen, wär's nicht passiert.
Ertappt:
Parent - - By Stefan Pohl Date 2022-04-24 12:54 Edited 2022-04-24 12:57 Upvotes 1
Peter Martan schrieb:

Alles klar, Stephan, danke für die Richtigstellung, hätte ich gleich mal wieder nicht nur auf die Zahlen und die (falschen) Überschriften geschaut, sondern auch den Text ordentlich gelesen, wär's nicht passiert.
Ertappt:


Ab sofort (also ab Stockfish 15) wird der Regression-Test (in Absprache mit dem Stockfish-Maintainer (Projektleiter) Vondele) auf lange Bedenkzeiten umgestellt. Siehe Website. Wir sind beide der Meinung, daß so ein VLTC-Testrun sinnvoller ist. Insbesondere nach den Erfahrungen mit der SFdev im Februar...
Da sind natürlich UHO-Eröffnungen nötiger denn je. Sonst wäre man wahrscheinlich nahe 100% Remisen...

Important: From now (Stockfish 15), the regression-testrun is not 20000 games with bullet-timecontrol (30sec+300ms) anymore, but 2000 games with VLTC of 10min+3sec (average game duration 30 minutes, around 3x more time than in the SPCC-ratinglist, using my UHO 2022 openings (otherwise 95%+ draws...)). I believe, this makes sense, because of 2 facts:
1) In February, we saw a huge regression of Stockfish-dev with short time-controls, but in Fishtest, VLTC-tests had shown a progress. And most chess-players and computerchess-fans use Stockfish with longer timecontrols, so a regression-test with long timecontrol makes sense to me.
2) In Fishtest, regression-test with short time-control (and sometimes using UHO-openings) are done, too, so there is no need, to do more of these tests here IMO.
Of course, 2000 games is not so much and the errorbar is quite huge, but 1000 gamepairs will give a reasonable result. And each regression-testrun will get a gamepair-rescoring by my Gamepairs Rescorer Tool, besides the classical Elo-performance-list.
Parent - - By Andreas Mader Date 2022-04-24 13:29
Stefan Pohl schrieb:

Ab sofort (also ab Stockfish 15) wird der Regression-Test (in Absprache mit dem Stockfish-Maintainer (Projektleiter) Vondele) auf lange Bedenkzeiten umgestellt. Siehe Website. Wir sind beide der Meinung, daß so ein VLTC-Testrun sinnvoller ist. Insbesondere nach den Erfahrungen mit der SFdev im Februar...


10+3 ist zwar noch immer einiges entfernt von "lang", aber es ist ein Schritt in die richtige Richtung und ich finde das toll. 

Schöne Grüße
Andreas Mader
Parent - By Stefan Pohl Date 2022-04-24 13:41
Andreas Mader schrieb:

Stefan Pohl schrieb:

Ab sofort (also ab Stockfish 15) wird der Regression-Test (in Absprache mit dem Stockfish-Maintainer (Projektleiter) Vondele) auf lange Bedenkzeiten umgestellt. Siehe Website. Wir sind beide der Meinung, daß so ein VLTC-Testrun sinnvoller ist. Insbesondere nach den Erfahrungen mit der SFdev im Februar...


10+3 ist zwar noch immer einiges entfernt von "lang", aber es ist ein Schritt in die richtige Richtung und ich finde das toll. 

Schöne Grüße
Andreas Mader


Mehr geht beim besten Willen nicht. Selbst mit 20 Partien parallel dauert ein 2000 Partien Testrun knapp 48 Stunden. Und im Verhältnis zu den Tests im Stockfish-Framework und auch zu meinen bisherigen Tests und auch zur SPCC-Rangliste, ist das schon lang. Länge ist ja immer relativ...
Parent - By Max Siegfried Date 2022-04-24 14:28
Die Frage ist doch was man sich davon erhofft.
Was erhofft man sich davon?
Man kann mit kurzer und mittlerer und langer Bedenkzeit testen/überprüfen.
Am besten man macht alles. Je mehr Informationen desto besser.
Aber die Verwendung von Stockfish sieht eher so aus, dass immer mehr Menschen der Engine immer weniger Bedenkzeit zur Verfügung stellen.
Denn: Je stärker Stockfish wird, desto weniger Bedenkzeit braucht er für ein zufriedenstellendes Ergebnis.
Außerdem verwenden immer mehr Menschen ihre Zeit für immer mehr unterschiedliche und auch neue Sachen, weshalb Stockfish automatisch weniger Zeit erhält.
Wir haben überall gefühlt 100% Remis. Außer bei extremen Vorgabestellungen für die Zuschauer.
Siehe Lichess, Playchess… die Menschen dort sollten vielleicht mal anfangen nur 1/10 der Bedenkzeit zu verwenden, damit es wenigstens minimal spannender wird.
Stockfish löst fast 5000 Testsuite Aufgaben mit nur 1 Sekunde pro Stellung.
Spätestens in 1 Jahr löst er wirklich alle Testsuite Aufgaben.

Es dürften nicht mehr allzu viele elos unter normalen Bedingungen zu holen sein. Elo Limit. Vielleicht noch 3 Jahre Entwicklungsdauer.
Danach dürfte es weitere elo Steigerungen nur zu sehen geben, wenn die Vorgabestellungen immer unausgeglichener werden/der Vorteil immer größer wird.
Wäre es nicht besser wenn Stockfish A bei 0 oder 1 Sekunde pro Stellung 100 elo stärker wäre als Stockfish B, auch wenn B bei einer VLTC 100 elo stärker wäre als Stockfish A?
Wann profitieren die normalen Anwender am meisten?
Parent - By Max Siegfried Date 2022-04-24 12:37
Stefan Pohl schrieb:

Peter Martan schrieb:


Wären Elo- Messungen nicht bei diesem Match ausgesprochen verpönt, würde ich sagen, 67 bei einer error bar von 40, so what?

Durch die cleveren Eröffnungsstellungen gerade um nochmal 12 gespreizt zu dem, was Stefan Pohl Abstand zwischen SF 15 und der Dragon 2.6- Version hat, (3802-3746=56) zugegeben, die Elo von SP sind auch schon etwas gespreizt durch UHO, und die 2.6 in seiner Liste ist nicht dieselbe Version wie die von TCEC, aber neuerlich, so what?


??? Das einzige Ergebnis, das es auf meiner Website zwischen SF 15 und Dragon 2.6 gibt, ist das in der SPCC-Rangliste. In der SPCC-Rangliste werden die 500 HERT-Vorgaben von Thomas Zipproth benutzt und zwar seit nun fast 5 Jahren. Seit wann ist das UHO??? Diese Eröffnungen sind klassisch und damit ausbalanciert.
Und das Ergebnis dieser 1000 Partien ist so:
Stockfish 15 vs. KomodoDragon 2.6 avx2    : 1000 (+155,=836,-  9), 57.3 %


+155 -9
Das sagt wohl alles.
Bieten die 9 Partien zu viel Vorteil für weiß/schwarz oder hat KomodoDragon diese verdient gewonnen, während Stockfish in den 9 Partien nur Unentschieden erreicht hatte?
Lohnt es sich diese 9 Partien zu analysieren? Ggf. könnten dadurch die Stockfish Entwickler neue Ideen für potenzielle Verbesserungen bekommen.
Parent - - By Max Siegfried Date 2022-04-23 13:52
Aus Sicht von Stockfish:
+28 =63 -9

59,5 aus 100

59,5%

67 elo Unterschied

———

Ohne Vorgabestellungen zu berücksichtigen, welche zu vorteilhaft waren, sieht es so aus:
+19 =63 -0

50,5 aus 82

61,59%

82 elo Unterschied

———

Wenn wir zusätzlich die Unentschieden nicht berücksichtigen, dann sieht es so aus:
+28 -9

32,5 aus 37

87,84%

343 elo Unterschied

bzw.

+19 -0

19 aus 19

100%
Parent - - By Peter Weise Date 2022-04-23 17:47
Wenn wir zusätzlich die Unentschieden nicht berücksichtigen, dann sieht es so aus:
+28 -9

32,5 aus 37

87,84%

343 elo Unterschied
--------------------------------

Ne, es bleibt bei 28 aus 37!!
OMG
Parent - - By Kurt Utzinger Date 2022-04-23 18:44
Weiss jemand, was all diese Bezeichnungen (fett hervorgeoben) zu bedeuten haben:
d=37, sd=37, mt=189423, tl=7022577, s=45993941, n=8712310514, pv=Be3 a6 Bd3 h6 Nbd2 a5 Nf1 Ne7 Ng3 Ng6 Qe2 Re8 Rad1 a4 h3 Be7 Bb1 Nh4 Rf1 Nxf3+ Qxf3 Bh4 Nf5 Qf6 Qh5 Bg5 f4 exf4 Bxf4 Qg6 Qf3 Bxf4 Qxf4 Nf8 Qh2 Bd7 Rf3 Nh7 Rdf1 Ng5, tb=0, h=86.4, ph=0.0, wv=1.10, R50=49, Rd=-11, Rr=-1000, mb=+0+0+0+0+0,
Mfg
Kurt
Parent - - By Peter Martan Date 2022-04-23 19:19
d=depth
sd=selective depth
n=nodes
tb=tablebase hits
wv=white valuation
bei den anderen weiß ich's auch nicht, oder bin mir jedenfalls nicht sicher, sofern ich mir überhaupt bei irgendwelchen sicher bin
Parent - - By Kurt Utzinger Date 2022-04-23 21:15
Peter Martan schrieb:

d=depth
sd=selective depth
n=nodes
tb=tablebase hits
wv=white valuation
bei den anderen weiß ich's auch nicht, oder bin mir jedenfalls nicht sicher, sofern ich mir überhaupt bei irgendwelchen sicher bin



Hallo Peter
Da bin ich etwas erleichtert zu wissen, dass es anderen auch so geht wie mir.
Gruss
Kurt
Parent - By Peter Martan Date 2022-04-23 21:42

Ja, sorry, dabei hat's uns mal jemand hier im Forum so schön als Liste der comments verlinkt zu einer TCEC- Site, wenn ich mich recht erinnere, aber ich finde weder das Posting hier noch den entsprechenden Artikel auf TCEC auf die Schnelle.
Ich glaube, es war damals Andreas Matthies, der's wusste und erklärt hat, vielleicht liest er ja mal wieder mit, sonst frag' ihn per PN, Kurt, er weiß sicher mehr als ich.
Parent - - By Klaus S. Date 2022-04-23 21:54
tl müsste Time Left sein.  (in millisec)
Parent - - By Peter Martan Date 2022-04-23 21:56
Ja, und mt vielleicht move time.
Parent - - By Klaus S. Date 2022-04-23 22:00
Ja, und h= Hashfull ?
Parent - By Peter Martan Date 2022-04-23 22:04
In Prozent, ja, kann gut sein.
mb hat vielleicht was mit der ominösen R-mobility zu tun, vielleicht sind auch die R- Werte irgendwie in Relation dazu, aber da steige ich vollends aus.
Parent - By Stefan Pohl Date 2022-04-24 12:24 Edited 2022-04-24 12:27 Upvotes 1
Peter Weise schrieb:

Wenn wir zusätzlich die Unentschieden nicht berücksichtigen, dann sieht es so aus:
+28 -9

32,5 aus 37

87,84%

343 elo Unterschied
--------------------------------

Ne, es bleibt bei 28 aus 37!!
OMG


Macht doch alles keinen echten Sinn, meine ich. Sinnvoll ist die Betrachtung der Gamepairs bei solch unbalancierten Eröffnungen. Und da war das Ergebnis:
50 Gamepairs und Stockfish 15dev hatte 19+ 0- 31= (=69%). Und das ist aus Sicht von KomodoDragon wirklich desaströs.
Up Topic Hauptforen / CSS-Forum / s22 - Superfinale: Stockfish vs. Dragon
1 2 3 Previous Next  

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill