Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Stockfish und LC0 Endspielstärke
- - By Lothar Jung Date 2023-12-12 12:17 Upvotes 1
Hier die Veröffentlichung:

„Stockfish or Leela Chess Zero? A Comparison Against Endgame Tablebases“.

https://webdocs.cs.ualberta.ca/~mmueller/ps/2023/ACG_2023_Stockfish.pdf
Parent - - By Peter Martan Date 2023-12-12 14:07 Edited 2023-12-12 14:36 Upvotes 1
Wie testet man bei SF die Policy allein? (Entnehme ich dem .pdf nicht, vielleicht hab' ich's nur nicht gründlich genug gelesen) Heißt das ungefähr dasselbe wie die "main evaluation" hier?

https://hxim.github.io/Stockfish-Evaluation-Guide/

Jedenfalls im 2. Schritt, bei dem dann auch Suche passieren darf:

Zitat:
Figure2 reflects the improvement in the performance of both engines after incorporating search. In the four tablebases used here,Lc0 still performs better than Stockfish even after applying a search of up to 400nodes.

400 nodes für SF als "Suche" zu bezeichnen, find' ich aber schon lustig, das ist selbst im Endspiel single thread gerade mal so Tiefe 5-6

Wie auch immer, schnell mal SF dev. single thread (3.5GHz avx2- compile) und Lc0 (3070ti, 2CPU- threads) über 1024 Endspiel- (oder Endspiel- nahe) Studien aus der HHdB mit 1"/pos. laufen lassen, beide Engines konnten die 6Steiner Syzygys nutzen, weil man ja weiß, dass Lc0 ohne tbs im Endspiel einfach noch mehr abstinkt gegen SF als mit wenigstens 6Steiner- Nutzung beidseits. (Oder? soll ich's noch einmal ohne tbs probieren? )

    Program                                    Elo   +/-  Matches  Score   Av.Op.   S.Pos.   MST1    MST2   RIndex

  1 Stockfishdev-20231202-singleT-Syz6       : 3503    3    991    50.7 %   3497   985/1024    1.0s    1.0s   0.99
  2 Lc0v0.31.0-dag+git.a4877961-2717500      : 3497    3    991    49.3 %   3503   951/1024    1.0s    1.0s   0.98

MST1  : Mean solution time (solved positions only)
MST2  : Mean solution time (solved and unsolved positions)
RIndex: Score according to solution time ranking for each position


Selbst mit diesen ausgesucht leichten single best move Stellungen (für die Hardware- TC, siehe Lösungszahlen) kommt man (wenn auch knapp) schon mit nur diesen beiden Engines
allein und damit nur 991 matches von nur 1024 Stellungen aus der error- bar. Und der Hardware- Vorteil war hier mit single thread für SF und der doch ganz guten GPU für Lc0 eindeutig auf der Seite von Lc0.
Parent - - By Reinhold Stibi Date 2023-12-12 15:20 Edited 2023-12-12 15:36
Das ist doch wirklich Blödsinn Stockfish mit 1 CPU und Lc0 mit einer sehr guten GPU
zu vergleichen.
Das müsstet du doch eigentlich wissen dass so ein Vergleich total hinkt.

Da müsste Stockfish mindestens 24 Threads haben.

Stockfish spielt auch ohne TBs ein ganz hervorragendes Endspiel und wenn es die TBs
benutzt dann viel intensiver und effektiver als Lc0.

Stockfish hat eine viel größere Vorhersicht durch die viel größere Rechentiefe, besonders auch im Endspiel als Lc0
und spannt etliche Züge früher wie der Hase läuft.
Das ist ja das Problem von Lc0.
Parent - - By Peter Martan Date 2023-12-12 15:35 Edited 2023-12-12 15:40 Upvotes 2
Das ist nicht Blödsinn sondern einer von vielen möglichen Vergleichen, mach gern den, der dich mehr interessiert selbst, ich wollte ja nur möglichst sicher sein, dass SF nicht Hardware- seitig bevorteilt ist, und es war auch die Vergleichsbasis im .pdf, das Lothar als Thread- Inhalt wählte.

1"/Stellung ist ja hingegen auch wieder nicht gerade die TC, die Lc0 entgegen kommt, aber bei über 1000 Stellungen, wenn man mit Lc0 auch immer nur eine einzelne Instanz gleichzeitig laufen lassen kann, ist das Ganze ja auch schon überhaupt wieder eine ziemliche Hardware- Zeit- Verschwendung, selbst als Stellungstest.
Besser als 1000 Stellungen (was man mindestens auch an Endspielstellungen brauchen würde, wenn man sie Eng-Eng ausspielen lassen wollte) reines endgame- game playing, um wenigstens auch überhaupt aus irgendwelchen error bars zu kommen, fände ich halt noch unnötiger, und die Frage, welche Stellungen man nehmen sollte dürfte müsste, wäre eine Gretchenfrage, Endspielstellungen sind in der Regel auch ohne Ausspielen als win, draw, loss beurteilbar.
Dass SF im Endspiel besser ist als Lc0 weiß man daher ohnehin auch ohne eigene Tests, allein schon, wenn man sich ein paar Spiele von den beiden gegeneinander anschaut, oder ein paar einzelne Endspiel- Stellungen anhand von Output und Eval vegleicht
Parent - By Reinhold Stibi Date 2023-12-12 15:44 Upvotes 1
Ja, Stockfish ist besonders im Endspiel besser als Lc0, das belegen die vielen Spiele im Vergleich; da
braucht man keine Stellungstests.

Möchte diesbezüglich noch auf meine Ergänzung oben hinweisen.
Parent - By Max Siegfried Date 2023-12-12 17:05
Reinhold Stibi schrieb:

Stockfish spielt auch ohne TBs ein ganz hervorragendes Endspiel


Schon das du endlich eingesehen hast das 8-Steiner TB gebraucht werden.
Stockfish soll die Endspiele schließlich perfekt spielen und nicht nur hervorragend.
Parent - - By Jörg Oster Date 2023-12-12 16:02 Upvotes 1
Eben, Stockfish hat keine policy.
Es beschleicht mich der leise Verdacht, die wussten nicht so wirklich, was Sie tun.

Es wäre interessant gewesen, beide Bewertungen miteinander zu vergleichen.
Also den value head von Lc0 mit der Bewertung des NNUE von Stockfish.

Andererseits spielen beide Engines TB Positionen mithilfe der TBs mehr oder weniger perfekt.
Zumindest dürften beide Engines gewonnene Endspiele auch gewinnen, und Remisendspiele auch remis halten.
Und mal im Ernst, wer lässt heutzutage ohne TBs spielen?

Im Grunde ist diese Untersuchung mindestens 9 Jahre zu spät dran ...
Parent - By Reinhold Stibi Date 2023-12-12 16:17
Stockfish braucht eigentlich überhaupt keine TBs.

Bei Blitz 5 Min. auf Schach.de spiele ich ohne TBs.

In extremer Zeitnot  von nur 0,5  bis 0,1 Sek. sind die TBs schädlich und spielen dann manchmal
totalen Unsinn wie Figuren einfach hinstellen.
Das läßt sich auch gut erklären weil in dieser kurzen Zeit auch mit einer schnellen SSD
die TBs nicht ausreichend geladen werden können.

Bei längerer Bedenkzeit und Zeitvorgabe  je Zug z.B. auch nur 1 Sek. sind die TBs nützlich,
bringen dann bei Stockfish auch nicht viel aber wohl bei den schwächeren Engines.
Parent - By Max Siegfried Date 2023-12-12 17:07
Jörg Oster schrieb:

Und mal im Ernst, wer lässt heutzutage ohne TBs spielen?


Das frage ich mich schon lange nicht mehr, aber manche Leute spüren hinter den TBs eine geheime Verschwörung damit die Engines schlechter spielen.
Ich freue mich jetzt schon auf die 8-Steiner.
Parent - - By Peter Martan Date 2023-12-12 18:17
Jörg Oster schrieb:

Und mal im Ernst, wer lässt heutzutage ohne TBs spielen?

Das hättest du nicht fragen sollen

Natürlich kann einen das auch interessieren, wie groß der Anteil am Erfolg bei denselben Stellungen und derselben Hardware- TC wohl durch die tbs sein mag:

Stockfish dev-20231202-08cdbca5 single thread no tbs
Bisher gelöst: 965 von 1024  ;  1:53m

         1   2   3   4   5   6   7   8   9  10  11  12  13  14  15  16  17  18  19  20
-------------------------------------------------------------------------------------
   0 |   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   -   0   0   0   0
  20 |   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   -   0   0   0   0
  40 |   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
  60 |   0   0   -   0   0   0   0   0   0   0   -   0   0   0   0   0   0   0   0   0
  80 |   0   -   0   0   0   0   0   0   0   0   0   0   0   0   0   0   -   0   0   0
100  |   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
120  |   0   -   0   0   0   0   0   0   0   0   0   0   0   -   0   0   0   0   0   -
140  |   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
160  |   0   0   0   0   0   0   0   -   -   0   -   0   0   0   0   0   0   0   0   -
180  |   0   -   0   -   0   0   0   0   0   0   0   -   0   -   0   0   0   0   0   0
200  |   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
220  |   0   0   1   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
240  |   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   -   0
260  |   0   0   0   0   -   -   0   0   0   0   0   0   0   0   -   0   0   0   -   0
280  |   0   0   0   0   0   0   0   -   0   0   0   0   0   -   0   0   0   0   0   0
300  |   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
320  |   0   0   0   0   0   0   0   0   0   0   0   1   0   0   0   0   0   0   0   0
340  |   0   0   0   -   0   0   0   0   0   0   0   0   0   0   0   -   0   0   -   0
360  |   0   0   -   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
380  |   0   0   -   0   0   -   0   0   0   0   0   0   0   0   0   0   0   0   0   0
400  |   0   0   0   -   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
420  |   0   0   0   -   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
440  |   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
460  |   0   0   0   0   0   0   -   0   0   -   0   0   0   0   0   0   0   0   0   -
480  |   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
500  |   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
520  |   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   1   0   0   0   0
540  |   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   -
560  |   0   0   0   0   0   0   0   -   0   0   0   0   0   0   0   0   0   -   0   0
580  |   0   0   0   0   0   0   1   0   0   0   0   0   0   0   0   0   0   0   0   0
600  |   0   0   -   0   0   0   0   0   0   0   0   0   0   0   1   0   0   0   0   0
620  |   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   -   0
640  |   0   0   0   0   0   0   0   0   0   0   0   -   0   0   0   0   0   -   0   0
660  |   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
680  |   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
700  |   0   0   0   -   0   -   0   0   -   0   0   0   0   0   0   0   0   0   0   0
720  |   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
740  |   0   0   0   0   0   0   0   0   0   0   0   0   0   -   0   0   0   0   0   0
760  |   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
780  |   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
800  |   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   -   0   0   -   0
820  |   0   0   0   0   0   0   0   0   0   0   0   -   0   0   0   -   0   -   0   0
840  |   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   -   0   0
860  |   0   0   0   0   0   -   0   0   0   0   0   0   0   0   0   0   0   -   0   0
880  |   0   0   0   0   0   0   0   -   0   0   0   0   0   0   0   0   0   0   0   0
900  |   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
920  |   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
940  |   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
960  |   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
980  |   -   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
1000 |   0   0   -   0   0   -   0   0   -   0   0   0   0   0   0   0   0   0   0   0
1020 |   0   0   0   0

  TotTime: 17:04m    SolTime: 1:53m

Lc0 v0.31.0-dag+git.a4877961 2717500 no tbs
Bisher gelöst: 900 von 1024  ;  2:13m

         1   2   3   4   5   6   7   8   9  10  11  12  13  14  15  16  17  18  19  20
-------------------------------------------------------------------------------------
   0 |   0   -   0   -   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
  20 |   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
  40 |   0   0   0   0   0   0   0   0   0   0   0   -   0   0   -   0   0   0   0   -
  60 |   0   0   0   0   -   -   0   0   0   0   -   -   0   0   0   -   0   -   0   0
  80 |   0   0   0   0   0   0   0   0   0   0   0   -   0   0   0   0   -   0   0   -
100  |   0   0   0   0   0   0   0   0   0   -   0   0   0   0   0   -   0   0   0   0
120  |   0   0   0   0   0   0   0   0   0   0   0   0   0   -   0   0   0   0   0   0
140  |   0   0   0   0   -   0   0   0   0   0   0   0   0   0   0   -   0   0   0   0
160  |   0   0   0   0   -   0   0   -   -   0   -   0   0   0   0   0   -   0   0   -
180  |   0   0   0   -   0   0   0   0   0   0   0   0   0   -   0   0   0   0   0   0
200  |   0   0   0   0   0   0   0   0   0   -   0   0   0   0   0   0   0   0   0   0
220  |   -   0   -   0   0   -   0   0   0   0   0   -   0   0   0   0   0   0   0   0
240  |   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   -   0
260  |   0   0   0   0   0   -   0   0   -   0   0   0   0   0   -   0   0   0   -   0
280  |   0   0   0   -   0   0   0   -   0   0   0   0   0   -   0   0   0   0   0   0
300  |   0   0   0   0   0   0   0   0   0   -   -   0   -   0   0   0   0   0   0   0
320  |   0   0   0   0   0   0   0   0   0   0   0   -   0   0   0   -   0   0   0   0
340  |   0   0   0   0   0   0   0   0   -   0   0   0   0   0   0   0   -   0   -   0
360  |   0   0   -   -   0   0   0   0   0   0   0   0   0   0   -   0   0   0   -   0
380  |   -   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   -   0   0   0
400  |   -   -   -   0   0   0   0   -   0   0   -   0   0   0   0   0   0   0   0   0
420  |   0   0   0   -   -   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
440  |   0   0   0   0   0   0   0   0   0   0   -   0   0   -   0   0   0   0   0   -
460  |   0   0   0   0   0   0   -   0   0   0   0   0   0   -   0   0   0   0   0   -
480  |   0   0   0   0   0   0   0   0   0   0   0   0   0   0   -   0   0   0   0   0
500  |   -   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
520  |   0   0   0   -   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
540  |   0   0   0   -   0   0   0   0   -   0   0   0   0   0   0   0   0   0   0   -
560  |   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
580  |   0   0   0   0   -   0   0   0   0   0   0   -   0   0   0   0   0   0   0   0
600  |   0   0   -   0   0   0   -   0   0   0   0   0   -   0   -   0   -   0   0   0
620  |   0   0   0   0   0   0   0   0   0   0   0   -   0   0   0   0   0   0   0   0
640  |   -   0   0   0   0   0   -   0   0   0   0   -   -   0   0   0   0   0   -   0
660  |   0   -   0   0   0   0   0   0   0   0   -   0   0   0   0   0   0   0   0   0
680  |   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   -   0   -
700  |   0   0   0   0   0   -   0   0   -   0   0   0   -   0   0   0   0   0   0   0
720  |   0   0   0   0   0   0   0   -   0   0   0   0   0   0   -   0   0   0   -   0
740  |   0   0   0   0   0   0   0   0   -   0   0   0   -   -   0   0   0   0   0   0
760  |   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
780  |   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   -   -
800  |   0   0   0   0   0   -   0   0   0   0   0   0   0   0   0   0   0   0   0   0
820  |   -   0   0   0   0   0   0   0   0   0   0   -   0   0   0   -   0   0   0   0
840  |   0   -   0   0   0   -   0   0   0   0   -   0   0   0   0   0   0   0   -   0
860  |   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   -   0   0
880  |   0   0   0   0   -   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
900  |   0   0   0   0   0   0   0   0   -   0   0   -   0   0   0   0   0   0   0   0
920  |   0   0   -   0   0   0   0   0   0   0   0   0   0   -   0   0   0   0   0   0
940  |   0   -   0   -   0   0   0   0   0   0   0   0   -   0   0   0   -   0   0   0
960  |   0   0   -   0   0   0   0   0   0   0   0   0   0   0   -   0   0   0   0   0
980  |   -   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
1000 |   0   0   0   0   0   -   0   0   0   0   0   0   0   0   0   0   0   0   0   0
1020 |   0   0   -   0

  TotTime: 7:35m    SolTime: 2:13m


Die Tabellen häte ich natürlich weglassen können, aber die gefallen mir immer so gut im Shredder, den ich jetzt genommen habe, um wenigstens diese beiden runs gleichzeitig laufen lassen zu können.
Zusammengefasst hat SF statt 985 im Fritz mit den 6Steinern jetzt im Shredder 965 gelost, also doch auch 20 weniger, Lc0 statt 951 mit tbs jetzt 900 ohne. Es scheint, dass Lc0 doch mehr auf die tbs angewiesen ist als Shredder, aber das hatte ich ja im Vorposting auch schon stark vermutet
Parent - - By Reinhold Stibi Date 2023-12-12 19:10 Edited 2023-12-12 19:29
Peter, Stockish hat mit TBs nicht einmal 2 % der Stellungen mehr gelöst.

2 % dürften keine 5 Elo sein.

Das sagt doch alles.

Die Ergebnisse wären noch viel knapper mit z.B. Stockfish und Abkömmlinge bei 8 Cores/16 Threads.

In der Praxis wenn es auf Leistung ankommt, spielt doch niemand nur mit 1 Core..

Dass Lc0 ziemlich im Endspiel hinterher hinkt zeigt doch, dass Stockfish nur mit 1 Core
und ohne TBs besser ist als Lc0 mit riesigem Hardware-Vorteil und mit TBs.

Diese Tests mit total ungleichen Hardwareverhältnissen sind Blödsinn, nichtssagend und unfair.

Interessant wäre dieser Endspieltest mit Stockfish 8 Cores/16 Threads oder 16 Cores/32 Threads
mit und ohne TBs.
Das wäre Praxisgerechter.
Parent - - By Peter Martan Date 2023-12-12 19:28
Reinhold Stibi schrieb:

Die Ergebnisse wären noch viel knapper mit z.B. Stockfish und Abkömmlinge bei 8 Cores/16 Threads.

Das probierst jetzt du, einmal mit und einmal ohne tbs

Reinhold Stibi schrieb:

Diese Tests mit total ungleichen Hardwareverhältnissen sind Blödsinn, nichtssagend und unfair.

Und wie die Hardware- Verhältnisse bei genau diesen Stellungen und dieser TC "gleich" wäre, das weiß aber auch keiner außer dir. Wenn du das nicht irgendwie beweisen kannst, was du da vermutest, sag ich einfach mal, alle weiteren Versuche, die nicht genau das Ergebnis bringen, das ich mir wünsche (du dir wünscht), sind auch Blödsinn

Auf mehrfachen () Wunsch hab' ich dir und mir noch einen Run mit 16 HT- on- threads (von32 möglichen) gegönnt:


    Program                                    Elo   +/-  Matches  Score   Av.Op.   S.Pos.   MST1    MST2   RIndex

  1 Stockfishdev-20231202-16t-Syz6           : 3505    2   2022    51.0 %   3498  1013/1024    1.0s    1.0s   1.00
  2 Stockfishdev-20231202-singleT-Syz6       : 3500    2   2001    50.1 %   3500   985/1024    1.0s    1.0s   0.99
  3 Lc0v0.31.0-dag+git.a4877961-2717500      : 3495    2   2003    48.9 %   3503   951/1024    1.0s    1.0s   0.98

MST1  : Mean solution time (solved positions only)
MST2  : Mean solution time (solved and unsolved positions)
RIndex: Score according to solution time ranking for each position


Gratuliere, du hast dir weitere 5 Elo bei +- 2 error redlich verdient
Parent - - By Reinhold Stibi Date 2023-12-12 19:41 Upvotes 1
Diesen Endspieltest mit den 1027 Stellungen werde ich mit meinem
PC 5900hx  8 Cores/16 Threads mit den 6 Steiner TBs und ohne TBs durchführen.

Hast du vielleicht den Link zu dem Endspieltest. Müsste mich sonst diesen vielleicht
etwas mühsam suchen.
Parent - - By Peter Martan Date 2023-12-12 19:47 Edited 2023-12-12 19:51 Upvotes 1
Sorry, Reinhold, erstens will ich in Foren sowieso keine Links zu Suiten mehr setzen, zweitens dürfte ich das bei diesen 1024 auch nicht ohne Harold van der Heijden wieder mal eigens zu fragen, 500 sind in den Lizenzbedingungen frei im Block weiterzugeben. Ich hatte schon mal, als es an diese 500 mit der Suite, die ich damals dazu veröffentlicht hatte, heranging, seine Erlaubnis per Mail extra eingeholt, ich schick dir per Mail diese 500, wenn du willst. Übrigens kann ich bei der Gelegenheit aber wärmstens empfehlen, sich diesen Goldstandard einer Studien- Datenbank anzuschaffen, wenn man ein Fan von Problemschach ist.
https://www.hhdbvi.nl/
Parent - - By Reinhold Stibi Date 2023-12-12 20:26
Peter,  13839 Endspielstudien sind mir zu viel.

Da habe ich nicht die Zeit dazu.

Das Angebot mit den 500 nehme ich gerne an.

Vielen Dank !
Parent - By Peter Martan Date 2023-12-12 20:36 Upvotes 1
Reinhold Stibi schrieb:

Peter,  13839 Endspielstudien sind mir zu viel.

Dann werden dir die 93839, die in der HHdBVI drin sind, auch zu viele sein.

Ich hab' mir die aber auch nicht alle einzelne angeschaut, Reinhold, so eine Datenbank hat vor allem den Sinn, eine Suche darin von einem Datenbankprogramm machen lassen zu können und eine gute Dokumentation für jede einzelne Studie zu haben, die drin ist.
Parent - By Max Siegfried Date 2023-12-12 22:17
Reinhold Stibi schrieb:

Peter,  13839 Endspielstudien sind mir zu viel.

Da habe ich nicht die Zeit dazu.

Das Angebot mit den 500 nehme ich gerne an.

Vielen Dank !


1 Sekunde pro Stellung reicht.
- - By Lothar Jung Date 2023-12-13 10:06 Upvotes 1
Ich bezweifele stark, das mir einer zeigen kann, dass LC0 BT3 oder T3 mit TB6 ein Endspiel verliert.
Unter HTC114 löst LC0 mit meiner Hardware (RTX 4070ti 15 sec.) fast jedes Endspiel.
Parent - - By Peter Martan Date 2023-12-13 10:22
Wenn du schreibst, löst fast jedes Endspiel, heißt das ja aber auch schon, dass es nicht jedes ist. Und das sind Stellungen, die als wdl mit single best move evaluiert sind, wenn da eine Lösung nicht gefunden wird, zählt das mehr meiner Meinung nach, als wenn's beim Ausspielen dann trotzdem doch noch so klappt, als wäre der best move gefunden worden, halt mit suboptimalen Zügen, die keine spielentscheidenden Fehler darstellen.
Das Ausspielen von Endspielstellungen krankt daran, dass sie, wenn sie entsprechend nahe an den tbs- Stellungen sind, in der Regel auch ohne sie auszuspielen als win, draw, loss beurteilt werden können mit interaktiver Analyse, lässt man jetzt solche ausspielen, die bei fehlerfreiem Spiel Remis sind oder die anderen? Und wieder mal, mit welcher Hardware- TC und gegen welche und wieviele Gegner?
Dass ein Remis- Endspiel von Lc0 gegen SF noch verspielt wird, sieht man immer wieder mal, umgekehrt natürlich auch, aber seltener.

Beispiele aus der jüngsten Foren- Vergangenheit:

https://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=167107#pid167107

https://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=167105#pid167105

Und das Gegenbeispiel, bei dem Lc0 eindeutig besser evaluiert und spielt als SF, allerdings keine Endspielstellung und phantasievoll komponiert, gehört hier also nur sehr am Rande, eigentlich gar nicht her, nur weil sie eines der seltenen Beispiele ist, bei dem der Vorteil wirklich deutlich auf der Lc0- Seite ist:

https://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=167010#pid167010

Die Salai- Studie, die ich in der letzten Zeit auch immer wieder mal zitiert hab als Teststellung, bei den 114 die Nr. 37, gehört auch zu den (relativ zu umgekehrt selteneren Beispielen für Lc0 vor SF)

https://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=167211#pid167211
Parent - - By Lothar Jung Date 2023-12-13 10:31 Upvotes 1
Ich meine nur „verliert“ direkt im Endspiel. Keine Studien. Auf RTX 4070 +, mit 15 sec. mit TB6.
Keine Stellungen, wo die Engine schon vorher im Nachteil ist.
Ich verliere mit BT3, BT4 und T3 auf Schach.de keine Partie.
Man sieht das Lösungsprofil von HTC114 dieser Netze in meinen Threads.
Wo ist bei den nicht gelösten Stellungen eine Endspielschwäche zu sehen??
Parent - By Max Siegfried Date 2023-12-13 11:01
Lothar Jung schrieb:

Ich meine nur „verliert“ direkt im Endspiel. Keine Studien. Auf RTX 4070 +, mit 15 sec. mit TB6.
Keine Stellungen, wo die Engine schon vorher im Nachteil ist.
Ich verliere mit BT3, BT4 und T3 auf Schach.de keine Partie.
Man sieht das Lösungsprofil von HTC114 dieser Netze in meinen Threads.
Wo ist bei den nicht gelösten Stellungen eine Endspielschwäche zu sehen??


Dann wären 7,5 Sekunden bereits ausreichend mit einer RTX 4090.
Parent - By Peter Martan Date 2023-12-13 11:32 Edited 2023-12-13 11:49
Lothar Jung schrieb:

Wo ist bei den nicht gelösten Stellungen eine Endspielschwäche zu sehen??

Das ist eine sich selbst beantwortende Frage, bei single best move- Stellungen, die in der Regel auch game changer darstellen (dem Spiel also einen anderen Ausgang bringen bei fehlerfreiem Weiterspielen als alle in Frage kommenden Alternativzüge), stellt jede falsche Lösung mit ziemlicher Wahrscheinlichkeit einen spielentscheidenen Fehler dar und das würde (im Vergleich zu einer anderen Engine, die den Fehler nicht macht bei gleicher Hardware- Zeit) eine Endspielschwäche aufzeigen.
Mit den praktischen Partien, die zuerst ins Endspiel führen, ist es viel schwieriger, weil du schreibst, keine Stellungen, wo die Engines schon im Nachteil ist, das funktioniert eben als Teststellungsprinzip nicht, in der Eröffnung ja heutzutage auch nicht mehr so recht, aber im Endspiel hieße Evalrange im Bereich von = (bei interaktiv gut evaluierten Outputs), dass das Remis ausgehen muss, wenn keine leicht nachweisbaren Fehler mehr passieren. Eröffnungseval zählt numerisch viel höher als Endspieleval.
Dass diese Endspielstellungen mit ausgeglichener Bewertung dann in aller Regel von starken Engines auf guter Hardware, selbst bei Elounterschieden von sagen wir 50, Remis ausgespielt werden, ist mehr self fulfilling prophecy als das Finden oder nicht Finden von single best move Stellungen im Endspiel, bei denen der bm (allein) Gewinn- bringend ist und alle Alternativzüge nicht.

Was man machen könnte, wäre ein Backward mit SF von Lc0- SF- Partien bei vernünftiger Hardware- TC, (da hätte man schon an den Evals der Engines im Spiel Anhaltspunkte, ab wo man genauer hinschauen müsste) dort, wo SF einen Evalsprung für die Lc0- Seite macht, eine weitere Partie ausspielen lassen, ob sich das Ergebnis dadurch ändert. Wie groß der Evalsprung sein dürfte bzw. müsste, und wie nahe an den tbs das Endspiel schon liegen sollte, wäre nach wie vor sehr diskutabel, auch wieder, ob man nur Partien nähme, die zuerst verloren wurden oder sowohl solche als auch Remis, bei denen Lc0 dann in einer des Partiepaares den Gewinn verschenkt haben könnte.
Ist mir kurz gesagt zuviel Aufwand, aus die Art etwas beweisen zu können, einzelne Partien, die nach Fehlersuche im Ergebnis korrigierbar sind, gibt's zuhauf, einzelne Partien würden mir hier aber eben meistens weniger sagen, als einzelne wirklich selektive Teststellungen.
Bei denen kann man ja schon bei statistisch signifant (Zufalsstreuungen bei SMP mittelnd) längerer time to solution von eindeutig besser oder schlechter reden, wieviel die einzelne Stellung zählt, ist die Frage, der muss man sich aber bei MEA z.B. ohnehin auch widmen, weil man irgendeine bestimmte Punktezahl für den einzelnen Zug vergeben muss.
Der wirkliche Knackpunkt ist "Schwäche", gibt's nur relativ zu bestimmten anderen Engines, Mindestanforderung der Unterscheidung wäre LOS.
Parent - - By Peter Martan Date 2023-12-13 19:58 Edited 2023-12-13 20:01
Lothar Jung schrieb:

Man sieht das Lösungsprofil von HTC114 dieser Netze in meinen Threads.
Wo ist bei den nicht gelösten Stellungen eine Endspielschwäche zu sehen??

Ich bin mal die Liste der Lösungen durchgegangen, die du im Thread über das BT4- Netz gebracht hast.
Da ist als erste Stellung von den nicht gelösten ein noch nicht  sehr weit fortgeschrittenes Endspiel, aber man könnte es jedenfalls schon so nennen, die Stellung Nr. 29 unter den 114, eine Studie von Bondarenko und Kuznetsov von 1982:


bm Lf4

Analysis by Lc0 v0.31.0-dag+git.a4877961:

1.a6 Tb4 2.Sxd7 fxg5 3.Kf7 Td8 4.Kxe6 Txd7 5.Txd7+ Kb6 6.Td6 Txc4 7.Kd7 Txe4 8.Txc6+ Ka5 9.Txc5+ Kxa6 10.Txg5 Tb4 11.Kc6 g6 12.Kc5 Tb6 13.Kc4 Kb7 14.Te5 Tc6+ 15.Kd3 Kc8 16.Te7 Ta6
= (-0.07)   Tiefe: 25/87   00:05:38  4821kN, tb=47242

Das ist das T3- Netz 2717500 mit dem jüngsten Lc0- Compile, das ich von deinem Link, den du gemeinsam mit dem vom Netz gepostet hast.

Meiner Meinung nach (bei sehr geringen Unterschieden zu Späterem) immer noch der (ein) Goldstandard das BT3- Netz 2790M (2860M ist praktisch gleich stark) mit dem Compile, das damals aktuell war, als das Netz auf TCEC gespielt hat:

2r5/prkpR1p1/2p1ppK1/P1p1N1B1/P1P1P3/8/8/8 w - - 0 1

Analysis by Lc0 v0.31.0-dag+git.e429eeb:

1.a6 Tb4 2.Sxd7 fxg5 3.Kf7 Td8 4.Kxe6 Txd7 5.Txd7+ Kb6 6.Td6 Txc4 7.Kd7 Txe4 8.Txc6+ Ka5 9.Txc5+ Kxa6 10.Txg5 Txa4
= (-0.07)   Tiefe: 26/98   00:05:57  3471kN, tb=60071

SF dev. mit 30 Threads der 16x3.5GHz CPU, 8G Hash:

2r5/prkpR1p1/2p1ppK1/P1p1N1B1/P1P1P3/8/8/8 w - - 0 1

Analysis by Stockfish dev-20231202-08cdbca5:

1.Lxf6 gxf6 2.Txd7+ Kb8 3.Kxf6 Th8 4.Kxe6 Tc7 5.Td3 Th6+ 6.Kf5 Te7
  Schwarz hat minimalen Vorteil: = (-0.25)  Tiefe: 10/15   00:00:00
...
1.Txd7+ Kb8 2.Lxf6 gxf6 3.Kxf6 Txd7 4.Sxd7+ Kc7 5.Sxc5 e5 6.Kxe5 Tg8 7.Ke6 Te8+ 8.Kf6 Th8 9.e5 Th6+ 10.Ke7 Th7+ 11.Kf6 Th6+
  Die Stellung ist ausgeglichen: = (0.00)  Tiefe: 54/23   00:00:11  212MN, tb=982836
1.Lf4
  Die Stellung ist ausgeglichen: = (0.03 ++)  Tiefe: 55/32   00:00:14  265MN, tb=1212340
...
1.Lf4
  Weiß steht besser: +/- (1.04 ++)  Tiefe: 55/38   00:00:18  334MN, tb=1395362
...
1.Lf4 Td8 2.a6 Tb4 3.Sxd7+ e5 4.Sxe5+ Kb6 5.a5+ Kxa6 6.Sxc6 Ta8 7.Sxb4+ cxb4 8.Kxg7 Kxa5 9.Kxf6 Kb6 10.Le3+ Kc6 11.Te6+ Kd7 12.Ta6 b3 13.Ld4 Td8 14.Ke5 Kc8 15.Td6 Tf8 16.c5 Tf1 17.Tf6 Tb1 18.Kd5 Td1 19.Kc4 a5 20.Tc6+ Kb7 21.Tb6+ Kc7 22.Le5+ Kc8 23.Kxb3
  Weiß steht klar auf Gewinn: +- (4.71)  Tiefe: 55/64   00:00:57  989MN, tb=3342653

Hab' noch 2 weitere Versuche gemacht, von denen der eine ungefähr gleich schnell war, der andere aber knapp über 2 Minuten gedauert hat, da ist offenbar schon ziemlich viel SMP- Streuung bei SF dev. drin, müsste man mehr Versuche machen, aber man könnte natürlich auch mit denjenigen Engines vergleichen, die hier immer wieder wirklich schnell lösen wie z.B. Crystal.
Nur mal so als erstes Beispiel aus den 114, nach denen du gefragt hast.
Parent - - By Lothar Jung Date 2023-12-13 20:11
1. Es ist eine Studie.
2. BT3/4 ist auf deiner Hardware zu langsam.
3. T3 mit dem aktuellen Netz rechnet viel tiefer.
4. Es ist kein Endspiel.
5. Bin auf den nächsten Versuch gespannt.
Parent - - By Peter Martan Date 2023-12-13 20:17
Es ist eine realitätsnahe Studie mit nur noch 3 Schwerfiguren, 2 Leichtfiguren und Bauern am Brett, wenn du diese Stellung nicht gelten lassen willst, ist es nur, um nicht mit einem deiner Lieblingsnetze auf deiner Superhardware zeigen zu müssen, wie lange es damit dauert
Parent - - By Lothar Jung Date 2023-12-13 20:27
Studien mit soviel Figuren und Bauern sind artifizielle.
Kein Beweis, das LC0 schwach im Endspiel ist.
HTC114 hat viele Endspiele.
Das vorletzte Netz machte 89/114.
Die Schwäche von LC0 liegt bei Opfern.
Einige Nichtlösungen sind extreme Studien, z.B. 16 Bauern.
Auch wurde bei einigen Nichtlösungen ein Zug gewählt, der sehr sicher gewinnt. Also nicht geeignet.
Parent - By Peter Martan Date 2023-12-13 20:50 Edited 2023-12-13 21:09
Lothar Jung schrieb:

Das vorletzte Netz machte 89/114.

CrystalMZ (Marco Zerbinatis Version von Crystal) macht 104/114 bei 15"/Stellung

Lothar Jung schrieb:

Auch wurde bei einigen Nichtlösungen ein Zug gewählt, der sehr sicher gewinnt. Also nicht geeignet.

Welche meinst du?

Edit: dass du nicht von Schwäche sprechen willst, ist verständlich aus deiner Sicht, aber wie ich schon mal dazu sagte, solche Begriffe kann man nur relativ definieren, natürlich ist Lc0 saustark mit vielen Engines, die deutlich schwächer sind, verglichen, aber der Goldstandard SF legt die Latte halt ziemlich hoch.
Lassen wir's gut sein, ich würde bei Lc0 ja von Endspielschwäche auch höchstens im Vergleich zu seinen übrigen Stärken sprechen, das Endspiel ist sicher nicht die stärkste Seite von Lc0. Auch da muss man einschränkend sagen, dass es mittlerweile löbliche Ausnahmen viele gibt, bei ein paar Festungen hat die Engine immer wieder mal die Nase sogar vor SF voran. Nur mit dem Begriff Endspiele haben wir die Definitionsprobleme auch schon gesehen, Fortresses sind insofern Sonderfälle, als sie eben den Fortschritt, der ansonsten zu den Stellungen mit noch weniger Material führen würde, vermissen lassen, da werden die tbs- Stellugen eben gar nicht mehr erreicht, weil vorher das GUI adjudiziert oder 3fold oder die 50 Züge- Regel.
Parent - By Peter Martan Date 2023-12-13 20:49 Edited 2023-12-13 21:12
Lothar Jung schrieb:

5. Bin auf den nächsten Versuch gespannt.

Nr.32, Herbstmann A. hat das 1956 um 2 Züge länger komponiert, als es in den 114 als Teststellung drin ist, es ist also keine Studie, sondern eine Stellung, die aus einer Studien- Variante rausgeschnitten ist

Die Originalstellung schaut so aus:


Bm 1.Sg5, nach 1...Sd6 ist die Teststellung in den 114 erreicht:



Analysis by Lc0 v0.31.0-dag+git.e429eeb:

1.Lg4 Lb2
  Schwarz hat entscheidenden Vorteil: -+ (-2.87)  Tiefe: 1/2   00:00:02  2Knoten
...
1.Lg4 Lc1 2.Sgf3 Sc5 3.Se5
  Schwarz steht deutlich besser: -+ (-2.48)  Tiefe: 3/7   00:00:02  26Knoten
1.Sxf7+ Sxf7 2.Se6+ Ke8 3.Ld3 Kd7 4.Sf8+
  Schwarz steht etwas besser: =/+ (-0.65)  Tiefe: 3/7   00:00:02  28Knoten
...
1.Sxf7+ Sxf7 2.Se6+ Ke8 3.Lg6 Lc1 4.Ld3 Sb8 5.Lb5+ Sd7 6.Sc5 Sfe5 7.Se6 Kf7 8.Sd4 Sc5 9.Sf5
  Schwarz steht deutlich besser: -+ (-2.26)  Tiefe: 7/17   00:00:02  831Knoten, tb=1
1.Lg4 Ke8 2.Lh5 Kf8 3.Sc6 Lc1 4.Sf3 e6 5.Sfe5 Lb2 6.Sd7+
  Schwarz hat entscheidenden Vorteil: -+ (-2.53)  Tiefe: 7/17   00:00:02  1781Knoten, tb=1
...
1.Ld3 Sc7 2.Lc2 Lc1 3.Sgf3 Sa6 4.Kd1 Lf4 5.Sc6+ Ke8 6.Sfe5 Sc5 7.Lg6 e6 8.Lh5 Sd7 9.Sd3 Le3 10.Ke2 Lb6 11.Sf4 Kf8 12.Lg4 Sc5
  Schwarz hat entscheidenden Vorteil: -+ (-2.61)  Tiefe: 21/73   00:02:34  1410kN, tb=7400
1.Sxf7+ Sxf7 2.Se6+ Ke8 3.Lg6 Lc1 4.Ld3 Sb8 5.Kd1 Lb2 6.Kc2 Lh8 7.Lb5+ Sd7 8.Le2 Lf6 9.Kd1 Lh4 10.Kc1 Lf2 11.Kb1 Lh4 12.Ka2 Lg3 13.Kb1 Le5 14.Ka2 Ld6 15.Kb1 Lb4 16.Ka2 Le1 17.Kb1 Lc3 18.Kc2 Lb4 19.Kd1 La3 20.Kc2 Lc5 21.Lh5 La7 22.Le2 Lb6 23.Kc1 Lc5 24.Kc2 Le3 25.Kb1 Lg5 26.Lb5 Lf6 27.Le2 Lh4 28.Kc2 Le1 29.Kc1 La5 30.Kc2 Lb4 31.Kd1 La3 32.Kc2 Ld6 33.Kb1 Lb4 34.Kc2 La5 35.Kb1 Lb6 36.Kc2
  Schwarz steht besser: -/+ (-0.74)  Tiefe: 21/73   00:02:35  1422kN, tb=7487
...
1.Sxf7+ Sxf7 2.Se6+ Ke8 3.Lg6 Lc1 4.Ld3 Sb8 5.Kd1 Lh6 6.Lb5+ Sd7 7.Le2 Lg5 8.Ke1 Lh4+ 9.Kd1 Lf2 10.Kc1 Lc5 11.Kb1 Le3 12.Kb2 Lb6 13.Kb1 La5 14.Ka2 Lb4 15.Kb1 Lc3 16.Ka2 Le1 17.Kb1 La5 18.Kc1 Lb4 19.Kb2 Ld6 20.Ka2 Lc5 21.Kb1 Lb6 22.Ka2 Ld8 23.Kb1 La5
  Schwarz steht etwas besser: =/+ (-0.70)  Tiefe: 27/86   00:03:08  2030kN, tb=12876

2 Minuten und eine halbe, bis Lc0 mit dem 2790- Netz auf der Lösung stabil bleibt, die Eval könnte gern etwas näher 0 gehen, aber wir wollen's mal nicht zu genau nehmen.
2 weitere Versuche sind ähnlich verlaufen, Sf7+ wurde wieder bald gebracht aber mit einer -+ Eval verworfen, bis es oben geblieben ist  mit sinkender Eval, einmal 2:29, einmal 3:33, da reichen die 3 Versuche halbwegs, damit ein Mittelwert für diese Hardware- Software- Kombi schon was aussagt in der Größenordnung.

SF dev. mit der Hardware wie oben:

3k4/4pp2/n2n4/5BN1/3N4/b7/4K3/8 w - - 0 1

Analysis by Stockfish dev-20231202-08cdbca5:

1.Sxf7+ Sxf7 2.Se6+ Ke8 3.Lg6 Lc1 4.Kf3 Sb8 5.Ke4 Sd7 6.Kd4
  Schwarz steht deutlich besser: -/+ (-1.47)  Tiefe: 10/12   00:00:00
1.Lb1 Ke8 2.Kd1 Sc5 3.Kc2 Kf8
  Schwarz steht deutlich besser: -+ (-1.73)  Tiefe: 11/18   00:00:00
...
1.Ld3 Sc7 2.Sc6+ Ke8 3.Lc2 e6 4.Kd3 Lb2 5.La4 Kf8 6.Lb3 Lg7 7.Sd4 Ke7 8.Sc6+ Kd7 9.Sb8+ Ke8 10.Sf3 Kf8 11.Kc2 f5 12.Sg5 Ke7
  Schwarz steht deutlich besser: -+ (-1.85)  Tiefe: 19/27   00:00:01  11431kN, tb=33431
1.Sxf7+ Sxf7 2.Se6+ Ke8 3.Lg6 Lc1 4.Ld3 Sh6 5.Lxa6 Kf7 6.Sc7 Sf5 7.Lb5 Sd6 8.Kd1
  Die Stellung ist ausgeglichen: = (-0.02)  Tiefe: 20/35   00:00:01  24038kN, tb=149641
1.Sxf7+ Sxf7 2.Se6+ Ke8 3.Lg6 Sb4 4.Sg5 Kd7 5.Sxf7 Lb2 6.Sg5 Lc1 7.Sf3 Sd5 8.Lf7 Sb6 9.Lb3 Kc8
  Die Stellung ist ausgeglichen: = (-0.01)  Tiefe: 21/35   00:00:01  25241kN, tb=171851
1.Sxf7+ Sxf7 2.Se6+ Ke8 3.Lg6 Lc1 4.Ld3 Sb8 5.Kd1 La3 6.Lb5+ Sd7 7.Le2 Lb2 8.Kc2 Le5 9.Kd2 Lb8 10.Kc2
  Die Stellung ist ausgeglichen: = (0.00)  Tiefe: 22/35   00:00:01  25490kN, tb=176433
1.Sxf7+ Sxf7 2.Se6+ Ke8 3.Lg6 Lc1 4.Ld3 Sb8 5.Kd1 La3 6.Lb5+ Sd7 7.Le2 Lb2 8.Kc2 Le5 9.Kd2 Lb8 10.Kc2 Ld6 11.Kb2 Lg3 12.Kc3 Lf2 13.Kb2
  Die Stellung ist ausgeglichen: = (0.00)  Tiefe: 23/35   00:00:01  25620kN, tb=178240
...
1.Sxf7+ Sxf7 2.Se6+ Ke8 3.Lg6 Lc1 4.Ld3 Sb8 5.Kd1 La3 6.Lb5+ Sd7 7.Le2 Lb2 8.Kc2 Le5 9.Kb3 Ld6 10.Kc2 Lc5 11.Lb5 Le3 12.Le2 Lb6 13.Kb2 La5 14.Kc2
  Die Stellung ist ausgeglichen: = (0.00)  Tiefe: 58/40   00:00:11  222MN, tb=3600975

Ein Zweitversuch wieder 1", ein dritter 12" bis Sf7+ stabil oben geblieben ist, am Rande bemerkt, die Eval ist hier auch sehr viel schneller genau richtig.
Parent - - By Peter Martan Date 2023-12-14 09:24 Edited 2023-12-14 09:37
Lothar Jung schrieb:

5. Bin auf den nächsten Versuch gespannt.

Lassen wir mal die Studien (wobei ich mich da schon frage, warum du dann bei den Suiten die 114 so gern nimmst, die bestehen zu einem großen Teil aus solchen) und wenden wir uns den Partien zu, die Lc0 gegen SF praktisch spielt.

Ich hab' mal 20 über Nacht die 3070ti (T3- Netz 2717500) gegen die 30 Threads ausspielen lassen und dann beim ersten Partiepaar, das nicht Remis oder 1:1 ausgegangen ist,  ein Backward mit SF für die Lc0- Seite laufen lassen. Von der frühesten Abweichung, die schon irgendwie unter Endspiel gefallen ist und bei der der Vorteil im Spiel von beiden Engines im Evalbereich von knapp über +/= angezeigt wurde, eine weitere Gegenpartie ausspielen lassen (die ursprüngliche mit vertauschten Farben von dieser UHO- Stellung aus hatte SF auch gewonnen).
Hier die .pgn aus den beiden verschmolzenen Partien:

[Event "AMD, Blitz 10.0min+2.0sek"]
[Site "Dort"]
[Date "2023.12.14"]
[Round "1"]
[White "Stockfish"]
[Black "Lc0 v0.31.0-dag+git.a4877961"]
[Result "1-0"]
[ECO "D10"]
[Annotator "0.91;0.73"]
[TimeControl "600+2"]

{AMD Ryzen 9 5950X 16-Core Processor 3400 MHz W=42.0 plies; 17.438kN/s; 70.442.049 TBAs B=23.6 plies; 30kN/s; 39.560 TBAs 1.03;0.89: 'AMD Ryzen 9 5950X 16-Core Processor 3400 MHz W=23.7 plies; 30kN/s; 1.711 TBAs B=43.4 plies; 17.534kN/s; 14.739.632 TBAs'}  1.d4 d5 2.c4 c6 3.Nc3 Nf6 4.e3 Bg4 5.f3 Be6 6.Nge2 dxc4 {1.03;0.89: 'Beide letzter Buchzug'}  7.Nf4 {1.03/18 43}  7...Bc8 {0.89/37 38}  8.Bxc4 {1.00/19 0}  8...b5 {0.92/34 11}  9.Be2 {0.99/19 11 1.03;0.89: '(Lb3)'}  9...Nbd7 {0.88/35 10}  10.e4 {1.01/25 35 1.03;0.89: '(Sd3)'}  10...e5 {0.85/31 10}  11.dxe5 {0.98/28 0}  11...Nxe5 {0.92/31 19}  12.Qxd8+ {0.98/17 0}  12...Kxd8 {0.91/25 0}  13.Be3 {1.00/16 0}  13...Kc7 {0.86/33 41}  14.a4 {1.01/22 80 1.03;0.89: '(Kf2)'}  14...b4 {0.78/28 8}  15.Nb1 {1.00/26 0 1.03;0.89: '(Sd1)'}  15...Nfd7 {0.75/36 53}  16.Nd2 {0.99/31 0}  16...g5 {0.69/36 21}  17.Nd3 {0.97/23 0}  17...Nxd3+ {0.75/35 40}  18.Bxd3 {0.98/27 0}  18...Be7 {0.72/38 36 1.03;0.89: '(Sc5)'}  19.Rc1 {0.92/20 32}  19...Ne5 {0.65/36 8}  20.Be2 {0.90/21 4 1.03;0.89: '(Lf1)'}  20...Be6 {0.63/36 11}  21.Nc4 {0.91/21 2}  21...Nxc4 {0.67/37 28}  22.Bxc4 {0.87/22 0}  22...a5 {0.72/38 43}  23.Ke2 {0.82/18 6}  23...Rad8 {0.71/34 2}  24.Bb5 {Abweichung aus dem SF- Backward}  ( 24.Bxe6 {0.71/20 108 (Lb5) '?!'}  24...fxe6 {0.57/34 9}  25.Rc2 {0.74/24 0}  25...Kb7 {0.52/38 13}  26.Rhc1 {0.73/19 0}  26...Rc8 {0.52/36 8}  27.Rd1 {0.68/18 32}  27...Rhe8 {0.49/48 0}  28.Bc5 {0.65/20 7 (g4)}  28...Bxc5 {0.29/35 9}  29.Rxc5 {0.56/23 1}  29...e5 {0.22/34 7}  30.Rd6 {0.61/25 1}  30...Kb6 {0.18/40 10}  31.Rc2 {0.57/24 9 (Tcd5)}  31...h5 {0.14/34 8}  32.Ke3 {0.48/24 21 (h3)}  32...g4 {0.12/57 8}  33.f4 {0.41/24 9}  33...exf4+ {0.12/44 0}  34.Kxf4 {0.40/23 1}  34...Red8 {0.12/52 7}  35.Rh6 {0.33/23 13}  35...Rd3 {0.10/45 0}  36.e5 {0.25/25 48}  36...b3 {0.07/54 0}  37.Re2 {0.24/25 0}  37...Rf8+ {0.01/52 34}  38.Ke4 {0.24/24 1}  38...Rfd8 {0.01/62 6}  39.e6 {0.25/21 1}  39...Rd2 {0.00/65 8}  40.Rxd2 {0.26/23 37}  40...Rxd2 {0.00/66 0}  41.Ke3 {0.26/21 28 (e7)}  41...Rd5 {0.00/74 7}  42.Rh7 {0.29/22 22}  42...Re5+ {0.00/70 0}  43.Kd3 {0.30/20 0}  43...Rxe6 {0.00/73 7}  44.Rxh5 {0.31/19 0;½-½ Lc0 v0.31.0-dag+git.a4877961-Stockfish AMD, Blitz 10.0min+2.0sek Dort 2023 (10) Remis angenommen}  )  24...Bd7 {0.73/19 64}  25.Rhd1 {0.91/43 32}  25...Be8 {0.70/21 0}  26.Rd5 {0.93/35 16 (Txd8)}  26...Rxd5 {0.68/25 42}  27.exd5 {1.07/36 6}  27...Bf6 {0.66/28 7}  28.Rc5 {1.12/41 30}  28...Bxb2 {0.73/31 0}  29.Bc4 {1.18/35 25}  29...Be5 {0.70/23 117}  30.Rxa5 {1.46/41 18}  30...Bxh2 {0.77/28 0}  31.Bd4 {1.32/45 41}  31...Rg8 {1.09/30 40 (Tf8)}  32.Ra7+ {1.52/35 11}  32...Kb8 {1.20/31 1}  33.a5 {1.48/45 14}  33...Bd6 {1.29/30 0}  34.Ra6 {1.50/48 14}  34...Kc7 {1.39/28 1 (cxd5)}  35.Bb6+ {1.90/34 16}  35...Kb8 {1.43/30 1}  36.Ba7+ {2.03/40 58 (Lf2)}  36...Kc7 {1.39/32 51}  37.Bb6+ {2.09/37 0}  37...Kb8 {1.60/32 11}  38.Bf2 {2.12/39 4}  38...cxd5 {1.62/35 15}  39.Rb6+ {2.16/37 0}  39...Kc8 {1.60/38 0}  40.Ba6+ {2.18/36 22}  40...Kc7 {1.64/39 65 (Kd7)}  41.Bb7 {2.34/33 22}  41...g4 {1.65/37 0}  42.a6 {2.50/32 14}  42...gxf3+ {1.63/39 0}  43.gxf3 {2.60/34 15}  43...Rg2 {1.61/40 0}  44.a7 {2.65/33 11}  44...Bc5 {1.59/42 0}  45.a8=Q {2.71/35 14}  45...Rxf2+ {1.58/40 0}  46.Ke1 {2.72/43 13}  46...Kxb6 {1.58/38 0}  47.Bxd5 {2.78/38 33}  47...Bb5 {1.59/39 0}  48.Qd8+ {2.95/36 31}  48...Ka6 {1.65/1 0}  49.Qc8+ {3.04/30 21 (Dc7)}  49...Kb6 {0.28/29 81}  50.Qb7+ {3.17/38 0 (Db8+)}  50...Ka5 {0.15/1 0}  51.Qa8+ {3.20/35 7}  51...Kb6 {0.23/32 47}  52.Qd8+ {3.25/35 21 (Db8+)}  52...Ka6 {0.19/1 0}  53.Qc7 {3.27/33 14}  53...Rf1+ {0.85/36 17}  54.Kd2 {3.27/36 0}  54...Rf2+ {1.29/34 3}  55.Kd1 {3.27/33 5}  55...Rf1+ {1.52/32 2}  56.Kc2 {3.29/33 17}  56...Ba4+ {1.75/30 0}  57.Kd3 {3.32/31 15}  57...Bb5+ {1.93/30 0}  58.Ke4 {3.31/34 49}  58...Re1+ {2.01/29 0}  59.Kf4 {3.32/29 6}  59...Be3+ {2.04/28 0}  60.Kg3 {3.32/29 13 (Kg4)}  60...Bf1 {1.75/20 52}  61.f4 {3.36/31 0}  61...Rc1 {1.97/19 34}  62.Qxf7 {3.39/31 10}  62...Bb5 {2.11/20 34}  63.Qb7+ {3.40/32 0}  63...Ka5 {2.29/1 0}  64.f5 {3.46/28 8}  64...Ba6 {2.28/16 0}  65.Qb8 {3.46/28 9}  65...Rc3 {2.34/16 0}  66.Kh4 {3.46/33 9}  66...Bd4 {2.49/15 15}  67.Kg4 {3.50/32 0}  67...Be2+ {2.78/14 15}  68.Kf4 {3.58/30 0}  68...Ba6 {2.68/12 1}  69.Qd8+ {3.71/29 20}  69...Bb6 {2.73/13 3}  70.Qh8 {3.73/26 3}  70...Bc7+ {2.80/14 2}  71.Kg4 {3.75/27 7}  71...Be2+ {3.24/13 7 (Tc5)}  72.Kg5 {3.92/26 6}  72...h6+ {3.35/14 1}  73.Kg6 {4.37/25 4}  73...Bd3 {3.38/15 0}  74.Qa8+ {4.62/23 5 (Le6)}  74...Kb5 {3.83/15 5}  75.Qb7+ {5.28/23 7}  75...Ka5 {4.20/14 6 (Lb6)}  76.Bc6 {7.31/21 6}  76...Bb8 {4.14/14 0}  77.Be8 {8.36/19 4 (Ld7)}  77...Bd6 {4.06/13 2 (Lc7)}  78.Qa7+ {10.89/19 3 (Dd7)}  78...Ba6 {6.17/1 0}  79.Qd7 {81.17/19 11}  79...Bc5 {6.86/15 0}  80.Qc7+ {199.45/29 4}  80...Bb6 {8.15/1 0}  81.Qe5+ {199.63/31 3}  81...Bc5 {9.86/1 0}  82.f6 {199.69/35 3}  82...Kb6 {11.47/10 5}  83.f7 {199.75/31 2}  83...Bb7 {14.10/9 9 (h5)}  84.Bd7 {199.77/38 5 (Dxc5+)}  84...Rd3 {13.13/9 6 (h5)}  85.f8=Q {199.83/39 2 (Dxc5+)}  85...Bxf8 {28.58/9 0}  86.Qb5+ {199.86/37 4}  86...Kc7 {35.38/8 1}  87.Qxd3 {199.89/38 2}  87...Bc6 {57.07/6 5 (Le7)}  88.Bxc6 {#15/36 2}  88...Kxc6 {#116/1 0}  89.Kf6 {#13/39 2}  89...Kc5 {36.61/6 4 (b3)}  90.Ke6 {#11/46 2}  90...Bg7 {17.17/6 2 (h5)}  91.Qd5+ {#9/61 2}  91...Kb6 {19.44/1 0}  92.Qd6+ {#8/72 2 (Dc4)}  92...Kb5 {32.77/8 3}  93.Kd5 {#7/131 0}  93...Ka4 {50.47/8 1}  94.Kc4 {#6/245 0}  94...Ka3 {37.69/8 2}  95.Qxb4+ {#5/245 0}  95...Ka2 {#4/1 0}  96.Qb3+ {#4/1 0}  96...Ka1 {#3/1 0}  97.Qc2 {#3/0 0}  97...Bb2 {#2/0 0}  98.Kb3 {#2/1 0}  98...Bc1 {#1/0 0}  99.Qa2# {#1/0 0}  1-0

Bevor ich da jetzt wieder gleich selber meine eigenen Überlegungen dazu ausbreite, warte ich mal ab, ob sich jemand außer mir die Partien und die Stellung, bei der sie voneinander abweichen, näher anschaut und auch was interessant daran findet oder eher nicht.
Weil sonst ein bestimmter Einwand gegen das Prinzip irgendwie zu erwarten wäre, lasse ich jetzt noch die Gegenpartie Lc0- SF von der Abweichung aus laufen, mal sehen, wie das ausgeht.

Edit: Remis.
Parent - - By Reinhold Stibi Date 2023-12-14 10:42


Diese Partie zeigt eine Endspielschwäche von Lc0 im frühen Endspiel.

31...Tg8 ?  gespielt  mit Bewertung von Lc0 mit 1.09  bei einer Tiefe von 30  und  40 Sek. Bedenkzeit

Richtig gewesen wäre:

31. ..Tf8  +0.93  40/55  2:22  Analyse mit Ryzen 9 5900hx

32.Ta7  + 1.52  Tiefe 35   in 11 Sek. von Stockfish gespielt.

Das zeigt mal wieder dass Stockfish viel früher  die Stellung richtig erfasst.
Die altbekannte Schwäche von Lc0 durch die wesentlich geringere Rechentiefe.
Parent - - By Peter Martan Date 2023-12-14 11:43 Edited 2023-12-14 11:55
Richtig.
Das ist aus der Partie, die SF gegen Lc0 nach der Abweichung aus dem Backward ausgespielt hat.
Mit leerem Hash gestartet, bleibt Lc0 mit dem T3- Netz 3 Minunten lang auf dem Textzug, der als Kommentar in der Partie den Ponderzug von SF 31...Tf8 enthält.

4b2r/2k2p1p/2p5/R2P2p1/PpBB4/5P2/4K1Pb/8 b - - 0 1

Analysis by Lc0 v0.31.0-dag+git.e429eeb:

31...Tg8 32.Ta7+ Kd6 33.Ta8 cxd5 34.Ld3 Kc7 35.a5 Kb7 36.Td8 Kc7 37.Txd5 Lc6 38.Tc5 Kd6 39.Lxh7 Te8+ 40.Kd3 Lb7 41.Txg5 Tc8 42.g3 Lxf3 43.a6 b3 44.a7 b2 45.Le5+ Ke7 46.Lxb2 Td8+ 47.Kc4 Tc8+ 48.Kb5 Lg1 49.La3+ Kd8 50.Lc5 Lxc5 51.Txc5 Tc7 52.Kb6 Tb7+ 53.Ka6 Tc7 54.Tf5 La8 55.Tb5 Tc6+ 56.Ka5 Tc3 57.Tb8+
  Weiß steht besser: +/- (1.00)  Tiefe: 24/60   00:02:17  722kN, tb=807

Spielt man den Zug aus:



Analysis by Lc0 v0.31.0-dag+git.e429eeb:

32.Ta7+ Kb8 33.a5 Ld6 34.Ta6 Kc7 35.Lb6+ Kb8 36.Lf2 cxd5 37.Tb6+ Kc8 38.La6+ Kc7 39.Lb7 Tg6 40.Lxd5 Lf8 41.Kd3 Lc6 42.Lxf7 Tf6 43.Ld5 Td6 44.Txc6+ Txc6 45.Lxc6 Kxc6 46.Kc4 h5 47.Le1 b3 48.Kxb3 Kb5 49.Kc2 Ld6 50.Kd3 g4 51.Ke3 gxf3 52.Kxf3 Lc7 53.Ke4 Ld6 54.Kd5 Lc7 55.Ke6 Ld8 56.Ke5 Lg5 57.Lc3 Ld8 58.Kf5 Ka6 59.Le1 Kb5 60.Kg6 h4 61.Kh5 Kc6 62.a6 Kd6 63.a7 Lc7 64.a8D Kc5
  Weiß steht besser: +/- (1.28)  Tiefe: 33/70   00:01:01  348kN, tb=404

Gibt man statt dessen den Ponder- Vorschlag  von SF ein, das 31...Tf8:



Analysis by Lc0 v0.31.0-dag+git.e429eeb:

32.Lc5 Tg8 33.Ta7+ Kb8 34.Ta6 g4 35.dxc6 gxf3+ 36.gxf3 Tg5 37.Le3 Tg2+ 38.Kd3 Kc7 39.Ld5 Kd6 40.Le4 f5 41.Lxf5 b3 42.a5 Lxc6 43.Le4 Tc2 44.Tb6 Kd7 45.Lxc6+ Txc6 46.Txb3 Tf6 47.Ke2 Lc7 48.Tb5 Te6 49.Kf2 Tc6 50.Lb6 Ld6 51.Tb2 h5 52.Kg2 Tc3 53.a6 h4 54.a7 h3+ 55.Kh1 Ta3 56.Tb1 Ta2 57.Lg1 h2 58.Le3 Kc8 59.Ld4 Ta4 60.Tb6 Lc7 61.Tb4 Ta2 62.Tb5 Ta4 63.Tb1
  Weiß steht besser: +/- (1.22)  Tiefe: 28/70   00:00:59  473kN, tb=781

bewertet Lc0 das schon ein wenig weniger hoch für Weiß, geht man den Halbzug wieder zurück, bleibt Lc0 beim SF- Zug

4b2r/2k2p1p/2p5/R2P2p1/PpBB4/5P2/4K1Pb/8 b - - 0 1

Analysis by Lc0 v0.31.0-dag+git.e429eeb:

31...Tf8 32.Lc5 Tg8 33.Ta7+ Kb8 34.Ta6 g4 35.dxc6 gxf3+ 36.gxf3 Tg5 37.Le3 Tg2+ 38.Kd3 Kc7 39.Ld5 Kd6 40.Le4 f5 41.Lxf5 b3 42.a5 Lxc6 43.Le4 Tc2 44.Tb6 Kd7 45.Lxc6+ Txc6 46.Txb3 Tf6 47.Ke2 Lc7 48.Tb5 Te6 49.Kf2 Tc6 50.Lb6 Ld6 51.Th5 Tc2+ 52.Ke3 Tc3+ 53.Ke4 Kc6 54.Txh7 Tc4+ 55.Kd3 Tf4 56.Ke2 Ta4 57.Th1 Kd5 58.Td1+ Ke5 59.Ke3 Ta3+ 60.Td3 Ta4 61.Ke2 Ke6 62.Tb3 Kd5
  Weiß steht besser: +/- (1.13)  Tiefe: 33/75   00:00:59  349kN, tb=997

Und so schaut's dann im MultiPV=2 aus:

4b2r/2k2p1p/2p5/R2P2p1/PpBB4/5P2/4K1Pb/8 b - - 0 1

Analysis by Lc0 v0.31.0-dag+git.e429eeb:

1. +/- (1.07): 31...Tf8 32.Lc5 Tg8 33.Ta7+ Kb8 34.Ta6 g4 35.dxc6 gxf3+ 36.gxf3 Tg5 37.Le3 Tg2+ 38.Kd3 Kc7 39.Ld5 Kd6 40.Le4 f5 41.Lxf5 b3 42.a5 Lxc6 43.Le4 Tc2 44.Tb6 Kd7 45.Lxc6+ Txc6 46.Txb3 Tf6 47.Ke2 Lc7 48.Tb5 Te6 49.Kf2 Tc6 50.Lb6 Ld6 51.Th5 h6 52.Th4 Tc2+ 53.Ke3 Tc3+ 54.Ke2 Ta3 55.Txh6 Lb4 56.Th5 Ke6 57.Kf2 Ta2+ 58.Ke3 Ta4 59.f4 Ld6 60.f5+ Kd5 61.Kd3 Ta3+ 62.Kc2 Le5 63.f6 Ke6 64.f7 Lg7 65.Ld4 Kxf7 66.Lxg7

2. +/- (1.35): 31...Tg8 32.Ta7+ Kb8 33.a5 Ld6 34.Ta6 Kc7 35.Lb6+ Kb8 36.Lf2 cxd5 37.Tb6+ Kc8 38.La6+ Kc7 39.Lb7 Tg6 40.Lxd5 Lf8 41.Kd3 Lc6 42.Lxf7 Tf6 43.Ld5 Td6 44.Txc6+ Txc6 45.Lxc6 Kxc6 46.Kc4 h5 47.Le1 b3 48.Kxb3 Kb5 49.Kc2 Ld6 50.Kd3 g4 51.Ke3 gxf3 52.Kxf3 Lc7 53.Ke3 Le5 54.Ke4 Ld6 55.Kf5 Le7 56.Lc3 Ld8 57.Ld2 Ka6 58.Kg6 h4 59.Le1 Kb5 60.Kh5 Kc6 61.a6 Kb5 62.a7 Kc6 63.a8D+
Weiß steht besser

Also immerhin "belehrbar".

SF dev. mit 30 Threads und 8G leerem Hash im MultiPV=2 gestartet:

4b2r/2k2p1p/2p5/R2P2p1/PpBB4/5P2/4K1Pb/8 b - - 0 1

Analysis by Stockfish dev-20231202-08cdbca5:

1. +/- (1.16): 31...Tf8 32.Lc5 Tg8 33.Ta7+ Kb8 34.Ta6 g4 35.dxc6 gxf3+ 36.gxf3 Tg5 37.Le3 Tg2+ 38.Kd3 Kc7 39.Ld5 Kd6 40.Le4 f5 41.Lxf5 b3 42.a5 Lxc6 43.Le4 Tc2 44.Tb6 Kd7 45.Lxc6+ Txc6 46.Txb3 Tf6 47.Ke2 Lc7 48.Tb5 Kc8 49.Ld4 Ta6 50.Lc3 Tc6 51.Kd3 Te6 52.Tf5 Td6+ 53.Ke3 Tc6 54.Kd4 Kb7 55.Tf7 h6 56.Le1 Kc8 57.f4 h5 58.f5 h4 59.Th7 Ta6 60.Ke4 Ld8

2. +/- (1.39): 31...Tg8 32.Ta7+ Kd6 33.Ta8 cxd5 34.Ld3 Kc7 35.a5 Kb7 36.Td8 Kc7 37.Txd5 Lc6 38.Tc5 Td8 39.Tc4 Kd6 40.Lc5+ Ke6 41.Txb4 Te8 42.Lb6 h5 43.a6 Ld6 44.Tb1 h4 45.Kf1 h3 46.gxh3 Lxf3 47.a7 f6 48.Kf2 Ld5 49.Td1 Le5 50.Lf5+ Kxf5 51.Txd5 Ke6 52.Td1 Th8
Weiß steht besser
 

Genug Diskrimination für eine single best move- Teststellung haben die beiden Kandidaten allerdings nicht. Nach 31...Tf8 sieht SF Weiß immer noch deutlich im Vorteil,

4br2/2k2p1p/2p5/R2P2p1/PpBB4/5P2/4K1Pb/8 w - - 0 1

Analysis by Stockfish dev-20231202-08cdbca5:

32.Lc5 Tg8 33.Ta7+ Kb8 34.Ta6 g4 35.dxc6 gxf3+ 36.gxf3 Tg5 37.Le3 Tg2+ 38.Kd3 Kc7 39.Ld5 Kd6 40.Le4 f5 41.Lxf5 b3 42.a5 Lxc6 43.Le4 Tc2 44.Tb6 Kd7 45.Lxc6+ Txc6 46.Txb3 Tf6 47.Ke2 Lc7 48.Tb5 Te6 49.Kf2 Tc6 50.Lb6 Ld6 51.Th5 h6 52.Ke3 Tc3+ 53.Ke4 Tb3 54.Txh6 Tb4+ 55.Kd5 Tb5+ 56.Kc4 Tb4+ 57.Kc3 Tb1 58.Kc2 Tf1 59.Th3 Ta1 60.Kd3 Lb4 61.Th5 Ta4 62.Tg5 Kc6 63.Te5 Kd7 64.Kc2 Ld6 65.Te3 Kc6 66.Tc3+ Kd5 67.Td3+ Kc6 68.Kd1 Ta2 69.Td2 Ta3 70.Ke2 Le5 71.Kf2 Lf4 72.Te2 Kd5 73.Kg2 Ta4 74.Kh3 Le5 75.Te3
+/- (1.34)   Tiefe: 41/87   00:01:13  1382MN, tb=2219993

wenn auch nicht so deutlich wie nach 31...Tg8(!?)

4b1r1/2k2p1p/2p5/R2P2p1/PpBB4/5P2/4K1Pb/8 w - - 0 1

Analysis by Stockfish dev-20231202-08cdbca5:

32.Ta7+ Kb8 33.a5 Ld6 34.Ta6 cxd5 35.Tb6+ Kc8 36.Lxd5 Lc7 37.Lb7+ Kb8 38.Txb4 Lxa5 39.Le5+ Lc7 40.Le4+ Kc8 41.Lxh7 Lxe5 42.Lxg8 f6 43.Kd3 Lc6 44.Kc4 Kc7 45.Tb1 Kd6 46.Tb6 Kc7 47.Ta6 Lb7 48.Ta7 Kb6 49.Ta2 Lc8 50.Kd5 g4 51.Ke4 gxf3 52.gxf3 Ld7 53.Tc2 Le8 54.Tc8 Lg6+ 55.Ke3 Lf5 56.Tc1 Lb2 57.Tc4 Le5 58.Ld5 Ld7 59.f4 Ld6 60.Ke4 Kb5 61.Tc3 Kb6 62.Tc2 Le7 63.Lg8 Lb4 64.Kd5 Le1 65.Kd4 Lg3 66.Ke4 Le1 67.Lb3 Lb5 68.Lf7 La4
+/- (1.43)   Tiefe: 40/84   00:00:19  398MN, tb=370024

Man müsste wieder von hier 2 Partien ausspielen lassen, fürchte aber, das könnte jetzt ein 1:1- Paar werden, je nach Hardware- TC, weil Weiß hier ja schon deutlichen Vorteil hat, auch nach 31...Tf8.
Parent - - By Reinhold Stibi Date 2023-12-14 12:20
Mit 31...Tf8 !  kann die Partie remis gehalten werden.

Analyse von Stockfish 02.12.23  mit Ryzen 9 5900hx  

31. .. Tf8!  + 0.93   40/555  2:22 Min.

Ein Vorteil von + 0.93 reicht nicht zum Sieg:

31...Tg8 ?  ist schon deutlich schlechter !   um  1.50 Vorteil für Weiß.

32. Ta7  + 1.49   46/32   3:29 Min.  Analyse mit Stockfish wie oben.
Parent - - By Peter Martan Date 2023-12-14 12:24
Reinhold Stibi schrieb:

Mit 31...Tf8 !  kann die Partie remis gehalten werden.

Je nachdem, welche Gegner das auf welcher Hardware ausspielen

Wieder die 30 Threads für SF und die 3070ti für Lc0, selbe TC wie in den Vorpartien:

[Event "AMD, Blitz 10.0min+2.0sek"]
[Site "Dort"]
[Date "2023.12.14"]
[Round "1"]
[White "Stockfish"]
[Black "Lc0 v0.31.0-dag+git.a4877961"]
[Result "1-0"]
[ECO "D10"]
[Annotator "1.41;1.18"]
[PlyCount "157"]
[TimeControl "600+2"]

{AMD Ryzen 9 5950X 16-Core Processor       3400 MHz W=50.1 plies; 20.016kN/s; 346.580.659 TBAs B=30.5 plies; 64kN/s; 492.733 TBAs} 1. d4 d5 2. c4 c6 3. Nc3 Nf6 4. e3 Bg4 5. f3 Be6 6. Nge2 dxc4 7. Nf4 Bc8 8. Bxc4 b5 9. Be2 Nbd7 10. e4 e5 11. dxe5 Nxe5 12. Qxd8+ Kxd8 13. Be3 Kc7 14. a4 b4 15. Nb1 Nfd7 16. Nd2 g5 17. Nd3 Nxd3+ 18. Bxd3 Be7 19. Rc1 Ne5 20. Be2 Be6 21. Nc4 Nxc4 22. Bxc4 a5 23. Ke2 Rad8 24. Bb5 Bd7 25. Rhd1 Be8 26. Rd5 Rxd5 27. exd5 Bf6 28. Rc5 Bxb2 29. Bc4 Be5 30. Rxa5 Bxh2 31. Bd4 Rf8 {Beide letzter Buchzug} 32. Bc5 {1.41/45 164} Rg8 {1.18/24 90} 33. Ra7+ {1.42/44 8} Kb8 {1.16/35 16} 34. Ra6 {1.03/44 45} g4 {1.11/36 13} 35. dxc6 {1.12/44 1} Rg5 {1.00/36 32 (gxf3+)} 36. Be3 {1.78/37 18} gxf3+ {0.96/36 10} 37. Kxf3 {1.79/35 3 (gxf3)} Rg6 {0.64/28 84 (Tg3+)} 38. Bd5 {3.26/36 15} Bc7 {0.62/30 3} 39. Ba7+ {3.29/42 24 (Ke2)} Kc8 {0.74/29 44} 40. Bc5 {3.64/43 55 (Ld4)} Kb8 {0.92/38 43} 41. a5 {3.70/41 0 (Ke3)} b3 {1.49/34 38} 42. Ba7+ {3.77/44 0} Kc8 {1.57/39 13} 43. Bd4 {3.77/45 0} Kb8 {1.82/40 12} 44. Ke3 {3.77/42 3} Rg5 {1.87/38 16 (Td6)} 45. Ba7+ {4.88/36 15} Kc8 {1.95/43 9 (Ka8)} 46. Bb6 {5.76/38 10} Kb8 {2.05/42 5} 47. Ra7 {6.40/36 17} Rxd5 {2.13/42 0} 48. Rb7+ {6.59/37 11} Ka8 {2.17/42 1} 49. Rxc7 {8.14/36 46} Bxc6 {2.24/45 0} 50. Rxc6 {8.74/31 20} b2 {2.25/42 1} 51. Rc8+ {9.03/32 12} Kb7 {2.36/1 0} 52. Rc7+ {9.05/46 10} Ka6 {2.33/39 0} 53. Ra7+ {9.06/34 9} Kb5 {2.37/1 0} 54. Bd4 {9.07/31 12} b1=Q {2.38/36 47 (b1T)} 55. Rb7+ {13.47/35 10} Kc4 {2.38/34 0} 56. Rxb1 {53.80/26 9} Rxd4 {2.39/33 0} 57. Rc1+ {95.71/35 12} Kd5 {2.47/33 0} 58. Ra1 {95.92/33 13} Kc5 {2.46/30 12 (Te4+)} 59. a6 {197.69/38 8} Rd8 {2.49/30 0} 60. g4 {199.57/43 59 (Kf4)} Kb6 {2.40/26 32} 61. Kf4 {199.59/58 0} Rd7 {2.55/27 158} 62. Kg5 {199.62/63 0 (Kf5)} Ka7 {1.10/32 8} 63. Rh1 {199.64/61 0} Rd5+ {1.15/34 2} 64. Kf4 {199.66/61 25} Rd4+ {1.43/35 0} 65. Kf5 {199.68/60 7} Rd5+ {2.02/34 0} 66. Ke4 {199.70/61 10} Rd7 {2.14/20 0} 67. Rh6 {199.72/62 36} Rc7 {2.77/19 0} 68. Kd5 {199.74/56 5 (Tf6)} Kb8 {5.18/17 32 (Td7+)} 69. Rxh7 {199.78/57 5} Rd7+ {5.66/15 0} 70. Kc5 {199.80/50 4} Re7 {5.93/15 0} 71. Kd4 {199.83/51 13} Rd7+ {5.74/11 0} 72. Ke3 {199.85/56 2} Re7+ {9.06/10 11 (Ka8)} 73. Kf4 {199.91/49 4} Kc8 {24.18/2 1 (Ka8)} 74. Rh8+ {#11/46 4} Kc7 {46.17/6 5 (Kd7)} 75. a7 {#10/51 4} Re1 {28.75/3 1} 76. a8=Q {#9/50 3} Rf1+ {39.78/2 3} 77. Kg5 {#8/58 0 (Kg3)} f6+ {#125/2 2} 78. Kg6 {#7/77 1} Kb6 {#124/1 0 (Tf4)} 79. Rc8 {#4/245 2 (Da6+)} 1-0

Eine weitere Partie von 31...Tf8 aus, Lc0 mit Weiß gegen SF mit Schwarz läuft.
Parent - - By Peter Martan Date 2023-12-14 12:49
Zitat:

Eine weitere Partie von 31...Tf8 aus, Lc0 mit Weiß gegen SF mit Schwarz läuft.

Die ist jetzt remis ausgegangen


[Event "AMD, Blitz 10.0min+2.0sek"]
[Site "Dort"]
[Date "2023.12.14"]
[Round "2"]
[White "Lc0 v0.31.0-dag+git.a4877961"]
[Black "Stockfish"]
[Result "1/2-1/2"]
[ECO "D10"]
[Annotator "1.19;1.34"]
[PlyCount "227"]
[TimeControl "600+2"]

1. d4 d5 2. c4 c6 3. Nc3 Nf6 4. e3 Bg4 5. f3 Be6 6. Nge2 dxc4 7. Nf4 Bc8 8. Bxc4 b5 9. Be2 Nbd7 10. e4 e5 11. dxe5 Nxe5 12. Qxd8+ Kxd8 13. Be3 Kc7 14. a4 b4 15. Nb1 Nfd7 16. Nd2 g5 17. Nd3 Nxd3+ 18. Bxd3 Be7 19. Rc1 Ne5 20. Be2 Be6 21. Nc4 Nxc4 22. Bxc4 a5 23. Ke2 Rad8 24. Bb5 Bd7 25. Rhd1 Be8 26. Rd5 Rxd5 27. exd5 Bf6 28. Rc5 Bxb2 29. Bc4 Be5 30. Rxa5 Bxh2 31. Bd4 Rf8 {Beide letzter Buchzug} 32. Bc5 {1.19/24 93} Rg8 {1.34/37 46} 33. Ra7+ {1.17/37 1} Kb8 {1.34/39 23} 34. Ra6 {1.18/36 0} g4 {1.40/41 17} 35. dxc6 {1.15/34 15} gxf3+ {0.93/44 76 (Tg5)} 36. gxf3 {0.99/38 65} Rg5 {1.02/49 0} 37. Be3 {1.03/36 25} Rg2+ {1.22/47 27} 38. Kd3 {1.05/36 5} Kc7 {1.20/47 12} 39. Bd5 {1.07/37 12} Kd6 {1.12/49 3} 40. Be4 {1.05/38 19} f5 {1.12/51 0} 41. Bxf5 {1.04/37 0} b3 {1.08/50 16} 42. a5 {1.04/35 0} Bxc6 {1.07/55 18} 43. Be4 {1.03/35 0} Rc2 {1.07/58 16} 44. Rb6 {1.02/33 0} Kd7 {1.02/55 21} 45. Bxc6+ {1.02/34 0} Rxc6 {1.02/52 14} 46. Rxb3 {1.01/33 0} Rf6 {1.03/58 14} 47. Ke2 {1.01/23 0} Bc7 {1.02/54 14} 48. Rb5 {1.00/26 0} Re6 {1.02/58 21} 49. Kf2 {0.99/29 31} Rc6 {1.02/59 0} 50. Bb6 {0.95/31 127} Bd6 {0.95/67 0} 51. Rh5 {0.95/34 0} h6 {0.95/67 14} 52. Rh4 {0.95/33 8 (Ke3)} Rc2+ {0.75/50 13} 53. Ke3 {0.94/30 8} Rc3+ {0.80/59 29 (Ta2)} 54. Ke2 {0.95/28 88} Ra3 {0.84/64 0} 55. Rxh6 {0.94/28 8} Bb4 {0.94/59 41} 56. Rh5 {0.90/30 21} Ra4 {0.85/63 31 (Ke6)} 57. Kd3 {0.95/29 66} Kc6 {0.86/65 0 (Ke6)} 58. Re5 {0.98/29 49 (Ke2)} Kd7 {0.86/58 13 (Ta1)} 59. Ke3 {1.06/29 17 (Tb5)} Kd6 {0.87/59 9 (Kc6)} 60. f4 {1.04/26 10} Ba3 {0.87/58 3} 61. Kf3 {1.03/27 2} Bc1 {0.89/66 8} 62. Bc5+ {1.05/26 0} Kd7 {0.88/60 11} 63. f5 {1.06/26 0} Rxa5 {0.90/59 10} 64. f6 {1.06/26 0} Ra4 {0.89/56 9} 65. Re7+ {1.06/25 0} Kc6 {0.89/56 9} 66. Be3 {1.06/27 0} Ba3 {0.89/62 10 (Lb2)} 67. Re4 {1.11/23 13} Ra5 {0.90/60 0 (Ta6)} 68. Kg4 {1.11/22 12} Kd7 {0.90/56 2} 69. Bg5 {1.10/22 7 (Lf4)} Rb5 {0.98/59 11} 70. f7 {1.10/23 2} Bf8 {1.01/56 8} 71. Kh5 {1.10/22 7} Rb1 {1.00/52 2} 72. Kg6 {1.08/22 4} Rf1 {0.93/57 20} 73. Rf4 {1.05/23 0} Rd1 {0.92/57 42} 74. Bf6 {1.03/24 0 (Tf3)} Rc1 {0.98/57 57 (Th1)} 75. Kh7 {1.05/23 16 (Td4+)} Rg1 {1.00/51 7} 76. Re4 {1.03/24 0} Rg2 {1.05/46 10} 77. Re8 {0.98/26 10} Bd6 {1.03/47 0} 78. Bd4 {0.98/26 0 (Lg7)} Rh2+ {1.01/47 14} 79. Kg8 {0.97/27 1} Rg2+ {1.00/47 8} 80. Bg7 {0.96/27 0} Rg1 {1.07/48 15} 81. Ra8 {0.95/28 9} Bc5 {1.03/46 0} 82. Ra7+ {0.93/27 5} Ke6 {1.05/45 0} 83. Ra5 {0.89/27 2 (Ta1)} Bb4 {1.01/52 4} 84. Ra6+ {0.85/25 1 (Ta1)} Kd7 {0.94/42 3} 85. Ra2 {0.82/24 4} Bc5 {0.87/41 0} 86. Ra4 {0.79/24 3 (Ta5)} Ke6 {0.76/41 11} 87. Ra6+ {0.76/23 2 (Ta2)} Kd7 {0.73/30 2} 88. Kh7 {0.74/22 0 (Ta4)} Rh1+ {0.65/34 4 (Tf1)} 89. Kg8 {0.71/22 3} Rg1 {0.61/34 1} 90. Ra5 {0.72/21 0} Bb4 {0.54/35 4} 91. Re5 {0.75/20 0 (Td5+)} Ba3 {0.49/39 2 (Tg2)} 92. Kh7 {0.75/18 2 (Ta5)} Rf1 {0.42/47 2} 93. Kg6 {0.72/17 2 (Kg8)} Bb4 {0.59/36 10 (Ld6)} 94. Bh6 {0.78/15 4 (Tf5)} Be7 {0.53/29 1 (Ld6)} 95. Re4 {0.75/15 3 (Lg7)} Ba3 {0.53/27 1} 96. Rf4 {0.72/15 4 (Kg7)} Rg1+ {0.51/28 1} 97. Kf5 {0.68/15 2} Bd6 {0.51/28 3} 98. Rf3 {0.65/14 2 (Td4)} Rh1 {0.67/26 5} 99. Bg5 {0.62/14 2 (Kg6)} Rd1 {0.50/27 1} 100. Kg6 {0.63/14 1} Bf8 {0.54/27 0} 101. Rf4 {0.64/13 1} Rg1 {0.54/26 2} 102. Kf5 {0.64/14 1} Rd1 {0.59/22 0} 103. Rf2 {0.60/13 5} Bb4 {0.64/25 0} 104. Bh6 {0.56/10 0 (Tf4)} Bd6 {0.60/23 2 (Th1)} 105. Kf6 {0.58/11 3 (Lg5)} Be7+ {0.44/25 5} 106. Kg6 {0.54/11 0 (Kf5)} Rg1+ {0.57/16 1} 107. Kf5 {0.52/10 1} Bb4 {0.29/21 3} 108. Rf4 {0.48/10 5} Bd6 {0.05/22 0} 109. Rf3 {0.45/9 1 (Tf2)} Re1 {0.00/29 2 (Td1)} 110. Rf2 {0.46/9 4} Rg1 {0.00/50 0 (Td1)} 111. Bg5 {0.43/8 2} Bf8 {0.00/45 0 (Th1)} 112. Rd2+ {0.45/9 1} Kc6 {0.00/44 0} 113. Bh4 {0.44/9 2} Rg7 {0.00/44 0 (Th1)} 114. Ke6 {0.39/9 2 Remis angenommen} 1/2-1/2
Parent - By Reinhold Stibi Date 2023-12-14 13:05
Die Ergebnisse zeigen doch, dass sich Stockfish optimal verteidigt hat
und Lc0 nicht.

Stockfish ist halt doch besser wie Lc0; ich schätze 50 Elo  und das
ist eine Menge.

Für 50 Elo plus brauchen Stockfish und Lc0 ca. 3 Jahre; das heißt
Stockfish hat ca. 3 Jahre Entwicklungsvorsprung.
Parent - - By Jörg Oster Date 2023-12-14 14:41 Upvotes 2
Reinhold Stibi schrieb:

...
Die altbekannte Schwäche von Lc0 durch die wesentlich geringere Rechentiefe.


Und auch wenn du das immer wieder sagst, wird es dadurch nicht richtiger.
Lc0 hat keine Suchtiefe wie AB-Engines, die Suche funktioniert anders.

Ich hoffe, ich komme dieses WE dazu, weiter zu den einzelnen MCTS-Schritten zu schreiben.
Dann wird dies hoffentlich für alle etwas klarer werden.
Parent - - By Reinhold Stibi Date 2023-12-14 14:54 Edited 2023-12-14 15:32
Klar hat Lc0 keine Suchtiefe wie die AB-Engines das ist doch wohlbekannt.

Richtig ist aber doch dass die Suche von Lc0 oder anders ausgedrückt die Vorhersicht
der weiteren Züge einer Variante bei Lc0 wesentlich geringer ist als bei Stockfish.

Schau doch die Partien von Lc0 an; Lc0 erfasst oft etliche Züge später eine Verlust -
oder Gewinnstellung.

Der Vorteil von Lc0 ist aber dass viele Stellungen durch die großen Netze abgespeichert
sind und Lc0 dann schneller als Stockfish die richtige Bewertung ohne große und tiefe Suche
findet.

Was stört dich denn an dem Begriff Rechentiefe.  Stockfish und Lc0 sind Computerprogramme
und Computer rechnen und Stockfish kann eben mehr in die Tiefe rechnen, also etliche Züge
mehr in einer Variante.
Habe nie behauptet dass die Suche von Lc0 und Stockfish  gleiche wäre wie bei den AB-Engines.
Parent - - By Max Siegfried Date 2023-12-14 16:39
Beim TCEC hätte man eben doch das große BT4 Netz nehmen sollen.
Stockfish vs LC0
+2 =2 -0

Hinzu kommt das LC0 gegen Caissa verloren hat.
Parent - By Max Siegfried Date 2023-12-14 20:48
Inzwischen +3 =2 -0
Parent - By Jörg Oster Date 2023-12-14 17:02 Upvotes 2
Ich hätte auch präziser sein sollen.

Bei AB wird ja mit Tiefe 1 gestartet, und dann jeweils um 1 erhöht.
Das wird mit Depth im GUI angezeigt.
Bei MCTS gibt es das nicht.
Was hier bei Depth angezeigt wird, ist völlig bedeutungslos.
Das hatte ich gemeint.
Up Topic Hauptforen / CSS-Forum / Stockfish und LC0 Endspielstärke

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill