Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Schach von einem anderen Stern: ALPHA-ZERO
- - By Walter Eigenmann Date 2023-10-27 00:22 Upvotes 1
.

Bekanntlich revolutionierte Google im Dez. '17 und Jan.'18 mit seinem DeepMind-Programm AlphaZero (AZ) das Computerschach. In einem langen Match wurde damals
die führende Engine Stockfish (SF) geradezu zertrümmert (zumindest gemäss den final publizierten Partien/Resultaten): https://de.wikipedia.org/wiki/AlphaZero

Ungeachtet der Tatsachen, dass AlphaZero nicht gegen die damals aktuellste Stockfish-Version gewann, keine Eröffnungsbücher verwendet wurden und SF zudem mit einer BZ
von exakt 60s/Zug nicht optimale Spielbedingungen vorfand, zeigte sich die Schachwelt elektrisiert von dem Spielstil, mit dem das KI-Programm den Weltmeister an die Wand spielte.

Um nur eine der zahllosen Lobeshymnen zu zitieren, hier jene des dän. GM PH Nielsen, der gegenüber der BBC sagte:
"I always wondered how it would be if a superior species landed on earth and showed us how they played chess. Now I know".
("Ich habe mich immer gefragt, wie es sei, wenn eine überlegene Spezies auf der Erde landete und uns ihre Art Schach zu spielen zeigte. Nun weiß ich es.")
https://www.bbc.com/news/technology-42251535

Nur ein Jahr später arbeiteten dann der engl. GM M.Sadler und die Mathematikerin N.Regan hunderte von AZ-Partien auf in ihrem Buch "Game Changer".
(Leider sind zahlreiche Analysen darin bereits wieder - im Lichte der heutigen AZ-Abkömmlinge LeelaChess & Stockfish16 - reine Makulatur und müssten
in einer Zweitauflage korrigiert werden...) https://www.chess-international.com/?p=5911

Ich habe mir (unabhängig von Sadlers "GameChanger") mal ein halbes Dutzend von AZ-Gewinnpartien angeschaut und daraus ein paar Stellungsaufgaben extrahiert,
deren Lösungen das extreme "Stellungsgefühl" von AlphaZero dokumentieren. Die folgenden Testpositionen stellen auch für die heutigen Top-Engines eine Herausforderung dar.
Ein wirklicher Jammer, dass Google dieses DeepMind-Projekt wieder eingestampft hat: https://tinyurl.com/2p884h5z

Natürlich sind diese sechs Best-Moves keine "Gewinnzüge" oder "Game Changer" oder auch nur "Brillanten" - in modernen NN-Zeiten gewinnen die Engines nicht mehr mit Hauruck.
Sondern sie häufen nach und nach kleinste Vorteile an, die dann in einer starken Initiative oder positioneller Überlegenheit kulminieren, welche ihrerseits dann die Voraussetzung ist
für spätere Partiegewinne.

Es würde mich interessieren, welche Engine bei welcher Stellung wie lange für den Lösungszug braucht (jeweils gehalten für mind. 5 Minuten, natürlich mit Default-Einstellung und ohne For-/Backward):

Nr. 1

12. 0-0 !
____________________________________________________

Nr. 2

11. c3 !
____________________________________________________

Nr. 3

15. Sf3 !
____________________________________________________

Nr. 4

12. Dd4
____________________________________________________

Nr. 5

23. ... Tb4 !
____________________________________________________

Nr. 6

15. ... Le6 !
____________________________________________________

Analysen & Download hier:
https://share.chessbase.com/SharedGames/game/?p=fEpGph6u66dtK1K2DxOaI1iiNtl6oznJM1SsBs2aVkm3jLlJwZ4LVZKNffCcKtCD

Gruss: Walter

.
Parent - - By Peter Martan Date 2023-10-27 01:03 Edited 2023-10-27 01:40
Hallo Walter!
Walter Eigenmann schrieb:

Es würde mich interessieren, welche Engine bei welcher Stellung wie lange für den Lösungszug braucht (jeweils gehalten für mind. 5 Minuten, natürlich mit Default-Einstellung und ohne For-/Backward)

Ich fang' mal schnell noch vor dem Schlafengehen an. 30 Threads der 16x3.5GHz CPU, 32G Hash.

Erste der 6:

1rbqk2r/3nbppp/p1n1p3/1p1pP3/2pP1P2/P1N1BN2/1PPQB1PP/R3K2R w KQk - 0 1

Analysis by Stockfish dev-20231008-7a4de961:

12.f5 exf5 13.Sxd5
  Weiß steht etwas besser: +/= (0.63)  Tiefe: 1/1   00:00:04  1307Knoten
12.0-0
  Weiß steht etwas besser: +/= (0.63)  Tiefe: 2/2   00:00:04  4276Knoten
12.0-0
  Weiß steht besser: +/- (0.89)  Tiefe: 3/3   00:00:04  6529Knoten
12.h4 b4
  Weiß steht besser: +/- (0.86)  Tiefe: 4/4   00:00:04  11kN
12.f5 Sf8
  Weiß steht besser: +/- (1.04)  Tiefe: 5/5   00:00:04  14kN
12.0-0 Sb6 13.Kh1 0-0
  Weiß steht besser: +/- (0.83)  Tiefe: 6/6   00:00:04  50kN
...
12.0-0 Sb6 13.Ld1 g6 14.h3 Tb7 15.Le2 Ld7 16.Sd1 a5 17.Lf2 0-0 18.Se3 f5 19.exf6 Lxf6 20.Sg4 Lg7 21.c3 Sc8 22.Lh4 Dc7 23.Ld1
  Weiß steht besser: +/- (1.01 ++)  Tiefe: 29/33   00:00:15  177MN
12.h4 a5 13.h5 f5 14.Lf2 b4 15.axb4 axb4 16.Sd1 b3 17.c3 Sb6 18.h6 gxh6 19.Lh4 Kd7 20.Se3 Tg8 21.Lxe7 Dxe7 22.Txh6 Dg7 23.Th4 Kc7 24.g4 fxg4 25.Sxg4 h6 26.De3 Ld7 27.Sf6 Dg3+ 28.Kd2 Ta8
  Weiß steht besser: +/- (1.01)  Tiefe: 29/40   00:00:19  232MN
12.h4 a5 13.h5 f5 14.Lf2 b4 15.axb4 axb4 16.Sd1 b3 17.c3 Sb6 18.h6 gxh6 19.Lh4 Kd7 20.Se3 Tg8 21.Lxe7 Dxe7 22.Txh6 Dg7 23.Th4 Kc7 24.g4 fxg4 25.Sxg4 h6 26.De3 Ld7 27.Sf6 Dg3+ 28.Kd2 Ta8
  Weiß steht besser: +/- (1.04 ++)  Tiefe: 30/40   00:00:20  253MN
...
12.h4 a5 13.h5 b4 14.Sd1 0-0 15.h6 g6 16.axb4 axb4 17.0-0 f5 18.Sg5 Sb6 19.Sf2 Te8 20.Sfh3 Tb7 21.De1 Lf8 22.Dh4 b3 23.cxb3 cxb3 24.La6 Tb8 25.Lb5 Ld7 26.Df2 De7 27.Lxc6
  Weiß steht besser: +/- (0.90 ++)  Tiefe: 35/52   00:00:50  686MN
12.0-0 Tb7 13.Kh1 f5 14.Tg1 Sf8 15.Se1 h5 16.Sf3 Ld7 17.Tgb1 Dc7 18.b3 h4 19.Sg1 Sa5 20.b4 Sc6 21.Lf3 Ta7 22.Sh3 Ta8 23.Df2 Dd8
  Weiß steht besser: +/- (0.93)  Tiefe: 35/52   00:00:58  797MN
...
12.0-0 Tb7 13.h4 f5 14.Sg5 Sb6 15.h5 Sa4 16.Sd1 c3 17.bxc3 g6 18.g4 h6 19.Sh3 fxg4 20.Lxg4 gxh5 21.Lf3 Lh4 22.f5 Tg7+ 23.Kh1 exf5 24.Lf4 Tg4 25.Se3 Se7 26.c4 Lg5 27.cxd5 Th4 28.Lg2 Sg6 29.Lg3 Tg4 30.Sxg5 Dxg5 31.Lh2 0-0 32.Tae1 Sb6 33.Lf3 f4 34.Sg2 Lb7 35.d6 Lxf3 36.Txf3 Df5 37.Tg1 De4 38.Dd3 Dd5
  Weiß steht besser: +/- (0.94 ++)  Tiefe: 41/60   00:05:18  4341MN

Nachdem das flott ging, weil die 5 Minuten schon nach einer, bei der zuletzt noch kurz h4 oben war, begonnen haben, mach' ich mal weiter. Eigentlich hätte ich die 6. Minute vor dem Kopieren noch abwarten müssen. Und wie lange die Engine für den Zug gebraucht hat, kommt natürlich auch drauf an, ab wann man rechnet, vom ersten Mal im Output oder vom letzten Mall, nachdem er sich nicht mehr geändert hat, was den ersten Zug angeht. Da müsste man dann aber halt eigentlich noch länger als 5 Minuten warten, ob er sich nicht doch noch irgendwann später ändert, weil dann müsste man wieder erst von da ab neu zu zählen anfangen, aber wir wollen's nicht zu kompliziert machen
Lieber gleich noch die zweite:

r1bqk2r/pp1nbppp/2n1p3/3pP3/1P1N1P2/5N2/P1PB2PP/R2QKB1R w KQkq - 0 1

Analysis by Stockfish dev-20231008-7a4de961:

11.c3
  Weiß hat minimalen Vorteil: = (0.30)  Tiefe: 1/1   00:00:03  710Knoten
...
11.c3 Sxd4 12.Sxd4 a5 13.a3 axb4 14.axb4 Txa1 15.Dxa1 Sb6
  Weiß steht etwas besser: +/= (0.48)  Tiefe: 9/11   00:00:03  71kN
11.c3 Sxd4 12.Sxd4 a5 13.a3 axb4 14.axb4 Txa1 15.Dxa1 Sb6
  Weiß steht etwas besser: +/= (0.48)  Tiefe: 10/13   00:00:03  194kN
11.Lb5 Sxd4 12.Sxd4 0-0 13.0-0 Sb6 14.a4 Ld7 15.f5 Lxb5
  Weiß steht etwas besser: +/= (0.50)  Tiefe: 11/16   00:00:03  373kN
...
11.Lb5 Sxd4 12.Sxd4 0-0 13.0-0 Sb6 14.a4 Ld7 15.Lxd7 Sxd7 16.a5
  Weiß steht etwas besser: +/= (0.53)  Tiefe: 14/23   00:00:03  1071kN
11.c3 a5 12.b5 Sxd4 13.cxd4 a4 14.Ld3 Sb6 15.De2 Sc4 16.0-0 Sxd2 17.Dxd2 0-0 18.Tab1 Ld7 19.Tfc1 Tc8 20.Txc8 Dxc8 21.g4
  Weiß steht etwas besser: +/= (0.60)  Tiefe: 15/23   00:00:04  1514kN
...
11.c3 Sxd4 12.Sxd4 a5 13.a4 Db6 14.b5 0-0 15.Ld3 Sc5 16.Lc2 Ld7 17.0-0 f6 18.Te1 Tac8 19.Tc1 Se4 20.Lxe4 dxe4 21.Txe4 fxe5 22.Txe5 Lf6 23.Te1 Lxd4+ 24.cxd4 Dxd4+ 25.Le3 Dxd1 26.Texd1 Txc1 27.Lxc1 Le8 28.Td4 Lg6 29.g4 h5 30.gxh5 Lxh5 31.Ld2 Lf3 32.Lxa5 Ld5 33.Ld2 Kf7 34.a5 Tc8 35.Kf2 Th8 36.Kg3 Tc8 37.Kg4 Tc4 38.Td3 Tc2 39.b6 Lc6 40.Td4 Ta2
  Weiß steht etwas besser: +/= (0.33 --)  Tiefe: 50/72   00:06:30  5969MN

Wenn's weiter so schnell geht, na mal sehen, Nr.3:

r2q1rk1/p1p1nppp/b1nb4/1p2p3/3PP3/1P2N1P1/PB1N1PBP/R2Q2KR w - - 0 1

Analysis by Stockfish dev-20231008-7a4de961:

15.d5
  Weiß steht besser: +/- (0.78)  Tiefe: 1/1   00:00:03  1959Knoten
15.Sf3 exd4 16.Sxd4
  Weiß steht besser: +/- (0.79)  Tiefe: 2/2   00:00:03  5468Knoten
15.d5
  Weiß steht besser: +/- (1.06)  Tiefe: 3/3   00:00:03  11kN
...
15.Sf3 exd4 16.Sxd4 Le5 17.Sxc6 Sxc6 18.Lxe5 Sxe5 19.h4
  Weiß steht etwas besser: +/= (0.64)  Tiefe: 10/13   00:00:04  255kN
...
15.Sf3 exd4 16.Sxd4 Le5 17.Sxc6 Sxc6 18.Lxe5 Sxe5 19.h3 c6 20.Kh2 Db6 21.a3 Tad8 22.Dc2 Lc8 23.Thd1 Le6 24.Dc3 f6 25.f4 Sf7 26.Sf5 Lxf5 27.exf5 c5 28.Txd8 Txd8 29.Tc1 Tc8 30.Ld5 Kf8 31.Tc2 Tc7 32.a4 Sd6 33.a5 Da6 34.Le6 Sb7 35.Ta2 c4 36.h4 h6 37.Ta1
  Weiß steht etwas besser: +/= (0.33 --)  Tiefe: 47/59   00:04:28  4058MN
15.d5
  Weiß steht etwas besser: +/= (0.39 ++)  Tiefe: 47/66   00:06:47  6088MN
15.d5 Sd4
  Weiß hat minimalen Vorteil: = (0.28 --)  Tiefe: 47/66   00:07:16  6499MN
15.Sf3 exd4 16.Sxd4 Le5 17.Sxc6 Sxc6 18.Lxe5 Sxe5 19.h3 c6 20.Kh2 Db6 21.a3 Tad8 22.Dc2 Lc8 23.Thd1 Le6 24.Dc3 f6 25.f4 Sf7 26.Tac1 Tfe8 27.Txd8 Txd8 28.Sf5 Lxf5 29.exf5 h5 30.Dxc6 De3 31.Tc3 De1 32.Df3 h4 33.gxh4 Sh6 34.Dg3 Dd2 35.Tc7 Td7 36.Tc8+ Td8 37.Txd8+ Dxd8 38.De3 Kh7 39.Lf1 Dd5 40.b4 Sxf5 41.Dd3 Da2+ 42.Lg2 g6
  Weiß hat minimalen Vorteil: = (0.30)  Tiefe: 47/66   00:10:01  8847MN
...
15.Sf3 exd4 16.Sxd4 Le5 17.Sxc6 Sxc6 18.Lxe5 Sxe5 19.h3 c6 20.Kh2 Db6 21.a3 Tad8 22.Dc2 Lc8 23.Thd1 Le6 24.Dc3 f6 25.f4 Sf7 26.Tac1 Tfe8 27.Txd8 Txd8 28.b4 Sd6 29.Dxc6 Dxe3 30.Td1 h5 31.Txd6 Tc8 32.Td3 Txc6 33.Txe3 Tc2 34.Kg1 Tc1+ 35.Kf2 Tc2+ 36.Te2 Tc3 37.Td2 Txa3 38.f5 Lc4 39.Lf3 Kf8 40.Td7 a5 41.bxa5 h4 42.gxh4 Txa5 43.Tc7 Ta3 44.h5 Lf7 45.Tb7
  Weiß hat minimalen Vorteil: = (0.25)  Tiefe: 50/70   00:12:09  10642MN

Das war jetzt Pech, dass ausgerechnet nach 4einhalb Minuten noch kurz d5 oben war, aber es ist sich noch vor dem Schlafengehen ausgegangen, na dann vielleicht doch gleich noch eine
Nr.4:

rn3rk1/pp1nqppp/2p5/4P2b/PbN5/2N2PPB/1P2P2P/R1BQK2R w KQ - 0 1

Analysis by Stockfish dev-20231008-7a4de961:

12.f4
  Weiß steht besser: +/- (0.75)  Tiefe: 1/1   00:00:03  3438Knoten
12.f4
  Weiß steht besser: +/- (0.75)  Tiefe: 2/2   00:00:03  12kN
12.Lf4
  Weiß steht besser: +/- (1.03)  Tiefe: 3/3   00:00:03  14kN
12.Lf4 g5 13.Lxg5 Dxg5
  Weiß steht besser: +/- (1.03)  Tiefe: 4/4   00:00:03  16kN
12.f4 f6 13.e6 Sc5
  Weiß steht besser: +/- (0.83)  Tiefe: 5/5   00:00:03  26kN
...
12.f4 f6 13.e6 Td8 14.Dc2 Sc5 15.f5 Td4 16.Se3 Sba6 17.0-0 La5 18.Sa2 Txa4 19.b3 Sb4 20.Db2 Txa2 21.Txa2 Sxa2 22.Dxa2 Lb4 23.g4 Le8 24.Sc2 Lc3 25.b4 Sa6 26.Lg2 Lxb4 27.Sxb4
  Weiß steht besser: +/- (0.90)  Tiefe: 24/45   00:00:05  20820kN
12.f4 f6 13.e6 Td8 14.Dc2 Sc5 15.f5 Td4 16.Se3 Sba6 17.0-0 La5 18.Sa2 Se4 19.Tf4 Sb4 20.Sxb4 Dxb4 21.Lg2 De1+ 22.Tf1 Db4 23.g4 Le8 24.b3 Sd2 25.Td1 Dxb3 26.Dxb3 Sxb3 27.Txd4 Sxd4 28.Sc4 Lb6 29.Sxb6 axb6 30.Ta2 c5 31.Kf2 Txa4 32.Tb2 b5 33.Lxb7 c4
  Weiß steht besser: +/- (0.84)  Tiefe: 25/47   00:00:05  22697kN
12.Dd4 Lg6 13.Le3 Sc5 14.Df4 f6 15.0-0 fxe5 16.Dxe5 Dxe5 17.Sxe5 Te8 18.Sxg6 Txe3 19.Kf2 Te8 20.Sf4 Sba6 21.Tfd1 Te7 22.Sa2 La5
  Weiß steht besser: +/- (1.09)  Tiefe: 26/47   00:00:06  49824kN
...
12.Dd4 Td8
  Weiß steht besser: +/- (0.93 ++)  Tiefe: 30/49   00:00:15  196MN
12.f4 f6 13.e6 Sc5 14.f5 Td8 15.Dc2 Td4 16.Se3 Sba6 17.0-0 La5 18.Sa2 Se4 19.Tf4 Sb4 20.Sxb4 Dxb4 21.Lg2 De1+ 22.Tf1 Db4 23.b3 Sd2 24.Td1 Lxe2 25.Txd2 Txd2 26.Dxd2 Dxd2 27.Lxd2 Lxd2 28.Kf2
  Weiß steht besser: +/- (0.93)  Tiefe: 30/51   00:00:16  206MN
...
12.f4 f6 13.e6 Td8 14.Dc2 Sc5 15.f5 Td4 16.Se3 Sba6 17.0-0 La5 18.Sa2 Txa4 19.b3 Sb4 20.Db2 Txa2 21.Txa2 Sxa2 22.Dxa2 Lb4 23.Lg2 h6 24.g4 Le8 25.Sc2 Lc3 26.Le3 Sa6 27.Lf3 Sb4 28.Sxb4 Lxb4 29.Kg2 a5 30.Dc2 b5 31.Ta1 Dd6 32.Td1 De5 33.Ld4 Dc7 34.De4 Td8 35.Tc1 De7 36.Tb1 c5 37.Le3 Tc8 38.h4 c4 39.bxc4 bxc4 40.g5 c3 41.gxh6 Kh7 42.Tg1 gxh6 43.Kh3
  Weiß steht besser: +/- (0.92 ++)  Tiefe: 50/73   00:06:50  6091MN

Tja, da wären wir halt jetzt doch an einem Punkt, wo etwas Forward- Backward gut wäre, um herauszufinden, warum SF f4 für besser hält. Nur so am Rande dazu, das Hiarcs online Abo- Tournament book hat für 12.f4 ebenso wie für 12.Dd4 66% Weiß- Performance, ersteres aber mit 15 Partiebeispielen, den Wunschzug nur mit 3, Ausspielwahrscheinlichkeit haben beide 50%.
So, genug für ein Posting, vielleicht wirft ja jemand seinen Stockfish für die letzten 2 an, bevor ich wieder munter bin, wünscht gute Nacht,
Parent - - By Walter Eigenmann Date 2023-10-27 09:29
Ja, die anfänglichen Output-Fluktuationen bei SF sind teils auffallend, erst ab ca. Tiefe 50 beginnen sich die Lösungszüge zu stabilisieren.
Wie gesagt, es sind "nur" Best-Moves, keine Winner.

Wobei man sich fragen kann, ob AlphaZero damals nicht ebenfalls diese seine BM-Züge mit noch mehr als 60s/Zug Bedenkzeit
jeweils noch revidiert hätte - was ich aber nicht glaube. Die Hardware war schon beeindruckend, die vier TPU's pushten AZ gewaltig.

Zwischenfrage: Gibt es einen Grund, warum du exorbitante 32Gb Hash benützt?

.
Parent - - By Peter Martan Date 2023-10-27 09:35
Walter Eigenmann schrieb:

Zwischenfrage: Gibt es einen Grund, warum du exorbitante 32Gb Hash benützt?

Für 5 Minuten find' ich das gerade passend, ich nehme immer noch die alte Formel Sekunden x GHz der CPU x 2=Mb Hash, das wären bei 300 Sekunden und den 30 Threads der 3.5GHz CPU gerundete 30G Hash.
Parent - - By Walter Eigenmann Date 2023-10-27 09:55
Wäre mal ein kleines Vergleichsexperiment wert von Ergebnissen bei Stellungstests mit vier, fünf unterschiedlichen Hash-Einstellungen.
Könnte mir vorstellen, dass nur wenige Abweichungen herauskämen. Aber ich meine irgendwo gelesen zu haben, dass grosser Hash
die Berechnungen sogar verlangsame?!

.
Parent - By Peter Martan Date 2023-10-27 10:23
Ja, bei kurzen Rechenzeiten, daher ja auch die Formeln zur Anpassung an selbige (TCs)
Parent - - By Peter Martan Date 2023-10-27 12:04
Walter Eigenmann schrieb:

Wie gesagt, es sind "nur" Best-Moves, keine Winner.

"Winner" ist überhaupt schlecht zu definieren, einen best move muss es in jeder Stellung geben, bei vielen Stellungen lässt sich der halt aber auch nicht wirklich als solcher beweisen.
Hier hab' ich mir z.B. den Spaß gegönnt, SF mit dem 12.f4 statt 12.Dd4 der 4. Stellung gegen Lc0 ausspielen zu lassen:

[Event "AMD, Schnellschach 45.0min+15.0sek"]
[Site "Dort"]
[Date "2023.10.27"]
[Round "2"]
[White "Stockfish"]
[Black "Lc0 v0.31.0-dag+git.e429eeb"]
[Result "1-0"]
[Annotator "1.00;1.07"]
[SetUp "1"]
[FEN "rn3rk1/pp1nqppp/2p5/4P2b/PbN5/2N2PPB/1P2P2P/R1BQK2R w KQ - 0 12"]
[PlyCount "141"]
[TimeControl "2700+15"]

12. f4 {Beide letzter Buchzug} f6 {1.07/25 91} 13. e6 {1.00/46 107} Nc5 {1.14/32 1} 14. f5 {1.02/43 64} Rd8 {1.13/34 1} 15. Qc2 {0.96/43 62} Rd4 {1.06/33 1} 16. Ne3 {0.99/48 97} Nba6 {1.00/30 29 (La5)} 17. O-O {1.15/42 49} Ba5 {0.97/31 35} 18. Na2 {1.16/47 300} Rxa4 {1.00/33 0} 19. b3 {1.21/43 49} Nb4 {1.00/33 0} 20. Qb2 {1.06/50 438} Rxa2 {1.00/31 0} 21. Rxa2 {0.98/48 72} Nxa2 {1.00/43 0} 22. Qxa2 {1.03/45 55} Bb4 {1.00/37 0} 23. Bg2 {1.23/38 45 (Sc2)} Rd8 {0.87/24 217 (h6)} 24. g4 {1.26/38 53} Be8 {0.88/22 2} 25. Bf3 {1.09/40 134} Na6 {0.86/23 139} 26. Kg2 {1.05/44 131} Bc5 {0.89/26 115} 27. Nc2 {1.13/43 0} h6 {0.90/16 0} 28. h4 {1.31/42 328} Nc7 {0.80/24 130} 29. Rh1 {1.02/43 141 (Da5)} Nb5 {1.27/25 313} 30. b4 {1.54/41 0} Bd4 {1.19/39 41} 31. g5 {1.65/39 0} hxg5 {1.14/43 66 (fxg5)} 32. hxg5 {1.94/37 40} fxg5 {1.14/47 4} 33. Ne3 {2.05/39 59} Nd6 {1.13/52 22} 34. Qb3 {2.10/37 20} Bf6 {1.16/44 53} 35. Qb1 {2.17/36 0 (Dc2)} Nb5 {0.85/34 185 (a6)} 36. Ng4 {2.50/42 102} Rd4 {0.81/40 2} 37. Nxf6+ {2.54/41 39} Qxf6 {0.79/42 23} 38. Bb2 {2.61/42 10} g4 {0.78/41 37} 39. Be4 {2.71/40 7} Qe5 {0.76/42 33} 40. Bxd4 {2.85/40 4} Nxd4 {0.76/38 9} 41. Qd3 {2.87/49 30} c5 {0.76/40 5} 42. e7 {2.88/51 37} Bb5 {0.90/45 520} 43. Qe3 {3.58/50 0} Kf7 {0.90/49 0} 44. bxc5 {3.73/41 72} Nxe2 {0.91/43 0 (Sxf5)} 45. Re1 {4.41/35 69 (e8D+)} Kxe7 {0.95/49 81} 46. Rxe2 {4.41/33 0} Bxe2 {0.96/47 0} 47. Qxe2 {4.74/32 42} Qxc5 {0.97/41 0} 48. Qxg4 {4.84/34 38} Qd4 {0.98/44 0 (Dc3)} 49. Qg5+ {4.98/30 38} Kf8 {0.98/45 0} 50. Qf4 {5.34/46 45 (Kf3)} b6 {0.75/33 144} 51. Kf3 {9.22/31 0} a5 {0.73/35 94} 52. Qb8+ {198.89/43 0} Ke7 {0.73/37 121} 53. Qc7+ {199.15/52 0} Kf8 {0.73/36 39} 54. Qc8+ {199.39/40 320 (Dc6)} Ke7 {0.70/39 118 (Kf7)} 55. Qe6+ {199.41/60 55} Kf8 {0.69/40 0} 56. Bd5 {199.43/66 31} Qd1+ {0.76/39 20} 57. Kf4 {199.46/55 16} Qd2+ {0.87/37 45} 58. Kg4 {199.49/57 0 (Kg3)} Qd1+ {1.02/37 319 (Dd4+)} 59. Kh4 {199.51/66 32} Qd4+ {1.08/33 0} 60. Qe4 {199.55/63 77} Qf2+ {1.13/33 0} 61. Kg5 {199.57/71 77} Qg3+ {1.27/30 0} 62. Qg4 {199.59/63 10} Qe5 {1.56/29 0} 63. Qf3 {199.61/55 17} Qf6+ {1.80/27 0} 64. Kg4 {199.63/60 13} Qd4+ {2.27/24 0} 65. Kh5 {199.67/57 67} Qe5 {2.65/23 0} 66. Be6 {199.69/53 9} Qh2+ {2.96/26 0} 67. Kg5 {199.71/53 26} Qd2+ {3.59/19 0} 68. Kg4 {199.73/51 8} Qd4+ {4.25/18 0 (Dd8)} 69. Kh5 {199.76/50 5} Qf6 {4.90/16 3} 70. Qe3 {199.78/49 3} Qb2 {5.19/14 97 (Da1)} 71. Qg5 {199.80/67 9 (Df4)} Qh2+ {6.49/12 314} 72. Kg6 {#25/66 0} Qb8 {6.73/14 0} 73. Bf7 {#24/63 10 (Dh4)} Qd6+ {26.28/7 66} 74. Kh7 {#22/69 0} Qe5 {45.03/2 48 (Dh6+)} 75. Bh5 {#20/55 15} Qd4 {29.20/2 1 (Df6)} 76. Qg6 {#16/56 13 (Dg3)} Qd7 {#146/2 0} 77. Kh8 {#15/56 14 (De8+)} a4 {#137/2 32 (Ke7)} 78. f6 {#5/183 16} b5 {#136/1 0 (a3)} 79. Qg5 {#4/245 0 (Dxg7+)} g6 {#3/1 0} 80. Qxg6 {#3/245 0} Qh7+ {#2/1 0} 81. Kxh7 {#2/245 0} a3 {#1/1 0} 82. Qh6# {#1/245 0} 1-0

Förmlich erschreckend mal wieder, wie weit Lc0 bei dieser doch nicht soo kurzen TC mit der Bewertung des verlorenen Endspiels hinter SF herhinkt (beim 62. Zug fängt's erst zu dämmern an, was die Eval angeht).
Übrigens hat's Lc0 in der Gegenpartie nicht geschafft, den Vorteil zu einem ganzen Punkt umzusetzen. Jetzt lasse ich noch, wenn ich wieder Hardware- Zeit frei habe, noch 2 Partien mit 12.Dd4 ausspielen.
Parent - - By Walter Eigenmann Date 2023-10-27 12:49
Zitat:
"Winner" ist überhaupt schlecht zu definieren, einen best move muss es in jeder Stellung geben
... es sei denn, wir haben Zugumstellungen vor uns - gar nicht so selten, wie man beim Stellungsanalysieren sieht.

.
Parent - - By Peter Martan Date 2023-10-27 13:09 Edited 2023-10-27 13:23
Nein, die meine ich nicht, das sind dann eben klar gleich gute Züge, wenn die Zugumstellungen zwingend sind, und ja, das sind dann nicht einzelne best moves, sondern mehrere solche. Dass eine Stellung mehrere Züge als Abspielmöglichkeiten bietet, die alle mehr oder weniger zwingend zu denselben Ergebnissen bei fehlerfreiem Ausspielen führen, (1-0, Remis, 0-1) das kommt ohnehin auch oft genug vor, auch bei denen könnten man dann einfach von gleich gut reden, es sei denn, es kommt einem auch darauf an, wie lange die Partien sind, die fehlerfrei ausgespielt werden. Aber das sind eben lauter Unterscheidungsmerkmale, die man gelten lassen kann oder auch nicht.

Im automatischen Stellungstest mit einer Suite würde ich halt Züge, die sich nicht sicher unterscheiden lassen in ihrer Wertigkeit, prinzipiell immer alle gelten lassen, eine Stellung kann ja in jeder .epd mit beliebig vielen best moves gespeichert werden, z.B. MEA- artige Syntax bietet darüber hinaus noch die Möglichkeit, verschieden viele Punkte für jeden irgendwie auch noch als Lösung zu wertenden Zug zu vergeben, diese Züge, die auch noch Punkte bringen können, wenn auch weniger als der bm oder die best moves, wie viele oder wie wenige es auch unter diesem Namen sind, werden von GUIs nicht als gelöst beurteilt, mit MEA bringen sie dennoch Punkte, nur die unter "Found" gezählten bleiben gleich viele, dort werden nur die als bm definierten summiert.
Du erinnerst dich an unsere Mails in der Sache, !?, ?!, !, ?, ev. noch !! und ?? sowie zusätzlich die Hierarchie der Varianten im GUI beim automatischen Stellungstest mit verschieden vielen Punkten zu bewerten, das wäre völlig ausreichend, leider hat Herr Wüllenweber nie auf meine diesbezüglichen Anregungen per Mail damals reagiert.
Parent - - By Walter Eigenmann Date 2023-10-27 13:26
...wobei wir uns richtig verstehen: Diese AZ-Züge würde ich in einem aussagekräftigen Stellungstest nicht verwenden, ob nun konventionell oder MEA-like.
Denn es sind zwar - wie ich meine - die wirklich "besten Züge", die sich von dem jeweils zweitbesten abheben (mehr oder weniger offenkundig).
Aber nicht in den für Stellungstests üblichen Zeitfenstern von 5-15 Sekunden; diese AZ's haben quasi Fernschach-Qualität.

.
Parent - - By Torsten Cuber Date 2023-10-27 13:46
Lieber Walter, deswegen teste ich Stellungen gerne mit drei oder vier verschiedenen Engines, bevor ich sie als Teststellung in meine Testsuite aufnehme.
Ich habe in den letzten Jahren immer wieder erlebt, daß Züge, die als die besten galten, von neuen Engines vielleicht nicht widerlegt wurden, aber es wurden sehr gute Alternativen gefunden.
Oder aber eine Engine blieb auch nach langem Rechnen stur bei einem anderen Zug.
Normalerweise denkt man dann, okay, sie hat's nicht gefunden, also weiter zur nächsten Stellung.
Ab und an schau ich mir diese "nicht gelösten" Stellungen genauer an, und siehe da, ich entdecke eine Variante, die vorher vom Verfasser der Testreihe nicht angegeben wurde. Oder es stellt sich heraus, dass es eine ZUGUMSTELLUNG gibt, die genau zum selben Ergebnis führt.
In solchen Fällen lass ich dann auch die Alternative als Lösung gelten.
Ich denke, so verhält es sich auch mit den Zügen von AlphaZero.
Wenn man deine sechs Stellungen beispielsweise in 10 Jahren wieder analysiert, mit der allerneuesten Hardware, wird man mit Sicherheit die ein oder andere Überraschung erleben...
Aus diesem Grund analysiere ich die großen Partien der Schachgeschichte auch immer wieder neu, ca alle 10 Jahre.
Liebe Grüße vom Torsten
Parent - - By Torsten Cuber Date 2023-10-27 14:10
Ein Beispiel dafür:
In deinem ERET Test gibt es die Stellung 084-Königsangriff.
Persson -Teichmeister, CorrGame 2009.
Als Lösung hast Du angegeben 28.Lg7!?
Ich habe diese Stellung immer wieder analysiert, und ich bin überzeugt, dass 28.Lg5!! mindestens gleichwertig, wenn nicht sogar der bessere Zug ist, der von praktisch allen Engines bevorzugt wird (mein Zeitlimit ist bekanntlich 5 Minuten pro Stellung!).
Was denkst Du darüber?
Parent - By Peter Martan Date 2023-10-27 14:35 Edited 2023-10-27 14:44
Wenn ich mich einmischen darf, noch bevor Walter antwortet, hier ist eine Sammlung von Threads, in denen das im Talkchess erörtert wurde, nämlich das Suchergebnis, wenn man die Stellung als Fen in die Suche eingibt, das lesen zu können, muss man eingeloggt sein.

https://talkchess.com/forum3/search.php?keywords=4r1k1%2F1r1np3%2F1pqp1ppB%2Fp7%2F2b1P1PQ%2F2P2P2%2FP3B2R%2F3R2K1+w+-+-

Ein Beispiel eines einzelnen Threads dazu:

https://talkchess.com/forum3/viewtopic.php?p=797260#p797260

Mir scheint, Dann Corbit hat das damals

https://talkchess.com/forum3/viewtopic.php?p=781695&sid=994315a3e3a9f52235b7b8d06891967a#p781695

als Erster gepostet.

Und Horst Sikorsky hat hier mal was dazu geschrieben

https://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=149896#pid149896
Parent - By Walter Eigenmann Date 2023-10-27 16:32
Es ist natürlich immer gut, wenn man angebliche "Lösungszüge" im Hinblick auf ihre Korrektheit überprüft.
Und das wird ja in den Foren auch immer wieder gemacht.

Wobei m.E. unbedingt Long-Time-MPV-Analysen bis in eine Tiefe von mind. 50 Ply's durchgeführt werden sollten,
um einen Zug stabilisiert zu bestätigen oder zu widerlegen. Erfahrungsgemäss hält das dann auch späteren Engine-Generationen stand.

Bezüglich ERET ist noch zu erwähnen, dass er ein Kind des Vor-NN-Zeitalters ist - quasi prähistorisch
Trotzdem dürften praktisch alle seine Lösungszüge tatsächlich Best-Moves sein - aber absolut behaupten will ich es auch wieder nicht
Ich habe mich schon jahrelang nicht mehr mit dem ERET beschäftigt:
https://glarean-magazin.ch/2017/03/05/computerschach-testaufgaben-engines-eigenmann-rapid-engine-test-eret/

Wenn du hier also eine widerlegende 3-MPV-Analyse einer fragl. Stellungslösung (z.B. Nr. 84 u.a.) bis rein in mind. 50-55 Halbzüge präsentierst,
werde ich mich gerne eines besseren belehren lassen.

.
Parent - - By Walter Eigenmann Date 2023-10-29 09:58
Ja, du hast recht:
Bei ERET-84 ist Lg5 die bessere Alternative.
Aber ich muss das einfach erwähnen: Wenn im ERET ein, zwei Aufgaben diskutabel sind, so ist das immer noch vernachlässigbar - im Vergleich mit allen anderen
grösserenen Stellungstests, die hier und in anderen Foren so diskutiert wurden und werden; dort ist mind. jeder 10. Lösungszug falsch, wie meine Recherchen ergaben.
Man wünscht sich gerade bei Stellungstests eine erhöhte analytische Sorgfalt und eine "innere Kohärenz" der Sammlung. Stattdessen werden oft von überall her
einfach unkritisch bzw. zufällig Aufgaben eingesammelt, in einen Topf zusammengewürfelt und den Programmen zum Frass vorgeworfen, woraus dann natürlich die
widersprüchlichsten Ergebnisse resultieren...

.
Parent - By Torsten Cuber Date 2023-10-29 10:56 Upvotes 1
Genau so ist es.
Ich arbeite schon seit über 20 Jahren an meinem eigenen PC-Test, und hab über die Jahre immer wieder analysiert und neu bewertet.
Immer wieder musste ich alte Stellungen rausnehmen und durch neue ersetzen.
Viele neue Stellungen kamen in den letzten Jahren dazu, weil der alte Test zu einfach geworden ist.
Aber viele Stellungen erwiesen sich im Laufe neuer Analysen als nicht mehr ganz eindeutig.
Es ist ja auch so, dass ich mit jeder neuen Engine, die ich teste, auch regelmäßig alte Analysen prüfe und dabei neue Varianten entdecke.
Aus diesem Grund habe ich bei meiner letzten Revision über 30 Stellungen ausgewechselt, die zu einfach geworden oder sich nicht mehr als eindeutig erwiesen haben.
Mein PC-ULTRA-2-TEST hat mittlerweile 100 Stellungen, von denen in den letzten Jahren viele neu dazu gekommen sind.
Die Anzahl der nicht ganz eindeutigen Stellungen wurde weiter reduziert, aber man wird wohl damit leben müssen, daß immer wieder Aufgaben dabei sind, die sich nach einigen Jahren als nicht mehr ganz korrekt erweisen.
Aber das weiß ich und ich kann damit leben.
Von den 20 Stellungen, die in meinem alten Test (der aber auch 150 Stellungen umfasste) noch als "nicht ganz korrekt oder falsch" angesehen werden konnten, sind in meinem neuen PC-ULTRA-2-TEST (100 Stellungen) jedenfalls keine mehr dabei.
Aber ich stimme Dir absolut zu:
"Man wünscht sich gerade bei Stellungstests eine erhöhte analytische Sorgfalt."
Genau darum bemühe ich mich, weil ich jede Stellung (nicht nur die neuen) immer wieder selbst analysiere. Und auch bereit bin, Stellungen, die ich über die Jahre lieb gewonnen habe, auszutauschen, wenn ich nicht mehr absolut überzeugt bin von ihrer Korrektheit.
Parent - By Walter Eigenmann Date 2023-10-29 09:13
Torsten Cuber schrieb:
Wenn man deine sechs Stellungen beispielsweise in 10 Jahren wieder analysiert, mit der allerneuesten Hardware,
wird man mit Sicherheit die ein oder andere Überraschung erleben...
Ausschliessen will ich das nicht; bei der Analyse muss man ja immer vom aktuell Maschinenmöglichen (nicht Menschenmöglichen) ausgehen.
Andererseits sind die Wirkungsgesetze des Schachs ja nicht vom Entwicklungsstand der Engines abhängig, und bei Tiefen-Analysen bis 60-80 Ply's ist die Wahrscheinlichkeit einer Revision dieser 6 Lösungszüge vernachlässigbar...
Wir treffen uns in 10 Jahren wieder hier

Torsten Cuber schrieb:
Aus diesem Grund analysiere ich die großen Partien der Schachgeschichte auch immer wieder neu, ca alle 10 Jahre.
Das ist wieder eine andere Baustelle. Ich persönlich schätze, dass 99% aller Schachbücher, die vor 2019 gedruckt wurden, hinsichtlich ihrer Kommentare reine Makulatur sind.
Ich habe mir mal einige der berühmtesten (Lehr)Bücher der berühmtesten Kommentaroren der Schachgeschichte vorgeknöpft im Hinblick auf ihre Einfach- und Doppel-Ausrufezeichen: Ein Desaster...
Nur ein kleiner Teil der Einschätzungen war korrekt - im Lichte der modernen NN-Engines...
Aber die schachgeschichtlich bzw. kulturhistorisch grosse Bedeutung von beispielsweise Aljechins "Nottingham 1936" oder Dworetskis "Positionelles Schach" oder Nunns "Mammoth Book Of World's Greatest Chess Games"
wird dadurch nicht geschmälert. (Letzteres erschien übrigens 1998 und wurde unter Einbezug der Engines Junior und Fritz geschrieben; eines der ganz wenigen Bücher mit explizit deklarierter Computer-Unterstützung).

.
Parent - - By Torsten Cuber Date 2023-10-27 14:23
Ein weiteres Beispiel möchte ich anbringen:
In deinem ERET TEST Stellung 090 Endspiel L vs L; Studie von Salai 2011.
Du gibst als Lösung an 1.f4!!, was Crystal 6 PMT (den ich beim zweiten Versuch installieren konnte) auf meinem Intel i7 8700 PC in 1:59 Minuten findet.
Crystal 5 fand den Zug nicht.
Aber:
Ich benutze zur Analyse auch Eduard Nemeths Leptir Analyzer, eine wahnsinnig starke Engine speziell für die Partieanalyse.
Leptir Analyzer zeigte mir nach langem Rechnen folgende Variante:
1.Ld1!! Ld2 2.f4!! Lxf4 3.Kd7 Ld2 4.Kc6 La5 5.b4!! cxb4 6.Lb3+, was mit Zugumstellung zur Stellung der Hauptvariante führt!!
Also muss man auch 1.Ld2 als Lösung gelten lassen!
Parent - By Peter Martan Date 2023-10-27 14:41 Edited 2023-10-27 14:47
Das ist ein mittlerweile auch schon ziemlich lange bekanntes Major Dual der schönen Studie, auch richtig.

https://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=165663#pid165663

Füllt im Talkchess mit der Suche nach der Stellung auch schon einige Seiten

https://talkchess.com/forum3/search.php?keywords=4K1k1%2F8%2F1p5p%2F1Pp3b1%2F8%2F1P3P2%2FP1B2P2%2F8+w+-+-
Parent - - By Walter Eigenmann Date 2023-10-28 01:59
Peter Martan schrieb:
Im automatischen Stellungstest mit einer Suite würde ich halt Züge, die sich nicht sicher unterscheiden lassen in ihrer Wertigkeit, prinzipiell immer alle gelten lassen, eine Stellung kann ja in jeder .epd mit beliebig vielen best moves gespeichert werden, z.B. MEA- artige Syntax bietet darüber hinaus noch die Möglichkeit, verschieden viele Punkte für jeden irgendwie auch noch als Lösung zu wertenden Zug zu vergeben, diese Züge, die auch noch Punkte bringen können, wenn auch weniger als der bm oder die best moves, wie viele oder wie wenige es auch unter diesem Namen sind, werden von GUIs nicht als gelöst beurteilt, mit MEA bringen sie dennoch Punkte, nur die unter "Found" gezählten bleiben gleich viele, dort werden nur die als bm definierten summiert.
Ja, "die Botschaft hör´ ich wohl, allein mir fehlt der Glaube" an die Möglichkeit einer richtigen "Wertigkeit" des zweit-, dritt- etc.-besten Zuges eines Outputs. Denn den finalen BM einer (vorerst nicht eindeutigen) Testaufgabe zu eruieren kann mit allerlei Analyse-Technik und viel Zeit gelingen, aber dann auch noch die Hierarchie mehrerer Konkurrenzzüge genau zu definieren und adäquat und differenziert mit Punkten zu belohnen - das ist schon eine Marke...
In praktischer Hinsicht funktioniert's ja eh anders, z.B. im Fernschach. Dort geht's um die "schachliche Wahrheit" einer Stellung, FS-Spieler sind keine Schachsportler, sondern Forscher, die in jeder Stellung nach dem einen und einzigen Zug fahnden. Wobei es eben NICHT - wie ein unausrottbares Vorurteil immer wieder doof perpetuiert wird - ausreicht, einfach Engine-Outputs abzulesen. Wenn das Eröffnungssystem mal gewählt ist, wird anschliessend um jeden minimsten Vorteil gerungen, es muss immer der absolut beste Zug her, weitere Kandidatenzüge interessieren nur ganz anfänglich, und seien sie noch so nah am BM.
WM Lasker wurde ja nachgesagt, er hätte zuweilen den "zweitbesten" Zug gespielt, falls dieser psychologisch verheerender erschien als der beste (bzw. was Lasker dafür hielt...). Aber Stockfish ist nicht Lasker...

.
Parent - - By Benno Hartwig Date 2023-10-28 08:30

> Wenn das Eröffnungssystem mal gewählt ist, wird anschliessend um jeden minimsten Vorteil gerungen, es muss immer der absolut beste Zug her, weitere Kandidatenzüge interessieren nur ganz anfänglich, und seien sie noch so nah am BM.


Ich hatte gerade gedacht, dass im Fernschach die Entscheidung über den dann ausgeführten Zug letztlich meistens vom Menschen getroffen wird.
Und ich hatte geglaubt, dass dann besonders interessant sein kann, welche Züge die Engine hier für machbar hält, auch die zweit- und drittbesten Züge, sofern deren Qualität dicht an der des besten liegt.

Liege ich damit denn daneben?
Parent - - By Walter Eigenmann Date 2023-10-28 10:32
Einverstanden. Jedenfalls: Die Top-FS-Spieler (ab 2450 Elo) nutzen die Engines zur Qualitätskontrolle, nicht zur Zugansage.
(Letzteres ist bei bei 30-40 Partien gleichzeitig auch gar nicht effizient realisierbar, wenn man von ca. 4-5 Stunden Engine-Analyse pro unklarer Mittelspielstellung ausgeht,
sobald man das Programm sich selber überlässt und trotzdem einen vorteilhaften Zug will).

Natürlich gehen FS-Grossmeister in die Stellungen rein, da wird händisch experimentiert und werden die Engines weit auf vielversprechende Verästelungen geleitet.
Gar nicht so unähnlich den neuesten Analyse-Features von Chessbase-17:
https://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=159736#pid159736
Der drohende "Remistod" im FS (wie im Engine-Schach) ist zwar nicht ganz wegzudiskutieren, wenn alle die gleichen Werkzeuge benützen.
Aber die 4-5 Siege pro FS-Turnier trennen die Spreu vom Weizen. Jeder Nachplapperer des weitverbreiteten Vorurteils, im Grossmeister-Fernschach würden tumb
einfach Stockfish-Züge nachgespielt, sollte sich mal die Gewinnpartien der Topspieler vorknöpfen. Dabei wird er herausfinden, dass zahllose Partienzüge
von den Engine-Outputs abweichen und erst nach aufwändiger Retro-Analyse sich als die einzig besten beweisen lassen.
Kurzum: Die Engine denkt, der Mensch lenkt.
Bei all unserem anbetungsvollen Niederknien vor den göttlichen Engines - "Der Weltmeister ist ja so blöd, er würde kein Match gegen den Computer gewinnen" - vergessen wir zuweilen,
dass Schach grösser ist als das Human-&Machine-Chess zusammen...

.
Parent - - By Klaus S. Date 2023-10-28 12:25
Hallo Walter,

dein link in der Signatur scheint nicht zu funktionieren.
Parent - By Walter Eigenmann Date 2023-10-28 12:32
Klaus S. schrieb:

Hallo Walter,dein link in der Signatur scheint nicht zu funktionieren.
Merci für den Hinweis! Korrigiert.

.
Parent - By Peter Martan Date 2023-10-28 09:38 Edited 2023-10-28 09:55
Walter Eigenmann schrieb:

Peter Martan schrieb:
Im automatischen Stellungstest mit einer Suite würde ich halt Züge, die sich nicht sicher unterscheiden lassen in ihrer Wertigkeit, prinzipiell immer alle gelten lassen, eine Stellung kann ja in jeder .epd mit beliebig vielen best moves gespeichert werden, z.B. MEA- artige Syntax bietet darüber hinaus noch die Möglichkeit, verschieden viele Punkte für jeden irgendwie auch noch als Lösung zu wertenden Zug zu vergeben, diese Züge, die auch noch Punkte bringen können, wenn auch weniger als der bm oder die best moves, wie viele oder wie wenige es auch unter diesem Namen sind, werden von GUIs nicht als gelöst beurteilt, mit MEA bringen sie dennoch Punkte, nur die unter "Found" gezählten bleiben gleich viele, dort werden nur die als bm definierten summiert.
Ja, "die Botschaft hör´ ich wohl, allein mir fehlt der Glaube" an die Möglichkeit einer richtigen "Wertigkeit" des zweit-, dritt- etc.-besten Zuges eines Outputs. Denn den finalen BM einer (vorerst nicht eindeutigen) Testaufgabe zu eruieren kann mit allerlei Analyse-Technik und viel Zeit gelingen, aber dann auch noch die Hierarchie mehrerer Konkurrenzzüge genau zu definieren und adäquat und differenziert mit Punkten zu belohnen - das ist schon eine Marke...
In praktischer Hinsicht funktioniert's ja eh anders, z.B. im Fernschach. Dort geht's um die "schachliche Wahrheit" einer Stellung, FS-Spieler sind keine Schachsportler, sondern Forscher, die in jeder Stellung nach dem einen und einzigen Zug fahnden. Wobei es eben NICHT - wie ein unausrottbares Vorurteil immer wieder doof perpetuiert wird - ausreicht, einfach Engine-Outputs abzulesen. Wenn das Eröffnungssystem mal gewählt ist, wird anschliessend um jeden minimsten Vorteil gerungen, es muss immer der absolut beste Zug her, weitere Kandidatenzüge interessieren nur ganz anfänglich, und seien sie noch so nah am BM.
WM Lasker wurde ja nachgesagt, er hätte zuweilen den "zweitbesten" Zug gespielt, falls dieser psychologisch verheerender erschien als der beste (bzw. was Lasker dafür hielt...). Aber Stockfish ist nicht Lasker...

Von Stockfish hingegen erwartet man aber halt, dass er nicht nur einen Zug in einer Stellung wählt, sondern auch die Alternativzüge alle zueinander in eine Hierarchie bringt, selbst bei gleich hohen Evals im Output muss eine Reihenfolge im MultiPV- Output erstellt werden und bei der internen Bewertung eine Sortierung aller möglichen Züge erstellt, nicht nur in der Analyse, auch im Spielen.
Und das Vorgehen zur Bestimmung des zweit- und drittbesten Zuges ist prinzipiell natürlich dieselbe wie beim besten, funktioniert's bei dem, warum dann bei den anderen nicht?
Es gibt Unterschiede in den Parametern der Suche und Bewertung zwischen einer primary line, die jeweils gerade von der Engine am besten bewertet wird und den non primaries, im MultiPV- mode werden die der non primaries (nicht ganz aber ziemlich) zu primaries erhoben und an die besten in den Parametern angeglichen, sie werden dann auch genauer untersucht mit weniger Pruning und weniger Reductions, das kostet in der A-B-Suche Rechenzeit, aber wenn man mit der Engine Zug um Zug in die Breite der möglichen Abspiele bei einer Stellung hineingeht, ist die Engine ja auch und erst recht gezwungen, den jeweils ausgewählten Zug allein in den Fortsetzungen zu untersuchen. Es ist ein rein quantitativer Unterschied, ob man das bei einem Zug allein macht, den man gerade für den besten hält, oder bei zweien oder dreien oder vieren...
Und ebenso wie die Engine wird der menschliche Spieler Züge, die gegen die besseren schon in den ersten Folgezügen deutlich schlechter ausschauen, nicht so aufwändig weiter untersuchen, wie die besseren. Hingegen merkt man halt gerade bei den taktisch kniffligen und bei den positionell anspruchsvollen, deren Pointen erste nach ein paar weiteren Zügen so richtig offenkundig werden, dass es sich immer wieder mal lohnt, nicht zuviele Abstriche in der Suche nach dem ersten besten zu machen, weil man sonst halt die wirklich besten übersehen kann, so passiert's ja auch den Engines immer noch immer wieder mal, da freut sich dann z.B. der Studienkomponist, wenn er eine Stellung erdacht hat, die dem menschlichen Problemlöser ebenso wie der Engine eine Falle stellt, in die man tappt, so lange man das Thema der Studie noch nicht erfasst hat.
Wenn du Stellungen zum Testen bewertest, kommst du nicht darum herum, den besten Zug im Vergleich zu den weniger guten einzusortieren, wieviele Punkte du wofür vergibst, ist natürlich dir überlassen, aber wieviel die einzelne Lösung insgesamt zählt, hängt ja auch ganz vordergründig davon ab, wieviele andere Stellungen du auch noch für den Test hernimmst, bei 1000 ist das richtig oder falsch der einzelnen automatisch 10x weniger wert als bei 100.
Darüberhinaus wäre irgendeine Art der Bewertung der einzelnen Lösung über das gelöst oder nicht gelöst hinaus ohnehin sehr viel wert, es ist eben nicht gleichgültig, ob das eine Stellung ist, die jede Engine in Sekunden richtig bewertet oder eine knifflige, für die Rechenzeit gegeben werden muss.
Die Hardware- TC deines Tests entscheidet darüber ja auch zwangsläufig, wie schwer oder leicht du deine Teststellungen beurteilst, und wenn dann ein Programm wie EloStatTS von Frank Schubert die Eng-Eng-Matches jeder einzelnen Stellung zwischen allen einzelnen Engines paarweise nach den genauen Lösezeiten bewertet, dann hast du halt viel mehr Bewertungskritierien und das "Remis" zwischen 2 Engines und einer Stellung nur dann, wenn sie von beiden Teilnehmern nicht in der vorgegebenen Zeit gelöst wird, das genau gleiche zeitliche Ergebnis ist schon, wenn's wenigstens Zentisekunden sind, die gezählt werden, schon nur mehr sehr selten Du bekommst einfach so wie beim game playing die Remisquote bei gleicher Zahl von Stellungen oder Partien viel besser in den Griff.
Und man kann halt auch andere als eindeutige single best move- Stellungen (von denen wir die Schwierigkeiten der Definition ja auch kennen und gerade wieder ins Auge fassen) für Suiten verwenden, wenn man die Wahl von zweit- oder drittbesten oder einfach von 2 gleich guten Zügen auch in die Bewertung der Stellung einbezieht. Die einzelne wird dadurch einfach in ihrer statistischen Aussage relativ zu den anderen weiter differenziert, allein schon das Gelöst oder nicht ist ein anderes, wenn du mehr als einen bm allein hast.
Aber danke jedenfalls, dass du mir mal wieder Gelegenheit gibst, derlei etwas ausführlicher in Worte zu fassen
Parent - - By Walter Eigenmann Date 2023-10-28 02:16
Peter Martan schrieb:

Walter Eigenmann schrieb:

Wie gesagt, es sind "nur" Best-Moves, keine Winner.

"Winner" ist überhaupt schlecht zu definieren, einen best move muss es in jeder Stellung geben, bei vielen Stellungen lässt sich der halt aber auch nicht wirklich als solcher beweisen.
Hier hab' ich mir z.B. den Spaß gegönnt, SF mit dem 12.f4 statt 12.Dd4 der 4. Stellung gegen Lc0 ausspielen zu lassen:
Ja, einen "unsicheren" BM ausspielen zu lassen ist natürlich eine Möglichkeit, seine Güte in der Praxis zu verifizieren.
Andererseits können einige wenige suboptimale Folgezüge nach einem BM dessen ganzen Vorteil - so er denn einen aufweist - ja auch wieder versemmeln.
Das Partie-Resultat sagt dann nichts über den BM aus.

.
Parent - By Peter Martan Date 2023-10-28 09:11 Edited 2023-10-28 10:01
Walter Eigenmann schrieb:

Andererseits können einige wenige suboptimale Folgezüge nach einem BM dessen ganzen Vorteil - so er denn einen aufweist - ja auch wieder versemmeln.
Das Partie-Resultat sagt dann nichts über den BM aus.

Ich dachte halt hingegen, dass es dasjenige ist, was die Wertigkeit eines Zuges im Wesentlichsten und endgültig bestimmt, wie die Partie danach ausgeht. Wenn man das noch nicht sagen kann, muss man halt eine möglichst exakte Vermutung dazu anstellen, und natürlich muss man immer (wie beim ersten Zug selbst) von den besten Folgezügen ausgehen. Was für einen Sinn haben andere Bewertungen, ob in cp oder in WDL- Wahrscheinlichkeiten oder in einer Hierarchie des Spielbaumes, wie auch immer, die Basis muss immer die möglichst exakte Vermutung über die weiteren Abspiele bis zum ganzen oder halben Punkt einer Seite sein.

Und sind die Partieausgänge mehrerer Züge zwingend und beweisbar oder mit großer Wahrscheinlichkeit vermutlich gleich, dann sind es die Züge im Wesentlichen auch. Nur die Länge der Partien, die mit dem einen oder anderen zu erwarten sind, entscheiden dann noch über besser oder schlechter. Extrembeispiel: bei einer Matt in x- Aufgabe sind nur alle diejenigen Züge gleich gut, die dieselbe DTM haben.
Parent - - By Torsten Cuber Date 2023-10-27 02:18
Also dann:
Analyse von Crystal 5 auf dem Smartphone XIAOMI 11:
Stellung 1: 12.0-0 in 1 Sekunde
Stellung 2: 11.c3 in 70 Sekunden
Stellung 3: 15.Sf3 in 60 Sekunden
Stellung 4: 12.Dd4 in 2 Sekunden
Stellung 5:  Crystal analysiert 23.-Sb5! 24.Dd2 Ta6 25.Txa6 Lxa6 -/+; 24.Db3 Df7 25.f5 h6 -/+ ( -/+ bedeutet Schwarz steht besser).
Stellung 6: Crystal 5 analysiert 15.- Scd5 16.Sb6 Sxb6 17.Lxa5 Sfd5 18.Lxb6 Sxb6 19.cxb6 Ta8 20.a4 Ta6 21.Da3 Dxb6 22.b4 Da7 23.a5 b6 24.e3 bxa5 25.Lf1 a4 26.Lxa6 Dxa6 = (0.00)
Fazit: Es ist faszinierend, was eine gute Schachengine heutzutage auf einem Smartphone leisten kann!
Parent - - By Peter Martan Date 2023-10-27 08:26
Ich nehme an, du weißt, dass es auch eine Crystal 6 gibt, ja?

https://github.com/jhellis3/Stockfish/releases/tag/v6

Und Ipman- Compiles davon:

https://ipmanchess.yolasite.com/compiles.php
Parent - - By Torsten Cuber Date 2023-10-27 09:31
Lieber Peter, ich habe Crystal 6 tatsächlich schon einmal runtergeladen als Paket für den PC, aber es ließ sich nicht installieren. Es war , soweit ich als Laie das erkennen konnte, keine exe Datei in dem Paket vorhanden, daß ich runtergeladen hatte.
Jedenfalls hat mein PC nichts installieren können.
(Ich installiere meine Programme immer als UCI Engine, die ich dann unter Komodo laufen lasse.)
Daher hab ich für meinen Test auf dem Smartphone Crystal 5 benutzt.
Gibt's Crystal 6 auch als Android-Version?
Liebe Grüße vom Torsten.
Parent - By Peter Martan Date 2023-10-27 09:48
Torsten Cuber schrieb:

Gibt's Crystal 6 auch als Android-Version?

Wahrscheinlich, da müsstest du aber die Foren durchsuchen, bei den Ipman- Compiles war mir scheint keins dabei.
Parent - By Kurt Utzinger Date 2023-10-27 13:03
Torsten Cuber schrieb:

Lieber Peter, ich habe Crystal 6 tatsächlich schon einmal runtergeladen als Paket für den PC, aber es ließ sich nicht installieren. Es war , soweit ich als Laie das erkennen konnte, keine exe Datei in dem Paket vorhanden, daß ich runtergeladen hatte.
Jedenfalls hat mein PC nichts installieren können.
(Ich installiere meine Programme immer als UCI Engine, die ich dann unter Komodo laufen lasse.)
Daher hab ich für meinen Test auf dem Smartphone Crystal 5 benutzt.
Gibt's Crystal 6 auch als Android-Version?
Liebe Grüße vom Torsten.


Hallo Thorsten
Crystal 6 zum Dowload hier
https://ipmanchess.yolasite.com/compiles.php
enthält nur die EXE-Dateien.
Gruss
Kurt
Parent - By Walter Eigenmann Date 2023-10-27 09:06
Merci für die Analysen. Aber mir scheint, du hast deine Crystal-Ergebnisse zu früh abgelesen.

Denn z.B. bei Nr. 1 erhalte ich von Crystal 5 in Tiefe 34 (nach ca. 5 Min.):

1. +/- (1.00): 12.h4 a5 13.h5 b4 14.axb4 axb4 15.Sd1 0-0 16.Lf2 h6 17.0-0
2. +/- (0.91): 12.0-0 Sb6 13.De1 g6 14.Kh1 Sa4 15.Sd1 a5 16.Lf2 Ld7 17.Tg1
3. +/- (0.71): 12.g4 b4 13.axb4 Lxb4 14.0-0 Sf8 15.Ld1 h5 16.h3 Sg6 17.Df2

Fazit:
Man muss den Engines nur genug Zeit geben, dann kommen die Fehler von alleine

.
Parent - - By Jörg Oster Date 2023-10-27 10:41
Vielen Dank, Walter.

An solchen Stellungen ohne klaren bzw. einzigen best move, zeigt sich, unter anderem, die Stärke der Alpha-Zero-Suche.
Bzw. der große Nachteil von PVS, welche ja alle modernen AB-Engines nutzen.
Parent - By Walter Eigenmann Date 2023-10-27 12:01
Jörg Oster schrieb:

Vielen Dank, Walter.
An solchen Stellungen ohne klaren bzw. einzigen best move...
... wobei ich doch meine, dass die angegebenen Lösungszüge die "klar" besten sind, welche die eigene Stellung jeweils am stärksten vorantreiben.
Jedenfalls legen das alle vielstündigen "Over-Night-"Berechnungen - inkl. vorausgegangener For-/Backward-Analysen - nahe.

.
- By Peter Martan Date 2023-10-27 08:50 Edited 2023-10-27 09:05
Morgähn!

Ich mach' mal da weiter, wo ich heute nachts aufgehört hatte (also wieder SF dev. mit 30 Threads und 32G Hash), mit Nr.5:

r3qbk1/pbp3pp/1r6/2p5/2NnPP2/2QPB3/1PP3PP/R4R1K b - - 0 1

Analysis by Stockfish dev-20231008-7a4de961:

23...Ta6 24.Txa6 Lxa6 25.Lxd4 cxd4 26.Dxd4
  Schwarz steht besser: -/+ (-1.28)  Tiefe: 1/1   00:00:04  1728Knoten
...
23...Ta6 24.Se5 Tb6 25.Sc4 Tb4 26.b3 g6 27.Lxd4 cxd4 28.Dxd4 Lg7 29.Dc5 Tb5 30.Dxc7
  Schwarz steht besser: -/+ (-0.78)  Tiefe: 13/19   00:00:04  1518kN
23...Sb5 24.Dd2 Ta6 25.Sa5 Tb8 26.f5 La8 27.Df2 Sd4 28.Sc4 Txa1 29.Txa1
  Schwarz steht besser: -/+ (-0.79)  Tiefe: 14/19   00:00:04  2309kN
...
23...Sb5 24.Dd2 Ta6 25.Se5 Txa1 26.Txa1 a6 27.Da5 Lc8 28.c4 Sd6 29.Dxc7 Sb7 30.Db6 a5 31.Ld2 a4 32.h3 Sd8 33.Le3 Ta6 34.Db5 Dxb5 35.cxb5 Ta5 36.b6 Ta6 37.Kg1 Txb6 38.Txa4 Sc6 39.Sxc6 Txc6 40.Tc4 La6 41.Tc3 Tb6 42.Lxc5 Lxc5+ 43.Txc5 Lxd3 44.e5 Txb2 45.Tc8+ Kf7 46.g4 Le4 47.Tc7+ Kg6 48.Td7
  Schwarz steht besser: -/+ (-0.75 ++)  Tiefe: 36/50   00:00:52  858MN
...
23...Sb5 24.Dd2 Ta6 25.Se5 Txa1 26.Txa1 h6 27.Df2 Sd6 28.Lxc5 Lxe4 29.dxe4 Sxe4 30.Dd4 Sxc5 31.b4 Td8 32.Dc4+ De6 33.bxc5 Dxc4 34.Sxc4 Td4 35.Sa5 Txf4 36.Sb3 Tf2 37.g3 Txc2 38.Txa7 Tc3 39.Tb7 g6 40.Kg2 Lg7 41.Kf2 Le5 42.Ke2 Tc2+ 43.Sd2 Txc5 44.Kd3 Tc3+ 45.Ke4 Ld6 46.Tb2 Kf7 47.Sf3 Tc4+ 48.Kd5 Tc5+ 49.Ke4 g5 50.Ta2 Kg6
  Schwarz steht besser: -/+ (-0.78 ++)  Tiefe: 38/53   00:01:47  1765MN
23...Tb5
  Schwarz steht besser: -/+ (-0.84 ++)  Tiefe: 38/81   00:02:04  2049MN
23...Tb5 24.Dd2 a5 25.b3 Dh5 26.h3 Le7 27.Sxa5 Sxc2 28.Dxc2 Tbxa5 29.Txa5 Txa5 30.b4 Ta3 31.Lxc5 Lxc5 32.bxc5 Lc6 33.f5 Df7 34.d4 De7 35.Tf4 Te3 36.Dc4+ Kf8 37.f6 gxf6 38.e5 Txh3+ 39.Kg1 Th6 40.d5 Le8 41.Dd4 c6 42.Txf6+ Txf6 43.exf6 De1+ 44.Kh2 cxd5 45.Dxd5 Dh4+ 46.Kg1 Dxf6 47.De4 Dg6 48.Df4+ Ke7 49.Dc7+ Ke6 50.Dd6+ Kf5 51.Dd5+ Kf4 52.Dd4+ De4 53.Df6+ Kg4 54.Dg7+ Kh5 55.Df8 Lc6 56.Dg7 De1+ 57.Kh2 Dh4+ 58.Kg1
  Schwarz steht besser: -/+ (-0.75)  Tiefe: 38/81   00:02:06  2076MN
...
23...Tb5 24.Dd2 a5 25.b3 Lc6 26.h3 h6 27.f5 Kh7 28.Lf4 Tb7 29.Txa5 Txa5 30.Sxa5 Ta7 31.c3 Txa5 32.cxd4 Ta3 33.d5 Lb5 34.Lxc7 Txb3 35.Tf3 De7 36.Lf4 Da7 37.Le5 Tb1+ 38.Kh2 c4 39.dxc4 Lxc4 40.d6 Dg1+ 41.Kg3 Td1 42.Df2 Dh1 43.Tc3 Lf7 44.Tc7 Lxd6 45.Lxd6 Txd6 46.Kh4 Td3 47.Txf7 Dc1 48.Txg7+ Kxg7 49.Da7+ Kf8 50.Db8+ Ke7 51.De5+ Kd8 52.Df6+ Kd7 53.Dg7+ Kc6 54.Kh5 Df1 55.f6 De2+ 56.Dg4 Dxg4+ 57.hxg4
  Schwarz steht etwas besser: =/+ (-0.62 --)  Tiefe: 44/40   00:05:07  4950MN

Da lässt mich jetzt die Forward- Backward- Analyse aber doch nicht ruhen, nur noch einen oder zwei Outputs dazu, wenn der Hash schon vom Standrechnen voll ist, nach dem Eingeben und Zurücknehmen von Walters Analyse- Varianten:

r3qbk1/pbp3pp/1r6/2p5/2NnPP2/2QPB3/1PP3PP/R4R1K b - - 0 1

Analysis by Stockfish dev-20231008-7a4de961:

23...Tb4 24.b3 h6 25.Dd2 Lc6 26.Df2 Tbb8 27.Lxd4 cxd4 28.Dxd4 Dd8 29.De3 Lb5 30.Txa7 Txa7 31.Dxa7 Ta8 32.Df2 Ta2 33.h3 Lb4 34.Kh2 De7 35.e5 Dd7 36.f5 Lc3 37.Dg3 Lxc4 38.bxc4 Dd4 39.e6 Df6 40.Kh1 Txc2 41.Dxc7 Te2 42.Df4 Ld4 43.Td1 Kh8 44.Tb1 Te3 45.Td1 Kh7 46.Dg4 Kg8 47.Df4 Te2 48.c5 Lxc5 49.d4 Le7 50.d5
-/+ (-0.75 --)   Tiefe: 43/64   00:02:59  2904MN
Schwarz steht besser

Lässt sich immerhin was sagen, die Engine, kann man sich's natürlich nicht verkneifen, auch noch die eigene obige Output- Variante vor- und zurückzuspielen, danach:

r3qbk1/pbp3pp/1r6/2p5/2NnPP2/2QPB3/1PP3PP/R4R1K b - - 0 1

Analysis by Stockfish dev-20231008-7a4de961:

23...Tb4 24.b3 h6 25.Dd2 Lc6 26.Df2 Tbb8 27.Lxd4 cxd4 28.Dxd4 Dd8 29.De3 Lb5 30.Txa7 Txa7 31.Dxa7 Ta8 32.Df2 Ta2 33.h3 Lb4 34.Kh2 De7 35.e5 Dd7 36.f5 Lc3 37.Dg3 Lxc4 38.dxc4 Dd4 39.e6 Df6 40.Kh1 Le5 41.De3 Ld6 42.c5 Le7 43.b4 Txc2 44.Df4 Db2 45.Tg1 Ld8 46.Td1 Lf6 47.Tg1 c6 48.Db8+ Kh7 49.De8
-/+ (-0.80 ++)   Tiefe: 44/80   00:01:39  1679MN
Schwarz steht besser

Engine bleibt beim A0- Zug, 5 Minuten hab' ich's nicht mehr abwarten wollen, dafür noch schnell Lc0 angeworfen, allerdings ohne das GUI neu zu starten, wird ja zwischen diesen beiden Engines nicht so viel Unterschied machen, mit dem Netz 2790M und der 3070ti GPU ist diese Engine praktisch von Anfang an auf 23...Tb4 und bleibt über 5 Minuten dabei, den Output hab' ich schon nach 4 Minuten kopiert:

r3qbk1/pbp3pp/1r6/2p5/2NnPP2/2QPB3/1PP3PP/R4R1K b - - 0 1

Analysis by Lc0 v0.31.0-dag+git.e429eeb:

23...Tb4 24.b3 h6 25.Dd2 Lc6 26.Df2 Tbb8 27.Ta5 Kh7 28.h3 a6 29.Se5 Tb5 30.Ta2 a5 31.Sc4 Ta6 32.f5 Dd8 33.Lf4 Le8 34.Lg3 Le7 35.Taa1 Tb8 36.Se3 Lf7 37.e5 Lg5 38.Tae1 a4 39.bxa4 Tb2 40.e6 Le8
-/+ (-0.82)   Tiefe: 18/58   00:03:50  1223kN
Schwarz steht besser

Und jetzt noch die Nr.6 angeschaut, um die erste SF- Runde mal fertig zu haben:

1r1q1r2/1pnbp1bk/2pp1npp/p1P2p2/N2P4/1Q3NP1/PP1BPPBP/2RR2K1 b - - 0 1

Analysis by Stockfish dev-20231008-7a4de961:

15...b5
  Die Stellung ist ausgeglichen: = (0.09)  Tiefe: 1/1   00:00:04  2132Knoten
15...b5
  Die Stellung ist ausgeglichen: = (0.09)  Tiefe: 2/2   00:00:04  4199Knoten
15...Scd5 16.e3 Le6
  Die Stellung ist ausgeglichen: = (0.16)  Tiefe: 3/3   00:00:04  12kN
---
15...Le6 16.Dd3 Ta8 17.Sb6 Ta6 18.a4 Scd5 19.Sc4 Se4 20.Sh4 Sxd2 21.Dxd2 Sf6 22.b4 Se4 23.Lxe4 fxe4 24.b5 Ta7 25.cxd6 exd6 26.Sg2 Df6 27.De3 Lxc4 28.Txc4 d5 29.Tc5 g5 30.h4 Tf7 31.hxg5 hxg5 32.Tdc1 Lf8 33.T5c2 cxb5 34.Tc7 bxa4 35.Txf7+ Dxf7 36.Dxg5 Ta6 37.Dh4+ Th6 38.Dd8 Tc6 39.Txc6 bxc6 40.Dxa5 a3 41.Se3 Dg6
  Die Stellung ist ausgeglichen: = (0.08 --)  Tiefe: 47/49   00:04:59  4515MN
...
15...Le6 16.Dd3 Ta8 17.Le1 Sd7 18.e3 Ld5 19.Sd2 Lxg2 20.Kxg2 d5 21.Sf3 e5 22.dxe5 Sxe5 23.Sxe5 Lxe5 24.Sb6 Tb8 25.Lc3 Lh8 26.Lxh8 Txh8 27.Sc4 Se6 28.Dc2 Tf8 29.a4 Sxc5 30.Sxa5 Dxa5 31.Dxc5 Dxc5 32.Txc5 Ta8 33.a5 Kg7 34.Ta1 Kf7 35.a6 Ke7 36.Tcc1 Txa6 37.Txa6 bxa6 38.Txc6 Tf6 39.Tc7+ Kd6 40.Tb7 Ke5 41.Kf3 Tc6 42.Tb8 h5 43.h3 Te6 44.Ke2 d4 45.exd4+ Kxd4+ 46.Kf3 Ke5 47.Tb3
= (0.04)   Tiefe: 49/66   00:08:06  7202MN
Die Stellung ist ausgeglichen

Hier herrscht wieder Einigkeit über den best move zwischen dem anderen Stern, von dem A0 kommt, und unserem heutigen Erdlings- Fisch, zumindest 8 Minuten lang


Edit: blöder Weise sehe ich erst jetzt beim Wiederdurchlesen, dass ich eine Zeile vom ...Le6- Output weggelöscht habe, die essentiell war, das erste Wechseln zum Output mit diesem Zug als bestem war unmittelbar nach der letzten Zeile mit ...Sd5, also schon nach Sekunden, nicht erst nach 5 Minuten.

Und wenn wir schon beim Nachtragen sind, Lc0 wechselt von f4 zu Dd4 in der Stellung Nr.4 nach einer Minute, kehrt aber dann auch wieder zu f4 zurück:

rn3rk1/pp1nqppp/2p5/4P2b/PbN5/2N2PPB/1P2P2P/R1BQK2R w KQ - 0 1

Analysis by Lc0 v0.31.0-dag+git.e429eeb:

12.f4 f6 13.e6 Sc5 14.f5 Td8 15.Dc2 Td4 16.Se3 La5 17.0-0 Sba6 18.Sa2 Txa4 19.b3 Sb4 20.Db1 Sxa2 21.Txa2 Txa2 22.Dxa2 Lb4 23.Lg2 Td8 24.g4 Le8 25.Lf3 Sa6 26.Kg2 Lc5 27.Sc2 h6 28.h4 Sc7 29.b4 Ld6 30.Dxa7 Sd5 31.Td1 Lc7 32.Dc5 Ld6 33.Df2 Sf4+ 34.Lxf4 Lxf4 35.Tb1 Lc7 36.Dc5 Ld6 37.Dc4 b5 38.Dc3 Lb8 39.Se3 Le5 40.Dc5 Ld6 41.Dc3 Le5 42.Da3
+/- (1.15)   Tiefe: 29/70   00:05:42  1800kN
Weiß steht besser
- - By Lothar Jung Date 2023-10-28 15:44 Edited 2023-10-28 15:51 Upvotes 1
Mich erstaunt, dass bei diesem Thread noch keiner die nachstehende Veröffentlichung thematisiert hat:

https://arxiv.org/pdf/2310.16410.pdf

Sie ist von den Alpha-Zero- Entwickler und befasst sich mit „Bridging the Human–AI Knowledge Gap: Concept Discovery and Transfer in AlphaZero“.

Interessant sind die Stellungsbeispiele und vor allem der Anhang.

Nebenbei ist zu bemerken, das kurz vor Ende der ersten TCEC-Runde der Vorsprung vom Stockfish nur noch 4 Punkte beträgt.
Dabei wurde das BT3-Netz adhoc in den Ring geworfen.
Es ist noch nicht austrainiert und die Optimierung der Parameter steht noch aus.
Parent - By Walter Eigenmann Date 2023-10-28 16:29
Lothar Jung schrieb:

Mich erstaunt, dass bei diesem Thread noch keiner die nachstehende Veröffentlichung thematisiert hat:
<a class='ura' href='https://arxiv.org/pdf/2310.16410.pdf'>https://arxiv.org/pdf/2310.16410.pdf</a>
Na ja, das ist ja auch erst zwei Tage alt, und wir haben nicht extra danach gesucht...
Aber trotzdem Dank für den Link/Artikel - scheint interessant zu sein!

Gruss: Walter

.
Parent - - By Max Siegfried Date 2023-10-28 22:38
Lothar Jung schrieb:

Mich erstaunt, dass bei diesem Thread noch keiner die nachstehende Veröffentlichung thematisiert hat:

<a class='ura' href='https://arxiv.org/pdf/2310.16410.pdf'>https://arxiv.org/pdf/2310.16410.pdf</a>

Sie ist von den Alpha-Zero- Entwickler und befasst sich mit „Bridging the Human–AI Knowledge Gap: Concept Discovery and Transfer in AlphaZero“.

Interessant sind die Stellungsbeispiele und vor allem der Anhang.

Nebenbei ist zu bemerken, das kurz vor Ende der ersten TCEC-Runde der Vorsprung vom Stockfish nur noch 4 Punkte beträgt.
Dabei wurde das BT3-Netz adhoc in den Ring geworfen.
Es ist noch nicht austrainiert und die Optimierung der Parameter steht noch aus.


https://global.techradar.com/de-de/computing/gpu/geruchteweise-wird-nvidias-rtx-5090-fast-doppelt-so-schnell-werden-wie-die-rtx-4090-ein-titan-auf-dem-vormarsch

RTX 4090: 512 Tensor-Kerne der vierten Generation
RTX 5090: 768 Tensor-Kerne der fünften Generation

Ist schon absehbar wann BT4 erscheint und wann die Netzgröße erhöht/verdoppelt wird?
Was ist deiner Meinung nach der Grund warum Stockfish so (schlecht) abgeschnitten hat?
Wird sich das Ergebnis von Stockfish in Zukunft verschlechtern?
Gibt es inzwischen Bereiche oder Stellungen die LC0 eindeutig deutlich besser spielt als Stockfish?
Die Bewertung von LC0 hat sich der von Stockfish angenähert. Man sieht selten extreme Bewertungsabweichungen.
Ist die Tiefe von Stockfish noch ausschlaggebend genug in Partien gegen LC0?
Ist Stockfish immer noch besser im Endspiel?
Ist Stockfish laut CCC immer noch besser bei kurzen Bedenkzeiten?
Parent - By Roland Riener Date 2023-10-28 22:56 Upvotes 4
Zitat:
Ist schon absehbar wann BT4 erscheint und wann die Netzgröße erhöht/verdoppelt wird?
Was ist deiner Meinung nach der Grund warum Stockfish so (schlecht) abgeschnitten hat?
Wird sich das Ergebnis von Stockfish in Zukunft verschlechtern?
Gibt es inzwischen Bereiche oder Stellungen die LC0 eindeutig deutlich besser spielt als Stockfish?
Die Bewertung von LC0 hat sich der von Stockfish angenähert. Man sieht selten extreme Bewertungsabweichungen.
Ist die Tiefe von Stockfish noch ausschlaggebend genug in Partien gegen LC0?
Ist Stockfish immer noch besser im Endspiel?
Ist Stockfish laut CCC immer noch besser bei kurzen Bedenkzeiten?

Ein Narr kann mehr fragen, als sieben Weise beantworten können.
Deutsches Sprichwort
Parent - By Lothar Jung Date 2023-10-29 08:44 Edited 2023-10-29 08:48
Stockfish hat nicht schlecht abgeschnitten, sondern nur weniger gut.
Bei BT4 wurden lediglich die Trainingsparameter entwickelt.
Vielleicht könnte das nächste BT3-Netz noch ein wenig stärker werden.
Die Hauptsache ist, dass die Tuniere wieder spannender werden und die Partien schönes Schach zeigen.
- By Lothar Jung Date 2023-10-29 08:47
Lesenswerter Blog von Kasparow zu Alpha-Zero:

https://www.science.org/doi/10.1126/science.aaw2221
- - By Lothar Jung Date 2023-10-29 18:18 Upvotes 1
Ein kleiner Stern, das neue BT3 Netz:

https://drive.google.com/file/d/1Lx0ycvybD6_w1EL42pOC6GLqry0Ru7ww/view?usp=sharing
Parent - - By Walter Eigenmann Date 2023-10-29 19:58
Lothar Jung schrieb:
Ein kleiner Stern, das neue BT3 Netz:
<a class='ura' href='https://drive.google.com/file/d/1Lx0ycvybD6_w1EL42pOC6GLqry0Ru7ww/view?usp=sharing'>https://drive.google.com/file/d/1Lx0ycvybD6_w1EL42pOC6GLqry0Ru7ww/view?usp=sharing</a>
Ich warte ja immer noch darauf, dass die Lc0-Macher endlich eine Leela-Variante bringen, die auf meiner Radeon-RX-6900XT-Karte ebenso stark performt wie auf den NVidia's ...

.
Up Topic Hauptforen / CSS-Forum / Schach von einem anderen Stern: ALPHA-ZERO

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill