Leela's blinde Flecken

By Arno Nickel Date 2019-07-30 18:41

Ich würde es sehr begrüßen, wenn hier die Mittelspiel-Schwächen von Leela, die ich nicht vorschnell als "taktische" Schwächen klassifizieren will (auch wenn sich dieser Eindruck aufdrängt), näher untersucht und eventuell auch klassifiziert werden könnten.

Das ist allerdings weniger ein Thema für Schnelltests und Blitzpartien, sondern mich interessiert der Aspekt für Analysen, d.h. welches sind die optimalen Einstellungen für solche Zwecke, und was muss man einfach hinnehmen als strukturelle Defizite, die mit Folgeversionen hoffentlich noch behoben werden (können).

Mir ist dabei klar, dass Leela als Analysetool bisher wenig taugt, was die Verlässlichkeit von Bewertungen, Tiefenangaben, Rangfolge von Kandidatenzügen etc. betrifft. Die "Macken" zeigen sich besonders, wenn man während der Analyse die Aanzahl der Varianten verändert. Dann verdoppelt sich auch schon mal die Anzeige der Rechentiefe sprunghaft - dies nur als Beispiel. Dennoch ist es natürlich sehr interessant, Leela neben Stockfish u.a. Engines bei der Partie- und Stellungsanalyse einzusetzen.

Hier ein Beispiel, das mich schier (ver)zweifeln lässt:

Event:

Ort:

Datum:

Weiss:

Schwarz:

Ergebnis

Board

Wie neue Stockfish-Versionen (9f.) auf Anhieb (ca. Tiefe 25) erkennen, kommt Weiß hier mit 14.Le3 zu einem sehr aussichtsreichen Angriff, der forciert zu einem gewinnträchtigen Endspiel führt:

14...Qxb2 15. Bxc5 Qxa1 16. Qb3 Ba6 17. Bxe7 Bxf1 18. Kxf1 Bf8 19. Bxf8 Kxf8 20. Nd4 Kg7 21. Nc2 Rhb8 22. Nxa1 Rxb3 23. axb3

Die weißen Springer werden schon in Kürze gut zusammenarbeiten und den schwarzen Turm dominieren, bis Schwarz in eine passive Druckstellung gerät;
zum Beispiel: 23...Re8 24. b4 Rxe5 25. Nd2 Re8 26. Nab3 Kf6 27. Nd4 Rc8 28. N2b3 Ke5 29. Ke2 Kd6 30. Kf3 Kc7 31. Kf4, und es ist nur ein Frage der Zeit, bis Weiß gewinnt.

Leela habe ich in allen Versionen von 0.21.0 bis 0.21.4 rechnen lassen und enttäuscht festgestellt, dass die späteren Versionen 21.2-21.4 auch nach längerem Rechnen 14.b4 (ca. 0.00 bis +0.20) bevorzugen und 14.Le3 als günstig für Schwarz bewerten (-0.60 bis günstigstenfalls 0.00), soweit im 3-Variantenmodus angezeigt. Im 1-Variantenmodus erscheint logischerweise 14. Le3 dann überhaupt nicht. - Das ist für mich erstaunlich, weil 14.Le3 eigentlich ein typischer Zug für das initiativreiche Figurenspiel von Leela auf den Spuren von AlphaZero sein müsste und das vorübergehende Turmopfer kaum der Rede wert sein dürfte angesichts des Damenfangs.

(Übrigens: "Überhaupt nicht" stimmt nicht ganz - in Tiefe 4-7 wird 14.Le3 kurz als "bester Zug" angezeigt und dann gleich wieder verlassen. Würde es also in einer Blitzpartie gespielt werden könnte man nur sagen "Glück gehabt", denn die richtige Begründung für den guten Zug würde fehlen.)

Die älteren Leela-Versionen 0.21.0 und 0.21.1 gehen im Mehrvariantenmodus nach längerem Rechnen manchmal (evtl. abhängig von den Netzen und von Parametern) zu 14.Le3 über.

In der Regel habe ich fürs Testen die hier empfohlenen Parameter-Einstellungen (s. z.B. Keck u. Strangmüller), aber auch die "defaults" verwendet und auch die jeweils besten 40er Netze verwendet; Grafikkarte RTX 2070 8Gb. Chessbase 15 GUI (= "Fritz").

MIr ist natürlich klar, dass die NN Engines anders ticken als die AB Engines und weniger geeignet sind zum punktgenauen Ausanalysieren, doch würde mich brennend interessieren, ob
a) andere Tester zu anderen Ergebnissen in nach 13...Lg7 kommen und ob dies möglicherweise,
b) falls es so ist, mit Parametereinstellungen zu tun hat.
Für mich sieht es generell nicht so aus, ols ob man z.B. durch Veränderungen an "cpuct", "cpuctbase" und cpuctfactor grundätzlich zu besseren Analyseergebnissen kommt. Damit habe ich experimentiert, hat nichts gebracht.

Desweiteren würde ich anregen, Mittelspielstellungen zu sammeln, in denen Leela "blinde Flecken" hat, um ein kompletteres Gesamtbild zu bekommen.

By Guenter Stertenbrink Date 2019-07-30 19:15

ich hatte mal hier einen Thread :
http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=114406
ist nun schon fast ein Jahr her und in letzter Zeit nicht mehr upgedatet.

Hier und da tauchen auch Stellungen in anderen Threads auf, aber schwer systematisch zu finden.
Dann kann man natuerlich noch Partiesammlungen nach eval-Spruengen durchsuchen

TCEC,CCCC,CCRL,CEGT,sp-cc,...

es gibt ja auch LeelaFish ... leider kein update seit langem

By Arno Nickel Date 2019-08-02 18:27 Edited 2019-08-02 18:33

Hier ist versehentlich der Partieanfang bis zur kritischen Teststellung nach 13...Lg7 verlorengegangen. Der geht wie folgt, wobei die Variante als solche keine Rolle spielen soll, sondern nur die resultierende Stellung, in der sich Leela schwertut.

Event:

Ort:

Datum:

Weiss:

Schwarz:

Ergebnis

Board

(Etwas ist komisch - die Vorschau zeigt mir Notation und animiertes Brett, doch wenn ich es absende, verschwindet immer irgendetwas. Deshalb hier also nun auch die Notation als reiner Text ohne Brettanimation:
[Event "Leela Test nach 13...Lg7"]
[Site "?"]
[Date "2019.08.02"]
[Round "?"]
[White "?"]
[Black "?"]
[Result "*"]
[ECO "B50"]
[PlyCount "26"]
[SourceVersionDate "2019.08.02"]

1. e4 c5 2. Nf3 d6 3. c3 Nf6 4. Bd3 Nc6 5. h3 d5 6. e5 Nd7 7. Bb5 Qb6 8. Ba4 c4
9. d4 cxd3 10. O-O g6 11. Qxd3 Nc5 12. Bxc6+ bxc6 13. Qd1 Bg7 *

By Guenter Stertenbrink Date 2019-08-07 10:40 Edited 2019-08-07 11:04

was ich noch fragen wollte ...

wie schnell findet Lc0 13.g4 im beschleunigten ("Topalov- ?") Drachen ?

1.e4 c5 2.Nf3 g6 3.d4 cxd4 4.Nxd4 Bg7 5.,Nc3 Nc6
6.Be3 Nf6 7.Bc4 O-O 8.Bb3 d6 9.f3 Bd7 10.Qd2 Nxd4
11.Bxd4 b5 12.h4 h5

By Kurt Utzinger Date 2019-08-07 12:09 Edited 2019-08-07 12:17

Guenter Stertenbrink schrieb:

Vermutlich gar nicht. Bei mir taucht 13.g4 erst als 9./10. Zug der Bestzüge auf. Bis
Lc0 das abgearbeitet hat und seine Meinung ändert, dürften Tage vergehen.
Mfg
Kurt

By 2phil4u Date 2019-08-11 19:29

Man kann ein neuronales Netzwerk nicht tunen.
Natürlich sind da Fehler und funny a4 openings.
Das Ding ist halt, Lc0 hat seinen eigenen Kopf aeh neuronales Netzwerk.
Die Ergebnisse sind hervorragend.
Eine Frage meinerseits bezüglich der Vorausberechnung war schon sehr schwer
Ich denke ein 2560 400 Netz mit 1 Mio Kn/s sollte etwas besser sein.
Interessen ist ja, ob bei perfektem Schachwissen die Taktiken in der Stellung selbst zu finden sind.
Nach dem Motto 4000 Eli mit Sichtiefe 0.