Ich würde es sehr begrüßen, wenn hier die Mittelspiel-Schwächen von Leela, die ich nicht vorschnell als "taktische" Schwächen klassifizieren will (auch wenn sich dieser Eindruck aufdrängt), näher untersucht und eventuell auch klassifiziert werden könnten.
Das ist allerdings weniger ein Thema für Schnelltests und Blitzpartien, sondern mich interessiert der Aspekt für Analysen, d.h. welches sind die optimalen Einstellungen für solche Zwecke, und was muss man einfach hinnehmen als strukturelle Defizite, die mit Folgeversionen hoffentlich noch behoben werden (können).
Mir ist dabei klar, dass
Leela als Analysetool bisher wenig taugt, was die Verlässlichkeit von Bewertungen, Tiefenangaben, Rangfolge von Kandidatenzügen etc. betrifft. Die "Macken" zeigen sich besonders, wenn man während der Analyse die Aanzahl der Varianten verändert. Dann verdoppelt sich auch schon mal die Anzeige der Rechentiefe sprunghaft - dies nur als Beispiel. Dennoch ist es natürlich sehr interessant, Leela neben Stockfish u.a. Engines bei der Partie- und Stellungsanalyse einzusetzen.
Hier ein Beispiel, das mich schier (ver)zweifeln lässt:
Event:
Ort:
Datum:
Weiss:
Schwarz:
Ergebnis
Board
Wie neue Stockfish-Versionen (9f.) auf Anhieb (ca. Tiefe 25) erkennen, kommt Weiß hier mit 14.Le3 zu einem sehr aussichtsreichen Angriff, der forciert zu einem gewinnträchtigen Endspiel führt:
14...Qxb2 15. Bxc5 Qxa1 16. Qb3 Ba6 17. Bxe7 Bxf1 18. Kxf1 Bf8 19. Bxf8 Kxf8 20. Nd4 Kg7 21. Nc2 Rhb8 22. Nxa1 Rxb3 23. axb3
Die weißen Springer werden schon in Kürze gut zusammenarbeiten und den schwarzen Turm dominieren, bis Schwarz in eine passive Druckstellung gerät;
zum Beispiel:
23...Re8 24. b4 Rxe5 25. Nd2 Re8 26. Nab3 Kf6 27. Nd4 Rc8 28. N2b3 Ke5 29. Ke2 Kd6 30. Kf3 Kc7 31. Kf4, und es ist nur ein Frage der Zeit, bis Weiß gewinnt.
Leela habe ich in allen Versionen von 0.21.0 bis 0.21.4 rechnen lassen und enttäuscht festgestellt, dass die späteren Versionen 21.2-21.4 auch nach längerem Rechnen 14.b4 (ca. 0.00 bis +0.20) bevorzugen und 14.Le3 als günstig für Schwarz bewerten (-0.60 bis günstigstenfalls 0.00), soweit im 3-Variantenmodus angezeigt. Im 1-Variantenmodus erscheint logischerweise 14. Le3 dann überhaupt nicht. - Das ist für mich erstaunlich, weil 14.Le3 eigentlich ein typischer Zug für das initiativreiche Figurenspiel von Leela auf den Spuren von AlphaZero sein müsste und das vorübergehende Turmopfer kaum der Rede wert sein dürfte angesichts des Damenfangs.
(Übrigens: "Überhaupt nicht" stimmt nicht ganz - in Tiefe 4-7 wird 14.Le3 kurz als "bester Zug" angezeigt und dann gleich wieder verlassen. Würde es also in einer Blitzpartie gespielt werden könnte man nur sagen "Glück gehabt", denn die richtige Begründung für den guten Zug würde fehlen.)
Die älteren Leela-Versionen 0.21.0 und 0.21.1 gehen im Mehrvariantenmodus nach längerem Rechnen manchmal (evtl. abhängig von den Netzen und von Parametern) zu 14.Le3 über.
In der Regel habe ich fürs Testen die hier empfohlenen Parameter-Einstellungen (s. z.B. Keck u. Strangmüller), aber auch die "defaults" verwendet und auch die jeweils besten 40er Netze verwendet; Grafikkarte RTX 2070 8Gb. Chessbase 15 GUI (= "Fritz").
MIr ist natürlich klar, dass die NN Engines anders ticken als die AB Engines und weniger geeignet sind zum punktgenauen Ausanalysieren, doch würde mich brennend interessieren, ob
a) andere Tester zu anderen Ergebnissen in nach 13...Lg7 kommen und ob dies möglicherweise,
b) falls es so ist, mit Parametereinstellungen zu tun hat.
Für mich sieht es generell nicht so aus, ols ob man z.B. durch Veränderungen an "cpuct", "cpuctbase" und cpuctfactor grundätzlich zu besseren Analyseergebnissen kommt. Damit habe ich experimentiert, hat nichts gebracht.
Desweiteren würde ich anregen, Mittelspielstellungen zu sammeln, in denen Leela "blinde Flecken" hat, um ein kompletteres Gesamtbild zu bekommen.