Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / interessante Fehler gegen die aktuellen NN-engines
- - By Guenter Stertenbrink Date 2018-10-09 07:50 Edited 2018-10-09 08:42
habt ihr die Partien von Greg Mattson aus dem Lc0-Forum gesehen ?
https://groups.google.com/group/lczero/attach/38c48e448704e/2000000000_2500000.pgn?part=0.1

Lc0-11248 gewann gegen StockFish 9 mit 15.5-8.5 bei etwa halber
Knotenzahl wie im Alpha0-Match , allerdings hatte SF9 nur 16MB Hash.
Wieviel Elo macht das eigentlich wohl gegenueber 1000MB ?

Jedenfalls ohne Buch kamen oft dieselben Zuege heraus bis Zug 30 oder so
und dann kams drauf an, findet StockFish den Fehler oder nicht.

Das sieht so aus, als haette Lc0 "Fallenstellen"  gelernt, Eroeffnungen vorbereitet.

eval-charts : http://magictour.free.fr/MATTSON1.GIF

z.B. SF9 mit Weiss :

aus Partie 7,21,23 , findet SF9 den Fehler 23.Tfe1 ?

oder SF9 mit Schwarz

aus Partie 8,14,16 , findet SF9 den Fehler 29.Lxd6 ? (falls es nicht eh schon verloren ist)

Mich wuerde interessieren, ob Lc0 diese Stellungen tatsaechlich schon mal hatte in den Trainingspartien.
Parent - - By Peter Martan Date 2018-10-09 08:49 Edited 2018-10-09 09:22
Definiere "findet den Fehler".
Avoid move Teststellung, im Sinne von, jeder andere Zug an erster Stelle im Output gilt als gelöst?
Wie lange soll die single variant mode Rechenzeit sein, um sicher zu sein, dass es sich die Engine nicht doch noch zum Schlechteren überlegt?

Darf's auch SF dev. statt SF9 sein? (Ich hab' ihn sicher noch irgendwo, aber ich müsste ihn jedenfalls neu installieren.)

Allen diesen Fragen mal vorgreifend, 24threads einer 12x3GHz Intel- CPU, 32G Hash mit leerem Hash gestartet, jeweils so  3 Minuten laufen lassen, immer nur ein einzelner Versuch (3 sollte man für SMP immer wenigstens machen eigentlich):

21.Tfe1? am



Analysis by Brainfish 280918 64 POPCNT:

23.Dd3 Tca8 24.a3 Dd8 25.Lf3 bxa3 26.Txa3
  +/-  (0.82)   Tiefe: 7/7   00:00:08  55kN
...
23.Dd3 Sg8 24.Lf3 Tc2 25.a4 Txb2 26.De3 Ta8 27.Lg4 Dd8 28.Dc1 Tb3 29.Dc4 Tb2
  =  (0.00)   Tiefe: 26/30   00:00:11  82188kN
23.Dd3
  =  (0.08 ++)   Tiefe: 27/37   00:00:13  106MN
23.Dd3 Sg8 24.Lf3 Tc2 25.a4 Txb2 26.De3 Ta8 27.Lg4 Dd8 28.Dc1 Tb3 29.Dc4 Tb2
  =  (0.00)   Tiefe: 27/37   00:00:13  106MN
...
23.Dd3 Sg8 24.Lf3 Tc2 25.a4 Txb2 26.De3 Ta8 27.Lg4 Dd8 28.Dc1 Tb3 29.Dc4 Tb2
  =  (0.00)   Tiefe: 51/15   00:03:15  4150MN

Und dann 29...Lxd6? am



Analysis by Brainfish 280918 64 POPCNT:

29...La8 30.Kb1 c5 31.dxc5+ Kxc5 32.Thh8 Lxd6 33.exd6
  -/+  (-1.32)   Tiefe: 7/9   00:00:01  63kN
29...La8 30.g6 S8xg6 31.Sc8+ Kc7 32.Sxe7 Sxe7 33.Txd8 Sd3+ 34.Kb1
  =/+  (-0.46)   Tiefe: 8/10   00:00:01  93kN
29...La6 30.Kc2 c5 31.dxc5+ Kxc5 32.Thh8 Kd4 33.g6 Kxe5 34.g7
  =  (-0.22)   Tiefe: 9/11   00:00:01  269kN
29...Kc7 30.Thh8 Se2+ 31.Kb1 Sxd4 32.g6 Sxg6 33.Txd8 Sxh8 34.Txh8 Lxd6
  =  (0.17)   Tiefe: 10/14   00:00:01  1045kN
29...La6 30.Thh8 b4 31.g6 c3 32.bxc3 bxc3 33.Kc2 Ld3+ 34.Kxc3 Lxg6 35.Lxg6 S4xg6 36.Th1
  =/+  (-0.48)   Tiefe: 11/14   00:00:01  1654kN
29...La6 30.Thh8 Se2+ 31.Kd2 Sxd4 32.g6 Sf3+ 33.Kc2 Sxg6 34.Lxg6 Txg8 35.Txg8 Sxe5 36.Sf7 Sf3
  =/+  (-0.37)   Tiefe: 12/20   00:00:01  1775kN
...
29...La6 30.Thh8 b4 31.Lh5 c3 32.bxc3 bxc3 33.Kc2 c5 34.Kxc3 cxd4+ 35.Kxd4 Sxh5 36.Txh5 Lxd6 37.exd6 Txd6+ 38.Kc3 Td3+ 39.Kb2 Td2+ 40.Kc1 Txf2 41.g6 Sxg6 42.Txg6 Lc4 43.a3 Ta2 44.Th4 Lb3 45.Kb1 Txa3 46.Kb2 Ta4 47.Txa4 Lxa4 48.Txe6+ Kc5 49.Ka3 Ld7 50.Tf6 Le8 51.Tf2
  =  (0.14)   Tiefe: 27/44   00:00:09  209MN
...
29...La6 30.Kc2 b4 31.Th4 Sd3 32.Te4 Sxf2 33.Te3 c5 34.dxc5+ Kxc5 35.g6 Kd4 36.g7 Kxe3 37.Th8 c3 38.g8D Ld3+ 39.Kc1 Sg6 40.Lxg6 Txg8 41.Txg8 cxb2+ 42.Kxb2 a4 43.Lxd3 Sxd3+ 44.Kc2 Sxe5 45.Sb5 Sc6 46.Ta8 b3+ 47.axb3 axb3+ 48.Kxb3 Sd4+ 49.Sxd4 Kxd4 50.Kc2 e5 51.Kd1 Kd3 52.Ta7
  =  (0.14)   Tiefe: 31/54   00:00:44  1040MN
29...La6
  =  (0.06 ++)   Tiefe: 32/20   00:00:54  1288MN
29...La6 30.Thh8 b4 31.Lh5 Sd3+ 32.Kc2 Se1+ 33.Kd1 Sd3
  =  (0.00)   Tiefe: 32/51   00:01:13  1733MN
...
29...La6 30.Thh8 b4 31.Lh5 Sd3+ 32.Kc2 Se1+ 33.Kd1 Sd3
  =  (0.00)   Tiefe: 40/43   00:03:18  4655MN

Mein Vorschlag für avoid move prinzipiell immer der am einfachsten durchführbare Weg, um zu sehen, ob die Engine mit dem am selbst auch richtig umgeht, ihn ihr nach der Testzeit mit leerem Hash auf der Teststellung gestartet, eingeben.
Alternativ gleich auf dem ausgeführten am mit neuerliche leerem Hash starten, ist eine zweite Möglichkeit, sagt aber natürlich nix ohne den Vortest auf der Vorstellung.
Gleich mit so vielen MV- Lines starten, dass der am dabei ist, ist eine weitere Möglichkeit, kostet aber auch Zeit und ist auch nur bedingt vergleichbar mit den anderen Methoden.
Wenn es knifflige Stellungen sind, braucht man Testlines, mit denen man mehr als den ersten Halbzug nach der Teststellung im Output vergleichen kann, Eval allein ohne Züge dazu reicht eigentlich nie.

Daher hier jetzt nur noch der Folgeoutput nach Methode eins, gleich nach dem ersten Output in der angegebenen Rechenzeit den am eingegeben:



Analysis by Brainfish 280918 64 POPCNT:

23...Dd8 24.Lf3 Db6 25.g4 f6 26.g5 fxg5
  =  (0.00)   Tiefe: 7/7   00:00:00  18kN
...
23...Sg8 24.Dd3 Dd8 25.Lf3 Sf6 26.Le2 Tca8 27.Dc4 Ta4 28.Lf1 Da5 29.b3 Txa2 30.Txa2 Dxa2 31.Dxb4 Sg4 32.Le2 Sf6
  =  (0.00)   Tiefe: 20/20   00:00:00  903kN
23...Sg8 24.Dd3 Dd8 25.Lf3 Sf6 26.Le2 Tca8 27.Dc4 Ta4 28.Lf1 b3 29.Dxb3 Sxe4 30.Lxh3 Da5 31.De3 Sc5 32.Lf1 Txa2 33.Txa2 Dxa2 34.Dc3 Dxd5 35.Lc4 Dd4 36.Dxd4 exd4 37.Te7 Ta1+ 38.Kg2
  =  (-0.08)   Tiefe: 21/40   00:00:00  1944kN
23...Sg8 24.Dd3 Dd8 25.Lf3 Sf6 26.Le2 Tca8 27.Dc4 Ta4 28.Lf1 b3 29.Dxb3 Sxe4 30.Lxh3 Da5 31.Tec1 Sc5 32.Dc2 Td4 33.Td1 Txd1+ 34.Dxd1 Dxb5 35.b3 Ta3 36.De1 Dd3 37.Lf1 Dc2
  =  (-0.08)   Tiefe: 22/40   00:00:00  2294kN
23...Sg8 24.Dd3 Dd8 25.Lf3 Sf6 26.Le2 Tca8 27.Dc4 Ta4 28.Lf1 b3 29.Dxb3 Sxe4 30.Lxh3 Da5 31.Tec1 Sc5 32.Dc2 Td4 33.Lf1 Td2 34.Dc4 Txb2 35.Tc2 Tb4 36.Dc3 Td4 37.Dxa5 Txa5
  =  (-0.09)   Tiefe: 23/40   00:00:00  6469kN
...
23...Tca8
  =  (-0.30 ++)   Tiefe: 41/58   00:02:04  2653MN
23...g5
  =/+  (-0.48 ++)   Tiefe: 41/62   00:03:07  4017MN
23...g5 24.a4 bxa3 25.bxa3 Ta4 26.De3 g4 27.Db3 Tcc4 28.Tec1 Txc1+ 29.Txc1 Td4 30.a4 Dd8 31.Da3 Db6 32.a5 Dxb5 33.Dxd6 f6 34.Db6 Dxb6 35.axb6 Tb4 36.f3 Txb6 37.fxg4 Tb3 38.Td1 Kf7 39.g5 fxg5 40.Tf1+ Ke7 41.Lf3 g4 42.Le2 Tb2 43.Kf2 Sf7 44.Ke3 Sd6 45.Lxg4 Txh2 46.Te1 Kf6 47.Kf3 b5 48.Ld7 b4 49.Tb1 Tc2 50.Lxh3 Tc3+ 51.Kg4 b3 52.Lg2
  =/+  (-0.59)   Tiefe: 41/62   00:04:03  5218MN
23...g5
  =/+  (-0.68 ++)   Tiefe: 42/22   00:04:40  6023MN
23...g5
  -/+  (-0.76 ++)   Tiefe: 42/56   00:05:17  6834MN
23...g5
  -/+  (-0.89 ++)   Tiefe: 42/56   00:05:55  7673MN

  -/+  (-0.89 ++)   Tiefe: 42/56   00:05:55  7673MN

Danach, weil die falsche 0.00- Eval zwar nur Sekunden lang bestehen bleibt, dann aber noch lange keine ordentliche Diskrimination zum Output vor dem am zeigt, könnte man z.B. immer noch trefflich streiten, ob das jetzt als gelöst gelten soll, oder nicht.

Hingegen nach dem Eingeben von 29...Lxd6? am:



Analysis by Brainfish 280918 64 POPCNT:

2.exd6 c5 3.Thh8 Txd6 4.Txf8 Txd4 5.Tb8
  +/=  (0.33)   Tiefe: 7/7   00:00:00  22kN
...
2.exd6
  +/-  (1.03 ++)   Tiefe: 26/48   00:00:08  195MN
2.exd6
  +/-  (1.28 ++)   Tiefe: 26/48   00:00:10  255MN
2.exd6 c5 3.f3 Txd6 4.Txf8 Lxf3 5.Tf1 Sd3+ 6.Kd2 Se5 7.Tb8+ Ka7 8.Txb5 Txd4+ 9.Kc1 Ka6 10.Tb8 Le4 11.g6 Lxg6 12.Lxg6 Sxg6 13.Te1 Sf4 14.Kc2 Ka7 15.Tf8 Kb7 16.Tf7+ Kc6 17.a3 a4 18.Ta7 Kb5 19.Kb1 Kc6 20.Te5 Kd6
  +/-  (1.29)   Tiefe: 26/49   00:00:13  307MN
...
2.exd6 c5 3.f3 Sd3+ 4.Kd2 Txd6 5.Txf8 Txd4 6.g6 Sf4+ 7.Ke3 e5 8.g7 Td3+ 9.Kf2 Txf3+ 10.Ke1 Te3+ 11.Kd2 Td3+ 12.Kc2 Lxh1 13.g8D Le4 14.Lg6 Sxg6 15.Tf6+ Kc7 16.Tf7+ Td7+ 17.Kc1 Sf4 18.Txd7+ Kxd7 19.Df7+ Kd6 20.a4 bxa4 21.Df8+ Kd7 22.Kd2 Se6 23.Db8 Sc7 24.Dh8 Ld5 25.Dxe5 Kc6 26.Dg5 Kb5 27.Dg7 Kb6
  +-  (1.98)   Tiefe: 29/52   00:00:45  1111MN
2.exd6
  +-  (2.07 ++)   Tiefe: 30/66   00:00:52  1265MN
...
2.exd6 c5 3.f3 Txd6 4.Txf8 Lxf3 5.Tf1 Sd3+ 6.Kd2 Se5 7.Lxe6 Txd4+ 8.Ke3 Te4+ 9.Kf2 Kc7 10.Kg3 Lg4 11.Lf5 Lxf5 12.T8xf5 a4 13.Td1 Sd3 14.g6 Te8 15.Kh4 Tg8 16.Kg5 Sxb2 17.Txc5+ Kb6 18.Tdd5 Sd3 19.Txb5+ Kc6 20.Kf5 c3 21.Txd3 Kxb5
  +-  (2.22)   Tiefe: 31/69   00:01:18  1919MN
...
2.exd6
  +-  (2.31 ++)   Tiefe: 32/61   00:01:40  2465MN

An diesem Vergleich zum Output der eigentlichen Testellung stimmt zwar die Evalrelation recht bald, die im ersten ist allerdings zu niedrig, könnte man also als wirklich beweisendes Ergebnis auch anzweifeln.
Avoid Move Teststellungen sind schwer zu beurteilen, dazu kommt noch, dass sie einen gewissen "Verführungsgrad" darstellen müssen, soll heißen, die Engines sollten gute (schlechte ) Gründe haben, ihn überhaupt spielen zu wollen. Sonst hat es jedenfalls keinen Sinn, sie in Testsets einzubauen, in denen nur single move "found" (solved- not solved) als Plus oder Minus gezählt wird.
Parent - - By Guenter Stertenbrink Date 2018-10-09 09:24 Edited 2018-10-09 09:43
ist also was faul an den Partien, SF9 spielte zu schlecht ?

(erkannter) Fehler = die eigene eval sinkt stark nach einigen weiteren Zuegen

23.Rfe1 {0.00/52 787s}
23.Rfe1 {0.00/44 780s}
23.Rfe1 {0.00/52 790s}
23.Rfe1 {0.00/52 795s}

29...Bxd6 {-0.39/36 762s} im vorigen Zug noch 0.00
29...Bxd6 {-0.39/36 764s}
29...Bxd6 {-0.39/36 764s}

mit einem thread , also die Tiefe ist seichter
Parent - - By Peter Martan Date 2018-10-09 10:04 Edited 2018-10-09 10:08
Günter, ich bin wieder unnötig weitschweifig, aber es ist mir ein altes Anliegen.

Aus dem Partieverlauf gespielte Züge sind immer etwas anderes, als mit leerem Hash gestartete Analysen.
Abgesehen von den bekannten Parametern, die eine Rolle spielen wie TC und Rechnerleistung (im weitesten Sinn, was für ein Hash in welcher Größe spielt oft mehr Rolle als die CPU), spielen Engines, die den Hash aus den Vorstellungen der Züge bis dorthin gefüllt haben, oft und oft anders als mit leerem Hash.

Die beiden Stellungen sind, wie ich versucht habe zu schildern und zu zeigen, als Teststellungen im klassischen Sinn nicht verwendbar, es ist zu wenig Verführung in den Zügen, die du als am verwenden willst.
Und Output- Lines und Evals mit und ohne Forward bis dorthin und oder Backward nach Eingabe von Folgezügen sind ja, sei ehrlich, auch nicht wirklich dein Anliegen, dich da mit bestimmten Compiles von bestimmten Versionen im Detail so auseinanderzusetzen, dass das dann reproduzierbare vergleichbare Ergbenisse werden, nicht auf single core und nicht auf Mehrkern, ich würde heutzutage immer letzteres zumindest auch anschauen wollen, halt mit je 3 Runs pro Output- Vergleich.

Und was ich eigentlich nur sagen wollte, gerade bei LC0, was ich so von Anderen höre und sehe, ist der Unterschied von Zug in der Partie und Output im leer gestarteten Stellungstest oft und oft noch erstaunlicher als bei ABlis (um die auch mal zu verdiminutiven, damit man mir das nächste Layla- Mausi dafür wieder nachsieht )

Was sagt denn deine LC0- Version auf deiner Hardware zu den Stellungen, wenn du sie mit leerem Hash drauf ansetzt übrigens?

Und zu deiner eigentlichen letzten Frage, ja natürlich spielte SF9 in der jeweiligen Partie zu schlecht, aber das war ja wohl auch mehr eine rhetorische Frage, oder?
Und "ob was faul war an den Partien", kann man ohne sie mit den Voraussetzungen, unter denen sie gespielt wurde und dem Verlauf zumindest nachher mit Evals und Tiefen kommentiert, zu kennen, sowieso nicht beantworten.
Parent - - By Guenter Stertenbrink Date 2018-10-09 10:31 Edited 2018-10-09 10:43
also eine Analyse mit leerem Hash vermeidet die 2 Zuege und erkennt die schlechten evals
bereits nach kurzer Zeit , waehrend in der Partie mit "besserem" Hash ,
wenn auch nur 16MB nach 700s auf einem Kern das nicht erkannt wird ?!

Mit schlecht gespielt meine ich , schlechter als sf9 normal spielt, ist also irgendwas
faul an dem Setting , GUI , Betriebssystem , multitasking , cutechess commandline , ?

auf dem Tablet mit einem thread dauert es ca. 3200s , ich melde mich dann

in meinem vorigen posting war uebrigens die eine Tiefe 44 (statt 52) irrtuemlich
aus einer anderen Eroeffnung mit 23.Rfe1, ich kann's jetzt nicht mehr editieren.
Parent - By Peter Martan Date 2018-10-09 13:10
Guenter Stertenbrink schrieb:

also eine Analyse mit leerem Hash vermeidet die 2 Zuege und erkennt die schlechten evals
bereits nach kurzer Zeit , waehrend in der Partie mit "besserem" Hash ,
wenn auch nur 16MB nach 700s auf einem Kern das nicht erkannt wird ?!

Das mit dem besseren Hash ist eben auch so eine Sache, wenn du damit meinst, dass die Einträge mit den Zügen aus der Partie vor der Stellung, den Hash automatisch "verbessern".

Gerade bei LC0 sieht man häufig, dass sie sich "in einen Wirbel" hinein spielt, selbst Verwicklungen herbeiführt, bei denen sie dann taktisch patzt, weil sie was zu wenig durchgerechnet hat, was ihr ihre NN- Evals als zu erfolgversprechend einbebrockt haben in der Suche.

"Fallenstellen" hat das überhaupt so an sich, dass man sich dabei immer auch selbst überlisten kann, merke: wer Anderen eine Grube gräbt, ist selbst ein Hilfsarbeiter.

Das kann AB- Engines natürlich genau so passieren, man sieht's bei aggressiven Settings typischer Weise häufiger als bei Default- Einstellungen. Fehler, die dann in der Partie passieren, müssen nicht unbedingt durch "besseren" Hash vermieden werden können, sondern bei denen ist dann leerer Hash zeitweise besser, weil nicht mit überoptimistischen Vorberechnungen belastet.
- - By Guenter Stertenbrink Date 2018-10-20 12:11 Edited 2018-10-20 12:16
StockFish - LC0 , TCEC-cup

[fen]

1.e4 c5 2.c3 Da5 (book)  3.Sf3 e6 4.Ld3 d5 5.exd5 exd5
6.O-O Sc6 7.Lc2 Ld6 8.d4 c4 9.Te1+ Sge7 10.Sg5 h6 ?
11.Dh5 O-O 12.Sh7 Te8 13.Sf6+ gxf6

und hier hatte Lc0 wohl Lh7+ !  uebersehen
Parent - By Patrick Götz Date 2018-10-20 16:05 Upvotes 1
- By Guenter Stertenbrink Date 2018-12-14 08:05 Edited 2018-12-14 08:07
Arasan-Lc0 , TCEC14,Div.3
1. d4 Nf6 2. c4 g6 3. Nc3 Bg7 4. e4 O-O 5. Nf3 d6
6. Be2 e5 7. dxe5 dxe5 8. O-O Nc6 9. Qxd8 Nxd8 10. Rd1 Bg4
11. Be3 Bxf3 12. Bxf3 Ne6 13. Na4 Rfe8 14. Nc5 Nxc5 15. Bxc5 Bh6
16. g4 a5 17. Ba3 Bg5 18. Rd3 b6 19. b3 h6 20. Bb2 Nh7
21. Rad1 Bf4 22. h4 Nf8 23. Kf1 Ne6 24. Rd7 Rac8 25. h5 Kg7
26. R7d5 Kf6 27. hxg6 fxg6 28. Be2 Nc5 29. Bf3 Ne6 30. Be2 Nc5
31. Bf3 Na6 32. Ba3 Nb4 33. Rd7 Nxa2 34. Rh7 Nb4 35. Rdd7 Rcd8
36. Rdf7+ Kg5 37. Rhg7 Rf8 38. Rf5+ Kh4 39. Rxg6 Rxf5 40. gxf5 Bg5
41. Be2 Rd6 42. Bb2 Nc6 43. f4 Bxf4 44. Ba3 Nb4 45. Bxb4 axb4
46. Rg4+ Kh3 47. Rxf4 exf4 48. e5 Rd7 49. f6 Rf7 50. c5 Rf8
51. Bc4 Kg3 52. e6 Rxf6 53. e7 b5 54. Bg8 1-0



35...Rcd8 ?  Stockfish geht danach sofort (Tiefe 17) auf +1.70

36.Rdf7+ Kg5 37.Rhg7 Rf8 38.Rf5+ Kh4 39.Rxg6 +-
- By Guenter Stertenbrink Date 2018-12-14 08:39 Edited 2018-12-14 08:42
Lc0-Booot , TCEC14,div.2



schon 81 Zuege geschaffelt , dann

90.Ra2 ? (-1.40d17) b5 91.axb5 axb5 92.Be2
(Nxb5 geht nicht wegen Rxb5,Bxb5,Rxd5 droht Bc5+ und Bb5 haengt)
92...Rc3+ 93.Bd3 Rxd5
- By Guenter Stertenbrink Date 2018-12-21 12:22 Edited 2018-12-21 12:25


Komodo MCTS - Fritz  , TCEC14 , Div.1

26.Rxf5 ? Kf7 ? 27. d6  und remis

26...Rd6 27.Rh5 Kg8
- - By Guenter Stertenbrink Date 2019-02-09 17:04
hier eine Sammlung der TCEC-Fehler :

https://groups.google.com/forum/#!topic/lczero/QQftH_0_G0Y
Parent - - By Reinhold Stibi Date 2019-02-11 18:20
Aus meiner eigenen Testreihe:

Leider führt Lc0 bei etlichen Endspielen eine gewonnene Stellung nicht zielstrebig zum Sieg.

Die Partien werden zwar gewonnen aber durch viele unsinnige, unzweckmäßige Züge.

Man möchte am liebsten selber eingreifen wenn man könnte. Solche Anfängerzüge
tun richtig weh.
Parent - - By Volker Göbel Date 2019-02-12 07:27
Reinhold Stibi schrieb:

Aus meiner eigenen Testreihe:

Leider führt Lc0 bei etlichen Endspielen eine gewonnene Stellung nicht zielstrebig zum Sieg.

Die Partien werden zwar gewonnen aber durch viele unsinnige, unzweckmäßige Züge.

Man möchte am liebsten selber eingreifen wenn man könnte. Solche Anfängerzüge
tun richtig weh.


Das ist furchtbar mit anzusehen wie LcZero im Endspiel teilweise herum rudert, bei klar gewonnenem Spiel.
Ich hab schon gesehen dass so lange sinnlos herumgezogen worden ist, dass es sogar noch ein Remis nach der 50 Züge Regel geworden ist.  
Warum spielt Leela im Endspiel so einen Mist zusammen? Am liebsten würde ich dann hingehen, und die Partie gerade aufgeben.  
Parent - - By Olaf Jenkner Date 2019-02-12 07:55
Ist es eigentlich möglich, neuronale Netze mit einer Endspieldatenbank zu trainieren? Das müßte doch das Problem elegant beseitigen.
Parent - - By Volker Göbel Date 2019-02-12 08:23
In der Fritz Gui ist es wenigstens möglich dass die Nalimovs greifen.
In anderen Guis weiß ich leider nicht wie es da ist.
Auf Infinity kann man die Syzygys einbinden, aber selbst dann wird der kürzeste Gewinnweg nicht gefunden, und planlos erst mal rum gezogen.
Nix für jemand der schwache Nerven hat. Sowas mit an sehen zu müssen.
Am besten man schaut weg.       
Parent - By Lothar Jung Date 2019-02-12 09:46 Edited 2019-02-12 09:50
Ich glaube, dass es in absehbarer Zeit ein TB-Endspieltraing gegen wird.
Eine Stockfishversion gibt es schon und Dietrich Kappe stellt ein Endspiel-NN zur Verfügung.
Die Administratoren verfolgen jedoch strikt das Selbstlerntraining und hoffen, dass sich Leela das Endspiel selber beibringt.
Meine Erachtens sind dafür die Trainingspartien durch die sehr beschränkte Rechentiefe (800 Nodes) nicht geeignet.
TB-Training wäre jedenfalls auch KI.
Mit gutem Endspielwissen würde Leela40 an SF11DEV vorbeiziehen.
Up Topic Hauptforen / CSS-Forum / interessante Fehler gegen die aktuellen NN-engines

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill