interessante Fehler gegen die aktuellen NN-engines

By Peter Martan Date 2018-10-09 08:49 Edited 2018-10-09 09:22

Definiere "findet den Fehler".
Avoid move Teststellung, im Sinne von, jeder andere Zug an erster Stelle im Output gilt als gelöst?
Wie lange soll die single variant mode Rechenzeit sein, um sicher zu sein, dass es sich die Engine nicht doch noch zum Schlechteren überlegt?

Darf's auch SF dev. statt SF9 sein? (Ich hab' ihn sicher noch irgendwo, aber ich müsste ihn jedenfalls neu installieren.)

Allen diesen Fragen mal vorgreifend, 24threads einer 12x3GHz Intel- CPU, 32G Hash mit leerem Hash gestartet, jeweils so 3 Minuten laufen lassen, immer nur ein einzelner Versuch (3 sollte man für SMP immer wenigstens machen eigentlich):

21.Tfe1? am

Analysis by Brainfish 280918 64 POPCNT:

23.Dd3 Tca8 24.a3 Dd8 25.Lf3 bxa3 26.Txa3
+/- (0.82)   Tiefe: 7/7   00:00:08 55kN
...
23.Dd3 Sg8 24.Lf3 Tc2 25.a4 Txb2 26.De3 Ta8 27.Lg4 Dd8 28.Dc1 Tb3 29.Dc4 Tb2
= (0.00)   Tiefe: 26/30   00:00:11 82188kN
23.Dd3
= (0.08 ++)   Tiefe: 27/37   00:00:13 106MN
23.Dd3 Sg8 24.Lf3 Tc2 25.a4 Txb2 26.De3 Ta8 27.Lg4 Dd8 28.Dc1 Tb3 29.Dc4 Tb2
= (0.00)   Tiefe: 27/37   00:00:13 106MN
...
23.Dd3 Sg8 24.Lf3 Tc2 25.a4 Txb2 26.De3 Ta8 27.Lg4 Dd8 28.Dc1 Tb3 29.Dc4 Tb2
= (0.00)   Tiefe: 51/15   00:03:15 4150MN

Und dann 29...Lxd6? am

Analysis by Brainfish 280918 64 POPCNT:

29...La8 30.Kb1 c5 31.dxc5+ Kxc5 32.Thh8 Lxd6 33.exd6
-/+ (-1.32)   Tiefe: 7/9   00:00:01 63kN
29...La8 30.g6 S8xg6 31.Sc8+ Kc7 32.Sxe7 Sxe7 33.Txd8 Sd3+ 34.Kb1
=/+ (-0.46)   Tiefe: 8/10   00:00:01 93kN
29...La6 30.Kc2 c5 31.dxc5+ Kxc5 32.Thh8 Kd4 33.g6 Kxe5 34.g7
= (-0.22)   Tiefe: 9/11   00:00:01 269kN
29...Kc7 30.Thh8 Se2+ 31.Kb1 Sxd4 32.g6 Sxg6 33.Txd8 Sxh8 34.Txh8 Lxd6
= (0.17)   Tiefe: 10/14   00:00:01 1045kN
29...La6 30.Thh8 b4 31.g6 c3 32.bxc3 bxc3 33.Kc2 Ld3+ 34.Kxc3 Lxg6 35.Lxg6 S4xg6 36.Th1
=/+ (-0.48)   Tiefe: 11/14   00:00:01 1654kN
29...La6 30.Thh8 Se2+ 31.Kd2 Sxd4 32.g6 Sf3+ 33.Kc2 Sxg6 34.Lxg6 Txg8 35.Txg8 Sxe5 36.Sf7 Sf3
=/+ (-0.37)   Tiefe: 12/20   00:00:01 1775kN
...
29...La6 30.Thh8 b4 31.Lh5 c3 32.bxc3 bxc3 33.Kc2 c5 34.Kxc3 cxd4+ 35.Kxd4 Sxh5 36.Txh5 Lxd6 37.exd6 Txd6+ 38.Kc3 Td3+ 39.Kb2 Td2+ 40.Kc1 Txf2 41.g6 Sxg6 42.Txg6 Lc4 43.a3 Ta2 44.Th4 Lb3 45.Kb1 Txa3 46.Kb2 Ta4 47.Txa4 Lxa4 48.Txe6+ Kc5 49.Ka3 Ld7 50.Tf6 Le8 51.Tf2
= (0.14)   Tiefe: 27/44   00:00:09 209MN
...
29...La6 30.Kc2 b4 31.Th4 Sd3 32.Te4 Sxf2 33.Te3 c5 34.dxc5+ Kxc5 35.g6 Kd4 36.g7 Kxe3 37.Th8 c3 38.g8D Ld3+ 39.Kc1 Sg6 40.Lxg6 Txg8 41.Txg8 cxb2+ 42.Kxb2 a4 43.Lxd3 Sxd3+ 44.Kc2 Sxe5 45.Sb5 Sc6 46.Ta8 b3+ 47.axb3 axb3+ 48.Kxb3 Sd4+ 49.Sxd4 Kxd4 50.Kc2 e5 51.Kd1 Kd3 52.Ta7
= (0.14)   Tiefe: 31/54   00:00:44 1040MN
29...La6
= (0.06 ++)   Tiefe: 32/20   00:00:54 1288MN
29...La6 30.Thh8 b4 31.Lh5 Sd3+ 32.Kc2 Se1+ 33.Kd1 Sd3
= (0.00)   Tiefe: 32/51   00:01:13 1733MN
...
29...La6 30.Thh8 b4 31.Lh5 Sd3+ 32.Kc2 Se1+ 33.Kd1 Sd3
= (0.00)   Tiefe: 40/43   00:03:18 4655MN

Mein Vorschlag für avoid move prinzipiell immer der am einfachsten durchführbare Weg, um zu sehen, ob die Engine mit dem am selbst auch richtig umgeht, ihn ihr nach der Testzeit mit leerem Hash auf der Teststellung gestartet, eingeben.
Alternativ gleich auf dem ausgeführten am mit neuerliche leerem Hash starten, ist eine zweite Möglichkeit, sagt aber natürlich nix ohne den Vortest auf der Vorstellung.
Gleich mit so vielen MV- Lines starten, dass der am dabei ist, ist eine weitere Möglichkeit, kostet aber auch Zeit und ist auch nur bedingt vergleichbar mit den anderen Methoden.
Wenn es knifflige Stellungen sind, braucht man Testlines, mit denen man mehr als den ersten Halbzug nach der Teststellung im Output vergleichen kann, Eval allein ohne Züge dazu reicht eigentlich nie.

Daher hier jetzt nur noch der Folgeoutput nach Methode eins, gleich nach dem ersten Output in der angegebenen Rechenzeit den am eingegeben:

Analysis by Brainfish 280918 64 POPCNT:

23...Dd8 24.Lf3 Db6 25.g4 f6 26.g5 fxg5
= (0.00)   Tiefe: 7/7   00:00:00 18kN
...
23...Sg8 24.Dd3 Dd8 25.Lf3 Sf6 26.Le2 Tca8 27.Dc4 Ta4 28.Lf1 Da5 29.b3 Txa2 30.Txa2 Dxa2 31.Dxb4 Sg4 32.Le2 Sf6
= (0.00)   Tiefe: 20/20   00:00:00 903kN
23...Sg8 24.Dd3 Dd8 25.Lf3 Sf6 26.Le2 Tca8 27.Dc4 Ta4 28.Lf1 b3 29.Dxb3 Sxe4 30.Lxh3 Da5 31.De3 Sc5 32.Lf1 Txa2 33.Txa2 Dxa2 34.Dc3 Dxd5 35.Lc4 Dd4 36.Dxd4 exd4 37.Te7 Ta1+ 38.Kg2
= (-0.08)   Tiefe: 21/40   00:00:00 1944kN
23...Sg8 24.Dd3 Dd8 25.Lf3 Sf6 26.Le2 Tca8 27.Dc4 Ta4 28.Lf1 b3 29.Dxb3 Sxe4 30.Lxh3 Da5 31.Tec1 Sc5 32.Dc2 Td4 33.Td1 Txd1+ 34.Dxd1 Dxb5 35.b3 Ta3 36.De1 Dd3 37.Lf1 Dc2
= (-0.08)   Tiefe: 22/40   00:00:00 2294kN
23...Sg8 24.Dd3 Dd8 25.Lf3 Sf6 26.Le2 Tca8 27.Dc4 Ta4 28.Lf1 b3 29.Dxb3 Sxe4 30.Lxh3 Da5 31.Tec1 Sc5 32.Dc2 Td4 33.Lf1 Td2 34.Dc4 Txb2 35.Tc2 Tb4 36.Dc3 Td4 37.Dxa5 Txa5
= (-0.09)   Tiefe: 23/40   00:00:00 6469kN
...
23...Tca8
= (-0.30 ++)   Tiefe: 41/58   00:02:04 2653MN
23...g5
=/+ (-0.48 ++)   Tiefe: 41/62   00:03:07 4017MN
23...g5 24.a4 bxa3 25.bxa3 Ta4 26.De3 g4 27.Db3 Tcc4 28.Tec1 Txc1+ 29.Txc1 Td4 30.a4 Dd8 31.Da3 Db6 32.a5 Dxb5 33.Dxd6 f6 34.Db6 Dxb6 35.axb6 Tb4 36.f3 Txb6 37.fxg4 Tb3 38.Td1 Kf7 39.g5 fxg5 40.Tf1+ Ke7 41.Lf3 g4 42.Le2 Tb2 43.Kf2 Sf7 44.Ke3 Sd6 45.Lxg4 Txh2 46.Te1 Kf6 47.Kf3 b5 48.Ld7 b4 49.Tb1 Tc2 50.Lxh3 Tc3+ 51.Kg4 b3 52.Lg2
=/+ (-0.59)   Tiefe: 41/62   00:04:03 5218MN
23...g5
=/+ (-0.68 ++)   Tiefe: 42/22   00:04:40 6023MN
23...g5
-/+ (-0.76 ++)   Tiefe: 42/56   00:05:17 6834MN
23...g5
-/+ (-0.89 ++)   Tiefe: 42/56   00:05:55 7673MN

-/+ (-0.89 ++)   Tiefe: 42/56   00:05:55 7673MN

Danach, weil die falsche 0.00- Eval zwar nur Sekunden lang bestehen bleibt, dann aber noch lange keine ordentliche Diskrimination zum Output vor dem am zeigt, könnte man z.B. immer noch trefflich streiten, ob das jetzt als gelöst gelten soll, oder nicht.

Hingegen nach dem Eingeben von 29...Lxd6? am:

Analysis by Brainfish 280918 64 POPCNT:

2.exd6 c5 3.Thh8 Txd6 4.Txf8 Txd4 5.Tb8
+/= (0.33)   Tiefe: 7/7   00:00:00 22kN
...
2.exd6
+/- (1.03 ++)   Tiefe: 26/48   00:00:08 195MN
2.exd6
+/- (1.28 ++)   Tiefe: 26/48   00:00:10 255MN
2.exd6 c5 3.f3 Txd6 4.Txf8 Lxf3 5.Tf1 Sd3+ 6.Kd2 Se5 7.Tb8+ Ka7 8.Txb5 Txd4+ 9.Kc1 Ka6 10.Tb8 Le4 11.g6 Lxg6 12.Lxg6 Sxg6 13.Te1 Sf4 14.Kc2 Ka7 15.Tf8 Kb7 16.Tf7+ Kc6 17.a3 a4 18.Ta7 Kb5 19.Kb1 Kc6 20.Te5 Kd6
+/- (1.29)   Tiefe: 26/49   00:00:13 307MN
...
2.exd6 c5 3.f3 Sd3+ 4.Kd2 Txd6 5.Txf8 Txd4 6.g6 Sf4+ 7.Ke3 e5 8.g7 Td3+ 9.Kf2 Txf3+ 10.Ke1 Te3+ 11.Kd2 Td3+ 12.Kc2 Lxh1 13.g8D Le4 14.Lg6 Sxg6 15.Tf6+ Kc7 16.Tf7+ Td7+ 17.Kc1 Sf4 18.Txd7+ Kxd7 19.Df7+ Kd6 20.a4 bxa4 21.Df8+ Kd7 22.Kd2 Se6 23.Db8 Sc7 24.Dh8 Ld5 25.Dxe5 Kc6 26.Dg5 Kb5 27.Dg7 Kb6
+- (1.98)   Tiefe: 29/52   00:00:45 1111MN
2.exd6
+- (2.07 ++)   Tiefe: 30/66   00:00:52 1265MN
...
2.exd6 c5 3.f3 Txd6 4.Txf8 Lxf3 5.Tf1 Sd3+ 6.Kd2 Se5 7.Lxe6 Txd4+ 8.Ke3 Te4+ 9.Kf2 Kc7 10.Kg3 Lg4 11.Lf5 Lxf5 12.T8xf5 a4 13.Td1 Sd3 14.g6 Te8 15.Kh4 Tg8 16.Kg5 Sxb2 17.Txc5+ Kb6 18.Tdd5 Sd3 19.Txb5+ Kc6 20.Kf5 c3 21.Txd3 Kxb5
+- (2.22)   Tiefe: 31/69   00:01:18 1919MN
...
2.exd6
+- (2.31 ++)   Tiefe: 32/61   00:01:40 2465MN

An diesem Vergleich zum Output der eigentlichen Testellung stimmt zwar die Evalrelation recht bald, die im ersten ist allerdings zu niedrig, könnte man also als wirklich beweisendes Ergebnis auch anzweifeln.
Avoid Move Teststellungen sind schwer zu beurteilen, dazu kommt noch, dass sie einen gewissen "Verführungsgrad" darstellen müssen, soll heißen, die Engines sollten gute (schlechte

) Gründe haben, ihn überhaupt spielen zu wollen. Sonst hat es jedenfalls keinen Sinn, sie in Testsets einzubauen, in denen nur single move "found" (solved- not solved) als Plus oder Minus gezählt wird.

By Guenter Stertenbrink Date 2018-10-09 09:24 Edited 2018-10-09 09:43

ist also was faul an den Partien, SF9 spielte zu schlecht ?

(erkannter) Fehler = die eigene eval sinkt stark nach einigen weiteren Zuegen

23.Rfe1 {0.00/52 787s}
23.Rfe1 {0.00/44 780s}
23.Rfe1 {0.00/52 790s}
23.Rfe1 {0.00/52 795s}

29...Bxd6 {-0.39/36 762s} im vorigen Zug noch 0.00
29...Bxd6 {-0.39/36 764s}
29...Bxd6 {-0.39/36 764s}

mit einem thread , also die Tiefe ist seichter

By Peter Martan Date 2018-10-09 10:04 Edited 2018-10-09 10:08

Günter, ich bin wieder unnötig weitschweifig, aber es ist mir ein altes Anliegen.

Aus dem Partieverlauf gespielte Züge sind immer etwas anderes, als mit leerem Hash gestartete Analysen.
Abgesehen von den bekannten Parametern, die eine Rolle spielen wie TC und Rechnerleistung (im weitesten Sinn, was für ein Hash in welcher Größe spielt oft mehr Rolle als die CPU), spielen Engines, die den Hash aus den Vorstellungen der Züge bis dorthin gefüllt haben, oft und oft anders als mit leerem Hash.

Die beiden Stellungen sind, wie ich versucht habe zu schildern und zu zeigen, als Teststellungen im klassischen Sinn nicht verwendbar, es ist zu wenig Verführung in den Zügen, die du als am verwenden willst.
Und Output- Lines und Evals mit und ohne Forward bis dorthin und oder Backward nach Eingabe von Folgezügen sind ja, sei ehrlich, auch nicht wirklich dein Anliegen, dich da mit bestimmten Compiles von bestimmten Versionen im Detail so auseinanderzusetzen, dass das dann reproduzierbare vergleichbare Ergbenisse werden, nicht auf single core und nicht auf Mehrkern, ich würde heutzutage immer letzteres zumindest auch anschauen wollen, halt mit je 3 Runs pro Output- Vergleich.

Und was ich eigentlich nur sagen wollte, gerade bei LC0, was ich so von Anderen höre und sehe, ist der Unterschied von Zug in der Partie und Output im leer gestarteten Stellungstest oft und oft noch erstaunlicher als bei ABlis (um die auch mal zu verdiminutiven, damit man mir das nächste Layla- Mausi dafür wieder nachsieht

)

Was sagt denn deine LC0- Version auf deiner Hardware zu den Stellungen, wenn du sie mit leerem Hash drauf ansetzt übrigens?

Und zu deiner eigentlichen letzten Frage, ja natürlich spielte SF9 in der jeweiligen Partie zu schlecht, aber das war ja wohl auch mehr eine rhetorische Frage, oder?
Und "ob was faul war an den Partien", kann man ohne sie mit den Voraussetzungen, unter denen sie gespielt wurde und dem Verlauf zumindest nachher mit Evals und Tiefen kommentiert, zu kennen, sowieso nicht beantworten.

By Guenter Stertenbrink Date 2018-10-09 10:31 Edited 2018-10-09 10:43

also eine Analyse mit leerem Hash vermeidet die 2 Zuege und erkennt die schlechten evals
bereits nach kurzer Zeit , waehrend in der Partie mit "besserem" Hash ,
wenn auch nur 16MB nach 700s auf einem Kern das nicht erkannt wird ?!

Mit schlecht gespielt meine ich , schlechter als sf9 normal spielt, ist also irgendwas
faul an dem Setting , GUI , Betriebssystem , multitasking , cutechess commandline , ?

auf dem Tablet mit einem thread dauert es ca. 3200s , ich melde mich dann

in meinem vorigen posting war uebrigens die eine Tiefe 44 (statt 52) irrtuemlich
aus einer anderen Eroeffnung mit 23.Rfe1, ich kann's jetzt nicht mehr editieren.

By Peter Martan Date 2018-10-09 13:10

Guenter Stertenbrink schrieb:

Das mit dem besseren Hash ist eben auch so eine Sache, wenn du damit meinst, dass die Einträge mit den Zügen aus der Partie vor der Stellung, den Hash automatisch "verbessern".

Gerade bei LC0 sieht man häufig, dass sie sich "in einen Wirbel" hinein spielt, selbst Verwicklungen herbeiführt, bei denen sie dann taktisch patzt, weil sie was zu wenig durchgerechnet hat, was ihr ihre NN- Evals als zu erfolgversprechend einbebrockt haben in der Suche.

"Fallenstellen" hat das überhaupt so an sich, dass man sich dabei immer auch selbst überlisten kann, merke: wer Anderen eine Grube gräbt, ist selbst ein Hilfsarbeiter.

Das kann AB- Engines natürlich genau so passieren, man sieht's bei aggressiven Settings typischer Weise häufiger als bei Default- Einstellungen. Fehler, die dann in der Partie passieren, müssen nicht unbedingt durch "besseren" Hash vermieden werden können, sondern bei denen ist dann leerer Hash zeitweise besser, weil nicht mit überoptimistischen Vorberechnungen belastet.

By Guenter Stertenbrink Date 2019-05-17 20:11

TCEC15sf#38

17...Rfb8 18.Rxa4 Rb1+ 19.Rxb1 Qxa4 20.Bg5 Ng8 21.h5 = +3.07

By Peter Martan Date 2019-05-17 20:39 Edited 2019-05-17 20:58

Guenter Stertenbrink schrieb:

TCEC15sf#38

Es ist das Spiel Nr. 39.
http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=121733#pid121733
Bei 16...Kh8(?) geht's bei mir von 0.6 auf 1.1, die nächsten 2 Züge waren dann wohl schon die Sargnägel, 18...Tb1+(?) ist für so eine frühe Spielphase eventuell schon nicht mehr zu retten und bei SF in der sicheren +-.

By Tom Paul Date 2019-05-17 23:11

Peter Martan schrieb:

Guenter Stertenbrink schrieb:

TCEC15sf#38

Es ist das Spiel Nr. 39.
<a class='ura' href='http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=121733#pid121733'>http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=121733#pid121733</a>
Bei 16...Kh8(?) geht's bei mir von 0.6 auf 1.1, die nächsten 2 Züge waren dann wohl schon die Sargnägel, 18...Tb1+(?) ist für so eine frühe Spielphase eventuell schon nicht mehr zu retten und bei SF in der sicheren +-.

Im Rückspiel, im Gegensatz zu Stockfish steht LC0 aber schon im 13ten Zug auf Gewinn.
Somit deutlich früher als Stockfish

By Klaus S. Date 2019-05-17 23:16

Kein Wunder, LC0 kommt mit +1,5 aus dem Buch;
SF kam auch mit +0,96 aus dem Buch

Sehr großer Vorteil für Weiss - scheiß Eröffnung

By Peter Martan Date 2019-05-17 23:22 Edited 2019-05-17 23:31

Also jetzt sind mal nach 20 Zügen die Damen vom Brett, LC0 träumt zwar immer noch mit 2.44 von einer Gewinneval, aber so ganz glaube ich ihr das nicht mehr, die 0.79 vom Bluefish scheinen mir realistischer.
Ich geh' mal schlafen und schau's mir morgen fertig an.

By Klaus S. Date 2019-05-18 00:52

Jetzt, nach über eine Stunde Schlaf, hat BF +1.65 auf der Uhr.

By Peter Martan Date 2019-05-18 07:40

Hab's mir schon angeschaut, hätte mich unnötig lange wach gehalten.

[Event "Sufi15 G40"]
[Site "?"]
[Date "2019.05.17"]
[Round "?"]
[White "LC0"]
[Black "SF"]
[Result "1-0"]
[ECO "C18"]
[PlyCount "65"]

1. e4 e6 2. d4 d5 3. Nc3 Bb4 4. e5 c5 5. a3 Bxc3+ 6. bxc3 Ne7 7. Qg4 O-O 8. Bd3
Nbc6 9. Nf3 f5 10. Qg3 Qa5 11. Bd2 b6 12. h4 f4 13. Qg4 Qa4 14. h5 cxd4 15. h6
g6 16. O-O Nf5 17. cxd4 Ncxd4 18. Nxd4 Qxd4 19. Qxf4 Qxf4 20. Bxf4 Nd6 21. Bd2
Nc4 22. Bb4 Rd8 23. Bc3 Bb7 24. a4 Rac8 25. Bd4 Na5 26. f4 Nc6 27. c3 Rc7 28.
g4 Bc8 29. Kh2 Re8 30. Kg3 Na5 31. Kh4 Nb3 32. Ra2 Nc5 33. Be2 *

...

Kurz durchgezappt vorwärst-rückwärts durch die nächsten paar Züge, scheint 33...Sb7 der letzte entscheidende Fehler von SF gewesen zu sein.

Nach 33.Le2:

Nach der Partiefortsetzung 33...Sb7 (?!):

Analysis by CF EXT 110519 x64 POP NUMA:

34.c4 dxc4 35.Tc2 Ld7 36.Lxc4 Tec8 37.Tfc1 Sd8 38.f5 b5 39.axb5 Lxb5 40.Lb3 Txc2 41.Txc2 Txc2 42.Lxc2 gxf5 43.gxf5 Lc4 44.Kg5 Kf7 45.Lxa7 exf5 46.Kxf5 Se6 47.Kg4 Sf8 48.Le4 Sg6 49.Ld4 Le6+ 50.Kg5 Sf8 51.Le3 Ld7 52.Lc2 Sg6 53.Lc5 Le6 54.Ld6 Lc4 55.Lf5 Le6 56.Le4 Lb3 57.Lc7 Lc4 58.Lb8
+- (2.11) Tiefe: 40/56 00:03:21 4548MN

...
33...Nb7 34. c4 dxc4
35. Rc2 Bd7 36. Rxc4 Rec8 37. Rb4 Rc2 38. Ba6 R8c7 39. Bxb7 Rxb7 40. Rd1 Kf8
41. a5 b5 42. Be3 Rbc7 43. Kg5 Ke7 44. Rd6 R2c4 45. Rb3 b4 46. Rd4 Rxd4 47.
Bxd4 a6 48. Rxb4 Bb5 49. Rb2 Kf7 50. Bf2 Ke7 51. Rd2 Rc3 52. Bd4 Rc6 53. Bb2
Ke8 54. Kf6 Rc7 55. Kxe6 Bd7+ 56. Kd6 Rc4 57. g5 Bf5 58. Bd4 Kf7 59. Bc5 Rc3
60. Rb2 Rd3+ 61. Kc6 Be4+ 62. Kb6 Rd5 63. Rb4 Bg2 64. Rc4 Rd7 65. Rc1 Ke6 66.
Kxa6 Kf5 67. Kb5 Rb7+ 68. Kc4 Bc6 69. Bb6 Re7 70. Kb4 Re6 71. Bd8 Be4 72. Rc7
Re8 73. Bf6 Rb8+ 74. Kc5 Ra8 75. Rxh7 Rxa5+ 1-0

Anstatt das Textzuges 33...Sb7 (?!), der Cfish- Vorschlag 33...Sb3 gespielt:

Analysis by CF EXT 110519 x64 POP NUMA:

34.Tb2 Sa5 35.Lb5 Tf8 36.Ld3 Sc6 37.Te2 Tff7 38.f5 Se7 39.f6 Sc6 40.Tg2 Sa5 41.Ta2 Ld7 42.Tfa1 Tf8 43.Tb1 Kf7 44.g5 Sc6 45.Kg4 Sa5 46.Kf4 Tg8 47.Le2 Tf8 48.Tg1 Sb3 49.Tf1 Tfc8 50.Tb1 Sa5 51.Kg4 Tf8 52.Tba1 Sc4 53.Tg1 Sa5 54.Kh4 Sc6 55.Tga1 Tcc8 56.Tf1 Sxd4
+/- (1.39) Tiefe: 45/52 00:03:24 4445MN

Wohl auch schon ziemlich aussichtslos, aber doch noch etwas zäher zu verteidigen als das, was kam.

Mehr und mehr habe ich das Gefühl, diese SF- Installation in diesem Sufi ist von LC0 und durch die TC überfordert. Sonst ließen sich solche Fehler zu Hause nicht so leicht als solche reproduzieren.
Ich hab's schon einmal gesagt, der Vorteil der BlueFish- Lines ist immer wieder weniger die Core- Zahl als das Pondern, das fehlt SF hier offenbar schon stark, mehr als LC0.

By Jörg Oster Date 2019-05-18 13:10

Bluefish pondert nicht.

Manchmal bin ich immer noch erstaunt, was z. B. auch im TCEC-Chat für ein Unsinn verbreitet wird.

By Peter Martan Date 2019-05-18 13:20

Danke für die Info, Jörg.

By Olaf Jenkner Date 2019-05-18 15:01 Upvotes 2

Was für Unsinn?
Die gehaltvollsten Beiträge lese ich immer wieder gerne, z.B.
"Chess is chess" oder
"Go, Leela go!"

By Tom Paul Date 2019-05-18 15:14

Olaf Jenkner schrieb:

Was für Unsinn?
Die gehaltvollsten Beiträge lese ich immer wieder gerne, z.B.
"Chess is chess" oder
"Go, Leela go!"

Du musst doch nur im Chat und per Mail vorschlagen, dass die Organisatoren einen Spam Filter zur Verfügung stellen.
Ob du diesen dann benutzt, sei dir überlassen.

By Thomas Plaschke Date 2019-05-18 15:53

>"Chess is chess" oder
>"Go, Leela go!"

Oh ja, das sind Highlights!

Viele Grüße
Th. Plaschke

By Tom Paul Date 2019-05-18 00:05

[quote="Guenter Stertenbrink"]
TCEC15sf#38

17...Rfb8 18.Rxa4 Rb1+ 19.Rxb1 Qxa4 20.Bg5 Ng8 21.h5 = +3.07
[/quote]

LC0 42372
4 Tiefen mehr als im Superfinale in dieser Stellung

17...Rfb8 18.Kh2 Nd8 19.Ng5 Be8 20.Bc1 Rb7 21.Ba3 Qc7 22.Nh3 a5 23.Nf4 Qd7 24.Bf3 Ng6 25.Ne2 Ne7 26.Nf4 Ng6 27.Nh3 Ne7 28.Bc5 Qc8 29.Nf4 Kg8 30.Ba3 Nf7 31.Bh5 Ra6 32.Bc5 Nh6 33.Bxe8 Qxe8 34.h5 Nc6 35.f3 Nf7 36.Rxa4 Rb5 37.R4a2 Ncxe5 38.Re1 Nd7 39.Nxd5 Qd8 40.Nc7 f4 41.Qxf4
Weiß steht etwas besser: +/= (0.52) Tiefe: 23/67 01:17:23 194MN

By Tom Paul Date 2019-05-18 00:13

[quote="Tom Paul"]
[quote="Guenter Stertenbrink"]
TCEC15sf#38

17...Rfb8 18.Rxa4 Rb1+ 19.Rxb1 Qxa4 20.Bg5 Ng8 21.h5 = +3.07
[/quote]

LC0 42372
4 Tiefen mehr als im Superfinale in dieser Stellung

17...Rfb8 18.Kh2 Nd8 19.Ng5 Be8 20.Bc1 Rb7 21.Ba3 Qc7 22.Nh3 a5 23.Nf4 Qd7 24.Bf3 Ng6 25.Ne2 Ne7 26.Nf4 Ng6 27.Nh3 Ne7 28.Bc5 Qc8 29.Nf4 Kg8 30.Ba3 Nf7 31.Bh5 Ra6 32.Bc5 Nh6 33.Bxe8 Qxe8 34.h5 Nc6 35.f3 Nf7 36.Rxa4 Rb5 37.R4a2 Ncxe5 38.Re1 Nd7 39.Nxd5 Qd8 40.Nc7 f4 41.Qxf4
Weiß steht etwas besser: +/= (0.52) Tiefe: 23/67 01:17:23 194MN
[/quote]

LC0 findet bereits 21.h5 auf Tiefe 24!!!
Das sah LC0 auf Tiefe 31 beim Finale nicht.
LC0 will h5 mit h6 kontern anstatt mit Da5.

21.h5 h6 22.Bh4 Qa6 23.Kh2 Qc8 24.Qf4 a5 25.Ng1 a4 26.Ra1 Kh7 27.Nh3 Qe8 28.Qe3 Nge7 29.Nf4 Ra6 30.Qc1 Na7 31.Qb2 Ra5 32.Bxe7 Qxe7 33.Qb6 Nc6 34.Ng6 Qf7 35.Qc7 Ra7 36.Qd6 Be8 37.Nf8+ Kg8 38.Nxe6
Die Stellung ist ausgeglichen: = (0.15) Tiefe: 24/59 00:03:06 9528kN

By Guenter Stertenbrink Date 2019-05-18 04:29 Edited 2019-05-18 04:44

17...Rfb8 18.Rxa4 Rb1+ 19.Rxb1 Qxa4 20.Bg5 Ng8 21.h5 h6

22.Bf6 gxf6 23.exf6 Nxf6 24.Qg6 Nh7 25.Rb7 Rg8 26.Qxh6 Rg7 27.Ng5 Qa3
28.Nxe6 Rf7 29.Nc5 Rf6 30.Qe3 f4 31.Qf3 Qc1+ 32. Kh2 Bf5 33.Qxd5 f3 34.Qxf3 Qh6
Schwarz behaelt die Mehrfigur verliert aber 4-6 Bauern dafuer

das musste man sehen bei 17....Rfb8 mit all den Nebenvarianten.
17 Zuege. Mit Laeuferopfer.

bei sowas ist Stockfish besser

By Peter Martan Date 2019-05-18 09:01 Edited 2019-05-18 09:22

Guenter Stertenbrink schrieb:

das musste man sehen bei 17....Rfb8

Naja, besser wär's schon bei 16...Kh8 (?!) gewesen, dass das noch im Cerebellum- Buch drin ist, wird sich nach dieser Partie wohl auch ändern, (ok, da geht's nach 17.Tfa1 (Hauptzug 17.h5!) mit ...Sd8 weiter, das ist wohl auch noch zu halten, aber das 17.h5 ist wohl schon auch besser als das 17.Tfa1) Hiarcs online hat da schon ein ?! und das ...Le8 statt dessen oben, und dazu gibt's wenigstens ein einzelnes Partiebeispiel auf der Corr.2019- CD von Herbert Bellmann, das ist eine Remispartie von 2002, zu ...Kh8 gibt's eins von 2012, das war ein 1-0 nach 16...Kh8 17.h5!

Aber mit sowas muss man natürlich rechnen, wenn man diese Line bis zum 8. Zug vorgibt, und ich bin mir sicher, Jeroen Noomen hat damit gerechnet und die Line ganz bewusst und für den Zweck ja auch sehr clever ausgewählt.

Wäre das Interesse hier die Theorie, wären andere erste Züge, oder gleich noch die nächsten 8 zusätzlich, besser gewesen, wenn man sich entscheidet, entweder "ausgeglichene", besser gesagt nicht zu unausgeglichene Eröffnungsstellungen ausspielen zu lassen, oder gleich einen ausgespielten Stellungstest draus zu machen, da müsste man dann überhaupt nicht dauernd nur von der Eröffnung aus spielen, sondern könnte das Mittel- und Endspiel extra testen, was sowieso sonst immer zu kurz kommt, wenn eine Engine einfach besser eröffnet als die andere, und dadurch gar nicht mehr so oft in Gefahr kommt, im Mittel- und Enspiel noch in Nachteil zu geraten.
Auch so zwei andere Beispiele für geschlossene Ratingsysteme, Elo aus Partien, die nicht nur aus frühen Eröffnungsstellungen gespielt werden, Elo aus Partien, die aus unausgeglichenen Eröffnungsstellung heraus ausgespielt werden, ausgespielte Stellungstests an und für sich wäre ein drittes, nicht ausgespielte Stellungstests an und für sich einige weitere, die hast du ja selbst schon einmal erwähnt, oder bist du wirklich der Meinung, Stellungstests, egal welche, wenn sie nur halbwegs sinnvoll an Stellungswahl und -Zahl sind, ergeben dieselben Elo wie das Ausspielenlassen an und für sich? Jetzt pass aber gut auf, was du dazu in diesem Forum hier sagst!

Ich finde übrigens nicht, dass sich bei solchen Bedingungen die Remisquote aus den Remis allein korrekt berechnen lässt, man sollte da die 1:1- Paare auch als solche werten, weil sie die Errorbar nur scheinbar drücken, in Wirklichkeit ist das derselbe Bias, wie wenn man solche Partien mit solchen vergleicht, die von der Grundstellung aus gespielt werden, da kommen nämlich viel weniger 1:1- Paare heraus.

Und wir sind wieder bei unserem alten Thema.

By Guenter Stertenbrink Date 2019-05-18 10:01 Edited 2019-05-18 10:23

hallo Peter,
ich glaube ich bin zu doof fuer deine langen Saetze. Vielleicht kannst du mehr
Punkte machen ?!
-------------------
Danke fuer die frz. Theorie - die kannte ich nicht.
-----------------------
Stellungstests ergeben meist fast dieselben Elos wie Partien.
----------------------------
ich zaehle ja vorsugsweise 1-1-Paare. Drawkiller-Stefan wuerde das wohl auch machen,
wenn littleblitzer ordentlich hin-und Rueckpartie spielen wuerde.
TCEC-Jeroen erwaehnt nur die drawrate, versucht aber hohe Anfangs-evals zu vermeiden.
Obwohl - ich glaube das laesst etwas nach
p.s. : und Ausgewogenheit, viele Eroeffnungen sollen vorkommen, keine Wiederholungen (bei Jeroen)

By Peter Martan Date 2019-05-18 11:03

Guenter Stertenbrink schrieb:

Stellungstests ergeben meist fast dieselben Elos wie Partien.

Definiere "meist" und "fast" anhand der jeweiligen Errorbars.

By Tom Paul Date 2019-05-18 08:58

[quote="Tom Paul"]
[quote="Guenter Stertenbrink"]
TCEC15sf#38

17...Rfb8 18.Rxa4 Rb1+ 19.Rxb1 Qxa4 20.Bg5 Ng8 21.h5 = +3.07
[/quote]

LC0 42372
4 Tiefen mehr als im Superfinale in dieser Stellung

17...Rfb8 18.Kh2 Nd8 19.Ng5 Be8 20.Bc1 Rb7 21.Ba3 Qc7 22.Nh3 a5 23.Nf4 Qd7 24.Bf3 Ng6 25.Ne2 Ne7 26.Nf4 Ng6 27.Nh3 Ne7 28.Bc5 Qc8 29.Nf4 Kg8 30.Ba3 Nf7 31.Bh5 Ra6 32.Bc5 Nh6 33.Bxe8 Qxe8 34.h5 Nc6 35.f3 Nf7 36.Rxa4 Rb5 37.R4a2 Ncxe5 38.Re1 Nd7 39.Nxd5 Qd8 40.Nc7 f4 41.Qxf4
Weiß steht etwas besser: +/= (0.52) Tiefe: 23/67 01:17:23 194MN
[/quote]

LC0 sieht 24 Sg5 nicht und das ist das Problem.
Stattdessen sieht er nur das positionelle Dh4.
Gerade weil er Sg5 nicht sieht, sieht er davor auch nicht Lf6 sonder nur Lxh6.
Das alles führt zu den vorher schlecht gespielten Zügen in der Partie.

Anderes Problem:
Wenn man einen der weißen Gewinnzüge eingibt, sieht LC0 seine Niederlage sofort.
Wenn man dann zurück geht und er eigentlich den weißen Gewinnzug sehen müsste, da entsprechend tief analysiert wurde, sieht LC0 den Gewinnzug immer noch nicht???
Es ist fast so als ob LC0 wieder bei 0 anfängt und nichts sehen kann???