Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Teststellung aus meinem nächsten PC-ULTRA-TEST
- - By Torsten Cuber Date 2025-03-13 22:27
3r4/p1pPk3/5p2/1PN5/6K1/8/PP6/8 b - - 0 1
Diese Endspiel-Stellung, die von mir stammt, wird Teil meines nächsten Engine-Test werden.
Die Lösung 1.- Txd7!! stellt die meisten Engines vor große Probleme. Damit wickelt Schwarz, im Stile Capablancas, in ein leicht gewonnenes Bauernendspiel ab!
Die Engines, zum Beispiel Stockfish 16,  bevorzugen es, den Turm zu behalten, und planen stattdessen umständlich das Manöver Td8-h8-h2, um den weißen Bauern am Damenflügel zu Leibe zu rücken.
Natürlich kann Schwarz auch so gewinnen, es ist aber (aus Sicht eines Menschen) wesentlich komplizierter!
1 -Txd7!! ist wesentlich eleganter und (!) wesentlich einfacher!
P.S. Vielleicht kann jemand von euch hier ein Diagramm einfügen, mir gelingt das nicht, egal wie ich es anstelle.
Testet eure Programme doch Mal mit dieser Stellung!.
Viel Spaß dabei!
Parent - - By Olaf Jenkner Date 2025-03-13 22:35 Edited 2025-03-13 22:40 Upvotes 1
Du drückst auf fen und kopierst deine FEN zwischen Klammer zu und Klammer auf.



Was soll dein Engine-Test zeigen? Daß Computer anders spielen als Menschen, ist allgemein bekannt.
Parent - By Torsten Cuber Date 2025-03-13 22:41
Vielen Dank Schachfreund!
Beste Grüße vom Torsten
Parent - - By Torsten Cuber Date 2025-03-13 22:46
Nein, 1.- Txd7!! ist objektiv der stärkere Zug, nach den ersten drei Zügen der Hauptvariante klettert die Bewertung für Schwarz (analysiert mit Crystal 5) auf -12 für Schwarz!
Die Hauptvariante lautet 1 -Txd7!! 2.Sxd7 Kxd7 3.Kf5 Ke7, mit -12.40 für Schwarz!
Es geht also nicht darum, dass Computer anders spielen als Menschen.
Das Qualitätsopfer ist objektiv der beste, weil schnellste und einfachste Weg zum Gewinn!
Parent - By Olaf Jenkner Date 2025-03-14 00:12
Kann sein, ich bin eine Niete im Endspiel.
Parent - - By Peter Martan Date 2025-03-14 01:12 Edited 2025-03-14 01:22
Das wird man nur anhand der DTM des einen oder anderen Kandidatenzuges beweisen bzw. überprüfen können, Torsten.
Ich hab' mal mit 1...Txd7 angefangen, über so weite Strecken mit wenig forcierten Zügen geht's mit Fischen schneller, bei denen man die NNUE- Unterstützung noch nicht hatte oder noch abdrehen konnte mit Forward- Backward eine DTM im Hash zu behalten, meistens bei Stellungen wie dieser sogar schneller als mit Huntsman.

Das ist der Output nach FW- BW von 1...Txd7 ausgehend und zurück zur Wurzelstellung:

3r4/p1pPk3/5p2/1PN5/6K1/8/PP6/8 b - - 0 1

Analysis by Stockfish 16:

1...Txd7 2.Sxd7 Kxd7 3.Kf5 Ke7 4.a3 Kf7 5.a4 Ke7 6.Kf4 Ke6 7.Ke4 f5+ 8.Kf4 Kf6 9.Kf3 Kg5 10.Kg3 f4+ 11.Kf3 Kf5 12.Kf2 Ke4 13.Ke2 f3+ 14.Kf2 Kf4 15.Kf1 Kg3 16.Kg1 f2+ 17.Kf1 Kf3 18.b3 Kg3 19.b4 Kf3 20.a5 Ke3 21.b6 cxb6 22.axb6 axb6 23.b5 Kd4 24.Kxf2 Kc5 25.Ke2 Kxb5 26.Kd3 Kb4 27.Kc2 Ka3 28.Kd2 b5 29.Kc2 b4 30.Kb1 Kb3 31.Kc1 Ka2 32.Kd2 b3 33.Kc3 b2 34.Kd4 Kb3 35.Ke3 b1D 36.Kf4 Dg6 37.Ke5 Dg5+ 38.Ke4 Kc3 39.Kf3 Kd4 40.Kf2 Ke4 41.Ke1 Dg2 42.Kd1 Kd3 43.Kc1 Dc2#
Tiefe: 82/86 00:02:47 23074MN
-+ (-#43)

Der Zeitzähler ist natürlich beim letzten Halbzug- Rückschritt neu gestartet, da ist einiges (seit dem letzten Posting dazu von mir, allerdings mit dem zweiten FW- BW gemeinsam, siehe weiter unten) an Zeit davor vergangen.
Mit noch vollem Hash hab' ich dann zu willkürlich 1...Tg8 gewechselt und bin wieder so weit vorwärts gegangen mit der Engine, bis neuerlich eine DTM in den Output kam und zurück zur Ausgangsstellung:

3r4/p1pPk3/5p2/1PN5/6K1/8/PP6/8 b - - 0 1

Analysis by Stockfish 16:

1...Tg8+ 2.Kf3 Th8 3.a4 Th5 4.d8D+ Kxd8 5.Se6+ Kd7 6.Sd4 Th2 7.b3 Th3+ 8.Kg4 Td3 9.Sc6 Txb3 10.Sxa7 Tb4+ 11.Kf5 Txa4 12.Sc6 Kd6 13.Kxf6 Ta2 14.Sd4 Td2 15.Sb3 Tb2 16.Sc1 Kd5 17.Sd3 Txb5 18.Sf4+ Ke4 19.Se2 Tb2 20.Sg3+ Kd3 21.Ke7 c5 22.Ke6 Tb5 23.Sh1 c4 24.Sf2+ Kd4 25.Ke7 Tb2 26.Sd1 Td2 27.Sb2 Te2+ 28.Kf8 c3 29.Sa4 c2 30.Sc3
Tiefe: 50/60 00:00:02 156MN
Schwarz setzt Matt.
-+ (-#44)

Tatsächlich sind's am Ende der Output- Line, wenn man zu ihr springt, nur mehr 4 weitere Züge, also wären's demnach eigentlich nur 34, nicht 44, aber diese größere Unverlässlichkeit im Output an der Ausgangsstellung nach dem 1...Tg8+ ist wohl der Tatsache geschuldet, dass die Breite des Suchbaumes nach dem Schlagzug 1...Txd7 immer noch ein bisschen kleiner ist und "leichter" bis zum Matt im Hash zu behalten für die Engine. Auch hätte ich vor dem Kopieren des 2. Outputs länger warten sollen, aber es hat nach den 2 Sekunden schon ewig gedauert, ohne dass ein neuer kam.

Wie auch immer, dass trotz der um einen Zug längeren DTM- Angabe im Output der Zug 1...Tg8  diesmal wieder im Hash als bm bleibt, liegt vordergündig vermutlich einfach daran, dass dazu die aktuellen Hash- Einträge noch nicht überschrieben sind, die nach 1...Txd7 schon meistenteils, aber groß ist der Unterschied in der DTM zwischen diesen 2 ziemlich willkürlich gewählten Kandidaten wohl auch bei wirklich besten Mattführungen nicht (z.B. könnte man sich auch fragen, was das Zwischenschach 1...Tg8+ 2...Th8 wirklich in Hinblick auf die beste DTM hilft, aber mit einem dritten Kandidaten tue ich mir das weite FW- BW jetzt nicht mehr an. Was ich nur sehen und zeigen wollte: ein Unterschied von wenigen Zügen zum Matt bei insgesamt noch guten 30, 35 kann meiner Meinung nach nicht als objektiv relevant genug gesehen werden, um zu sagen, der eine ist ein single best move im Testststellungssinn und der andere nicht. Das könnte bei solchen Variantenlängen höchstens dann der Fall sein, wenn der eine Zug das Matt noch innerhalb der 50- Züge- Regel erreichte und der andere knapp nicht mehr.

So schaut's dann übrigens nach einer Weile im MultiPV=3 aus, wenn man dafür kurz noch einmal ins 1...Th8 hinein gegangen ist, und wieder bisTiefe 56 wartet:

3r4/p1pPk3/5p2/1PN5/6K1/8/PP6/8 b - - 0 1

Analysis by Stockfish 16:

1. -+ (-#48):  1...Tg8+ 2.Kf3 Th8 3.a4 Th5 4.Se4 Td5 5.Ke3 f5 6.Sg5 Txd7 7.Sf3 Kf6 8.a5 Td5 9.Sd4 f4+ 10.Ke4 Txd4+ 11.Kxd4 Kf5 12.Kd3 Kg4 13.Ke2 Kg3 14.Kf1 Kf3 15.a6 Ke3 16.Ke1 Kd3 17.Kd1 f3 18.Ke1 Kc2 19.Kf2 Kxb2 20.Kxf3 Kb3 21.Kf2 Kc3 22.Kf3 Kd4 23.Kf4 Kc5 24.Ke4 Kxb5 25.Kd4 c5+ 26.Kd3 Kb4 27.Ke2 Kc3 28.Kf3 Kb3
2. -+ (-#51):  1...Th8 2.b3 Th1 3.b4 Tb1 4.a3 Tf1 5.a4 Tf2 6.Sd3 Td2 7.Sc5 Txd7 8.Sa6 Td4+ 9.Kf5 Td5+ 10.Kf4 Kd6 11.Ke4 Td2 12.Kf5 Ta2 13.a5 Td2 14.Kxf6 Td5 15.Kg7 Txb5 16.Kf6 c5 17.Sxc5 Txb4 18.Sd3 Tb3 19.Se5 Tb5 20.Sc4+ Kc5 21.Se3 Txa5 22.Ke5 Ta2 23.Sd1 Te2+ 24.Kf4 Kd4 25.Kf3 Td2 26.Sf2 Txf2+ 27.Kxf2 Kc3 28.Ke1 a5 29.Kd1 Kb2 30.Ke2 Kc2 31.Kf2 Kc3
3. -+ (-#53):  1...Txd7 2.Sxd7 Kxd7 3.Kf3 Ke6 4.Ke4 f5+ 5.Kd4 Kf6 6.Ke3 Ke5 7.Kf3 f4 8.Kf2 Ke4 9.Ke2 f3+ 10.Kf2 Kf4 11.a3 Ke4 12.a4 Kf4 13.a5 Kg4 14.Kf1 Kg3 15.Kg1 f2+ 16.Kf1 Kf3 17.b3 Kg3 18.a6 Kf3 19.b6 cxb6 20.b4 Ke3 21.b5 Kd3 22.Kxf2 Kc4 23.Ke3 Kxb5 24.Kd3 Kxa6 25.Kd4 Ka5 26.Kd5 Kb4 27.Ke4 a5 28.Kf5 Kb3 29.Kf6 Ka3 30.Ke5 b5 31.Ke6 a4

Gute Nacht.
Parent - By Peter Martan Date 2025-03-14 08:11 Edited 2025-03-14 08:59
Und nachdem ich's über Nacht habe weiterlaufen lassen, in Tiefe 73:

3r4/p1pPk3/5p2/1PN5/6K1/8/PP6/8 b - - 0 1

Analysis by Stockfish 16:

1. -+ (-#38):  1...Tg8+ 2.Kh3 Th8+ 3.Kg3 Th5 4.b4 Td5 5.Kf3 Txd7 6.Ke4 Td1 7.Sa6 Kd6 8.Sc5 Ta1 9.Sb7+ Ke7 10.Sa5 Txa2 11.Sc6+ Kd6 12.Sd4 Ta4 13.Sf5+ Kd7 14.Kd5 Txb4 15.Kc5 Tf4 16.Sg3 Tf3 17.Se2 Te3 18.Sf4 Te5+ 19.Kd4 Txb5 20.Kc4 Tb6 21.Sd3 Kd6 22.Kc3 a5 23.Kd4 a4 24.Sf2 f5 25.Sd1 a3 26.Sc3 Tb4+ 27.Kd3 Tb3 28.Kc2 Txc3+ 29.Kxc3 f4 30.Kc2 Kd5 31.Kc3 a2 32.Kb2 Kc4 33.Kxa2 f3 34.Kb2 f2 35.Ka3 Kc3 36.Ka4 f1D 37.Ka5 Db1 38.Ka4 Db4#

2. -+ (-#41):  1...Th8 2.b3 Th1 3.b4 Tb1 4.a3 Tf1 5.a4 Tf2 6.Sd3 Td2 7.Sc5 Txd7 8.Sa6 Td4+ 9.Kf5 Td5+ 10.Kf4 Kd6 11.Ke4 Te5+ 12.Kf4 Te1 13.Sc5 Tf1+ 14.Ke4 f5+ 15.Ke3 Tb1 16.Sd3 Tb3 17.Kd4 Txd3+ 18.Kxd3 Kd5 19.a5 f4 20.a6 f3 21.Ke3 Kc4 22.Kxf3 Kxb4 23.Ke3 Kxb5 24.Kd4 c5+ 25.Kd3 Kxa6 26.Kc4 Kb6 27.Kd3 Kb5 28.Ke4 a5 29.Ke3 Kb4 30.Ke2 c4 31.Ke3 Kb3 32.Kd4 c3 33.Ke5 c2 34.Kf4 a4 35.Kf3 c1D 36.Ke4 Dg5 37.Kf3 a3 38.Ke2 a2 39.Kf3 a1D 40.Ke4

3. -+ (-#43):  1...Txd7 2.Sxd7 Kxd7 3.Kf5 Ke7 4.Kf4 Ke6 5.Ke4 f5+ 6.Kf4 Kf6 7.a3 Ke6 8.Kf3 Ke5 9.Ke3 f4+ 10.Kf3 Kf5 11.Kf2 Kg4 12.Kg2 f3+ 13.Kf2 Kf4 14.a4 Ke4 15.Kf1 Ke3 16.Ke1 f2+ 17.Kf1 Kf3 18.b3 Ke3 19.b4 Kf3 20.a5 Ke3 21.b6 cxb6 22.axb6 axb6 23.b5 Kd4 24.Kxf2 Kc5 25.Ke1 Kxb5 26.Kd2 Kb4 27.Kc2 Ka3 28.Kc3 b5 29.Kd2 b4 30.Kc2 Ka2 31.Kd2 b3 32.Ke3 b2 33.Kf4 Ka3 34.Kf3 b1D 35.Kg2 Kb4 36.Kf3 Kc5 37.Kf4 Kd4 38.Kf3 Df5+ 39.Ke2

Das -#43 (42 vom Ende der output- line, wenn man sie wieder eingibt und zum 39.Ke2 springt, beim 29. Zug laut 6Steinern aber doch ein #43 insgesamt wird, weil's dort noch ein -#22 ist) für 1...Txd7 hatten wir ja im Vorposting als -#43 schon komplett im single primary output, das lässt sich vermutlich auch noch etwas  kürzen, aber ob es wirklich soviel kürzer wird als das nach 1...Tg8+, das jetzt komplett als -#38 im MultiPV- output ist, und vielleicht auch noch etwas kürzer geht?

Wenn man mal schon halbwegs richtige Lines bis zum Matt hat, geht's mit Huntsman ja auch viel flotter rückwärts, das probier' ich jetzt noch schnell ein bisschen, wenn's mir zu mühsam wird, lass' ich's sein, sonst geht sich aber weiterer Output jedenfalls wahrscheinlich nicht mehr in der Editierzeit aus
Parent - - By Wolfram Bernhardt Date 2025-03-14 09:30
Interessant.

Ich würde schon auch Txd7 spielen - aber dabei sehr hoffen, dass Weiss mit dem Springer nimmt. Dann wird es schnell und einfach.

Aber wenn Weiss das nicht tut, geht es nicht mehr so schnell und vielleicht auch gar nicht mehr so einfach, Weiss kann noch ne ganze Weile rumnerven und dafür sorgen, dass es viele Züge werden. Und ob es dann wirklich noch weniger sind als in den anderen Varianten... wäre ich spontan nicht sicher...
Parent - - By Peter Martan Date 2025-03-14 09:54 Edited 2025-03-14 10:31
Wolfram Bernhardt schrieb:

Ich würde schon auch Txd7 spielen - aber dabei sehr hoffen, dass Weiss mit dem Springer nimmt. Dann wird es schnell und einfach.

Ja, denkste, siehe hier:

https://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=173792#pid173792

Überhaupt kann man nach 1...Txd7 als Mensch natürlich leichter auf Abschneider hoffen, bei denen Weiß eben nicht die besten Fortsetzungen findet, drum schaut's ja auch einfach leichter aus, es ist schon mal ein Bäuerchen weg

Der Witz ist aber, dass das sowieso fällt und es eine optische Täuschung ist, dass das schon alles Weitere erledigt.

Das Problem ist genau das beim 2. Zug, ob Weiß da überhaupt gleich zurückschlägt, macht nicht den großen Unterschied, hingegen lässt es den Suchbaum eben auch nicht wesentlich schrumpfen, weil Weiß da mit Abwartezügen wie z.B, 2.Kf3!? auch noch keine wesentliche DTM hergibt, hingegen hängt sich Huntsman an dieser Stelle unmittelbar nach 1....Txd7 mit übertrieben langen DTM- outputs noch furchtbar auf, weil er alle ungefähr gleich langen Antworten von Weiß durchrechnen muss.
Parent - - By Wolfram Bernhardt Date 2025-03-14 10:10
Ja, genau. Also ob Txd7 wirklich der beste ist, würde ich auch anzweifeln.

Aus menschlicher Sicht ja, aber ob es das objektiv und damit als Teststellung geeignet ist... ich weiß nicht... ich weiß nicht...
Parent - - By Peter Martan Date 2025-03-14 10:18 Edited 2025-03-14 10:27
Als Teststellung kannst du das so wie jede andere Schachstellung nehmen, von der dich der beste Zug oder die besten Züge interessieren (bei gleich langer DTM sind halt mehrere gleich gut, wenn man von dem absieht, was einem als Mensch besser gefällt), als Teststellung für Engines ist sie nicht geeignet, wenn du nur einen einzelnen ("single") best move eingeben willst, lässt du alle mit gleicher oder ähnlich langer (spielt ja sonst nur bei Matt in x- puzzles eine Rolle, wieviele es genau sind) DTM als best moves gelten (prinzipiell kannst du ja beliebig viele auflisten unter der Syntax bm in der .epd), dann wird sie für alle Engines, die da einen der ungefähr gleichwertigen Gewinnzüge wählen, leicht lösbar. In diesem Fall hier müssten in einer automatisch zu bewertenden Suite mindestens 5, 6 Züge, wenn nicht 7 oder 8 als bm(s) eingegeben werden, so what?
Parent - By Wolfram Bernhardt Date 2025-03-14 10:29
Ja. Wenn ich richtig gezählt habe, hat Schwarz hier 15 Züge.

Selbst das eher stumpfe Ta8 verlängert den Weg zum Matt nicht wesentlich. Wäre dann auch ein "ungefähr gleichwertiger Gewinnzug". So kommt man schnell auf 7-8.

Hier einen guten Zug zu finden, ist also nicht so schwer.
Parent - - By Torsten Cuber Date 2025-03-14 12:28
Lieber Wolfram,
ich habe Mal exemplarisch eine Variante ausgesucht, bei der Weiß nicht den Turm auf d7 nimmt:
1.- Txd7!! 2.a3 Td5 3.b4 Kd6 4.Se4+ Ke5 5.Sc5 Txc5! 6.bxc5 f5+ mit Mattanzeige -27; oder 5.- Kd4! 6.Se6+ Ke4 7.Sxc7 f5+; oder 6.Kf3 Txc5! 7.bxc5 Kxc5, und hier zeigt Crystal 5 (auf meinem Smartphone) nach 1:34 Min. die Bewertung MA -20.
Also eine Stellung, die durchaus Potential bietet
Außerdem stellt die Stellung ein schönes Beispiel dar, wie schwierig es heute geworden ist, eindeutige (!) Stellungen zu finden, die sich als Test für Engines eignen UND zugleich noch schwer genug sind!
Auf jeden Fall Danke für deine Antwort!
Parent - - By Peter Martan Date 2025-03-14 13:00 Upvotes 1
Was ist jetzt also deine DTM nach 1...Txd7
?
Schaffst du eine Variante ohne weiße Fehler in weniger als 43 (oder von mir aus, wenn da der SF- Output noch um 3  Züge zu verkürzen sein sollte, weniger als 40 ) Zügen zum Matt von schwarzer Seite? Dann zeig sie bitte, diese deine best line, mit backward solving wird sie sich ja leicht überprüfen lassen.

Oder ist bei dir deine beste Variante nach 1...Th8 länger als die 38 Züge, die SF im Output vom ersten bis zum letzten Zug dazu anzeigt?
Wenn das alles nicht, wieso meinst du dann nach wie vor, das 1...Txd7 sei ein eindeutiger best move und verdiene !!
?
Sorry, ich hätte aber halt gern, dass die Arbeit und Hardware- Zeit, die ich in diese deine Steststellung investiert habe, wenigstens zur Kenntnis genommen würde
Parent - - By Torsten Cuber Date 2025-03-14 13:08
Lieber Peter, da mein PC momentan "ausser Dienst" ist, kann ich meine Stellungen nur mit Stockfish und Crystal 5 auf dem Smartphone analysieren, und da fehlt die Rechenpower für so tiefe Analysen.
Aber ich denke, dass Du Recht hast mit deiner Annahme, daß die DTM nicht unbedingt für 1.-Txd7 spricht.
Weil es aber aus unserer menschlichen Sicht der schönste und einfachste Gewinnweg ist, hab ich ihm trotzdem !! gegeben.
Darüber hinaus sollte diese Stellung nur als Beispiel dienen für die Aufgaben, die ich in meinen neuen Test aufnehmen möchte.
Prinzipiell wird es darauf hinauslaufen, daß die meisten Stellungen Studien sein werden, weil " normale" Stellungen mittlerweile zu einfach oder, wie im vorliegenden Fall, nicht eindeutig genug sind!
Parent - By Peter Martan Date 2025-03-14 13:44 Edited 2025-03-14 13:56 Upvotes 1
Torsten Cuber schrieb:

Aber ich denke, dass Du Recht hast mit deiner Annahme, daß die DTM nicht unbedingt für 1.-Txd7 spricht.
Weil es aber aus unserer menschlichen Sicht der schönste und einfachste Gewinnweg ist, hab ich ihm trotzdem !! gegeben.
Darüber hinaus sollte diese Stellung nur als Beispiel dienen für die Aufgaben, die ich in meinen neuen Test aufnehmen möchte.
Prinzipiell wird es darauf hinauslaufen, daß die meisten Stellungen Studien sein werden, weil " normale" Stellungen mittlerweile zu einfach oder, wie im vorliegenden Fall, nicht eindeutig genug sind!

Da stimmt mir einiges nicht, Torsten.
Erstens ist das, was ich zu den Kandidatenzügen geschrieben habe, keine Annahme, sondern eine fundierte Analyse, zweitens ist der "schönste" Weg bei einer relativ simplen (im Sinne von alltäglich in der Spielpraxis vorkommenden) Endspielstellung nichts, woran ich ästhetische Kriterien wie an eine komponierte Studie anlegen würde können, bei der aber eben auch ein Hauptweg eindeutig anders, raffiniert und ungewöhnlich sein sollte,  und "einfach" ist 1...Txd7 eben nachweislich auch einfach absolut nicht.

Wie ein Gewinnweg einfacher sein soll, wenn er die länger DTM hat als ein anderer ("komplizierterer", der aber schneller zum Matt führt?) könnte ich mir höchstens dann erklären, wenn dieser "einfachere" Weg eindeutig weniger Gelegenheit zu eigenen und oder eindeutig mehr Gelegenheit zu Fehlern des Gegner gäbe, das sehe ich hier aber auch nicht. Dass Weiß nicht zurückschlagen wird und es damit Schwarz (wenngleich auch nicht viel) leichter machte, ok, hoffst du ja aber selber auch nicht in deiner kurzen HV.
Teststellungen müssen weder Studien sein, (auch unter denen gibt's und gab's ja bekanntlich auch immer schon solche, die für die Engines viel zu leicht waren und oder sind und für Menschen trotzdem "schön", ev. auch "kompliziert", das hat einfach für Menschen ganz andere Bedeutung als Kritierium als für Engines) noch spricht (für mich) etwas dagegen, komponierte Studien als Teststellungen für Menschen und Maschinen zu verwenden.

Egal, was es für Stellungen sind (Eröffnungsstellungen sind eigentlich die Teststellungen schlechthin heutzutage, immer genauer muss man die Vorteile einer Seite berücksichtigen, um für starke Engines auf vernünftiger Hardware- TC nicht nur Remis- Partiepaare als Ergebnisse des Ausspielens zu bekommen, sei's als 2 drawn draws oder als 2 x won draws, die mittlerweile zu recht mindestens ebnso gefürchteten sogenannten 1:1- Paare, die sind eigentlich ab einer gewissen Hardware- TC und Spielstärke der größere Fluch als die einzelnen Remis, weil sie die error bar mehr erhöhen, als sie beim Ersatz einzelner 1/2- 1/2- Paare an Diskrimination bringen, eh klar, weil bessere Unterscheidung bringen sie als 1-1-Paare eben auch nicht). Man muss für Teststellungen auch keine eindeutigen single best moves als Lösung haben, es sei denn, es soll eine Suite aus lauter solchen single best moves sein, was aber alle Teststellungen, wie "einfach" oder "schwer" (aus Hardware- TC- oder aus menschlicher -Sicht) sie sein mögen, ob zum Ausspielen, für Suiten (da gibt's ja außer den single best move ones auch andere, erwähne ich aus gegebenem Anlass des anderen Threads ganz gerne eigens neuerlich, e.g. STS, MEA, NICE, Simex..., außerdem kann man natürlich auch einfach immer alle Züge, die gleich gut an Lösungswert sind, unter der bm- Syntax in der .epd in Serie auflisten, es kommt dabei auch nicht einmal auf eine Reihenfolge an, in der man die Züge auflistet), was also alle Teststellungen als einziges Kriterium (für mich) wirklich erfüllen müssten oder sollten: die Züge, die man als Lösungen sucht oder suchen lässst, müssten oder sollten die richtigen sein
Parent - By Peter Martan Date 2025-03-14 13:02 Edited 2025-03-14 13:05
Was ist jetzt also deine DTM nach 1...Txd7
?
Schaffst du eine Variante ohne weiße Fehler in weniger als 43 (oder von mir aus, wenn da der SF- Output noch um 3  Züge zu verkürzen sein sollte, weniger als 40 ) Zügen zum Matt von schwarzer Seite? Dann zeig sie bitte komplett, diese deine best line, mit backward solving wird sie sich ja leicht überprüfen lassen.

Oder ist bei dir deine beste Variante nach 1...Th8 länger als die 38 Züge, die SF im Output vom ersten bis zum letzten Zug dazu anzeigt?

https://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=173792#pid173792

Wenn dir das Eine und oder das Andere nicht gelingen sollte, wieso meinst du dann nach wie vor, das 1...Txd7 sei ein eindeutiger best move und verdiene !!
?
Sorry, ich hätte aber halt gern, dass die Arbeit und Hardware- Zeit, die ich in diese deine Teststellung investiert habe, wenigstens zur Kenntnis genommen würde
Parent - - By Wolfram Bernhardt Date 2025-03-15 09:46
Ja, finde ich auch. Die Stellung ist schon schön.

Sie zeigt auch, wie schwer es ist, Stellungen zu finden, die für Menschen einfach und klar sind, für Engines aber schwer.

Ich vermute, solche wird man am ehesten noch im Endspiel finden.
Parent - By Torsten Cuber Date 2025-03-15 13:11
Da stimme ich dir absolut zu!.
Deswegen bestehen die Engine-Tests heute auch zu großen Teilen aus Studien!.
Zum einen, weil es dort eben qua Definition nur einen Lösungszug gibt (bzw geben sollte!), zum anderen kann man Engines heutzutage nur noch mit Studien an die Grenzen ihre Leistungsfähigkeit führen, weil es eben gerade in komplizierten Studien um langwierige strategische Manöver geht, die teilweise ein zigfaches Wiederholen eines bestimmten Motiv erfordern, bis eine klare Gewinnstellung erreicht wurde, die auch die Engines als klar gewonnen erkennen (Bewertung +10).
Oder die Studien arbeiten mit komplexen Zugzwang- Manövern, die aus menschlicher Sicht sehr lehrreich sind (darum beschäftigt man sich ja auch mit Studien, um was dabei zu lernen!), aber für Engines sehr schwer sind, weil der klare Gewinn eben erst sehr spät erkannt wird (mit entsprechender Bewertung)!
Auf jeden Fall wird mein neuer Test zum großen Teil aus solchen Studien bestehen, die aber so weit wie möglich "partienahe", bzw "praxisnahe" Stellungen sein sollten.
Fantasiestudien, in denen zum Beispiel 4 Läufer auf dem Brett stehen, interessieren mich nicht so, weil ich einfach auch etwas aus den Studien für das praktische Spiel (!) lernen möchte, und wer bitte hat in seinen Partien schonmal vier Läufer auf dem Brett gehabt?
Ich hoffe, dass das Grundkonzept für meine Testsuite jetzt etwas klarer geworden ist.
Das dabei auch Stellungen auftauchen, die sich nach stundenlangem Studium als nicht ganz eindeutig genug herausstellen, liegt in der Natur der Sache.
Auch berühmte Studien wurden schon von den Computern "korrigiert", weil man Nebenlösungen entdeckte, die ohne Computer nicht gesehen wurden!
Das ist ja auch der Grund, warum ich meinen PC-ULTRA-TEST regelmäßig überarbeite, und alte Stellungen, die sich als nicht mehr eindeutig genug erweisen,  durch neue ersetze!
Deshalb bin ich auch für jeden Kommentar von eurer Seite dankbar, solange er konstruktiv bleibt.
Parent - - By Peter Martan Date 2025-03-13 22:56 Edited 2025-03-13 23:05
Torsten Cuber schrieb:

Natürlich kann Schwarz auch so gewinnen, es ist aber (aus Sicht eines Menschen) wesentlich komplizierter!

Naja, Torsten, das kann man so sagen, dass Schwarz auch anders gewinnen kann.
Das ist mal mit leerem Hash gestartet und gerade so vielen MultiPV- Varianten, dass keine dabei ist mit wesentlich schlechterer Eval aus schwarzer Sicht, dass 1...Txd7 nach oben kam, passierte schon bald, noch während ich die Zahl der Lines erhöht habe, das ist in Tiefe 23 nach ca. 5 Minuten mit 30 Threads der 16x3.5GHz CPU:



Analysis by Stockfish dev-20250202-d46c0b6f:

1. -+ (-6.28):  1...Txd7 2.Kf3 Td2 3.Sa4 Th2 4.Kg4 Tf2 5.Kg3 Tc2 6.Kf3 Kd6 7.Ke3 f5 8.Kf3 Th2 9.Kg3 Td2 10.Kf3 Td3+ 11.Ke2 Th3 12.Ke1 Th1+ 13.Kd2 Th4 14.b3 Th2+ 15.Kc3

2. -+ (-6.15):  1...Tg8+ 2.Kf3 Th8 3.Se4 Th6 4.d8D+ Kxd8 5.Kg2 Kd7 6.Sc3 Th5 7.Kg1 Ke6 8.Sa4 Txb5 9.Kf1 Kd7 10.Kf2 Tb4 11.Sc5+ Kd6 12.Sd3 Td4 13.Ke2 Txd3 14.Kxd3 Ke6 15.b3 c5 16.Kc4 Ke5 17.Kd3 f5 18.Ke3 a6 19.Kd3

3. -+ (-6.12):  1...Tf8 2.Kf5 Th8 3.Se4 Th5+ 4.Kf4 Txb5 5.b3 Td5 6.Sc3 Td3 7.Sb1 Kxd7 8.Ke4 Td1 9.Sc3 Te1+ 10.Kd3 Te5 11.Sb1 Ke6 12.Sa3 Ta5 13.Sc2 Txa2 14.Sd4+ Kd5 15.Sf5

4. -+ (-6.05):  1...Tb8 2.a4 Th8 3.b3 Th1 4.Se4 Td1 5.Kf5 Td5+ 6.Kf4 Txd7 7.Ke3 f5 8.Sc5 Td1 9.Kf4 Kd6 10.Sb7+ Ke6 11.Sc5+ Kd5 12.Sa6 Tf1+ 13.Ke3 Kd6 14.Kd3 Tb1 15.Kc2 Th1 16.Kd2 Th2+ 17.Ke3

5. -+ (-6.03):  1...Kd6 2.Sb7+ Kxd7 3.a4 Th8 4.Sc5+ Ke7 5.Sa6 Th2 6.b4 Kd6 7.Kf4 Th1 8.Kf5 Tf1+ 9.Ke4 f5+ 10.Kd3 Tf4 11.Kc3 Th4 12.Kd3 Te4 13.a5 Th4 14.Kc3 Th3+ 15.Kd4 Th1 16.Kd3 Th2 17.Sb8 Th3+ 18.Kc4 Th4+ 19.Kb3

6. -+ (-6.03):  1...Th8 2.a4 Th2 3.b3 Th1 4.Se4 Td1 5.Kf4 Txd7 6.Ke3 Td5 7.Sc3 Te5+ 8.Kf3 Ke6 9.Sd1 Td5 10.Sf2 Ke5

7. -+ (-5.92):  1...Ta8 2.b3 Th8 3.Kg3 Th5 4.Se4 Td5 5.Kf2 Txd7 6.Ke3 Td5 7.Sf2 Ke6 8.Sh3 Txb5 9.Kd3 Tf5 10.Sg1 Kd6 11.Kc4

8. -+ (-5.73):  1...Kf7 2.Kf5 Ke7 3.Ke4 Tb8 4.a4 Tb6 5.b4 Td6 6.a5 Td1 7.Sa6 Kxd7 8.Sb8+ Kc8 9.Sc6 Kb7 10.Ke3 Td5 11.Sd4 f5 12.Kd3 Te5 13.Kc4 f4 14.Sf3 Te4+ 15.Kc5 Te3 16.Sd2 Td3 17.Sf1 f3 18.a6+ Kc8

Und das 2 Minuten später in Tiefe 24:

3r4/p1pPk3/5p2/1PN5/6K1/8/PP6/8 b - - 0 1

Analysis by Stockfish dev-20250202-d46c0b6f:

1. -+ (-7.07):  1...Kd6 2.b4 Txd7 3.Sb3 Th7 4.Sd4 Th2 5.b6 axb6 6.a3 Ta2 7.Sf5+ Ke5 8.Se3 f5+ 9.Kg5 Ke6 10.Sc4 Tg2+ 11.Kh6 Kf6 12.Kh7 f4 13.a4 Tc2 14.Sa3 Ta2 15.Sc4 Ta1

2. -+ (-7.00):  1...Tf8 2.Kf3 Th8 3.Se4 Th6 4.Kg3 Kxd7 5.b3 Ke7 6.Sc3 Th5 7.Sb1 Ke6 8.Sc3 Th1 9.Se4 Ta1 10.Sc3 Ke5 11.Kf3 Th1 12.Ke2 f5 13.b6 Th2+ 14.Kd3 cxb6 15.Kc4 f4 16.Kd3 f3 17.Se4 Txa2

3. -+ (-6.98):  1...Th8 2.b3 Th2 3.a4 Th1 4.Se4 Td1 5.Kf4 Txd7 6.Ke3 f5 7.Sf2 Td5 8.Ke2 Ke6 9.Sh3 Kd6 10.Sg5 Td4 11.Sf7+ Kd5 12.Ke3 Tb4 13.Kd3 Txb3+ 14.Kc2 Ta3 15.Sg5 Ta2+ 16.Kc3 Txa4

4. -+ (-6.92):  1...Txd7 2.Kf3 Td5 3.Se4 f5 4.Sc3 Td2 5.Sa4 Kd6 6.Ke3 Th2 7.Kf3 Th3+ 8.Kg2 Td3 9.Kf1 Td2 10.Ke1 Th2 11.Kf1 Ke5 12.Sc5 Tc2 13.Sb7 Kd5 14.Ke1 f4

5. -+ (-6.91):  1...Tb8 2.Sd3 Th8 3.Kf5 Th5+ 4.Kg6 Tg5+ 5.Kh6 Kxd7 6.b4 Ke7 7.a3 Txb5 8.Sc1 Kf7 9.Sb3 Td5 10.Sa5 Txa5 11.bxa5 c5 12.Kh5 c4 13.Kg4 f5+ 14.Kg3

6. -+ (-6.87):  1...Tg8+ 2.Kf3 Th8 3.Kg3 Tb8 4.a4 Th8 5.Sb7 Kxd7 6.Sc5+ Kd6 7.Se4+ Ke7 8.Sc3 Th5 9.a5 Ke6 10.Kf3 Th2 11.Sa4 Kd6 12.Ke3 Th4 13.Sc3 Tb4 14.Sb1

7. -+ (-6.64):  1...Ta8 2.b3 Th8 3.Kg3 Th5 4.Se4 Td5 5.Kf4 Txd7 6.Sg3 Td5 7.Ke4 Ke6 8.Sf1 Txb5 9.Kd4 Td5+ 10.Kc3 Te5 11.Kc4 Te2 12.a3 Tf2 13.Se3 f5 14.Sd1

8. -+ (-6.55):  1...Kf7 2.Kf5 Ke7 3.Ke4 Tb8 4.a4 Tb6 5.d8D+ Kxd8 6.Sa6 Kd7 7.Sc5+ Ke7 8.Kd5 Td6+ 9.Kc4 f5 10.a5 Td2 11.b4 Td1 12.a6 f4 13.Se4 f3 14.Sf2 Td2 15.Se4 Te2 16.Sg3 f2 17.Kc5 Tc2+ 18.Kd4 Tc1 19.Ke3 Tb1 20.Kxf2

Es weiter beobachtend, war in Tiefe 25 einmal wieder ...Td7 oben, noch in derselben Iteration (das weitere Fortschreiten der time to depth dauert ja jetzt schon immer länger) ist es auf Platz 5 abgerutscht. Als single best move gehte das nicht leicht durch, würde ich sagen, game changer ist's sowieso keiner relativ zu den Alternativen. Kann man aus menschlicher Sicht natürlich trotzdem den schönsten, subjektiv einfachsten oder klarsten Weg finden, aber als Engine- Teststellung fehlt die Beweisbarkeit, dass es deutlich besser ist als die eine oder andere Alternative, dazu kommt, dass es ziemlich viele ähnlich gute Alternativen sind. Damit würde es bei mir auch für MEA eher nicht in die engere Wahl kommen, weil ich nicht gern mehr als 4 Lösungen mit Punkten belohne, es macht die Sache zu zufallsabhängig, selbst bei multiplen Lösungen sollten es nicht allzu vielen allzu ähnliche sein.
Danke trotzdem für die interessante Stellung.
Parent - - By Kurt Utzinger Date 2025-03-14 13:04
Peter Martan schrieb:

Torsten Cuber schrieb:

Natürlich kann Schwarz auch so gewinnen, es ist aber (aus Sicht eines Menschen) wesentlich komplizierter!

Naja, Torsten, das kann man so sagen, dass Schwarz auch anders gewinnen kann.
Das ist mal mit leerem Hash gestartet und gerade so vielen MultiPV- Varianten, dass keine dabei ist mit wesentlich schlechterer Eval aus schwarzer Sicht, dass 1...Txd7 nach oben kam, passierte schon bald, noch während ich die Zahl der Lines erhöht habe, das ist in Tiefe 23 nach ca. 5 Minuten mit 30 Threads der 16x3.5GHz CPU:

Es weiter beobachtend, war in Tiefe 25 einmal wieder ...Td7 oben, noch in derselben Iteration (das weitere Fortschreiten der time to depth dauert ja jetzt schon immer länger) ist es auf Platz 5 abgerutscht. Als single best move gehte das nicht leicht durch, würde ich sagen, game changer ist's sowieso keiner relativ zu den Alternativen. Kann man aus menschlicher Sicht natürlich trotzdem den schönsten, subjektiv einfachsten oder klarsten Weg finden, aber als Engine- Teststellung fehlt die Beweisbarkeit, dass es deutlich besser ist als die eine oder andere Alternative, dazu kommt, dass es ziemlich viele ähnlich gute Alternativen sind. Damit würde es bei mir auch für MEA eher nicht in die engere Wahl kommen, weil ich nicht gern mehr als 4 Lösungen mit Punkten belohne, es macht die Sache zu zufallsabhängig, selbst bei multiplen Lösungen sollten es nicht allzu vielen allzu ähnliche sein.
Danke trotzdem für die interessante Stellung.


Wenn 3 - 8 fast gleichwertige Züge zum Gewinn führen, eignet sich eine
Stellung keineswegs zu Testzwecken für Computerprogramme, meine ich.
Als Test für menschliche Spieler wäre die Stellung hingegen sehr gut.
Gruss
Kurt
Parent - - By Peter Martan Date 2025-03-14 13:09 Edited 2025-03-14 13:19
Kurt Utzinger schrieb:

Als Test für menschliche Spieler wäre die Stellung hingegen sehr gut.

Und was willst du dabei als Mensch testen? Ob du eine kürzere DTM mit 1...Txd7 gegen den Rechner schaffst als nach z.B. 1...Th8, das könntest du natürlich probieren, viel Spaß beim Versuch

Dass du's gegen einen bestimmten anderen Menschen oder beim Herumprobieren am Brett ohne Engine- Unterstützung allein leichter so ausspieltest, dass du deine Ergebnisse für "gut" hieltest, würde ja vielleicht noch nicht viel sagen (wie man anhand der von mir ausreichend angebotenen Engine- Varianten sieht, wenn du denn nämlich als Mensch zu dem Schluss kommst, 1...Txd7 ist eindeutig besser als alles Andere), und vor allem davon abhängen, ob's dir der Gegner so leicht macht, wie du's dir erhoffst.
Oder meinst du auf irgendeine "menschliche" Art allein (ohne Engine- Unterstützung) beweisen zu können, dass 1...Txd7 ein eindeutiger best move ist? Wie Torsten schon richtig schrieb, ist die Definition dieses Begriffs (best move) nicht davon abhängig, wer gegen wen spielt, entweder ein bestimmter Zug ist ein solcher, oder er ist es nicht. Ob man's immer bei allen Stellungen von Interesse wird schlüssig beweisen können, welche der objektiv eindeutig beste ist (geben muss es schon immer mindestens einen solchen, bei z.B. gleichen distances to mate können's auch nachweislich mehrere gleich gute best moves sein), das steht auf einem anderen Blatt.
Aber einen Zug, von dem man nicht weiß, ob's der beste ist, den (Zug) als "Lösung" einer "Testellung" zu verwenden, wen oder was auch immer du damit testen willst, schaut mir verdächtig nach Trick 17 (Selbstüberlistung) aus.
Oder ganz im Sinn des Zitates,
Und also schließt er messerscharf, dass nicht sein kann, was nicht sein darf
Parent - - By Kurt Utzinger Date 2025-03-14 13:54
Peter Martan schrieb:

Kurt Utzinger schrieb:

Als Test für menschliche Spieler wäre die Stellung hingegen sehr gut.

Und was willst du dabei als Mensch testen? Ob du eine kürzere DTM mit 1...Txd7 gegen den Rechner schaffst als nach z.B. 1...Th8, das könntest du natürlich probieren, viel Spaß beim Versuch


Testen möchte man als Mensch, ob man in der Lage wäre, den mehr oder weniger auf der
Hand liegenden Zug 1...Txd7  2.Sxd7 zu berechnen oder ob man sich doch eher auf andere
wohl kaum berechenbare Fortsetzungen einlassen soll. Und wenn der Gegner nicht 2.Sxd7
spielt, sind wir nicht besser dran als bei anderen Möglichkeiten.
Gruss
Kurt
Parent - By Peter Martan Date 2025-03-14 14:28 Edited 2025-03-14 14:31
Kurt Utzinger schrieb:

Testen möchte man als Mensch, ob man in der Lage wäre, den mehr oder weniger auf der
Hand liegenden Zug 1...Txd7  2.Sxd7 zu berechnen oder ob man sich doch eher auf andere
wohl kaum berechenbare Fortsetzungen einlassen soll. Und wenn der Gegner nicht 2.Sxd7
spielt, sind wir nicht besser dran als bei anderen Möglichkeiten.

Kurt, ich verstehe dich rein schachlich überhaupt nicht.
Du meinst, es genügte hier, die Partie mit 1...Txd7 zu gewinnen, wozu braucht man also noch andere "kompliziertere" Wege, ist es das, was du meinst?
Mit 2.Sxd7 könnte man danach ja natürlich vermutlich rechnen, müsste man aber halt auch nicht nur, es sei z.B, dein Gegner will sich da seinerseits einfach selbst auf der Uhr mehr weiterbringen als dich, der du dann ja erst wieder am Rechnen wärst, warum er's nicht annimmt, und was du jetzt anstatt seinem erwarteten Zug vorgesetzt bekommen hast.

Weiß hat ja eh nichts mehr zu verlieren, aber einen anderen Grund, die Quali nicht zu nehmen, sähe ich keinen, ein Opfer stellt die aber zunächst mal schon einfach dar, das das Spiel nicht so vereinfacht, wie man sich erhoffen könnte, darüber sind wir uns ja offenbar einig.

Und wenn du jetzt aber imstande bist, den Gewinn mit dem (eigentlich trotz des) Qualiopfer(s) sicher nach Hause zu spielen, warum sollte dir das, wenn du das Opfer (an der Stelle noch) nicht bringst, nach anderen, objektiv einfach gleich guten anderen Zügen nicht auch gelingen?

Und wenn du deine menschliche Endspiel- Technik überprüfen wolltest anhand der Stellung, solltest du dann nicht erst recht den einen oder anderen anderen Weg, von denen es ja nachweislich ein paar solche gleich gute gibt, auch wenigstens so weit durchrechnen, dass du sicher wärst, dass sich das Quali- Opfer lohnt, und dass du nicht ohne es ev. einen noch besseren Weg hättest?

Und würdest du dann, wenn sich die Stellung als Übung für dich gelohnt hätte, nicht auch zu dem Schluss kommen, da kann man opfern, muss es aber nicht?
Was man wirklich bei welcher eigenen und welcher gegnerischen Restzeit auf der Uhr am Brett spielen würde, das hinge wohl stark davon ab, wer der Gegner wäre, gegen eine Maschine würde ich vielleicht auch 1...Txd7 spielen, wenn ich halbwegs sicher gesehen hätte, dass sich das danach auch noch gut ausgehen sollte, weil bei der muss ich sowieso ihrerseits nicht wirklich auf Fehler hoffen, aber je nachdem, wie sicher ich mir wäre, könnte es durchaus auch sein, dass ich lieber zunächst noch meinen Turm behielte, den Bauern bekommt man ja später auch noch, vor allem, wenn man ohnehin bereit ist, dafür die Qualle zu geben.
Just my two cents, ich sehe schon, es handelt sich bei der Teststellung mehr um eine psychologische als eine schachliche
Parent - - By Andreas Matthies Date 2025-03-14 17:29 Upvotes 2
Wann hört ihr endlich auf, Computerschach mit menschlichen Attributen wie "elegant" und "umständlich" zu bewerten?
Computerschach hat außer den Regeln so gut wie nichts mit "Menschenschach" zu tun.

Grüße, Andreas
Parent - - By Lothar Jung Date 2025-03-14 18:57 Upvotes 1
Ja, Andreas, Du bringst es auf den Punkt.
ComputerSchach ist durch und durch künstlich.
Kalte Algorithmen berechnen. Keine Überraschung, keine Psychologie, keine Emotionen.
Es ist sogar noch schlimmer. Die Regeln werden gebrochen. Bei der Eröffnung (UHU) , im Endspiel (Tablebases) und bei der Bedenkzeit.
Bei der Elowertung gerät alles durcheinander.
Schlimm ist es, daß diese Künstlichkeit, durch die KI auf unser Leben sich Bahn bricht.
Lothar
Parent - By Max Siegfried Date 2025-03-14 20:26
Du gegen Stockfish:
-Beide benutzen das Eröffnungsbuch ihrer Wahl oder das gleiche Eröffnungsbuch. Dadurch kannst du theoretisch gegen Stockfish mithalten bis nur noch 2 Könige auf dem Brett sind.
-Sollte Stockfish vorher abweichen, musst du nur einige Züge im Mittelspiel überstehen, bevor ihr beide auf die Endspiel Tablebases zugreift.
= Dadurch hast du als Mensch eine relativ gute Chance gegen Stockfish Remis zu spielen und du spielst unter den gleichen Bedingungen wie die Engines untereinander.
Up Topic Hauptforen / CSS-Forum / Teststellung aus meinem nächsten PC-ULTRA-TEST

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill