Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / WM: Engines und Stellungswiederholungen
- - By Michael Scheidl Date 2014-11-17 17:25
...seufz

In der zur Stunde noch laufenden 7. Partie Carlsen-Anand hatten auf Chessdom die drei Live-Kibitzengines Houdini, Komodo und Stockfish schon längere Zeit mit ca. +1 bzw. +2 bewertet. (Worauf es hier nicht ankommt ist, die Stellung an sich war vermutlich, wie ich einmal riskiere zu behaupten, schon längst 99% remis aber für Engines nur schwer so einschätzbar.) Mit 47.Kb2 spielte Carlsen den König zurück auf das Feld von welchem dieser gerade kam, und erlaubte Anand eine Stellungswiederholung mit 47...Th2, was auch geschah.



Man erkennt hier wie die Bewertung von Komodo und Stockfish momentan auf 0,02 bzw. 0,00 abfiel, wie man es halt von vielen Engines im Dunstkreis von Stellungswiederholungen sieht, auch wenn diese noch keineswegs zwingend ein Remis bedeuten müssen. Unmittelbar nach 47...Th2 - von beiden Engines erwartet - kehrten die Bewertungen sofort auf die vorigen Niveaus zurück. Dies entbehrt der Logik und stört Engineanalysen, insbesondere wenn wir an Stellungen denken die evtl. weitaus unübersichtlicher sein können und dasselbe auftritt. Typisch sind z.B. einmalige Wiederholungen die nur dazu dienen, schneller über die Zeitkontrolle zu kommen.

Nur Intelligenzler Houdini, bravo!, vermied diese irrige seismische Eruption seiner Messungen, erkennend daß Weiß ja nicht auf ein Wiederholungsremis einzugehen gewzungen war, sondern anders fortsetzen konnte um den (vermeintlichen) Vorteil von ca. +1 möglicherweise zu vergrößern. Carlsen versuchte dementsprechend 48.Sd5.

Die Schachwelt jenseits der Enginefans wird sich sicherlich über diesen, von zwei der drei Topengines werbewirksamst auf großer Bühne dargereichten Käse wundern.
Parent - By Tom Paul Date 2014-11-17 17:38
Das mit 0.00 nach der ersten Wiederholung ist einfach nur falsch und schlecht, da hatten die Programmierer keine Ahnung.
Hätte man bloß einen GM gefragt.

Besonders lustig wird es dann, wenn man Stellungen dieser Art die ja nach Engine Meinung 0.00 sind, 20000 mal ausspielen lässt und weiß 20000 mal gewinnt.
Parent - - By Peter Martan Date 2014-11-17 18:27
Michael Scheidl schrieb:

Man erkennt hier wie die Bewertung von Komodo und Stockfish momentan auf 0,02 bzw. 0,00 abfiel, wie man es halt von vielen Engines im Dunstkreis von Stellungswiederholungen sieht, auch wenn diese noch keineswegs zwingend ein Remis bedeuten müssen. Unmittelbar nach 47...Th2 - von beiden Engines erwartet - kehrten die Bewertungen sofort auf die vorigen Niveaus zurück. Dies entbehrt der Logik und stört Engineanalysen, insbesondere wenn wir an Stellungen denken die evtl. weitaus unübersichtlicher sein können und dasselbe auftritt. Typisch sind z.B. einmalige Wiederholungen die nur dazu dienen, schneller über die Zeitkontrolle zu kommen.


Schon, schon, eigentlich stört mich hier aber seit dem 31...Lxg4, was ein wirklich weitblickender Plan zum Festungsbau ist, ebenso wie das plötzliche Herausplatzen mit der Idee einer Stellungswiederholung dort, wo du das beobachtet hast, dass die vielen Züge bis dahin, die auch keinerlei Fortschritt gebracht haben, (wenigstens korrekter Weise auch in der Eval nicht), nicht schon längst unterwegs dorthin den scheinbaren Materialvorteil irgendwie relativiert bekommen.
Ist die Idee, mit zunehmendem Partiefortschritt und völlig gleichbleibender Eval, auch als engine auf den Verdacht zu kommen, da ist was faul mit dem reinen Materialzählen, wirklich so blauäugig, programmtechnisch?

Michael Scheidl schrieb:

Nur Intelligenzler Houdini, bravo!, vermied diese irrige seismische Eruption seiner Messungen, erkennend daß Weiß ja nicht auf ein Wiederholungsremis einzugehen gewzungen war, sondern anders fortsetzen konnte um den (vermeintlichen) Vorteil von ca. +1 möglicherweise zu vergrößern. Carlsen versuchte dementsprechend 48.Sd5.

Die Schachwelt jenseits der Enginefans wird sich sicherlich über diesen, von zwei der drei Topengines werbewirksamst auf großer Bühne dargereichten Käse wundern.


Dazu muss ich allerdings auch (sinngemäß noch einmal) sagen, dass das 0.00 genau so richtig oder falsch war hier bereits wie das +1, eigentlich weniger falsch, tatsächlich hat der jüngste SFdev. mit den 6er Syzygys auf Schwabli die ganze Zeit höchstens 0.66 gehabt, also wenigstens weniger als das Material wäre, die Highendrechner bei den Live- Übertragungen könnten sich da ja vielleicht auch irgendwas noch ein bisschen mehr gönnen, es sei denn, sie wollen die engines bei solchen Events eh absichtlich etwas schlechter aussehen lassen.
Parent - - By Thomas Müller Date 2014-11-17 18:39
noch was anderes ....
bei chess24.com sind die wertungen fast immer viel zu hoch.
Ich habe keine ahnung wie der dortige SF im jetzigen endspiel +2,xx angezeigt bekommt ?!?!
Das ist für den "ahnungslosen" zuschauer sehr verwirrend.

gruß
thomas
Parent - - By Michael Scheidl Date 2014-11-17 18:56
Auf Chessdom wiederum sind nun nach Vereinfachung - Carlsen büßte gerade seinen letzten Bauern ein - die Evals von Komodo und Stockfish endlich gegen Null gegangen, doch nun ist einige Züge lang Houdini auf rätselhafte +2 verfallen...  Gerade besinnt er sich langsam.

Vielleicht wird ein Wissen um das Remis TS-T zu spät eingeschaltet. Ich meine, wenn TS-T remis ist, dann TS-TBB doch allemal?! Ein Bewertungsfehler der mir aber auch bei anderen Engines schon aufgefallen ist.

Diese Kibitzengines spielen offenbar meist ohne Tablebases. Die Sesse-Analyse hingegen beinhaltet sogar den Zugriff auf die Lomonosovs und zeigt seit Erreichen des Siebensteiners lapidar "Theoretical draw / Tablebase result" an.
Parent - - By Michael Scheidl Date 2014-11-17 19:17
Zitat:
Vielleicht wird ein Wissen um das Remis TS-T zu spät eingeschaltet.

Leider ist jetzt zu sehen, daß Houdini sogar den reinen Fünfsteiner mit knapp +3 bewertet. Ist das mit H4 reproduzierbar? Ich wundere mich bzw. hätte mit sowas nicht gerechnet.
Parent - By Tom Paul Date 2014-11-17 19:20
Da hilft nur eines: https://stockfishchess.org/get-involved/ + https://groups.google.com/forum/?fromgroups=#!forum/fishcooking damit die Programmierer wenigstens Stockfish diesen 0.00 BUG austreiben.
Parent - - By Benno Hartwig Date 2014-11-17 20:55

> Dies entbehrt der Logik und stört Engineanalysen...


Konkret welche Bewertung hieltest du denn für angemessen?
Zu ignorieren, dass dem Gegner hier schon mal nichts Vernünftiges einfiel, wäre ja sicherlich auch nicht angemessen.

Angenommen die erste Wiederholungsstellung ist 1,00 für den Gegner.
Mit welchem Wert würdest du in der ersten Wiederholung den Zug zu dieser Stellung bewerten?
Dabei bitte bedenken, dass es andere Züge geben könnte, die z.B. 0,10 oder auch 0,90 für den Gegner bieten. Diese Züge müssen sinnvoll vergleichen werden können mit dem Zug zur ersten Wiederholung. Welches Vergleichsergebnis ist hier deiner Meinung nach denn sinnvoll?

Benno
Parent - - By Michael Scheidl Date 2014-11-17 22:27
Die Bewertung des ein drittes Vorkommen der Stellung vermeidenden Alternativzuges, den die Engine somit logischerweise erwarten sollte, natürlich nur falls aus jeweiliger Perspektive überhaupt einer besser als 0,00 vorhanden ist. Ansonsten bzw. wenn keine Alternativen besser 0,00 gefunden werden, ist die Bewertung ja ok, aber sonst nicht.

Wobei mir egal ist ob und was im Suchbaum der Einfachheit halber und zwecks Geschwindigkeit gemacht wird; was geht das mich an aber der Output sollte möglichst stimmig sein.
Parent - - By Benno Hartwig Date 2014-11-17 23:40
Na, wenn es eine bessere Alternative als 0,00 gibt, dann wird jede Engine diese jetzt doch sowieso wählen.
Fragwürdig könnte solch ein Fall doch nur sein, wenn man wirklich meint, dass man aus der Stellung was machen kann, obwohl man beim ersten Versuch damit bereits scheiterte.
Diesen Fall sehe ich als weniger interessant an.

Interessanter ist aus meiner Sicht eine Wiederholungsstellung die eigentlich eher schlecht für mich ist.
Wie soll die Engine abwägen zwischen
1.) Eigentlich ist die Stellung schlecht (z.B. -1,00), aber meinem Gegner fiel beim ersten mal nichts ein
2.) ich kann auch was anderes ziehen. das ist zwar etwas besser (z.B. -0,80), aber mein Gegner bekommt ganz neue Chancen weiterzumachen.
Mit welcher dieser beiden Alternativen hat deiner Meinung nach meine Engine die besseren Chancen? Was sollte sie machen.

AFAIK machen die Engines dann alle(?) mit Blick auf 1.) eine 0,00-Bewertung. Nicht gut?
Eine -1,00-Bewertung und folgerichtig die anschließende 'Flucht'  in die -0,80-Stellung erscheint mir zumindest auch problematisch.
Was wäre der bessere Kompromiss ?

Benno
Parent - - By Michael Scheidl Date 2014-11-18 15:31
Das ist jetzt ohne konkretes Beispiel etwas intransparent geworden... Z.B., hat die Engine welche sich -1 fühlt(e) in der wiederholten Stellung über eine Alternative zu entscheiden, so dürfte eigentlich keine besser als -1 vorhanden sein, sonst hätte diese ja ursprünglich schon gewählt bzw. (in der Analyse) vorgeschlagen werden müssen. M.a.W. nur wegen der Wiederholung taucht ja nicht plötzlich etwas besseres auf. - Vielleicht läßt es sich so auf den Punkt bringen:

Ist eine unerzwungene (erste) Stellungswiederholung geschehen, so stimmt die Bewertung 0.00 nicht.
Parent - By Benno Hartwig Date 2014-11-18 19:34 Edited 2014-11-18 19:45
in solch einen Wiederholungskreis muss ja irgendwann wieder eingemündet worden sein.
Hier ist die Stelle, wo dann erstmals die Wiederholung zu bewerten ist.
Und dann kommt man ja aus Stellungen, in denen man vorher noch nicht war, wo es also bislang unbewertete Alternativen gibt.
Und das mehrere Züge lang!
Diese neuen Alternatven müssen dann regelmäßig mit den erreichbaren Wiederholungsstellungen verglichen werden.
"Will ich lieber in die erste Wiederholung? Oder such mein Glück in bislang nicht bewerteten Stellungen?"

Und wie dieser Vergleich geschehen soll ist nicht trivial.
Möglicherweise ist eine 0,00 für die Wiederholungsstellung nicht die beste Lösung, OK.
Zu ignorieren, dass die Stellung für den Gegnern (oder auch für einen selbst) nur zu einer Wiederholungsschleife genutzt werden konnte, aber sicherlich auch.
"Die Vorteil- oder Nachteil-hafte Bewertung war ggf. übertrieben, denn der erste Versuch damit hatte ja zu nichts geführt."
Spontaner Vorschlag:                                        Bewertung = eigentliche_Bewertung / 2
oder mit einem ausgeklügelten FAKTOR:         Bewertung = FAKTOR * eigentliche_Bewertung

Benno
Up Topic Hauptforen / CSS-Forum / WM: Engines und Stellungswiederholungen

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill