Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Stockfish Endspiel
- - By Tom Paul Date 2014-04-08 09:57

Schwarz am Zug
Stockfish bewertet diese Stellung mit +2.11 Tiefe 44.
Da muss noch nachgebessert werden.
Schließlich wollen wir nicht, dass Stockfish diese Remisstellung anstrebt mit +2.11 Vorteil und deshalb auf eine Gewinnstellung mit +2.00 Vorteil verzichtet.
Parent - - By Heiko Krauß Date 2014-04-08 13:33
Der aktuelle Stocki vom 7.4 bewertet die Stellung mit
  +/-  (1.08 !)   Tiefe: 44/71   00:03:31  2330mN, tb=1056909

Gruß Heiko
Parent - By Eelco de Groot Date 2014-04-08 20:45
Eigentlich hat sich aber da nicht viel wirklich geändert , nur daß die Bewertung nun verglichen wird mit PawnValueEg, also 1.08 Endspiel Bauern. Man sehe patch von Lucas Braesch https://github.com/mcostalba/Stockfish/commit/0d8a4c7565390c9f7ccc99799a76a19fb50e6f7b
Zitat:
Rescale UCI scores to PawnValueEg
This is more consistent with what other engines are doing.
Often people thinks that SF's scores are overblown. In the
end, it just boils down to the arbitrary way of rescaling them.

No functional change.


Das war ein bißchen versteckt, nur hier zu finden.

Gruß,
Eelco
Parent - - By Benno Hartwig Date 2014-04-09 10:10 Edited 2014-04-09 10:22

> Der aktuelle Stocki vom 7.4 bewertet die Stellung mit  +/-  (1.08 !)   Tiefe: 44/71   00:03:31  2330mN, tb=1056909


Notwendig wäre, dass SF das Remis erkennt, trotz materieller Überlegenheit. Dass kein Sieg erzwungen werden kann.
In solchen Stellungen ist das ggf. nicht einfach. Es ist ja noch viel Material da.

Außerdem:
Gegner spielen ja auch nicht immer fehlerfrei.
Und von den vielen Remis-Stellungen, die von hier aus erreicht werden können, kann SF ggf. tatsächlich solche 'erzwingen' bei denen SF meint, dass hier Fehler des Gegnerns besonders wahrscheinlich sind (auch wenn SF sich hier verschätzen mag. SF darf sich auch gern einen Menschen als Gegner 'vorstellen') Dann ist aus meiner Sicht auch sehr gerechtfertigt, diesen Stellungen ein positive Bewertung zu geben. Eine die diese geschätzte Fehlerwahrscheinlichkeit irgendwie abbildet.

Bei manchen Engines sieht man ansonsten auch immer mal wieder, wie sie auf den ersten Blick im Vorteil scheint (Mehrbauer), wie die Engine dann aber korrekt in der Tiefe remis erkennt ("Ich kann damit nichts erzwingen"), und wie sie dann sehr bereitwillig und schnell in ein Remis abwickelt, bei dem sie dann materiell im Hintertreffen ist (Sie schenkt einfach Bauern her. "Es hatte ja doch keinen Zweck!"  Marvin hieß jener depressive Roboter, richtig?), also auch nicht mal mehr auf einen Gegnerfehler hoffen darf. Das finde ich dann auch sehr unglücklich!
Nur weil man erkennt, dass der Mehrbauer nicht zum Erzwingen des Sieges ausreicht, muss man ihn ja nicht gleich verschenken und ggf. noch einen weiteren dazu.

Benno

PS:
besonders grotesk:
König und Bauer gegen König, und der Sieg ist nicht erzwingbar.
Und der König kümmert sich nicht mehr um den Schutz seines Bauern und wandert munter umher.
Und der einsame König schlägt den vereinsamten Bauern auch nicht "Brauche ich nicht, ich halte ja auch so remis".
Und so steht da der von allen ignorierte Bauer, und die Könige spazieren umher...
Parent - - By Circular Date 2014-04-09 10:15
Zitat: In solchen Stellungen ist das ggf. nicht einfach. Es ist ja noch viel Material da.

Dann hilft ein Studium von Averbach gute Nacht Lektüre bestimmt weiter.

Averbach sollte bekannt sein!
Parent - - By Benno Hartwig Date 2014-04-09 11:05 Edited 2014-04-09 11:11

> Dann hilft ein Studium von Averbach gute Nacht Lektüre bestimmt weiter.


Sind die Remiskriterien bei Awerbach so konkret beschrieben, dass sich daraus ein passender Algorithmus für das Erkennen derartiger Stellungen ableiten lässt?
Ein Erkennen, welches aufwandmäßig eine Kosten-Nutzen-Abwägung besteht?
Sehr viel(!) häufiger als das Erkennen dieser Situation findet wohl eine Prüfung statt, in der erkannt wird, dass die Situation nicht so ist. Und diese Prüfung darf nicht zu viel kosten. Sonst kostet sie zu viel Spielstärke.
Benno
Parent - - By Circular Date 2014-04-09 11:22
Mit dem Algorithmus ist das so eine Sache, für Menschen ist es klar und deutlich...

So viele Regeln sind es doch gar nicht...

Computer sollten es leicht schaffen, da es doch nicht viel zu rechnen gibt!
Parent - By Michael Scheidl Date 2014-04-09 14:33
Viele dieser Regeln sind "Daumenregeln" und unverläßlich.

Für unsere geliebten Compis gilt: Dummheit + wahnwitzige Geschwindigkeit = Klugheit. Obwohl, zu dieser konkreten Stellung kommt mir in den Sinn, ob es nicht einen Penalty (Malus) für einen Turm VOR dem eigenen Freibauern geben sollte, quasi in Umkehrung eines Bonus für Turm hinter Freibauern, der bekannten Regel. Die ist selbstverständlich schon höchst nützlich und ich nehme an, oder hoffe daß keine Topengine ohne sie auskommen will.
Parent - By Benno Hartwig Date 2014-04-08 21:34

> und deshalb auf eine Gewinnstellung mit +2.00 Vorteil verzichtet.


Andere Stellungen, die SF beispielsweise mit +2,00 bewertet, können aber ebenfalls "falsch" bewertet worden sein.
+2,00 bzw. +2,11 heißt ja nicht "Ich gewinne" sondern eher sowas wie "derartige Stellungen, die ich nur teilweise durchschaue, gewinne ich sehr häufig".

Aber du hast natürlich recht, es macht Sinn zu überlegen, mit welcher Logik sich hier die Beurteilung verbessern lässt.
Ist ggf. aber gar nicht einfach. Hast du einen Vorschlag?

Benno
Parent - - By Tom Paul Date 2014-04-11 06:44 Edited 2014-04-11 06:47
Komodo vs Stockfish 1-0
Stockfish ist blind im Endspiel:
Hier spielte Stockfish Db8 und bewertet diese Stellung genau wie die vorherigen mit 0.00.
Komodo sieht sich jetzt mit Dd3 und +1.45 in Vorteil, davor waren es nur +0.65 also wäre dieses Ergebnis Remis gewesen.
Dann sieht Stockfish Dg8 und bewertet diese Stellung mit +2.04.
Somit hat Stockfish einen Sprung von 0.00 auf +2.04 in einem Zug vollbracht.
Stockfish hatte Dd3 der Zug ist nun wirklich extrem leicht zu finden nicht einmal auf der Liste gehabt.
Stattdessen hatte Stockfish mal wieder seine saublöden Ideen von einem hxg5 hxg5 Abtausch.
Verbesserungen für Stockfish:
1.Es ist dämlich anzunehmen, dass der Gegner der ja auf Gewinn spielen will in einer Stellung wie dieser nach Stockfish 0.00 Meinung Material abtauscht.
Mit wenig Material wiegt ein möglich Patzer X nicht so schwer wie mit viel Material, deshalb ist auch eine +1.00 Stellung in der Eröffnung viel schlimmer als eine +1.00 Stellung im Endspiel.
2.Es ist richtig die eigenen Züge/Möglichkeiten zu schneiden um tiefer rechnen zu können. Aber es ist eindeutig dämlich die gegnerischen Möglichkeiten so stark zu beschneiden wie es Stockfish derzeit macht.
Und das bei 16 Zügen, tiefer als Komodo, x2 =32 weil für beide Seiten gerechnet wird.
http://tcec.chessdom.com/archive.php?se=6&st=3&ga=1
Parent - By Tom Paul Date 2014-04-11 11:26
Übrigens lese ich über Stockfish ständig etwas über Linie und Reihe xy Tuning aber ich habe nichts über Diagonalen entdeckt!
Wie geht Stockfish eigentlich damit um?
Mir ist dies in mehreren Stockfish Partien als Schwäche aufgefallen, wie auch in der Partie gegen Komodo.
Parent - - By Circular Date 2014-04-11 12:22
Deine Mutmaßungen zu:

1. und
2.

verstehe ich überhaupt nicht.

Gibt es dafür stichhaltige Gründe?
Parent - - By Benno Hartwig Date 2014-04-11 14:28
zu 2.
Es wurden schon häufiger Stellungen gepostet, in denen SF einen Zug übersah, mit dem der Gegner sehr schnell zu einem deutlichen Vorteil kommt.
Beispiel: SF rechnet 20 plys tief und meint "ausgeglichen".
Dann macht der Gegner seinen Zug, und SF erkenn nun schon nach z.B. läppischen 8 plys, dass der Gegner deutlichen Vorteil hat.
Das lag auf 10 Plys in der 1. Analyse, wure aber wohl wegen hier tatsächlich schädlicher Cuts übersehen.

Klar, durch mutiges und in der Regel wohl auch sehr gutes Schneiden kommt SF auf viel Tiefe und auf große Spielstärke
Aber es entstehen auch Risiken, die sich immer wieder auch negativ auswirken.
Versuche, diese "was schneide ich und was nicht" zu optimieren, könnten schon sinvoll sein und ggf. auch zu weiterer Spielstärke führen.
Und falls man übersehene Gegnerzüge für schlimmer hält als eigene übersehene Chancen, ist sein Vorschlag ggf. auch gut.
Und falls die Idee Quatsch ist, dann wird es nichts bringen.

Benno
Parent - - By Michael Scheidl Date 2014-04-11 14:39
Das geschieht eben wenn man ausschließlich Elomaximierung im Computerschach anstrebt, und das im Ultrablitz. Manche "Old School"-Programmierer würden stattdessen vermutlich lieber ein paar Elopunkte opfern, um die größten Dummheiten zu vermeiden. Gegen Menschen und/oder bei langen Bedenkzeiten sind statistische 10 oder 20 Elo weniger bestimmt kein Thema, falls man dafür viele Sonderfälle besser behandeln kann.
Parent - - By Benno Hartwig Date 2014-04-11 15:23

> Manche "Old School"-Programmierer würden stattdessen vermutlich lieber ein paar Elopunkte opfern, um die größten Dummheiten zu vermeiden.


Da denke ich dann aber auch wieder an das alte Brute-Force, Maschinenschach, "uninspiriert", "unmenschlich", knallharter Horizonteffekt und was diesem Computerschach noch vorgeworfen wurde.
"Inspiration" kann man natürlich auch SF nicht bescheinigen, aber wenn er dank seiner besonderen Selektivität ganz besonders Tiefe Erkenntnisse raushaut, sieht es manchmal wenigstens so ähnlich aus, finde ich.
Und die Mischung aus 'Genialem' und manchmal auch 'Dummen' hat eben auch was 'Menschliches'.

Und wenn dabei in der Summe sogar noch mehr Spielstärke herauskommt, dann finde ich das in jeder Hinsicht klasse.
Spielstärke nicht wegen einer leidigen Eigenschaft, sondern weil es klasse gemacht wurde.

Benno
Parent - - By Michael Scheidl Date 2014-04-11 15:34
Mein anderer Geschmack sozusagen gründet sich auf folgendem: Wie soll ich einer Engine in der Analyse vertrauen, wenn ich weiß daß sie diverse Spezialfälle - die ja in nicht auslotbarer Tiefe in der Zukunft lauern können - nicht versteht und falsch bewertet?

Leider ist das Falscher Läufer-Endspiel auch im 21. Jahrhundert noch immer das Musterbeispiel dafür. Am lästigsten jedoch: Ungleichfarbige Läufer in einem Bauernendspiel. GMs rofln! Was da manchmal bei TCEC passiert, da krieg ich Fremdschämen.
Parent - - By Benno Hartwig Date 2014-04-11 16:09

> Wie soll ich einer Engine in der Analyse vertrauen, wenn ich weiß daß sie diverse Spezialfälle - die ja in nicht auslotbarer Tiefe in der Zukunft lauern können - nicht versteht und falsch bewertet?


Aber gerade die von dir favorisierten, weniger selektiven Engines werden ja früher(!) auf jene für sie überhaupt nicht auslotbaren Tiefen stoßen, und sie werden diesen Tiefen dann annähernd blind gegenüber sein.

Das Falscher Läufer-Endspiel wirkt aber schon ärgerlich, da hast du Recht. Hier sehe ich zumindest im Fall von Vas einfach eine gehörige, beharrliche Portion Sturheit und die Abwesenheit jedes Sinnes für Schönheit.
(Eine Engine, die das falsche Läufer Endspiel nicht kann und die Unterverwandlungen nur unvollständig behandelt, hat irgendwie auch was Hässliches. "Nö, die Züge finde ich doof, über die denke ich einfach gar nicht nach, pöh!" Finde ich.)

Benno
Parent - By Michael Scheidl Date 2014-04-11 16:50
Zitat:
Hier sehe ich zumindest im Fall von Vas einfach eine gehörige, beharrliche Portion Sturheit und die Abwesenheit jedes Sinnes für Schönheit.

Aus meiner Seele gesprochen! Gratisfans können für damit zusammenhängende Endspieltypen Rykbka 2.2 verwenden, wo dieses Wissen noch drin war.
Parent - By Thomas Müller Date 2014-04-11 18:01
in der letzten TCEC partie SF-H4 war es diesmal H4 der daneben gegriffen hat.
http://tcec.chessdom.com/archive.php?se=6&st=3&ga=5



+0.31 meinte H4 im 27. und nach 28...Sd4 waren es +1.82
SF sah das früher.
Wirklich verblüffend. An den plys kann es nicht liegen ?!

gruß
thomas
Up Topic Hauptforen / CSS-Forum / Stockfish Endspiel

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill