Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Zur Stockfish Bewertung am Beispiel Lettisches Gambit
- - By Thomas Zipproth Date 2026-04-14 18:23 Upvotes 5
Mir schien anhand der Diskussion zum Lettischen Gambit, dass die aktuelle Bedeutung des Stockfish-Scores cp (centipawn) evtl. nicht allen bekannt ist.
Hier eine kurze Zusammenfassung am Beispiel Lettisches Gambit nach 1 Stunde Rechnen:

Tiefe: 55
Score: cp 214
WDL: 988 12 0

Im Gegensatz zu früher ist der cp-Wert nicht mehr einfach ein umgerechneter Stellungsbewertungswert (aus dem NN oder einer HCE, Hand-Crafted Evaluation).
In den cp-Wert geht heute auch die statistische Gewinnwahrscheinlichkeit ein, die über Millionen von Partien (Selfplay) modelliert wurde.
cp ist dabei auf Gewinnwahrscheinlichkeit normiert: 1.00 entspricht ungefähr 50% Gewinnwahrscheinlichkeit im Stockfish-Selfplay-Modell.

Diese Umrechnung hat als Input den aktuellen internen Stellungswert der Suche plus die Materialverteilung und berechnet daraus WDL (Win Draw Loss).
Das WDL-Modell hängt also nicht nur vom Score, sondern auch vom Material auf dem Brett ab.
Die WDL-Ausgabe kann per UCI-Kommando aktiviert werden.

Lettisches Gambit: WDL 988 12 0, d.h. Stockfish erwartet im Selfplay ungefähr:
988 gewonnene Partien
12 Remis-Partien
0 Verluste.

cp-Wert und WDL sind für dieselbe Stellung nahezu direkt ineinander umrechenbar.
Parent - - By Wolfram Bernhardt Date 2026-04-15 10:23 Edited 2026-04-15 10:27 Upvotes 1
Hi!

Das klingt jetzt so, als sollte man auf jeden Fall das Lettische Gambit spielen - es gewinnt ja zu rund 99%.

Aber ist anders gemeint: Das ist ja ein Gambit, das Schwarz spielt. Und wenn Schwarz es spielt, gewinnt Weiss zu rund 99%.

Oder habe ich etwas falsch verstanden?

Viele Grüße
     Wolfram
Parent - - By Thomas Zipproth Date 2026-04-15 11:50
Ok, das habe ich nicht dazu geschrieben, weil es (dachte ich) selbstverständlich ist.

Das lettische Gambit entsteht nach:
1. e4 e5 2. Sf3 f5

Die Bewertung ist die Stockfish Berechnung für diese Stellung.
Stockfish gibt den Score bezogen auf den aus der am Zug ist, hier also Weiß.

Tiefe: 55
Score: cp 214 (2.14)
WDL: 988 12 0

Erwartungswert WDL für Weiß (der am Zug ist):
988 gewonnene Partien
12 Remis-Partien
0 Verluste.
Parent - - By Frank Brenner Date 2026-04-15 13:05
Hallo Thomas,

dass Stockfish heute keine hand-crafted Bauerneinheiten mehr ausgibt, sondern einen Wert, der sich über alle Spielphasen hinweg per fester Formel in eine Siegwahrscheinlichkeit umrechnen lässt, und dass im Lettischen Gambit nach einer Stunde Analyse +2,14 für Weiß angezeigt werden, was im Bullet-Selfplay ungefähr einem erwarteten Score von +988–12–0 entspricht, reicht noch lange nicht aus, um die Ausgangsstellung einfach als „für Weiß gewonnen“ abzuhaken.

Nur wenn man der Meinung wäre, dass Stockfish praktisch wie ein Gott spielt, könnte man aus einer Bewertung von +2,14 auf eine nahezu sichere Gewinnstellung schließen.

In der Realität ist das aber noch lange nicht der Fall. Kein starker Schachspieler würde eine frühe Eröffnungsstellung, in der Stockfish +2,14 anzeigt, einfach als sicher  gewonnen einstufen, sondern eher als „möglicherweise gewonnen“.

Und genau darum geht es: dieses „möglicherweise“  durch Investition von fleißiger Testarbeit  in ein "fast sicher" zu qualifizieren.

Denn man kann die Sache auch umdrehen: Angenommen, es gäbe eine Engine, die 800 Elo stärker ist als Stockfish. Dann würde Stockfish gegen diese Engine selbst aus einer Stellung, die es mit +2,14 bewertet, ganz sicher nicht mit 988–12–0 im Bullet dominieren.

Der Mephisto Roma verliert nahezu 100% aller Spiele gegen Stockfish, selbst dann wenn der Roma in der Eröffnung einen Vorteil für sich von +3 anzeigt.
Die +3 des Roma lassen sich für Roma-Bullet-Selfplays ebenso in eine Gewinnwahrscheinlcihkeit umrechnen, mit allerdings unbekannter formel, die man erst ermitteln müsste, aber um diese Formel geht es nicht.

Was man  aber machen könnte:

Du kannst den SF  Wochenlang an der Stellung  rechnen und wenn der Vorteil von 2,14 beständig steigt auf bis zu 2,3 dann 2,6 dann 2,8  und dann 3,0 usw... Ja das wäre das ein immer stärkerer Hinweis auf eine Gewinnstellung nach 1. e4 e5 2. Sf3 f5
Aber wegen des zu hohen Branchingfaktors von SF kommt man vielleicht nicht tief genug in die Stellung  um solche ständig wachsende Bewertungen zu beobachten. Dazu ist der Gewinn vielleicht noch zu weit entfernt. Außerdem ist es langweilig monatelang den Rechner mit Vollast laufen zu lassen für den nächsten Halbzug.

Man könnte das spiel mit langer Bedenkzeit ausspielen: Aber mit nur einer einzigen Partie werden zu viele Varianten übersehen, am Ende wäre ein 1-0 oder 1/2  qualitativ nicht besser als das +2,14 von SF mit einer Stunde Rechenzeit.

Ein Kompromiss wäre, dass man eine Partie  mit langer Bedenkzeit spielt und dem Schwarzspieler, dessen Niederlage man beweisen möchte,  die Möglichkeit gibt Züge zurückzunehmen, z.b. wenn die beiden Engines plötzlich einen "starken drop um einige Zehntel"  in der Bewertung anzeigen.

Am ende muss man heute im Jahr 2026 immer noch sehr viel Zeit investieren um eine Eröffnungsstellung auf Gewin/Remis/Verlust zu beurteilen. Dazu ist Stockfish wahrscheinlich noch nicht perfekt genug bei +2,14 .

Grüße Frank
Parent - - By Walter Eigenmann Date 2026-04-15 22:41 Upvotes 1
Frank Brenner schrieb:
Nur wenn man der Meinung wäre, dass Stockfish praktisch wie ein Gott spielt, könnte man aus einer Bewertung von +2,14 auf eine nahezu sichere Gewinnstellung schließen.
In der Realität ist das aber noch lange nicht der Fall. Kein starker Schachspieler würde eine frühe Eröffnungsstellung, in der Stockfish +2,14 anzeigt, einfach als sicher  gewonnen einstufen, sondern eher als „möglicherweise gewonnen“.
Es sei denn, man untersucht mal ein paar 1000 SF-Games und zählt zusammen, wie oft SF nicht gewann nach einem +2,14 in der Eröffnung (oder im Mittelspiel-Übergang).
Ich tippe auf einige wenige Partien...
Noch ein Szenario: Man nimmt 50 UHO-Stellungen, die SF mit ca. +2 einschätzt, und lässt ihn die Positionen gegen viele starke, verschiedene Engines je ein paar hundert Games ausspielen.
Ich tippe auf eher wenige Partien, die SF nicht gewinnt...
+2 ist schon eine echte Marke bei Stockfish.

Gruss: Walter

.
Parent - - By Thomas Zipproth Date 2026-04-15 23:23 Upvotes 1
Ich denke so ist es, >+2 ist bei Stockfish zu fast 100% gewonnen.

Und es hat ja niemand behauptet, das mit einem Score von 2.14 die Gewinnstellung mathematisch bewiesen ist.
Es bleibt eine Wahrscheinlichkeitsaussage, aber ich würde sagen, eine sehr sichere.

Und ich hatte das ganze schon mal mit 1. g4 durchgespielt:

Für Schwarz nach 1. g4:
Tiefe: 65
cp 140 (1.4)
WDL 822 178 0

Interessanterweise gewinnt Stockfish auch hier mit Schwarz nahezu 100% der Partien.
Und bei den wenigen Remis Partien konnte man einen verpassten Sieg finden.

Gruß Thomas
Parent - By Peter Martan Date 2026-04-15 23:40 Edited 2026-04-16 00:24
Thomas Zipproth schrieb:

Und ich hatte das ganze schon mal mit 1. g4 durchgespielt


Die Gemeinsamkeit mit dem Lettischen Gambit  nach 1.e4 e5 1.Sf3 f5 ist unter anderem die geringe Zugzahl der Vorgabe.
Mein Versuch mit SF- Reckless zum Lettischen Gambit,

https://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=178819#pid178819

, war nicht als statistisch belastbarer Beweis für die Genauigkeit der Aussage der Eval gedacht, aber bei einer TC von immerhin 3'+1", was ja gegen echte VSTC schon direkt lang ist () und einem doch immerhin mit entsprechend großen Partiezahlen ansonsten immerhin noch nachweisbarem Spielstärkenunterschied wie zwischen Reckless und SF, sind die 5 Remis in den 150 Partien ja auch nicht gerade viel (mit steigender Hardware- TC und reinem Selfplay sollte die draw rate ja im Allgemeinen eher steigen als sinken).

In Eröffnungen würde ich der SF- Eval heutzutage eher noch mehr trauen als im verwickelten Mittelspiel, in dem die Suche komplizierter wird, und im Endspiel, in dem eine Eval von +2 schon deutlich Remis- verdächtiger ist als in der Eröffnung, weil bei entsprechend reduziertem Material die Varianten bis zu den tbs durchrechenbar eher +199 oder eine DTM im Output haben, wenn die Stellung zwingend gewonnen ist. +2 wäre da eher hinterfragenswert, ob Festungen und oder die 50 Züge eventuell je nach Hardware- Zeit und Engine möglicher Weise einfach zu optimistisch als zu vorsichtig beurteilt werden, was die Suche angeht, die natürlich sowieso immer das Fragezeichen an der ansonsten noch so guten Eval bleibt, dass z.B. eigens als solche komponierte anti engine puzzles Ausnahmen darstellen, schrieb ich schon an anderer Stelle. Und natürlich gibt's auch Eröffnungsstellungen, die SF für meine Analysen und das, was ich persönlich an Eval am besten fände, weniger genau richtig ausgibt, aber welche das sind, (und natürlich kann ich mich erst recht leicht mehr oder weniger irren, auch mit noch so guter Engine- und Datenbankunterstützung) werde ich hier sicher nicht veröffentlichen, das sind meine wenigen Resthoffnungen im Fernschach

Nein, im Ernst, über+2 nach 2 Zügen (oder noch früher), das ist in aller Regel gelaufen. Man kann's ja am einfachsten dadurch ausprobieren, dass man 2  Bauern einer Seite so wegnimmt, dass die Eval dann nicht gleich viel höher als +2 für die Seite im Vorteil ist (und das wird eben, wenn man nur auf einer Seite 2 kassiert, schon schwer, da muss man schon eine Weile herumprobieren, und es sollte eher die weiße als die schwarze Seite sein, damit nicht der Anzugsvortei auch noch dazu kommt, so ginge es z.B. halbwegs, wenn man nicht allzu lange rechnen lässt:

Analysis by Stockfish dev-20260402-5eeca739:

1.Sc3 d6 2.e4 g6 3.Le3 Lg7 4.a3 Lxc3+ 5.bxc3 Sc6 6.f3 Sf6 7.Se2 d5 8.exd5 Sxd5 9.Lh6 Dd6 10.c4 Sb6 11.Dxd6 cxd6 12.Sf4 Sd4 13.Kf2 Se6 14.a4 Sxf4 15.Lxf4 Le6 16.c5 dxc5 17.Lb5+ Sd7 18.Thb1 0-0-0 19.a5 a6
Tiefe: 39/64 00:01:25 2237MN, tb=230
Schwarz steht deutlich besser.
-+ (-2.08)

Und ja, UHO im weitesten Sinn ist das Prinzip, mit dem heutzutage am meisten getestet und gespielt wird, was sich auch wieder aufs Training der Netze auswirkt, so gesehen sollten die um die +1 herum evaluierten frühen Eröffnungsstellungen diejenigen sein, die das beste Verhältnis zwischen Prognose und Ergebnis haben, sie sind also sowieso sozusagen self fulfilling prophecies in der Selektion für die Fortschrittskontrolle, somit auch als Grundlage weiteren Fortschritts, sofern er auf diese Art überhaupt noch nachweisbar ist, so what?
Parent - By Frank Brenner Date 2026-04-16 01:28 Edited 2026-04-16 01:32 Upvotes 1
Dass Stockfish in Partiedatenbanken bei einer Bewertung von +2 extrem häufig gewinnt, ist auch klar – Stockfish ist ja ohnehin die beste Engine.

Aber wie sieht es aus, wenn man eine Engine heranzieht, die 300 Elo stärker ist (zum Beispiel durch 1000 Bedenkzeit)?

Ich bin mir sicher, dass bei einer Stockfish-Bewertung von +2,14 die spieltheoretische Gewinnquote bei weitem nicht bei etwa 988–12–0 liegt, wenn der Gegner perfekt verteidigt.

Grüße Frank
Up Topic Hauptforen / CSS-Forum / Zur Stockfish Bewertung am Beispiel Lettisches Gambit

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill