Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Die Bewertung der Bewertung
- - By Walter Eigenmann Date 2022-02-17 10:08 Upvotes 1
.

Nimmt ein durchschnittlicher Schachspieler seine Lieblings-Engine her, um eine Partie analysieren zu lassen, schaut er natürlich gebannt
auf den Evaluations-Output des Programmes.
Denn er ist (meistens) auf die Bewertung der Stellung(en) durch die Engine angewiesen, um der ggf. analytischen Komplexität
einigermassen gerecht zu werden.
(Grossmeister mögen eine Stellung auch ohne Computer relativ schnell einschätzen können).

Doch es gibt bekanntlich mind. drei Probleme beim Bewerten von Bewertungen:

1. Jedes Programm bewertet aufgrund seiner Spielstärke eine Stellung anders
2. Wenn zwei Programme das gleiche sagen, ist es nicht das Gleiche
2. Ein Programmierer kann grundsätzlich alles in seine Engine reinschreiben

Wie krass unterschiedlich aber tatsächlich die Engines die gleiche Stellung unter gleichen Hardware-Bedingungen (Ryzen-7 / 2048GB Hash)
und unter dem gleichen Interface (CB15) bei gleichen TB-Bedingungen (5er Syzygy) bewerten können, fiel mir kürzlich wieder mal auf
bei der Durchsicht einer TCEC-Partie zwischen Kayra und Stockfish (Kayra gewann).

Der untenstehende Screenshot der folgenden Stellung...



... wurde nach ca. 1-minütiger Analyse geschossen und weist die simultane Evaluation (3-Var-Analysemodus) von vier aktuell gebräuchlichen und starken Engines aus:



Wie man sieht, ist gemäss "Informator"-Symbolik und Centipawn-Output alles vertreten: Von "praktisch remis" bis zu "Weiss gewinnt klar".

Die Interpretation dieses Ergebnisses ist nicht ganz trivial.

Ist nun die Stellung wirklich für Weiss gewonnen?
Dann würde evtl. ShashChess - manche halten dieses SF-Derivat für gar noch stärker als Stammvater Stockfish selber - die Stellung nicht gewinnen,
weil er trotz seiner 36 Ply's den Durchblick nicht hat?

Die schwächste Engine dieser Vier ist gemäss div. Rankings Ethereal, trotzdem deklariert das Programm "entscheidenden Vorteil"
und nimmt damit das Partie-Ergebnis treffsicher vorweg...

Kann man evtl. pauschal behaupten, FatFritz und ShashChess seien halt schlechte Bewerter, Stockfish und Ethereal aber korrekte?
Oder etwas neutraler formuliert: FF & SC evaluieren "konservativer" als die "progressiven" SF & ET ?

Oder aber ist es nicht vielmehr so, dass ein Output von += (0.68) bei ShashChess zu interpretieren ist als: "Weiss steht deutlich besser".
Oder das +- (2.62) bei Ethereal als "Weiss steht etwas besser" ?

Oder noch eine aufwändigere Option: Man untersucht möglichst viele Partien zum Beispiel von Stockfish (gegen starke Gegner) im Hinblick
auf die Frage: Welcher Evaluations-Range wird durch das spätere Partie-Ergebnis bestätigt?

Wie gesagt: Die Programmierer können grundsätzlich in ihre Evaluationen reinschreiben, was sie möchten...

PS: Rückblick auf Rybka seinerzeit: Dort wurde ja überall gemunkelt, dass sein Programmierer bewusst
die wahren Evaluationen der Engine durch "falsche" Outputs "verschleiere"...

Fazit: Für Schachanalysen sind Schachprogramme nicht zu gebrauchen...

Gruss: Walter

Hier geht's zur ganzen Partie (Stellungsvorgabe) Kayra - Stockfish (1:0)
https://share.chessbase.com/SharedGames/share/?p=/o3FZ6znXDIP/5XybucR+nQwV43IV6wwAo+afjfuOcoxLKapXF4R9+PLaTLdeMVo

.
Parent - - By Dieter Brandhorst Date 2022-02-17 16:19 Upvotes 1
Zitat:
Fazit: Für Schachanalysen sind Schachprogramme nicht zu gebrauchen...


Eine m.E. verfrühte Schlussfolgerung. Ich sehe hier 4 Schachprogramme, die für eine gegebene Stellung jeweils dieselben 3 Züge in derselben Reihenfolge als die besten Züge angeben. Das ist schon einmal sehr einheitlich. Die Zugbewertungen in Zentibauerneinheiten sind in der Tat sehr unterschiedlich, aber nicht chaotisch, sondern stehen in einem mehr oder weniger bestimmten Verhältnis zueinander. Intern wird z.B. von allen Engines der Zug  Th6  durchgehend 2-3mal höher bewertet als der Zug Tg5. Im externen Vergleich bewertet Etheral alle 3 ermittelten Züge durchschnittlich 5(!) mal höher in Zentibauerneinheiten als ShashChess, Stockfish ca. 2,5 mal und FatFritz ca. 1,7mal. Sollten die Programme intern auch mit entsprechend unterschiedlichen Gewinnerwartungen arbeiten, hielte ich deine Aussage für gerechtfertigt.
Für mich sieht es aber eher so aus, als würden die Programme nur mit unterschiedlichen Verhältnissen bei der Umrechnung von Gewinnerwartung zu Zentibauerneinheiten und vice versa arbeiten. Das ist zwar immer noch ärgerlich, würde aber trotzdem Schachanalysen erlauben. Hilfreich wäre, wenn man die intern verwendeten Gewinn- Remis- und Verlusterwartungsangaben zu sehen bekäme.

VG Dieter
Parent - By Kurt Utzinger Date 2022-02-17 17:35
Dieter Brandhorst schrieb:

Zitat:
Fazit: Für Schachanalysen sind Schachprogramme nicht zu gebrauchen...


VG Dieter


Hallo Dieter
Das hat Walter natürlich nicht ernst gemeint.
Gruss
Kurt
Parent - - By Reinhold Stibi Date 2022-02-17 17:08 Edited 2022-02-17 18:03
Ab dem Diagramm wird die Partie bei korrektem Spiel wahrscheinlich remis sein.

Analyse mit Stockfish 13.02.22  avx2  und Ryzen 3970X.

Nach einigen Zügen kommt Weiß  um +2.00 und kommt nicht zu einer höheren Bewertung.

Nützlich wäre die Einstellung der ganzen Partie hier um Forum in der Form, dass man die
Partie bequem nachspielen und analysieren könnte, da würde man wahrscheinlich schnell
den Fehler von Schwarz finden.

Der Maßstab im Schach ist Stockfish. Ich finde die Bewertung richtig und wüsste nicht,
was es da auszusetzen gäbe.

Kein Mensch und auch kein Schachprogramm kann in dieser Diagrammstellung eindeutig urteilen
ob die Stellung, zwar mit Vorteil für Weiß, gewonnen oder nur remis ist. Das ergeben nur etliche
Züge später. Wahrscheinlich hat Schwarz bei der Fortsetzung einen gröberen Fehler begannen.

Es ist doch ganz natürlich, dass die Programme  unterschiedliche Bewertungen abgeben sonst
wären ja alle gleich.
Letztlich sind die genannten Bewertungen der Programme alle richtig weil kein eindeutiger Sieg
auszumachen ist.
Genau wie bei den Menschen sehen die Programme eine Stellung mehr oder weniger positiv;
es wäre doch stinklangweilig wenn Alle gleich einschätzen würden.
Dies ist also keine Frage von richtig oder falsch.
Parent - - By Horst Sikorsky Date 2022-02-17 17:16
die Fehler vor dem Diagramm muss man mit Absicht machen.
Gruß Horst
Parent - By Walter Eigenmann Date 2022-02-18 10:40 Edited 2022-02-18 10:42
Horst Sikorsky schrieb:
die Fehler vor dem Diagramm muss man mit Absicht machen.
Sozusagen. Die Stellung stammt aus einer Kayra-Stockfish-Partiensammlung mit Imbalanced-Eröffnungsstellungen als Vorgaben:
https://www.glarean-verlag.ch/schach/Kayra-Partien/kayra-partien.htm

Gruss: Walter

.
Parent - By Walter Eigenmann Date 2022-02-17 23:14
Reinhold Stibi schrieb:
Ab dem Diagramm wird die Partie bei korrektem Spiel wahrscheinlich remis sein.
Wahrscheinlich nicht.

Reinhold Stibi schrieb:
Nützlich wäre die Einstellung der ganzen Partie hier um Forum in der Form, dass man die
Partie bequem nachspielen und analysieren könnte, da würde man wahrscheinlich schnell den Fehler von Schwarz finden.
Der tut nichts zur Sache.

Reinhold Stibi schrieb:
Der Maßstab im Schach ist Stockfish.
Nö.

.
Parent - - By Peter Martan Date 2022-02-17 21:04 Edited 2022-02-17 22:04
Walter Eigenmann schrieb:

Wie man sieht, ist gemäss "Informator"-Symbolik und Centipawn-Output alles vertreten: Von "praktisch remis" bis zu "Weiss gewinnt klar".

Die Interpretation dieses Ergebnisses ist nicht ganz trivial.

Ist nun die Stellung wirklich für Weiss gewonnen?

In guter (? ) Absicht hast du eine Stellung genommen, bei der die Frage, die du anknüpfst, durch eine einzelne Eval von einer Engine allein nicht gleich klar wird.
Würde ich einer der vielen Stellungstest- Kritiker um der Stellungstestkritik wegen sein, wäre meine Gegenfrage, und was ist mit dem vielen vielen Stellungen, bei denen die Engines sofort genau wissen, sagen und in Züge umsetzen, was gespielt wird?

Und sind hingegen nicht eigentlich sowieso diejenigen Stellungen mit bei allen Engines deutlich niedrigeren Evals die schwer zu beurteilenden?
Die Interpretation einer Eval von 0.25 in der Eröffnung ist auch nicht ganz trivial.

Wenn im Endspiel ein Vorteil einer Seite wie in deiner Stellung ausgewiesen wird, was tut's, wenn Unklarheit herrscht, einige Züge vorwärts gespielt und schon wird's klarer, in der Eröffnung reichen oft viele viele Züge nicht und das zu erwartende Ergebnis hat in der Regel eine viel höhere Remiswahrscheinlichkeit als solche schon viel weiter fortgeschrittene Stellungen, an Zugzahl und Materialschwund.

Und wie geht jetzt also der im Umgang mit Engines und mit dem Schach als solchem nicht ganz unerfahrene Spieler vor?
Er folgt den Output- Lines seiner Lieblingsengines ein paar Züge weit vorwärts und schaut sich die Evals, die dann herauskommen, im Vergleich zu denen an, die zuerst da waren.
Bleiben sie gleich hoch?
Werden sie höher?
Sinken sie gar?

Um bei deinen Beispiel zu bleiben:
SF weist zuerst eine Eval aus, die nach einer Weile Standrechnen doch schon deutlich im +- ist:

8/1k6/1p1rbn2/4N2R/1p6/3P1P2/PK1B4/8 w - - 0 1

Analysis by Stockfish 100222:

48.Th6 Lf5 49.Lxb4 Te6 50.d4 Sd5 51.Th5 Tf6 52.Ld2 Lc8 53.a4 Ka6 54.Th8 Lb7 55.Kc2 Te6 56.Lg5 Td6 57.Kd3 Sc7 58.Le3 Tf6 59.Ld2 Td6 60.Th7 Sd5 61.Kc4 Sf6 62.Th8 Ld5+ 63.Kd3 Le6 64.a5 bxa5 65.Ta8+ Kb7 66.Txa5 Td5 67.Ta1 Td6 68.Tc1 Lf5+ 69.Ke3 Sd5+ 70.Kf2 Sc7 71.Le3 Sd5 72.Tc5 Le6 73.Sc4 Td7 74.Lg5 Lg8 75.Tb5+ Ka6 76.Ta5+ Kb7 77.Se3 Td6 78.Tb5+ Ka6 79.Tb8 Le6 80.Sxd5 Lxd5 81.Le3
+-  (2.05)    Tiefe: 54/86   00:03:31  6394MN, tb=30934234

Aber, oh Wunder, springt man zum Ende der Output- Line, ist die Eval niedriger:

1R6/8/k2r4/3b4/3P4/4BP2/5K2/8 b - - 0 1

Analysis by Stockfish 100222:

81...Tf6 82.f4 Lb7 83.Kg3 Te6 84.Lf2 Le4 85.Tf8 Tg6+ 86.Kh3 Ld5 87.Lg3 Tg8 88.Tf6+ Kb5 89.f5 Kc4 90.Le5 Kd3 91.Tg6 Lf7 92.Ta6 Ke4 93.Kh4 Ld5 94.Ta5 Lf7 95.f6 Kf5 96.Tc5 Tg4+ 97.Kh3 Tg8 98.Tc7 Ld5 99.Ta7 Le6 100.Ta1 Lf7 101.Tf1+ Kg5 102.Tf4 Ta8 103.Kg2 Ta7 104.Kf3 Ld5+ 105.Ke3 Ta3+ 106.Kf2 Kg6 107.f7 Ta2+ 108.Kg3 Lxf7 109.Tf6+ Kg7
+/=  (0.61)    Tiefe: 49/64   00:00:37  1470MN, tb=16713713

Also war die am Anfang falsch?
Oder ist es die am Ende?

Oder sind es die Züge zwischen der Ausgangsstellung und der am Ende des Outputs?
Ah, Erkenntnis, die Evals sagen nichts ohne die zugehörigen Stellungen und Züge, und zusätzliche Erkenntnis: es kommt auch nicht unwesentlich darauf an, wieviel Züge zwischen den Stellungen liegen, die evaluiert werden!

Folgt man dann den Vorschlägen (hier ist die Frage, wieviele Züge übernimmt man auf einmal aus dem Output, wie lange lässt man pro Zug rechnen, welcher Engine traut man am meisten) so weit, bis die Eval wieder sinkt oder bis sie in noch deutlichere Höhen steigt, dann ist dabei außer den numerischen Evals vor allem auch von Interesse, über wie viele Züge steigt oder sinkt sie wie schnell, oder wie viele Züge muss oder kann man machen (lassen), ohne, dass sich an der Eval viel ändert.

Schauen wir uns einmal dieses Abspiel an:

8/1k6/1p1rbn2/4N2R/1p6/3P1P2/PK1B4/8 w - - 0 48

48.Rh6 Bf5 49.Bxb4 Re6 50.d4 Nd5 51.Rh5 Rf6 52.Bd2 Bc8 53.a4 Bf5 54.Ng4 Rf8 55.Nh6 Be6 56.Re5 Nc7 57.f4 Bd7 58.f5 Bxa4 59.Bg5 Bd7 60.f6 Kc6 61.f7 Be6 62.Bf4 Kd7 63.Rg5 Nd5 64.Bd2 Rxf7 65.Nxf7 Bxf7 *

17 Züge der Output- Line gefolgt, immer so weit, bis eine Änderung im Output kam, dann dort abgebogen, wenn ein Alternativzug eine bessere Eval hatte als der zuerst angebotene, auf diese Art flott interaktiv vorwärts: es ist das Material weniger geworden und der Output schaut jetzt dann dort so aus:

8/3k1b2/1p6/3n2R1/3P4/8/1K1B4/8 w - - 0 1

Analysis by Stockfish 100222:

66.Kc2 Ke6 67.Le1 Kd6 68.Kd3 Ke6 69.Lg3 b5 70.Kd2 Kd7 71.Tg7 Ke6 72.Ld6 Sf6 73.Le5 Sd5 74.Th7 Le8 75.Th6+ Kf5 76.Th1 Lc6 77.Tc1 Ld7 78.Lg7 Ke4 79.Te1+ Kf3 80.Te5 Lc6 81.Lh6 Lb7 82.Kc1 Kf2 83.Ld2 Kg2 84.Kc2 Kf2 85.Kd3 Kf3 86.Tf5+ Kg4 87.Tg5+ Kf3 88.Te5 Lc6 89.Tf5+ Kg4 90.Tf1 Lb7 91.Tc1 Kf3 92.Tc5 Sb6 93.Tf5+ Kg4 94.Tf4+ Kg3 95.Tf8 Sd5 96.Tb8 Lc6 97.Tc8 Lb7 98.Tc5
+-  (2.86)    Tiefe: 57/89   00:04:21  11049MN, tb=86409716

Deutlicher im +-, für sich immer noch nicht beweisend (wenn man bedenkt, wie weit das Endspiel schon fortgeschritten ist, die absoluten Werte müssen ja außer zu den zugehörigen Zügen auch immer zur Zugzahl, die schon gesamt in der Partie gespielt sind, relativiert werden, nicht nur der 50- Züge- Regel wegen, sondern weil Evals in der Eröffnung einfach an und für sich mehr zählen bei gleicher Höhe).

Würde man jetzt aber einfach ans Ende dieser Output- Line springen, hätte man zwar immer noch gleich viel Material, aber hier steigt jetzt die Eval, wenn man ein bisschen wartet, bis zur "Schmerzgrenze" im Wert einer Dame (9 Bauern) Vorteil.

Aber dazwischen liegen wieder 30 Züge einer Output- Line, dass der Fortschritt da vom Ende der interaktiven Line dann nach den 65 dramatisch schnell weiter gegangen ist, kann man eigentlich auch nicht wirklich sagen.
Jetzt haben wir immer noch die Wahl, den 30 Zügen im letzten Output zu glauben, ganz egal, ob die Eval da jetzt zum Schluss schon eine DTM oder wieder remislich wäre, weil die Frage bleiben ja wieder hauptsächlich die 30 unüberprüften Züge.
So what?

Wir kommen zu dem Schluss, dass es nicht an der numerischen Höhe der Evals an der Ausgangsstellung liegt, dass die "nicht leicht zu interpretieren" sind, sie sind unter den verschiedenen Engines verschieden hoch und auch bei denen, bei denen sie im +- sind, für den Partiefortschritt, der schon stattgefunden hat, immer noch schwer zu interpretieren, weil die Stellung halt immer noch ein unklare ist.

Was man oft nicht wahrhaben will: es ist das Material schon so reduziert, und es ist immer noch nicht auf den ersten Blick klar, wer gewinnt, oder ob's Remis ist.
Ja, ärgerlich, aber was können da die Engines und ihre Evals dafür? Liegt's nicht eher am menschlichen Interpreten, dass er nicht imstande ist, die Zahlen mit den Zugzahlen, der Stellung und den Zügen zu vergleichen?

Schaut man sich den Fortschritt der Evals an (und da kommt's eben, wenn die Züge stimmen, nicht so sehr auf die absolute Höhe an, sondern darauf, ob sie so hoch bleiben oder niedriger werden oder gleich bleiben, völlig unabhängig davon, wie hoch sie absolut sind) wird's klar, der Fortschritt ist zu sehen oder nicht, hier ist er zu sehen, wenn er auch sehr zäh ist und überhaupt nur dabb, wenn man nicht zu vielen Zügen aus den Output- Lines zu weit traut.

Ein Ausdruck, der in dem Zusammenhang auch nicht ungebräuchlich ist: der der Dynamik einer Stellung, definieren wir den doch einfach anhand der Engine- Evals als Änderung der Eval- Höhe über die Zahl der Züge hinweg, in der sie (die Eval- Änderung) auftritt.

Eval- Ende minus Eval- Anfang dividiert durch Zugzahl der zu betrachtenden Abspiel- Varianten = Dynamik der Stellung.

Im anderen Thread hast du gerade das entsprechende Feature der Fritz- Backward- Analyse erwähnt, da geht's auch nicht nur um jeweils eine einzelne Stellung von Interesse, sondern um die Änderungen der Evals über den Verlauf einer Partie oder einer Variante einer bestimmten Länge oder auch nur zwischen zwei Stellungen vor und nach einem einzelnen Zug.

Extrembeispiel Stellungen mit taktisch forciertem single best move als "Lösung", ein game changer, wie man so schön sagt: die Eval nach einem Zug ist sehr viel höher als nach allen anderen an der Stellung in Frage kommenden Kandidatenzüge, sehr erfreulich sowas, man sieht gleich, welcher der beste ist.

Extrembeispiel Eröffnungsstellung (oder andere "stille, positionelle, ausgeglichene" Stellung mit unforcierten Abspielen): die Eval bleibt, wenn die Eröffnungsstellung nicht schon ausnahmsweise, weil schon gepatzt wurde, ungewöhnlich hoch ist, über viel Züge hinweg ungefähr gleich hoch, das sowohl in die Tiefe gespielt wie in die Breite an ungefähr gleich guten Verzweigungen analysiert. Mag sein, das wird dann halt auch einfach wieder mal Remis, was ja im Computerschach mittlerweile bei ausgeglichenen Eröffnungssstellungen sowieso das Ergebnis mit einer sehr sehr hohen Wahrscheinlichkeit ist, mag aber auch sein, es wird noch beliebig viel im weiteren Verlauf von Menschen oder Maschinen gepatzt, und schwupps, ändert sich der Stellungscharakter von jetzt auf dann.

Und dann mal ein weiteres erfreuliches Beispiel: frühe Mittelspielstellung, Anzugsvorteil aus der Eröffnung wurde von Weiß etwas ausgebaut oder von Schwarz nicht nur ausgeglichen, sondern ins Minus verkehrt, und jetzt kommt eine Seite in Angriff und die Evals klettern rasch über wenige Züge, von denen ein paar sogar forciert sind, hier kann man sich auf die Evals vielleicht auch nicht in ihrer absoluten Höhe verlassen (wozu denn auch, gerade da schon unnötig und wozu eigentlich auch überhaupt? Wer kommt eigentlich je wirklich auf die Idee, Evals allein nach ihrer numerischen Höhe zu interpretieren, völlig unansichtig der Stellung, der Züge, die auch gleich ein- und auffallen dazu und im Output stehen), aber darauf, dass die Dynamik der Stellung eine hohe ist, darauf kann man dann schon bauen anhand der Evals, bei solchen Stellungen hoher Dynamik.

Und dann halt auch mal die Endspiele, die sich noch hinziehen ohne Entscheidung, weil der Vorteil knapp (noch) nicht reicht, damit es schneller geht, oder weil es die Seite im Vorteil halt noch sehr lang mit einem Rest Hoffnung probieren kann, ihn (den Vorteil) entscheidend zu machen. So ein Beispiel hast du hier gewählt, lieber Walter, und ich bin mir ziemlich sicher, dass du das sehr wohl in weiser Voraus- und Absicht gemacht hast.

Es gibt aber halt überhaupt viele Stellungen, die schwierig zu interpretieren sind in ihren Gewinnwahrscheinlichkeiten, aber dass das durch Zahlenwerte, die die Engines ausgeben, schwieriger werden kann als ohne sie, da sitzt dann das Problem in so einem Fall halt doch wieder mal mehr vor dem Bildschirm als dahinter, würde ich sagen.

Die "unklaren" Stellungen:
Hier ist es wie anderswo, nichts Genaues weiß man nicht, aber dieses ebenso.
Man kann man sich dann damit zufrieden geben (bei der Grundstellung jammert man ja auch nicht dauernd rum, dass man da noch so gar nicht genau sagen kann, wie die Partie ausgehen wird), dass diese und jene (z.B. auch die im Beispiel hier) eine Stellung ist, in der der weiße Vorteil bei perfektem Spiel beider Seiten wahrscheinlich (hier nach einem noch ziemlich lang dauernden zähen Endspiel) irgendwann gewonnen sein wird, wenn Schwarz sich nicht irgendwie über die 50 Züge retten kann oder in ein Dauerschach, oder man spielt halt so lange weiter (wie auch immer, automatisch, Eng-Eng, interaktiv, mit welchem Zeitaufwand man das auch immer für notwendig hält) bis man zum Schluss einen ganzen oder einen halben Punkt hat.

Oder man sagt, "Schwarz muss sehr genau spielen, um den Verlust noch zu vermeiden", oder "Weiß hat den Vorteil in ein Endspiel gebracht, der, wenn nicht überhaupt schon zwingend entscheidend, das weiße Spiel aber jedenfalls sehr viel aussichtsreicher und leichter macht als das von Schwarz", oder "Schwarz kann noch ums Remis kämpfen" oder gibt andere derartige wohlklingende "menschliche" Evalulierungen von derlei Stellungen zum Besten, weil man sich zu irgendwelchen Zahlenwerten einfach nicht durchringen (-kämpfen, -rechnen) will oder kann, beispielsweise zu der einzig wirklich schlüssigen Antwort, das ist in soundso vielen Zügen gewonnen. Und "was weiß ich, wie das ausgeht", ist auch für den Meister wie den Schüler unbefriedigend, obwohl ein klares "man kann's noch nicht sicher sagen" hin und wieder auch Schachspielern ganz gut täte und zu Gesicht stünde, rein so emotional betrachtet, man reibt sich sonst leicht auf an der Überforderung, der schachlichen und oder der verbalen.

Dass alle solchen mehr oder weniger blumigen menschlichen "Urteile" mehr als die cp oder Prozent Gewinnwahrscheinlichkeit der Engine- Evals sagen, das würde ich auch eine Frage der Interpretation nennen wenn nicht eine der mehr oder weniger guten Ausreden, nennt das
Parent - - By Walter Eigenmann Date 2022-02-17 23:06
Eigentlich wollte ich nur zeigen, wie extrem verschieden die Engines bewerten...
Dass vorher etwas war, und nachher etwas kommt, und dass man nun etwas analysieren soll - na klar!

.
Parent - By Peter Martan Date 2022-02-17 23:59 Edited 2022-02-18 00:18
Dass dir das klar war, glaub' ich dir, dass aber bei der Frage, inwieweit man den Evals trauen darf, die Antwort durchaus des Gebens wert war, so weit, wie man den Zügen traut, die bei den Evals immer auch im Output stehen, ließ mich diese Antwort vielleicht etwas ausführlicher geben, als notwendig gewesen wäre

Außerdem dachte ich aber halt auch, dass die Antwort auf die Frage, ob die Stellung jetzt für Weiß gewonnen sei oder nicht, für dich nicht nur rhetorisch war und sie daher doch halbwegs schlüssig gegeben werden sollte.
Dass sie nie nicht ganz so leicht zu beantworten war, hast du ja selbst so gesehen, sonst wären die Evals ja auch leichter zu interpretieren gewesen, ich behaupte sogar, sie wären auch klarer in der Höhe bei klareren Stellungen.

Trotz allem noch einmal langer Rede kurzer Sinn, schuld sind nicht die Evals, wenn man sie nicht ausreichend gut interpretieren kann, schuld sind die Menschen, die sie für sich allein sehen und nicht die Züge dazu im Output. Und je nach Stellung gelten die Züge für die Eval und die Eval für die Züge halt verschieden weit. Leuchtendes Beispiel: DTM- Eval.
Schuld sind die Evals an falscher Interpretation nur dann, wenn sie nachweislich falsch sind. Bei solchen sollte man ansetzen, um sie als Kriterium des Entwicklungsfortschritts zu korrigieren und zu verbessern.
Überhaupt finde ich halt, dass man von Programmierer- Seite durchaus darauf wert legen sollte, dass die jeweilige Engine an der jeweiligen Stellung möglichst gut passende Evals abgibt. Um das an schwieriegen Stellungen überhaupt beurteilen und verbessern zu können, muss man die Evals aber auch erst mal ernst nehmen, ihnen Beachtung schenken und sie entsprechend würdigen.
Anhand der hoffentlich auch immer besser werdenden Output- Lines.
Parent - By Dieter Brandhorst Date 2022-02-17 23:42 Upvotes 1
Bei  der Analyse von Stellungen oder Partien versuche ich auch erst einmal das eigene Schachhirn einzuschalten, um danach mit der Engine
tiefere Erkenntnisse zu erlangen und zu lernen. Die vorliegende Stellung würde ich grob folgendermaßen einschätzen:
Material: Weiß hat einen Mehrbauern (+1)
Aktivität der Figuren: Weiß hat 3 Bauern, davon 2 Freibauern, Schwarz nur einen Doppelbauern, Weißer Turm und Läufer sind etwas aktiver als die schwarzen Gegenspieler, sie befinden sich in der gegnerischen Hälfte des Bretts. Der weiße Turm ist angegriffen, kann aber mit einem aktiven Zug nach vorn ausweichen (Th6) und seinerseits den Springer angreifen. Meine Einschätzung: +1,5 für Weiß, ich würde versuchen die Freibauern voranzutreiben und so auf Gewinn zu spielen. Jetzt kommen die Engines ins Spiel,  sie zeigen mir ob taktische Hindernisse meinen Plan verhindern, oder ob es noch andere, vielversprechendere Züge oder Pläne gibt.  Ob die Engine in diesem Moment die Stellung für fast gewonnen oder eben nur vorteilhaft für Weiß hält, spielt für mich keine Rolle. Überrascht wäre ich bei dieser Stellung nur von einer Minusbewertung für Weiß, dann würde ich mich aber wahrscheinlich eher den Würfelspielen zuwenden.
.

VG Dieter
Parent - - By Michael Scheidl Date 2022-02-17 22:05 Upvotes 1
Unter solchen umständen wäre es interessant zu sehen, was bei einem ausspielen der stellung herauskommt, z.b. zweimal zwischen ShashChess und Ethereal mit seitenwechsel.

Die absolute höhe der bewertungen in den traditionellen bauerneinheiten - die jeder geübte schachspieler spontan versteht - hat im computerschach etwas an vertrauen eingebüßt sozusagen... zumindest bei mir. Das hat aber nicht nur mit der komposition der bewertungsterme wie immer sie auch sein mögen, zu tun, sondern auch mit dem typischen enormen weitblick(*) auf moderner hardware. Die rückrechnung von gewinnwahrscheinlichkeiten wie sie neuronale netzwerke liefern sofern ich nichts mißverstanden habe, zu bauerneinheiten aufgrund irgend einer suspekten formel, tut ein übriges.

*) Also wenn ich z.b. für meine "schaumgebremste" eigenpraxis, selbsteinschätzung ~1600 Elo, einen eröffnungstrick analysieren lasse, so ist es eventuell von zweifelhaftem wert wenn eine engine zug XY mit +2.00 bewertet, wenn ich um das zu lukrieren 15 folgezüge so präzise spielen können muß wie diese. Da kann jede menge übermensch-taktik zwischendrin sein. Pech ist dann wenn der zweitbeste zug im minus ist...
Parent - - By Peter Martan Date 2022-02-17 23:39 Edited 2022-02-17 23:48
Michael Scheidl schrieb:

Unter solchen umständen wäre es interessant zu sehen, was bei einem ausspielen der stellung herauskommt, z.b. zweimal zwischen ShashChess und Ethereal mit seitenwechsel.

Die absolute höhe der bewertungen in den traditionellen bauerneinheiten - die jeder geübte schachspieler spontan versteht - hat im computerschach etwas an vertrauen eingebüßt sozusagen... zumindest bei mir.

Die Frage nach dem Ergebnis beim Ausspielen liegt nahe, klar. Nun läuft bei mir schon LC0 gegen SF, um zwei ungefähr gleich starke Gegner (3070ti GPU gegen 30 Threads Ryzen- CPU) zu haben, mit 30'+5".
Bevor ich das habe laufen gesehen, hätte ich es bereits als 1-0 gesehen (lässt sich jetzt natürlich noch leichter sagen, wo es sich schon als erstes Ergebnis abzeichnet ) bei einer solchen Hardware- Zeit- Engine- Kombi, hingegen z.B. LC0 auf deutlich schwächerer Hardware, sagen wir mit der online- Graphik des Laptops (die kann mit dem DX12- Backend aber immerhin doch deutlich mehr als CPU- gestütztes LC0) wäre ich mir weniger sicher, dass es nicht auch das eine oder andere Remis geben könnte.
Nun sind wir anhand der Stellung von Walter bei der Frage, wie sehr sagen die Evals etwas über den Ausgang vom Ausspielen im Eng-Eng-Match aus und sehen schon, dass es auch da davon abhängt, welche Engines mit welcher Hardware- TC.

Schwächere Paarungen würden, sag' ich jezt mal so, wahrscheinlich auch mehr Remis ausspielen, aber das alles relativiert ja nur die eigentliche Frage: kann man von Evals aus dem Standrechnen, die man nur an der einen Stellung allein anschaut, den Ausgang von Stellungen überhaupt beurteilen und die Antwort ist klar bei klaren Stellungen und bei unklaren Stellungen halt weniger klar.
Aber kann man's nur so deutlich besser beantworten, dass man genug Partien mit ausreichender Hardware- Software- Zeit ausspielen lässt? Ich würde auch da ja sagen, weil's ja auch bei den Partien in den unklaren Stellungen sonst nur drauf ankommt, welche Engine gegen welche mit welcher Hardware- TC, wie sollte es auch anders sein, wenn's dieselben Engines sind, denen ich bei einem bestimmten Hardware- Zeitaufwand halt trauen kann oder nicht.

Die Frage, sagen die Evals überhaupt etwas, wenn du meinst, du traust ihnen heutzutage weniger als früher, kann ich das in keiner Weise nachvollziehen, außer, dass du halt vielleicht misstrauischer geworden sein könntest.

Tatsächlich war und ist die Frage bei den Evals ja immer schon eigentlich praktisch nur: haben sie grundsätzlich "recht", passend zum wahrscheinlichen Ausgang, oder liegen sie daneben. Bei dieser Frage ist das "beweisbar daneben" schon sehr viel seltener geworden, nämlich es ist sehr viel seltener, dass man es leicht beweisen kann, wenn sie daneben liegen, die Evals.

Da gab's früher einfach viel mehr viel leichtere Zugzwang- Stellungen (weil der Mensch schon weiß, aha, Zugzwang und es dann nicht mehr so schwer hat wie die Engine, die das nicht weiß) viel mehr Festungs- Stellungen (die sind eigentlich die letzte Festung der Menschen, bei denen er sich noch irgendwie hämisch zeigen kann in der Bewertung gegenüber einer falschen der Engine, aber gerade da hat der findige Computerschach- Freund halt auch schon relativ bald entdeckt, dass er nur genügend Züge des Outputs übernehmen muss, um zu sehen, ob die Phantasie- Eval gleich hoch bleibt oder doch steigt oder irgendwann, spätestens wenn die 50 Züge nahen, zu sinken anfängt) bei denen man die Engines mit grundfalschen Evals ertappen und überführen konnte.

Heutzutage hat man in den Algorithmen alle möglichen Arten von detection of lack of progress (eval- progress übrigens) oder eigens raffinierte fortress detection- code- patches (Crystal) gegen die letzten Bastionen, die Festungen.
Und es ist wieder nur mehr eine Frage, wieviel pruning gönnt man der Suche, und wieviel zusätzlichen Code um Blockaden möglichst früh zu erkennen, was natürlich die Suche als solche wieder bremst, sich auf die noch verlässlichere NNUE (oder NN)- Eval stützend, um die paar Endspiele, die wegen der sich nur mehr selten auswirkenden restlichen blinden Flecken an Zugzwang oder Blockade nicht gewonnen werden, gegen das mehr an Elo einzutauschen, das man durch weniger time to depth gewinnt.

Die Evals als solche sind um Klassen besser geworden in der Zeit, in der ich sie beobachte, vielleicht merkt man's deshalb nicht so allgemein und sofort, weil man an immer "schwerere" Stellungen die Anforderung stellt, da müsste doch mit einer einzelnen cp- Ausgabe sofort alles klar sein, früher hat man da mit der Software und der Hardware, die man hatte, einfach viel früher gesagt, ja ist halt noch unklar.

Jetzt verlangt man (zu Recht) schon eine aussagekräftige Diskrimination zwischen verschiedenen Eröffnungsvarianten, selbst derjenigen, die in den Datenbanken schon bis zum Abwinken als gleich remisträchtig mit Unmengen von Partie-Beispielen hoher Qualität statistisch ausreichend abgesichert bekannt sind, wobei sich auch hier wieder die Frage stellt, was hat man noch davon, wenn da der eine oder ander cp für die eine Variante dazu kommt und bei der anderen weniger wird, aber auch da ist das Werkzeug Engine so nützlich, wie es Unterschiede im Verlauf von Abspielen, Unterschiede in den Evalverläufen mit mehr oder weniger langen Zugfolgen, mehr oder weniger langer Rechenzeit und mehr oder weniger starker Hardware bieten kann.

Ich hab' dich auch deshalb so vollgelabert, weil ich die ganze Zeit auf das Partie- Ergebnis warte, leider immer noch nix, SF ist schon bei 4+ als Schwarzer, LC0 gurkt immer noch bei 1.20 rum, ich beginne mir Sorgen zu machen, dass diese Speerspitze der AI wieder mal so lange rumzieht, bis es doch noch Remis wird.
Soviel nur auch noch zur Ergebnis- Gläubigkeit aus dem Eng-Eng-Match und dazu, wonach sich das so richtet, was da am Brett passiert. Das ist doch nicht von dem abgehoben zu betrachten, was die Blechis dabei an Evals ausspucken, hier haben sie nur noch die zusätzlich unentbehrliche Komponente zu bieten, auf der ich jetzt noch einmal justamend herumreiten muss:

Die dynamische Komponente der Eval, wie sie sich über die Züge hinweg verändert, wieviele Züge es braucht, um sie um soundso viel steigen oder sinken zu lassen.
Meinst du nicht auch, dass man diese wesentliche Komponente des Verlaufs der Eval, ihre Änderung pro Zugzahl nur auch ein bisschen einbeziehen sollte müsste dürfte könnte, und man hätte sofort eine weitere Dimension der Aussage, vielleicht die einzig relevante?

Evals stellen keinen Selbstzweck dar, sie sind sinn- und inhaltslos, wenn man nicht daran die Frage knüpft, an welche Züge, die im Output auch dabei stehen, sind sie gebunden, an welche und wieviele davon "glaubt man", wie weit interessiert's einen im weiteren Abspiel- Verlauf, kommt da irgendwann (und wann??!!) ein Endergebnis in Sicht.
Und das zeichnet sich an einzelnen Evals bei klaren Stellungen heutzutage viel früher und verlässlicher ab als vor ein paar Jahren noch, und es braucht weniger lange Varianten und weniger ganze Partien, um früher sagen zu können, hier geben die Evals und ihre Dynamik verlässliche Auskunft über den Ausgang.

So, jetzt ist endlich diese eine quälende Partie rum:

Event:
Ort:
Datum:

Weiss:
Schwarz:

Ergebnis
Board

SF: 30 Threads der 3.5GHz CPU, 8G Hash, LC0 3070ti, NN 781032, 8G NN-cache, 6Steiner Syzygys, 30'+5", ponder on, die Evals und die Rechenzeiten sind gespeichert und werden beim Zitieren sichtbar.

Das jetzt mit entsprechend vielen anderen Engines und entsprechend vielen Partien abzusichern, darfst du selber machen, Michael, grüßt dich herzlich
Parent - - By Horst Sikorsky Date 2022-02-18 00:05
ist denn bis zum 48.Zug alles auf hohen Niveau. ?

außer einiger Anfangszüge
Parent - - By Peter Martan Date 2022-02-18 00:22
Eine zwar vielleicht auch nicht völlig uninteressante Frage, auf die kann jetzt aber selbst ich aus Mangel an Hintergrundinformation vollends keine schlüssige Antwort mehr geben.
Parent - - By Horst Sikorsky Date 2022-02-18 00:55
Peter Martan schrieb:

Eine zwar vielleicht auch nicht völlig uninteressante Frage, auf die kann jetzt aber selbst ich aus Mangel an Hintergrundinformation vollends keine schlüssige Antwort mehr geben.


es sieht bei mir aus, als ob der 25 Steiner ab den 19. Zug zum 24 Steiner wird und Weiß Gewinnt.
Gute Nacht
Parent - - By Peter Martan Date 2022-02-18 01:36
Du hast die Partie?
Auch gute Nacht
Parent - - By Horst Sikorsky Date 2022-02-18 10:42
[Event "Stellung ausspielen, Lang 150min+30sek"]
[Site "?"]
[Date "2022.02.17"]
[Round "1.1"]
[White "Stockfish 100222"]
[Black "Stockfish 130222x"]
[Result "1-0"]
[Annotator "1.45;1.67"]
[SetUp "1"]
[FEN "rnbqkb1r/ppp4p/5nN1/3pQ3/2B1p3/8/PPPP1PPP/RNB1K2R b KQkq - 0 0"]
[PlyCount "84"]
[EventDate "2022.02.17"]
[EventType "tourn"]
[SourceTitle "Fritz Engine Tournament"]

{AMD Ryzen 9 3900X 12-Core Processor       3793 MHz W=48.1 plies; 9.184kN/s;
402.937.340 TBAs B=49.4 plies; 9.497kN/s; 397.356.498 TBAs} 1... Be7 2. Nxe7
Qxe7 3. Qxe7+ Kxe7 4. Bf1 Bf5 {1.67/49 370} 5. Nc3 {1.45/44 331 (d3)} Rg8 {
1.29/45 315 (Te8)} 6. Ne2 {1.62/44 180} Nc6 {1.24/50 815} 7. b3 {1.61/48 0} a5
{1.37/48 142} 8. Ba3+ {1.59/48 308 (h3)} Kf7 {1.37/45 178} 9. h3 {1.68/46 71}
Nb4 {1.50/44 232} 10. Kd1 {1.50/43 80} c5 {1.51/47 410} 11. g4 {1.50/49 1096}
Bd7 {1.17/51 0} 12. Nf4 {1.94/46 281} a4 {1.42/46 7} 13. Rg1 {1.91/44 197} b6 {
1.33/47 21 (h6)} 14. g5 {2.08/43 215 (Kc1)} h6 {1.38/44 185} 15. g6+ {2.06/44
50} Kg7 {1.58/52 398 (Ke7)} 16. Rb1 {2.31/44 181} Rge8 {2.46/50 582} 17. Bb2 {
2.88/50 0} d4 {2.57/49 191} 18. c3 {3.15/50 231} Nd3 {2.70/51 74} 19. Bxd3 {
3.08/47 211} exd3 {3.34/51 514} 20. cxd4 {3.30/49 0} Kg8 {3.04/50 422} 21. dxc5
{3.62/49 0} Ne4 {3.29/51 248} 22. f3 {3.68/47 0} Nf2+ {3.36/50 324} 23. Kc1 {
3.45/48 0} a3 {3.25/51 411} 24. Bd4 {3.84/49 42} Nxh3 {3.47/50 159} 25. Nxh3 {
3.52/50 294} bxc5 {3.77/52 72} 26. Bxc5 {3.69/48 545} Bxh3 {3.38/52 3} 27. Kd1
{4.00/47 237} Be6 {3.65/52 433} 28. Rc1 {4.00/49 227} Bd5 {3.75/51 139} 29. Rg3
{4.09/51 158} Rec8 {3.38/52 27 (h5)} 30. Bd6 {4.30/51 248} Rxc1+ {4.79/48 225}
31. Kxc1 {4.54/49 0} Rc8+ {4.88/52 915} 32. Kd1 {5.50/52 0} Ra8 {5.75/52 648}
33. Be5 {5.84/55 85} Re8 {5.77/50 5} 34. Bc3 {5.95/48 230} h5 {5.83/47 44} 35.
f4 {6.04/51 181} h4 {5.87/48 0} 36. Rxd3 {6.10/50 213} Be6 {5.92/48 0} 37. f5 {
6.21/49 236} Bxf5 {6.15/48 0} 38. Rd4 {6.36/47 259} Bxg6 {6.59/55 1003} 39.
Rxh4 {6.63/52 0} Re7 {6.42/49 491 (Te6)} 40. Ra4 {6.96/45 213} Bh5+ {6.83/49 0}
41. Kc2 {7.03/49 276} Bg6+ {6.73/47 0} 42. d3 {7.12/53 841} Re3 {6.94/54 0} 43.
Rd4 {7.14/46 194} 1-0
Parent - - By Horst Sikorsky Date 2022-02-18 10:47
[Event "Stellung ausspielen, Lang 150min+30sek"]
[Site "?"]
[Date "2022.02.18"]
[Round "2.1"]
[White "Stockfish 130222x"]
[Black "Stockfish 100222"]
[Result "1-0"]
[Annotator "1.76;1.64"]
[SetUp "1"]
[FEN "rnbqkb1r/ppp4p/5nN1/3pQ3/2B1p3/8/PPPP1PPP/RNB1K2R b KQkq - 0 0"]
[PlyCount "126"]
[EventDate "2022.02.17"]
[EventType "tourn"]
[SourceTitle "Fritz Engine Tournament"]

{AMD Ryzen 9 3900X 12-Core Processor       3793 MHz W=49.2 plies; 8.593kN/s;
353.302.839 TBAs B=48.4 plies; 8.524kN/s; 411.146.329 TBAs} 1... Be7 2. Nxe7
Qxe7 3. Qxe7+ Kxe7 4. Bf1 Bf5 {1.64/47 593} 5. Nc3 {1.76/44 335} Rg8 {1.39/46
45 (Te8)} 6. Ne2 {1.60/42 181} Nc6 {1.67/45 222} 7. b3 {1.81/45 0} a5 {1.33/46
138} 8. Ba3+ {1.68/45 149} Kf7 {1.37/44 243} 9. h3 {1.57/47 32} Nb4 {1.38/45
151} 10. Kd1 {1.76/47 124} c5 {1.53/46 178} 11. Nf4 {1.50/50 375} a4 {1.34/48 0
} 12. g4 {1.58/49 686 (Kc1)} Bd7 {1.31/46 394} 13. Rg1 {1.50/47 35} b6 {
1.12/49 307} 14. g5 {1.94/48 26 (Kc1)} h6 {1.37/46 442} 15. g6+ {2.19/52 0} Ke7
{1.54/51 501} 16. Bb2 {1.74/52 142} d4 {1.70/51 104} 17. c3 {1.90/54 147} dxc3
{1.66/51 38} 18. dxc3 {1.86/54 188} Nc6 {1.53/51 33} 19. Bc4 {1.95/56 442} Rgd8
{1.73/54 0} 20. Kc1 {2.19/55 580} a3 {2.06/52 94} 21. Bxa3 {1.96/62 345} Rxa3 {
1.83/56 0} 22. g7 {2.05/54 383} Raa8 {1.72/57 23} 23. Nd5+ {2.02/59 213} Nxd5 {
1.68/59 48} 24. Bxd5 {2.31/57 193} Rg8 {1.83/57 107} 25. Kb2 {1.97/61 338} Rac8
{1.64/57 95} 26. Bxe4 {2.27/61 150} Kf7 {1.99/60 248} 27. Rad1 {1.71/64 245}
Be6 {1.62/56 73} 28. Rd6 {1.89/62 128} Nd8 {1.71/57 191} 29. f4 {1.91/60 125}
Rxg7 {1.59/58 232} 30. Rgd1 {2.08/62 20} Ke8 {1.62/59 470} 31. f5 {1.76/65 0}
Bg8 {2.00/59 1376} 32. f6 {2.36/61 367} Ra7 {1.92/60 56} 33. Rxb6 {1.70/64 785}
Kf8 {1.88/61 423} 34. Bf5 {2.24/61 0} Rca8 {1.94/54 387} 35. a4 {2.43/60 86}
Nf7 {1.66/53 59} 36. Be4 {2.43/51 135} Rc8 {2.16/56 342} 37. Bc6 {2.40/53 0}
Ne5 {2.39/51 507} 38. Bb5 {2.26/54 0} Bf7 {1.86/52 124} 39. Re1 {2.80/52 140}
Ng6 {1.92/51 47} 40. Ka3 {3.04/49 217 (Td6)} Nf4 {2.11/55 539 (Taa8)} 41. Rd6 {
2.98/48 223} Raa8 {2.31/52 0} 42. Re7 {3.21/48 207} Rcb8 {2.37/49 0} 43. c4 {
3.22/52 334} Rc8 {2.27/51 0} 44. Re4 {3.64/48 183 (Td1)} Nxh3 {3.18/50 515
(Sh5)} 45. Rh4 {4.15/50 483} Ng5 {4.20/52 0} 46. Rxh6 {4.31/45 150} Ra7 {
4.30/48 159} 47. Rb6 {4.58/45 0} Kg8 {4.63/47 261} 48. Ba6 {4.59/46 0 (Lc6)}
Re8 {3.61/45 498} 49. Bb7 {4.99/45 0} Ne6 {3.38/38 65} 50. Rb5 {5.21/39 140}
Nf8 {4.10/42 0} 51. Bc6 {5.31/43 291} Rc8 {4.32/44 0 (Te5)} 52. Bg2 {5.40/42
177} Be6 {4.40/44 0} 53. Rb6 {5.62/39 148} Bf7 {3.84/46 62 (Td8)} 54. Rd6 {
6.53/39 166 (Th3)} Rd7 {5.00/38 137} 55. Rxd7 {6.50/39 1} Nxd7 {4.53/30 20} 56.
a5 {6.98/43 172} Re8 {5.74/37 0} 57. Bc6 {7.33/37 123} Rd8 {4.14/37 0} 58. Rh1
{7.30/39 113} Ne5 {6.80/34 4} 59. Bb5 {7.55/39 186} Bg6 {6.54/39 0} 60. Re1 {
7.56/35 75} Nd3 {3.87/33 9} 61. Re7 {8.12/33 63} Nb4 {7.17/34 63} 62. Ka4 {
8.26/32 16} Rd2 {8.25/36 173 (Td1)} 63. Bd7 {8.69/33 66} Kf8 {8.63/32 9} 64.
Kb5 {8.95/31 42} 1-0
Parent - - By Peter Martan Date 2022-02-18 11:04 Edited 2022-02-18 11:25
Naja, Fische unter sich, da hättest du gleich immer einen allein ausspielen lassen können.

Ich scherze nur, scherzt nur...

Edit: Ceres putzt SF übrigens auch gerade weg mit Weiß, (naja, 100 Züge lang wird's schon auch wieder dauern, weil das GUI immer noch auf nicht aufgeben eingestellt ist) die Stellung ist offenbar doch klarer gewonnen, als es mir anfangs schien.
Aber es ging mir ja darum, zu zeigen, dass sie (die Stellung) nicht soo klar ist, weil die Evals (mancher Engines) nicht soo klar sind, die von SF ist sowieso von Anfang an ein klares +-

Aber das nur noch so am Rande erwähnt
Parent - - By Horst Sikorsky Date 2022-02-18 11:24
Peter Martan schrieb:

Naja, Fische unter sich, da hättest du gleich immer einen allein ausspielen lassen können.

Ich scherze nur, scherzt nur

Beide Fische hatten 8 GB Ram, in den letzten 25 Zügen der 2.Partie war mein Arbeitsspeicher,  von 32 GB
zu 99 % VOLL.
Parent - - By Peter Martan Date 2022-02-18 11:26
Das sind die tbs.
Aber irgendwas stimmt da mit der Speicherverwaltung vom GUI trotzdem nicht ganz.
War's Fritz?
Parent - By Horst Sikorsky Date 2022-02-18 17:16
Peter Martan schrieb:

Das sind die tbs.
Aber irgendwas stimmt da mit der Speicherverwaltung vom GUI trotzdem nicht ganz.
War's Fritz?

ja
Parent - - By Peter Martan Date 2022-02-18 12:36
Peter Martan schrieb:

Ceres putzt SF übrigens auch gerade weg mit Weiß


[Event "AMD, Schnellschach 30m+5s"]
[Site "da"]
[Date "2022.02.18"]
[Round "1"]
[White "Ceres 0.96"]
[Black "Stockfish 100222"]
[Result "1-0"]
[Annotator "0.91;1.92"]
[SetUp "1"]
[FEN "8/1k6/1p1rbn2/4N2R/1p6/3P1P2/PK1B4/8 w - - 0 48"]
[PlyCount "175"]
[TimeControl "1800+5"]

48. Rh6 {0.91/20 112} Bf5 {1.92/46 62} 49. Bxb4 {0.92/13 0} Re6 {1.83/46 27}
50. d4 {0.94/11 0} Nd5 {1.80/47 26} 51. Rh5 {0.93/9 0} Rf6 {1.75/50 31} 52. Bd2
{0.93/9 33} Bc8 {1.97/48 40} 53. a4 {0.97/7 19} Bf5 {2.06/47 116 (Tf8)} 54. Ng4
{0.99/20 114} Rf8 {2.21/55 0} 55. Nh6 {1.04/10 54} Be6 {1.79/53 0} 56. Re5 {1.
03/8 0} Nc7 {2.11/58 147 (Tf6)} 57. f4 {1.16/21 93} Bd7 {2.18/57 0 (Lc4)} 58.
f5 {1.23/20 88} Bxa4 {2.07/60 0} 59. Bg5 {1.24/18 0} Bd7 {2.16/56 50} 60. f6 {
1.24/12 0} Be6 {2.21/57 48} 61. f7 {1.23/11 0} Kc6 {2.26/55 38} 62. Bf4 {1.25/
9 8} Kd7 {2.30/55 23} 63. Rg5 {1.25/7 0} Nd5 {2.13/55 40} 64. Bd2 {1.26/10 37}
Rxf7 {2.35/54 37 (Kd6)} 65. Nxf7 {1.32/15 85} Bxf7 {2.77/59 24} 66. Kc2 {1.35/
13 0} Kc6 {3.16/59 193 (b5)} 67. Kd3 {1.37/14 86} Kd6 {3.30/55 0 (b5)} 68. Rg7
{1.33/13 109 (Ke4)} Bh5 {3.97/58 98 (Le8)} 69. Ke4 {1.42/13 101} Ke6 {4.03/57
7 (b5)} 70. Rg5 {1.49/14 93} Bf7 {4.24/58 0} 71. Bf4 {1.45/7 34 (Lc1)} Nf6+ {
4.87/57 170 (Sc3+)} 72. Kd3 {1.47/14 67} Nd5 {4.87/62 6} 73. Bh2 {1.49/8 46} b5
{4.87/64 0} 74. Kd2 {1.54/9 34 (Lg3)} Kf6 {4.87/45 26} 75. Re5 {1.57/8 7 (Tg1)}
Be6 {4.87/60 67} 76. Rh5 {1.64/9 0} Kg6 {4.87/60 22} 77. Rh8 {1.66/8 6} Kf5 {
5.24/63 53} 78. Bd6 {1.70/9 0} Ke4 {5.24/51 23 (Ld7)} 79. Re8 {1.78/15 58} Kf5
{5.24/61 0} 80. Bc5 {1.85/8 26} Nf4 {5.68/60 68 (Kf6)} 81. Ke3 {2.42/18 49}
Nd5+ {6.14/42 0} 82. Kf3 {2.62/8 24} Kf6 {7.99/51 243 (Ld7)} 83. Rf8+ {4.29/15
46} Bf7 {9.97/44 92} 84. Ke4 {4.74/8 0 (Tb8)} Nc3+ {9.97/30 10} 85. Ke3 {4.91/
8 27 (Kd3)} Nd5+ {11.32/35 160} 86. Kd3 {5.18/10 0 (Kd2)} Nf4+ {6.16/30 20
(Ke6)} 87. Ke4 {6.88/12 46 (Ke3)} Ne6 {12.59/26 4} 88. Rc8 {7.58/7 24 (Tb8)}
Ng5+ {11.30/33 17} 89. Kf4 {9.16/7 10} Ne6+ {12.92/25 8 (Sh3+)} 90. Ke3 {9.81/
11 53} Kg5 {14.76/28 0 (Sg7)} 91. d5 {15.00/10 49 (La3)} Nf4 {6.18/20 10} 92.
d6 {13.83/7 11} Nd5+ {70.90/28 5} 93. Kd4 {15.17/7 24} Nf6 {70.73/28 0} 94. Rc7
{16.84/6 28} Be6 {152.53/59 0 (Le8)} 95. Ke5 {20.46/9 42} Bd7 {152.56/56 0} 96.
Bf2 {22.17/6 25 (Ld4)} Ng4+ {70.66/31 7} 97. Kd4 {18.88/7 18} Nf6 {152.02/30 0}
98. Be1 {17.52/6 24} Bh3 {152.52/47 0 (Lf5)} 99. Rg7+ {17.86/8 36} Kh6 {152.55/
47 0} 100. Rg3 {17.06/7 22 (Tg1)} Bc8 {152.52/46 9} 101. Bc3 {19.50/7 13 (Ld2+)
} Bd7 {152.56/49 21 (Kh5)} 102. Ke5 {21.60/8 33 (Tg1)} Ne8 {152.57/48 12 (Sg4+)
} 103. Kd5 {35.77/8 33 (Tg1)} Kh5 {152.61/42 9 (b4)} 104. Re3 {61.90/7 34 (Kc5)
} b4 {152.62/42 13} 105. Bd4 {62.55/6 8} Ba4 {#24/38 0 (Kg6)} 106. Re7 {99.99/
7 31} Bb3+ {#22/55 0 (Sxd6)} 107. Kc5 {99.99/6 25} Nxd6 {#21/56 0} 108. Kxd6 {
99.99/2 15} Bc2 {2/0 0} 109. Rb7 {1/0 0} b3 {11/1 0} 110. Rg7 {10/1 0} Bg6 {10/
1 0} 111. Rg8 {9/0 0} Kh6 {9/0 0} 112. Bf6 {8/0 0} Kh5 {8/0 0} 113. Ke7 {7/0 0}
Be4 {7/0 0} 114. Rg3 {6/0 0} Bc2 {6/1 0} 115. Ke8 {5/0 0} Bd1 {5/0 0} 116. Kf7
{4/1 0} Be2 {4/0 0} 117. Kg7 {3/1 0} Bc4 {3/0 0} 118. Re3 {2/0 0} Kg4 {2/0 0}
119. Re4+ {1/1 0} Kg3 {1/0 0} 120. Rxc4 {2/1 0} Kg2 {2/0 0} 121. Rc3 {1/0 0} b2
{2/1 0} 122. Rb3 {1/0 0} Kf2 {1/0 0} 123. Bxb2 {8/1 0} Ke1 {8/0 0} 124. Kf6 {
7/0 0} Kd1 {7/0 0} 125. Ke5 {6/0 0} Kc2 {6/0 0} 126. Re3 {5/0 0} Kxb2 {9/1 0}
127. Rf3 {8/0 0} Ka2 {8/0 0} 128. Kd4 {7/0 0} Kb2 {7/1 0} 129. Kd3 {6/0 0} Kb3
{6/1 0} 130. Rf4 {5/1 0} Kb2 {5/1 0} 131. Rb4+ {4/1 0} Ka3 {4/1 0} 132. Kc3 {
3/1 0} Ka2 {3/1 0} 133. Ra4+ {2/0 0} Kb1 {2/1 0} 134. Ra3 {1/0 0} Kc1 {1/1 0}
135. Ra1# {1/1 0} 1-0
Parent - By Horst Sikorsky Date 2022-02-18 17:22 Upvotes 1
das ist ja schon am Anfang noch gewonnener.
Würde ich nie ausspielen lassen   
Parent - - By Benno Hartwig Date 2022-02-17 23:07

> Fazit: Für Schachanalysen sind Schachprogramme nicht zu gebrauchen.


Ok:
Derjenige, der kein Erfahrung damit hat, wie der Output seiner Engine zu bewerten ist, kann so ein Schachprogramm in solcher Weise wirklich nicht gebrauchen.

Aber die meisten
- kennen ihrer Engine und ihre Ausgaben
- sehen, wie sich die Bewertung in der Partie entwickelte

Außerdem:
wenn wir ein einziges Mal ein Experiment machen wollen, und
A sagt: Die Erfolgsaussicht ist 55%
B sagt: Die Erfolgsaussicht ist 70%
und wir sehen dann, dass das Experiment erfolgreich ist:
Was sagt das dann tatsächlich über die Einschätz-Qualität von A und B?
Ich denke: Ja, A kann trotzdem der verlässlichere Schätzer sein.
Parent - - By Walter Eigenmann Date 2022-02-18 11:31
.

Benno Hartwig schrieb:
Ok:Derjenige, der kein Erfahrung damit hat, wie der Output seiner Engine zu bewerten ist, kann so ein Schachprogramm in solcher Weise wirklich nicht gebrauchen.
Aber die meisten
- kennen ihrer Engine und ihre Ausgaben
... wobei man die -zig-tausende Vereinsspieler nicht vergessen sollte,
die einfach ihren Fritzi anwerfen, ihre Verluststellung eingeben und dann schauen...

Benno Hartwig schrieb:
- sehen, wie sich die Bewertung in der Partie entwickelte
Das ist allerdings nicht unser Thema

Benno Hartwig schrieb:
Außerdem: wenn wir ein einziges Mal ein Experiment machen wollen, und A sagt: Die Erfolgsaussicht ist 55%, B sagt: Die Erfolgsaussicht ist 70%,
und wir sehen dann, dass das Experiment erfolgreich ist: Was sagt das dann tatsächlich über die Einschätz-Qualität von A und B?
Ich denke: Ja, A kann trotzdem der verlässlichere Schätzer sein.
Ja, wenn's nur um 15% geht.
Aber ein Bewertungs-Range von 0.68 (+/= sprich: remis) bis 2.62 (+- sprich: gewonnen) ist schon etwas heftig, oder?

.
Parent - By Peter Martan Date 2022-02-18 11:34
Walter Eigenmann schrieb:

Benno Hartwig schrieb:
- sehen, wie sich die Bewertung in der Partie entwickelte
Das ist allerdings nicht unser Thema

Meins schon
Parent - - By Andreas Matthies Date 2022-02-18 08:26 Upvotes 2
Walter Eigenmann schrieb:

... bei der Durchsicht einer TCEC-Partie zwischen Kayra und Stockfish (Kayra gewann).


Kayra ist meines Wissens ein (meiner Meinung nach ziemlich nutzloser) Stockfish Clone und hat mit Sicherheit nicht beim TCEC gespielt.

FAKENEWS!

Grüße, Andreas
Parent - - By Walter Eigenmann Date 2022-02-18 09:50
.

Andreas Matthies schrieb:
Kayra ist meines Wissens ein (meiner Meinung nach ziemlich nutzloser) Stockfish Clone und ...
Na ja, ein SF-Clone, der seinen Ziehvater reihenweise vermöbelt, kann so nutzlos nicht sein...

Andreas Matthies schrieb:
...hat mit Sicherheit nicht beim TCEC gespielt. FAKENEWS!
Ich habe irgendwo eine Sammlung von 140 ausgespielten Imbalanced-Stellungen (gemäss div Eröffnungsbildern) zwischen Kayra und Stockfish runtergeladen:
https://www.glarean-verlag.ch/schach/Kayra-Partien/kayra-partien.htm
Ob sie von TCEC stammen, möchte ich tatsächlich auch nicht beschwören...

Gruss: Donald Trump

.
Parent - - By Andreas Matthies Date 2022-02-18 11:24 Upvotes 2
Walter Eigenmann schrieb:

Na ja, ein SF-Clone, der seinen Ziehvater reihenweise vermöbelt, kann so nutzlos nicht sein...
...
... irgendwo eine Sammlung von 140 ausgespielten Imbalanced-Stellungen (gemäss div Eröffnungsbildern) zwischen Kayra und Stockfish runtergeladen...


Tja, das hört sich nicht nach einer seriösen Quelle an. Definitiv keine Spiele, die beim TCEC stattgefunden haben, ev. basierend auf deren Eröffnungsbüchern aber nicht mehr.
Wo sind die Stellungen bzw. Spiele, in denen der Ziehvater den Sohn vermöbelt?

Es gab diverse Diskussionen über den Wert von Kayra und es haben sich nach dem Hype einiger Fanboys auch die Stockfish-Entwickler den Code angeschaut und es als "Kayra = SF + random changes" bzw. "it's basically stockfish" eingestuft.

http://talkchess.com/forum3/viewtopic.php?f=2&t=78986&p=916530&hilit=kayra#p916530

In dem dort aufgeführten Test sind im Gegensatz zu all den Tests, bei denen Kayra angeblich so überragend abscheidet, auch die genauen Testbedingungen definiert und vor allem werden auch für beide Engines dieselben Compiler und Compileroptionen verwendet, was für den Ausgang von Tests bei nahezu identischen Engines entscheidend ist.

Aber ehrlich gesagt will ich das ganze gar nicht erneut diskutieren.

Viele Grüße,
Andreas
Parent - - By Walter Eigenmann Date 2022-02-18 11:49
.

Andreas Matthies schrieb:
Tja, das hört sich nicht nach einer seriösen Quelle an.
Der Begriff "Seriösität" hat hier nichts verloren, Partien sind Partien, ihren Download habe ich verlinkt.

Andreas Matthies schrieb:
Wo sind die Stellungen bzw. Spiele, in denen der Ziehvater den Sohn vermöbelt?
Bitte jetzt nicht auf das Niveau absinken: "Ich habe auch einen Grossen!"

Andreas Matthies schrieb:
Kayra = SF + random changes" bzw. "it's basically stockfish" eingestuft.
Ja, wollen wir deswegen nun 10 hochinteressante SF-Derivate (alias "basically Stockfish") in die Tonne treten?

.
Parent - - By Andreas Matthies Date 2022-02-18 13:55 Upvotes 2
Walter Eigenmann schrieb:

Andreas Matthies schrieb:
Tja, das hört sich nicht nach einer seriösen Quelle an.
Der Begriff "Seriösität" hat hier nichts verloren, Partien sind Partien, ihren Download habe ich verlinkt.
Warum nennst du sie dann in deinem Eingangspost fälschlicherweise "TCEC-Partien"? Um Seriösität (TCEC = potente Hardware + lange Bedenkzeit + detailliert offen gelegte Engine-Parameter) vorzutäuschen, wo sie nichts verloren hat?
Walter Eigenmann schrieb:
Andreas Matthies schrieb:
Kayra = SF + random changes" bzw. "it's basically stockfish" eingestuft.
Ja, wollen wir deswegen nun 10 hochinteressante SF-Derivate (alias "basically Stockfish") in die Tonne treten?
Zumindest sollten wir ihnen nicht mehr Ehre zukommen lassen, als sie verdienen. Wie gesagt: "random changes"
Parent - - By Walter Eigenmann Date 2022-02-18 19:00 Upvotes 1
Andreas Matthies schrieb:

Walter Eigenmann schrieb:

Andreas Matthies schrieb:
Tja, das hört sich nicht nach einer seriösen Quelle an.
Der Begriff "Seriösität" hat hier nichts verloren, Partien sind Partien, ihren Download habe ich verlinkt.
Warum nennst du sie dann in deinem Eingangspost fälschlicherweise "TCEC-Partien"? Um Seriösität (TCEC = potente Hardware + lange Bedenkzeit + detailliert offen gelegte Engine-Parameter) vorzutäuschen, wo sie nichts verloren hat?

Inzwischen habe ich meinen damaligen Partien-Download von "Kayra vs Stockfish" recherchiert - er stammte von hier:
https://open-chess.org/viewtopic.php?f=4&t=3333&sid=3603c79a45bb04a7898f73e2781a70df

Ich lade jährlich hunderttausende von Partien runter und merke mir nie ihre Herkunft, weil Quelle & Turniere meist in der entspr. PGN stehen. Meist...
Und nix mit  "Seriösität vorgetäuscht", TCEC ist nicht die einzige "seriöse" Partien-Quelle...
Also bitte: "Bleiben Sie seriös!" (Tartakower)

Walter Eigenmann schrieb:
Andreas Matthies schrieb:
Kayra = SF + random changes" bzw. "it's basically stockfish" eingestuft.
Ja, wollen wir deswegen nun 10 hochinteressante SF-Derivate (alias "basically Stockfish") in die Tonne treten?
Zumindest sollten wir ihnen nicht mehr Ehre zukommen lassen, als sie verdienen. Wie gesagt: "random changes"

Unsinn, da hat niemand rumgewürfelt, sondern da hat jemand gezielt an SF geschraubt - das ist erlaubt, ja erwünscht!
Deswegen haben wir auch Clones wie CorChess, Crystal, CiChess, Cfish, Bluefish, Honey, Kayra u.a. die dem "Original" in manchen Belangen weit überlegen sind.

.
Parent - - By Peter Weise Date 2022-02-18 19:58
Walter Eigenmann schrieb:

Unsinn, da hat niemand rumgewürfelt, sondern da hat jemand gezielt an SF geschraubt - das ist erlaubt, ja erwünscht!
Deswegen haben wir auch Clones wie CorChess, Crystal, CiChess, Cfish, Bluefish, Honey, Kayra u.a. die dem "Original" in manchen Belangen weit überlegen sind.

Leider wird da doch lediglich "(her)rumgewürfel", immer via "try and error" und genau dies ist Unsinn und vor allem unverschämt!
Parent - By Walter Eigenmann Date 2022-02-19 09:39 Upvotes 1
Peter Weise schrieb:

Walter Eigenmann schrieb:

Unsinn, da hat niemand rumgewürfelt, sondern da hat jemand gezielt an SF geschraubt - das ist erlaubt, ja erwünscht!
Deswegen haben wir auch Clones wie CorChess, Crystal, CiChess, Cfish, Bluefish, Honey, Kayra u.a. die dem "Original" in manchen Belangen weit überlegen sind.
Leider wird da doch lediglich "(her)rumgewürfel", immer via "try and error" und genau dies ist Unsinn und vor allem unverschämt!

Unsinn. Unverschämt wäre es, den Experimentatoren dies hier zu verbieten:



"Stockfish ist kostenlos und wird unter der GNU General Public License Version 3 (GPL v3) vertrieben. Im Wesentlichen bedeutet dies, dass Sie mit dem Programm fast genau das tun können, was Sie wollen. Sie können es unter Ihren Freunden verteilen, es auf Ihrer Website zum Download anbieten, es verkaufen (entweder alleine oder als Teil eines größeren Softwarepakets) oder es als Ausgangspunkt für ein eigenes Softwareprojekt verwenden". (Quelle: Stockfish Webseite)

Davon abgesehen ist Try-and-Error ein wissenschaftlich anerkanntes Optimierungsverfahren - und wurde in der Geschichte
gerade auch des Computerschachs vielfach sehr erfolgreich angewandt, wie wir heute wissen (Stichwort "Brute-Force").

.
Parent - - By Andreas Matthies Date 2022-02-19 09:10
Walter Eigenmann schrieb:

Ich lade jährlich hunderttausende von Partien runter und merke mir nie ihre Herkunft, weil Quelle & Turniere meist in der entspr. PGN stehen. Meist...

Deshalb erneut die Frage: Warum nennen Sie explizit "TCEC-Spiele", wenn Sie sich die Herkunft Ihrer Spiele nicht merken und diese hier auch nicht aus der PGN hervorgeht?
Genau diese Frage war Hintergrund meines ersten Posts und ist immer noch nicht beantwortet.

Walter Eigenmann schrieb:

Und nix mit  "Seriösität vorgetäuscht", TCEC ist nicht die einzige "seriöse" Partien-Quelle...

Habe ich auch nie behauptet. Aber es IST eine seriöse Quelle. Und Sie haben mit Ihrer falschen Angabe dieser Quelle den Partien eine Qualität gegeben, die sie vermutlich nicht verdienen.
Nochmal zur Verdeutlichung:
- TCEC: Moderne CPU mit AVX512 Befehlssatz, > 100 Threads, >= 30 Minuten Bedenkzeit + 5 Sekunden Inkrement
- Ihre PGN von der Mediafire-Quelle: Alte CPU ohne AVX2 Befehlssatz, 3 Threads, 1 Minute + 1 Sekunde Inkrement

Walter Eigenmann schrieb:

Unsinn, da hat niemand rumgewürfelt, sondern da hat jemand gezielt an SF geschraubt - das ist erlaubt, ja erwünscht!

Natürlich sind Veränderungen und Erweiterungen erlaubt und erwünscht. Aber woher wissen Sie, dass da im Falle von Kayra "gezielt geschraubt" wurde? Können Sie das im Code belegen? Haben Sie einen Hintergrund in der Programmierung von Schach-Engines? Falls ja, wäre ich an Details zu den Verbesserungen im Kayra-Code interessiert, denn "Unsinn" lasse ich mir nicht so gerne sagen, wenn es nicht gut begründet ist. Das "herumgewürfelt" stammt immerhin von einem der wichtigsten Stockfish-Entwickler.

Walter Eigenmann schrieb:

Also bitte: "Bleiben Sie seriös!" (Tartakower)


Sie schreien "Unsinn" und ich soll seriös bleiben? Ich beende das jetzt hier. Es scheint Ihnen schwer zu fallen, einfach Ihren Fehler bezüglich der falschen Quellen einzugestehen, stattdessen flüchten Sie sich in Zitate.
Parent - - By Walter Eigenmann Date 2022-02-19 09:46
Andreas Matthies schrieb:
Deshalb erneut die Frage: Warum nennen Sie explizit "TCEC-Spiele", wenn Sie sich die Herkunft Ihrer Spiele nicht merken und diese hier auch nicht aus der PGN hervorgeht?
Genau diese Frage war Hintergrund meines ersten Posts und ist immer noch nicht beantwortet.
Herumreiten auf einem falsch gewählten Begriff ist eigentlich ein typisches Merkmal eines Foren-Trolls, aber...

Andreas Matthies schrieb:
Sie schreien "Unsinn" und ich soll seriös bleiben? Ich beende das jetzt hier.
... ich will mal nicht nachtragend sein und es ebenfalls beenden.

.
Parent - - By Andreas Matthies Date 2022-02-19 09:49
Unbequeme Fragen und Diskussionen unbeantwortet lassen und stattdessen "Troll!" schreien.
Der neutrale Leser möge sich seine eigene Meinung bilden.
Parent - - By Frank Quisinsky Date 2022-02-19 14:19 Edited 2022-02-19 14:26
Hallo Andreas,

es war leider noch nie anders hier, dass den Clones zu viele Erwartungen entgegengebracht werden.
Jeder genaue Test hat fast immer das Gegenteil bewiesen.

Houdini war eine Ausnahme.
Das Programm stand lange auf Platz 1 obwohl es ein Clone war.
Hier hat der Programmierer wirklich das eine oder andere erfolgversprechend geändert, anders war das seinerzeit nicht zu erklären.
Houdini ist gar so hoch gehoben wurden, dass sich kommerzielle drum gerissen haben.

Es sind also nicht nur die User für sich alleine genommen!!
Auch Anbietern ist es scheiß egal wer hinter einer Entwicklung steht, Hauptsache das Programm ist stark.
Und insofern erhoffen sich viele Clone-Programmierer interessante Angebote und User sehen in jedem Clone eine stärkere Version als das Original darstellt.

Du hast TCEC angsprochen!
Klar ist die Hardware gigantisch aber unrealistisch.
Niemand hat eine solche Hardware und aus den wenigen TCEC Ergebnissen ist statistisch nichts ablesbar.

Für die vielen nichtssagenden 1+1 Vergleiche trifft natürlich gleiches zu.

Vieles ist unlogisch geworden bzw. war es immer schon!!
Interesse an Clones, Interesse an Ergebnissen auf Hardware die sich niemand kaufen würde.

Aber auch ...
Personen, die nach Partien mit längeren Zeitkontrollen seit vielen Jahren schreien, spielen dann hin- und wieder mal ein paar 1+1 Vergleiche.

So viele Gründe warum sich die ganze Szene täglich lächerlich macht und auch der Hauptgrund warum viele interessante Personen Foren meiden.
Es treffen viele Stiere aufeinander und jeder von denen hat den _Längsten_ oder ist der Stärkste und selbst die Admins meinen da stetig mitmischen zu müssen.

Aber ...
Es gibt so viel Positives!
Niemals sollten wir uns die Lust an diesem Hobby verderben lassen.
Nicht wegen typischer Schreierei!

Spreche aus Erfahrung ...
Mittlerweile sind es schon 21 Klageandrohungen aus Winboard / Arena Zeiten und danach.
Und wie viele von den Firmen oder Anwendern haben auch nur eine einzige gegen mich durchgezogen.

0

Ein wildes Geschrei und jeder hat Recht!
Individualisten treffen aufeinander.

Unter uns ...
Es sind noch nicht mal die User, die für viele unschöne Situationen die Verantwortung tragen.
Es sind meist die Programmierer die anstacheln (meist im Hintergrund) oder versuchen Gruppenbildungen zu provozieren.
Damit meine ich Dich jetzt nicht, bevor das falsch verstanden wird.

Viele Grüße
Frank

PS: Wenn SwordFish die neue Nummer 1 ist oder irgend ein anderer Clone ... dann ist es so.
Und wenn Houdini kein Clone ist, Rybka keiner war ... dann ist es so.
Und wenn sich der König aller Engines "Traumschiff" schimpft ... dann ist es so.

Für Beweise hat sich noch nie jemand wirklich interessiert weil man Dinge nur so sehen möchte wie es im Grunde favorisiert in den grauen Zellen liegt.
Parent - By Frank Quisinsky Date 2022-02-19 14:42 Edited 2022-02-19 14:49
Übrigens,

da Du das vielleicht liest:

Run-3 wird ein Test für Engines, die ich noch nicht in der meiner Liste habe.
Habe gerade die Programmierer von Booot, rofChade, Wasp und Goliath angeschrieben mit der Idee das erneut neuere dev. Versionen starten können.
Wäre auch für Dein Programm interessant eine dev ins Rennen zu schicken.

Start ist ca. der 12. März.

Run-4 wird dann wieder ein Turnier der wirklichen TOP-41 CPU Engines.
Das startet dann danach!

Hattest in TalkChess Interesse angemeldet!

Viele Grüße
Frank

Schaue mal auf rofChade ... schon +190 Elo zur letzen Release Version.
Booot steht in den NN Anfängen und die neue Wasp Version (neuer als 5.26 hat derzeit +20).
Wasp 5.x wird also ganz sicher starten. Maile gerade mit John ob die dev Versionen veröffentlicht werden können
bzw. ob es zu einer neuer Release Version kommen sollte.

https://www.amateurschach.de/t-ki/common/ki-ratings.jpg

Keine TCEC mit unrealistischer Hardware!
Kein 1+1 und höhere Bedingungen als CEGT oder CCRL 1-Core Ergebnisse.
Heute Morgen schrieb mich eine bekannte Schachzeitschrift an, die meine Ergebniss dauerhaft publizieren möchten.
Habe abgelehnt, interessiert mich einfach nicht!
Soll doch jeder damit machen was er möchte ... was fragen die so blöd.
Ausserdem habe ich kein Bock auf Stress und deren meist komischen Vorstellungen.
Sollte doch allen klar sein wie ich ticke (rote Buchstaben seit 20 Jahren in meinem Logo "Frank's Chess Page").
Parent - - By Chess Player Date 2022-02-18 18:22
[Event "TCEC Season 22 - L2 L1 Testing"]
[Site "https://tcec-chess.com"]
[Date "2022.02.19"]
[Round "1.39"]
[White "Revenge 20220211"]
[Black "Stockfish_13_CCRL 64-bit_4CPU"]
[Result "1-0"]
[ECO "D25"]
[WhiteElo "3480"]
[BlackElo "3538"]
[Annotator "ChessBase"]
[PlyCount "149"]
[EventDate "2022.??.??"]
[Source "ChessBase"]
[TimeControl "1800+5"]

1. d4 Nf6 2. Nf3 d5 3. c4 dxc4 4. e3 Bg4 5. Bxc4 e6 6. h3 Bh5 7. Nc3 Nbd7 8.
O-O Bd6 9. e4 Nb6 10. Bb3 Bb4 11. Re1 O-O 12. a3 Be7 13. g4 Bg6 14. Qe2 c5 15.
dxc5 Bxc5 16. Bf4 Rc8 17. Rac1 Qe7 18. Bg3 a5 19. Kg2 Rfd8 20. e5 Nfd5 21. Bxd5
Nxd5 22. Nxd5 exd5 23. Bh4 f6 24. exf6 Qxe2 25. Rxe2 gxf6 26. Bxf6 Rf8 27. Be7
Rfe8 28. Re5 Bb6 29. Rxc8 Rxc8 30. Rxd5 Rc2 31. Rd2 Rxd2 32. Nxd2 Bd4 33. b4 a4
34. Bc5 Bc3 35. Nf3 Bb2 36. b5 b6 37. Bxb6 Bxa3 38. Bd4 Bd3 39. b6 Ba6 40. Ne5
Be7 41. Nd7 Bd8 42. Nf6+ Kf7 43. Nxh7 a3 44. f4 Kg6 45. Nf8+ Kf7 46. Nd7 Bb7+
47. Kg3 Ke6 48. Nc5+ Kd5 49. Nb3 Ke4 50. h4 Bd5 51. b7 Bxb7 52. Bg7 Bd5 53.
Nc5+ Ke3 54. h5 Bg8 55. g5 a2 56. h6 Be7 57. Ne6 Bh7 58. Kg4 Ke4 59. f5 Bxf5+
60. Kh5 Ba3 61. g6 Kd3 62. h7 Be4 63. h8=Q Bf3+ 64. Kh6 Bc1+ 65. Kh7 Be4 66.
Ba1 Be3 67. Nf4+ Kc4 68. Qc3+ Kb5 69. Qxe3 Bb1 70. Ne6 Bc2 71. Qc5+ Ka4 72. Nd4
Bxg6+ 73. Kh6 Be8 74. Bc3 a1=Q 75. Qa7# 1-0
Parent - By Chess Player Date 2022-02-19 12:59


Das ist ein Matt, wunderbar anzusehen.
Parent - By Dieter Brandhorst Date 2022-02-18 19:35 Edited 2022-02-18 19:43
Hallo Walter,

mit der  Fritz 18 GUI kann man sich ja zumindest für FatFritz und Stockfish14.1 zusätzlich zu den cps die Gewinnwahrscheinlichkeiten anzeigen lassen. Ich habe das mal mit deiner Stellung getan. Wie man sehr schön erkennt, sind bei doch recht unterschiedlichen cp-Bewertungen, die Gewinnwahrscheinlichkeiten sehr ähnlich.



VG Dieter

P.S. Für eine größere Ansicht bitte einmal auf das Bild klicken.
Parent - - By Andreas Mader Date 2022-02-19 20:42
Das Problem ist in diesem Fall, dass die Suche nach dem besten Zug nach einer sehr kurzen Zeit in einer einzigen Momentaufnahme gezeigt wird und daraus dann Schlussfolgerungen gezogen werden.

Wenn ich eine Stellung wirklich analysieren möchte, dann lasse ich die Engines nicht ein paar Sekunden lang daran rechnen und bin dann schon derart ungeduldig, dass ich abbreche, sondern gebe ihnen mehr Zeit. In den meisten Fällen gleichen sich die Bewertungen unterschiedlicher etwa gleich starker Engines dann auch mehr oder weniger an. Außerdem besteht die Analyse einer Stellung nicht nur daraus, sie einer Engine zum Fraß vorzuwerfen und irgendwann das Ergebnis abzulesen, sondern auch aus der Beobachtung, wie die Hauptvarianten aussehen, wie sich die mit fortschreitender Suchtiefe ändern und auch wie sich die Bewertung mit größerer Suchtiefe entwickelt.

Schöne Grüße
Andreas
Parent - By Walter Eigenmann Date 2022-02-19 20:50
Andreas Mader schrieb:
Das Problem ist in diesem Fall, dass die Suche nach dem besten Zug nach einer sehr kurzen Zeit in einer einzigen Momentaufnahme gezeigt wird und daraus dann Schlussfolgerungen gezogen werden.
Na ja, im Zeitalter der 1+1-Partien würde ich eine ganze Minute pro Stellung mit 4 Threads nicht gerade eine "sehr kurze Zeit" nennen...

.
Up Topic Hauptforen / CSS-Forum / Die Bewertung der Bewertung

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill