Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Spielstärke- oder Spielschwächetetests
1 2 Previous Next  
- - By Frank Sanders Date 2023-01-14 21:18
Ausgelöst durch das MEA Tool von Ed Schröder zum Analysieren von Testsets habe ich mir ein paar Überlegungen zu Positionstest im Allgemeinen gemacht.

Seit es kommerzielle Schachcomputer, später Schachprogramme gibt, wird versucht mittels Sammlungen von Positionen die Spielstärke der verschiedenen Programme einzuordnen.
Als die Programme durchschnittlich 1400 Elo, 1600 Elo, 1800 Elo, usw. spielten griff man hauptsächlich zu Testpositionen die über der jeweils aktuellen Spielstärke lagen. Denn die Programme spielten ja nur durchschnittlich auf dem geschätzten Elo-Level. Manchmal viel schlechter manchmal viel besser. Die Annahme war, das Programm das mehr gute Züge findet, spielt auch besser. (Spielstärketest)

Inzwischen hat sich die Situation deutlich geändert, die Spitzenprogramme spielen durchschnittlich deutlich besser als jeder Mensch. Positionen die deutlich über dem Level der Spitzenprogramme liegen kann es daher nicht geben. Daher muss man auf Positionen zurückgreifen die unter der durchschnittlichen Spielstärke liegen. Die Annahme ist, das Programm, das weniger schlechte Züge macht, ist spielstärker. (Spielschwächetest)

Dabei gibt es, außer es handelt sich um eine taktische Stellung, ein Problem, wenn das Programm einen anderen Zug als den Lösungszug spielt. Wer entscheidet, ob der gefundene Zug gleichwertig, schlechter oder gar besser als der Lösungszug ist? Wer Zeit und das notwendige Wissen hat, könnte natürlich versuchen die jeweilige Position auszuanalysieren. Aber hier kommt ein weiteres Problem ins Spiel. Während man anfänglich noch glaubte, mit ein paar Stellungen etwas messen zu können, der erste mir bekannte Test hieß "Nolot-Test" und hatte ganze 11 Stellungen(!), sollte meiner Meinung nach ein guter Stellungstest 500 bis 1000 Positionen haben. Selbst wenn die Spitzenprogramme nur bei der Hälfte der Test-Positionen die aus Schachbüchern, Datenbanken, … stammen, abweichen, wer bewertet diese Abweichungen mittels Analyse?

Wer noch Zugriff auf die Zeitschrift PC-Schach (vormals Modul) hat, dem sei der Artikel von Thomas Mally "Alles nur nicht die piff-paff-puff-Methode empfohlen.

Trotz dem oben gesagten glaube ich, dass es möglich ist, einen aussagekräftigen Positionstest zu entwickeln. Es ist nur vielleicht deutlich schwieriger als tausende Kurzpartien zu spielen. So what?
Parent - - By Walter Eigenmann Date 2023-01-14 23:35 Upvotes 1
Frank Sanders schrieb:
Inzwischen hat sich die Situation deutlich geändert, die Spitzenprogramme spielen durchschnittlich deutlich besser als jeder Mensch. Positionen die deutlich über dem Level der Spitzenprogramme liegen kann es daher nicht geben.
Ich glaube, du unterschätzt das Schachspiel...

.
Parent - - By Frank Sanders Date 2023-01-15 00:23
Nein, nein, ich bezweifle nicht, dass es sie gibt. Ich frage mich nur wo ich sie finden kann.
Parent - - By Walter Eigenmann Date 2023-01-15 12:11 Upvotes 2
Frank Sanders schrieb:
Nein, nein, ich bezweifle nicht, dass es sie gibt. Ich frage mich nur wo ich sie finden kann.
Wahrscheinlich meinst du nicht "wo" - denn da gibt's eine Menge zum Downloaden:
- CCRL: https://ccrl.chessdom.com/ccrl/4040/games.html
- TCEC: https://tcec-chess.com/#x=archive
- SPCC: https://drive.google.com/drive/folders/1KKxhf73s1JSBd1va669BoqvAeZtXEgWK?usp=sharing
- F-GM: http://www.fastgm.de/downloads.html  u.v.a.

... sondern "wie" - und das ist das echte Problem...
Arbeitstechnisch ist dessen Lösung ein fokussiertes Zusammenspiel von User-Knowhow, modernster Software und Schachkompetenz. (Übrigens auch die drei Ingredienzien erfolgreichen Fernschachspielens).
Ob und in welchem Maße du diese drei Voraussetzungen mitbringst, kann ich nicht beurteilen.
Aber du willst einen eigenen Stellungstest generieren? Einfach mal anfangen - und hier berichten!

.
Parent - By Frank Sanders Date 2023-01-15 20:14
Ja das ist ein guter Rat. Ob ich hier berichte überlege ich noch.
Parent - - By Olaf Jenkner Date 2023-01-15 00:35 Upvotes 2
Frank Sanders schrieb:

Positionen, die deutlich über dem Level der Spitzenprogramme liegen, kann es daher nicht geben.

Kannst du das bitte erklären?
Eine Position ist eine Position. Was hat das mit einem Level von Programmen zu tun?
Parent - - By Frank Sanders Date 2023-01-15 10:06 Upvotes 1
Gemeint ist folgendes. Als die Brettcomputer, später die Schachprogramme ungefähr eine Spielstärke von z.B. 1800 Elo hatten, verwendete man für Tests meist Spiele und daraus folgend Positionen von 2000er, 2200er, 2400er oder Großmeisterpartien, um bestimmte gute oder entscheidende Züge finden zu lassen. Spiele oder ausgewählte Positionen die 200, 400,600 Elo über den derzeitigen Spitzenprogrammen liegen, sind mir nicht bekannt. Getestet werden deshalb Situationen von Spielern deren Spielstärke unter der Spielstärke der Programme liegt, wo die Programme aber immer noch danebengreifen. Darum Spielschwächetest.

Vielleicht ist der Satz so deutlicher formuliert: Positionen, deren Lösung deutlich über dem Level der Spitzenprogramme liegt, kann es derzeit nicht geben.
(das heißt natürlich nicht, dass es sie überhaupt nicht gibt)
Parent - By Peter Martan Date 2023-01-15 10:29 Edited 2023-01-15 10:49 Upvotes 1
Frank Sanders schrieb:
Vielleicht ist der Satz so deutlicher formuliert: Positionen, deren Lösung deutlich über dem Level der Spitzenprogramme liegt, kann es derzeit nicht geben.
(das heißt natürlich nicht, dass es sie überhaupt nicht gibt)

Damit erklarst du aber halt einfach deinen persönlichen schachlichen Bankrott, wenn du selbst mit Unterstützung der besten Engines, die's heutzutage gibt, nicht zu schlüssigen Stellungsbewertungen kommen kannst. Diese könntest du ja sonst dann einfach wieder von den Engines verlangen, aber halt mit kürzerer Rechenzeit als der, die du dir und ihnen interaktiv in der Analyse gegönnt hast. Und nein, das müssen keine numerischen Evals sein, ein einfaches Ranking der in Frage kommenden Abspiele in Hinblick auf besser oder schlechter genügt vollauf.

Die Lösungen müssen ja auch keine single best move only Lösungen sein, es müssen daher keine single best move Stellungen sein, aber welcher Zug in einer Stellung der beste, zweitbeste oder die paar besten und oder zweitbesten, drittbesten sind, das solltest du doch, wenn du selbst auch irgendwie an Schach als Spiel herangehen willst, in allen Stellungen unter Zuhilfenahme deiner Super- Über- Drüber- Engines sagen können, die so gut sind, dass es keine Stellungen mehr für sie gibt, mit denen du sie testen kannst. Das Ganze klingt mir wieder einmal nach der alten self denying prophecy, und also schließt er messerschart, dass nicht sein kann, was nicht sein darf.

Was soll denn das heißen, Positionen, deren Lösung über dem Level der Programme liegt?
Olaf hat's dich auch schon gefragt, deine Antwort (wenn auch nicht an ihn, sondern an Walter) war, du weißt nicht, wo du sie (die Stellungen?) finden kannst. Sei mir nicht böse, du weißt glaube ich wirklich nicht, wovon du eigentlich schreibst. Was brauchst du? Stellungen, die für Engines zu schwer sind oder solche, die dir zu schwer sind oder solche, die den Engines zu leicht sind dir aber nicht, oder was für welche?
So what?
Hast du dir jetzt das Prinzip MEA, von dem du am Anfang auch schreibst, überhaupt schon wirklich näher angeschaut? Vielleicht auch noch eine Stellungssammlung dazu, die dafür gedacht ist?
Wenn du nicht einmal das wirklich machen willst, hör bitte auf, nur wieder mal mit historischen Schmähschriften aus grauer Vorzeit zu kommen, sonst komm' ich mit Abraham a Santa Clara, hat auch immer noch irgendwie moralische Kompetenz, so wie das, was zu Zeiten, als die Dedicateds noch das Beste waren, was es computerschachlich gab, ein guter Vergleich zu dem ist, was man heutzutage hat und kann auf dem Sektor Schach und Computer (wenn man denn überhaupt etwas Ahnung von Schach und von Computerschach hat und auch willens ist, die Engines als Werkzeuge und nicht nur als Spielzeuge zu verwenden).

Überhaupt hab' ich's satt, über diese Dinge immer wieder als Frage der Moral und der Philosphie und sonst noch was zu "diskutieren". anstatt Stellungen zu zeigen, von denen man meint, das oder jenes kann man von ihnen sagen oder nicht. Wenn man keine Stellungen hat, über die man als Tester oder als Schachspieler oder als Kritiker von Ergebnissen selbst Aussagen treffen kann, soll man keine Stellungstests machen, da hast du recht, ja, ok, dann lass' es halt. Ich würde dann aber an deiner Stelle erst recht die Finger davon lassen, Engines gegeneinander Matches spielen zu lassen und aus diesen Ergebnissen dann irgendwelche eigenen schachlichen Schlüsse zu ziehen, da lass das doch bitte auch nur Diejenigen machen, die davon was verstehen und sich die Stellungen, die sie zum Ausspielen verwenden, auch gut überlegen und dazu auch imstande sind.

Sonst kannst du genau so gut hergehen und behaupten, die Ergebnisse der Ranglisten sind alle völlig wertlos, weil "Tester" wie du nicht beurteilen können als Schachspieler, ob das, was da ausgespielt wird, überhaupt etwas mit Schach zu tun hat, so wie du es dir vorstellst
Parent - - By Lothar Jung Date 2023-01-15 10:44 Upvotes 2
Du musst (auch) berücksichtigten mit welchen Partiematerial die Engines NNUEs oder Lc0-Netze trainiert werden, auch spielt die Suche eine Rolle:

KomodoDragon: menschliche Partien, Computerpartien und Lc0-Reinforcement-Partien.
Lc0-Netze: Nur Reinforcement Partien, MCTS.
Ethereal: Nur Reinformentpartien mit sich selbst.
Stockfish: Nur Computerpartien.

Insbesondere Lc0 tut sich bei herkömmlichen Schachproblempositionen schon mal schwer, besonderes wegen seiner geringeren Rechentiefe und der MCTS Suche.
Die anderen Engines sind wegen A/B Suche und NNUE schneller.
Die Engines haben ihre eigenen Lösungsstärken und -Schwächen.

Lothar
Parent - - By Peter Martan Date 2023-01-15 10:51 Edited 2023-01-15 10:54 Upvotes 1
Lothar Jung schrieb:

Du musst (auch) berücksichtigten mit welchen Partiematerial die Engines NNUEs oder Lc0-Netze trainiert werden, auch spielt die Suche eine Rolle:

Du musst eine Ahnung von Schach haben, damit es Sinn hat, über Schachstellungen und Schachprogramme mit dir zu reden, und nein, ich meine nicht vorzugsweise dich persönlich in diesem Zusammenhang und "Thread"
Parent - - By Lothar Jung Date 2023-01-15 11:09 Upvotes 1
Natürlich das schwächste Glied der Kette sitzt vor dem PC.
Sind hier Leute mit 2.200 + Elo?
Parent - - By Peter Martan Date 2023-01-15 11:18 Edited 2023-01-15 11:20 Upvotes 1
Ja, hier (*aufzeigend*)
Uups, das wollte ich doch nie, nie, niemals machen, aber wenn du schon eine so niedrige Schwelle ansetzt...
Parent - - By Lothar Jung Date 2023-01-15 11:20
Chapeau
Parent - - By Peter Martan Date 2023-01-15 11:23 Edited 2023-01-15 11:26
Ist ja auch nur Fernschach

Aber ich wüsste übrigens (und eigentlich ist die Wettbewerbs- eigene diesbezügliche Wertung ja sogar relativ niedriger geeicht, das corr.- rating, es sagt halt aber um das auch weniger über den menschlichen Anteil daran) aus dem Stegreif viele, die hier hin und wieder posten, die diese deine Anforderung locker erfüllten.
Parent - - By Lothar Jung Date 2023-01-15 13:59
Ach Fernschach,
gab es schon Schachcomputer?
Parent - By Peter Martan Date 2023-01-15 14:27
Ich bin erst vor-voriges Jahr eingestiegen mit offiziellem ICCF- Rating, und ja, es gab schon welche
Parent - - By Peter Martan Date 2023-01-15 01:14 Edited 2023-01-15 01:48
Walter bringt es deshalb wieder einmal ganz kurz und einfach auf den Punkt, weil wenn du daran zweifelst, ob du als Mensch mit Engine- Unterstützung Schachstellungen bewerten kannst, sodass dir die Ergebnisse bei den einzelnen Stellungen schlüssig scheinen, dann geht's natürlich auch nicht in Summen noch so vieler oder noch so weniger solcher (Stellungen).

Die Frage war bei diesen Dingen noch nie das Ob, (außer für Diejenigen, die sich halt nicht damit befassen wollten, warum gerade die immer so getan haben, als wüssten sie besser als diejenigen, die sich wohl damit befassten, hat mich immer schon gewundert, mittlerweile nicht mehr, weil es ist halt mühsamer, sich Schachstellungen selbst anschauen zu müssen und sie nicht einfach nur die Engines ausspielen zu lassen)  sondern immer nur das  Wie und zu welchem Zweck.

Mittlerweile kommen aber halt auch die hartnäckigsten Stellungstest- Leugner nicht mehr darum herum, sich die Eröffnungsteststellungen genauer und genauer anzuschauen, ob und in wie weit sie sich für eng-eng-matches eigenen, von denen man wenigstens mit irgendwie überschaubaren Partiemengen noch irgendwelche Aussagen erhoffen darf.

Wenn du ernsthaft über Stellungstests reden willst, zeig Stellungen, von denen du zweifelst, ob sie für einen Stellungstest, wie du ihn dir vorstellst, geeignet sind, und dann mach' ich dir gerne Vorschläge, wie man sie doch auch bewerten könnte und eventuell auch so, dass man sie in der richtigen Art mit den richtigen anderen gemeinsam in einer Sammlung verwendete. Stellungen, die du nicht verwenden kannst,  gibt es keine. Ob sie sich für eine Suite einer bestimmten Größe, eine bestimmte Hardware- TC, ein bestimmtes Auswertungstool und einen bestimmten Engine- Pool eignen, das sind die eigentlich einzig relevanten Fragen, außer natürlich wie gesagt, die Analyse der Einzelstellung.

Damit du siehst, wie bunt für mich und für die heutigen Engines Sammlungen schon sein können hier hast du (mal wieder )

https://www.dropbox.com/s/5eqjhca2e7zi1xd/MEA2K.epd?dl=0

ein wirklich breites Spektrum drin. Mach' dich, wenn du's nicht schon hast, mit dem MEA- Tool als solchem vertraut, um zu wissen, was die Punkte, die bei den einzelnen Stellungen dabei stehen, bedeuten, und wenn du dann über das alles wirklich konkret und praktisch weiterreden willst, bitte gerne.

Damit du die Blocks darin noch leichter zuordnen kannst (die Quellen stehen zumindest am Anfang und am Ende der Blöcke bei den Stellungen schon auch dabei. wenn nicht bei jeder einzelnen): 111 Eret, 200 Arasan2021- Suite, 1500 STS (Stategic Test Suite von Swaminathan und Corbit, revised von Ed Schröder und Ferdiand Mosca, 200 Stellungen aus Stefan Pohls UHO 6moves- Sammlung, und das alles wird mit 100 bis 500 msec./Stellung ausgewertet. Die 500msec für diese 2048 nur für LC0 (weil langsamer in der Initialisierung) ansonsten ist diese längste TC nur für die kleineren MEA- Sammlung von mir reserviert, die kleinste hat 888 Stellungen, ist etwas mehr Taktik- orientiert und bildet damit die Brücke zu den hauptsächlich taktischen single best moves Sammlungen, die ich auch immer noch in Verwendung habe, aber auch und gerade bei denen kommt's stark drauf an, welche Sammlung für welche Engines mit welcher Hardware- TC. Am besten sieht man den Zusammenhang und den fließenden Übergang zwischen "Taktik" und "positionell" (zwei Begriffe, die fürs Engine- Schach immer nur sehr beschränkt Sinn hatten, weil für Engines alles irgendwie Taktik ist, es wird nur das eine mehr aus der Suche und das andere mehr aus der "statischen Eval" heraus schneller oder langsamer beurteilt, und beides ist im Wesentlichen nur ein Frage der Tiefe und der Breite des Suchbaumes und der Rechenzeit relativ zur Hardware) beim missing link der 888: von den 1500 STS- Stellungen hab ich da nur 594 drin gelassen, die restlichen sind selbst für die VSTC von zu vielen Engines zu gut lösbar. Darunter leidet dann die statistische Diskrimination zwischen den Runs und den Engines ebenso wie unter zu wenigen.
Gerne können wir, wenn's dich wirklich praktisch interessiert, und du dich wenigstens ein bisschen mit der einen Sammlung befasst hast (damit du schon ungefähr weißt, worüber ich schreibe), über einzelne Stellungen und einzelne, auch andere Sammlungen weiter reden.
Enjoy
Parent - - By Frank Sanders Date 2023-01-15 10:55
Zitat:
Walter bringt es deshalb wieder einmal ganz kurz und einfach auf den Punkt, weil wenn du daran zweifelst, ob du als Mensch mit Engine- Unterstützung Schachstellungen bewerten kannst, sodass dir die Ergebnisse bei den einzelnen Stellungen schlüssig scheinen, dann geht's natürlich auch nicht in Summen noch so vieler oder noch so weniger solcher (Stellungen).


Ich finde gerade der ERET Test von Walter ist ein sehr gutes Beispiel dass das geht. Er selbst hat aber auch geschrieben, dass die Erstellung der 111 Aufgaben ca. ein halbes Jahr gedauert hat. Bei einem Test mit über 1000 Positionen wären dass ungefähr 5 Jahre.
Parent - - By Peter Martan Date 2023-01-15 11:03 Edited 2023-01-15 11:17
Frank, der Eret ist ja auch in vielen "meiner" Sammlungen mit mehr oder weniger Stellungen immer noch mit vertreten, die Rechenzeiten sind halt einfach für diese Stellungen heutzutage schon ganz andere als sie bei der Erstellung waren, niemand weiß das besser als Walter.

Und willst du dich jetzt auf single best move Suiten allein fixieren, dann musst du auch bei denen natürlich nicht ständig alle Stellungen, die da dafür schon im Lauf der Jahre evaluiert und gesammelt wurden, neu finden oder erfinden, du musst sie nur entsprechend ihren Anforderungen an die Engines neu zusammenstellen und die Hardware- TC anpassen.
Aber ich dachte ja, du willst nicht mehr nur single best move testen, das kann ich ja verstehen und ich dachte, du hast dir MEA angeschaut, aber wieso glaubst du dann immer noch, dabei ginge es um single best move only test positions?

Sei mir nicht böse, wenn ich mal wieder etwas polemisch geworden bin, aber ich kenne das so gut mittlerweile: jemand will sich nicht wirklich mit etwas beschäftigen, sondern lieber darüber motzen, dass es eh nicht funktionieren kann, um sich die Mühe zu ersparen, es wirklich kennen zu lernen, das sind einfach die sauren Trauben für die "Kritiker" des "Stellungstests" in den Computerschachforen (in diesem hier besonders) immer schon gewesen und sind es, scheint mir gerade wieder, immer noch.

Wenn du über Stellungstests (mit mir) reden willst, bring Stellungen, um über sie zu reden. Zeig Output und was dir daran unverständlich scheint, sodass du was damit anfängst, das dir über die Engines, die du daran rechnen lässt, etwas aussagt.

Wenn du keine findest, schau dir einfach mal eine der Sammlungen an, zu denen ich im Wochen- Abstand in den letzten paar Monaten gefühlte 20x Download- Links gebracht hab, wenn du nur sagen willst, dass du nicht imstande bist, etwas damit anzufangen, tut's mir für dich leid, aber eigentlich auch nicht wirklich, weil, was du nicht weißt, müsste dich ja wenigstens auch nicht heiß machen, so gesehen wärst du vielleicht eh wirklich besser beraten, dich damit nicht näher zu befassen, wenigstens hast du richtig erkannt, dass es einen schon auch eine Weile beschäftigen kann. Du schreibst was von 5 Jahren, die eine gute Suite zur Entwicklung braucht, was glaubst du, wie lange mache ich das?
Parent - - By Frank Sanders Date 2023-01-15 11:23
Ich schreibe hier, weil ich selbst versuche einen Spielstärketest zu entwickeln. Und ich schreibe über die Gedanken, Zweifel, Schwierigkeiten die sich dabei ergeben.
Aber vielleicht sollte ich das doch wieder weiter im stillen Kämmerlein machen und das Feld den Profis überlassen.
Parent - - By Peter Martan Date 2023-01-15 11:29 Edited 2023-01-15 11:31
Nein, wenn du wirklich an einem eigenen Stellungstest bastelst, und davon im Forum was profitieren willst, solltest du Stellungen bringen.
Die Profis sagen dir dann, ob's gute oder schlechte sind für welchen Zweck, mit welchem Test- Tool und welcher Hardware- TC. Ob du über einzelne Stellungen oder erste Sammlungen, die du für konsistent hältst, reden willst, up to you, aber ohne irgendwelche konkreten Beispiele wird's nix werden.
Über Eret müssen wir nicht mehr diskutieren, der hat sich bewährt, (und tut es immer noch) und schon sind wir uns einig, also:
next one sample or example
Parent - - By Frank Sanders Date 2023-01-15 20:22 Edited 2023-01-15 20:27
Hier eine Stellung mit zugehöriger Großmeisteranalyse:



Bewertung:
Beide Seiten haben schon einige Zeit ihre Entwicklung abgeschlossen. Die nicht sehr ehrgeizige weiße Figurenstellung und Fehlbehandlung der Position haben es Schwarz erlaubt, mehr als seinen fairen Anteil am Zentrum zu erhalten. Die schwarzen Zentrumsbauern sind überlegen und die harmonisch platzierten Figuren verstärken diese Überlegenheit. Außerdem hat Weiß Probleme auf der b-Linie, die nützlich für Schwarz sein können. Darum hat Schwarz einen angenehmen und stabilen Vorteil.
Pläne:

A: Ich sollte die Situation im Zentrum klären indem ich 1…dxe4 spiele. Nachdem Weiß zurückschlägt (2. Sxe4 Sxe4  3. Dxe4) sollte ich die Möglichkeit haben im geeigneten Augenblick mit …Sd4 Weiß zum Abtausch der Springer zu zwingen. Dann durch …cxd4 werde ich einen gut geschützten Freibauern auf der d-Linie. Ich werde meinen Läufer besser positionieren und meine Türme haben auf der b und c Linie ausgezeichnete Möglichkeiten.

B: Die b-Linie ist sehr wichtig, darum sollte ich Gegenspiel auf anderen Teilen des Bretts unterbinden, und zwar mit 1…d4, das weiße Möglichkeiten im Zentrum und am Königsflügel verhindert. Danach, durch einfaches Verdoppeln der Türme auf der b-Linie und Umgruppierung meiner Figuren auf dem Damenflügel, behalte ich meinen Vorteil und habe Chancen diesen zu vergrößern. Das ist der richtige Plan.

C: Mein Plan sollte sich auf das Zentrum und den Damenflügel fokussieren, wo ich im Vorteil bin. Da ich die Situation im Zentrum klären muss, spiele ich 1…Sd4, und zwinge Weiß meinen starken Springer abzutauschen (2. Dd1 verhindert das nicht, mit Blick auf 2…Tb8). Nach 2.Lxd4 cxd4 habe ich alle Vorteile von Plan A und die Möglichkeit eines späteren …dxe4 da 3. exd5 Sxd5 zu meinem Vorteil ist.

Der Großmeister gibt für Plan a 20 Punkte, für Plan B 7 Punkte und für Plan C 13 Punkte.
Die Programme die ich mir angeschaut habe ziehen keinen dieser Pläne, sondern bevorzugen Turmzüge z.B. 1…Td8 oder Turm b8.

Frage liegt der Großmeister daneben oder liegen die Programme daneben? Warum ist diese Stellung geeignet oder nicht geeignet.
Parent - - By Peter Martan Date 2023-01-15 21:41 Edited 2023-01-15 22:23
Frank Sanders schrieb:

A: Ich sollte die Situation im Zentrum klären indem ich 1…dxe4 spiele. Nachdem Weiß zurückschlägt (2. Sxe4 Sxe4  3. Dxe4) sollte ich die Möglichkeit haben im geeigneten Augenblick mit …Sd4 Weiß zum Abtausch der Springer zu zwingen. Dann durch …cxd4 werde ich einen gut geschützten Freibauern auf der d-Linie. Ich werde meinen Läufer besser positionieren und meine Türme haben auf der b und c Linie ausgezeichnete Möglichkeiten.

B: Die b-Linie ist sehr wichtig, darum sollte ich Gegenspiel auf anderen Teilen des Bretts unterbinden, und zwar mit 1…d4, das weiße Möglichkeiten im Zentrum und am Königsflügel verhindert. Danach, durch einfaches Verdoppeln der Türme auf der b-Linie und Umgruppierung meiner Figuren auf dem Damenflügel, behalte ich meinen Vorteil und habe Chancen diesen zu vergrößern. Das ist der richtige Plan.

C: Mein Plan sollte sich auf das Zentrum und den Damenflügel fokussieren, wo ich im Vorteil bin. Da ich die Situation im Zentrum klären muss, spiele ich 1…Sd4, und zwinge Weiß meinen starken Springer abzutauschen (2. Dd1 verhindert das nicht, mit Blick auf 2…Tb8). Nach 2.Lxd4 cxd4 habe ich alle Vorteile von Plan A und die Möglichkeit eines späteren …dxe4 da 3. exd5 Sxd5 zu meinem Vorteil ist.

Der Großmeister gibt für Plan a 20 Punkte, für Plan B 7 Punkte und für Plan C 13 Punkte.

Die Programme die ich mir angeschaut habe ziehen keinen dieser Pläne, sondern bevorzugen Turmzüge z.B. 1…Td8 oder Turm b8.

Frage liegt der Großmeister daneben oder liegen die Programme daneben? Warum ist diese Stellung geeignet oder nicht geeignet.

Also zunächst mal im Zweifelsfall liegt praktisch immer der GM daneben, wenn die Engines ganz anderer Meinung sind als er, es sei denn, er hat die Partie mit Engine analysiert, was er heutzutage natürlich täte, bevor er was in ein Buch schriebe zu einem  besonders "schönen" Partiebeispiel, anhand dessen er etwas erläutern wollte
Nein, Scherz beiseite, es gibt ja auch komponierte Studien, die ein GM halt vielleicht schon durchschaut hat und die Engine noch nicht, aber sonst, was unsupported human analysis angeht, selbst von noch so hochkarätigen over the board- Meistern, da sind die alten Bücher voll von echten Irrtümern. Wie heißt es so schön: irren ist menschlich, vergeben ist göttlich.
Und auch Engines können irren, es gibt außer den anti- Engine- Studien schon auch trotz tbs immer wieder mal ein Endspiel, dass falsch eingeschätzt wird, aber das kann man dann als Mensch ohne Engine erst recht nicht sicher beurteilen.

[Event "Nea Makri zt"]
[Site "Nea Makri"]
[Date "1990.??.??"]
[Round "?"]
[White "Barlov, Dragan"]
[Black "Grivas, Efstratios"]
[Result "0-1"]
[ECO "C77"]
[WhiteElo "2520"]
[BlackElo "2445"]
[PlyCount "156"]
[EventDate "1990.??.??"]
[EventType "tourn"]
[EventRounds "15"]
[EventCountry "GRE"]
[SourceTitle "EXT 1999"]
[Source "ChessBase"]
[SourceDate "1998.11.16"]
[SourceVersion "1"]
[SourceVersionDate "1998.11.16"]
[SourceQuality "1"]

1. e4 e5 2. Nf3 Nc6 3. Bb5 a6 4. Ba4 Nf6 5. Qe2 b5 6. Bb3 Bc5 7. c3 O-O 8. O-O h6 9. Rd1 Re8 10. d3 Bf8 11. a3 d6 12. Nbd2 Na5 13. Ba2 c5 14. Nf1 Be6 15. Bxe6 Rxe6 16. Ng3 g6 17. Qc2 d5 18. a4 b4 19. Bd2 Qe8 20. Re1 bxc3 21. Bxc3 Nc6 22. Rec1 dxe4 23. dxe4 Rb8 24. Nd2 Nd4 25. Qd3 h5 26. Ngf1 Rd6 27. Bxd4 cxd4 28. Nc4 Rc6 29. Nfd2 Nd7 30. Rcb1 Bb4 31. Qh3 Nc5 32. a5 Kg7 33. Nf3 f6 34. Ncd2 Qc8 35. Qg3 Qg4 36. Rc1 Rbc8 37. Rc4 Bxd2 38. Qxg4 hxg4 39. Nxd2 Nd3 40. b3 Nb2 41. Rxc6 Rxc6 42. Kf1 Rc2 43. Ke2 Kf7 44. b4 Nc4 45. Kd3 Rc3+ 46. Ke2 Nd6 47. Rh1 f5 48. f3 gxf3+ 49. gxf3 f4 50. Rb1 Nb5 51. Kd1 Rc8 52. Rb2 Nc3+ 53. Ke1 Na4 54. Rb1 Rb8 55. Nc4 Kf6 56. Nd2 Rh8 57. Nf1 Nc3 58. Rb2 g5 59. Rg2 Rb8 60. Rb2 Rh8 61. Rg2 Rb8 62. Rb2 g4 63. Nd2 gxf3 64. Nxf3 Rb5 65. Nd2 Kg5 66. Kf1 f3 67. Nxf3+ Kf4 68. Nd2 Nxe4 69. Nc4 Nc3 70. Rf2+ Kg5 71. h4+ Kxh4 72. Rf5 e4 73. Nd6 Rxb4 74. Nxe4 Nxe4 75. Rf4+ Kg3 76. Rxe4 Kf3 77. Re1 d3 78. Rd1 Rb3 0-1

die Stellung vor dem 22. Zug von Schwarz, im Hiarcs online- Buch ist da nur 22...dxe4 drin, hat aber als (einziges) Beispiel vermutlich genau diese Partie, weil es ihr noch 3 Züge weiter folgt und die ist halt für Schwarz ausgegangen.

SF sagt mit leerem Hash gestartet, im MultiPV=20 (warum so viele auf einmal, ist dir sicher gleich klar in der Folge):

r3qbk1/5p2/p1n1rnpp/2ppp3/P3P3/2BP1NN1/1PQ2PPP/R1R3K1 b - - 0 1

Analysis by Stockfish dev-20230114-3d2381d7:

1. -/+ (-1.04): 22...Dd7 23.Tab1 dxe4 24.Sxe4 Sd5 25.Ld2 Sdb4 26.Dc4 Sxd3 27.Td1 Td8 28.Le3 Sxb2 29.Txd7 Sxc4 30.Txd8 Sxd8 31.Sxc5 Td6 32.Se4 Td3 33.Se1 Ta3 34.Lc5 Lxc5 35.Sxc5 Sc6 36.Sxa6 Sd2 37.Td1 Se4 38.f3 Sc3 39.Td6 Sd4 40.Sc5 Ta1 41.Kf2 Sd1+ 42.Kg1 Sb2 43.Kf2
2. -/+ (-0.93): 22...Td8 23.Te1 h5 24.exd5 Sxd5 25.Se4 f6 26.Ted1 Kg7 27.h4 Scb4 28.Db3 Tc6 29.Lxb4 Sxb4 30.Tac1 Td5 31.Se1 Dd8 32.Tc4 Le7 33.g3 f5 34.Sc3 Td7 35.Sa2 Sd5 36.Sf3 Tb6 37.Dc2 Tdb7 38.De2 Txb2 39.Dxe5+ Lf6
3. -/+ (-0.92): 22...Tb8 23.Tab1 Dd7 24.h4 dxe4 25.Sxe4 Sd5 26.Te1 Td8 27.Tbd1 Sd4 28.Lxd4 cxd4 29.h5 g5 30.Tc1 Lb4 31.Sc5 Lxc5 32.Dxc5 Tde8 33.g3 Db7 34.Sd2 Sb4 35.Dc4 Tc6 36.Db3 a5 37.Se4 Tec8 38.Tc4 Txc4 39.dxc4 Da6 40.Df3 De6 41.Sd2 Td8 42.g4 Sc2 43.Te4 Kg7 44.Kf1 Sb4 45.b3
4. -/+ (-0.89): 22...Tc8 23.Tab1 Dd7 24.Ld2 dxe4 25.Sxe4 Sxe4 26.dxe4 Sd4 27.Sxd4 exd4 28.b3 Tce8 29.f3 Tb6 30.Dd3 De6 31.La5 Tb7 32.Ld2 Teb8 33.Tc4 f5 34.Lf4 fxe4 35.fxe4 Te8 36.Tcc1 g5 37.Ld2 Ld6 38.a5 Teb8 39.e5 Dxe5 40.g3 Kg7 41.Dxa6 Txb3 42.Txb3 Txb3
5. -/+ (-0.86): 22...Ta7 23.Tab1 Td7 24.Te1 d4 25.Ld2 Tb7 26.Tec1 Dd7 27.h4 h5 28.Sf1 Te8 29.b4 Sxb4 30.Lxb4 cxb4 31.S1d2 Te6 32.Dc8 Tbb6 33.Dxd7 Sxd7 34.Tc7 Sc5 35.Sc4 Tbc6 36.Txc6 Txc6 37.Scxe5 Tb6 38.Sxd4 Sxa4 39.Sc4 Tb8 40.Sc6 Sc3 41.Tb2 Tb5 42.Sd4 Tb7 43.Sc6 Sa4 44.Tb1 Tc7 45.Sxb4
6. -/+ (-0.80): 22...De7 23.h3
7. -/+ (-0.76): 22...Dd8 23.Tab1 Tb8 24.Ld2 dxe4 25.dxe4 h5 26.Se2 Dd7 27.b3 Td6 28.Le1 Te8 29.Dxc5 Sxe4 30.Dc2 Sf6 31.Td1 Txd1 32.Txd1 Db7 33.Sg5 Sb4 34.Db2 Sbd5 35.Sf3 e4 36.Se5 e3 37.f3
8. -/+ (-0.74): 22...Sd4 23.Lxd4 cxd4 24.Dd2 Tb8 25.h4 dxe4 26.Sxe4 Sxe4 27.dxe4 Dd7 28.Tc2 h5 29.Dd1 Lb4 30.Dd3 Le7 31.Dc4 Kg7 32.g3 Lb4 33.Dd3 Lf8 34.Sg5 Teb6 35.a5 Tb5
9. -/+ (-0.74): 22...a5 23.h3 Td8 24.b3 Td7 25.Ld2 Dd8 26.Tab1 Db6 27.Ta1 Da6 28.Tab1 Td8 29.h4 Td7 30.Te1 dxe4 31.dxe4 Db6 32.h5 Sxh5 33.Sxh5 gxh5 34.Tbc1 Dd8 35.Lc3 h4 36.Ted1
10. =/+ (-0.70): 22...Db8 23.Tab1 a5 24.Ld2 Db6 25.b3 Td8 26.h3 Da7 27.Te1 Da6 28.Tec1 Db6 29.Dd1 Td7 30.Dc2 Kg7 31.Db2 Kh7 32.Dc2 Da6 33.Te1 Td8 34.Tec1 Tee8 35.h4 Te6 36.Te1 dxe4 37.dxe4 Sd4
11. =/+ (-0.69): 22...Dc8 23.exd5 Sxd5 24.Te1 De8 25.Db3 Sf4 26.Ld2 Sb4 27.Lxf4 exf4 28.Txe6 Dxe6 29.Dxe6 fxe6 30.Se4 Sxd3 31.b3 Tb8 32.Sfd2 Lg7 33.Tb1 Ld4 34.Kf1 Se5 35.Ke2 Kf7 36.g3 g5 37.gxf4 gxf4 38.Tc1 Sd7 39.h4 e5 40.Tg1 Sf6 41.Sd6+ Ke6 42.Tg6
12. =/+ (-0.69): 22...Kg7 23.Tab1 Kg8 24.Ld2 Tb8 25.b3 Tb7 26.h3 Dd8 27.Dd1 Tc7 28.Dc2 a5 29.Db2 Kh7 30.Te1 Dc8 31.Tec1 Td7 32.Dc2 Da6 33.Te1 Kg8 34.exd5 Sxd5 35.Dc4 Dxc4
13. =/+ (-0.68): 22...Kh7 23.Tab1 Td8 24.Ld2 Dd7 25.b3 Kg8 26.h3 Tb8 27.Td1 Tb7 28.Tdc1 Dd8 29.Te1 d4 30.h4 h5 31.Sf1 Dc7 32.Sg5 Te8 33.Sh2 Kg7 34.Dc4 Tb6 35.Tec1 Dd7 36.f4 exf4 37.Lxf4 Sg4
14. =/+ (-0.67): 22...Kh8 23.Ld2 Dd8 24.Tab1 Ta7 25.h3 Kg8 26.b3 Tb7 27.Dd1 Tc7 28.Dc2 a5 29.Db2 Td7 30.Te1 d4 31.Dc2 Tb7 32.Tec1 Te8 33.Le1 h5 34.Sf1 Sd7 35.De2 Dc7 36.S1d2 Teb8 37.Kh2
15. =/+ (-0.62): 22...Td6 23.exd5 Sxd5 24.Se4 Te6 25.Ld2 Td8 26.Db3 Sf6 27.Dc4 Sd4 28.Sxd4 Txd4 29.Dc2 Sd5 30.Dd1 f5 31.Sxc5 Tc6 32.b4 Sxb4 33.Db3+ Df7 34.Lxb4 Dxb3 35.Sxb3 Txc1+ 36.Txc1 Txb4 37.Sd2 Txa4 38.Sc4 Lg7 39.g3 a5 40.Kg2 Ta2 41.Se3 a4 42.Tc6 f4 43.Tc8+ Kf7
16. =/+ (-0.61): 22...dxe4 23.Sxe4 Sd5 24.Ld2 Td8 25.Db3 Sf6 26.Dc4 Sd4 27.Sxd4 Txd4 28.Dc2 Sd5 29.Dd1 f5 30.Sxc5 Tc6 31.b4 Sxb4 32.Db3+ Df7 33.Lxb4 Dxb3 34.Sxb3 Txc1+ 35.Txc1 Txb4 36.Sd2 Txa4 37.Sc4 Lg7 38.g3 a5 39.Kg2 Ta2 40.Se3 a4 41.Tc6 f4 42.Tc8+ Kf7
17. =/+ (-0.61): 22...d4 23.Le1 Tb8 24.b3 Sd7 25.Dd1 Tb7 26.h3 h5 27.Sf1 Db8 28.Tcb1 Sb4 29.Lxb4 cxb4 30.S1d2 De8 31.Sc4 Tb8 32.g3 Tc6 33.Ta2 Lh6 34.Tc2 f6 35.Sh4 Sc5 36.Sa5 Tc7 37.Sc4 Kh7 38.Kg2 Dd8 39.Tbb2 De7 40.a5
18. =/+ (-0.60): 22...Sa7 23.Ld2 Sc6 24.exd5 Sxd5 25.Se4 Td8 26.Db3 Sf6 27.Dc4 Sd4 28.Sxd4 Txd4 29.Dc2 Sd5 30.Dd1 f5 31.Sxc5 Tc6 32.b4 Sxb4 33.Db3+ Df7 34.Lxb4 Dxb3 35.Sxb3 Txc1+ 36.Txc1 Txb4 37.Sd2 Txa4 38.Sc4 Lg7 39.g3 a5 40.Kg2 Ta2 41.Se3 a4 42.Tc6 f4 43.Sd5 Td2 44.Tc8+ Kh7
19. =/+ (-0.60): 22...Sb8 23.exd5 Sxd5 24.Se4 Sc6 25.Ld2 Td8 26.Db3 Sf6 27.Dc4 Sd4 28.Sxd4 Txd4 29.Dc2 Sd5 30.Dd1 f5 31.Sxc5 Tc6 32.b4 Sxb4 33.Db3+ Df7 34.Lxb4 Dxb3 35.Sxb3 Txc1+ 36.Txc1 Txb4 37.Sd2 Txa4 38.Sc4 Lg7 39.g3 a5 40.Kg2 Ta2 41.Se3 a4 42.Tc6 f4 43.Sd5 Td2 44.Tc8+ Kh7
20. =/+ (-0.59): 22...Le7 23.Ld2 dxe4 24.dxe4 Lf8 25.b3 Sd4 26.Sxd4 exd4 27.Te1 h5 28.f3 h4 29.Se2 Sh5 30.g4 hxg3 31.hxg3 Tb6 32.g4 Sg7 33.Kg2 Tab8 34.Tab1 Se6 35.Th1 Lg7 36.Sf4 Sxf4+ 37.Lxf4 Le5 38.Ld2 De6 39.Dxc5 Txb3 40.Txb3
Schwarz steht besser
 
Du ahnst schon, worauf ich hinaus will?

Wenn's dir nur darum geht, ob du die Stellung in deinen Stellungstest aufnehmen sollst, sag' ich mal einfach nein, weil du müsstest, egal, wie du das jetzt mit oder ohne Engines und mit oder ohne dich auf den einen GM allein zu verlassen () bewerten wolltest, du müsstest mindestens 6 Züge als "Lösungen" gelten lassen, und dich zwischen denen und den nächsten 5 zu entscheiden, die du nicht reinnimmst, ist auch schon nicht leicht. Nun könntest du natürlich "einfach" die 6, die dir am besten scheinen, mit gleich wenigen Punkten belohnen, aber da kannst du die Stellung auch gleich raus lassen, weil der eine oder andere einzelne Punkt, den die Engine da mehr oder weniger zufällig einheimst, sollten das Kraut dann nicht fett machen, wenn die Gesamtzahl der Stellungen und der Punkte nicht geradezu lächerlich wenig ist.
So weit zum Thema Stellungstest- Stellungen, das war ja schnell erledigt, wenigstens hast du mit dieser Stellung also keine große Arbeit gehabt


Was die Analyse selbst angeht, bin ich mal ein paar Lines mit SF gefolgt, wie er sie vorschlägt und oder wie du sie angibst.

22...Dd7 (!?):

r4bk1/3q1p2/p1n1rnpp/2ppp3/P3P3/2BP1NN1/1PQ2PPP/R1R3K1 w - - 0 1

Analysis by Stockfish dev-20230114-3d2381d7:

23.Te1 d4 24.Ld2 Tee8 25.Teb1 Teb8 26.Le1 De6 27.b3 h5 28.Dd1 Sd7 29.h3 Sb4 30.a5 Tb5 31.Sf1 Tc8 32.Sg5 Df6 33.Sf3 Lh6 34.De2 Sc6 35.S1d2 Sxa5 36.Dd1 Tcb8 37.Sc4 Sxc4 38.bxc4 Txb1 39.Txb1 Txb1 40.Dxb1 Dc6 41.La5 Lf8 42.Dc2 f6 43.Da2 Kf7 44.Kh2 Dc8 45.Db1 Le7 46.Sd2 Sf8 47.g3 Dc6 48.Db3 Sd7 49.Da2 Ke8 50.Kh1 Ld8 51.Sb3
-/+ (-0.89)   Tiefe: 50/61   00:05:27  8004MN
Schwarz steht besser

22...Tb8 (!?):

1r2qbk1/5p2/p1n1rnpp/2ppp3/P3P3/2BP1NN1/1PQ2PPP/R1R3K1 w - - 0 1

Analysis by Stockfish dev-20230114-3d2381d7:

23.Tab1 Dd7 24.h4 Td8 25.b3 dxe4 26.dxe4 h5 27.Sf1 Sd4 28.Lxd4 exd4 29.Sg5 Tb6 30.Dd3 Sg4 31.Sf3 Dc7 32.Tc2 Tf6 33.Te1 Lh6 34.S1h2 Tb6 35.e5 Lf4 36.Sxg4 hxg4 37.Sh2 g3 38.Sg4 Db7 39.Tb1 Dd5 40.fxg3
-/+ (-0.77)   Tiefe: 39/69   00:01:14  1920MN
Schwarz steht besser

22...Td8 (!?):

3rqbk1/5p2/p1n1rnpp/2ppp3/P3P3/2BP1NN1/1PQ2PPP/R1R3K1 w - - 0 1

Analysis by Stockfish dev-20230114-3d2381d7:

23.Te1 dxe4 24.Sxe4 Sd5 25.Tad1 Sd4 26.Sxd4 cxd4 27.La5 Tb8 28.Tc1 Dd7 29.g3 f5 30.Sd2 Kh7 31.Kf1 g5 32.Sf3 Lg7 33.Kg1 Lf6 34.h3 Lg7 35.Kh2 Tf8 36.Kg1 g4 37.hxg4 f4 38.Sh4 fxg3 39.fxg3 Se3 40.Dc7 Dd5 41.Dc5 Db3 42.Da3 Dxa3 43.bxa3 Tf7 44.Lb4 Tef6 45.Sf5 Sxf5 46.gxf5 Txf5 47.Tf1 Tf3 48.Kg2
-/+ (-0.84 ++)   Tiefe: 42/51   00:00:33  863MN
Schwarz steht besser

22...d4 von dir ( vielleicht ?!)

r3qbk1/5p2/p1n1rnpp/2p1p3/P2pP3/2BP1NN1/1PQ2PPP/R1R3K1 w - - 0 1

Analysis by Stockfish dev-20230114-3d2381d7:

23.Le1 Tb8 24.Tab1 Sd7 25.h4 h5 26.Sf1 Lh6 27.Ld2 Lg7 28.Dd1 Lf8 29.Le1 f6 30.De2 Lg7 31.b3 a5 32.Dd1 Te7 33.Tb2 Lh6 34.Ld2 Lf8 35.Le1 Sb6 36.Tbb1 Teb7 37.S1d2 Dc8 38.g3 Dh3 39.Sh2 Th7 40.Sc4 Sxc4 41.Txc4 Thb7 42.Sf3 Le7 43.Dc2 Tb6 44.Dd1
=/+ (-0.55 ++)   Tiefe: 41/50   00:00:11  315MN
Schwarz steht etwas besser

22...Sd4 von dir (vielleicht wieder ?!, würde ich jedenfalls auch nicht unter die besten 6 nehmen, wenn ich mich auf 6 beschränken müsste, aber naja, 6 reichen halt auch nicht wirklich, wenn man fair sein will zu den Engines und der Stellung)

r3qbk1/5p2/p3rnpp/2ppp3/P2nP3/2BP1NN1/1PQ2PPP/R1R3K1 w - - 0 1

Analysis by Stockfish dev-20230114-3d2381d7:

23.Lxd4 cxd4 24.h4 Dd7 25.Db3 dxe4 26.Sxe4 Sxe4 27.dxe4 Dd8 28.Dd1 a5 29.g3 Lb4 30.Dd3 h5 31.Tc2 Tc8 32.Tac1 Txc2 33.Txc2 Kg7 34.b3 Dd7 35.Tc4 Te8 36.Kf1 f6 37.Sd2 Td8 38.Sf3 Tb8 39.Dc2 Tb7 40.Dd3 Dh3+ 41.Kg1 Te7 42.Tc6 Dd7 43.Tc4 Dd6 44.Kf1 De6 45.Kg1 Db6 46.Kg2 Tf7 47.Tc8 Db7 48.Tc4
=/+ (-0.47)   Tiefe: 49/61   00:02:52  4370MN
Schwarz steht etwas besser

Warum die wie ein Alibi (sind sie ja auch) scheinenden !?- Symbole bei allen untersuchten Zügen, die kein ?! bekommen: weil du so, wenn du das nun wirklich, weil du's so interessant findest, in den Stellungstest reinnehmen willst, musst du dem GUI sagen (dem MEA- Tool gibst du einfach alle Züge an, die dir gut genug dazu vorkommen), wie es die Hierarchie bewerten soll. Wäre der oberste, den's ja geben muss, ohne Kommentar, würder er in einem Stellungstest (bei einem !? allerdings auch noch, es sei denn, es ist ausdrücklich als avoid move mit dem entsprechenden syntax- nag am versehen. Das wäre aber auch z.B. im Fritz schon ein Weg, eine Bewertung über das gelöst- nicht gelöst hinaus mit mehreren Zügen vorzunehmen. Walter Eigenmann hat mir geschrieben, er wird das Matthias Wüllenweber weitersagen. Momentan kann man im Fritz durch das "äquivalent ist"- Symbol aus der Kommentarpalette Züge im Stellungstest als gleichwertige Lösungen kennzeichnen, aber verschieden viele Punkte geht halt (noch) nicht. Das ist dann in der Notation ein vorangestelltes (zum Unterschied vom = nach dem Zug, dass bedeutet, dass die Stellung ausgeglichen ist) Geichheitszeichen.

Nach diesen Einzel- Forward- Backward- Lines wieder MultiPV, diesmal =6:

158627: Barlov,Dragan - Grivas,Efstratios 0-1 0.0, Nea Makri zt 1990
r3qbk1/5p2/p1n1rnpp/2ppp3/P3P3/2BP1NN1/1PQ2PPP/R1R3K1 b - - 0 1

Analysis by Stockfish dev-20230114-3d2381d7:

1. -/+ (-1.00): 22...Dd7 23.Te1 d4 24.Ld2 Tb8 25.Teb1 Tee8 26.Le1 De6 27.b3 Sd7 28.Dd1 h5 29.h3 c4 30.bxc4 Sc5 31.a5 Dd6 32.Se2 Lh6 33.Sc1 Lxc1 34.Dxc1 Sxd3 35.c5 Dxc5 36.Dxc5 Sxc5 37.Tb6 Tbc8 38.Tc1 Sa7 39.Lb4 Sd3 40.Txc8 Sxc8 41.Tb8 Sxb4 42.Txb4 Kf8 43.Sd2 Te6 44.Kf1 Tc6 45.Sc4 f6 46.f4 Tc5 47.Sb6 Ke7 48.Sxc8+ Txc8 49.Tb7+ Kd6 50.Tb6+ Kc5 51.Txf6
2. -/+ (-0.85): 22...Tc8 23.Tab1 Dd7 24.h3 Tce8 25.Ld2 dxe4 26.dxe4 Sd4 27.Sxd4 exd4 28.f3 Tb6 29.b3 De6 30.Se2 Sh5 31.Sf4 Sxf4 32.Lxf4 g5 33.Lc7 Tb7 34.Lh2 h5 35.Kh1 Td7 36.Dd3 g4 37.Tc2 Tb7 38.Lf4 Tc8 39.Tf2 c4 40.bxc4 Txb1+ 41.Dxb1 Txc4 42.fxg4 hxg4 43.Kh2 gxh3 44.gxh3 Tc3 45.Tg2+ Kh7
3. -/+ (-0.80): 22...Td8 23.Te1 Sd4 24.Lxd4 cxd4 25.h4 dxe4 26.Sxe4 Sd5 27.Tec1 a5 28.Db3 Kh8 29.Db5 Tb6 30.Dxe8 Txe8 31.Sed2 Sf4 32.Tc7 Sxd3 33.Txf7 Kg8 34.Td7 Txb2 35.Se4 Te7 36.Td6 Te2 37.Sg3 Tc2 38.Se4 Kg7 39.h5 gxh5 40.Td5 Ta7 41.Td1 Sb2 42.Ta1 Lb4 43.Sxe5
4. -/+ (-0.78): 22...Tb8 23.Tab1 Dd7 24.h4 Sd4 25.Lxd4 exd4 26.exd5 Dxd5 27.Te1 Txe1+ 28.Txe1 Da2 29.Te2 h5 30.Se5 Ld6 31.Dc4 Dxc4 32.Sxc4 Lxg3 33.fxg3 Tb3 34.Se5 Sg4 35.Sxg4 hxg4 36.Tc2 Txd3 37.Txc5 Txg3 38.Td5 Td3 39.Kf1 Td2 40.Tg5 Txb2 41.Txg4
5. -/+ (-0.77): 22...De7 23.Tab1 Tb8 24.h3 Db7 25.h4 Td8 26.Te1 dxe4 27.dxe4 Sd4 28.Dd3 Dc8 29.Dc4 Dd7 30.b3 Tb8 31.h5 Sxh5 32.Sxh5 gxh5 33.Lxd4 exd4 34.Dd3 Le7 35.Se5 Dc7 36.Sc4 h4 37.e5 Kh8 38.Df3 Tg8 39.Kh1 Teg6 40.Tg1 Dc8 41.Dxf7 Dg4 42.Df3
6. =/+ (-0.69): 22...Ta7 23.Tab1 Td7 24.Te1 Dd8 25.Ld2 a5 26.h3 Db6 27.Tec1 Td8 28.b3 Td7 29.Dd1 Kh7 30.Dc2 Kg7 31.Dd1 Kg8 32.Tc2 Td8 33.Df1 Da6 34.Tbc1 Db7 35.Tb1 Td7 36.De2 Da7 37.Tcc1 Da6 38.Df1 Da8 39.Tc2 Dd8 40.De2 dxe4 41.dxe4 Sd4 42.Sxd4 exd4

Und jetzt wieder auf single primary zurück:

r3qbk1/5p2/p1n1rnpp/2ppp3/P3P3/2BP1NN1/1PQ2PPP/R1R3K1 b - - 0 1

Analysis by Stockfish dev-20230114-3d2381d7:

22...Dd7 23.h4 Td8 24.Te1 dxe4 25.Sxe4 Sh5 26.Db3 Dd5 27.Dxd5 Txd5 28.Ted1 Le7 29.Ld2 f5 30.Sc3 Td8 31.Lxh6 Sb4 32.g3 Sxd3 33.b3 Ted6 34.Tab1 Sf6 35.Lg5 e4 36.Se1 Kf7 37.Sxd3 Txd3 38.Txd3 Txd3 39.Se2 Sg4 40.Lxe7 Kxe7 41.b4 cxb4 42.Txb4 Tf3 43.Tb7+ Kd8 44.Sd4 Txf2 45.Sc6+ Kc8
-/+ (-0.87)   Tiefe: 46/62   00:02:41  3891MN
Schwarz steht besser

Ja, wie gesagt, wenn nur die Frage ist, welchen Zug ich selbst nehmen würde, das ...Dd7 (!?) wird schon passen, denk' ich.

Aber vor allem würde ich deshalb (wenn's keine laufende Fernpartie ist) nicht soo viel mehr Zeit in diese Frage investieren,  welcher Zug hier wirklich der objektiv beste ist, dazu müsste man sich auch mal anschauen, was alles wie bald zueinander umstellen könnte, weil davon wären ja dann manche Züge eventuell wirklich auch rein objektiv gleicht gut, und  zum Remis reichen hier für Schwarz wirklich sehr viele und zu einem zwingenden Gewinn ziemlich sicher keiner, bei bestem schwarzen Gegenspiel kann Weiß hier zwar viel planen, aber wenn Weiß nicht wie in der Partei bei 23.dxe4? nach 22...dxe4 (!? oder sogar ?!) patzt, wird's nix aus dem ganzen Punkt, denk' ich mal. Aber wie gesagt, das kommt auf den Gegner und die TC an und ob ich nicht was übersehen habe.

Nach 22...dxe4(?!) 23.dxe4?

r3qbk1/5p2/p1n1rnpp/2p1p3/P3P3/2B2NN1/1PQ2PPP/R1R3K1 b - - 0 1

Analysis by Stockfish dev-20230114-3d2381d7:

23...Sd4 24.Lxd4 cxd4 25.De2 Tc8 26.Txc8 Dxc8 27.Se1 Sd7 28.Sd3 Dc4 29.Tc1 Dxa4 30.Dc2 Db5 31.Sf1 Tb6 32.Sd2 Lb4 33.Sf3 Ld6 34.g3 Sb8 35.Dc4 Tc6 36.Dxb5 Txc1+ 37.Sxc1 axb5 38.Kf1 Sc6 39.Sd2 f5 40.f3 Kf7 41.Sd3 Kf6 42.Ke2 Lb4 43.Sb3 Le7 44.Sd2 h5 45.Sb3 Lb4 46.Kf1 Ld6 47.Sd2 Sd8 48.f4
-/+ (-1.20 --)   Tiefe: 42/51   00:00:59  1531MN
Schwarz steht besser

Vor diesem weißen Fehler:

r3qbk1/5p2/p1n1rnpp/2p1p3/P3p3/2BP1NN1/1PQ2PPP/R1R3K1 w - - 0 1

Analysis by Stockfish dev-20230114-3d2381d7:

23.Sxe4 Sd5 24.Ld2 Td8 25.Db3 Sf6 26.Dc4 Sxe4 27.dxe4 Sd4 28.Lc3 De7 29.Tf1 g5 30.Tad1 h5 31.Se1 g4 32.f3 Lh6 33.Lxd4 Txd4 34.Txd4 exd4 35.Sd3 Le3+ 36.Kh1 h4 37.Sxc5 Tc6 38.b4 g3 39.h3 a5 40.Db5 Dc7 41.Sd3 axb4 42.f4 b3 43.Dxb3 Tc3 44.Db5 Dc6 45.Dg5+ Dg6 46.Dd8+ Kg7
=/+ (-0.44)   Tiefe: 42/52   00:00:51  1332MN
Schwarz steht etwas besser

Also da ist die weiße Welt schon noch in Ordnung, wenn mit dem Springer statt mit dem Bauern zurück geschlagen wird.  Dementsprechend ist der Textzug (der auch so nicht im Hiarcs- Buch als einziger drin sein sollte und schon gar nicht als einzig aktiv auszuspielender) gehört auch nicht zu denen, die unter die besten im Stellungstest gehören würden.

Wie siehst du das alles?
Parent - - By Peter Martan Date 2023-01-15 23:44
Und wenn die Editierzeit noch so lang ist...

Was ich auch noch hatte erwähnen wollen, der Plan a vom GM hat sowieso Macken, das 3.(24.)Dxe4, von dem er schreibt, geht nicht, nur 3.dxe4. Und wenn das ein Tippfehler ist, verstehe ich den schönen Plan mit dem geschützten Freibauern erst recht nicht.
Frank Sanders schrieb:

A: Ich sollte die Situation im Zentrum klären indem ich 1…dxe4 spiele. Nachdem Weiß zurückschlägt (2. Sxe4 Sxe4  3. Dxe4) sollte ich die Möglichkeit haben im geeigneten Augenblick mit …Sd4 Weiß zum Abtausch der Springer zu zwingen. Dann durch …cxd4 werde ich einen gut geschützten Freibauern auf der d-Linie. Ich werde meinen Läufer besser positionieren und meine Türme haben auf der b und c Linie ausgezeichnete Möglichkeiten.

Geht so nicht, aber das nur noch so am Rande zur Frage, ob der GM eventuell auch falsch liegen könnte...
Parent - - By Frank Sanders Date 2023-01-16 09:10
E ist ein Tippfehler:  dxe4
Parent - By Peter Martan Date 2023-01-16 09:15 Edited 2023-01-16 10:09
Dacht ich's doch, aber damit ist der übrige Plan auch im Kübel. Der geht von dem illegalen Zug des Tippfehlers aus offenbar.
Das mit dem gedeckten Freibauern wird nach 3.exd4 nichts mehr.
Parent - - By Frank Sanders Date 2023-01-16 10:17
Warum nicht? Z.B  3...Td8 4.Td1 Sd4
Natürlich muss Weiß nicht zurückschlagen und es entsteht kein Freibauer, aber dann steht der Springer auf d4 doch sehr gut.
Parent - By Peter Martan Date 2023-01-16 10:43 Edited 2023-01-16 10:54
Ja, du hast schon recht, die Absicht ist klar und es war nur ein Tippfehler, aber das ist halt mit Plänen (nicht nur aber besonders im Schach) immer so eine Sache, sie funktionieren oft nur, wenn der Gegner mitspielt und keine anderen Pläne hat, die dagegen sprechen und eventuell sogar besser durchsetzbar sind.
Oder wie es so schön heißt bei Brecht,

Ja, mach nur einen Plan,
und sei ein großes Licht,
Und mach dann noch 'nen zweiten Plan,
gehn tun sie beide nicht.

Aber übrigens ist der Plan mit dem Freibauern in der einen Partie SF- LC0 nach 22...dxe4 sogar aufgegangen, es ist halt dann trotzdem oder erst recht bald vereinfacht gewesen.
Parent - - By Frank Sanders Date 2023-01-16 09:12
Danke für die ausführliche Antwort. Ich verstehe jetzt deine Arbeitsweise, Listen und Ergebnisse besser.
Parent - By Peter Martan Date 2023-01-16 10:07 Edited 2023-01-16 10:37
Bitte gerne, Frank, ich war unnötig wortreich mal wieder, vor allem wäre auch der viele nichtssagende Output nicht notwendig gewesen, aber das war ja alles, was ich vielleicht auch nicht klar genug gesagt habe, nicht aus dem leeren Hash gestartet, außer dem ersten MultiPV=20- Output, sondern jeweils nach einzelnen Forward- Backward- Strecken am Wurzelzug mit schon vollem Hash und nur neuer Zeit- und Tiefenzählung.

Und ich hätte mich in die Stellung nicht so hinein gesteigert gleich wieder, wenn sie nicht als solche natürlich interessant wäre, und mein halbherziges Résumé, das sei wahrscheinlich bei bestem Spiel remis, will ich so auch nicht betonieren. Ich hab dann über Nacht SF gegen LC0 noch von ein paar Folgestellungen ausspielen lassen, nach 22...Dd7 ist SF sogar ein ganzer Punkt mit Schwarz gelungen, in der Rückpartie mit LC0 für Schwarz ist's aber wieder ein Remis geworden. Partien nach 22...Tb8 und nach 22...exd4 hab' ich noch selbst bald adjudiziert als Remis, wo's ziemlich klar war, das nichts mehr ging, die Partien nach 22...Dd7 hat das GUI beendet.
Ich hab' das alles in eine .pgn gesammelt gemeinsam mit den Lines, die ich gestern schon zum Forward- Backward verwendet habe, mit End- Evals, also solchen, die die Engine mit der Tiefanangabe an der Endstellung eingefügt hat.

[Event "Nea Makri zt"]
[Site "Nea Makri"]
[Date "1990.??.??"]
[Round "?"]
[White "Barlov, Dragan"]
[Black "Grivas, Efstratios"]
[Result "0-1"]
[ECO "C77"]
[WhiteElo "2520"]
[BlackElo "2445"]
[Annotator "Peter"]
[PlyCount "156"]
[EventDate "1990.??.??"]
[EventType "tourn"]
[EventRounds "15"]
[EventCountry "GRE"]
[SourceTitle "EXT 1999"]
[Source "ChessBase"]
[SourceDate "1998.11.16"]
[SourceVersion "1"]
[SourceVersionDate "1998.11.16"]
[SourceQuality "1"]

{-0.54;-0.86: 'AMD Ryzen 9 5950X 16-Core Processor       3400 MHz W=21.8 plies; 14kN/s; 907 TBAs B=50.4 plies; 24.348kN/s; 22.149.052 TBAs  -0.31;-0.37: 'AMD Ryzen 9 5950X 16-Core Processor       3400 MHz W=16.2 plies; 12kN/s; 1.833 TBAs B=57.5 plies; 23.304kN/s; 65.239.121 TBAs ' -0.49;-0.95: 'AMD Ryzen 9 5950X 16-Core Processor       3400 MHz W=26.8 plies; 22kN/s; 105.501 TBAs B=51.9 plies; 28.876kN/s; 1.015.823.956 TBAs ''} 1. e4 e5 2. Nf3 Nc6 3. Bb5 a6 4. Ba4 Nf6 5. Qe2 b5 6. Bb3 Bc5 7. c3 O-O 8. O-O h6 9. Rd1 Re8 10. d3 Bf8 11. a3 d6 12. Nbd2 Na5 13. Ba2 c5 14. Nf1 Be6 15. Bxe6 Rxe6 16. Ng3 g6 17. Qc2 d5 18. a4 b4 19. Bd2 Qe8 20. Re1 bxc3 21. Bxc3 Nc6 22. Rec1 dxe4 $6 (22... Qd7 23. h4 (23. Re1 {-0.73/49 548} d4 {-0.52/14 195} 24. Bd2 {-0.74/50 13} Ree8 {-0.53/16 99} 25. Reb1 {-0.86/50 75} Rab8 {-0.50/17 145 -0.54;-0.86: '(De6)'} 26. Be1 {-0.92/53 0} Qe6 {-0.48/19 51} 27. b3 {-0.92/52 10} h5 {-0.50/19 91 (Sd7)} 28. Qd1 {-0.96/56 206} Nd7 {-0.51/23 1} 29. h3 {-0.95/57 38} Bh6 {-0.51/24 32} 30. a5 {-0.95/54 572 (Sf1)} (30. Nf1 {-0.49/30 31 (Ld2)} c4 {-1.15/42 48} 31. bxc4 {-0.49/37 1} Nc5 {-1.21/47 195} 32. N1h2 {-0.49/18 1} Qd7 {-1.07/48 283 (Kg7)} 33. a5 {-0.49/29 42} Rec8 {-1.10/47 15} 34. Qc2 {-0.47/25 165 (Kf1)} Kh7 {-1.16/43 39 (Kg7)} 35. Qd1 {-0.53/22 202} Rh8 {-1.21/48 0} 36. h4 {-0.63/24 184 (Kf1)} f6 {-1.35/44 69} 37. Bd2 {-0.73/27 181 (g3)} Bxd2 {-1.61/44 44} 38. Nxd2 {-0.77/34 1} Nb4 {-1.62/46 73} 39. Ra3 {-0.81/29 2} Nbxd3 {-1.78/44 41 (Tb7)} 40. Rb6 {-0.57/32 135} Rxb6 {-1.38/49 0} 41. axb6 {-0.70/35 36} Nf4 {-1.57/48 21} 42. Nb3 {-0.87/37 39} Nxe4 {-1.60/49 21} 43. Qf3 {-0.93/38 54} Nc3 {-1.40/54 80} 44. Nd2 {-0.92/48 2} Qe7 {-1.38/51 34} 45. Ra1 {-0.94/41 14} Nfe2+ {-1.37/53 24} 46. Kf1 {-0.85/42 25} Re8 {-1.35/56 51} 47. Qc6 {-0.81/38 5} e4 {-2.07/45 46} 48. Qc7 {-0.81/40 16} Qxc7 {-2.46/38 21} 49. bxc7 {-0.81/35 14} f5 {-2.55/39 29} 50. Rxa6 {-0.78/33 13} Rc8 {-2.67/39 25} 51. Ra7 {-0.76/31 17} Nf4 {-2.77/37 26 (Sc1)} 52. g3 {-0.85/36 474} Ne6 {-3.10/46 0} 53. Nb3 {-0.85/41 3 (Ta6)} d3 {-3.41/35 42 (Kg8)} 54. Ke1 {-0.94/41 98} Rxc7 {-3.76/36 0 (Kg8)} 55. Rxc7+ {-0.70/25 75} Nxc7 {-4.00/35 0} 56. Kd2 {-0.68/25 2 (Sc5)} Na4 {-4.12/34 30} 57. f3 {-1.25/29 110 (Sf1)} Kg7 {-4.70/33 38} 58. Ke3 {-1.39/33 84 (Sf1)} Kf6 {-5.08/38 41} 59. Nf1 {-1.45/30 10} Ke5 {-5.18/42 41} 60. Nd4 {-1.47/29 2} Nc3 {-5.30/41 35} 61. Nc6+ {-1.63/28 2} Kd6 {-5.52/42 80} 62. Nd8 {-1.85/26 2} Ne8 {-5.70/51 115} 63. Nb7+ {-2.08/27 2} Ke5 {-5.71/41 30} 64. Nd8 {-3.13/23 50} Nd6 {-5.74/41 0 (Sd1+)} 65. Nc6+ {-2.17/24 48} Kf6 {-5.91/38 0 (Ke6)} 66. Na5 {-2.59/21 35} Ke6 {-5.95/40 29} 67. Nb3 {-2.87/22 5} Ke5 {-5.96/32 4} 68. Na5 {-3.00/18 2} Ke6 {-5.98/35 31 (Sa4)} 69. Nb3 {-1.78/25 49} Ke5 {-6.09/35 0} 70. Na5 {-2.47/22 2} Na4 {-6.13/31 13 (Se2)} 71. Nc6+ {-3.68/20 58 (f4+)} Kf6 {-6.34/31 14} 72. Na5 {-4.60/20 42 (Kd4)} Nb2 {-7.43/26 16} 73. fxe4 {-5.53/20 1 (Sd2)} fxe4 {-8.24/23 16} 74. c5 {-7.22/18 3 (Sd2)} Ndc4+ {-10.78/22 16} 75. Nxc4 {-10.79/16 12 (Kd4)} Nxc4+ {-87.88/78 20} 76. Kxe4 {-13.52/15 9} d2 {-#35/58 34} 77. Nxd2 {-17.24/13 1} Nxd2+ {-#30/65 13} 78. Ke3 {-18.24/9 1} Nc4+ {-#29/61 11} 79. Kf4 {-22.34/2 51 (Kd3)} Ne5 {-#27/75 32} 80. Ke4 {-36.25/4 1} Nc6 {-#25/73 11} 81. Kd5 {-33.80/2 29 (Kf4)} Nb8 {-#24/76 9} 82. Kd6 {-#163/2 19 (Ke4)} Kf5 {-#21/73 10} 83. Kc7 {-#162/1 0 (Ke7)} Na6+ {-#19/85 12} 84. Kb7 {-#161/1 0 (Kd6)} Nxc5+ {-#16/80 16} 85. Kb8 {-#160/1 1 (Kc6)} g5 {-#15/74 15 (Kg4)} 86. Ka8 {-#153/1 1 (hxg5)} g4 {-#12/101 11 (gxh4)} 87. Kb8 {-#147/2 1} Ne4 {-#11/203 10} 88. Kc8 {-#146/1 1 (Kc7)} Nxg3 {-#10/98 13} 89. Kd7 {-2/0 0} Ne4 {-1/0 0} 90. Kc6 {-1/0 0} g3 {-1/1 0} 91. Kd5 {-1/0 0} g2 {-1/1 0} 92. Kc4 {-1/0 0} g1=Q {-2/0 0} 93. Kb5 {-2/0 0} Kg4 {-1/0 0} 94. Ka6 {-1/0 0} Kxh4 {-2/1 0} 95. Kb7 {-2/0 0} Kg5 {-1/0 0 0-1 (95) Lc0 v0.30.0-dag+git.721fb3af-Stockfish Dort 2023 [-0.49;-0.95]}) 30... c4 {-0.58/22 128 (Tec8)} 31. bxc4 {-0.82/49 41} Nc5 {-0.59/27 18} 32. Ne2 {-0.84/48 193} Qd6 {-0.57/28 3} 33. Nh4 {-0.86/49 249} Re7 {-0.63/33 115 (Kh7)} 34. f4 {-0.61/43 34} Bxf4 {-0.65/37 91 (Teb7)} 35. Nxf4 {-1.01/53 51} exf4 {-0.63/43 2} 36. Nf3 {-0.96/48 37} Reb7 {-0.62/42 2} 37. Rxb7 {-0.91/47 26} Rxb7 {-0.61/45 5} 38. Rb1 {-0.83/48 24} Qb8 {-0.64/30 40} 39. Rxb7 {-0.82/50 3} Qxb7 {-0.64/24 26} 40. Bh4 {-0.80/47 7} Kg7 {-0.64/22 59 (Db4)} 41. Qd2 {-0.50/43 50} Qb1+ {-0.70/32 158} 42. Kh2 {-0.38/63 0} Qb8 {-0.71/30 2 (Sxd3)} 43. Bf2 {-0.26/45 28} Ne6 {-0.66/29 70} 44. h4 {-0.12/48 9} Qb3 {-0.62/31 64} 45. Ng5 {-0.06/54 0} Nxg5 {-0.48/33 156} 46. hxg5 {-0.03/62 0} Qb8 {-0.48/33 44} 47. g3 {-0.03/61 11} fxg3+ {-0.47/32 35} 48. Bxg3 {-0.02/56 0} Qc8 {-0.47/31 120} 49. Qf4 {-0.04/60 0 (Dd1)} Qd8 {-0.82/26 194} 50. Be1 {-0.01/62 66 (c5)} Qe7 {-0.46/33 282} 51. Bg3 {0.00/72 0 (Lf2)} Qd8 {-0.45/33 36} 52. Be1 {0.00/71 0} Kg8 {-0.42/33 33} 53. Kg2 {0.00/71 2} Nxa5 {-0.38/34 24} 54. Bxa5 {0.00/72 21} Qxa5 {-0.34/36 1} 55. e5 {0.00/77 38} Qa2+ {-0.33/35 3 Remis angenommen ½-½ (55) Stockfish-Lc0 v0.30.0-dag+git.721fb3af Dort 2023 [-0.73;-0.52]}) 23... Rd8 24. Re1 dxe4 25. Nxe4 Nh5 26. Qb3 Qd5 27. Qxd5 Rxd5 28. Red1 Nf4 29. Ne1 f5 30. g3 Ne2+ {-0.80/33}) (22... Rb8 $5 23. Rab1 Qd7 24. h4 dxe4 25. Nxe4 Nd5 26. Re1 Rd8 27. Rbd1 Nd4 28. Bxd4 cxd4 29. Rc1 Bb4 30. Nc5 Bxc5 {-0.70/37}) (22... d4 23. Be1 Nd7 24. h4 h5 25. Nf1 Rb8 26. Rab1 a5 27. Qd1 Qd8 28. Qe2 Re8 29. b3 Qe7 30. Rb2 Nb6 {-0.57/34}) (22... Nd4 23. Bxd4 cxd4 24. h4 Qd7 25. Qb3 dxe4 26. Nxe4 Nxe4 27. dxe4 Qd8 28. Qd1 a5 29. g3 Bb4 30. Qd3 h5 {-0.48/37}) (22... Rd8 23. Re1 {-0.54/18 163} dxe4 {-0.86/48 344 -0.54;-0.86: '(Sd4)'} 24. Nxe4 {-0.58/24 1} Nd5 {-0.99/42 48} 25. Rad1 {-0.57/22 1} Nd4 (25... Ndb4 {-0.93/50 208} 26. Bxb4 {-0.56/22 1} Nxb4 {-0.97/48 42} 27. Qc3 {-0.55/20 1} Qxa4 {-1.05/45 66} 28. Nxe5 {-0.54/24 1} Qb5 {-1.05/44 81} 29. f4 {-0.53/28 130} Rd4 {-0.88/46 35} 30. Kh1 {-0.49/23 80} Qb6 {-0.97/49 409 (Sd5)} 31. h3 {-0.46/24 80 (Dc1)} a5 {-0.81/46 47} 32. Qc1 {-0.46/16 1} Qc7 {-1.07/46 196 (a4)} 33. Qc3 {-0.43/23 261 (b3)} Qb6 {-0.73/52 463} 34. Qc1 {-0.43/30 1} a4 {-0.83/43 129 (Da7)} 35. Re3 {-0.41/17 16} Qa5 {-0.71/46 92 (Te7)} 36. Nc3 {-0.34/22 268} Qa6 {-0.60/52 0} 37. Ne4 {-0.33/13 2} Qb5 {-0.52/51 153 (Sd5)} 38. Nc3 {-0.31/23 203} Qa6 {-0.56/50 0} 39. Ne4 {-0.32/24 74} Nd5 {-0.58/48 0 (Dc8)} 40. Rf3 {-0.32/24 147} Qc8 {-0.34/47 0 (Da7)} 41. Rdf1 {-0.30/23 97} Nb4 {-0.25/50 0 (f5)} 42. Nc3 {-0.29/19 121 (Te1)} Qe8 {-0.39/41 12} 43. Qd1 {-0.28/23 67} Nd5 {-0.39/43 5 (g5)} 44. Nxd5 {-0.26/18 87 (Se2)} Rxd5 {-0.47/39 18} 45. Nc4 {-0.25/17 16} Qb5 {-0.42/47 59} 46. Na3 {-0.26/21 41} Qd7 {-0.29/44 26 (Db4)} 47. Nc4 {-0.22/18 95} Qb5 {-0.34/49 0} 48. Na3 {-0.24/20 66} Qe8 {-0.32/48 0 (Db4)} 49. Nc4 {-0.21/17 152 (b3)} Rf5 {-0.22/53 42} 50. b3 {-0.21/20 2} axb3 {-0.29/46 6} 51. Qxb3 {-0.21/17 9} Bg7 {-0.22/49 5 (h5)} 52. Nd2 {-0.20/13 55} Qd8 {-0.21/49 0 (Dc6)} 53. Rb1 {-0.18/12 75} Bd4 {-0.19/51 0 (Td5)} 54. Ne4 {-0.16/13 54} Rd5 {-0.19/56 0} 55. Rff1 {-0.15/12 33} Kg7 {-0.18/59 0 (Te7)} 56. Qa2 {-0.10/14 48} Re7 {-0.18/64 4 (Te8)} 57. Rb8 {-0.08/15 37} Qxb8 {-0.18/64 15 (Dd7)} 58. Qxd5 {-0.06/16 25} Qb5 {-0.18/63 1} 59. f5 {-0.03/17 30} Qxd3 {-0.18/66 4} 60. f6+ {-0.03/17 26} Kh7 {-0.18/65 2 adjud. Remis angenommen ½-½ (60) Lc0 v0.30.0-dag+git.721fb3af-Stockfish Dort 2023 [-0.54;-0.86]}) 26. Nxd4 cxd4 27. Ba5 Rb8 28. Rc1 f5 29. Nd2 Kh7 30. h3 Qd7 {-0.87/30}) 23. dxe4 $2 (23. Nxe4 Nxe4 24. Bd2 (24. dxe4 Rd8 {-0.37/51 581} 25. Rd1 {-0.31/16 268 (De2)} Nd4 {-0.46/40 54} 26. Qd3 {-0.31/14 0} Rdd6 {-0.31/50 634 (h5)} 27. Qf1 {-0.23/18 124 (Le1)} Qc6 {-0.34/38 31} 28. Bxd4 {-0.23/17 129 (Sd2)} cxd4 {-0.47/42 49} 29. Qe2 {-0.22/15 1} Qd7 {-0.34/52 96} 30. Ne1 {-0.23/14 52} Rc6 {-0.33/60 151} 31. Nd3 {-0.23/15 203} h5 {-0.27/60 208} 32. h3 {-0.21/17 2} Kg7 {-0.26/53 35} 33. Rf1 {-0.21/18 57} Bd6 {-0.23/56 13} 34. Rfc1 {-0.20/19 67} Rxc1+ {-0.21/58 0} 35. Rxc1 {-0.20/19 74} Qxa4 {-0.24/60 1} 36. Qc2 {-0.20/17 14} Qb5 {-0.20/58 33 (Da5)} 37. Qc4 {-0.18/17 125} Qa5 {-0.15/60 0} 38. Kf1 {-0.17/16 165 (Db3)} Bf8 {-0.16/57 37 (Le7)} 39. Ke2 {-0.15/15 103 (Dc8)} Qd8 {-0.10/48 23} 40. Qc8 {-0.13/16 72} Qxc8 {-0.05/53 44} 41. Rxc8 {-0.14/15 12} Rb6 {-0.03/59 32 (h4)} 42. g4 {-0.11/14 97 (g3)} Bd6 {0.00/65 33 (hxg4)} 43. gxh5 {-0.08/14 99} gxh5 {0.00/65 0} 44. f4 {-0.06/14 52 (Td8)} exf4 {0.00/77 38 (f6)} 45. Rc4 {-0.05/13 53} f3+ {0.00/68 0 (Tb3)} 46. Kxf3 {0.00/10 107} Bh2 {0.00/75 0} 47. Rxd4 {0.00/10 114 (Kg2) Remis angenommen ½-½ (47) Lc0 v0.30.0-dag+git.721fb3af-Stockfish Dort 2023 [-0.31;-0.37]}) 24... Rd8 25. Qb3 Nf6 26. Qc4 Ne4 27. dxe4 Nd4 28. Bc3 Qe7 29. Rf1 g5 30. Rad1 h5 31. Ne1 g4 32. f3 Bh6 33. Bxd4 Rxd4 34. Rxd4 exd4 35. Nd3 Be3+ 36. Kh1 h4 37. Nxc5 Rc6 38. b4 g3 39. h3 a5 40. Qb5 Qc7 41. Nd3 axb4 42. f4 b3 43. Qxb3 Rc3 44. Qb5 Qc6 45. Qg5+ Qg6 46. Qd8+ Kg7) 23... Rb8 $2 (23... Nd4 {-1.20/42}) 24. Nd2 Nd4 25. Qd3 h5 26. Ngf1 Rd6 27. Bxd4 $2 (27. Qc4 {-0.90/38}) 27... cxd4 (27... cxd4 {-1.26/31}) 28. Nc4 Rc6 29. Nfd2 Nd7 30. Rcb1 Bb4 (30... Qe6 {-2.48/28}) 31. Qh3 Nc5 32. a5 Kg7 33. Nf3 f6 34. Ncd2 Qc8 35. Qg3 Qg4 36. Rc1 Rbc8 37. Rc4 Bxd2 38. Qxg4 hxg4 39. Nxd2 Nd3 40. b3 Nb2 41. Rxc6 Rxc6 42. Kf1 Rc2 43. Ke2 Kf7 44. b4 Nc4 45. Kd3 Rc3+ 46. Ke2 Nd6 47. Rh1 f5 48. f3 gxf3+ 49. gxf3 f4 50. Rb1 Nb5 51. Kd1 Rc8 52. Rb2 Nc3+ 53. Ke1 Na4 54. Rb1 Rb8 55. Nc4 Kf6 56. Nd2 Rh8 57. Nf1 Nc3 58. Rb2 g5 59. Rg2 Rb8 60. Rb2 Rh8 61. Rg2 Rb8 62. Rb2 g4 63. Nd2 gxf3 64. Nxf3 Rb5 65. Nd2 Kg5 66. Kf1 f3 67. Nxf3+ Kf4 68. Nd2 Nxe4 69. Nc4 Nc3 70. Rf2+ Kg5 71. h4+ Kxh4 72. Rf5 e4 73. Nd6 Rxb4 74. Nxe4 Nxe4 75. Rf4+ Kg3 76. Rxe4 Kf3 77. Re1 d3 78. Rd1 Rb3 0-1

Nun ist 30'+15" natürlich auch keine echte LTC und Folgerungen aus den paar Partien zwischen 2 Engines zu ziehen, bringt auch nicht viel Aufschluss, aber immerhin hatte SF 30 Threads der 16x3.5GHz CPU, LC0 die restlichen 2 und die 3070ti GPU und wenn ich's schon gespeichert habe, füg' ich's halt auch ein hier.

Ich würde trotzdem oder erst recht vermuten, dass die Stellung nicht zwingend gewonnen ist, und dass es gegen eine Engine mit echt langer Rechenzeit pro Zug nicht leicht sein wird, das zu einem 0-1 zu machen, aber wie man sieht, kann SF gegen LC0 schon mal ein Pünktchen schaffen. Wir wären an einer Stelle, wo's erst recht interessant würde, über Stellungen zu reden in Hinblick auf das, was man aus ihnen an Infos über Engines und ihre Spielstärke relativ zu anderen Engines gewinnen kann und wie. Wir könnten anfangen zu überlegen, wie gut oder wie schlecht Stellungen, die für Stellungstests bestimmter Art geeignet sind, sich zum Ausspielen Eng-Eng eignen und was sie für statistischen Wert in der Spielstärkenbestimmung hätten, aber das würde den Rahmen des Threads vollends sprengen.
Was hingegen meine persönlich Meinung dazu angeht, ist die ja auch schon oft genug verkündet worden von mir, ich sehe den großen Unterschied, den man bei den Testern immer wieder gerne macht, zwischen Stellungen zum Eng-Eng-Ausspielen und anderen Teststellungen nicht wirklich.

Natürlich sind single best move- Stellungen, die noch dazu optimaler Weise auch single game changers sind, also die einigen Züge, die das Spiel entscheiden, für Eng-Eng-Matches ungeeignet, aber alle anderen, und die sind halt in der weit überwiegenden Mehrheit, kann man zum Ausspielen (Lassen) sehr wohl auch verwenden, man sprach dann früher in dem Zusammenhang von Thementurnieren, ein Begriff, der selten verwendet ist inzwischen, weil die Eröffnungsstellungen, die man heutzutage meistens verwendet, eigentlich lauter solche Thementurniere starten, wenn man das in einem so weiten Sinn definiert. Das Thema wird halt mit dem Farbwechsel beendet und das nächste gestartet.
Und nun braucht man für Eng-Eng-Matches, von denen man mit noch halbwegs machbaren Partiezahlen Performance- Unterschiede zwischen starken und untereinander ähnlich starken Engines bekommen will, immer mehr Eröffnungs- Teststellungen, die nicht nur Remis oder 1:1-Paare (wo der Vorteil zu groß wird) liefern, sondern ein praktikables Verhältnis von (durch den Vorteil gespreizten) Elodifferenz zu error bar. Diese Stellungen zu finden, zu bewerten und zu sammeln, ist eine sehr ähnlich wie diejenige, Stellungen für andere Stellungstests als solche zu selektieren.
Um es mal wieder auf diesen Punkt zu bringen: Eng-Eng-Matches mit tauglichen Eröffnungs- Teststellungen sind nichts anderes als ausgespielte Stellungstests und das Aussuchen der als Eröffnungs- Teststellungen Geeigneten setzt eine Art von Stellungstest voraus.

Merke vor allem auch: Stellungstest ist für mich nicht nur das, was ein Tool, ein GUI statistisch aus einer Sammlung von Stellungen an Ergebnissen gewinnt, es ist das Prinzip, einzelne Stellungen mithilfe und anhand von interaktiver Analyse mit bestimmten Engines gemeinsam (natürlich muss man die schon für die Analyse auch auswählen, aber da kann man ja mehrere abwechselnd nehmen, wenn man sich nicht auf eine allein verlassen will) dahingehend zu bewerten, was welche Engine and time to solution(s, wenn's mehrere pro Stellung gibt) time to best eval, time to best line im Output zeigt. Das ist übrigens (Einzelstellungs- abhängig) das einzig wirklich exakt und reprodzierbar Mess- und Vergleichbare, single thread deterministisch, SMP auch durch mehrere Versuche zu mitteln, aber wenigstens wirklich exakt und reproduzierbar für die einzelne Stellung, die einzelne Engine auf der einzelnen Hardware (ganz genau genommen auch noch für das einzelne GUI und das einzelnen Betriebssystem, aber was das GUI angeht, würde ich für solche Messungen halt sicherheitshalber ohne messen, also im Konsolen- Modus).

Das nur auch noch, weil der vielgeschmähte Zeitfaktor, dass man sich bei Teststellungen an bestimmte Zeitwerte klammert, die oft genug gering genug unterscheidbar sind, die Meinung, die z.B. Kurt hier auch gerade wieder angesprochen hat, dass es nicht die große Rolle spielen sollte, ob ein paar Sekunden mehr oder weniger Lösungszeit für eine Stellung relevant ist, ja, solche Sachen sind statistisch immer ein Problem, weil sie Ergebnisse mit wenig Unterschied gleich wesentlich verändern und man sie willkürlich definieren muss, aber dafür kann man das wenigstens auch, und man muss damit leben, wenn man überhaupt statistisch relevant messen will. Einen anderen wirklich exakt messbaren Unterschied gibt's bei schachlichen Leistungen halt an und für sich nicht, außer den ganzen und halben Punkten gibt's noch die Zeit. Wie lang welche Engine wofür braucht, bestimmt die Leistung bei jeder Stellung, jeder Partie, jedem Match. Bei Eng-Eng sagt man auch nicht, ach, des einen Sekundenbruchteils wegen, den die Engine über die Partie zuviel Zeit verbaucht hat, sodass sie dann durch Zeitmangel erst ganz zum Schluss verloren hat, nur deswegen gleich einen ganzen Punkt zu vergeben, nein, das scheint mir nicht gerechtfertigt. Da fällt das Fähnchen und es käme niemand auf die Idee zu sagen, halt, halt, halt, einen Moment sollten wir der Engine oder dem Spieler noch geben, er hat bis dahin doch so gut gespielt

Die Eröffnungsstellungen, die nicht nur Remis zwischen starken und ähnlich starken Engines mit halbwegs vernünftiger (nicht nur very very short TC) Hardware-Rechenzeit erbringen, haben Vorteile einer Seite zu haben. Bei Stefan Pohl heißen sie (z.B.) UHO (unbalanced human openings) und er hat eine wirklich sehr schöne Sammlung an verschieden stark einseitig bevorteilten solchen Stellungen hier

https://www.sp-cc.de/uho_2022.htm

zum Download.

Aus denen habe ich ja diejenigen Stellungen, (im 1111- Set ca. 250 davon) fürs MEA- Testen gewonnen, ich habe mit dem 6mvs- Set mit dem größten einseitigen Vorteil genommen, im Unter- Set heißt's
UHO_2022_6mvs_+180_+189.pgn
, und meine Absicht dahinter war (hat auch ganz gut funktioniert, finde ich), solche Eröffnungsstellungen zu verwenden, die schon an der Grenze zum wahrscheinlichen Gewinn der bevorteilten Seite sind, weil die haben natürlich auch noch eher als ausgeglichene Eröffnungsstellungen eine kleinere Anzahl von Abspielen, also "Lösungszügen", und sie haben eher signifikante Unterschiede in den Kandidatenzügen, was ihre Bewertung angeht, eine klarere Zugsortierung, und das sind eben die Kriterien, die Stellungen für statistische Stellungstests brauchen.

Um das noch einmal auf den Hauptpunkt zu bringen: es muss nicht einmal eine eindeutig beweisbar beste Zugsortierung (ein Ranking der Kandidaten) bestehen, man kann sogar unter der bm- Syntax beliebig viele Züge eintragen, die spielen praktisch keine Rolle, wenn das Scoring durch die eigens definierten Punkte wie bei MEA erfolgt. Dann wirkt sich das unter bm Eingetragene nur dahingehend aus, was in der Spalte Found steht im Ergebnis, das hat aber keine Einfluss aufs Ranking und Rating, das sich nur nach den Prozenten von den möglichen Gesamtpunkten richtet.

Jetzt kann man also für MEA schon auch Stellungen wie deine hier verwenden, es ist nur unproduktiv in verschiedener Hinsicht (Arbeitsaufwand und Ergebnis), bei einer Stellung 6 und mehr Züge (einzelne mit 6 kommen aber sogar auch vor bei mir, solche mit 5 gibt's ein paar, wenn die restlichen Kandidatenzüge dann wenigstens wirklich deutlich schlechter sind) mit natürlich bei allen, wenn man sich nicht einmal der Sortierung wirklich sicher ist, minimalen Punkten pro Zug. Wirkt sich dann in Summe einfach wie ein Zug in einer best move Sammlung aus, der von allen Engines gelöst wird.

Ok., Pause.
Parent - - By Kurt Utzinger Date 2023-01-15 12:03
Frank Sanders schrieb:

Zitat:
Walter bringt es deshalb wieder einmal ganz kurz und einfach auf den Punkt, weil wenn du daran zweifelst, ob du als Mensch mit Engine- Unterstützung Schachstellungen bewerten kannst, sodass dir die Ergebnisse bei den einzelnen Stellungen schlüssig scheinen, dann geht's natürlich auch nicht in Summen noch so vieler oder noch so weniger solcher (Stellungen).


Ich finde gerade der ERET Test von Walter ist ein sehr gutes Beispiel dass das geht. Er selbst hat aber auch geschrieben, dass die Erstellung der 111 Aufgaben ca. ein halbes Jahr gedauert hat. Bei einem Test mit über 1000 Positionen wären dass ungefähr 5 Jahre.


Hallo Frank
Ich verstehe dein Anliegen. Viele der heutigen Ranglisten, die auf Teststellungen basieren, sind
einigermassen bedeutungslos. Und zwar in dem Sinne, als es nicht nur für Otto-Normal-User
im Schachbereich völlig egal ist, ob der Durchschnitt der Lösungszeiten 3 Sek, 5 Sek, 10 Sek usw.
beträgt. Es ist zwar schön zu sehen, was da alles gelöst wird. Aber im Prinzip hat man mit diesen
Tests die Engines (Programme) eigentlich gar nicht richtig gefordert. Zum Zeitpunkt des ERET Tests
von Walter Eigenmann war das noch anders. Und hier konnte man noch den Spreu vom Weizen
trennen. Es sind also einige Hunderte neue Stellungen zu kreieren, die der Leistung der heutigen
Programme auf schneller Hardware "gerecht" werden. Und diese Stellungen zu finden und einen
solchen Test aufzubauen, braucht bestimmt sehr viel Zeit. Denn jede Stellung müsste tatsächlich
in einem zeitaufwändigen Verfahren durch die Programme mit menschlicher Hilfe selbst auf deren
Richtigkeit geprüft werden. Dies deshalb, weil die menschlichen Spieler nur so beim Hinsehen keine
korrekten Schlussfolgerungen zu tun imstande sind. Fazit (für mich): Eine solche Testsuite dürfte
es in den nächsten Jahren kaum geben ... oder willst du dich an die Arbeit machen?!
Beste Grüsse
Kurt
Parent - - By Peter Martan Date 2023-01-15 12:38 Edited 2023-01-15 13:27
Kurt, du enttäuscht mich schwer, nach allem, was wir per Mail darüber miteinander schon geklärt hatten (dachte ich).
Wenn du's für dich selbst aufgeben hast, dir was zusammenzustellen, ok, dass du aber meine Bemühungen derartig ignorierst und dadurch zu dem Schluss kommst, seit Eret gibt's nichts Neues mehr, das spricht nicht für deine echte Entschlossenheit im Versuch, der Sache als solcher mehr Aufmerksamkeit zu widmen.

Warum nimmst du nicht "einfach" (so wie's ich's ja im Wesentlich auch immer wieder mache, nicht nur, aber auch) den Eret und andere im Schwierigkeitsgrad ähnliche Stellungen, und sortierst diejnigen wieder aus, die dir für eine kürzere TC dann wieder zu schwer erscheinen?

Die single best move suite ist, was die Hardware- TC in einem einheitlichen Niveau angeht, natürlich am schwierigsten "perfekt" zu bekommen, vor allem, wenn man die kürzere Rechenzeit und das höhere Engine- Niveau mit mehr Stellungen ausgleichen will, aber wie du meinen lichtvollen Ausführungen der letzten paar Monate vielleicht doch auch entnommen wirst haben, single best move stellt bei Weitem nicht (mehr) die einzige Art des Stellungstests dar.
(Hat sie ja auch nie, aber es war halt immer das, woran sich die Kritiker "aufgehängt" haben, weil sie die meisten damals schwierigen Teststellungen auch mit Engine- Unterstützung nicht wirklich verstanden haben und es sich nicht antun wollten, da interaktiv genug Zeit zu investieren. Heutzutage hiflt dir Standrechnen im MultiPV- Mode schon in weitaus kürzerer Rechenzeit mehr weiter bei denen, bei denen du damals nur mit Forward- Backward Chancen auf korrekten Ouput hattest.  STS war noch nie eine single best move suite, auch keine taktische suite, warum heißt sie wohl Strategic Test Suite? Und schon als sie rauskam, waren die Rechenzeiten viel kürzer als z.B. für Eret, es sollten eben damals schon die Ergebnisse nicht aus tiefer Suche sonder aus der "statischen Eval" stimmen).
Was soll's, ein echter "Jünger" warst du halt auch noch nie und wirst wohl, scheint's, auch keiner mehr werden


Edit, edit: wenn du bei single best move bleiben willst, was geht dir dann an dieser 256- Stellungen- Sammlung ab?

https://www.dropbox.com/s/lpg29zoyvh03dza/256.epd?dl=0

Kannst du, je nachdem für welche Engines mit Hardware- TCs von (SMP) bis 15" laufen lassen, wenn du single thread des Determinismus wegen testest, auch noch etwas länger. Auswerten (lassen) würd' dich das halt schon mit EloStatTS, weil du damit einfach mehr statistische Aussage bekommst.

Was mir stark weiterhelfen würde, wäre ein GUI- Feature, dass das, was MEA macht, einfacher bedienbar machte (ohne die eigene Syntax des Tools, die man halt auf's Leerzeichen korrekt Tippen muss als Konsolen- Anwendung).
Dazu würde mir schon eine Auswertung von !?, ?1 und ? als Kommentare bei den alternativen Lösungen reichen. Mehr als 4 (mit dem ! zusätzlich und der Hierarchie der Züge im .pgn- Baum wären's schon 5) für beliebig viele ähnlich starke Züge würde man als reine Graduierung nicht brauchen pro Stellung, mehr als soviele Abstufungen braucht man bei MEA auch nicht, da kann man aber halt zusätzlich auch noch verschieden viele Punkte für verschieden Hardware- Zeit- "schwere" Stellungen frei definieren.
Wenn das GUI dann auch noch die andere Hauptleistung von EloStatTS übernähme (oder wenigstens das würde single best move auch schon wesentlich besser diskriminierbar machen bei ähnlich stark performenden Engines), Stellungen, die von 2 Engines in ihren jeweiligen Testläufen gleichermaßen gelöst oder nicht gelöst würden als Remis, von der einen Engine im Vergleich allein gelösten als 1-0 und von der anderen allein gelöste als 0-1 bewertete, hätte man auch "echte Elo" (aus direktem Eng-Eng-Minimatch an jeder einzelnen Stellung), aber die braucht man natürlich nicht wirklich, wenn die Punktebewertung alle genug Diskrimination relativ zur error bar liefert.
Auf diese Art kann man die Ergebnisse aus den Lösungsfiles der verschiedensten GUIs auch manuell in Elostat eintippen, ist aber halt auch etwas, was wieder unnötig Zeit kostet und Aufwand, selbst vor dem PC sitzend, das Abzählen vor allem bei vielen Stellungen Engine für Engine, das ist mühsam.

Im Banksia werden Bildschirm für Bildschirm die Stellungen nach dem Durchlaufen und schon währenddessen schön färbig getrennt nach gelösten (grün) und ungelösten (rot) dargestellt, das Abzählen ist da dann kein unheimlicher Aufwand mehr, und schon sagt dir das Elostat- Programm oder ein anderes, in das du nur 1-0, 0-1 und Remis als Summenwerte eingeben musst, wie das Elo- Verhältnis ist, aber sowas könnte einem das GUI schon auch wirklich mit sehr wenig zusätzlichem Programmaufwand abnehmen, wenn denn ein ansonsten ohnehin komplettes automatisiertes Stellungstest- Feature bereits vorhanden ist.
Ich würde da ja erst recht ganz stark auf Fritz hoffen, bei dem ist eine Erneuerung der Testsuite- Auswertung allein schon von der Mindest- TC her länger fällig, finde ich.
Pham (Banksia) weiß auch über diesen meinen "kleinen bescheidenen Wunsch" Bescheid, der hat aber noch genug andere Baustellen vorher zu bedienen vermutlich
Parent - By Peter Martan Date 2023-01-15 13:45 Edited 2023-01-15 13:48
Zitat:

Kannst du, je nachdem für welche Engines mit Hardware- TCs von (SMP) bis 15" laufen lassen,

Drum muss ich immer wieder soviel und so lange rumeditieren, bis die eh schon lange diesbezügliche Zeit auch noch aus ist, es gehen nicht nur Tippfehler, sondern auch wesentliche Infos oft selbst beim Wiederdurchlesen neuerlich durch den Suchfilter, im zitierten Satz fehlt das 5", also gemeint war
...mit Hardware- TCs von 5" (SMP auf starker Hardware) bis 15" pro Stellung....
Parent - - By Kurt Utzinger Date 2023-01-15 16:56
Peter Martan schrieb:

Kurt, du enttäuscht mich schwer, nach allem, was wir per Mail darüber miteinander schon geklärt hatten (dachte ich).
Wenn du's für dich selbst aufgeben hast, dir was zusammenzustellen, ok, dass du aber meine Bemühungen derartig ignorierst und dadurch zu dem Schluss kommst, seit Eret gibt's nichts Neues mehr, das spricht nicht für deine echte Entschlossenheit im Versuch, der Sache als solcher mehr Aufmerksamkeit zu widmen.

Warum nimmst du nicht "einfach" (so wie's ich's ja im Wesentlich auch immer wieder mache, nicht nur, aber auch) den Eret und andere im Schwierigkeitsgrad ähnliche Stellungen, und sortierst diejnigen wieder aus, die dir für eine kürzere TC dann wieder zu schwer erscheinen?


Hallo Peter

Ich weiss nicht mehr, was wir alles geklärt haben sollen. Ich habe es nicht aufgegeben, mir etwas zusammenzustellen. Denn so richtig habe ich das noch gar nie gemacht. Und natürlich kann ich mir aus all den Testsuites einen "eigenen Test" zusammenstellen. Werde das aber wohl nicht tun. Sinngemäss habe ich dir mal folgendes geschrieben: Eine Vermischung von "vielen leichteren" und "genügend schweren" Stellungen ist unabdingbar für eine wirklich brauchbare Testsuite und für einen objektiven (Stärke-)Vergleich der Engines. Bei "leichten" Stellungen würde ich die Einschränkung der Sinnlosigkeit von Stellungen machen, welche heute von praktisch allen Engines innert weniger Sekunden gelöst werden, weil ich das als reine Verschwendung von Zeit und Ressourcen betrachte. Ganz generell ist aber für die praktische Anwendung eine Engine zu bevorzugen, die in 1000 Stellungen 950 Punkte mit 920 leichteren und 30 schweren Aufgaben holt gegenüber einer Engine mit 950 Punkten, erzielt durch 850 leichtere und 100 schwereren Aufgaben. Für mich zeigen Tests nur oberflächliche Trends zur Spielstärke der Engines. Aus meiner Sicht ist jede (Engine-)Schachpartie nach Ende der Eröffnungsbibliothek bei jedem selbständig ausgeführten Zug ein Test für das Programm. So gesehen, müsste ein aussagekräftiger Stellungstest für echte Vergleiche X-Tausend Positionen enthalten. Das ist nicht zu schaffen. Deshalb geben eine (sehr) grosse Anzahl von Partien einer Engine gegen möglichst viele andere Engines schliesslich einen verlässlicheren Vergleich zur Spielstärke. Was mich als "Langsam-Spieler" stört, ist einzig die für solche Spieletests üblicherweise sehr tief angesetzten Bedenkzeiten. So hat (nimmt sich) niemand mehr die Zeit,  sich die Partien anzuschauen. So werden die Games fast ausschliesslich nur noch statistisch ausgewertet. Das ist zwar wichtig, aber widerspricht eben meiner Schachphilosophie, dass Schach ein Denksport ist, der nicht im Sekundenbereich abgehandelt werden sollte. Verständlich deshalb auch, dass ich nur ganz ausnahmsweise Blitzpartien spiele. Das geschieht höchstens am Ende eines schönen Schachnachmittags, den ich mit einem Schachfreund bei der Analyse von (u.a. eigenen) Partien/Stellungen, verbracht habe. Es geht dann nur noch darum, den Kopf freizumachen und etwas Spass zu haben, ohne die Partien ernst zu nehmen.

Beste Grüsse
Kurt
Parent - - By Peter Martan Date 2023-01-15 17:57 Edited 2023-01-15 18:43
Kurt Utzinger schrieb:

So gesehen, müsste ein aussagekräftiger Stellungstest für echte Vergleiche X-Tausend Positionen enthalten. Das ist nicht zu schaffen.

Das ist leicht zu schaffen, wenn du die Evaluierung der Stellung einfach auch den Engines überlässt. Im Wesentlichen haben Schröder und Mosca das ja mit dem STS gemacht. Es gab und gibt ein .epd- Set mit SF- Evaluierung und eines mit LC0.  Ferdy hat sogar hier

https://talkchess.com/forum3/viewtopic.php?p=936756&sid=8a3ed42d419bb9eb83e62f101ae9f02d#p936756

mal eine Web- Anbindung veröffentlicht, mit der an sich an der Evaluierung beteiligen konnte. Drum hab ich das für UHO- Sets ja jetzt auch im CCC vorgeschlagen.
Schröder nimmt für ganze Datenbanken MEA oder das andere Tool NICE mit zigtausend Stellungen

https://rebel13.nl/misc/nice.html

für ähnliche Zwecke, für mich persönlich wird das Ganze dann halt mehr und mehr ein Similarity- Test zwischen den Evals der Eich- Engines (die man ja aber natürlich praktisch beliebig lang laufen lassen kann pro Stellung) und den mit diesen Evals getesteten anderen. Mosca lässt SF im MultiPV- Mode laufen und vergibt die Punkte der Stellungen nach den Evals der MultiPV- Züge.

https://talkchess.com/forum3/viewtopic.php?p=936637&sid=235388e41493894f8363dc48c2ec543c#p936637

Aber etwas anderes als das macht man letzten Endes ja auch nicht, wenn man immer eine Engine im Match  gegen genau eine andere vergleicht, gegen die sie spielt.
Meine Absicht hinter den Suiten, die ich daraus gemacht habe, indem ich die "allzu leichten" weggelassen habe und dafür leichte taktische mit Eröffnungen mit einseitigem Vorteil dazugenommen, wie sie auch zum Ausspielen lassen von Stefan Pohl verwendet werden: ich will die reine Taktik- Lastigkeit der single best move- Suiten dem game playing- Ergebnis ähnlicher machen.
Außer der Neukombination der Stellungen habe ich die Punkte alle auf die Art händisch verändert, dass ich Stellungen, die mit mehr Hardware- Zeit zu lösen sind, mit relativ mehr Punkten belohnt habe als die schneller evaluierbaren, für Eröffnungen, weil früher im Spiel von entscheidenderer Bedeutung, auch im Verhältnis der Abspiele zueinander relativ höher bewerte, wenn auch nicht so hoch wie die an single best move heranreichenden, also Stellungen mit weniger ähnlich guten Zügen, von denen einer viel besser ist als die anderen, bekommen mehr Punkte für den Hauptzug und relativ weniger für die Alternativen.

Wie auch immer, es gibt einfach ein bisschen mehr zum Thema Stellungstest als das, was sich die "Kritiker" darunter vorstellen. Und bei der Gelegenheit mal wieder das Totschlagargument schlechthin, das immer irrtümlich von den Phobikern des Ausdrucks verwendet wurde: der Stellungstest testet die Teststellungen, ja, wird gut sein, wenn er das macht, dazu macht man ihn ja. Und vors sinnvolle Eng-Eng-Match haben die Götter heute mehr denn je den Stellungstest schon deshalb zwingend auch gesetzt, weil wenn man heutzutage nicht die Auswahl der Eröffnungsstellungen clever für das jeweilige Match, die Engines, um die's geht und die Hardware- TC trifft, (Womit wird man denn diese Eröffnungsteststellungen testen, hmh? Richtig, mit einem Stellungstest, oder wie auch immer wir ihn anders nennen wollen, damit das pfui pfui pfui- Wort vermieden wird ), wenn man diese Auswahl der Eröffnungsteststellungen nicht entsprechend selektiv trifft, kriegt man einfach nur mehr entweder Remis oder 1:1- Paare, ja man kann die Elo auf die Art schon auch spreizen, aber wenn man die error bar um das noch mehr spreizt (was man mit 1:1- Paaren einfach noch mehr tut als mit gleich vielen Remis bei gleicher Performance, die Engines selbst ändern sich ja nicht dadurch), dann spielt man sich mit noch so vielen Partien einfach einen Wolf und weiß nachher genau so wenig wie vorher, nur, dass der Strom und die Hardware sinnlos verbrannt ist, das weiß man schon und eigentlich im Vorhinein genau
Parent - - By Frank Sanders Date 2023-01-15 20:51 Edited 2023-01-15 21:03
Zitat:
Das ist leicht zu schaffen, wenn du die Evaluierung der Stellung einfach auch den Engines überlässt. Im Wesentlichen haben Schröder und Mosca das ja mit dem STS gemacht. Es gab und gibt ein .epd- Set mit SF- Evaluierung und eines mit LC0.


Das ist sehr interessant, da bekommen dann die Züge die in deinen Zusammenstellungen nicht gefunden werden die höchste Bewertung, denn das heißt dann bei diesem Test, der beste Zug in einer Stellung ist jener den Stockfish oder lc0 macht. Wenn sie verschiedene machen gibt es leider wieder ein kleines Problem, welches ist jetzt der bessere, oder sind sie gleichwertig?
Parent - - By Peter Martan Date 2023-01-15 22:09 Edited 2023-01-15 22:18
Du hast das Prinzip noch nicht ganz verstanden oder willst es nicht verstehen oder beides

Wie es Mosca gemacht hat: er übernimmt nicht die Evals als Punkte, sondern vergibt 1-10 (oder in anderen sets, um  mehr Punkte pro Stellung zu haben, auch ein Vielfaches) je nach dem relativen Abstand der MultiPV- Eval von der des am besten evaluierten Zuges, wenn der Abstand zu groß wird, kommt der Zug nicht in die unter mit Punkten belohnten. Also wieviele es sind und wie hoch die Punkte, hängt davon ab, wie weit auseinander wieviele Züg an Eval liegen

Und ich hab keine Stellungen in meiner Sammlung, bei denen ich mir nicht mit SF einig geworden bin diesbezüglich, was das Ranking der Züge angeht. (Ob du dem oder z.B. LC0 mehr glaubst, das ist natürlich Ansichtssache, aber bei klaren Stellungen, und auf solche sollte man sich natürlich schon beschränken, macht das nicht viel Unterschied. Wenn sie einem nicht gleich klar sind, kann man sie weiter untersuchen oder weglassen)

Du wirst in meinen Sammlungen keinen solchen Konflikt finden, wie du ihn dir wieder herbeirzueden versuchst, du musst dir halt die Stellungen einfach mit Engine anschauen, Frank, sonst wird das nix mit unseren weiteren Diskussionen, warum das und jenes deiner ausschließlich theoretischen Überlegung nach nicht funktionieren kann oder darf, das kannst du so messerscharf schließen, wie du möchtest
Schau dir die Stellungen mit der Engine deines Vertauens an, da sind keine so komplizierten drin, dass du dir nicht mit einer halbwegs modernen Engine auf halbwegs moderner Hardware schnell einig würdest.
Und ja, ich finde die SF- Evals oft genug auch nicht so zuverlässig, wo sie nahe beisammen liegen bei mehreren Kandidaten und vor allem gibt's auch bei denen immer wieder echt falsche, wenn die Engine etwas wirklich noch nicht weit genug geschnallt hat, aber die würde ich dann auch schon deshalb nicht in die STC- MEA- Suite hineinnehmen, weil sie halt dann einfach zu schwer sind.
Und ich habe lieber meine eigene Punkte- Höhe und richte mich nicht sklavisch nach der numerischen Höhe der Engine- Evals, auch deshalb, weil auch bei SF (und LC0 erst recht), der Partiefortschritt in Richtung Endspiel nicht wirklich eingeht, ein 1.00 in der Eröffnung ist etwas ganz anderes als im Endspiel.
Aber auch Mosca macht's ja wie gesagt nicht so, dass er einfach die Evals in Punkte umsetzt, er nimmt sie als Richtschnur für die Punktehöhe je nach Zahl an Kandidaten in einer bestimmten Eval- Range (so wie das z.B. auch Stefan Pohl bei der Auswahl seiner Stellungen für die opening positions macht).
Ich richte mich im Wesentlichen nach dem Ranking, auch das habe ich ein Einzelfällen in der Sammlung anders als die Engine, aber in allen diesen Zweifelsfällen musst du halt einfach gleich viele Punkte für alle fraglichen Züge nehmen, die ungefähr gleich (im relevanten Bereich) gut bewertet werden und wenn du bei einer Stellung zuviele gleichwertige Lösungen hast, lass sie raus. Wenn's ein zu leicht zu findender single best move ist (Schlagzug, Zug aus dem Schach...), lass ihn raus, der nimmt nur einem anderen Zug den Platz weg, Stellungen, die von allen Engines gelöst werden, drücken nur die Diskrimation statistisch, wenn's einer ist, bei dem du dir mit der Engine nicht und nicht einig wirst, lass ihn raus. Und mach' dir keine Sorgen, es bleiben genug übrig, bei denen du dir klar sein wirst und mit der Engine einig, wenn nicht, überleg mal, ob nicht vielleicht du falsch liegst

Alles klar, wenn nicht, nach der gemeinsamen Analyse deiner Teststellung werden wir einander sicher besser verstehen,
lass uns zu deiner Einzelstellung wechseln...
Parent - - By Frank Sanders Date 2023-01-16 11:06
Nein, das Prinzip von Mosca hatte ich schon verstanden. Das interessante an diesem Ansatz ist, dass folgende Idee dahinter steckt:

"Ein Zug ist dann gut, wenn ihn Stockfish (LC0) spielt, oder wenn er im MultiPV Modus in der Bewertung nicht sehr weit vom gespielten Zug entfernt ist. Je weiter er entfernt ist umso schlechter ist er."

Das heißt, hier spielt die menschliche Analyse keine Rolle für die Vergabe von Punkten mehr. Das lässt sich sehr gut automatisieren und man könnte dann, wie Ed Schröder einmal gemeint hat, Testsets mit zehntausenden (oder noch mehr) Teststellungen generieren.

Die könnte man dann automatisch abarbeiten lassen und Listen erzeugen.

(Und in etwa ist man dann da, wo die Engine - Engine Tester schon heute sind).

Vielleicht überlege ich mir das, und schreibe ein Programm das das kann.
Parent - By Peter Martan Date 2023-01-16 12:27 Edited 2023-01-16 13:05
Frank Sanders schrieb:

Vielleicht überlege ich mir das, und schreibe ein Programm das das kann.

Die vollautomatisch Methode ist die eine, aber eigentlich nicht meine. Weil einerseits ist der Similarity- Test, den das ja dann eigentlich darstellt, nur für die eine Engine, mit der man ihn macht bzwl. machen lässt, gültig, und zweitens hab' ich mir halt nicht deshalb die Arbeit angetan, die Stellungen alle noch einmal zu durchkämmen nach denen, dir mir nicht geeignet genug schienen (immerhin sind von 1500 im 888- Set nur 594 übrig geblieben, auch im neuen 1111er nur die, der ganze STS ist nur im 2048er drin und eigentlich, je mehr ich herumprobiere, umso mehr geben mir die Ergebnisse recht, dass das mehr an Hardware- Zeit nicht durch ein Mehr an Diskrimination und weniger an error bar belohnt wird sondern im Gegenteil. Es sind halt mehr Stellungen, das macht mehr her, aber die Ergebnisse "gefallen" mir bei den 888 und den 1111 besser) und alle Punkte manuell in den .epd- Strings auszubessern, sondern das hatte den Sinn, Stellungen nach ihrer "Schwierigkeit" und ihrer Ein- oder Merdeutigkeit und danach, wie nahe sie dem Endspiel oder der Eröffnung waren zu unterscheiden nach meinen persönlichen Einschätzungen, dadurch auch, was die Evals und ganz selten auch die Sortierungen anging, etwas Engine- unabhängiger zu machen, natürlich um den Preis, sie damit mehr von meinen eigenen persönlichen Einschätzungen (abhängig werden zu lassen). Wie gesagt schon allein dadurch, dass ich bei zu geringen Unterschieden gleich lauter gleich wenige Punkte pro Zug gab und vor allem durch ein verschieden hohes Niveau für Eret, Arasan, STS und UHO im Block und zusätzlich von den einzelnen Stellungen zueinander.
Eigentlich war das Ganze eine ziemliche Heidenarbeit, auch wenn ich die Stellungen alle schon kannte (Eret und Arasan sowieso, aber auch den STS hab' ich schon in grauer Vorzeit, lange vor MEA, einmal für mich persönlich adaptiert. Dass die Stellungen hingegen alle schon vorhanden waren, das half natürlich andererseits wiederum enorm

Und das aber auch noch: die MEA- Suiten dienen mir zum Brückenschlag zwischen Taktik und game playing, aber wenn mich die taktischen Fähigkeiten "allein" (sind ja bei Engines wie gesagt eh nicht von irgendetwas Anderem trennbar) interessieren, insbesondere auch, was dazu gedachte Branches und Settings angeht, dann werfe ich immer noch zuerst die 256 an

https://www.dropbox.com/s/lpg29zoyvh03dza/256.epd?dl=0

, weil die sind zwar auch für eine TC von 5"/Stellung SMP selektiert, aber sie sind doch ca. zur Hälfte aus wirklich schweren single best move positions rekrutiert und insgesamt haben sie alle ihre Eindeutigkeit in den Lösungen.

Für die ganz schweren allein gibt's immer noch die 128 (überhaupt in Suite- Zeit lösbaren)

https://www.dropbox.com/s/804b7chwli13laf/1284.epd?dl=0

für 15". Und von diesen beiden Suiten hab' ich halt auch schon die ziemlich lang immer wieder aktualisierten EloStatTS- Listen. Beide Tests brauchen allein deutlich länger als einer der MEA- Runs, aber dafür hat man halt schon die speziellere Aussage und man "durchschaut" die taktischen Stellungen besser, hat sie auch so ziemlich alle schon öfter und länger analysiert, aberso schwer sie auch für Menschen und hin und wieder auch noch für Engines sind, eigentlich sind sie mit den forcierten taktischen Abspielen ja immer noch "leichter" "lösbar" in dem Sinn, dass man wenigstens einzelne möglichst alleinige Lösungszüge kennt und als solche beweisen kann. Bei Eröffnungsstellungen und anderen "positionellen", unforcierten kennt man die meistens nicht oder nicht so genau.
Parent - By Frank Sanders Date 2023-01-15 20:18
Zitat:
Denn jede Stellung müsste tatsächlich
in einem zeitaufwändigen Verfahren durch die Programme mit menschlicher Hilfe selbst auf deren
Richtigkeit geprüft werden. Dies deshalb, weil die menschlichen Spieler nur so beim Hinsehen keine
korrekten Schlussfolgerungen zu tun imstande sind. Fazit (für mich): Eine solche Testsuite dürfte
es in den nächsten Jahren kaum geben ... oder willst du dich an die Arbeit machen?!


Da bin ich deiner Meinung. Aber ich muss es ja nicht so bierernst machen. Ein Hobby soll auch Freude machen.
Parent - - By Stefan Kleinert Date 2023-01-17 14:00 Upvotes 2
Seit es kommerzielle Schachcomputer, und Schachprogramme gibt denken sehr viele das man mit Stellungstest die Spielstärke der Programme einordnen kann.

Es gibt sogar Schachfreunde, die es nach über 20 Jahren nicht verstanden haben das man die Spielstärke nicht anhand einer einzigen Stellung festmachen kann . Die Ergebnisse von Stellungstest sind

dazu auch noch Zufall da es bei einer Wiederholung des Testes zu einem anderen Ergebnis kommen kann . Ein weiteres Problem was bis jetzt wohl nur wenigen aufgefallen ist das die CB GUI

Stellungen als gelöst bewertet, obwohl der Lösungszug am Ende vor Ablauf der Zeit wieder verworfen wurde. Den Bug hat oder hatte die GUI viele Jahre , wahrscheinlich hat sich daran auch nichts geändert
Parent - - By Walter Eigenmann Date 2023-01-18 11:28 Edited 2023-01-18 12:19 Upvotes 2
Stefan Kleinert schrieb:

Seit es kommerzielle Schachcomputer, und Schachprogramme gibt denken sehr viele das man mit Stellungstest die Spielstärke der Programme einordnen kann.

Um sieben Ecken herum hast du recht: Seit über 20 Jahren werden immer die gleichen Behauptungen gegenüber der Methode Stellungstest aufgestellt - und immer noch sind sie falsch:

Stefan Kleinert schrieb:
Es gibt sogar Schachfreunde, die es nach über 20 Jahren nicht verstanden haben das man die Spielstärke nicht anhand einer einzigen Stellung festmachen kann.
Nope - ich kenne keinen ernstzunehmenden "Schachfreund", der solchen Unsinn behauptet.

Stefan Kleinert schrieb:
Die Ergebnisse von Stellungstest sind dazu auch noch Zufall, da es bei einer Wiederholung des Testes zu einem anderen Ergebnis kommen kann.
Nö - auch im MP- und NN-Zeitalter werden bei einer umfangreichen,
mit genügend repräsentativen Aufgaben bestückten Testreihe die starken Programme immer im oberen, die schlechteren immer in den unteren Vierteln rangieren.
Natürlich sind im MP-Betrieb nicht-deterministische Fluktuationen nicht auszuschließen. Aber erstens hält sich dieses Phänomen sehr in Grenzen,
das wird immer überschätzt. Und wer zweitens ganz sicher gehen will, testet im 1-CPU-Modus, wiederholt den Test 10x und mittelt dann die Zeit-Ergebnisse.
Mehr darüber hier: https://glarean-magazin.ch/2017/03/05/computerschach-testaufgaben-engines-eigenmann-rapid-engine-test-eret/#Relationen-entscheiden-nicht-absolute-Zahlen

Es ist absolut unmöglich, dass bei einem umfangreichen und vielfältig diversifizierten Stellungstest ein Top-Five-Programm bei den "offiziellen" Playing-Rankings
nicht auch beim Test unter den ersten Fünf landet. Eine Schachpartie ist ein einziger Stellungstest - nur mit weniger Schlüsselpositionen.

Stefan Kleinert schrieb:
Ein weiteres Problem was bis jetzt wohl nur wenigen aufgefallen ist das die CB GUI Stellungen als gelöst bewertet, obwohl der Lösungszug am Ende vor Ablauf der Zeit wieder verworfen wurde. Den Bug hat oder hatte die GUI viele Jahre, wahrscheinlich hat sich daran auch nichts geändert
Njet - falls das überhaupt jemals vorkam, dann m.W. nicht mehr in den letzten 15 "Fritz"-Jahren. Kannst du hier ein paar Beweis-Stellungen zeigen für diese Behauptung?
Womit ich meinerseits nicht behaupten will, dass das Test-Feature bei Fritzi nicht noch ausbaufähig ist, da gibt's noch einige "Nices-To-Have"...

Kurzum: Bitte nicht altes dummes Zeug aufwärmen, nur weil es Spass macht

Ich persönlich entscheide aufgrund von privaten Stellungstests - sie dauern total ca. 60 Minuten -, ob sich die nähere Beschäftigung mit einem neuen Programm (bzw. Derivat) lohnt oder nicht.
Bis jetzt haben dann jeweils ein paar Tage später die "offiziellen" Engine-Turnier-Rankings diese meine Befunde immer verifiziert...

Stünde ich vor der Wahl, entweder mit einem guten Stellungstest - ok, viele sind nicht gut... - oder mit 10'000 ausgespielten Games das Ranking von Engines bestimmen zu müssen,
ich nähme den Stellungstest und wüsste mich nicht nur auf der viel schnelleren, sondern auch auf der ziemlich zuverlässigen Seite.
Was wiederum nichts gegen CCRL & Co. sagen will; deren Bemühungen weiß ich sehr zu schätzen, und ihre Partien durchforste ich regelmäßig.
Und sei es nur, um neue Stellungen für den nächsten Test aufzuspüren...

.
Parent - - By Stefan Kleinert Date 2023-01-18 19:19 Upvotes 1
Walter Eigenmann schrieb:

Stefan Kleinert schrieb:

Seit es kommerzielle Schachcomputer, und Schachprogramme gibt denken sehr viele das man mit Stellungstest die Spielstärke der Programme einordnen kann.

Um sieben Ecken herum hast du recht: Seit über 20 Jahren werden immer die gleichen Behauptungen gegenüber der Methode Stellungstest aufgestellt - und immer noch sind sie falsch:

Stefan Kleinert schrieb:
Es gibt sogar Schachfreunde, die es nach über 20 Jahren nicht verstanden haben das man die Spielstärke nicht anhand einer einzigen Stellung festmachen kann.
Nope - ich kenne keinen ernstzunehmenden "Schachfreund", der solchen Unsinn behauptet.

Stefan Kleinert schrieb:
Die Ergebnisse von Stellungstest sind dazu auch noch Zufall, da es bei einer Wiederholung des Testes zu einem anderen Ergebnis kommen kann.
Nö - auch im MP- und NN-Zeitalter werden bei einer umfangreichen,
mit genügend repräsentativen Aufgaben bestückten Testreihe die starken Programme immer im oberen, die schlechteren immer in den unteren Vierteln rangieren.
Natürlich sind im MP-Betrieb nicht-deterministische Fluktuationen nicht auszuschließen. Aber erstens hält sich dieses Phänomen sehr in Grenzen,
das wird immer überschätzt. Und wer zweitens ganz sicher gehen will, testet im 1-CPU-Modus, wiederholt den Test 10x und mittelt dann die Zeit-Ergebnisse.
Mehr darüber hier: <a class='ura' href='https://glarean-magazin.ch/2017/03/05/computerschach-testaufgaben-engines-eigenmann-rapid-engine-test-eret/#Relationen-entscheiden-nicht-absolute-Zahlen'>https://glarean-magazin.ch/2017/03/05/computerschach-testaufgaben-engines-eigenmann-rapid-engine-test-eret/#Relationen-entscheiden-nicht-absolute-Zahlen</a>

Es ist absolut unmöglich, dass bei einem umfangreichen und vielfältig diversifizierten Stellungstest ein Top-Five-Programm bei den "offiziellen" Playing-Rankings
nicht auch beim Test unter den ersten Fünf landet. Eine Schachpartie ist ein einziger Stellungstest - nur mit weniger Schlüsselpositionen.

Stefan Kleinert schrieb:
Ein weiteres Problem was bis jetzt wohl nur wenigen aufgefallen ist das die CB GUI Stellungen als gelöst bewertet, obwohl der Lösungszug am Ende vor Ablauf der Zeit wieder verworfen wurde. Den Bug hat oder hatte die GUI viele Jahre, wahrscheinlich hat sich daran auch nichts geändert
Njet - falls das überhaupt jemals vorkam, dann m.W. nicht mehr in den letzten 15 "Fritz"-Jahren. Kannst du hier ein paar Beweis-Stellungen zeigen für diese Behauptung?
Womit ich meinerseits nicht behaupten will, dass das Test-Feature bei Fritzi nicht noch ausbaufähig ist, da gibt's noch einige "Nices-To-Have"...

Kurzum: Bitte nicht altes dummes Zeug aufwärmen, nur weil es Spass macht

Ich persönlich entscheide aufgrund von privaten Stellungstests - sie dauern total ca. 60 Minuten -, ob sich die nähere Beschäftigung mit einem neuen Programm (bzw. Derivat) lohnt oder nicht.
Bis jetzt haben dann jeweils ein paar Tage später die "offiziellen" Engine-Turnier-Rankings diese meine Befunde immer verifiziert...

Stünde ich vor der Wahl, entweder mit einem guten Stellungstest - ok, viele sind nicht gut... - oder mit 10'000 ausgespielten Games das Ranking von Engines bestimmen zu müssen,
ich nähme den Stellungstest und wüsste mich nicht nur auf der viel schnelleren, sondern auch auf der ziemlich zuverlässigen Seite.
Was wiederum nichts gegen CCRL & Co. sagen will; deren Bemühungen weiß ich sehr zu schätzen, und ihre Partien durchforste ich regelmäßig.
Und sei es nur, um neue Stellungen für den nächsten Test aufzuspüren...


Ich wärme hier nichts auf den Fehler hatte die 13er GUI schon , du wirst mit Sicherheit nicht bei jedem Test die ganze Zeit vor der GUI sitzen um das ganze zu kontrollieren.

60 Min vor dem PC  zu sitzen und das ganze mit einem Video zu beweisen darauf habe ich keine Lust. Und so wie es aussieht, ist es dir bei der alten GUI nicht aufgefallen und all deine Tests sind damit für die Katz

Was einzelne Stellungen angeht, konnte Eduard anhand von einer Stellung sehen wie gut oder wie schlecht ein Programm spielt...und das macht er nach über 20 Jahren immer noch

Ich selbst habe um die 20 Jahre Engines getestet und die Ergebnisse mit Stellungstests verglichen. Engines die gut Stellungen lösten fanden sich oft am Tabellenende wieder.

Mit eigenen Stellungen und Vorbestellungen habe ich auch getestet , mir ging es immer darum die Engine zu finden die zu derzeit am besten spielte um gute Ergebnisse bei Turnieren zu erzielen, jeder der mich länger kennt weiß dass das sehr gut funktioniert, hat da ich sehr viele Turniere mit meist völlig unterlegener Hardware gewonnen habe .

Nichts gegen dich aber was das Testen von Engines angeht kannst du mir nichts vormachen.

Was Bugs angeht habe ich mehr Fehler gefunden als so mach anderer Schachfreund , beim ersten Freestyle Schachturnier hätte ich als Zuschauer in jeder Partie Züge ausführen können um so die Partie zu versauen und den ersten Preis zu gewinnen !

Ein weiter Bug war das man mit der Fritz 7 oder 8 GUI sich mit einer Engine im großen Saal einloggen konnte und sie so unsichtbar gegen menschliche Gegner spielte , den Spaß hatte ich mir damals gemacht um zu testen ob die Software die Nutzung einer Engine erkennt , satte 60 Partien in 3 bis 4 Tagen dauerte es damals bis man meinen Wertungen gelöscht hatte.

Aber jetzt gibt es natürlich keine Fehler mehr in der CB GUI weil sie mittlerweile Perfekt funktioniert .

Mit deinem Test kannst du die guten von den grottenschlechten unterscheiden, mehr aber auch nicht .

Viel Spaß beim unsinngen weiteren testen mit der CB  GUI die wie eine Wundertüte funktionier 
Parent - - By Walter Eigenmann Date 2023-01-19 11:07 Upvotes 1
Stefan Kleinert schrieb:
Ich selbst habe um die 20 Jahre Engines getestet und die Ergebnisse mit Stellungstests verglichen. Engines die gut Stellungen lösten fanden sich oft am Tabellenende wieder.
Welche Stellungstests hast du verglichen?

Stefan Kleinert schrieb:
Mit deinem Test kannst du die guten von den grottenschlechten unterscheiden, mehr aber auch nicht.
Ich habe seinerzeit (vor sechs Jahren) nach Erscheinen des ERET dessen Resultate den damals aktuellen Playing-Rankings gegenübergestellt und erhalten:



Natürlich ist der ERET nun (im NN-Zeitalter) nicht mehr State of the Art - interessant wäre allenfalls noch eine Testzeit von z.B. 2sec./Zug mit anschliessendem Vergleich zu den CCRL-Rankings u.a.

Stefan Kleinert schrieb:
Viel Spaß beim unsinngen weiteren testen mit der CB  GUI die wie eine Wundertüte funktionier 
Ich beobachte meine Stellungstests auch unter Fritz immer genau; dessen Ergebnisse lassen sich sehr gut mit Shredder und Arena reproduzieren (auch wenn deren unterschiedlichen Test-Settings zuweilen, aber vernachlässigbar selten zu Abweichungen führen können).

Es bleibt also dabei: Solange du hier deine Behauptungen nicht mit einigen Stellungen beweisen kannst, so dass wir diese anschliessend mit div. Fritzis reproduzieren könnten - aber bitte mit dessen Versionen aus den letzten zehn Jahren, nicht mit Uralt-Versionen... -, solange sind wir gezwungen, deine Unterstellungen unter der Rubrik "Sinnfreies CB-Bashing" abzuhaken.

.
Parent - - By Lothar Jung Date 2023-01-19 11:18 Upvotes 2
Die Aussagen von Kleinert sind ohne jeglichen Respekt und schachlicher Expertise.
Parent - By Rainer Neuhäusler Date 2023-01-20 22:35
Lothar Jung schrieb:

Die Aussagen von Kleinert sind ohne jeglichen Respekt und schachlicher Expertise.

Ja, schon. Wer angesichts des oben gezeigten Ranglistenvergleiches die ERET-Resultate Meister Zufall in die Schuhe schiebt und die Suite höchstens zur Unterscheidung von "guten und grottenschlechten" Engines als tauglich erachtet, ist fürwahr ein Weltmeister im Wegschauen. Eine derartig hohe Korrelation bzw. Konkordanz von Ranglisten ist in der Tat erstaunlich. Das sind Traumquoten. Kannst du berechnen wie sich der statistische Zusammenhang hier als Koeffizient präsentiert? Pearson, Spearman, Kendall etc.

Gibt es entsprechende Befunde aus neuerer Zeit ? Ein Vergleich, wie sich die Situation bei den führenden Engines heute darstellt, wäre sehr interessant. Ich werde mir das vornehmen, aber das dauert und dauert... Außerdem kann ich natürlich nicht mit jener Hardware konkurrieren, die hier der eine oder andere mehr oder weniger auffällig durchblicken lässt. Vielleicht bringt Walter in nicht allzu ferner Zukunft ja auch ein Update.

Wie schaut es bei dir aus, mit dem ERET-Testlauf von ca. 20 Engines, meine ich? Du hast zwar den "Arsch voll Arbeit", wie du selbst bemerkst, aber demnach wäre ja das Gehirn noch frei !? (Danke für diese Steilvorlage)

Stolze Windows und Apple-Leute mit viel diskutierter und neuester Laptop- oder PC-Ausrüstung, RTX-Krösusse und natürlich auch normale Nutzer mit gut bürgerlichem Elekro- oder Supermarkt Equipment sind herzlich dazu eingeladen, den derzeitigen Stand des gerne benutzten ERET zu verifizieren.
.
- By Peter Martan Date 2023-01-15 09:14 Edited 2023-01-15 09:28
Obwohl ich eigentlich nicht glaube, dass das wirklich die Absicht hinter der Erstellung dieses Threads hier war, weil's aber andererseits für den Fall reinpasst, dass doch, oder dass Andere daran wirklich praktisches Interesse haben, hier

http://talkchess.com/forum3/viewtopic.php?f=2&t=81349

hab' ich die Sache, wie im CCC auch schon öfters in der letzten Zeit, mal wieder dort angesprochen.

Aus dem Posting vom Link, damit man nicht das alles auch noch dort lesen muss, was hier ohnehin schon großteils (immer wieder ) beschrieben wurde, das wesentlich Neue ist diese Sammlung

https://www.dropbox.com/s/o5nbi5svwyqji2x/1111.epd?dl=0

, zu der ich auch im CCC jetzt den Link gepostet habe, die ein weiteres Mittelding zwischen taktischen und "strategischen" Test- Suiten darstellt. Die 594 nicht allzu leichten STS- Stellungen mit anderen kombiniert, wie ich's im Posting direkt über diesem hier gerade genauer geschildert habe.
Aus Stefan Pohls UHO 6mvs- Set sind jetzt ca. 250 drin, außer denen, die schon nach den 6 Zügen als .epds in MEA- Syntax erzeugt waren, kommen jetzt mal versuchsweise noch ca. 50 dazu mit den Stellungen schon nach 5 Zügen weiterer solcher Lines.
- By Peter Martan Date 2023-01-15 14:30
Und nur für den immer unwahrscheinlicher scheinenden Fall, dass das doch auch außer mir sonst noch jemanden interessieren könnte, hier erste Resultate mit der neuen 1111- Suite:
https://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=160893#pid160893
- - By Peter Martan Date 2023-01-17 13:29 Edited 2023-01-17 13:39
Einen hab' ich noch, einen hab' ich noch

Es zeigt sich, dass es noch näher an die Ergebnisse aus dem game playing herankommt, Eret rauszunehmen und durch UHO zu ersetzen.

999:

https://www.dropbox.com/s/fdnbo837wmzsof7/999.epd?dl=0

Natürlich ist das Ganze (wie alles derartige) immer noch sehr von der Hardware- Zeit abhängig, aber erstmalig kommt LC0 mit "nur" dem 3/2- fachen der Zeit von SF über das, was der single threaded schafft:

    EPD  : epd\999.epd
    Time : 200 - 500ms
                                                Max   Total   Time   Hash         
    Engine           Score   Found  Pos   ELO  Score   Rate    ms     Mb  Cpu     
1  SF230114          9700    868   999  3901  11184  86.7%    200     8    8
2  ShashChess27.1GD  9634    859   999  3874  11184  86.1%    200     8    8
3  SF15              9524    856   999  3834  11184  85.2%    200     8    8
4  lc0dag0.30-BT2    9346    826   999  3762  11184  83.6%    500     2    2
5  lc0dag0.30-BT2    9029    799   999  3631  11184  80.7%    300     1    1
6  ShashChess27.1    9007    805   999  3622  11184  80.5%    200     1    1
7  SF15              8920    806   999  3591  11184  79.8%    200     1    1
8  SF230114          8832    811   999  3555  11184  79.0%    200     1    1


Und weil die Zahl der Stellungen allein zu wenig werbewirksam ist, soll das Ganze jetzt auch einen einprägsamen Namen haben:

ARASTSUHO- MEA- Suite


Sagt aber auch wirklich alles, was drin ist: Arasan 2021- Suite (mit 200 leicht und zahlreich genug an reinen single best move Taktik- Aufgaben für VSTC) STS neu (auf die am ehesten auch als single best move- Stellungen verwendbaren 594 daraus reduziert) und 250 UHO aus dem 6mvs- Set mit dem größten Vorteil einer Seite von den Sammlungen, die Stefan Pohl zum Download anbietet.

Habe erstmal fertig.
Parent - - By Lothar Jung Date 2023-01-17 14:18 Edited 2023-01-17 14:25
Es grüßt aus dem Tal, der Rheinländer,

Peter drei Wünsche:

1. Lc0 braucht 2 Threads.

2. Lc0 benutzt keinen Hash, sondern den NNcache, den Du auf 8 GB setzen solltest.

3. Die Latenz ist bei GPU (PCI Bus) deutlich höher als bei CPU. 300 ms ist zu niedrig, 500 ms geht.

Lothar

PS: Ich würde die Liste nur mit 8 CPU erstellen. Das ist wirklichkeitsnäher.
Up Topic Hauptforen / CSS-Forum / Spielstärke- oder Spielschwächetetests
1 2 Previous Next  

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill