Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / @Jörg Oster
- - By Tom Paul Date 2014-01-22 17:18
Woher wisst ihr ob 3fold_fix erfolgreich ist oder nicht, wenn das gegen Master getestet wird?
Wenn es funktioniert, dann gibt es gleich viele Siege und Niederlagen und eine niedrigere Remisquote.
Wenn es nicht funktioniert, dann gibt es gleich viele Siege und Niederlagen und eine höhere Remisquote.
Also an der Remisquote ablesen?
Oder müsste man dann nicht Stockfish mit und ohne 3fold_fix gegen eine schwächere Engine testen?
Parent - - By Michael Scheidl Date 2014-01-22 17:43
Andere Frage: Warum ist das nicht vollkommen wurscht?
Parent - - By Stefan Schiffermüller Date 2014-01-22 18:51
Michael Scheidl schrieb:

Andere Frage: Warum ist das nicht vollkommen wurscht?


Ich finde den Gedanken von Tom Paul nicht wurscht. Ich hatte den selben Gedanken.
Parent - By Michael Scheidl Date 2014-01-23 10:19
Mir eigentlich auch nicht (mehr), nachdem ich einen Blick auf den Chessprogramming-Wiki-Artikel geworfen habe. Die Sache scheint viel komplizierter zu sein als ich gedacht habe. Ich hatte "a priori" angenommen daß so eine verbesserte Remisbewertung, wie von Jörg gezeigt, eigentlich nur gut sein kann. Vermeidet fälschliche 0.00-Bewertungen. Daß das evtl. sogar Elos kostet, leuchtet mir spontan nicht ein, aber ich habe die zahlreichen Forenpostings die im Artikel aufgeführt sind, nicht gelesen...
Parent - - By Jörg Oster Date 2014-01-22 18:48
Dieser Patch ändert nur, ab wann SF eine Stellungswiederholung als Remis bewertet.
Im Moment erkennt SF in dieser Stellung das Matt nicht, wenn man Kf6 vorgibt. Weil der richtige Zug Kh6 ist, muss Weiß mit dem König zurück nach g6, und damit kommt es zur ersten Stellungswiederholung, welche SF derzeit mit Remis bewertet.



Also: position fen 6k1/8/6K1/6P1/8/8/8/8 w - - 0 1 moves g6f6
SF normal:
Code:
info depth 25 seldepth 8 score cp 0 nodes 30278 nps 917515 time 33 multipv 1 pv g8h7 f6f7 h7h8 f7f8 h8h7 g5g6 h7g6
info nodes 30278 time 33


SF mit Patch:
Code:
info depth 25 seldepth 29 score cp -8929 nodes 210067 nps 2258784 time 93 multipv 1 pv g8h7 f6f7 h7h8 f7g6 h8g8 g6h6 g8f7 g5g6 f7f8 h6h7 f8e7 g6g7 e7d6 g7g8q d6c5 h7g6 c5b5 g6f6 b5b4 f6e5 b4c3 e5e4 c3b4 e4d4 b4b5 g8c4 b5a5 d4e5 a5b6 c4d5 b6a7 e5e4 a7b6 e4d4 b6c7 d4e5 c7b6 e5d4
info nodes 210067 time 93


Sehr wahrscheinlich führt dieser Patch aber zu einer Elo-Schwächung, was mit den 40.000 Spielen überprüft werden soll.
Parent - - By Tom Paul Date 2014-01-22 19:08
Also versuchst du Stockfish die erste Stellungswiederholung mit der richtigen Bewertung beizubringen und diese nicht remis zu werten?
Das ist auch richtig so.
Stockfish sollte immer dann eine Stellungswiederholung als remis werten, wenn 3-Fold Rep geschehen!!! ist und sonst nie.
Warum glaubst du das es zu einer ELO-Schwächung kommt?

Sonst lässt man Stockfish mit weiß diese Stellung 10000x spielen, immer mit Kf6 zuerst und Stockfish wird 10000x gewinnen, nur gibt es hier einige die immer argumentieren, dass die erste Stellungswiederholung schon remis ist, weil dem Weißspieler nichts besseres eingefallen ist und somit die 0.00 Bewertung richtig ist, selbst wenn sie wie in diesem Fall 10000x gegen den Weißspieler verlieren werden.
Parent - By Jörg Oster Date 2014-01-22 19:26
Weil das keine neue Idee von mir ist, sondern eine altbekannte.
Das wurde früher schon mal versucht in Stockfish, führte aber leider zu einer Schwächung.

Lies dir das hier mal durch https://chessprogramming.wikispaces.com/Repetitions
dann wird dir vielleicht manches klarer.
Parent - By Benno Hartwig Date 2014-01-23 11:02

> Stockfish sollte immer dann eine Stellungswiederholung als remis werten, wenn 3-Fold Rep geschehen!!! ist und sonst nie.


Ich bin aber schon überzeugt, dass es gar nicht so seltene Fälle gibt, wo das deutlich nachteilig wäre.
Fälle in denen freiwillig in eine unvorteilhafte Stellung gegangen wird, obwohl eine andere zu erreichen wäre, in der deinem Gegner schon mal nichts eingefallen ist. Da gibst du ihm dann ganz neue vorteilhafte Chancen, obwohl du das gar nicht nötig hattest.
Die Information zu einer Stellung "Sie mag zwar nicht schön aussehen, aber meinem Gegner fiel dazu beim ersten Versuch rein gar nichts ein!" sollte meiner Meinung nach unbedingt in die Bewertung einfließen.  Ob wirklich mit einer echten '0'-Bewertung, kann ja diskutiert werden.

Benno
Parent - - By Tom Paul Date 2014-01-22 19:17 Edited 2014-01-22 19:22
Kann man da nicht einfach Code schreiben:
Wenn man 3-Fold Rep erzwingen kann oder wenn 3-Fold Rep gespielt wurde
-> Remis 0.00
Bei 2-Fold Rep
-> kein Remis
-> es sei denn 3-Fold Rep wird erzwungen.
Gibt es nicht schon seit langem andere Engines die die korrekte Bewertung anzeigen?
Vielleicht gibt es einen Fehler irgendwo im gesamten Code der deinen Test negativ ausfallen lässt.

Kannst du einen Code schreiben der 3-Fold Rep vermeidet, wenn ein anderer 0.00 Zug spielbar ist?
Parent - - By Jörg Oster Date 2014-01-22 19:29
Tom Paul schrieb:

Kannst du einen Code schreiben der 3-Fold Rep vermeidet, wenn ein anderer 0.00 Zug spielbar ist?

Nein, kann icht nicht.
Parent - By Tom Paul Date 2014-01-25 15:44
23-01-14  jo  3fold_fix  diff 
ELO: -0.88 +-2.1 (95%) LOS: 20.1%
Total: 40000 W: 7241 L: 7342 D: 25417
40000 @ 15+0.05 th 1  Fix 3-fold repetition, take 5. Common implementation like everybody else does.

Mit 101 Niederlagen mehr als Siege hat es leider nicht geklappt, oder kann man hier von Zufall sprechen?
Vielleicht fällt hier jemandem noch ein Verbesserungsvorschlag ein.
Was ist jetzt eigentlich wichtiger -0.88 ELO weniger und eine korrekte Angabe, auch im Hinblick auf Eröffnungsbücher oder lieber keine -0.88 ELO weniger und dafür falsche Angaben und Eröffnungsbücher?
Parent - - By Benno Hartwig Date 2014-01-23 12:48
Tom Paul schrieb:
Bei 2-Fold Rep
-> kein Remis
-> es sei denn 3-Fold Rep wird erzwungen.
Aber das will man (ich zumindest) doch nicht.
Wenn ich durch eine miese -2,00-Stellung durch musste und meinem Gegner dann aber nichts besseres einfiel, als mich etwas später etscheiden zu lassen, ob ich erneut in diese Stellung gehe oder stattdessen eine nur wenig bessere -1,50-Stellung nehme, dann würde zumindest ich mir überlegen wollen:
"Die -1,50-Stellung ist schon blöd, und mit ziemlich großer Wahrscheinlichkeit verliere ich dann. "
und
"Die -2,00-Stellung sieht auf den ersten Blick noch blöder aus, aber mein Gegner hat beim ersten Versuch trotz all seiner Anstrengungen rein gar nichts daraus machen können. "

Ich würde diese zweite Stellung dann im Minimax nicht mit -2,00 bewerten wollen, sondern besser.
Vielleicht sollte es nicht 0,00 sein, aber vielleicht (aus dem Bauch heraus) -1,00.
Und dann könnte darin schon eine bessere Alternative als die -1,50-Lösung sein, und eine schlechter als z.B. eine -0,50-Alternative.

Bei der Realisierung muss dann also zwischen der 1. und der 2. Wiederholung unterschieden werden.

Benno
Parent - By Tom Paul Date 2014-02-14 11:18
@Jorg Oster,

13-02-14  jo  repfix  diff 
ELO: 1.64 +-2.1 (95%) LOS: 94.0%
Total: 39143 W: 7197 L: 7012 D: 24934
40000 @ 15+0.05 th 1  Final try to reduce early draws. First measure the impact on performance and draw rate.

Wie hast du das hinbekommen?
Parent - - By Hans Neumann Date 2014-02-14 11:30
Die Stockfish-Version vom 2014-02-12
(kompiliert als 32-Bit SSE2 mit MVS 2013 Express)

findet +M14 1.Kh6 sofort.

Code:

FEN: 6k1/8/6K1/6P1/8/8/8/8 w - - 0 1

SF4x13 2014-02-12:
1/1  00:00   7  4k  +51,82  1.Kf6
2/2  00:00   41  21k  +51,82  1.Kf6 Kh7
3/4  00:00   99  50k  +51,83  1.Kh6 Kf8 2.g6
4/4  00:00   168  84k  +51,83  1.Kh6 Kf8 2.g6 Ke7 3.g7
5/6  00:00   297  149k  +51,83  1.Kh6 Kf7 2.g6+ Kf8 3.Kh7 Ke7
6/7  00:00   496  248k  +51,83  1.Kh6 Kf7 2.g6+ Kf8 3.Kh7 Ke7 4.g7
7/8  00:00   973  324k  +63,59  1.Kh6 Kf7 2.g6+ Ke6 3.Kh7 Kd5 4.g7 Kc5 5.g8D
8/10  00:00   2k  583k  +63,69  1.Kh6 Kf7 2.g6+ Ke6 3.g7 Kd5 4.g8D+ Kc5 5.Kg5 Kb5
9/12  00:00   2k  594k  +63,69  1.Kh6 Kf7 2.g6+ Kf8 3.Kh7 Ke7 4.g7 Kd6 5.Kg6 Kc5 6.g8D Kb5
10/12  00:00   3k  709k  +63,69  1.Kh6 Kf7 2.g6+ Kf8 3.Kh7 Ke7 4.g7 Kd6 5.Kg6 Kc5 6.g8D Kb5
11/13  00:00   4k  899k  +63,79  1.Kh6 Kf7 2.g6+ Kf8 3.Kh7 Ke7 4.g7 Kd6 5.Kg6 Kc5 6.Kf5 Kb5 7.g8D
12/13  00:00   6k  855k  +63,79  1.Kh6 Kf7 2.g6+ Kf8 3.Kh7 Ke7 4.g7 Kd6 5.Kg6 Kc5 6.Kf5 Kb5 7.g8D
13/15  00:00   9k  958k  +63,84  1.Kh6 Kf7 2.g6+ Kf8 3.Kh7 Ke7 4.g7 Kd6 5.Kg6 Kc5 6.Kf5 Kd5 7.g8D+ Kd4 8.Kf4
14/16  00:00   13k  1.073k  +63,84  1.Kh6 Kf7 2.g6+ Kf8 3.Kh7 Ke7 4.g7 Kd6 5.Kg6 Kc5 6.Kf5 Kd5 7.g8D+ Kd4 8.Kf4 Kc3 9.Kf5
15/17  00:00   19k  1.163k  +63,89  1.Kh6 Kf7 2.g6+ Kf8 3.Kh7 Ke7 4.g7 Kd6 5.Kg6 Kc5 6.Kf5 Kd5 7.g8D+ Kd4 8.Kf4 Kc5 9.Ke4 Kb5 10.Kf4 Kc5
16/18  00:00   31k  1.293k  +63,89  1.Kh6 Kf7 2.g6+ Kf8 3.Kh7 Ke7 4.g7 Kd6 5.Kg6 Kc5 6.Kf5 Kd5 7.g8D+ Kd4 8.Kf4 Kc5 9.Ke4 Kb5 10.Db3+ Kc5
17/20  00:00   43k  1.402k  +63,89  1.Kh6 Kf7 2.g6+ Kf8 3.Kh7 Ke7 4.g7 Kd6 5.Kg6 Kc5 6.Kf5 Kd5 7.g8D+ Kd4 8.Kf4 Kc5 9.Ke4 Kb5 10.Kd3 Kc5
18/21  00:00   62k  1.384k  +63,89  1.Kh6 Kf7 2.g6+ Kf8 3.Kh7 Ke7 4.g7 Kd6 5.Kg6 Kc5 6.Kf5 Kd5 7.g8D+ Kd4 8.Kf4 Kd3 9.Db3+ Kd4 10.Kf5 Kc5 11.Ke4 Kd6
19/22  00:00   98k  1.398k  +63,99  1.Kh6 Kf7 2.g6+ Kf8 3.Kh7 Ke7 4.g7 Kd6 5.Kg6 Kc5 6.Kf5 Kd5 7.g8D+ Kd4 8.Kf4 Kd3 9.Db3+ Kd4 10.Kf5 Kc5 11.Ke4 Kd6 12.Dd5+ Kc7 13.Dc5+ Kd8 14.Kd5
20/25  00:00   158k  1.402k  +63,99  1.Kh6 Kf7 2.g6+ Kf8 3.Kh7 Ke7 4.g7 Kd6 5.Kg6 Kc5 6.Kf5 Kd5 7.g8D+ Kd4 8.Kf4 Kc5 9.Ke4 Kc6 10.Kd4 Kd6 11.Dg6+ Ke7 12.Kd5 Kd8 13.Dd3
21/25  00:00   228k  1.533k  +64,04  1.Kh6 Kf7 2.g6+ Kf8 3.Kh7 Ke7 4.g7 Kd6 5.Kg6 Kc5 6.Kf5 Kd5 7.g8D+ Kd4 8.Kf4 Kc5 9.Ke4 Kc6 10.De6+ Kc5 11.Dd5+ Kb6 12.Kd4 Kc7 13.Kc5 Kc8 14.Dc4
22/26  00:00   319k  1.801k  +64,04  1.Kh6 Kf7 2.g6+ Kf8 3.Kh7 Ke7 4.g7 Kd6 5.Kg6 Kc5 6.Kf5 Kd5 7.g8D+ Kd4 8.Kf4 Kc5 9.Ke4 Kc6 10.De6+ Kc5 11.Dd5+ Kb6 12.Kd4 Kc7 13.Kc5 Kc8 14.Dc4
23/29  00:00   475k  2.149k  +64,09  1.Kh6 Kf7 2.g6+ Kf8 3.Kh7 Ke7 4.g7 Kd6 5.Kg6 Kc5 6.Kf5 Kd5 7.g8D+ Kd4 8.Kf4 Kc5 9.Ke4 Kc6 10.De6+ Kc5 11.Dd5+ Kb4 12.Kd4 Ka3 13.Dc4 Kb2 14.De6 Kc2
24/29  00:00   798k  2.633k  +64,09  1.Kh6 Kf7 2.g6+ Kf8 3.Kh7 Ke7 4.g7 Kd6 5.Kg6 Kc5 6.Kf5 Kd5 7.g8D+ Kd4 8.Kf4 Kc5 9.Ke4 Kc6 10.De6+ Kb5 11.Kd5 Kb4 12.Kd4 Ka4 13.Kc4 Ka5 14.Kc5
25/30  00:00   1.087k  2.876k  +64,19  1.Kh6 Kf7 2.g6+ Kf8 3.Kh7 Ke7 4.g7 Kd6 5.Kg6 Kc5 6.Kf5 Kd5 7.g8D+ Kd4 8.Kf4 Kc5 9.Ke4 Kc6 10.De6+ Kc5 11.Db3 Kc6 12.Dd5+ Kc7 13.Ke3 Kc8 14.Kd4 Kb8 15.Dd8+ Kb7 16.Kc5
26/31  00:00   1.512k  3.011k  +M19  1.Kh6 Kf7 2.g6+ Kf8 3.Kh7 Ke7 4.g7 Kd6 5.g8D Kc6 6.Kg6 Kc5 7.Kf6 Kc6 8.Kf5 Kc5 9.Ke4 Kd6 10.Dd5+ Kc7 11.Kd4 Kc8 12.Kc4 Kb8 13.Dd8+ Ka7 14.Kd5 Kb7 15.Kc5 Ka7 16.Dd5 Kb8 17.Kb6 Kc8 18.Dd3 Kb8 19.Dd8+
27/34  00:00   1.748k  3.013k  +M17  1.Kh6 Kf7 2.g6+ Kf8 3.Kh7 Ke7 4.g7 Kd6 5.g8D Kc6 6.De6+ Kb5 7.Kg6 Kc5 8.Kf5 Kd4 9.Dc6 Kd3 10.Dd5+ Kc3 11.Ke4 Kc2 12.Dc4+ Kb2 13.Db4+ Ka2 14.Kd5 Ka1 15.Kd4 Ka2 16.Kc3 Ka1 17.Db2+
28/34  00:00   1.965k  3.023k  +M16  1.Kh6 Kf7 2.g6+ Kf8 3.Kh7 Ke7 4.g7 Kd6 5.g8D Kc6 6.Kg6 Kc5 7.De6 Kd4 8.Kf5 Kc5 9.Ke4 Kb4 10.Dd5 Ka3 11.Dc4 Kb2 12.Db4+ Kc2 13.Kd4 Kd1 14.Kd3 Kc1 15.Db7 Kd1 16.Db1+
29/34  00:00   2.347k  3.064k  +M15  1.Kh6 Kf7 2.g6+ Kf8 3.Kh7 Ke7 4.g7 Kd6 5.g8D Kc5 6.Kg6 Kb5 7.Kf5 Kc5 8.Ke5 Kb4 9.Kd4 Kb5 10.Dc4+ Kb6 11.Dc8 Ka7 12.Kd5 Kb6 13.Db8+ Ka5 14.Kc5 Ka4 15.Db4+
30/34  00:00   2.604k  3.086k  +M15  1.Kh6 Kf7 2.g6+ Kf8 3.Kh7 Ke7 4.g7 Kd6 5.g8D Kc5 6.Kg6 Kb5 7.Kf5 Kc5 8.Ke5 Kb4 9.Kd4 Kb5 10.Dc4+ Kb6 11.Dc8 Ka7 12.Kd5 Kb6 13.Db8+ Ka5 14.Kc5 Ka4 15.Db4+
31/34  00:00   3.057k  3.088k  +M15  1.Kh6 Kf7 2.g6+ Kf8 3.Kh7 Ke7 4.g7 Kd6 5.g8D Kc5 6.Kg6 Kd4 7.Kf5 Kc5 8.Ke5 Kb4 9.Kd4 Kb5 10.Dc4+ Kb6 11.Dc8 Ka7 12.Kd5 Kb6 13.Db8+ Ka5 14.Kc5 Ka4 15.Db4+
32/34  00:01   3.555k  3.118k  +M14  1.Kh6 Kf7 2.g6+ Kf8 3.Kh7 Ke7 4.g7 Kd6 5.g8D Kc5 6.Kg6 Kd4 7.Kf5 Kd3 8.Dd5+ Kc3 9.Ke4 Kc2 10.Dc4+ Kb1 11.Db4+ Kc2 12.Ke3 Kc1 13.Kd3 Kd1 14.Dd2+
33/34  00:01   4.092k  3.167k  +M14  1.Kh6 Kf7 2.g6+ Kf8 3.Kh7 Ke7 4.g7 Kd6 5.g8D Kc5 6.Kg6 Kd4 7.Kf5 Kd3 8.Dd5+ Kc3 9.Ke4 Kc2 10.Dc4+ Kb1 11.Db4+ Kc2 12.Ke3 Kc1 13.Kd3 Kd1 14.Dd2+
34/34  00:01   4.596k  3.207k  +M14  1.Kh6 Kf7 2.g6+ Kf8 3.Kh7 Ke7 4.g7 Kd6 5.g8D Kc5 6.Kg6 Kd4 7.Kf5 Kd3 8.Dd5+ Kc3 9.Ke4 Kc2 10.Dc4+ Kb1 11.Db4+ Kc2 12.Ke3 Kc1 13.Kd3 Kd1 14.Dd2+
35/34  00:01   5.434k  3.283k  +M14  1.Kh6 Kf7 2.g6+ Kf8 3.Kh7 Ke7 4.g7 Kd6 5.g8D Kc5 6.Kg6 Kd4 7.Kf5 Kd3 8.Dd5+ Kc3 9.Ke4 Kc2 10.Dc4+ Kb1 11.Db4+ Kc2 12.Ke3 Kc1 13.Kd3 Kd1 14.Dd2+
36/34  00:01   6.369k  3.363k  +M14  1.Kh6 Kf7 2.g6+ Kf8 3.Kh7 Ke7 4.g7 Kd6 5.g8D Kc5 6.Kg6 Kd4 7.Kf5 Kd3 8.Dd5+ Kc3 9.Ke4 Kc2 10.Dc4+ Kb1 11.Db4+ Kc2 12.Ke3 Kc1 13.Kd3 Kd1 14.Dd2+
37/34  00:02   7.393k  3.411k  +M14  1.Kh6 Kf7 2.g6+ Kf8 3.Kh7 Ke7 4.g7 Kd6 5.g8D Kc5 6.Kg6 Kd4 7.Kf5 Kd3 8.Dd5+ Kc3 9.Ke4 Kc2 10.Dc4+ Kb1 11.Db4+ Kc2 12.Ke3 Kc1 13.Kd3 Kd1 14.Dd2+
38/34  00:02   7.840k  3.433k  +M14  1.Kh6 Kf7 2.g6+ Kf8 3.Kh7 Ke7 4.g7 Kd6 5.g8D Kc5 6.Kg6 Kd4 7.Kf5 Kd3 8.Dd5+ Kc3 9.Ke4 Kc2 10.Dc4+ Kb1 11.Db4+ Kc2 12.Ke3 Kc1 13.Kd3 Kd1 14.Dd2+
Bester Zug: Kh6, Wert: +Matt in 14, Tiefe: 38/34, Dauer: 00:02,975, 7.839.910 Knoten, 3.433k



Gruß
Hans
Parent - - By Jörg Oster Date 2014-02-14 15:12
Hallo Hans,

dass er diese Stellung löst, stand nie in Frage.
Das Problem ist, gibt man SF den falschen Zug vor, Kf6, dann muss er wieder nach g6 zurück, was eine Stellungswiederholung ist.
Du musst also schon das in der Konsole bzw. im Terminal so eingeben, wie von mir geschrieben. Oder halt den Zug Kf6 ausführen.

position fen 6k1/8/6K1/6P1/8/8/8/8 w - - 0 1 moves g6f6

Dann gibt SF eine Remisbewertung aus, was natürlich Quatsch ist.
Parent - By Hans Neumann Date 2014-02-14 18:23
Hallo Jörg,

jo stimmt, hab das wohl erst nicht ganz verstanden.

Gruß
Hans
Parent - - By Thomas Plaschke Date 2014-02-14 20:06
Das Problem/Thema hatten wir doch schon vor Urzeiten. Damals wurde Ossi Weiner wüst angegriffen, weil der Richard Lang völlig unfähig war, ein vernünftiges Schachprogramm zu machen.[/Sarkasmus aus]

Mich stört das Verhalten der Programme nicht - im Gegenteil, ich erwarte nichts anderes!

Im normalen Spiel streben sie 3fache Stellungswiederholung - und damit das Remis - nur an, wenn sie keinen besseren Zug finden. Wenn dagegen der Operator eine Zügevorgabe macht und ihnen in der Zugfolge durch eine mutwillige einmalige Stellungswiederholung vormacht, der gemachte Zug aus der konkret vorausgegangenen Stellung sei der beste und nicht besser als remis. - Die Programme gehen schlicht davon aus, dass eine Partie aus einer Abfolge der besten Züge besteht (auch wenn sie nicht von ihnen selbst berechnet wurden). Ist doch plausibel, oder?

Die Programme müssten sonst Vorgabezüge von eigenen (selbst berechneten) unterscheiden.
Ein bisschen viel verlangt, finde ich.

Und wenn man ihnen eine eigene Partie vorgibt, sind die Vorgabezüge wieder nicht selbst berechnet und das Programm müsste sich wieder anders verhalten.
Welchen Nutzen sollte das haben?

Ich freue mich also eher darüber, wenn die Programmierer ihren Programmen genug Intelligenz mitgegeben haben, um Stellungswiederholungen in beliebigen Partieverläufen zu erkennen und ganz ökonomisch als Remis zu bewerten.

Für mich ist das gezeigte Verhalten der Programme daher nur folgerichtig und sollte gar nicht anders sein.

Schöne Grüße
Th. Plaschke
Parent - - By Michael Scheidl Date 2014-02-15 15:54 Edited 2014-02-15 15:58
Zitat:
Die Programme gehen schlicht davon aus, dass eine Partie aus einer Abfolge der besten Züge besteht (auch wenn sie nicht von ihnen selbst berechnet wurden). Ist doch plausibel, oder?

Eigentlich nicht, insbesondere dürfen sie nicht damit rechnen daß der Gegner "unweigerlich" nochmals wiederholen wird, wenn es garnicht erzwungen ist. Eine der ersten Engines die immun gegen eine solche Fata Morgana wurden, war bzw. ist Shredder.

An die Weiner-Story zu diesem Thema kann ich mich dunkel erinnern, habe aber das Partiebeispiel dazu nicht mehr im Kopf. Es war jedenfalls sehr aussagekräftig, und es wäre interessant welche aktuellen Engines immer noch hereinfallen. Ich möchte es mir garnicht ausmalen.
Parent - - By Thomas Plaschke Date 2014-02-16 04:05
Ich hab's gefunden!

CSS 1/89, S. 6f. Anders als Ossi Weiner wollte ein Leser nach der vorgegebenen Zugfolge 1. e3 d6 2. Sf3 Lh3 3. Sg1 Lc8 4. Sf3 dem Mephisto Almeria nicht das Prinzip Hoffnung zugestehen. Der Almeria fand wohl keinen Zug, der die Remisgrenze zu seinen Gunsten überschreitet und strebte mit 4. ... Lh3 remis durch 3fache Stellungswiederholung an.

Welche Programme ziehen nach dieser Zugfolge à tempo 4. ... Lh3?
(Stellungsbewertungen nach 2. Sf3 und 4. Sf3 angegeben)
Shredder 12:   Nein (0.02, 0.02)
Crafty 23.8:   Ja   (ca. -0.30, 0.01)
Hiarcs 14:     Nein (ca. -0.35, ca. -0.30)
Junior Yoko:   Ja   (-0.37, 0.00)
Gull 2.8 beta: Ja   (-0.37, 0.00)
Komodo 5:      Ja   (-0.06, -0.14)
Spark 1.0:     Nein (-0.10, 0.03)
SF v. 14.2.:   Ja   (-0.32, 0.00)


Das Ergebnis von Komodo 5 ist mit dem drawscore erklärbar, der mit -7 (1/100 Bauern) vorgegeben ist. Setzt man drawscore auf -15, gehört Komodo 5 auch zur Nein-Fraktion.
Shredder, Spark und Hiarcs scheinen sich dagegen nicht durch Vorgaben irritieren zu lassen. Bei Shredder und Spark könnte man noch argumentieren, dass in der Stellung nach 2. Sf3 ein Zug mit besserer Bewertung als 0.00 (=Remis) existiert. Damit stünde ihnen auch im 4. Zug etwas besseres als Remis in Aussicht. Tatsächlich laviert aber die Stellungsbewertung durch die Halbzüge mal über, mal unter der 0.00. Und wenn sie < 0 war, haben beide nicht auf die rettende Zugwiederholung zurückgegriffen. Es sollte also nicht an einem besseren Alternativzug liegen.
- Genauso wie Hiarcs, das sich noch deutlicher nicht auf den (scheinbaren) Remispfad locken lässt (Immerhin spielt es lieber mit fast einem drittel Bauern im Minus weiter!).

Ossi Weiner fand damals Almerias Verhalten unter den gegebenen Umständen wohl sinnvoll und/oder effizient. Der CSS-Leser warnte dagegen vor dem Einsatz des Gerätes in Abbruchstellungen bei Hängepartien.
- Also ich hätte in den Almeria oder einen anderen Schachcomputer bestimmt immer nur die Abbruchstellung eingegeben und nicht die ganze Partie - geht doch schneller . Außerdem müsste man beim Über-die-Zeit-schieben schon ganz schön Mist gemacht haben, finde ich. Da solche taktischen Aussetzer (1-zügiger Einsteller) einem Schachprogramm nur als Folge eines Programmfehlers unterlaufen dürften, schließe ich mich lieber Ossi Weiners Auffassung an und sage: Versäume in schlechter Stellung nie eine Stellungswiederholung - es könnte noch remis werden!

Viele Grüße
Th. Plaschke
Parent - - By Michael Scheidl Date 2014-02-16 11:42
Danke! Ich bin erschüttert! So viele fallen herein...

Wenigstens gehören Houdini 1.5a (sodaß ich annehme, auch die Folgeversionen), Critter 1.6a, Texel 1.03 oder auch Deep Saros 4.1.6 ebenfalls zur Nein-Fraktion.

Deep Fritz 13 is leider nicht immun, sondern wechselt ständig zwischen Lh3 und Sf6 hin und her. In der Analyse greift das Hashlernen. Bei der an sich lernfähigen Engineversion Stockfish DD PA_GTB mußte ich leider feststellen, daß hier kein Lerneffekt eintritt oder nicht nutzbar wird, obgleich das Lernfile aktualisiert wurde.
Parent - By ? Date 2014-02-16 15:47 Edited 2014-02-16 16:26
Michael Scheidl schrieb:
...So viele fallen herein...

Na eben nicht!
Das Remis bereits bei der 1. Wiederholung (also dem 2. Auftreten der Stellung) muss extra programmiert werden. Für Regelkonformität müsste nur die 2. Wiederholung (also das 3. Auftreten der Stellung) als Remis und (mögliches) Partieende beachtet (=programmiert) werden. Die Programmierer der "Reinfaller" wollen die 1. Wiederholung als Remis bewertet haben.

Warum? Forward pruning! Was bei Stockfish so hoch gelobt wird (Verzweigungsfaktor <2 und hohe Selektivität) gibt es nicht umsonst. Die Vertiefung der 1. Wiederholung kann ich mir sparen, wenn ich unterstelle, dass der Gegner bei seiner Meinung bleibt. Diese Unterstellung ist im Normalfall auch nicht aus der Luft gegriffen und spart im Suchbaum der betroffenen Variante 2 Halbzüge. Wenn man bedenkt, wie viele Stellungswiederholungen in einem Suchbaum von 30 Halbzügen stecken könnten ... Da wird eben jede Möglichkeit genutzt. Und mal ehrlich, wer hat denn bspw. beim Blitzen nicht schon geblufft und erwartet, dass der Gegner auch im nächsten Zug eine Widerlegung, die uns zu unserem Erschrecken urplötzlich ins Auge sprang, übersieht (Blind bleibt blind!)?

Viele Grüße
Th. Plaschke

P.S.: Ich habe mit der Zugfolge 1. e4 d6  2. d4 Dd7  3. Le2 Dd8  4. Le3 Dd7  5. Sf3 Dh3  6. Sg1 Dd7  7. Sf3 das Motiv etwas fortentwickelt. Die Stellung nach 7. Sf3 ist nun positionell eindeutig besser für Weiß, so dass contempt-Faktoren vermutlich keinen entscheidenden Einfluss auf die positionelle Bewertung nehmen können. Außerdem wird nun die Dame eingestellt. Damit kann positionelle Kompensation für das verlorene Material noch sicherer ausgeschlossen werden. Zu den "Nichtabschneidern" gesellen sich von den prominenten Programmen noch Bouquet 1.8, BlackMamba 2.0, Houdini 1.5a, Critter 1.6a, DiscoCheck 5.2, Arasan 16.3 und Yace 0.99.87. Komodo 5 mit Standardeinstellungen (drawscore=-7) setzt nun auf remis.
Anders als neuerdings Deep Saros 4.1.6 schneidet die Vorversion Deep Saros 4.1.3c dagegen ab.
Parent - By Karl Müller Date 2014-02-17 22:04
Thomas Plaschke schrieb:


Ich freue mich also eher darüber, wenn die Programmierer ihren Programmen genug Intelligenz mitgegeben haben, um Stellungswiederholungen in beliebigen Partieverläufen zu erkennen und ganz ökonomisch als Remis zu bewerten.

Schöne Grüße
Th. Plaschke


Jaaaaaaaaaaaaaaa - ich auch, wenn dann noch die GUI mitmachen würde, dann wäre alles in Butter (z. Z. GUI zerstört Intelligenz . . .).
Parent - By Tom Paul Date 2014-02-17 08:57
16-02-14  jo  3fold_fix  diff 
LLR: 2.65 (-2.94,2.94) [-4.00,0.00]
Total: 58392 W: 10625 L: 10685 D: 37082
sprt @ 15+0.05 th 1  Test as simplification/bugfix as vdb proposed.

Das sieht nach einem ersten Erfolg aus.
Up Topic Hauptforen / CSS-Forum / @Jörg Oster

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill