Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / TCEC/S7: Eine alte Wissenlücke
- - By Michael Scheidl Date 2014-09-27 17:58
Zu einem Kuriosum kam es am Schluß einer wechselvollen Partie zwischen Spike und Octochess.


Nach 100...Kxe6. Octo bewertete hier mit -17.08; Spike hatte beim vorigen Zug mit -24.86 bewertet. Zuvor hatte nicht viel gefehlt, und die Partie wäre nach TCEC-Abschätzungsregeln rein aufgrund der Evals als Schwarzsieg abgebrochen worden. Doch nun griff noch rechtzeitig die 5er-Tablebaseabschätzung: Remis.

http://tcec.chessdom.com/archive.php?se=7&st=1a&ga=42

Überraschenderweise hat nicht nur Octo, sondern auch die Qualitätsengine Spike (1.4) das bekannte Motiv

"Randbauer und falscher Läufer"

nicht erkannt. Das zieht sich schon durch die ganze Computerschachgeschichte; anscheinend wird die Bedeutung dieses Stücks Endspielwissen mitunter unterschätzt und nicht eingebaut.

Bei TCEC gibt's für Engines diesmal keinen Tablebasezugriff, wodurch solche Wissenlücken aufgedeckt werden können.
Parent - By Ralf Mueller Date 2014-09-27 18:57
Interessant! Habe eben mal alle mir verfügbaren Engines über die Stellung gejagt mit folgendem Ergebnis. Die Stellung korrekt mit Remis (Bewertung < 0.15) bewerten:
Alaric 707
Amyan 1.72
Crafty 19.01
Critter 1.2, 1.4 (1.6 nicht getestet)
Rybka 1.2-4
Fire 3
Frenzee 3.5.19
Fruit 05/11/03
Gaviota
Glaurung 1.2.1 (andere Versionen nicht getestet)
Gull 3
Hannibal 1.4b
Houdini 1.5a
MinkoChess 1.3
Scorpio 2.7.5
Spark 1.0 (nicht aber Bright 0.5c)
Sting 4.7
Stockfish 1.6-10/08/14
Texel 1.01 (neuere Versionen nicht getestet)
The Baron 1.7.0, 2.23
Toga II 1.3.1, 3.0

Die Stellung mit einem kleinen schwarzen Vorteil, der aber noch unter einer Bauerneinheit liegt, bewerten:
Critter 0.9
Hiarcs 13.2
Gandalf 6
Ktulu 4.2
Nirvanachess 1.7
Pharaon 3.5.1
Philou 3.7.1
ProDeo 1.83
Ruffian 1.0.5
Rybka WinFinder 2.2
SmarThink 1.7
Spike 1.4
Tao 5.6

Die Stellungsbewertung von Spike bei TCEC konnte ich somit nicht reproduzieren, auch nicht vor 100...Kxe6, womit Spike nicht gerechnet hatte.
Sowohl Komodo 5, CCT und Rhetoric 1.4.1/1.4 bewerten diese Stellung nicht korrekt, sondern mit großem schwarzen Vorteil.
Parent - - By Benno Hartwig Date 2014-09-27 20:02
Dass Engines das Endspiel nicht (immer noch nicht, aber zumindest Spike ist ja auch uralt) kennen, mag ja angehen.
Aber wie kommen sie, wenn sie doch keine Umwandlung sehen, zu derart grotesk hohen Bewertungen??
AFAIR hatte doch die an dieser Stelle ebenfalls dummerhaftige Rybka noch viel milder gewertet.

Benno
Parent - - By Ralf Mueller Date 2014-09-27 20:09
Sowohl Rybka 1.2 als auch Rybka 4 bewerten diese Stellung bei mir als 0.00
Solch hohe Werte für Spike 1.4 ließen sich bei mir nicht rekonstruieren, da bleibt er bei ca. -0.6-0.8
Parent - By Michael Scheidl Date 2014-09-27 21:04
Zitat:
Solch hohe Werte für Spike 1.4 ließen sich bei mir nicht rekonstruieren

Kann wohl mit den in der TCEC-Partie schon mit allem möglichen gefüllten Hashtables zu tun haben... Das ist zumindest als ein Hauptgrund anzunehmen, wenn etwas aus einer praktischen Partie nicht reproduzierbar ist.

Hat Spike 1.4 das Wissen also doch (wie ich auch angenommen hätte)? Dann ist mir das ein Rätsel.
Parent - - By Benno Hartwig Date 2014-09-28 09:49 Edited 2014-09-28 09:54
Bei mir sieht es so aus:
Rybka 4.1 Bewertung 0,00 (sofort und stabil)
Rybka 3 bei Tiefe 15 immer noch -6,07 (Vas wurde in den Foren ziemlich dafür kritisiert, dass seine damals absolute Top-Engine dieses Anfängerwissen nicht hat und er sich lange weigerte, daran was zu ändern.)
Rybka 2.3.2a bei Tiefe 18 immer noch -5,99
Rybka 1.2f Bewertung 0,00 (sofort und stabil)

Warum hatte Vas das eigentlich nach der 1er-Version ausgebaut?
Ein sehr sichtbarer und hässlicher Fleck (wie auch die Unterverwandlungsbehandlung) auf der damals ansonsten noch blütenweißen Rybka-Weste war das ja schon.

Spike 1.4 liefert bei mir übrigens auch Bewertungen in der Gegend -0,80, was irgendwie angemessen erscheint:
"Ich habe keine Chance etwas zu erzwingen. Aber wenn sich mein Gegner genügend doof anstellt..."

Benno
Parent - - By Frank Brenner Date 2014-09-28 11:44
Vas hat in den Sourcecode geguckt und hat festgestellt dass dieser Teil ein "sichtbarer und hässlicher Fleck" im Source Code darstellt.

Also wird das Stück Code entfernt, da er für die Zukunft eine elegantere und allgemeinere Lösung gesucht hat. Die Entfernung war auch kommerziell zu verschmerzen da die Engine dadurch im Durchschnitt kaum schwächer wurde.

Dieser ästhetischer aspekt hat ja auch zu einem Streit geführt bei der Programmierergilde von Stockfish. Marco Costalba will eigentlich nur erfahrene Programmierer im Team haben, die automatisch, so wie er, ästhetische Aspekte berücksichtigen. Denn wenn man das nicht tut (kein Anfänger tut dies) so entsteht nach einigen Jahren ein Spaghetticode wo keiner mehr etwas versteht und weitermachen kann und will.

Dies ist der Grund wieso viele Programmierer nach einigen Jahren ihr Programm wegwerfen und ganz neu anfangen.
Parent - - By Benno Hartwig Date 2014-09-28 18:57
Die Lanze für einen strukturierten Code, die du da brichst, brichst du natürlich mit Recht.
Aber dass dazu notwendig war, die Engine vergessen zu lassen, was der falsche Läufer bedeutet, kann ich ganz sicher nicht glauben!

Benno
Parent - By Frank Brenner Date 2014-09-28 19:11

>Aber dass dazu notwendig war, die Engine vergessen zu lassen, was der falsche Läufer bedeutet, kann ich ganz sicher nicht glauben!


selbstverständlich ist dies möglicih zb wenn dieser code spaghetticode ist und über viele seiten lang geht und (gefüehlt) recht haufig fehlerhaft bewertet; dabei ist es egal ob er sehr haeufig richtig liegt.

Dann loescht man alles und ersetzt es ein paar Monate oder Jahre spaeter wenn man einen guten eleganten code gefunden hat der das viel besser macht.
Parent - - By Jörg Oster Date 2014-09-27 20:46
Nur mal so nebenbei erwähnt, nicht nur für dich.
Ich habe diese Woche einige Stunden an Zeit investiert, um den entspechenden Code in Stockfish zu erweitern, damit er möglichst alle Fälle abdeckt. Falls das überhaupt möglich ist!? Mittlerweile bin ich mir da nicht mehr so sicher ... 
Auf jeden Fall bewertet SF damit viel mehr Positionen als vorher nun als remis. Hier der Output für obige Stellung:

Engine:
      Eval term |    White    |    Black    |    Total   
                |   MG    EG  |   MG    EG  |   MG    EG 
----------------+-------------+-------------+-------------
       Material |   ---   --- |   ---   --- | -3.00 -3.49
      Imbalance |   ---   --- |   ---   --- |  0.00  0.00
          Pawns |   ---   --- |   ---   --- |  0.00  0.00
        Knights |  0.00  0.00 |  0.00  0.00 |  0.00  0.00
        Bishops |  0.00  0.00 |  0.04  0.01 | -0.04 -0.01
          Rooks |  0.00  0.00 |  0.00  0.00 |  0.00  0.00
         Queens |  0.00  0.00 |  0.00  0.00 |  0.00  0.00
       Mobility |  0.00  0.00 |  0.36  0.40 | -0.36 -0.40
    King safety | -0.14 -0.19 | -0.14 -0.19 |  0.00  0.00
        Threats |  0.00  0.00 |  0.00  0.00 |  0.00  0.00
   Passed pawns |  0.00  0.00 |  0.00  0.00 |  0.00  0.00
          Space |  0.00  0.00 |  0.00  0.00 |  0.00  0.00
----------------+-------------+-------------+-------------
          Total |   ---   --- |   ---   --- | -3.40 -3.90

Total Evaluation: 0.00 (white side)

go depth 25
info depth 1 seldepth 1 score cp -6 nodes 10 nps 2000 time 5 multipv 1 pv e2d1
info depth 2 seldepth 2 score cp -251 nodes 157 nps 22428 time 7 multipv 1 pv e2f3 d6h2
info depth 3 seldepth 3 score cp -6 nodes 216 nps 30857 time 7 multipv 1 pv e2f3 d6h2 f3g2
info depth 4 seldepth 4 score cp 6 nodes 422 nps 60285 time 7 multipv 1 pv e2f3 d6h2 f3g2 e6d5
info depth 5 seldepth 5 score cp -6 nodes 661 nps 82625 time 8 multipv 1 pv e2f3 d6h2 f3g2 e6d5 g2h2
info depth 6 seldepth 6 score cp 6 nodes 1653 nps 183666 time 9 multipv 1 pv e2f3 d6h2 f3g2 e6d5 g2h2 d5c4
info depth 7 seldepth 7 score cp -6 nodes 2205 nps 220500 time 10 multipv 1 pv e2f3 d6h2 f3g2 e6d5 g2h2 d5c4 h2g2
info depth 8 seldepth 9 score cp -6 nodes 5144 nps 367428 time 14 multipv 1 pv e2f3 e6f5 f3g2 f5g4 g2h1 g4g3 h1g1 d6c5 g1h1
info depth 9 seldepth 10 score cp -6 nodes 6733 nps 420812 time 16 multipv 1 pv e2f3 e6f5 f3g2 f5g4 g2h1 g4g3 h1g1 d6c5 g1h1 g3f4 h1g2 c5d4 g2h1
info depth 10 seldepth 12 score cp -6 nodes 10479 nps 582166 time 18 multipv 1 pv e2f3 e6f5 f3g2 f5g4 g2h1 g4g3 h1g1 d6c5 g1h1 g3f3 h1h2 c5g1 h2g1
info depth 11 seldepth 13 score cp -6 nodes 16535 nps 826750 time 20 multipv 1 pv e2f3 e6f5 f3g2 f5g4 g2h1 g4g3 h1g1 d6c5 g1h1 g3f3 h1h2 c5g1 h2g1
info depth 12 seldepth 14 score cp -6 nodes 26144 nps 1136695 time 23 multipv 1 pv e2f3 e6f5 f3g2 f5g4 g2h1 g4g3 h1g1 d6c5 g1h1 g3f3 h1h2 f3g4 h2g2 g4h4 g2h1
info depth 13 seldepth 17 score cp -6 nodes 42207 nps 1563222 time 27 multipv 1 pv e2f3 e6f5 f3g2 f5g4 g2h1 g4g3 h1g1 d6c5 g1h1 g3f3 h1h2 f3g4 h2g2 g4h4 g2h1 h4g4 h1g2
info depth 14 seldepth 17 score cp -6 nodes 51995 nps 1733166 time 30 multipv 1 pv e2f3 e6f5 f3g2 f5g4 g2h1 g4g3 h1g1 d6c5 g1h1 g3f3 h1h2 f3g4 h2g2 g4h4 g2h1 h4g4 h1g2
info depth 15 seldepth 19 score cp -6 nodes 74106 nps 2058500 time 36 multipv 1 pv e2f3 e6f5 f3g2 f5g4 g2h1 g4g3 h1g1 d6c5 g1h1 g3f3 h1h2 f3g4 h2g2 g4h4 g2h1 h4g4 h1g2 g4f5 g2h1
info depth 16 seldepth 20 score cp -6 nodes 104741 nps 2380477 time 44 multipv 1 pv e2f3 e6f5 f3g2 f5g4 g2h1 g4g3 h1g1 d6c5 g1h1 g3f3 h1h2 f3g4 h2g2 g4h4 g2h1 c5d4 h1g2 d4e5 g2h1 e5h2 h1h2
info depth 17 seldepth 21 score cp -6 nodes 143164 nps 2602981 time 55 multipv 1 pv e2f3 e6f5 f3g2 f5g4 g2h1 g4g3 h1g1 d6c5 g1h1 g3f3 h1h2 f3g4 h2g2 g4h4 g2h1 c5d4 h1g2 d4e5 g2h1 e5h2 h1h2 h4g4 h2g2 g4f5 g2h1
info depth 18 seldepth 22 score cp -6 nodes 198526 nps 2877188 time 69 multipv 1 pv e2f3 e6f5 f3g2 f5g4 g2h1 g4g3 h1g1 d6c5 g1h1 g3f3 h1h2 f3g4 h2g2 g4h4 g2h1 c5d4 h1g2 d4e5 g2h1 h4g4 h1g1 e5h2 g1h2 g4f5 h2g2
info depth 19 seldepth 23 score cp -6 nodes 260847 nps 3033104 time 86 multipv 1 pv e2f3 e6f5 f3g2 f5g4 g2h1 g4g3 h1g1 d6c5 g1h1 g3f3 h1h2 f3g4 h2g2 g4h4 g2h1 c5d4 h1g2 d4e5 g2h1 h4g4 h1g1 e5h2 g1h2
info depth 20 seldepth 25 score cp -6 nodes 342930 nps 3175277 time 108 multipv 1 pv e2f3 e6f5 f3g2 f5g4 g2h1 g4g3 h1g1 d6c5 g1h1 g3f3 h1h2 f3g4 h2g2 g4h4 g2h1 c5d4 h1g2 d4e5 g2h1 h4g4 h1g1 e5d4 g1h1 d4c5 h1g2
info depth 21 seldepth 26 score cp -6 nodes 451510 nps 3319926 time 136 multipv 1 pv e2f3 e6f5 f3g2 f5g4 g2h1 g4g3 h1g1 d6c5 g1h1 g3f3 h1h2 f3g4 h2g2 g4h4 g2h1 c5d4 h1g2 d4e5 g2h1 h4g4 h1g1 e5d4 g1h1 d4c5 h1g2 g4f5 g2h1 f5g4
info depth 22 seldepth 27 score cp -6 nodes 584742 nps 3419543 time 171 multipv 1 pv e2f3 e6f5 f3g2 f5g4 g2h1 g4g3 h1g1 d6c5 g1h1 g3f3 h1h2 f3g4 h2g2 g4h4 g2h1 c5d4 h1g2 d4e5 g2h1 h4g4 h1g1 e5d4 g1h1 d4c5 h1g2 g4f5 g2h1 f5g4
info depth 23 seldepth 29 score cp -6 nodes 722956 nps 3492541 time 207 multipv 1 pv e2f3 e6f5 f3g2 f5g4 g2h1 g4g3 h1g1 d6c5 g1h1 g3f3 h1h2 f3g4 h2g2 g4h4 g2h1 c5d4 h1g2 d4e5 g2h1 h4g4 h1g1 e5d4 g1h1 d4e3 h1h2 e3f4 h2g1 g4f5 g1h1
info depth 24 seldepth 30 score cp -6 nodes 878674 nps 3557384 time 247 multipv 1 pv e2f3 e6f5 f3g2 f5g4 g2h1 g4g3 h1g1 d6c5 g1h1 g3f3 h1h2 f3g4 h2g2 g4h4 g2h1 c5d4 h1g2 d4e5 g2h1 h4g4 h1g1 e5d4 g1h1 d4e3 h1h2 g4f5 h2g2 e3d4 g2h1
info depth 25 seldepth 30 score cp -6 nodes 1096839 nps 3608023 time 304 multipv 1 pv e2f3 e6f5 f3g2 f5g4 g2h1 g4g3 h1g1 d6c5 g1h1 g3f3 h1h2 f3g4 h2g2 g4h4 g2h1 c5d4 h1g2 d4e5 g2h1 h4g4 h1g1 e5d4 g1h1 d4e3 h1h2 g4f5 h2g2 e3c5 g2h1 f5g4 h1g2 g4f5
info nodes 1096839 time 304
bestmove e2f3 ponder e6f5


Ich wollte das nur mal kurz erwähnen, um den teils eklatanten Unterschied zwischen Theorie und Praxis aufzuzeigen. Es hört sich leicht an, fügt doch gerade mal dieses oder jenes Wissen einer Engine hinzu. So einfach ist es aber (manchmal, oder meistens?) nicht! 

Gruß, Jörg.
Parent - - By Chess Player Date 2014-09-28 10:57
Jörg Oster schrieb:

... Hier der Output für obige Stellung:

      Eval term |    White    |    Black    |    Total   
                |   MG    EG  |   MG    EG  |   MG    EG 
----------------+-------------+-------------+-------------
       Material |   ---   --- |   ---   --- | -3.00 -3.49
...
----------------+-------------+-------------+-------------
          Total |   ---   --- |   ---   --- | -3.40 -3.90

Total Evaluation: 0.00 (white side)

...
info depth 25 seldepth 30 score cp -6 nodes 1096839 nps 3608023 time 304 multipv 1 pv e2f3 e6f5 f3g2 f5g4 g2h1 g4g3 h1g1 d6c5 g1h1 g3f3 h1h2 f3g4 h2g2 g4h4 g2h1 c5d4 h1g2 d4e5 g2h1 h4g4 h1g1 e5d4 g1h1 d4e3 h1h2 g4f5 h2g2 e3c5 g2h1 f5g4 h1g2 g4f5 info nodes 1096839 time 304 bestmove e2f3 ponder e6f5

...
Gruß, Jörg.


Ich verstehe wie verschiedene andere Personen nicht dein Posting. Kannst Du uns bitte einmal diese Zeilen etwas genauer erklären?
Parent - By Jörg Oster Date 2014-09-28 11:36
Chess Player schrieb:

Jörg Oster schrieb:

... Hier der Output für obige Stellung:

      Eval term |    White    |    Black    |    Total   
                |   MG    EG  |   MG    EG  |   MG    EG 
----------------+-------------+-------------+-------------
       Material |   ---   --- |   ---   --- | -3.00 -3.49
...
----------------+-------------+-------------+-------------
          Total |   ---   --- |   ---   --- | -3.40 -3.90

Total Evaluation: 0.00 (white side)

...
info depth 25 seldepth 30 score cp -6 nodes 1096839 nps 3608023 time 304 multipv 1 pv e2f3 e6f5 f3g2 f5g4 g2h1 g4g3 h1g1 d6c5 g1h1 g3f3 h1h2 f3g4 h2g2 g4h4 g2h1 c5d4 h1g2 d4e5 g2h1 h4g4 h1g1 e5d4 g1h1 d4e3 h1h2 g4f5 h2g2 e3c5 g2h1 f5g4 h1g2 g4f5 info nodes 1096839 time 304 bestmove e2f3 ponder e6f5

...
Gruß, Jörg.


Ich verstehe wie verschiedene andere Personen nicht dein Posting. Kannst Du uns bitte einmal diese Zeilen etwas genauer erklären?


Der obere Teil zeigt die augenblickliche Positionsbewertung (static evaluation), der untere Teil zeigt die Analyse bis zu einer Suchtiefe 25.

Gruß, Jörg.
Parent - By Martin Hertz Date 2014-09-29 13:47

Ob es wohl auch DOS-Programme gab, die das richtig und stabil bewerten konnten?
Code:
M-Chess Pro 5.0      remis

M-Chess 1.70         remis

Chess System Tal     remis

Gideon Pro 1.0       schwankend

Chess Genius 3.0     verlust

WChess 1.05          verlust

Socrates 3.0         verlust

Fritz 3.05           verlust


Beeindruckend, daß sogar M-Chess 1.70 es bereits konnte, aber etwas enttäuscht war ich vom Chess Genius, dem ich es eher zugetraut hätte.
Gideon Pro kann sich hier nicht so recht entscheiden.
Up Topic Hauptforen / CSS-Forum / TCEC/S7: Eine alte Wissenlücke

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill