Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Teststellung: Remisbewertung
- - By Michael Scheidl Date 2014-03-22 13:57
Günther Simon zeigt im CCC eine Stellung von 2005, die Engines neun Jahre später noch nicht besser verstehen:


http://talkchess.com/forum/viewtopic.php?t=51687

Gefragt ist eine remis(-liche) Bewertung. Weiß kann nichts erreichen.

Den im CCC angeführten Erfolg von Protector 1.5 konnte ich hier (1.5.0) nicht reproduzieren, was vielleicht daran liegt daß ich nicht die kompletten Nalimovs habe:

Analysis by Protector 1.5.0 JA x64:

1...Ke5 2.Bf1 Kd4 3.Rd3+ Ke4 4.Rb3 Kf4 5.Rd3
  +-  (4.76)   Depth: 7/10   00:00:00  16kN
  +-  (5.26)   Depth: 45/62   00:06:59  2323MN, tb=2147483647

So ähnlich sieht es offenbar mit jeder Engine aus, z.B.

Analysis by Stockfish 040214 64 SSE4.2 syz:

1...Ke5 2.Ra3 Ke4 3.Ra4 Kd4 4.Bf1+ Kd5 5.Bd3 Ke5 6.Rb4 Kd5 7.Rg4 Ke5 8.Ra4 Kd5 9.Ra2 Kd4 10.Bb5 Kc5 11.Be2 Kd4 12.Bb5
  +-  (4.37)   Depth: 7/8   00:00:00  4kN
  +-  (4.35)   Depth: 67/74   00:01:42  512MN, tb=575733

Vielleicht könnte Stockfish bei Rechentiefe 100 ein 50er-Remis erkennen
Parent - - By Kurt Utzinger Date 2014-03-22 14:44
Hallo Michael
Habe mir diese wundervolle Teststellung heruntergeladen, um
sie in ein paar Jahren wieder hervorzukramen. Aber vielleicht
gibt es ja doch noch irgend eine Engine, die eine reale Bewertung
anzuzeigen imstande ist.
Mfg, Kurt
Parent - By Michael Scheidl Date 2014-03-22 16:22 Edited 2014-03-22 16:25
Anhand dessen ist mir eine andere, allerdings "sehr konstruierte" Teststellung eingefallen. Es geht darum ob Engines heutzutage tatsächlich gewisse Arten von Remisstellungen "einfach" dadurch erkennen können, daß sie quasi in einer Brute Force-Manier 100 effektive Halbzüge tief rechnen. Oder ob sie über eine evtl. etwas kürzere Distanz erkennen können, daß Stellungswiederholungen unvermeidlich sind. Ich weiß nicht welcher dieser zwei Fälle hier zutrifft:

174: Teststellung, wertloses Material 2012

Analysis by DiscoCheck 5.2 (Singlecore, i5-3210M, 512 MB Hash):

1.Kg2 Bd4 2.Kf3 Bh8 3.Ke4 Bc3 4.Kd5
  +-  (19.94)   Depth: 7   00:00:00  2kN
1.Kg2 Bd4 2.Kf3 Bh8 3.Ke4 Bb2 4.Kd5 Bc3
  +-  (20.08)   Depth: 8   00:00:00  2kN
1.Kg2 Bd4 2.Kf3 Bc5 3.Ke4 Bf2 4.Kd5 Be3 5.Kc6
  +-  (20.22)   Depth: 9   00:00:00  3kN
(...)
1.Kg2 Bd4 2.Kg3 Bg7 3.Kf3 Bf6 4.Ke4 Bh8 5.Kd5 Bc3 6.Kc6 Bd2 7.Kb5 Bh6 8.Kb4 Bf8+ 9.Kc4 Bg7 10.Kc5 Be5 11.Kc6 Bf6 12.Kd6 Bg7 13.Ke7 Bh8 14.Kf7 Bd4 15.Kg6
  +-  (12.48)   Depth: 28   00:00:00  446kN
(...)
1.Kg2 Bc3 2.Kf1 Bf6 3.Ke2 Bg5 4.Kd3 Be7 5.Kd4 Bf6+ 6.Kd5 Bb2 7.Ke6 Ba3 8.Kf6 Be7+ 9.Kf7 Bd6 10.Kg6 Ba3 11.Kh7 Bf8 12.Kg8 Bc5 13.Kg7 Bd4+ 14.Kh6 Bc5 15.Kh5 Be3 16.Kg6 Bd4 17.Kf5 Bg7 18.Kg4
  +-  (12.11)   Depth: 33   00:00:01  1001kN
1.Kg2 Bc3 2.Kf3 Bd2 3.Kg3 Bc3 4.Kf4 Bd2+ 5.Ke5 Bc3+ 6.Kd5 Bb2 7.Kc4 Bf6 8.Kd5 Bg7 9.Ke6 Bb2 10.Kd5 Bg7
  =  (-0.25) Depth: 34   00:00:01  1123kN
(...)
1.Kg2 Bc3 2.Kf3 Bd2 3.Kg3 Bc3 4.Kh3 Bf6 5.Kg2 Bc3
  =  (-0.25)   Depth: 127   00:00:02  2517kN

127 Halbzüge in 2 Sekunden...

(-0.25 statt 0.00 liegt nur am Default-Contempt)

P.S. Stockfish erkennt das Remis ebenso schnell, indem die Engine fast augenblicklich auf Tiefe 50 kommt. Ich glaube daher eher, daß Stellungswiederholung unvermeidlich ist. - Andere gute Engines bleiben hier ahnungslos, obwohl sie z.T. auch sehr schnell auf Wundertiefen kommen. Houdini 1.5a beispielsweise bleibt irgendwie in Tiefe 99 hängen, einen Halbzug vor der Erkenntnisschwelle

Natürlich ist die Stellung von keinerlei Praxisrelevanz, aber ich finde es faszinierend was unsere technischen Wunderwerke sozusagen, hier aufführen. Absurde Rechentiefen in Sekundenbruchteilen - die mitunter an der "künstlichen Dummheit" nichts ändern. Das freut einen als Mensch doch immer wieder.
Parent - By Bernhard Traven Date 2014-03-22 14:53
eine wilde sache, Mike!! 

houdini 4 sieht weiß auch klar vorne:

Ke5 +- 3,63
Ke7 +- 3.91 jeweils auf tiefe 40...
auf die TB wurde noch gar nicht zurückgegriffen...
Parent - By Roland Kanz Date 2014-03-23 02:43
Hallo Michael!

Houdini4 Pro findet wenigstens annähernd die Remisbewertung!
Komodo 6 jedoch nicht, wähnt sich immer noch auf Gewinn

Nach Stundenlanger Analysen die zweigeteilt sind wie man sieht:

[Event "Remis erkannt ?!"]
[Site "Erstmals gepostet 2005 Günter Simon"]
[Date "2014.03.23"]
[Round "?"]
[White "CSS Michael Scheidl"]
[Black "Erstmals gepostet 2005 G.Simon"]
[Result "1/2-1/2"]
[Annotator " "]
[SetUp "1"]
[FEN "8/8/5k2/8/2B4p/5RbP/5pP1/7K b - - 0 1"]
[PlyCount "107"]

{Houdini 4 Pro x64:} 1... Ke5 ({Komodo 6 64-bit:} 1... Ke5 2. Bf1 Ke4 3. Rb3
Kf4 4. Rb4+ Ke5 5. Ra4 Kd5 6. Rc4 Kd6 7. Rg4 Kc5 8. Rg6 Kd4 9. Rg5 Ke4 10. Rb5
Kd4 11. Rb7 Ke4 12. Rd7 Ke3 13. Rf7 Kd4 14. Rf5 Ke3 15. Rc5 Ke4 16. Rc8 Kd5 17.
Re8 Kd4 18. Rd8+ Ke3 19. Rd7 Ke4 20. Rb7 Kd4 21. Ra7 {2.78/38} {Komodo 6
64-bit:}
Ke4 22. Ra6 {2.68/47}) 2. Bd3 Kd5 3. Bb5 Kd4 4. Be2 Ke4 5. Bf1 Ke5 6.
Ra3 Ke4 7. Ra4+ Ke5 8. Rg4 Kd5 9. Rb4 Ke5 10. Rc4 Kd5 11. Rg4 Ke5 12. Ra4 Kf5
13. Rc4 Ke5 14. Be2 Kf5 15. Bd3+ Ke5 16. Ra4 Kd5 17. Rb4 Ke5 18. Rb5+ Kd4 19.
Bf1 Ke4 20. Rc5 Kd4 21. Ra5 Ke4 22. Ra2 Kf4 23. Ba6 Ke4 24. Ra4+ Ke5 25. Rb4
Kd5 26. Rb7 Kd4 27. Rh7 Ke4 {3.57/49} {Houdini 4 Pro x64:} 28. Rg7 Kd4 29. Rg4+
Kc5 30. Bf1 Kd5 31. Bd3 Ke5 32. Bc4 Kf5 33. Rg8 Ke5 34. Bf1 Ke6 35. Re8+ Kf6
36. Rc8 Kf5 37. Rd8 Kf6 38. Bd3 Ke7 39. Rd5 Kf7 40. Rb5 Kf6 41. Ra5 Ke6 42. Rf5
Kd7 43. Bc4 Ke7 44. Rf3 Kd6 45. Re3 Kc5 46. Bf1 Kd5 47. Rf3 Ke4 48. Bc4 Ke5 49.
Bd3 Kd4 50. Bf1 Ke4 51. Rxg3 hxg3 52. h4 Kf4 53. h5 Kg5 54. Be2 Kh6 $11 {0.71/
39}
1/2-1/2
MfG
Roland
Parent - By Peter Martan Date 2014-03-23 08:01
Ja, obwohl ich von Teststellungen etwas übersättigt bin derzeit, das ist schon eigentlich genau mein Punkt, was hier fehlt, ist eine eigene Bewertung für einen fehlenden Fortschritt im Bewertungsverlauf.
Würde die engine das schneller merken, da geht einfach nichts weiter, obwohl das Material dafür spräche, es sollte, würde sie das 0.00 schon auch bringen. Eigentlich sollte sie besonders aufmerksam sein gerade dann, wenn die statische Eval schon deutlich für eine Seite spricht, und die berechneten Züge bringen trotzdem keine Fortschritt in dieser Eval.
Wieder ist es genau das Verhältnis, das nicht stimmt.
Der Trick mit der herabgesetzten 50-Züge- Grenze von Houdini funktioniert jedenfalls sofort wieder.
Parent - - By Peter Martan Date 2014-03-25 09:01
Noch ein P.S., Michael, zu deinem guten Fund, im CCC hatte es noch eine Fortsetzung:
http://www.talkchess.com/forum/viewtopic.php?topic_view=threads&p=563342&t=51687&sid=516d5feabfd3bdfe5638892025b65fe6
Wahre Worte wohl von Milos Stanisavljevic und Carl Langan.
Parent - - By Peter Martan Date 2014-03-25 17:13
Peter Martan schrieb:

Wahre Worte wohl von Milos Stanisavljevic und Carl Langan.

Und was H.G. Muller da so schreibt
http://www.talkchess.com/forum/viewtopic.php?topic_view=threads&p=563375&t=51687&sid=bd856e4ed8f9155bc9460bdb49420491
könnte glatt von mir sein.
Parent - - By Michael Scheidl Date 2014-03-25 19:33
Zitat:
Playing games is a poor method of gauging Chess skill

Na der traut sich was

Hoffentlich setzt sich diese Meinung nicht durch, denn dann würde ja viel Arbeit auf mich zu kommen!   In den letzten Jahren war es doch so einfach und bequem, Ratings von Partiespiel-Ranglisten abzulesen ohne selber gründlich zu testen...

Marantjosef.
Parent - By Peter Martan Date 2014-03-25 20:23
Michael Scheidl schrieb:

Marantjosef.

Up Topic Hauptforen / CSS-Forum / Teststellung: Remisbewertung

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill