Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Houdini 1.5a / Strelka 5: Beobachtungen
- - By Michael Scheidl Date 2011-10-25 23:25 Edited 2011-10-25 23:33
Bei einem kurzen Match, das nur den Zweck verfolgte Vergleichsbeobachtungen zu ermöglichen, ging ich von der Hypothese aus daß beide Engines ihre "echten internen" Tiefen anzeigen (soweit mir bekannt scheint nichts dagegen zu sprechen), sodaß es einen Sinn hatte sie hierfür auf dieselbe Tiefe, in dem Fall auf 7 HZ. zu fixieren. Ich spielte mit den Top 200-Eröffnungsvarianten von S.Canbaz, habe aber nur die ersten 25 ausspielen lassen (also 50 Partien), da der Eindruck rasch ein recht klarer wurde:

Der Bewertungsverlauf nahm beiderseits einen weitgehend "parallelen" Verlauf. D.h. Bewertungsbewegungen, Wechsel des Vorteils von einer Seite zur anderen oder Bewertungssprünge wurden von beiden Engines fast immer quasi gemeinsam vollzogen bzw. von der Richtung her gegenseitig bestätigt. Lediglich die absolute Größe der Bewertungszahlen ist bei Strelka höher - aber nicht einfach um den Faktor 2 vergrößert, sondern meist mehr, im Schnitt eher näher beim Dreifachen. Ein fixer Faktor war nicht ablesbar, was aber auch damit zu tun haben mag daß die Engine ja nicht in denselben Stellungen, sondern jeweils einen Halbzug früher bzw. später rechneten.

Ein beispielhaftes Bewertungsprofil:


http://picfront.org/d/8ohf

Es gab eine auffällig große Anzahl von z.T. frühen Remis durch Stellungswiederholungen: 15 in 50 Partien. Das kommt zwischen unterschiedlichen Engines normalerweise viel seltener vor, deutet somit ebenfalls auf sehr ähnliche Engines hin. Insgesamt gab es nur 18 Remis, was jedoch mit der geringen RT. zu tun haben kann.

Die Partien: http://remixshare.com/download/q5nit
Parent - By Frank Quisinsky Date 2011-10-26 06:13
Hi Michael,

sehr schön, gut gemacht!
Also ich habe gestern Abend mal eine aktuelle GM Partie analyiseren lassen.
Quad Core System, vier Engines geladen je mit einem Core.

Strelka (kann ja auch nur einen)
Robbolito
Houdini
Chiron

Die Engine die wirklich abwich, teils mit interessanten Zügen war Chiron
Robbolito im Endspiel etwas schwächer, Chiron natürlich auch.

Strelka und Houdini spielten die gleichen Züge, es kam bis auf 3 Züge zu gleichen Hauptvarianten der ersten 4-5 Züge.
Die drei Züge schaute ich mir später genauer an, lies ich länger rechnen waren diese dann auch bis auf einen auch gleich.
Sehe zwischen Strelka 5 und Houdini 1.5 keinen Unterschied.

Im frühen Mittelspiel bis auf zwei Ausnahmen war auch Robbolito fast gleich zu Houdini 1.5 (Hauptvarianten).
Werde mir das nochmals mit zwei anderen GM Partien ansehen, aber ich sehe hier wirklich, sage mal zu 98% das gleiche Programm. Das die Spiesltärke dann natürlich auch gleich sein muss versteht sich von selbst. Pondern hatte ich abgeschlatet, TB Zugriffe abgeschaltet und die Hash-Tabellen auf 1Mb gesetzt.

Gruß
Frank
Parent - By Christian Schmidt Date 2011-10-26 09:19
Sehr interessanter Post, der sich mit meinen subjektiven Eindrücken deckt. Ein Houdini 1.5a spielt mit veränderten Settings merklich anders als die Originalversion. Von Strelka kann ich das nicht behaupten. Die hohen Bewertungen von Strelka sagen gar nichts aus. Man kann im Prinzip sehr hohe, sehr niedrige oder gar negative Bewertungen anzeigen lassen, obwohl die gleiche Engine im Hintergrund werkelt.
Parent - - By Michael Scheidl Date 2011-10-26 13:38
Hier nochmals das Bewertungsprofil, das
bei PicFront irgendwie abhanden kam

Parent - - By Peter Behringer Date 2011-10-26 17:06
Also da kann man ja gar nix erkennen; die Partiebewertungsgraphfunktion von Scid ist da interssanter:

Zitat:

[Event "Strelka5-houdini2"]
[Site "ORION9"]
[Date "2011.10.24"]
[Round "1"]
[White "Strelka-5-32"]
[Black "Houdini_20_w32 [t1]"]
[Result "1/2-1/2"]
[BlackElo "2200"]
[ECO "B83"]
[Opening "Sizilianisch"]
[Time "23:55:57"]
[Variation "Scheveninger System, Modern, 9.f4 e5 10.Nb3 exf4 11.Bxf4"]
[WhiteElo "2200"]
[TimeControl "120+2"]
[Termination "adjudication"]
[PlyCount "250"]
[WhiteType "program"]
[BlackType "program"]

1. e4 c5 2. Nf3 d6 3. d4 cxd4 4. Nxd4 e6 5. Nc3 Nf6 6. Be2 Be7 7. O-O O-O
8. f4 Nc6 9. Be3 e5 10. Nb3 exf4 11. Bxf4 Be6
12. Qd3 Ne5 {+0.02/13 5}
13.Qb5 {+0.52/15 13} Qb8 {-0.01/14 4}
14. Rad1 {+0.71/14 3} Bd7 {-0.07/13 5}
15. Qb4 {+0.38/14 9} a5 {-0.06/15 10}
16. Qd4 {+0.71/15 7} Qc7 {-0.09/14 3}
17. Nc5 {+0.73/14 3} Bc6 {-0.13/14 3}
18. N5a4 {+1.08/13 3} h6 {-0.17/13 3}
19. Nb5 {+1.06/14 6} Bxb5 {+0.09/13 3}
20. Bxb5 {+1.06/13 0} Rad8 {-0.24/15 15}
21. Nc3 {+1.13/14 3} Rc8 {-0.28/15 4}
22. Be2 {+1.21/14 4} Rfe8 {-0.20/14 6}
23. h3 {+1.18/13 3} Nc4 {-0.12/14 9}
24. Kh2 {+0.90/13 8} Bf8 {-0.19/13 6}
25. Bd3 {+0.96/12 3} Be7 {-0.21/14 14}
26. b3 {+1.27/13 8} Ne5 {-0.15/16 4}
27. Nb5 {+1.01/14 3} Qc5 {-0.18/15 11}
28. Qxc5 {+0.97/15 6} Rxc5 {-0.14/13 0}
29. a4 {+0.84/15 4} Rcc8 {-0.09/13 2}
30. Bg3 {+0.89/15 3} Nfd7 {-0.18/15 4}
31. Rf5 {+0.84/14 8} b6 {-0.15/14 9}
32. Rf2 {+1.25/13 5} Nxd3 {-0.20/14 5}
33. cxd3 {+1.90/15 4} Nc5 {-0.36/15 3}
34. Bxd6 {+1.73/16 2} Nxb3 {-0.37/16 3}
35. d4 {+2.36/16 6} Rc4 {-0.55/16 11}
36. e5 {+2.35/16 5} Bg5 {-0.58/16 4}
37. h4 {+2.16/14 3} Be3 {-0.62/15 2}
38. Rf3 {+2.16/12 0} Bxd4 {-0.50/16 4}
39. Rxb3 {+1.93/15 2} Bxe5+ {-0.49/15 0}
40. Bxe5 {+2.21/16 2} Rxe5 {-0.64/14 0}
41. Rd8+ {+1.91/16 8} Kh7 {-0.63/13 0}
42. Nd4 {+1.76/17 5} Re4 {-0.45/14 3}
43. Nf3 {+1.98/17 5} Re6 {-0.53/14 2}
44. h5 {+2.23/15 10} Rxa4 {-0.45/14 2}
45. Rc3 {+1.94/15 2} g6 {-0.62/14 6}
46. Nd4 {+2.48/14 6} Re7 {-0.64/13 3}
47. Rd6 {+2.30/14 2} Rb4 {-0.70/14 3}
48. hxg6+ {+2.25/14 2} fxg6 {-0.69/12 0}
49. Nc6 {+2.37/15 6} Rc7 {-0.56/15 2}
50. Nxb4 {+2.40/15 3} Rxc3 {-0.52/14 0}
51. Nd5 {+2.40/14 0} Rc5 {-0.68/15 5}
52. Rd7+ {+2.61/14 2} Kg8 {-0.68/13 0}
53. Nxb6 {+2.61/13 0} Rh5+ {-0.70/16 4}
54. Kg1 {+2.57/16 3} Rb5 {-0.68/16 4}
55. Nd5 {+2.78/16 6} a4 {-0.46/14 2}
56. Nc3 {+3.74/16 2} Ra5 {-1.21/14 2}
57. Rd2 {+3.74/14 0} h5 {-1.26/14 2}
58. Ra2 {+3.43/16 4} h4 {-1.16/15 2}
59. Kh2 {+3.89/17 2} g5 {-1.20/16 2}
60. Kh3 {+3.73/17 2} Re5 {-1.14/17 2}
61. Nxa4 {+4.00/15 0} Re3+ {-1.12/17 3}
62. Kh2 {+3.75/17 2} Kf7 {-1.12/17 5}
63. Nb6 {+3.55/14 3} g4 {-1.02/16 3}
64. Nd5 {+3.54/15 2} Re4 {-0.98/16 1}
65. Nc7 {+3.47/15 3} Kf6 {-0.89/16 3}
66. Nb5 {+3.02/15 4} Re1 {-0.61/17 2}
67. Nc3 {+2.47/16 2} Kf5 {-0.21/16 2}
68. Ra5+ {+2.92/14 0} Kf4 {-0.21/14 0}
69. Nd5+ {+1.85/15 6} Kf5 {-0.22/15 3}
70. Nb4+ {+3.04/13 0} Ke4 {-0.22/13 0}
71. Ra2 {+1.20/14 2} Kf5 {-0.19/15 1}
72. g3 {+0.97/16 2} hxg3+ {-0.20/16 2}
73. Kg2 {+1.11/18 3} Re3 {-0.20/16 2}
74. Nc6 {+1.09/15 3} Rd3 {-0.19/15 2}
75. Rc2 {+1.03/16 2} Rd7 {-0.16/15 1}
76. Nb4 {+1.11/15 2} Rh7 {-0.16/16 2}
77. Rc5+ {+0.90/14 3} Ke4 {-0.16/16 1}
78. Kxg3 {+0.98/14 3} Rh1 {-0.16/16 2}
79. Rc4+ {+1.03/15 2} Kf5 {-0.16/16 2}
80. Rf4+ {+0.90/15 2} Ke6 {-0.16/15 3}
81. Rd4 {+0.95/14 2} Kf5 {-0.15/15 1}
82. Rd5+ {+0.93/15 1} Ke4 {-0.15/16 2} 83. Rc5 {+0.87/15 2} Rg1+ {-0.15/16 1} 84. Kf2
{+0.86/15 2} Rd1 {-0.15/16 2} 85. Kg2 {+0.83/15 2} Rd4 {-0.15/16 1} 86. Nc6
{+0.81/15 2} Rd3 {-0.15/16 2} 87. Rc4+ {+0.85/15 2} Kd5 {-0.15/15 2} 88.
Rc1 {+0.86/16 1} Rf3 {-0.15/15 2} 89. Rc2 {+0.82/15 1} Re3 {-0.15/16 1} 90.
Nb4+ {+0.86/16 2} Ke6 {-0.15/16 2} 91. Rc5 {+0.86/14 2} Rb3 {-0.15/16 2}
92. Nd5 {+0.95/15 1} Ke5 {-0.15/16 1} 93. Ra5 {+0.86/16 1} Rf3 {-0.15/15 1}
94. Ne7+ {+0.91/15 2} Kf4 {-0.15/16 2} 95. Rf5+ {+0.88/15 2} Ke4 {-0.15/17
2} 96. Rc5 {+0.93/16 2} Re3 {-0.15/16 1} 97. Rc6 {+0.81/15 1} Rd3 {-0.15/15
1} 98. Rc8 {+0.91/15 1} Ke5 {-0.15/16 2} 99. Rf8 {+0.86/15 2} Rb3 {-0.15/16
1} 100. Ng6+ {+0.90/16 2} Ke6 {-0.15/15 2} 101. Nf4+ {+0.89/17 2} Ke5
{-0.15/16 2} 102. Ne2 {+0.69/16 2} Ra3 {-0.15/16 1} 103. Rc8 {+0.85/16 1}
Rd3 {-0.15/16 1} 104. Rb8 {+0.92/16 1} Ke4 {-0.15/15 1} 105. Ng3+ {+0.87/14
1} Kd5 {-0.15/15 1} 106. Re8 {+0.91/13 2} Rc3 {-0.16/14 1} 107. Nf5
{+0.88/14 2} Rb3 {-0.18/13 2} 108. Ne3+ {+1.11/14 1} Kd4 {-0.19/15 2} 109.
Nxg4 {+1.03/14 1} Rc3 {-0.19/15 2} 110. Kf2 {+1.01/13 2} Kc5 {-0.19/14 2}
111. Ne3 {+1.13/14 2} Rb3 {-0.22/14 1} 112. Ke2 {+1.12/12 2} Kd4 {-0.23/13
1} 113. Kf3 {+1.33/13 2} Rb2 {-0.24/13 1} 114. Rd8+ {+1.32/13 1} Kc5
{-0.24/11 0} 115. Ke4 {+1.25/14 2} Re2 {-0.28/14 1} 116. Rd5+ {+1.31/14 2}
Kc6 {-0.28/15 1} 117. Rh5 {+1.38/14 2} Re1 {-0.27/14 1} 118. Kd4 {+1.28/14
2} Rg1 {-0.28/13 3} 119. Rh8 {+1.30/13 2} Kb5 {-0.28/14 2} 120. Nf5
{+1.36/13 1} Kc6 {-0.27/15 2} 121. Rh6+ {+1.41/14 1} Kb5 {-0.27/15 2} 122.
Nd6+ {+1.29/13 2} Kb4 {-0.28/15 2} 123. Rh4 {+1.37/14 1} Rd1+ {-0.28/15 2}
124. Ke5+ {+1.35/14 2} Ka3 {-0.28/15 2} 125. Nf5 {+1.34/14 2} Kb3 {-0.28/13
2} 126. ... {½-½ Arena Entscheidung} 1/2-1/2


Aus Thorstens Post (http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=43248).



Und nu?
Parent - - By Michael Scheidl Date 2011-10-26 19:54 Edited 2011-10-26 19:56
Die Grafik ist nicht nur häßlicher ( ok, ist Geschmacksache) sondern sogar falsch: Scid weiß nicht daß Arena - leider - die Bewertungen aus Sicht der jeweiligen Seite in die PGN gespeichert hat. D.h. eine negative Bewertung von Schwarz bedeutet in dem Fall einen einen Vorteil für Weiß. Das dürfte sich noch an der Vorgangsweise von WinBoard orientiert haben; UCI-Engines bewerten bekanntlich per Default aus Sicht von Weiß.

Scid hat die Bewertungen Houdinis also unschuldigerweise in die verkehrte Richtung eingetragen. Vielleicht gibt es dafür eine Option im Interface? Mir ist dasselbe Problem aus Shredder Classic bekannt, wenn ich eine Arena-PGN dort anschaue.

Arena selber stellt das richtig dar:



Zeigt im Prinzip dasselbe, obwohl der Vergleich darunter leidet, daß die Rechentiefen oft recht unterschiedlich waren. Für den speziellen Zweck, der Ähnlichkeit der Bewertung nachzuspüren, sind identische Rechentiefen besser (natürlich negiert das dann Unterschiede der Suchleistung).

In meinem obigen Beispiel im anderen Posting ist doch gut zu erkennen, wie beide Engines bei den Bewertungsänderungen konform gehen, und sich im Profil nur nach der Größe der Zahlen unterscheiden. Ich habe während der 50 Partien live zugeschaut und das war jedesmal dasselbe.
Parent - By Peter Behringer Date 2011-10-26 20:48
Hallo Michael;

erstens: mein Bild ist weg (@admin: vielleicht besser nur den Link belassen - also ohne 'Direktsicht' - indes wird ohne die Anzeige von gar nix überhaupt nicht deutlich, aus welchem Grunde die Partiebewertungsrgaphfunktion von Scid besser als die Fritzens sein soll).

zweitens: BwGFkt Arenas* gefällt mir

drittens: die Grafik kann nicht falsch sein (die Quelle, also die Pgn, meinetwegen schon - bzw. 'unmodern' - Scid korrigiert die Werte aus der Pgn nur nicht; eine Funktion zur bes. Interpretation gibt es nicht)

viertens: die Bewertungen aus Sicht von Weiß sind angenehmer; selbst unter Winboard/xboard ist dies mittlerweile für Matches/Turniere einstellbar

*man kann nun auch sehr schön erkennen, daß sich die Behauptung (die Du allerdings nie aufgestellt hast), Strelka multipliziere dauernd irgend etwas internes (genauer: die Houdini-Seele)  mit 4, so nicht halten läßt

Grüße
Up Topic Hauptforen / CSS-Forum / Houdini 1.5a / Strelka 5: Beobachtungen

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill