Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / SWCR: Stockfish 2.1.1 JA x64 PHQ-3 LIVE im Result-Mode
- - By Frank Quisinsky Date 2011-07-08 01:09
Hallo zusammen,

zeitgleich mit Fire 2.2 xTreme x64 läuft auch eine super aggressive Einstellung (PHQ-3) von Stockfish 2.1.1 JA x64 im Live Result-Mode.

Viel Spaß beim Beobachten!

Gruß
Frank
Parent - - By Benno Hartwig Date 2011-07-08 08:25
Hallo Frank, deine Liste weist jetzt aus

Code:
Stockfish 2.1.1 JA x64 PHQ-1   2947
Stockfish 2.1.1 JA x64         2940
Stockfish 2.1.1 JA x64 PHQ-2   2936
und das ist, auch bei gut 1200 Partien je Engine, sehr wenig Abstand der Spielstärken.
Ich habe noch mal nachgesehen: Bei 1200 Partien ist die Wahrscheinlichkeit dafür, dass eine Engine (die ja z.B. 2941 ELO haben könnte) um mindestens 6 ELO falsch bewertet wird, immerhin fast 50%.
Deine Beobachtungen zum sehr verschiedenen Spielverhalten sind natürlich interessant.
Einen echten Hinweis darauf, dass die Spielstärke wirklich unterschiedlich ist, erhielten wir aus meiner Sicht durch diese Ergebnisse allerdings nicht.

Benno
Parent - - By Frank Quisinsky Date 2011-07-08 16:45
Hi Benno,

schaue ich bei allen Engines nach, die mehr als 1.200 Partien gespielt haben und vergleiche das mit der Anzahl der derzeitigen Partien ist die Wahrscheinlichkeit bei mir keinesfalls 50% sondern 17%. Im übrigen habe ich ja auch alle SF Versionen bei ponder = off die gleiche Partieanzahl spielen lassen. Wir haben also 2.400 Partien pro den bislang getesteten 4 Engines. Nehme ich die Partien von Andrea raus, würde ich die ponderlosen dazu packen haben wir folgendes Bild:

PHQ-1, 2.949
PHQ-2, 2.942
default, 2.938

Sehe hier keine großen Veränderungen wie zum Stand nach 1.200 Partien. Also ob 1.200 oder 2.400 ... die durchschnittliche Abweichung von 1.000 auf 2.000 liegt in der SWCR übrigens derzeit bei 1.4 ELO.

Du merkst, auf die ErrBar achte ich nicht, bringt nichts.
Zu fehlerhaft im Vergleich mit tatsächlichen Resultaten.

Gruß
Frank
Parent - - By Frank Quisinsky Date 2011-07-08 20:26
Hallo zusammen,

der Test wurde eingestellt. Habe hierzu kurz eine News verfasst.

Gruß
Frank
Parent - - By Thomas Koehler Date 2011-07-09 10:06
Hallo Frank,

deine PHQ-Tests haben mich inspiriert, selbst auch ein paar Settings zu probieren, nachdem ich mich schon damit abgefunden hatte, dass Agg. 157 zwar vermutlich mehr bringt als default, aber nicht so viel Biss hat wie Vers. 1.7.1 mit Agg. 159 oder 160...

Dein PHQ2 hat R3 im 5'-Blitz (120 Partien) fix und alle gemacht. Die PHQs sind gegen stärkere Engs womöglich nicht so erfolgreich, aber gut für Showkämpfe gegen Schwächere (wobei R3 kaum schwächer ist...).

In Respekt zu Bennos Untersuchungen http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?tid=3796
bin ich der Überzeugung, dass kleine Parameter-Variationen zu starken Änderungen des Spielverhaltens führen, was sich an Teststellungen zeigt. Es handelt sich M.E. also nicht nur um "Rauschen".
So habe ich deine PHQ mal etwas variiert:
(1)
M. Mid 125 (belassen)
M. End 104 (statt 100)
Agg 148 (statt 150)
cow 75 (belassen)
Taktisch etwas prunig, aber sehr schnell und ich denke nicht minder bissig als dein PHQ. Womöglich sollten MM und ME nicht so stark voneinander abweichen, aber das ist nur eine vage Vermutung.

Behauptet gegen Houdini 1.5 hat sich das folgende Setting, was R3 ebenfalls verprügelt hat und taktisch sehr solide scheint. Es zeigt keine Schwächen, dafür ebenfalls spektakuläre Kurzpartien:
(2)
M. Mid 104
M. End 101
Agg 147
Cow 98

Vielleicht hast du ja Zeit und Lust, mal ein Setting zu testen. Ich habe dazu nicht die Möglichkeiten (und den Enthusiasmus).

Beste Grüße

Thomas
Parent - - By Ludwig Bürgin Date 2011-07-09 16:21
Hallo Thomas

Gratulation.

Das letztgenannte Setting spiele ich im Maschinenraum .Läuft sehr gut

Gruß Ludwig
Parent - - By Thomas Koehler Date 2011-07-09 20:00
Hallo Ludwig,

das freut mich zu hören. Wäre toll wenn du später etwas Konkreteres sagen könntest (Highlight oder Vergleich mit Default...)

Gruß Thomas
Parent - - By Ludwig Bürgin Date 2011-07-10 10:07
Hallo Thomas

Anbei eine gespielte Partie im Maschinenraum.

[Event "Wertungspartie, 3m + 0s"]
[Site "Maschinenraum"]
[Date "2011.07.10"]
[Round "?"]
[White "SyKo, HOUDiNi 1.5a x64"]
[Black "Dinkelberger, Stockfish 2.1.1 JA "]
[Result "1-0"]
[ECO "C02"]
[WhiteElo "2655"]
[BlackElo "2483"]
[Annotator "0.16;-0.56"]
[PlyCount "163"]
[EventDate "2011.07.10"]
[TimeControl "180"]

{HOUDiNi 1.5a x64 (6 cores): 18.8 plies; 17.180kN/s Intel(R) Core(TM) i7 CPU 
970  @ 3.20GHz 4020MHz, BookDF12.ctg, 768 MB} 1. e4 {B 0} e6 {B 0} 2. d4 {B 0}
d5 {B 0} 3. e5 {B 0} c5 {B 0} 4. c3 {B 0} Nc6 {B 0} 5. Nf3 {B 0} Qb6 {B 0} 6.
a3 {B 0} f6 {B 0} 7. Bd3 {B 0} fxe5 {B 0} 8. dxe5 {B 0} c4 {-0.56/18 4} 9. Bc2
{B 0} g6 {-0.36/21 4} 10. O-O {B 0} Bg7 {-0.44/23 4} 11. Nbd2 {B 0} Nge7 {-0.
56/22 8} 12. Qe2 {B 0} O-O {-0.48/22 7} 13. b3 {B 0} Qc7 {-0.52/21 4} 14. Re1 {
B 0} b5 {-0.52/22 7} 15. Bb2 {B 0} Bd7 {-0.24/21 5} 16. a4 {0.16/20 6} a6 {-0.
40/21 4} 17. bxc4 {0.17/19 8} bxc4 {-0.36/23 0} 18. Ba3 {0.16/21 4} Bh6 {-0.28/
22 6 (Qa5)} 19. a5 {0.24/20 12} Rf7 {-0.28/24 0} 20. Bd6 {0.21/18 4} Qd8 {-0.
32/22 6 (Qa7)} 21. Bc5 {0.20/19 3} Nxa5 {-0.32/22 3 (Na7)} 22. Reb1 {0.08/18 5}
Nac6 {-0.44/22 0} 23. h3 {0.10/18 3} Na7 {-0.72/20 4 (Nf5)} 24. Bb6 {-0.08/18 5
} Qc8 {-1.21/21 4 (Qf8)} 25. Be3 {-0.26/19 11} Bg7 {-0.88/24 0} 26. Nf1 {-0.24/
19 3} Nb5 {-0.96/20 0} 27. Bd2 {-0.28/19 8} Nf5 {-0.92/23 0 (Qc5)} 28. N1h2 {
-0.21/17 3} Qf8 {-0.76/17 5 (Qc5)} 29. Ng5 {-0.14/17 3} Re7 {-0.84/19 4} 30.
Ngf3 {-0.11/18 2} Ree8 {-0.64/19 4 (Rf7)} 31. Ng4 {0.00/16 4} Red8 {-0.64/20 3
(Bc6)} 32. Re1 {0.00/15 3} Rdc8 {-0.60/18 4} 33. Rec1 {0.00/18 0} h5 {-0.64/19
7} 34. Ne3 {0.01/19 0} Ne7 {-0.52/21 8} 35. Ra2 {0.02/18 2} Qd8 {-0.48/18 2
(a5)} 36. Nd1 {0.16/18 2} Qc7 {-0.68/20 4} 37. Bg5 {0.08/19 0} Nf5 {-0.40/19 2}
38. Bxf5 {0.07/19 5} gxf5 {-0.56/20 3} 39. Nb2 {0.11/20 0} Be8 {-0.52/17 3} 40.
Na4 {0.04/20 7} Rab8 {-0.56/23 0} 41. Qd2 {0.02/19 4} Qf7 {-0.80/19 2 (a5)} 42.
Qe3 {0.01/16 1} Qf8 {-0.64/20 4 (a5)} 43. Rca1 {0.02/18 1} Rb7 {-0.64/24 3 (a5)
} 44. Rb1 {0.02/17 2} Bg6 {-0.64/22 2 (Rcb8)} 45. Rbb2 {0.03/18 2} Rbb8 {-0.64/
23 2} 46. Ra1 {0.02/18 8} Rc7 {-0.64/26 0 (Be8)} 47. Kh1 {0.04/17 1} Rc6 {-0.
64/22 2 (Rf7)} 48. Qf4 {0.10/18 1} Rcc8 {-0.64/22 2} 49. Qh4 {0.14/18 0} Be8 {
-0.64/19 2 (Qe8)} 50. Bf6 {0.18/18 4} Qf7 {-0.64/18 2 (Rb7)} 51. Re2 {0.32/16 1
} Qg6 {-0.76/19 2 (Bh6)} 52. Ng5 {0.30/18 2} Rc6 {-0.68/18 4} 53. Bxg7 {0.22/
20 0} Qxg7 {-0.80/19 4} 54. Re3 {0.22/20 0} Qh6 {-0.68/16 1} 55. Rg3 {0.20/19 6
} Kf8 {-0.76/20 1} 56. Qf4 {0.20/18 1} Rc7 {-0.92/16 2 (Rd8)} 57. h4 {0.35/17 1
} Na7 {-0.88/21 1 (Rd8)} 58. Qe3 {0.42/17 1} Rb5 {-0.52/20 1} 59. Re1 {0.33/19
5} Nc8 {-0.88/20 1} 60. Kg1 {0.33/18 1} Rc6 {-0.80/22 1} 61. Ra1 {0.25/19 0}
Bd7 {-0.80/21 0 (Rc7)} 62. Qd4 {0.23/17 2} Rc7 {-0.76/19 1} 63. Nh3 {0.78/17 0}
Ra5 {0.00/17 1} 64. Nf4 {1.14/18 0} Kf7 {0.96/19 0 (Qh7)} 65. Rg6 {1.89/15 0}
Qxg6 {1.77/21 0} 66. Nxg6 {2.03/17 0} Kxg6 {2.46/21 1} 67. Qf4 {2.24/20 0} Kf7
{2.70/21 2 (Bxa4)} 68. Qh6 {3.16/18 1} Ke8 {3.19/16 1 (Rb7)} 69. Qxh5+ {3.43/
20 1} Kd8 {3.83/23 0} 70. Qh8+ {3.44/21 0} Be8 {4.20/23 0} 71. h5 {3.63/22 0}
Re7 {3.51/22 0} 72. h6 {3.72/23 1} Kc7 {4.16/22 0} 73. h7 {3.87/23 0} Rxa4 {4.
84/22 0} 74. Rxa4 {3.82/24 0} Bxa4 {3.31/21 0} 75. Qg8 {3.75/24 0} Rxh7 {3.51/
22 0} 76. Qxh7+ {3.79/23 0} Bd7 {4.25/23 1} 77. Qg7 {3.66/24 0} Na7 {3.75/19 1
(a5)} 78. f4 {5.01/15 0} d4 {5.73/16 1 (Kc6)} 79. cxd4 {5.82/18 1} c3 {6.94/21
0} 80. Qe7 {5.82/21 0} c2 {6.90/21 0 (Nc6)} 81. Qc5+ {6.76/22 3} Kd8 {7.41/24 0
} 82. Qxc2 {6.93/20 1 Dinkelberger,Stockfish 2.1.1 JA 6 gibt auf} 1-0

Solche Spielausgänge passieren leider sehr oft.
Auch mit Eröffnungsänderungen ist dem nicht beizukommen.
Werde mal eine Reihe 16 min. Partien spielen,mal sehen ob das besser wird ?

Allerdings konnten auch ein paar wenige Siege gegen Spitzen-Houdinis erreicht werden, was mit dem normalen Stockfish kaum möglich ist .

Gruß Ludwig
Parent - - By Thomas Koehler Date 2011-07-11 18:25
Hallo Ludwig,

der Fehler liegt hier wohl eher bei Houdini. Das Programm spielt zu stark!
Stocki hatte im 62. und 63. Zug kein gutes Händchen. Die Erkenntnisse kommen aber innerhalb weniger Sekunden, je nach Setting.

Etwas vorsichtiger, womöglich aber erfolgreicher ist das hier:
(3)
MM 115
ME 108
Agg 147
Cow 84

Nicht der Draufgänger wie (1), aber sehr umsichtig und allen Lebenslagen gewachsen...

Extremeres Setting führt offenbar nicht unbedingt zu extremerem Spielverhalten.

Vielleicht kannst du einen Houdi damit quälen...

Gruß Thomas
Parent - - By Ludwig Bürgin Date 2011-07-13 11:38
Hallo Thomas

Es ist Ernüchterung bei mir eingekehrt.
Mit Deinen Settings kann man tatsächlich auch mal gegen einen Spitzenspieler mit Stockfish im Maschinenraum gewinnen.
Über mehrere gespielte Partien scheint es in der Gesammtheit eher nachteilig zu sein.
Bin aber überascht, wie man mit drehen an den Einstellungen  das Spielverhalten von Stockfish beeinflussen kann.
Mache jetzt selber Versuche mit Settings  und teste sie im Maschinenraum.

Gruß Ludwig
Parent - By Thomas Koehler Date 2011-07-14 13:33
Hallo Ludwig,

(2) ist der ultimative Draufgänger mit den kürzesten Partien im Vergleich, gern mal unter 35 Zügen. Gegen Top-Engines mit hervorragender Taktik bringt das ab und zu ein Highlight an Spielkunst, aber nicht die Performance. Es ist wohl immer ein Kompromiss.
So konnte gegen Houdini das Rating gehalten werden (-88 Elo), gegen Critter nicht ganz (-77 Elo, sollten 30 mehr sein.)
Gegen Komodo siehts da schon besser aus (+54) und gg. R3 ebenso (+72). Jeweils 120 Partien.

Insgesamt wohl um einiges stärker, aber womöglich nicht gegen die Houdinis im MR. Für Analysen auch recht eindrucksvoll, auch mit ME 107 statt 101. Da habe ich noch keine Partien dazu.

Es würde mich aber interessieren wenn du was Nettes zusammenbrauen konntest...

Gruß Thomas
Parent - - By Frank Quisinsky Date 2011-07-09 16:44 Edited 2011-07-09 16:50
Hallo Thomas,

schön das ich Dich animieren konnte. Ich habe mir Deine Settings angesehen und ein bissel experimentiert.

Variante 1:
Ist ja fast PHQ, ganz minimale Abweichungen.
Bei meinem Stellungstest (40 Aufgaben) fast das gleiche Ergebnis.

Variante 2:
Wäre auch fast die Variante von Stefan Pohl, da im Grunde nur deutlich der "Aggresseness" Wert hochgeschraubt wurde. Dieses Setting habe ich mir vor dem PHQ-1 Test angesehen und darauf hin ja PHQ-1 erstellt. Die Ergebnisse gegen Houdini, Rybka waren besser als bei PHQ-1, allerdings die Ergebnisse gegen schwächere Engine teils deutlich schwächer. Der Grund warum bei Aggresseness 150 der Mittespielparameter nach oben sollte bzw. Feigheit deutlicher nach unten.

Sofern ich mich erinnere war in einem 1.000 Partien Ponder = off Test das Ergebniss von dem Pohl Setting:

Gegen die TOP-12: + 12 zu default
Gegen Platz 13-24: - 8 zu default

Das Ergebnis war also minimal besser als default, wie auch derzeit mit +7 PHQ.
Allerdings erzeugt PHQ doppelt so viele kurze Gewinnpartien als default.
Das Setting von Stefan erreichte bei den knapp 1.000 Partien 6.5% kurze Gewinnpartien, also nicht 8% wie bei PHQ.

Werde jetzt zunächst mal keine weiteren Settings testen. Muss noch so viel einpicken in die SWCR.
Der komplette 32bit Bereich steht seit geraumer Zeit.

Vielleicht wieder zum Ende des Jahres etwas besonderes ausprobieren!

Dir weiterhin viel Spaß mit den SF Settings.
Denke ich habe alles durch und glaube das Agg. hoch, Feigheit runter und Mittelspiel minimal hoch die besten Ergebnisse produziert. Glaube das waren auf allen meinen Maschinen ca. 7.000 SF Games

Viele Grüße
Frank
Parent - By Thomas Koehler Date 2011-07-09 20:12
Hallo Frank,

danke für die Antwort. Das Setting von Stefan Pohl kenne ich nicht. Aber es geht ME nicht nur darum, intuitiv die Zahlenbereiche abzuschätzen. Kleine Änderungen können das Spielverhalten erheblich beeinflussen.
Ist irgendwo ersichtlich, welche Engs sich als besondere Angstgegner etabliert haben? Da mache ich vllt. selbst mal ein Match.

Gruß Thomas
Up Topic Hauptforen / CSS-Forum / SWCR: Stockfish 2.1.1 JA x64 PHQ-3 LIVE im Result-Mode

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill