Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Strelka 5.5 obsiegt im Familienzwist
- - By Michael Scheidl Date 2012-04-24 14:03
1:30m+0,5s auf N455/1,66 GHz
ponder off, 64 MB Hashtables
Singlethread, 32 Bit
S.Canbaz' Top10-Eröffnungen
Arena 2.0.1, Windows 7 32 Bit


   Engine          Score                    St
1: Strelka 5.5     39.5/60 ····················
2: Strelka 5.1     10.0/20 011===010=0101===1=0
3: Houdini 1.5a-2d 7.5/20  =00=010=01====0=0===
4: Ivanhoe 946hm-G 3.0/20  00=00000=0000=0=0010


65,8%! Das Resultat gegen Ivanhoe kommt mir abnormal vor, aber die Partieprofile sehen unverdächtig aus (RT. ok usw.), es scheint auch keine Zeitüberschreitungen gegeben zu haben. - Witzig, wie Strelka gegen die eigene Vorgängerversion "diplomatisch" remisierte.

Der kürzeste Schwarzsieg war:

Event:
Ort:
Datum:

Weiss:
Schwarz:

Ergebnis
Board
Parent - - By Benno Hartwig Date 2012-04-24 14:13
[quote="Michael Scheidl"]1:30m+0,5s auf N455/1,66 GHz[/quote]Ich finde ja auch, dass 10min-Partien oder auch 5min-Partien ein Spielstärkegefüge aufzeigen, welches denen bei längeren Zeiten doch sehr stark ähnelt.
Ist dies aber wirklich auch noch gegeben bei 1:30m+0,5s, also wohl ca. 2min pro Partie? Insb. wenn der Prozessor nicht zu den schnellsten gehört?
Oder kommt es da ggf. doch zu drastischeren Verschiebungen?

Als ich seinerzeit mit Ipollit rumprobierte war dessen drastische Überlegenheit bei 1m-Partien auffällig, sie brach aber schon bei 3min/Partie deutlich ein.
Diese ultrakurzen Zeiten betrachte ich dann doch mit etwas Skepsis.

Benno
Parent - - By Michael Scheidl Date 2012-04-24 15:24
Zitat:
Oder kommt es da ggf. doch zu drastischeren Verschiebungen?

Schwer zu sagen; bei Stefan Pohls TEB-Blitztests mit ähnlicher Bedenkzeit - allerdings viel besserer CPU - sieht es nicht danach aus. Ich schaue üblicherweise in meine Partieprofile und kann keine "Anomalien" feststellen, insbesondere sind die Rechentiefen (meist) relativ ok oder sagen wir, erträglich.

1m+1s ist so ähnlich, und Fritz hält ja die Durchschnitt-RT. von Enginepartien fest:

[Event "DCh33 "]
[Site "?"]
[Date "2012.04.23"]
[Round "11.5"]
[White "DoubleCheck 3.3 JA"]
[Black "Texel 1.01 32-bit"]
[Result "0-1"]
[ECO "A21"]
[Annotator "-0.01;-0.40"]
[PlyCount "104"]
[EventDate "2012.04.22"]
[EventType "simul"]
[Source "User"]
[TimeControl "60+1"]

{Intel(R) Atom(TM) CPU N455   @ 1.66GHz 1662 MHz  W=12.8 plies; 140kN/s;
Balanced-16.ctg  B=12.7 plies; 266kN/s; Balanced-16.ctg} 1. c4 {B 0} e5 {B 0}
2. Nc3 {B 0} Bb4 {B 0} 3. Nd5 {B 0} Be7 {B 0} 4. d4 {B 0} d6 {B 0} 5. e4 {B 0}
Nf6 {B 0} 6. Nxe7 {B 0} Qxe7 {B 0} 7. f3 {B 0} exd4 {B 0} 8. Qxd4 {B 0} Nc6 {
B 0} 9. Qc3 {B 0} O-O {B 0} 10. Be3 {-0.01/10 3} Ne8 {-0.40/11 3 (Nd7)} 11. Bd3
{0.06/11 3 (0-0-0)} Qh4+ {-0.21/12 3 (f5)} 12. Kf1 {0.17/11 3 (g3)} Ne5 {-0.54/
10 3 (f5)} 13. Ne2 {0.25/11 3} f5 {-0.54/10 2 (Be6)} 14. Bf2 {0.23/10 3 (exf5)}
Qe7 {-0.71/11 2} 15. Re1 {0.00/11 3 (exf5)} Nxd3 {-1.05/12 2} 16. Qxd3 {-0.02/
13 3} fxe4 {-0.89/12 2} 17. Nc3 {-0.07/12 2 (Qxe4)} exd3 {-0.97/12 2} 18. Rxe7
{-0.12/13 2} a6 {-0.86/12 2 (b6)} 19. Nd5 {0.09/12 2} b5 {-0.64/12 3 (Bf5)} 20.
c5 {0.15/12 2} c6 {-0.83/12 4 (Bf5)} 21. Nb4 {0.17/12 2} Bf5 {-0.49/12 2 (dxc5)
} 22. Nxc6 {0.44/12 2} Bg6 {-0.51/12 6 (dxc5)} 23. Rb7 {0.85/11 2 (b4)} Rf7 {
-0.49/12 2 (Kh8)} 24. Ne7+ {0.76/14 2} Kf8 {-0.56/14 2} 25. Nxg6+ {0.74/14 2}
hxg6 {-0.68/13 2} 26. Rb6 {0.55/13 2} Rc7 {-1.07/13 2} 27. b4 {0.20/13 2} a5 {
-1.42/14 2} 28. bxa5 {-0.85/11 2 (Be3)} Rxa5 {-2.76/13 2} 29. g4 {-1.67/12 2}
dxc5 {-2.74/13 2} 30. Kg2 {-1.80/12 2} c4 {-2.97/12 2} 31. a4 {-1.66/11 2} d2 {
-3.36/12 2 (bxa4)} 32. Rxb5 {-1.60/10 2 (Be3)} c3 {-4.37/13 2} 33. Be3 {-2.84/
13 2} Rxb5 {-4.42/13 2} 34. axb5 {-2.97/16 2} Nd6 {-5.39/13 2 (Rd7)} 35. Kg3 {
-1.32/11 2 (b6)} Re7 {-5.78/14 2 (Nc4)} 36. Kf2 {-3.02/14 2} Nc4 {-5.83/14 2}
37. Bxd2 {-3.24/15 2} cxd2 {-6.11/15 2} 38. Rd1 {-3.63/14 2} g5 {-6.44/16 2
(Rb7)} 39. b6 {-4.09/14 2 (h3)} Rb7 {-6.63/17 2} 40. f4 {-4.74/14 2 (Ke2)} gxf4
{-9.18/14 2} 41. h4 {-5.75/13 2 (g5)} Rxb6 {-9.44/14 2} 42. h5 {-5.87/12 2} Rd6
{-9.70/15 2 (Kf7)} 43. Ke2 {-8.07/14 2} f3+ {-10.28/16 2} 44. Kxf3 {-8.28/14 2}
Nb2 {-10.55/16 2} 45. Ke2 {-8.40/12 2 (Rxd2)} Nxd1 {-11.35/12 1 (Re6+)} 46.
Kxd1 {-17.20/13 2} g5 {-#7/11 1 (Rd4)} 47. hxg6 {-17.76/10 2 (h6)} Kg7 {-#6/9
1 (Kg8)} 48. Ke2 {-#10/9 1} d1=Q+ {-#5/8 1} 49. Ke3 {-#11/9 0} Rd3+ {-#4/8 2
(Qd3+)} 50. Kf4 {-#6/5 0} Qf3+ {-#3/6 0} 51. Ke5 {-#4/3 0} Qe3+ {-#2/4 0 (Rd5+)
} 52. Kf5 {-#2/1 0} Rd5# {-#1/2 0} 0-1

Ich gebe aber zu daß mir Zeitkontrollen wie von (min.) 3m+2s aufwärts lieber wären, doch dann komme ich in einer mir angenehmen Gesamt-Testzeit nur auf ganz magere Partienzahlen...
Parent - - By Clemens Keck Date 2012-04-24 16:57
Ja wenn man sowas mit brauchbaren Zeiten - also 3 +2 oder besser 5 +3 oder am besten 40Z in 20min testen will braucht man (stromsparende) hardware. 2 bis 3 quads kann man locker mit solchen Tests beschäftigen. Mit Intels neuster Ivy Bridge kommt man pro quad gerade noch auch 165 Watt bei Vollast.
Aber Zum Glück gibt es genug seriöse Tester bzw. Testergruppen, da kann man sich den Aufwand sparen.

MfG Clemens Keck
Parent - - By Kurt Utzinger Date 2012-04-24 18:00
Hallo Clemens
Spielt heute - wo es nur noch um statistische Werte geht - kaum mehr eine Rolle, ob Partien
mit 1m+1s oder 3m+2s gespielt werden. Beides hat mit Qualität ja nichts mehr zu tun.
Mfg
Kurt
Parent - By Michael Scheidl Date 2012-04-24 18:14
Also nicht daß ich jetzt 1+1 propagieren würde, denn das ist für mich ein eher "zähneknirschender" Kompromiß. Aber 3m+2s produziert m.E. durchaus Qualität, insbesondere wenn es auf Multicore-CPUs und 64 Bit-Software geschieht. Die Rechentiefen sind gewaltig und irgendwelche "prinzipiellen" Probleme durch Zeitknappheit sind selbst auf meinem Atom nicht festzustellen.
Parent - - By Stefan Pohl Date 2012-04-27 08:34
[quote="Michael Scheidl"]
Zitat:
Oder kommt es da ggf. doch zu drastischeren Verschiebungen?

Schwer zu sagen; bei Stefan Pohls TEB-Blitztests mit ähnlicher Bedenkzeit - allerdings viel besserer CPU - sieht es nicht danach aus.


Das stimmt. Als ich die TEB-Liste von 30''+450ms auf 60''+750ms umstellte (also verdoppelte Bedenkzeit) gab es keine Verschiebungen in der Platzierung. Einzige Veränderung war, daß alle Engines elomäßig dichter zusammenrückten, genau was auch zu erwarten war. Wirklich kritisch würde es erst bei noch kürzeren Bedenkzeiten, da selbst die LittleBlitzerGUI, die ja gar keine Brettgrafik hat und daher extrem klein und effizient ist, natürlich etwas Zeit braucht um nach jedem gespielten Zug diesen auf Legalität zu prüfen und an die gegnerische Engine zu übergeben und diese losrechnen zu lassen. Das ist aber wie gesagt durchaus GUI-abhängig, daher kann ich hier nur für die LittleBlitzerGUI sprechen und habe folgendes festgestellt: Kritisch wird es bei weniger als 200ms Bedenkzeit, da kann es wirklich zu merkwürdigen Ergebnissen kommen. Ergo sollte man immer einen FischerBonus von mindestens 200ms einstellen. Um auch den Zeiteinteilungs-Algorithmus einer Engine testen zu können, sollte man dazu eine Basiszeit wählen, die mindestens 50 mal größer ist, damit der Zeiteinteilungsalgorithmus überhaupt was zum einteilen hat. Daher würde ich 10''+200ms als absolute Schmerzgrenze für sinnvolle Enginetests ansehen. Für Vorab-Schnelltests nehme ich immer 1/3 der TEB-Zeit, also 20''+250ms. Das gibt Ergebnisse, die schon sehr gut sind, wenn man sie mit Ergebnissen mit längerer Bedenkzeit vergleicht. Wobei eben immer gilt: Je länger die Zeit, desto enger rücken alle Ergebnisse und Engines an die 50%-Marke heran.

Gruß - Stefan
Parent - By Stefan Pohl Date 2012-04-27 08:41
[quote="Stefan Pohl"]
Als ich die TEB-Liste von 30''+450ms auf 60''+750ms umstellte
[/quote]

Es waren 30''+400ms nicht 450ms, sorry.

Noch eine kleine Tempoeinschätzung: Wenn man die LittleBlitzerGUI so einstellt, daß sie niemals selber Remis gibt (Remis erst bei 500 Zügen z.B.) und auch nie für eine Engine aufgibt (9000 cp für 50 Züge z.B.), also alle Partien bis zum bitteren Ende spielt, und man hat ein 4-Kern-System und läßt somit 4 Partien parallel laufen, dann schafft man mit TEB-Tempo (60''+750ms) ca. 1 Partie pro Minute (weil jede Partie etwa knapp 4 Minuten dauert) und somit etwa 1500 Partien in 24 Stunden. Bei 1/3 TEB-Zeit logischerweise jeweils 3 mal soviel. Damit kommt man schon bei 8-Stunden Übernacht-Tests zu statistisch sehr sicheren Resultaten. Daher denke ich, noch schneller muß nun wirklich nicht sein.

Gruß - Stefan
Up Topic Hauptforen / CSS-Forum / Strelka 5.5 obsiegt im Familienzwist

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill