Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / LS-Rangliste: Stockfish hats geschafft...
1 2 Previous Next  
Parent - - By Stefan Pohl Date 2013-09-07 10:49
[quote="Stefan Schiffermüller"]
Ich sehe gerade, dass der laufende Regressionstest nach 12000 Partien bei +24 ELO gegenüber Stockfish 4 liegt. Dabei sind die beiden letzten Patches von heute, die jeweils auch nochmal ein paar ELO ausmachen sollten, noch nicht mit inbegriffen.
[/quote]

Das darf man nicht überbewerten. Spielt eine Engine gegen eine ältere Version von sich selbst sind die Ergebnisse meist zu gut. Bei mir in der LS-Rangliste sind es +14 von Stockfish 4 zu 130830 und die Version 130905 hatte ich nach 3500 Partien abgebrochen, weil sie 2 Elo schlechter lag (also praktisch identisch zur 130830).

Stefan
Parent - - By Stefan Schiffermüller Date 2013-09-07 11:13
[quote="Stefan Pohl"]
[quote="Stefan Schiffermüller"]
Ich sehe gerade, dass der laufende Regressionstest nach 12000 Partien bei +24 ELO gegenüber Stockfish 4 liegt. Dabei sind die beiden letzten Patches von heute, die jeweils auch nochmal ein paar ELO ausmachen sollten, noch nicht mit inbegriffen.
[/quote]

Das darf man nicht überbewerten. Spielt eine Engine gegen eine ältere Version von sich selbst sind die Ergebnisse meist zu gut.[/quote]
Ist klar. Es geht ja nur um die Relation. Zum Vergleich: Der Regressionstest SH4 vs. SH3 ergab +56.66 ELO. Ich bin gespannt, ob KomodoCCT in deinem nächsten Test überrundet werden kann.

Stefan
Parent - - By Stefan Pohl Date 2013-09-07 11:17
[quote="Stefan Schiffermüller"]
[quote="Stefan Pohl"]
[quote="Stefan Schiffermüller"]
Ich sehe gerade, dass der laufende Regressionstest nach 12000 Partien bei +24 ELO gegenüber Stockfish 4 liegt. Dabei sind die beiden letzten Patches von heute, die jeweils auch nochmal ein paar ELO ausmachen sollten, noch nicht mit inbegriffen.
[/quote]

Das darf man nicht überbewerten. Spielt eine Engine gegen eine ältere Version von sich selbst sind die Ergebnisse meist zu gut.[/quote]
Ist klar. Es geht ja nur um die Relation. Zum Vergleich: Der Regressionstest SH4 vs. SH3 ergab +56.66 ELO. Ich bin gespannt, ob KomodoCCT in deinem nächsten Test überrundet werden kann.

Stefan
[/quote]

Tja, jetzt ist erst mal Bouquet 1.8 dran. Stockfish muß also noch ein paar Tage warten. Da ich so viele Development-Versionen von Stocki getestet habe, ist klar, daß Releases anderer Top-Engines Test-Priorität haben.

Stefan
Parent - - By Dirk Triebel Date 2013-09-07 20:04
Hallo Stefan,

hast Du eine link für Bouquet 1.8, ich finde keinen;-).

Danke!

Viele Grüße,
Dirk
Parent - - By Dirk Triebel Date 2013-09-07 22:11
Danke Michael,

ich erstelle gerade ein list ähnlich wie die vom Stefan nur mit ponder - find den Unterschied schon interessant und würd mich mal interessieren wie der Frank beim pondern auf 25-35% kommt? Hast du das aus den Partien selbst (sprich bei 0s rausgeholt) oder gibt es eine Statik die ich als relativer Neuling nicht kenn? Nutze die Fritz 13 Gui.13

Danke für eure Hilfe!

Viele Grüße,

Dirk
Parent - By Stefan Pohl Date 2013-09-08 11:07
[quote="Dirk Triebel"]
Danke Michael,

ich erstelle gerade ein list ähnlich wie die vom Stefan nur mit ponder - find den Unterschied schon interessant und würd mich mal interessieren wie der Frank beim pondern auf 25-35% kommt? Hast du das aus den Partien selbst (sprich bei 0s rausgeholt) oder gibt es eine Statik die ich als relativer Neuling nicht kenn? Nutze die Fritz 13 Gui.13

Danke für eure Hilfe!

Viele Grüße,

Dirk
[/quote]

Eine Liste ähnlich wie meine mit der FritzGUI? Na, dann nimm dir mal das nächste Jahr nix weiter vor. Denn die FritzGUI erlaubt nur Fischerboni im Sekundentakt. Ohne Fischerbonus zu testen, ist keine brauchbare Lösung, weil viele Engine-Engine-Partien sehr lang sind (ich hatte schon Partien mit mehr als 300 Zügen!) und mit einem Fischerbonus von 1 Sekunde brauchst Du sehr lange, um wirklich viele Partien zu absolvieren. Es sei denn, Du hast einen ganzen Rechner-Park.

Stefan
Parent - By Hauke Lutz Date 2013-09-08 16:45
Bei mir ergibt beim 1+0 Bullet, dass die Version vom 30.8. im direkten Vergleich besser ist, als die Versionen vom 5.9 und 7.9. ..... hat da jemand eine Ahnung wie das sein kann??
Up Topic Hauptforen / CSS-Forum / LS-Rangliste: Stockfish hats geschafft...
1 2 Previous Next  

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill