Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Rybka 4.1 x64 Exp. 79TD v.1 zu Rybka 4.1 x64 und *Bücher*
- By Frank Quisinsky Date 2011-05-09 23:19 Edited 2011-05-09 23:28
Hallo zusammen,

morgen läuft mein SWCR-64 Update Turnier aus. Es macht also morgen Sinn, das 79er TD Setting mit den Standard Einstellungen der Version 4.1 zu vergleichen. Rybka 4.1 hat im noch laufenden Turnier noch 20 Partien zu spielen und der Unterschied beträgt nach fast 1.000 Partien nunmehr 10 ELO.

Normaler Weise ein kaum messbarer Bereich, wenn nicht der dicke Unterschied bei der Remisquote wäre. Insofern gibt Bayesian auch einen höheren Wert für die niedrigere Remisquote beim Setting als ELOstat aus. Bei einer ELOstat Kalkulation dürfte es keinen Unterschied zwischen den Versionen 4.1 x64 Standard und 4.1 x64 TD 79 v.1 geben.

Sofern ein Interesse besteht, setze ich einen direkten Vergleich (gleiche Gegner) mit den Auswertungen von Bayesian und ELOstat morgen oder übermorgen ins Forum. Damit wäre das Thema zu den Rybka 4.1 Settings vorerst mal wieder abgeschlossen, denn 79 TD v.1 ist das Setting, welches lt. dem fleißigen Setting Tester im Rybka Forum derzeit die besten Ergebnisse bei der Version 4.1 erzielt (ca. 15 ELO mehr als Standard).

Wie die Ergebnisse dann letztendlich zu werten sind, ist schwierig. In einem anderen Thread und auf meiner News Seite habe ich das schon mehrfach versucht, auch bei den Rybka 4.0 Exp Settings 42 und 61.

Viele Grüße
Frank

PS: Macht kaum Sinn diese Settings zu testen. Da sich die anderen Listenbetreiber hierzu kaum aufraffen (sie haben eigentlich Recht mit der Sichtweise keine Settings zu testen) versuche ich mit der SWCR die Lücke zu füllen. Festgestellt wurde in der SWCR z. B. auch, dass sich das Hiarcs 12.1 Sharpen PV Setting nicht auswirkt. Bei den Hiarcs 13 Versionen wurde auf Sharpen PV Hinweise beim Release offenbar verzichtet
So endete das "Sharpen-PV" Märchen bei Hiarcs.

Es gibt bekanntlich viele Märchen im Computerschach.
Das bekannteste ist ... ein gutes Buch wirkt sich um bis zu 200 ELO aus.

Die Frage ist wo, bei welchen gezielten Test und oder ... natürlich ist der Buchersteller immer von seiner Arbeit überzeugt.

SWCR - hier wird mit einem eigenen Buch gespielt. Zu der Bucherstellung gab es eine Projektbeschreibung die über meine Webseiten abgerufen werden kann.
IPON - hier wird mit Vorgabestellungen gespielt.
CEGT - mal Vorgabestellungen, Buch x oder sonst was ... ein MIX

Ergebnis ... die Listen unterscheiden sich kaum. Wird im Detail vergleichen kommt raus, dass die durchschnittliche Listenabweichung aller getesteten Engines zwischen SWCR und IPON bei 0.26 liegt, bei der CEGT bei 0.17 liegt.

Natürlich kann sich ein Buch bemerkbar machen wenn zwei Engines ein Match spielen und das Buch z. B. auf eine Engine getunt wurde.

Beispiel:
Komodo liebt die ruhigen Eröffnungen, spielt mit das passivste Schach während der Eröffnungsphase. Wird gegen Komodo ein Buch mit vielen taktischen Varianten gewählt wird die Engine vielleicht ins schwimmen geraten.

Für eine Ratingliste spielt es eine ganz wesentliche Rolle Partiewiederholungen zu vermeiden. Daher z. B. Vorgabestellungen oder Random Bücher, die dann aber sehr ausgewogen sein sollten ... in Fall der SWCR um Partiewiederholungen zu vermeiden und ... alle Engines sollten aufgrund des Buches nicht in einem direkten Nachteil kommen.

Ich weiß ...
Sind viele Buchtuner unterwegs, die von Ihrer Arbeit überzeugt sind. Nur, verschwindet z. B. eine schlechte Variante aus einem Buch weil Klatsche gegen Fritz kann diese Variante allerdings gegen Spike gut sein. Ein Tipp für Buchersteller ... testet Eure Bücher gegen Engines die sich stark vom Spielstil in der Eröffnung unterscheiden. Z. B. Komodo und Spark unterscheiden sich grundlegend beim Eröffnungsaufbau.

Wie spielt z. B. Fritz mit einem eigenen (User-Buch) Buch gegen Komodo und Spark, nach je 200 Partien.
Und wie spielt z. B. Fritz mit dem Original Buch gegen Komodo und Spark, nach je 200 Partien.

Hat das eigene Buch deutlich bessere Ergebnisse ist es gut. Wobei das nur ein Stichprobentest ist, den ich z. B. hier und da mal durchführe. Nach wie vor ... ein Buch welches mit überzeugt und ausgewogen ist, ist das von Nimzo 8. Da ich die Bücher von ChessBase sammel und alle vorliegen habe, erstelle ich hin- und wieder solche Vergleiche. Sehr gut ist auch das derzeitige Deep Fritz 12 Eröffnungsbuch. Während das Hiarcs 13 Buch z. B. besser gegen Komodo 1.3 spielt aber schlechter gegen Spark 1.0 als die tatsächliche ELO. Da Hiarcs in der Eröffnung selbst aggressiv spielt ist das Buch für Hiarcs also sehr gut, fraglich ist ob es gut für andere Engines oder einer Ratingliste ist (nur mal als Beispiel).

Viel Spaß beim Testen

Gruß
Frank
Up Topic Hauptforen / CSS-Forum / Rybka 4.1 x64 Exp. 79TD v.1 zu Rybka 4.1 x64 und *Bücher*

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill