Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Komodo 8 - 5-men Syzygy tablebases
- - By Andreas Strangmüller Date 2015-01-10 19:09
Welchen Nutzen bzw. Elogewinn bringen die 5-Steiner Syzygy Tablebases?

Hier ein Test mit Komodo 8 auf einem Kern mit 128 MB Hash.
Die Tablebases lagen auf einer Solid State Disk - Samsung 840 EVO.
Getestet wurden vier verschiedenen Bedenkzeiten (TC), jeweils vervierfacht, immer 3000 Partien bzw. 1520 bei höchster Bedenkzeit.
15 Sek. + 0.15 Sek. / 60 Sek. + 0.60 Sek. / 240 Sek. + 2.40 Sek. / 960 Sek. + 9.60 Sek.

TC  = 15"+0.15"
TB5 = 5-Steiner Syzygy tablebases
T1  = 1 Thread

    Program            Elo    +   -   Games   Score   Av.Op.  Draws
---------------------------------------------------------------------
  1 Komodo 8 T1 TB5  : 3005   8   8   3000    51.4 %   2995   60.8 %
  2 Komodo 8 T1      : 2995   8   8   3000    48.6 %   3005   60.8 %

Result : 1542.5/3000 (+630,=1825,-545)

Elo  +10

TC  = 60"+0.6"

    Program            Elo    +   -   Games   Score   Av.Op.  Draws
---------------------------------------------------------------------
  1 Komodo 8 T1 TB5  : 3009   7   7   3000    52.5 %   2991   68.2 %
  2 Komodo 8 T1      : 2991   7   7   3000    47.5 %   3009   68.2 %

Result : 1576.0/3000 (+553,=2046,-401)

Elo  +18

TC  = 4'+2.4"

    Program            Elo    +   -   Games   Score   Av.Op.  Draws
---------------------------------------------------------------------
  1 Komodo 8 T1 TB5  : 3006   6   6   3000    51.7 %   2994   75.4 %
  2 Komodo 8 T1      : 2994   6   6   3000    48.3 %   3006   75.4 %

Result : 1551.5/3000 (+420,=2263,-317)

Elo  +12
 
TC  = 16'+9.6"

    Program            Elo    +   -   Games   Score   Av.Op.  Draws
---------------------------------------------------------------------
  1 Komodo 8 T1 TB5  : 3006   8   8   1520    51.7 %   2994   79.8 %
  2 Komodo 8 T1      : 2994   8   8   1520    48.3 %   3006   79.8 %

Result : 785.5/1520 (+179,=1213,-128)

Elo  +12
Parent - - By Ingo B. Date 2015-01-10 19:12
Hallo Andreas,

Leider im, aus mir unerfindlichen Gründen populärer werdenden, Selbsttest.
K8 mit und ohne gegen S5 wäre toll gewesen.

Gruß
Ingo
Parent - - By Andreas Strangmüller Date 2015-01-10 20:14
Hallo Ingo,

sei doch nicht so ungeduldig

Das folgt natürlich noch, ebenso rein S5 oder der bald erscheinende S6.

Aber meines Erachtens gehört der Selbsttest bei einer Testreihe unbedingt dazu.

Viele Grüße,
Andreas
Parent - By Ingo B. Date 2015-01-10 22:03
Andreas Strangmüller schrieb:

... sei doch nicht so ungeduldig

Das folgt natürlich noch, ebenso rein S5 oder der bald erscheinende S6.


Super!

Andreas Strangmüller schrieb:

Aber meines Erachtens gehört der Selbsttest bei einer Testreihe unbedingt dazu.


Das bin ich nicht so überzeugt (Wobei, wenn es nur ein Teil einer größeren Reihe ist, schadet es auch nicht)...
Von den imposanten Elosprüngen im SF Selbsttest blieben in den ordentlicheren Listen IMMER weit weniger übrig. Natürlich ist es immer noch ein Plus, aber sagt nicht so viel aus, leider.

Gruß
Ingo
Parent - By Tom Paul Date 2015-01-10 22:03
Mich interessiert besonders der SMP Vergleich zwischen S6 und K9.
Parent - By Stefan Pohl Date 2015-01-11 12:11
Ingo B. schrieb:

Hallo Andreas,

Leider im, aus mir unerfindlichen Gründen populärer werdenden, Selbsttest.
K8 mit und ohne gegen S5 wäre toll gewesen.

Gruß
Ingo


Ich habe zur Zeit der LS-Ranglistemal eine damals aktuelle Stockfishversion einen LS-Testrun mit 5er Syzygy (geparkt auf einem USB-Stock) und einmal ohne machen lassen. Da kam +11 Elo (mit den TBs) raus, wenn ich mich recht entsinne.
In Selftests kommt m.E. nicht unbedingt ein zu hohes Egebnis raus, verglichen mit Ranglistentests. Das liegt, denke ich, eher daran, daß die Selftests meist mit viel kürzeren Bedenkzeiten stattgefunden haben, als die Ranglistenpartien. Und kurze Bedenkzeiten strecken eine Rangliste auseinander bzw. ein positives Ergebnis immer etwas nach oben.
Daher wird man im Framework immer höhere Elozugewinne in den Regressiontests haben, als z.B. in der IPON. Aber das liegt daran, daß die Bedenkzeit in der IPON eben viel länger ist (Framework testet ja nur mit 60"+50ms, ohne Pondern). So etwa Faktor 10 würde ich daher mal über den Daumen peilen. Das macht viel aus und drückt generell alle Resultate näher an die 50%-Marke und damit Zugewinn-Messungen bzw. starke Engines gegen schwächere Gegner im Ergebnis zwangsläufig nach unten.

Was sehr schön wäre, wenn du mal einen Selftest mit 2 Stockfishen unter IPON-Bedingungen machen würdest, die bei dir beide in der IPON gelistet sind. Ob da nach 3000-4000 Partien wirklich nennenswert mehr Elodifferenz als in der IPON-Liste rauskäme?!? Bezweifle ich. Aber vielleicht irre ich mich auch. Wäre auf jeden Fall sehr interessant.

Stefan
Parent - By Andreas Strangmüller Date 2015-01-20 20:35
Hier ein weiterer Test, diesmal Komodo 8 gegen Stockfish 5, Komodo einmal ohne und dann mit Tablebases, 1 Thread, 128 MB Hash.
Getestet wurden drei verschiedenen Bedenkzeiten (TC), jeweils vervierfacht, 3000 bzw. 1550 Partien bei höchster Bedenkzeit.
60 sec + 0.60 sec / 240 sec + 2.40 sec / 960 sec + 9.60 sec

TC  = 60"+0.60"
TB5 = 5-Steiner Syzygy Tablebases
T1  = 1 Thread

     Program            Elo    +   -   Games   Score   Av.Op.  Draws
  --------------------------------------------------------------------
   1 Stockfish 5 T1   : 3005   9   9   3000    51.4 %   2995   46.1 %
   2 Komodo 8 T1      : 2995   9   9   3000    48.6 %   3005   46.1 %

Result : 1540.5/3000 (+849,=1383,-768)

Elo  +9

     Program            Elo    +   -   Games   Score   Av.Op.  Draws
  --------------------------------------------------------------------
   1 Stockfish 5 T1   : 3002   9   9   3000    50.5 %   2998   48.2 %
   2 Komodo 8 T1 TB5  : 2998   9   9   3000    49.5 %   3002   48.2 %

Result : 1516.5/3000 (+793,=1447,-760)

Elo  +4                   TB Nutzen: 5 Elo

--------------------------------------------------------------------


TC  = 4'+2.4"

     Program            Elo    +   -   Games   Score   Av.Op.  Draws
  --------------------------------------------------------------------
   1 Stockfish 5 T1   : 3004   9   9   3000    51.2 %   2996   52.2 %
   2 Komodo 8 T1      : 2996   9   9   3000    48.8 %   3004   52.2 %

Result : 1536.5/3000 (+754,=1565,-681)

Elo  +8

     Program            Elo    +   -   Games   Score   Av.Op.  Draws
  --------------------------------------------------------------------
   1 Stockfish 5 T1   : 3002   9   9   3000    50.5 %   2998   52.1 %
   2 Komodo 8 T1 TB5  : 2998   9   9   3000    49.5 %   3002   52.1 %

Result : 1516.5/3000 (+735,=1563,-702)

Elo  +4                   TB Nutzen: 4 Elo

--------------------------------------------------------------------

 
TC  = 16'+9.6"

    Program            Elo    +   -   Games   Score   Av.Op.  Draws
--------------------------------------------------------------------
  1 Komodo 8 T1      : 3004   11  11  1550    51.3 %   2996   60.4 %
  2 Stockfish 5 T1   : 2996   11  11  1550    48.7 %   3004   60.4 %

Result : 795.0/1550 (+327,=936,-287)

Elo  +9

    Program            Elo    +   -   Games   Score   Av.Op.  Draws
--------------------------------------------------------------------
  1 Komodo 8 T1 TB5  : 3006   11  11  1550    51.7 %   2994   59.2 %
  2 Stockfish 5 T1   : 2994   11  11  1550    48.3 %   3006   59.2 %

Result : 802.0/1550 (+343,=918,-289)

Elo  +12                   TB Nutzen: 3 Elo


Der Einsatz von Syzygy Tablebases scheint die Spielstärke von Komodo 8 im Spiel gegen Stockfish 5 nur unwesentlich zu erhöhen, im Schnitt 4 Elo. Bei zunehmender Bedenkzeit nimmt der Nutzen ab.
Aufgrund der Fehlertoleranz, selbst bei dieser hohen Partienzahl, ist diese Aussage jedoch nicht unbedingt stichhaltig, auch wenn die Tendenz darauf hindeutet.
Im Selbsttest profitierte Komodo von den Tablebases im Schnitt noch um 13 Elopunkte.

Was kann man aus den bisherigen Ergebnissen ableiten?
Ist Stockfish im Übergang zum Endspiel schon so gut, dass Komodo mit Tablebases kaum Nutzen daraus ziehen kann?
Sieht so aus.

Deutlich zu sehen ist wieder die zunehmende Spieltstärke von Komodo bei zunehmender Bedenkzeit.
Bei 4'+2.4" noch um 8 Elo schwächer, bei 16'+9.6" jedoch bereits um 9 Elo stärker als Stockfish 5.

Als nächstes folgt der Selbsttest mit dem bald erscheinenden Stockfish 6, dann der Test Komodo 8 gegen Stockfish 6.

Viele Grüße,
Andreas
Up Topic Hauptforen / CSS-Forum / Komodo 8 - 5-men Syzygy tablebases

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill