Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / FGRL-Rating List: 240+2.40 - Stockfish 140730
- - By Andreas Strangmüller Date 2014-08-10 11:19
Seit Stockfish 5 in zwei Monaten ein Plus von 18 Elo-Punkten.
Das deckt sich ziemlich mit dem aktuellen Regressionstest vom 06.08., beim dem die aktuelle Entwicklungsversion +19,68 Elo erreichte.
http://tests.stockfishchess.org/tests/view/53e207dd0ebc592db1a06475

     Program             Elo     +   -   Games   Score   Av.Op.  Draws
  ----------------------------------------------------------------------
   1 Stockfish 140730  : 3112    9   9   3000    67.0 %   2989   51.1 %
   2 Stockfish 5       : 3094    9   9   3000    64.5 %   2991   52.0 %
   3 Houdini 4         : 3081    9   9   3000    62.5 %   2992   46.9 %
   4 Komodo 7a         : 3065    9   9   3000    60.1 %   2994   50.3 %
   5 Gull 3            : 3035    9   9   3000    55.5 %   2997   51.6 %
   6 Critter 1.6a      : 2981    8   8   3000    46.9 %   3002   54.5 %
   7 Fire 3.0 x64      : 2967    8   8   3000    44.8 %   3003   54.4 %
   8 Bouquet 1.8       : 2963    9   9   3000    44.1 %   3004   52.9 %
   9 Rybka 4.1         : 2937    9   9   3000    40.2 %   3006   50.4 %
  10 Chiron 2          : 2889    9  10   3000    33.1 %   3011   42.6 %
  11 Protector 1.6.0   : 2876    9   9   3000    31.2 %   3013   44.1 %

Games        :  16500 (finished)

White Wins   :   4741 (28.7 %)
Black Wins   :   3497 (21.2 %)
Draws        :   8262 (50.1 %)

White Perf.  : 53.8 %
Black Perf.  : 46.2 %

Individual statistics:

1 Stockfish 140730          : 3112  3000 (+1244,=1533,-223), 67.0 %

Rybka 4.1                   :        300 (+153,=137,- 10), 73.8 %
Critter 1.6a                :        300 (+132,=154,- 14), 69.7 %
Bouquet 1.8                 :        300 (+145,=143,- 12), 72.2 %
Houdini 4                   :        300 (+ 86,=164,- 50), 56.0 %
Chiron 2                    :        300 (+175,=116,-  9), 77.7 %
Gull 3                      :        300 (+ 96,=168,- 36), 60.0 %
Protector 1.6.0             :        300 (+196,=102,-  2), 82.3 %
Fire 3.0 x64                :        300 (+138,=145,- 17), 70.2 %
Stockfish 5                 :        300 (+ 46,=223,- 31), 52.5 %
Komodo 7a                   :        300 (+ 77,=181,- 42), 55.8 %

2 Stockfish 5               : 3094  3000 (+1154,=1560,-286), 64.5 %

Rybka 4.1                   :        300 (+138,=142,- 20), 69.7 %
Critter 1.6a                :        300 (+121,=154,- 25), 66.0 %
Bouquet 1.8                 :        300 (+127,=156,- 17), 68.3 %
Houdini 4                   :        300 (+ 89,=157,- 54), 55.8 %
Chiron 2                    :        300 (+175,=113,- 12), 77.2 %
Gull 3                      :        300 (+ 82,=175,- 43), 56.5 %
Protector 1.6.0             :        300 (+184,=113,-  3), 80.2 %
Fire 3.0 x64                :        300 (+123,=151,- 26), 66.2 %
Komodo 7a                   :        300 (+ 84,=176,- 40), 57.3 %
Stockfish 140730            :        300 (+ 31,=223,- 46), 47.5 %

3 Houdini 4                 : 3081  3000 (+1173,=1407,-420), 62.5 %

Rybka 4.1                   :        300 (+159,=119,- 22), 72.8 %
Critter 1.6a                :        300 (+119,=150,- 31), 64.7 %
Bouquet 1.8                 :        300 (+142,=136,- 22), 70.0 %
Chiron 2                    :        300 (+174,=106,- 20), 75.7 %
Gull 3                      :        300 (+ 87,=157,- 56), 55.2 %
Protector 1.6.0             :        300 (+184,=101,- 15), 78.2 %
Fire 3.0 x64                :        300 (+130,=156,- 14), 69.3 %
Stockfish 5                 :        300 (+ 54,=157,- 89), 44.2 %
Komodo 7a                   :        300 (+ 74,=161,- 65), 51.5 %
Stockfish 140730            :        300 (+ 50,=164,- 86), 44.0 %

4 Komodo 7a                 : 3065  3000 (+1049,=1508,-443), 60.1 %

Rybka 4.1                   :        300 (+145,=137,- 18), 71.2 %
Critter 1.6a                :        300 (+ 99,=173,- 28), 61.8 %
Bouquet 1.8                 :        300 (+119,=143,- 38), 63.5 %
Houdini 4                   :        300 (+ 65,=161,- 74), 48.5 %
Chiron 2                    :        300 (+176,=106,- 18), 76.3 %
Gull 3                      :        300 (+ 88,=159,- 53), 55.8 %
Protector 1.6.0             :        300 (+152,=135,- 13), 73.2 %
Fire 3.0 x64                :        300 (+123,=137,- 40), 63.8 %
Stockfish 5                 :        300 (+ 40,=176,- 84), 42.7 %
Stockfish 140730            :        300 (+ 42,=181,- 77), 44.2 %

5 Gull 3                    : 3035  3000 (+892,=1549,-559), 55.5 %

Rybka 4.1                   :        300 (+118,=147,- 35), 63.8 %
Critter 1.6a                :        300 (+ 97,=157,- 46), 58.5 %
Bouquet 1.8                 :        300 (+103,=154,- 43), 60.0 %
Houdini 4                   :        300 (+ 56,=157,- 87), 44.8 %
Chiron 2                    :        300 (+147,=126,- 27), 70.0 %
Protector 1.6.0             :        300 (+149,=130,- 21), 71.3 %
Fire 3.0 x64                :        300 (+ 90,=176,- 34), 59.3 %
Stockfish 5                 :        300 (+ 43,=175,- 82), 43.5 %
Komodo 7a                   :        300 (+ 53,=159,- 88), 44.2 %
Stockfish 140730            :        300 (+ 36,=168,- 96), 40.0 %

6 Critter 1.6a              : 2981  3000 (+590,=1635,-775), 46.9 %

Rybka 4.1                   :        300 (+ 89,=171,- 40), 58.2 %
Bouquet 1.8                 :        300 (+ 64,=195,- 41), 53.8 %
Houdini 4                   :        300 (+ 31,=150,-119), 35.3 %
Chiron 2                    :        300 (+115,=137,- 48), 61.2 %
Gull 3                      :        300 (+ 46,=157,- 97), 41.5 %
Protector 1.6.0             :        300 (+111,=159,- 30), 63.5 %
Fire 3.0 x64                :        300 (+ 67,=185,- 48), 53.2 %
Stockfish 5                 :        300 (+ 25,=154,-121), 34.0 %
Komodo 7a                   :        300 (+ 28,=173,- 99), 38.2 %
Stockfish 140730            :        300 (+ 14,=154,-132), 30.3 %

7 Fire 3.0 x64              : 2967  3000 (+527,=1633,-840), 44.8 %

Rybka 4.1                   :        300 (+ 74,=188,- 38), 56.0 %
Critter 1.6a                :        300 (+ 48,=185,- 67), 46.8 %
Bouquet 1.8                 :        300 (+ 52,=196,- 52), 50.0 %
Houdini 4                   :        300 (+ 14,=156,-130), 30.7 %
Chiron 2                    :        300 (+113,=138,- 49), 60.7 %
Gull 3                      :        300 (+ 34,=176,- 90), 40.7 %
Protector 1.6.0             :        300 (+109,=161,- 30), 63.2 %
Stockfish 5                 :        300 (+ 26,=151,-123), 33.8 %
Komodo 7a                   :        300 (+ 40,=137,-123), 36.2 %
Stockfish 140730            :        300 (+ 17,=145,-138), 29.8 %

8 Bouquet 1.8               : 2963  3000 (+530,=1587,-883), 44.1 %

Rybka 4.1                   :        300 (+ 64,=181,- 55), 51.5 %
Critter 1.6a                :        300 (+ 41,=195,- 64), 46.2 %
Houdini 4                   :        300 (+ 22,=136,-142), 30.0 %
Chiron 2                    :        300 (+132,=137,- 31), 66.8 %
Gull 3                      :        300 (+ 43,=154,-103), 40.0 %
Protector 1.6.0             :        300 (+109,=146,- 45), 60.7 %
Fire 3.0 x64                :        300 (+ 52,=196,- 52), 50.0 %
Stockfish 5                 :        300 (+ 17,=156,-127), 31.7 %
Komodo 7a                   :        300 (+ 38,=143,-119), 36.5 %
Stockfish 140730            :        300 (+ 12,=143,-145), 27.8 %

9 Rybka 4.1                 : 2937  3000 (+449,=1511,-1040), 40.1 %

Critter 1.6a                :        300 (+ 40,=171,- 89), 41.8 %
Bouquet 1.8                 :        300 (+ 55,=181,- 64), 48.5 %
Houdini 4                   :        300 (+ 22,=119,-159), 27.2 %
Chiron 2                    :        300 (+ 92,=157,- 51), 56.8 %
Gull 3                      :        300 (+ 35,=147,-118), 36.2 %
Protector 1.6.0             :        300 (+119,=132,- 49), 61.7 %
Fire 3.0 x64                :        300 (+ 38,=188,- 74), 44.0 %
Stockfish 5                 :        300 (+ 20,=142,-138), 30.3 %
Komodo 7a                   :        300 (+ 18,=137,-145), 28.8 %
Stockfish 140730            :        300 (+ 10,=137,-153), 26.2 %

10 Chiron 2                 : 2889  3000 (+354,=1279,-1367), 33.1 %

Rybka 4.1                   :        300 (+ 51,=157,- 92), 43.2 %
Critter 1.6a                :        300 (+ 48,=137,-115), 38.8 %
Bouquet 1.8                 :        300 (+ 31,=137,-132), 33.2 %
Houdini 4                   :        300 (+ 20,=106,-174), 24.3 %
Gull 3                      :        300 (+ 27,=126,-147), 30.0 %
Protector 1.6.0             :        300 (+ 89,=143,- 68), 53.5 %
Fire 3.0 x64                :        300 (+ 49,=138,-113), 39.3 %
Stockfish 5                 :        300 (+ 12,=113,-175), 22.8 %
Komodo 7a                   :        300 (+ 18,=106,-176), 23.7 %
Stockfish 140730            :        300 (+  9,=116,-175), 22.3 %

11 Protector 1.6.0          : 2876  3000 (+276,=1322,-1402), 31.2 %

Rybka 4.1                   :        300 (+ 49,=132,-119), 38.3 %
Critter 1.6a                :        300 (+ 30,=159,-111), 36.5 %
Bouquet 1.8                 :        300 (+ 45,=146,-109), 39.3 %
Houdini 4                   :        300 (+ 15,=101,-184), 21.8 %
Chiron 2                    :        300 (+ 68,=143,- 89), 46.5 %
Gull 3                      :        300 (+ 21,=130,-149), 28.7 %
Fire 3.0 x64                :        300 (+ 30,=161,-109), 36.8 %
Stockfish 5                 :        300 (+  3,=113,-184), 19.8 %
Komodo 7a                   :        300 (+ 13,=135,-152), 26.8 %
Stockfish 140730            :        300 (+  2,=102,-196), 17.7 %

http://www.fastgm.de
Parent - - By Tom Paul Date 2014-08-10 11:41
Der neue Stockfish hat gegen alle Gegner besser abgeschnitten als Stockfish 5, außer gegen Houdini und Komodo, da hatte Stockfish 5 besser abgeschnitten.
Parent - - By Hauke Lutz Date 2014-08-10 22:06
Letzteres deckt sich genau mit dem was man vom Geringschätzungsfaktor erwartet hat.
Parent - By Michael Scheidl Date 2014-08-11 07:05
...der aber per 14.7. noch auf null war, und inzwischen wieder ist. Ich verwende vorerst trotzdem einen Contempt von 10 Centipawns. Das dürften auf einer "normalen" Skala wohl so ca. 5 CP. sein. Ich denke, bei einer Rang Eins-Engine ist das bei dieser geringen Dosierung vertretbar bzw. sinnvoll. Einige nicht so dringende Remisfortsetzungen bzw. solche Zugvorschläge können wohl unterdrückt werden, sofern die beste Alternative nicht schlechter als -0,10 bewertet wird.

Ich mache aber mehr Analysen als Enginepartien, sodaß es mir nicht auf jeden Elopunkt ankommt. Jedenfalls gut daß die Einstellmöglichkeit durch den User beibehalten wurde.
Parent - - By Stefan Pohl Date 2014-08-11 04:23
Stimmt sehr gut mit meinen Tests überein...(+17 bei mir für Stockfish 140723) trotz der bei dir längeren Bedenkzeit und der größeren Gegnerzahl.
Leider war Stockfish aber schon Mitte Juni so stark.

Gruß - Stefan
Parent - - By Tom Paul Date 2014-08-11 08:55 Edited 2014-08-11 08:59
Ist ja auch kein Wunder, im Stockfish Forum wird auch schon darüber geredet, warum das Framework die ganzen Tage leer steht bzw. nicht arbeitet, weil es Tests gibt aber keine Maschinen angezeigt werden oder es gibt Maschinen aber keine Tests.
Außerdem wird dort von einem Mangel an neuen Ideen gesprochen und das bei 58 Programmierern + die normalen Tester.
Ihr könnt ja eure Ideen oder auch die von anderen Leuten dort posten, damit es endlich mal vorwärts geht.
Parent - By Benno Hartwig Date 2014-08-11 11:32

> Ihr könnt ja eure Ideen oder auch die von anderen Leuten dort posten


Eine grundsätzliche Idee, mit der ich immer mal wieder in den Sourcen spiele, ohne dass ich aber eine Stärkung erreichen konnte ist:

Die verschiedenen Züge in einer Stellung werden ja bewertet (so gut es geht genau bewertet, oder auch nur widerlegt), dies kann auch mal durch Abschätzungen erfolgen, oder durch besonders genaue Untersuchung. Dann wird aber immer einfach der Zug genommen, der den besten Wert hat. Der Stellungswert ist dann der Wert dieses Zugs. Bei gleichguten Zügen wird der erste derart gefundene Zug genommen.
Es wird aber AFAIK durchweg nicht(!) bewertet, auf welchem gefährlichen/sicheren/chancenreichen Weg die Stellung erreicht wird, die letztlich zur Bewertung führte.

- ob ich die ausgeglichene Stellung erreicht über Stellungen mit materiellem oder positionellem Übergewicht, oder mit Untergewicht
- ob es neben meinen guten Zügen ggf. andere gab, die gute Alternativen bieten, oder ob meine Züge erzwungen waren.
- ob in der Ruhesuche die statische Bewertung ggf. schon fast so gut war wie der beste Schlagzug, oder ob ich zum Erfolg durch Schlagen verdammt war
- ...
(und alles natürlich genauso auch aus Sicht des Gegners)

Ich erhoffe dadurch, dass bei annähernd gleichguten Alternativen diejenige gewählt wird, die irgendwie zwischendurch chancenreicher ist als andere, die zwischendurch mehr Möglichkeiten bietet, die hier weniger Gefahren bereit hält.
Eine kleine Erweiterung des minimax-Gedankens, der heute doch immer noch in den Engines der zentrale Gedanke ist.

Benno
Parent - - By Thomas Müller Date 2014-08-11 12:14
wieviele von deinen "ideen" wurden schon getestet/ungesetzt ?
Parent - - By Tom Paul Date 2014-08-11 12:18
Ein paar.
Parent - By Patrick Götz Date 2014-08-11 15:10
Nenne mir bitte nur eine die umgesetzt wurde.
Zur Überprüfbarkeit bitte noch das Patchdatum dazu.
Up Topic Hauptforen / CSS-Forum / FGRL-Rating List: 240+2.40 - Stockfish 140730

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill