Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / SWCR 64-Bit nach 1.800 von 4.800 ... Vergleich mit IPON
- - By Frank Quisinsky Date 2010-05-21 06:34 Edited 2010-05-21 06:37
Hallo zusammen,

ganz interessant ist es, die SWCR 64-Bit zukünftig mit IPON zu vergleichen. Interessant weil die SWCR die doppelte Bedenkzeit hat und abzulesen sein wird, welche Engine die Tendenz haben mit mehr Zeit besser zu werden.

Der ELO-Wert von IPON in Klammern!

Code:
Rank Name                          Elo    +    - games score oppo. draws
   1 Rybka 3 x64                  2911   40   38   225   74%  2735   29% (+13 ELO)
   2 Stockfish 1.7.1 JA x64       2903   39   37   225   74%  2736   34% (+20 ELO)
   3 Naum 4.2 x64                 2835   36   35   225   64%  2740   39% (+16 ELO)
   4 Komodo 1.0 JA x64            2807   35   35   225   60%  2741   44% (+29 ELO)
   5 Shredder 12 x64              2800   36   35   225   59%  2742   37% (+-0 ELO)
   6 Zappa Mexico II x64          2765   35   35   226   53%  2745   43% (+55 ELO)
   7 Protector 1.3.4 JA x64       2755   36   36   225   51%  2745   35% (nicht getestet)
   8 Spark 0.4 x64                2747   35   35   225   50%  2746   40% (nicht getestet)
   9 Thinker 5.4d Inert x64       2739   35   35   223   49%  2746   43% (nicht getestet)
  10 Onno 1.1.1 x64               2718   35   35   225   45%  2748   43% (+35 ELO)
  11 Sjeng WC-2008 x64            2711   35   35   225   45%  2748   41% (+38 ELO)
  12 Critter 0.60 x64             2707   35   35   225   43%  2749   44% (+18 ELO)
  13 Loop 2007 x64                2668   36   37   225   38%  2751   34% (+58 ELO)
  14 Junior 11.1a x64             2659   37   38   225   37%  2752   26% (+22 ELO)
  15 Twisted Logic 20100131x x64  2615   37   38   226   30%  2755   32% (+19 ELO)
  16 SmarThink 1.20 x64           2597   38   39   225   28%  2756   27% (nicht getestet)


Im Grunde ist das Ergebnis klar. Nach 225 Partien spielt Shredder 20 ELO unter seinen Verhältnissen.
Loop 2007 ist doch im Vergleich zur 13.6 stärker geworden oder spielt 38 ELO über seinen Verhältnissen.
Zappa Mexiko II spielt 35 ELO über seinen Verhältnissen.
Protector spielt runde 35 ELO über seinen Verhältnissen.

Immer im Vergleich zur Ipon.
Wahrscheinlich spielt Zappa nur 20 ELO über seinen Verhältnissen denn die Engine wird mit mehr Zeit stärker. Auch Komodo wird mit mehr Zeit stärker und wird letztendlich näher an Shredder stehen als in der IPON Liste.

Egal, ist nur ein Zwischenergebnis nach 225 Partien pro Engine, es werden als Basis für die neue Ratinglisten zunächst 600 Partien gespielt. Wird noch ca. 11 Tage dauern bis das Endergebnis vorliegt.

32-bit CONTRA 64-bit:
http://www.nk-qy.info/bericht-swcr-32-bit-contra-64-bit.htm

Gruß
Frank
Parent - - By Ralf Badera Date 2010-05-21 09:50
Hallo Frank,
[quote="Frank Quisinsky"]
Hallo zusammen,

Der ELO-Wert von IPON in Klammern!

Code:
Rank Name                          Elo    +    - games score oppo. draws
   5 Shredder 12 x64              2800   36   35   225   59%  2742   37% (+-0 ELO)
   6 Zappa Mexico II x64          2765   35   35   226   53%  2745   43% (+55 ELO)
   7 Protector 1.3.4 JA x64       2755   36   36   225   51%  2745   35% (nicht getestet)
  13 Loop 2007 x64                2668   36   37   225   38%  2751   34% (+58 ELO)

Im Grunde ist das Ergebnis klar. Nach 225 Partien spielt Shredder 20 ELO unter seinen Verhältnissen.
Loop 2007 ist doch im Vergleich zur 13.6 stärker geworden oder spielt 38 ELO über seinen Verhältnissen.
Zappa Mexiko II spielt 35 ELO über seinen Verhältnissen.
Protector spielt runde 35 ELO über seinen Verhältnissen.

Immer im Vergleich zur Ipon.

Gruß
Frank
[/quote]
Kannst Du mir kurz erzklären, wie Du auf das "unter/über seinen Verhältnissen" kommst und woher die Zahlen stammen? Wenn Shredders Wertung identisch ist, wieso spielt er dann unter seinen Verhältnissen? Legst Du irgendwelche 20 ELO für den Zeitunterschied mit hinein?

MfG,
Ralf
Parent - - By Frank Quisinsky Date 2010-05-21 11:20
Hallo Ralf,

auf Shredder wird geeicht. Nach meinen Berechnungen spielt Shredder 20 ELO unter seinen Verhältnissen, bedeutet ... ziehe von allen anderen Engines 20 ELO ab. Dieses Resultat hättest Du, wenn Shredder nicht so schlecht gestartet wäre bzw. entsprechend seiner Spielstärke spielt. Denke das wird sich mit immer mehr Partien stabilisieren.

Gruß
Frank
Parent - By Frank Quisinsky Date 2010-05-21 20:44
Hallo Ralf,

habe das auf der Webseite etwas klarer dargestellt. Hier die bisherigen beiden Auswertungen. Es wird später sicherlich sehr schön abzulesen sein, dass Shredder Startschwierigkeiten hatte. Warten wir mal die dritte Auswertung ab, spätestens bei ca. 75%, also 450 Partien sollte schon ein klares Bild ersichtlich sein.

Code:
Erste Auswertung:
Nach 25% aller Partien = 150 Partien pro Engine, 1.200 / 4.800 Partien, 10 / 40 Runden:
Eine dumme Situation, denn Shredder, die Engine auf die geeicht wird, hat offenbar Startschwierigkeiten. Daher verzerrt das leider alle anderen ELO-Werte!

01. Stockfish 1.7.1 JA x64        2.931 48 46 150 76% 2.752 33%
02. Rybka 3 x64                   2.917 48 46 150 73% 2.753 28%
03. Naum 4.2 x64                  2.849 45 44 150 63% 2.757 36%
04. Komodo 1.0 JA x64             2.825 44 43 150 60% 2.759 41%
05. Shredder 12 x64               2.800 44 43 150 56% 2.761 37%
06. Zappa Mexico II x64           2.792 43 42 150 55% 2.761 45%
07. Protector 1.3.4 JA x64        2.783 44 43 150 53% 2.762 36%
08. Spark 0.4 x64                 2.769 43 43 150 50% 2.763 43%
09. Thinker 5.4d Inert x64        2.764 42 42 150 50% 2.763 42%
10. Onno 1.1.1 x64                2.739 42 42 150 46% 2.765 45%
11. Sjeng WC-2008 x64             2.722 43 43 150 44% 2.766 38%
12. Critter 0.60 x64              2.712 43 44 150 41% 2.766 40%
13. Junior 11.1a x64              2.682 45 46 150 38% 2.768 27%
14. Loop 2007 x64                 2.669 44 45 150 35% 2.769 32%
15. Twisted Logic 20100131x x64   2.648 45 46 150 32% 2.771 33%
16. SmarThink 1.20 x64            2.606 47 49 150 27% 2.773 24%



Zweite Auswertung:
Nach 40% aller Partien = 240 Partien pro Engine, 1.920 / 4.800 Partien, 16 / 40 Runden:

01. Rybka 3 x64                   2.910 38 37 240 74% 2.735 29%
02. Stockfish 1.7.1 JA x64        2.909 38 36 240 75% 2.735 33%
03. Naum 4.2 x64                  2.838 35 34 240 64% 2.740 39%
04. Komodo 1.0 JA x64             2.804 34 34 240 60% 2.742 44%
05. Shredder 12 x64               2.800 35 34 240 59% 2.742 37%
06. Zappa Mexico II x64           2.765 34 34 240 53% 2.745 43%
07. Protector 1.3.4 JA x64        2.758 35 35 240 52% 2.745 34%
08. Spark 0.4 x64                 2.745 34 34 240 49% 2.746 40%
09. Thinker 5.4d Inert x64        2.743 34 34 240 49% 2.746 44%
10. Sjeng WC-2008 x64             2.710 34 34 240 45% 2.748 40%
10. Onno 1.1.1 x64                2.710 34 34 240 44% 2.748 43%
12. Critter 0.60 x64              2.705 34 34 240 43% 2.749 43%
13. Loop 2007 x64                 2.661 35 36 240 37% 2.752 33%
14. Junior 11.1a x64              2.660 36 37 240 37% 2.752 27%
15. Twisted Logic 20100131x x64   2.618 36 37 240 31% 2.755 32%
16. SmarThink 1.20 x64            2.600 37 38 240 29% 2.756 28%


Gruß
Frank
Up Topic Hauptforen / CSS-Forum / SWCR 64-Bit nach 1.800 von 4.800 ... Vergleich mit IPON

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill