Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / LS-Rangliste: Bouquet 1.5
- - By Stefan Pohl Date 2012-10-26 04:02
Hallo zusammen,

Hier nun das Endergebnis von Bouquet 1.5. +91 Elo zur Version 1.4. Netter Fortschritt, aber eben auch nicht besser als die OpenSource/Ippolit "Schallmauer" Ivanhoe. Aber auf Augenhöhe mit Ivanhoe und damit etwas besser als der Ur-Ippo. Also nicht so schlecht. Den Test von Saros 3.1aDistro habe ich nach 2500 Partien wegen des extrem schwachen Abschneidens (-130 Elo zu Version 3.0) abgebrochen. Das Ergebnis findet sich unter abgebrochene Tests - ganz unten im Posting.

Testbedingungen: Notebook mit Intel i7-2630QM Prozessor (4 Kerne, 2GHz Takt, Windows 7 64bit Home Premium). Geschwindigkeit der Hardware: Houdini 2.0c auf einem Core etwa 2.2 Mio Kn/s, auf 4 Cores etwa 7.5 Mio Kn/s (bei vollem Brett), FritzMark=20.2. HyperThreading off.
Bedenkzeit: 45''+500ms Fischerbonus (ca. knapp 90 Sekunden pro Partie je Engine), keine Tablebases, 1 Core/Thread und 64 MB Hash pro Engine, kein Pondern, 500 Vorgabestellungen aus der Frank Q. Datenbank (von mir handverlesen, nur Hauptsysteme (kein Holländisch etc.)). Gespielt wird bis zum Matt oder bis zum Remis, die GUI gibt keine Partie auf und auch Remis erst bei 500 Zügen - also gar nicht). Benutzt wird die LittleBlitzerGUI. Dazu merke ich hier nochmal an: Alle Partien wurden/werden im Gauntlet-Modus gespielt, weil nur so die Vorgabestellungen auch alle sequentiell und mit vertauschten Farben korrekt abgespielt werden. Die Ranglisten werden mit bayeselo (mm 0 1) erstellt und die Ergebnisse an Robbolito 0.085g3 x64 mit 3000 Elo gefixt.

Hier nun zunächst die LS-Rangliste mit den besten Engineversionen (nur offizielle Releases, keine Entwicklungsversionen und auch keine Spezialsettings) (jeder gegen jeden, je 1000 Partien):

Rank Name                    Elo    +    - games score oppo. draws
   1 Houdini 3 x64          3151    5    5 10000   67%  3025   42%
   2 Critter 1.6a x64       3070    5    5 10000   55%  3033   53%
   3 Strelka 5.5 x64        3069    5    5 10000   55%  3034   53% (singlecore)
   4 Komodo 5 x64           3058    5    5 10000   53%  3035   44% (singlecore)
   5 Ivanhoe 46h x64        3022    5    5 10000   48%  3038   56% (best open source)
   6 Robbolito 0.10 x64s    3019    5    5 10000   47%  3039   57%
   7 Bouquet 1.5 x64s       3019    5    5 10000   47%  3039   55%
   8 Rybka 4.1 x64s         3012    5    5 10000   46%  3039   47%
   9 Robbolito 0.085g3 x64  3000    5    5 10000   44%  3040   55% (singlecore)(Ippolit 2009)
  10 Stockfish 2.3.1 x64s   2999    5    5 10000   44%  3041   46%
  11 Saros 3.0 x64          2986    5    5 10000   42%  3042   49%


Dazu die Einzelergebnisse des aktuellen Test-Gauntlets:

Bouquet 1.5 x64s   - Houdini 3 x64             320.0 - 680.0    +100/=440/-460    32.00%
Bouquet 1.5 x64s   - Komodo 5 x64              434.0 - 566.0    +219/=430/-351    43.40%
Bouquet 1.5 x64s   - Strelka 5.5 x64           421.5 - 578.5    +137/=569/-294    42.15%
Bouquet 1.5 x64s   - Critter 1.6a x64          428.5 - 571.5    +140/=577/-283    42.85%
Bouquet 1.5 x64s   - Ivanhoe 46h x64           487.5 - 512.5    +172/=631/-197    48.75%
Bouquet 1.5 x64s   - Robbolito 0.10 x64s       509.0 - 491.0    +176/=666/-158    50.90%
Bouquet 1.5 x64s   - Rybka 4.1 x64s            519.5 - 480.5    +282/=475/-243    51.95%
Bouquet 1.5 x64s   - Robbolito 0.085g3 x64     520.5 - 479.5    +202/=637/-161    52.05%
Bouquet 1.5 x64s   - Saros 3.0 x64             543.0 - 457.0    +263/=560/-177    54.30%
Bouquet 1.5 x64s   - Stockfish 2.3.1 x64s      534.5 - 465.5    +287/=495/-218    53.45%


Dann noch die komplette LS-Rangliste:

Rank Name                    Elo    +    - games score oppo. draws
   1 Houdini 3 x64          3151    5    5 11000   68%  3018   41%
   2 Houdini 2.0c x64       3104    5    5 11000   62%  3015   42%
   3 Houdini 1.5a x64       3084    5    5 10000   59%  3017   44% (best freeware (multicore))
   4 Critter 1.6a x64       3071    5    5 14000   56%  3033   52%
   5 Strelka 5.5 x64        3071    4    5 14000   56%  3033   52% (singlecore)
   6 Komodo 5 x64           3060    5    5 14000   54%  3033   43% (singlecore)
   7 Ivanhoe 46h x64        3021    5    5 14000   48%  3036   53% (best open source)
   8 Bouquet 1.5 x64s       3020    5    5 10000   47%  3039   55%
   9 Robbolito 0.10 x64s    3019    5    4 14000   48%  3036   54%
  10 Rybka 4.1 x64s         3012    5    5 14000   47%  3037   46%
  11 Stockfish 2.3.1 x64s   3002    5    5 12000   45%  3037   44%
  12 Robbolito 0.085g3 x64  3000    4    4 14000   45%  3038   52% (singlecore)(Ippolit 2009)
  13 Stockfish 2.2.2 x64s   2996    5    5 11000   45%  3033   44%
  14 Saros 3.0 x64          2987    5    5 14000   43%  3039   46%
  15 Bouquet 1.4 x64s       2929    5    5 13000   34%  3044   42%


(x64=64bit version, x64s=64bit SSE42-version)

Gelöschte Betas, Entwicklungsversionen, Settings: keine
Abgebrochene Test-Gauntlets (wegen zu schwachen Ergebnisses): Saros 3.1aDistro (-130 Elo to Saros 3.0 (2500 games))

Wer die Partien der LS-Rangliste haben will, kann mir seine eMail-Adresse per PM hier oder auf talkchess mitteilen, ich schicke dann in Kürze die Partien als PGN-File. Dieses Angebot erfolgt, damit Transparenz und Glaubwürdigkeit der Rangliste gewährleistet ist.

Grüße an alle - Stefan
Parent - - By Thomas Schoenegger Date 2012-10-26 08:32
Danke dir, interessant wird ja das Ergebnis von RobboLito 0.21Q sein, welche ich ja leicht besser als Ivan und Rybka bei diesen BZ sehe. Obwohl die Ergebnisse in 40/4 nicht berauschend waren, wurde ja kurz angetestet. Soweit ich das verstanden habe wird es keine 0.22 geben. Bin aber auf dein Resultat neugierig.
Grüße Thomas
Parent - - By Stefan Pohl Date 2012-10-26 11:59
Zur Zeit läuft der Test von Gull 2 beta2. Sobald der durch ist (hoffentlich Montagabend), kommt Robbolito dran.

Stefan
Parent - - By Thomas Schoenegger Date 2012-10-26 17:03
Freue mich auf dein Fazit, zu meiner Schande muss ich zugeben, dass ich mich mit  Gull2beta2 noch nie beschäftigt habe.  Stockfish 2.3.1Qi ist ja interessant, jedoch für AMD-Besitzer nicht zu gebrauchen, da Intel optimiert, aber scort ja angeblich (russ. Forum) besser als das offizielle Release. Das letzte Compile des Stocki 120114Q weiß ich auch nicht. Sind mir einfach zu viele. Aber auf Robbo 0.22 bin ich gespannt, ob es sich bei dir /10tausend Partien vor Rybka und Ivan einreihen wird.
Grüße Thomas 
Parent - By Thomas Schoenegger Date 2012-10-26 17:12
Meinte natürlich die 0.21
Up Topic Hauptforen / CSS-Forum / LS-Rangliste: Bouquet 1.5

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill