[quote="Thomas Plaschke"]
Ja, das wird das Beste sein.
Die 1,5 - 2 Prozent, die der auto-compile bei mir langsamer ist, sind nicht weltbewegend.
Also viel Erfolg beim Testen.
Gruß
Th. Plaschke
[/quote]
Also bei mir ist der auto-compile eindeutig schneller (4%) als alle JA-Compiles. Habe mir soeben nun noch mal die JA-compiles von der Stockfish-Seite runtergeladen (falls es noch mal eine Änderung gegeben haben sollte, was auch der Fall zu sein scheint (die wievielte Version ist das eigentlich mittlerweile?!?)) - auch diese allerneuesten JA-Compiles sind ca. 4% langsamer als der auto-compile. Für moderne Intel-CPUs (nur diese kann ich beurteilen, AMD hab ich nicht), sind die JA-compiles eindeutig nur 2.Wahl. Zudem möchte ich auch in Zukunft gelegentlich development-Versionen von Stockfish in meiner LS-Rangliste testen (die ja dann auch "nur" als auto-compiles vorliegen), da ist es prinzipiell sowieso sinnvoller auch den offiziellen 3.0 Stockfish Code als auto-compile zu testen. Da die auto-compiles auf meinen Rechnern zudem schneller sind, bleibe ich bei den (sehr bewährten und stabilen) auto-compiles.
Endergebnis von Stockfish 3.0 für die LS-Rangliste (hoffentlich) kommenden Montag (alle Zeitangaben wie immer ohne Gewähr) - mit nur einem 4-Core Notebook dauert es halt, bis man 10000 Partien durch hat, selbst mit Lightspeed...
Stefan
P.S: Ich kann mich ja mal als Wahrsager versuchen:
Ich habe mal spaßeshalber alle Änderungen der development-Versionen seit dem 14.04. (diese Version war die letzte, die ich in der LS-Rangliste getestet hatte) angesehen und hochgerechnet. Es gab (neben einigen kleineren Optimierungen und bugfixes) seit dem 14.4. insgesamt 3 Änderungen, die mit echten Partien-Tests überprüft und abgeschätzt wurden (die hänge ich mal unten ans Posting an, wird sonst zu unübersichtlich).
Diese 3 Änderungen haben (addiert) eine Scoreverbesserung von 1.3% ergeben, das wären +9 Elo. Dazu gab es noch eine Hashtable-Optimierung, die ca. +3% Geschwindigkeit brachte und eben einige kleinere Optimierungen.
Daraus leite ich jetzt mal meine Ergebnisprognose für Stockfish 3.0 ab, die besagt, daß ich von einem Plus von 10-15 Elo gegenüber der Version 130414 ausgehe, die im LS-top10-tournament mit 3015 Elo gelistet ist (Stockfish 3.0 wird diese Version im top10-tournament ersetzen (immer vorausgesetzt, Version 3.0 scort besser als die Version 130414) und spielt gegen die genau gleichen Gegner unter den genau gleichen Bedingungen ebenfalls 10000 Partien).
Also tippe ich hiermit auf folgendes Ergebnis:
Stockfish 3.0: 3025-3030 Elo im LS-top10-tournament und 3022-3027 Elo in der komplett-LS-Rangliste. Das reicht leider nicht, um den Titel "best open source"-Engine von Ivanhoe 50kQ (3038 LS-Elo) zu übernehmen, aber immerhin wäre dieser nun in Sichtweite...
Da ich daran glaube, daß Ergebnisse bei sehr genauen, modernen Testbedingungen (wie bei meinen und denen vom Stockfish-Team) reproduzierbar und auch (bedingt) vorhersagbar sind (sofern man weiß welche Änderungen in einer Engine gemacht wurden und diese auch mit statistisch zuverlässigen Tests untermauert wurden (so wie in diesem Fall)), hoffe ich, daß meine Prognose stimmt...
Sollte ich falsch liegen, dürft ihr mich drauf festnageln...Da meine Prognose nur einen halb so großen Ergebnisintervall beinhaltet wie die Errorbars (die sich ja beim Vergleich von 2 Versionen einer Engine auf insgesamt 10 Elo addieren!), werde ich wohl auch ein bißchen Glück brauchen...
Hier noch die besagten 3 Änderungen, die vom Stockfish-Team mit Tests geprüft wurden. Ich habe immer die längere der beiden Bedenkzeiten zur Betrachtung herangezogen (60''+0.05''), da diese näher an den LS-Bedingungen (45''+0.5'') dran ist.
Author: Marco Costalba
Date: Fri Apr 19 09:36:00 2013 +0200
Timestamp: 1366356960
Merge Joona's bishop+pawn tweak
The idea is to penalize a bishop in case of
its pawns are on the same colored squares.
Good at short 15"+0.05 TC
LLR: 2.95 (-2.94,2.94)
Total: 4252 W: 925 L: 806 D: 2521
And at longer 60"+0.05 TC
LLR: 2.95 (-2.94,2.94)
Total: 15006 W: 2743 L: 2564 D: 9699
bench: 5274705
--------------------------------------------
Author: Marco Costalba
Date: Thu Apr 25 12:05:00 2013 +0200
Timestamp: 1366884300
Merge Joona's increased static null pruning
The idea is to fail high more easily in static
null test if in the parent node we are already
very deep in the move list, so the propability
to fail high there is very low.
[edit: I have slightly changed the functionality
moving
ss->futilityMoveCount = moveCount;
At the end of the pruning code, this should not affect
ELO in anyway, but makes code more natural and logic]
Test with SPRT is good at 15+0.05
LLR: 2.96 (-2.94,2.94)
Total: 50653 W: 10024 L: 9780 D: 30849
And at 60+0.05
LLR: 2.97 (-2.94,2.94)
Total: 40799 W: 7227 L: 6921 D: 26651
bench: 4530093
--------------------------------------
Author: Ryan Schmitt
Date: Thu Apr 25 12:13:17 2013 +0200
Timestamp: 1366884797
Increase rook/queen on 7th bonus
Shows an increase at 15+0.05
LLR: 3.01 (-2.94,2.94)
Total: 20450 W: 4091 L: 3927 D: 12432
And at 60+0.05
LLR: 2.97 (-2.94,2.94)
Total: 61432 W: 10849 L: 10441 D: 40142
bench: 4493356
Signed-off-by: Marco Costalba <>