Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Bench-Werte Stockfish 6 sse4.2.compiles
- - By Stefan Pohl Date 2015-01-29 04:18 Edited 2015-01-29 04:30
Hallo zusammen,

Ich hatte ein kleines Problem mit der Antivirensoftware auf einem meiner Notebooks, auf dem sonst das Endless-RoundRobin Turnier läuft (und das ich für die Messungen genutzt hatte), und mit dem ich die Compiles ausgemessen hatte. Hier nun meine korrekten Werte (je 10 bench-Durchläufe, Mittelwert), von meinem anderen Notebook, daß ich für die Stockfish-Testruns  nutze, auf dem keine Antivirensoftware läuft:

Der sse42 aus dem offiziellen Download-Package von stockfishchess.org ist am schnellsten und zwar deutlich: +4.7% schneller als der micha...@gmail.com Compile und +5.1% schneller der Compile von abrok.eu. Alles auf meiner i7-mobile CPU (i7-2630QM).
Noch krasser war es bei Andreas Strangmüller mit seinem Desktop-PC (i5-750 CPU), dessen Resultat ich mal von fishcooking hier rein kopiere (siehe unten). Da war der offizielle sse42-compile fast +8% schneller als der von abrok.eu (!). Glücklicherweise ist Andreas ein seriöser Tester, der seine Stockfish 6-Tests natürlich mit der offiziellen Version von stockfishchess.org durchführt. So haben wir dann wenigstens ein vernünftiges Ranglisten-Ergebnis, wenn er mit seinen Testruns durch ist (http://www.fastgm.de).
Schön wäre es, wenn jemand mal benches mit den Haswell-Compiles macht, sofern eine Haswell-CPU vorhanden ist...(Bitte vorher frisch booten und Antivirensoftware abschalten!)

Stefan

Intel i5-750 @ 3.5 GHz

Base = stockfishchess.org  - stockfish-6-sse42.exe
Test = abrok.eu/stockfish/ - stockfish_15012721_x64_modern.exe

Results for 50 tests for each version:

            Base      Test      Diff     
    Mean    1640565   1519301   121264 = + 7,98%  
    StDev   2820      1861      3235    

p-value: 0
Parent - By Stefan Pohl Date 2015-01-29 08:31
Nachtrag meines alten Intel-Quad ohne sse42 (core2 Q9550 2.83GHz). Hier kamen natürlich die non-sse42 Compiles zum Einsatz:
Der normale x64-Compile aus dem offiziellen Downloadpackage war hier +5.3% schneller als die Version von abrok.eu.

Stefan
Parent - - By Wolfgang Battig Date 2015-01-29 12:58
Stefan Pohl schrieb:

.....So haben wir dann wenigstens ein vernünftiges Ranglisten-Ergebnis, ....


na ja, ganz so ist es ja nicht. Werner Schüle (CEGT-40/20) und ich verwenden ausschließlich die "offizielle" Version, lediglich Gerhard hat m.W. anfangs (also in vielleicht mal gerade 200-300 Spielen von letztendlich mehreren tausend) nicht die "offizielle" verwendet. Wieviel bringen 5%, meinetwegen auch 8% (wenn es wirklich so viel ist)? 3 oder 4 oder 5 ELO? Lächerlich! Erst recht in Verbindung damit, dass die ach so "langsame" Version in vielleicht 10-20% aller Spiele verwendet wurde.

Die CEGT-Zahlen werden "sauber" sein. Ganz abgesehen davon gibt es auch noch CCRL.

Es gibt also ganz sicher mehr als EIN vernünftiges Ranglistenergebnis.

Zitat:
Schön wär es, wenn jemand mal benches mit den Haswell-Compiles macht, sofern eine Haswell-CPU vorhanden ist...(Bitte vorher frisch booten und Antivirensoftware abschalten!)


Benchmark hab ich nicht gemacht sondern die BMI2-Versionen mal parallel auf meinem i7-4770 rechnen lassen. Über den Daumen +4-5%.
Parent - - By Stefan Pohl Date 2015-01-29 13:34
Wolfgang Battig schrieb:

Stefan Pohl schrieb:

.....So haben wir dann wenigstens ein vernünftiges Ranglisten-Ergebnis, ....


na ja, ganz so ist es ja nicht. Werner Schüle (CEGT-40/20) und ich verwenden ausschließlich die "offizielle" Version, lediglich Gerhard hat m.W. anfangs (also in vielleicht mal gerade 200-300 Spielen von letztendlich mehreren tausend) nicht die "offizielle" verwendet. Wieviel bringen 5%, meinetwegen auch 8% (wenn es wirklich so viel ist)? 3 oder 4 oder 5 ELO? Lächerlich! Erst recht in Verbindung damit, dass die ach so "langsame" Version in vielleicht 10-20% aller Spiele verwendet wurde.

Die CEGT-Zahlen werden "sauber" sein. Ganz abgesehen davon gibt es auch noch CCRL.

Es gibt also ganz sicher mehr als EIN vernünftiges Ranglistenergebnis.

Zitat:
Schön wär es, wenn jemand mal benches mit den Haswell-Compiles macht, sofern eine Haswell-CPU vorhanden ist...(Bitte vorher frisch booten und Antivirensoftware abschalten!)


Benchmark hab ich nicht gemacht sondern die BMI2-Versionen mal parallel auf meinem i7-4770 rechnen lassen. Über den Daumen +4-5%.


Vielen Dank für die interessanten Auskünfte.
Ich meine zwar nicht, daß 3-5 Elo lächerlich sind, aber das ist Ansichtssache. Und wenn Andreas Strangmüller 7.9% Prozent Geschwindigkeitsplus auf seinem System mißt, dann kannst du das schon glauben. Und das ist ja nun keine Kleinigkeit. Wie dem auch sei:
Ich habe eher ein prinzipielles Problem damit, nicht die vom Hersteller, Macher, Verantwortlichen (oder wie immer man das bei Stockfish nennen will) offiziell veröffentlichten Versionen in einer Rangliste zu testen, sondern einen Autocompile einer Beta-/Devversionen Website. Das geht nach meiner Meinung einfach gar nicht. Selbst dann nicht, wenn der dortige Compile gleich schnell oder gar schneller wäre.
Damit nimmt der Tester den Verantwortlichen die Entscheidungsfreiheit, welche Version schlußendlich zur finalen erklärt wird. (und das sind nun mal die lauffähigen exe-Files und nicht nur der Source Code).

Ich würde es schön finden, wenn du die Bmi2-Compiles mal richtig benchen würdest, denn bei fishcooking wurde vom Macher des Compiles behauptet, dieser Compile wäre so 7.3% schneller als der auf abrok.eu.
Es wäre informativ, das mal genau nachzumessen.

Stefan
Parent - By ? Date 2015-01-29 13:57
Stefan Pohl schrieb:


Damit nimmt der Tester den Verantwortlichen die Entscheidungsfreiheit, welche Version schlußendlich zur finalen erklärt wird. (und das sind nun mal die lauffähigen exe-Files und nicht nur der Source Code).
....



Tja, wenn es denn so wäre. Deine Behauptung macht es nicht wahr: http://www.talkchess.com/forum/viewtopic.php?topic_view=threads&p=606218&t=55122

Niemand hat hier irgendjemandem die Entscheidungsfreiheit genommen, im Gegenteil! Willst du aber wahrscheinlich auch nicht hören und findest irgend etwas anders ...

Ingo
Parent - - By GS Date 2015-01-29 14:25
Stefan Pohl schrieb:

[...snip...]
Ich habe eher ein prinzipielles Problem damit, nicht die vom Hersteller, Macher, Verantwortlichen (oder wie immer man das bei Stockfish nennen will) offiziell veröffentlichten Versionen in einer Rangliste zu testen, sondern einen Autocompile einer Beta-/Devversionen Website. Das geht nach meiner Meinung einfach gar nicht.
[...snip...]


Unwahrheiten werden auch durch andauernde Wiederholungen nicht wahr !

Natürlich ist die Abrok-Version von Stockfish 6.0 eine/die Offizielle !

Zitat Joona Kiiski (Quelle siehe unten):
It will likely take a few days to prepare the official binaries.
Meanwhile you can either download a version compiled by abrok.eu or compile it yourself:
...
On behalf of all Stockfish developers and contributors,


Hinweis:
Bei mangelnden Englischkenntnissen einfach einen Verwandten, Bekannten oder Freund
fragen oder einen Translator verwenden !

http://talkchess.com/forum/viewtopic.php?t=55122
Parent - - By Jörg Oster Date 2015-01-29 14:45
GS schrieb:

Stefan Pohl schrieb:

[...snip...]
Ich habe eher ein prinzipielles Problem damit, nicht die vom Hersteller, Macher, Verantwortlichen (oder wie immer man das bei Stockfish nennen will) offiziell veröffentlichten Versionen in einer Rangliste zu testen, sondern einen Autocompile einer Beta-/Devversionen Website. Das geht nach meiner Meinung einfach gar nicht.
[...snip...]


Unwahrheiten werden auch durch andauernde Wiederholungen nicht wahr !

Natürlich ist die Abrok-Version von Stockfish 6.0 eine/die Offizielle !


Das steht so aber nicht im Zitat von Joona!
Und ja, ich kann Englisch lesen (und verstehen).

GS schrieb:

Zitat Joona Kiiski (Quelle siehe unten):
It will likely take a few days to prepare the official binaries.
Meanwhile you can either download a version compiled by abrok.eu or compile it yourself:
...
On behalf of all Stockfish developers and contributors,


Hinweis:
Bei mangelnden Englischkenntnissen einfach einen Verwandten, Bekannten oder Freund
fragen oder einen Translator verwenden !

<a class='urs' href='http://talkchess.com/forum/viewtopic.php?t=55122'>http://talkchess.com/forum/viewtopic.php?t=55122</a>
Parent - - By GS Date 2015-01-29 15:25
Jörg Oster schrieb:

[...snip...]
Und ja, ich kann Englisch lesen (und verstehen).
[...snip...]


Hhhmm, und woran hapert es dann ?

Joona Kiiski (einer der Autoren von Stockfish) schreibt als Thread-Überschrift:
"SF 6 has been released".

Danach listet er einige features auf und schreibt zum Schluss, dass es noch ein
wenig dauert bis die binaries auf der offiziellen Stockfish-Seite zur Verfügung
stehen. Um diese Wartezeit zu überbrücken stellt er die Abrok-Links ins Posting.
Er unterschreibt im Auftrag aller Stockfish Entwickler und Helfer.

Kann man das missverstehen ?

Es liegt ja wohl auf der Hand, dass wenn einer der Verantwortlichen unterschreibt
mit "on behalf of all Stockfish developers and contributors", er dies nicht lange
unwiedersprochen stehen lassen könnte, so es denn ungewollt oder gar falsch wäre !

Desweiteren ist auch den Stockfish Machern bekannt, dass eine neue Version sofort
getestet wird. Hätten sie deswegen Bauchweh und/oder begründete Angst bezüglich
marginaler Geschwindskeitsverluste, so würden sie diesen Schritt niemals gehen, nicht wahr ?
Parent - - By sachista Date 2015-01-29 15:54
GS schrieb:
Hhhmm, und woran hapert es dann ?

Joona Kiiski (einer der Autoren von Stockfish) schreibt als Thread-Überschrift:
"SF 6 has been released".

Danach listet er einige features auf und schreibt zum Schluss, dass es noch ein
wenig dauert bis die binaries auf der offiziellen Stockfish-Seite zur Verfügung
stehen. Um diese Wartezeit zu überbrücken stellt er die Abrok-Links ins Posting.
Er unterschreibt im Auftrag aller Stockfish Entwickler und Helfer.

Kann man das missverstehen ?


Anscheinend ja, denn genau das ist hier passiert. Immerhin wird Joona Kiiski ja falsch zitiert/übersetzt.

Darum geht es:

GS schrieb:

Natürlich ist die Abrok-Version von Stockfish 6.0 eine/die Offizielle !

Zitat Joona Kiiski (Quelle siehe unten):
It will likely take a few days to prepare the official binaries.
Meanwhile you can either download a version compiled by abrok.eu or compile it yourself:



Joona schreibt, dass es wahrscheinlich ein paar Tage dauert, die offiziellen Binaries vorzubereiten/bereit zu stellen/zu erstellen und nicht, dass es "noch ein
wenig dauert bis die binaries auf der offiziellen Stockfish-Seite zur Verfügung stehen" - das wäre ja mithilfe von z.B. abrok.eu direkt möglich gewesen.

In der Zwischenzeit könne man sich entweder eine Version von abrok.eu herunterladen oder sich selbst Binaries kompilieren. Er unterscheidet also zwischen den "official binaries" und der "version compiled by abrok.eu". Er schlägt sogar vor, sich selbst eine Version zu kompilieren. Nach der Logik von "Natürlich ist die Abrok-Version von Stockfish 6.0 eine/die Offizielle !" wäre diese (wie auch immer) selbstkompilierte Version dann ja auch "eine/die Offizielle" - obwohl Joona ja ohnehin schon vorher entsprechend differenziert hat.
Parent - - By GS Date 2015-01-29 17:07
Danke für die Antwort !

Und wie soll/muss man dann den Thread-Titel, welcher immerhin
von einem der Autoren von Stockfish 6.0 stammt:

"SF 6 has been released"
(Stockfish 6.0 wurde veröffentlicht resp. ist veröffentlicht worden)

richtig interpretieren ?

Dazu noch im Thread-Text u.a. ein Link zu Stockfish 6.0 exe-files
und dazu noch die Legitimation aller Verantwortlichen ?
Parent - By ? Date 2015-01-29 17:57
GS schrieb:

Danke für die Antwort !

Und wie soll/muss man dann den Thread-Titel, welcher immerhin
von einem der Autoren von Stockfish 6.0 stammt:

"SF 6 has been released"
(Stockfish 6.0 wurde veröffentlicht resp. ist veröffentlicht worden)

richtig interpretieren ?

Dazu noch im Thread-Text u.a. ein Link zu Stockfish 6.0 exe-files
und dazu noch die Legitimation aller Verantwortlichen ?


Stockfish ist bekanntermaßen ein Open-Source-Projekt. Es wurde in diesem Fall also (zunächst) der Sourcecode der finalen/offiziellen Version von Stockfish 6 veröffentlicht. Die offiziellen Binaries folgten dann später, wie Joona Kiiski es in seinem Beitrag ja auch angekündigt hatte.
Parent - - By Gysi Date 2015-01-29 18:09
Wenn jemand in dieser Angelegenheit die Meinung eines professionellen Übersetzers erfahren möchte, bitteschön:

Kindergarten!
Parent - By GS Date 2015-01-29 18:39
Bitte - Danke.
Parent - - By Benno Hartwig Date 2015-01-29 17:27 Edited 2015-01-29 17:44

> Natürlich ist die Abrok-Version von Stockfish 6.0 eine/die Offizielle !


Und wenn sich diese hinsichtlich der Geschwindigkeit doch deutlich von der unterscheiden würde, die man direkt bei
https://stockfishchess.org/download/
bekommt? 
Ich habe im Moment schon den Eindruck, dass die Version von stockfishchess.org schon ein Stück schneller ist als die abrok-Version.
Soll es dann wirklich zwei unterschiedliche, verschieden schnelle "offizielle"  Stockfish-6-modern-Versionen geben?

Benno
Parent - - By GS Date 2015-01-29 18:36
Bleiben wir bei den Fakten.

Ein Co-Autor schreibt, dass die Engine veröffentlich wurde (nicht wird !)
und setzt einen Link auf die Engine.exe. Und sowohl das Posting als auch
der Link sind nach wie vor aktuell und verfügbar.

Mir persönlich ist das "offiziell genug" !

Meine Tests haben gezeigt, dass es bei entsprechender Mindestbedenkzeitvorgabe
vollkommen gleichgültig ist, ob nun ein Compile 3, 5 oder 8% "schneller/langsamer" ist.
Parent - - By Benno Hartwig Date 2015-01-29 19:48
Ich akzeptiere ja das Faktum, dass es dir persönlich "offiziell genug" ist.

Und andererseits überlege ich, was es für die Verkäufe zweier Rybka-, Houdini- oder Komodo-Anbieter bedeutet hätte, wenn bekannt geworden wäre, dass die Versionen des einen jeweils um 5% schneller wäre als die des anderen.
Wäre das den Käufern wirklich egal gewesen?

Benno
Parent - - By GS Date 2015-01-29 20:07
Es ist ihnen aber schon bekannt, dass Stockfish Freeware ist ?
Parent - - By Benno Hartwig Date 2015-01-29 20:21

> Es ist ihnen aber schon bekannt, dass Stockfish Freeware ist ?


Ja,
ich denke aber, das ist unerheblich für die Frage, ob man 2 Programmversionen für unterschiedlich hält.
Und auch mit Blick auf die Freeware ist interessant, wie solch ein Unterschied für Verkaufszahlen anderer Software wirken würde, denke ich.

Übrigens, ich weiß ja nicht, ob dir das bekannt ist : Stockfish ist sogar Open Source und der User hat die Chance, auch selbst noch nach besonders schnellen Compiles zu forschen und sich selbst zu versuchen.

Benno
Parent - By GS Date 2015-01-29 20:54
Benno Hartwig schrieb:

[...snip...]
Übrigens, ich weiß ja nicht, ob dir das bekannt ist : Stockfish ist sogar Open Source und der User hat die Chance, auch selbst noch nach besonders schnellen Compiles zu forschen und sich selbst zu versuchen.
[...snip...]


Ja, ist bekannt.
Parent - By Ingo B. Date 2015-01-29 13:51
Wolfgang Battig schrieb:

...
na ja, ganz so ist es ja nicht. ...


Mir scheint es ist nie ganz so wie SP das immer hochschaukelt! Zusätzlich zu der Irrelevanz die du erwähnst, kommt noch, dass die Version die GS und ich Anfangs verwendet haben genau die Version ist die der Autor als ausreichend bezeichnet hat und sogar ausdrücklich erwähnte das ein "retest" bei erscheinen der endgültigen endgültigen Version nicht nötig ist.

http://www.talkchess.com/forum/viewtopic.php?topic_view=threads&p=606218&t=55122

Gruß
Ingo

PS: übrigens, da ich bei SF5 ja auch einen abrok compile verwedet habe - wegen der Syzygy bases - sollte der Abstand jetzt genau richtig sein.
Parent - By GS Date 2015-01-29 14:10
Hi Wolfgang !

In den ersten 300 Games kam bei mir die besagte Veröffentlichung von Stockfish 6
zum Einsatz. Die Performance, welche dieser Stockfish 6 erspielte ist 3191.

Danach kam dann die "offizielle" Version zu ihrem Auftritt, Performance aus bisher
400 weiteren Spielen ist 3190.

Wie ich schon erwähnte, 3-5 oder auch 8% spielen keine Rolle bei unseren Tests.

Möglicherweise ist das bei Bedenkzeiten in der Art "eine Handvoll Sekunden Basiszeit
plus Bruchteile einer Sekunde Aufschlag"
anders, dies jedoch interessiert niemanden.

Zitat Joona Kiiski (Quelle siehe unten):
"We expect these to be somewhat faster than the ones abrok.eu is providing.
However there should be no need to restart test runs or anything like that if
you already have used abrok.eu compiles.


http://talkchess.com/forum/viewtopic.php?t=55122&start=10

Viele Grüsse,
G.S.
Parent - - By Andreas Strangmüller Date 2015-01-29 20:09
Hallo Stefan,

hier die Werte einer Haswell-CPU:

Intel i7-4700QM

Base = stockfish-6-bmi2
Test = stockfish_15012721_x64_bmi2

Results for 50 tests for each version:

            Base      Test      Diff     
    Mean    2199074   2062119   136955    + 6.64%
    StDev   6998      6468      11370    

p-value: 0

Results for 50 tests for each version:

            Base      Test      Diff     
    Mean    2173042   2031634   141408    + 6.96%
    StDev   114795    109366    10583    

p-value: 0

Results for 50 tests for each version:

            Base      Test      Diff     
    Mean    2195079   2052928   142151    + 6.92%
    StDev   48910     49836     8498     

p-value: 0
Parent - By Stefan Pohl Date 2015-01-30 06:54
i
Andreas Strangmüller schrieb:

Hallo Stefan,

hier die Werte einer Haswell-CPU:

Intel i7-4700QM

Base = stockfish-6-bmi2
Test = stockfish_15012721_x64_bmi2

<code>Results for 50 tests for each version:

            Base      Test      Diff     
    Mean    2199074   2062119   136955    + 6.64%
    StDev   6998      6468      11370    

p-value: 0

Results for 50 tests for each version:

            Base      Test      Diff     
    Mean    2173042   2031634   141408    + 6.96%
    StDev   114795    109366    10583    

p-value: 0

Results for 50 tests for each version:

            Base      Test      Diff     
    Mean    2195079   2052928   142151    + 6.92%
    StDev   48910     49836     8498     

p-value: 0</code>


Super, vielen Dank. Also knapp +7%. Ganz schön happig.
Ich warte jetzt gespannt auf deine Test-Ergebnisse des offiziellen Stockfish 6 !
Bei mir sind gut 2100 von 7000 Partien durch und es sieht nach einem leichten Plus (irgendwas im Bereich von +5 Elo) im Vergleich zu Stockfish 150105 aus.

Stefan
Parent - - By Benno Hartwig Date 2015-01-29 23:02
Ich habe bei sehr kurzen 20s+0,2s ein kleines Turnier aufgesetzt, um die Geschwindigkeiten der SF6-Kompilate vergleichen zu können.
Hier steht es jetzt:
1. SF6ori        271.5/506  122-85-299  (L: m=19 t=0 i=0 a=66)(D: r=219 i=41 f=22 s=3 a=14)(tpm=442.9 d=17.01 nps=848654)
2. SF6bunkbail   228.5/505  83-131-291  (L: m=34 t=0 i=0 a=97)(D: r=215 i=43 f=19 s=1 a=13)(tpm=447.5 d=16.24 nps=719909)
3. SF6abrok      258.0/505  109-98-298  (L: m=31 t=0 i=0 a=67)(D: r=218 i=40 f=25 s=2 a=13)(tpm=445.9 d=16.63 nps=807356)


Hmm,
vor einiger Zeit hatte ich noch festgestellt, dass die bunkbail-Version etwas schneller war als die abrok-Version.
Nun hat abrok aber wo auf und überholt.  Aber das Executable von stockfishchess.org (hier die ori-Version) ist wohl doch noch  ein Stückchen schneller.

Benno
Parent - By Benno Hartwig Date 2015-01-30 07:00 Edited 2015-01-30 07:04
Natürlich sind die Spielstärkeunterschiede nicht groß:

1. SF6ori        571.5/1087  253-197-637  (L: m=42 t=0 i=0 a=155)(D: r=467 i=87 f=42 s=4 a=37)(tpm=442.6 d=17.21 nps=912836)
2. SF6abrok      558.5/1086  241-210-635  (L: m=60 t=0 i=0 a=150)(D: r=475 i=83 f=39 s=3 a=35)(tpm=444.7 d=16.98 nps=871978)
3. SF6bunkbail   500.0/1087  188-275-624  (L: m=74 t=0 i=0 a=201)(D: r=460 i=94 f=33 s=3 a=34)(tpm=446.2 d=16.54 nps=778887)

  Program            Score     %    Av.Op.  Elo    +   -    Draws
1 SF6ori       : 572.5/1089  52.6   2994   3012   13  13   58.7 %
2 SF6abrok     : 559.5/1088  51.4   2997   3007   13  13   58.5 %
3 SF6bunkbail  : 501.0/1089  46.0   3009   2981   13  13   57.5 %


aber die Version von stockfishchess.org ist wohl schon einfach die schnellste und dann auch spielstärkste.

Benno
Parent - By Stefan Pohl Date 2015-01-30 07:17 Edited 2015-01-30 07:19
Benno Hartwig schrieb:

Ich habe bei sehr kurzen 20s+0,2s ein kleines Turnier aufgesetzt, um die Geschwindigkeiten der SF6-Kompilate vergleichen zu können.
Hier steht es jetzt:
<code>1. SF6ori        271.5/506  122-85-299  (L: m=19 t=0 i=0 a=66)(D: r=219 i=41 f=22 s=3 a=14)(tpm=442.9 d=17.01 nps=848654)
2. SF6bunkbail   228.5/505  83-131-291  (L: m=34 t=0 i=0 a=97)(D: r=215 i=43 f=19 s=1 a=13)(tpm=447.5 d=16.24 nps=719909)
3. SF6abrok      258.0/505  109-98-298  (L: m=31 t=0 i=0 a=67)(D: r=218 i=40 f=25 s=2 a=13)(tpm=445.9 d=16.63 nps=807356)</code>

Hmm,
vor einiger Zeit hatte ich noch festgestellt, dass die bunkbail-Version etwas schneller war als die abrok-Version.
Nun hat abrok aber wo auf und überholt.  Aber das Executable von stockfishchess.org (hier die ori-Version) ist wohl doch noch  ein Stückchen schneller.

Benno


Sehr schöne Gegenüberstellung Benno. Beachtenswert vor allem, wie stark die durchschnittliche Suchtiefe dank des schenlleren Compiles ansteigt: meßbar tiefer kommt der offizielle Stocfish gegenüber dem abrok.eu-Autocompile. Ich hatte mit den beiden non-sse42-Compiles auf meinem uralten Quad auch etwas über +0.3 Halbzügen. Das ist beträchtlich und kommt eben durch das stark selektive Suchen von Stockfish zustande. Und hat bei dir auch erheblichen Einfluß auf die erzielten Punkte. Die Compiles reihen sich im Erfolgsscore genau nach ihren Geschwindigkeiten auf, so wie es zu erwarten ist. Natürlich wären die Abstände bei längeren Bedenkzeiten geringer, aber wenn eine Engine konstant ungefähr ein 0.2-0.3 Halbzügetiefer rechnet, wird sich das bei genügend Partien immer in einer höheren Punkteausbeute niederschlagen. So viel zum Thema, daß 5-8% mehr Speed "irrelevant", "lächerlich", "nicht meßbar mehr Elo" seien...letzteres würde eventuell bei einem stark BruteForce-lastigen Programm und sehr langen Bedenzeiten stimmen, aber sicher nicht bei Stockfish, mit seiner stark selektive Suche, die eben stark von mehr Bedenkzeit profitiert (und genau auf das läuft ein schnellerer Compile ja hinaus), weil sich die Suche nicht so schnell im Suchbaum festfrißt.

Stefan
Parent - - By Benno Hartwig Date 2015-01-30 13:35 Edited 2015-01-30 13:37
Stefan, ich habe den Eindruck, dass die abrok-Kompilate irgendwann schneller geworden sind
(Das  bunkbaíl-Kompilat hatte mal die Nase vorn, jetzt liegt es eher hinten)

Du hast ja immer bei gleichen Bedingungen getestet.
Hast du verfolgt, wie sich die nps-Werte entwickelten? Irgendwann sprachen wir ja schon mal über diese SF-nps-Werte.
Hat es da irgendwann mal einen gewissen Sprung gegeben (ggf. dann auch zusammen mit einem entsprechenden "Spielstärkesprung")?

Benno
Parent - - By Stefan Pohl Date 2015-02-01 13:18
Benno Hartwig schrieb:

Stefan, ich habe den Eindruck, dass die abrok-Kompilate irgendwann schneller geworden sind
(Das  bunkbaíl-Kompilat hatte mal die Nase vorn, jetzt liegt es eher hinten)

Du hast ja immer bei gleichen Bedingungen getestet.
Hast du verfolgt, wie sich die nps-Werte entwickelten? Irgendwann sprachen wir ja schon mal über diese SF-nps-Werte.
Hat es da irgendwann mal einen gewissen Sprung gegeben (ggf. dann auch zusammen mit einem entsprechenden "Spielstärkesprung")?

Benno


Das kann ich nicht bestätigen. Im Gegenteil. Im Herbst wurde auf die neue gcc-Compilerversion umgestellt und dadurch wurden die abrok.eu-Binaries meßbar langsamer (eben um den Betrag, um den die offiziellen Binaries jetzt schneller sind, denn diese wurde mit der alten Compiler-version erzeugt, soweit ich weiß) - also ca. -5%.
Seitdem konnte ich keine nennenswerte Änderung feststellen.
Aber wenn du das ganz genau wissen bzw. prüfen willst, so kannst du ja beliebig viele alte abrok.eu-Versionen nachwievor downloaden und es ausmessen.

Stefan
Parent - By Tom Paul Date 2015-02-01 14:09
Und welchen Sinn hatte dann die Umstellung?
Parent - - By Thomas Plaschke Date 2015-01-31 18:27
Noch mehr Zahlenfutter am Wochenende.
Ich habe verschiedene Compiles von Stockfish 6 verglichen - und wollte mal sehen, ob eine schnellere Version zustande bringe als die von der "offiziellen" Quelle.
Code:
                                  t=405ms                t=1622ms                  bench              d=17 def depth          d=20 def depth
Stockfish-6-sse42                3.432.698      100,0%  3.479.504       100,0%   2.696.929      100,0%   2.663.711      100,0%   2.535.568      100,0%
Stockfish-6-PGO474               3.438.034      100,2%  3.472.459        99,8%   2.696.929      100,0%   2.661.281       99,9%   2.540.078      100,2%
Stockfish-6-PGO492               3.413.214       99,4%  3.415.058        98,1%   2.647.297       98,2%   2.623.937       98,5%   2.478.872       97,8%
Stockfish_6_BYO474_x64_avx       3.433.618      100,0%  3.453.037        99,2%   2.696.929      100,0%   2.658.694       99,8%   2.511.308       99,0%
Stockfish-6-64                   3.360.800       97,9%  3.399.698        97,7%   2.622.389       97,2%   2.580.455       96,9%   2.447.840       96,5%
                                                                                 8.918.745              43.756.784              155.648.398
Stockfish-6-sse42 und Stockfish-6-64 sind offizielle Windows-Compiles ("modern" und "modern mit popcnt").
Stockfish-6-PGO474 und Stockfish-6-PGO492 sind von mir fabrizierte Compiles. PGO steht auf deutsch für "Profil gestützte Optimierung" und die Zahl danach für die Version des verwendeten minGW-Compilers (4.7.4 und 4.9.2).
Stockfish_6_BYO474_x64_avx ist eine mit dem BYO-Compilerpaket 1.13 angefertigte Version. Compilate, die schneller sind als die BYO-Versionen, muss man erst mal schaffen. - Ein guter Markstein, finde ich.

Das ganze fand auf einem i5-Ivy-Bridge-Rechner statt. Aufgeführt sind Zeit- und Tiefentests. Getestet wurde mit dem Stockfish-Benchmarktest. t=405ms bedeutet, dass mit den Parametern bench 16 1 405 default time gestestet wurde. Gerechnet wird an den 37 Teststellungen 405ms pro Zug. Der gesamte Test dauert dann ca. 15 s. - Mit 1622ms etwa eine Minute.
Die Tiefentests wurden mit den Parametern bench 16 1 17 default depth für 17 Halbzüge Tiefe, entsprechend 20 für 20 Halbzüge gestartet. Als Parametereingabe bench allein startet den Test für Tiefe 13. Die Tests dauerten dann mit der zunehmenden Tiefe ca. 3,3 s, 15 s und 1 Minute.
Die Engineausgaben habe ich ins null-device umgeleitet. Die Leistungsfähigkeit der Bildschirmausgabe wollte ich nicht testen. Die Werte sind dadurch etwas besser als mit Bildschirmausgabe.
Die Minutentests habe ich 2 mal durch geführt die kürzen Tests etwa 5 mal. Die besten Werte kamen in die Tabelle. Die Tabelle zeigt also die maximale Leistung, nicht die Durchschnittswerte. So hat im bench-Test die PGO474 den gelisteten Wert 4 mal erreicht, die offizielle sse4.2-Version den identischen Wert dagegen nur einmal.

Und noch mehr Zahlenfutter. Inspiriert von Bennos Test habe ich versucht mit der für mich neuen Little-Blitzer-GUI eine Testreihe zu starten (ebenfalls 20s Bedenkzeit +0,2 pro Zug). Erstmal ganz sachte und einfach. Ich habe Stockfish 6 als Stockfisch 6 A-D, also viermal gegen sich selbst spielen lassen. So zu sagen, um über 2.000 Partien das statistische Rauschen zu hören. 18 Partien waren am Ende aber doppelt. Die habe ich für die Elo-Wertung herausgenommen.
Code:
   Program    Elo    +   -   Games   Score   Av.Op.  Draws

  1 SF6a    : 3004   14  14   990    50.8 %   2999   58.5 %
  2 SF6d    : 3001   14  14   995    50.3 %   3000   58.7 %
  3 SF6b    : 2998   14  14   985    49.6 %   3001   57.0 %
  4 SF6c    : 2997   14  14   994    49.4 %   3001   57.5 %
Anfangswert ist 3000.

Hier noch die Turnierstatistik:
Code:
1.  SF6d                       503.5/1001  209-203-589    (L: m=1 t=0 i=0 a=202)  (D: r=455 i=82 f=35 s=2 a=15)  (tpm=477.3 d=20.05 nps=3248807)
2.  SF6c                       494.5/1001  206-218-577    (L: m=5 t=0 i=0 a=213)  (D: r=449 i=79 f=27 s=6 a=16)  (tpm=481.2 d=20.13 nps=3293885)
3.  SF6b                       495.5/1000  210-219-571    (L: m=0 t=0 i=0 a=219)  (D: r=443 i=75 f=29 s=5 a=19)  (tpm=478.1 d=20.21 nps=3322998)
4.  SF6a                       506.5/ 998  214-199-585    (L: m=2 t=0 i=0 a=197)  (D: r=465 i=60 f=31 s=7 a=22)  (tpm=476.9 d=20.30 nps=3319461)

Gewonnen hat Stockfish 6 vor Stockfish 6. Dritter wurde Stockfish 6. Auf den Plätzen blieb Stockfish 6.
Warum die Little-Blitzer-GUI nicht Eingabe von Turnierrunden erlaubt, sondern nur Zahl der zu spielenden Partien, weiß ich nicht. Ich dachte auch, bei 4 Teilnehmern und 2000 "rounds" läge es auf der Hand, dass jeder Teilnehmer auf 1000 Partien kommt. Vielleicht da jemand einen Ratschlag?

Viele Grüße
Th. Plaschke
Parent - By Benno Hartwig Date 2015-01-31 18:50 Edited 2015-01-31 19:03
Thanx für deine "Zahlen".
Die offiziellen Compiles sind dann wohl schon richtig gut.

LittleBlitzer ist schon eigen.
Ich finde die Idee sehr gut, aber das Programm sollte gern etwas weiterentwickelt werden und dann richtig gut werden.

Die von dir erwähnte Partienzahl-Verteilung ist schon eigenwillig.
Ich würde auch zur Laufzeit gern etwas mehr erfahren, was gerade läuft, wer gerade spielt. Eine Kreuztabelle wäre schön.
Und ich würde gern ein Turnier wiederaufsetzen können (OK, ich kann ein neues beginnen und die PGN-Datei fortschreiben lassen. Dann rechnet z.B. Elostat alles zusammen. Wichtig, falls man mal leichtfertig auf die ESC-Taste gekommen ist.).

Die LittleBlitzer-Idee ist toll, das Tool ist wirklich sehr praktisch, wenn man schnell viele Partien braucht.
Aber das Programm ist irgendwie noch nicht fertig.
Aber die Arbeiten daran sind wohl eingestellt.

Benno
Parent - By Thomas Plaschke Date 2015-02-01 11:56
Ergänzen sollte ich noch, dass es sich bei der Version SF6d um Stockfish-6-64.exe aus dem offiziellen Packet handelt. Das ist die Version ohne popcnt, die im Vergleich der Stockfish-Compilate zwischen 2,1 % und 3,5 % langsamer als die "Spitzenversion" Stockfish-6-sse42.exe war.
Ihr Nachteil erwies sich, diplomatisch ausgedrückt, als nicht in Elo-Punkten ablesbar.

Viele Grüße
Th. Plaschke
Parent - By Thomas Plaschke Date 2015-02-01 20:22
Ich habe auch noch einen Compile mit VC 2013. Dessen Ergebnis gegen die offizielle Version reiche ich hiermit nach:
Code:
1.  SF6MS         487.0/1000  196-222-582    (L: m=1 t=0 i=0 a=221)  (D: r=470 i=70 f=18 s=6 a=18)  (tpm=479.9 d=20.02 nps=3036189)
2.  SF6           513.0/1000  222-196-582    (L: m=1 t=1 i=0 a=194)  (D: r=470 i=70 f=18 s=6 a=18)  (tpm=479.1 d=20.31 nps=3304285)

Laut Elostat ergibt sich diese Reihenfolge:
Code:
  1 SF6           : 3005   14  14  1000    51.3 %   2995   58.2 %
  2 SF6MS         : 2995   14  14  1000    48.7 %   3005   58.2 %

Im Geschwindigkeitsvergleich liegt die VC-Version zwischen 14,5 % bei sehr kurzen Bedenkzeiten bis 9,1 % bei kurzen Bedenkzeiten hinter der Vergleichsversion.
Hier die ergänzte Tabelle:
Code:
                                    t=405ms                t=1622ms                  bench              d=17 def depth          d=20 def depth
stockfish-6-sse42                  3.432.698      100,0%  3.479.504       100,0%   2.696.929      100,0%   2.663.711      100,0%   2.535.568      100,0%
Stockfish-6-PGO474                 3.438.034      100,2%  3.472.459        99,8%   2.696.929      100,0%   2.661.281       99,9%   2.540.078      100,2%
Stockfish-6-PGO492                 3.413.214       99,4%  3.415.058        98,1%   2.647.297       98,2%   2.623.937       98,5%   2.478.872       97,8%
Stockfish_6_BYO474_x64_avx         3.433.618      100,0%  3.453.037        99,2%   2.696.929      100,0%   2.658.694       99,8%   2.511.308       99,0%
stockfish-6-64                     3.360.800       97,9%  3.399.698        97,7%   2.622.389       97,2%   2.580.455       96,9%   2.447.840       96,5%
Stockfish-6-VC2013                 3.010.835       87,7%  3.137.243        90,2%   2.305.180       85,5%   2.389.253       89,7%   2.303.717       90,9%
Knotenzahl bei Tests mit fixer Tiefe                                               8.918.745              43.756.787              155.648.398

Im Vergleichswettkampf entspricht die durchschnittliche Bedenkzeit pro Zug am ehesten der im Test mit 405 ms bzw. mit d=17. Ein Geschwindigkeitsnachteil von 10-12 % wäre demnach mit etwa 10 Elo-Punkten zu beziffern. Wobei die mögliche Fehlerabweichung allerdings immer noch deutlich größer als die Elo-Differenz ist.
Ohne einen Denkfehler gemacht zu haben, hieße das aber auch, dass die SF6-bunkbail-Version in Bennos Test noch langsamer als mein VC-Stockfish sein muss. Immer hin liegt die bunkbail-Fassung von Stockfish dort mit 31 Elo-Punkten signifikant hinter der offiziellen Version. Das hätte ich nicht erwartet. Ich habe SF6-bunkbail nicht und kann das daher nicht nachvollziehen. Hast Du eine Erklärung dafür, Benno?

Viele Grüße
Th. Plaschke
Up Topic Hauptforen / CSS-Forum / Bench-Werte Stockfish 6 sse4.2.compiles

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill