Threads-Test inkl. Stockfish 5 und Komodo 8

By Jörg Oster Date 2014-10-09 17:44

Hallo Andreas,

vielen Dank. Sehr aufschlussreich.
Joona's Patch zeigt also durchaus messbare Ergebnisse! Trotzdem etwas verwunderlich, dass sich von 8 auf 16 Threads fast gar nichts mehr tut.
Zugegeben, so ganz verstehe ich das nicht ...

Interessant wäre es, Crafty als Vergleichsengine dabei zu haben.

Gruß, Jörg.

By Tom Paul Date 2014-10-09 18:04

Zappa ist eine Klasse für sich.

By Benno Hartwig Date 2014-10-10 18:29

Besteht diese Klasse darin, dass Zappa mit 16 Kernen nichts anzufangen weiß

Da kann aber Stockfish doch fast genau so gut.

Benno

By Jörg Oster Date 2014-10-10 22:00

Ich denke, es zeigt sich hier auch, dass Komodos SMP-Implementierung neueren Datums ist und dem Komodo-Team wahrscheinlich auch solche Maschinen zum Testen zur Verfügung standen. Was bei den anderen wahrscheinlich nicht der Fall war. Im Falle von Stockfish mit Sicherheit nicht!

Deswegen würde mich auch brennend die Performance von Crafty im Vergleich interessieren. Gerade weil Bob Hyatt ja über sehr viele Jahre schon Super-Hardware zum Testen zur Verfügung steht ...

By Andreas Strangmüller Date 2014-10-10 22:09

Hallo Jörg,

der Test mit Crafty 24.1 läuft aktuell.

Hier die Ergebnisse des ersten Durchgangs:


    Program           Elo    +   -   Games   Score   Av.Op.  Draws
 -------------------------------------------------------------------
  1 Crafty 24.1 T2  : 3046    9   9  3000    63.0 %   2954   45.7 %
  2 Crafty 24.1 T1  : 2954    9   9  3000    37.0 %   3046   45.7 %

Wins   = 1203
Draws  = 1371
Losses = 426
Av.Op. Elo = 3000

Result     : 1888.5/3000 (+1203,=1371,-426)
Perf.      : 63.0 %
Margins    :
 68 %      : (+  0.6,-  0.6 %) -> [ 62.3, 63.6 %]
 95 %      : (+  1.2,-  1.2 %) -> [ 61.7, 64.2 %]
 99.7 %    : (+  1.9,-  1.9 %) -> [ 61.1, 64.8 %]

Elo        : 3092
Margins    :
 68 %      : (+  5,-  5) -> [3087,3097]
 95 %      : (+  9,-  9) -> [3083,3101]
 99.7 %    : (+ 14,- 14) -> [3078,3106]

Games        :   3000 (finished)

White Wins   :    876 (29.2 %)
Black Wins   :    753 (25.1 %)
Draws        :   1371 (45.7 %)

White Perf.  : 52.0 %
Black Perf.  : 48.0 %

Individual statistics:

1 Crafty 24.1 T2  : 3046  3000 (+1203,=1371,-426), 63.0 %
2 Crafty 24.1 T1  : 2954  3000 (+426,=1371,-1203), 37.0 %

By Willem Date 2014-10-10 22:56

Hallo Andreas,

Vielen Dank.
Sehr interessant und informatief.
Eine Erweiterung bis 32 Threads wäre natürlich nog besser !!!

By Jörg Oster Date 2014-10-10 23:38

Hallo Andreas,

klasse, was für ein Service!
Schon mal vorab vielen Dank dafür.

Von 1 auf 2 Threads also ganz normale +92 Punkte.
Bin mächtig gespannt auf die weiteren Ergebnisse.

Gruß, Jörg.

By Andreas Strangmüller Date 2014-10-12 10:00

Hallo Jörg,

aber gerne doch, hier der Durchgang 1 gegen 4 Threads:


    Program           Elo    +   -   Games   Score   Av.Op.  Draws
 --------------------------------------------------------------------
  1 Crafty 24.1 T4  : 3098   10  10  3000    75.7 %   2902   36.0 %
  2 Crafty 24.1 T1  : 2902   10  10  3000    24.3 %   3098   36.0 %

Wins   = 1729
Draws  = 1081
Losses = 190
Av.Op. Elo = 3000

Result     : 2269.5/3000 (+1729,=1081,-190)
Perf.      : 75.7 %
Margins    :
 68 %      : (+  0.6,-  0.6 %) -> [ 75.1, 76.2 %]
 95 %      : (+  1.1,-  1.1 %) -> [ 74.5, 76.7 %]
 99.7 %    : (+  1.6,-  1.7 %) -> [ 74.0, 77.3 %]

Elo        : 3197
Margins    :
 68 %      : (+  5,-  5) -> [3192,3202]
 95 %      : (+ 10,- 10) -> [3187,3207]
 99.7 %    : (+ 16,- 16) -> [3181,3213]

Games        :   3000 (finished)

White Wins   :   1015 (33.8 %)
Black Wins   :    904 (30.1 %)
Draws        :   1081 (36.0 %)

White Perf.  : 51.9 %
Black Perf.  : 48.1 %

Individual statistics:

1 Crafty 24.1 T4  : 3098  3000 (+1729,=1081,-190), 75.7 %
2 Crafty 24.1 T1  : 2902  3000 (+190,=1081,-1729), 24.3 %

und 1 gegen 8 Threads:


    Program           Elo    +   -   Games   Score   Av.Op.  Draws
 -------------------------------------------------------------------
  1 Crafty 24.1 T8  : 3120   11  11  3000    80.0 %   2880   30.8 %
  2 Crafty 24.1 T1  : 2880   11  11  3000    20.0 %   3120   30.8 %

Wins   = 1937
Draws  = 924
Losses = 139
Av.Op. Elo = 3000

Result     : 2399.0/3000 (+1937,=924,-139)
Perf.      : 80.0 %
Margins    :
 68 %      : (+  0.5,-  0.5 %) -> [ 79.4, 80.5 %]
 95 %      : (+  1.0,-  1.0 %) -> [ 78.9, 81.0 %]
 99.7 %    : (+  1.5,-  1.6 %) -> [ 78.4, 81.5 %]

Elo        : 3240
Margins    :
 68 %      : (+  6,-  6) -> [3235,3246]
 95 %      : (+ 11,- 11) -> [3229,3252]
 99.7 %    : (+ 17,- 17) -> [3224,3258]

Games        :   3000 (finished)

White Wins   :   1124 (37.5 %)
Black Wins   :    952 (31.7 %)
Draws        :    924 (30.8 %)

White Perf.  : 52.9 %
Black Perf.  : 47.1 %

Individual statistics:

1 Crafty 24.1 T8  : 3120  3000 (+1937,=924,-139), 80.0 %
2 Crafty 24.1 T1  : 2880  3000 (+139,=924,-1937), 20.0 %

By Ingo B. Date 2014-10-13 05:40

Wenug beachtet, aber beeindruckend. Crafty kann fast mit Zappa mithalten und ist in deinem Test sicherlich der zweitbeste Performer!
Die CEGT liefert dazu leider keine Vergleichsdaten - was aufgrund der Gesamtstärke der Engine verzeilich ist.

Was, auch Aufgrund der Daten der CEGT von 1 auf 4 Threads auffällt ist, dass alle "neuen" Engine, sozusagen die "schnellen Abschneider", deutlich schlechter mit mehr Kernen umgehen können als "konventionelle" Enignes. Die neue Technik ist offensichtlich deutlich schwerer, oder besser "schlechter", zu parallelisieren. Interessante Beobachtung wie ich finde (Ein Seiteneffekt ist, dass das Testen von MP unwichtiger wird)

Gruß
Ingo

By Thomas Plaschke Date 2014-10-13 19:10

Ingo B. schrieb:

Wenug beachtet, aber beeindruckend. Crafty kann fast mit Zappa mithalten und ist in deinem Test sicherlich der zweitbeste Performer!
...

Anscheinend konzentriert sich Prof. Hyatt auf die Parallelsuche und ist da durchaus konkurrenzfähig. Sei's ihm gegönnt!

Was mir beim TCEC auffällt - außer, dass Crafty 24.1 bis jetzt überraschend gut gepunktet hat - ist die niedrige Knotenleitsung und vergleichsweise niedrige Rechentiefe mancher Programme. Toga und Senpai beispielsweise und auch andere, scheinen von den 16 cores keinen optimalen Nutzen zu ziehen. - Mein 4-core-i5 schafft mehr nps als Senpai und rechnet auch tiefer. Vielleicht wäre den betroffenen Programmen mit weniger Rechnerkernen mehr geholfen. - Overpowered! so zu sagen.

Gibt's dafür eine Erklärung?

Viele Grüße
Th. Plaschke

By Benno Hartwig Date 2014-10-13 20:46

> Mein 4-core-i5 schafft mehr nps als Senpai

Willst du damit sagen, dass Senpai auf deinem i5 mehr nps schafft als bei TCEC?
Benno

By Thomas Plaschke Date 2014-10-13 21:53

Benno Hartwig schrieb:

Willst du damit sagen, dass Senpai auf deinem i5 mehr nps schafft als bei TCEC?
Benno

Ja.

Ich veröffentliche hier jetzt keine Vergleichsserie. Beim Kiebitzen habe ich die Engines, die ich in meinem "Pool" habe, immer mal wieder mitlaufen lassen, um die aktuellen hv's zu sehen.

Bspw. hat Senpai in der Partie Naum - Senpai 14. .. Dxg2 nach 2:48 gezogen. Im 25. Halbzug bei 4.407 kN/s. Mein i5 (auf knapp 4.5 GHz übertaktet) rechnet am 28. Halbzug bei 4.931 kN/s bei nur 8 GB Hashtabellen. In anderen Senpai-Partien sieht es ähnlich aus. Auch bei Toga würde ich nicht auf die geballte Power von 16 cores schließen.

Ich sage nicht, man müsste bei dem Superrechner annähernd die Leistung eines cores multipliziert mit 16 erwarten. Aber deutlich mehr als auf unseren PC's von der Stange sollte es schon sein. Zum Beispiel erreicht Crafty etwa das 2,5fache an K/s meines Rechners und deutlich mehr Rechentiefe (bspw. Crafty - Baron 16. Tfd1 nach 2:31 50.544 kK/s bei 31 plies, mein Rechner ca. 22.400 kK/s und 27 plies).

Die Werte meines Rechners wurde mit "frischen" Hashtabellen gemacht. Die Rechner beim TCEC haben noch von der laufenden Partie gefüllte Tabellen gehabt - ein Vorteil, den ich weder beziffern kann noch kompensieren will/könnte.

Ich schließe aus meinen Beobachtungen, dass beim TCEC Engines mitmachen, die auf dem Turnierrechner mit weniger als 16 cores stärker sein könnten. - Deswegen finde ich die Experimente von Andreas Strangmüller in diesem Zusammenhang sehr interessant.

Mal unverblümt auffordernd gefragt: Würde sich das Verhalten von Senpai auch auf seinem Rechner zeigen (- 12 cores sind nicht so weit weg von 16)? Und was wäre die optimale cores-Anzahl für Senpai?

Viele Grüße
Th. Plaschke

By Tom Paul Date 2014-10-14 07:07

Viele Kerne unterstützen und viele Kerne sinnvoll verwenden sind zwei verschiedene Dinge.

Bsp.
Ein Autofahrer kann mit seinem Auto bis 200 km/h umgehen und erzielt die dem entsprechende Leistung.
Dieser Autofahrer könnte genauso gut einen Formel 1 Wagen fahren aber eben nur bis 200 km/h und er würde somit von der übrigen Power nicht profitieren.

Bsp.
Engine unterstützt 4 Kerne @ 4,5 GHz und kann diese sinnvoll verwenden.
Engine unterstützt 8 Kerne @ 3 GHz kann aber nur 4 Kerne sinnvoll verwenden.
Welche CPU ist wohl besser für diese Engine geeignet.
Und deshalb sind sehr viel GHz (ab 5 GHz spürt man die Power) bei möglichst niedrigem Stromverbrauch so wichtig.

By Benno Hartwig Date 2014-10-14 09:15

> Viele Kerne unterstützen und viele Kerne sinnvoll verwenden sind zwei verschiedene Dinge.

Klar, die Logik muss ja sinnvoll mit den Ressourcen umgehen können, und das ist nicht trivial, bei sehr vielen Kernen wohl noch schwieriger.

Nur, hast du den sowas, wovon Thomas berichtet, schon mal irgendwo beobachtet:
Eine Engine zeigt bsp. bei 4 Kernen eine konkreten nps-Wert, und bei 8 oder 16 Kernen einen tatsächlich niedrigeren(!) Wert als bei 4 Kernen???
Mir ist das neu, und ich staune.

Benno

By Benno Hartwig Date 2014-10-14 09:03

>> Willst du damit sagen, dass Senpai auf deinem i5 mehr nps schafft als bei TCEC?
> Ja.

Wow, das finde ich interessant, erstaunlich.

Soweit ich es verstand zeigen Engines nps-Werte, die ich als Brutto benennen möchte:
Sie zählen Knoten mit, die bei eine rein sequentiellen Abarbeitung (also 1 Thread) überhaupt nicht analysiert worden wären.
Deren Analyse bei Parallelbearbeitung erst im Nachhinein dann als überflüssig erkannt werden.
Insofern hätte ich bei mehr Threads immer auch mehr von solchen Bruttoknoten erwartet.
4 mal so viele Threads --> 4 mal so hoher nps-Wert, zumindest annähernd??
Die Verwaltung sollte sich wohl wirklich nur marginal einmischen.

Inwieweit solche höheren nps-Werte bei mehr Kernen dann Nutzen bringen, hängt von der Güte der Programmierung ab, davon wie gut es dem Entwickler gelungen ist, die Logik auf mehrere Kerne zu verteilen.

Dass dieser nps-Wert bei 16 TCEC-Kernen tatsächlich aber kleiner ist als auf einem hausbackenen 4-kern-Rechner, finde ich überaus überraschend!
Muss ich nachher auch mal ausprobieren. (u.a. auch mit i5-750, also auch 4 Kernen, die aber schon etwas betagt sind)

Hast du sowas schon mal bei irgendeiner anderen Engine beobachtet?

Benno

By ? Date 2014-10-14 19:15

Benno Hartwig schrieb:

...
Hast du sowas schon mal bei irgendeiner anderen Engine beobachtet?

Toga ist ähnlich. Ich habe mir die anderen Namen leider nicht gemerkt - so stark wie die genannten leiden die anderen Engines aber nicht unter den 16 cores.

Wenn man aber die reine nps-Leistung von Programmen auf dem eigenen Rechner mit deren Leistung auf dem TCEC-Rechner ins Verhältnis setzt, gibt es garantiert noch einige "auffällige" Programme, die verhältnismäßig deutlich langsamer als Crafty oder auch Stockfish sind.
- Einfach mal auf dem TCEC-live-Spielbrett auf c8 klicken, Strg-A drücken, dann Strg-C und in das CB-GUI mit Partie einfügen zum "nachrechnen" vorbereiten (alternativ mit "Partie->PGN aus Zwischenablage holen" unter Arena (von mir bevorzugt) oder jeder anderen geeigneten GUI). In den Kommentaren der Partie stehen die Daten aus der Partie zum Vergleich (Schönen Dank an Martin Thoresen auch dafür!).

Viele Grüße
Th. Plaschke

By Peter Martan Date 2014-10-14 11:30

Thomas Plaschke schrieb:

Benno Hartwig schrieb:

Willst du damit sagen, dass Senpai auf deinem i5 mehr nps schafft als bei TCEC?

Ja.

http://www.talkchess.com/forum/viewtopic.php?topic_view=threads&p=592487&t=51637&sid=0a3a199271660c91738098204e190b31

By Benno Hartwig Date 2014-10-14 13:15

Ah, Thanx.
Dieser Thread dort wurde von Fabien himself gestartet.
Und nun ist diese Beobachtung "Senpai langsam bei TCEC" auch dort platziert.
Vielleicht wird er was dazu sagen..
Ma' gucken.
Benno

By Peter Martan Date 2014-10-14 08:02 Edited 2014-10-14 08:07

Ingo B. schrieb:

Ein Seiteneffekt ist, dass das Testen von MP unwichtiger wird

Das verstehe ich im Kontext mit dem übrigen posting überhaupt nicht. Zuerst schreibst du, was dich so alles verwundert und dann, dass gerade das zu testen deshalb (oder trotzdem?) unwichtiger wird?
?

By Tom Paul Date 2014-10-11 11:05

Benno Hartwig schrieb:

Besteht diese Klasse darin, dass Zappa mit 16 Kernen nichts anzufangen weiß

Da kann aber Stockfish doch fast genau so gut.

Benno

Wer hatte denn zu Zappas Zeit einen 16 Kerner?
Bin mir sehr sicher, wenn 16 Kerne damals so viele Leute gehabt hätten wie heute, dann hätte der Erfinder von Zappa da noch einiges an ELO herausgeholt.

By Benno Hartwig Date 2014-10-11 11:47

> Wer hatte denn zu Zappas Zeit einen 16 Kerner?

Zu Zappas Zeit war Zappa ja ggf. die von dir erwähnte "Klasse für sich". Damals eben.
Benno

By Ingo B Date 2014-10-11 07:28

Hallo Andreas,

Zuerst möchte ich sagen das ich begeistert bin von der Arbeit und der Aufarbeitung die du dir gemachst hast. Ich bin ein wenig neidisch auf die HW und hätte auch ein paar Ideen was ich damit machen würde ... (z.B. ob sich die Gewinne bei 2 vs 4 Threads betätigen lassen oder ob es da plötzlich enger zusammen liegt ...)

Trotzdem hatte ich das beim letzten mal erwähnt und möchte das wiederholen, damit andere es mitverfolgen können:
Ich glaube das Selbsttest und in geringerem MAße auch die kurze Bedenkzeit vielleicht nicht der Weisheit letzter Schluß sind.
Ich habe exemplarisch die Daten der CEGT 40/4 genommen da dort jeweils genug Spiele vorliegen und die Zeitkontrolle am dichtesten an deiner dran ist.

Bsp S5:
Threads Test Gewinn von 1 auf 4 Treads von rund 150 Elo, die CEGT hat da nur 75 Elo gemessen.
Bsp K8:
Threads Test Gewinn von 1 auf 4 Treads von rund 150 Elo, die CEGT hat da nur 90 Elo gemessen.
Bsp Zappa:
Threads Test Gewinn von 1 auf 4 Treads von rund 200 Elo, die CEGT hat da nur 144 Elo gemessen. (Trotzdem noch WOW!)

Warum die Unterschiede bestehen soll jeder sich selbst überlegen, ich würde auf Selbsttest tippen.

Vielleicht schaut sich ja mal jemand die Daten der CEGT 40/20 bzw der CCRL an ...

Gruß
Ingo

PS: Übrigens ist bei der CEGT von 4 auf 8 S5 deutlich besser als K8, allerdings sind die Daten da noch etwas dünn und seltsam. S5 ist von 4 auf 8 fast so gut wie von 1 auf 4, das kann theoretisch kaum sein oder S5 hätte einen Bug in der "Singleimplementierung" - was äusserst unwahrscheinlich ist

deswegen eher die Vermutung zur "dünnen" Datenlage.

By Andreas Strangmüller Date 2014-10-11 10:47

Hallo Ingo,

danke für Deine netten Worte!

Die kurze Bedenkzeit ist sicher nicht optimal, eine längere wäre mir auch lieber, scheitert aber leider an den bekannten Faktoren Zeit bzw. Hardwareressourcen etc.

Die Elo-Zuwächse zwischen 1 und x Threads sind in diesem Experiment eher zweitranging. Wichtiger ist der Vergleich der Elo-Werte.
Hieraus lassen sich m. E. schon aussagekräftige Rückschlüsse über die Effektivität der SMP-Implemetierung der getesteten Engines ziehen und das ist ja das eigentliche Ziel dieses Experiments.

Bezüglich Deiner Idee (Gewinne bei 2 vs 4 Threads ...) schau Dir vielleicht mal den Test mit Stockfish DD an.
http://www.fastgm.de/threads1.html

Hier habe ich im unteren Bereich der Seite Tests mit drei Bedenkzeiten bei 1 vs. 2, 2 vs. 4 und 4 vs. 8 Threads durchgeführt.

Viele Grüße,
Andreas

By Ingo B. Date 2014-10-11 18:19

Andreas Strangmüller schrieb:

...
Die Elo-Zuwächse zwischen 1 und x Threads sind in diesem Experiment eher zweitranging. Wichtiger ist der Vergleich der Elo-Werte.

? Wie willst du Elo Werte vergleichen ohne die Zuwächse zu betrachten ? Für mich ist das Betrachten eines Wertes und das Vergleichen mit einem anderen immer die Bildung einer Differenz aka Zuwachs.

Andreas Strangmüller schrieb:

Hieraus lassen sich m. E. schon aussagekräftige Rückschlüsse über die Effektivität der SMP-Implemetierung der getesteten Engines ziehen und das ist ja das eigentliche Ziel dieses Experiments.

Das Ziel war mir klar, ich wollte nur darauf hinweisen das die CEGT (ua?) eben eine deutlich gedämpftere Zuwachskurve und für K8 u. S5, bei durchaus guter Datenlage, soger S5 als die effektivere Engine haben!
Wer hat jetzt Recht? Du mit deinen wirklich hervoragenden identischen Testbedinungen aber enginetechnischer "Inzucht" oder die CEGT mit ihren eher wahrscheinlicheren Gegnerverteilung aber unterschiedlicher HW die, wie ich finde durchaus fragwürdig, mit einem einzigen und uraltem Benchmark angepasst wird?
Ich weiß es nicht. Was ich weiß, ist das Fragen bleiben und nichts wirklich sicher beantwortet wurde!

Andreas Strangmüller schrieb:

Bezüglich Deiner Idee (Gewinne bei 2 vs 4 Threads ...) schau Dir vielleicht mal den Test mit Stockfish DD an.
...

Danke, bei 240 scheint es ja gut zu passen!

Gruß
Ingo

By Andreas Strangmüller Date 2014-10-11 19:16

Zitat:

? Wie willst du Elo Werte vergleichen ohne die Zuwächse zu betrachten ? Für mich ist das Betrachten eines Wertes und das Vergleichen mit einem anderen immer die Bildung einer Differenz aka Zuwachs.

Da hab ich mich vielleicht mißverständlich ausgedrückt.
Die Elo-Zuwächse bzw. Differenz zwischen 1 und x Threads sind hardware- und bedenkzeitabhängig. Ob es jetzt von 1 auf 4 Threads bei 60 Sekunden Bedenkzeit 130 oder 150 Elo Punkte sind ist bei diesem Test nicht so wichtig.
Wichtiger ist Vergleich der Differenz bei allen gestesten Engines bei z. B. 1 gegen 4 Threads.

Evtl. starte ich mal einen Test zwischen Stockfish 5 und Komodo 8 mit 1-2, 1-4 und 1-8 Threads, um zu sehen was da für eine Zuwachskurve herauskommt.

Grüße,
Andreas

By Ingo B. Date 2014-10-11 19:24

Andreas Strangmüller schrieb:

...
Wichtiger ist Vergleich der Differenz bei allen gestesten Engines bei z. B. 1 gegen 4 Threads.

OK, verstanden. Was bleibt ist, dass die CEGT eben S5 als effektiver erachtet ...

Andreas Strangmüller schrieb:

Evtl. starte ich mal einen Test zwischen Stockfish 5 und Komodo 8 mit 1-2, 1-4 und 1-8 Threads, um zu sehen was da für eine Zuwachskurve herauskommt.

Das wäre auf jeden Fall spannend. Einmal K8 mit einem Thread gegen S5 mit 1, 2, 4 und 8 und dann das ganze mit S5 auf 1T und K8 mit 1, 2, 4, 8.
... und wenn du ganz viel Zeit hast auch noch mit 16 Threads

Gruß
Ingo

By Benno Hartwig Date 2014-10-13 08:43

> OK, verstanden. Was bleibt ist, dass die CEGT eben S5 als effektiver erachtet ...

Steht bei CEGT eigentlich jedem Thread ein eigener realer Kern zur Verfügung?
Benno

By Ingo B. Date 2014-10-13 09:39

Benno Hartwig schrieb:

Steht bei CEGT eigentlich jedem Thread ein eigener realer Kern zur Verfügung?
Benno

Meines Wissens ja. CEGT benutzt kein HT sondern nur echte Kerne.
Ob das auch für den, mMn unnötigen, 12 Kern Test gilt weiß ich nicht sicher, glaube aber sie würden deswegen nicht ihr Prinzip brechen.
Vielleicht kann noch jemand der CEGT mehr dazu sagen.

Gruß
Ingo

By GS Date 2014-10-13 12:01

Ja, immer echte Kerne und kein HT.

Best wishes,
G.S.
(CEGT team)

By Tom Paul Date 2014-10-11 11:00

Ingo B schrieb:

Bsp S5:
Threads Test Gewinn von 1 auf 4 Treads von rund 150 Elo, die CEGT hat da nur 75 Elo gemessen.
Bsp K8:
Threads Test Gewinn von 1 auf 4 Treads von rund 150 Elo, die CEGT hat da nur 90 Elo gemessen.
Bsp Zappa:
Threads Test Gewinn von 1 auf 4 Treads von rund 200 Elo, die CEGT hat da nur 144 Elo gemessen. (Trotzdem noch WOW!)

Bei Zappa können die anderen Engines nur hinterher schauen.

By Benno Hartwig Date 2014-10-11 11:49

> Threads Test Gewinn von 1 auf 4 Treads von rund 200 Elo, die CEGT hat da nur 144 Elo gemessen. (Trotzdem noch WOW!)

Hmmm.
Das ist die optimistische Wertung.
Pessimisten würden ggf. erklären: "Na, die 1- und 2-Kernleistung bei Zappe kann nicht wirklich befriedigen."
Wenn etwas besser geworden ist, muss es deshalb ja nicht gut geworden sein!
Benno

By Stefan Pohl Date 2014-10-11 12:15

Ingo B schrieb:

Zuerst möchte ich sagen das ich begeistert bin von der Arbeit und der Aufarbeitung die du dir gemachst hast. Ich bin ein wenig neidisch auf die HW.

Das unterschreib ich...nur das "ein wenig" hätt ich weggelassen...

Stefan

By GS Date 2014-10-11 13:04

Ingo B schrieb:

[...snip...]
...deswegen eher die Vermutung zur "dünnen" Datenlage.

Ich habe vorher ein Update der CEGT 40/4 online gestellt,
es gab wieder viele Spiele in den letzten 2 Wochen diesbezüglich.

Viele Grüsse,
G.S.

By GS Date 2014-10-11 13:16

Nachfolgend ein paar Daten zum Thema, siehe:
http://www.husvankempen.de/nunn/blitz.htm


Komodo 8.0 x64
 1CPU   ELO 3149 out of 1600 games
 4CPU   ELO 3238 out of 1800 games
 8CPU   ELO 3285 out of 1550 games
12CPU   ELO 3306 out of 1664 games

Stockfish 5.0 x64
 1CPU   ELO 3156 out of 3127 games
 4CPU   ELO 3232 out of 3600 games
 8CPU   ELO 3294 out of 1500 games
12CPU   ELO 3306 out of 1050 games

Houdini 4.0 x64
 1CPU   ELO 3134 out of 3527 games
 4CPU   ELO 3220 out of 3544 games
 8CPU   ELO 3236 out of 1327 games
12CPU   n/a

Gull 3.0 x64
 1CPU   ELO 3081 out of 2400 games
 4CPU   ELO 3175 out of 3344 games
 8CPU   ELO 3220 out of  950 games
12CPU   ELO 3222 out of  894 games

G.S.
(CEGT team)

By Bertil Date 2014-10-13 20:10

Hi!

My results
SF5 8 vs 16 cores +37 SF16 vs 24 cores +7 3200 games and 1600 games 3m+1s 8 move book repeating
K8 same conditions as above +45 and +18 1800 and 1480 games

Bertil