Houdini auf kurze Zeiten optimiert, lange Zeiten schlechter

By Michael Scheidl Date 2014-01-06 20:18 Edited 2014-01-06 20:20

Eine Stockfish-Zwischenversion von vielen die sowiewo unter http://abrok.eu/stockfish/ laufend erscheinen, Herkunft bzw. Ersteller nicht erwähnt, Anzahl der Testpartien nicht angegeben, Testbedingungen unvollständig angeführt... (nur um darzustellen warum ich mit Postings wie obigem leider nichts anfangen kann oder will).

Und Arena nach jeder Partie

neu zu starten muß, besonders wenn wir von Blitztests reden, enorm viel Zeit verschwenden. Klingt mir nicht praktikabel.

Einem "Zurückfallen" von mehreren auf einen Thread bei laufendem Test sollte allerdings nachgegangen werden... Haben das andere Arena 3.5-User ebenfalls bemerkt? Besteht vielleicht ein Konflikt mit der neuen, globalen UCI-Einstellung f.d. Anzahl der Threads?

(Mein eigenes erstes Turnier damit war Singlecore.)

By Benno Hartwig Date 2014-01-06 21:27 Edited 2014-01-06 21:32

> ca. +40 Elo gegen H4Pro

Und das bei sehr kurzen Zeiten?? Das wäre tatsächlich so sensationell, dass du dafür gern mal sehr viel Genaueres(!!) sagen solltest.
Der i7-2600 hat nur 4 reale Kerne. Aus meiner Sicht gibt es keinen Grund, mehr Threads zu konfigurieren als du reale(!) Kerne hast.
Was du sonst deinen Engines ggf. 'antust', ist mir unklar.
Was hat sich denn logisch an der Engine geändert? Etwas mehr Performance, könnte solch eine enorme Steigerung ja nicht annähernd(!) bewirken.
Benno (zweifelnd)

By guest Date 2014-01-07 13:39

Benno Hartwig schrieb:

...
Der i7-2600 hat nur 4 reale Kerne. Aus meiner Sicht gibt es keinen Grund, mehr Threads zu konfigurieren als du reale(!) Kerne hast.
...

ist das zwigend murks? oder könnte es doch sinn machen? wenn ja, was ist dabei zu beachten?
genug der fragen.

By Michael Scheidl Date 2014-01-07 16:16

Auf einem Intel i5-3210M bringt Hyperthreading (4 Threads auf 2 phys. Cores) definitiv etwas, wie ich glaube auf verschiedene Arten und Weisen gemessen und bewiesen zu haben. Bei Interesse liefert die Forensuche hierzu Näheres.

Allerdings kann ich zu einem i7-2600 nicht aus eigener Erfahrung behaupten, daß es dort genauso ist. Es ist nur eine sehr naheliegende Annahme. Jeder kann das nach dem Muster der hier auffindbaren diesbezüglichen Postings bei sich selbst nachprüfen.

By Benno Hartwig Date 2014-01-07 20:14 Edited 2014-01-07 20:23

> Auf einem Intel i5-3210M bringt Hyperthreading (4 Threads auf 2 phys. Cores) definitiv etwas, wie ich glaube auf verschiedene Arten und Weisen gemessen und bewiesen zu haben.

Das überrascht mich.
Kannst du bitte kurz skizzieren, wie du bewiesen und gemessen hast?
Die Zeiten schwanken ja sehr stark und man müsste gleiche Stellungen mehrmals analysieren. War es sowas?
Knoten/Sekunde taugt nicht als Kriterium. Aber das hast du ja sicher auch nicht gemacht.
Mit genügend großer Partienzahl ein Ranking erspielt haben, wäre eine Möglichkeit. War es das?
Oder ein direktes Duell zweier Thread-Einstellungen, bei genügend vielen Partien.

Wie kamst du zu deiner (für mich sehr überraschenden) Einschätzung?

Ich denke, doppelt so viele Threads wie reale Kerne zu fahren, kann erst dann Sinn machen, wenn die Knotenleistung dadurch mindestens(!) um den Faktor 2/1,7=1,18 gestiegen ist. Wie groß ist denn die Steigerung der Knotenleistung?

Benno

By Michael Scheidl Date 2014-01-07 20:17

Bitte nutze die Forensuche. Ich hab mich mich glaub ich eh schon zwei, dreimal wiederholt (inkl. Talkchess) und bin dessen müde.

By docdwo Date 2014-01-09 12:04

Weiter unten in diesem Thread habe ich meine konkreten Messungen mit dem stockfish bench Kommando beschrieben. Es kommt dabei auf die Parameter an, Suchtiefe und Hashgröße sollten den konkreten Turnier-Bedingungen entsprechen. Meine i2600k @4.2GHZ ist mit 8 Threads ca. 15% schneller als mit 4 Threads. Mein i7 in einem MacBook Pro von 2011 wird dagegen mit 8 Threads langsamer.
Aber auch da könnten Turniere mit 8 Threads Sinn machen: Wenn ich überprüfen will, wie sich die Programme auf moderner Hardware schlagen. Ich muss ja nur die Bedenkzeit heraufsetzen, um das gleiche Ergebnis zu erhalten. Teste ich mit 4 Threads, verschaffe ich Programmen, die schlecht skalieren (H4Pro) einen Vorteil, den sie auf modernen Rechnern nicht haben. Stockfish (aktuelle dev oder Rockwood 2014) und auch Komodo skalieren mit zunehmender Rechenzeit besser als H4Pro. Sie sind bei kurzer Bedenkzeit auf alle Resourcen angewiesen, die sie bekommen können. Ich sehe nicht ein, warum ich ihnen den Vorteil der besseren Implementierung der Parallelität der Suche nicht gönnen soll. Zumal es ja schon 24-echte-Kerne Doppelprozessormaschinen für
unter 6000 Euro zu kaufen gibt
http://cpubenchmark.net/cpu.php?cpu=Intel+Xeon+E5-2697+v2+%40+2.70GHz&id=2009&cpuCount=2
Wäre mal interessant, H4Pro und Stockfish darauf zu vergleichen. Stockfish wird darauf wahrscheinlich schon im 30 sec pro Partie-Blitz an H4Pro vorbeiziehen.

By Benno Hartwig Date 2014-01-07 16:28

Zwingend nicht. Aber ich rechne beim Einsatz von mehr als den realen Kernen und der Nutzung von Hyperthreading eher mit Nachteilen, die dazu noch für verschiedene Engines unterschiedlich heftig sein können.
Diese Nachteile erwarte ich deshalb, weil der Hyperthreading-Leisungsgewinn (wenige Prozent?) wohl deutlich kleiner ist als der Verlust wegen der vglw. schlechten Nutzung der Leistung bei Verdopplung der Thread-Anzahl.

Aber mache doch gern (und bitte!) einen Test, und schreibe bitte gern auch das Ergebnis hier her.
Beispiel: Grundstellung, feste Tiefe 25 (oder so), ein Zug Sh3, und dann die Zeit für den Antwortzug aufschreiben. (wenn Zeit zu klein, dann bitte Tiefe größer einstellen)
Bei Threads=1 brauchst du nur 1 oder 2 Messungen.
Bei Threads=2, 4 und 8 mach bitte aber mindesten 5, besser 10 Durchgänge. Zumindest bei Stockfish habe ich hier dermaßen schwankende Zeiten gesehen, dass die schlechtesten mehr als doppelt so groß waren wie die besten. Bei gleicher Stellung und gleichen Rahmenbedingungen und ansonsten unbelastetem Rechner!
Vielleicht auch noch mal mit einer anderen Stellung deiner Wahl, vielleicht mehr im Mittelspiel und größerer Tiefe, und ggf. auch noch eine mehr im Endspiel und noch größerer Tiefe.

Und nenne bitte auch gern die Rahmenbedingungen (vor allem Anzahl der Partien und Ergebnisse) des Tests, bei dem du derart sensationelle Ergebnisse erkannt haben möchtest.

Benno

By docdwo Date 2014-01-07 10:19

Zum Thema Hyperthreading: Schaut man sich die Diagramme auf http://de.wikipedia.org/wiki/AMD_Bulldozer an, sieht man, dass AMD etwas ähnliches macht, dies aber als 8-Core vermarktet. Ob die 8-Thread-Einstellung etwas bringt, hängt von der Implementierung der parallelen Berechnung ab. Bei H4Pro/Stockfish kommt man auch mit der 4-Thread Einstellung auf 85-90% der Knotenzahl, Komodo tcecr bricht aber regelrecht ein. Da Arena 3.5 eine einheitliche Einstellung vorsieht, würde ich Komodo mit der 4-Thread Einstellung grob benachteiligen.

Das Zurückfallen auf 1-Thread habe ich mit Arena 3.0 beobachtet, da der Neustart aber nur 2-3sec dauert gehe ich lieber kein Risiko ein. Schließlich ist der Fehler im Nachhinein nicht zu bemerken, wenn Arena z.B. nach 20 Partien neu startet und dann wieder alle Threads da sind. Stockfish verliert aber so lange die meisten Spiele.

Stockfish Rockwood (siehe z.B. http://rybkaforum.net/cgi-bin/rybkaforum/topic_show.pl?tid=27956 oder http://immortalchess.net/forum/showthread.php?p=451145) ist keine normale Developer-Version, sondern eine alle paar Monate erscheinende Version die auf spezielle Weise compiliert wurde.

Ich habe nur ca. 1000 Testpartien zwischen den drei Engines gemacht, und wollte nur darauf hinweisen, dass es Anzeichen dafür gibt, dass die Überlegenheit von H4Pro bei kurzen Bedenkzeiten nicht mehr gegeben ist. Das ist natürlich auch mit einer aktuellen Developer-Version nachvollziehbar, Stockfish DD scheint mir in dieser Hinsicht wesentlich schwächer. Ich bin nicht der einzige,
der das bemerkt hat http://immortalchess.net/forum/showthread.php?t=23889&page=8 .

> nur um darzustellen warum ich mit Postings wie obigem leider nichts anfangen kann oder will

Den Ton dieses Kommentars empfinde ich als unhöflich. Wenn sie mein Posting nicht interessiert fände ich es
besser, sie würden nicht darauf antworten. Oder einfach nachfragen, ohne meinen Kommentar abzuwerten.

By Michael Scheidl Date 2014-01-07 16:22

Zitat:

Den Ton dieses Kommentars empfinde ich als unhöflich.

Das lag nicht in meiner Absicht und ich bedaure diesen Eindruck.

Hoffentlich ist das "Zurückfallen-Problem" bei Arena 3.5 verschwunden. Man wird sehen.

Von speziellen "Stockfish-Nebenversionen" wie ich sie gerne nenne, halte ich mitunter sehr viel: Ich benutze u.a. gerne Comstock, Stockfish PA_GTB, und natürlich Syzygy-Fish. Leider entsteht aber inzwischen der Eindruck einer gewissen Überflutung... was solls, besser als umgekehrt.

By Benno Hartwig Date 2014-01-07 16:39 Edited 2014-01-07 16:44

> Bei H4Pro/Stockfish kommt man auch mit der 4-Thread Einstellung auf 85-90% der Knotenzahl, Komodo tcecr bricht aber regelrecht ein.

Ich denke, die Knotenzahl ist in diesem Fall überhaupt kein aussagefähiges Kriterium, denn meistens zählt die Engines im Multicore-Betrieb doppelt berechnete Knoten und eigentlich überflüssigerweise berechnete Knoten sämtlich mit. Berechnungen, die für das Ergebnis keinerlei Nutzen haben.

Ich würde daher unbedingt(!) für Tests fest eine bestimmte Tiefe komplett durchrechnen lassen (kann man z.B. in Arena so vorgenen) und die Zeiten messen, die für diese Tiefe durchschnittlich benötigt werden!
(Bitte mehrere Durchgänge machen, da diese Zeiten bei Threads>1 sehr stark(!) schwanken können.)
Und am besten für mehr als eine Stellung.

Und wenn dann die Tiefe bei einer Thread-Zahl im Mittel besonders schnell geschafft wird, dann ist das auf jeden Fall besser, als wenn eine andere Thread-Anzahl zwar eine höhere Knotenleistung bietet, dafür aber länger braucht!
Letzteres ist das, was ich für Thread-Angaben erwarte, die größer als die reale Kern-Anzahl sind.

Benno
(und mein i5-750 hat gar kein Hyperthreading. Wenn ich da frech threads=5 oder 8 sagen, rechnet die Engine tapfer weiter, sie braucht aber, sie braucht...)

By docdwo Date 2014-01-08 09:19

Aus http://www.cruxis.com/chess/manual/index.html?some_frequently_asked_question.htm
"The architecture of Houdini (and of chess engines in general) is not very well suited for hyper-threading; using more threads than physical cores will usually degrade the performance of the engine. Although the hyper-threads often produce a slightly higher node speed, the increased inefficiency of the parallel alpha-beta search more than offsets the speed gain obtained with the additional hyper-threads."

Allerdings skaliert jeder Prozessor anders, siehe z.B. http://www.wien2k.at/reg_user/benchmark/ .
Insbesondere skalieren modernere Prozessoren immer besser.

Bei Schachprogrammen ist das Scaling vom gewählten Algorithmus abhängig, siehe
http://chessprogramming.wikispaces.com/Parallel+Search

Dort finden wir für den DTS Algorithmus z.B. für 4 threads den Faktor 3.7, für 8 threads Faktor 6.6.
Hyperthreading kann natürlich 8 threads nicht mit der gleichen Performance ausführen wie 4 threads,
es reicht aber ein Faktor > 3.7 / 6.6 damit sich 8 threads lohnen.

Was beudeutet das in der Praxis:
1) Jedes Programm hat auf jedem Prozessor seinen eigenen "Sweet Spot" in Bezug die optimale Thread-Zahl
2) Die Entscheidung von Areana 3.5 die Thread-Zahl zu "vereinheitlichen" ist fragwürdig
3) Ein Programm mit schlechter Skalierung wird auf einem i2600k besser abschneiden wenn nur 4 threads
eingestellt sind.
4) Programme wie Stockfish oder Komodo, die besser skalieren werden mit 8 Threads besser abschneiden.

Ein Test mit 4 Threads läuft gerade, es würde mich nicht überraschen, wenn H4Pro sich jetzt durchsetzt.

By docdwo Date 2014-01-08 12:02

Für Stockfish kann man versuchen, über das bench Kommando die optimale Thread-Zahl zu bestimmen. Zusätzlich gibt es noch den "Minimum Split Depth" UCI Parameter. Aus http://manpages.ubuntu.com/manpages/raring/man6/stockfish.6.html
"If you are using more than four threads, it is recommended to raise the value of "Minimum Split Depth" UCI parameter
to 6"

Also in der Kommandozeile

> stockfish

dann
setoption name Min Split Depth 6
und
bench 1024 4 20 default depth (für 4 threads)
oder
bench 1024 6 20 default depth (für 6 threads)
...

Problem ist, dass ich keine reproduzierbaren Ergebnisse bekomme (ausser mit 1 Thread). Allerdings scheint der Sweetspot tatsächlich eher bei 6 Threads als bei 8 Threads mit meinem i2600k zu liegen. Für Komodo kann das aber wieder anders sein.
Werde mit Arena 3.5 auch mit 6 Threads testen.

By Benno Hartwig Date 2014-01-08 14:48 Edited 2014-01-08 14:56

> Problem ist, dass ich keine reproduzierbaren Ergebnisse bekomme (ausser mit 1 Thread).

das ist wohl bei threads>1 einfach so

10 Tests oder besser noch mehr in gleichen Situationen sind wohl angemessen, aus denen man dann den Durchschnitt bilden kann (das arithmetische? oder in diesem Fall doch lieber das geometrische?)
Oft sind die schlechtesten Zeiten mehr als doppelt und machmal sogar 3 mal so groß wie die besten. Bei 'eigentlich' gleichen Bedingungen und gleichen Tiefen!

Da kann eine 2-Kern-Berechnung auch mal langsamer sein als die Berechnung mit nur einem Kern!

Benno

By docdwo Date 2014-01-08 18:49

Hier sind ein paar Partien mit 4 Threads (1 min per Partie,
Opening http://kirill-kryukov.com/chess/tools/opening-sampler/pgn/swcr-fq-openings-v4.1.pgn, zufällig mit automatisch Brett umdrehen)

-----------------Houdini_4_Pro_x64B-----------------
Houdini_4_Pro_x64B - Komodo-tcecr-64bit : 123,5/229 76-58-95 54%   +28
Houdini_4_Pro_x64B - StockFishRW : 116,5/229 75-71-83 51% +7
-----------------Komodo-tcecr-64bit-----------------
Komodo-tcecr-64bit - Houdini_4_Pro_x64B : 105,5/229 58-76-95 46%   -28
Komodo-tcecr-64bit - StockFishRW : 91,0/230 37-85-108 40%   -70
-----------------StockFishRW-----------------
StockFishRW - Houdini_4_Pro_x64B : 112,5/229 71-75-83 49% -7
StockFishRW - Komodo-tcecr-64bit : 139,0/230 85-37-108 60%   +70

Und ein Turnier mit 8 Threads (1 min per Partie,
Opening http://kirill-kryukov.com/chess/tools/opening-sampler/pgn/HS-Grand_10-moves-48617.pgn, zufällig mit automatisch Brett umdrehen)

-----------------Houdini_4_Pro_x64B-----------------
Houdini_4_Pro_x64B - Komodo-tcecr-64bit : 249,5/495 131-127-237 50% ±0
Houdini_4_Pro_x64B - StockFishRW : 222,5/495 118-168-209 45%   -35
-----------------Komodo-tcecr-64bit-----------------
Komodo-tcecr-64bit - Houdini_4_Pro_x64B : 245,5/495 127-131-237 50% ±0
Komodo-tcecr-64bit - StockFishRW : 195,5/495 73-177-245 39%   -78
-----------------StockFishRW-----------------
StockFishRW) - Houdini_4_Pro_x64B    : 272,5/495 168-118-209 55%   +35
StockFishRW - Komodo-tcecr-64bit : 299,5/495 177-73-245 61%   +78

Hier sind meine bench Ergebnisse mit Stockfish Rockwood 2014.
Entscheidend ist natürlich nicht Nodes/second sondern
Total time. Rockwood scheint auch auf einem Hyperthreading-i2600k (4.2Ghz)
bis 8 Cores zu skalieren. Ab Sandybridge skalieren die Intel-Prozessoren
besser als ältere Modelle.

4 Threads:

setoption name Min Split Depth value 5
bench 1024 4 22 default depth
Total time (ms) : 59386
Nodes searched : 413512025
Nodes/second : 6963123

setoption name Min Split Depth value 7
bench 1024 4 22 default depth
Total time (ms) : 62572
Nodes searched : 423405028
Nodes/second : 6766685

6 Threads:

setoption name Min Split Depth value 5
bench 1024 6 22 default depth
Total time (ms) : 62747
Nodes searched : 500577708
Nodes/second : 7977715

setoption name Min Split Depth value 7
bench 1024 6 22 default depth
Total time (ms) : 61936
Nodes searched : 489483411
Nodes/second : 7903051

8 Threads:

setoption name Min Split Depth value 5
Total time (ms) : 54498
Nodes searched : 472349311
Nodes/second : 8667277

setoption name Min Split Depth value 6
bench 1024 8 22 default depth
Total time (ms) : 55281
Nodes searched : 490434334
Nodes/second : 8871661

bench 1024 8 22 default depth
Total time (ms) : 51822
Nodes searched : 45279678
Nodes/second : 8737539

bench 1024 8 22 default depth
Total time (ms) : 51206
Nodes searched : 447612643
Nodes/second : 8741410

bench 1024 8 22 default depth
Total time (ms) : 53275
Nodes searched : 476444243
Nodes/second : 8943111

Spricht doch eher für 8 Threads, trotz Hyperthreading.
Keine Ahnung, warum Nodes searched kleiner als bei 6 Threads ist.

By docdwo Date 2014-01-08 18:54

Sorry, die letzten bench -Ergebnisse waren mit
setoption name Min Split Depth value 7

also

setoption name Min Split Depth value 6
bench 1024 8 22 default depth
Total time (ms) : 55281
Nodes searched : 490434334
Nodes/second : 8871661

setoption name Min Split Depth value 7
bench 1024 8 22 default depth
Total time (ms) : 51822
Nodes searched : 45279678
Nodes/second : 8737539

bench 1024 8 22 default depth
Total time (ms) : 51206
Nodes searched : 447612643
Nodes/second : 8741410

bench 1024 8 22 default depth
Total time (ms) : 53275
Nodes searched : 476444243
Nodes/second : 8943111

By Hauke Lutz Date 2014-01-07 22:09

Ich bedanke mich erstmal für den Download-Link.

Ich lasse gerade die Rookwood-Version gegen die dev Version 140106 mit den Vorgabestellungen von Stefan Pohl ein 1+1" Duell auf einem 4930k, Takt 4,5 GHz, 4 Kerne, HyperThreading off spielen.

Momentan sieht es für Rookwood eher schlecht aus, aber 82 Partien (+5/=68/-9 --> -17 Elo) sind natürlich noch nichts spruchreifes.
Das Ergebnis der 1000 Partien sollte in der Nacht auf Freitag feststehen.

Für den Fall das Rookwood die dev-Version mit ca 20 Elo (>53% Score) besiegen sollte, werde ich ihn danach gegen H4 und Komodo tcecr spielen lassen.

Gruß
Hauke

By Michael Scheidl Date 2014-01-07 23:15

Inzwischen hat jemand im CCC sehenswerte Stellungsbeispiele zu Rockwood gepostet. Zwar sieht es nicht so aus als könnte gerade nur diese Version oder Engine die betreffenden Züge finden, aber das ändert an der Attraktivität an sich ja nichts:

Stockfish Rockwood, alias "Stockwood" zog hier spektakulär 37...Tc6!!

Wenn ein menschlicher GM so etwas spielt, werden Goldmünzen auf das Schachbrett geworfen. Ein höchst entzückender Zug. Die Idee: Falls 38.dxc6, dann 38...Dc8 mit tödlichem Blick nach h3.

http://www.talkchess.com/forum/viewtopic.php?p=551758

Es ist schön, manchmal auch solche Illustrationen zu haben statt immer nur diese Statistiken (ohne den großen Wert letzterer zu verkennen).

By Chess Player Date 2014-01-08 10:19 Edited 2014-01-08 10:22

Code:


Critter_1.6a_32bit:
 
 15/55  00:15   49.325k  3.219k  +0,46  b7-b5 a5xb6/ep Dd8xb6 Td1-g1 g3-g2+ Kh1-h2 Db6-d8 Da4-d1 Dd8-g5 Tg1-e1 Tc8-b8 Kh2-g1 Dg5-g3 Sd3-f2 Lf8-e7 Tc1-c6 Kg8-h8 Dd1-a4 a6-a5 b2-b4 Tb8-g8 b4xa5 Sh4xf3+ Le2xf3 Dg3xf3 Te1-c1 Tg7-g3
 15/55  00:15   49.325k  3.219k  +0,33  Kg8-h7 Tc1-c2 Tc8-c7 Tc2xc7 Tg7xc7 Td1-c1 Tc7xc1+ Ld2xc1 Lf8-h6 Da4-d1 Dd8xa5 Lc1-d2 Da5-c7 Ld2-c3 Lh6-g7 Le2-f1 Kh7-g6 Lf1-g2 Dc7-b6
 15/55  00:15   49.325k  3.219k  +0,05  Tc8-c7 Tc1xc7 Tg7xc7 Td1-c1 Dd8-c8 Le2-f1 Sh4xf3 Da4-d1 Sf3xd2 Tc1xc7 Dc8xc7 Dd1xd2 f4-f3 Sd3-e1 g3-g2+ Lf1xg2 f3xg2+ Kh1xg2 Dc7-h7 Dd2-d3 Lf8-h6 Kg2-f2 Dh7-g6 Dd3-g3 Kg8-f7 Dg3xg6+ Kf7xg6
 15/55  00:15   49.325k  3.219k  -2,53  Tc8-c6 d5xc6 Dd8-c8 Sd3xf4 e5xf4 Da4-b3+ Kg8-h8 Le2-f1 g3-g2+ Kh1-g1 Dc8xh3 Lf1xa6 Dh3-h1+ Kg1-f2 g2-g1T Td1xg1 Dh1-h2+ Kf2-e1 Tg7xg1+ La6-f1 Tg1xf1+ Ke1xf1 Dh2-g2+ Kf1-e1 Sh4xf3+ Db3xf3 Dg2xf3 c6-c7 Df3-g3+ Ke1-e2 f4-f3+ Ke2-e3 f3-f2+
---------------------------------------------------------------------------
 16/55  00:44   155.725k  3.518k  +0,51  Lf8-e7 Td1-g1 Le7-f8 Da4-d1 Tc8xc1 Ld2xc1 Dd8xa5 Lc1-d2 Da5-d8 Le2-f1 b7-b5 Lf1-g2 Dd8-b6 Ld2-c3 Tg7-c7 Dd1-d2 Kg8-h7 Tg1-c1
 16/55  00:44   155.725k  3.518k  +0,02  Tc8-c7 Tc1xc7 Tg7xc7 Td1-c1 Dd8-c8 Le2-f1 Sh4xf3 Da4-d1 Sf3xd2 Tc1xc7 Dc8xc7 Dd1xd2 f4-f3 Sd3-e1 g3-g2+ Se1xg2 f3xg2+ Dd2xg2+ Lf8-g7 Dg2-g6 Dc7-c2 Dg6-e6+ Kg8-h7 De6xd6 Dc2xe4+ Kh1-h2 De4-f4+ Kh2-g2 Df4-d2+ Kg2-f3
 16/55  00:44   155.725k  3.518k   0,00  Kg8-h7 b2-b4 b7-b5 a5xb6/ep Dd8xb6 Le2-f1 Tc8xc1 Ld2xc1 g3-g2+ Lf1xg2 Sh4xg2 Da4-e8 Sg2-e3 Td1-g1 Tg7xg1+ Kh1xg1 Kh7-g7 De8-d7+ Kg7-f6 Kg1-h2 Db6-d4 Dd7-d8+ Kf6-f7 Dd8-d7+ Kf7-f6
 16/55  00:44   155.725k  3.518k  -3,30  Tc8-c6 Td1-g1 g3-g2+ Kh1-h2 Dd8-g5 Tg1-d1 Tc6xc1 Kh2-g1 Tc1xd1+ Da4xd1 Dg5-g3 Sd3-f2 Kg8-h7 Ld2-c3 Kh7-h6 Lc3-d2 Lf8-e7 Ld2-c3 Le7-d8 Lc3-b4 Dg3-g6 Lb4-c3 Tg7-g8 Lc3-b4 Ld8-e7
---------------------------------------------------------------------------
 17/55  00:58   210.436k  3.617k  +0,47  Lf8-e7 Td1-g1 Le7-f8 Da4-d1 Tc8xc1 Ld2xc1 g3-g2+ Kh1-h2 Kg8-h7 Sd3-f2 Dd8xa5 Lc1-d2 Da5-d8 Ld2-e1 Dd8-g5
 17/55  00:58   210.436k  3.617k   0,00  Tc8-c7 Tc1xc7 Tg7xc7 Td1-c1 Dd8-c8 Le2-f1 Sh4xf3 Da4-d1 Sf3xd2 Tc1xc7 Dc8xc7 Dd1xd2 f4-f3 Sd3-e1 g3-g2+ Se1xg2 f3xg2+ Dd2xg2+ Lf8-g7 Dg2-g6 Dc7-c2 Dg6-e8+
 17/55  00:58   210.436k  3.617k   0,00  Kg8-h7 b2-b4 b7-b5 a5xb6/ep Dd8xb6 Le2-f1 Tc8xc1 Ld2xc1 g3-g2+ Lf1xg2 Sh4xg2 Da4-e8 Sg2-e3 Td1-g1 Tg7xg1+ Kh1xg1 Kh7-g7 De8-d7+ Kg7-g8 Dd7-e6+ Kg8-g7 De6-d7+
 17/55  00:58   210.436k  3.617k  -4,03  Tc8-c6 Td1-g1 g3-g2+ Kh1-h2 Dd8-g5 Tg1-e1 Tc6xc1 Kh2-g1 Tc1-c7 Sd3-f2 Dg5-g3 Da4-a3 Tg7-g6 Da3-b3 Tc7-g7 Te1-c1 Kg8-h7 Db3-d3 Kh7-h6 Dd3-b3 Tg6-g5 Sf2-g4+ h5xg4 h3xg4

Code:


Komodo-5r1-32bit: abgebrochen nach 30 Minuten 

 19  11:47   346.152k  489k  +0,26  Kg8-h8 Ld2-c3 Tc8-c7 Sd3xf4 Dd8-g5 Lc3-d2 e5xf4 Tc1xc7 Tg7xc7 Da4-e8 Kh8-g8 De8-e6+ Tc7-f7 Kh1-g1 Dg5-f6 De6xf6 Tf7xf6 Ld2-b4 Tf6-h6 e4-e5 Sh4-f5 e5-e6 Lf8-e7 Td1-d3 Kg8-g7 Lb4-d2 Le7-g5
 19  11:47   346.152k  489k  +0,13  Tg7-g6 Td1-e1 Kg8-h7 Te1-d1 Tg6-g7 Tc1-c2 Tc8xc2 Da4xc2 Tg7-c7 Ld2-c3 Dd8-c8 Le2-f1 g3-g2+ Lf1xg2 Tc7-g7 Lg2-f1 Sh4xf3 Lf1-g2 Sf3-h4 Lg2-f1 Sh4-f3
 19  11:47   346.152k  489k  +0,13  Kg8-h7 Tc1-c2 Tc8xc2 Da4xc2 Tg7-c7 Ld2-c3 Dd8-c8 Le2-f1 g3-g2+ Lf1xg2 Tc7-g7 Lg2-f1 Sh4xf3 Lf1-g2 Sf3-h4 Lg2-f1 Sh4-f3
 19  11:47   346.152k  489k  +0,13  Tc8-c7 Tc1xc7 Tg7xc7 Td1-c1 Dd8-c8 Le2-f1 Sh4xf3 Tc1xc7 Dc8xc7 Da4-d1 Sf3xd2 Dd1xd2 f4-f3 Sd3-e1 g3-g2+ Se1xg2 f3xg2+ Lf1xg2 Lf8-g7 Lg2-f3 Dc7-f7 Dd2-c3 Df7-f4 Kh1-g2 Df4-g5+ Kg2-h2 Dg5-f4+ Kh2-g2

Code:


Stockfish-DD-32-PA_GTB:

 23/49  00:19   55.851k  2.906k   0,00  Tg7-g6 Td1-e1 Tg6-g7 Te1-d1 Tc8-b8 Tc1-c3 b7-b5 a5xb6/ep Dd8xb6 Td1-g1 Db6-d8 Tg1-c1 Dd8-b6 Tc1-g1 Db6-d8 Tg1-c1 Dd8-b6 Tc1-g1
 23/49  00:19   55.851k  2.906k   0,00  Tc8-b8 Tc1-c3 b7-b5 a5xb6/ep Dd8xb6 Td1-g1 Db6-d8 Tg1-c1 Dd8-b6 Tc1-g1 Db6-d8 Tg1-c1 Dd8-b6 Tc1-g1
 23/49  00:19   55.851k  2.906k   0,00  Tc8-a8 Tc1-c3 Ta8-c8 Tc3-c1 Tc8-c6 d5xc6 Dd8-c8 Da4-b3+ Kg8-h8 Sd3xf4 e5xf4 Le2-f1 g3-g2+ Kh1-g1 g2xf1T+ Kg1xf1 Dc8xh3+ Kf1-e2 Tg7-g2+ Ke2-d3 Sh4xf3 Db3-c3+ Lf8-g7 Kd3-c2 Lg7xc3 c6xb7 Sf3-d4+ Kc2-b1 Dh3-d3+ Kb1-a2 Dd3-c4+ Ka2-b1 Sd4-c6 Ld2xc3+ Kh8-h7 Td1xd6 Dc4xe4+ Kb1-a1 Sc6-b8 Tc1-h1 Tg2-g5 Th1-f1 De4xb7 Tf1xf4 Sb8-c6 Tf4-f1
 23/49  00:19   55.851k  2.906k  -6,10  Tc8-c6 d5xc6 Dd8-c8 Da4-b3+ Kg8-h8 Sd3xf4 e5xf4 Le2-f1 g3-g2+ Kh1-g1 g2xf1T+ Kg1xf1 Dc8xh3+ Kf1-e2 Tg7-g2+ Ke2-d3 Sh4xf3 Db3-c3+ Lf8-g7 Kd3-c2 Lg7xc3 c6xb7 Sf3-d4+ Kc2-b1 Dh3-d3+ Kb1-a2 Dd3-c4+ Ka2-b1 Sd4-c6 Ld2xc3+ Kh8-h7 Td1xd6 Dc4xe4+ Kb1-a1 Sc6-b8 Tc1-h1 Tg2-g5 Th1-f1 De4xb7 Tf1xf4 Sb8-c6 Tf4-f1

Code:


SmarThink 1.50:
 6/24  00:00   51k  632k  +1,65  Lf8-e7 Td1-g1 Le7-f6 Sd3-b4 g3-g2+ Kh1-h2 Tg7-g3 Tc1-c2 b7-b5
 8/29  00:00   170k  655k  +1,65  Lf8-e7 Ld2-b4 g3-g2+ Kh1-g1 b7-b5 Da4-b3 Dd8-d7 Tc1xc8+ Dd7xc8 Sd3-f2 Le7-f8
 8/29-  00:00   202k  652k  +1,64  Tc8-c7 Tc1xc7 Tg7xc7 Ld2-b4 Dd8-c8 Le2-f1 Sh4xf3
 14/41  00:00   4.075k  626k  +0,36  Tc8-c7 Tc1xc7 Tg7xc7 Td1-c1 Dd8-c8 Le2-f1 Sh4xf3 Da4-d1 Sf3xd2 Dd1xd2 Tc7xc1 Sd3xc1 f4-f3 Dd2-g5+ Lf8-g7 Sc1-d3 g3-g2+ Lf1xg2 f3xg2+ Kh1xg2 Dc8-c2+
 14/44-  00:01   8.758k  591k  +0,35  Tc8-c6 d5xc6 Dd8-c8 Le2-f1 g3-g2+ Lf1xg2 Tg7xg2 Da4-b3+ Kg8-h8 Sd3xf4 e5xf4 Ld2-c3+ Lf8-g7 Lc3xg7+ Kh8-h7 Td1-d2 Tg2xd2 c6xb7 Dc8xc1+ Db3-d1 Td2xd1+
 16/52  00:12   72.552k  577k  -4,16  Tc8-c6 Sd3xf4 e5xf4 d5xc6 Dd8-c8 Da4-b3+ Kg8-h8 Le2-f1 g3-g2+ Kh1-g1 g2xf1D+ Kg1xf1 Dc8xh3+ Kf1-e2 Tg7-g2+ Ke2-d3 Sh4xf3 Ld2-e3 b7xc6 Le3xf4
Bester Zug: Tc8-c6, Wert: -4,16, Tiefe: 16/52, Dauer: 02:05,683, 72.551.634 Knoten, 577k

Hier fällt mir unangenehm auf, dass die Zeit Angaben für die entsprechenden Tiefen F-A-L-S-C-H sind!!!

By Hauke Lutz Date 2014-01-07 23:33

nach 103 Partien schon +11/=82/-11, mal schaun was die zeit bringt

By Hauke Lutz Date 2014-01-08 04:01 Edited 2014-01-08 04:06

Die Rookwood-Version ist bei folgender Partie (1 Kern, Takt 4,5 GHz, HyperThreading off) 2 Sekunden langsamer (4m:39s) bei Tiefe 30 als die 140106-Version (4m:37s).

Auch im direkten Vergleich liegt Rookwood unter vorher genannten Bedingungen bislang mit 10 Elo (+14/=149/-19) zurück.

In meinen Augen keine Verbesserung, aber ok. Ich lasse den Test trotzdem erstmal weiterlaufen..

Gruß
Hauke

By Hauke Lutz Date 2014-01-08 16:27

390 Partien +33/=315/-42 --> Rookwood ist trotz einer "Optimierung" im direkten Vergleich wenn überhaupt gleichstark wie die 140106-Version.

Gruß
Hauke

By docdwo Date 2014-01-08 19:17

Teste jetzt mit stockfish_14010815_x64_modern_sse42.exe .
Auch ich meine, dass die neuesten Versionen ok sind,
und jetzt oder schon bald Rockwood 2014 überholen werden.
Wichtig ist nur, dass man mit bench genau misst, ob 8 Threads nicht doch etwas bringen
(wie bei mir immerhin 15% gegenüber 4 Threads trotz Hyperthreading).
Und die Tatsache, dass auf schneller Hardware H4Pro nichts mehr zu lachen hat, erst recht nicht
mit 8 Threads. Insbesondere beeindruckt die Performance gegen Komodo tcecr, die besser
als H4Pro ist, auch bei 4 Threads.

By Hauke Lutz Date 2014-01-09 02:14

Das ist Leistung/Recheneinheit ab 4 Threads mehr oder weniger stark abnimmt ist bei jeder Engine unterschiedlich stark festzustellen.

Auf meinem PC mit einem 4930k bringt es, mit 4 echten Kernen getestet, wenn überhaupt nur unmerkliche Verbesserungen.
Dies deckt sich mit meiner Messung von letzter Nacht wo ich mit einem Kern gemessen habe.

Deswegen ist mein Fazit: Holt euch einfach die aktuelle Version und fertig.

Gruß
Hauke

By Karl Date 2014-01-08 22:00

Jaaaaa!!!
meine derzeitige Nummer 1 unter den Stockys.
In div. Test ist die Roockwood Engine immer die schnellste, wie der "Higgs" das gemacht hat?
Setze die Engine derzeit für Blitz und Langschach auf Schach.de ein und bin mehr als zufrieden.
Grüße

By Hauke Lutz Date 2014-01-09 16:24

Welche CPU hast du, Karl? Auf meiner CPU mit Ivy Bridge-E Architektur stelle ich keine Verbesserung fest.