Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / DJ Welcome Test "Reloaded"
1 2 Previous Next  
Parent - By Andreas Wutzke Date 2012-02-21 15:20
Hallo Timo,

ja Komodo ist der Angstgegner von Junior. Aber das liegt nicht so sehr an einer grossen Schwäche von Junior sondern dass der Komodo einfach so saustarkt ist.
Bei langer Bedenkzeit auf 1 vs 1 thread haut der auch Houdini, Hiarcs, Fritz, Spark weg...

Ich hab mal einen test auf i7 4 Cores gemacht. 3 cores für Junior nur  1 für Komodo mit permanent brain und 40Z/120min das konnte Junior grad so unentschieden halten.
Bei 10 Partien.....

Die Frage ist nun, ob Komodo MP wirklich nochmals so viel zulegen kann.

Gruß
Andi
Parent - - By Kurt Utzinger Date 2012-02-20 08:50
Hallo Timo
In der Zwischenzeit (20.2.2012) hat sich die Situation langsam
ins rechte Licht gerückt und der Nimbus von Deep Junior 13
beginnt je länger je mehr zu bröckeln.
Mfg
Kurt
Parent - By Timo Haupt Date 2012-02-20 10:43
Hallo Kurt,

du hast Recht: Auch wenn es nur eine Momentaufnahme ist, hat sich der Eindruck von gestern Abend schon relativiert. Gegen Houdini und Rybka liegt Junior deutlich zurück, gegen Stockfish und Critter sieht es ein wenig positiver aus. Wenigstens gegen die "Oberklasse" (Fritz, Naum, Chiron) schaut es (noch) ein wenig besser aus. Wäre ja immerhin ein Achtungserfolg, wenn Junior in dieser Liga "mitspielen" könnte. Dann wäre zumindest die von den Autoren angedeutete Leistungssteigerung ("one generation ahead in strength") nicht ganz aus der Luft gegriffen. Um das zu verifizieren, sind natürlich weitere Partien nötig. Denke mal, dass ich weitere Tests anschließen werde, wenn das Ergebnis dieses Tests in die entsprechende Richtung deuten würde. Testkandidaten wären für mich dann noch Shredder, Spike, Sjeng, Spark, Zappa und natürlich der neue Hiarcs, sobald dieser verfügbar ist.

Viele Grüße
Timo
Parent - - By Timo Haupt Date 2012-02-19 21:01
Nicht dass noch jemand denkt, ich will hier eine Lobhudelei auf Junior veranstalten. Dieser hat gerade kurz und schmerzvoll gegen Chiron verloren - ist praktisch mit Pauken und Trompeten untergegangen:

[Event "Junior-Chiron"]
[Site "?"]
[Date "2012.02.19"]
[Round "7.1"]
[White "Deep Junior 13"]
[Black "Chiron 1.1a 64bit"]
[Result "0-1"]
[ECO "C18"]
[Annotator "0.29;-0.10"]
[PlyCount "64"]
[EventDate "2012.02.18"]

{AMD Phenom(tm) II X4 905e Processor 3000 MHz W=21.7 plies; 2.822kN/s B=27.0
plies; 1.948kN/s} 1. e4 e6 2. d4 d5 3. Nc3 Bb4 4. e5 c5 5. a3 Bxc3+ 6. bxc3 Qc7
7. Qg4 Ne7 8. Qxg7 Rg8 9. Qxh7 cxd4 10. Ne2 Nbc6 11. f4 dxc3 12. Qd3 d4 13. h4
{0.29/21 213} b6 {-0.10/25 282} 14. Qc4 {0.15/22 0 (h5)} Nf5 {-0.86/25 514
(Bb7)} 15. h5 {-0.28/22 300} a5 {-0.87/28 178} 16. h6 {-0.29/22 0 (Nxd4)} Ba6 {
-0.99/27 284} 17. h7 {-0.26/22 0 (Qb3)} Rh8 {-1.63/26 353} 18. Qb3 {-0.34/23
83 (Qa4)} Nce7 {-1.60/27 233 (a4)} 19. Rb1 {-0.90/22 1121 (Qa4+)} Rb8 {-1.48/
27 248 (Nd5)} 20. Qa4+ {-1.08/21 224} b5 {-1.94/28 114} 21. Qb3 {-1.09/23 37}
b4 {-2.18/26 294 (Qc6)} 22. axb4 {-1.72/22 400} Nc6 {-2.54/25 107 (Rxb4)} 23.
Qa4 {-1.65/22 386 (Rh3)} Bb5 {-3.29/27 306} 24. Qa2 {-2.32/23 128 (Qb3)} Nxb4 {
-4.26/26 288} 25. Rxb4 {-3.05/22 0} axb4 {-4.79/26 557} 26. g4 {-3.05/23 8
(Rh3)} Qb7 {-6.38/27 599 (Ne3)} 27. Rh3 {-4.33/23 380} Ne3 {-6.74/28 0} 28.
Bxe3 {-5.27/22 358} dxe3 {-6.91/27 189} 29. g5 {-5.27/21 52 (Nd4)} Ra8 {-9.92/
29 268} 30. Qb1 {-7.53/23 24} Qd5 {-10.60/30 144 (Qd7)} 31. Rxe3 {-6.92/23 90}
Qd2+ {-12.48/26 41} 32. Kf2 {-6.92/9 0} Rxh7 {-13.46/27 297} 0-1

Ich will nicht Chirons Leistung schmälern - er hat sicherlich Juniors Fehler gut ausgenutzt. Aber ich glaube, man kann trotzdem sagen, dass Junior diese Partie auf ganzer Linie verloren hat. Die Wurzel allen Übels scheint für mich in diesem Zug zu liegen:

Junior zieht 14. Dc4?

Die weiße Dame steht dort denkbar schlecht und wird in der Folge von Schwarz nur noch hin- und hergejagt. Sie spielt quasi bis zum Schluss gar nicht mehr mit und Chiron nutzt das eiskalt aus. Schon spektakulär, so ein Kurzsieg!

Viele Grüße
Timo
Parent - - By Michael Scheidl Date 2012-02-20 09:28 Edited 2012-02-20 09:34
Nach der vorgegebenen Variante war Junior mit einengenden schwarzen Bauern c3+d4 sowie den halboffenen Linien in g+h konfrontiert:


13.Sxd4 ist der wahrscheinlichste grüne Turnierzug im Fritz 13-Buch. Es ist bis zu mittleren Tiefen wohl nicht die erste Enginewahl, sieht aber unverdächtig bzw. normal aus(?).

12...d4 dürfte im Computerschach selten bzw. eher neu sein; ich fand nur einige Beispiele wo jeweils 12...Ld7 geschah.

P.S. Unter den bisherigen Zwischenergebnissen hat Deep Junior 13 gegen Rybka und gegen Houdini die größten Probleme, wobei auffällt daß es im Houdini-Match in bisher acht Partien noch kein Remis gab, während z.B. gegen Critter 7 von 8 Partien remis wurden. - Aber das sind nur Momentaufnahmen.
Parent - By Timo Haupt Date 2012-02-20 10:48
Hallo Michael,

ja, diese Vorgabestellung hat es in sich! Die daraus entstandenen Partien waren absolut sehenswert für denjenigen, der wilde und chaotische Stellungen mag! Auf jeden Fall ist es für beide Seiten brandgefährlich, die Partie kann schon in der Eröffnungsphase sehr schnell kippen.

Das Houdini-Match finde ich auch erstaunlich, da scheint Remis ein Fremdwort zu sein. Gegen Rybka hatte Junior in dem ersten Test wesentlich weniger Probleme und die beste Quote. Das scheint nun anders zu sein - vielleicht konnte Rybka mit nur 1GB Hash nicht sein volles Potenzial ausschöpfen? Reine Spekulation, ich weiß - vor allem weil man das nach nur 10 Partien überhaupt nicht sagen kann.

Viele Grüße
Timo
Parent - By Timo Haupt Date 2012-02-24 10:45
Neben den wirklich schönen und interessanten Partien, die immer wieder zu beobachten sind (sowohl tolle Siege von Junior, aber eher öfter Siege seiner Gegner), ist mir gestern Nacht auch dieses Kuriosum aufgefallen. Da hat mal wieder der bereits bekannte Bug in Junior zugeschlagen, von welchem Clemens bereits berichtet hat und welcher auch in meinem ersten Test einmal aufgetreten ist.

In der folgenden Partie ist bis zum 32. Zug eigentlich nichts los, doch dann brennen Junior die Sicherungen durch:

[Event "Junior-Fritz"]
[Site "?"]
[Date "2012.02.24"]
[Round "30.1"]
[White "Fritz 13"]
[Black "Deep Junior 13"]
[Result "1-0"]
[ECO "A37"]
[Annotator "0.09;0.23"]
[PlyCount "109"]
[EventDate "2012.02.18"]

{AMD Phenom(tm) II X4 905e Processor 2999 MHz W=20.2 plies; 2.740kN/s; 414.031
TBAs B=30.5 plies; 1.267kN/s; 1.699.570 TBAs} 1. c4 c5 2. Nc3 Nc6 3. Nf3 e5 4.
g3 g6 5. Bg2 Bg7 6. a3 d6 7. O-O Nge7 8. b4 e4 9. Ne1 f5 10. Bb2 O-O 11. d3 Be6
12. Rb1 {0.09/20 252} exd3 {0.23/18 259 (Ne5)} 13. Nxd3 {0.36/20 97} Bxc4 {0.
27/18 41} 14. bxc5 {0.25/22 152 (Na4)} dxc5 {0.38/19 168} 15. Nxc5 {0.30/24 32}
Qxd1 {0.37/19 125} 16. Rfxd1 {0.27/25 0} Rad8 {0.34/21 156 (Rfd8)} 17. Nxb7 {
0.37/25 160} Rxd1+ {0.48/22 0} 18. Nxd1 {0.38/26 65} Rb8 {0.32/24 185} 19. Bxg7
{0.19/28 0} Kxg7 {0.31/23 88} 20. Nc3 {0.25/28 81} Ba6 {0.26/26 226} 21. Nd6 {
0.21/29 0} Rxb1+ {0.27/25 146} 22. Nxb1 {0.21/28 0} Bxe2 {0.27/25 442} 23. f4 {
0.24/28 0} Bd1 {0.27/24 195} 24. Ne8+ {0.23/28 209 (Nc3)} Kh6 {0.19/24 192
(Kf7)} 25. Kf2 {0.30/27 275 (Nc3)} Nd4 {0.27/23 156} 26. Nd6 {0.33/28 45} Ba4 {
0.17/23 164} 27. Ke3 {0.29/28 41 (Nc3)} Bc6 {0.09/23 165} 28. Kxd4 {0.35/28 55
(Bf1)} Bxg2 {0.00/23 194} 29. Nc4 {0.37/28 113 (Nc3)} Nd5 {0.37/25 243 (g5)}
30. Nc3 {0.49/31 355} Nxc3 {0.48/28 0} 31. Kxc3 {0.49/30 59} Bf1 {0.49/30 88
(Bc6)} 32. a4 {0.56/29 206 (Ne3)} Bxc4 {0.00/34 155 (Kh5)} 33. Kxc4 {7.31/28 31
} g5 {0.00/37 113} 34. Kd5 {9.17/31 0 (a5)} Kh5 {0.00/36 97 (Kg6)} 35. h3 {12.
99/30 40 (a5)} g4 {-#24/32 297 (a5)} 36. h4 {14.25/26 130 (hxg4+)} Kh6 {-#19/
29 446 (Kg6)} 37. a5 {#102/18 4} a6 {-12.97/29 42 (Kg7)} 38. Kc6 {#102/17 5}
Kh5 {-#19/27 118 (Kg7)} 39. Kb6 {#93/16 18 (Kd6)} h6 {-#19/28 236 (Kh6)} 40.
Kxa6 {#47/13 0 (Kc6)} Kg6 {1.92/9 0} 41. Kb6 {#46/14 11} Kf6 {#12/32 206 (h5)}
42. a6 {#42/9 0} Ke6 {#10/35 243 (Kg6)} 43. Kc6 {#35/13 19} Kf6 {#9/36 293
(Ke7)} 44. a7 {#29/12 33} Kf7 {#6/40 192 (Ke6)} 45. a8=Q {#28/9 0} Kg7 {#5/41
215 (Kf6)} 46. Qb7+ {#19/9 3 (Qa1+)} Kg8 {#5/46 246} 47. Qc8+ {#22/10 0 (Qb8+)}
Kh7 {#5/46 238 (Kf7)} 48. Qxf5+ {#24/7 0 (Qc7+)} Kh8 {#5/52 249 (Kg7)} 49. Qxg4
{#19/8 0 (Kd6)} h5 {#4/60 90} 50. Qxh5+ {#14/7 0 (Qg5)} Kg7 {#4/60 185} 51.
Qg5+ {#5/7 0} Kf8 {#4/60 84} 52. Qf6+ {#4/7 0 (Kd7)} Kg8 {#4/60 19} 53. h5 {#3/
7 0 (Qg6+)} Kh7 {#5/9 0} 54. h6 {#2/7 0 (Qg6+)} Kg8 {#4/9 0} 55. Qg7# {#1/7 0}
1-0

In dieser Stellung glaubt Junior, dass ihm eine Abwicklung ins Bauernendspiel das Remis sichern würde:
Junior zieht 32. ..Lxc4??

Wenig später verliert er völlig den Sinn für die Realität, indem er plötzlich glaubt, für sich ein Matt in 24 Zügen auf dem Brett zu haben:
Fritz hat gerade 35. h3 gezogen. Junior antwortet nun mit g4 und träumt vom Matt für Schwarz in 24.

Fritz hat gerade 40. Kxa6 gezogen.

Erst jetzt sieht Junior seine Niederlage ein, zieht Kg6 mit einer Bewertung von 1.92 für Weiß und erkennt im nächsten Zug das Matt in 12 gegen sich an.

Unglaublich, aber wahr!

Viele Grüße
Timo
Parent - - By Kurt Utzinger Date 2012-02-22 17:36
Hi Timo
Per heutigem Stand (22.02.2017, 17.30 Uhr) sieht es echt schlimm
aus für Deep Junior 13, nämlich wie folgt:

25 % gegen Houdini (4,5/18)
42 % gegen Critter (8,0/19)
35 % gegen Stockfish (7,0/20)
26 % gegen Rybka (5,0/19)
52 % gegen Naum (10,0/19)
47 % gegen Chiron (10,5/22)
26 % gegen Kommodo (5,0/19)
47 % gegen Fritz (10,0/21)

Total also lediglich 38 % mit 60,0 Punkten aus 157 Partien.

Ich glaube, wir können den Junior als Spitzenengine "vergessen".

Mfg
Kurt
Parent - - By Timo Haupt Date 2012-02-22 18:08
Hallo Kurt,

es sieht in der Tat schlimm aus, allerdings nicht so schlimm wie im Blitz. Da holte Junior gegen diese Gegnerschaft lediglich 28% im Durchschnitt. Die 10% mehr könnten aber möglicherweise der generell höheren Remisquote bei längeren BZ geschuldet sein. Ingo schlug deshalb einen Test mit einer Vergleichsengine vor, die bei 5m+3s bei ihm auch ca. 28% gegen diese Gegner holte. Sollte diese sich dann im gleichen Maße um ca. 10% "verbessern", wäre das ein Indiz dafür, dass die Theorie mit der generell höheren Remisquote zuträfe. Dann müsste man den Mythos "Junior profitiert von längeren BZ stärker als andere Engines" wohl wirklich endgültig begraben...

Viele Grüße
Timo
Parent - - By Ingo Bauer Date 2012-02-22 19:04
Wie hoch war denn die Remisquote bei mir gegen diese Engines und wie hoch ist sie jetzt (bin zu fauls )? (Wobei die Anzahl an Spielen immer noch sehr niedrig ist?). Wenn die Remisquote ungefähr gleich ist wei bei mir, absolut aber rund 10% mehr herrauskommen, wäre das ja auch schon eine interessante Info ...

Gruß
Ingo
Parent - - By Timo Haupt Date 2012-02-22 23:25
Die Remisquote ist bei mir bislang dramatisch höher als bei dir. Auch wenn mein Test natürlich noch viel zu wenige Partien hat, scheint sich der Trend anzudeuten, dass es bei längeren BZ tatsächlich wesentlich mehr Remisen gibt. Diese Vermutung wurde ja bereits vorher von dir geäußert.

IPON (DJ13 vs. Top 18):


DJ13-Test (DJ13 vs. Top 8):


Mal schauen, ob ich Junior nach Ende dieser Matches noch gegen die restlichen Gegner aus IPON Top18 nachspielen lasse. Dann hätte man einen noch besseren (und genaueren) Vergleich.

Viele Grüße
Timo
Parent - - By Ingo Bauer Date 2012-02-23 02:54
Moin Timo,

Bei 54% Remisquote ist klar, das das Beobachten von ein paar wenigen Partien einen anderen Eindruck hinterläßt als ein systematischer Test!

Zwei Fragen stellen sich:

1. Wie ist das reine Gewinn/Verlust Verhältniss bei mir und bei dir? 54% Resmisquote sind alleine schon 27% der Punkte wo J13 bei mir nur 28% im Ganzen hatte. Bei gleichem G/V Verhältniss hätte Junior mit dieser Remisquote schon fast 10% mehr Punkte geholt.
2. Wie verhält sich die Konkurenz? (Es könnte ja sein das Junior besonders erfolgreich Remisen holt!) Spark finde ich als ersten Test gut!

Gruß
Ingo
Parent - - By Ingo Bauer Date 2012-02-23 03:20 Edited 2012-02-23 03:23
Ich habe gerade mal in die CCRL gesehen.

Während Spark da in der 40/4 knapp vor DJ12.5 liegt, liegt er bei der 40/40 immerhin 40 Elo hinter DJ12.5. (Allerdings wieder sehr wenige Partien gegen andere Gegner auf jeweils 4 Kernen). Bei Spike 1.4 ist das anders, der liegt in beiden Listen vor DJ12.5.

Das bemerkend fällt mir auf das ein Test mit nur zwei Enignes eigentlich nichtssagend ist. Egal was dabei herrauskommt, du weißt nicht ob einer besser oder der andere schlechter geworden ist, und selbst wenn ungefähr das selbe herrauskommt (im Vergleich zu IPON, weil die schon mehrmals erwähnt wurde) ist die Probe mit einer Engine zu klein.

Sollte sich das mit der erhöhten Remisquote bewahrheiten, müßte ein Testsetup das beweisen soll das Engine X überproportional zulegt anders aussehen als ein Match gegen die (weit entfernten) Top 6, 7, 8 ... Man müßte ein komplettes "Jeder gegen Jeden"-Turnier mit Engines spielen die vergleichbare Spielstärke haben wie Engine X und das mit kurzer und mit langer Zeitkontrolle (und natürlich möglichst vielen Spielen). Ein Vergleich gegen eine Gegnerschaft die Elomäßig weit entfernt ist aufgrund der geringen Partiezahl in sich schwierig - aber besser als nichts

Gruß
Ingo
Parent - - By Timo Haupt Date 2012-02-23 08:35
Moin Ingo,

dieses "Jeder gegen Jeden"-Turnier wird es geben (meinen Eröffnungstest), allerdings nicht mit Turnierbedenkzeit und nicht MP - da würde ich mit meinen Rechnern mehrere Jahre brauchen. Aber immerhin wird es grob die 10-fache IPON-Bedenkzeit sein, so dass hier ein Fingerzeig gegeben werden könnte. Dann wird zwar der eine oder andere immer noch auf die Idee kommen zu sagen, "ja aber mit Turnierbedenkzeit und MP wäre Engine X dann aber vor Engine Y" - und man könnte es ihm nicht direkt widerlegen. Doch ich glaube, dass nicht mehr allzu viele Stimmen wie diese laut werden, denn wenn sich bei 10-facher IPON-BZ unter sonst ziemlich ähnlichen Bedingungen (Ponder=On, SP, Vorgabestellungen) nichts in der Rangfolge tut, werden sich die allermeisten damit zufrieden geben. Diese Erkenntnis (sollte sie denn dann aus den Daten herauslesbar sein) wird zwar eher ein Nebenprodukt sein, aber dafür eines, das möglicherweise mit alten Mythen aufräumt (oder diese bestätigt, wer weiß?)...

Viele Grüße
Timo

P.S.: Nicht ganz von der Hand zu weisen ist allerdings wirklich der Unterschied zwischen SP und MP. Da es hier unterschiedlich gute Ansätze gibt, wie die Suche parallelisiert wurde bzw. parallelisiert werden kann (denn je selektiver eine Engine im SP vorgeht, desto ineffizienter sollte die parallele Suche werden), kann man schon beobachten, dass sich die Rangfolge ggf. geringfügig ändert und die Ratings dichter zusammenrücken. Beispiel Shredder: Legt bei 4 CPUs nicht mehr so stark zu wie andere Engines, ist dann quasi auf einem Niveau mit Spike und Junior, während er bei 1 CPU diesen doch ein Stückchen davoneilt (siehe CEGT 40/20 und CCRL 40/40).
Parent - - By Ingo Bauer Date 2012-02-23 09:22
Moin moin

[quote="Timo Haupt"]

dieses "Jeder gegen Jeden"-Turnier wird es geben (meinen Eröffnungstest), allerdings nicht mit Turnierbedenkzeit und nicht MP - da würde ich mit meinen Rechnern mehrere Jahre brauchen. Aber immerhin wird es grob die 10-fache IPON-Bedenkzeit sein, so dass hier ein Fingerzeig gegeben werden könnte. Dann wird zwar der eine oder andere immer noch auf die Idee kommen zu sagen, "ja aber mit Turnierbedenkzeit und MP wäre Engine X dann aber vor Engine Y" - und man könnte es ihm nicht direkt widerlegen. Doch ich glaube, dass nicht mehr allzu viele Stimmen wie diese laut werden, denn wenn sich bei 10-facher IPON-BZ unter sonst ziemlich ähnlichen Bedingungen (Ponder=On, SP, Vorgabestellungen) nichts in der Rangfolge tut, werden sich die allermeisten damit zufrieden geben. Diese Erkenntnis (sollte sie denn dann aus den Daten herauslesbar sein) wird zwar eher ein Nebenprodukt sein, aber dafür eines, das möglicherweise mit alten Mythen aufräumt (oder diese bestätigt, wer weiß?)...
[/quote]

Ich hoffe sehr das du recht behälst mit deiner Prognose, allein, ich fürchte, dass es immer dieses "Mit mehr Zeit würde aber ..." bleiben wird.Einfach weil die Wahrnehmung eines einzelnen SPieles etwas viel intensiveres ist als eine abstrakte Statistik ...

[quote="Timo Haupt"]
P.S.: Nicht ganz von der Hand zu weisen ist allerdings wirklich der Unterschied zwischen SP und MP. Da es hier unterschiedlich gute Ansätze gibt, wie die Suche parallelisiert wurde bzw. parallelisiert werden kann (denn je selektiver eine Engine im SP vorgeht, desto ineffizienter sollte die parallele Suche werden), kann man schon beobachten, dass sich die Rangfolge ggf. geringfügig ändert und die Ratings dichter zusammenrücken. Beispiel Shredder: Legt bei 4 CPUs nicht mehr so stark zu wie andere Engines, ist dann quasi auf einem Niveau mit Spike und Junior, während er bei 1 CPU diesen doch ein Stückchen davoneilt (siehe CEGT 40/20 und CCRL 40/40).
[/quote]

Dieses SP/MPThema ist ein ganz anderes, aber ja, eine Parallelisierung kann unterschiedlich durchgeführt werden. Ich bin nicht sicher ob diese "umgekehrt proportional" zur Selektivität einer Engine läuft aber Unterschiede gibt es.
Arbeisthypothese: Von 1 auf 4 Threads ca 90 Elo Gewinn. Die eine Engine liegt 20 Elo drunter, eine andere 20 drüber, es könnten also ca. 40 Elo Differenz zustande kommen.
Irgendwie bin ich da mit dem Alter entspannter geworden. Wenn eine Engine 20 Elo hinter einer Engine liegt ist das für mich irgendwei kein riesiger Unterschied mehr, wenn nun NACH einem Test mit 4 Kernen sich der Unterschied umgedreht haben sollte, ist das für mich auch kein riesiger Unterschied mehr.
Ich würde gerne von "Klassen" sprechen. Wenn du mal in meine Liste schaust, dann ist Houdini (noch) eine Klasse für sich, dann von Komodo bis Stockfish ist es die zweite Klasse, von Chiron bis Spike die nächste, Protector bis Junior ... Was man innerhalb einer Klasse für eine lange Analyse benutzt ist Geschmackssache.

Gruß
Ingo
Parent - - By Timo Haupt Date 2012-02-24 00:02
n'Abend Ingo,

[quote="Ingo Bauer"]
Arbeisthypothese: Von 1 auf 4 Threads ca 90 Elo Gewinn. Die eine Engine liegt 20 Elo drunter, eine andere 20 drüber, es könnten also ca. 40 Elo Differenz zustande kommen.
[/quote]

Einverstanden! Aber nun führe das weiter auf die Bedingungen der offenen ICGA-WM: Dort treten manche Programme mit weitaus mehr als 4 Threads an. Und während die einen ihr Maximum bei 8 Threads erreicht haben (und auch auf diesen der Zugewinn gegenüber 4 nur gering ist), können die anderen auch auf 32 oder mehr noch zulegen. Und dann kommt eben auch deutlich mehr als die o.g. 40 Elo Differenz dabei heraus. Junior tritt jedes Jahr auf sehr guter Hardware an, teilweise Maschinen, die noch gar nicht am Markt erhältlich sind. Zusammen mit dem sicherlich stark auf  Junior zugeschnittenen Eröffnungsbuch, sowie der "Turnierhärte" des Junior-Teams ist es somit wohl keine so große Überraschung mehr, warum Junior regelmäßig bei diesem Turnier gut abschneidet.

[quote="Ingo Bauer"]
Irgendwie bin ich da mit dem Alter entspannter geworden. Wenn eine Engine 20 Elo hinter einer Engine liegt ist das für mich irgendwei kein riesiger Unterschied mehr, wenn nun NACH einem Test mit 4 Kernen sich der Unterschied umgedreht haben sollte, ist das für mich auch kein riesiger Unterschied mehr.
Ich würde gerne von "Klassen" sprechen. Wenn du mal in meine Liste schaust, dann ist Houdini (noch) eine Klasse für sich, dann von Komodo bis Stockfish ist es die zweite Klasse, von Chiron bis Spike die nächste, Protector bis Junior ... Was man innerhalb einer Klasse für eine lange Analyse benutzt ist Geschmackssache.
[/quote]

Das mit den Klassen sehe ich ähnlich. Houdini nimmt momentan quasi die Position ein, die Kasparov über Jahre hinweg im Menschenschach hatte: Eine Klasse für sich allein. Komodo bis Stockfish stellt die "Spitzenklasse" dar, Chiron bis Spike die "Oberklasse". Protector bis Zappa wäre dann die "gehobene Mittelklasse". Auf diesen Bereich (Houdini bis Zappa) will ich mich in Zukunft konzentrieren bei meinen Tests. Ich rechne allerdings damit, dass langfristig noch einige Engines in diesen Bereich vordringen werden. Einige vielversprechende neue Programme sind derzeit in der Mache, bei denen ich viel Potenzial vermute und denen ich zutraue, in diese Bereich vorstoßen zu können. Einige von denen sind frei erhältlich (Nemo, Quazar), andere noch privat (Rick48) und wiederum andere werden wohl immer privat bleiben (Thinker, Rondo). Naja, jedenfalls wird es nicht langweilig - im Gegenteil. Vor 3-4 Jahren, als Rybka die absolute Dominanz inne hatte und man fast schon die Hoffnung aufgab, dass irgendjemand mal diese Über-Engine ein- oder sogar überholen könnte, fand ich das Geschehen deutlich trister. Da hatte ich mich schon innerlich auf ein langsam dahinsiechendes Ende des Computerschachs eingestellt. Im Jahr 2012 ist es wieder spannend geworden und das Hobby macht (zumindest mir) wieder soviel Spaß wie schon lange nicht mehr (in etwa vergleichbar mit der Situation vor 10 Jahren).

Viele Grüße
Timo
Parent - By Ingo Bauer Date 2012-02-24 09:04
Moin Timo,

Das mit den vielen Kernen kann sein - oder auch nicht. Wir können da nur vermuten aber meines Wissen kann und ist das niemand wirklich am testen. Wenn ich jetzt schreibe das bei den meisten Engines bei 8 Kernen effektiv Schluß ist mit "Gewinn durch Paralellisierung" auch wenn sie noch auf 16 laufen und ganz wenige vielleicht auch noch von 8 auf 16 zulegen (dann ist die Frage wieviel, 10, 15 Elo?) bin ich sicher das wir diese Frage mit den heutigen Engines nicht lösen werden! Wenn es irgendwann 32Core Rechner zum Hausgebrauch geben wird werden wir das an anderen Engines testen ...

[quote="Timo Haupt"]
Naja, jedenfalls wird es nicht langweilig - im Gegenteil. Vor 3-4 Jahren, als Rybka die absolute Dominanz inne hatte und man fast schon die Hoffnung aufgab, dass irgendjemand mal diese Über-Engine ein- oder sogar überholen könnte, fand ich das Geschehen deutlich trister. Da hatte ich mich schon innerlich auf ein langsam dahinsiechendes Ende des Computerschachs eingestellt. Im Jahr 2012 ist es wieder spannend geworden und das Hobby macht (zumindest mir) wieder soviel Spaß wie schon lange nicht mehr (in etwa vergleichbar mit der Situation vor 10 Jahren).
[/quote]

Da gebe ich dir völlig Recht! Auch ich vermutete das Computerschach durch Langeweile stirbt - das ist Gott sei Dank dann doch nicht so gekommen.
Das es nochmal so spannend wird wie ich es ca. 99-2002 empfunden habe glaube ich aber nicht. Bin aber sicher das das daran liegt, das ich heute mehr weiß und mir andere Testmöglichkeiten zu Verfügung stehen.

Gruß
Ingo
Parent - - By Thorsten Czub Date 2012-02-22 18:09
was ist denn  bei diesen tests anders als bei den vorherigen ?
Parent - By Timo Haupt Date 2012-02-22 23:30
Die Bedenkzeit ist anders: 125min/50Z + 100min/40Z + (15min+5s) statt 120min/40Z + 60min
Die Hashkonfiguration ist anders: Für die Matches mit 6 Threads haben die Engines 4GB Hash, bei 2 Threads 1GB und bei einem Thread sind es 512MB.

Aber das scheint Junior auch nicht wirklich zu helfen - ich hätte den vorherigen Test ruhig weiterlaufen lassen können. Das einzige, was nun im Gegensatz zu dem vorherigen Test nicht mehr passiert, ist, dass Junior in höchster Zeitnot noch das Endspiel vergeigt. Hier wird er meist schon im Mittelspiel (bzw. spätes Mittelspiel / frühes Endspiel) überwältigt, wenn er verliert.
Parent - - By Eduard Nemeth Date 2012-02-24 06:33
die spannung! wann gelingt junior endlich der allererste sieg gegen rybka und komodo?? :-[
Parent - - By Eduard Nemeth Date 2012-02-26 13:47
jetzt wird es nur peinlich! das weltmeister programm kann auch nach fast 80 partien gegen rybka und komodo nicht gewinnen. und fuer sowas zahlt man aucjh noch freiwillig 60 euro
Parent - - By Timo Haupt Date 2012-02-26 16:52
[quote="Eduard Nemeth"]
jetzt wird es nur peinlich! das weltmeister programm kann auch nach fast 80 partien gegen rybka und komodo nicht gewinnen. und fuer sowas zahlt man aucjh noch freiwillig 60 euro
[/quote]

Mich erstaunt es auch, dass Rybka und Komodo auf langen BZ offenbar so schwierig zu schlagen sind. Dass du dich darüber lustig machst, dass ich eine Software ehrlich erstanden habe, kann ich allerdings nicht nachvollziehen...
Parent - - By Kurt Utzinger Date 2012-02-26 17:21
[quote="Timo Haupt"]
[quote="Eduard Nemeth"]
jetzt wird es nur peinlich! das weltmeister programm kann auch nach fast 80 partien gegen rybka und komodo nicht gewinnen. und fuer sowas zahlt man aucjh noch freiwillig 60 euro
[/quote]

Mich erstaunt es auch, dass Rybka und Komodo auf langen BZ offenbar so schwierig zu schlagen sind. Dass du dich darüber lustig machst, dass ich eine Software ehrlich erstanden habe, kann ich allerdings nicht nachvollziehen...
[/quote]

Hi Timo
Natürlich ist es schon ein wenig peinlich, dass der neue Deep Junior 13 gegen andere MP-Engines
(einzige Ausnahme Naum) kein Bein auf den Boden bringt und teilweise fürchterlich untergeht.
Wäre ich noch Windows- und ChessBase-User würde ich mir Deep Junior 13 trotzdem zulegen,
weil mir Junior mit seinen speziellen Algorithmen in vielen Stellungen immer wieder Freude
gemacht hat und für Überraschungen gut war.
Mfg
Kurt
Parent - - By Frank Rahde Date 2012-02-26 17:32
Hi Kurt,

und warum genügt dir DJ12 nicht?!

Gruß, Frank
Parent - By Kurt Utzinger Date 2012-02-26 17:40
[quote="Frank Rahde"]
Hi Kurt,

und warum genügt dir DJ12 nicht?!

Gruß, Frank
[/quote]

Hi Frank
Ich habe auch Deep Junior 12 nicht, denn bin nun glaube ich
schon drei Jahre Linuxer.
Gruss
Kurt
Parent - By Eduard Nemeth Date 2012-02-27 07:34
hallo timo! natuerlich meine ich nicht dich. tester finde ich sogar unverzichtbar! also bitte weiter so.

mfg.
eduard
Parent - - By Eduard Nemrth Date 2012-02-27 16:33
hallo timo!
ich meine nicht dich und die anderen tester. testen ist wichtig, und dafuer danke ich euch. auch meine ich nicht dass ich grundsaetzlich gegen junipr bin. ich finde nur den preis total daneben.

mfg.
eduard
Parent - By Timo Haupt Date 2012-02-27 17:24
Hallo Eduard,

ok, dann hatte ich dich falsch verstanden. Naja, wenn ich es mir so überlege, hast du im Grunde Recht. Für 60 Euro bekommt man anderswo mehr Spielstärke fürs Geld. Da war der Houdini-Kauf wesentlich lohnender. Und mit der Freeware Critter und Stockfish kommt man ebenfalls gut zurecht.

Aber irgendwie ist man dann doch Jäger und Sammler. Hatte den 12er Junior ausgelassen und deshalb beim 13er zugeschlagen. Hätte ich mir 12 damals ebenfalls zugelegt, wäre ich jetzt sicher verärgert, da der Elo-Zuwachs von 12 auf 13 nicht sehr groß ist. Aber so kann ich einigermaßen damit leben, auch wenn ich mir schon etwas mehr erhofft hatte. Ich dachte, dass unter "Junior-freundlichen" Bedingungen (lange BZ, viel Hash, MP) die Engine in der Lage sein würde, ihren Score gegenüber Blitz um 10-15% zu verbessern (zumindest gegen die Top5). Doch das scheint nur bedingt zu gelingen. Zwischenstand:
vs. Houdini 21,6%
vs. Critter 32,9%
vs. Stockfish 34,5%
vs. Rybka 31%
vs. Komodo 28,8%

Übrigens geschieht gerade ein kleines Wunder: Junior hat seine erste Gewinnstellung gegen Komodo auf dem Brett!

Gruß
Timo
Parent - - By Kurt Utzinger Date 2012-02-27 17:40
[quote="Eduard Nemrth"]
hallo timo!
ich meine nicht dich und die anderen tester. testen ist wichtig, und dafuer danke ich euch. auch meine ich nicht dass ich grundsaetzlich gegen junipr bin. ich finde nur den preis total daneben.

mfg.
eduard
[/quote]

Hi Eduard
Aber kosten nicht alle MP Engines bei ChessBase Euro 99.90 ??
Dann wäre Deep Junior 13 vergleichsweise sogar günstig. Bei
Hiarcs-Chess sind Hiarcs und Junior günstiger und zur Zeit
wäre Hiarcs 13 MP UCI gar für rund Euro 29.- zu haben.
Gruss
Kurt
Parent - - By Eduard Nemeth Date 2012-02-28 07:01
Hallo Kurt,
Du weisst ja selbst, dass die ChessBase,die Programme auch eine eigene GUI bieten. Zudem gibt es einen kostenlosen Zugang zu Schach.de. Allein der Zugang zum Server kostet zB. beim ICC jährlich 70 Dollar. Und ICC ist nicht besser als Schach.de.

Im Übrigen: Manche mögen es gerne als vermessen ansehen, wenn ich mich über Junior etwas lustig mache. Ich sehe das etwas anders! Wenn jemand für seine Schach-Engine derzeit 60 bis 70 Euro verlangt, dann muss er sich auch gefallen lassen, mit den besten Engines gemessen zu werden.

MfG.
Eduard
Parent - - By Kurt Utzinger Date 2012-02-28 08:51
[quote="Eduard Nemeth"]
Hallo Kurt,
Du weisst ja selbst, dass die ChessBase,die Programme auch eine eigene GUI bieten. Zudem gibt es einen kostenlosen Zugang zu Schach.de. Allein der Zugang zum Server kostet zB. beim ICC jährlich 70 Dollar. Und ICC ist nicht besser als Schach.de.

Im Übrigen: Manche mögen es gerne als vermessen ansehen, wenn ich mich über Junior etwas lustig mache. Ich sehe das etwas anders! Wenn jemand für seine Schach-Engine derzeit 60 bis 70 Euro verlangt, dann muss er sich auch gefallen lassen, mit den besten Engines gemessen zu werden.

MfG.
Eduard
[/quote]

Hi Eduard
Das kann man so sehen. Dann müsstest Du aber auch
über Hiarcs "klagen", der gehört ja auch nicht mehr
zu den besten Engines und hat ebenso wenig eine
eigene GUI.
Gruss
Kurt
Parent - By Peter Martan Date 2012-02-28 10:29
[quote="Kurt Utzinger"]
Dann müsstest Du aber auch
über Hiarcs "klagen", der gehört ja auch nicht mehr
zu den besten Engines und hat ebenso wenig eine
eigene GUI.
[/quote]

Das könnte sich aber demnächst auch ändern, Kurt!
http://www.hiarcs.net/forums/viewtopic.php?p=53709#53709
Parent - - By Benno Hartwig Date 2012-02-26 16:55 Edited 2012-02-26 16:57
[quote="Eduard Nemeth"] und fuer sowas zahlt man aucjh noch freiwillig 60 euro [/quote]Hast du denn bislang nur für die jeweiligen Spitzenreiter-Engines Geld locker gemacht? *staun*
Wo in der Riege der anderen Engines DJ einzusortieren ist, finde ich zumindest auch sehr interessant.
Benno
Parent - By Eduard Nemeth Date 2012-02-27 07:50
es tut mir leid benno, aber derzeit erfuellen critter, stockfish und houdini 1.5 meine beduerfnisse. insbesondere finde ich es super dass critter und stockfish auch unter android laufen! also, wofuer ich geld ausgeben wuerde, waeren diverse weitere engines fuer android [gerne hier auch junior]. fuer die plattform windows, muesste die engine mit der spitze mithalten - evtl. rybka 5.

mfg.
eduard
Up Topic Hauptforen / CSS-Forum / DJ Welcome Test "Reloaded"
1 2 Previous Next  

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill