Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / DiscoCheck 3.6: Stärker!
- - By Michael Scheidl Date 2012-06-29 15:50
Ich habe den Blitztest von DiscoCheck 3.51, siehe

http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=50259

unter identischen Bedingungen mit der neuen Version 3.6 wiederholt.

Discotime 36  2012

Discocheck 3.6   - Hannibal 1.2           5.0 - 15.0    +2/=6/-12    25.00%
Discocheck 3.6   - MinkoChess 1.3         7.0 - 13.0    +5/=4/-11    35.00%
Discocheck 3.6   - Quazar 0.4             9.0 - 11.0    +7/=4/-9     45.00%
Discocheck 3.6   - Texel 1.01             11.0 - 9.0    +8/=6/-6     55.00%
Discocheck 3.6   - Shredder Classic 4     6.5 - 13.5    +4/=5/-11    32.50%

Discocheck 3.6 total: 38.5/100

Außer bei Minko sind die Head-to-Head-Resultate besser, und erstmals ist ein positives dabei (Disco-Texel 55%). Version 3.51 hatte insgesamt 29% erzielt.

Es gab fünf Verluste auf Zeit (ich hab nicht aufgepaßt von wem), von denen ich zwei oder drei in Anbetracht der sehr kurzen Zeitkontrolle "laut Stellung" auf Remis korrigiert habe; in den anderen hatte Arena selber das offenbar wegen des Materialstandes so gemacht.

Zur Anwendung kam die Executable von J.Ablett, wie immer unter http://jimablett.net63.net/

Hier noch der kürzeste Sieg und die kürzeste Niederlage Discos:

[Event "Discotime 36"]
[Site "NC-110"]
[Date "2012.06.28"]
[Round "1"]
[White "Discocheck 3.6"]
[Black "MinkoChess 1.3"]
[Result "1-0"]
[ECO "A35"]
[PlyCount "54"]
[EventDate "2012.??.??"]
[TimeControl "60"]

1. c4 c5 2. Nf3 d6 3. Nc3 {0.33/11 1} Nf6 {-0.23/11 2} 4. e3 {0.37/11 1} Nc6 {
-0.20/11 2} 5. Be2 {0.40/10 1} g5 {-0.15/11 2} 6. h3 {0.29/11 1} Rg8 {-0.21/11
2} 7. d4 {0.70/11 1} Bf5 {-0.28/11 2} 8. O-O {0.72/10 1} h5 {-0.44/11 2} 9. d5
{0.83/10 1} Nb4 {-0.85/12 2} 10. a3 {0.92/11 1} Nc2 {-1.28/11 1} 11. Ra2 {0.87/
11 2} g4 {-1.68/10 1} 12. hxg4 {1.91/11 1} hxg4 {-2.13/12 1} 13. Nh4 {3.09/12 2
} Bh7 {-2.90/12 1} 14. Bd3 {2.93/12 1} Bxd3 {-2.99/12 1} 15. Qxd3 {3.15/12 1}
Rh8 {-3.22/12 1} 16. Nf5 {3.21/12 1} e6 {-3.47/10 1} 17. Ng3 {3.26/11 1} Nxe3 {
-3.57/10 1} 18. Bxe3 {3.40/10 1} Qd7 {-4.12/11 1} 19. Bg5 {3.59/10 1} Be7 {-4.
40/11 1} 20. dxe6 {3.94/11 1} Qxe6 {-4.93/11 1} 21. Nf5 {4.66/10 1} Qe5 {-5.29/
11 1} 22. f4 {4.70/9 1} gxf3 {-5.16/11 1} 23. Qxf3 {4.75/10 1} Rb8 {-5.36/11 1}
24. Raa1 {4.98/9 1} Kd8 {-5.69/8 1} 25. Rad1 {6.01/8 1} Nd5 {-7.33/8 1} 26.
Nxd6 {7.60/8 1} Qh2+ {-8.90/8 1} 27. Kf2 {7.60/1 0} Bxg5 {-9.10/10 1 Black
resigns} 1-0

[Event "Discotime 36"]
[Site "NC-110"]
[Date "2012.06.28"]
[Round "3"]
[White "Discocheck 3.6"]
[Black "Shredder Classic 4"]
[Result "0-1"]
[ECO "C55"]
[PlyCount "47"]
[EventDate "2012.??.??"]
[TimeControl "60"]

1. e4 e5 2. Bc4 Nf6 3. d3 Nc6 4. Nf3 Be7 5. O-O O-O 6. Re1 d6 7. a4 Be6 8. a5
a6 9. Bxe6 {-0.10/12 2} fxe6 {0.13/9 1} 10. Nc3 {-0.05/11 1} Qe8 {0.30/10 5}
11. Ng5 {-0.14/11 1} Nd4 {0.48/9 1} 12. Be3 {-0.13/11 1} Qg6 {0.53/9 2} 13.
Bxd4 {-0.09/12 1} exd4 {0.57/11 2} 14. Nxe6 {0.07/13 1} dxc3 {0.20/11 3} 15.
Nxf8 {0.04/13 1} Rxf8 {0.41/10 1} 16. bxc3 {0.12/13 1} Ng4 {0.46/9 2} 17. Rf1 {
0.14/12 1} Bh4 {0.37/9 2} 18. g3 {0.03/12 1} Bf6 {1.10/10 4} 19. Qb1 {0.10/11 2
} Qh5 {3.19/8 1} 20. Qb3+ {-0.67/9 2} Kh8 {4.10/9 3} 21. h4 {-2.73/10 2} Bxh4 {
15.88/10 1} 22. Qf7 {-11.80/9 1} Rxf7 {#6/10 1} 23. f4 {-26.90/10 2} Bxg3 {#6/
9 1} 24. Rf2 {-299.92/8 1 White resigns} 0-1
Parent - - By Michael Scheidl Date 2012-06-30 07:46
Head-to-head gegen Texel liegt DiscoCheck doch noch knapp 100 Elo zurück, hatte also in den obigen 20 Partien quasi "Glück" (doch die Bedingungen waren ein bißchen anders):

2m+1s, Atom N455/1.66 GHz
64 MB hash, ponder off
S.Canbaz' Top-50 openings
DF13-GUI, Windows 7 32-bit


Disco vs. Texel, Blitz 2m+1s
                               
1   Texel 1.01 JA 32-bit   +96  +50/=27/-23 63.50%   63.5/100
2   DiscoCheck 3.6         -96  +23/=27/-50 36.50%   36.5/100


[Event "Disco vs. Texel, Blitz 2m+1s"]
[Site "NC-110"]
[Date "2012.06.29"]
[Round "21"]
[White "Texel 1.01 JA 32-bit"]
[Black "DiscoCheck 3.6"]
[Result "0-1"]
[ECO "B80"]
[Annotator "0.45;0.49"]
[PlyCount "82"]
[TimeControl "120+1"]

{Intel(R) Atom(TM) CPU N455   @ 1.66GHz 1662 MHz  W=11.1 plies; 198kN/s  B=19.
0 plies; 106kN/s} 1. e4 c5 2. Nf3 d6 3. d4 cxd4 4. Nxd4 Nf6 5. Nc3 a6 6. Be3 e6
7. f3 b5 {Both last book move} 8. Bd3 {0.45/13 5} Be7 {0.49/13 4 (b4)} 9. O-O {
0.38/13 4} e5 {0.55/13 4 (0-0)} 10. Nde2 {0.47/12 3} O-O {0.56/13 4} 11. a4 {
0.48/12 3 (Nd5)} b4 {0.40/15 4} 12. Nd5 {0.27/12 3} Nxd5 {0.39/15 4} 13. exd5 {
0.22/13 3} Nd7 {0.38/14 4} 14. Qe1 {0.22/12 3 (Qd2)} Qa5 {0.27/12 4} 15. c4 {
0.27/11 3 (c3)} f5 {0.15/11 4 (Nc5)} 16. g3 {0.18/12 3 (Bc2)} Nc5 {0.05/13 4}
17. Bc2 {0.18/12 3} Bd7 {0.04/12 4} 18. b3 {0.20/12 3 (Kg2)} Rae8 {0.09/12 3
(Bf6)} 19. Bd2 {0.15/11 4 (Rd1)} Qb6 {-0.01/12 3 (Rb8)} 20. a5 {0.56/12 3} Qa7
{0.08/14 3} 21. Kh1 {0.51/13 3 (Kg2)} e4 {-0.11/12 3 (Bf6)} 22. Ra2 {0.46/11 3
(Be3)} Bf6 {-0.30/11 3} 23. fxe4 {0.40/12 3 (Be3)} fxe4 {-0.79/12 3} 24. Nf4 {
0.04/12 4} Bg4 {-0.59/12 3 (Qb8)} 25. Bxb4 {0.17/11 3} Bf3+ {-0.41/12 3} 26.
Ng2 {0.28/12 3 (Rxf3)} Bd4 {-1.08/11 3 (Bg5)} 27. Qb1 {-0.39/12 9 (Qd2)} Qd7 {
-1.34/11 3 (Qf7)} 28. Bxc5 {-0.70/11 2} dxc5 {-1.29/12 3} 29. b4 {-1.49/12 4
(Qe1)} Qh3 {-3.24/12 3 (Qg4)} 30. Bd3 {-4.93/13 5 (Bb3)} exd3 {-4.74/12 3} 31.
Qxd3 {-8.71/13 2} Be4 {-7.70/13 3 (Bxg2+)} 32. Qd1 {-17.57/15 5} Rxf1+ {-10.75/
13 4} 33. Qxf1 {-9.19/2 0} Re5 {-14.91/14 4 (Bxg2+)} 34. d6 {-#6/11 8 (Rf2)}
Rh5 {-#15/8 3} 35. Qg1 {-#5/10 2} Bxg1 {-#13/8 3 (Qxg3)} 36. Kxg1 {-#6/9 2}
Qxh2+ {-#11/9 3} 37. Kf1 {-#5/8 2} Qh1+ {-#9/10 2} 38. Kf2 {-#4/8 2 (Ke2)}
Qxg2+ {-#7/20 2} 39. Ke3 {-#3/7 0} Qf3+ {-#5/86 5} 40. Kd2 {-#2/2 0} Rh2+ {-#3/
127 0} 41. Kc1 {-#1/3 0} Qh1# {0.01/127 0} 0-1

[Event "Disco vs. Texel, Blitz 2m+1s"]
[Site "NC-110"]
[Date "2012.06.30"]
[Round "72"]
[White "DiscoCheck 3.6"]
[Black "Texel 1.01 JA 32-bit"]
[Result "0-1"]
[ECO "D44"]
[Annotator "0.62;0.47"]
[PlyCount "84"]
[TimeControl "120+1"]

{Intel(R) Atom(TM) CPU N455   @ 1.66GHz 1662 MHz  W=16.1 plies; 105kN/s  B=11.
0 plies; 228kN/s} 1. d4 d5 2. c4 c6 3. Nf3 Nf6 4. Nc3 e6 5. Bg5 dxc4 6. e4 b5
7. e5 h6 8. Bh4 g5 9. Nxg5 hxg5 10. Bxg5 {Both last book move} Nbd7 {0.47/12 4}
11. Qf3 {0.62/12 4 (exf6)} Bb7 {0.59/11 3 (Bh6)} 12. exf6 {0.61/11 4} Qa5 {0.
53/11 3} 13. h4 {0.52/11 4 (h3)} O-O-O {0.13/11 3} 14. Qg3 {-0.07/11 4 (Qe3)}
c5 {-0.37/11 3} 15. Be3 {-0.57/11 4 (Rd1)} cxd4 {-0.58/11 3} 16. Bxd4 {-1.02/
13 4} Nc5 {-1.03/11 3 (e5)} 17. O-O-O {-0.82/11 4 (Bxc5)} b4 {-2.26/10 3} 18.
Bxc4 {-0.98/11 4} Rg8 {-1.67/10 3 (Bd6)} 19. Qe3 {-1.00/10 4} bxc3 {-1.41/10 3
(Bxg2)} 20. Bxc3 {-0.36/11 4} Rxd1+ {-1.03/11 4 (Qa4)} 21. Rxd1 {-0.26/13 4}
Qa4 {-1.26/11 3} 22. Rd4 {-0.23/13 3} Qc6 {-0.81/12 3} 23. Qd2 {-0.28/12 3} Nd7
{-0.78/11 4} 24. Bb3 {-0.46/12 3} Nb6 {-1.61/12 5 (Ba6)} 25. Bd1 {-0.83/10 3
(Rd8+)} Bc5 {-2.03/12 3 (Qc7)} 26. Bf3 {-1.95/12 3} Qc7 {-2.13/13 3} 27. Rg4 {
-2.19/13 3} Rxg4 {-2.06/13 3} 28. Bxg4 {-2.24/13 3} Bxg2 {-2.10/12 3} 29. f3 {
-2.14/13 3} Qh2 {-2.20/11 3} 30. Qg5 {-0.97/13 5} Qg1+ {-1.49/11 7} 31. Kc2 {
-0.91/13 3} Qf2+ {-2.25/11 2} 32. Kb3 {-0.82/13 5} Bf1 {-3.77/11 2 (Kb7)} 33.
Bd2 {-3.29/10 3 (Qd2)} Kb7 {-4.85/11 3} 34. f4 {-4.09/10 4 (Kc2)} Kc6 {-9.05/
11 3 (Bd3)} 35. f5 {-6.75/10 3} Nc4 {-10.16/12 2} 36. Bc3 {-7.02/10 4} Ne3 {
-17.01/12 2} 37. Qxe3 {-14.67/11 3} Qxe3 {-18.01/10 2} 38. a3 {-16.27/10 3
(fxe6)} Qe4 {-17.09/9 2} 39. Bd4 {-23.09/9 4 (h5)} Bxd4 {-#6/7 3 (Qxg4)} 40.
Ka2 {-#8/9 2 (fxe6)} Bc4+ {-#3/6 0 (Qxg4)} 41. Ka1 {-#4/127 0} Qe1+ {-#2/4 0}
42. Bd1 {-#2/1 0} Qxd1# {-#1/2 0} 0-1
Parent - - By Ingo Bauer Date 2012-06-30 08:16
Hallo Michael,

Du mußt aupassen ... ein paar von diesen Tests und schon hast du eine Rangliste "am Bein". Die will gepflegt werden!
Da muß man Spiele nachholen, falsche Engines jäten, Spiele kontrolieren und evtl nachholen, plötzlich muß man sich Gedanken über Eröffnungen machen, Anfragen bearbeiten, Auswertungen mit Bayes, Elo ordo sonstwas machen, damit klarkommen, dass der Umsonstservice heftig kritisiert wird, die Hardware zu lahm ist, nicht genug Kerne gespielt werden, die Zeitkontrolle zu lang UND zu kurz ist, die falschen Engines im Test sind, Settings eingespielt werden müssen, jeder Ritter getestet werden muß, die Onlinerepresentanz gepflegt werden will, die Onlinerepresentanz schlecht ist, dein Testsystem völlig falsch ist,  ... ach, du kommst dann nicht mehr aus der Verpflichtungen raus!



Sieh dich vor
Ingo
Parent - By Wolfgang Battig Date 2012-06-30 09:39
+1 
Parent - - By Michael Scheidl Date 2012-06-30 10:18
Ja, schrecklich... Dennoch träume ich immer wieder gerne von einem eigenen "Testlabor", wo ich verschiedene Testmethoden anwenden könnte usw. usf.

Eine Zeit lang habe ich ja den sog. "Blivorix" erstellt und damit einige wenige Engines recht gut (vor-)eingeschätzt, aber das ganze war konzeptionell nicht auf Dauer brauchbar.

http://computerschach.twoday.net/search?q=blivorix

Weiters finde ich Ideen interessant, die ermöglichen mehr als nur die Eng-Eng-Spielstärke zu bewerten, z.B. die "Ausstattung" (Funktionen wie EGTB-Nutzung, Multi-PV usw.) die ja ebenfalls Teil einer Enginequalität ist. Die Frage ist natürlich, wie man das konkret bewerten und mit sonstigen Testresultaten kombinieren könnte...

Eigentlich bräuchte ich nur noch im Lotto zu gewinnen, und dann kann ich das alles umsetzen.
Parent - By Thomas Müller Date 2012-06-30 10:28
ja die ideen sind vorhanden
So eine art "warentest" mit verschiedenen rubriken die dann mit 10 punkten als bestwert bewertet werden.
Und am schluss kommt dann ein schnitt raus von 8.7P z.B.
Das ganze je nach testrubrik noch gewichten. Eng-stärke mit 40% oder so.....
Thinker z.B. würde bei analyseoutput glatt 0 pkt bekommen und bei spielstäre vielleicht 7 ?!

Ja die Ideen .......wo ist der nächste lottoladen?

gruß thomas
Parent - - By Michael Scheidl Date 2012-07-04 21:16
Wer will, kann sich unter http://jimablett.net63.net/ die neueste Version 3.6.1 für diverse Plattformen herunterladen. Ich werde wohl mit einem neuerlichen Kurztest bis 3.8 oder 4.0 warten. - Ponder, Multi-PV usw. gehen immer noch nicht. Lieber wären mir Updates von Texel, MinkoChess oder Hannibal (u.a.), die sind doch etwas vielversprechender in punkto Spielstärke.

Ich hoffe immer, mich frühzeitig für eine künftige Topengine zu interessieren solange sie noch "unauffällig" ist, aber bisher sind selbige immer m.o.w. versandet (Delfi, Alaric, ColossusUCI...).
Parent - By Wolfgang Battig Date 2012-07-05 08:38
[quote="Michael Scheidl"]
..... Ich werde wohl mit einem neuerlichen Kurztest bis 3.8 oder 4.0 warten. .....[/quote]

Ein zusätzlicher Test der 3.6.1 ist nicht nötig, so die Aussage von Lucas Braesch im CCC auf eine entsprechende Anfrage von mir.
Er erwartet keine Spielstärkesteigerung zur 3.6
In meinem CEGT-Blitz Test fällt auch die Steigerung der 3.6 zur 3.5 sehr bescheiden aus, siehe http://cegt.siteboard.eu/f6t310-testing-discocheck-3-6.html.
+11 nach 1.200 Partien (ErrorBar ist +/- 18 bei dieser Partienzahl), Lucas hatte wohl +22 in seinen Tests.
Up Topic Hauptforen / CSS-Forum / DiscoCheck 3.6: Stärker!

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill