Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / CEGT - Update vom 04.10.2009
- - By Wolfgang Battig Date 2009-10-05 14:38
Hallo zusammen,

unsere aktuellen Listen sind wie üblich unter den angehängten Links verfügbar.

40 /120:
Die aktuellen Tests könnt Ihr wie immer in unserem Forum verfolgen.

Aktuell sind Naum 4  und Stockfish 1.4 im Test, in Kürze werden Fritz 12 und Deep Shredder 12 folgen.

40 / 20:
Neue Partien: 1.299
Gesamt: 352.951

NEUE Engines
- Fritz 12: Hier ist bisher keine wesentliche Veränderung zu sehen. Die neue Version liegt 17 Punkte vor Fritz 11 aber leicht hinter Deep Fritz 11 1CPU (-4).
- Tornado 3.21a x64 1CPU: Nach bisher 260 Partien ebenfalls nur eine minimale Steigerung von 12 Punkten zur Version 2.2
- NanoSzachy 3.7: bisher nur 79 Partien gespielt, daher noch kein Kommentar.

UPDATES
Twisted Logic 20090922 x64 hat 3 Punkte verloren und liegt nun bei 2805, +37 zur 20090105

Blitz:
Neue Partien: 3.246
Gesamt: 529.768

Mit Ausnahme einiger "Aufräumarbeiten" (Critter 0.40, Petir 4.72, DanaSah 4.24, Scorpio 2.1 w32 1CPU) handelt es sich hier um ein reines Fritz 12-Update mit 2000 Partien.

Die Abstände betragen:
+ 16 zu Deep Fritz 11 1CPU
+ 20 zu Fritz 11.1
+ 29 zu Fritz 11

also etwas mehr als bei 40/20.

Aktuell ist hier nun Deep Shredder 12 im Test, daher kommt das nächste Update bereits am kommenden Wochenende.

Wie immer ein herzliches "Danke" an alle Tester!!

Links

40/20

Games of the week 40/20

Blitz

40/120
Parent - - By Ingo Bauer Date 2009-10-05 15:21
Hallo Wolfgang,

Wie ihr ja auf eurer Webseite schreibt, passt ihr je nach Hardware die Benkzeiten an.

Was ich leider nicht finde, ist welche Hardware ihr tatsächlich mit welcher Zeitkontrolle bespielt?

Ich zum Beispiel bin noch am ehesten an eurer 40/20 Liste interessiert. Nun würde mich intersressieren welche Spiele, mit welcher Hardware und welcher Zeitkontrolle gespielt wurden/werden.

Wenn ich das richtig gelesen habe, korrigiert mich wenn ich da was falsch verstanden habe, ist euer Referenzsystem ein 2.4Ghz P4. Wenn ich jetzt einfach mal über den Daumen schätze ist ein Kern P4 so rund 66% Core2. Da eure Liste an Testern wohl nicht komplett ist kann ich mir jetzt keine ungefähre Zeit vorstellen die ihr tatsächlich spielt. Auch steht bei den meisten Testern E6600 aber Quad - ich nehme mal an ihr meint Q6600. Sind die übertaktet oder laufen die mit originalen 2.4. Wenn sie original laufen, gehe ich mal so von ~40/14 aus. Ist das so korrekt? Da eure Testerliste auch nicht ganz vollständig ist, wie ich in eurem Forum ersehen kann, fehlen mir leider Angaben  welche HW die fehlenden Tester benutzen. Sollte schon jemand mit einem i7 dabei sein, wäre mien Schätzung natürlich völlig hinfällig.

(Wobei andere vielleicht eher an der Blitzrangliste oder an der langen Bedenkzeit interessiert sind)

Der zweite Punkt ist - welche Matche wuren denn mit Buch und welche mit Eröffnungsstellungen gespielt. Ist für mich eigentlich eine wichtige Info die mir leider fehlt (oder ich habe sie übersehen)

Würde mich freuen wenn ihr eure Dokumentation und/oder mich auf den aktuellen Stand bringen könntet.

Gruß und im Moment sehr gespannt
Ingo
Parent - By Gerhard Sonnabend Date 2009-10-05 16:45
Hi Ingo !

Ich kann Dir ein paar Antworten geben, allerdings lediglich in Bezug
auf die Blitz-Rating-Liste.

Heutzutage, in Zeiten der Quads und/oder schnellen Dual-PCs, lassen
wir alle mit 40/3+... laufen, obwohl vom Benchmark her auch 40/2+...
regelkonform wäre.

Ob mit (Kurz)Büchern oder Vorgabestellungen gespielt wird entscheidet
ausschliesslich der Tester. Ebenso welches GUI zum Einsatz kommt.

Wolfgang z.B. verwendet sowohl Bücher als auch Stellungen, Christian +
ich ausschliesslich Vorgabestellungen.

Meiner Meinung nach macht das bei der Masse der Games ohnehin nichts
aus. Buch-/Positionslernen wird verhindert.

Ich stelle immer wieder fest, dass die Tests von Werner, Wolfgang,
Christian und mir in Bezug auf die Resultate letztendlich sehr eng
beieinander liegen. Ausreisser nach oben oder unten bei 100er-Serien
gibt es immer mal, aber dies passiert selbst auf einem PC und den
immer selben Bedingungen (wie Du selbst schon erfahren hast).

Als letztes und aktuelles Beispiel siehe die Fritz 12 Tests. Selbst
1000 weitere Spiele haben das Rating gerade mal einen einzigen Punkt
verändert !

Viele Grüsse,
G.S.
Parent - By Roland Rösler Date 2009-10-05 16:46
Schönes Thema, Ingo!
Bin gerade mal im Kopf durchgegangen, wo die "höherwertigen" Partien gespielt werden; bei CEGT 40/20 (geeicht auf PIV 2,4 GHz, ponder=off) oder bei Dir 6'+3" (C2D 3 GHz, ponder=on). Mit deiner Maschine würdest Du bei CEGT mit 40/10 oder 40/11 spielen (besser 630"). Bei einer "normalen" 60 Züge CEGT Partie hat jede Engine also 16 Minuten Zeit. Bei Dir hat jede Engine 9 Minuten, rechnet aber auch 9 Minuten, wenn der Gegner am Zug ist.
Mein Fazit: Ganz leichte Vorteile für CEGT!
Parent - By Jörn Gronemann Date 2009-10-05 17:18
Hallo Ingo

Ich spiele meistens 40/20 und dem kleinen HS7 Buch. Der Rechner ist ein Q6600 und nicht hochgetaktet. Immer 512MB für Hash. sowie 4 Threads.
Parent - By Werner Schüle Date 2009-10-05 18:30
Hallo Ingo,
ich habs ein wenig aktueller: Basis ist der AMD 4200+ und benutzt wird der Crafty bench, den diese CPU mit 55 Sekunden absolviert.
Zum Umrechnen gibts dann eine Excel Tabelle. Bei 40/20 gilt dann
- mit meinem AMD 64X2 wird mit 40/15 gespielt (bench in etwa 42 Sekunden)
- mit dem Core2Duo mit 40/11 und
- mit dem  Core2Quad mit 40/10 (27 Sek)

Gruß
Werner

die Tabelle bekomme ich nicht richtig hin. Beispiel für den AMD 4200+

40/20  40/120  54  56  AMD 4200+  (55)
Hier liegt der Crafty bench zwischen 54 und 56 Sekunden (gemessen 55)

Code:
40/40  40/120  time [s]     
40 moves in X  40 moves in X  Crafty - Bench     
45  270  123  124   
44  264  120  122   
43  258  117  119   
42  252  115  116   
41  246  112  114   
40  240  109  111   
39  234  106  108   
38  228  104  105   
37  222  101  103   
36  216  98  100   
35  210  95  97   
34  204  93  94   
33  198  90  92   
32  192  87  89   
31  186  84  86   
30  180  82  83   
29  174  79  81   
28  168  76  78   
27  162  73  75   
26  156  71  72   
25  150  68  70   
24  144  65  67   
23  138  62  64   
22  132  60  61   
21  126  57  59   
20  120  54  56  AMD 4200+  (55)
19  114  51  53   
18  108  49  50  AMD 4600+  (50)
17  102  46  48   
16  96  43  45   
15  90  40  42   
14  84  38  39   
13  78  35  37  C2D E6700  (35)
12  72  32  34   
11  66  29  31  C2D @ 3,2  (29)
10  60  27  28   
9  54  24  26   
8  48  21  23   
7  42  18  20   
6  36  16  17   
5  30  13  15   
4  24  10  12   
3  18  7  9   
2  12  5  6   
1  6  2  4   
Parent - By Wolfgang Battig Date 2009-10-06 17:01
[quote="Ingo Bauer"]
Hallo Wolfgang,


Hallo Ingo,

Zitat:
Wie ihr ja auf eurer Webseite schreibt, passt ihr je nach Hardware die Benkzeiten an.


Blitz: keine Anpassung, wir spielen alle hardwareunabhängig mit 40/3. Lediglich auf meinem alten P4-2GHZ lasse ich 40/4 laufen, aber der kommt eh praktisch nie mehr zum Einsatz
40/20: Anpassung wie von Werner beschrieben
40/120: keine Anpassung, allerdings ist hier ein A64-3500+ (2,2 GHZ) die Untergrenze. Langsamere Hardware wird nicht verwendet

Zitat:
Was ich leider nicht finde, ist welche Hardware ihr tatsächlich mit welcher Zeitkontrolle bespielt?


dafür gibt es auch keine Statistik. Die Bedenkzeit für die 40/20-Liste liegt zwischen 40/10 und 40/20 (je nach Bench). 40/10 bzw. 40/11 kommt auf den schnellen Quads zum Tragen. Einer unserer Tester hat einen Core-Duo E5200 von 2,5 auf 3,6 (oder 3,7?) GHZ hochgejubelt, wie da der Bench aussieht weiß ich allerdings nicht.

Zitat:
Ich zum Beispiel bin noch am ehesten an eurer 40/20 Liste interessiert. Nun würde mich intersressieren welche Spiele, mit welcher Hardware und welcher Zeitkontrolle gespielt wurden/werden.


Statistik wie gesagt leider nicht vorhanden

Zitat:
Wenn ich das richtig gelesen habe, korrigiert mich wenn ich da was falsch verstanden habe, ist euer Referenzsystem ein 2.4Ghz P4.


anfangs war es ein P4 mit 2,0 GHZ (allerdings noch zu 40/40-Zeiten), mittlerweile wie von Werner beschrieben der A64-4200+

Zitat:
Wenn ich jetzt einfach mal über den Daumen schätze ist ein Kern P4 so rund 66% Core2. Da eure Liste an Testern wohl nicht komplett ist kann ich mir jetzt keine ungefähre Zeit vorstellen die ihr tatsächlich spielt. Auch steht bei den meisten Testern E6600 aber Quad - ich nehme mal an ihr meint Q6600. Sind die übertaktet oder laufen die mit originalen 2.4.


ja, es sind m.W. die Q6600 mit 2,4 GHZ und m.W. nach nicht übertaktet. Ich habe einen Q8200 (4 x 2,333 GHZ), auch nicht übertaktet.

Zitat:
Wenn sie original laufen, gehe ich mal so von ~40/14 aus. Ist das so korrekt?


ich habs bei meinem Quad noch nicht gemessen, weil ich fast nur Blitz und 40/120 mache (da wird ja nicht adaptiert). Sollte aber ungefähr hinkommen, evtl. etwas weniger (40/12 oder 40/13).

Zitat:
Da eure Testerliste auch nicht ganz vollständig ist, wie ich in eurem Forum ersehen kann, fehlen mir leider Angaben  welche HW die fehlenden Tester benutzen.


ja, die Tester-Seite könnte mal wieder eine Überarbeitung vertragen, sowohl was die Personen als auch deren Hardware betrifft.
Von den aufgeführten sind derzeit nur Johan, Jörn, Michael, Werner und ich aktiv. Es fehlen Gerhard und Christian (Koch). Bei Gerhard weiß ich von einem Q6600 und einem Laptop mit A64-3700+. Was er sonst noch einsetzt weiß ich nicht. Christian hat einige Zeit pausiert, hatte seinerzeit glaube ich einen A64-X2-4600+ oder so. Kann sich natürlich auch geändert haben.

Zitat:
Sollte schon jemand mit einem i7 dabei sein, wäre mien Schätzung natürlich völlig hinfällig.


ist mir nicht bekannt

....

Zitat:
Der zweite Punkt ist - welche Matche wuren denn mit Buch und welche mit Eröffnungsstellungen gespielt. Ist für mich eigentlich eine wichtige Info die mir leider fehlt (oder ich habe sie übersehen)


dazu gibt es ebenfalls keine Statistik, da jeder Tester frei in seiner Wahl ist. Es dürfen nur keine "eigenen" Bücher verwendet werden. Ansonsten spielen wir mit Büchern von Sedat Canbaz, Harry Schnapp, Salvo Spitalieri usw. Und natürlich mit Vorgabestellungen jeglicher Couleur (Nunn, Noomen, Schnapp, Canbaz usw.).

Ich spiele hauptsächlich mit:

- HS2.0-Book.bkt von Harry Schnapp (Shredder Classic)
- Perfect2009.ctg von Sedat Canbaz (CB-GUI)
- PGN-Random Datenbanken (Limit 10 - 12 Züge) unter Arena 2.01
- Vorgabestellungen (GUI-unabhängig)

"GUI-technisch" ist es bei mir ca. 70% Arena, 25% Shredder Classic, 5% CB (da meistens die 10er, weil am stabilsten)

Gruß
Wolfgang
Parent - - By Ingo Bauer Date 2009-10-06 21:52
Hallo alle,

Danke für die Antworten.

Ich will gar nicht verhelen das ich Zeitanpassung und verschiedene Hardware suboptimal finde, ich aber einsehe das es bei vielen Testern wohl kaum anders geht.

Trotzdem vielen Dank für eure Mühe, ich habe jetzt einen besseren Eindruck was bei euch läuft.

Gruß
Ingo
Parent - - By Gerhard Sonnabend Date 2009-10-07 07:24
[quote="Ingo Bauer"]
Hallo alle,
Danke für die Antworten.
Ich will gar nicht verhelen das ich Zeitanpassung und verschiedene Hardware suboptimal finde, ich aber einsehe das es bei vielen Testern wohl kaum anders geht.
Trotzdem vielen Dank für eure Mühe, ich habe jetzt einen besseren Eindruck was bei euch läuft.
[/quote]

Hi Ingo !

Ich denke die Resultate zeigen auf, dass die CEGT-Testbedingungen
und die Durchführung zu absolut realistischen Scores der einzelnen
Programme führen. Vergleicht man mit anderen Listen, welche zumindest
eine vergleichbar grosse Basis bieten, so wird man kaum Unterschiede
finden können.

Viele Grüsse,
G.S.
Parent - By Benno Hartwig Date 2009-10-07 09:09
[quote="Gerhard Sonnabend"]Ich denke die Resultate zeigen auf, dass die CEGT-Testbedingungen
und die Durchführung zu absolut realistischen Scores der einzelnen
Programme führen.[/quote]Volle Zustimmung!
Und:
Mögen die Berichte anderer Interessierter über kleine Turnierchen (100 Spiele oder oft auch deutlich weniger!) schon irgendwie interessant sein, und können sie auch Indizien zu Stärken und Schwächen liefern, so sind sie aus statistischer Sicht zur Spielstärke kaum aussagefähig.
Großen Dank an die Tester mit der großen Geduld und den sehr vielen Partien!
(Ich stelle mir gerade die 'Diskussion' der Fans über die Spielstärken vor, wenn es CEGT, CCRL und SSDF nicht gäbe.
"Aber ich habe hier doch gerade 20 Spiele gemacht, und da wurde nun wirklich eindeutig bewiesen...")

Benno
Parent - - By Gerhard Sonnabend Date 2009-10-07 07:20
Hier die Daten von Christian:

AMD Athlon x2 Dual Core 4200+ 2.20 GHz

Games mit 50 Vorgabestellungen (= 100 Spiele pro Match)

40 Züge in 3 Minuten

Ponder=off

64 MB HTs

4-Steiner TBs resp. SBs

Viele Grüsse,
G.S.
Parent - - By Ingo Bauer Date 2009-10-07 08:09
Moin Gerhard

[quote="Gerhard Sonnabend"]
...

40 Züge in 3 Minuten

Ponder=off

64 MB HTs
...
[/quote]

Wird von allen und bei jeder Zeitkontrolle 64MB Hash benutzt? Ich hatte das jetzt so in Erinnerung das, mache mehr benutzen!(?)

Gruß
Ingo
Parent - By Wolfgang Battig Date 2009-10-07 08:39
[quote="Ingo Bauer"]
Moin Gerhard

Wird von allen und bei jeder Zeitkontrolle 64MB Hash benutzt? Ich hatte das jetzt so in Erinnerung das, mache mehr benutzen!(?)

Gruß
Ingo
[/quote]

Blitz: 64 MB (Gerhard gibt glaube ich 128MB, zumindest bei seinen Quad-Tests für die "QBRL")
40/20: 256MB bei mir, wie es die anderen halten, weiß ich nicht. Denke aber mal, dass sie auf keinen Fall weniger geben
40/120: 512 MB bei mir, ich weiß aber, dass Heinz bei seinen 4CPU-Tests mit 1GB Hash hat spielen lassen (seine Quads haben je 4GB Speicher)
Up Topic Hauptforen / CSS-Forum / CEGT - Update vom 04.10.2009

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill