Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / CEGT - Ranglisten vom 12.10.2008
- - By Wolfgang Battig Date 2008-10-12 14:25
Hallo zusammen,

unsere aktuellen Ranglisten sind online und unter den bekannten Links abrufbar.

40 / 20:
Neue Partien: 1.738
Gesamtzahl: 279.674

Die "games of the week" findet Ihr wie üblich unter dem unten angegebenen Link.

NEU
Scorpio 2.02 Beta wurde bisher nur mit 1CPU getestet und liegt nach 360 Partien hinter älteren Versionen, eine Verbesserung ist also nicht in Sicht
Rotor 0.4: Jan Brouwer kann seine Engine weiter konstant verbessern, die neue Version legt nach 270 Partien sehr gute 58 ELO zur 0.3 zu!

UPDATES
Rybka 3 x64 4CPU hat noch mal knapp 200 games hinzubekommen. Der Abstand zwischen 2 und 4CPU liegt jetzt stabil bei knapp unter 40 ELO, da dürfte sich nicht mehr viel tun.
Matacz 1.4 hat nach weiteren 130 Partien (jetzt 530) einige ELO verloren und liegt nur noch 9 Pünktchen vor der 1.3, beide sind also als gleich stark einzuschätzen. Im Blitz (s.u.) sieht es etwas besser aus. 
Naum 3.1 x64 1CPU hat 272 Partien dazu bekommen (442) und liegt weiterhin hinter der 32bit-Version. Eine detaillierte Aufstellung der diversen x64-Singles incl. Vergleichen zur jeweiligen 32bit folgen, wenn die bisher getesteten Engines mindestens 300-400 Partien gespielt haben.
Genius 7: Einer (oder mehrere?) unserer Tester hat/haben diesem Oldie in den letzten Wochen einige neue Partien verpasst (jetzt 530). Die Nr. 1 vergangener Tage liegt in unserer Liste nur knapp über der 2400er-Marke, sic transit gloria mundi.....

Blitz:
Neue Partien: 7.084
Gesamtzahl: 371.495

"Games of the week" unter: http://cegt.foren-city.de/topic,67,-update-sunday-12th-of-october-is-online.html

Hier konnten wir eine sehr hohe Zahl neuer Partien hinzufügen, da wir derzeit die Blitzliste  nur alle 14 Tage updaten, was in "Normalzeiten" wo kein Spitzenprogramm wie zuletzt Rybka oder bald DeepFritz neu aufgelegt wird durchaus Sinn macht. Daher gibt es einiges zu berichten:

NEU

Diablo 0.5.1                   / 2474 - 300 / sehr stark verbessert, +106 zur 0.4!
GreKo 6.0                      / 2388 - 450 / nur leicht verbessert, +6 zur bisher besten 5.7.1
Matacz 1.4                     / 2492 - 720 /  im Gegensatz zu 40/20 deutlich verbessert, +45 zur 1.3
Colossus 2008b                 / 2684 - 1060 / nach der enttäuschenden 2008a nun wieder ein deutlicher Sprung von 60 ELO zu dieser und 48 ELO zur bisher besten 2007a.
Thinker 5.2M x64 2CPU passive  / 2838 - 1000 / +3 zur Version 5.2I, Lance kommt bei den MP-Versionen nicht von der Stelle. Aktuell teste ich die entsprechende 32bit-Single, Ergebnisse beim nächsten Update.


UPDATES

Cyrano 0.6b17                    / 2701 - 1200 / 400 neue Partien ergeben einen Verlust von 18 ELO
Delfi 5.4 2CPU                   / 2763 -  840 / 300 neue Partien, -4 ELO
Rybka 3 w32 2CPU                 / 3096 - 1200 / liegt nach 1200 Partien satte 119 ELO hinter der x64
Rybka 3 w32 1CPU "dynamic"       / 3004 - 1000 / +8, aber -33 zur default
Glaurung 2.1 x64 4CPU            / 2949 - 1200 / 500 neue Partien ergaben keine Veränderung
SOS 4 Arena                      / 2608 -  400 / auch Oldies kommen bei uns nicht zu kurz....


Laufende Tests (zurzeit Rotor 0.4, Philou 1.1.0, Rybka 3 x64 2CPU "human" und "dynamic" u.a.) könnt Ihr in unserem Forum unter http://cegt.foren-city.de/forum,4,-cegt-blitz-coordination.html verfolgen.

40 / 120:
Nach 3 ½ Monaten wurden beide Turnierlisten aktualisiert!

In beiden kam Rybka 3, einmal mit 2 und einmal mit 4 CPU hinzu. Logischerweise liegt die neue Version in beiden Listen vorn, bei den Quads sind es "nur" 64, mit 2CPU 92 ELO zur 2.3.2a. Allerdings sind insgesamt noch zu wenig Partien mit Rybka 3 gespielt, was sich aber bald ändern wird, da Heinz van Kempen sich jetzt wieder verstärkt den 40/120-Listen widmet.

Notiz am Rande: In beiden Listen haben mit 2 Ausnahmen alle Engines nun mindestens 1000 Partien (Single/Dual-Liste) bzw. 600 Partien (Quad-Liste) gespielt!

Wie immer ein herzliches Dankeschön an alle Tester!!

Links

Blitz:http://www.husvankempen.de/nunn/blitz.htm
40/20: http://www.husvankempen.de/nunn/rating.htm
40/120: http://www.husvankempen.de/nunn/rating120.htm
Forum: http://cegt.foren-city.de/
Tester: http://www.husvankempen.de/nunn/testers/testers.html
Games of the week (40/20): http://www.husvankempen.de/nunn/40_40%20Rating%20List/Coordination/gow.JPG

Wolfgang Battig
CEGT-Team
  
Parent - By Roland Rösler Date 2008-10-12 15:44
Meiner Meinung nach ist es interessant, sich die Elosteigerung von Rybka 3 x64 4 CPU gegenüber der Vorgängerversion (R2) über die verschiedenen Zeitkontrollen mal genauer anzuschauen, die da wären:

40/4      +154 Elo (R3 1600 Spiele / R2 2050 Spiele)
40/20     +120 Elo (R3 1455 Spiele / R2 2204 Spiele)
40/120    + 64 Elo (R3  316 Spiele / R2  600 Spiele)


Die Elosteigerungen nehmen mir zunehmender Bedenkzeit doch deutlich ab. Dass mit zunehmender Bedenkzeit die Elosteigerungen abnehmen, war zu erwarten; aber m. E. nicht in dem Masse. Möglicherweise liegt es ja daran, dass Larry (Kaufman) R3 auf kurze Bedenkzeiten hin optimiert hat (in seinen Über-Nacht Bulletpsrtien (80.000 Partien in 8 Stunden)).

Was ist Eure Meinung zu dem Thema?

PS: Das die Elosteigerungen überragend sind, braucht nicht weiter betont zu werden; das weis ich selber. Und schön ist auch, dass R3 jetzt schneller zur Sache kommt. Aber dennoch ...
Parent - - By Ingo Bauer Date 2008-10-12 20:35
Hallo Wolfgang, hallo CEGT

Wie ich auf eurer Webseite sehe habt ihr völlig unterschiedliche Hardware. Es geht von 1.8GHz P4 bis 3GHz C2 Architektur.

Mich würde die Methode interessieren mit der Ihr für Eure Liste die Zeiten anpasst. Nach meiner gronben schätzung spielt der 1.8P4 höchstens mit 40% der 3GHz C2 bei einem Thread, bekommt nun der 18 deutlich mehr Zeit oder werden die 3Ghz in ihrer Zeit beschnitten. Was ist das Basissystem auf dem z.B. 40/20 gespielt wird und nach welcher Methode passt ihr das auf schnelle und langsame Intel bzw AMD Architekturen an. Welcher Benchmark wird genommen zum testen ...

Sollte das irgendwo auf euren Seiten beschrieben sein würde mir ein Link schon reichen.

Vielen Fragen und schonmal Danke
Ingo
Parent - - By Wolfgang Battig Date 2008-10-12 22:18
[quote="Ingo Bauer"]
Hallo Wolfgang, hallo CEGT

Wie ich auf eurer Webseite sehe habt ihr völlig unterschiedliche Hardware. Es geht von 1.8GHz P4 bis 3GHz C2 Architektur.

Mich würde die Methode interessieren mit der Ihr für Eure Liste die Zeiten anpasst. Nach meiner gronben schätzung spielt der 1.8P4 höchstens mit 40% der 3GHz C2 bei einem Thread, bekommt nun der 18 deutlich mehr Zeit oder werden die 3Ghz in ihrer Zeit beschnitten. Was ist das Basissystem auf dem z.B. 40/20 gespielt wird und nach welcher Methode passt ihr das auf schnelle und langsame Intel bzw AMD Architekturen an. Welcher Benchmark wird genommen zum testen ...

Sollte das irgendwo auf euren Seiten beschrieben sein würde mir ein Link schon reichen.

Vielen Fragen und schonmal Danke
Ingo
[/quote]

Hallo Ingo,

die "conditions" findest Du hier: http://www.husvankempen.de/nunn/testers/conditions.htm

Jeder Tester misst die Leistungsfähigkeit seiner Maschine(n) mit einem Benchmark, der ermittelte Wert ergibt dann die zu wählende Bedenkzeit.

Allerdings gibt es Unterschiede zwischen den einzelnen Bedenkzeiten:

40/120 wird aktuell ohne Anpassung gespielt, d.h. egal auf welcher Maschine immer "40/120 repeated". Allerdings wird 40/120 nur auf mindestens A64-3500+ bzw. A64-x2-4200+ gespielt. Langsame(re) Maschinen wie z.B. mein alter P4 kämen dort nicht zum Einsatz.

40/20 wird mittels o.g. Benchmark angepasst, Basis ist hier der x2-4200+

40/4 (Blitz) ist ein Sonderfall. Die 40/4 haben als Basis noch den "alten" P4-2GHZ, man könnte auch 40/2 mit x2-4200+ als Basis nehmen. Das würde aber auf schnelleren Rechnern (der 4200+ ist ja nicht mehr uptodate) zu Bedenkzeiten von 40/1 oder so führen und das mögen die Blitztester (sind ja zurzeit "nur" Gerhard Sonnabend und ich, sowie zeitweise Anthony Massa) nicht so sehr. Als Untergrenze hatten wir (damals Gerhard, Christian (Koch) und ich) mal 40/2 festgelegt, im allgemeinen spielen wir mit 40/3 repeated. Auf den langsamen Maschinen (mein P4, Gerhard hat auch noch P4 im Einsatz) zumeist mit 40/5. Ich setze meinen P4-1,8 aber nur noch sehr selten ein, weil es auch mein Arbeitstier ist für die tägliche Arbeit.
Bei mir laufen die Blitztests fast alle auf x2-4600+ und single-3500+ sowie einem Centrino-Notebook mit 40/3, obwohl auf den beiden A64 auch 40/2 lt. Benchmark ok wäre. Ist mir persönlich aber zu kurz.
Parent - - By Ingo Bauer Date 2008-10-12 22:39
Hallo Wolfgang,

Danke für die schnelle Antwort!

[quote="Wolfgang Battig"]

Jeder Tester misst die Leistungsfähigkeit seiner Maschine(n) mit einem Benchmark, der ermittelte Wert ergibt dann die zu wählende Bedenkzeit.
[/quote]

Welcher Benchmark ist das denn, wie messt ihr?

[quote="Wolfgang Battig"]

40/120 wird aktuell ohne Anpassung gespielt, d.h. egal auf welcher Maschine immer "40/120 repeated". Allerdings wird 40/120 nur auf mindestens A64-3500+ bzw. A64-x2-4200+ gespielt. Langsame(re) Maschinen wie z.B. mein alter P4 kämen dort nicht zum Einsatz.

[/quote]

3500+ hat ECHTE 2.2Ghz wenn ich mich nicht täusche. Dann ist er noch RUND 15-20% langsamer asl ein C2-Kern. Rein rechnerisch ist das also völlig über den Daumen ein 1.8 C2 sowie ein 3.0 C2 die dieselbe Zeitkontrolle spielen. Hmm ...

[quote="Wolfgang Battig"]

40/20 wird mittels o.g. Benchmark angepasst, Basis ist hier der x2-4200+

[/quote]

Das ist mir die wichtigste - deswegen meine Frage nach dem Benchmark!

[quote="Wolfgang Battig"]

40/4 (Blitz) ist ein Sonderfall. Die 40/4 haben als Basis noch den "alten" P4-2GHZ, man könnte auch 40/2 mit x2-4200+ als Basis nehmen. Das würde aber auf schnelleren Rechnern (der 4200+ ist ja nicht mehr uptodate) zu Bedenkzeiten von 40/1 oder so führen und das mögen die Blitztester (sind ja zurzeit "nur" Gerhard Sonnabend und ich, sowie zeitweise Anthony Massa) nicht so sehr. Als Untergrenze hatten wir (damals Gerhard, Christian (Koch) und ich) mal 40/2 festgelegt, im allgemeinen spielen wir mit 40/3 repeated. Auf den langsamen Maschinen (mein P4, Gerhard hat auch noch P4 im Einsatz) zumeist mit 40/5. Ich setze meinen P4-1,8 aber nur noch sehr selten ein, weil es auch mein Arbeitstier ist für die tägliche Arbeit.
Bei mir laufen die Blitztests fast alle auf x2-4600+ und single-3500+ sowie einem Centrino-Notebook mit 40/3, obwohl auf den beiden A64 auch 40/2 lt. Benchmark ok wäre. Ist mir persönlich aber zu kurz.
[/quote]

Klingt kompliziert, aber ganz kurz von mir: 40/2 (im schlimmsten Fall) und dann auch noch Ponder off finde ich uninteressant, insofern ist mir das egal.

Habe hier noch einen etwas langsameren Rechner und überlege ob ich da was drehe, aber im Ganzen traue ich der Sache nicht so Recht! Im Moment sammle ich Erfahrungen und teste auch ein bischen selber, mal sehen - bin aber skeptisch.

Gruß
Ingo
Parent - By Gerhard Sonnabend Date 2008-10-13 09:56
Hallo Ingo !

Welcher Benchmark ist das denn, wie messt ihr?
Das ist mir die wichtigste - deswegen meine Frage nach dem Benchmark!

Unter dem Link, welchen Wolfgang gepostet hatte, steht u.a.:

...
Benching:
to adapt the different hardware of testers in CEGT to a standard (currently
40/20 and 40/4 on P4 2Ghz reference machine from Uschi) we perform a benchmark
with a Bryan Hofmann Crafty compile.
...

Klingt kompliziert, aber ganz kurz von mir: 40/2 (im schlimmsten Fall)
und dann auch noch Ponder off finde ich uninteressant, insofern ist mir
das egal.


Blitz ist ohnehin eine eigene Disziplin und kann keinesfalls mit den Listen,
welche längere Bedenkzeiten verwenden, verglichen werden. Viele glauben ja
immer noch, dass man aufgrund Blitzresultaten auf längere Bedenkzeiten ableiten
kann und lassen sich durch nichts, nicht mal durch Fakten, davon abbringen.
Deshalb lohnt ein Blick i.d. CEGT-Blitz-Ratingliste immer dann, wenn man wissen
will ob und wie eine Engine i.d. Disziplin Blitz dasteht resp. sich plaziert.

Viele Grüsse,
G.S.
Parent - - By Wolfgang Battig Date 2008-10-13 20:12
[quote="Ingo Bauer"]
Hallo Wolfgang,

Danke für die schnelle Antwort![/quote]

gern geschehen. Komme in der Woche immer erst abends zum antworten, da ich am Arbeitsplatz keinen Zugriff auf dieses Forum habe.

[quote="Ingo Bauer"]
Welcher Benchmark ist das denn, wie messt ihr?[/quote]

siehe Antwort von GS

[quote="Ingo Bauer"]
....

3500+ hat ECHTE 2.2Ghz wenn ich mich nicht täusche. Dann ist er noch RUND 15-20% langsamer asl ein C2-Kern. Rein rechnerisch ist das also völlig über den Daumen ein 1.8 C2 sowie ein 3.0 C2 die dieselbe Zeitkontrolle spielen. Hmm ...[/quote]

auch der 3500+ ist eher theoretischer Natur, hätte ich vielleicht klarer sagen sollen. Standard bei 40/120 sind der Core2Quad6600 mit 2,4 GHZ (Heinz hat glaube ich 4 Stück davon) sowie je ein x2-4600+ mit ebenfalls 2,4 GHZ von Heinz und (ab und zu) von mir. "Ab und zu" weil von den ca. 22.000 Partien in der Liste nur ca. 350 von mir sind...

....

[quote="Ingo Bauer"]Klingt kompliziert, aber ganz kurz von mir: 40/2 (im schlimmsten Fall) und dann auch noch Ponder off finde ich uninteressant, insofern ist mir das egal.[/quote]

ich auch, daher nutze ich 40/2 auch nicht. Unter 40/3 läuft bei mir nix. 40/2 haben wir mal als Untgergrenze festgelegt, weil die Rechner ja auch immer schneller werden und irgendwann mit weniger als 40/1 gespielt werden könnte und 40/0,5 möchte nun wirklich niemand sehen.

40/3 repeated ist schon ganz ok, bei einer durchschnittlichen Partie sind es ca. 6-8 Minuten/game aber ohne "Superblitz-Phase" am Ende

[quote="Ingo Bauer"]Habe hier noch einen etwas langsameren Rechner und überlege ob ich da was drehe, aber im Ganzen traue ich der Sache nicht so Recht! Im Moment sammle ich Erfahrungen und teste auch ein bischen selber, mal sehen - bin aber skeptisch.[/quote]

viel Spaß!
Parent - By Gerhard Sonnabend Date 2008-10-13 20:26
[quote="Wolfgang Battig"]
[...snip...]
ich auch, daher nutze ich 40/2 auch nicht. Unter 40/3 läuft bei mir nix. 40/2 haben wir mal als
Untgergrenze festgelegt, weil die Rechner ja auch immer schneller werden und irgendwann mit weniger
als 40/1 gespielt werden könnte und 40/0,5 möchte nun wirklich niemand sehen.
[/quote]

Bei mir ebenso.
Selbst auf dem Baby-Quad und dem AMD 3700+ (beide @ 2.4GHz)
ist 40/3+... die absolute Untergrenze.

Viele Grüsse,
G.S.
Up Topic Hauptforen / CSS-Forum / CEGT - Ranglisten vom 12.10.2008

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill