CEGT - Update vom 12.12.2010

By Wolfgang Battig Date 2010-12-14 15:02

Hallo zusammen,

unsere aktuellen Ranglisten sind online und unter den bekannten Links abrufbar.

40 /120:
Aktuelle Ergebnisse zu unseren Tests findet Ihr wie immer in unserem Forum.

Bis zu einem ersten "richtigen" Update auf unserer Homepage findet ihr in diesem Posting eine (halbwegs) aktuelle Rangliste, die jeweils nach Aufnahme einer neuen Engine (mind. 250 Partien) aktualisiert wird.

Aktueller Test:
Loop 2007 x64

Die nächsten Kandidaten werden Critter 0.90 x64 und Deep Junior 12 x64 sein.

Insgesamt liegen mittlerweile >2.000 Partien vor, sodass es evtl. zum Jahresende eine erste Liste incl. Download der Partien geben wird!

40 / 20:
Neue Partien: 1.757
Gesamtzahl: 466.767
Games of the week: Link s. unten

NEUE Engines

Critter 0.90 x64 6CPU: hatte keinen guten Start, allerdings sind erst 150 Partien gespielt. Aufgrund der bisherigen Tests kann man wohl davon ausgehen, dass 6CPU im Vergleich zu 4CPU nicht wirklich viel bringt. Ohne Critter 0.90 (zu wenig Partien) ergaben sich bislang Steigerungen von minimal 9 ELO (Critter 0.80) bis maximal 34 ELO (Zappa Mexico II), durchschnittlich waren es bei bisher 7 Engines +21 ELO.

Francesca MAD 0.15: guter Start mit +78 zur Vorversion nach (erst) 200 Partien.

UPDATES
Größere Verschiebungen hat es nur in 2 Fällen gegeben:

Critter 0.90 x64 2CPU: ist erwartungsgemäß gefallen (-16) aber immer noch etwas überbewertet. Hier sind weitere Partien nötig.
Ansonsten pendelt sich die neue Version bei einen Plus von 60-70 ELO zur Version 0.80 ein.

Crafty 23.4 x64 1CPU: +19 ELO

Blitz:

Nächstes Update morgen! Auf jeden Fall das letzte vor Weihnachten, evtl. auch für 2010.

Wie immer ein herzliches Dankeschön an alle Tester!!

Links

Blitzliste

40 / 20 - Liste

40 / 120 - Listen

Forum

Aktuelle Blitztests

Aktuelle 40/20-Tests

Tester

Games of the week (40/20)

Wolfgang Battig
CEGT-Team

By Wolfgang Battig Date 2010-12-16 17:31

Und hier noch die Daten des letzten Updates 2010 unserer Blitzliste:

Blitz:
Neue Partien: 11.250 (!!), liegt daran, dass rechtzeitig ein großes Turnier mit 6.600 Partien beendet war.
Gesamtzahl: 737.154

NEUE Engines

Critter 090 x64 4CPU: 3191 - 400 (+100, aber zur 0.70 x64 4CPU, weil wir die 0.80 mit dieser Konstellation nicht im Angebot haben)
Spark 1.0 x64 1CPU: 2975 - 1200 (+26 zur 0.5)
Delphil 2.6b 1CPU: 2438 - 1000 (-21 zur 2.6a, mal wieder keine Verbesserung, die Engine tritt seit langem auf der Stelle, vorsichtig ausgedrückt...)
FrancescaMAD 0.15: 2574 - 450 (+85 zur 0.13, Gratulation!)

Und weitere 5 Neuzugänge aus einem großen Turnier mit "32bit-Single"-Engines:
Critter 0.80 w32 1CPU: 3002 - 1100 Partien (-33 zur x64)
Gull 1.1 w32: 2929 - 1100 (-59 zur x64)
Hannibal 1.0 w32: 2820 - 1100 (-58 zur x64)
Spark 0.5 w32 1CPU: 2899 - 1100 (-50 zur x64)
Stockfish 1.9 w32 1CPU: 3085 - 1100 (-51 zur x64, +27 zur 1.8 w32 1CPU)

Wichtige Updates
Critter 0.80 w32 2CPU: 3064 - 1700 (+6)
Plisk 0.2.7d w32 1CPU: 2321 - 900 (-11)

Und aus dem o.a. Turnier:
Deep Shredder 12 w32 1CPU: 2972 - 4406 (+4)
Deep Sjeng ct 2010 w32 1CPU: 2964 - 3100 (+5)
Fruit 090705 w32 1CPU: 2849 - 2100 (-4)
Hiarcs 13.1: 2945 - 5800 (-2)
Komodo 1.2 w32 1CPU: 2922 - 2100 (+8)
Naum 4.2 w32 1CPU: 3006 - 3700 (-3)
Rybka 4.0 w32 1CPU: 3113 - 2700 (0)

Gruß
Wolfgang
CEGT-Team

By Rudolf Rohs Date 2010-12-17 11:55

Hallo Wolfgang,

ändert das Ergebnis von Houdini 1.5 in der Ipon eigentlich etwas an eurer Einstellung die Engine zu testen?

Man kann ja jetzt ähnlich wie früher bei der Toga eine deutliche Eigenentwicklung/Leistungssteigerung
feststellen.

Gruß

Rudolf

By Wolfgang Battig Date 2010-12-17 13:53

[quote="Rudolf Rohs"]
Hallo Wolfgang,

ändert das Ergebnis von Houdini 1.5 in der Ipon eigentlich etwas an eurer Einstellung die Engine zu testen?

Man kann ja jetzt ähnlich wie früher bei der Toga eine deutliche Eigenentwicklung/Leistungssteigerung
feststellen.

Gruß

Rudolf
[/quote]

Hallo Rudolf,

eine Umfrage unter den CEGT-Testern aus Februar 2010 ergab bei 6 Stimmen (so viele sind wir ja nicht) ein 4:2 dagegen. Derzeit gäbe es aus meiner
Sicht wohl eine Mehrheit andersrum zumindest aber ein Patt (3 Befürworter kenne ich sicher!). Ich bin aber kein Freund davon, bei jeder passenden und unpassenden Gelegenheit neue Abstimmungen anzusetzen, bis einem - wem auch immer - das Ergebnis passt! Das geht im Großen (Politik) nicht und sollte auch im Kleinen (unbedeutendes Computerschach) nicht gehen.

ABER - und da gebe ich Dir völlig recht - es ist jetzt offenbar eine neue Situation da, denn kaum jemand, mich eingeschlossen, hat wohl damit
gerechnet, dass es jemand schafft, Rybka 4 so relativ deutlich zu distanzieren. Zumindest keiner von denen, die (angeblich) bei Rybka "abgeschrieben" haben.

Dementsprechend werde ich mir mal ein eigenes Bild machen, siehe http://cegt.foren-city.de/topic,435,-testing-houdini-1-xx-x64-1cpu-inofficial.html, danach
sehen wir weiter.

Ich könnte mir einen "offiziellen" Test unter strikten Bedingungen durchaus vorstellen. Was die Bedingungen angeht bin ich ganz auf Ingos Linie, d.h. bekannter Autor, größere Abstände zwischen den Versionen usw.

Gruß
Wolfgang

By Werner Schüle Date 2010-12-17 14:51

Hallo zusammen,
falls das jetzt einigermaßen hinhaut, dann hätten wir wieder Gleichstand:
http://rybkaforum.net/cgi-bin/rybkaforum/topic_show.pl?tid=18686
(ich bin aber nach wie vor skeptisch, ob das bei unseren Bedenkzeiten hinhaut!)
Z.B. die Version 61 scheint einen großen Vorsprung vor der default Einstellung zu haben.

Gruß
Werner

By Ernest Bonnem Date 2010-12-18 01:19

[quote="Werner Schüle"]Z.B. die Version 61 scheint einen großen Vorsprung vor der default Einstellung zu haben.[/quote]
Frage Ingo was er davon schätzt...

By Ingo Bauer Date 2010-12-18 07:18

Hallo Werner

[quote="Werner Schüle"]
Hallo zusammen,
falls das jetzt einigermaßen hinhaut, dann hätten wir wieder Gleichstand:
http://rybkaforum.net/cgi-bin/rybkaforum/topic_show.pl?tid=18686
(ich bin aber nach wie vor skeptisch, ob das bei unseren Bedenkzeiten hinhaut!)
Z.B. die Version 61 scheint einen großen Vorsprung vor der default Einstellung zu haben.

Gruß
Werner
[/quote]

Wie Ernest schon schrieb: Frag mich mal

Im Ernst, ich habe deren Topversion (61v2) mit 600 Spielen angestestet gehabt und die war bei meinen Bedingungen 20 Elo HINTER R4. Alles weitere darüber erübrit sich für mich!

Gruß
Ingo

By Frank Quisinsky Date 2010-12-18 11:35

Hallo Ingo,

daran kannst Du auch erkennen wie unterschiedlich Ergebnisse ausfallen können.
Bei mir 20 ELO + nach ca. 900 Partien und Du hattest glaube ich nach 600 Partien abgebrochen bei 20 ELO -

Also 40 ELO Unterschied und das bei der Anzahl an Partien ... kann eigentlich nicht sein.
Da muss der Zufall schon enorm groß sein.

Glaube Du hattest auch die 61v2 getestet.
Diese lag in einem 600 Partien Kurztest bei mir ca. 5 ELO vor Rybka 4 Standard Einstellung.

Viele Grüße
Frank

By Ingo Bauer Date 2010-12-18 07:47 Edited 2010-12-18 07:53

Hallo Wolfgang,

Grundsätzlich gebe ich dir Recht was die Abstimmungen betrifft!

Es ist allerdings fraglich, ob man den selben Zeitrahmen wie in der Politik im Commputerschach anwenden kann. Willst du nur alle 4-5 Jahre abstimmen? Andersherum, wenn man die Regel zu strikt anwendet, hätten wir in der Politik immer noch das Steuerrecht von 1949 ... (OK, wäre vielleicht nicht soo schlecht

)

Andererseits habt ihr das Problem, das ihr im Augenblick in eure Liste diejenigen aufnehmt, die NICHT zugeben auf etwas anderem aufzubauen (wieviel sei mal dahingestellt) ... auch kein schöner Zustand.

Ansonsten testet ihr (inoffiziell) im Blitz, schade. Nicht das euer 40/3 prinzipiell schlecht wäre (im Gegenteil, ich glaube das reicht völig aus!), aber über die Jahre habt ihr eure Bedinungen dort am meisten verwässert. Wenn man sich ein wenig Einliest gewinnt man von der Liste den Eindruck jeder spielt was er will und ihr werft es in einen Topf. Ich hätte mir einen Test in der 40/20 gewünscht, wie ihr ihn auch mit H1.03a gemacht habt.

Gruß
Ingo

PS: Ich bin auch ein wenig erstaunt über die 60 Elo bei mir. Houdart selber kam nur auf 35 ELo ... aber ich habe gerade nochmal 200 Spiele nachgespielt und wieder kam H1.5 in dieser Gegend raus

By Wolfgang Battig Date 2010-12-18 11:16

Hallo Ingo,

[quote="Ingo Bauer"]
Hallo Wolfgang,

Grundsätzlich gebe ich dir Recht was die Abstimmungen betrifft!

Es ist allerdings fraglich, ob man den selben Zeitrahmen wie in der Politik im Commputerschach anwenden kann. Willst du nur alle 4-5 Jahre abstimmen? Andersherum, wenn man die Regel zu strikt anwendet, hätten wir in der Politik immer noch das Steuerrecht von 1949 ... (OK, wäre vielleicht nicht soo schlecht

)

ich meinte das eher prinzipiell darauf bezogen, dass man nicht so oft/lange abstimmen kann, bis es einem passt. Natürlich hast Du recht, dass wir nicht
den Bundestagswahlzyklus anwenden können! Ich denke wir werden das kurzfristig nochmal diskutieren.

Zitat:

Ansonsten testet ihr (inoffiziell) im Blitz, schade. ...

...Ich hätte mir einen Test in der 40/20 gewünscht, wie ihr ihn auch mit H1.03a gemacht habt.

es gibt bei uns was die Tester angeht kaum Überschneidungen zwischen Blitz (GS und ich) und 40/20 (Werner, Jörn, Johan, Mircea, Michael), das war Dir vielleicht nicht bewusst.
Eigentlich ist keiner von uns in beiden Sektionen unterwegs, Ausnahme bin ich - aber nur ab und zu - wenn ich mich ein wenig bei 40/20 beteilige. Ich habe ja auch noch die 40/120er.

Den 40/20-Test mit Houdini 1.03a hat seinerzeit Jörn Gronemann gemacht, vielleicht übernimmt er es bei Gelegenheit ja auch für Houdini 1.5. Jörn testet allerdings mit 4CPU. Solange der "Fall" nicht geklärt ist, bleibt aber auch das "inoffiziell". Fraglich ist aber, ob Jörn sich das "inoffiziell" nochmal antut, solange nicht klar ist, ob seine Ergebnisse überhaupt in der Liste auftauchen. Für die 1.03a hatte er 500 Partien mit 4CPU und 400 mit 6CPU spielen lassen. Das blockiert den/die Rechner schon recht lange.

2000 Partien mit 40/3 und noch dazu mit "nur" 1CPU sind da wesentlich schneller durch

Gruß
Wolfgang

By Frank Quisinsky Date 2010-12-18 11:41

Hallo Wolfgang,

wobei z. B. der volle Name diverser IvanHoe Leute die kompilieren bekannt ist.
Wird bei den Diskussionen auch gerne übersehen, auch daran kannst Du erkennen das der Glauben da immer noch im Vordergrund steht.

Da ich selbst bevorzugt mit der CEGT vergleiche, auch wenn ich bei 1-CPU sowohl w32 als auch x64 wesentlich mehr Partien produziere als die CEGT 40/20 (bei den Engines die seit dem Start der SWCR erschienen sind) wäre es für mich auch interessanter wenn z. B. ein Houdini oder IvanHoe in der CEGT auftaucht. So würden ein paar Vergleichswerte mehr im Raum stehen.

Viele Grüße und ein Dank an die unermüdliche Arbeit der CEGT Tester

Gruß
Frank