Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Eindrücke von Shredder 12 (+Settings)
- - By Ulrich Harm Date 2009-12-25 20:58
Hallo in die Runde der Computerschach - Freunde,

In den vergangenen Wochen und nun noch über Weihnachten habe ich
einige kurze Engineturniere mit Shredder 12 UCI auf meinen beiden (alten)
Single-CPU Rechnern (32 bit / Windows XP) laufen lassen ( Athlon 3600+
mit 1 GB RAM und der andere Rechner mit Intel 2.66 MHz / 512 MB RAM).
In allen Fällen wurde der Zeitmodus 10 Min. + 10 Sek. pro Zug verwendet
und das kurze Eröffungsbuch 5moves.CTG (Michael Scheidl mit Setting "normal"),
um ein möglichst abwechslungsreiches Eröffnungsspektrum zu erhalten und
dabei zugleich den Einfluss von Eröffnungsbüchern zu minimieren.
Bei Shredder 12 UCI (und auch Shredder 11) wurde im Enginesetting wieder
die Einstellung '"Pos. learning = off" verwendet (=> hatte sich bei Engineturnieren
mit Shredder bei mir immer wieder bewährt). Es wurden grundsätzlich keine Nalimov-
Endspieldatenbanken benutzt;  bei Shredder 12 UCI wurden die 3-4 Steiner Shredderbases
verwendet.

Vom Spielstil her würde ich Shredder 12 (Standard-Settings) als aktiven Positions-
spieler bezeichnen mit einem recht soliden Spiel in allen Bereichen aber auch ohne
herausragende Eigenschaften im Vergleich zu anderen Spitzenengines (wenn man mal
von seiner besonderen Stärke in einigen Endspielen wie z.B. Turmendspielen absieht).

Hier also nun zu den Ergebnissen mit Shredder 12 UCI (Pos. learn. = off ):
bei Verwendung der Fritz 11 GUI :

Shredder 12 UCI   ----------   vs. Fritz 11    ..........   +21/ -11 / =19  ( 60% )
       "                -----------  vs. Rybka 3    ..........   +25/ -27/ =20   ( 48 % ) 
       "                 ----------  vs.  Stockfish 1.5.1  ...  +40/ -9/ =27    (70 %)  
       "                ----------- vs.  Rybka 2.2n2    .....   +23 / -5 / =16   (70 %)  
       "              ------------- vs.  Shredder 11   .....   +22 / -2 / =27   (70 % )   
       "              ------------- vs. Toga II 1.4.1 SE ...   +26 / -8/ = 9    (71 % )
===============================================================  

Zum Ergebnis gegen Rybka 3 ist anzumerken, dass Rybka 3 durch die Fritz 11 GUI bekannter-
massen etwas benachteiligt wird (Rybka 3 läuft hier aus mir nicht verständlichen technischen
Gründen ein wenig langsamer als andere Engines). Aus diesem Grunde habe ich später nochmals
ein Match  Shredder 12 vs. Rybka 3  unter Verwendung der guten alten Fritz 8 - GUI ausgeführt,
bei der Rybka 3 nicht wesentlich verlangsamt wird ( Ergebnis siehe unten).

Beim Spiel von Shredder 12 war mir nun aufgefallen, dass er beim Spiel gegen taktisch starke
Gegner (besonders natürlich Rybka 3) desöfteren Probleme mit der Königssicherheit hat (haupt-
sächlich natürlich im Mittelspiel) und dadurch so manchen "Einsteller" produziert hat. Andererseits
hat Shredder 12 mit den Standard-Settings nur selten gegen starke Gegner Partien durch starke
Angriffsführungen gegen den gegnerischen König gewonnen.
So kam ich auf die Idee, bei den Shredder 12 - Settings einfach mal die Einstellung "King Safety = 110"
zu verwenden (anstelle des Standards "King Safety = 100").
Und siehe da, schon nach einigen wenigen Partien gegen Rybka 3 zeichnete es sich ab, dass Shredder 12 mit
diesem Setting im Mittelspiel deutlich sicherer und zugleich druckvoller spielte ( Mittelspiel ) !
Rybka 3 gelang es nun nur noch selten, Shredder 12 durch Angriffe auf seine Königstellung in Verlegenheit
zu bringen bzw. zu überspielen und auf der anderen Seite spielte Shredder 12 im Mittelspiel nun deutlich 
druckvoller und stärker ! So gelang es Shredder 12 nun auch deutlich öfter, den bisherigen "Überflieger" Rybka 3
nun bereits im Mittelspiel stark unter Druck zu setzen und manchmal auch schon durch sehenswertes Angriffs-
schach auseinanderzunehmen ! So was war bisher aufgrund der dramatischen Dominanz von Rybka 3 (besonders
auch im Mittelspiel) völlig undenkbar und ich habe  hier nicht schlecht gestaunt !
Hier also nun die ersten Ergebnisse mit entsprechenden Engine - Turnieren unter Verwendung unter Verwendung des
Shredder 12 Settings "King Safety = 110" bei sonst gleichen Bedingungen wie zuvor (vgl. oben / Fritz 11 - GUI ) :

Shredder 12 (Pos. learn. = off / King Safety = 110) : 

Shredder 12 (KS=110)------   vs. Fritz 11    ...........   +25/ -5 / =22  ( 69% )
       "                 ----------  vs. Rybka 3    ..........   +19/ -15/ =26   ( 53 % ) !!
       "                 ----------  vs.  Stockfish 1.5.1  ....  +18/ -7/ =28    (60 %)  
       "                ----------- vs.  Rybka 2.2n2    .....   +27 / -9 / =13   (68 %)  
       "              ------------- vs.  Shredder 11   ......   +26 / -3 / =17   (75 % )   
       "              ------------- vs. Toga II 1.4.1 SE ...   +28 / -8/ = 16    (69 % )
=============================================================== 

Im Anschluss noch die Ergebnisse des Matches von S 12 gegen Rybka 3 bei sonst gleichen
Bedingungen unter Verwendung der Fritz 8 - GUI [=> bei der Rybka 3 seine volle Geschwindigkeit /
Performance (nahezu) erreicht]   : 

Shredder 12 (Standard / Pos. learn. = off)   -----   ...   Rybka 3 ....  +4 / -14/ =22 ..  ( 38 % )   

Shredder 12 wie vor mit King Safety = 110 : 

Shredder 12 (KS=110)    --------   ... Rybka 3    .... +13 / -19/ =21   ...   ( 44 % )  ... !!!   
========================================================================= 

Auch hier also nun unter realistischen Bedingungen (volle Performance von Rybka 3) holt Shredder 12
mit diesem Setting (King Safety = 110) also immerhin einen hervorragenden Score von 44 % !!
Insgesamt scheint mir nach diesen Erfahrungen also Shredder 12 mit dem Setting King Safety = 110
nicht mehr sehr weit vom bisherigen Überflieger Rybka 3 entfernt zu sein ! Das Ergebnis gegen Stockfish
1.5.1 und gegen Toga ist zwar mit diesem Setting geringfügig schwächer, aber das hervorragende
Ergebnis gegen Rybka 3 (44 % !) und gegen Fritz 11 (69 % !) sind sehr überzeugend, ebenso auch
das nun sehr sichere und druckvolle Mittelspiel !
Möglicherweise wäre es optimal, das Setting :  "King Saftety" bei S12 im Mittelspiel auf Werte um 110
und im  Endspiel auf Werte im Bereich 100 bis 105  einzustellen, was aber so leider nicht möglich ist.

Mit so optimierten Settings und einer besseren Geschwindigkeitssteigerung bei 64 bit Betriebssystemen
(=> Shredder 12 spielt nach diversen Ranglisten mit 64 bit kaum stärker als bei 32 bit, nutzt also diese Möglichkeit
der Geschwindigkeitssteigerung kaum aus im Gegensatz zu Rybka, Stockfish etc. ) hätte Shredder 12 den
bisherigen König Rybka 3  beinahe eingeholt und das mit einem überzeugenden druckvollen Spielstil !! 

Die Zeiten der totalen Dominanz von Rybka 3 scheinen also vorbei auch ohne die wegen ihrer
Herkunft umstrittene Robbolito - Engine zu nutzen !

    

Mal sehen, wie sich die nun brandneu erschienene Stockfish 1.6 - Engine schlägt ! Der Vorgänger
Stockfish 1.5.1  hatte mir mit seinem druckvollen Mittelspiel und überzeugenden Endspiel
sofort sehr gut gefallen und hatte ja auch schon eine beeindruckende Performance gezeigt ( eindeutig stärkste
freeware - Engine, wenn auch noch nicht auf dem Level von Rybka 3 oder Shredder 12 ). 

Soweit mal ein Bericht von meiner Seite zu einigen Tests mit Shredder 12 UCI. 

Beste Gruesse und frohe Weihnachten,

     Ulrich
______________

========================================

Parent - - By Ingo Bauer Date 2009-12-26 19:16
Hallo ulli

[quote="Ulrich Harm"]
...
So kam ich auf die Idee, bei den Shredder 12 - Settings einfach mal die Einstellung "King Safety = 110"
zu verwenden (anstelle des Standards "King Safety = 100").
...
[/quote]

Gegen Rybka spiele ich sogar mit KS 135, und da spielt Shredder sehr gut. Wenn du ihm dann noch die eigene Dame, Türme und Freibauern etwas höher bewertet, damit er die nicht so leicht abtauscht und etwas vorsichtiger ist, kommn ganz schön Partien gegen Rybka zu stande. Allerdings spielst du auch gegen den 32bit Rybka, gegen den 64 bitter sieht das noch anders aus.

Der Nachteil: Ein solches Setting ist über alles, also gegen ein großes Set an Gegnern, schwächer als das Original. Schade, aber so ist es

Gruß und Danke für deinen Test (ich lese davon gernee mehr)
Ingo
Parent - - By Kurt Utzinger Date 2009-12-26 21:12
[quote="Ingo Bauer"]
[...]
Der Nachteil: Ein solches Setting ist über alles, also gegen ein großes Set an Gegnern, schwächer als das Original. Schade, aber so ist es
[...]
Ingo
[/quote]

Das ist typisch beim Versuch mit geänderten Settings: viel besser gegen bestimmte
Gegner, aber gesamthaft schwächer, wenn eine grosse Menge von Partien gegen
eine grosse Anzahl von Engines gespielt/verglichen wird.
Mfg
Kurt
Parent - - By Christian Koch Date 2009-12-26 22:04
Hallo Kurt,

kannst Du das auch für Die Shredder-Settings in Deinen umfangreichen Tests bestätigen? Oder sind es nur nacheplapperte alte Parolen?
Parent - By Kurt Utzinger Date 2009-12-27 09:59
[quote="Christian Koch"]
Hallo Kurt,

kannst Du das auch für Die Shredder-Settings in Deinen umfangreichen Tests bestätigen? Oder sind es nur nacheplapperte alte Parolen?
[/quote]

Hallo Christian
Als Nicht-mehr-Schachprogramm-Tester käme es mir nur ganz ausnahmsweise in den Sinn,
mit irgendwelchen Settings irgend eine Engine zu testen. Und Engine-/Engine-Matches gibt es
bei mir eigentlich keine mehr. Meine Aussage basiert auf den jahrelangen Erfahrungen mit dem
Testen von TheKing-Settings und der geringen (bis gar keinen) Aussagekraft, wenn solche Tests
nicht auf einer grossen Anzahl von Partien gegen die breite Palette anderer Programmen basieren.
Das hat nichts zu tun mit dem "Nachplappern" alter Parolen.
Mfg
Kurt
Parent - - By Ulrich Harm Date 2010-01-03 23:56
Hallo Ingo,

nach einer Woche Weihnachtsurlaub, wo ich nicht zum Internet / Schreiben kam,
noch eine kurze (derzeitige) Antwort von meiner Seite :

Es mag sein, dass Du recht hast, und das Setting von Shredder 12 mit
Kingsafety = 110 erzielt gegen eine breite Palette anderer Programme keinen
klaren Vorteil im Vergleich zum Standardsetting.
Bei meinen beschriebenen kleinen Testserien hat S 12 mit KS=110 auch nur
gegen Rybka 3 und gegen Fritz 11 klar besser abgeschnitten als mit dem
Standardsetting (KS=100). Gegen Shredder 11 war der Vorteil nur noch gering,
gegen Toga und Rybka 2.2n2 gab es keinen signifikanten Unterschied und gegen
Stockfish 1.5.1  war das Standardsetting sogar etwas besser als KS=110.
Statistisch gesehen ergibt sich damit sicher noch kein eindeutig überzeugender
Vorteil des neuen Settings (KS=110), zumal die Anzahl der gespielten Partien
auch nicht gross genug für eine sichere Aussage ist.
Dennoch hatte ich beim Betrachten einiger Partien gegen Rybka 3 und andere
Gegner den Eindruck, dass Shredder 12 mit KS=110 im Mittelspiel merklich
stärker, sicherer und druckvoller spielt als mit dem Standardsetting; so entschied
S 12 hier einige sehenswerte Angriffspartien bereits im Mittelspiel gegen Rybka 3 ,
was sonst äusserst selten ist (Rybka 3 war bislang gerade im Mittelspiel der absolute
Überflieger ... ) ! Daher glaube ich hier nicht einfach nur ein einen Zufall.
Aber es kann sein, dass das neue Setting (KS=110) im Endspiel wieder etwas schwächer ist,
sodass es am Ende zu keinem klar erkennbaren Gesamtvorteil kommt (=> leider kann man
bei Shredder 12 das Setting von King Safety nicht getrennt für Mittelspiel und Endspiel
einstellen ).
Das alles könnten nur weitere ausgedehnte Testserien zeigen.
Ich will auf jeden Fall noch einige weitere kleine Testserien mit S 12 und KS=110
gegen verschiedene weitere Gegner (u.a. Stockfish 1.6 ) durchführen und die Ergebnisse
dann auch wieder hier im Forum mitteilen inkl. einiger weiterer Eindrücke vom Spielstiel und
den Stärken / Schwächen bzgl. Shredder 12 / KS=110 .

Soviel erstmal hierzu von meiner Seite.

Alles Gute für das neue Jahr 2010 und beste Gruesse,

    Ulrich
_____________
Parent - - By Ingo Bauer Date 2010-01-04 08:51
Hallo Ulrich,

Solltest du ein Setting finden, das "über alles" besser ist als das Standardsetting, bin ich der erste der sich darüber freut!
Allerdings habe ich selber mindestens 7500+ Partien mit verschiedenen Setting (ein gut Teil mit KS Einstellungen) gespielt und nichts gefunden. Ein paar Settings waren ungefähr gleichwertig, wobei ein komplett anderer Spiestil rauskam, aber besser war leider nichts.
Gegen Rybka im speziellen, habe ich eines das rund 5% mehr rausholt. Gegen den 32bit R3 sieht das dann schon SEHR gut aus, aber wie gesagt, gegen ein Set der 10 besten Engines ist das alles "Suboptimal".

Vielleicht ist aber doch mehr drin, in Abständen setze ich mich auch immer wieder hin und versuche mich ... da muß doch was gehen!

Gruß
Ingo
Parent - - By Ulrich Harm Date 2010-01-13 21:12
Hallo Ingo,

habe letzte Woche noch unter gleichen Bedingungen (siehe oben)
zwei entsprechende Turniere (10 Min. + 10 Sek. / Zug ;
32bit / 1 CPU)
mit Shredder 12 (+ KS110 - Setting) durchgeführt gegen
Doch 1.3 und gegen den brandneuen und superstarken
Stockfish 1.6.2.

Ergebnis mit Shredder 12 (Standardsetting mit Pos. learn. = Off) :

Shredder 12  -----  Doch 1.3       .......  +22/ -10/ =11  (64 %)
Shredder 12  -----  Stockfish 1.6.2   ....  +13/ -24/ =22  (41 %) 
==========================================================  

Die analogen Turniere mit Shredder 12 (King Safety = 110)   :  

Shredder12_KS110    --------   Doch 1.3          ....    +18/ -4/ =20   (67%)
Shredder12_KS110    --------  Stockfish 1.6.2   ....    +15/ -19/ =25  (47%)  

=========================================================== 

Die Verbesserungen mit dem Setting :;  "King Safety = 110"  sind zwar auch hier
nicht riesig, aber zusammen mit den früheren Ergebnissen (hier wurde auch gegen
Rybka 3 und gegen Fritz 11 ein deutlich besseres Ergebnis ( mit KS= 110) erreicht,
gehe ich schon davon aus, dass Shredder 12 auch "über alles" mit dem Setting
KS=110 eine leichte Verbesserung erreichen sollte.
Nach meinen persönlichen Eindrücken vom Spiel gegen Rybka 3 und gegen Stockfish
1.6.2 spielt Shredder 12 mit KS=110 besonders im Mittelspiel deutlich sicherer und
stärker.
Besonders fällt (vermutlich aus diesem Grunde des besseren Mittelspiels !)
mit dem Setting KS=110 auf, dass S12 hier gegen die stärksten Gegner
(Rybka 3 und Stockfish 1.6.2 , welche beide stärker sind), merklich 
besser spielt.

Zum neuen Superstar "Stockfish 1.6.2" möchte ich in einem neuen Posting
mit entsprechenden Turnierergebnissen noch mehr schreiben.

Gruss Ulrich
_________________
Parent - - By Ingo Bauer Date 2010-01-13 21:47
Moin,

Ich kann jetzt nicht nachsehen, mein Rechner ist vor 3h verstorben, aber wenn ich am WE den neuen am laufen habe schau ich nochmal meine Ergebnisse an (Platte lebt ). Wie gesagt, mit KS Settings mehr als 7500 Spiele. Ich schätze mal KS120 habe ich so 1000. Ich sehe noch mal drüber und berichte hier.
Ich hoffe du hast Recht, ich fürchte nur das reicht nicht ...

Gruß
Ingo
Parent - - By Kurt Utzinger Date 2010-01-13 21:53
[quote="Ingo Bauer"]
Moin,

Ich kann jetzt nicht nachsehen, mein Rechner ist vor 3h verstorben, aber wenn ich am WE den neuen am laufen habe schau ich nochmal meine Ergebnisse an (Platte lebt ). Wie gesagt, mit KS Settings mehr als 7500 Spiele. Ich schätze mal KS120 habe ich so 1000. Ich sehe noch mal drüber und berichte hier.
Ich hoffe du hast Recht, ich fürchte nur das reicht nicht ...

Gruß
Ingo
[/quote]

Kann man denn Deine Tests mit denjenigen von Ulrich vergleichen?
Letzterer verwendet eine wohl doch deutliche höhere Bedenkzeit.
Mfg
Kurt
Parent - - By Ingo Bauer Date 2010-01-13 22:59
[quote="Kurt Utzinger"]
...
Kann man denn Deine Tests mit denjenigen von Ulrich vergleichen?
Letzterer verwendet eine wohl doch deutliche höhere Bedenkzeit.

[/quote]

Auf die Frage kann ich dir keine 100% sichere Antwort geben.

Ulrichs Bedenkzeit ist bestimmt zw. 2 und 3 mal so lang wie bei mir, dafür Ponder off und Hardware mir unbekannt. Trotzdem glaube ich, dass selbst bei identischen Bedinungen  die Zeitkontrolle für eine statistisch, aussagekräftige Rangliste nicht so wichtig ist.
Sehr kurze Bedenkzeiten sind sicherlich kritisch, schlicht weil bei jeder Partie die Zugerzeugung immer eine gewisse Zeit braucht. Zwar wird das mit modernen CPUs auch schneller, aber das Verhältniss zw. Zugerzeugung und Bewertung wird ungünstiger bei kurzen Bedenkzeiten.
Das sind heute, auf modernen CPUs aber schon sehr kurze Bedenkzeiten. Ich habe ein bischen mit 1+1 experimentiert und nicht so viel Unterschied zu meiner Liste gesehen. Hatte aber das Gefühl das die Engines ein bischen dichter zusammenrücken.
Sehr lange Zeitkontrollen wiederrum produzieren vielleicht eine höhere Remisquote (Da ist die Datenbasis aber dünn). Eine höhere Remisquote zieht die Engines auch wieder zusammen in ihrem Rating.

Also:
Zu kurz sollte ein Test mit Engines nicht sein, aus dem Bauch halte ich die Minute/Spiel im Moment eigentlich für die Untergrenze. Bei so kurzen Bedenkzeiten muß man dann aber für eine ordentliche Trennung mehr Partien spielen. Ab wo sich das lohnt und wo man das beste Ergebniss in möglichst kurzer Zeit bekommt dürfen wir in den nächstne Jahren austesten.
Im Mittelfeld der Zeitkontrollen spielt das für eine Enginerangliste meiner Meinung nach keine Rolle.
Besonders lange Zeitkontrollen wiederrum kommen nie zu einer ordentlichen Abweichung, da man schlicht nicht genug Partien spielen kann.

Um es klar zu sagen: Eine Rangliste hat NICHTS mit qualitativ hochwertigen Partien zu tun und kann trotzdem hervoragende Ergebnisse liefern!. Ich habe von einem Programmier gehört der TAUSENDE von Partien über Nacht mit extrem kurzen Bedenkzeiten spielt und eine hervoragende Engineentwicklung hin bekommt ... offensichtlich langt sogar das zum Enginetesten ... und müßte demnach auch für eine Rangliste reichen und ich liege mit meiner "Nicht kürzer als eine Minute"-These noch viel zu hoch.

Je mehr Spiele ich spiele, und je mehr ich mich in Ranglisten reinarbeite, desto weniger glaube ich, dass man auf modernen Computern riesige Bedenkzeiten braucht um eine Engine zu bewerten. Ich glaube für eine ordentliche Rangliste sind andere Faktoren als die Zeitkontrolle bestimmend. Die Anzahl an Engines ist sehr kritisch. Wenn ich böswillig eine Engine in meiner Liste hochpuschen will, müßte ich nur sorgfälltig die Gegner auswählen ... das selbe Problem habe ich mit den Eröffnungsstellungen. Wenn ich gut auswähle bekomme ich jede Engine locker 50 ELo rauf oder runter. Deswegen ist es wichtig die selben Bedinungen VOR einem Test festzulegen und dabei zu bleiben. In meiner Liste steht immer vorher fest gegen wen gespielt wird, da suche ich mir nicht aus ob ich jetzt an Spielen gegen die neue "Überfliegerengine" interessiert bin, oder spiele 1/3 aller Spiele einer neuen Enigne gegen verschiedenen Geschmacksrichtungen des selben Gegners ... Alle so etwas ist schlimmer als eine doppelt oder dreifache Zeitkontrolle.

Gruß
Ingo

PS: langer Text, aber deine Frage passte so gut
Parent - By Kurt Utzinger Date 2010-01-14 08:35
Hallo Ingo
Danke für die ausführliche Antwort.
Gruss
Kurt
Parent - - By Ulrich Harm Date 2010-01-13 22:12
Hallo Ingo,

ich hatte auch mal ein paar Spiele (unter gleichen Bedingungen) mit
King Safty = 120 durchgeführt.
Aber hier zeigten mir bereits einige wenige Partien gegen Rybka 3 und andere
starke Gegner, dass dieses Setting in vielen Situationen bereits "überzogen" und
damit nicht mehr optimal ist. Shredder 12 legte übertriebenen Wert auf seine Königs-
sicherheit im Mittelspiel (=> auch wo dies gar nicht mehr wirklich sinnvoll / nötig war)
und auch im Endspiel wirkt sich dies dann oft negativ aus, da der König hier oft (nach
Abtausch der Damen und der meisten Figuren) mobilisiert werden sollte (oft sogar optimal
in Richtung Brettmitte zur Unterstützung seiner Bauern etc. ), was dann bei KS = 120
aufgrund des dann übertriebenen '"Sicherheitsstrebens" zu wenig kommt mit ent-
sprechend schlechterem Spiel.
Mit KS=110 sind diese Nachteile im Endspiel aber kaum noch spürbar (=> optimal wäre hier
im Endspiel wahrscheinlich KS im Bereich 100 bis 105) und das Mittelspiel ist hier deutlich stärker in
Angriff und Verteidigung (+Prävention), womit auch insgesamt noch eine leichte
Spielstärkesteigerung resultiert (=> würde ich auf jeden Fall nach meinen bisherigen
Erfahrungen so einschätzen).

Beste Gruesse,

Ulrich
_________________
Parent - - By Ingo Bauer Date 2010-01-18 20:49
Moin Ulrich,

Ich habe ein paar Spiele, aber da habe ich auch noch an anderen Setting gedreht.

Ich werde jetzt, um das Thema abzuschließen, einen empirischen Beweis mit King Safety 110 führen!


Shredder

KS110

DS 12 x64  KS110 - Rybka 3 1T (2905)0.0-0.0
DS 12 x64  KS110 - Stockfish 1.6.2 x64 (2827)0.0-0.0
DS 12 x64  KS110 - Naum 4 (2769)0.0-0.0
DS 12 x64  KS110 - Doch64 1.2 JA x64 (2711)0.0-0.0
DS 12 x64  KS110 - Zappa Mexico II x64 1T (2705)0.0-0.0
DS 12 x64  KS110 - Onno-1-1-1 x64 (2676)0.0-0.0
DS 12 x64  KS110 - Spark-0.3 VC x64 (2663)0.0-0.0
DS 12 x64  KS110 - DSjeng WC2008 x64 1T (2663)0.0-0.0
DS 12 x64  KS110 - Toga II 1.4 beta5c BB (2657)0.0-0.0
DS 12 x64  KS110 - H12.1 MP 1T (2656)0.0-0.0
0.0-0.0



0 out of 1000 games played

www.shredderchess.com



Am Schluß muß mehr als 2800 rauskommen und ich hoffe du hast Recht!

Gruß
Ingo
Parent - - By Bertil Eklund Date 2010-01-18 22:15
I can add a result from my games.
After more than 7400 games. Deep Shredder12 Gambit are 1 elo above DS12 x64. Games are 6min or longer. All on 4 quads and one dual. Most games against Rybka, Naum and Robbo.

Bertil
Parent - By Ingo Bauer Date 2010-01-18 22:35
Hello Bertil,

[quote="Bertil Eklund"]
I can add a result from my games.
After more than 7400 games. Deep Shredder12 Gambit are 1 elo above DS12 x64. Games are 6min or longer. All on 4 quads and one dual. Most games against Rybka, Naum and Robbo.

Bertil
[/quote]

I am impressed. I know that the Gambit Shredder has a VERY attractiv playing style for humans to watch, but I always considered it overall a bit weaker than the original Shredder.

Interesting!

Bye
Ingo
Parent - By Michael Scheidl Date 2010-01-19 00:46
Does the SSDF already have a policy regarding Robbo & Co? The english Wikipedia has recently removed the Ippolit article for being a "non-noteable project", which seems absurd. Being listed by the SSDF as a trusted source could have influence on this matter. By that I don't refer to the discussions about the legal or moral status, but that it is of course noteable beyond doubt nevertheless.
Parent - - By Ulrich Harm Date 2010-01-19 10:04
Hallo Ingo,

wenn Du die Ergebnisse mit (Deep) Shredder12 (King Safety = 110)
hast (z.B. auch gegen Engines wie Naum 4, Hiarcs etc, die ich nicht besitze),
würde ich mich freuen, wenn Du diese Ergebnisse hier mal postest.
Wie gesagt, gigantische Elo - Steigerungen erwarte ich zwar nicht, aber
eine leichte Verbesserung schon und das bei einem stärkeren und
attraktiveren / druckvolleren Mittelspiel (nach meinen Einschätzungen beim
Zuschauen einiger Partien gegen Rybka 3 etc. ).

Ob das noch ausreichen wird, damit S12 in der näheren Zukunft noch in der
Weltspitze mit Rybka 3/4 , Stockfish, Robbo und künftigen neuen Shooting Stars
(=> Hiarcs 13 ?) etc. wird mitspielen können, ist natürlich dann immer noch unklar.

Neben weiteren kleineren Opimierungen der Engine und evtl. der Settings (=> was
sich nun noch zeigen müsste) wird es hier für Shredder 12 in jedem Fall nötig werden,
auch den Vorteil von 64 bit - Betriebssystemen besser zu nutzen (Deep Shredder 12 64 bit
spielt derzeit praktisch gleich stark als die entsprechende Version mit 32 bit, während ver-
schiedene Konkurrenzprogramme wie Rybka, Stockfish, Doch, Robbo etc. deutlich von
64 bit - Systemen profitieren, meist im Bereich von 30 - 50 Elopunkten).
Da bei heutigen neuen Rechnern immer mehr 64-bit Betriebssysteme zum Einsatz kommen
werden ( Windows 7 / 64 bit etc.), was früher eher noch die Ausnahme war, wird es
sicher auch für Shredder nötig sein, diese neuen technischen Entwicklungen besser zu
nutzen. Ansonsten wird er bald in den entsprechenden Ranglisten (=> wo inzwischen fast
nur noch auf 64 bit Systemen getestet wird ... ) weit abgeschlagen irgendwo dahindümpeln,
was mir eigentlich ein wenig leid tun würde angesichts des erheblichen Potentials, das immer
noch in dieser Engineentwicklung steckt (neben der hohen Performance auch z.B. ein sehr
attraktiver Spielstil mit KS = 110 !).

So bin ich durchaus mal noch etwas gespannt darauf, ob es gelingt, (Deep) Shredder 12
in dieser Hinsicht noch erfolgreich weiterzuentwickeln.

Beste Grüsse,

   Ulrich
_____________
Parent - - By Ingo bauer Date 2010-01-19 10:49
Hallo Ulli

[quote="Ulrich Harm "]
...
auch den Vorteil von 64 bit - Betriebssystemen besser zu nutzen (Deep Shredder 12 64 bit
spielt derzeit praktisch gleich stark als die entsprechende Version mit 32 bit, während ver-
schiedene Konkurrenzprogramme wie Rybka, Stockfish, Doch, Robbo etc. deutlich von
64 bit - Systemen profitieren, meist im Bereich von 30 - 50 Elopunkten).
Da bei heutigen neuen Rechnern immer mehr 64-bit Betriebssysteme zum Einsatz kommen
werden ( Windows 7 / 64 bit etc.), was früher eher noch die Ausnahme war, wird es
sicher auch für Shredder nötig sein, diese neuen technischen Entwicklungen besser zu
nutzen. Ansonsten wird er bald in den entsprechenden Ranglisten (=> wo inzwischen fast
nur noch auf 64 bit Systemen getestet wird ... ) weit abgeschlagen irgendwo dahindümpeln,
..
[/quote]

1. Selbstverständlich werde ich das Ergebniss hier posten.
2. Das mit den 64bit ist ein Missverständniss. Nicht '32 bit Engine profitieren nicht von 64 bit', sondern '64bit Engines (BBoard) werden durch 32bit Compilate gehandicapt'!
Punkt 2 kann ich soger logisch schließen:
S12 in 32bit spielt auf dem Level von R2.3.2a und schon als R2.3.2a erschien hieß es die 32bit Engines (oder besser die 'Nicht-BBoard' Engines) müssen umstellen um mitzuhalten (Gilt wohl auch für Naum4). Da Rybkas Sprung von 2.3.2a zu 3 aller Wahrscheinlichkeit nichts mit BBoards zu tun hat (die waren ja schon vorher da) kann man wohl auch mit 'konventionellen' Methoden oben mitspielen!

Gruß
Ingo
Parent - By Ulrich Harm Date 2010-01-19 18:12
Hallo Ingo,

alles klar .
=> ich bin schon ein wenig gespannt über die Ergebnisse
bei Deinen Tests mit DS12 (KS=110)  !

Zu den technischen Hintergründen der Verbesserungen unter 64 bit
kann ich nicht viel sagen, da ich hierbei nicht die entsprechenden
Fachkenntnisse habe. Ich sehe nur in letzter Zeit, dass bei den
wichtigen Ranglisten (CEGT etc. ) fast nur noch Ergebnisse mit
64 bit - Systemen präsentiert werden und dass dabei einige Engines
deutlich von 64 bit profitieren ( z.B. Rybka 3 mit fast 50 Elopunkten etc.).
Bei DS12 scheint dies hingegen nicht der Fall zu sein (keine klare
Steigerung bei 64 bit ggü. 32 bit in den Ranglisten).

Wie gesagt, bezüglich der techischen Hintergründe hierzu habe ich zuwenig
Ahnung, um mitreden zu können  ... .

Vielen Dank für die Info's und mit besten Gruessen,

   Ulrich
_____________
Parent - - By Ingo Bauer Date 2010-01-20 17:57
Hallo

OK, hier nun ein paar harte Zahlen für S12 mit King Safety 110:

Elostat:

9  DS 12 x64  KS110               : 2804   15  15  1400    64.2 %   2703   36.1 %
10 Deep Shredder 12 x64           : 2801   11  11  2600    60.1 %   2729   37.5 %


Bayes:

   8 DS 12 x64  KS110              2803   16   15  1400   64%  2706   36%
  10 Deep Shredder 12 x64          2801   12   12  2600   60%  2731   38%


Einmal 3, einmal 2 ELo Vorsprung - dabei waren die Gegner aber nicht gleich.

Und hier och die Individuellen Ergebnisse, ich würde ihnen bei nur 100 Spielen pro Gegner aber nicht so viel Gewicht beimessen:

9 DS 12 x64  KS110          : 2804  1400 (+646,=506,-248), 64.2 %

Deep Junior 2010 x64          : 100 (+ 60,= 26,- 14), 73.0 %
Fruit 05/11/03                : 100 (+ 59,= 30,- 11), 74.0 %
Toga II 1.4 beta5c BB x64     : 100 (+ 59,= 32,-  9), 75.0 %
Spike 1.2 Turin               : 100 (+ 68,= 25,-  7), 80.5 %
Rybka 2.3.2a mp x64           : 100 (+ 20,= 43,- 37), 41.5 %
Zappa Mexico II x64           : 100 (+ 53,= 34,- 13), 70.0 %
Hiarcs 12.1 MP                : 100 (+ 51,= 39,- 10), 70.5 %
Rybka 3 x64                   : 100 (+ 15,= 42,- 43), 36.0 %
Deep Sjeng WC2008 x64         : 100 (+ 45,= 40,- 15), 65.0 %
Naum 4 x64                    : 100 (+ 30,= 41,- 29), 50.5 %
Onno-1-1-1 x64                : 100 (+ 56,= 32,- 12), 72.0 %
Spark-0.3 VC x64              : 100 (+ 54,= 38,-  8), 73.0 %
Doch64 1.2 JA x64             : 100 (+ 47,= 42,- 11), 68.0 %
Stockfish 1.6.2 JA x64        : 100 (+ 29,= 42,- 29), 50.0 %

10 Deep Shredder 12 x64      : 2801  2600 (+1076,=975,-549), 60.1 %

Deep Junior 2010 x64          : 100 (+ 63,= 25,- 12), 75.5 %
Zappa Mexico II x64 2T        : 100 (+ 35,= 41,- 24), 55.5 %
Stockfish 1.6.2 x64 2T        : 100 (+ 18,= 45,- 37), 40.5 %
Naum 4 x64 2T                 : 100 (+ 20,= 46,- 34), 43.0 %
Rybka 3 x64 2T                : 100 (+ 11,= 41,- 48), 31.5 %
Fruit 05/11/03                : 100 (+ 60,= 29,- 11), 74.5 %
Glaurung 2.2 JA               : 100 (+ 50,= 40,- 10), 70.0 %
Rybka 2.2n2 mp x64            : 100 (+ 34,= 39,- 27), 53.5 %
Toga II 1.4 beta5c BB x64     : 100 (+ 64,= 30,-  6), 79.0 %
Deep Shredder 10 x64          : 100 (+ 67,= 28,-  5), 81.0 %
Spike 1.2 Turin               : 100 (+ 66,= 26,-  8), 79.0 %
Rybka 2.3.2a mp x64           : 100 (+ 33,= 45,- 22), 55.5 %
Zappa Mexico II x64           : 100 (+ 47,= 37,- 16), 65.5 %
Hiarcs 12.1 MP                : 100 (+ 58,= 35,-  7), 75.5 %
Rybka 3 x64                   : 100 (+ 15,= 40,- 45), 35.0 %
Deep Sjeng WC2008 x64         : 100 (+ 41,= 42,- 17), 62.0 %
Naum 4 x64                    : 100 (+ 38,= 33,- 29), 54.5 %
Rybka 3                       : 100 (+ 25,= 44,- 31), 47.0 %
Stockfish 1.4 JA x64          : 100 (+ 41,= 43,- 16), 62.5 %
Fritz 12                      : 100 (+ 41,= 40,- 19), 61.0 %
Onno-1-1-1 x64                : 100 (+ 54,= 33,- 13), 70.5 %
Stockfish 1.5.1 JA x64        : 100 (+ 25,= 41,- 34), 45.5 %
Doch64 09.980 JA x64          : 100 (+ 52,= 34,- 14), 69.0 %
Spark-0.3 VC x64              : 100 (+ 45,= 37,- 18), 63.5 %
Doch64 1.2 JA x64             : 100 (+ 49,= 36,- 15), 67.0 %
Stockfish 1.6.2 JA x64        : 100 (+ 24,= 45,- 31), 46.5 %


Mein Bauchgefühl sagt mir 110 schlicht nicht genug ist für eine Differenz im Rating!

Gruß
Ingo
Parent - By Ulrich Harm Date 2010-01-21 10:13
Hallo Ingo,

vielen Dank für Deine Tests mit KS=110 !

So scheint es wohl so zu sein, dass trotz der bisherigen ermutigenden
Ergebnisse mit KS=110, insbesondere auch gegen einige sehr starke
Gegner (=> merkliche Steigerung gegen Rybka 3, Stockfish 1.6.2, Fritz 11
und inzwischen auch Rybka 2.3.2a [vgl. unten]) doch insgesamt keine
nennenswerte Steigerung der Gesamt - Performance erzielt wird.

Bei meinen bisherigen Tests hatte S12 mit KS=110 nur gegen Stockfish 1.5.1
und gegen Shredder 11 merklich schwächer abgeschnitten.
Gerade habe ich nochmals einen weiteren analogen kurzen Test mit S12
(Standard und KS=110) unter gleichen Bedingungen gegen Rybka 2.3.2a
laufen lassen (10 Min. + 10 Sek. / Zug ; 1 CPU ; 32 bit) mit folgendem
Gesamtergebnis (S12 jeweils mit Pos. learning = off) :

S12 (Standard)   -----   Rybka 2.3.2a   ....   +17 / -14 / =19   ..  (53 %) 

S12 (KS=110)   ------   Rybka 2.3.2a    ....   +19 / -10 / =20   ..  (59 %)
==========================================================  

Aber wie gesagt : Trotz dieser ermutigenden Einzelergebnisse bei mir (natürlich mit einer
beschränkten Partienzahl) und eines für mich deutlich überzeugenderen Spielstils
bei KS=110 im Mittelspiel (=> wirkt hier oft druckvoller und sicherer) scheint nach
Deinen Ergebnissen mit grösseren Partienzahlen und einer grösseren Palette von
Gegnern das Gesamtergebnis mit KS=110  nicht deutlich besser zu sein als mit dem
Standardsetting.
Das muss man dann wohl einfach erst mal so stehenlassen.

Für die längere Zunkunft hin gesehen, scheint sich mir heute eh die Frage zu stellen, ob
die kommerziellen Engines auf dem heutigen Preisniveau (meist 50 Euro für Single-CPU
und stolze 100 Euro für die "Deep" - Versionen) noch konkurrenzfähig sein können.
Angesichts superstarker kostenfreier MP - fähiger Engines (inkl. 64 bit) wie Stockfish
1.6.2  oder den (wegen des Clon - Verdachts umstrittenen) Robbo- und Firebird -
Versionen (sowie anderen aufstrebenden Engines wie Doch, Sparc etc. ) wird es für
die meisten User und selbst auch für viele Computerschach - Liebhaber immer schwerer
werden, noch überzeugende Argumente für den Einkauf neuer kommerzieller Engines
auf diesem Preis- niveau zu finden.
Das mögen manche zwar bedauern, aber ich denke, man wird sich diesen Realitäten
für die Zunkunft stellen müssen. Ob sich hier eine Weiterentwicklung von den früheren
Spitzenengines wie Fritz (11/12) , Junior, Hiarcs, Naum etc. noch wirklich lohnt,
werden die entsprechenden Entwickler für sich beantworten müssen. Ich bezweifle
aber, dass sich hier weitere Verbesserungen ihrer Engines in Zunkunft noch gut auf diesem
bisher gewohnten Preisniveau werden vermarkten lassen.
Selbst bei Rybka und Shredder als derzeitigen Spitzenengines wird das schon fraglich
sein.
Ist überhaupt schon in Sicht, ob es noch ein Rybka 4 - Release geben wird (=> war ja schon
mehrfach hinausgeschoben worden) ? 

Ich denke, hier werden wohl bald viele Entwickler kommerzieller Engines an einem Wendepunkt
stehen (sofern sie nicht die Entwicklung schon eingestellt haben wie bei Zappa). 

Nochmals vielen Dank für Deine Bemühungen Ingo,

  Gruss Ulrich
________________

 
Up Topic Hauptforen / CSS-Forum / Eindrücke von Shredder 12 (+Settings)

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill