Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / SWCR-64: Shredder 12 w32 im LIVE-Mode ...
- - By Frank Quisinsky Date 2010-08-06 12:39 Edited 2010-08-06 12:48
Hallo zusammen,

so aktuell ist Shredder 12 nun auch nicht mehr. Und dennoch kann ein LIVE Mode ganz interessant sein

Ich möchte die SWCR-32 und die SWCR-64 zu einer dritten Ratingliste zusammenführen.

An den bisherigen Listen wird sich daher nichts ändern, die SWCR-32 (nur 32-Bit gegeneinander) und die SWCR-64 (nur 64-Bit gegeneinander, Ausnahme jetzt Shredder 12 w32) bleiben bestehen.

Ich vermute (gilt als Prognose), dass Shredder 12 w32 aufgrund meiner bisherigen Ergebnisse bzw. ELO-Berechnungen ca. 8 ELO besser als Shredder 12 x64 spielt. Das ist umso tragischer, denn auf Shredder 12 werden die beiden Listen geeicht. Mit anderen Worten verzerrt alles ein wenig. Es ist daher notwendig (schon um sicher zu gehen), dass Shredder 12 w32 in die SWCR-64 integriert wird um eine bessere Eichung der Listen langfristig zu gewährleisten.

Dies alles läuft im LIVE Mode.
Shredder 12 w32 hat in der SWCR-64 gegen 27 Gegner 40 Partien = 1.080 Partien zu spielen.

Wie gut nun die bisherigen SWCR-Auswertungen sind, könnte folglich auch aus diesem Test entnommen werden.

Wer das verfolgten möchte ...

Frank's Chess Page
http://www.amateurschach.de

Hinweis:
Bereits nach nur 75 Partien war im diesen Fall das Rating schon konstant.
Mal schauen wie es weiter geht ...

Gruß
Frank
Parent - - By Frank Quisinsky Date 2010-08-06 13:05
Wie gut oder schlecht nun die bisherigen SWCR-Auswertungen sind, könnte folglich auch aus diesem Test entnommen werden.

oder schlecht ... hinzugefügt.

Sonst heißt es nachher ... Protz, protz ... was ja völlig Banane ist, na ja oft übertreibe ich bekanntlich ja gerne, bin ja auch kein Kind von Traurigkeit
Glaube ich bin der größte Kritiker an den eigenen Listen.

Aber die SWCR wird nach den Shredder 12 Partien jetzt weiter wachsen.
Viele Hinweise warum und weshalb sind auch der "Aktuell" Seite zu entnehmen.

Wenn noch Fragen kommen, werde ich dann dort Stellung nehmen (so kann ich immer wieder darauf verweisen, spare mir langfristig weitere Arbeit).

Gruß
Frank
Parent - - By Frank Quisinsky Date 2010-08-06 17:50
Hallo zusammen,

damit es etwas interessanter wird ...

Shredder Classic GUI liegt bei der ELO-Berechnung ca. 10 ELO über Bayesian.
Selbst rechne ich damit, dass Shredder 12 w32 8 ELO stärker als Shredder 12 x64 ist.

2.800 + 10 + 8 ... 2.818 wäre das Ergebnis, welches Shredder nach 1.080 Partien +- erreichen sollte.

Derzeit schaut es wie folgt aus:

Code:
103.5  -  59.5    63.50%    Perf=2813


Denke mit diesen Infos macht es ein wenig mehr Spaß über das WE mal auf die LIVE Seite zu schauen.
Die 1.080 Partien sollten am Montag Nachmittag gespielt sein, wenn kein Rechner abstürzt.
Hoffe der FTPTigger hält auch durch, bin selbst nicht zu Hause und könnte dann nicht mehr eingreifen.

Ansonsten nun alle ein schönes WE.

Gruß
Frank
Parent - - By Kurt Utzinger Date 2010-08-06 18:18
[quote="Frank Quisinsky"]
Die 1.080 Partien sollten am Montag Nachmittag gespielt sein, wenn kein Rechner abstürzt.
Hoffe der FTPTigger hält auch durch, bin selbst nicht zu Hause und könnte dann nicht mehr eingreifen.
[/quote]

Offenbar wird die Gefahr als gering eingeschätzt, dass durch einen Trafo oder ein sonstiges Bauteil
ein Brand entstehen könnte. Ich habe es mir zur Gewohnheit gemacht, alle Geräte abzuschalten,
wenn ich mein Zuhause verlasse.
Mfg
Kurt
Parent - - By Frank Quisinsky Date 2010-08-06 18:24 Edited 2010-08-06 18:26
Hallo Kurt,

musst Dich nicht sorgen. Hängt ein Sicherheitssystem dazwischen, angeschlossen an einer USV. Natürlich kann immer mal etwas passieren aber die Hardwarekomponenten sind sehr gut und genau darauf achte ich (kleines Hobby, berufsbezogen entstanden). Außerdem benutze ich eine Fernüberwachung. Ich kann von jedem Computer aus die ganze Maschinen ausschalten. Was lediglich noch nicht funktioniert ist auf einen Absturz entsprechend zu reagieren. Das geht natürlich auch aber das habe ich derzeit noch nicht.

Gruß
Frank
Parent - - By Frank Quisinsky Date 2010-08-07 11:29
Hallo,

aktuell:

Code:
235.0  -  137.0    63.17%    Perf=2811


Habe jetzt selbst 4-5x auf die Seite geschaut.
Niedrigster Wert war bislang 2808 und höchster den ich gesehen habe 2819.

Prognose liegt bei 2818.
Es wackelt also zur Zeit um 11 ELO und je mehr Partien desto kleiner wirds "wackeln"

Gruß
Frank
Parent - - By Frank Quisinsky Date 2010-08-09 18:06 Edited 2010-08-09 18:13
Hallo,

aktuelles Ergebnis:

Code:
613.0  -  369.0    62.42%    Perf=2806


Nach Korektur-Eingriffe.
1x Twisted: Wieder in Remis-Stellung auf Zeit verloren (Remis gewertet)
2x Komodo: Bekannter Fehler (2x Remis gewertet, anstatt 0:1 aus Komodo Sicht)
1x Junior: Nach 255 Zügen in unklarer Stellung auf Zeit verloren (Partie lasse ich wiederholen).
4x Partien unter 16 Züge Remis (werden wiederholt).

Also es schaut so aus, dass meine x64 Liste doch offenbar alles richtig erfasst hat. Meine Vermutung, dass Shredder 12 w32 ca. 8 ELO besser spielt (weil ich dachte das alle anderen Engines zu hoch liegen und Shredder zu niedrig) bewahrheitete sich nicht. Vielmehr ist es so, dass Shredder 12 x64 ca. 5 ELO vor Shredder 12 w32 liegen wird. Und diese 5 ELO bedeuten nichts, absolut in normalen Fehlertoleranzen.

OK, habe ein wenig mehr Klarheit und kann die Listen zusammenfügen.
Sind noch ca. 100 Partien zu spielen, die Ergebnisse bzw. alle Updates der SWCR Listen sind dann morgen früh abrufbar.

Bevor es dann mit Critter 0.80 und Hannibal 1.0a weiter geht muss Protector 1.3.4 JA w32 noch zurück in die 32-bit Hauptratingliste geführt werden. Hier sind dann noch 380 Partien zu spielen. Danach habe ich erst mal genug von "Sonderpartien" ... will jetzt auch endlich Critter 0.80 und Hannibal 1.0a sehen

Gruß
Frank
Parent - - By Ingo Bauer Date 2010-08-09 19:18
[quote="Frank Quisinsky"]
...

Also es schaut so aus, dass meine x64 Liste doch offenbar alles richtig erfasst hat. Meine Vermutung, dass Shredder 12 w32 ca. 8 ELO besser spielt (weil ich dachte das alle anderen Engines zu hoch liegen und Shredder zu niedrig) bewahrheitete sich nicht. Vielmehr ist es so, dass Shredder 12 x64 ca. 5 ELO vor Shredder 12 w32 liegen wird. Und diese 5 ELO bedeuten nichts, absolut in normalen Fehlertoleranzen.

[/quote]

Warte mal ab bis das ordentlich von Bayes ausgewertet wurde. Das könnte noch weniger als 5 Elo werden.
Was dann aber 1. klar zeigt das du das OHNE die Spiele und nur mit umbennen hättest hinbekommen können und 2. Eine Enigne viel zu wenig ist um zwei Listen zusammenzufügen!
Als nächstes müßtest du die S12-32 in die 64er Liste integrieren und dann ... Ich glaube deine Unterscheidung in 32 und 64 macht keinen Sinn mehr, du machst dir nur doppelte Arbeit. Einfach immer die 64 wenn vorhanden und ansonsten die 32 bit Version - fertig.

Gruß
Ingo
Parent - By Frank Quisinsky Date 2010-08-09 20:25
Hallo Ingo,

ich habe jetzt mal folgendes gemacht.

1.000 Pseudo Partien hinzugefügt ... Sjeng -15
1.000 Pseudo Partien hinzugefügt ... Thinker - 30
1.000 Pseudo Partien hinzugefügt ... Zappa -70

Also die w32 dieser drei in die x64 um dann mehr Vergleichswerte zu bekommen.

Ergebnis:
Keine Änderungen von +-3 bei allen 80 Engine Versionen der Gesamtratingliste.

Insofern trifft eher meine Vermutung zu, dass weitere Engines nicht notwendig sind weil ja innerhalb der beiden Listen schon ausreichend Cluster vorhanden sind und natürlich auch unter den gleichen Voraussetzungen gespielt werden.

Kannst Du gerne auch mal machen.
Nehme eine Engine mit der Spielstärke von Thinker w32 und bennen diese in Thinker w32 um.
Setze die 1.000 Partien hinzu und mache diesen Test ...

Ingo, da passiert nichts!

Gruß
Frank

Doch, doch die Unterscheidung w32 und x64 ist mir sehr wichtig.
In keiner anderen Liste ist das jetzt so einfach abzulesen, Quasi zukünftig für alle aktuellen Engines!
Das ist ein SWCR Event, etwas besonderes und das möchte ich auch so weiter führen.
Habe mir hier sehr viele Gedanken gemacht, gerade weil der 64-Bit Zuwachs der SWCR auf den Schachwelt Seiten immer gerne angriffen wurde.
Nun ist schön zu sehen, das 85% der Einschätzungen stimmten!
Parent - - By Frank Quisinsky Date 2010-08-09 20:51
Hallo Ingo,

ich weiß noch nicht wo ich meinen Denkfehler habe aber nach meinen Auswertungen stimmt doch die Annahme das die x64 schlechter ist.
Hatte vorher -8 kalkuliert ... es sind -6 !!

Habe Dir mal die Liste aller SWCR Partien erzeugt ...fehlen zwar noch 70 Shredder Partien aber egal!

Und das schaut alles absolut logisch aus.
Könnte die Liste auch mal mit den vier Pseudo Engines posten wenn Du willst aber ich denke Du glaubst mir da sicherlich.

Hier die Liste nach 43.611 SWCR-32 / SWCR-64 Partien!
25 Engines, 78 Versionen

Code:
Rank Name                          Elo    +    - games score oppo. draws
   1 Rybka 4 x64                  2945   23   22   877   82%  2701   29%
   - Rybka 3 x64                  2911   23   22   837   78%  2693   27%
   2 Stockfish 1.7.1 JA x64       2902   19   18  1117   76%  2712   34%
   - Rybka 4 w32                  2894   21   21   880   75%  2709   33%
   - Stockfish 1.7.1 JA w32       2874   18   18  1200   75%  2690   31%
   - Stockfish 1.8.0a JA w32      2866   22   21   800   74%  2695   36%
   - Stockfish 1.8.0 JA w32       2863   21   21   800   74%  2695   37%
   - Rybka 3 w32                  2860   16   16  1520   74%  2689   31%
   3 Naum 4.2 x64                 2833   18   18  1118   67%  2714   38%
   - Stockfish 1.6.3 JA w32       2827   18   18  1080   71%  2680   36%
   - Naum 4.2 w32                 2827   16   16  1400   68%  2704   36%
   4 Critter 0.70 x64             2813   20   20   878   65%  2707   38%
   - Naum 4.1 w32                 2811   19   19   920   68%  2686   35%
   5 Komodo 1.2 JA x64            2804   20   19   877   64%  2707   41%
   - Stockfish 1.6.0 JA w32       2802   19   18   960   68%  2687   39%
   6 Shredder 12 w32              2800   11   11  2970   63%  2706   37%
   - Komodo 1.0 JA x64            2797   20   20   837   64%  2699   39%
   - Shredder 12 x64              2794   18   18  1080   61%  2713   35%
   - Naum 4.0 w32                 2785   19   19   960   65%  2682   38%
   7 Deep Fritz 12 w32            2780   15   15  1480   61%  2707   42%
   - Critter 0.70 w32             2774   19   19   880   59%  2715   40%
   - Komodo 1.2 JA w32            2760   19   19   880   56%  2715   41%
   - Fritz 12 w32                 2746   16   16  1160   59%  2688   44%
   8 Thinker 5.4d Inert x64       2742   17   17  1117   54%  2717   42%
   9 Spark 0.5 x64                2739   19   19   878   54%  2710   38%
  10 Hiarcs 13.1 w32              2737   19   19   880   53%  2716   42%
   - Stockfish 1.5.1 JA w32       2731   19   19   840   59%  2672   43%
  11 Zappa Mexico II x64          2731   17   17  1117   52%  2718   41%
  12 Protector 1.3.4 JA x64       2728   18   18  1078   52%  2719   37%
   - Spark 0.4 x64                2723   20   20   837   53%  2702   40%
  13 Fruit 09_07_05 x64           2723   17   17  1118   51%  2718   35%
   - Komodo 1.0 JA w32            2716   16   16  1200   53%  2695   40%
   - Spark 0.5 w32                2713   19   19   880   49%  2717   40%
   - Thinker 5.4d Inert w32       2712   13   13  1960   51%  2705   42%
   - Critter 0.60 x64             2706   20   20   838   50%  2703   37%
  14 Junior 11.2 x64              2694   20   20   879   47%  2712   32%
   - Protector 1.3.5 x64          2691   20   20   838   47%  2712   39%
   - Doch 1.3.4 JA w32            2690   19   19   840   51%  2686   44%
  15 Sjeng WC-2008 x64            2689   17   17  1117   46%  2719   37%
   - Critter 0.60 w32             2688   19   19   920   50%  2688   39%
   - Junior 11.2 w32              2688   20   20   880   46%  2718   33%
   - Spark 0.4 w32                2686   19   19   880   49%  2692   43%
   - Protector 1.3.4 JA w32       2679   19   19   920   48%  2691   39%
  16 Onno 1.1.1 x64               2677   20   20   837   46%  2704   40%
   - Onno 1.2.70 x64              2677   19   19   877   45%  2713   39%
   - Cyclone xTreme Wrath w32     2676   17   17  1080   47%  2697   41%
   - Protector 1.3.2 w32          2674   17   17  1160   47%  2695   41%
   - Protector 1.3.5 JA w32       2669   19   19   880   43%  2719   41%
   - Junior 2010 w32              2669   16   16  1240   47%  2691   36%
   - Hiarcs 12.1 w32              2667   19   19   880   47%  2689   41%
   - Protector 1.3.1b w32         2667   19   19   840   47%  2690   42%
   - Doch 1.2 JA w32              2665   19   19   840   48%  2679   40%
   - Hiarcs 12.1 Sharpen PV w32   2665   16   16  1280   45%  2699   40%
   - Sjeng WC-2008 w32            2664   13   13  1960   44%  2706   37%
   - Zappa Mexico II w32          2662   13   13  1960   44%  2706   42%
   - Spark 0.3a w32               2656   17   17  1120   44%  2698   41%
   - Junior 11.1a x64             2653   20   20   837   43%  2705   32%
   - Doch 09.980 JA w32           2652   19   19   840   46%  2675   42%
   - Junior 11.1a w32             2645   18   19   960   44%  2692   36%
   - Spark 0.3 w32                2643   19   19   880   43%  2690   42%
  17 Loop 2007 x64                2636   17   18  1118   38%  2721   36%
   - Onno 1.1.1 w32               2631   14   15  1520   40%  2695   41%
   - Onno 1.2.70 w32              2629   19   19   880   37%  2721   39%
  18 Twisted Logic 20100131x x64  2617   18   18  1117   35%  2722   32%
   - Fruit 05/11/03 w32           2616   13   13  1960   37%  2707   41%
   - Loop 2007 w32                2615   20   20   880   35%  2722   36%
   - Loop 13.6 w32                2615   15   15  1520   38%  2696   39%
   - Critter 0.52b w32            2614   18   18  1040   38%  2699   37%
   - Glaurung 2.2 JA w32          2610   18   18  1080   37%  2700   36%
  19 Ktulu 9.03 w32               2608   15   16  1480   36%  2711   30%
  20 SmarThink 1.20 x64           2604   18   18  1117   34%  2722   33%
   - SmarThink 1.20 w32           2595   13   13  1960   34%  2708   37%
   - Twisted Logic 20100131x w32  2575   15   15  1640   31%  2711   30%
  21 Spike 1.2 Turin w32          2573   16   16  1440   31%  2711   34%
  22 Scorpio 2.6 JA x64           2562   18   19  1117   28%  2724   32%
  23 Crafty 23.2 JA x64           2561   18   19  1118   28%  2724   31%
  24 Chronos 1.99 x64             2558   18   18  1118   27%  2724   33%
  25 Daydreamer 1.75 JA x64       2527   19   19  1118   24%  2725   30%


Gruß
Frank
Parent - - By Frank Quisinsky Date 2010-08-09 20:58
Hi Ingo,

minimieren wir das mal ...

Code:
01 Rybka 4 x64                  2945   23   22   877   82%  2701   29%
02 Stockfish 1.7.1 JA x64       2902   19   18  1117   76%  2712   34%
03 Naum 4.2 x64                 2833   18   18  1118   67%  2714   38%
04 Critter 0.70 x64             2813   20   20   878   65%  2707   38%
05 Komodo 1.2 JA x64            2804   20   19   877   64%  2707   41%
06 Shredder 12 w32              2800   11   11  2970   63%  2706   37%
07 Deep Fritz 12 w32            2780   15   15  1480   61%  2707   42%
08 Thinker 5.4d Inert x64       2742   17   17  1117   54%  2717   42%
09 Spark 0.5 x64                2739   19   19   878   54%  2710   38%
10 Hiarcs 13.1 w32              2737   19   19   880   53%  2716   42%
11 Zappa Mexico II x64          2731   17   17  1117   52%  2718   41%
12 Protector 1.3.4 JA x64       2728   18   18  1078   52%  2719   37%
13 Fruit 09_07_05 x64           2723   17   17  1118   51%  2718   35%
14 Junior 11.2 x64              2694   20   20   879   47%  2712   32%
15 Sjeng WC-2008 x64            2689   17   17  1117   46%  2719   37%
16 Onno 1.1.1 x64               2677   20   20   837   46%  2704   40%
17 Loop 2007 x64                2636   17   18  1118   38%  2721   36%
18 Twisted Logic 20100131x x64  2617   18   18  1117   35%  2722   32%
19 Ktulu 9.03 w32               2608   15   16  1480   36%  2711   30%
20 SmarThink 1.20 x64           2604   18   18  1117   34%  2722   33%
21 Spike 1.2 Turin w32          2573   16   16  1440   31%  2711   34%
22 Scorpio 2.6 JA x64           2562   18   19  1117   28%  2724   32%
23 Crafty 23.2 JA x64           2561   18   19  1118   28%  2724   31%
24 Chronos 1.99 x64             2558   18   18  1118   27%  2724   33%
25 Daydreamer 1.75 JA x64       2527   19   19  1118   24%  2725   30%


Gruß
Frank
Parent - - By Ingo Bauer Date 2010-08-09 21:06 Edited 2010-08-09 21:10
Super Frank!

Jetzt mußt du mir nur noch sagen warum die doppelt so lange spielst wie ich um meine Liste mit minimalsten Unterschieden zu kopieren? Da soll mir nochmal einer kommen und sagen das lange Bedenkzeiten etwas anderes produzieren als kurze!

Wenn du komplett fertig bist, mache ich mal wieder eine ordentliche Anpassung mit Excel - ich gehe mal davon aus, dass die Unterschiede dann noch kleiner werden als sie so schon sind.

Gruß
Ingo
Parent - - By Frank Quisinsky Date 2010-08-09 21:17
Hi Ingo,

also eine Überraschung ist dabei ... Critter !!

Ansonsten, gebe Dir wirklich Recht.
Wir haben die doppelte Bedenkzeit und keine Abweichung ist größer als 30.

Die Unterschiede bei noch mehr Zeit werden nicht sehr viel größer.
z. B. Zappa ... 21 ELO bei doppelter Zeit.

Es ist nicht davon auszugehen das wir nun bei 10facher Zeit 210 ELO erwarten können.
Das wird dann maximal 30-40 werden, Schwellenberechnung.

Insofern stimme ich Dir wirklich zu.
Ein Vergleich wird jetzt Sinn machen bei 40 in 60 und alles andere ist Murks.
Wir werden zu 40 in 10 feststellen, das einige um vielleicht maximal 30-40 zulegen und das war es.
Und selbst das ist fraglich!

Aber ohne Testen bekommen wir das nicht raus!

Gruß
Frank
Parent - - By Ingo Bauer Date 2010-08-09 21:40
Hi

[quote="Frank Quisinsky"]

also eine Überraschung ist dabei ... Critter !!
[/quote]

Ahh ja, das ist ja C07 bei dir ... na ja, dann kann ich dir sagen das miene Liste und die 40/20 der CEGT bzgl C07 praktisch gleich sind, und deine einen Aussreißer nach oben hat ... warum mußt du klären. (Aber selbst das ist noch im Rahmen da die 07 und 08 gerade mal 30 Elo auseinanderliegen - es ist aber schon sehr Grenzwertig bei dir!)

[quote="Frank Quisinsky"]
Ansonsten, gebe Dir wirklich Recht.
[/quote]

Das ich das noch erleben darf

[quote="Frank Quisinsky"]
Wir haben die doppelte Bedenkzeit und keine Abweichung ist größer als 30.
[/quote]

Und das ist Critter der bei dir im Verlgeich zu allen anderen sehr hoch steht (und das hat niocht mit der Bedenkzeit zutun)

[quote="Frank Quisinsky"]
Die Unterschiede bei noch mehr Zeit werden nicht sehr viel größer.
z. B. Zappa ... 21 ELO bei doppelter Zeit.

...
[/quote]

Nene, ich schrieb nicht ohne Grund: "Wenn du fertig bist dann Excel ..." Du kannst nicht einfach hingehen und beide Listen nebeneinander stellen. Du mußt die Gesammtabweichung minimieren, also allen Engine so lange ein paar Elo plus oder minus (natürlich allen das selbe + oder -) bis die durchschnittliche Abweichung am gerinsten ist. Erst dann ist es mathematisch korrekt (Habe mich sogar noch belehren lassen (und angelesen), dass man die Abweichung ins Quadrat setzen müßte, aber das ist fast kein Unterschied mehr).
Mach du fertig, ich schicke dir dann die Excelliste mit dem Ergebniss.

Gruß
Ingo
Parent - - By Frank Quisinsky Date 2010-08-09 22:37
Hi Ingo,

dann schauen wir mal ob Critter 0.8 bei mir um 30 ELO ansteigt. Wenn das der Fall ist, scheint auch der Critter 0.7 Wert OK zu sein.
Dann stellt sich die Frage ob Critter von längerer Zeit in Verbindung mit Pondern profitiert!

Bin ja der Meinung, dass 800 Partien ausreichen. Es könnte aber jetzt bei 78 Engines in der Liste durchaus sein, dass 1-2 um 20 ELO abweichen.
Das entspricht meiner Annahme und diese 20 ELO wären mir auch egal.

Mehr Partien bei 40 in 10 kann ich nicht spielen oder ich müsste die Zeit runterfahren.
Insofern müssen die gespielten Partien ausreichen.

Was ich aber machen kann wäre folgendes:
Die Engines, die grobe Abweichungen zur CEGT oder IPON haben, kann ich meinetwegen noch mal 500 Partien nachspielen lassen, um sicher zu gehen.
Vielleicht haben wir in Critter ja den 1/52 Fall bei 800 Partien. Nach meiner Berechnung kommt es in einem von 52 Fällen dazu, dass eine Engine um ca. 20 ELO austitscht.

Wie gesagt, wenn ich die ToDo Liste abgearbeitet haben, kann ich solche Stichproben gerne durchführen.
Wäre ja auch verbunden mit neuen Erkenntnissen und diese interessieren mich natürlich selbst.

Nur zu, wenn Du die Excel Liste erstellen möchtest, sehr gut.
Selbst halte ich mich derzeit an Mittelspielstatistiken aus, mich interessieren bevorzugt schnelle Gewinnpartien, taktische Manöver die zum Gewinn führen.

Viele Grüße
Frank
Parent - By Frank Quisinsky Date 2010-08-09 22:59 Edited 2010-08-09 23:04
Hi Ingo,

schaue Dir mal die Stichproben an ...

Loop 2007 / 13.6
Onno 1.1.1 / 1.2.70

Oder die ELO-Unterschiede ...
Rybka 3 w32 zu Rybka 3 x64
Rybka 4 w32 zu Rybka 4 w32

Das ist alles absolut klar in der Liste.

Oder die ELOs von Hiarcs 13.1 w32, Spike 1.2 Turin w32, Fritz 12, Deep Fritz 12
Alles Engines die konstant spielen (Hiarcs 12.1 war noch im Blitz deutlich stärker, nicht Hiarcs 13.1).

Konstant, geht über meine Statistiken deutlich hervor.
Auch das stimmt zu IPON ...

Oder Shredder 12 x64 geringfügig schlechter als die w32
Auch das stimmt ...

Jetzt auf die Suche zu gehen, was ist nicht stimmig ist sehr schwierig !!
Wie gesagt, bei Verdachtsmomenten kann ich wirklich mal 500 Partien nachspielen lassen.

Gruß
Frank

Mist, da biste an allen Ecken am vergleichen und was kommt bei der Liste raus ...
Critter ... unglaublich ... fuchst mich!
Parent - By Frank Quisinsky Date 2010-08-09 21:13 Edited 2010-08-09 21:22
Code:
01 Rybka 4 x64                  2945   23   22   877   82%  2701   29%  IPON - 2
02 Stockfish 1.7.1 JA x64       2902   19   18  1117   76%  2712   34%  IPON +19
03 Naum 4.2 x64                 2833   18   18  1118   67%  2714   38%  IPON +16
04 Critter 0.70 x64             2813   20   20   878   65%  2707   38%  IPON +26
05 Komodo 1.2 JA x64            2804   20   19   877   64%  2707   41%  IPON - 1
06 Shredder 12 w32              2800   11   11  2970   63%  2706   37%  IPON   0
07 Deep Fritz 12 w32            2780   15   15  1480   61%  2707   42%  IPON - 3
08 Thinker 5.4d Inert x64       2742   17   17  1117   54%  2717   42%  IPON nicht getestet
09 Spark 0.5 x64                2739   19   19   878   54%  2710   38%  IPON nicht getestet
10 Hiarcs 13.1 w32              2737   19   19   880   53%  2716   42%  IPON   0
11 Zappa Mexico II x64          2731   17   17  1117   52%  2718   41%  IPON +21
12 Protector 1.3.4 JA x64       2728   18   18  1078   52%  2719   37%  IPON nicht getestet
13 Fruit 09_07_05 x64           2723   17   17  1118   51%  2718   35%  IPON nicht getestet
14 Junior 11.2 x64              2694   20   20   879   47%  2712   32%  IPON +23
15 Sjeng WC-2008 x64            2689   17   17  1117   46%  2719   37%  IPON +17
16 Onno 1.1.1 x64               2677   20   20   837   46%  2704   40%  IPON - 6
17 Loop 2007 x64                2636   17   18  1118   38%  2721   36%  IPON +24
18 Twisted Logic 20100131x x64  2617   18   18  1117   35%  2722   32%  IPON +19
19 Ktulu 9.03 w32               2608   15   16  1480   36%  2711   30%  IPON nicht getestet
20 SmarThink 1.20 x64           2604   18   18  1117   34%  2722   33%  IPON nicht getestet
21 Spike 1.2 Turin w32          2573   16   16  1440   31%  2711   34%  IPON - 8
22 Scorpio 2.6 JA x64           2562   18   19  1117   28%  2724   32%  IPON nicht getestet
23 Crafty 23.2 JA x64           2561   18   19  1118   28%  2724   31%  IPON nicht getestet
24 Chronos 1.99 x64             2558   18   18  1118   27%  2724   33%  IPON nicht getestet
25 Daydreamer 1.75 JA x64       2527   19   19  1118   24%  2725   30%  IPON nicht getestet


Bekannt ist das Naum, Junior und Zappa mit mehr Zeit zulegen.
OK, würde daraus hervorgehen.

Das Loop zulegt und Stockfish zulegt wäre mir neu.
Das Komodo nicht zulegt wäre mir absolut neu.

Wobei, im Blitz liegt Stockfish immer weit hinter Rybka, da Rybka nicht zulegt muss folglich Stockfish zulegen.
Insofern auch keine Überraschung!

Diese Erkenntnisse könnte man ziehen.
Aber der Vergleich hinkt, mehr Sinn würde es machen die ELO-Differenzen zwischen den Version zu messen.
Also Naum 4.0 - 4.2 bei Dir und mir ... als Beispiel.
Diese Werte sind im Grunde fast alle identisch.

Da diese Werte identisch sind wirds interessant ...
Die Frage die Engines legen mit der doppelten Zeit zu oder auch nicht.

Aber wie gesagt, Deine Vorgabestellungen oder meine Bücher?
Was macht das wirklich aus, denke das macht nichts aus.

Im Grunde wäre dann folgendes Ergebnis zu ziehen:

3x Vermutung stimmt
2x Überraschung
1x Vermutung stimmt nicht

Jetzt mal im Schnelldurchgang!
Interessant auch, dass unsere ELOs bei den 32-Bit die Du getestet hast fast identisch sind.
Auch das spricht für eine gute Vergleichbarkeit.

Gruß
Frank
Up Topic Hauptforen / CSS-Forum / SWCR-64: Shredder 12 w32 im LIVE-Mode ...

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill