Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Rybka 4.1 x64 Exp. 79TD v1 Spießroutenlauf mit 1.200 Partien
- - By Frank Quisinsky Date 2011-04-20 00:57
Hallo zusammen,

es besteht der Verdacht, dass sich Rybka 4.1 um 20-25 ELO verbessert hat.

Nach einem Kurztest über 380 Partien (vor dem SWCR-64 Update Turnier) hatte ich ein + 21 ELO
Beim laufenden SWCR-64 Update Turnier sind es nach 563 (andere Partien) nun auch + 23 ELO

Auch gibt es neue Rybka 4.1 Settings, die vielleicht dann auch die üblichen 20-30 ELO hinzugeben.
Insofern könnte Rybka 4.1 x64 mit Houdini 1.5 x64 gleich ziehen.

Als Ratinglistenbetreiber sollte ich das testen, auch wenn ich ungerne laufende Turniere unterbreche.
Aber was solls, so haben wir über Ostern gar ein kleines Event.

Laufzeit ca. 4 1/2 Tage (288 Partien pro Tag wenn nichts hängen bleibt).
Rybka 4.1 mit Setting spielt also gegen 31 Gegner die 40 Partien!

Wer verfolgen möchte findet den Link zum Live Test auf meiner Webseite!

Viel Spaß und den Lesern dieser Zeilen ein paar schöne Ostertage!
Frank
Parent - - By Frank Quisinsky Date 2011-04-20 01:22
Korrektur:
Spielt gegen 30 Gegner je 40 Partien = 1.200 Partien

Danach geht es dann aber mit dem vorgesehenen Turnieren weiter bzw. wird das unterbrochene SWCR-64 Update-Turnier fortgesetzt.
Genug für heute ...

Mal in meinen News-Ticker schauen ... Message 171 lesen
Parent - - By Frank Quisinsky Date 2011-04-20 21:15 Edited 2011-04-20 21:22
Wünsche den frühjahrsmüden Herren
einen wunderschönen guten Abend,


knapp über 200 Partien sind gespielt.
Benötigt ca. 520 Partien für ein gutes Rating und in diesem Fall wäre ein sehr genaues Rating gut.

Die Zahl 520:
Das ist die Anzahl der Partien an dem sich meine Excel Kurve aller getesteten Engines einen Knick hinsichtlich Genauigkeit und weniger Ratinglistenveränderungen sich erlaubt. Die durchschnittliche ELO Abweichung nach 520 Partien bis aktuelle durchschnittliche Anzahl der Partien aller Engines beträgt 1,532 ELO. Bei 500 Partien sind es z. B. noch 1,842 ELO. Aber ich denke dafür interessieren sich die wenigsten um diese Jahreszeit, so kurz vor dem Eiersuchen.

Nun ja ...
Hier die aktuelle SWCR, noch ist nicht so viel ablesbar!
Hey, hey ... natürlich hinsichtlich dem gerade getesteten Rybka Setting, also wirklich!

13 neue Engines vom derzeit unterbrochenen SWCR-64 Update-Turnier und ...
Rybka 4.1 x64 Exp. 79TD v1 (mehr zu diesem Setting im Rybka Forum).

Code:
96.127 SWCR games
Last update: April 20th, 2011 (21:15)

*14* updates are still running!

143. x64 Rybka 4.1 Exp. 79TD v1    NEW      Started: 19.04.11
142. x64 Critter 1.01              Update   Started: 29.03.11
141. x64 Rybka 4.1                 Update   Started: 29.03.11
140. x64 GullChess 1.2             Update   Started: 29.03.11
139. x64 Equinox 0.95              Update   Started: 29.03.11 private
131. w32 Spike 1.4 Leiden          Again    Started: 29.03.11
138. x64 Protector 1.4.0 JA        Update   Started: 29.03.11
137. x64 IvanHoe B47cB             Update   Started: 29.03.11
136. x64 Stockfish 2.0.1 JA        Update   Started: 29.03.11
135. x64 Komodo 1.3 JA             Update   Started: 29.03.11
127. w32 Hiarcs 13.2               Again    Started: 29.03.11
134. x64 Tornado 4.40              Update   Started: 29.03.11
133. x64 WB Scorpio 2.7            Update   Started: 29.03.11
119. w32 ChessTiger 2007           Again    Started: 29.03.11

Rank Name                          Elo    +    - games score oppo. draws
   1 Houdini 1.5 x64              2998   19   18  1339   80%  2758   28%
   2 Rybka 4 x64 Exp. 42          2971   20   19  1240   80%  2721   25%
   - Rybka 4.1 x64                2963   27   26   566   77%  2753   31% NEW + 23
   - Rybka 4.1 x64 Exp. 79TD v.1  2962   47   44   210   78%  2741   25% NEW
   - Rybka 4 x64 Exp. 61          2962   21   20  1000   78%  2745   27%
   - Houdini 1.03a x64            2950   22   21   920   79%  2720   29%
   3 IvanHoe B47cB x64            2948   26   25   574   76%  2757   36% NEW + 14
   - Rybka 4 x64                  2940   17   17  1520   80%  2701   29%
   - IvanHoe B49jA x64            2934   19   18  1160   76%  2740   34%
   - IvanHoe B52aC x64            2924   21   21   880   77%  2729   34%
   4 Stockfish 1.9.1 JA x64       2908   18   17  1280   73%  2730   33%
   - Stockfish 1.8.0 JA x64       2907   18   18  1200   75%  2716   33%
   - Rybka 3 x64                  2907   23   22   840   78%  2689   28%
   - Fire 1.31 x64                2903   21   20   927   74%  2724   36%
   - Stockfish 2.0.1 JA x64       2901   25   25   574   70%  2759   38% NEW -  6
   - Stockfish 1.7.1 JA x64       2898   19   19  1120   76%  2708   34%
   5 Critter 1.01 x64             2897   25   25   573   69%  2759   38% NEW + 23
   - Stockfish 1.9.1 JA           2893   21   20   960   78%  2689   31%
   - Rybka 4                      2891   19   18  1200   76%  2695   32%
   - Critter 0.90 x64             2874   17   17  1200   68%  2743   37%
   - Stockfish 2.0.1 JA           2873   20   20  1000   76%  2680   34%
   - Stockfish 1.7.1 JA           2873   18   18  1200   75%  2688   31%
   - Critter 0.90                 2870   20   20  1000   76%  2680   32%
   - Stockfish 1.8.0 JA           2862   20   20   920   74%  2695   37%
   - Rybka 3                      2858   16   16  1520   74%  2687   31%
   6 Komodo 1.3 JA x64            2837   24   24   573   61%  2762   41% NEW + 30
   7 Naum 4.2 x64                 2835   12   12  2821   65%  2724   36%
   - Critter 0.80 x64             2833   15   15  1680   67%  2703   33%
   - Stockfish 1.6.3 JA           2825   18   18  1080   71%  2678   36%
   - Naum 4.2                     2821   13   12  2320   68%  2696   37%
   - Critter 0.80                 2814   18   18  1040   67%  2694   37%
   - Naum 4.1                     2809   20   19   920   68%  2684   35%
   - Critter 0.70 x64             2808   20   20   880   65%  2703   38%
   - Komodo 1.2 JA x64            2807   13   13  2280   62%  2715   39%
   8 Shredder 12                  2800    8    8  5664   62%  2710   36%
   - Stockfish 1.6.0 JA           2800   19   19   960   68%  2685   39%
   9 GullChess 1.2 x64            2799   24   24   572   55%  2765   41% NEW + 11
  10 Spike 1.4 Leiden             2795   15   15  1573   61%  2713   35% "Again"
   - Komodo 1.0 JA x64            2792   20   20   840   64%  2694   40%
  11 Sjeng c't 2010               2790   12   12  2583   59%  2720   37%
   - Shredder 12 x64              2789   15   15  1600   63%  2692   34%
   - GullChess 1.1 x64            2788   17   17  1160   56%  2745   37%
   - Naum 4.0                     2782   19   18   960   65%  2680   38%
  12 Deep Fritz 12                2779   14   14  1760   62%  2698   41%
   - Komodo 1.3 JA                2776   19   19  1000   63%  2684   36%
   - Critter 0.70                 2776   19   19   920   61%  2701   39%
   - GullChess 1.0a x64           2774   15   15  1480   58%  2713   37%
  13 Protector 1.4.0 JA x64       2771   24   24   573   51%  2766   40% NEW + 58 to version 1.3.4 JA x64
  14 Hiarcs 13.2                  2764   15   15  1573   57%  2714   39% "Again"
  14 Spark 1.0 x64                2764   15   15  1424   51%  2754   41%
   - Komodo 1.2 JA                2758   17   16  1200   58%  2700   41%
   - GullChess 1.1                2746   18   18  1000   59%  2685   40%
   - GullChess 1.0a               2746   18   18   960   58%  2695   39%
   - Fritz 12                     2743   17   16  1160   59%  2686   44%
   - Spark 0.5 x64                2741   13   13  2120   55%  2706   36%
  16 Thinker 5.4d Inert x64       2739   11   11  2822   52%  2726   38%
   - Hiarcs 13.1                  2738   11   11  2920   52%  2720   38%
   - Stockfish 1.5.1 JA           2729   19   19   840   59%  2670   43%
  17 Zappa Mexico II x64          2726   11   11  2822   50%  2726   39%
   - Spark 1.0                    2719   18   18  1000   55%  2686   36%
  18 Junior 12.0 x64              2719   15   15  1582   46%  2745   32%
   - Spark 0.4 x64                2719   20   20   840   53%  2698   40%
   - Protector 1.4.0 JA           2718   18   18  1000   54%  2686   36%
  19 Fruit 09_07_05 x64           2715   12   11  2821   48%  2726   33%
   - Komodo 1.0 JA                2714   16   16  1200   53%  2693   40%
   - Protector 1.3.4 JA x64       2713   14   14  1720   50%  2712   37%
   - Thinker 5.4d Inert           2709   11   11  2880   52%  2698   42%
   - Spark 0.5                    2707   17   17  1200   51%  2702   41%
   - Protector 1.3.6-370 JA x64   2707   17   17  1280   46%  2736   33%
   - Critter 0.60 x64             2702   20   20   840   50%  2698   38%
   - Junior 12.0                  2699   18   18  1000   51%  2687   35%
  20 Booot 5.1.0                  2696   18   18  1080   42%  2756   37%
   - Sjeng WC-2008 x64            2688   14   14  1760   47%  2712   36%
   - Doch 1.3.4 JA                2688   19   19   840   51%  2684   44%
   - Protector 1.3.5 x64          2686   20   20   840   47%  2708   39%
   - Critter 0.60                 2686   19   19   920   50%  2686   39%
  21 Hannibal 1.0a x64            2686   13   13  2262   43%  2736   35%
   - Junior 11.2                  2685   17   17  1200   48%  2702   33%
   - Spark 0.4                    2684   19   19   880   49%  2690   42%
   - Junior 11.2 x64              2683   16   15  1520   47%  2708   30%
  22 Onno 1.2.70 x64              2680   12   12  2582   44%  2725   36%
   - Protector 1.3.4 JA           2678   14   14  1600   47%  2700   39%
   - Cyclone xTreme Wrath         2673   17   17  1080   47%  2695   41%
   - Protector 1.3.2              2672   17   17  1160   47%  2693   41%
   - Onno 1.1.1 x64               2672   20   20   840   46%  2700   40%
  23 Equinox 0.95 x64             2671   25   25   574   37%  2768   31% NEW + 69 to version 0.83 x64
   - Protector 1.3.5 JA           2668   20   20   840   44%  2711   42%
   - Junior 2010                  2667   16   16  1240   47%  2689   36%
   - Hiarcs 12.1                  2665   19   19   880   47%  2687   41%
   - Protector 1.3.1b             2665   19   19   840   47%  2688   42%
   - Sjeng WC-2008                2664   12   12  2240   45%  2699   37%
   - Equinox 0.95                 2664   18   18  1000   46%  2689   36%
   - Doch 1.2 JA                  2663   19   20   840   48%  2677   40%
   - Hiarcs 12.1 Sharpen PV       2663   16   16  1280   45%  2697   39%
   - Zappa Mexico II              2657   11   11  2880   44%  2699   41%
   - Spark 0.3a                   2654   17   17  1120   44%  2696   41%
   - Doch 09.980 JA               2650   19   19   840   46%  2673   42%
   - Junior 11.1a x64             2649   20   20   840   43%  2701   32%
   - Junior 11.1a                 2643   18   19   960   44%  2689   36%
   - Spark 0.3                    2641   19   19   880   43%  2688   42%
   - Hannibal 1.0a                2640   14   14  1720   41%  2702   35%
   - Bright 0.5c                  2635   19   19   960   41%  2700   35%
  24 Umko 1.1 x64                 2634   16   16  1541   33%  2759   33%
  25 Loop M1-T x64                2630   19   19   960   36%  2736   36%
   - Onno 1.1.1                   2628   15   15  1520   40%  2693   41%
   - Onno 1.2.70                  2628   14   14  1840   39%  2702   39%
   - Loop 2007 x64                2623   13   13  2327   37%  2721   34%
  26 Crafty 23.4 JA x64           2622   16   16  1581   33%  2747   32%
  27 Jonny 4.00                   2617   11   12  2887   36%  2718   30%
   - Loop 2007                    2616   14   14  1840   38%  2703   36%
   - Equinox 0.87t x64            2615   17   17  1280   33%  2739   31%
   - Fruit 05/11/03               2614   11   11  2880   38%  2699   40%
  28 Scorpio 2.7 JA x64           2614   25   26   573   29%  2770   30% NEW + 58
   - Twisted Logic 20100131x x64  2613   18   18  1120   35%  2718   32%
   - Loop 13.6                    2612   15   15  1520   38%  2694   39%
   - Critter 0.52b                2612   18   18  1040   38%  2697   37%
   - Umko 1.0 x64                 2612   17   17  1200   34%  2726   37% "ponder not possible"
   - Glaurung 2.2 JA              2607   18   18  1080   37%  2698   36%
  29 Ktulu 9.03                   2607   14   14  1760   37%  2702   31%
  30 Tornado 4.40 x64             2605   26   26   574   28%  2770   28% NEW + 63
   - Equinox 0.83 x64             2602   18   18  1160   32%  2735   32%
  31 SmarThink 1.20 x64           2601   12   12  2527   34%  2721   32%
   - Crafty 23.3 JA x64           2600   17   18  1200   33%  2727   34%
   - SmarThink 1.20               2593   11   11  2880   35%  2700   36%
   - Umko 1.1                     2590   19   19  1000   36%  2692   34%
   - Crafty 23.4 JA               2584   19   19  1000   35%  2692   34%
   - Equinox 0.83                 2579   19   19   960   33%  2702   34%
   - Twisted Logic 20100131x      2572   15   15  1600   32%  2705   30%
   - Spike 1.2 Turin              2572   16   16  1480   31%  2706   34%
   - Cipollino 3.25 x64           2569   20   20   960   28%  2739   30%
   - Crafty 23.3 JA               2564   19   20   960   31%  2703   32%
   - Tornado 4.40                 2563   19   19  1000   32%  2693   32%
  32 BugChess2 1.7 x64            2561   18   18  1207   27%  2735   30%
  33 ChessTiger 2007 1.0012       2559   16   16  1573   28%  2722   30% "Again"
   - Scorpio 2.6 JA x64           2556   18   18  1200   27%  2729   31%
   - Crafty 23.2 JA x64           2556   18   19  1120   28%  2720   30%
  34 Chronos 1.99 x64             2553   18   19  1120   27%  2720   33% "ponder not possible"
   - Crafty 23.3 JA x64 NP        2550   20   21   960   25%  2740   30% "test without ponder"
   - Tornado 4.25 x64             2542   20   20  1080   27%  2718   25%
  35 Daydreamer 1.75 JA x64       2523   19   19  1120   24%  2721   30%
   - Tornado 3.6.7 x64            2482   23   24   840   19%  2728   24%
  36 Zarkov 6.44                  2474   15   16  1960   21%  2705   24%
  37 Gaviota 0.80 x64             2360   26   27   960   11%  2719   15%


Gruß
Frank
Parent - - By Frank Quisinsky Date 2011-04-20 23:12 Edited 2011-04-20 23:17
Spielen wir mal ein wenig Alleinunterhalter ... in alter Manier

Im Grunde deutet sich jetzt nach 235 Partien das an, was schon aufgrund der anderen Rybka Setting Testerei festgestellt wurde.

Die folgenden Thesen:
Houdini wird mit mehr Bedenkzeit minimal schwächer.
Rybka Standard wird mit mehr Bedenkzeit minimal schwächer.
Rybka Settings wird mit mehr Bedenkzeit minimal stärker, allerdings sind verschiedene Resultate gegen sehr starke Gegnerschaft schwächer. Also mehr Punkte als das Standard Setting wird gegen schwächere Gegnerschaft erzielt. Da die schwächere Gegnerschaft in der Überzahl ist, was bei der hohen ELO bzw. dem Ratingplatz auch logisch erscheint, entsteht so etwas wie eine optische Täuschung.

Beispiel:
Houdini 1.5 x64 führt die Ratinglisten klar an.
Kommen aber jetzt mehr vergleichbare Gegner für Houdini, fällt die ELO etwas ab, deutlicher als bei einer Engine die z. B. in der Mitte einer Ratingliste auftaucht.

Insofern gaukeln uns die Listen vor ...
Houdini steht z. B. 30-40 ELO vor Platz 2 (Rybka 4.0 Setting) oder 60-70 ELO vor Platz 2 (Rybka 4.0 Standard).

Würde nun morgen ein Ruffian released, Ruffian hätte auch 3.000 ELO und mischt sich in die Liste ...
Ja dann steht Houdini z. B. 20-30 ELO vor ehemals Platz 2 (Rybka 4.0 Setting) oder 50-60 ELO vor Platz (Rybka 4.0 Standard).
Eine weitere starke Engine kommt hinzu und plötzlich geht die Zahl der dominierenden Engine leicht abwärts.

Hat auch wenig mit Anzahl der Partien zu tun!

Wer sich dafür interessiert ...
Einfach mal die SWCR Partiedatenbank herunterladen und Ratinglisten erstellen ohne derzeit Platz 2 und 3, und 4 und dann auf die Unterschiede achten.

Also, optische Täuschung, denn eine Engine ohne viel Konkurrenz (also viele andere Engines die nicht weiter als ca. maximal 40 ELO entfernt sind) wird uns immer eine leicht erhöhte ELO in einer Ratingliste vorgaukeln. Die Wahrheit ist eher ... einfach 10-15 ELO vom Ergebnis abziehen wenn eine Nummer 1 mehr als 40 ELO Vorsprung hat und selbst danach kaum weitere Konkurrenz vorhanden ist.

Alles was ich sagen möchte ist ...
Selbst wenn ich mit diesem Setting oder anderen Engines, die so weit oben stehen, bei wenig Konkurrenz, x tausend Partien spielen lassen würde, sehen wir dennoch diese "leichte" optische Täuschung. Vielleicht sollten wir eine Ratingliste einfach nicht nach den ELOs ablesen, wenn denn die Engines interessieren, die ganz oben, oder auch ganz unten in einer Liste stehen, sondern z. B. Aussagen treffen wie ...

Houdini ist Rybka kaum messbar sehr leicht überlegen oder ...
Stockfish liegt schon messbar hinter Houdini zurück.

Die reine ELO ist wirklich eher statistisch gesehen interessant aber nach wie vor ... so richtig gut ist dieses Bewertungssystem nicht.

Gruß
Frank

Prognose:
Rybka 4.1 x64 TD v1 sollte ca. bei 2.975 - 2.985 ELO landen.
Rybka 4.1 x64 wird nach 1.000 Partien wahrscheinlich noch um 3-5 ELO fallen.

Errechnete Prognosen aus dem Verlauf vom Test des Settings 4.0 Exp. 42 und 4.0 Exp. 61
Parent - - By Frank Quisinsky Date 2011-04-20 23:30
Hi,

zu der Prognose:

Würde dann letztendlich bedeuten:
Nach den obigen Ausführungen ...

Houdini vormals ca. 3.005 fällt ab auf 2.995

Also:

1. Houdini 1.5 2.995
2. Rybka 4.1 Setting 2.980
3. Rybka 4.1 default 2.960
3. Rybka 4.0 Setting 2.960

Und wenn jetzt rein hypothetisch eine Engine x mit 2.950 als neue Engine auftaucht ...
Dann werden die Abstände immer weiter minimaler zwischen den oben genannten Engines.

Um das zu verdeutlichen, bzw. zu versuchen das deutlicher herauszustellen spielen im aktuellen Spießroutenlauf 30 Engines.
Also auch wieder Fire 1.31 weil ich einfach mehr Engines benötige die so hohe Zahlen erreichen und natürlich auch noch mehr schwächere Gegnerschaft (ausreichend vorhanden).

Statistik Spielerei mit einer immer besser werdenden SWCR.

So genug für heute!
Weiterhin viel Spaß beim Beobachten vom "Erbsenzählen"

ELO verstehen oder besser gesagt, das beste draus machen und richtig deuten bzw. Fehler um interpretieren ist das Thema!

Gruß
Frank
Parent - - By Frank Quisinsky Date 2011-04-20 23:44 Edited 2011-04-20 23:49
Hi,

einer noch

Geht jetzt los, erste Schwelle erreicht und bei der Konstellation geht logischer Weise jetzt das Rating hoch ...
Also 40 Partien mehr sind gespielt und Exp. 79TD legt 7 ELO zu.
Es ist sehr viel spannender die eigentlich fast immer gleichen Entwicklungskurven (Engine abhängig) zu beobachten wenn noch wenige Partien gespielt sind. Wir sprechen zwar von Kaffeesatz lesen aber so magisch ist das ganze gar nicht und so voller Zufälle auch nicht. Wahrscheinlich wird sich langfristig wie beschrieben alles wieder schön einreihen wenn die Partien durch sind ... Setting liegt ca. 20 ELO vor Default.

Na ja, geirrt habe ich mich auch schon öfters, auch wenn es hier alles sehr logisch ausschaut.
Schaun wir mal wie es sich morgen Abend gestaltet. Sind dann ja schon über 500 Partien gespielt und die Sache wird schon sehr deutlich.

Und immer schön auf die Remisquote achten (Default zu Standard, bei Bayesian maßgebender als bei ELOstat und auch deutlich beeinflussender). Wäre z. B. die Remisquote jetzt nicht gleich zu dem Test bei Rybka 4.0 (Standard / default) würde die Prognose zusammenbrechen und dann wären einige Aussagen von mir schon wieder hinfällig ... dann lässt Kaffeesatz lesen eher wieder grüßen!

Code:
Rank Name                          Elo    +    - games score oppo. draws
   1 Houdini 1.5 x64              2998   18   18  1341   80%  2759   28%
   2 Rybka 4 x64 Exp. 42          2971   20   19  1240   80%  2721   25%
   3 Rybka 4.1 x64 Exp. 79TD v.1  2969   44   42   241   79%  2740   24%
   4 Rybka 4.1 x64                2964   27   26   566   77%  2753   31%
   5 Rybka 4 x64 Exp. 61          2962   21   20  1000   78%  2745   27%
   6 Houdini 1.03a x64            2950   22   21   920   79%  2720   29%
   7 IvanHoe B47cB x64            2949   26   26   575   76%  2757   36%
   8 Rybka 4 x64                  2940   17   17  1520   80%  2701   29%
   9 IvanHoe B49jA x64            2934   19   18  1160   76%  2740   34%
  10 IvanHoe B52aC x64            2924   21   21   880   77%  2729   34%
  11 Stockfish 1.9.1 JA x64       2907   18   17  1280   73%  2730   33%
  12 Stockfish 1.8.0 JA x64       2907   18   18  1200   75%  2716   33%
  13 Rybka 3 x64                  2906   23   22   840   78%  2689   28%
  14 Fire 1.31 x64                2904   21   20   928   74%  2724   36%
  15 Stockfish 2.0.1 JA x64       2902   25   25   574   70%  2759   38%
  16 Stockfish 1.7.1 JA x64       2898   19   19  1120   76%  2708   34%
  17 Critter 1.01 x64             2897   25   25   574   69%  2760   38%
  18 Stockfish 1.9.1 JA           2893   21   20   960   78%  2689   31%
  19 Rybka 4                      2891   19   18  1200   76%  2695   32%
  20 Critter 0.90 x64             2874   18   17  1200   68%  2743   37%
Parent - - By Frank Quisinsky Date 2011-04-21 00:13
Hey, habe ja doch noch einen ...

Wer ganz genau hinschaut ... auch mal IPON mit SWCR vergleicht wird folgendes feststellen.

Alle "neueren Engines" ... ob nun Critter, Stockfish, Houdini sind ja 20 ELO höher bewertet
Ups, wie kann das denn sein?

Das ist recht interessant und deutet noch auf einen anderen Umstand hin.
Liegt wahrscheinlich wirklich an dem sehr aggressiven Pruning, Null-Move, NL etc.

Spekulativer bedeutet beim schnellen Schach minimale Vorteile zu vielen anderen Engines, die nicht so spekulativ bzw. nach vielen der offenbar ELO steigernden Entwicklungen der letzten beiden Jahre agieren. Im Umkehrschluss gleichen sich mit mehr Zeit viele andere Engines an. Während die spekulativen eher etwas über rechnen benötigen die langsameren weniger spekulativen Engines etwas mehr Zeit. Dies zu messen ist schier unmöglich aber wenn Listen mit unterschiedlichen Zeiten verglichen werden wird es deutlicher. Vermute selbst ca. einen Vorteil von 20 ELO maximal beim schnelleren Schach. Fraglich ist, wie es z. B. im Turnierschach ausschaut.

Beispiel:
Stockfish, Houdini, Critter sind im Blitz einer anderen Engine ca. 150, 100, 100 ELO überlegen.
beim Schellschach sind es dann plötzlich 130, 80, 80 ELO.

Und jetzt die Frage aller Fragen ... wie schaut es beim Turnierschach aus.
Vermute das sich irgend wann kaum noch etwas regt, zumindest sehe ich nach meinen Analysen nichts, maximal dann nochmals 10 und nur im Einzelfall dann mal bis zu 30 ELO.
Also durchschnittlich vielleicht 120, 70, 70 ELO.

Es ist einfach unglaublich wenn die Suche beobachtet wird.
Gerade bei Houdini, Critter und Stockfish ... wie schnell und nach wie wenig Sekunden die hohen Suchtiefen erreicht werden.
Während andere Engine wirklich viel länger brauchen und sich von Ply zu Ply hochzukämpfen schaut es bei den spekulativen eher so aus ... sehr sehr schnell sehr tief, dann auch in den normalen Abständen Ply tiefer und oftmals werden dabei Kombinationen die langsame Engines beim Kampf und den Ply more errechnen einfach überrechnet. So könnte zumindest auch logischer erklärt werden warum die "moderneren Engines" in Blitz-Listen kontinuierlich 20 ELO besser abschneiden als in der SWCR bei mittleren Bedenkzeiten.

Schade ist, dass ich die SWCR nicht mit 40 in 20 vor ca. 1 1/2 Jahren gestartet habe, würde so im Vergleich zu IPON noch deutlicher werden.
Aber es es drum.

Wirklich genug!
Ein CSS Forum Abend eingelegt und vielleicht entsteht ja noch eine spannende Diskussion denn trotz der ganzen Beschäftigung mit Statistiken müssen meine Ausführungen auch nicht total treffen. Aber es sind Gedankengänge, errechnete Statistiken und Eindrücke die beim Betreiben einer solcher Liste entstehen.

Frank
Parent - - By Frank Quisinsky Date 2011-04-21 07:52
Geht also wie vermutet weiter hoch ...
und vielleicht beginnt jetzt der Kampf um Platz 1.
Gehe aber davon aus das es nicht reichen wird.
Werden wahrscheinlich noch 15-20 ELO zwischen Platz 1 und 2 liegen, welche tatsächlich dann vielleicht 10 wären.

Mal schauen ...
Berichte heute Abend weiter!

Code:
Rank Name                          Elo    +    - games score oppo. draws
   1 Houdini 1.5 x64              2998   18   18  1343   80%  2759   28%
   2 Rybka 4.1 x64 Exp. 79TD v.1  2972   38   36   325   79%  2741   26%
   3 Rybka 4 x64 Exp. 42          2970   20   19  1240   80%  2720   25%
   4 Rybka 4.1 x64                2963   27   26   566   77%  2753   31%
   5 Rybka 4 x64 Exp. 61          2962   21   20  1000   78%  2744   27%
   6 Houdini 1.03a x64            2950   22   21   920   79%  2720   29%
   7 IvanHoe B47cB x64            2948   26   25   578   75%  2758   36%
   8 Rybka 4 x64                  2940   17   17  1520   80%  2701   29%
   9 IvanHoe B49jA x64            2934   19   18  1160   76%  2740   34%
  10 IvanHoe B52aC x64            2923   21   21   880   77%  2729   34%
  11 Stockfish 1.9.1 JA x64       2907   18   17  1280   73%  2730   33%
  12 Stockfish 1.8.0 JA x64       2907   18   18  1200   75%  2716   33%
  13 Rybka 3 x64                  2906   23   22   840   78%  2688   28%
  14 Fire 1.31 x64                2903   21   20   931   74%  2725   36%
  15 Stockfish 2.0.1 JA x64       2901   25   25   577   69%  2760   38%
  16 Critter 1.01 x64             2898   25   25   577   69%  2761   38%
  17 Stockfish 1.7.1 JA x64       2897   19   19  1120   76%  2708   34%
  18 Stockfish 1.9.1 JA           2893   21   20   960   78%  2689   31%
  19 Rybka 4                      2891   19   18  1200   76%  2696   32%
  20 Critter 0.90 x64             2873   18   17  1200   68%  2743   37%
  21 Stockfish 2.0.1 JA           2873   20   20  1000   76%  2680   34%
  22 Stockfish 1.7.1 JA           2873   18   18  1200   75%  2688   31%
  23 Critter 0.90                 2870   20   20  1000   76%  2680   32%
  24 Stockfish 1.8.0 JA           2862   20   20   920   74%  2695   37%
  25 Rybka 3                      2858   16   16  1520   74%  2687   31%
Parent - - By Rudolf Rohs Date 2011-04-21 11:01
Hallo Frank,

damit Du dich nicht ärgerst über den fehlenden Zu-/Wiederspruch will ich auch einmal was dazu sagen.
Du machst eine tolle Arbeit und bist sehr informativ, Danke hierfür.

Zu deinen Aussagen. Rein auf kurze Bedenkzeiten bringt das Setting einiges für die Elowertung, aber nicht für die Spielstärke.

Duch das agressivere Verhalten schlägt Rybka 4.1 jetzt schwächere Gegner noch gnadenloser in den Boden,
aber Hand aufs Herz die Engine ist nicht stärker geworden. Schau Dir mal deine 64-Rangliste an. Hier schlägt
Rybka 4.1 seinen Gegner Houdini 1.5 recht eindeutig. Mit dem Setting steht es bisher Unendschieden.
Oder anders ausgedrückt.

Wenn ich mit PC-Hilfe  gegen einen Gegner spiele will ich meinen Gegner möglichst bezwingen. Der wird mit ähnlichen
Gedanken  an die Partie rantreten. Damit kann ich davon ausgehen, daß er nur die stärksten Engines als Hilfsmittel ver-
wendet. Das Setting ist aber nur bei schwächeren Engines stärker und somit kontraproduktiv und uninteressant, würde
mich also nur interessieren, wenn ich eine Rangliste erstellen will und auch hier nur, wenn ich diese Rangliste nicht dafür
heranziehen würde, die stärkste Engine zu finden.

Im Fernschach z.B. kommt es häufiger zu Duellen. Da spielt dann Houdini 1.5 gegen Rybka 4.1 oder gegen Stockfish 2.0 etc..
Da interessiert es mehr, wie Houdini gegen Rybka direkt abschneidet und wo die Stärken und Schwächen der beiden Engines
liegen, als wie Beide gegen Umko abschneiden.
 
Sehr informativ ist da auch der Vergleich zwischen den Ranglisten, z.B. das Rybka 4.1 auf deiner Bedenkzeit Houdini 1.5 etwas
überlegen zu sein scheint, daß aber bei der längeren Bedenkzeit von Martin Thoresen Houdini letztendlich doch noch im Endspurt
an Rybka 4.1 vorbeizog und warscheinlich dort noch Vorteile besitzt.

Gruß

Rudolf Rohs
Parent - - By Frank Quisinsky Date 2011-04-21 16:12
Hi Rudolf,

problematisch ist, das sämtliche Thesen wirklich je nach Sichtweise auf dem Kopf gestellt werden können. In solchen Fällen neigen wir ja zu sagen, maßgeblich ist was hinten raus kommt.

Mit PC-Hilfe gegen einen Gegner:
Auf der anderen Seite, dieses Setting erspielt deutlich mehr sehenswerte Kombinationen als das Standard Setting. Mehr Gewinnpartien, mehr schnellere Siege und weniger Remispartien. Solche meist taktischen Einschläge sind bei Analysen sehr wichtig. Rybka übersieht einiges, gerade die Standard Settings. Auf der anderen Seite haben wir ja Engines die das auch besser machen als Rybka mit dem Setting, z. B. Spark, Stockfish etc..

Nehmen wir mal an GM hat eine neue Taktik und schneidet gegen 17 von 20 anderen GMs besser ab. Allerdings gegen 3 andere schwächer, die selbst zu den 5 besten gehören.

Tja, was wird er tun ...
Er ist Mensch und kann seine Taktik entsprechend einsetzen.

Was wir benötigen ist ein gutes 3-Hirn, gerade für den Bereich Fernschach. Das macht sehr viel mehr Sinn als z. b. mit 4-Cores auf Quad analysieren zu lassen. Dabei werden meist eh die Züge die übersehen werden nur schneller übersehen.

Aber wie gesagt, ist wirklich ein schwieriges Thema und Ansichtssache.
Vergleichen wir später mal die Ergebnisse wenn Rybka 4.1 default und Rybka 4.1 mit Ihren Spielen durch sind.

Bei der SWCR Champions-League gab es auch Licht und Schatten mit den Settings.
Zweischneidig wird es trotz aller gut gemeinten Versuche bleiben, was solls!

Und danke für die Komplimente ...

Werde gleich mal ausrechnen wie es jetzt ausschaut, sind glaube ich ca. 420 Partien gespielt!

Gruß
Frank
Parent - - By Frank Quisinsky Date 2011-04-21 16:27
Auszug aus der SWCR:

Code:
Rank Name                          Elo    +    - games score oppo. draws
   1 Houdini 1.5 x64              2997   19   18  1346   80%  2759   28%
   2 Rybka 4 x64 Exp. 42          2970   20   19  1240   80%  2720   25%
   3 Rybka 4.1 x64 Exp. 79TD v.1  2967   33   32   419   79%  2739   26%
   4 Rybka 4.1 x64                2964   27   26   566   77%  2753   31%
   5 Rybka 4 x64 Exp. 61          2962   21   20  1000   78%  2744   27%
   6 IvanHoe B47cB x64            2950   26   25   581   76%  2759   36%
   7 Houdini 1.03a x64            2950   22   21   920   79%  2720   29%
   8 Rybka 4 x64                  2940   17   17  1520   80%  2701   29%
   9 IvanHoe B49jA x64            2934   19   18  1160   76%  2740   34%
  10 IvanHoe B52aC x64            2923   21   21   880   77%  2729   34%
  11 Stockfish 1.8.0 JA x64       2907   18   18  1200   75%  2716   33%
  12 Stockfish 1.9.1 JA x64       2907   18   17  1280   73%  2730   33%
  13 Rybka 3 x64                  2906   23   22   840   78%  2688   28%
  14 Fire 1.31 x64                2904   20   20   934   74%  2725   36%
  15 Stockfish 2.0.1 JA x64       2901   25   25   580   69%  2761   38%
  16 Critter 1.01 x64             2898   25   24   580   69%  2762   38%
  17 Stockfish 1.7.1 JA x64       2897   19   19  1120   76%  2707   34%
  18 Stockfish 1.9.1 JA           2894   21   20   960   78%  2689   31%
  19 Rybka 4                      2891   19   18  1200   76%  2696   32%
  20 Stockfish 2.0.1 JA           2873   20   20  1000   76%  2680   34%
  21 Critter 0.90 x64             2873   18   17  1200   68%  2743   37%
  22 Stockfish 1.7.1 JA           2873   18   18  1200   75%  2688   31%
  23 Critter 0.90                 2870   20   20  1000   76%  2680   32%
  24 Stockfish 1.8.0 JA           2862   20   20   920   74%  2695   37%
  25 Rybka 3                      2858   16   16  1520   74%  2687   31%


Rating ging minimal zurück.
Jetzt wirds es richtig spannend bis Partiennummer 520 (Rating bildet sich um +-10, es sei denn wir haben einen 1/52 ... derzeit 1/54 Fall.
Wobei +-10 beim Messen eines Settings statistisch gesehen auch nicht sonderlich genau ist.
Na ja, kommen ja noch weitere Partien!

Gruß
Frank
Parent - - By Frank Quisinsky Date 2011-04-21 23:49
Hallo zusammen,

dachte schon es kommt zu einem Bruch der Serie, hätte die Prognose total auf dem Kopf gestellt.
Also, alles nimmt seinen bereits beschriebenen oder besser vermuteten Verlauf.
Interessant ist, dass Rybka 4.1 x64 Exp. 79TD v1 keine der letzten 58 Partien verloren hat.
Das Rating steigt also kontinuierlich an aber es steht jetzt schon fest, das Houdini 1.5 x64 nicht erreicht werden kann.

Hier ein Zwischenstand nach 500 Partien:

Code:
Rank Name                          Elo    +    - games score oppo. draws
   1 Houdini 1.5 x64              2997   18   18  1349   80%  2760   28%
   2 Rybka 4.1 x64 Exp. 79TD v.1  2978   30   29   502   79%  2741   25%
   3 Rybka 4 x64 Exp. 42          2970   20   19  1240   80%  2720   25%
   4 Rybka 4.1 x64                2964   27   26   566   77%  2753   31%
   5 Rybka 4 x64 Exp. 61          2962   21   21  1000   78%  2744   27%
   6 IvanHoe B47cB x64            2950   26   25   584   75%  2761   36%
   7 Houdini 1.03a x64            2950   22   21   920   79%  2720   29%
   8 Rybka 4 x64                  2940   17   17  1520   80%  2701   29%
   9 IvanHoe B49jA x64            2934   19   18  1160   76%  2740   34%
  10 IvanHoe B52aC x64            2923   21   21   880   77%  2729   34%
  11 Stockfish 1.9.1 JA x64       2907   18   17  1280   73%  2730   33%
  12 Stockfish 1.8.0 JA x64       2907   18   18  1200   75%  2716   33%
  13 Rybka 3 x64                  2906   23   22   840   78%  2688   28%
  14 Fire 1.31 x64                2903   20   20   937   74%  2726   36%
  15 Stockfish 2.0.1 JA x64       2902   25   24   583   69%  2763   38%
  16 Critter 1.01 x64             2898   25   24   583   69%  2763   38%
  17 Stockfish 1.7.1 JA x64       2897   19   19  1120   76%  2707   34%
  18 Stockfish 1.9.1 JA           2893   21   20   960   78%  2689   31%
  19 Rybka 4                      2891   19   18  1200   76%  2696   32%
  20 Stockfish 2.0.1 JA           2873   20   20  1000   76%  2680   34%
  21 Critter 0.90 x64             2873   18   17  1200   68%  2743   37%
  22 Stockfish 1.7.1 JA           2873   18   18  1200   75%  2688   31%
  23 Critter 0.90                 2870   20   20  1000   76%  2680   32%
  24 Stockfish 1.8.0 JA           2862   20   20   920   74%  2695   37%
  25 Rybka 3                      2858   16   16  1520   74%  2687   31%


In Anbetracht dessen, dass ich vermute das Rybka 4.1 x64 default bis zum Abschluss im laufenden SWCR-64 Update-Turnier noch 3-5 ELO verlieren wird könnte es zu den erwarteten 20-25 ELO Steigerung für das Exp. Setting zu dem Default Setting kommen. Insofern auch keine Sensation aber tatsächlich wird der Unterschied zwischen Rybka 4.1 Exp. 79 TD v1 und Houdini 1.5 dann kaum messbar sein.

Mal weiter abwarten.

Genug geschrieben für heute
Werde dann morgen berichten ... über Nacht wird sich das Rating dann wahrscheinlich endgültig gebildet haben.

Gruß
Frank
Parent - - By Frank Quisinsky Date 2011-04-22 00:01
Also derzeit Partiennummer 502:
In allen 8 laufenden Matches steht Rybka deutlich auf Gewinn ...
Nur mal so, es geht also weiter hoch!
Parent - - By Frank Quisinsky Date 2011-04-22 10:20
Code:
Rank Name                          Elo    +    - games score oppo. draws
   1 Houdini 1.5 x64              2997   18   18  1354   80%  2760   28%
   2 Rybka 4 x64 Exp. 42          2970   20   19  1240   80%  2720   25%
   3 Rybka 4.1 x64 Exp. 79TD v.1  2967   27   26   613   78%  2741   26%
   4 Rybka 4.1 x64                2964   27   26   567   77%  2753   31%
   5 Rybka 4 x64 Exp. 61          2962   21   21  1000   78%  2744   27%
   6 Houdini 1.03a x64            2950   22   21   920   79%  2720   29%
   7 IvanHoe B47cB x64            2950   26   25   588   75%  2762   36%
   8 Rybka 4 x64                  2940   17   17  1520   80%  2701   29%
   9 IvanHoe B49jA x64            2934   19   18  1160   76%  2740   34%
  10 IvanHoe B52aC x64            2923   21   21   880   77%  2729   34%
  11 Stockfish 1.8.0 JA x64       2907   18   18  1200   75%  2716   33%
  12 Stockfish 1.9.1 JA x64       2907   18   17  1280   73%  2730   33%
  13 Rybka 3 x64                  2906   23   22   840   78%  2688   28%
  14 Fire 1.31 x64                2903   20   20   941   74%  2727   36%
  15 Stockfish 2.0.1 JA x64       2903   25   24   587   69%  2764   39%
  16 Stockfish 1.7.1 JA x64       2897   19   19  1120   76%  2707   34%
  17 Critter 1.01 x64             2897   25   24   587   68%  2764   38%
  18 Stockfish 1.9.1 JA           2894   21   20   960   78%  2689   31%
  19 Rybka 4                      2891   19   18  1200   76%  2696   32%
  20 Stockfish 2.0.1 JA           2873   20   20  1000   76%  2680   34%
  21 Critter 0.90 x64             2873   18   17  1200   68%  2743   37%
  22 Stockfish 1.7.1 JA           2873   18   18  1200   75%  2688   31%
  23 Critter 0.90                 2870   20   20  1000   76%  2680   32%
  24 Stockfish 1.8.0 JA           2862   20   20   920   74%  2695   37%
  25 Rybka 3                      2858   16   16  1520   74%  2687   31%


Und nach der beschriebenen Serie erfolgte der Einbruch. Von Partienummer 520-550 gingen 8 ELO verloren.
Von 550 - 610 weitere 3.

Nach 20 ELO zu default schaut es nicht mehr aus, allerdings könnte das trotz der Partieanzahl noch passieren denn noch immer ist die Remisquote sehr gering.
Fest steht aber das Houdini nicht erreicht wird, auch dieses Setting deutlich aggressiver spielt.

Es werden deutlich mehr Schwarz als Weiß Partien verloren.
Die Weiß-Statistik ist gigantisch und die schwarz Statistik sehr sehr deutlich dahinter.

Die mehr Partien mit schwarz werden im frühen Endspiel verloren.
Würde bedeuten das dieses Setting nicht so richtig greift, zumindest nicht mit schwarz!

Schaun wir mal ...
Vielleicht kommt eine neue Serie aber ob die ELO jetzt noch deutlich steigt ist so gut wie ausgeschlossen.

Frank
Parent - - By Frank Quisinsky Date 2011-04-22 10:52
Hm ...

Korrektur, so gigantisch ist die weiß Statistik gar nicht.
Habe mich von den vielen Partien die mit schwarz zwischen Partiennummer 520 - 560 verloren wurden in die Irre führen lassen.

Hier mal eine Statistik:
Alle schwarz Partien aus der SWCR von Rybka 79 und Houdini 1.5 gelöscht.
Code:

Rank Name                          Elo    +    - games score oppo. draws
   1 Houdini 1.5 x64              3012   28   27   666   84%  2757   23%
   2 Rybka 4.1 x64 Exp. 79TD v.1  2981   42   40   296   84%  2732   24%
   3 Rybka 4 x64 Exp. 42          2973   20   19  1220   81%  2716   24%
   4 Rybka 4 x64 Exp. 61          2963   21   21   980   79%  2740   27%
   5 Rybka 4.1 x64                2962   28   27   556   78%  2748   30%
   6 Houdini 1.03a x64            2949   22   21   920   79%  2720   29%


31 ELO Unterschied, die interne weiß / schwarz Statistik für Rybka schaut auch völlig normal aus.
Unterschied bei allen Partien zwischen Rybka 79 und Houdini 1.5 beträgt wie in der Liste die vorher gepostet wurde 30 ELO.

Klarer Fehlalarm!

Na dann warten wir mal weiter ab denn aufgrund der niedrigen Remisquote könnte das noch etwas hoch gehen und es werden vielleicht 10-15 ELO Unterschied, allerdings liegt alles in einen kaum messbaren Bereich und interessanter werden daher die direkten Vergleiche. Aber auch hier ist wie bei den anderen Settings klar, mehr Punkte gegen schwächere, weniger gegen stärkere Engines als default.
Parent - - By Werner Schüle Date 2011-04-22 11:45
Hallo Frank,
danke für die Tests. Ich habe die Resultate bis jetzt auch verfolgt. Es sieht leider nicht so aus, wie wenn Houdini erreicht werden könnte.

Schöne Ostern!

Gruß
Werner
Parent - - By Frank Quisinsky Date 2011-04-22 13:11
Hi Werner,

nee, verdammt war die ganz Müh für die Katz
Dir auch schöne Ostern!

Obwohl ...
Steht derzeit wieder in allen 8 laufenden Matches auf Gewinn!
Aber jetzt muss wirklich eine richtig gute Serie her, so 50-100 Partien keine mehr verlieren.
Eine solche Serie gab es ja schon 2x während der bislang gespielten 650 Partien.
Problem ist nur, dass sich danach wieder alle TOPs gegenseitig absprechen und Rybka richtig leiden muss!



Gruß
Frank
Parent - - By Frank Quisinsky Date 2011-04-22 19:41
Hallo,

in den letzten ca. 70 Partien gab es 5 Niederlagen aber sehr viele Siege.
Die Performance geht also wieder nach oben.

Werden so wie es ausschaut ca. 10-15 ELO + zu Rybka 4 default werden.
Mal weiter abwarten aber ich denke es geht eher noch ein bissel nach oben als nach unten.

Code:
Rank Name                          Elo    +    - games score oppo. draws
   1 Houdini 1.5 x64              2998   18   18  1357   80%  2761   28%
   2 Rybka 4.1 x64 Exp. 79TD v.1  2971   25   25   719   79%  2739   25%
   3 Rybka 4 x64 Exp. 42          2970   20   19  1240   80%  2720   25%
   4 Rybka 4.1 x64                2964   27   26   567   77%  2753   31%
   5 Rybka 4 x64 Exp. 61          2962   21   20  1000   78%  2744   27%
   6 IvanHoe B47cB x64            2951   26   25   591   75%  2763   36%
   7 Houdini 1.03a x64            2950   22   21   920   79%  2720   29%
   8 Rybka 4 x64                  2940   17   17  1520   80%  2701   29%
   9 IvanHoe B49jA x64            2934   19   18  1160   76%  2740   34%
  10 IvanHoe B52aC x64            2924   21   21   880   77%  2729   34%
  11 Stockfish 1.9.1 JA x64       2907   18   17  1280   73%  2730   33%
  12 Stockfish 1.8.0 JA x64       2907   18   18  1200   75%  2716   33%
  13 Rybka 3 x64                  2906   23   22   840   78%  2688   28%
  14 Stockfish 2.0.1 JA x64       2904   25   24   590   69%  2765   38%
  15 Fire 1.31 x64                2903   20   20   944   74%  2728   36%
  16 Stockfish 1.7.1 JA x64       2897   19   19  1120   76%  2708   34%
  17 Critter 1.01 x64             2897   25   24   590   68%  2766   38%
  18 Stockfish 1.9.1 JA           2893   21   20   960   78%  2689   31%
  19 Rybka 4                      2891   19   18  1200   76%  2696   32%
  20 Critter 0.90 x64             2873   18   17  1200   68%  2743   37%
  21 Stockfish 2.0.1 JA           2873   20   20  1000   76%  2680   34%
  22 Stockfish 1.7.1 JA           2873   18   18  1200   75%  2688   31%
  23 Critter 0.90                 2870   20   20  1000   76%  2680   32%
  24 Stockfish 1.8.0 JA           2862   20   20   920   74%  2695   37%
  25 Rybka 3                      2858   16   16  1520   74%  2687   31%


Gruß
Frank
Parent - - By Frank Quisinsky Date 2011-04-22 22:01
Code:
Rank Name                          Elo    +    - games score oppo. draws
   1 Houdini 1.5 x64              2998   18   18  1358   80%  2761   28%
   2 Rybka 4.1 x64 Exp. 79TD v.1  2972   25   24   736   79%  2741   25% NEW
   - Rybka 4 x64 Exp. 42          2970   20   19  1240   80%  2720   25%
   - Rybka 4.1 x64                2964   27   26   567   77%  2753   31% NEW + 24
   - Rybka 4 x64 Exp. 61          2962   21   20  1000   78%  2744   27%
   3 IvanHoe B47cB x64            2950   26   25   592   75%  2763   36% NEW + 16


Und Punkt für Punkt kämpft sich das Setting wieder nach vorne.
Sofern die Remisquote weiterhin so niedrig bleibt sind noch 5-10 ELO nach oben möglich.

Gab gerade einen schönen Sieg von Hannibal gegen Rybka.
Denke ich lade die Datenbank Mitte nächster Woche hoch, wer nachspielen möchte.

Ansonsten gleichen sich die Ergebnisse immer mehr an bzw. punktet dieses Setting lediglich gegen Stockfish, IvanHoe, ChessTiger und Shredder schwächer.

Morgen unterbreche ich den Spießroutenlauf für 2 Tage, sind dann ca. 1.000 gespielt. Die restlichen 200 dann von Dienstag Abend bis Mittwoch Nachmittag.

Gruß
Frank
Parent - - By Frank Quisinsky Date 2011-04-23 09:03
Code:
Rank Name                          Elo    +    - games score oppo. draws
   1 Houdini 1.5 x64              2999   18   18  1362   80%  2762   28%
   2 Rybka 4.1 x64 Exp. 79TD v.1  2971   23   23   870   79%  2739   25%
   3 Rybka 4 x64 Exp. 42          2970   20   19  1240   80%  2720   25%
   4 Rybka 4.1 x64                2964   27   26   567   77%  2753   31%
   5 Rybka 4 x64 Exp. 61          2962   21   20  1000   78%  2744   27%
   6 IvanHoe B47cB x64            2950   26   25   596   75%  2765   36%
   7 Houdini 1.03a x64            2950   22   21   920   79%  2720   29%
   8 Rybka 4 x64                  2940   17   17  1520   80%  2701   29%
   9 IvanHoe B49jA x64            2934   19   18  1160   76%  2740   34%
  10 IvanHoe B52aC x64            2924   21   21   880   77%  2729   34%
  11 Stockfish 1.8.0 JA x64       2907   18   18  1200   75%  2716   33%
  12 Stockfish 1.9.1 JA x64       2907   18   17  1280   73%  2730   33%
  13 Rybka 3 x64                  2906   23   22   840   78%  2689   28%
  14 Fire 1.31 x64                2904   20   20   949   74%  2730   36%
  15 Stockfish 2.0.1 JA x64       2903   24   24   595   69%  2767   38%
  16 Stockfish 1.7.1 JA x64       2898   19   19  1120   76%  2708   34%
  17 Critter 1.01 x64             2897   25   24   595   68%  2767   38%
  18 Stockfish 1.9.1 JA           2893   21   20   960   78%  2689   31%
  19 Rybka 4                      2891   19   18  1200   76%  2695   32%
  20 Critter 0.90 x64             2873   18   17  1200   68%  2743   37%
  21 Stockfish 2.0.1 JA           2873   20   20  1000   76%  2680   34%
  22 Stockfish 1.7.1 JA           2873   18   18  1200   75%  2688   31%
  23 Critter 0.90                 2870   20   20  1000   76%  2680   32%
  24 Stockfish 1.8.0 JA           2862   20   20   920   74%  2695   37%
  25 Rybka 3                      2858   16   16  1520   74%  2687   31%


150 Partien mehr sind gespielt und 1 ELO wurde verloren.
Am späten Nachmittag dann der letzte Zwischenstand before ich den Spießroutenlauf für 3 Tage unterbreche.

Viele Grüße
Frank
Parent - - By Frank Quisinsky Date 2011-04-23 16:16
Hier noch der letzte Zwischenstand:
Spießroutenlauf wurde für 3 Tage untebrochen.
Die restlichen 262 werden dann am Dienstag Abend gestartet.

Code:
Rank Name                          Elo    +    - games score oppo. draws
   1 Houdini 1.5 x64              2998   18   18  1365   80%  2761   28%
   2 Rybka 4 x64 Exp. 42          2969   20   19  1240   80%  2719   25%
   - Rybka 4.1 x64 Exp. 79TD v.1  2968   22   22   938   79%  2739   25% NEW
   - Rybka 4.1 x64                2963   27   26   567   77%  2752   31% NEW + 24
   - Rybka 4 x64 Exp. 61          2961   21   20  1000   78%  2743   27%
   3 IvanHoe B47cB x64            2950   26   25   599   75%  2765   36% NEW + 17
   - Houdini 1.03a x64            2949   22   21   920   79%  2719   29%
   - Rybka 4 x64                  2939   17   17  1520   80%  2700   29%
   - IvanHoe B49jA x64            2933   19   18  1160   76%  2739   34%
   - IvanHoe B52aC x64            2923   21   21   880   77%  2728   34%
Parent - By Frank Quisinsky Date 2011-04-27 06:12
Hallo zusammen,

die abschließenden Ergebnisse und Partien liegen auf meinen Webseiten.
Fortgesetzt wird die SWCR nun wieder mit dem noch nicht beendeten SWCR-64 Update-Turnier.

Insbesondere wird interessant sein ob Rybka 4.1 x64 default nun noch steigt oder fällt (für den direkten Vergleich zum getesteten Setting).

Gruß
Frank
Parent - - By Benno Hartwig Date 2011-04-21 08:53
[quote="Frank Quisinsky"]Spielen wir mal ein wenig Alleinunterhalter ... in alter Manier [/quote]Tue es, mache gern weiter die Ingrid!
Im Ernst: ich denke schon, dass du mit deinen Berichten hier von manchem mit Interesse gelesen wirst!
Thanx und viele Grüße
Benno
Parent - By Frank Quisinsky Date 2011-04-21 16:00
Hi Benno,

kann leider derzeit nicht erkennen ob von diesem Forum Interessierte auf meine Webseite klicken, interessiert mich ehrlich gesagt auch nicht so wirklich. Wenn hier einer ein Interesse daran hat ist doch das Ziel schon erfüllt. Was ich sagen kann ist, dass im letzten Monat durchschnittlich in der Woche 410 unterschiedliche IPs auf meiner Webseite waren. Im Monat davor waren es 420. Während der SWCR Champions-League waren es um die 1.750. Finde für eine Ratingliste und dieser einfachen Webseite ist das ja ganz OK. Auch kommen ca. 5x mehr Anfragen zu den Listen, Ideen und Vorschläge über eMail.

Wollte eigentlich mit den vielen Beiträgen ein wenig das Forum beleben und über Ostern ein kleines Event anbieten. Auch wenn die Ergebnisse der getesteten Engine eigentlich klar sein werden ... ist immer wieder spannend etwas erneut festzustellen.

Dir und Deiner Familie schöne Ostertage!

Viele Grüße
Frank
Up Topic Hauptforen / CSS-Forum / Rybka 4.1 x64 Exp. 79TD v1 Spießroutenlauf mit 1.200 Partien

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill