Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / IPON RRRL 1 + 1
- - By Ingo Bauer Date 2012-12-21 16:54
Hallo,

Da Toga jetzt ausgefallen ist habe ich mal aus purer Langeweile ein 1 + 1 unter IPON-Bedinungen gestartet.

Das ganze ist ziemlich Sinnfrei, es dient lediglich dazu mal zu sehen ob sich etwas anders einreiht. gute 10% sind durch und war es zu Anfang noch ziemlich konfus kommt doch so langsam Sinn rein.

Man sieht vorne immer das Rating der Engines bei 5 + 3 und hinten die bisherige PErformance. Man kann also leicht sehen wer besser und wer schlechter mit dieser kurzen Bedenkzeit zurechtkommt.




















Rank Name Hou Kom Dee Cri StoHIA Chi Dee Gul Nau Han spa Spi Pro Dee Dee Qua Zap Min PointsS-B%Perf
1 Houdini 3 STD (3090) X 9.5 13.5 12.5 10.5 13.0 15.0 13.0 15.5 15.0 11.5 14.0 15.0 13.0 14.0 15.5 15.5 15.5 15.5 247.0 / 289 33095.7585.47%3131
2 Komodo 5 (3007) 6.5 X 8.0 10.0 8.0 14.0 11.5 12.0 15.0 13.0 12.5 14.0 15.5 15.5 14.5 15.0 14.0 15.0 15.5 229.5 / 288 29824.7579.69%3066
3 Deep Rybka 4.1 (2963) 2.5 8.0 X 9.5 8.0 11.0 12.0 12.5 13.5 14.5 11.5 13.0 13.0 12.5 14.0 14.0 15.5 13.0 15.0 213.0 / 288 27448.7573.96%3012
4 Critter 1.4a (2986) 3.5 6.0 6.5 X 9.5 13.0 11.5 14.5 11.5 8.5 12.0 13.5 13.0 11.5 13.0 13.5 15.0 15.0 12.5 203.5 / 288 26162.2570.66%2982
5 Stockfish 2.2.2 JA (2968) 5.5 8.0 8.0 6.5 X 12.5 10.0 10.5 12.0 12.0 11.0 11.5 9.0 13.5 14.5 10.5 13.5 13.0 14.5 196.0 / 288 25737.2568.06%2962
6 HIARCS 14 WCSC 32b (2824) 3.0 2.0 5.0 3.0 3.5 X 9.5 8.5 10.0 8.0 12.0 9.0 8.5 11.0 8.5 9.0 11.0 11.0 13.5 146.0 / 288 18266.7550.69%2843
7 Chiron 1.5 (2851) 1.0 4.5 4.0 4.5 6.0 6.5 X 9.5 7.0 8.0 8.0 9.0 13.0 11.0 8.0 12.5 10.5 9.5 11.5 144.0 / 288 18194.7550.00%2838
8 Deep Shredder 12 (2800) 3.0 4.0 3.5 1.5 5.5 7.5 6.5 X 7.0 8.0 12.5 8.5 10.0 10.5 10.0 8.5 11.5 9.5 12.5 140.0 / 288 17628.2548.61%2832
9 Gull 1.2 (2801) 1.5 1.0 2.5 4.5 4.0 6.0 9.0 9.0 X 8.0 6.0 11.0 10.0 11.0 11.0 10.5 11.0 11.5 10.5 138.0 / 289 16913.5047.75%2826
10 Naum 4.2 (2840) 1.0 3.0 1.5 7.5 4.0 8.0 8.0 8.0 8.0 X 8.5 8.5 8.5 10.5 6.5 9.5 10.0 10.0 14.0 135.0 / 288 16926.7546.88%2817
11 Hannibal 1.2 (2801) 4.5 3.5 4.5 4.0 5.0 4.0 8.0 3.5 10.0 7.5 X 9.0 6.5 7.5 7.0 8.0 14.0 10.0 9.5 126.0 / 288 16403.7543.75%2797
12 spark-1.0 (2771) 2.0 2.0 3.0 2.5 4.5 7.0 7.0 7.5 5.0 7.5 7.0 X 9.5 7.0 11.0 11.0 9.0 10.5 8.5 121.5 / 288 15225.5042.19%2788
13 Spike 1.4 32b (2780) 1.0 0.5 3.0 3.0 7.0 7.5 3.0 6.0 6.0 7.5 9.5 6.5 X 7.5 8.5 10.5 9.5 11.0 9.0 116.5 / 288 14503.0040.45%2775
14 Protector 1.4.0 (2763) 3.0 0.5 3.5 4.5 2.5 5.0 5.0 5.5 5.0 5.5 8.5 9.0 8.5 X 8.5 9.0 12.5 10.5 9.5 116.0 / 288 14388.0040.28%2775
15 Deep Sjeng c't 2010 32b (2792) 2.0 1.5 2.0 3.0 1.5 7.5 8.0 6.0 5.0 9.5 9.0 5.0 7.5 7.5 X 11.5 7.0 12.0 8.0 113.5 / 288 14083.2539.41%2767
16 Deep Junior 13.3 (2755) 0.5 1.0 2.0 2.5 5.5 7.0 3.5 7.5 5.5 6.5 8.0 5.0 5.5 7.0 4.5 X 7.5 7.0 8.5 94.5 / 288 12102.5032.81%2719
17 Quazar 0.4 (2736) 0.5 2.0 0.5 1.0 2.5 5.0 5.5 4.5 5.0 6.0 2.0 7.0 6.5 3.5 9.0 8.5 X 9.0 9.0 87.0 / 286 10628.0030.42%2702
18 Zappa Mexico II (2709) 0.5 1.0 3.0 1.0 3.0 5.0 6.5 6.5 4.5 6.0 6.0 5.5 5.0 5.5 4.0 9.0 6.0 X 6.5 84.5 / 286 10798.0029.55%2696
19 MinkoChess 1.3 (2701) 0.5 0.5 1.0 3.5 1.5 2.5 4.5 3.5 5.5 2.0 6.5 7.5 7.0 6.5 8.0 7.5 6.0 8.5 X 82.5 / 286 10146.2528.85%2691





2734 out of 25650 games played

Level: 1 Minutes/Game + 1 Seconds/Move

Immer wenn ich Zeit habe lasse ich das mal etwas laufen.

Gruß
Ingo

Parent - - By Ingo Bauer Date 2012-12-22 07:23
So, ich mache jetzt erstmal Pause, aber hier ein Zwischenstand:






















Rank Name Hou Kom Cri Dee Sto Chi HIA Nau Gul Dee Han spa Spi Dee Pro Dee Qua Min Zap PointsS-B%Perf
1 Houdini 3 STD (3090) X 25.0 29.5 31.5 28.5 34.0 35.5 36.5 37.0 35.5 32.5 36.5 36.5 35.5 37.0 39.0 40.0 39.5 40.0 629.5 / 737 210858.5085.41%3131
2 Komodo 5 (3007) 15.0 X 22.0 25.5 23.5 30.0 32.0 32.0 37.0 30.0 34.0 33.5 39.0 35.0 38.5 37.0 34.5 38.0 38.0 574.5 / 737 188413.0077.95%3048
3 Critter 1.4a (2986) 11.5 19.0 X 20.5 23.5 31.5 30.0 30.0 30.0 33.0 30.0 33.5 33.5 32.5 32.0 36.0 37.0 33.5 36.5 533.5 / 735 174173.2572.59%3000
4 Deep Rybka 4.1 (2963) 9.5 15.5 20.5 X 21.5 27.5 30.0 32.0 33.0 32.0 27.0 31.0 31.5 32.5 27.0 36.0 35.5 35.0 34.0 511.0 / 721 165988.2570.87%2986
5 Stockfish 2.2.2 JA (2968) 12.5 17.5 17.5 18.5 X 27.0 29.5 29.0 29.0 26.0 27.5 30.5 29.5 31.5 32.5 25.5 33.5 38.0 34.5 489.5 / 721 160116.2567.89%2962
6 Chiron 1.5 (2851) 7.0 11.0 9.5 11.5 13.0 X 17.5 20.0 20.0 23.0 20.0 22.5 25.0 23.0 26.5 27.5 31.0 27.0 27.5 362.5 / 720 115832.2550.35%2841
7 HIARCS 14 WCSC 32b (2824) 5.5 9.0 11.0 10.0 10.5 22.5 X 19.5 24.0 21.5 25.0 22.0 24.0 21.5 26.0 26.0 26.5 31.0 27.0 362.5 / 722 114946.2550.21%2841
8 Naum 4.2 (2840) 4.5 9.0 11.0 8.0 11.0 20.0 20.5 X 21.0 24.5 23.0 22.0 25.5 20.5 26.0 26.0 27.0 27.5 28.0 355.0 / 722 112220.2549.17%2834
9 Gull 1.2 (2801) 4.0 4.0 11.0 7.0 11.0 20.0 15.0 19.0 X 21.0 16.5 27.5 23.0 22.5 26.0 24.0 25.5 28.0 27.0 332.0 / 717 103681.2546.30%2817
10 Deep Shredder 12 (2800) 5.5 11.0 8.0 8.0 13.0 17.0 18.5 15.5 19.0 X 23.0 24.0 23.5 22.5 19.5 23.5 24.0 28.0 25.0 328.5 / 721 105314.7545.56%2811
11 Hannibal 1.2 (2801) 8.5 7.0 11.0 12.0 12.5 20.0 15.0 17.0 23.5 17.0 X 18.0 18.5 18.5 22.5 25.5 27.0 23.5 28.0 325.0 / 722 105431.2545.01%2807
12 spark-1.0 (2771) 4.5 7.5 7.5 9.0 9.5 17.5 18.0 17.0 12.5 16.0 22.0 X 22.0 20.5 23.0 27.0 26.5 25.0 27.0 312.0 / 722 98182.5043.21%2796
13 Spike 1.4 32b (2780) 4.5 2.0 7.5 8.5 9.5 15.0 16.0 14.5 17.0 16.5 21.5 18.0 X 23.0 19.5 25.5 24.0 27.0 27.0 296.5 / 722 92046.2541.07%2780
14 Deep Sjeng c't 2010 32b (2792) 5.5 6.0 8.5 7.5 8.5 17.0 18.5 19.5 17.5 16.5 21.5 19.5 17.0 X 18.0 25.0 17.5 23.0 26.0 292.5 / 721 93764.7540.57%2776
15 Protector 1.4.0 (2763) 4.0 2.5 9.0 13.0 7.5 12.5 14.0 14.0 12.0 20.5 17.5 17.0 20.5 22.0 X 21.5 28.5 25.0 26.5 287.5 / 719 90133.2539.99%2774
16 Deep Junior 13.3 (2755) 2.0 4.0 5.0 4.0 14.5 11.5 14.0 14.0 15.0 16.5 14.5 13.0 14.5 14.0 18.5 X 19.0 22.0 20.0 236.0 / 720 75507.7532.78%2720
17 Quazar 0.4 (2736) 1.0 6.5 3.0 4.5 6.5 9.0 13.5 13.0 14.5 16.0 13.0 13.5 16.0 22.5 10.5 21.0 X 26.0 22.0 232.0 / 721 71901.7532.18%2716
18 MinkoChess 1.3 (2701) 1.5 3.0 6.5 5.0 2.0 13.0 9.0 12.5 12.0 12.0 16.5 15.0 13.0 17.0 15.0 18.0 14.0 X 24.0 209.0 / 722 65534.0028.95%2692
19 Zappa Mexico II (2709) 1.0 3.0 3.5 6.0 5.5 12.5 13.0 12.0 11.0 15.0 12.0 13.0 13.0 14.0 13.5 20.0 18.0 16.0 X 202.0 / 720 64088.5028.06%2683





6871 out of 25650 games played

Level: 1 Minutes/Game + 1 Seconds/Move

Interessant wie sich alles genau dahinbewegt wo es auch bei 5 + 3 liegt. Der "Bruch", also die Stelle an der z.B. auffallen muß das die Unterschiedlichen Zuggeneratoren unterschiedliche Zeit benötigen (Pro Zug + pro Knoten) muß tiefer liegen. Womöglich gibt es noch andere Faktoren die reinspielen.

To be continued
Ingo

Parent - - By Thomas Müller Date 2012-12-22 08:26
Hi Ingo,

das bei dem "turnier" nicht viel anderes rauskommt wie bei deiner liste war doch aber vorher schon klar!?
Zumindest bei so vielen partien. Hab die reihenfolge jetzt nicht quer geprüft, aber sieht doch aus wie immer
Du sagst doch selber immer "zeitfaktor" ist wurscht wenn ich mich erinnere?

gruß thomas
Parent - - By Ingo Bauer Date 2012-12-22 08:39
[quote="Thomas Müller"]
Hi Ingo,

das bei dem "turnier" nicht viel anderes rauskommt wie bei deiner liste war doch aber vorher schon klar!?
Zumindest bei so vielen partien. Hab die reihenfolge jetzt nicht quer geprüft, aber sieht doch aus wie immer
Du sagst doch selber immer "zeitfaktor" ist wurscht wenn ich mich erinnere?

gruß thomas
[/quote]

Im Groben sieht es so aus wie die normale IPON-RRRL, ja.

"Zeitfaktor ist wurscht" stimmt, aber glaube ich an die Einschränkung das es eine Untergrenze gibt. Bsp: Zuggenerator. Für jeden Knoten werden alle möglichen Antwortzüge ermittelt und (vielleicht) schon sortiert. Das dauert immer gleich lang, ist aber in den Engines unterschiedlich implementiert. Wenn du nun die Zeitkontrolle so weit nach unten regelst das die Engines mit dem langsamten Zuggenerator einen großen Teil ihrer Bedenkzeit damit verbringen Züge zu generieren während andere noch Zeit haben diese auch zu bewerten sollte an dieser Stelle ein Bruch passieren ... Alles theoretisch und offensichtlich bei 1 + 1 noch nicht der Fall. (Aber das muß komplett gespielt werden, dann mal auf Rate der Zeitverlustspiele und die Remisquote schauen)
Interessant ist es aber weil man eigentlich für eine Rangliste, also wenn man sich nicht für die Spiele interessiert, so Zeit (und Geld) sparen könnte, oder eine kleine Liste machen könnte die mehr als die TOP 20 enthält ... erstmal Datanbasis schaffen, dann sehe ich weiter.

Gruß
Ingo
Parent - - By Ingo Bauer Date 2012-12-26 06:19
Gut 50%:






















Rank Name Hou Kom Cri Dee Sto Chi Nau HIA Gul Dee Han spa Dee Spi Pro Dee Qua Zap Min PointsS-B%Perf
1 Houdini 3 STD (3090) X 54.5 54.5 59.0 53.0 67.0 73.5 68.0 74.5 71.5 65.0 69.0 69.5 74.0 76.0 77.0 76.5 78.0 76.5 1237.0 / 1458 830554.0084.84%3123
2 Komodo 5 (3007) 26.5 X 40.0 47.0 49.0 62.0 65.0 61.5 69.5 62.0 62.5 66.5 65.0 73.0 73.0 69.5 67.0 72.0 70.5 1101.5 / 1458 726102.5075.55%3024
3 Critter 1.4a (2986) 26.5 41.0 X 44.0 48.0 58.0 62.5 60.0 60.5 66.0 58.5 65.5 62.0 64.5 63.0 70.5 74.5 71.5 70.5 1067.0 / 1458 703901.5073.18%3004
4 Deep Rybka 4.1 (2963) 22.0 34.0 37.0 X 42.5 59.0 60.0 56.5 64.5 60.0 61.0 63.5 64.5 62.5 60.0 65.5 65.0 67.5 72.0 1017.0 / 1446 665905.7570.33%2981
5 Stockfish 2.2.2 JA (2968) 28.0 32.0 33.0 38.5 X 57.5 53.0 59.0 59.0 52.0 60.5 63.5 62.0 63.5 67.0 56.0 70.5 68.0 72.0 995.0 / 1449 651135.2568.67%2968
6 Chiron 1.5 (2851) 14.0 19.0 23.0 21.0 23.5 X 41.0 39.0 45.5 47.5 41.5 46.5 43.5 48.0 51.5 58.5 55.0 52.5 59.0 729.5 / 1444 467842.0050.52%2841
7 Naum 4.2 (2840) 7.5 16.0 18.5 20.0 27.0 39.0 X 44.5 43.0 44.5 48.5 46.5 42.0 49.0 51.5 51.0 53.0 57.0 55.0 713.5 / 1443 453257.2549.45%2836
8 HIARCS 14 WCSC 32b (2824) 13.0 19.5 21.0 24.5 22.0 41.0 35.5 X 46.5 42.5 44.5 42.0 46.0 47.0 47.5 54.0 49.0 52.5 59.0 707.0 / 1445 455518.7548.93%2833
9 Gull 1.2 (2801) 6.5 11.5 20.5 15.5 22.0 34.5 37.0 33.5 X 46.5 37.0 50.5 46.5 50.0 53.5 45.5 54.5 53.0 51.5 669.5 / 1444 421824.2546.36%2816
10 Deep Shredder 12 (2800) 9.5 19.0 15.0 20.0 28.0 32.5 35.5 37.5 33.5 X 43.5 44.5 49.0 45.5 44.0 48.0 49.5 53.5 57.5 665.5 / 1443 425919.7546.12%2814
11 Hannibal 1.2 (2801) 16.0 18.5 22.5 20.0 20.5 38.5 31.5 35.5 43.0 36.5 X 35.5 41.0 38.0 42.5 48.0 53.0 56.5 46.0 643.0 / 1445 419230.2544.50%2803
12 spark-1.0 (2771) 12.0 14.5 15.5 16.5 16.5 33.5 33.5 38.0 29.5 35.5 44.5 X 42.5 43.5 49.0 47.0 49.5 54.0 50.0 625.0 / 1442 397236.5043.34%2797
13 Deep Sjeng c't 2010 32b (2792) 11.5 16.0 19.0 15.5 18.0 36.5 38.0 34.0 33.5 31.0 39.0 37.5 X 41.0 35.5 47.0 46.5 52.5 50.5 602.5 / 1443 388267.0041.75%2784
14 Spike 1.4 32b (2780) 7.0 8.0 16.5 17.5 16.5 32.0 31.0 33.0 30.0 34.5 42.0 36.5 39.0 X 44.5 48.0 43.5 51.0 50.5 581.0 / 1443 367098.5040.26%2774
15 Protector 1.4.0 (2763) 5.0 8.0 18.0 20.0 13.0 28.5 28.5 32.5 26.5 36.0 37.5 31.0 44.5 35.5 X 45.0 46.0 49.0 45.5 550.0 / 1443 349134.2538.12%2759
16 Deep Junior 13.3 (2755) 4.0 11.5 10.5 14.5 25.0 21.5 29.0 26.0 34.5 32.0 32.0 32.0 33.0 32.0 35.0 X 38.5 42.5 46.5 500.0 / 1443 322333.2534.65%2734
17 Quazar 0.4 (2736) 4.5 14.0 6.5 15.0 10.5 25.0 27.0 31.0 25.5 30.5 27.0 30.5 33.5 36.5 34.0 41.5 X 45.0 48.5 486.0 / 1444 307317.0033.66%2728
18 Zappa Mexico II (2709) 3.0 9.0 9.5 12.5 13.0 27.5 23.0 27.5 27.0 26.5 23.5 26.0 27.5 29.0 31.0 37.5 35.0 X 37.5 425.5 / 1444 274467.0029.47%2695
19 MinkoChess 1.3 (2701) 4.5 10.5 10.5 8.0 6.0 21.0 25.0 21.0 28.5 22.5 34.0 30.0 29.5 29.5 34.5 33.5 31.5 42.5 X 422.5 / 1441 269143.2529.32%2694





13738 out of 25650 games played

Level: 1 Minutes/Game + 1 Seconds/Move

Eigentlich ist es schon erschreckend wie identisch das zur 5fachen Zeit bei 5 + 3 der IPON RRRL ist ... diejenigen die immer noch glauben das ihre Engine mehr Zeit braucht werden es schwer haben .... oder müssen mal mit echten Zahlen kommen

Gruß
Ingo

Parent - By Stefan Pohl Date 2012-12-26 11:12
[quote="Ingo Bauer"]

Eigentlich ist es schon erschreckend wie identisch das zur 5fachen Zeit bei 5 + 3 der IPON RRRL ist ... diejenigen die immer noch glauben das ihre Engine mehr Zeit braucht werden es schwer haben .... oder müssen mal mit echten Zahlen kommen

Gruß
Ingo
[/quote]

So isses. Den einzig meßbaren Effekt, den man mit mehr Zeit hat, ist, daß alle Ergebnisse etwas dichter an die 50%-Marke rücken. Dadurch entsteht bei weniger Zeit eine Art "Zieharmonika-Effekt", der die Rangliste spreizt (was die Abstände angeht), aber eben nicht die Rangfolge. Sehr schön konnte man das bei meinem Umstieg auf die doppelte Zeit in der LS-Rangliste beobachten. Hier noch mal mein Posting diesbzgl.:

nachdem ich nun auch mal die alte (20''+250ms) und die neue LS-best-Liste (45''+500ms) verglichen habe (danke Frank für die Anregung!) fällt folgendes auf:

1) Der Abstand von der besten zur schlechtesten Engine wird insgesamt etwas geringer. Das war zu erwarten, denn je mehr Bedenkzeit, desto mehr rücken alle Einzelergebnisse tendenziell an die 50%-Marke heran. (Was ja auch der Grund dafür ist, daß Junior mit mehr Zeit gegen die besten Gegner nichtmehr ganz so grausam eingeht. Das nährt dann die Illusion, er würde mit mehr Bedenkzeit besser spielen. Gleiches gilt für Hiarcs).
2) Die einzige Engine die mit mehr Zeit wirklich stark zulegt, ist Stockfish 2.2.2 (+21 Elo!), aber eben nicht Komodo 5 (nur +8), letzteres versuchen die Komodo-Entwickler ja immer zu propagieren, aber da ist wohl mehr der Wunsch der Vater des Gedanken...
3) Die einzige Engine, die wirklich mit mehr Zeit meßbar abbaut ist Houdini 2.0c (-14 Elo).
4) Alle anderen Ergebnisse schwanken zwischen beiden Listen nur sehr gering und kaum außerhalb der Errorbar.
5) Die Remisquoten steigen mit der längeren Bedenkzeit bei allen Engines um ca. 3% an. Auch das war mit steigender Bedenkzeit zu erwarten, da das schachliche Niveau eben auch steigt.
6) Die Reihenfolge der Engines in beiden Listen bleibt gleich bis auf Stockfish, der in der neuen LS-best-Liste einen Platz gutmachen kann, da er mit mehr Zeit eben so stark zulegt.

Genau das ist ja auch der Grund, warum ich mit hohem Tempo (aber nicht ultraschnell) lieber mehr Partien spiele, als mit langen Bedenkzeiten wenig:
Das schachliche Niveau ist aus menschlicher Sicht so oder so unfaßbar hoch und spielt zudem für das Testen keine wirkliche Rolle, weil eben praktisch alle Engines mehr oder weniger gleich stark von mehr Zeit profitieren. Und das Ergebnis-Qualitäts-Niveau ist primär von der Anzahl der gespielten Partien abhängig. Daher halte ich mein jetziges Testtempo (45''+500ms) für optimal: ca. 2-3 Sekunden pro Zug bei vollem Brett und nie weniger als 0.5 Sekunden, egal wie lange die Partie sich hinzieht. Damit ist immer ausreichende Bedenkzeit vorhanden (0.5 Sekunden sind eine lange Zeit für eine Engine auf einem modernen Prozessor). Houdini 3 kommt bei mir auf eine durchschnittliche Mindest-Rechentiefe von 18.5 Halbzügen (gemittelt über alle Züge in allen Partien) und ich schaffe gute 2000 Partien in 24 Stunden (bei 4 parallel laufenden Spielen auf den 4 Cores meines Notebooks) auf nur einem PC.

Stefan
Parent - - By Ingo Bauer Date 2012-12-27 03:36
Rund 75%:






















Rank Name Hou Kom Cri Dee Sto Chi Nau HIA Dee Gul Han spa Dee Spi Pro Dee Qua Zap Min PointsS-B%Perf
1 Houdini 3 STD (3090) X 70.5 71.0 76.0 70.5 90.5 98.0 93.5 96.5 98.0 86.5 94.5 91.5 102.0 102.5 104.5 103.5 107.0 103.0 1659.5 / 1979 1513082.5083.86%3110
2 Komodo 5 (3007) 39.5 X 58.0 62.5 65.5 81.5 88.0 85.0 82.5 92.0 83.0 90.5 86.0 96.5 97.5 94.0 92.5 97.5 96.0 1488.0 / 1977 1341096.7575.27%3022
3 Critter 1.4a (2986) 39.0 52.0 X 58.0 62.5 76.5 84.0 82.5 87.5 81.0 81.5 88.5 84.5 89.5 86.5 95.5 98.0 97.5 96.0 1440.5 / 1980 1293804.7572.75%3000
4 Deep Rybka 4.1 (2963) 34.0 47.5 52.0 X 57.5 81.5 81.5 75.5 82.5 87.0 82.0 85.5 87.0 88.5 85.0 87.0 88.0 90.5 97.5 1390.0 / 1976 1245573.0070.34%2982
5 Stockfish 2.2.2 JA (2968) 39.5 44.5 47.5 52.5 X 76.0 73.0 80.0 73.0 81.0 82.0 86.0 83.0 89.5 90.5 76.5 94.0 90.5 97.5 1356.5 / 1978 1213824.7568.58%2966
6 Chiron 1.5 (2851) 18.5 27.5 33.5 28.5 34.0 X 55.0 55.5 62.0 61.5 61.0 65.5 62.5 69.5 68.5 81.0 73.5 71.5 81.0 1010.0 / 1965 884573.0051.40%2847
7 Naum 4.2 (2840) 12.0 22.0 26.0 28.5 37.0 55.0 X 61.5 60.0 60.0 62.5 60.0 58.0 65.0 67.5 72.0 72.0 77.0 76.5 972.5 / 1964 845549.2549.52%2836
8 HIARCS 14 WCSC 32b (2824) 16.5 25.0 27.5 34.5 30.0 53.5 47.5 X 54.5 60.0 57.5 57.0 60.0 64.5 62.0 70.5 70.5 71.0 79.0 941.0 / 1964 826311.7547.91%2826
9 Deep Shredder 12 (2800) 13.5 26.5 22.5 27.5 37.0 47.0 48.0 54.5 X 51.0 58.0 63.0 66.0 61.0 59.0 64.0 68.5 72.0 78.0 917.0 / 1965 802976.2546.67%2818
10 Gull 1.2 (2801) 12.0 18.0 29.0 22.0 29.0 47.5 48.0 47.0 58.0 X 52.0 68.0 58.0 64.0 73.0 65.5 70.0 75.0 70.5 906.5 / 1963 783552.2546.18%2815
11 Hannibal 1.2 (2801) 23.5 26.0 28.5 28.0 28.0 48.0 46.5 51.5 51.0 57.0 X 50.5 56.0 57.5 61.0 67.0 71.5 74.5 68.5 894.5 / 1966 792917.5045.50%2810
12 spark-1.0 (2771) 15.5 19.5 21.5 24.5 24.0 43.5 49.0 52.0 46.0 41.0 58.5 X 56.5 58.0 68.0 62.0 66.5 70.0 67.0 843.0 / 1967 734402.0042.86%2794
13 Deep Sjeng c't 2010 32b (2792) 18.5 24.0 25.5 22.0 27.0 46.5 51.0 48.0 43.0 51.0 53.0 52.5 X 57.0 53.5 65.0 63.0 70.5 65.0 836.0 / 1965 739290.2542.54%2789
14 Spike 1.4 32b (2780) 8.0 13.5 20.5 21.5 20.5 39.5 43.0 44.5 48.0 45.0 51.5 51.0 52.0 X 60.5 62.5 58.5 71.5 73.0 784.5 / 1965 672377.5039.92%2772
15 Protector 1.4.0 (2763) 7.5 12.5 23.5 25.0 19.5 40.5 41.5 47.0 50.0 36.0 48.0 41.0 55.5 48.5 X 62.5 60.5 67.0 61.0 747.0 / 1967 649488.7537.98%2758
16 Deep Junior 13.3 (2755) 5.5 16.0 14.5 23.0 33.5 28.0 37.0 38.5 45.0 43.5 42.0 47.0 44.0 45.5 46.5 X 50.0 59.5 62.5 681.5 / 1965 601137.5034.68%2734
17 Quazar 0.4 (2736) 6.5 17.5 12.0 21.0 15.0 35.5 37.0 38.5 40.5 39.0 37.5 42.5 46.0 50.5 48.5 58.0 X 61.0 63.0 669.5 / 1963 579410.7534.11%2730
18 Zappa Mexico II (2709) 3.0 12.5 12.5 18.5 19.5 36.5 31.0 38.0 37.0 34.0 34.5 39.0 38.5 37.5 42.0 49.5 48.0 X 55.0 586.5 / 1964 515483.2529.86%2698
19 MinkoChess 1.3 (2701) 7.0 14.0 14.0 12.5 11.5 28.0 32.5 30.0 31.0 38.5 40.5 42.0 44.0 36.0 48.0 46.5 45.0 54.0 X 575.0 / 1965 503037.2529.26%2693





18699 out of 25650 games played

Level: 1 Minutes/Game + 1 Seconds/Move

Am Schluß mache ich einen ordentlichen Vergleich über Remisquoten, Verluste auf Zeit, richtige Bayesauswertung ... mal sehen ob man etwas sieht.

Gruß
Ingo

Parent - - By Robert Houdart Date 2012-12-27 10:07
Quite remarkable how close the 1+1 ratings are to the 5+3 ratings.
Parent - By Ingo Bauer Date 2012-12-27 10:29 Edited 2012-12-27 10:34
[quote="Robert Houdart"]
Quite remarkable how close the 1+1 ratings are to the 5+3 ratings.
[/quote]

Yep, the ranking is more or less the same. I have to check draw rate and time losses and adapt the 5+3 to the TOP19 as soon as it is finished but will publish the result everywhere as some might be interested.

Bye
Ingo
Parent - - By Stefan Pohl Date 2012-12-27 10:49
[quote="Robert Houdart"]
Quite remarkable how close the 1+1 ratings are to the 5+3 ratings.
[/quote]

No surprise for me...Thats why I am testing with 45''+500ms: much more games->much more accuracy of the results/ratings.

Stefan
Parent - - By Ralf Mueller Date 2012-12-27 16:00
Auch wenn die Ergebnisse oft ähnlich sind, können sie nicht die gleichen sein, weil die Voraussetzungen eben andere sind. Durch die Mehrzahl an Partien stellst du zwar eine äußerst genaue 45''+500'''-Rangliste auf, aber darum nicht gleich eine genauere Langzeit-Rangliste. Bestes Beispiel ist das Abschneiden von Stockfish in deinen Listen. Ich persönlich würde nie eine derart kurze Bedenkzeit-Liste als Ersatz für eine Langzeit-Liste nehmen, sondern immer nur als das, was sie ist und misst, eine Kurzzeit-Liste.
Parent - - By Michael Scheidl Date 2012-12-27 19:43
Es steht jedermann frei zu imaginieren, daß seine Lieblingsengine bei Bedenkzeit (B) viel besser ist als bei Bedenkzeit (A)...

Der Einfluß von Fakten auf Meinungen ist gering.
Parent - By Ralf Mueller Date 2012-12-27 20:09
Hm? Wie ist denn das gemeint?

Falls es sich auf mein Argument mit Stockfish bezieht, kann ich nur zwei Sachen sagen:
1) Meine Lieblingsengine ist nicht Stockfish. Ich habe nämlich keine.
2) Die Fakten sind nunmal so, dass Stockfish bei allen Ranglisten, die ich bisher gesehen habe, in den Ranglisten von Herrn Pohl am schlechtesten abschneidet, und das mit einem weit größeren Unterschied zu längeren Bedenkzeiten als andere Engines.

Mein Beispiel war also rein auf Fakten basiert. Du wirst bei keiner Engine einen so großen Unterschied zwischen den Ranglisten von Herrn Pohl und Ranglisten mit längeren Bedenkzeiten finden wie bei Stockfish.
Parent - - By Ingo Bauer Date 2012-12-27 21:05
[quote="Michael Scheidl"]
Es steht jedermann frei zu imaginieren, daß seine Lieblingsengine bei Bedenkzeit (B) viel besser ist als bei Bedenkzeit (A)...

Der Einfluß von Fakten auf Meinungen ist gering.
[/quote]

Aus welchen irrationalen Gründen jemand welche Liste ansieht - ist mir egal, ich kann es sowieso nicht ändern. Wenn ich aber eine Liste nur des Rankings wegen erstelle - was zu 95% bei mir zutrifft - weiß ich nicht wie ich den zusätzlichen Stromverbrauch rechtfertigen kann. Engines nur deswegen lange spielen zu lassen weil Menschen lange spielen scheint mir ein bisschen dünn wenn ich das selbe Ergebniss billiger produzieren könnte ...

Na ja, ich habe ja noch meine 5%

Gruß
Ingo
Parent - By Ralf Mueller Date 2012-12-27 21:34
Man darf sich nicht von der Ähnlichkeit der Resultate blenden lassen. Es ist auf keinen Fall egal, welche Bedenkzeit man wählt. Die Frage ist nur, welche Bedenkzeit für den Anwender am relevantesten ist, damit mit dieser die Spielstärke festgestellt werden kann. Daher begrüße ich es natürlich, dass es verschiedene Ranglisten mit verschiedenen Bedenkzeiten gibt, sodass man die für seine Anwedungen am passendsten auswählen kann. Aber den Trend zu immer kürzeren Bedenkzeiten - liefern ja eh die gleichen Resultate - sehe ich kritisch, weil es eben doch nicht das gleiche ist und niemals sein wird, auch wenn es bei den Top-Engines den Anschein hat. Aber es kist doch natürlich möglich, dass eine Engine mit längeren Bedenkzeiten deutlich aufdreht bzw. abnimmt! Man darf sich auf keinen Fall auf eine völlig unrealistische (weil viel zu kurze) Bedenkzeit versteifen und sie für alles annehmen.

Ich fände es im Gegenteil einmal sehr wertvoll und hilfreich, Ranglisten für Engines mit Fernschach-Bedenkzeiten zu kreieren. Bei allem "wissenschaftlichen" Gemesse und Getue ist in dieser Branche im Grunde fast gar nichts bekannt, obwohl es denke ich dafür eine große Nachfrage gäbe, ob für Fernschach oder Analyse-Zwecke.
Parent - By Thomas Schoenegger Date 2012-12-27 20:20
das einzig Auffällige m. E. ist Ponder on/off zw dieser 1+1 und LS, sowie 5+3. Da ich immer nur auf die erreichte Platzierung in meiner Rangliste schaue und feststelle, dass Komodo in diesen Ranglisten und in meiner bei Ponder "off" hinter Critter und bei "on" vor Critter liegt.
Für mich persönlich und jeden halbwegs ambitionierten Tester jedenfalls Nichts Neues.

Thomas Schönegger
Parent - - By Benno Hartwig Date 2012-12-28 06:30
[quote="Ingo Bauer"]Das ganze ist ziemlich Sinnfrei, es dient lediglich dazu mal zu sehen ob sich etwas anders einreiht.[/quote]Und darum finde ich das auch gar nicht soo sinnfrei!

Es mag einen interessieren, wie sich die Spielstärkeverhältnisse z.B. bei 40 Züge in 40 Minuten verhalten.
Und man kann eine kleinere(!) Testreihe unter diesen Bedingungen durchführen, und erhhält mit großer Wahrscheinlichkeit einen stattlichen Fehler (wegen zu weniger Partien)
Man könnte eine größere Testreihe bei z.B. 40 Züge in 5 Minuten durchführen. Der statistische Fehler ist dann kleiner, aber man misst etwas anderes als einen interessiert. Ein gewisser systematischer Fehler.
Oder man könnte eine große Testreihe bei eben 1+1 durchführen. Der statistische Fehler ist dann sehr klein, aber man misst etwas noch deutlicher anderes als einen interessiert. Ein ggf. etwas größerer systematischer Fehler.

Wie verhalten sich diese Fehler zueinander?

Angenommen mich interessiert 40 in 40
und ich mache einen Test bei 3000 Partien pro Engine bei 1+1 und nehme das Ergebnis als Schätzwert für das, was mich eigentlich interessiert.
Wieviele Partien bei 40 in 40 müsste ich tatsächlich machen, um einen genau so verlässlichen Wert zu erhalten?
Wieviele Partien bei 40 in 5 müsste ich machen, um einen  genau so verlässlichen Wert zu erhalten?

Ich finde daher interessant, wie sich die 1+1-Differenzen verhalten zu denen, die bei längeren und auch deutlich längeren Zeiten erspielt werden.

Benno
Parent - - By Ingo Bauer Date 2012-12-28 06:52 Edited 2012-12-28 06:57
?

Wie willst du 40/40 mit 1 + 1 Vergleichen? Kommt mir ein bisschen wirr vor

Alles was man schließen kann ist:

1. Wenn 1 + 1 das gleicher Ranking ergibt wie die rund 5 fache Zeit 5 + 3 dann kann man auch annehmen das weiter Steigerungen bei gleicher Partiezahl das gleiche Ranking ergeben.
2. Wenn Engines bei Incrementen sich mit steigender Bedenkzeit gleich verhalten, ist di eAnnahme gerechtfertigt das das auch für wiederholende Zeitkontrollen gilt. 40/4 oder 40/20 oder 40/40 oder 40/120 + 20/60 + 60Rest oder ... sollten dann das selbe Ranking ergeben bei genügend großer, gleicher Spieleanzahl.

Noch oben ist das unkritisch, ich sehe keinen Grund warum eine Engine spätestens nach 5 + 3 noch überdurchschnittlich zulegen sollte wenn sie es von 1 + 1 auf 5 + 3 nicht getan hat ... (bei durchschnittlicher moderner Hardware)
Nach unten kann der Schluß aber fehlgehen weil es Teile in einer Enigne gibt die unterschiedlich imlementiert wurden, deren zeitlicher Anteil aber nach oben kleiner und damit irrelevanter wird. Also ein Ultrabullet kann schief gehen - was praktisch auch alle Topprogrammierer schon getroffen hat die sich dann wunderten das ein selbst ermittelter Zugewinn sich nicht in den Listen zeigte ... (Interessant ist das 1 + 1 auf 3.2 GHz Phenoms wohl nicht mehr Ultrabullet ist!)

Oder noch anders: Warum Rechner tagelang heizen lassen wenn man das selbe Ranking früher bekommt.

Achtung: Das gilt natürlich nicht wenn man sich für die Partien interessiert. DIE sind natürlich mit mehr Zeit gehaltvoller.

Gruß
Ingo

PS: Das sind natürlich alles Annahmen WENN ungefähr das gleiche RAting rauskommt. Das muß ich noch auswerten.

EDIT:
Ich glaube ich habs kapiert:

>und ich mache einen Test bei 3000 Partien pro Engine bei 1+1 und nehme das Ergebnis als Schätzwert für das, was mich eigentlich interessiert.
>Wieviele Partien bei 40 in 40 müsste ich tatsächlich machen, um einen genau so verlässlichen Wert zu erhalten?
>Wieviele Partien bei 40 in 5 müsste ich machen, um einen  genau so verlässlichen Wert zu erhalten?

Immer gleich viele. Die Mathematik ist die selbe egal ob 1 + 1 oder 40/40. Wenn das slebe Ranking rauskommen sollte mußt du für jede Serie die selbe Anzahl an Spielen spielen.
Parent - - By Klaus Ritter Date 2012-12-28 09:04
Hallo Ingo,
bitte nicht falsch verstehen ist eine Frage, du meinst das 1+1 ein gleiches Ergebnis wird wie z.b 60+15 ?
wenn das so ist hättet ihr euch eine menge Dukaten sparen können im Vergleich Cluster Rybka vs. Houdini
Wäre allerdings schade gewesen, weil dieses Event war ein Highlight 2012.

Gruß,
Klaus
Parent - - By Ingo Bauer Date 2012-12-28 09:13
Da verstehe ich nichts falsch, keine Angst.

Ich habe das Turnier noch nicht endgültig ausgewertet, aber WENN 1 + 1 das selbe Ranking produziert wie 5 + 3 sehe ich nicht warum ein 60 + 15 Ranking anders aussehen sollte.
Anders: 26650 Spiele in 1 + 1 oder 5 + 3 oder 60 + 15 geben das selbe Ranking.

Dein Vergleich hinkt natürlich insofern als das ein Ranking aus 6 Spielen nicht viel Wert ist. Wenn du jeweils 6 Spiele zw. zwei Engines 1000 mal spielen lässt dürfte so ziemlich alles zw. 6-0 und 0-6 herrausgekommen sein. Wenn du allerdings 2 mal 500 6 Spiele Matches machen läßt dürften die schon ziemlich ähnlich sein.

Dazu nochmal: Lange Spiele sind natürlich gehaltvoller als kurze, um ein richtiges Rating zu produzieren scheinen sie aber nicht notwendig.

Gruß
Inog
Parent - By Ingo Bauer Date 2012-12-28 09:38
[quote="Ingo Bauer"]
Da verstehe ich nichts falsch, keine Angst.

Ich habe das Turnier noch nicht endgültig ausgewertet, aber WENN 1 + 1 das selbe Ranking produziert wie 5 + 3 sehe ich nicht warum ein 60 + 15 Ranking anders aussehen sollte.
Anders: 26650 Spiele in 1 + 1 oder 5 + 3 oder 60 + 15 geben das selbe Ranking.

Dein Vergleich hinkt natürlich insofern als das ein Ranking aus 6 Spielen nicht viel Wert ist. Wenn du jeweils 6 Spiele zw. zwei Engines 1000 mal spielen lässt dürfte so ziemlich alles zw. 6-0 und 0-6 herrausgekommen sein. Wenn du allerdings 2 mal 500 6 Spiele Matches machen läßt dürften die schon ziemlich ähnlich sein.

Dazu nochmal: Lange Spiele sind natürlich gehaltvoller als kurze, um ein richtiges Rating zu produzieren scheinen sie aber nicht notwendig.

Gruß
Ingo
[/quote]

Dazu kommt noch das keine Rangliste der Engines erzeugt werden kann weil denkbar unterschiedliche Hardware eingesetzt wurde ...

Aber Spaß hat es gamacht, da geb ich dir Recht

Gruß
Ingo
Parent - - By Stefan Pohl Date 2012-12-28 10:32
[quote="Ingo Bauer"]

Noch oben ist das unkritisch, ich sehe keinen Grund warum eine Engine spätestens nach 5 + 3 noch überdurchschnittlich zulegen sollte wenn sie es von 1 + 1 auf 5 + 3 nicht getan hat ... (bei durchschnittlicher moderner Hardware)
Nach unten kann der Schluß aber fehlgehen weil es Teile in einer Enigne gibt die unterschiedlich imlementiert wurden, deren zeitlicher Anteil aber nach oben kleiner und damit irrelevanter wird. Also ein Ultrabullet kann schief gehen - was praktisch auch alle Topprogrammierer schon getroffen hat die sich dann wunderten das ein selbst ermittelter Zugewinn sich nicht in den Listen zeigte ... (Interessant ist das 1 + 1 auf 3.2 GHz Phenoms wohl nicht mehr Ultrabullet ist!)

Oder noch anders: Warum Rechner tagelang heizen lassen wenn man das selbe Ranking früher bekommt.

Achtung: Das gilt natürlich nicht wenn man sich für die Partien interessiert. DIE sind natürlich mit mehr Zeit gehaltvoller.

[/quote]

Stimme 100% zu. Die Frage ist eben nur, wo das Ultrabullet-Problem wirklich anfängt. Bei meiner ersten LS-Rangliste mit 20''+250ms (auf meiner nicht sehr schnellen Hardware, auf der Houdini und Ippos so circa 2 Mio Knoten/Sekunde auf einem Core schaffen) gab es nur einen echten Ausreißer, nämlich Houdini 2.0c, der überdurchschnittlich gut abschnitt (komischerweise aber Houdini 1.5a nicht!). Und Stockfish war etwas schlechter als zu erwarten war. Ansonsten war alles ziemlich "normal". Das läßt mich vermuten, daß diese Bedenkzeit/Hardware-Kombination wohl an der Grenze des Erträglichen war. Daher auch mein Entschluß, die Bedenkzeit zu verdoppeln und die LS-Ranfgliste komplett neu aufzubauen. Ganz wichtig ist gerade bei kurzen Bedenkzeiten natürlich, den Rechner vor jedem Test-Gauntlet frisch zu booten, die Internet-Verbindung zu kappen (damit kann und sollte man dann auch die Antivirensoftware abschalten!) und automatische Windows-Funktionen (wie Autoupdates und das automatische gelegentliche Defragmentieren der Festplatte etc.) abzustellen. Dann ist man mit 45''+500ms (ohne Pondern) auf der sicheren Seite. Beim 1'+1'' (mit Pondern) - wie hier bei dir natürlich erst Recht. Allerdings denke ich, daß die 60fache Basiszeit (im Verhältnis zum Fischerbonus) etwas zu gering ist und vor allem sollte sie für Vergleiche mit anderen Bedenkzeiten möglichst ähnlich gewählt werden: Bei 5'+3'' ist der Faktor 100 (das ist eine gute Wahl), ein Verkürzen auf 2'+1'' (Faktor 120) schiene mir daher für Vergleiche sinnvoller als 1'+1'', einfach weil das näher an Faktor 100 dran ist.

Stefan
Parent - By Ralf Mueller Date 2012-12-28 12:20
Wobei man sagen muss, dass Stefans Rangliste nochmal anders aussieht als Ingos Rangliste 1+1 und 5+3 (vor allem Stockfish).
Weiterhin ist nicht ausgeschlossen, dass manche Engines nicht (oder besonders) gut mit Ikrementen umgehen können o.ä., was bei einem Vergleich 1+1 mit 5+3 nicht auffällt.
Parent - By Benno Hartwig Date 2012-12-28 22:00
[quote="Ingo Bauer"]>und ich mache einen Test bei 3000 Partien pro Engine bei 1+1 und nehme das Ergebnis als Schätzwert für das, was mich eigentlich interessiert.

>Wieviele Partien bei 40 in 40 müsste ich tatsächlich machen, um einen genau so verlässlichen Wert zu erhalten?
>Wieviele Partien bei 40 in 5 müsste ich machen, um einen  genau so verlässlichen Wert zu erhalten?

Immer gleich viele. Die Mathematik ist die selbe egal ob 1 + 1 oder 40/40. Wenn das slebe Ranking rauskommen sollte mußt du für jede Serie die selbe Anzahl an Spielen spielen.
[/quote]Ja aber:
Dich interessiert ggf. brennend 40 Züge in 40 Minuten (oder sogar eigentlich: 40 in 120!).
Und du willst einen gewissen Aufwand investieren.

Du kannst dann ggf. pro Engine 200 Pariten 40 in 40 spielen. (zu jeweils 3000 Partien 40 in 120 habe ich halt keine 'Lust')
Und du kannst bei kürzeren Zeiten wesentlich mehr Partien machen, bei kleinerem statistischem und größeren systematischem Fehler.
Und mich interessiert nun, bei welcher Zeit ich die kleinsten Fehler erwarten darf.
(Sicher nicht bei 200 Partien 40 in 40. Ggf in 40 in 5? oder doch in 1+1?)

Stellt sich die Frage:
"Wie sehr unterscheiden sich die relativen Spielstärken bei sehr verschiedenen Zeiten? Wie groß ist der mittlere systematische Fehler?"
Um das zu beurteilen muss man dann aber ungefähr abschätzen können, wie groß denn überhaupt diese systematischen Fehler sind.
Und dafür bedarf es umfangreich ausgespielter Ratinglisten bei sehr unterschiedlichen Zeiten. Dafür sollte deine eben ausgespielte Liste sehr nützlich sein.

Benno
Parent - - By Ingo Bauer Date 2012-12-28 14:01
Vorweg PS: 54 ELo hätte ich nicht erwartet. Das ist WEIT jenseits der von mir erspielten Auflösung von +/-11 Elo. Es gibt jetzt mehrere Möglichkeiten

a) der von mir postulierte 'break' bei niedriger Bedenkzeit liegt zw. 1+1 und 5+3 oder
b) der von mir postulierte 'break' bei niedriger Bedenkzeit liegt über 5+3 oder
c) der von mir postulierte 'break' existiert nicht.

Was man sicher ableiten kann ist, das 1+1 oder weniger zu kurz ist. Jetzt müßte ich irgendetwas mit 5facher Zeit der 5+3 spielen und dann 25650 Spiele ... das wird wohl nicht passieren.

Mein Ergebniss passt mir nicht in den Kram, muß mal lesen was andere daraus machen und nachdenken ...

Hello all,

I played the TOP20 of the IPON-RRRL without Fritz again. All is identical to th eIPON conditions but this time with a time control of 1 + 1 and not 5 + 3.
This is th eresult:

1+1 / 25650 games

29 games lost on time / 0.11%

Rank Name                      Elo    +    - games score oppo. draws
   1 Houdini 3 STD            3100   12   12  2700   84%  2812   22%  + 9
   2 Komodo 5                 3007   11   11  2700   74%  2817   30%  + 1
   3 Critter 1.4a             2994   11   11  2700   73%  2818   34%  + 9
   4 Deep Rybka 4.1           2972   11   11  2700   70%  2819   34%  + 9
   5 Stockfish 2.2.2 JA       2956   10   10  2700   68%  2820   37%  -12
   6 Chiron 1.5               2844   10   10  2700   52%  2827   37% - 8
   7 Naum 4.2                 2826   10   10  2700   50%  2827   36%  -15
   8 HIARCS 14 WCSC 32b       2812   10   10  2700   48%  2828   34%  -13
   9 Deep Shredder 12         2800   10   10  2700   46%  2829   33%  + 0
  10 Gull 1.2                 2798   10   10  2700   46%  2829   32%  - 3
  11 Hannibal 1.2             2790   10   10  2700   45%  2830   36%  -11
  12 spark-1.0                2775   10   10  2700   43%  2830   36%  + 4
  13 Deep Sjeng c't 2010 32b  2773   10   10  2700   43%  2830   34%  -20
  14 Spike 1.4 32b            2751   10   10  2700   40%  2832   34%  -29
  15 Protector 1.4.0          2735   10   11  2700   37%  2833   33%  -28
  16 Quazar 0.4               2714   11   10  2700   35%  2834   32%  -27
  17 Deep Junior 13.3         2709   11   11  2700   35%  2834   29%  -45
  18 Zappa Mexico II          2688   11   11  2700   31%  2835   32%  -33
  19 MinkoChess 1.3           2676   11   11  2700   30%  2836   31%  -23


Average draw rate: 33%
Average elo deviation to 5+3: -12 Elo

5+3 / 25650 games

49 games lost on time / 0.19%

Rank Name                      Elo    +    - games score oppo. draws
   1 Houdini 3 STD            3091   11   11  2700   82%  2826   24%  - 9
   2 Komodo 5                 3006   10   10  2700   73%  2831   35%  - 1
   3 Critter 1.4a             2985   10   10  2700   70%  2832   37%  - 9
   4 Stockfish 2.2.2 JA       2968   10   10  2700   68%  2833   40%  +12
   5 Deep Rybka 4.1           2963   10   10  2700   68%  2833   40%  - 9
   6 Chiron 1.5               2852   10   10  2700   52%  2839   42%  + 8
   7 Naum 4.2                 2841   10   10  2700   50%  2840   41%  +15
   8 HIARCS 14 WCSC 32b       2825   10   10  2700   48%  2841   40%  +13
   9 Hannibal 1.2             2801   10   10  2700   45%  2842   41%  +11
  10 Gull 1.2                 2801   10   10  2700   45%  2842   38%  + 3
  11 Deep Shredder 12         2800   10   10  2700   45%  2842   40%  + 0
  12 Deep Sjeng c't 2010 32b  2793   10   10  2700   43%  2842   40%  +20
  13 Spike 1.4 32b            2780   10   10  2700   42%  2843   40%  +29
  14 spark-1.0                2771   10   10  2700   40%  2844   39%  - 4
  15 Protector 1.4.0          2763   10   10  2700   39%  2844   39%  +28
  16 Deep Junior 13.3         2754   10   10  2700   38%  2845   33%  +45
  17 Quazar 0.4               2742   10   10  2700   37%  2845   37%  +27
  18 Zappa Mexico II          2721   10   10  2700   34%  2846   36%  +33
  19 MinkoChess 1.3           2699   10   10  2700   31%  2848   35%  +23


Average draw rate: 38%
Average elo deviation to 5+3: +12

Average Elo deviation is 12 so the 1+1 Rating has to be increased by 12 to get a propper comparison
(Actually it has to be something with the square of the difference ... too long ago, I think the difference is marginal and this will do):

1+1 adjusted:

Rank Name                      Elo    +    - games score oppo. draws
   1 Houdini 3 STD            3112   12   12  2700   84%  2812   22%  +21
   2 Komodo 5                 3019   11   11  2700   74%  2817   30%  +13
   3 Critter 1.4a             3006   11   11  2700   73%  2818   34%  +21
   4 Deep Rybka 4.1           2984   11   11  2700   70%  2819   34%  +21
   5 Stockfish 2.2.2 JA       2968   10   10  2700   68%  2820   37%  + 0
   6 Chiron 1.5               2856   10   10  2700   52%  2827   37%  + 4
   7 Naum 4.2                 2838   10   10  2700   50%  2827   36%  - 3
   8 HIARCS 14 WCSC 32b       2824   10   10  2700   48%  2828   34%  - 1
   9 Deep Shredder 12         2812   10   10  2700   46%  2829   33%  +12
  10 Gull 1.2                 2810   10   10  2700   46%  2829   32%  + 9
  11 Hannibal 1.2             2802   10   10  2700   45%  2830   36%  + 1
  12 spark-1.0                2787   10   10  2700   43%  2830   36%  +16
  13 Deep Sjeng c't 2010 32b  2785   10   10  2700   43%  2830   34%  - 8
  14 Spike 1.4 32b            2763   10   10  2700   40%  2832   34%  -17
  15 Protector 1.4.0          2747   10   11  2700   37%  2833   33%  -16
  16 Quazar 0.4               2726   11   10  2700   35%  2834   32%  -15
  17 Deep Junior 13.3         2721   11   11  2700   35%  2834   29%  -33
  18 Zappa Mexico II          2700   11   11  2700   31%  2835   32%  -21
  19 MinkoChess 1.3           2688   11   11  2700   30%  2836   31%  -11


While no engine is in another ball park (interesting expression) the maximum additional difference is 54 Elo which is quite a high number!

I have to think about that!

Bye
Ingo

PS: Results, Bayes and Elostat files in Archive at http://www.inwoba.de
Parent - - By Kurt Utzinger Date 2012-12-28 14:33
Hi Ingo
Hat man nicht immer postuliert, dass die Elo-Werte keine Rolle spielen, sondern
es schliesslich nur um die Rangfolge der Engines geht? Von daher müsstest Du
Dir doch keine Sorgen machen, oder?
Mfg, Kurt
Parent - - By Ingo Bauer Date 2012-12-28 14:41 Edited 2012-12-28 14:46
[quote="Kurt Utzinger"]
Hi Ingo
Hat man nicht immer postuliert, dass die Elo-Werte keine Rolle spielen, sondern
es schliesslich nur um die Rangfolge der Engines geht? Von daher müsstest Du
Dir doch keine Sorgen machen, oder?
Mfg, Kurt
[/quote]

Ja das war mein Postulat und ja das Ranking ist mehr oder minder das selbe. Da wo getauscht wurde waren die Engines sowieso sehr dicht zusammen. Aber das die Entfernung sich in einem Fall um 54 Elo geändert hat finde ich bedenklich. Sollte das bei nochmaliger Verfünffachung auf 25 + 15 wieder passieren würde sich die Rangfolge doch gravierend ändern (oder hätte sich geändert wenn da mehr Enignes in meiner 19er Liste ständen) ...

Aus dem Bauch würde ich sagen das diese Änderung mit mehr Zeit immer weiter abnimmt, bin jetzt aber erstmal vorsichtiger und muß darüber nachdenken.

Gut ist, das ich jetzt nicht mit 1+1 testen und meine bisherige Arbeit aufgeben muß. 1+1 oder kürzer ist raus aus dem Rennen

Gruß
Ingo
Parent - - By Kurt Utzinger Date 2012-12-28 14:52
... damit meinst du, dass auch Stefan's 45''+500ms wenig Wert sind?
Mfg, Kurt
Parent - - By Ingo Bauer Date 2012-12-28 14:56
[quote="Kurt Utzinger"]
... damit meinst du, dass auch Stefan's 45''+500ms wenig Wert sind?
Mfg, Kurt
[/quote]

Das ist dein Schluß! Sieh auf meine Daten, überleg dir ob du denen vertraust und 54 Elo "Fehler" aktzeptierst und zieh dann deine eigenen Schlüsse.

ABER: 1+1 oder 5+3 oder 40/120 ... ist in sich immer wahr, man kann aber offensichtlich nicht von 1+1 auf andere Zeitkontrollen schließen und ob das von 5+3 geht muß noch bewiesen werden (wobei mir auffällt das ich zur 40/20 der CEGT praktisch keine wirklich relevanten Unterschiede habe ...)

Gruß
Inog
Parent - - By Kurt Utzinger Date 2012-12-28 15:18
[quote="Ingo Bauer"]
[quote="Kurt Utzinger"]
... damit meinst du, dass auch Stefan's 45''+500ms wenig Wert sind?
Mfg, Kurt
[/quote]

Das ist dein Schluß! Sieh auf meine Daten, überleg dir ob du denen vertraust und 54 Elo "Fehler" aktzeptierst und zieh dann deine eigenen Schlüsse.

ABER: 1+1 oder 5+3 oder 40/120 ... ist in sich immer wahr, man kann aber offensichtlich nicht von 1+1 auf andere Zeitkontrollen schließen und ob das von 5+3 geht muß noch bewiesen werden (wobei mir auffällt das ich zur 40/20 der CEGT praktisch keine wirklich relevanten Unterschiede habe ...)

Gruß
Inog
[/quote]

Nein, das ist nicht mein Schluss, sondern war nur eine Frage, deren direkten
Beantwortung du fast erwartungsgemäss elegant ausgewichen bist. Meine
[heutige] Meinung dazu: die Ranglisten scheinen (fast) unabhängig von den
gewählten Bedenkzeiten identisch auszufallen. Das hätte ich früher nicht
gedacht und nehme ich jetzt einfach zur Kenntnis. Dass mir Partien mit
bedeutend längeren Bedenkzeiten viel, viel besser gefallen, ist bekannt und
ändert aber nichts am Grundsätzlichen. Mit Euren Tests (v.a. Ingo, Stefan)
hat man sehr schnell einen Überblick, das ist gut so. Trotzdem studiere und
schaue ich mir fast ausschliesslich nur Partien mit langen Bedenkzeiten an.
Deshalb umso besser, dass es auch noch Schachfreunde gibt, die sich in
diesem Bereich betätigen.
Mfg, Kurt
Parent - By Ingo Bauer Date 2012-12-28 15:36
[quote="Kurt Utzinger"]

Nein, das ist nicht mein Schluss, sondern war nur eine Frage, deren direkten
Beantwortung du fast erwartungsgemäss elegant ausgewichen bist. Meine
[heutige] Meinung dazu: die Ranglisten scheinen (fast) unabhängig von den
gewählten Bedenkzeiten identisch auszufallen. Das hätte ich früher nicht
gedacht und nehme ich jetzt einfach zur Kenntnis. Dass mir Partien mit
bedeutend längeren Bedenkzeiten viel, viel besser gefallen, ist bekannt und
ändert aber nichts am Grundsätzlichen. Mit Euren Tests (v.a. Ingo, Stefan)
hat man sehr schnell einen Überblick, das ist gut so. Trotzdem studiere und
schaue ich mir fast ausschliesslich nur Partien mit langen Bedenkzeiten an.
Deshalb umso besser, dass es auch noch Schachfreunde gibt, die sich in
diesem Bereich betätigen.
Mfg, Kurt
[/quote]

Da sind wir mal durchgängig (fast) einer Meinung. Wer schaut sich Kurzpartien an? Niemand, warum auch!? Das "fast" erwähne ich nur weil ich mir doch noch ab und zu meine Partien nach schweren Fehlern durchsehe, aber das geht am Evalprofil und dauert pro Partie 5 Sekunden ... Analyse ist anders.

Gruß
ingo
Parent - By Stefan Pohl Date 2012-12-29 12:40
[quote="Kurt Utzinger"]
Meine [heutige] Meinung dazu: die Ranglisten scheinen (fast) unabhängig von den
gewählten Bedenkzeiten identisch auszufallen. Das hätte ich früher nicht
gedacht und nehme ich jetzt einfach zur Kenntnis.
[/quote]

Tja Kurt, die Frage ist dann nur noch, welche Rangliste wohl die beste/genaueste ist. Das beantwortet sich wohl eigentlich von selbst denke ich, wenn man (zu Recht) davon ausgeht, daß die Anzahl der gespielten Partien das primäre Qualitätsmerkmal ist und nicht die längste Bedenkzeit (oder Ponder on oder ähnliche Ressourcenvergeudung).

Inzwischen ist die Malware-Warnung beim Chrome-Browser wieder weg - deshalb würde sich (wie immer) ein Blick auf die genaueste aller Ranglisten empfehlen. http://ls-ratinglist.beepworld.de/

Beste Grüße in die Schweiz  - Stefan
Parent - By Stefan Pohl Date 2012-12-29 13:41
[quote="Ingo Bauer"]
[quote="Kurt Utzinger"]
... damit meinst du, dass auch Stefan's 45''+500ms wenig Wert sind?
Mfg, Kurt
[/quote]

Das ist dein Schluß! Sieh auf meine Daten, überleg dir ob du denen vertraust und 54 Elo "Fehler" aktzeptierst und zieh dann deine eigenen Schlüsse.

[/quote]

Da ist sicher ein guter Rat. Ich habe mit 20''+250ms und der etwa doppelten Bedenkzeit (45''+500ms) jeweils mehr als doppelt so viele Partien (je 55000) spielen lassen als du und außerdem mit einem fast identischen Faktor zwischen Basiszeit und Fischerbonus (80 (20''+250ms) und 90 (45''+500ms)) (im Gegensatz zu dir (Faktor 60 (1'+1'') und 100 (5'+3'')).

Ich denke mehr gibt es dazu nicht zu sagen, jeder kann da seine eigenen Schlüsse ziehen...

Stefan
Parent - By Ralf Mueller Date 2012-12-28 15:04
Hallo Ingo!

Wie ich schon oben geschrieben habe (schon länger, ist aber noch nicht freigeschaltet), gehe ich davon aus, dass unterschiedliche Bedenkzeiten auf jeden Fall einen Systematischen Fehler produzieren, also unterschiedliches messen und dass man die Resultate nicht ohne Weiteres einfach generell auf alles übertragen kann. Es gibt eben Engines, die erst bei Fernschach ihre ganzen Qualitäten entfalten (perfektionistische Ansätze), während andere eher auf kurze Bedenkzeiten abgestimmt sind (pragmatisch-praktische Ansätze). Ich denke, dass für unterschiedliche Bedenkzeiten auch unterschiedlich aggressives Pruning z.Bsp. optimal ist. Das soll aber nicht belehrend klingen, es ist nur meine Meinung. Es ist auch sehr interessant, dass bei CCRL wiederum Bouquet, ein Stockfish-Derivat einen beachtlichen Lesitungsunterschied von ca. 120 Elopunkten zwischen der 40/4 und der 40/40-Rangliste aufweist. Bei Stephans Rangliste ist Bouquets Platzierung nicht besonders, dafür aber Stockfish übermäßig schlecht. In deiner Rangliste trifft es nun Junior. Ich neige zu der Ansicht, dass es keine allgemeinen Regeln gibt, die positionellen Engines sind bei längerer/kürzerer Bedenkzeit besser. Ich denke vielmehr, dass jede Bedenkzeitregelung immer ein anderes Ergebnis bringt. Bei allen Änderungen ist mir übrigens noch keine ernsthafte Rangliste untergekommen, bei der Houdini 3 nicht an erster Stelle ist. Aber meiner Meinung nach kann gerade für Fernschach-Bedenkzeiten, so mühsam es auch ist, noch sehr viel getan werden, da hier trotz eines großen Interessenskreises noch fast nichts statistisch relevantes zur Spielstärke bekannt ist.

...

Ich verstehe nicht ganz, wo du die 54 Elo hernimmst? Die größte Differenz, die ich in der bereinigten Liste finde, sind die -33 von Junior 13.3?!
Parent - - By Michael Scheidl Date 2012-12-28 15:38
Ich finde diese Differenz von 54 nicht(?).

Ein Teil der Unterschiede ist vielleicht durch die Bedenkzeiteinteilung der jeweiligen Engine, bzw. deren Eignung für 1+1 verursacht worden. Diese konnte oder wollte ich noch nie so richtig als Teil einer "Spielstärke an sich" betrachten...
Parent - - By Ingo Bauer Date 2012-12-28 16:17
[quote="Michael Scheidl"]
Ich finde diese Differenz von 54 nicht(?).
[/quote]

Die Differenz der besten Engine in der 1+1 zur 5+3 ist +21 ELo, die Differenz der schlechtesten Engine in der 1+1 zur 5+3 ist 33Elo. Elounterschied von 1+1 zu 5+3 ist somit 54 Elo zw. diesen beiden Engines.

[quote="Michael Scheidl"]
Ein Teil der Unterschiede ist vielleicht durch die Bedenkzeiteinteilung der jeweiligen Engine, bzw. deren Eignung für 1+1 verursacht worden. Diese konnte oder wollte ich noch nie so richtig als Teil einer "Spielstärke an sich" betrachten...
[/quote]

Was macht sonst einen Spielstärkeunterschied aus wenn nicht die gewählte Bedenkzeit. Wenn es das nicht ist müßten meine beiden Listen gleich sein ... Gestern las ich den schönen Satz: "Der Einfluß von Fakten auf Meinungen ist gering." Das scheint jeden mal zu treffen

Gruß
Ingo
Parent - By Ralf Mueller Date 2012-12-28 16:53
Nein, es ist ein Unterschied, ob eine Engine im Modus 1+1 besonders gut spielt im Vergleich zu längeren Bedenkzeiten, weil sie bspw. eine unglaublich schnelle Zug-Generierung hat, weil sie auf diese Bedenkzeit getunt wurde (Pruning+Eval), weil sie sich die Zeit eben besonders sinnvoll einteilt (bei längeren Bedenkzeiten nicht ganz so dramatisch), weil sie besonderes Schachwissen hat (oder besonders wenig), was v.a. bei kurzen Bedenkzeiten Sinn macht oder weil sie einen abwartenden Spiesltil hat, der zu spekulative Engines (die bei längerer Bedenkzeit die Widerlegung sehen) bestraft.

Die Liste ließe sich beliebig lang fortsetzen und es sind alles nur erdachte Gründe (müssen nicht stimmen, darum geht es nicht). Ich will nur deutlich machen, dass kürzere Bedenkzeit nicht gleich kürzere Bedenkzeit ist. Also wenn zwei Engines hier besonders schlecht sind, kann das aus den verschiedensten Gründen heraus sein, es wird in den seltensten Fällen der gleiche sein. Ich denke, dass es darum Herrn Scheidl ging.

Die Frage ist halt nur, bei welcher Bedenkzeit möglichst viele Nebeneffekte ausgestellt sind und es nur um die Spielstärke geht. Ich denke nicht, dass es die perfekte Bedenkzeit gibt, daher mein Votum, die Listen immer nur als das zu nehmen, was sie sind. Wenn eine Liste 1+1 misst, dann misst sie eben die Eignung der Engine für 1+1-Bedenkzeiten und nicht mehr.

Ich denke der Ähnlichkeitseffekt der Ranglisten verschiedener Bedenkzeiten hat vertauschte Ursache und Wirkung: Die Programmierer richten sich nach den Ranglisten und nicht die Ranglisten nach den Programmen. Jeder kommerzielle Programmierer versucht seine Engine auf die Bedenkzeiten zu optimieren, mit denen die Listen erstellt werden (weil es heutzutage meist nur um die Listen geht). Don Dailey hat seine Testweise mehrmals so beschrieben (ich bin mir sicher, andere Prorgammierer gehen ähnlich vor): Eine neue Version wird erst in einen Blitz-Parcours geschickt und nur wenn diese Version dort besser abschneidet als die alte, wird mit langen bedenkzeiten getestet. Es gibt also überhaupt keine Chance auf eine Änderung, die nur bei längeren Bedenkzeiten sinnvoll sind! Von daher kein Wunder, dass viele Engines ähnlich gut sind, weil die Programmierer einfach auch zunächst auf die kurzen Bedenkzeiten optimieren (und nachher mit Langzeittest absichern). Aber nur, weil es oft keine Unterschiede gibt, heißt das nicht, dass es gleich ist. Man darf sich da echt nicht täuschen lassen und einem Wunschdenken verfallen.
Parent - By Martin Hander Date 2012-12-28 17:01
[quote="Ingo Bauer"]
[quote="Michael Scheidl"]
Ein Teil der Unterschiede ist vielleicht durch die Bedenkzeiteinteilung der jeweiligen Engine, bzw. deren Eignung für 1+1 verursacht worden. Diese konnte oder wollte ich noch nie so richtig als Teil einer "Spielstärke an sich" betrachten...
[/quote]
Was macht sonst einen Spielstärkeunterschied aus wenn nicht die gewählte Bedenkzeit. Wenn es das nicht ist müßten meine beiden Listen gleich sein ... Gestern las ich den schönen Satz: "Der Einfluß von Fakten auf Meinungen ist gering." Das scheint jeden mal zu treffen

Gruß
Ingo
[/quote]
Dazu eine Frage:

Wenn man eine Engine beispielsweise zum Analysieren von Stellungen benutzt, ist man ja eigentlich nicht direkt daran interessiert, wie gut diese Engine Partien mit vorgegebener Bedenkzeit pro Partie spielt (d.h. wie gut z.b. die Zeiteinteilung ist), sondern daran wie gut sie einzelne Stellungen beurteilt (Was natürlich fast, aber eben nur fast dasselbe ist).

Die Frage ist, ob man nicht einen Erkenntnisgewinn erzielen könnte, wenn man mal ein Turnier mit vorgegebener Bedenkzeit pro Zug spielt (z.b. 1 Sekunde und evtl. ohne Contempt). Damit wäre der Faktor der Zeiteinteilung ausgeschaltet, und man hätte einen reinen "Analysewettkampf".

Kann aber auch sein, das das Unsinn ist, so gut kenne ich mich an dieser Stelle nicht aus

Gruß
Martin
Parent - - By Stefan Pohl Date 2012-12-29 12:50
[quote="Ingo Bauer"]

Die Differenz der besten Engine in der 1+1 zur 5+3 ist +21 ELo, die Differenz der schlechtesten Engine in der 1+1 zur 5+3 ist 33Elo. Elounterschied von 1+1 zu 5+3 ist somit 54 Elo zw. diesen beiden Engines.

[/quote]

Das ist der von mir bereits mehrfach postulierte Zieharmonikaeffekt. Zusätzlich kommt noch der Unsicherheitsfaktor dazu, der durch das sehr unterschiedliche Verhältnis von Basiszeit zu Fischerbonus in diesem Experiment zwischen 1'+1'' (Faktor 60) und 5'+3''(Faktor 100) entsteht.

Ergo: Was ist nun eigentlich die neue Erkenntnis, die Du uns hier mitteilen willst? Meiner ja hoffentlich nicht ganz unmaßgeblichen Meinung nach ist das alles kalter Kaffee, weil ich das hier alles schon gepostet habe (und zwar mit einer erheblich größeren Datenbasis).

Stefan
Parent - - By Ingo Bauer Date 2012-12-29 13:38 Edited 2012-12-29 13:44
[quote="Stefan Pohl"]
[quote="Ingo Bauer"]

Die Differenz der besten Engine in der 1+1 zur 5+3 ist +21 ELo, die Differenz der schlechtesten Engine in der 1+1 zur 5+3 ist 33Elo. Elounterschied von 1+1 zu 5+3 ist somit 54 Elo zw. diesen beiden Engines.

[/quote]

Das ist der von mir bereits mehrfach postulierte Zieharmonikaeffekt. Zusätzlich kommt noch der Unsicherheitsfaktor dazu, der durch das sehr unterschiedliche Verhältnis von Basiszeit zu Fischerbonus in diesem Experiment zwischen 1'+1'' (Faktor 60) und 5'+3''(Faktor 100) entsteht.

Ergo: Was ist nun eigentlich die neue Erkenntnis, die Du uns hier mitteilen willst? Meiner ja hoffentlich nicht ganz unmaßgeblichen Meinung nach ist das alles kalter Kaffee, weil ich das hier alles schon gepostet habe (und zwar mit einer erheblich größeren Datenbasis).

Stefan
[/quote]

Wenn der Zieharmonikaeffekt 54 Elo groß sein kann, was du ja anerkennst, dann kannst du dir deine kleine Errorbar in deinen kalten Kaffe stecken sofern du davon ausgehst das sich deine Ergebnisse auf andere Zeitkontrollen übertragen lassen. Die SD ist dann nämlich irrelevant für jede andere Zeitkontrolle weil die mögliche Abweichung bei mehr Zeit DEUTLICH größer ist als dein SD.
Im CCC hat Houdart und noch jemand errechnet das die Korrelation rund 10 Elo groß ist. "Angenommen" es läuft zu deiner kurzen Liste linear (was wie gesagt auch mehr sein kann), ist jedes Austesten mit SD kleiner als 10 egal wenn man auf eine andere Zeitkontrolle übertragen will(!) weil der mögliche zusätzliche Fehler durch die andere Zeitkontrolle größer ist als 10Elo . Oder noch anders. Deine SD ist richtig für dein Zeitkontrolle, mehr aber auch nicht!

SD lassen sich nicht auf andere Zeitkontrollen übertragen! Die einzige Datenbasis die mir jetzt bekannt ist ist von 1+1 auf 5+3 und da ist der Zieharmonikaeffekt 10 Elo (im Durchschnitt). Von da aus kann ich jetzt in Zukunft eine Abschätzung machen wo eine Engine bei 5+3 liegen wird, wenn ich sie bei 1+1 teste*. Wir haben keine Datenbasis von kleineren oder größeren Zeitkontrollen, ich würde aber vermuten das das bei weniger Zeit größer und bei mehr Zeit kleiner wird als die 10 Elo.

Ingo

*Was natürlich sehr schön ist um mal schnell eine Engine zu testen. 2700 Spiele 1+1 schaffe ich über Nacht. Danach weiß ich aob es sich für die Top 20 der 5+3 lohnt
Parent - - By Stefan Pohl Date 2012-12-29 13:53
[quote="Ingo Bauer"]
[quote="Stefan Pohl"]
[quote="Ingo Bauer"]

Die Differenz der besten Engine in der 1+1 zur 5+3 ist +21 ELo, die Differenz der schlechtesten Engine in der 1+1 zur 5+3 ist 33Elo. Elounterschied von 1+1 zu 5+3 ist somit 54 Elo zw. diesen beiden Engines.

[/quote]

Das ist der von mir bereits mehrfach postulierte Zieharmonikaeffekt. Zusätzlich kommt noch der Unsicherheitsfaktor dazu, der durch das sehr unterschiedliche Verhältnis von Basiszeit zu Fischerbonus in diesem Experiment zwischen 1'+1'' (Faktor 60) und 5'+3''(Faktor 100) entsteht.

Ergo: Was ist nun eigentlich die neue Erkenntnis, die Du uns hier mitteilen willst? Meiner ja hoffentlich nicht ganz unmaßgeblichen Meinung nach ist das alles kalter Kaffee, weil ich das hier alles schon gepostet habe (und zwar mit einer erheblich größeren Datenbasis).

Stefan
[/quote]

Wenn der Zieharmonikaeffekt 54 Elo groß sein kann, was du ja anerkennst, dann kannst du dir deine kleine Errorbar in deinen kalten Kaffe stecken sofern du davon ausgehst das sich deine Ergebnisse auf andere Zeitkontrollen übertragen lassen. Die SD ist dann nämlich irrelevant für jede andere Zeitkontrolle weil die mögliche Abweichung bei mehr Zeit DEUTLICH größer ist als dein SD.
Im CCC hat Houdart und noch jemand errechnet das die Korrelation rund 10 Elo groß ist. "Angenommen" es läuft zu deiner kurzen Liste linear (was wie gesagt auch mehr sein kann), ist jedes Austesten mit SD kleiner als 10 egal wenn man auf eine andere Zeitkontrolle übertragen will(!) weil der mögliche zusätzliche Fehler durch die andere Zeitkontrolle größer ist als 10Elo . Oder noch anders. Deine SD ist richtig für dein Zeitkontrolle, mehr aber auch nicht!

SD lassen sich nicht auf andere Zeitkontrollen übertragen! Die einzige Datenbasis die mir jetzt bekannt ist ist von 1+1 auf 5+3 und da ist der Zieharmonikaeffekt 10 Elo. Von da aus kann ich jetzt in Zukunft eine Abschätzung machen wo eine Engine bei 5+3 liegen wird, wenn ich sie bei 1+1 teste. Wir haben keine Datenbasis von kleineren oder größeren Zeitkontrollen, ich würde aber vermuten das das bei weniger Zeit größer und bei mehr Zeit kleiner wird als die 10 Elo.

Ingo
[/quote]

Tja, zu allen Fakten, die dir nicht ins Weltbild passen, kommt wie immer nur das große Schweigen, sei es damals die LittleBlitzerGUI, die im Gauntlet alle Vorgabestellungen sehr wohl sequentiell und mit vertauschten Farben abspielt (was du ja bis heute nicht gepeilt hast), oder eben jetzt das Faktum, daß du hier hier zwei Listen erstellst, die ein extrem unterschiedliches Verhältnis zwischen Basiszeit und Fischerbonus aufweisen und somit den Zeiteinteilungsalgorithmus der Engines mal eben komplett über den Jordan werfen...
Es bleibt daher bei dem Faktum: Den einzigen Vergleich zwischen 2 Ranglisten mit unterschiedlichen Bedenkzeiten - mit statistisch wirklich relevanten Ausgangsbedingungen -  habe ich erstellt und zwar seinerzeit mit meiner alten und neuen LS-Rangliste.

Stefan
Parent - - By Ingo Bauer Date 2012-12-29 13:59 Edited 2012-12-29 14:03
[quote="Stefan Pohl"]
[quote="Ingo Bauer"]
[quote="Stefan Pohl"]
[quote="Ingo Bauer"]

Die Differenz der besten Engine in der 1+1 zur 5+3 ist +21 ELo, die Differenz der schlechtesten Engine in der 1+1 zur 5+3 ist 33Elo. Elounterschied von 1+1 zu 5+3 ist somit 54 Elo zw. diesen beiden Engines.

[/quote]

Das ist der von mir bereits mehrfach postulierte Zieharmonikaeffekt. Zusätzlich kommt noch der Unsicherheitsfaktor dazu, der durch das sehr unterschiedliche Verhältnis von Basiszeit zu Fischerbonus in diesem Experiment zwischen 1'+1'' (Faktor 60) und 5'+3''(Faktor 100) entsteht.

Ergo: Was ist nun eigentlich die neue Erkenntnis, die Du uns hier mitteilen willst? Meiner ja hoffentlich nicht ganz unmaßgeblichen Meinung nach ist das alles kalter Kaffee, weil ich das hier alles schon gepostet habe (und zwar mit einer erheblich größeren Datenbasis).

Stefan
[/quote]

Wenn der Zieharmonikaeffekt 54 Elo groß sein kann, was du ja anerkennst, dann kannst du dir deine kleine Errorbar in deinen kalten Kaffe stecken sofern du davon ausgehst das sich deine Ergebnisse auf andere Zeitkontrollen übertragen lassen. Die SD ist dann nämlich irrelevant für jede andere Zeitkontrolle weil die mögliche Abweichung bei mehr Zeit DEUTLICH größer ist als dein SD.
Im CCC hat Houdart und noch jemand errechnet das die Korrelation rund 10 Elo groß ist. "Angenommen" es läuft zu deiner kurzen Liste linear (was wie gesagt auch mehr sein kann), ist jedes Austesten mit SD kleiner als 10 egal wenn man auf eine andere Zeitkontrolle übertragen will(!) weil der mögliche zusätzliche Fehler durch die andere Zeitkontrolle größer ist als 10Elo . Oder noch anders. Deine SD ist richtig für dein Zeitkontrolle, mehr aber auch nicht!

SD lassen sich nicht auf andere Zeitkontrollen übertragen! Die einzige Datenbasis die mir jetzt bekannt ist ist von 1+1 auf 5+3 und da ist der Zieharmonikaeffekt 10 Elo. Von da aus kann ich jetzt in Zukunft eine Abschätzung machen wo eine Engine bei 5+3 liegen wird, wenn ich sie bei 1+1 teste. Wir haben keine Datenbasis von kleineren oder größeren Zeitkontrollen, ich würde aber vermuten das das bei weniger Zeit größer und bei mehr Zeit kleiner wird als die 10 Elo.

Ingo
[/quote]

Tja, zu allen Fakten, die dir nicht ins Weltbild passen, kommt wie immer nur das große Schweigen, sei es damals die LittleBlitzerGUI, die im Gauntlet alle Vorgabestellungen sehr wohl sequentiell und mit vertauschten Farben abspielt (was du ja bis heute nicht gepeilt hast), oder eben jetzt das Faktum, daß du hier hier zwei Listen erstellst, die ein extrem unterschiedliches Verhältnis zwischen Basiszeit und Fischerbonus aufweisen und somit den Zeiteinteilungsalgorithmus der Engines mal eben komplett über den Jordan werfen...
Es bleibt daher bei dem Faktum: Den einzigen Vergleich zwischen 2 Ranglisten mit unterschiedlichen Bedenkzeiten - mit statistisch wirklich relevanten Ausgangsbedingungen -  habe ich erstellt und zwar seinerzeit mit meiner alten und neuen LS-Rangliste.

Stefan
[/quote]

Das mit dem Weltbild und so ... du hast absolut Recht! Lies dir das oben noch mal durch.

... ahh ausser hier, oder besser das will ich präzisieren: "...mit statistisch wirklich relevanten Ausgangsbedingungen..." Gilt genau für deine Liste, sonst nirgends weil der mögliche Fehler beim übertragen auf eine andere Zeitkontrolle größer ist als deine SD und diese (beim übertragen auf eine andere Zeitkontrolle) praktisch ausgehebelt wird.

Ahh, das mit dem Verhältniss ist auch irrelevent. Ich hätte auch 25650 Spiele 40/40 spielen können. Das Verhältniss zw diesen beiden Listen ist dann definiert - PUNKT. ob 1/100 oder 1/80 ode 1/5432 das Verhältniss zw beiden Listen ist durch die SPiele definiert. Die Ratio irrelevant.

Werd glücklich mit deiner Liste. Ich antworte nicht auf dich wenn du mich nicht ansprichst, halte du es doch genauso mit mir und alles wird gut!

Ingo
Parent - - By Stefan Pohl Date 2012-12-29 14:09
[quote="Ingo Bauer"]
Das mit dem Weltbild und so ... du hast absolut Recht!

Werd glücklich mit deiner Liste. Ich antworte nicht auf dich wenn du mich nicht ansprichst, halte du es doch genauso mit mir und alles wird gut!

Ingo
[/quote]

Mach ich sofort, sobald du endlich zugibst, daß die LittleBlitzerGUI im Gauntlet-Mode alle PGN-Vorgabestellungen sequentiell und mit Farbvertauschung korrekt abspielt. Aber dafür müßtest du ja einräumen, dich mal geirrt zu haben. Wenn du dafür die menschliche Größe aufbringst - wunderbar.
Und es geht mir hier nicht darum, daß ich in diesem Fall mal Recht habe, sondern nur darum, daß andere Computerschachfreaks sich wegen deinem Fehlurteil (irren ist menschlich!) von dieser exzellenten GUI fernhalten, denn das wäre einfach schade, denn diese GUI ist einfach super und unerreicht stabil (bei mir jetzt mehr als 400000 Partien ohne Absturz).

Gruß - Stefan
Parent - - By Ingo Bauer Date 2012-12-29 14:15
[quote="Stefan Pohl"]
[quote="Ingo Bauer"]
Das mit dem Weltbild und so ... du hast absolut Recht!

Werd glücklich mit deiner Liste. Ich antworte nicht auf dich wenn du mich nicht ansprichst, halte du es doch genauso mit mir und alles wird gut!

Ingo
[/quote]

Mach ich sofort, sobald du endlich zugibst, daß die LittleBlitzerGUI im Gauntlet-Mode alle PGN-Vorgabestellungen sequentiell und mit Farbvertauschung korrekt abspielt...
[/quote]

Wenn dir soviel Herzblut daran liegt: Ja gebe ich zu!
Der Autor hat mir zwar schriftlich etwas anderes gesagt - und zwar explizit über den Gauntlet Modus - und danach habe ich das nicht mehr getestet weil das war ja nicht nötig aber ja, da hast Recht. (Insbesondere weil ich jetzt weiß das 1+1 ganz hervoragend im Netz mit vielen Rechnern gleichzeitig mit der Classic funktioniert)
Das sollte jetzt langen.

Ingo

PS: Wenn ich mich über jeden Scheiß der über die Classic geschrieben wurde so aufregen würde hätte ich schon einen Herzkasper.
Parent - By Stefan Pohl Date 2012-12-29 14:30
[quote="Ingo Bauer"]
[quote="Stefan Pohl"]
Mach ich sofort, sobald du endlich zugibst, daß die LittleBlitzerGUI im Gauntlet-Mode alle PGN-Vorgabestellungen sequentiell und mit Farbvertauschung korrekt abspielt...
[/quote]

Wenn dir soviel Herzblut daran liegt: Ja gebe ich zu!
Der Autor hat mir zwar schriftlich etwas anderes gesagt - und zwar explizit über den Gauntlet Modus - und danach habe ich das nicht mehr getestet weil das war ja nicht nötig aber ja, da hast Recht. (Insbesondere weil ich jetzt weiß das 1+1 ganz hervoragend im Netz mit vielen Rechnern gleichzeitig mit der Classic funktioniert)
Das sollte jetzt langen.

Ingo

PS: Wenn ich mich über jeden Scheiß der über die Classic geschrieben wurde so aufregen würde hätte ich schon einen Herzkasper.
[/quote]

Danke Ingo. Es ging mir dabei - wie schon erwähnt- nicht um meine Eitelkeit, sondern nur darum, daß andere Freaks sich nicht von dieser ausgezeichneten GUI fernhalten. Und es ging hierbei ja nicht um irgendeinen "Scheiß" (unschönes Zitat), sondern um den Fakt, ob die LittleBlitzerGUI für Tests und Ranglistenerstellungen brauchbar ist oder nicht. Das ist ja wohl ein sehr wichtiger Faktor, denn soviel brauchbare GUIs gibt es ja nicht (schon gar nicht freeware).
Dennoch möchte ich hier explizit festhalten, daß ich es sehr zu schätzen weiß, daß du deinen Irrtum hier öffentlich eingeräumt hast und damit hoffentlich mehr Leute die LittleBlitzerGUI nutzen werden (nur darum geht es mir).
Dafür Respekt und Anerkennung.

Gruß - Stefan
Parent - - By Stefan Pohl Date 2012-12-29 14:18
[quote="Ingo Bauer"]
Ahh, das mit dem Verhältniss ist auch irrelevent. Ich hätte auch 25650 Spiele 40/40 spielen können. Das Verhältniss zw diesen beiden Listen ist dann definiert - PUNKT. ob 1/100 oder 1/80 ode 1/5432 das Verhältniss zw beiden Listen ist durch die SPiele definiert. Die Ratio irrelevant.
[/quote]

Also das ist (ich muß es leider so deutlich sagen) einfach nur Quatsch. Der Zeiteinteilungsalgorithmus der Engines ist relevant und wird durch das Verhältnis zwischen Basiszeit und Fischerbonus maßgeblich beeinflußt.
Ich finde es wirklich erschreckend, daß du so einen Unfug postest, nur um mir eins reinzuwürgen. Du hast doch genug Ahnung vom Computerschach um zu wissen, daß das Verhältnis zwischen Basiszeit und Fischerbonus nicht irrelevant ist.
Damit ist diese Debatte für mich vorbei - hier geht es offensichtlich nicht mehr um Fakten.

Wenn du dich wieder den Fakten zuwendest, wird es mir eine Freude sein, wieder mit dir zu diskutieren...Ich warte diesbzgl immer noch auf ein Statement zur LittleBlitzerGUI.

Gruß - Stefan
Parent - - By Ingo Bauer Date 2012-12-29 14:27
[quote="Stefan Pohl"]
[quote="Ingo Bauer"]
Ahh, das mit dem Verhältniss ist auch irrelevent. Ich hätte auch 25650 Spiele 40/40 spielen können. Das Verhältniss zw diesen beiden Listen ist dann definiert - PUNKT. ob 1/100 oder 1/80 ode 1/5432 das Verhältniss zw beiden Listen ist durch die SPiele definiert. Die Ratio irrelevant.
[/quote]

Also das ist (ich muß es leider so deutlich sagen) einfach nur Quatsch. Der Zeiteinteilungsalgorithmus der Engines ist relevant und wird durch das Verhältnis zwischen Basiszeit und Fischerbonus maßgeblich beeinflußt.
[/quote]

Bis dahin hast du recht und das habe ich auch schon ein paar mal geschrieben. Die Zeiteinteilung hat nur nichts mit dem VERHÄLTNISS zweier Listen zu tun, sondern nur mit den Ergebniss innerhalb dieser Liste. Das VERHÄLNISS zweier Listen wird durch Spiele definiert, danach steht das VERHÄLTNISS zw diesen beiden Listen (Ergebniss in einer Liste, Verhältniss zweier Listen ... zwei verschiedene Dinge ... klar?). Ich habe den Eindruck du kannst den Gedanken nicht zu Ende denken weil dein Adrenalinpegel vorher durch die Decke geht.

Zumindest ein paar im CCC hatten damit keine Problem. Schreib doch mal deine Bedenken da ...

[quote="Stefan Pohl"]

Ich finde es wirklich erschreckend, daß du so einen Unfug postest, ...
[/quote]

Ich auch und gebe auch auf. Dann ist jetzt ja Ruhe.

Ingo
Parent - By Stefan Pohl Date 2012-12-29 14:40
[quote="Ingo Bauer"]
Die Zeiteinteilung hat nur nichts mit dem VERHÄLTNISS zweier Listen zu tun, sondern nur mit den Ergebniss innerhalb dieser Liste. Das VERHÄLNISS zweier Listen wird durch Spiele definiert, danach steht das VERHÄLTNISS zw diesen beiden Listen (Ergebniss in einer Liste, Verhältniss zweier Listen ... zwei verschiedene Dinge ... klar?).
[/quote]

Ganz genau. Das Verhältnis beider Listen zueinander ist genau der Punkt. Wenn dort Basiszeit und Fischerbonus stark voneinander abweichen, ist es nicht mehr zulässig bzw. unproblematisch, 2 Listen überhaupt in ein Verhältnis zueinander zu setzen. Nur darum ging es mir. Ich würde es sehr begrüßen, wenn du das ganze 1'+1'' Experiment noch mal mit 2'+1'' wiederholst. Das könnte dann wirklich sehr interessant werden.

Würde mich sehr auf dieses Ergebnis freuen.

Gruß - Stefan
Parent - - By Ingo Bauer Date 2012-12-30 17:57
Hello

The projection for GULL II out of the former data for the 1+1 is 2944, the real result was 2950. The difference is well in the Error bar.

1+1 RRRL:

Rank Name                      Elo    +    - games score oppo. draws
   1 Houdini 3 STD            3091   11   11  2700   82%  2826   24%
   2 Komodo 5                 3006   10   10  2700   73%  2831   35%
   3 Critter 1.4a             2985   10   10  2700   70%  2832   37%
   4 Stockfish 2.2.2 JA       2968   10   10  2700   68%  2833   40%
   5 Deep Rybka 4.1           2963   10   10  2700   68%  2833   40%
   6 Chiron 1.5               2852   10   10  2700   52%  2839   42%
   7 Naum 4.2                 2841   10   10  2700   50%  2840   41%
   8 HIARCS 14 WCSC 32b       2825   10   10  2700   48%  2841   40%
   9 Hannibal 1.2             2801   10   10  2700   45%  2842   41%
  10 Gull 1.2                 2801   10   10  2700   45%  2842   38%
  11 Deep Shredder 12         2800   10   10  2700   45%  2842   40%
  12 Deep Sjeng c't 2010 32b  2793   10   10  2700   43%  2842   40%
  13 Spike 1.4 32b            2780   10   10  2700   42%  2843   40%
  14 spark-1.0                2771   10   10  2700   40%  2844   39%
  15 Protector 1.4.0          2763   10   10  2700   39%  2844   39%
  16 Deep Junior 13.3         2754   10   10  2700   38%  2845   33%
  17 Quazar 0.4               2742   10   10  2700   37%  2845   37%
  18 Zappa Mexico II          2721   10   10  2700   34%  2846   36%
  19 MinkoChess 1.3           2699   10   10  2700   31%  2848   35%


Current 5+3 IPON-RRRL:

Rank Name                      Elo    +    - games score oppo. draws
   1 Houdini 3 STD            3091   11   11  2850   81%  2833   25%
   2 Komodo 5                 3007   10   10  2850   72%  2837   35%
   3 Critter 1.4a             2987   10   10  2850   70%  2838   38%
   4 Stockfish 2.2.2 JA       2968   10   10  2850   68%  2839   41%
   5 Deep Rybka 4.1           2962    9    9  2850   67%  2840   41%
   6 Gull II                  2935    9    9  2850   63%  2841   41%
   7 Chiron 1.5               2849    9    9  2850   50%  2846   42%
   8 Deep Fritz 13 32b        2843    9    9  2850   49%  2846   39%
   9 Naum 4.2                 2839    9    9  2850   49%  2846   41%
  10 HIARCS 14 WCSC 32b       2824    9   10  2850   47%  2847   40%
  11 Hannibal 1.2             2802    9    9  2850   44%  2848   40%
  12 Deep Shredder 12         2800    9    9  2850   44%  2848   40%
  13 Deep Sjeng c't 2010 32b  2793    9    9  2850   42%  2849   41%
  14 Spike 1.4 32b            2781    9    9  2850   41%  2849   40%
  15 spark-1.0                2770   10   10  2850   40%  2850   39%
  16 Protector 1.4.0          2764    9   10  2850   38%  2850   39%
  17 Deep Junior 13.3         2757   10   10  2850   38%  2850   34%
  18 Quazar 0.4               2736   10   10  2850   35%  2852   36%
  19 Zappa Mexico II          2710   10   10  2850   31%  2853   34%
  20 MinkoChess 1.3           2699   10   10  2850   30%  2854   36%


I will not continue with it as the projection of 1+1 to 5+3 and to decide if something is in the 5+3 I can do with some gut feeling faster Besides that there is no need for a 1+1 or shorter as it is too different from the longer time control lists.

Bye
Ingo
Parent - By Ingo Bauer Date 2012-12-30 18:29
UPS, Accidently I copied the old 1+1 in here. This is the corrected version:

The projection for GULL II out of the former data for the 1+1 is 2944, the real result was 2950. The difference is well in the Error bar.

1+1 RRRL:

Rank Name                      Elo    +    - games score oppo. draws
   1 Houdini 3 STD            3099   12   12  2700   83%  2822   23%
   2 Komodo 5                 3007   11   11  2700   73%  2827   32%
   3 Critter 1.4a             2997   10   11  2700   72%  2828   36%
   4 Deep Rybka 4.1           2972   10   10  2700   69%  2829   35%
   5 Stockfish 2.2.2 JA       2957   10   10  2700   67%  2830   38%
   6 Gull II                  2950   10   10  2700   66%  2830   37%
   7 Chiron 1.5               2843   10   10  2700   51%  2836   37%
   8 Naum 4.2                 2827   10   10  2700   49%  2837   36%
   9 HIARCS 14 WCSC 32b       2813   10   10  2700   47%  2838   34%
  10 Deep Shredder 12         2800   10   10  2700   45%  2838   33%
  11 Hannibal 1.2             2790   10   10  2700   44%  2839   36%
  12 spark-1.0                2778   10   10  2700   42%  2840   36%
  13 Deep Sjeng c't 2010 32b  2775   10   10  2700   42%  2840   35%
  14 Spike 1.4 32b            2755   10   10  2700   39%  2841   33%
  15 Protector 1.4.0          2740   10   10  2700   37%  2842   33%
  16 Quazar 0.4               2714   10   11  2700   34%  2843   31%
  17 Deep Junior 13.3         2710   11   11  2700   33%  2844   29%
  18 Zappa Mexico II          2690   11   11  2700   31%  2845   31%
  19 MinkoChess 1.3           2678   11   11  2700   29%  2845   31%


Current 5+3 IPON-RRRL:

Rank Name                      Elo    +    - games score oppo. draws
   1 Houdini 3 STD            3091   11   11  2850   81%  2833   25%
   2 Komodo 5                 3007   10   10  2850   72%  2837   35%
   3 Critter 1.4a             2987   10   10  2850   70%  2838   38%
   4 Stockfish 2.2.2 JA       2968   10   10  2850   68%  2839   41%
   5 Deep Rybka 4.1           2962    9    9  2850   67%  2840   41%
   6 Gull II                  2935    9    9  2850   63%  2841   41%
   7 Chiron 1.5               2849    9    9  2850   50%  2846   42%
   8 Deep Fritz 13 32b        2843    9    9  2850   49%  2846   39%
   9 Naum 4.2                 2839    9    9  2850   49%  2846   41%
  10 HIARCS 14 WCSC 32b       2824    9   10  2850   47%  2847   40%
  11 Hannibal 1.2             2802    9    9  2850   44%  2848   40%
  12 Deep Shredder 12         2800    9    9  2850   44%  2848   40%
  13 Deep Sjeng c't 2010 32b  2793    9    9  2850   42%  2849   41%
  14 Spike 1.4 32b            2781    9    9  2850   41%  2849   40%
  15 spark-1.0                2770   10   10  2850   40%  2850   39%
  16 Protector 1.4.0          2764    9   10  2850   38%  2850   39%
  17 Deep Junior 13.3         2757   10   10  2850   38%  2850   34%
  18 Quazar 0.4               2736   10   10  2850   35%  2852   36%
  19 Zappa Mexico II          2710   10   10  2850   31%  2853   34%
  20 MinkoChess 1.3           2699   10   10  2850   30%  2854   36%


I will not continue with it as the projection of 1+1 to 5+3 and to decide if something is in the 5+3 I can do with some gut feeling faster Besides that there is no need for a 1+1 as it is too different from the longer time control lists.

Bye
Ingo
Up Topic Hauptforen / CSS-Forum / IPON RRRL 1 + 1

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill