Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / SWCR: Aktuell laufendes Turnier ...
- - By Frank Quisinsky Date 2010-09-08 15:52 Edited 2010-09-08 15:54
Hallo zusammen,

zum aktuell laufenden Turnier bzw. den folgenden Turnieren habe ich ein paar Infos auf meiner Aktuell Seite gesetzt (siehe Link auf der Startseite, Einträge 38-40).

Frank's Chess Page
http://www.amateurschach.de

Die laufende Turniertabelle wird offenbar rege verfolgt. Damit es etwas spannender wird habe ich die ELOs gesetzt. Mithin erstehen beim Betrachten der LIVE Tabelle erste Anhaltspunkte zur Spielstärke der derzeit 6 getesteten Engines. Die erste Bayesian Berechnung wird dann am Freitag Nachmittag bei ca. 175 Partien pro neuer Engine erfolgen.

Bislang läuft alles recht Rund. Es gab einen Hänger von Loop M1-T. Zwei Zeitüberschreitungen von Loop M1-T und 2 Zeitüberschreitungen von Komodo 1.2. Loop M1-T überzieht offenbar wenn die Partie entschieden ist, bzw. kurz vor dem Matt steht. Bei Komodo das bekannte Problem. Auch gab es eine Zeitüberschreitung von Crafty 23.3 JA x64 (auch zum bekannten Problem). Die NP ... no Ponder ... Version von Crafty spielte bislang ohne Zeitüberschreitung und startete erstaunlich gut. Allerdings scheint sich das so langsam in erwartete Ergebnisse einzuränken.

Equinox und Cipollino laufen absolut stabil, auch Fire und Houdini. Besonders habe ich mir den Ponder Mode von Equinox, Cipollino, Fire und Houdini angesehen. Auch das läuft offenbar stabil und zuverlässig. Die Zeiteinteilung von Fire könnte besser sein.

Ansonsten gibt es nicht mehr zu berichten. Die bisherigen ELO-Ausgaben der LIVE Tabelle kommen derzeit Kaffeesatz lesen gleich. Es sind zwar schon ca. 100 Partien gespielt aber ...

Beispiel:
Nach 100 Partien verliert eine Engine in Partie 101 und schon geht die ELO um ca. 7 nach unten. Gibt es eine Verlustserie von 5 Partien, geht es ca. 35 nach unten. Also ein Auf- und Ab. Interessant wird es wenn ca. 350 Partien gespielt sind. Die erste Berechnung am Freitag erfolgt dennoch nach knapp 200 Partien um einfach mal zu sehen wie schaut es dann zu Beginn der nächsten Woche aus, wenn 300 Partien vorliegen.

Interessant wird es werden die ELOs am Wochenende zu verfolgen. Am Sonntag wissen wir wo es hingeht, die ELOs werden stabiler.

Gruß
Frank
Parent - - By Frank Quisinsky Date 2010-09-08 16:15 Edited 2010-09-08 16:17
Hallo,

vielleicht hat ja jemand Interesse mich nach dem laufenden Turnier mit Analysen zu den IPP Familie Engines zu unterstützen. Es stehen dann jeweils 920 Partien zweier dieser Programme zur Verfügung. Nach wie vor bin ich davon überzeugt, dass es sich um simple Clones handelt wobei Houdini im Endspiel offenbare zusätzliche Stärken aufweist. Anhand der dann vorliegenden Partien sind viele Statistiken möglich. Insofern wird es auch einen gesonderten Download geben. In diesem Download der Partien von Fire 1.31 x64 und Houdini 1.03a werden die Zugkommentare zur Verfügung stehen, die sonst in den SWCR Datenbanken gelöscht werden (der PGN Download wird sonst zu mächtig). Durch diese Kommentare sind die Analysen dann etwas einfacher.

Also, wer möchte kann sich daran gerne beteiligen.

Viele Grüße
Frank
Parent - - By Frank Quisinsky Date 2010-09-09 10:43
Hallo zusammen,

war neugierig und habe sehr früh mal eine erste Berechnung durchgeführt ...
Schauen wir mal wie viel ELO Houdini 1.03a mit weiteren Partien noch verlieren wird!

920 Partien haben die 6 neuen im laufenden Turnier ja zu spielen ...
Also, alles noch recht früh ...

After 19.954 games (SWCR-64, all games)

Code:
01. IPP Houdini 1.03a x64        2.975 58 54  137 82% 2.721 29% NEW
02. Rybka 4 x64                  2.939 20 19 1194 81% 2.689 28%
--. IPP Fire 1.31 x64            2.916 53 50  138 76% 2.723 36% NEW
--. Rybka 3 x64                  2.905 22 22  840 78% 2.687 28%
03. Stockfish 1.8.0 JA x64       2.898 22 21  835 76% 2.702 31%
--. Stockfish 1.7.1 JA x64       2.895 19 18 1120 76% 2.706 34%
04. Critter 0.80 x64             2.840 21 21  835 69% 2.705 33%
05. Naum 4.2 x64                 2.830 16 16 1435 68% 2.700 36%
--. Critter 0.70 x64             2.806 20 19  880 65% 2.701 38%
06. Shredder 12                  2.800 16 16 1394 64% 2.699 35%
07. Komodo 1.2 JA x64            2.797 17 17 1195 64% 2.694 40%
--. Komodo 1.0 JA x64            2.790 20 20  840 64% 2.692 40%
--. Shredder 12 x64              2.787 18 18 1080 61% 2.706 35%
08. Spark 0.5 x64                2.737 17 17 1194 56% 2.696 39%
09. Thinker 5.4d Inert x64       2.732 15 15 1435 54% 2.703 40%
10. Zappa Mexico II x64          2.722 15 15 1435 53% 2.703 39%
--. Spark 0.4 x64                2.717 19 19  840 53% 2.696 40%
11. Protector 1.3.4 JA x64       2.716 15 15 1394 52% 2.704 37%
12. Fruit 09_07_05 x64           2.710 15 15 1435 51% 2.703 34%
--. Critter 0.60 x64             2.700 20 19  840 50% 2.697 38%
13. Hannibal 1.0a x64            2.688 20 20  835 47% 2.712 36%
14. Sjeng WC-2008 x64            2.686 15 15 1434 48% 2.704 36%
--. Protector 1.3.5 x64          2.684 19 20  840 47% 2.706 39%
15. Junior 11.2 x64              2.683 17 17 1195 48% 2.697 31%
16. Onno 1.2.70 x64              2.676 17 17 1195 47% 2.698 37%
--. Onno 1.1.1 x64               2.670 19 19  840 46% 2.698 40%
--. Junior 11.1a x64             2.647 20 20  840 43% 2.699 32%
17. Loop M1-T x64                2.639 51 52  121 37% 2.734 38% + 8
--. Loop 2007 x64                2.631 15 16 1400 40% 2.705 37%
18. Equinox 0.83 x64             2.616 50 51  137 34% 2.734 30% NEW
--. Twisted Logic 20100131x x64  2.611 18 18 1120 35% 2.716 32%
19. Umko 1.0 x64                 2.607 20 20  836 35% 2.716 36% (ponder not possible)
20. SmarThink 1.20 x64           2.601 15 16 1434 35% 2.707 33%
21. Crafty 23.3 JA x64           2.591 20 21  835 33% 2.717 33%
--. Cipollino 3.25 x64           2.579 51 54  132 28% 2.737 32% NEW
--. Crafty 23.3 JA x64 NP        2.567 50 52  138 27% 2.738 33% (without ponder = -24 ELO)
22. BugChess2 1.7 x64            2.563 21 21  800 29% 2.718 33%
23. Scorpio 2.6 JA x64           2.555 18 18 1120 28% 2.718 32%
--. Crafty 23.2 JA x64           2.554 18 18 1120 28% 2.718 30%
24. Chronos 1.99 x64             2.551 18 18 1120 27% 2.718 33% (ponder not possible)
25. Daydreamer 1.75 JA x64       2.521 19 19 1120 24% 2.719 30%
26. Tornado 3.6.7 x64            2.479 23 24  800 19% 2.722 24%
Parent - - By Frank Quisinsky Date 2010-09-09 12:49
Hallo,

weitere Infos zum laufenden Turnier:

Es gab einen bösen Hänger von Houdini. Im Spiel gegen Cipollito blieb das Match nach 32 Zügen hängen. Nachdem ich beendet hatte, blieb Houdini im RAM. Das kontrolliere ich natürlich auch, entfernte Houdini aus dem RAM und startete neu.

Tragisch, ich verfolge nicht immer aber wenn sich das öfters wiederholt bleiben einige Matches hängen. Nun gut, es laufen 4 Quad Cores und zeitglich 8 Matches. Bleiben mal 1 oder 2 Matches übers WE hängen, werden weniger Partien produziert, egal ... aber die Laufzeit vom Turnier wird natürlich beeinflusst.

Also, einen solchen Fehler hatte ich bei allen Engines seit die SWCR noch nie. Wenn mal eine Engine hängen bleibt (passiert bei Junior 11.2 x64 durchschnittlich bei ca. 150 Partien), ich das Match beendet liegt Junior 11.2 x64 aber nicht im RAM (übrigens passiert nicht bei Junior 11.2 w32 oder x86). Gleiches für die sehr seltenen Hänger bei der Loop Serie. Hier durchschnittlich nach 300-350 Partien, dass ein Loop mal hängen bleibt. Wobei Loop 2007 noch nie diesen Fehler produziert hat, eher Loop 13.6 oder jetzt Loop M1-T.

Muss Ingo mal fragen ob er solche Probleme bei Houdini auch hat.

Gruß
Frank
Parent - - By Frank Quisinsky Date 2010-09-10 13:24
Hallo zusammen,

so, die letzte Auswertung vor dem WE.

Am WE wird es sich entscheiden, in welche genauere ELO Richtung es für die neuen 6 Engines hinläuft.
Daher habe ich in die Shredder Classic 4.0 GUI die ELO-Auswertungen von Bayesian 0056 gebracht, die der SWCR-64 alle Partien.
Diese ELO-Berechnung der aktuellen SWCR-64 findet sich unter der Tabelle, siehe LINK "x64, with ELO calculations" auf der Startseite.

Nach wie vor versuche ich das laufende Turnier über die "Aktuell" Seite ein wenig mit Kommentare zu füllen.

Frank's Chess Page
http://www.amateurschach.de

Gruß
Frank

Code:
ELO calculation (2)
After 20.253 games (SWCR-64, all games)

01. IPP Houdini 1.03a x64        2.954 49 46  186 80% 2.719 28% NEW
02. Rybka 4 x64                  2.940 19 19 1209 81% 2.689 28%
--. IPP Fire 1.31 x64            2.905 45 43  191 75% 2.719 35% NEW
--. Rybka 3 x64                  2.905 22 22  840 78% 2.688 28%
03. Stockfish 1.8.0 JA x64       2.900 22 21  849 76% 2.702 31%
--. Stockfish 1.7.1 JA x64       2.896 19 18 1120 76% 2.706 34%
04. Critter 0.80 x64             2.841 21 20  849 69% 2.705 33%
05. Naum 4.2 x64                 2.832 16 16 1449 68% 2.700 35%
--. Critter 0.70 x64             2.807 19 19  880 65% 2.701 38%
06. Shredder 12                  2.800 16 16 1409 64% 2.699 35%
07. Komodo 1.2 JA x64            2.798 17 16 1209 65% 2.694 40%
--. Komodo 1.0 JA x64            2.791 20 20  840 64% 2.693 40%
--. Shredder 12 x64              2.788 18 18 1080 61% 2.707 35%
08. Spark 0.5 x64                2.738 16 16 1209 56% 2.696 39%
09. Thinker 5.4d Inert x64       2.732 15 15 1449 54% 2.703 40%
10. Zappa Mexico II x64          2.723 15 15 1449 53% 2.703 39%
--. Spark 0.4 x64                2.718 19 19  840 53% 2.697 40%
11. Protector 1.3.4 JA x64       2.716 15 15 1409 52% 2.704 37%
12. Fruit 09_07_05 x64           2.712 15 15 1450 51% 2.704 34%
--. Critter 0.60 x64             2.700 20 20  840 50% 2.697 38%
13. Hannibal 1.0a x64            2.689 20 20  849 47% 2.712 36%
14. Sjeng WC-2008 x64            2.686 15 15 1449 48% 2.704 36%
--. Protector 1.3.5 x64          2.684 19 19  840 47% 2.707 39%
15. Junior 11.2 x64              2.683 17 17 1209 48% 2.698 31%
16. Onno 1.2.70 x64              2.675 17 17 1209 47% 2.698 37%
--. Onno 1.1.1 x64               2.671 19 19  840 46% 2.699 40%
--. Junior 11.1a x64             2.648 20 20  840 43% 2.700 32%
17. Loop M1-T x64                2.641 42 43  185 38% 2.732 34% + 9
--. Loop 2007 x64                2.632 15 16 1400 40% 2.706 37%
18. Equinox 0.83 x64             2.614 43 44  186 34% 2.734 30% NEW
--. Twisted Logic 20100131x x64  2.611 18 18 1120 35% 2.716 32%
19. Umko 1.0 x64                 2.607 20 20  850 35% 2.716 36% (ponder not possible)
20. SmarThink 1.20 x64           2.602 15 16 1449 36% 2.707 33%
21. Crafty 23.3 JA x64           2.589 20 20  850 33% 2.717 33%
--. Cipollino 3.25 x64           2.574 44 46  186 28% 2.735 30% NEW
22. BugChess2 1.7 x64            2.563 21 22  800 29% 2.719 33%
23. Scorpio 2.6 JA x64           2.555 18 18 1120 28% 2.718 32%
--. Crafty 23.2 JA x64           2.555 18 18 1120 28% 2.718 30%
24. Chronos 1.99 x64             2.552 18 18 1120 27% 2.719 33% (ponder not possible)
--. Crafty 23.3 JA x64 NP        2.540 42 44  207 24% 2.737 30% (without ponder = -49 ELO)
25. Daydreamer 1.75 JA x64       2.521 19 19 1120 24% 2.720 30%
26. Tornado 3.6.7 x64            2.479 23 24  800 19% 2.723 24%


Gruß
Frank
Parent - - By Frank Quisinsky Date 2010-09-13 11:40 Edited 2010-09-13 11:47
Hallo,

hier wieder die aktuelle Kalkulation des laufenden Turnieres.

Bei Houdini 1.03a x64 gab es wie in einem anderen Thread beschrieben 8 GUI Hänger. Habe mir mal die Mühe gemacht herauszufinden wie denn die Nachholpartien endeten, denn die Hänger waren in 7 Fällen Remispositionen. In einem Fall konnte ich das nicht mehr nachvollziehen. 6x gab es zufälliger Weise das gleiche Remisergebnis und 1x gewann Houdini die Nachholpartie. Also nur 0.5 Punkte mehr durch die Nachholpartien erzielt. Diese Partie entstand gegen Junior 11.2 x64. Daher habe ich ein paar Junior 11.2 x64 Partien spielen lassen bis ein Remisergebnis vorlag und die automatische Nachholpartie ersetzt. Insofern stimmen jetzt zunächst mal wieder alle Ergebnisse bzw. die errechneten ELO Werte. Alles sehr aufwendig wenn es zu solchen Fehlern kommt.

Loop M1-T x64 blieb bislang auch 3x hängen, es gab mittlerweile 9 Partien bei den Loop in Stellungen bei Matt gegen sich die Zeit verlor. Das ist egal, weil die Partie eh verloren wurde. Ansonsten die üblichen Komodo Probleme und auch Equinox überzog mittlerweile 2x die Zeit, nach 17 Züge und 32 Züge. Diese beiden Partien werden derzeit wiederholt. Auch eine Zeitüberschreitung von Crafty 23.3 JA x64 mit Ponder (auch ein bekanntes Problem) wieder dabei, wurde wiederholt bzw. wird derzeit wiederholt.

Also, Datenbank bereinigt, Ergebnisse in Tabelle integriert ... in der Hoffnung das es bei den nächsten noch zu spielenden 600 Partien per 6 neuer Engines nicht zu sehr vielen weiteren Problemen kommt.

Ach ja, habe eine Excel Tabelle die mir Hochrechnungen erstellt.
Es scheint, dass es nach diesen Hochrechnungen nicht mehr zu gravierenden Änderungen bis Partie Nummer 920, für alle 6 neuen Engines kommt.
Also keine Änderungen mehr im Rahmen von +-5 (= 10 ELO mehr oder weniger).
Sehr früh wie bei den letzten Turnieren scheint die ELO also schon aussagekräftig zu sein, bin mal gespannt.

Höchste Abweichung erreicht Crafty 23.3 JA x64 NP (no ponder) mit -8 ... sollte noch um 8 ELO steigen. Zweithöchste für Loop M1-T (sollte noch um 6 ELO steigen). Prognose bei Houdini 1.03a x64 ist 8 ELO stärker als Rybka 4.
Wer sich dafür interessiert ...

Code:
ELO calculation (3)
After 20.886 games (SWCR-64, all games)

01. IPP Houdini 1.03a x64        2.951 38 36  306 79% 2.719 26% NEW
02. Rybka 4 x64                  2.940 19 19 1239 81% 2.690 28%
--. IPP Fire 1.31 x64            2.912 35 33  322 75% 2.721 35% NEW
--. Rybka 3 x64                  2.905 22 22  840 78% 2.687 28%
03. Stockfish 1.8.0 JA x64       2.902 21 21  880 76% 2.702 31%
--. Stockfish 1.7.1 JA x64       2.896 19 18 1120 76% 2.706 34%
04. Critter 0.80 x64             2.841 20 20  881 69% 2.705 33%
05. Naum 4.2 x64                 2.831 16 15 1480 68% 2.700 36%
--. Critter 0.70 x64             2.806 19 19  880 65% 2.701 38%
06. Shredder 12                  2.800 16 15 1440 64% 2.699 35%
07. Komodo 1.2 JA x64            2.798 17 16 1240 64% 2.694 39%
--. Komodo 1.0 JA x64            2.791 20 20  840 64% 2.693 40%
--. Shredder 12 x64              2.787 18 18 1080 61% 2.707 35%
08. Spark 0.5 x64                2.739 16 16 1240 56% 2.696 38%
09. Thinker 5.4d Inert x64       2.732 15 15 1480 54% 2.703 40%
10. Zappa Mexico II x64          2.723 15 15 1480 53% 2.703 39%
--. Spark 0.4 x64                2.717 19 19  840 53% 2.696 40%
11. Protector 1.3.4 JA x64       2.715 15 15 1440 52% 2.704 37%
12. Fruit 09_07_05 x64           2.711 15 15 1480 51% 2.704 34%
--. Critter 0.60 x64             2.700 20 20  840 50% 2.697 38%
13. Hannibal 1.0a x64            2.689 19 19  879 47% 2.712 36%
14. Sjeng WC-2008 x64            2.685 15 15 1480 48% 2.704 36%
--. Protector 1.3.5 x64          2.684 19 19  840 47% 2.706 39%
15. Junior 11.2 x64              2.682 17 17 1240 48% 2.698 31%
16. Onno 1.2.70 x64              2.676 16 16 1240 47% 2.698 37%
--. Onno 1.1.1 x64               2.671 19 19  840 46% 2.699 40%
--. Junior 11.1a x64             2.648 20 20  840 43% 2.700 32%
17. Loop 2007 x64                2.631 15 16 1400 40% 2.706 37%
--. Loop M1-T x64                2.628 33 34  301 36% 2.733 35% - 3 ELO
18. Equinox 0.83 x64             2.615 34 35  300 34% 2.735 29% NEW
--. Twisted Logic 20100131x x64  2.611 18 18 1120 35% 2.716 32%
19. Umko 1.0 x64                 2.606 20 20  881 35% 2.716 36% (ponder not possible)
20. SmarThink 1.20 x64           2.602 15 15 1480 36% 2.707 34%
21. Crafty 23.3 JA x64           2.589 20 20  880 33% 2.716 33%
--. Cipollino 3.25 x64           2.578 34 35  302 29% 2.736 32% NEW
22. BugChess2 1.7 x64            2.563 21 22  800 29% 2.719 33%
23. Scorpio 2.6 JA x64           2.555 18 18 1120 28% 2.718 32%
--. Crafty 23.2 JA x64           2.555 18 18 1120 28% 2.718 30%
24. Chronos 1.99 x64             2.552 18 18 1120 27% 2.718 33% (ponder not possible)
--. Crafty 23.3 JA x64 NP        2.551 34 35  321 26% 2.736 31% (without ponder = -38 ELO)
25. Daydreamer 1.75 JA x64       2.521 19 19 1120 24% 2.719 30%
26. Tornado 3.6.7 x64            2.479 23 24  800 19% 2.723 24%


Wer die aktuelle Turniertabelle (LIVE-Mode) verfolgten möchte ...

Frank's Chess Page
http://www.amateurschach.de

Viele Grüße
Frank
Parent - - By Frank Quisinsky Date 2010-09-16 16:37
Hallo,

damit die ELO Entwicklung schön nachvollzogen werden kann hier dann die weitere ...
Es ist Halbzeit bei den 6 neuen Engines, ca. 460 der 920 Partien wurden gespielt.

Für Houdini 1.03a x64 steht das Turnier auf Spielstop. Ich kann in den nächsten Tagen keine Turnierkorrekturen bei Abstürzen mehr durchführen. Bislang stürzte Houdini 1.03a x64 15x ab (wie beschrieben mit GUI-Crash, vorgekommen auf allen der 4 SWCR Rechner). Das entspricht einer Absturzquoto von 3,26%. Damit alles zügig weiterläuft steht Houdini also bis Montag auf Stop und wird dann ab Montag die Partien automtisch nachholen. Informationen hierzu finden sich auf meiner Aktuell / Actual Seite.

Code:
ELO calculation (5)
After 21.715 games (SWCR-64, all games)

01. IPP Houdini 1.03a x64        2.952 31 30  461 80% 2.719 27% NEW
02. Rybka 4 x64                  2.939 19 18 1280 81% 2.690 28%
--. Rybka 3 x64                  2.905 22 22  840 78% 2.688 28%
03. Stockfish 1.8.0 JA x64       2.904 21 21  920 76% 2.702 30%
--. IPP Fire 1.31 x64            2.897 28 28  461 74% 2.721 36% NEW
--. Stockfish 1.7.1 JA x64       2.896 19 18 1120 76% 2.706 34%
04. Critter 0.80 x64             2.838 20 20  921 68% 2.705 33%
05. Naum 4.2 x64                 2.831 15 15 1520 68% 2.701 35%
--. Critter 0.70 x64             2.807 19 19  880 65% 2.701 38%
06. Shredder 12                  2.800 15 15 1480 64% 2.699 35%
07. Komodo 1.2 JA x64            2.799 16 16 1281 65% 2.694 39%
--. Komodo 1.0 JA x64            2.791 20 20  840 64% 2.693 40%
--. Shredder 12 x64              2.788 18 17 1080 61% 2.707 35%
08. Spark 0.5 x64                2.740 16 16 1280 56% 2.696 38%
09. Thinker 5.4d Inert x64       2.735 15 15 1521 54% 2.703 40%
10. Zappa Mexico II x64          2.723 15 15 1521 53% 2.703 39%
--. Spark 0.4 x64                2.718 19 19  840 53% 2.697 40%
11. Protector 1.3.4 JA x64       2.715 15 15 1480 52% 2.704 36%
12. Fruit 09_07_05 x64           2.709 15 15 1521 51% 2.704 34%
--. Critter 0.60 x64             2.700 20 20  840 50% 2.697 38%
13. Hannibal 1.0a x64            2.690 19 19  921 47% 2.711 36%
14. Sjeng WC-2008 x64            2.685 15 15 1520 48% 2.705 36%
--. Protector 1.3.5 x64          2.685 19 19  840 47% 2.707 39%
15. Junior 11.2 x64              2.682 16 16 1282 48% 2.698 31%
16. Onno 1.2.70 x64              2.676 16 16 1280 47% 2.698 38%
--. Onno 1.1.1 x64               2.671 19 19  840 46% 2.699 40%
--. Junior 11.1a x64             2.648 20 20  840 43% 2.700 32%
17. Loop M1-T x64                2.634 27 27  461 37% 2.732 35% + 2 ELO
--. Loop 2007 x64                2.632 15 16 1400 40% 2.706 37%
--. Twisted Logic 20100131x x64  2.611 18 18 1120 35% 2.716 32%
18. Equinox 0.83 x64             2.607 28 28  461 33% 2.734 30% NEW
19. Umko 1.0 x64                 2.606 19 19  921 35% 2.715 36% (ponder not possible)
20. SmarThink 1.20 x64           2.604 15 15 1520 36% 2.707 34%
21. Crafty 23.3 JA x64           2.592 19 20  921 33% 2.716 34%
--. Cipollino 3.25 x64           2.581 28 28  461 29% 2.735 32% NEW
22. BugChess2 1.7 x64            2.564 21 22  800 29% 2.719 33%
23. Scorpio 2.6 JA x64           2.555 18 18 1120 28% 2.718 32%
--. Crafty 23.2 JA x64           2.555 18 18 1120 28% 2.718 30%
24. Chronos 1.99 x64             2.552 18 18 1120 27% 2.719 33% (ponder not possible)
--. Crafty 23.3 JA x64 NP        2.550 28 29  475 26% 2.736 31% (without ponder = -42 ELO)
25. Daydreamer 1.75 JA x64       2.521 19 19 1120 24% 2.720 30%
26. Tornado 3.6.7 x64            2.479 23 24  800 19% 2.723 24%


Die nächste Auswertung erfolgt dann am Montag (sehr spät, wenn die Houdini 1.03a x64 Partien nachgespielt sind).
Aber bereits jetzt sind die Auswertungen der 6 neuen Engines recht zuverlässig. Immerhin liegen ja auch schon 460 Partien vor.

Gruß
Frank
Parent - - By Frank Quisinsky Date 2010-09-16 17:44
Hallo zusammen,

würde dann folgende SWCR (alle Partien) ergeben:
Nach 52.875 Partien ...


Code:
Rank Name                          Elo    +    - games score oppo. draws
   1 Houdini 1.03a x64            2952   31   30   461   80%  2719   27%
   2 Rybka 4 x64                  2939   19   18  1280   81%  2690   28%
   3 Rybka 3 x64                  2905   23   22   840   78%  2687   28%
   4 Stockfish 1.8.0 JA x64       2904   21   21   920   76%  2702   30%
   5 Fire 1.31 x64                2897   29   28   461   74%  2721   36%
   6 Stockfish 1.7.1 JA x64       2896   19   19  1120   76%  2706   34%
   7 Rybka 4                      2894   20   20  1000   75%  2709   33%
   8 Stockfish 1.7.1 JA           2874   18   18  1200   75%  2689   31%
   9 Stockfish 1.8.0a JA          2866   22   21   800   74%  2694   36%
  10 Stockfish 1.8.0 JA           2863   20   20   920   74%  2696   37%
  11 Rybka 3                      2860   16   16  1520   74%  2689   31%
  12 Critter 0.80 x64             2838   20   20   921   68%  2705   33%
  13 Naum 4.2 x64                 2831   16   15  1520   68%  2701   35%
  14 Stockfish 1.6.3 JA           2827   18   18  1080   71%  2680   36%
  15 Naum 4.2                     2826   16   15  1480   67%  2705   36%
  16 Critter 0.80                 2813   21   20   800   66%  2702   39%
  17 Naum 4.1                     2811   20   19   920   68%  2686   35%
  18 Critter 0.70 x64             2806   20   19   880   65%  2701   38%
  19 Stockfish 1.6.0 JA           2802   19   19   960   68%  2687   39%
  20 Shredder 12                  2800   10   10  3520   64%  2702   37%
  21 Komodo 1.2 JA x64            2799   16   16  1281   65%  2694   39%
  22 Komodo 1.0 JA x64            2791   20   20   840   64%  2693   40%
  23 Shredder 12 x64              2788   18   18  1080   61%  2707   35%
  24 Naum 4.0                     2785   19   19   960   65%  2682   38%
  25 Deep Fritz 12                2779   14   14  1560   60%  2708   43%
  26 Critter 0.70                 2776   19   18   960   60%  2710   40%
  27 Komodo 1.2 JA                2758   18   18  1000   56%  2714   42%
  28 Fritz 12                     2746   16   16  1160   59%  2688   44%
  29 Spark 0.5 x64                2740   16   16  1280   56%  2696   38%
  30 Hiarcs 13.1                  2736   18   18  1000   53%  2715   43%
  31 Thinker 5.4d Inert x64       2734   15   15  1521   54%  2703   40%
  32 Stockfish 1.5.1 JA           2731   19   19   840   59%  2672   43%
  33 Zappa Mexico II x64          2723   15   15  1521   53%  2703   39%
  34 Spark 0.4 x64                2718   20   20   840   53%  2696   40%
  35 Komodo 1.0 JA                2716   16   16  1200   53%  2695   40%
  36 Protector 1.3.4 JA x64       2715   15   15  1480   52%  2704   36%
  37 Spark 0.5                    2713   18   18  1000   50%  2716   41%
  38 Thinker 5.4d Inert           2711   13   13  2040   51%  2706   42%
  39 Fruit 09_07_05 x64           2709   15   15  1521   51%  2704   34%
  40 Critter 0.60 x64             2700   20   20   840   50%  2697   38%
  41 Doch 1.3.4 JA                2690   19   19   840   51%  2686   44%
  42 Hannibal 1.0a x64            2690   19   19   921   47%  2711   36%
  43 Critter 0.60                 2688   19   19   920   50%  2688   39%
  44 Spark 0.4                    2686   19   19   880   49%  2692   43%
  45 Sjeng WC-2008 x64            2685   15   15  1520   48%  2704   36%
  46 Protector 1.3.5 x64          2684   20   20   840   47%  2706   39%
  47 Junior 11.2                  2683   18   18  1000   45%  2717   33%
  48 Junior 11.2 x64              2682   17   17  1282   48%  2698   31%
  49 Protector 1.3.4 JA           2679   16   16  1360   46%  2706   39%
  50 Onno 1.2.70 x64              2676   16   16  1280   47%  2698   38%
  51 Cyclone xTreme Wrath         2676   17   17  1080   47%  2697   41%
  52 Protector 1.3.2              2674   16   17  1160   47%  2695   41%
  53 Onno 1.1.1 x64               2671   20   20   840   46%  2699   40%
  54 Protector 1.3.5 JA           2669   19   19   880   43%  2719   41%
  55 Junior 2010                  2669   16   16  1240   47%  2691   36%
  56 Hiarcs 12.1                  2667   19   19   880   47%  2689   41%
  57 Protector 1.3.1b             2667   19   19   840   47%  2690   42%
  58 Doch 1.2 JA                  2665   19   19   840   48%  2679   40%
  59 Sjeng WC-2008                2665   13   13  2040   44%  2707   37%
  60 Hiarcs 12.1 Sharpen PV       2664   16   16  1280   45%  2699   40%
  61 Zappa Mexico II              2662   13   13  2040   43%  2707   42%
  62 Spark 0.3a                   2656   17   17  1120   44%  2698   41%
  63 Doch 09.980 JA               2652   19   19   840   46%  2676   42%
  64 Junior 11.1a x64             2648   20   20   840   43%  2700   32%
  65 Junior 11.1a                 2645   19   19   960   44%  2691   36%
  66 Spark 0.3                    2643   19   19   880   43%  2690   42%
  67 Hannibal 1.0a                2640   20   20   840   39%  2714   36%
  68 Onno 1.2.70                  2634   18   18  1000   38%  2719   40%
  69 Loop M1-T x64                2634   27   27   461   37%  2732   35%
  70 Loop 2007 x64                2632   16   16  1400   40%  2706   37%
  71 Onno 1.1.1                   2631   15   15  1520   40%  2695   41%
  72 Fruit 05/11/03               2617   13   13  2040   37%  2708   40%
  73 Loop 13.6                    2615   15   15  1520   38%  2696   39%
  74 Critter 0.52b                2614   18   18  1040   38%  2699   37%
  75 Loop 2007                    2612   19   19  1000   34%  2720   35%
  76 Twisted Logic 20100131x x64  2611   18   18  1120   35%  2716   32%
  77 Glaurung 2.2 JA              2610   17   18  1080   37%  2700   36%
  78 Ktulu 9.03                   2608   15   15  1560   36%  2712   30%
  79 Equinox 0.83 x64             2607   28   29   461   33%  2733   30%
  80 Umko 1.0 x64                 2606   19   20   921   35%  2715   36%
  81 SmarThink 1.20 x64           2603   15   15  1520   36%  2707   34%
  82 SmarThink 1.20               2596   13   13  2040   34%  2708   37%
  83 Crafty 23.3 JA x64           2592   20   20   921   33%  2715   34%
  84 Cipollino 3.25 x64           2581   28   29   461   29%  2735   32%
  85 Twisted Logic 20100131x      2574   15   15  1640   31%  2711   30%
  86 Spike 1.2 Turin              2573   15   16  1520   30%  2712   34%
  87 BugChess2 1.7 x64            2564   21   22   800   29%  2719   33%
  88 Scorpio 2.6 JA x64           2555   18   19  1120   28%  2718   32%
  89 Crafty 23.2 JA x64           2555   18   19  1120   28%  2718   30%
  90 Chronos 1.99 x64             2552   18   19  1120   27%  2718   33%
  91 Crafty 23.3 JA x64 NP        2550   28   29   475   26%  2736   31%
  92 Daydreamer 1.75 JA x64       2521   19   19  1120   24%  2720   30%
  93 Tornado 3.6.7 x64            2479   24   24   800   19%  2723   24%


Gruß
Frank
Parent - - By Frank Quisinsky Date 2010-09-20 17:25
Hallo zusammen,

Houdini wurde nach 4 Tagen Spielpause nun wieder vom Spielstop befreit (wegen der beschriebenen Abstürze). So konnte die anderen 5 Engines am Wochenende in Ruhe und ohne Spielabbrüche die automatisch generierten Partien unter der Shredder GUI absolvieren.

Also bei 5 der 6 "neuen" Engines, nunmehr ca. 700 von 920 Partien
und bei Houdini wurden bislang die Hälfte mit 460 von 920 Partien absolviert.

Das Turnier läuft wahrscheinlich am Samstag sehr spät aus.
Das nächste Turnier startet dann wahrscheinlich erst am Montag nächster Woche.

Ist also alles in den letzten Zügen ... an den ELOs der 6 neuen wird sich nun nach so vielen Partien kaum noch etwas ändern.

Hier die aktuelle Berechnung:

Code:
ELO calculation (6)
After 22.816 games (SWCR-64, all games)

01. IPP Houdini 1.03a x64        2.952 31 30  461 80% 2.717 27% NEW
02. Rybka 4 x64                  2.938 19 18 1336 81% 2.688 28%
--. Rybka 3 x64                  2.905 22 22  840 78% 2.687 28%
03. Stockfish 1.8.0 JA x64       2.903 20 20  976 76% 2.698 30%
--. IPP Fire 1.31 x64            2.903 23 23  703 75% 2.716 35% NEW
--. Stockfish 1.7.1 JA x64       2.895 18 18 1120 76% 2.706 34%
04. Critter 0.80 x64             2.840 19 19  976 69% 2.701 33%
05. Naum 4.2 x64                 2.831 15 15 1574 68% 2.698 35%
--. Critter 0.70 x64             2.806 19 19  880 65% 2.701 38%
06. Komodo 1.2 JA x64            2.801 16 16 1336 65% 2.692 39%
07. Shredder 12                  2.800 15 15 1534 64% 2.697 35%
--. Komodo 1.0 JA x64            2.790 20 20  840 64% 2.692 40%
--. Shredder 12 x64              2.787 18 17 1080 61% 2.706 35%
08. Spark 0.5 x64                2.739 16 16 1336 57% 2.694 38%
09. Thinker 5.4d Inert x64       2.734 15 14 1576 55% 2.700 39%
10. Zappa Mexico II x64          2.723 15 14 1576 53% 2.701 39%
--. Spark 0.4 x64                2.717 19 19  840 53% 2.696 40%
11. Protector 1.3.4 JA x64       2.714 15 15 1536 52% 2.701 37%
12. Fruit 09_07_05 x64           2.706 15 15 1576 51% 2.701 34%
--. Critter 0.60 x64             2.700 20 20  840 50% 2.697 38%
13. Hannibal 1.0a x64            2.692 18 18  976 48% 2.707 36%
14. Sjeng WC-2008 x64            2.686 14 15 1576 48% 2.702 35%
--. Protector 1.3.5 x64          2.684 19 19  840 47% 2.706 39%
15. Junior 11.2 x64              2.681 16 16 1335 48% 2.695 31%
16. Onno 1.2.70 x64              2.675 16 16 1336 47% 2.695 38%
--. Onno 1.1.1 x64               2.670 19 19  840 46% 2.698 40%
--. Junior 11.1a x64             2.647 20 20  840 43% 2.699 32%
17. Loop 2007 x64                2.631 15 16 1400 40% 2.706 37%
--. Loop M1-T x64                2.626 22 22  700 36% 2.728 35% - 5 ELO
--. Twisted Logic 20100131x x64  2.611 17 18 1120 35% 2.716 32%
18. Umko 1.0 x64                 2.606 19 19  976 36% 2.710 36% (ponder not possible)
19. SmarThink 1.20 x64           2.602 15 15 1576 36% 2.704 34%
20. Equinox 0.83 x64             2.597 22 23  700 32% 2.730 32% NEW
21. Crafty 23.3 JA x64           2.592 19 19  975 34% 2.711 34%
--. Cipollino 3.25 x64           2.573 23 23  701 29% 2.731 32% NEW
22. BugChess2 1.7 x64            2.563 21 21  800 29% 2.719 33%
23. Scorpio 2.6 JA x64           2.555 18 18 1120 28% 2.718 32%
--. Crafty 23.2 JA x64           2.554 18 18 1120 28% 2.718 30%
24. Chronos 1.99 x64             2.551 18 18 1120 27% 2.718 33% (ponder not possible)
--. Crafty 23.3 JA x64 NP        2.546 23 23  725 26% 2.732 31% (without ponder = -46 ELO)
25. Daydreamer 1.75 JA x64       2.521 18 19 1120 24% 2.719 30%
26. Tornado 3.6.7 x64            2.479 23 24  800 19% 2.723 24%


Die LIVE Tabelle kann auf meinen Webseiten eingesehen werden!

Frank's Chess Page, SWCR
http://www.amateurschach.de

Weiterhin viel Spass beim Beobachten der SWCR.

Gruß
Frank
Parent - - By ernst happe Date 2010-09-21 13:19
hi frank,

ist dieses dir bekannt und trifft das für dein turnier zu?

Code:
Known issues in current release 1.03a

    * There is a known time management problem at ultra-short time controls with increments (for example 5"+0.05" time control). The problem has a significant impact on the playing strength when the remaining time available for a move is less than a second. The issue does not occur at ultra-short repeating time controls (e.g. 5"/40).


quelle:

http://www.cruxis.com/chess/houdini.htm

ernst
Parent - - By Frank Quisinsky Date 2010-09-21 14:56
Hallo,

mit solch kurzen Bedenkzeiten lasse ich nicht spielen.
Fest steht aber, dass Houdini 1.03a x64 bei mir nach ca. 700 Partien 27x die Shredder 12 GUI zum Absturz gebracht hat.

Hatte kürzlich geschrieben, dass dies bei Remispositionen vorkommt.
Nein stimmt nicht.
Die Abstürze kommen auch im Mittelspiel, kurz vor der Mattsetzung seitens Houdini, also total unregelmäßig.

Bei Ponder = off Partien hatte ich bislang keine Probleme. Auf meinem Notebook habe ich jetzt ca. 800 Partien mit Partie in 5 Minuten spielen lassen.
Nicht ein einziger Absturz.

Dieses Houdini Problem nervt ganz gewaltig und von daher muss ich die Engine bei den automatischen Turnieren rausnehmen.
Ein Rating nach ca. 1.000 Partien habe ich ja und das scheint ca. 10-15 ELO über Rybka 4 zu liegen.

Gruß
Frank
Parent - - By Thomas Müller Date 2010-09-21 15:01
ist schon seltsam....
Ich hatte in letzter zeit auch einiges mit der shredder-gui laufen lassen.
Dabei sind ein paar (muss grad noch überlegen) aufgefallen die nicht liefen obwohl diese unter CB-Gui keine probleme hatten.
Houdini war nicht dabei.....waren eher "exoten....ah ne  komodo war z.b dabei und N2....

grüße thomas
Parent - - By Frank Quisinsky Date 2010-09-21 15:51
Hallo Thomas,

also ich bin mir sicher das diese Probleme bei Houdini mit Ponder = on zusammenhängen.
Schwierig auf Fehlersuche zu gehen, müsste mit debug Option spielen. Habe auch keine Lust Beta zu testen.

Komodo bringt aber nicht die GUI zum Absturz, sondern überzieht lediglich die Zeit.
Das kann einfach herausgefiltert und geändert werden, zumal es sich immer um klare Remispositionen handelt.

Das Komodo Problem ist also harmlos, müssen heit nur die Daten geprüft werden.
Einfach mit ChessBase 10.

Gruß
Frank
Parent - - By Gerhard Sonnabend Date 2010-09-21 16:06
[quote="Frank Quisinsky"]
also ich bin mir sicher das diese Probleme bei Houdini mit Ponder = on zusammenhängen.
Schwierig auf Fehlersuche zu gehen, müsste mit debug Option spielen. Habe auch keine Lust Beta zu testen.
[...snip...]
[/quote]

Ich kann bestätigen, dass in bisher 300 PB=off Games für
meine QBRL ebenfalls keinerlei Probleme festzustellen sind.
Bin mir gibt es lediglich 4 Steiner und es wird immer bis zum
bitteren Ende gespielt. GUI = Shredder Classic.
Es scheint also tatsächlich an PB=on zu liegen. Komisch nur,
dass Ingo kaum Probleme hatte. Evtl. liegt "es" an der Kombination
PB=on und Zeitstufen xZüge/yZeit repeated ?

Viele Grüsse,
G.S.
Parent - - By Frank Quisinsky Date 2010-09-21 16:33
Hi Gerhard,

habe mal ein wenig im Forum geblättert.
Als Ingo Houdini testete berichte er auch von diesen Hängern.

Die meisten sind in klaren Endstellungen kurz vor dem Remis oder Matt.
Da Ingo ja mit Aufgabefaktor spielt wird es sich bei Ihm reduzieren.

Kann aber dennoch sein, dass dieses Problem in Verbindung mit den Zeitstufen x Züge in x Minuten wiederholend liegt.

Bin auch ein wenig überrascht.
Houdini hält das Rating nach 460 Partien auch bei jetzt fast 700 Partien bzw. legt nochmals knapp zu.
Werden bei mir ca. 10-15 ELO über Rybka 4.

Nun bin ich gespannt wenn Firebird 1.1 Weal Setting und IvanHoe x im kommenden Turnier eingreift.
Nach einem Kurztest scheint IvanHoe ca. 10 ELO über Houdini zu liegen.

Mithin liegen die letzten IPP Familie Engines und Rybka 3 / 4 ca. 60 ELO auseinander.
Warten wir das mal in Ruhe ab ...

Gruß
Frank
Parent - - By Bram Mourik Date 2010-09-21 20:29
Hallo Frank, vielen dank für deine Arbeit und ich bin ganz froh das du die Ippo's mitnehmt in deine Tests.
Grüsse Bram
Parent - By Frank Quisinsky Date 2010-09-22 13:02
Hi Bram,

wobei ich jetzt nicht jede IPP Familie Engine teste.
Nehme jetzt 4 auf, 2 laufen und im kommenden Turnier 2 weitere (Firebird 1.1 Wael Setting und Ivanhoe T0.4 Beta).
Die nächsten IPPs schaue ich mir dann vielleicht in 3 Monate an, es sei denn ich vernehme, dass sich eine wesentlich verbessert hat.

Du siehst aber das die Rybka 3 / 4 und die diversen IPPs nur ca. 50 ELO auseinder liegen.
Noch eine Vermutung aber jetzt überlege mal wie viele IvanHoe Versionen es allein gibt.
Für jeden ELO mehr wahrscheinlich 20 Versionen.

Egal ...
Bin jetzt mal auf IvanHoe gespannt.

Fire 1.31 zieht zu schnell bei Ponder = On Matches und verliert dadurch allein ca. 10-15 ELO (immer noch großer Rest auf der Uhr vor der Zeitkontrolle).
Houdini 1.03a x64 stürzt bei Ponder = on Matches unregelmäßig durchschnittlich nach 33 Partien 1x ab bzw. bringt die automatischen Partien zum erliegen (Shredder GUI crasht).

Insofern ...
Mal schauen was Ivanhoe fabriziert, Ivanhoe und Firebird 1.1 starten dann am Sonntag beim nächsten SWCR-64 Turnier.

Gruß
Frank
Parent - - By ernst happe Date 2010-09-22 11:18
hi frank,

deine ratingliste hat einen entscheidenden fehler, da die spreizung der elo werte viel zu hoch ist!

du solltest von rang eins bis zum schlusslicht nicht mehr als 300 elo punkte zu liegen haben.

da ja so viel wert auf realität der werte gelegt wird, so daneben ist diese liste.

z.b. würde niemand auf die idee kommen, wm carlson gegen spieler der 3 kreisklasse spielen zu lassen und dann noch auszuwerten!

ernst

als reines turnier ist es jedoch voll o.k.
Parent - - By Thomas Müller Date 2010-09-22 12:34
aha.... 
aber deine "liste" hat keine 300 elo spreizung ?
oh jeh!
Parent - - By ernst happe Date 2010-09-22 12:43
doch, doch.

da verwechselt du etwas thomas, denn du hast mein letztes posting dazu nicht gelesen.
ich sprach von einem grundstock von engines die dieses turnier zu ende spielen sollen und alle
elowerte sollten dabei innerhalb einer 300 elo spreizung liegen!

ernstlich amüsiert solchen unverständnis

ernst
Parent - By Thomas Müller Date 2010-09-22 13:33
amüsiert bin ich auch
nun denn, mach mal. Mal sehen was da so rauskommt bei dir?!

grüße thomas
Parent - - By Frank Quisinsky Date 2010-09-22 12:56
Hallo Ernst,

das spielt hinsichtlich der Ratings keine Rolle bzw. verschieben sich durch die Unterschiede von Platz 1 zum letzten Platz die ELOs nicht.
Du kannst das einfach testen ...

Nehme die SWCR-32 oder die SWCR-64 und lösche einfach mal die letzten beiden Engines in der Liste weg.
Berechne dann neu und vergleiche welche Auswirkungen das hat.

Wenn es denn trotzdem zu Abweichungen kommt liegt das auch ein wenig an ELOstat. Bayesian ist in diesem Punkt genauer.

Vor vielleicht 5-6 Jahren sind viele Ratinglistenbetreiber davon ausgegangen (zähle mich dazu), dass die Unterschiede von Platz 1 bis zum letzten Platz vielleicht nicht mehr als 250-300 ELO betragen sollten. Schönes Beispiel war auch Klaus Wlotzka mit seiner CSS Ratingliste oder wie gesagt meine damalige eigene Ratingliste.

Wichtig ist wirklich nur, dass möglich viele Engines eine gleiche Anzahl von Partien gegeneinander spielen. Je mehr Engines desto weniger Partien werden notwendig. Die SWCR Ratings sind im Grunde schon ab ca. 350 in knapp über 90% aller Fälle recht genau, +-10!

Gruß
Frank

PS:
Wenn ich im kommenden Jahr an der SWCR in bisheriger Form weiterspiele (meine Tendenz dazu ist 70:30, überlege ob ich eine neue Liste mit längeren Bedenkzeiten aufbaue) dann werden die Unterschiede sicherlich noch größer werden, zumindest in der SWCR-64. Denn in diesem Fall werde ich mehr und mehr Amateure hinzuholen die das Level der TOP 15 noch nicht erreicht haben, z. B. Tornado, Chronos, BugChess etc.. Die SWCR-64 ist meine experimentelle Liste, hier teste ich einfach alles wozu ich gerade Lust und Laune habe.
Parent - - By ernst happe Date 2010-09-24 10:53
[quote="Frank Quisinsky"]
Hallo Ernst,

das spielt hinsichtlich der Ratings keine Rolle bzw. verschieben sich durch die Unterschiede von Platz 1 zum letzten Platz die ELOs nicht.
Du kannst das einfach testen ...

Nehme die SWCR-32 oder die SWCR-64 und lösche einfach mal die letzten beiden Engines in der Liste weg.
Berechne dann neu und vergleiche welche Auswirkungen das hat.

...
[/quote]
hi frank,

noch ein irrtum deinerseits,

denn ratinglisten bzw. turnierauswertungen werden durch die gesetze der statistik und den gesetzen der
grossen zahlen bestimmt. da nutzt es nichts ein paar engines herauszunehmen und sich dann zu wundern, dass sich nichts ändert!

tip:

nehme die top engines die in deiner liste eine spreizung der elo zahlen von ca 200 -300 punkte aufweisen.

es sollten dann immer noch genügend partien zur auswertung vorliegen.
und dann berechne einfach mal neu.

ernst
Parent - By Frank Quisinsky Date 2010-09-24 13:27
Hi,

das selbe in grün, rosarot, zartes leuchtendes schwarz, grelles weiß ... bestechendes gepunktetes rot-rot-grün, schwarz-gelb und was es nicht alles gibt auf der Welt

Dennoch, ich schätze mal das die SWCR-32 und die SWCR-64 ELO Verwischungen von ca. 8 Punkten hat.
Glaube das bei meinen 32-Bit / 64-Bit Vergleich alles um 8 ELO verwischt wird.

Wird sich mit weiteren und noch mehr und mehr Partien immer mehr ausgleichen.
Ruhig bleiben und Rechner laufen lassen ...

Gruß
Frank
Parent - - By Thomas Müller Date 2010-09-21 16:28
nee...ich habe einige 40in20' mit ponder=on und 1cpu laufen lassen.
Sogar wenn die gui mehrmals gestartet ist hatte ich bei H1.03a keinen hänger

Ja bei komodo ist "nur" die engine hänegn geblieben.
Mit chronos (kann nicht pondern) hatte ich auch massive probleme unter shredder, CB nicht

Und dann hatte ich nich scorpio 2.6....die lief unter shredder aber unter CB nicht.

Ja so ist halt mit den unterschiedlichen umsetzungen von WB&UCI....denke das ist nicht einheitlich?!

grüße thomas
Parent - - By Frank Quisinsky Date 2010-09-21 16:35 Edited 2010-09-21 16:38
Hallo Thomas,

also Chronos lief ohne Ponder im Ponder=on Turnier bei mir problemlos durch.
Nicht ein Hänger.

OK, dann könnte es in Verbindung mit dem Prozessortyp liegen.
Vielleicht mag Houdini die AMDs und hat bei den Intel Prozessoren ein Problem.

Gerade die Hänger 28, 29 gehabt.
4 Rechner mit Q9550 Prozessoren und die Hänger habe ich jeden der vier PCs.

Durchschnittlich nach jeder 30sten Partien ein GUI Crash.
Zu viel für die automatischen Shredder Turniere, legt mir alles lahm wenn ich Houdini später im Turnier lasse.

Gruß
Frank

Scorpio hatte ich nur im x64 Turnier, da spielt keine Fritz Engine!
Also habe ich Scorpio noch nicht unter der Fritz GUI laufen gehabt.
Allerdings kann ich dennoch bestätigen, auf meinem Notebook unter der Fritz GUI gab es massive Probleme mit der letzten Scorpio Version.
Parent - - By Thomas Müller Date 2010-09-21 17:25
hattest du die S-gui auch mehrfach gestartet?
ja denke schon, du machst das ja dauernd so.
hmmm....seltsam das alles ist.
Muss ich mir mal anschauen ob ich was finde.....evtl. tatsächlich intel/amd ?!?
Parent - By Frank Quisinsky Date 2010-09-21 17:50
Hi Thomas,

ja, laufen auf den 4 Quad Systemen immer 2 Matches, also insgesamt 8 Matches bei Ponder = on.
Vielleicht findest Du ja was ... dumm ist, dass die Endstellungen durch den Absturz nicht gesavt werden.
Das macht die Sache schwierig.

Im Grunde müsste "debug" mitlaufen. Bei ca. 30 Matches wird statistisch gesehen ein Crash dabei sein.

Gruß
Frank
Parent - - By Frank Quisinsky Date 2010-09-22 13:18
Hallo zusammen,

so Houdini 1.03a x64 ist nun auf den Stand der anderen 5 neuen Engines.
Die 6 neuen haben jetzt also 736 der 920 Partien gespielt.

Da ich einige Datenbankwartungsarbeiten durchführte ruhte das Turnier für 7 Stunden.
Derzeit werden ausschließlich die restlichen 186 fehlenden Houdini Partien gespielt, damit das Turnier dann ohne Abstürze in meiner Abwesenheit am Wochenende auslaufen kann.

Hier wieder die aktuelle SWCR-64 (alle Partien).

ELO calculation (7)
After 23.176 games (SWCR-64, all games)

Code:
01. IPP Houdini 1.03a x64        2.949 24 24  736 79% 2.718 28% NEW
02. Rybka 4 x64                  2.938 18 18 1352 81% 2.690 28%
--. Rybka 3 x64                  2.905 22 22  840 78% 2.687 28%
03. Stockfish 1.8.0 JA x64       2.904 20 20  992 76% 2.701 31%
--. IPP Fire 1.31 x64            2.901 23 22  736 75% 2.720 36% NEW
--. Stockfish 1.7.1 JA x64       2.896 19 18 1120 76% 2.706 34%
04. Critter 0.80 x64             2.838 19 19  992 68% 2.704 33%
05. Naum 4.2 x64                 2.831 15 15 1592 68% 2.700 35%
--. Critter 0.70 x64             2.806 20 19  880 65% 2.701 38%
06. Komodo 1.2 JA x64            2.801 16 16 1352 65% 2.694 39%
07. Shredder 12 w32              2.800 15 15 1552 64% 2.698 35%
--. Komodo 1.0 JA x64            2.791 20 20  840 64% 2.693 40%
--. Shredder 12 x64              2.788 18 18 1080 61% 2.707 35%
08. Spark 0.5 x64                2.740 16 16 1352 56% 2.696 38%
09. Thinker 5.4d Inert x64       2.735 14 14 1592 55% 2.702 39%
10. Zappa Mexico II x64          2.723 14 14 1592 53% 2.703 39%
--. Spark 0.4 x64                2.717 19 19  840 53% 2.696 40%
11. Protector 1.3.4 JA x64       2.714 15 15 1552 52% 2.703 37%
12. Fruit 09_07_05 x64           2.706 15 15 1592 50% 2.703 34%
--. Critter 0.60 x64             2.700 19 19  840 50% 2.697 38%
13. Hannibal 1.0a x64            2.691 18 18  992 48% 2.710 36%
14. Sjeng WC-2008 x64            2.687 15 14 1592 48% 2.704 35%
--. Protector 1.3.5 x64          2.684 19 19  840 47% 2.706 39%
15. Junior 11.2 x64              2.682 16 16 1352 48% 2.697 30%
16. Onno 1.2.70 x64              2.675 16 16 1352 47% 2.698 38%
--. Onno 1.1.1 x64               2.671 19 19  840 46% 2.698 40%
--. Junior 11.1a x64             2.648 20 20  840 43% 2.700 32%
17. Loop 2007 x64                2.632 15 16 1400 40% 2.706 37%
--. Loop M1-T x64                2.625 21 22  736 35% 2.732 35% - 7 ELO
--. Twisted Logic 20100131x x64  2.611 18 18 1120 35% 2.716 32%
18. Umko 1.0 x64                 2.606 19 19  992 35% 2.713 36% (ponder not possible)
19. SmarThink 1.20 x64           2.602 15 15 1592 36% 2.706 34%
20. Equinox 0.83 x64             2.596 22 22  736 32% 2.733 32% NEW
21. Crafty 23.3 JA x64           2.592 19 19  992 34% 2.714 34%
--. Cipollino 3.25 x64           2.571 22 23  736 28% 2.734 32% NEW
22. BugChess2 1.7 x64            2.564 21 21  800 29% 2.719 33%
23. Scorpio 2.6 JA x64           2.555 18 18 1120 28% 2.718 32%
--. Crafty 23.2 JA x64           2.555 18 18 1120 28% 2.718 30%
24. Chronos 1.99 x64             2.552 18 18 1120 27% 2.718 33% (ponder not possible)
--. Crafty 23.3 JA x64 NP        2.546 23 23  736 25% 2.735 31% (without ponder = -46 ELO)
25. Daydreamer 1.75 JA x64       2.521 19 19 1120 24% 2.719 30%
26. Tornado 3.6.7 x64            2.479 23 24  800 19% 2.723 24%


Am Sonntag läuft das Turnier aus und direkt im Anschluss wird das nächste SWCR-64 Turnier gestartet.

Weitere News hierzu finden sich auf meiner "Aktuell / Actual" Seite.

Viel Spass beim Beobachten der SWCR.

Gruß
Frank
Parent - - By Frank Quisinsky Date 2010-09-24 13:12
Hallo zusammen,

habe doch noch mal eine Berechnung gemacht.
Mehr oder weniger eigentlich schon das vorläufige Endergebnis ... sind nur noch knapp 500 Partien zu spielen.

Code:
ELO calculation (8)
After 23.714 games (SWCR-64, all games)

01. IPP Houdini 1.03a x64        2.948 22 21  920 79% 2.718 29% NEW
02. Rybka 4 x64                  2.937 18 18 1375 81% 2.691 28%
--. Rybka 3 x64                  2.905 22 22  840 78% 2.687 28%
03. Stockfish 1.8.0 JA x64       2.904 20 20 1016 76% 2.702 31%
--. IPP Fire 1.31 x64            2.900 22 21  811 74% 2.721 36% NEW
--. Stockfish 1.7.1 JA x64       2.896 19 18 1120 76% 2.706 34%
04. Critter 0.80 x64             2.838 19 19 1016 68% 2.705 33%
05. Naum 4.2 x64                 2.831 15 15 1616 68% 2.701 35%
--. Critter 0.70 x64             2.806 20 19  880 65% 2.701 38%
06. Komodo 1.2 JA x64            2.800 16 16 1376 65% 2.695 39%
06. Shredder 12 w32              2.800 15 15 1575 64% 2.699 35%
--. Komodo 1.0 JA x64            2.791 20 20  840 64% 2.693 40%
--. Shredder 12 x64              2.788 18 18 1080 61% 2.707 35%
08. Spark 0.5 x64                2.740 16 16 1375 56% 2.697 38%
09. Thinker 5.4d Inert x64       2.736 14 14 1616 55% 2.703 39%
10. Zappa Mexico II x64          2.723 14 14 1616 53% 2.703 39%
--. Spark 0.4 x64                2.717 19 19  840 53% 2.696 40%
11. Protector 1.3.4 JA x64       2.714 15 15 1575 52% 2.704 37%
12. Fruit 09_07_05 x64           2.706 15 14 1616 50% 2.704 34%
--. Critter 0.60 x64             2.700 19 19  840 50% 2.697 38%
13. Hannibal 1.0a x64            2.689 18 18 1016 47% 2.710 35%
14. Sjeng WC-2008 x64            2.687 15 14 1615 48% 2.704 35%
--. Protector 1.3.5 x64          2.684 19 19  840 47% 2.706 39%
15. Junior 11.2 x64              2.681 16 16 1375 48% 2.698 30%
16. Onno 1.2.70 x64              2.678 16 16 1375 47% 2.699 38%
--. Onno 1.1.1 x64               2.671 19 19  840 46% 2.698 40%
--. Junior 11.1a x64             2.648 20 20  840 43% 2.700 32%
17. Loop 2007 x64                2.631 15 15 1440 40% 2.703 37%
--. Loop M1-T x64                2.627 20 21  811 36% 2.733 35% - 4 ELO
--. Twisted Logic 20100131x x64  2.611 18 18 1120 35% 2.716 32%
18. Umko 1.0 x64                 2.608 18 18 1016 35% 2.714 37% (ponder not possible)
19. SmarThink 1.20 x64           2.602 15 15 1615 36% 2.706 34%
20. Equinox 0.83 x64             2.598 20 21  851 32% 2.729 33% NEW
21. Crafty 23.3 JA x64           2.593 18 19 1016 34% 2.714 34%
--. Cipollino 3.25 x64           2.569 21 22  811 28% 2.735 30% NEW
22. BugChess2 1.7 x64            2.564 21 21  800 29% 2.719 33%
23. Scorpio 2.6 JA x64           2.555 18 18 1120 28% 2.718 32%
--. Crafty 23.2 JA x64           2.555 18 18 1120 28% 2.718 30%
24. Chronos 1.99 x64             2.552 18 18 1120 27% 2.718 33% (ponder not possible)
--. Crafty 23.3 JA x64 NP        2.544 21 22  824 25% 2.736 30% (without ponder = -49 ELO)
25. Daydreamer 1.75 JA x64       2.521 19 19 1120 24% 2.719 30%
26. Tornado 3.6.7 x64            2.479 23 24  800 19% 2.723 24%


Gruß
Frank
Parent - By Frank Quisinsky Date 2010-09-24 13:32 Edited 2010-09-24 13:39
Wirklich eine Ponder Sensation.

Würde bedeuten, das das Partiematerial besser ist wenn im Vergleich mit Ponder anstatt mit 2 Cores gespielt wird. Es weniger Sinn macht mit 2 Cores anstatt mit einem Core und Ponder zu testen. Es wird besseres Material produziert.

Auch etwas verwunderlich für mich ... meine das es weit über 40, fast 50 ELO ausmacht.
Vielleicht sollte ich das mit einem zweiten Test überprüfen. Vielleicht eine Engine die in der Mitte des Feldes positioniert ist.
z. B. Sjeng oder so ...

Kann es fast kaum glauben!
20 ELO mehr als schon mal getestet.
Wirft einige älteren Betrachtungspunkte über den Haufen!

Loop MP hätte ich auch stärker eingeschätzt.
Aber gut so, ist die freie Version Loop 2007 die interessanteste wobei aus 4 ELO Unterschied auch nicht viel abzulesen ist.

Gruß
Frank
Up Topic Hauptforen / CSS-Forum / SWCR: Aktuell laufendes Turnier ...

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill