SWCR: Laufendes Turnier (4 neue Engines) ...

By Frank Quisinsky Date 2010-09-29 11:59 Edited 2010-09-29 12:08

Hallo zusammen,

mittlerweile haben die vier neuen auch schon wieder knapp 200 der 920 Partien (oder nach 8 von 40 Runden) absolviert.
Zeit für die erste Hochrechnung ...

Wobei:
Ganz interessant bei dieser Hochrechnung ist die Eigenart von Bayesian.
Bayesian bewertet Remispartien etwas anders als ELOstat und insofern und aufgrund der sehr hohen Remisquoten von IvanHoe und Firebird fallen die ELOs derzeit nocht nicht wie erwartet aus. Shredder bewertet eher wie ELOstat und von daher schön in der Berechnungsseite auf meiner Webseite zu erkennen, dass Bayesian hier mehr oder weniger eine Eigenart hat, die für mich aber auch realistischer als ELOstat ist.

Ferner:
Hiarcs, IvanHoe und GullChess stehen jetzt auf Spielstop mittels der "X" Funktion in der Shredder *.sto Datei. Es werden also bis morgen Mittag nur Firebird Partien gespielt. Am Freitag ändere ich dass, dann steht Firebird auf Spielstop und die drei anderen spielen durch. Der Grund wie bei Houdini, die Turnier soll in meiner Abwesentheit durchlaufen und nicht stehen bleiben. IvanHoe läuft stabil. Die Shredder GUI stürzt wie bei Houdini bei Firebird allerdings öfters mal ab und von daher muss ich korrigieren.

Interessant auch die ELO-Entwicklung von Hiarcs 13.1. Die Engine lief ja schon in der SWCR-32 und erreichte 2.735 ELO. Dieses Rating wurde nach 90 Partien schon in der SWCR-64 erzielt und ist seit dem stabil.

Hier nun die Berechnung:

Code:

ELO calculation (1)
After 24.888 SWCR-64 games, 28 different engines, 46 versions included
ELO are fixed to 2.800 for Shredder 12 32bit. All other engines are derived from that fixed number.
Calculated with:  Bayesian 0056

The separate columns give the (mean) Elo performance, the + and - margins of error given with 95 % confidence,
the number of finished games, the relative score given in percentages, the average opponent ELO and finally the
relative number of draws for each program.

01. IPP Houdini 1.03a x64        2.947 22 21  920 79% 2.717 29%
02. Rybka 4 x64                  2.939 18 17 1432 81% 2.692 28%
--. Rybka 3 x64                  2.905 22 22  840 78% 2.687 28%
03. Stockfish 1.8.0 JA x64       2.905 20 19 1072 76% 2.704 31%
--. IPP Fire 1.31 x64            2.900 20 20  920 75% 2.719 36%
--. IPP IvanHoe B52aC x64        2.899 44 42  184 74% 2.732 40% NEW
--. Stockfish 1.7.1 JA x64       2.896 19 18 1120 76% 2.706 34%
--. IPP FireBird 1.1 x64 WD      2.867 42 40  184 71% 2.733 51% NEW
04. Critter 0.80 x64             2.836 18 18 1072 68% 2.706 33%
05. Naum 4.2 x64                 2.832 15 15 1672 68% 2.702 36%
--. Critter 0.70 x64             2.806 19 19  880 65% 2.701 38%
06. Shredder 12 w32              2.800 15 15 1632 63% 2.700 35%
06. Komodo 1.2 JA x64            2.800 16 15 1432 64% 2.696 39%
--. Komodo 1.0 JA x64            2.791 20 20  840 64% 2.693 40%
--. Shredder 12 x64              2.787 18 18 1080 61% 2.706 35%
08. Hiarcs 13.1 w32              2.740 41 41  184 50% 2.739 39% NEW
08. Spark 0.5 x64                2.740 15 15 1432 56% 2.698 37%
10. Thinker 5.4d Inert x64       2.735 14 14 1672 54% 2.704 39%
11. GullChess 1.0a x64           2.733 40 40  184 49% 2.739 44% NEW
12. Zappa Mexico II x64          2.724 14 14 1672 53% 2.704 40%
--. Spark 0.4 x64                2.717 19 19  840 53% 2.696 40%
13. Protector 1.3.4 JA x64       2.713 14 14 1632 51% 2.705 37%
14. Fruit 09_07_05 x64           2.705 14 14 1672 50% 2.705 34%
--. Critter 0.60 x64             2.700 20 20  840 50% 2.697 38%
15. Sjeng WC-2008 x64            2.688 14 14 1672 48% 2.705 36%
16. Hannibal 1.0a x64            2.686 18 18 1072 47% 2.712 36%
--. Protector 1.3.5 x64          2.684 19 19  840 47% 2.706 39%
17. Junior 11.2 x64              2.679 16 16 1432 48% 2.700 30%
18. Onno 1.2.70 x64              2.677 15 15 1432 47% 2.700 38%
--. Onno 1.1.1 x64               2.671 19 19  840 46% 2.698 40%
--. Junior 11.1a x64             2.648 20 20  840 43% 2.700 32%
19. Loop 2007 x64                2.631 15 15 1472 40% 2.705 36%
--. Loop M1-T x64                2.627 19 19  920 36% 2.731 36%
--. Twisted Logic 20100131x x64  2.611 18 18 1120 35% 2.716 32%
20. Umko 1.0 x64                 2.607 18 18 1072 35% 2.715 37% (ponder not possible)
21. SmarThink 1.20 x64           2.602 15 15 1672 36% 2.707 34%
22. Equinox 0.83 x64             2.597 19 19  992 32% 2.731 33%
23. Crafty 23.3 JA x64           2.592 18 18 1072 33% 2.715 34%
--. Cipollino 3.25 x64           2.565 20 20  920 28% 2.734 30%
24. BugChess2 1.7 x64            2.563 21 22  800 29% 2.718 33%
25. Scorpio 2.6 JA x64           2.555 18 18 1120 28% 2.718 32%
--. Crafty 23.2 JA x64           2.554 18 19 1120 28% 2.718 30%
26. Chronos 1.99 x64             2.552 18 18 1120 27% 2.718 33% (ponder not possible)
--. Crafty 23.3 JA x64 NP        2.546 20 21  920 25% 2.735 30% (Test: Without ponder)
27. Daydreamer 1.75 JA x64       2.521 19 19 1120 24% 2.719 30%
28. Tornado 3.6.7 x64            2.479 23 24  800 19% 2.723 24%

Wer die LIVE Tabelle verfolgen möchte:

Frank's Chess Page, SWCR
http://www.amateurschach.de

Gruß
Frank

By Frank Quisinsky Date 2010-09-29 22:54

Hallo zusammen,

IvanHoe und Fire 1.1 produzieren einfach zu viele Remispartien gegen schwächere Gegner.
Nun wird es etwas deutlicher.

Die Ipp Familie Fans werden nun schreihen ...
Bayesian ist Schei...

Wird bei den anderen noch zu testenden IvanHoe Versionen sicherlich nicht anders sein.
Aber warten wir das mal in Ruhe ab.

Ich könnte ja mal Robbolito testen, dann wäre die Enttäuschung bei den Ipp Familie Fans sicherlich riesen groß ... bei so vielen Versionen die da gekommen sind.
War das nicht alles vorhergesagt?

Mal schauen wie das weiter geht ...
Mittlerweile interessiert mich dieser Statistikvergleich mehr als die Ergebnisse der IPP Familie.

Gruß
Frank

Bayesian 0056:

Code:

   1 Houdini 1.03a x64            2947   22   21   920   79%  2717   29% 
   2 Rybka 4 x64                  2938   18   17  1436   80%  2693   29% 
   3 Rybka 3 x64                  2905   23   22   840   78%  2687   28% 
   4 Stockfish 1.8.0 JA x64       2903   19   19  1077   75%  2704   31% 
   5 Fire 1.31 x64                2899   20   20   920   75%  2719   36% 
   6 IvanHoe B52aC x64            2898   43   41   189   73%  2736   41% 
   7 Stockfish 1.7.1 JA x64       2895   19   18  1120   76%  2706   34% 
   8 FireBird 1.1 x64 WD          2886   34   33   295   74%  2732   47% 
   9 Critter 0.80 x64             2836   18   18  1077   67%  2707   33% 
  10 Naum 4.2 x64                 2831   15   15  1677   68%  2702   36% 
  11 Critter 0.70 x64             2806   20   19   880   65%  2701   38% 
  12 Shredder 12                  2800   15   15  1636   63%  2700   35% 
  13 Komodo 1.2 JA x64            2800   15   15  1437   64%  2697   39% 
  14 Komodo 1.0 JA x64            2790   20   20   840   64%  2692   40% 
  15 Shredder 12 x64              2787   18   18  1080   61%  2706   35% 
  16 Hiarcs 13.1                  2741   40   40   189   49%  2743   40% 
  17 Spark 0.5 x64                2740   15   15  1437   56%  2698   37% 
  18 Thinker 5.4d Inert x64       2735   14   14  1677   54%  2704   39% 
  19 GullChess 1.0a x64           2731   40   40   189   48%  2743   43%

ELOstat 1.3

Code:

  1 Houdini 1.03a x64              : 2956   21  21   920    79.4 %   2721   29.2 % 
  2 Rybka 4 x64                    : 2943   17  17  1436    80.5 %   2697   28.6 % 
  3 IvanHoe B52aC x64              : 2915   39  38   189    73.0 %   2742   41.3 % 
  4 FireBird 1.1 x64 WD            : 2915   29  28   295    73.6 %   2737   47.5 % 
  5 Rybka 3 x64                    : 2912   22  22   840    78.3 %   2690   27.5 % 
  6 Fire 1.31 x64                  : 2910   19  19   920    74.6 %   2723   36.1 % 
  7 Stockfish 1.7.1 JA x64         : 2906   18  17  1120    75.7 %   2709   33.7 % 
  8 Stockfish 1.8.0 JA x64         : 2904   19  18  1077    75.5 %   2709   30.8 % 
  9 Critter 0.80 x64               : 2838   18  17  1077    67.4 %   2711   33.1 % 
 10 Naum 4.2 x64                   : 2834   14  14  1677    67.7 %   2706   35.5 % 
 11 Critter 0.70 x64               : 2809   18  18   880    64.7 %   2704   38.1 % 
 12 Komodo 1.2 JA x64              : 2802   14  14  1437    64.2 %   2701   39.2 % 
 13 Shredder 12                    : 2800   14  14  1636    63.4 %   2705   34.9 % 
 14 Komodo 1.0 JA x64              : 2797   19  18   840    64.3 %   2695   39.5 % 
 15 Shredder 12 x64                : 2789   17  17  1080    61.3 %   2710   35.1 % 
 16 Hiarcs 13.1                    : 2745   39  39   189    49.5 %   2749   39.7 % 
 17 Spark 0.5 x64                  : 2744   14  14  1437    55.9 %   2702   37.3 % 
 18 Thinker 5.4d Inert x64         : 2738   13  13  1677    54.2 %   2708   39.3 % 
 19 GullChess 1.0a x64             : 2736   37  37   189    48.1 %   2749   43.4 %

WOW, 31 ELO Differenz bei den Berechnungsprogrammen für Firebird 1.1 x64 WD.
Tja, was sollen wir da von den jeweiligen ErrorBars nur halten

Gruß
Frank

By Ingo Bauer Date 2010-09-29 23:15

Hallo,

[quote="Frank Quisinsky"]

Bayesian 0056:

Code:

   1 Houdini 1.03a x64            2947   22   21   920   79%  2717   29% 
   2 Rybka 4 x64                  2938   18   17  1436   80%  2693   29% 
   3 Rybka 3 x64                  2905   23   22   840   78%  2687   28% 
   4 Stockfish 1.8.0 JA x64       2903   19   19  1077   75%  2704   31% 
   5 Fire 1.31 x64                2899   20   20   920   75%  2719   36% 
   6 IvanHoe B52aC x64            2898   43   41   189   73%  2736   41% 
   7 Stockfish 1.7.1 JA x64       2895   19   18  1120   76%  2706   34% 
   8 FireBird 1.1 x64 WD          2886   34   33   295   74%  2732   47% 
   9 Critter 0.80 x64             2836   18   18  1077   67%  2707   33% 
  10 Naum 4.2 x64                 2831   15   15  1677   68%  2702   36% 
  11 Critter 0.70 x64             2806   20   19   880   65%  2701   38% 
  12 Shredder 12                  2800   15   15  1636   63%  2700   35% 
  13 Komodo 1.2 JA x64            2800   15   15  1437   64%  2697   39% 
  14 Komodo 1.0 JA x64            2790   20   20   840   64%  2692   40% 
  15 Shredder 12 x64              2787   18   18  1080   61%  2706   35% 
  16 Hiarcs 13.1                  2741   40   40   189   49%  2743   40% 
  17 Spark 0.5 x64                2740   15   15  1437   56%  2698   37% 
  18 Thinker 5.4d Inert x64       2735   14   14  1677   54%  2704   39% 
  19 GullChess 1.0a x64           2731   40   40   189   48%  2743   43%

[/quote]

Die Idee in Robbolito 0.9 in [url]deine[/url] Liste aufzunehmen finde ich gut. Wenn ich anonyme Engines aufnehmen würde wäre das meine erste Wahl!

Der EINZIGE der in deiner Liste, trotz fast täglicher Updates so vieler Vögel oder Ritter, ETWAS besser zu sein scheint als der letzte offizielle Robolito ist ... Naaa, wer ist es???

(Ironie AN) An jeden Programmierer hier: Nehmt Robo 0.9, ändert zwei beliebige Variablen minimal und ihr seid ganz weit oben mit dabei! (Ironie AUS)

Gruß
Ingo

PS: Hallo Daniel, kannst du nicht ein offizielles TAG für Ironie AN und AUS einführen

By Frank Quisinsky Date 2010-09-29 23:41

Hi Ingo,

wir müssen den ganzen Test aller IPP Engines wirklich mal abwarten.
Es kommen ja dann noch zwei weitere IvanHoe Versionen.

Würde ich dann danach eine 7 und 8 dieser Familie durchlaufen lassen (z. B. Robbolito und Igorrit) wäre ganz sicher die Enttäuschung der Fans riesengroß.
Mache ich nicht, muss nicht alles bewiesen werden ... nicht jede Frage muss beantwortet werden, auch offene Fragen sind interessant.

Aber ich erwarte ehrlich gesagt auch keine Wunder, hier sind keine professionellen Programmierer am Werk.

Dennoch, wir müssen das abwarten ... wird ja jetzt getestet und vielleicht ist der Spuk dann auch endlich vorbei.
Na ja, jeder glaubt ja an etwas und der Glaube ist bekanntlich stärker als die Realität.

Nun, Robbolito und Igorrit werde ich nicht testen. Die kommen mit den gleichen Absturzproblemen wie Fire 1.1 und Houdini 1.03a daher und wie gesagt, nicht jede Frage muss beantwortet werden.
Möchte den Fans dieser Engine Gruppe auch nicht die Lust nehmen.

Ein drittes Mal ... NEIN DANKE (ständig auf GUI Abstürze reagieren).

Die Fire 1.1 Absturz Quote liegt bei derzeit 5.5%, gar nochmals 1.5% höher als bei Houdini 1.03a.

Ironie an:
Könnte ja jetzt wie von Ernst Happe vorgeschlagen vorgehen

Einfach da Absturz für die gegnerische Engine werten ...
Warte mache das mal ...

Ups, Firebird 1.1 liegt ja plötzlich "nur" noch bei 2.815 ELO, also ca. 90 ELO hinter Rybka 3.
Ironie aus!

Nein, wir testen das jetzt korrekt durch und fertig.

Dennoch:
IvanHoe spielt ein anderes Schach und ist für eine Ratingliste gar nicht mal so uninteressant. Sehe überhaupt keine Gemeinsamkeit mit Rybka 3 oder Rykba 4.
Nur, die Partien sind grottenlangweilig. Keine schnellen Gewinne, Endspielvorteile die nicht umgesetzt werden, starke Endphase vom Mittelspiel ... immer wieder ... hier werden die Punkte eingefahren.

Also ganz ehrlich ...
Ein Junior, ein Hiarcs, ein Spark, ein Shredder, ein Thinker, ein Hannibal etc. spielen für den Zusehenden interessanteres Schach, auch wenn die Engines Fehler produzieren die dann von der IPP Familie ausgenutzt werden. Würde mal so sagen, die IPP Familie ist absolutes Computerschach im Jahr 2010. Andere Engines spielen menschlicher, interessanter!

Gruß
Frank

By Ingo Bauer Date 2010-09-29 23:57

Hallo Frank

[quote="Frank Quisinsky"]
Es kommen ja dann noch zwei weitere IvanHoe Versionen.
[/quote]

Aua und wann willst du aufhören? Und täglich grüßt das Murmeltier ... morgen kommt ein neuer Ritter oder Vogel ... Jede Enigne die damit nicht klarkommt drückst du nach unten und anderen hoch. Du kannst nicht einen größeren Prozensatz an Spielen einer Liste mit praktisch identischen enignes bestreiten!

Nimm einen Ippo (ich habe mich für den besten entschieden) und gut ist. Wenn dir Ivan so gefällt nimm den, aber spiel nicht 15 Littos in deine Liste ein. Jeder neue verwässert das ganze!

[quote="Frank Quisinsky"]
Würde ich dann danach eine 7 und 8 dieser Familie durchlaufen lassen (z. B. Robbolito und Igorrit) wäre ganz sicher die Enttäuschung der Fans riesengroß.
[/quote]

Das ist wirklich böse ironisch! Gefällt mir!

[quote="Frank Quisinsky"]
Nun, Robbolito und Igorrit werde ich nicht testen. Die kommen mit den gleichen Absturzproblemen wie Fire 1.1 und Houdini 1.03a daher ...
[/quote]

Ahh, gut das du das weißt ... ohne zu testen! Da ich die Fähigkeit nicht habe habe ich geprüft und dir gemailt und kann nur sagen "Keine Probleme"!

[quote="Frank Quisinsky"]
Die Fire 1.1 Absturz Quote liegt bei derzeit 5.5%, gar nochmals 1.5% höher als bei Houdini 1.03a.
[/quote]

Ja, sorry, ich weiß auch nicht was mit deiner Hardware los ist

[quote="Frank Quisinsky"]
Ein Junior, ein Hiarcs, ein Spark, ein Shredder, ein Thinker, ein Hannibal etc. spielen für den Zusehenden interessanteres Schach, auch wenn die Engines Fehler produzieren die dann von der IPP Familie ausgenutzt werden.
[/quote]

Du woltest etwas anderes sagen, aber das ist genau mein Credo. Ich sehe seltenst gutes Spiel, sondern eigentlich immer Versagen des Verlierers. Der letze Fehler verliert - so ist nunmal Schach!

Gruß
Ingo

By Frank Quisinsky Date 2010-09-30 00:24 Edited 2010-09-30 00:28

Hallo Ingo,

nach dem Test der 6 IPP Engines verbleibt eine in der SWCR-64 und alle anderen Engines fliegen raus. Die Partien der 5 die dann rausfliegen stehen aber zum Download zur Verfügung. In der Zeit in der ich das teste sind dann alle diser Engines in den Listen. Steht auf meiner Aktuell Seite. Das Endergebnis, also die Ratingliste aller SWCR Partien, inklusive alle Partien mit Shredder Partiekommetaren wird also als Download file zur Verfügung gestellt.

Warum ich weiß, dass Iggorit und Robbolito die gleichen Absturz Probleme haben?
Das ist einfach Ingo, habe Matches gegen Komodo spielen lassen, bewusst gegen Komodo um zu sehen ob wieder alles im Speicher bleibt.

Und warum drei x IvanHoe Versionen?
Sind offenbar 3 oder 4 die diese Versionen erstellen. Teste mal von denen die letzte Version durch. Zumindest läuft IvanHoe absolut rund / stabil und selbst die UCI Optionen scheinen zu greifen

Eine dieser Versionen wird das Rennen machen, die anderen sind mir zu buggy.

Wenn schon denn schon ...
So sind alle Interessierten auch in der Lage mal eine Aussage zu diesen Engines zu treffen mit ausreichend vorhandenen Partiematerial.

Lese einfach hin- und wieder mal meine Aktuell Seite, so muss ich nicht auch noch hier alles wiederholen.
Im Grunde wird dort fast jede Frage zur SWCR beantwortet.

Gruß
Frank

By Thomas Müller Date 2010-09-30 08:50

bei mir ist H1.03a mit 4xCPU Ponder=off 40/3' jetzt erst mal durch.
Hat nicht gereicht um R4 zu verdrängen.
naja egal....weitere Ipps werde ich nicht testen.

Code:

   Program                          Elo    +   -   Games   Score   Av.Op.  Draws

  1 Deep Rybka 4 x64               : 2986   39  38   260    80.0 %   2745   30.8 %
  2 Houdini 1.03a x64 4_CPU        : 2946   36  36   306    78.9 %   2716   29.1 %
  3 Rybka 3                        : 2943   23  22   805    81.2 %   2689   28.0 %

By Frank Quisinsky Date 2010-09-30 08:59

Hallo Thomas,

ziehe das jetzt auch nur mit den 6 durch.
Bei mir wird wie gesagt nur ein IvanHoe in der Liste verbleiben.

Mal schauen welcher dann von den drei die ich testen werde das Rennen macht.

Wirklich nicht gut das Ergebnis.
300 Partien ... nun ja etwas kritisch, könnte sich noch ändern aber 40 - 50 ELO nach oben wäre zweifelhaft.

Wäre auch ein komplett anderes Ergebnis als Gerhard hat.
Vielleicht liegt es am Prozessortyp?

Gruß
Frank

By Thomas Müller Date 2010-09-30 12:18

ja war schon seltsam, aber ich bewerte das auch nicht über.
Ist zwar auch eine rangliste was ich habe, aber genauer sind die von info, deine und auch gerhards. Cegt... sowieso.
Aber H hat gegen schwächere etwas punkte liegen lassen.
Nun gut...vielleicht mache ich nach über 4 J 40/3' mit 4xcpu auf der gleichen HW auch mal was neues

Code:

2 Houdini 1.03a x64 4_CPU   : 2946  306 (+197,= 89,- 20), 78.9 %

Fritz 8                       :   8 (+  8,=  0,-  0), 100.0 %
Deep Shredder 9               :   6 (+  5,=  1,-  0), 91.7 %
Rybka 1.01 Beta 13d           :   6 (+  3,=  2,-  1), 66.7 %
Rybka 1.2n                    :   8 (+  7,=  1,-  0), 93.8 %
Loop 13.5                     :   6 (+  5,=  1,-  0), 91.7 %
Loop M1-P                     :   8 (+  5,=  3,-  0), 81.2 %
Rybka 2.3.2a mp               :   8 (+  3,=  4,-  1), 62.5 %
Naum 2.2                      :   6 (+  4,=  1,-  1), 75.0 %
Movei00_8_438                 :   8 (+  8,=  0,-  0), 100.0 %
Zappa Mexico X64              :   6 (+  4,=  1,-  1), 75.0 %
Toga II 1.4 beta5c            :   8 (+  4,=  3,-  1), 68.8 %
Zappa Mexico II               :  12 (+  7,=  5,-  0), 79.2 %
Naum 3.1                      :   8 (+  3,=  5,-  0), 68.8 %
HIARCS 12.1 MP                :   6 (+  5,=  1,-  0), 91.7 %
HIARCS Paderborn 2007 MP      :   8 (+  6,=  2,-  0), 87.5 %
DeepFrenzee May07 x64         :   8 (+  7,=  1,-  0), 93.8 %
Colossus 2008b                :   6 (+  6,=  0,-  0), 100.0 %
Deep Sjeng WC2008 x64         :  12 (+  9,=  3,-  0), 87.5 %
Thinker54Di_x64               :  20 (+ 14,=  5,-  1), 82.5 %
Stockfish 1.3.1 JA            :   8 (+  6,=  2,-  0), 87.5 %
Deep Shredder 12 x64          :  18 (+ 11,=  7,-  0), 80.6 %
bright-0.5c                   :   6 (+  5,=  1,-  0), 91.7 %
Deep Fritz 12                 :  12 (+  5,=  6,-  1), 66.7 %
Naum 4.2                      :  18 (+  7,=  8,-  3), 61.1 %
HIARCS 13.1 MP                :  12 (+  6,=  5,-  1), 70.8 %
Deep Junior 11.2 UCI          :  12 (+ 11,=  1,-  0), 95.8 %
Komodo64 1.2 JA x64           :   6 (+  3,=  3,-  0), 75.0 %
Deep Rybka 4 x64              :  12 (+  5,=  4,-  3), 58.3 %
spark-0.4 x64                 :  12 (+  8,=  4,-  0), 83.3 %
Stockfish 1.8 JA 64bit        :  12 (+  4,=  4,-  4), 50.0 %
Critter 0.80 64-bit           :  12 (+  5,=  5,-  2), 62.5 %
Booot 5.0.0                   :   8 (+  8,=  0,-  0), 100.0 %

By Frank Quisinsky Date 2010-09-30 19:13

Hi Thomas,

denke es wird sicherlich an der Anzahl der Partien liegen, aber solche Umstände bei Ratinglisten kennen wir ja.
Bei meinem Naum 4.2 Test ... da lief alles absolut durcheinander. Ein Auf- und Ab und letztendlich war ich total verwirrt.

Aber das erlebst Du wirklich 1x in 50 Fällen.

Noch habe ich ja in der SWCR genug Partien zu spielen.
Bin ganz froh das es mit Updates derzeit ein wenig ruhiger ist.

Wenn ich mal soweit bin, dass meine Rechner ruhen könnten überlege ich auch mal in den Spielpausen ein paar kleine andere Turniere spielen zu lassen.
Mir gefallen die Schweizer System Turniere von Cock de Corter ganz gut. So habe ich ca. vor 10 Jahren mit der Fritz GUI getestet. Leider liefen zu diesem Zeitpunkt die schweizer Systeme nicht so stabil. Heute viel besser, irgendwann kamen dann die wichtigen Änderungen. Schweizer System Turnier mit Turnierbedenkzeit ... wäre doch mal was

Gruß
Frank

By Ingo Bauer Date 2010-09-30 10:11

Hallo Frank

[quote="Frank Quisinsky"]

Warum ich weiß, dass Iggorit und Robbolito die gleichen Absturz Probleme haben?
Das ist einfach Ingo, habe Matches gegen Komodo spielen lassen, bewusst gegen Komodo um zu sehen ob wieder alles im Speicher bleibt.
...
[/quote]

Und ich habe dir ein Ergebniss mit 1600 Spielen geschickt und hatte KEINEN derartigen Absturz. Aus meiner sicht sind deine Rechner/Software Konfigurationen irgendwie recht instabil!

Gruß
Ingo

By Frank Quisinsky Date 2010-09-30 13:16

Hi Ingo,

die sollen instabil sein, bei über 55.000 Partien?
Alle vier?

Wenn nur Fire und Houdini, Robbo und Iggorit ... also immer die gleichen ...
Sag mal ... sonst alles OK?

Gruß
Frank

By Ingo Bauer Date 2010-09-30 13:57

Hallo Frank

[quote="Frank Quisinsky"]
Hi Ingo,

die sollen instabil sein, bei über 55.000 Partien?
Alle vier?

Wenn nur Fire und Houdini, Robbo und Iggorit ... also immer die gleichen ...
Sag mal ... sonst alles OK?

Gruß
Frank
[/quote]

Warum so agressiv?

Nochmal deutlich: Bei mir liefen 1600 Partien mit Robbo 0.9 stabil (!), du hast das Ergebniss schon vor zwei Wochen bekommen. Houdini läuft bei mir wesentlich besseer als bei dir und besser als so mancher andere! (Fire/Ivan habe ich keine Ahnung)

So langsam solltest du auch obigen Vorschlag in Betracht ziehen!

Bye
Ingo

By Frank Quisinsky Date 2010-09-30 19:06

Hallo Ingo,

wenn Du schon im Forum zu Ergebnissen einer Version schreibst, welche von einem Autor ist, welchen Du nicht magst (hattest Dich mehrfach dazu ausgelassen) dann kannst Du die auch auf eine Deine Webseite bringen. Du veröffentlichst doch eh keine Partien, sehe keinen Unterschied die Ergebnisse in einem Forum oder auf einer Webseite zu veröffentlichen. Verstehe jetzt gar nichts mehr bei Dir und Deiner IPON. Für mich weit weg von jeglicher Logik. Auch kenne ich die Ergebnisse von Dir gar nicht, hast mir nichts per eMail gesendet. Sämtliche Leute, auch die diverser Ratinglsiten testen aber niemand veröffentlicht die Ergebnisse. Ach, ist mir auch egal.

Nein, ich teste keinen Robbolito 0.9. Übrigens hattest Du aber Recht?! Ich hatte einen anderen noch älteren Robbolito getestet und mich in der Versionsnummer geirrt. Wäre ja schön wenn mal eine der älteren Versionen stabil laufen würden. Aber ich breche den Test der IPP Familie, wie vorgesehen, nach 6 der vielen Versionen ab. Es folgen nach dem laufenden Test noch zwei weitere IvanHoe Versionen. Diese interessieren mich jetzt auch deutlich mehr als die von Dir erwähnte ältere Robbolito Version.

Das sich die Spielstärke "wahrscheinlich" nicht verbessert hat, davon gehe ich aus. Aber IvanHoe läuft sehr stabil und hat meines Erachtens einen deutlich anderen Spielstil. Insofern möchte ich jetzt nur wissen, welche der Versionen von den Personen die kompilieren am spielstärksten ist.

Bin froh wenn der Test durch ist, habe ehrlich gesagt auch nicht mehr viel Lust dazu.
Möchte mal wieder ein paar spannende Partien sehen, also dieses langweilige Endspielgeschiebe mit Remisausgang.
Das ist ja der absolute Horror!

Typisches Rybka Geschiebe im späten Mittelspiel mit Vorteilen aber jegliches spannendes Computerschach kannste suchen gehen. Zumal FireBird 1.1 als auch IvanHoe die kleinen Positionsvorteile im Endspiel, im Vergleich zu Rybka, offenbar nur sehr selten auch umsetzen können. Da enden ja weit über 40% mit Remis. Dann laufen die Partien 150 Züge und so guter letzt gibst dann noch einen Gratis Crash und die Parite ist Futsch (im Fall von FireBird). Hilfe ... Horror-Test!

Egal, ziehe ich jetzt durch!

Gruß
Frank