Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Naum 4.2 marschiert einfach ... weiterhin auf Platz 1!
1 2 Previous Next  
- - By Frank Quisinsky Date 2010-03-30 19:09 Edited 2010-03-30 19:18
Hi,

Naum 4.2 32-Bit bei 40 in 10 marschiert einfach weiter. Egal wer kommt, gegen alle Engines steht Naum 4.2 positiv. Bzw. gerade gegen Rybka verloren, steht dort 5,5:5,5!
Weiterhin auf Platz 1 aber nur noch mit 7 ELO Vorsprung nach jetzt fast 300 Partien. Wenn die 400 Partie Marke übersprungen ist, passiert wahrscheinlich nichts mehr +-5.
Spannender geht es nun wirklich nicht mehr.

Hier die Ergebnisse:

Code:
Rank Name                      Elo    +    - games score oppo. draws
   1 Naum 4.2                 2857   36   34   285   76%  2671   32%
   2 Rybka 3                  2850   23   22   726   76%  2664   29%
   3 Stockfish 1.6.3 JA       2814   21   21   727   71%  2666   35%
   4 Shredder 12              2800   21   21   728   69%  2667   34%
   5 Deep Fritz 12            2771   20   20   759   64%  2675   41%
   6 Thinker 5.4d Inert       2703   20   20   727   55%  2672   39%
   7 Komodo 1.0 JA            2702   20   20   728   55%  2672   41%
   8 Protector 1.3.2          2669   20   20   728   50%  2674   42%
   9 Hiarcs 12.1 Sharpen PV   2657   20   20   728   48%  2674   38%
  10 Sjeng WC-2008            2655   20   20   727   47%  2674   38%
  11 Spark 0.3a               2650   20   20   727   46%  2674   42%
  12 Zappa Mexico II          2650   20   20   727   46%  2675   44%
  13 Junior 11.1a             2640   20   21   708   44%  2682   38%
  14 Onno 1.1.1               2624   20   20   728   43%  2676   41%
  15 Critter 0.52b            2608   20   20   728   40%  2677   38%
  16 Fruit 05/11/03           2607   20   20   729   40%  2677   41%
  17 Ktulu 9.03               2603   21   21   760   39%  2684   30%
  18 Loop 13.6                2596   20   20   728   38%  2678   39%
  19 SmarThink 1.20           2578   20   21   727   35%  2678   39%
  20 Twisted Logic 20100131x  2565   21   21   727   34%  2679   32%


Ziehe mir mal den Shredder Spießroutenlauf rüber ...

Code:
naum-42

Naum 4.2 - Critter 0.52b  9.5 - 1.5  86.36%  
Naum 4.2 - Fruit 05_11_03  9.5 - 1.5  86.36%  
Naum 4.2 - Hiarcs 12.1 Sharpen PV  8.5 - 2.5  77.27%  
Naum 4.2 - Komodo 1.0  10.0 - 1.0  90.91%  
Naum 4.2 - Loop 13.6  9.5 - 1.5  86.36%  
Naum 4.2 - Onno 1.1.1  7.5 - 3.5  68.18%  
Naum 4.2 - Protector 1.32  9.0 - 2.0  81.82%  
Naum 4.2 - Rybka 3  5.5 - 5.5  50.00%  
Naum 4.2 - Shredder 12  6.5 - 4.5  59.09%  
Naum 4.2 - Sjeng WC-2008  8.0 - 2.0  80.00%  
Naum 4.2 - SmarThink 1.20  7.5 - 2.5  75.00%  
Naum 4.2 - Spark 0.3a  8.0 - 2.0  80.00%  
Naum 4.2 - Stockfish 1.6.3 6.0 - 4.0  60.00%  
Naum 4.2 - Thinker 5.4d Inert 8.5 - 1.5  85.00%  
Naum 4.2 - Twisted Logic 20100131x  9.5 - 0.5  95.00%  
Naum 4.2 - Zappa Mexico II  8.0 - 2.0  80.00%  
  131.0 - 38.0  77.51%

169 von 640 Partien gespielt
Spielstufe: 40 Züge in 10 min


Dann gab es ja ein:
24.5 : 15.5 gegen Deep Fritz 12
33.0 :  7.0 gegen Ktulu 9.03

und im Spießroutenlauf unter der Fritz 12 GUI gegen Junior 11.1a steht es derzeit ... muss schauen ...
27,5 : 9,5 gegen Junior 11.1a

Derzeit läuft Naum 4.2 auf 2 PCs ... die letzten Junior 11.1a Partien laufen, dann auf 4 PCs.
Denke morgen Abend wird Naum 4.2 dann 400 der 760 Partien gespielt haben.

Der 1 Platz von Rybka wackelt also nach fast 4 Jahren Dominanz ganz erheblich.
Rede immer von 32-Bit, bei 64-Bit schaut es anders aus ... da sind noch gut und gerne 50 ELO aufzuholen.

Gruß
Frank
Parent - - By U. Haug Date 2010-03-30 19:20
Guten Abend Frank,

erst mal danke für deine Tests. Naum 4.2 scheint ja wirklich etwas Besonderes zu sein!

[quote="Frank Quisinsky"]
Hi,

Naum 4.2 32-Bit bei 40 in 10 marschiert einfach weiter. Egal wer kommt, gegen alle Engines steht Naum 4.2 positiv.
Weiterhin auf Platz 1 aber nur noch mit 7 ELO Vorsprung nach jetzt fast 300 Partien. Wenn die 400 Partie Marke übersprungen ist, passiert wahrscheinlich nichts mehr +-5.
Spannender geht es nun wirklich nicht mehr.
(...)
Der 1 Platz von Rybka wackelt also nach fast 4 Jahren Dominanz ganz erheblich.
Rede immer von 32-Bit, bei 64-Bit schaut es anders aus ... da sind noch gut und gerne 50 ELO aufzuholen.

Gruß
Frank
[/quote]

sag mal. testest du nicht auch noch gegen die momentan angeblich (?) allerstärksten Engines wie Firebird 1.2? Ich fände es sehr interessant, ob in diesem Vergleich Naum 4.2 deutlich an seine Grenzen stößt oder vielleicht auch nicht.

Nette Grüße,

Ulrich
Parent - By Frank Quisinsky Date 2010-03-30 21:25
Hallu Ulrich,

unter uns ...
Firebird 1.0 Beta liegt 23 ELO über Rybka 3, gespielte Partien = 720!
Also derzeit 13 ELO vor Naum 4.2 bei der Bedenkzeit die ich einsetze, 40 in 10.
Aber verrate mich blos nicht.

Habe aber kein Interesse das Online zu stellen, so lange die Herkunft dieser Engine nicht absolut und zuverlässig geklärt ist.
Diesen Test habe ich intern durchgeführt, danach aber keine weiteren Partien spielen lassen.
Für einen Anhaltspunkt über was ich in Interviews rede bzw. schreibe reicht mir das persönlich aus.

Immer 32-Bit ...

Gruß
Frank
Parent - - By Ingo Bauer Date 2010-03-30 19:47 Edited 2010-03-30 19:51
Moin Frank

[quote="Frank Quisinsky"]
...
Naum 4.2 32-Bit bei 40 in 10 marschiert einfach weiter. Egal wer kommt, gegen alle Engines steht Naum 4.2 positiv. Bzw. gerade gegen Rybka verloren, steht dort 5,5:5,5!
Weiterhin auf Platz 1 aber nur noch mit 7 ELO Vorsprung nach jetzt fast 300 Partien. Wenn die 400 Partie Marke übersprungen ist, passiert wahrscheinlich nichts mehr +-5....
...
[/quote]

Wenn da nichts mehr passiert und Naum 4.2 auf R3 Niveau liegt hast du das Problem zu erklären, warum deine Liste die einzige ist die das so sieht.

Die CEGT hat N4.2-64 20 Elo Hinter R3-32, bei mir sind es 30 Elo. CEGT und IPON testen die 64bit Naum Version die nach Aussage des Authors besser sein soll als die 32bit Version (Auch die Knotenzahlen und die Time to depth deuten darauf hin), CCRL hat noch gar keinen N4.2 in ihrer 40/40 Liste ...

Hier mal Grundstellung der 32bit Version:


Engine: Naum 4.2 32b (1024 MB)
by Aleksandar Naumov

...

21/44  1:10   +0.14    1.Nc3 Nf6 2.d4 d5 3.Nf3 Nc6 4.g3 g6
                       5.Bg2 Bg7 6.O-O O-O 7.Ne5 Bf5 8.Bf4 Nb4
                       9.Nd3 a5 10.a3 Nxd3 11.exd3 (107.164.690) 1510

21/44  1:45   +0.15    1.e4 e5 2.Nc3 Nc6 3.Nf3 Nf6 4.Bb5 Bc5
                       5.O-O O-O 6.Nxe5 Nxe5 7.d4 a6 8.Be2 Bd6
                       9.dxe5 Bxe5 10.Qd3 d6 11.Be3 (159.536.895) 1515

22/45  2:36   +0.17    1.e4 e5 2.Nc3 Nc6 3.Nf3 Nf6 4.Bb5 Bb4
                       5.O-O O-O 6.d3 Nd4 7.Bc4 d6 8.Nxd4 exd4
                       9.Ne2 Bc5 10.Nf4 Bd7 11.Bd2 b5 (239.264.812) 1530

best move: e2-e4 time: 2:39.390 min  n/s: 1.530.834  nodes: 242.175.942


und hier der 64bit Naum 4.2:


Engine: Naum 4.2 (1024 MB)
by Aleksandar Naumov

...

21/44  0:57   +0.14    1.Nc3 Nf6 2.d4 d5 3.Nf3 Nc6 4.g3 g6
                       5.Bg2 Bg7 6.O-O O-O 7.Ne5 Bf5 8.Bf4 Nb4
                       9.Nd3 a5 10.a3 Nxd3 11.exd3 (107.164.690) 1873

21/44  1:24   +0.15    1.e4 e5 2.Nc3 Nc6 3.Nf3 Nf6 4.Bb5 Bc5
                       5.O-O O-O 6.Nxe5 Nxe5 7.d4 a6 8.Be2 Bd6
                       9.dxe5 Bxe5 10.Qd3 d6 11.Be3 (159.536.895) 1881

22/45  2:05   +0.17    1.e4 e5 2.Nc3 Nc6 3.Nf3 Nf6 4.Bb5 Bb4
                       5.O-O O-O 6.d3 Nd4 7.Bc4 d6 8.Nxd4 exd4
                       9.Ne2 Bc5 10.Nf4 Bd7 11.Bd2 b5 (239.264.812) 1901

best move: e2-e4 time: 2:39.235 min  n/s: 1.901.764  nodes: 280.432.660

(Jeweils 1 Thread, 1GB Hash, gleichzeitig laufen lassen - und ja, das ist ein bischen dünn für einen Test aber es ist ein Anhaltspunkt)

Also identische Knotenzahl bei erreichter Tiefe (absolut), die 32bit Version braucht nur rund 25% länger um da hin zu kommen. 25% sind am Rande des messbaren in Elo ausgedrückt - sagen wir mal so 15 Elo SCHLECHTER als die 64 bit Version.

Entweder hat Alex Naumov dann einen Bug in die 64bit Version gebaut oder deine Liste testet ungenau oder du hast zu wenig Spiele. Ich brauch dir nicht zu sagen was ich glaube

Gruß
Ingo

PS: Ziemlich reißerischer Titel für so wenig Partien! OK, aber besser als Ratinglisten mit 50 Partien gegen einen Gegner oder gar nur Ratings mit 3 Partien - da muß ich dann doch sehr den Kopf schütteln!
Parent - By Ingo Bauer Date 2010-03-30 20:05
[quote="Ingo Bauer"]
M

Die CEGT hat N4.2-64 20 Elo Hinter R3-32, bei mir sind es 30 Elo. CEGT und IPON testen die 64bit Naum Version die nach Aussage des Authors besser sein soll als die 32bit Version (Auch die Knotenzahlen und die Time to depth deuten darauf hin), CCRL hat noch gar keinen N4.2 in ihrer 40/40 Liste ...
...
[/quote]

Mein Rating für R3-32 ist ein bischen "outdated". Ich lass mal ein paar Spiele gegen aktuellere Gegner laufen vielleicht tut sich ja was.

Gruß
Ingo
Parent - - By Frank Quisinsky Date 2010-03-30 20:17
Hallo Ingo,

schüttle ruhig den Kopf
Ich schüttle manchmal auch den Kopf wenn ich sehe was Du schreibst, obwohl Du dich nun schon so lange mit Ratinglisten auseinander setzt.

Ich komme erneut der Bitte nach einer Erklärung sehr gerne nach.

Naum profitiert zumindest in der Version 4.1 nicht sonderlich von 64-Bit.
Es ist auffällig, das die 32-Bit Versionen sehr gut optimiert sind.
Es ist auffällig das in jeder Blitz-Ratingliste Naum 4.1 deutlicher hinter Rybka steht als bei mittleren Bedenkzeiten.

Auch nach nur 285 Partien kannst Du eine Aussage treffen.
Das kannst Du im Grunde auch nach einer Partien, wie ... wenn ich mich recht erinnere ... mal der gute Thorsten Czub geschrieben hat.
Dann wenn Du Dir die Partie genau anschaust.

Wobei eine Partie schon ein wenig untertrieben ist und bei den heutigen Spielstärken das auch nicht mehr so einfach zu realisieren ist.

Natürlich ist die Gefahr noch groß, dass Naum 4.2 am Ende nicht auf Platz 1 liegen wird. Die Sache wird verdammt knapp. Es sind nur 7 ELO ... bzw. derzeit wieder 10 ELO. Das schwankt seit Partienummer 145 - 285 zwischen 6 und 15 ELO beständig.

Da kann dennoch noch einiges passieren aber die Wahrscheinlich ist bei der Dominanz bei den Ergebnissen unwahrscheinlich.
Selbst wenn Naum 4.2 am Ende 5 ELO vor Rybka 3 liegt, und das nach 760 Partien könnte sich das natürlich noch ändern. Vielleicht dann bei 1.200 Partie 5 ELO hinter Rybka.

Fest steht aber das bei der SWCR ein Ergebnis ermittelt wird und wenn eine Engine auf Platz 1 liegt, liegt diese auf Platz 1. Ob mit einem ELO oder mit 5 ELO.

Für Dich ist das schwierig nachzuvollziehen.
Du hast Deine eigenen Ansichten über Anzahl von Partien, 64-bit etc., Zeitkontrolle etc..
Das ist OK aber Du kannst es doch selbst beobachten.

2 Cores bedeutet das 1.75fache im Vergleich zu einem Core.
Naum legt bei mehr Bedenkzeit zu, für mich nach den Ergebnissen die ich kenne absolut nicht in Frage gestellt.

2 Cores bedeutet Zeitvorteil, weil durch eine 1.75fache Leistung die Engine im Grunde in die gleiche Tiefe kommt als bei 1.75fach mehr Zeit.

Du kannst das doch schön selbst in Deiner Liste beobachten.

Rybka 3 hat einen ca. 50 ELO Vorteil gegenüber Naum bei x64.
Rybka 3 profitiert um 50 ELO von x64, bei Naum ist das nicht der Fall, profitiert nicht.

Wenn in der SWCR Naum 4.2 bei einem Core ca. 10 ELO vor Rybka liegt, müsste Naum 4.2 bei Dir ca. 40 ELO hinter Rybka liegen (Du spielst mit x64).
Das kannst Du wahrscheinlich erst dann sehen, wenn Du 2 Cores benutzt, da in der SWCR mit der ca. doppelten Zeit als bei Dir gespielt wird.

Dann gibt es noch eine andere Möglichkeit:

Konfiguriere die 32-Bit Engines und spiele den Spießroutenlauf den ich spiele.
Du wirst nichts anderes sehen bzw. feststellen.

Bei mir verändern sich Ratings nach 400 Partien nicht mehr um mehr als +-5.
Das gab es bei den 40 Versionen bislang noch nicht.
Viele der 40 Versionen haben ja schon 1.200 oder mehr Partien gespielt.

Also warum sollte ich bei Naum, bei diesen klaren Ergebnissen von einem anderen Tatbestand ausgehen.
Es kann natürlich passieren aber das wäre total unwahrscheinlich.

Und warum die anderen das nicht feststellen ...

Ja dann überleg doch mal selbst.
Wer spielt mit 32-Bit derzeit bei mittleren Bedenkzeiten.

Und mithin wurde das von anderen auch noch nicht festgestellt.
Bzw. Wolfgang hat etwas dazu geschrieben.

Im Blitz bei 32-Bit liegt Naum 4.2 7 oder 8 ELO hinter Rybka 3. Glaube er sprach von 500 Partien.

Also, nicht immer auf kontra gehen, nur weil Du mit anderen Voraussetzungen andere Ergebnisse produzierst.

Warten wir es doch einfach ab.
Es schaut nach einer neuen Nummer 1 bei 32-Bit aus. Wenn auch knapp bzw. zumindest zieht Naum 4.2 gleich. Glaube aber Naum 4.2 zieht vorbei, spricht zu viel dafür (z. b. auch die Remisquote). Rybka verliert mehr Partien, x andere Dinge ...

Wir werden sehen ...

Gruß
Frank
Parent - - By Frank Quisinsky Date 2010-03-30 20:27
Hi Ingo,

ich vergaß.
Du hast doch Rybka 3 32-Bit in Deiner Liste.
Lasse doch einfach Naum 4.2 32-Bit 500 Partien spielen.

Dauert bei Dir ja nur einen Tag.
Meine Prognose wäre dann bei Deiner Bedenkzeit 0-10 ELO bis Rybka 3.
Aufgrund der geringeren Bedenkzeit müsste Naum 4.0 sehr knapp hinter Rybka 3 bei Dir landen.

Das ist einfach.

Gruß
Frank
Parent - - By Ingo Bauer Date 2010-03-30 20:46
Hi

[quote="Frank Quisinsky"]
...
Du hast doch Rybka 3 32-Bit in Deiner Liste.
Lasse doch einfach Naum 4.2 32-Bit 500 Partien spielen.

Dauert bei Dir ja nur einen Tag.
Meine Prognose wäre dann bei Deiner Bedenkzeit 0-10 ELO bis Rybka 3.
[/quote]

Nach meiner obigen Prognose sollte N4.2 32 bit 15 Elo hinter Naum 4.2-64bit landen, also rund 45 ELo hinter R3-32bit.

[quote="Frank Quisinsky"]
Aufgrund der geringeren Bedenkzeit müsste Naum 4.0 sehr knapp hinter Rybka 3 bei Dir landen.
Das ist einfach.
...
[/quote]

Hä? das ist mir zu Hoch. Naum 4.0 ist als 64 Bit in meiner List und WEIT hinter R3-32 bit. Ich nehme aber an du meinst Naum 4.2.

Dein einziges Argument das ich in dem langen Text sehen konnte ist, das Naum von mehr Bedenkzeit profitiert, aber erstens bist du nicht soo viel länger als ich und zweitens wäre das die erste Engine die so deutlich mesbar (bei unserem kleinen Zeitunterschied) aus dem Rahmen fallen würde!

Nochmal in klaren Worten:

Naum 4.2 64bit ist laut den Speedtest und dem Author besser als Naum 4.2 in 32bit. ALLE Listen, ausser deiner haben Naum 4.2 64bit mit einem Thread recht deutlich HINTER R3-32bit. PUNKT.

Gruß
Ingo
Parent - By Frank Quisinsky Date 2010-03-30 21:07
Hi Ingo,

nochmal mit ganz klaren Worten
Nicht überall wo die Zahlen 64 glänzen ist auch 64 drin

Naum 4.2 x64 bei Dir 2.818
Rybka 3 w32 bei Dir 2.851

Habe selbst 400 Partien von Naum 4.1 x64 und da sehe ich 8 ELO schlechter als Naum 4.1 w32.
10-15 ELO bei mir Zeit.

Wären bei Dir dann vergleichbar 2.841 für Naum 4.2.

Anderes Beispiel.
Naum 4.2 2 Cores bei Dir 2.883
Naum 4.2 1 Core bei Dir 2.818

Differenz = 65 ELO bei einem Core mehr ?
Unwahrscheinlich !!

1 Core mehr produziert durchschnittlich 35 - maximal 55 ELO.
Wo kommen denn die 10-30 ELO her?

Also irre ich mich bei der Zeitkomponente.
Sind es doch mehr als 10-15 ELO durch die doppelte Bedenkzeit?

Bei Dir dauert eine Partie 16 Minuten.
Bei mir dauert eine Partie 40 Minuten (bis zur Entscheidung ohne Aufgabe, Partiedurchschnitt der 16.000 Partien = 86 Züge).
Du kannst 8 Minuten abziehen, würde ich mit Aufgabefaktor spielen.

Also 32 zu 16 Minuten ...
Doppelte Bedenkzeit ... daher rührt der Unterschied bei Naum.

Zu sehen in fast allen Blitzratinglisten.
Naum ist im Blitz deutlich schwächer als Rybka im Vergleich zu mittleren Bedenkzeiten.
Vergleiche Naum 4.1 Blitz je mit Rybka 3 Blitz und das gleiche bei 40 in 20 CEGT.

40 in 20 CEGT bedeutet 40 in 10 bei mir (Hardwarevorteil), wobei bei mir noch Ponder aktiviert ist.
Ergebnisse auch gut vergleichbar.

Für mich gibt es da überhaupt keinen Zweifel.
Naum 4.2 spielt bei 32-Bit um Platz 1 und scheint auch auf Platz 1 zu landen.

Also was du schreibst mit oder ohne Punkt ist für mich nicht nachvollziehbar.
Schaue Dir erst die 32-Bit genauer an ... erst testen, dann urteilen!
Deine Ergebnisse bei 2 Threads ... simuliert im Grunde die Zeit die ich bei SWCR einsetze.

Gruß
Frank
Parent - - By Kurt Utzinger Date 2010-03-30 20:33
[quote="Frank Quisinsky"]
[...]
Das kannst Du im Grunde auch nach einer Partien, wie ... wenn ich mich recht erinnere ... mal
der gute Thorsten Czub geschrieben hat. Dann wenn Du Dir die Partie genau anschaust.
[...]
[/quote]

Hallo Frank
Nun muss aber selbst ich schmunzeln, denn nach nur einer Partie kann man bei dem heutigen
Niveau der Schachprogramme (noch fast) gar nichts sagen. Hier ist offenbar Dein Temperament
mit Dir durchgegangen, oder Du hast Dich an die guten, alten Schachcomputerzeiten erinnert,
wo so etwas bei langen Bedenkzeiten im Kampf zwischen zwei stark unterschiedlichen
Programmen manchmal tatsächlich möglich war.
Mfg
Kurt
Parent - By Frank Quisinsky Date 2010-03-30 20:38
Hi Kurt,

habe mich an Schachcomputerzeiten erinnert.
Saitek Simultano um genau zu sein.

Hatte ein super Gerät abgegeben und mir in jungen Jahren dann den Saitek Simultano zugelegt.
Das war mit Abstand der langweiligste Schachcomputer den ich je hatte.

Der hat so grotten langweilig gespielt dass mir das nach nur einer Partie schon aufgefallen ist.
Und nach den ersten 20 Turnierpartien gegen Polgar und ich weiß nicht mehr genau ... wurde das Gerät deutlich geschlagen.
Wenn dann mal ein Pünktchen kam, war das auch eher ein Zufall.



Aber an dem was Thorsten mal geschrieben hast ist etwas dran.
Heute bei den hohen Spielstärken zwar nicht mehr zu sehen aber starke Schachspieler erkennen sehr schnell wo die Stärken und Schwächen von Schachprogrammen liegen.
Erinnere mich an das nette Gespräch mit GM Meier, hatten in Trier mit Jörg Hickl ein Interview mit Ihm gemacht.

Wir erkennen das natürlich eher aufgrund Statistiken, Analysen etc..

Naum 4.2 spielt wie ein Panzer.
Und ich kann noch gar nicht sagen wo denn jetzt der Spielstärke überhaupt her kommt.
Im Endspiel sicher, würde dennoch sagen Stockfish ist besser im Endspiel.
Im Mittelspiel ein Panzer ..

Gruß
Frank
Parent - - By Ingo Bauer Date 2010-03-30 20:36
Hallo Frank,

zuviel Sermon zu wenig Fakt.

Ich habe dir oben kurz nachgewiesen das die 32 bit nicht besser sein kann als die 64 bit Version (dünne Datenbasis, aber das habe ich oben auch erwähnt), die 64 bit Version steht überall hinter R3-32 ... nur bei dir nicht. Wie du das erklärst überlasse ich dir.

Wieso du das mit MP vergleichen willst weiß ich nicht, 2Threads ist etwas anderes als mehr Zeit, genau so wie Ponder ON etwas anderes ist als eine reine Bedenkzeitverlängerung!

Ansonten: Warum nicht auf Contra? Dazu ist ein Forum doch da? Hier ein "Hast du gut gemacht" zu schreiben ist MAL ok, sollte aber doch wohl nicht die Regel sein, ein ordentlicher Disput würzt das ganze doch erst ...!? Mit Friede, Freude, Eierkuchen würde ich mich hier zu Tode langweilen!

Gruß
Ingo
Parent - - By Frank Quisinsky Date 2010-03-30 20:43
Hi,

Ingo, nicht schreiben "nicht besser sein kann" ... testen!
Ich habe Dir geschrieben das Naum 4.1 x64 Bit 8 ELO schlechter als 32-Bit war.
In Mails die wir ausgetauscht haben.

2 Threads ist etwas anders als mehr Zeit, sehr sehr bedingt.
Ponder = On ist ein ca. 35% Bedenkzeitverlängerung.

Ponder und x64 wie auch Hardware sind alles Zeitfaktoren.

Natürlich muss näher hingeschaut werden.
Engine A hat bei 2 Cores 1.6 als Faktor und Engine B hat bei 2 Cores 1.75 als Faktor.
Im Grunde sind es immer 40 - 55 ELO mehr ... spreche von den TOP-Engines.

Recht hast Du, mit Contra
Darf und sollte nur nicht beleidigend werden.
Daran stören sich meist die Schreiber selbst gar nicht aber die Leser

Die denken jetzt eh wieder ...
Zeit Frank und Ingo besser in Ruhe zu lassen

Gruß
Frank

Du schreibst ...
Die 64-Bit steht überall hinter der 32-Bit von Rybka 3.

Und jetzt mein Kommentar:
Wo steht die 32-Bit von Naum 4.2 ... siehst Du in der SWCR
Parent - - By Ingo Bauer Date 2010-03-30 21:07
Moin,

[quote="Frank Quisinsky"]
...
Ingo, nicht schreiben "nicht besser sein kann" ... testen!
...
[/quote]

Ich werde nicht eine Enigne, die sich 100% identisch verhält zu Naum 4.2 32bit, also selbe PV, identische Anzahl an Knoten bis zu jeder beliebigen Tiefe die allerdings rund 25% langsamer ist testen, in der mehr als vagen Hoffnung das sie bessere Ergebnisse als die schnellere Engine bringt ... das erscheint mir doch etwas wundergläubig!

[quote="Frank Quisinsky"]
2 Threads ist etwas anders als mehr Zeit, sehr sehr bedingt.
Ponder = On ist ein ca. 35% Bedenkzeitverlängerung.

Ponder und x64 wie auch Hardware sind alles Zeitfaktoren.
[/quote]

Dazu wollte ich eigenltich immer mal ein Artikelchen mit Bsp auf meiner Homepage zusammenstellen. Das glaube ich nämlich nicht, sondern halte das für eine unbewiesene Annahme! Selbst mit einem Thread kenne ich 2 Enignes (evtl eine dritte) die bei Ponder ON ein anderes Timing an den Tag legen, egal WELCHE Hardware und welche Bedenkzeit dahinter steckt sich also eben nicht nach einfach analog zur fiktiven Bedenkzeitverlängerung verhalten!

Deswegen auch meine unbeantwortete Frage (ich habe noch Hoffnung) ich sammle nämlich sehr geduldig Fakten diesbezüglich.

[quote="Frank Quisinsky"]
Du schreibst ...
Die 64-Bit steht überall hinter der 32-Bit von Rybka 3.

Und jetzt mein Kommentar:
Wo steht die 32-Bit von Naum 4.2 ... siehst Du in der SWCR
[/quote]

Das Rechtfertigen eines Ratings mit der Liste in der es steht scheint mir eine zweifelhafte Methodik!

Gruß
Ingo
Parent - - By Frank Quisinsky Date 2010-03-30 21:14
Hi Ingo,

ich rechtfertige doch nicht nur mit meiner Liste, sondern auch mit Deiner und wenn Du möchtest mit jeder anderen

Glaube Dein Problem ist eher, dass Du einen Vorteil bei Naum 4.2 x64 siehst den es gar nicht gibt.

Ich muss das nicht mehr testen, ich habe das schon getestet (Naum 4.1).

Gruß
Frank
Parent - - By Ingo Bauer Date 2010-03-30 21:23
[quote="Frank Quisinsky"]
...
Glaube Dein Problem ist eher, dass Du einen Vorteil bei Naum 4.2 x64 siehst den es gar nicht gibt.
...
[/quote]

Selbst OHNE Vorteil ist Naum 4.2 32/64 schlechter als Rybka 3-32bit - das ist doch  das was ich dir versuche die ganze Zeit klarzumachen.

Aber ok, hier gebe ich auf! Wenn 25% schneller für dich kein Unterschied ist kann ich mir weiteres Wundtippen sparen!

Gruß
Ingo
Parent - - By Frank Quisinsky Date 2010-03-30 21:27
Hallo Ingo,

25% schneller bedeutet keinesfalls auch besser.
Das ist ein Irrglaube!

Und wenn Du das vielleicht auch selbst feststellst ... sage dann blos nicht Naum ist total bugy

Gruß
Frank
Parent - - By Ingo Bauer Date 2010-03-30 21:36 Edited 2010-03-30 21:38
Hi

[quote="Frank Quisinsky"]

25% schneller bedeutet keinesfalls auch besser.
Das ist ein Irrglaube!

[/quote]

Ahhh Frank,

Wir vergleichen hier nicht Rybkaknoten mit Shredderknoten sonder Knoten identischer Engines. Aber selbst ohne Knoten kommt Naum 4.2 64 bit schlicht und einfach schneller auf Tiefe, alse Time to depth ist besser!

Schau dir das doch mal an:

22/45  2:36   +0.17    1.e4 e5 2.Nc3 Nc6 3.Nf3 Nf6 4.Bb5 Bb4
                       5.O-O O-O 6.d3 Nd4 7.Bc4 d6 8.Nxd4 exd4
                       9.Ne2 Bc5 10.Nf4 Bd7 11.Bd2 b5 (239.264.812) 1530

22/45  2:05   +0.17    1.e4 e5 2.Nc3 Nc6 3.Nf3 Nf6 4.Bb5 Bb4
                       5.O-O O-O 6.d3 Nd4 7.Bc4 d6 8.Nxd4 exd4
                       9.Ne2 Bc5 10.Nf4 Bd7 11.Bd2 b5 (239.264.812) 1901


IDENTISCHE KNOTEN nur unterschiedlich schnell, IDENTISCHE HV nur unterschiedlich schnell. Das Ding ist wie Shredder, selber Code, unterschiedler Compile. DAS SIND GLEICHE ENGINES nur unterschiedlich schnell. Auch du darfst das gerne bei dir zu Hause versuchen!

25% schneller bei den Knoten, 12.5% schneller auf Tiefe.

So jetzt weiß ich echt nicht mehr weiter!

Bye
Ingo
Parent - - By Frank Quisinsky Date 2010-03-30 21:41
Hi Ingo,

OK, das schaut logisch aus.
Aber dennoch sind die Ergebnisse anders.

Vielleicht liegt der Grund auch tiefer. Dazu müsste man die Sourcen kennen und auch lesen können.

Wie erklärst Du Dir denn 65 ELO mehr bei Naum 4.2 in Deiner Liste 1Core zu 2Cores.
Musst auch mal versuchen Deine eigenen Fakten zu durchleuchten.
65 ELO kann nicht sein!
Da muss ein anderer Faktor hinzukommen.

Gruß
Frank
Parent - - By Ingo Bauer Date 2010-03-30 21:47
Hi

[quote="Frank Quisinsky"]
...
Vielleicht liegt der Grund auch tiefer. Dazu müsste man die Sourcen kennen und auch lesen können.
...
[/quote]

Du spekulierst, alles was wir wissen ist das die Enignes identisch sind - nur unterschiedlich schnell.

[quote="Frank Quisinsky"]
...
Wie erklärst Du Dir denn 65 ELO mehr bei Naum 4.2 in Deiner Liste 1Core zu 2Cores.
Musst auch mal versuchen Deine eigenen Fakten zu durchleuchten.
65 ELO kann nicht sein!
Da muss ein anderer Faktor hinzukommen.
...
[/quote]

Warum kann das nicht sein und warum müssen da andere Faktoren sein? Ich habe 65 Elo, die CEGT hat sogar 70 ELo von einem auf 2 Threads. Ich würde mich ja freuen wenn Naum 4.2 nicht so gut parallelisieren würde aber ich sehe keinen Grund warum er das nicht können sollte. Hast du irgendwelche Daten warum das nicht gehen können soll?

Gruß
Ingo
Parent - - By Frank Quisinsky Date 2010-03-30 21:50 Edited 2010-03-30 21:55
Hi Ingo,

Ein Faktor von 1.75 kann eine Engine nicht um 40 bis maximal 50 ELO stärker machen, wenn eine Verdoppelung der Geschwindigkeit maximal 50-60 ELO beträgt.
Kommst du auf 65 oder 70 ELO mehr sind andere Faktoren dafür verantwortlich.

Das können nicht viele Faktoren sein.

- Zeit selbst ... durch mehr Zeit bessere Ergebnisse als andere Engines
- die Engine selbst

Ist es die Engine selbst macht die Engine irgend etwas anders bei der Verwendung von einem Core im Vergleich zu 2 Cores.

Das ist logisch!
Was Du anführst ist "für mich" unlogisch!

Gruß
Frank

Und das bedeutet ... die Sache wird interessant
Denn ich habe keinen Grund an die Ergebnisse anderer Listenbetreiber nicht zu glauben.

Um Dich jetzt nicht ganz in Rage zu bringen ...
Nach 295 Partien sind es wieder 12 ELO mehr für Naum 4.2
Parent - - By Ingo Bauer Date 2010-03-30 22:04 Edited 2010-03-30 22:06
Moin

[quote="Frank Quisinsky"]
Hi Ingo,

Ein Faktor von 1.75 kann eine Engine nicht um 40 bis maximal 50 ELO stärker machen, wenn eine Verdoppelung der Geschwindigkeit maximal 50-60 ELO beträgt.
Kommst du auf 65 oder 70 ELO mehr sind andere Faktoren dafür verantwortlich.

Das können nicht viele Faktoren sein.

- Zeit selbst ... durch mehr Zeit bessere Ergebnisse als andere Engines
- die Engine selbst

Ist es die Engine selbst macht die Engine irgend etwas anders bei der Verwendung von einem Core im Vergleich zu 2 Cores.

Das ist logisch!
Was Du anführst ist "für mich" unlogisch!

[/quote]

Oh doch, da gibt es noch einiges was falsch sein kann:

Zitat: "Ein Faktor von 1.75 ... " Der kann schon anders sein "... kann eine Engine nicht um 40 bis maximal 50 ELO stärker machen ..." ein anderer Faktor kann das vielleicht und deine Annahme von 40 bis 50 ist genau das, eine Annahme " ... wenn eine Verdoppelung der Geschwindigkeit maximal 50-60 ELO beträgt..." noch eine unbewiesene Annahme " ... Kommst du auf 65 oder 70 ELO mehr sind andere Faktoren dafür verantwortlich." Das Unterschreibe ich dir, wenn du mir die 1.75, die +40-50 und die maximalen 50-60 irdendwie plausibel machen kannst ohne auf deinen Bauch zu verweisen.
Natürlich gibt es eine Obergrenze und ich glaube die 65 Elo sind sehr dicht dran, aber da auch Zappa 63 Elo hat halte ich diese 65 durchaus für machbar und plausibel. Es kann natürlich auch sein das die 1600 Spiele noch nicht genug sind ...

Gruß
Ingo
Parent - - By Frank Quisinsky Date 2010-03-30 22:21
Hi Ingo,

sehr richtig, Zappa benötigt auch Zeit.
Das ist nicht verwunderlich.

Rechne doch die durchschnittlichen 1Core zu 2Core Zuwächse aus. Habe ich im Januar gemacht und kaum auf durchschnittlich 44 ELO.
Der durchschnittliche Faktor war 1.72 oder 1.73, weiß nicht mehr.

Habe mich da an allen möglichen Ratinglisten bedient.

wenn 1.73 = 40 ELO ist wäre eine Verdoppelung der Geschwindigkeit genau 46,24 ELO. Da es aber auch Programme gibt die über 1.73 liegen komme ich immer zu dem Ergebnis.
Verdoppelung der Geschwindigkeit = 50 bis aller maximal 55 ELO.

Kommt also eine Listenbetreiber auf 75 ELO spielt ein anderer Faktor eine Rolle.
Das ist nun wirklich logisch.

Wenn Naum 4.2 2T im Vergleich zu Naum 4.1 1T bei Dir um 65 ELO zulegt, solltest Du bevor Du alles in Frage stellst was Du sonst noch an Ergebnissen siehst ... zunächst drüber nachdenken ... wie kann das sein?

Diese Themen sind spannend.
Nicht alle Programme verhalten sich gleich.

Naum ist ein sehr schönes Beispiel.

Schauen wir mal in unsere Ratinglisten.
Wir haben ja genug Partien und Resultate ...

Naum 4.0 x64 bei Dir ... 2.773
Naum 4.0 w32 bei mir ... 2.780 (960 Partien) ... aha 7 ELO mehr

Naum 4.1 x64 bei Dir ... 2.783
Naum 4.1 w32 bei mir ... 2.807 (920 Partien) ... aha 24 ELO mehr

Naum 4.2 x64 bei Dir ... 2.818
Naum 4.2 w32 bei mir ... 2.857 (285 Partien) ... 39 ELO mehr

Wohlgemerkt, bei der x64 und bei mir w32 ...

Wenn wir beide auf Shredder 2.800 eichen, warum ist Naum 32-Bit immer stärker.
Und jetzt komme mir nicht wieder mit horrenden Partienzahlen, die für mich absolut keine Bedeutung haben. Ob Du nun 10.000 Partien gespielt hast oder 2.000 oder im Jahr 2006 wurde noch von 500 gesprochen. Da gab es keine Quad Cores. Wenn es bald 32Core Systeme gibt, spricht Du wahrscheinlich davon das 20.000 Partien notwendig sind Ist jetzt gemein aber ich kann nicht erkennen das ein Ergebnisse von 500 auf 1.200 Partien bei mir zu groben Abweichungen führen. Und selbst wenn ich unsere Listen vergleiche ist alles gleich, bis auf Naum und Junior 2010. Wie kann denn alles gleich sein wenn ich viel weniger Partien habe

ELOstat ...
Siehe Liste Christian Koch, schaue ich mir auch immer wieder gerne an.
Er hat glaube ich eine Engine mit 6.000 gespielten Partien und ELOstat sagt glaube ich noch 6 oder 8 Abweichung. Das sind Höchstwerte, allerhöchste Wahrscheinlichkeitsabweichungen, die im Grunde so selten eintreffen wie die Wahrscheinlichkeit ist das Dich der Blitz trifft

Gruß
Frank
Parent - - By Ingo Bauer Date 2010-03-30 22:43
Hi

[quote="Frank Quisinsky"]
...

Schauen wir mal in unsere Ratinglisten.
Wir haben ja genug Partien und Resultate ...

Naum 4.0 x64 bei Dir ... 2.773
Naum 4.0 w32 bei mir ... 2.780 (960 Partien) ... aha 7 ELO mehr

Naum 4.1 x64 bei Dir ... 2.783
Naum 4.1 w32 bei mir ... 2.807 (920 Partien) ... aha 24 ELO mehr

Naum 4.2 x64 bei Dir ... 2.818
Naum 4.2 w32 bei mir ... 2.857 (285 Partien) ... 39 ELO mehr

Wohlgemerkt, bei der x64 und bei mir w32 ...

Wenn wir beide auf Shredder 2.800 eichen, warum ist Naum 32-Bit immer stärker.
...
[/quote]

Frank, das ist genau der Grund warum ich hier heute mein erstes Posting gestartet habe und DICH fragte wie du das erklärst weil DEIN Rating von allen anderen, und nicht nur meinem, abweicht (Geh mal zu CEGT, CCRL und schau dir die Single Naums an)

Ich zitiere mich aus meinem ersten Posting: "Wenn da nichts mehr passiert und Naum 4.2 auf R3 Niveau liegt hast du das Problem zu erklären, warum deine Liste die einzige ist die das so sieht".

Nachdem wir festgestellt hatten das Naum 4.2 in 32 und 64 bit identisch ist ausser das die 32bit langsamer ist, ist es an dir deine obige Frage zu erklären! Ich will sie hier aber nochmal präzisieren: "warum ist Naum 32-Bit ... " in der SWCR "... immer stärker?

Gruß
Ingo
Parent - - By Frank Quisinsky Date 2010-03-30 22:56
Hi Ingo,

und ich kann Dir immer wieder nur darauf antworten.

In den anderen Listen taucht noch kein Naum 4.2 32-Bit auf.
Ich muss nicht erklären warum eine 64-Bit sich unter Umständen anders verhält als eine 32-Bit.

Und nochmals.
Es ist einfach für Dich ...

Lasse doch ein einem schönen Nachmittag einfach 500 Partien Naum 4.2 w32 Bit spielen.
Du hast ja Rybka 3 w32 in Deiner Liste. Bei Deiner verwendeten Zeit vermute ich eine ELO von 2.835-2.840. Das wäre ca. 15-20 mehr als die x64.

Das mag ja sein das es unwahrscheinlich klingt aber nach 400 Partien stellt ich auch fest das Naum 4.1 x64 8 ELO schwächer ist.
Kann es doch nicht ändern, es sind Resultate die ich hier sehe, die Einstellungen sind OK.

Teste doch mal Naum 4.1 oder 4.2 32-Bit und Du hast Dir die Frage selbst beantwortet.
Bzw. Du hast Sie Dir ja schon beantwortet ... siehe Deine Ergebnisse Naum 4.2 1T zu Naum 4.2 2T bei x64.
Zumindest halb beantwortet.

Und verweise nicht immer auf andere, ich sehe nirgends Naum 4.2 w32 Ergebnisse bis auf das was Wolfgang Battig geschrieben hat.
Nochmals ... ich kann auch verweisen ... so ist das nicht.

In CEGT Blitz liegt Naum 4.2 w32 nach 500 Partien 8 ELO hinter Rybka 3.
Warte ich schaue mal eben ...
Sehe überhaupt keinen Naum 4.2

Dann suche ich Dir den Thread ...

Ergebnisse CEGT:
Naum 4.2 32-Bit:
w32 - 1CPU: ELO 3036 aus 500 Partien (Rybka 3: 3043 aus 2730 Partien)

Thread:
http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?tid=2296

Also, wenn Du schon andere zitierst dann richtig!

Und nochmal ...
Wenn im Blitz nur 7 ELO hinter Rybka ist es klar das Naum 4.2 bei längeren Bedenkzeiten vor Rybka 3 landet.
Dafür muss ich nun wirklich kein Prophet sein, klar nicht unbedingt aber zumindest auf einem Level.
Ich denke dennoch ca. 5-10 ELO vorne, wie jetzt nach 300 Partien, derzeit sind es wieder 9 ELO

Gruß
Frank
Parent - - By Frank Quisinsky Date 2010-03-30 23:04
Hi,

hoffe das mit CEGT war für Dich jetzt kein KO Argument

Wir könnten ja noch Stunden so weiter ... in der Zeit hättest Du aber 500 Partien zusammen.

Wirklich schwierig Dich mal von etwas zu überzeugen, wobei ich Dich ja nicht überzeugen will aber Deine Argumente sind teilweise wirklich Haare sträubend.

Und das Dich der Blitz trifft wünsche ich Dir natürlich nicht.
Bin doch froh das es IPON gibt, sehr interessant ... weiter so ... mir gefällt auch IPON.

Gruß
Frank
Parent - - By Ingo Bauer Date 2010-03-30 23:20
[quote="Frank Quisinsky"]
..

Wirklich schwierig Dich mal von etwas zu überzeugen, wobei ich Dich ja nicht überzeugen will aber Deine Argumente sind teilweise wirklich Haare sträubend.
...
[/quote]

Los, wir finden DREI neutrale Wahnsinnige die sich durch diesen Thread arbeiten und mal die "Argument" nach Haarsträubefaktor gewichten - Ich bin sehr gespannt was die dazu sagen würden!

Gruß
Ingo
Parent - By Peter Martan Date 2010-03-31 07:00 Edited 2010-03-31 07:03
Moin Frank, um mit Ingo zu sprechen.
Ich hatte schon das eine oder andere Mal angesetzt, mich an diesem lustigen thread zu beteiligen, dass ich euren Enthusiasmus süß finde z.B., und dass man einen neuen Sport aus dem um die Wette Ranglistenlisten machen könnte.
Mein Gebot wäre z.B. gewesen: wenn der im Hiarcsforum schon angekündigte Hiarcs 13 herauskommen wird, wird er in 2 von 3 Ranglisten um nicht mehr als 13 Elo über oder unter R3 liegen und in mindestens einer der neue Spitzenreiter sein, egal, wer dann gerade die anderen sind.

Dann wollte ich euch auch schon mal bitten, ob ihr sowas nicht auch per Email machen könntet, aber das wär auch verfehlt gewesen, weil eigentlich wird meine Erkenntnis aus all dem, sosehr ich mich anfangs aufgerergt habe, dass mir keiner glaubt, dass das eine Sackgasse ist, die Sackgasse ist eigentlich eine ganz andere:
Schach überfordert den Computer ebenso wie den Menschen. Einzelbeispiele:
Antons letzte Randviir- Studie, die Walter auch schon als 15.Brillanten gebracht hat, wird von Fritz 10 mit Selektivität null gelöst und sonst höchstens noch von der einen oder anderen engine, bei der man den Nullzug auch abdrehen kann, in absehbarer Zeit auf Superhardware oder über Nacht.
Mit einem meiner langjährigen Analysepartner stecke ich wieder einmal in einer völlig unsinnigen Einzelvariante einer außer von mir von praktisch niemandem gespielten Eröffnung und ich sehe es kommen, die Erkenntnis wird einfach wieder einmal sein, es ist eine Scheißremisvariante mehr, von denen gibt es mittlerweile soviele, dass ich mit meiner Absicht, keine mehr in mein Buch aufzunehmen, einfach mehr und mehr scheitere.
Man kann einen Beruf aus dem Schachspiel machen, dann sind Computer sicher unverzichtbare Hilfsmittel, welches Programm einem dabei dann in welchen Stellungen am besten helfen könnte, wird auf die einzelne berufliche Spezialisierung und die Klasse, in der man spielt, ankommen.
Dass einem Berufsspieler Ranglisten bei dieser Entscheidung helfen können, glaub ich weniger und weniger, glaubt das einer von euch noch?
Ist ja auch nicht der Sinn und eigentlich habt ihr völlig recht, aus der Ranglistenerstellung eine Wissenschaft und einen Sport für sich (für euch) zu machen, da ist man schön abgegrenzt gegen alle anderen Computer- und Schachfragen, man muss nur die Regeln so definieren, dass Schach und hardware möglichst wenig Imponderabilitäten darstellen und schon kann man ganz unter sich bleiben.

Du hast nach drei neutralen Wahnsinnigen gefragt, ich bin absolut nicht neutral aber sicher wahnsinnig, bei dem Ganzen überhaupt noch mitzumachen, dass ich es stur auf diese meine für mich bisher einzig richtige und wichtige Art tue und tat und nicht verstanden habe, dass die Art Computerschach zu betreiben, auf eure Art eigentlich viel mehr Zukunft hat, das sehe ich jetzt langsam ein und möchte bei euch beiden in Stellvertretung für alle anderen heldenhaften Vorreiter des Ranglistenlistens Abbitte leisten.
Euer Wahnsinn hat wenigstens Methode, ich verstehe das mehr und mehr und danke euch, dass ihr mich von meinem ureigensten Eigenbrötlerwahnsinn mehr und mehr kuriert.
Parent - - By Ingo Bauer Date 2010-03-30 23:18
Hi

[quote="Frank Quisinsky"]
...

Lasse doch ein einem schönen Nachmittag einfach 500 Partien Naum 4.2 w32 Bit spielen.
Du hast ja Rybka 3 w32 in Deiner Liste. Bei Deiner verwendeten Zeit vermute ich eine ELO von 2.835-2.840. Das wäre ca. 15-20 mehr als die x64.
[/quote]

Zitat: Ich werde nicht eine Enigne, die sich 100% identisch verhält zu Naum 4.2 64bit, also selbe PV, identische Anzahl an Knoten bis zu jeder beliebigen Tiefe die allerdings rund 25% langsamer ist testen, in der mehr als vagen Hoffnung das sie bessere Ergebnisse als die schnellere Engine bringt ... das erscheint mir doch etwas wundergläubig!

[quote="Frank Quisinsky"]

In CEGT Blitz ....

[/quote]

Jetzt kommst du mir mit Blitz, die ganze Zeit behauptest du das Naum bei langeren Bedenkzeiten gewinnt und dann zitierst du Blitz? Ja was denn nun, wo wird Naum nun besser, beim Blitz oder bei langen Partien? (Nebenbei, da die CEGT Blitzliste praktisch nicht mal mehr Hardware anpasst ist diese Liste für mich die fragwürdigste!) Ansonten hat die momantane CEGT BLitz KEINEN Naum 4.2 egal ob 32 oder 64 Bit, wo hast du den diese Zahlen her? (http://www.husvankempen.de/nunn/40_4_Ratinglist/40_4_AllVersion/rangliste.html)

1. Naum 32 und 64 sind identische Enignes, nur die 32 ist langsamer (du slber hast das als logisch bezeichnet)
2. Bei mir, der CEGT 40/20 (und Thomas hier aus dem Thread, und wahrscheinlich demnächt bei der 40/40CCRL) ist die schnelle 64 bit Naum 4.2 Engine hinter Rybka 3 32 bit.
und hier auch noch der Link zur CEGt 40/20: http://www.husvankempen.de/nunn/40_40%20Rating%20List/40_40%20All%20Versions/rangliste.html Auf Rang 14 findest du R3 32 bit, auf Rang 17 Naum 4.2 64bit.

Nun erklär du mir warum bei dir nicht.

Ansonten schreib ich jetzt erstmal nichts mehr dazu, Warum? Weil DU die Ausnahme bist und wenn DEINE Liste stimmt DU erklären mußt warum die anderen ALLE falsch liegen.

Gruß
Ingo
Parent - - By Frank Quisinsky Date 2010-03-30 23:30
Hi Ingo,

jetzt gehen Dir aber die Argumente aus oder Du hast gelesen was ich geschrieben habe.
Dann stürmst Du einfach nur drauf los.

Ich muss mich offenbar immer wieder wiederholen.

Naum legt generell im Vergleich zu Rybka bei mehr Zeit zu.
Rybka ist generell eine Engine die im Blitz deutlich besser spielt. Nicht ganz so drastisch wie z. B. Hiarcs aber auch eine Engine die von kurzen Bedenkzeiten im Verhältnis zu längeren Bedenkzeiten profitiert.

Nicht ich habe angefangen andere Listen zu zitieren, Du berufst Dich auf andere Listen.
Ich wollte Dir darlegen, dass ich nicht der Einzige bin der offenbar festgestellt hat das Naum 4.2 w32 extrem gute Zahlen aufweist.
Nochmals, siehe Link CEGT Blitz ... offenbar gehst Du gerne bei Dingen die ich schreibe auf Contra.

Das ist OK, aber dann schaue Dir auch andere Ergebnisse an.
Oder den Beitrag von Wolfgang Battig zu dem Thema, stimme Wolfgang hier übrigens voll zu.

Deine Argumentation ist für mich wirklich Haar sträubend.
Weiß und Schwarz und Punkt.
Ohne mal selbst zu testen.

Verlasse Dich beim Engine testen doch nicht nur auf eine Variante.
In Deinem Fall x64.

Ist ja gut wenn Du davon überzeugt bist aber das und auch Deine Zeit ist nur eine mögliche Variante von Millionen.

Viel interessanter ist es Listen zu vergleichen und zu schauen wo kommt es denn zu Abweichungen und warum kommt es zu diesen Abweichungen.
Ich habe noch nie eine Liste gesehen die ein Optimum darstellt, dass gibt es nicht.

siehe Hiarcs Beispiel Blitz
Engines verhalten sich nie gleich.

Thema Beeinflussungsfaktoren bei Ratinglisten.
Dazu habe ich schon oft geschrieben.

Wo ich die Zahlen her habe.
Mein Gott, wenn Du meine Beiträge nicht liest ... Link steht doch groß und breit im Beitrag dann macht eine Diskussion keinen Sinn.
Dann bestätigt sich eher der Verdacht, dass Du drauflos polterst ohne auch mal zu lesen was andere Personen schreiben.

In meinem vorletzten Beitrag findest Du den Link zum Beitrag von Wolfgang.
Und jetzt greife nicht auch noch die CEGT an.

Wenn morgen in CCRL dann auch noch Naum 4.2 32Bit auftaucht sind dann alle Listen plötzlich schlecht.

Teste es einfach selbst.
Das kann nicht so schwierig sein.
Auch wenn es Dir vielleicht nicht passt eine 32-Bit zu testen.
Die würde sicherlich besser sein als die 64-Bit in Deiner Liste, keine Ahnung.
Oder mache es besser nicht, Du würdest ja die Welt nicht mehr verstehen

Gruß
Frank
Parent - By Frank Quisinsky Date 2010-03-30 23:35
Hi,

damit es für Dich einfacher ist.
Möchtest wahrscheinlich gar nicht lesen was ich schreibe ...

Ergebnisse CEGT:
Naum 4.2 32-Bit:
w32 - 1CPU: ELO 3036 aus 500 Partien (Rybka 3: 3043 aus 2730 Partien)

Thread:
http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?tid=2296

Gruß
Frank
Parent - - By Ingo Bauer Date 2010-03-30 23:48
[quote="Frank Quisinsky"]
..
jetzt gehen Dir aber die Argumente aus ...
[/quote]
Ja

[quote="Frank Quisinsky"]
Ich muss mich offenbar immer wieder wiederholen.
[/quote]

Dann sind wir schon zwei!

[quote="Frank Quisinsky"]
....
Ich wollte Dir darlegen, dass ich nicht der Einzige bin der offenbar festgestellt hat das Naum 4.2 w32 extrem gute Zahlen aufweist.
Nochmals, siehe Link CEGT Blitz ... offenbar gehst Du gerne bei Dingen die ich schreibe auf Contra.
[/quote]

Nochmal die CEGT BLitz HAT KEINEN NAUM 4.2 EGAL OB 32 ODER 64 bit IM MOMENT. Siehe mein Link. Dein Link führt zu einem Beitrag in dem Wolfang aber EXTRA einschränkend schreibt: "500 Partien reichen aber nicht aus, weil wir 100er Serien spielen und daher noch nicht ausreichend viele unterschiedliche Gegner "abgearbeitet" wurden." Das hst du vergessen zu erwähnen. Wenn (noch) nicht mal die CEGT ihren Ergebnissen traut um es in die aktuelle Liste einzuarbeiten warte auch ich noch ab!

[quote="Frank Quisinsky"]
Das ist OK, aber dann schaue Dir auch andere Ergebnisse an.
Oder den Beitrag von Wolfgang Battig zu dem Thema, stimme Wolfgang hier übrigens voll zu.
[/quote]

Wobei? Hierbei: Zitat Wolfgang Battig: "500 Partien reichen aber nicht aus"?

[quote="Frank Quisinsky"]
Deine Argumentation ist für mich wirklich Haar sträubend.
[/quote]

Hartes Brot - müssen wir aber mit leben!

[quote="Frank Quisinsky"]
Mein Gott, wenn Du meine Beiträge nicht liest ... Link steht doch groß und breit im Beitrag dann macht eine Diskussion keinen Sinn.
[/quote]

Siehe oben, du zitierst nur das aus dem Link das dir gefällt. FAKT IST: DIE AKTUELLE CEGT BLITZ ... ach hatten wir schon.

[quote="Frank Quisinsky"]
Dann bestätigt sich eher der Verdacht, dass Du drauflos polterst ohne auch mal zu lesen was andere Personen schreiben.
[/quote]

Schön, dann haben sich ja die zwei richtigen gefunden!

[quote="Frank Quisinsky"]
In meinem vorletzten Beitrag findest Du den Link zum Beitrag von Wolfgang.
[/quote]

Den du nur zur Hälfte zitierst ... (Ansonten ist das auch Blitz ... Phhh.)

[quote="Frank Quisinsky"]
Und jetzt greife nicht auch noch die CEGT an.
[/quote]

Nicht 'noch', sondern schon recht lange, das kennen die schon und regen sich nicht mal mehr darüber auf - Frechheit

[quote="Frank Quisinsky"]
...
Oder mache es besser nicht, Du würdest ja die Welt nicht mehr verstehen

[/quote]

Im Moment verstehe ich nur einen sehr kleinen Teil nicht!

Gruß
Ingo
Parent - By Frank Quisinsky Date 2010-03-30 23:53
Hi Ingo,

so, jetzt haben wir uns ausgetobt und sollten die Pizza in den Backofen schmeißen
Oder eine bestellen ... nee schon zu spät

Gruß
Frank
Parent - - By Wolfgang Battig Date 2010-03-31 11:19
Hi Ingo und Frank,

da ich schon mehrfach erwähnt wurde....

[quote="Ingo Bauer"]
Nochmal die CEGT BLitz HAT KEINEN NAUM 4.2 EGAL OB 32 ODER 64 bit IM MOMENT. Siehe mein Link. Dein Link führt zu einem Beitrag in dem Wolfang aber EXTRA einschränkend schreibt: "500 Partien reichen aber nicht aus, weil wir 100er Serien spielen und daher noch nicht ausreichend viele unterschiedliche Gegner "abgearbeitet" wurden." Das hst du vergessen zu erwähnen. Wenn (noch) nicht mal die CEGT ihren Ergebnissen traut um es in die aktuelle Liste einzuarbeiten warte auch ich noch ab![/quote]

sie wäre schon drin (in der Blitzliste), wenn es seitdem ein Update gegeben hätte. Das kommt aber erst am Karfreitag, also übermorgen. Das vorige war am 21.3. und unser Naum 4.2-Blitztest hat erst am 20.3. begonnen. Es fehlten also schlicht die Ergebnisse und unsere Blitzliste wird i.d.R. ~ alle 2 Wochen aktualisiert.

Zum Zeitpunkt meines zitierten Postings (25.3.) waren 500 Partien mit der 32bit-1CPU gespielt, mittlerweile sind es 1000 und die Performance (ein richtiges rating ist es ja noch nicht!) ist um 16 ELO gefallen. Es tut sich also - wie erwartet - durchaus noch etwas jenseits der 500-Partien-Grenze. Frank sieht das generell anders, ich bin da eher bei Ingo, denke aber, dass es für beide Meinungen (viele) Beispiele gibt. Im aktuellen Daydreamer 1.7-Test fiel die Performance zwischen Partie 350 und 1000 um deutliche ~30 ELO (!!). Wie gesagt, gibt sicher auch genügend Gegenbeispiele, will keine neue Diskussion zu dem Thema aufmachen

[quote="Frank Quisinsky"]
In meinem vorletzten Beitrag findest Du den Link zum Beitrag von Wolfgang.
[/quote]
[quote="Ingo Bauer"]
Den du nur zur Hälfte zitierst ... (Ansonten ist das auch Blitz ... Phhh.)[/quote]

ja, "nur Blitz"

In unserer 40/20-Liste ist Naum 4.2 bereits drin, allerdings nur mit 64bit.

Naum 4.2 x64 1CPU = ELO 3032 - 450 games
Rybka 3 x32 1CPU  = ELO 3051 - 1386

Naum 4.2 x64 2CPU = ELO 3102 - 300
Rybka 3 w32 2CPU  = ELO 3130 - 777


"Natürlich" (aus meiner und wohl auch Ingos Sicht) zu wenig Partien für Naum 4.2, aber die Tendenz ist da: Naum 4.2 64bit liegt hinter Rybka 3 32bit. Und das bei "längerer" Bedenkzeit.

Ob ich - wie im genannten Thread angedacht - noch einen Test für Naum 4.2 32bit/Single mit 40/20 nachschiebe, ist unwahrscheinlich, da sich meine/unsere Bereitschaft eine 32bit-Version zu testen wenn eine 64bit existiert in relativ engen Grenzen hält, zumindest was 40/20 bzw. 40/120 angeht. Dauert schlicht zu lange. Und da beim Blitztest die 32bit hinter der 64bit liegt, sehe ich derzeit keinen Sinn darin. Vielleicht wenn ich mal gaaanz viel CPU-Zeit frei habe.

[quote="Frank Quisinsky"]
Und jetzt greife nicht auch noch die CEGT an.

[quote="Ingo Bauer"]
Nicht 'noch', sondern schon recht lange, das kennen die schon und regen sich nicht mal mehr darüber auf - Frechheit [/quote][/quote]

genau: kaum zu glauben...

Viele Grüße
Wolfgang
Parent - - By Frank Quisinsky Date 2010-03-31 11:56
Hi Wolfgang,

es kommt natürlich darauf an wie getestet wird (Partiegrenze).

Ich habe immer geschrieben und bin nach wie vor auch davon absolut überzeugt (sehe einfach nichts anderes in meinen Statistiken, kann es auch nicht ändern) dass die Anzahl der notwendigen Partien geringer wird, wenn viele unterschiedlichen Programme in einer Liste spielen.

Wenn ich jetzt z. B. 2.000 Partien von Engine A gegen nur 5 andere Engines produziert habe, wackelt ein Rating mehr als wenn ich 500 Partien gegen 20 andere Engines produziert habe. Bei diesem "wackeln" sprechen wir vielleicht von 20 ELO.

Auch kommt es immer auf die eigene Zielsetzung an.
Mir reicht ein Rating wenn es um +-10 abweicht, also um 20 ELO.
Das erreiche ich nach meinen Statistiken in etwa bei 560 Partien.
+-15 also 30 ELO bei 380 Partien.

Und natürlich gibt es Aussetzer, aber die Wahrscheinlichkeiten liegen durchschnittlich bei 1:40 - 1:50.
Das dies bei der Menge der getesteten Engines in der CEGT schon vorgekommen ist verwundert mich nicht und ist auch absolut normal.

Bei Naum 4.1 habe ich selbst noch die x64 gestestet. Ich teste auf einen Rechner nur x64 um den ELO-Zugewinn zu ermitteln bzw. festzustellen ob es Unterschiede gibt. Bei Naum (egal welche Version) gab es nie einen relevanten Vorteil, der Schuss bei der Version 4.1 ging eher nach hinten los (8 ELO weniger für die x64 als für die w32). Habe aber hier auch nur 400 Partien, reicht aber um zu sehen das dort nichts passiert ist.

Nach allen Ergebnisse die ich kenne, auch die von Ingo ... leider fast nur x64 und meist auch nur mit deutlich schnelleren Bedenkzeiten als ich spiele, muss ich ja davon ausgehen das im 32-Bit Bereich Naum 4.2 hinter Rybka 3 in der SWCR landen wird. Das kann ja durchaus noch passieren. Meine Prognose war 10-15 ELO hinter Rybka 3. Wenn ich mir aber die Spielanlage ansehe, wie Naum die Punkte erspielt glaube ich eher das die beiden Engine unter den von mir getesteten Bedingungen gleich stark sind, total fraglich wer nun letztendlich vorne liegt. Vielleicht sind es ja am Schluss wirklich 15 ELO mehr für Rybka.

Wäre es so hätte Naum 2.835 und sich auch bei mir um 50 ELO zu Naum 4.0 verbessert, bzw. ca. 25 zu Naum 4.1. Das wäre dann exakt das Ergebnis nach der Ankündigung von Alexander ... Naum hat von 4.0 auf 4.2 um 50 ELO zugelegt.

Schaue ich jetzt nur auf die eigenen Ergebnisse, was ich normal nicht mache sieht es so aus:

Rybka 3: 2.857 (1.240 Partien) und Naum 4.1 2.807 (920 Partien).
Bei 40 in 10 sind das 50 ELO Unterschied.

Rybka 3: 2.874 (700 Partien) und Naum 4.1 2.785 (420 Partien).
Bei Partie in 5 Minuten sind das 89 ELO Unterschied.

Könnte jetzt auch in andere Listen schauen um mir dieses Ergebnis zu holen.
Also 39 ELO höhere Differenz zwischen Rybka 3 und Naum 4.1 ... Vergleich Blitz zu mittleren Bedenkzeiten.

Ingo schrieb ja auch schon früher, dass meine SWCR Ergebnisse bei Naum schwer nachzuvollziehen sind.
Er vergisst aber immer das ich mit der doppelten Bedenkzeit spiele.

Ingo IPON: Naum 4.1 = 2.783 ... ja klar ... das ist auch der Wert den ich im Blitz habe (2.785)
Frank SWCR: Naum 4.1 = 2.807 ... ja klar ... Naum wird stärker mit längeren Bedenkzeiten.

Die Sache ist daher kompliziert weil:

- er testet x64 (bei Naum 4.1 für mich zu sehen das die x64 eher schlechter ist als die w32, wahrscheinlich gibt es kaum Unterschiede ... gleich stark)
- Naum bei mir Zeit zulegt

Hier kommen zwei Dinge zusammen.

Also zusammengefasst:

Das Naum mit mehr Zeit im direkten Vergleich zu Rybka zulegt ist absolut klar und unzweifelhaft.
Das bei 32-Bit Rybka seinen x64 50 ELO Vorteil nicht ausspielen kann ist auch klar. Naum 32-Bit liegt immer näher an Rybka 32-Bit weil Naum von x64 ... zumindest die Version 4.0 und auch die Version 4.1 nicht profitiert. Die 4.2 habe ich hier noch nicht getestet.

Ich finde es schade wenn immer nur auf die eigenen Ergebnisse geschaut werden. Das was selbst ermittelt wurde ist das Maß aller Dinge. Nein, was selbst ermittelt wurde ist der Stand unter den eingesetzten Bedingungen und es gibt Millionen von Konstellationen eine Ratingliste zu erstellen.

Wahrscheinlich und das ist mir auch klar, spiele ich an einer Konstellation die für Naum sehr günstig ist. Das Naum 4.2 bei x64 und kürzeren Bedenkzeiten nach den vielen bisherigen Ergebnissen ca. 70-90 ELO hinter Rybka 3 x64 liegt ist auch mir klar und von daher gibt es für mich keinen Grund irgend etwas anzuzweifeln, weder die CEGT noch die IPON Liste. Ich glaube auch diesen Ergebnisse, weil für mich klar und eindeutig.

Zur Klarstellung!

Gruß
Frank
Parent - - By Frank Quisinsky Date 2010-03-31 12:26
Hi,

vergleichen wir mal CEGT mit SWCR:

CEGT 40/4

Deep Shredder 12 hat 3.001 im CEGT Blitz. Ingo und ich eichen bei Shredder 12 auf 2.800.
Ziehen wir also je 201 ELO ab.

Rybka 3 32Bit = 3.043 - 201 = 2.842 im 40/4 CEGT Blitz
Naum 4.1 32Bit = 2.983 - 201 = 2.782 im 40/4 CEGT Blitz

Zwischen den beiden liegen 60 ELO im Blitz, bei mir sind es gar 89 ELO im Blitz (CEGT hat mehr Partien, zugegeben im Blitz habe ich bei vielen Engines mit ca. 400 Partien zu wenige).

CEGT 40/20

Shredder 12 x64 (gibt keine ELO-Unterschiede zwischen x64 und w32 bei Shredder)
= 2.982

Ingo und ich eichen auf 2.800 also - 182 ELO.

Rybka 3 32Bit = 3.051 - 182 = 2.869 ... wird 12 ELO besser bewertet als in SWCR (2.857)
Naum 4.1 = 2.984 - 182 = 2.802 ... wird 5 ELO schlechter bewertet als in SWCR (2.807)

Also zunächst bleibt festzuhalten:
Es gibt kaum Unterschiede zwischen CEGT und SWCR
Klar, 40 in 20 ist wie 40 in 10 bei mir (wegen meinem Hardwarevorteil bzw. Eurer Berechnungsgrundlage).
Spiele mit Ponder, CEGT ohne.

Aber zwischen IPON und CEGT gibt es diese Unterschiede !!

Naum 4.1 x64 = 3.003 - 182 = 2.821 CEGT
Naum 4.1 x64 = 2.783

Der Unterschied zwischen CEGT und IPON liegt bei Naum 4.1 bei sage und schreibe 38 ELO !!!!!!!!!!!!

Und das versteht Ingo nicht.
Nein, er behauptet gar CEGT und IPON wären doch vergleichbar und ich sollte doch mal auf andere Listen schauen weil etwas mit SWCR nicht stimmt.
Wie irrsinnig!

Ich denke es liegt an den Bedingungen von Ingo.
Die kleinere Bedenkzeit und das Naum mit mehr Zeit zulegt.
Denn ich glaube nicht, dass die Ergebnisse von Ingo nicht stimmen. Das wäre ja völliger Quatsch.

Gruß
Frank
Parent - By Frank Quisinsky Date 2010-03-31 12:54
Kurz ...
Vergessen !!

Aber zwischen IPON und CEGT gibt es diese Unterschiede !!

Naum 4.1 x64 = 3.003 - 182 = 2.821 CEGT
Naum 4.1 x64 = 2.783 IPON

38 ELO Differenz und das nach tausenden von Partien ...
Zwischen IPON und CEGT

Soviel zum Thema tausende von Partien sind notwendig.

Frage:
Wie kann das sein?
Da bin ich mal auf eine Erklärung gespannt.

Ich schreibe das jetzt, weil Ingo mich aufgefordert hat, ich sollte erklären warum Naum bei mir abweicht.
Denke eher Ingo sollte das tun ... denn ich sehe bei der SWCR nichts was zu anderen Listen abweicht.

Zwischen IPON und SWCR sind lediglich Naum und Junior ein Thema.
Sonst ist ja dort alles reproduzierbar und gleich, trotz der unterschiedlichen Bedenkzeit.

Gruß
Frank
Parent - - By Wolfgang Battig Date 2010-03-31 13:06
[quote="Frank Quisinsky"]
....
Ich finde es schade wenn immer nur auf die eigenen Ergebnisse geschaut werden. Das was selbst ermittelt wurde ist das Maß aller Dinge. Nein, was selbst ermittelt wurde ist der Stand unter den eingesetzten Bedingungen und es gibt Millionen von Konstellationen eine Ratingliste zu erstellen.


richtig, aber dass man den eigenen Ergebnissen "mehr glaubt" als anderen ist auch klar - und menschlich! Dass heißt natürlich nicht, dass man andere Ergebnisse geringschätzen  sollte, was aber auch - glaube ich - keiner der Diskutanten hier tut.

Zitat:
Wahrscheinlich und das ist mir auch klar, spiele ich an einer Konstellation die für Naum sehr günstig ist.


möglich

Zitat:
Das Naum 4.2 bei x64 und kürzeren Bedenkzeiten nach den vielen bisherigen Ergebnissen ca. 70-90 ELO hinter Rybka 3 x64 liegt


nicht nur bei kürzeren Bedenkzeiten, zumindest bei uns! Da wird es ggfs. weniger als beim Blitz, aber es ist schon noch sehr deutlich

40/20:
Naum 4.2 x64 1CPU = 3032 aus 450 games (-67)
Rybka 3 x64 1CPU  = 3099 aus 1701 games


67 ELO ist m.E. immer noch deutlich, beim Blitz sind es 81.

Zitat:

ist auch mir klar und von daher gibt es für mich keinen Grund irgend etwas anzuzweifeln, weder die CEGT noch die IPON Liste. Ich glaube auch diesen Ergebnisse, weil für mich klar und eindeutig.


es wird immer wieder "Ungereimtheiten" geben, in ALLEN Listen! Bei Dir ist es jetzt (vielleicht) Naum 4.2, bei uns war es vor einiger Zeit der Unterschied zwischen Deep Shredder 12 64bit und 32bit, der nicht zu erklären war. Und - Zeit und Lust vorausgesetzt (beides bei mir nicht vorhanden) - könnte man sicher auch bei IPON was finden... .

Obwohl Ingos Liste aus meiner Sicht die am klarsten strukturierte ist (immer gleiche Testsuite z.B.). Ich bin aber auch ehrlich und sage: Das wäre mir zu langweilig, immer nur dieselben 50 Eröffnungen zu sehen und teste daher mit verschiedenen Suites und zusätzlich mit Büchern (Harry Schnapp z.B.), spiele Turniere usw. Dabei nehme ich gern in Kauf, dass man das als "Unsicherheitsfaktor" werten kann. Ich teste aber auch (und vor allem!) aus Spaß und nicht einer "Wahrheit" wegen, die wir ALLE vermutlich eh nie finden werden...

Und jetzt mein Lieblingssatz (mit dem du Ingo "auf die Palme" bringen kannst, weil er es wesentlich enger sieht ): Wichtig ist was hinten rauskommt!

In diesem Sinne
Wolfgang
Parent - - By Frank Quisinsky Date 2010-03-31 13:24
Hallo Wolfgang,

genau!
Es wird auch immer Ungereimtheiten geben. Und ganz ehrlich, es sind nur wenige zwischen den Listen sofern ich das alles verfolgt habe. Hier und dort mal ein Aussetzer. Vor ca. 5 Jahren klaffte das alles viel weiter auseinander. Erinnere mich noch an Gandalf 4.32g. Die Engine lag in meiner und auch in anderen Listen auf Platz 3-4 ... seinerzeit mit Junior um Platz 3 gespielt. In der Rochade zerrissen und in der SSDF um Platz 40. Enrique spiele ein großes Turnier und auch dort letzter. Wurde dann ca. 1 Jahr später in die Listen geschaut war Gandalf plötzlich da wo er wirklich stand. Zwischenzeitlich zwar auch nicht auf Platz 3-4 sondern auf 7-8 weil neue Engines kamen.

Dann gab es diesen CSS Redakteur, habe den Namen vergessen. Der glaube auch nicht das Gandalf 4.32g so stark ist. In Leiden im Hotelzimmer spielten wir dann auf meinen Dual Pentium III Partien: Fritz - Gandalf. So wir es es wollte, Bedenkzeit etc.. die Wette: Nach 20 Partien macht Gandalf keine 5 Punkte. Gandalf gewann nach 20 Partien mit 13:7 und auch die nächsten 20 Partien mit 11:9 ... sein Kommentar: OK, mag ja sein, aber dass muss ein anderer Gandalf sein oder der Winboard Adapter bevorzugt Gandalf ... sein zweiter Kommentar.

Leute glauben was sie glauben möchten.
Und von diesen Geschichten könnte ich wirklich x erzählen.

Später stellte sich heraus, dass Enrique eine schlechte Einstellung benutzte, obwohl darauf hingewiesen wurde. Das SSDF Ergebnis blieb schleierhaft.

Nun warten wir mal die Naum Ergebnisse ab.
Normal müsste Naum bei 2.835 landen. Das wäre ein Wert der vergleichbar mit anderen Werten wäre. Also ca. 15 ELO hinter Rybka 3. Wenn 2.835 erreicht wird, hätte sich Naum 4.2 zu 4.1 um 25 ELO und zu 4.0 um 50 ELO verbessert. Das stimmt auch mit den Ankündigungen und anderen Ergebnissen überein. Wenn Naum 4.2 auf Platz 1 landet, sehe ich selbst als Erklärung nur:

1. Statistischer Aussetzer nach 760 Partien
2. Die längere Bedenkzeit macht es
3. w32 besser als x64

Gruß
Frank
Parent - - By Kurt Utzinger Date 2010-03-31 14:00
Hallo Frank
Hallo Ingo

Wann dürfen wir mit der Herausgabe des Romans "Naum 4.1 marschiert einfach ... weiterhin auf Platz 1!"
rechnen und zwar in einer Form, so dass die geneigten Leser auch noch verstehen können, um was es
überhaupt geht und wie die endgültigen Schlussfolgerungen sind?               

Mfg
Kurt
Parent - By Werner Mueller Date 2010-03-31 14:10
[quote="Kurt Utzinger"]
Hallo Frank
Hallo Ingo

Wann dürfen wir mit der Herausgabe des Romans "Naum 4.1 marschiert einfach ... weiterhin auf Platz 1!"
rechnen und zwar in einer Form, so dass die geneigten Leser auch noch verstehen können, um was es
überhaupt geht und wie die endgültigen Schlussfolgerungen sind?               

Mfg
Kurt
[/quote]
Die Sache könnte ja vielleicht sogar spannend sein, wenn es wenigstens wirklich um Platz 1 ginge. 
Parent - By Peter Martan Date 2010-03-31 15:03
Parent - By Frank Quisinsky Date 2010-03-31 15:22
Hi Kurt,

na, es geht doch weiter
Ich schrieb doch heute morgen (neuer Thread), nun auf Platz 2

Die endgültigen Schlussfolgerungen sind:

- es gibt Ratinglisten
- die gibt es schon lange
- sehr lange
- und wird es sicherlich auch weiterhin geben



Gruß
Frank
Parent - By Udo Kaiser Date 2010-03-31 23:46
klar marschiert Naum auf Platz 1. Wenn man Firebird nicht mitspielen läßt.
So macht sich jeder seine eigene Erbsenzählerliste.
Das erinnert mich an die guten alten Zeiten der Schachcomputer wo
man es mit Stellungstests hatte. Da haben "Tester" gerne mal nachgefragt,
ob man nicht noch ne Stellung wüßte die NUR das Gerät A lösen könnte.
So konnte man sich eine Rangfolge durch Auswahl der Stellungen
selbst gestalten.

Wünsch dir was
Parent - - By Ingo Bauer Date 2010-03-31 15:45
Hallo

[quote="Wolfgang Battig"]
...

es wird immer wieder "Ungereimtheiten" geben, ... könnte man sicher auch bei IPON was finden... .
[/quote]

HA!

[quote="Wolfgang Battig"]

Obwohl Ingos Liste aus meiner Sicht die am klarsten strukturierte ist (immer gleiche Testsuite z.B.). Ich bin aber auch ehrlich und sage: Das wäre mir zu langweilig, immer nur dieselben 50 Eröffnungen zu sehen ...
[/quote]

Da muß ich dir sogar recht geben - aber meine Liste funktioniert sehr gut, so wie sie ist. Wenn man betrachtet aus welchen Gründen sie entstanden ist paßt Konzept und Resultat gut zusammen.
Wenn ich mal etwas "interessantes" sehen will lasse ich zwei Quads ein, zwei Spiele gegeneinander spielen. Zeitkontrolle so mittelmäßig (30 + 0). Kein Buch, sondern ne nette Eröffnungsstellung. So was ist in einer Stunde rum, ich selber kann noch nachdenken darüber ... und ein nettes Spiel ist das auch.

Gruß
Ingo
Parent - - By Wolfgang Battig Date 2010-03-31 16:57
[quote="Ingo Bauer"]
....
Da muß ich dir sogar recht geben - aber meine Liste funktioniert sehr gut, so wie sie ist. Wenn man betrachtet aus welchen Gründen sie entstanden ist paßt Konzept und Resultat gut zusammen.....
Gruß
Ingo
[/quote]

das (oben markierte) wollte ich auch nicht in Frage stellen. Da Du ja auch schonmal Beta-Versionen einer bestimmten Engine testest muss Deine Liste klarstmögliche Strukturen haben, sonst weiß man ja nie, worauf eine Spielstärkeänderung zurückzuführen ist. Zumindest bliebe eine gewisse Unsicherheit...

Bei einer Liste wie der von Frank, die ja regelmäßig in einer Schachzeitung erscheint, sieht das anders aus. Hier würde ich auch möglichst breit gestreute Bücher bevorzugen, denn das "normale" Schachleben spielt sich ja nicht innerhalb von nur 50 Eröffnungen ab.

Und wir? Tja, wir erscheinen nirgendwo und müssen auf keine Betatests Rücksicht nehmen. Daher können wir frei nach dem Motto: "jeder macht was er will, keiner macht was er soll aber alle machen mit" agieren und schauen "was hinten rauskommt"...

Und am Ende des Tages ähneln sich alle Listen - von Einzelfällen abgesehen - doch sehr und das trotz all der unterschiedlichen Konzepte, Bedenkzeiten, Hardware, Testsuites usw.

Gruß
Wolfgang
Parent - By Thomas Müller Date 2010-03-31 17:57
[quote="Wolfgang Battig"]
Und am Ende des Tages ähneln sich alle Listen - von Einzelfällen abgesehen - doch sehr und das trotz all der unterschiedlichen Konzepte, Bedenkzeiten, Hardware, Testsuites usw.
Gruß
Wolfgang
[/quote]

Danke!!
Das ist die Ranglistenweißheit des Jahrzehnts!

grüße thomas
Parent - - By Frank Quisinsky Date 2010-03-31 18:17
Hi Wolfgang,

genau, wobei ich noch Rücksicht auf 32-Bit nehmen muss.
64-Bit haben die wenigsten installiert, anders schaut es bei den Computerschächlern aus, die sicherlich schon zu 50% 64-Bit nutzen.

Das macht die Sache auch kompliziert, weil trotzdem hin- und wieder Fragen kommen, wie z. B welche Engines sich bei 64-Bit steigern. Hatte jetzt erst wieder Fernschachspieler die fragten. So habe ich dann auch auf die anderen Listen verwiesen, die ja mit der SWCR verlinkt sind bzw. natürlich auch auf den errechneten 64-Bit Zuwachs, der in den SWCR Tabellen steht. Das mit dem 64-Bit Zuwachs geht aus irgend einem Grund in den Tabellen bei der SCHACHWELT nicht gut genug hervor.

Würde ich jetzt nicht die Liste für die SCHACHWELT erstellen, würde es mich auch reizen verschiedene x64 Engines einzusetzen bzw. bei den kritischen (wo kaum Unterschiede ersichtlich sind) beide zu testen.

Zu dem Buch:
Da bin ich egoistisch, die gleichen Stellungen wären mir zu langweilig. Diese Meinung habe ich immer schon vertreten. Aber auch aus dem von Dir beschriebenen Grund. Es gibt viele, wirklich viele Downloads der SWCR Datenbank. Und wenn da immer nur die gleichen Eröffnungen vorkommen würde das sicherlich auch die Wenigsten interessieren.

Gruß
Frank

PS: So nun 10 ELO hinter Rybka 3 nach ca. 350 Partien.
Habe die Tabellen in den anderen Thread gesetzt.
Parent - - By Thomas Müller Date 2010-03-31 18:38
Hi frank,

eines muss ich jetzt aber noch los werden....
Auch an Ingo gerichtet.

Bei allem "disput" und unterschiedlicher auffassung den ihr zwei gerade habt, muss man euch beiden zugute halten, dass ich euch fair miteinander ausgetauscht habt!
Da ist kein böses Wort gefallen wie es bei dem einen oder anderen zeitgenossen evtl. passiert wäre.
Dafür mal ein danke, auch wenn der eine oder andere darüber schmunzelt oder total den überblick verloren hat

--
TM

PS:
aber übertreibt es nicht....der thread ist schon etwas lang
Parent - By Frank Quisinsky Date 2010-03-31 19:00
Hi,

warum auch nicht.
Meine, bin doch selbst ein Fan von IPON und schaue mir seine Liste gerne an.
Lese auch seine Beiträge gerne.

Und mal etwas zum Schmunzeln ist doch auch OK, gerade wenn es um Tabellen, Statistiken etc. geht.

Und da ich es nicht lassen kann ...
Warum er aber so deutlich andere Werte als CEGT bei Naum 4.1 hat ist und bleibt fraglich.
In CEGT spielt ja Naum 4.1 deutlich stärker als bei Ingo Naum 4.2.

Spreche jetzt bewusst nicht von der SWCR, werde mich hüten.

Gruß
Frank
Up Topic Hauptforen / CSS-Forum / Naum 4.2 marschiert einfach ... weiterhin auf Platz 1!
1 2 Previous Next  

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill