Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Shredder XP in meinem Test
- - By Ingo Bauer Date 2009-06-11 14:44 Edited 2009-06-11 14:46
Hallo,

Ich habe mal den aktuellen 64 bit Onno gegen meinen aktuellen Shredder XP laufen lassen. Die Bedinungen sind weiter unten hinlänglich erklärt:

DS XP x64 1T  : Onno-1-0-0 x64          : 100 (+ 52,= 39,-  9),

Natürlich nur 100 Spiele, also völlig OHNE jeden statistische Aussagekraft und Belang und selbstverständlich ohne irgendwelche Settings mit "sag ich nicht" Faktor - also alles default! Jeder der versucht aus nur 100 Spielen irgendetwas herrauszulesen muß sich leider täuschen!

Freundlichst Grüßend
Ingo

PS: Nur um das nochmal klar zu stellen, ich habe nichts gegen Onno, ganz im Gegenteil!
Parent - - By Eduard Nemeth Date 2009-06-11 14:55 Edited 2009-06-11 15:01
Vielen Dank!

Nun bin ich sehr gespannt darauf, was der neue Shredder auf Schach.de zu leisten vermag! Ich bin sicher, dass es dort zu Duellen Onno vs. Shredder 12 kommen wird, und dann werden wir ja sehen ob Shredder 12 dort (und live) im Blitz (3+0 und 5+0) ebenso hoch gewinnen wird? 

Noch interessanter wird es werden, wenn Onno auch als MP auf Schach.de blitzen wird können, und noch interessanter wird es sein wenn Onno auch die EGTB's wird nutzen können.

Meine Prognose: Es steht uns ein spannender Herbst 2009 & Frühjahr 2010 bevor! 

MfG.
Eduard.
Parent - By Ingo Bauer Date 2009-06-11 19:31
Hallo Ede

[quote="Eduard Nemeth"]
Vielen Dank!

Nun bin ich sehr gespannt darauf, was der neue Shredder auf Schach.de zu leisten vermag! Ich bin sicher, dass es dort zu Duellen Onno vs. Shredder 12 kommen wird, und dann werden wir ja sehen ob Shredder 12 dort (und live) im Blitz (3+0 und 5+0) ebenso hoch gewinnen wird? 

...
[/quote]

Ja, wenn dich interessiert wie sich Shredder XP auf Playchess bei 3+0 schlägt schau dir doch mal "Comp Shredder" an!

Gruß
Ingo
Parent - - By Gerhard Sonnabend Date 2009-06-11 15:08
Hi Ingo !

[quote="Ingo Bauer"]
Ich habe mal den aktuellen 64 bit Onno gegen meinen aktuellen Shredder XP laufen lassen.
Die Bedinungen sind weiter unten hinlänglich erklärt:

DS XP x64 1T  : Onno-1-0-0 x64          : 100 (+ 52,= 39,-  9),

Natürlich nur 100 Spiele, also völlig OHNE jeden statistische Aussagekraft und Belang und
selbstverständlich ohne irgendwelche Settings mit "sag ich nicht" Faktor - also alles
default! Jeder der versucht aus nur 100 Spielen irgendetwas herrauszulesen muß
sich leider täuschen!
[/quote]

Uuups, + 160, also knapp 100 Punkte hinter R3x64.
Aber, "Jeder der versucht aus nur 100 Spielen irgendetwas herrauszulesen muß
sich leider täuschen."

Wie soll/muss ich das auffassen ?
Gute oder schlechte Performance in diesem Fall (Match) ?

Viele Grüsse,
G.S.
Parent - - By Ingo Bauer Date 2009-06-11 15:25
Moin Gerhard

[quote="Gerhard Sonnabend"]

Uuups, + 160, also knapp 100 Punkte hinter R3x64.

Gute oder schlechte Performance in diesem Fall (Match) ?

[/quote]

Versuchst du etwas aus 100 Spielen etwas herrauszulesen
Wenn ich verraten würde ob die Performance gut oder schlecht war würde ich mehr verraten als ich dürfte. Aber dir brauche ich nicht sagen das sich Engines gegen verschiedene Gegner unterschiedlich verhalten.

Noch ein bischen Geduld, sooo lange dauert es nicht mehr!

Gruß
Ingo
Parent - - By Gerhard Sonnabend Date 2009-06-11 15:30
Hi Ingo !

[quote="Ingo Bauer"]
Versuchst du etwas aus 100 Spielen etwas herrauszulesen
[/quote]

Nein, natürlich nicht !

[quote="Ingo Bauer"]
Wenn ich verraten würde ob die Performance gut oder schlecht war würde ich mehr
verraten als ich dürfte.
[/quote]

Schade, den Versuch war es wert
Ich tippe trotzdem mal auf "eher durchschnittlich" in Bezug aufs o.g. Match.

Viele Grüsse,
G.S.
Parent - - By Ingo Bauer Date 2009-06-11 15:42
Moin

[quote="Gerhard Sonnabend"]
...

Schade, den Versuch war es wert
Ich tippe trotzdem mal auf "eher durchschnittlich" in Bezug aufs o.g. Match.

[/quote]

Versuchen geht immer !

Aber ich bemerke noch etwas. Wenn ich dir sage es war überdurchschnittlich, dann würde dir das auch nichts nutzen weil es ja sein könnte das ich NUR gegen bessere Engines getestet haben. Das selbe gilt umgekehrt oder die Aussage "Durchschnitt". Sprich der reine Prozentsatz ist völlig wertlos. Ohne das Gesamtbild, also den Durchschnitt der getesteten Enignes ist das singuläre Ergebniss nichtssagend.

Gruß
Ingo
Parent - - By Gerhard Sonnabend Date 2009-06-11 15:52
[quote="Ingo Bauer"]
Aber ich bemerke noch etwas. Wenn ich dir sage es war überdurchschnittlich, dann würde dir das auch nichts nutzen weil es ja sein könnte das ich NUR gegen bessere Engines getestet haben. Das selbe gilt umgekehrt oder die Aussage "Durchschnitt". Sprich der reine Prozentsatz ist völlig wertlos. Ohne das Gesamtbild, also den Durchschnitt der getesteten Enignes ist das singuläre Ergebniss nichtssagend.
[/quote]

Hi Ingo !

Nun, meiner Erfahrung nach ist es vollkommen gleichgültig,
ob die Performance gegen gleichgute, schlechtere oder
u.U. bessere Gegner erzielt wird, so lange es denn in einem
vernünftigen Rahmen bleibt (Elo-Unterschied +- 250, mind.
50-100 Games pro Match).
Ich habe dies schon zigmal aufgezeigt und auch fast alle
anderen Tester kommen immer wieder zu diesem Schluss:
"das ELO-System funktioniert am besten bei Schachengines".

Viele Grüsse,
G.S.
Parent - - By Ingo Bauer Date 2009-06-11 16:50
Hi

[quote="Gerhard Sonnabend"]

Hi Ingo !

Nun, meiner Erfahrung nach ist es vollkommen gleichgültig,
ob die Performance gegen gleichgute, schlechtere oder
u.U. bessere Gegner erzielt wird, so lange es denn in einem
vernünftigen Rahmen bleibt (Elo-Unterschied +- 250, mind.
50-100 Games pro Match).
Ich habe dies schon zigmal aufgezeigt und auch fast alle
anderen Tester kommen immer wieder zu diesem Schluss:
"das ELO-System funktioniert am besten bei Schachengines".

Viele Grüsse,
G.S.
[/quote]

Ahh, Sorry, da haben wir aneinandervorbeigeredet. Ich sprach von der Prozentualen Perfomance (Im obigen Fall also 71% von Shredder), du sprichst von der Eloperformance. Das sind 2 paar Schuhe und auch ich schließe mich an, das Elosystem funktioniert hervoragend für Engines (im Schnitt, es gibt immer mal einzelne Ausreißer)

Gruß
Ingo
Parent - - By Roland Rösler Date 2009-06-11 17:31
Naja, 71,5% gegen Onno (Elo 2584) bedeuten für S12 Elo 2744 (2584+160) nach 100 Spielen!
Das hat zwar wenig Aussagekraft, aber besser als nichts! Und mehr gibst Du uns ja wohl auch nicht.

   Program                          Elo    +   -   Games   Score   Av.Op.  Draws

1  Rybka 3 1T                     : 2831   11  11  3200    76.9 %   2622   31.0 %
2  Rybka 3 1T 32-bit              : 2772   19  19  1000    73.6 %   2594   31.4 %
3  Rybka 2.3.2a mp 1T             : 2720    6   6  7900    63.8 %   2622   38.7 %
4  Naum 4                         : 2700    7   7  5000    56.2 %   2657   39.9 %
5  Rybka 2.2n2 mp 1T              : 2682   10  10  2600    59.2 %   2618   41.4 %
6  Rybka 1.2f                     : 2670    6   6  8000    64.1 %   2569   33.8 %
7  Deep Fritz 11                  : 2638   14  14  1500    55.9 %   2597   38.6 %
8  Shredder Bonn 1T               : 2622   10  10  2900    50.6 %   2618   40.2 %
9  Zappa Mexico II x64 1T         : 2620    6   6  7700    46.9 %   2642   40.4 %
10 Deep Shredder 11 x64 1T        : 2600    9   9  3400    52.1 %   2586   39.6 %
11 Strelka 2.0 B x64              : 2598   16  16  1000    52.8 %   2579   43.5 %
12 Rybka 1.0 Beta x64             : 2596   11  11  2500    53.2 %   2574   36.3 %
13 Zappa Mexico X64 Final         : 2592    9   9  3600    53.2 %   2569   40.4 %
14 Naum 3.1 1T                    : 2590    7   7  5600    47.8 %   2606   38.9 %
15 Onno-1-0-0 x64                 : 2584   17  17  1000    50.1 %   2583   41.3 %
Parent - - By Ingo Bauer Date 2009-06-11 18:05
Hallo Roland,

Da schreibe ich extra das keine Schlüsse gezogen werden sollen  ...

Wie war nochmal die 95% Abweichung bei 100 Spielen?

Gruß
Ingo
Parent - - By Ernest Bonnem Date 2009-06-11 22:42
[quote="Ingo Bauer"]Wie war nochmal die 95% Abweichung bei 100 Spielen? [/quote]

Also DS XP x64 1T  : Onno-1-0-0 x64          : 100 (+ 52,= 39,-  9),  71.5% und +162 Elo für Shredder

Standard deviation = sqrt ( (52+9)/4 ) = 3.9

95% Abweichung = 2 Standard deviation = 7.8
==> zwischen 71.5-7.8 (= 63.7%) und 71.5+7.8 (= 79.3%) für Shredder.

Das heißt zwischen +100 Elo und +233 Elo für Shredder / Onno
... und Onno selbst ist 2584 (+-17)

Mit 95% Sicherheit kann man also sagen, daß der neue Shredder zwischen 2685 Elo und 2818 liegt. 
Parent - - By Ingo Bauer Date 2009-06-11 22:55
Hallo Ernest,

endlich jemand mit Ahnung!

[quote="Ernest Bonnem"]
[quote="Ingo Bauer"]Wie war nochmal die 95% Abweichung bei 100 Spielen? [/quote]

Also DS XP x64 1T  : Onno-1-0-0 x64          : 100 (+ 52,= 39,-  9),  71.5% und +162 Elo für Shredder

Standard deviation = sqrt ( (52+9)/4 ) = 3.9

95% Abweichung = 2 Standard deviation = 7.8
==> zwischen 71.5-7.8 (= 63.7%) und 71.5+7.8 (= 79.3%) für Shredder.

Das heißt zwischen +100 Elo und +233 Elo für Shredder / Onno
... und Onno selbst ist 2584 (+-17)

Mit 95% Sicherheit kann man also sagen, daß der neue Shredder zwischen 2685 Elo und 2818 liegt. 
[/quote]

Alles verstanden! Jetzt könnte also Onno noch schwanken und wir hätten (2584-17+100) 2667 als Minimum und (2584+17+233) 2835 als Maximum für Shredder?

Oh je Oh je, wie wäre das erst bei 20 Spielen!?

Gruß und nochmal Danke
Ingo
Parent - By Roland Rösler Date 2009-06-14 21:01
Naja, +100 Elo zu Shredder 11 (2600) bzw. Shredder Bonn (2622) scheinen mir für Shredder 12 in deiner Liste jetzt nicht mehr unrealistisch. Somit sollte zumindest Augenhöhe mit Naum 4 möglich sein. Und das wäre ein phantastisches Ergebnis!
Parent - By emilo reggio Date 2009-06-12 11:06
Wie ist denn die 99% Abweichung bei 100 Spielen?

oder kann man das nicht berechnen? ist doch besser als 95% abweichung.

Up Topic Hauptforen / CSS-Forum / Shredder XP in meinem Test

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill