Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Vergleich IPON und *SBRL
- - By Gerhard Sonnabend Date 2010-01-02 12:14
Hi to all !

Hier mal ein Vergleich zwischen Ingos Liste und
meiner gerade erst gestarteten SBRL, siehe:
http://www.pcschach.de/Punkt2.htm

SBRL
Code:

Program                         Elo    +   -  Games
Rybka 3.0 x64 1CPU             2810   30  29    360
Stockfish 1.6 x64 1CPU         2716   28  28    360  -94
Deep Shredder 12 x64 1CPU      2676   28  28    360  -40
Naum 4.0 x64 1CPU              2639   28  28    360  -37
Fritz 12                       2620   29  29    360  -19
Doch 1.2 x64 1CPU              2596   30  31    360  -24


IPON
Code:

Program                         Elo    +   -  Games
Rybka 3 x64                    2923   12  12   2400
Stockfish 1.6 x64              2844   14  14   1500  -79
Deep Shredder 12 x64           2816   12  12   2200  -28
Naum 4 x64                     2783   10  10   2600  -33
Fritz 12                       2750   13  13   1500  -33
Doch64 1.2 JA x64              2724   13  13   1600  -26


Wenn man bedenkt, dass es doch einige Unterschiede gibt in
Bezug auf die Bedingungen (PB, Bedenkzeit, Anzahl der Vorgabe-
stellungen) und meine Liste erst ganz am Anfang steht, so ist
nicht nur die Übereinstimmung der Platzierungen sondern auch
die der Punktabstände fast schon beängstigend !

Weiteres folgt.

Viele Grüsse,
G.S.
Parent - - By Ingo Bauer Date 2010-01-02 12:40
Hallo Gerhard,

[quote="Gerhard Sonnabend"]
...

Wenn man bedenkt, dass es doch einige Unterschiede gibt in
Bezug auf die Bedingungen (PB, Bedenkzeit, Anzahl der Vorgabe-
stellungen) und meine Liste erst ganz am Anfang steht, so ist
nicht nur die Übereinstimmung der Platzierungen sondern auch
die der Punktabstände fast schon beängstigend !
..

[/quote]

Beängstigend finde ich das du das "beängstigend übereinstimmend" findest.

3 von 5 Abständen liegen ausserhalb eines meiner Errormargins. (um mal bei 95% zu bleiben die willkürlich ist). Und was die Reihenfolge betrifft: Wenn das nicht zufällig die Spitze, sondern das dichte Mittelfeld wäre, hätten wir komplett andere Reihenfolgen - und das ist alles wonach die meisten sehen!

Kurz: Jeder sieht was er will!

Gruß
Ingo
Parent - - By Gerhard Sonnabend Date 2010-01-02 12:50
Hi Ingo !

[quote="Ingo Bauer"]
Beängstigend finde ich das du das "beängstigend übereinstimmend" findest.
[/quote]

Deshalb ja der deutliche Hinweis, dass meine Liste gerade erst gestartet wurde.

[quote="Ingo Bauer"]
Wenn das nicht zufällig die Spitze, sondern das dichte Mittelfeld wäre, hätten wir komplett andere Reihenfolgen - und das ist alles wonach die meisten sehen!
[/quote]

Das bezweifel ich.
Die meisten schauen meiner Meinung nach lediglich auf die TOP-5.
Und, wer weis denn ob die "zufällige Reihung des Mittelfeldes" nicht
gerade in Deiner Liste total "falsch" ist ?
Ich würde mich nicht trauen so etwas zu behaupten !

Viele Grüsse,
G.S.
Parent - - By Ingo Bauer Date 2010-01-02 13:09
Nochmal Moin,

[quote="Gerhard Sonnabend"]
...

[quote="Ingo Bauer"]
Wenn das nicht zufällig die Spitze, sondern das dichte Mittelfeld wäre, hätten wir komplett andere Reihenfolgen - und das ist alles wonach die meisten sehen!
[/quote]
...
Und, wer weis denn ob die "zufällige Reihung des Mittelfeldes" nicht gerade in Deiner Liste total "falsch" ist? Ich würde mich nicht trauen so etwas zu behaupten !
...
[/quote]

Stimmt, mache ich auch nicht, meine Reihung ist richtig!

Im Ernst, wenn ich die Wahl zw. zwei Listen habe, von denen ich nicht 100% sagen kann welche stimmt, halte ich mich an die die näher an der Realität (Turniere, Online, eigenes Spiel ...) erstellt wurde. Wenn dann  eine der Listen realitästfern mit Ponder off erstellt wurde, und die andere realitätsnah mit Ponder ON halte ich mich im Zweifel an die P-ON Liste.
Das EINZIGE was für POFF spricht, abgesehen von historischen Gründen, ist die doppelte Anzahl an Spielen und damit eine höhere statistische Genauigkeit in der selben Zeit. Aber das hatten wir schon alles.

Gruß und frohes neues
Ingo
Parent - By Gerhard Sonnabend Date 2010-01-02 13:58
Hi Ingo !

[quote="Ingo Bauer"]
[...snip...]
Im Ernst, wenn ich die Wahl zw. zwei Listen habe, von denen ich nicht 100% sagen kann welche stimmt, halte ich mich an die die näher an der Realität (Turniere, Online, eigenes Spiel ...) erstellt wurde. Wenn dann  eine der Listen realitästfern mit Ponder off erstellt wurde, und die andere realitätsnah mit Ponder ON halte ich mich im Zweifel an die P-ON Liste.
Das EINZIGE was für POFF spricht, abgesehen von historischen Gründen, ist die doppelte Anzahl an Spielen und damit eine höhere statistische Genauigkeit in der selben Zeit. Aber das hatten wir schon alles.
[/quote]

Damit kann ich locker leben. Zwischenzeitlich kommt mir der Gedanke, dass ich
meine Liste als neuen und vor allem schnellen Gradmesser für Neuerscheinungen
nutzen kann und wohl auch werde.

Auch Dir ein frohes und vor allem gesundes Neues Jahr 2010.

Viele Grüsse,
G.S.
Parent - - By Clemens Keck Date 2010-01-02 18:58
Hallo Ihr zwei

ich glaune P-ON oder P-OFF macht keinerlei Unterschied in einer Liste. Lediglich die Qualität der Partien dürfte höher einzustufen sein.
Ich bin allerdings auch ein Freund des P-On Spieles. Irgendwie ist das "echter". Leider verbraucht das auch mehr Rechenpower.

MfG Clemens
Parent - By Frank Quisinsky Date 2010-01-02 19:15
Hi Clemens,

ich denke auch nicht das die Ergebnisse grob voneinander abweichen werden.

Wenn ich z. B. an die ATL denke (ca. 20.000 Partien umfassende Ratingliste an der ich vor ca. 3 Jahren gespielt hatte) gab es eine Engine die deutlich bei Ponder On und eine die deutlich bei Ponder = off besser war. Die Unterschiede liegen ca. bei +- 10 - maximal 15 ELO, kaum messbar.

Aber die Qualität ist, wie Du es geschrieben hast, besser.
Realitätsnäher und vor allem macht das auch mehr Spaß beim Zusehen.

Andere Bedinungen wie:

- Eröffnungsbuchfrage
- Größe der Hash-Tabellen,
- Nutzung von Endspieldatenbanken
- Nutzung welcher GUI
- Modus ... jeder gegen jeder x Partien oder wildes Testen ...
- Anzahl der Partien größer als 300, 500, 750, 1000 etc.
- Ponder
- verwendete Zeitkontrolle
etc..

sind dann eher Geschmacksache, aber sicherlich auch beeinträchtigend.

Hier geht es jetzt zunächst mal darum zu versuchen bei der ELO-Berechnung einen Standard zu finden.

Berechnung mit Bayes oder Elostat (beiden).
Berechnungsgrundlage: Engine x mit ELO x

Hätten wir diese gemeinsame Grundlage wäre es für den Leser einfacher zu vergleichen.

Dann wäre es optimal wenn sich die Betreiber gegenseitig verlinken bzw. einen Kreuzverbund bilden.
Würde Einheitlichkeit demonstrieren, etwas was meines Erachtens ein wenig verloren gegangen ist.

Gruß
Frank
Parent - - By Kurt Utzinger Date 2010-01-02 13:03
... bitte nicht streiten wegen dieser zwei Listen -

Kurt
Parent - By Ingo Bauer Date 2010-01-02 13:10 Edited 2010-01-02 13:19
Moin Kurt,

[quote="Kurt Utzinger"]
... bitte nicht streiten wegen dieser zwei Listen -

Kurt
[/quote]

Wir streiten nicht, wir haben einen gepflegten Disput - schon ewig und ohne Hoffnung den andern zu bekehren, aber mit Sitte und Anstand! Wir sind der lebende Beweis das man auch in einem Forum unterschiedlicher Meinung sein kann ohne unflätig zu werden.

Auch dir ein schönes neues Jahr
Ingo
Parent - - By Gerhard Sonnabend Date 2010-01-02 13:59
[quote="Kurt Utzinger"]
... bitte nicht streiten wegen dieser zwei Listen -

Kurt
[/quote]

Hi Kurt !

Frohes Neues Jahr 2010.

Frage:
wann und wo haben Ingo und ich gestritten ?

Viele Grüsse,
G.S.
Parent - - By Frank Quisinsky Date 2010-01-02 15:16
Hi Gerhard,

natürlich wäre es vorteilhaft wenn Du dich auch in die Diskussion der Beteiligung eines Standards zur Berechnungsgrundlage von Ratinglisten einklinken könntest bzw. auch dann bereit wärst Deine Liste einem evtl. festgelegten Standard anzupassen.

Gruß
Frank
Parent - - By Gerhard Sonnabend Date 2010-01-02 15:55
[quote="Frank Quisinsky"]
natürlich wäre es vorteilhaft wenn Du dich auch in die Diskussion der Beteiligung eines Standards zur Berechnungsgrundlage von Ratinglisten einklinken könntest bzw. auch dann bereit wärst Deine Liste einem evtl. festgelegten Standard anzupassen.
[/quote]

Hi Frank !

Weshalb ?
Zu faul zum (um)rechnen ?

Viele Grüsse + gutes Neues Jahr 2010,
G.S.
Parent - - By Ingo Bauer Date 2010-01-02 16:59
Hallo

[quote="Gerhard Sonnabend"]
...
Weshalb ?
...
[/quote]

Weil es einfacher für den unbedarften Reinseher ist ...

Gruß
Ingo
Parent - - By Gerhard Sonnabend Date 2010-01-02 17:05
[quote="Ingo Bauer"]
Weil es einfacher für den unbedarften Reinseher ist ...
[/quote]

O.K., was habt Ihr vor ?
War im Urlaub bis 28.12 und hab nicht viel verfolgen können.

Viele Grüsse,
G.S.
Parent - By Ingo Bauer Date 2010-01-02 17:16
Moin

Ich habe ne PM und Email rausgeschickt.

Gruß
Ingo
Parent - - By Gerhard Sonnabend Date 2010-01-02 15:54
Nun läuft gerade der Test mit Zappa Mexico II x64 1CPU

Erstes Resultat:
vs Naum 4.0 x64 1CPU  23.5-36.5 / -76 ELO

Sieht schon wieder ganz "normal" aus im Vergleich zu anderen Listen.

http://www.pcschach.de/Punkt2.htm

Viele Grüsse,
G.S.
Parent - By Gerhard Sonnabend Date 2010-01-03 16:46
Weitere Resultate von Zappa Mexico II x64 1CPU

Code:

vs Deep Shredder 12 x64 1CPU   21.0-39.0 / -108 ELO
vs Doch 1.2 x64 1CPU           23.0-37.0 / - 83 ELO
vs Fritz 12                    22.0-38.0 / - 95 ELO
vs Naum 4.0 x64 1CPU           23.5-36.5 / - 76 ELO

Nach wie vor alles im Lot !
Ich bin sehr überrascht, dass man mittels solch kurzer Bedenkzeiten
mittlerweile durchaus realistische Resultate produzieren kann !

http://www.pcschach.de/Punkt2.htm

Viele Grüsse,
G.S.
Up Topic Hauptforen / CSS-Forum / Vergleich IPON und *SBRL

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill