Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Neue Rangliste gestartet: ATOMICC
- - By Michael Scheidl Date 2012-03-23 07:21
Eine neue Enginerangliste ist im Entstehen, gestaltet von einem amerikanischen Hobbykollegen:

http://atomicc-testing.blogspot.com/p/rating-list.html

Mir gefällt der "radikale" Verzicht auf ein menschenähnliches Zahlenniveau. Stattdessen wird der Rückstand auf den Ranglistenersten dargestellt, was ungewöhnlich ist, da es zu negativen zwei- oder dreistelligen Wertungszahlen führt.

Die Testbedingungen:

http://atomicc-testing.blogspot.com/p/controls.html

Alles sozusagen ganz normal, inkl. des sich zunehmend durchsetzenden Ponder = on. Die Bedenkzeit ist wie bei der in Frieden ruhenden CSS-Rangliste 10m+10s. Der Tester Brent M. (im CCC zu finden) benutzt die Silver Openings Suite mit 50 Varianten, d.h. 100 Partien je Zweikampf. Derzeit ist noch nicht viel zu sehen, da erst vier Engines je zwei Matches ausgetragen haben.

Tbs. bis zu Fünfsteinern. Falls - was so genau nicht beschrieben ist - auch die Tablebaseunterstützung durch die Fritz-GUI eingeschaltet ist, könnte das eventuell Engines mit Endspielschwächen hin und wieder einen (halben) Punkt retten. Ob das zu einem meßbaren Unterschied im Vergleich mit anderen Ranglisten führt, bezweifle ich... Aber wer weiß. Einige starke Engines haben ja (noch) gar keinen eigenen Tbs.-Zugriff. Vermutlich spielt die Zeiteinteilung eine größere Rolle, d.h. Engines welche mit diesem im Vergleich zur Basiszeit etwas untypisch großen Inkrement besonders gut umgehen können, hätten - theoretisch - einen größeren Vorteil davon als sonst.

Es gibt also Möglichkeiten, etwaige Unterschiede zu Vergleichratings (womit ich nicht wirklich rechne) zu "interpretieren". Die tatsächliche Faktenlage könnte man dann jedoch anhand der downloadbaren Testpartien erforschen.
Parent - - By Werner Mueller Date 2012-03-23 08:23
[quote="Michael Scheidl"]
...
Alles sozusagen ganz normal, inkl. des sich zunehmend durchsetzenden Ponder = on. Die Bedenkzeit ist wie bei der in Frieden ruhenden CSS-Rangliste 10m+10s. Der Tester Brent M. (im CCC zu finden) benutzt die Silver Openings Suite mit 50 Varianten, d.h. 100 Partien je Zweikampf. Derzeit ist noch nicht viel zu sehen, da erst vier Engines je zwei Matches ausgetragen haben.
...
[/quote]
Ja, genial einfach und einfach genial.
Schlägt 3 Fliegen mit einer Klappe (ohne in der Substanz etwas zu ändern!).

1) Alle Listen wären (mit dieser Darstellung) unmittelbar vergleichbar.
2) Die mittlerweile ermüdende Frage nach der Vergleichbarkeit mit der menschlichen ELO-Zahl drängte sich nicht mehr auf.
3) Der Irrtum, dass es sich bei Computer-Ratingzahlen und menschlichen ELO-Zahlen um ein und dieselbe mathematische Größe handele, wäre nicht mehr ganz so naheliegend.

Die Seite ist erfrischend sachlich und einfach strukturiert, wirkt aber trotzdem (oder gerade deswegen) und zusammen mit dem ansprechenden Design professionell.
Das lässt auf ein ernsthaft gemeintes Projekt hoffen und bei einem etwas längerem Atem auf einen hohen Bekannheitsgrad bzw. Akzeptanz. Jedenfalls würde ich mir das im Sinne einer Propagierung o.a. Darstellung wünschen.
Parent - By Werner Mueller Date 2012-03-23 08:36
Habe die falsche Stelle zitiert, gemeint war:

[quote="Michael Scheidl"]
...
Mir gefällt der "radikale" Verzicht auf ein menschenähnliches Zahlenniveau. Stattdessen wird der Rückstand auf den Ranglistenersten dargestellt, was ungewöhnlich ist, da es zu negativen zwei- oder dreistelligen Wertungszahlen führt.
...
[/quote]
Parent - - By Michael Scheidl Date 2012-03-23 09:59
Zitat:
1) Alle Listen wären (mit dieser Darstellung) unmittelbar vergleichbar.
2) Die mittlerweile ermüdende Frage nach der Vergleichbarkeit mit der menschlichen ELO-Zahl drängte sich nicht mehr auf.
3) Der Irrtum, dass es sich bei Computer-Ratingzahlen und menschlichen ELO-Zahlen um ein und dieselbe mathematische Größe handele, wäre nicht mehr ganz so naheliegend.

Ganz genau! Ich hatte das aus diesen Gründen schon früher ein paar Mal befürwortet. Ich glaube, CCRL hat das anfangs so gemacht, sich später jedoch leider dem Mainstream gebeugt.

(1) hat allerdings zur Voraussetzung, daß exakt dieselbe Engine überall auf #1 liegt. Das könnte sich bald ändern und die Spitzenposition könnte zwischen mehreren nahezu gleichstarken Engines umstritten sein...

Ich prophezeie es nicht ausdrücklich aber ich rechne damit. MP-Komodo 4.x (angeblich auch "an sich" bereits wieder verstärkt) und Rybka 5 haben das Potential, Critter wohl auch. Nur um Stockfish mach ich mir Sorgen: Die Homepage ist noch da, aber der Blog ist schonmal dahin...
Parent - By Thomas Müller Date 2012-03-23 11:01
Hi,

ja mit Komodo 4.x & Critter (1.5) könnte es was werden.
R5 vielleicht, aber nur wenn er kommt.
Bei SF ist eigentlich schon länger stillstand finde ich.
Die diversen versionen die da auftauchen, sind vermutlich nur "settings"?
Am code selber macht doch keiner was oder?
Und deshalb kommt da auch nicht mehr dabei raus, als vielleicht +- 10 elos bei einigen "versionen"?!

gruß thomas
Parent - - By Benno Hartwig Date 2012-03-23 13:35
[quote="Werner Mueller"]1) Alle Listen wären (mit dieser Darstellung) unmittelbar vergleichbar.[/quote]Die Qualität der Vergleichbarkeit hängt aber ab von der Qualität der Einschätzung der (in allen Listen vertretenen) Spitzenreiterengine.
Wollte man die Vergleichbarkeit steigern, müsste wohl der Mittelwert aus einem bestimmten Satz von Engines angeglichen werden.

Benno
Parent - - By Werner Mueller Date 2012-03-23 14:29
[quote="Benno Hartwig"]
[quote="Werner Mueller"]1) Alle Listen wären (mit dieser Darstellung) unmittelbar vergleichbar.[/quote]Die Qualität der Vergleichbarkeit hängt aber ab von der Qualität der Einschätzung der (in allen Listen vertretenen) Spitzenreiterengine.
Wollte man die Vergleichbarkeit steigern, müsste wohl der Mittelwert aus einem bestimmten Satz von Engines angeglichen werden.

Benno
[/quote]
Der ganze Trick ist doch nur ein optischer (eine Verschiebung der Skala, alle Ratingzahlen werden um die der Spitzenengine verringert).

Und mit unmittelbarer Vergleichbarkeit meine ich diese Optik (der Mensch rechnet nicht gern Kopf, die heutige Jugend nimmt schon bei 3/4 einen Taschenrechner).

Was Du meinst, ist das Überstülpen von Dir wichtig erscheinenden Rahmenbedingungen. Das hätte bei dieser 'neuen' Art der Darstellung exakt so viel oder so wenig Sinn (um genau zu sein: exakt so wenig) wie bei der 'alten'
Parent - - By Benno Hartwig Date 2012-03-24 07:36
[quote="Werner Mueller"]Der ganze Trick ist doch nur ein optischer (eine Verschiebung der Skala, alle Ratingzahlen werden um die der Spitzenengine verringert).[/quote]Wobei sogar noch zu bedenken ist, dass die von dir genannten 'Ratingzahlen' letztlich nur aus einem einigermaßen willkürlichen Grundwert und den dann ermittelten Differenzen gebildet wurden!

Bei Ratings hatte man eigentlich nie etwas anderes als tatsächlich ermittelte ELO-Differenzen, und einen grob und mutig geschätzten Offset.

Benno
Parent - - By Werner Mueller Date 2012-03-24 08:28
[quote="Benno Hartwig"]
[quote="Werner Mueller"]Der ganze Trick ist doch nur ein optischer (eine Verschiebung der Skala, alle Ratingzahlen werden um die der Spitzenengine verringert).[/quote]Wobei sogar noch zu bedenken ist, dass die von dir genannten 'Ratingzahlen' letztlich nur aus einem einigermaßen willkürlichen Grundwert und den dann ermittelten Differenzen gebildet wurden!

Bei Ratings hatte man eigentlich nie etwas anderes als tatsächlich ermittelte ELO-Differenzen, und einen grob und mutig geschätzten Offset.

Benno
[/quote]
Natürlich, beim ELO- wie beim 'ELO'-System kommt es selbstredend (und nicht irgendwie letztlich oder eigentlich) ausschließlich auf die Differenzen an.
Und weil dies so ist, ist jedes gewählte Offset weder grob noch mutig geschätzt, sondern willkürlich - weil mathematisch gesehen beliebig.

Und wenn überhaupt ein Offset als am wenigsten willkürlich betrachtet werden kann, dann ist es das Offset an der Spitze. Weil dann hinter jeder Engine in der Liste sozusagen im Klartext der Abstand zur Spitze steht - und keine Rechenaufgabe.
Parent - - By Benno Hartwig Date 2012-03-24 09:59
[quote="Werner Mueller"]Und wenn überhaupt ein Offset als am wenigsten willkürlich betrachtet werden kann, dann ist es das Offset an der Spitze. Weil dann hinter jeder Engine in der Liste sozusagen im Klartext der Abstand zur Spitze steht - und keine Rechenaufgabe.[/quote]Spätestens wenn du verschiedene Progamme an der Spitze hast, wird die Willkür offensichtlich.
Für die Vergleichbarkeit wäre sicher sehr viel besser, du würdest über alle in 2 Listen gemeinsam vorhandenen Engines den Ausgleich suchen, z.B. mit Überlegungen gemäß http://de.wikipedia.org/wiki/Kleinste_Quadrate.

Benno
Parent - - By Michael Scheidl Date 2012-03-24 11:04
Es gibt doch nicht nur zwei Listen... Außerdem ändern sich alle ständig. Wer soll da jedesmal solche Analysen anstellen? Es ist eine Lösung wünschenswert die dem "gemeinen Computerschachfan" augenblickliche problemlose Vergleiche ermöglicht, ohne einen Doktorgrad in Mathematik zu benötigen.

Das einzige Problem der Atomicc-Methode ist hierbei, daß auf verschiedenen Listen verschiedene Spitzenreiter auftauchen könnten. Ansonsten ist das genial, weil einfach.

Ich glaube jedoch, daß dieses Problem ignoriert werden kann, denn man wird vielleicht antreffen daß auf Liste X Engine A bei 0 und Engine B bei -30 liegt, und auf Liste Y umgekehrt. Das ist "verkraftbar"...
Parent - By Ingo Bauer Date 2012-03-24 11:30
Moin,

[quote="Michael Scheidl"]
Es gibt doch nicht nur zwei Listen... Außerdem ändern sich alle ständig. Wer soll da jedesmal solche Analysen anstellen? Es ist eine Lösung wünschenswert die dem "gemeinen Computerschachfan" augenblickliche problemlose Vergleiche ermöglicht, ohne einen Doktorgrad in Mathematik zu benötigen.

Das einzige Problem der Atomicc-Methode ist hierbei, daß auf verschiedenen Listen verschiedene Spitzenreiter auftauchen könnten. Ansonsten ist das genial, weil einfach.

Ich glaube jedoch, daß dieses Problem ignoriert werden kann, denn man wird vielleicht antreffen daß auf Liste X Engine A bei 0 und Engine B bei -30 liegt, und auf Liste Y umgekehrt. Das ist "verkraftbar"...
[/quote]

Als ich damals ein Startrating gesucht habe, habe ich mit Absicht den hier beschriebenen Ansatz verworfen um unnötiger Fragerei aus dem Weg zu gehen. Jetzt, ein paar Jahre später, sehe ich, das man, egal mit welchem Ansatz, unnötige Fragen bekommt. Auch wenn alle Informationen deutlich auf der Webseite stehen kommen Fragen nach dem Motto "Warum so und nicht anders". Kurz: Der "gemeine Computerschachfan" liest nicht was auf einer Webseite als Erklärung steht (egal ob mit oder ohne Mathematik). Der Informierte, also teilweise diejenigen die hier lesen, ist durchaus in der Lage ein 0, 2800, 3200 oder sonst ein Rating im Kontext, also auch in der nicht vorhandenen Vergleichbarkeit zum menschlichen Rating, zu lesen, verstehen und einzuordnen. Insofern halte ich die Diskussion welches Rating denn richtig sei für müssig. Die "0" der AtomiCC Liste ist allerdings auch mutig, weil der Macher immer wieder viele Fragen beantworten werden muß ...

Ansonsten freue ich mich über die Liste, sehr systematisch. Einziges kleines Manko das ich finden kann sind die 5 Steiner von einer Platte. Da beharken sich evtl. mehrere Engines um Zugriffsrechte. 4 Steiner hätten gelangt, die stehn nach kurzer Zeit komplett im Speicher und arbeiten dann, was Zugriffszeiten betrifft wie Bitbases. Allerdings sollte man da die Kirche im Dorf lassen, ob wir hier um 2, 3, oder vielleicht 5 Elo sprechen weiß kein Mensch.
Da immer mehr Listen etwas "iponesk" werden, wird meine Liste immer überflüssiger. Gut so!

Gruß
Ingo
Parent - By Benno Hartwig Date 2012-03-24 10:07
[quote="Werner Mueller"]Natürlich, beim ELO- wie beim 'ELO'-System kommt es selbstredend (und nicht irgendwie letztlich oder eigentlich) ausschließlich auf die Differenzen an.[/quote]Die real existierenden menschlichen-ELO-Listen haben dem aber eine Instanzierung verpasst, die Realität ist. "Der Mensch hat 2800 ELO" ist inzwischen eine gut verstehbare Aussage, du bist nicht mehr darauf angewisen, dich mit Bemerkungen "A hat 100 ELO mehr als B" zu begnügen.
OK, dass amerikanische und europäische Werte mit Vorsicht zu vergleichen sind, weiß ich wohl.
Benno
Parent - By Thorsten Czub Date 2012-03-23 08:30
sehr schön.
Parent - - By Thomas Müller Date 2012-03-23 11:06
Hallo,

generell finde ich es gut wenn sich jemand die mühe macht was zu eigenes zu erstellen.
Allerdings glaube ich nicht, dass bei dieser liste was anderes (reihenflolge) rauskommt als bei den bisherigen.
Die 4 die gelistet sind, ist genau die reihenfolge die schon bekannt ist.
Aber gut...schauen wir mal wie das wächst

gruß thomas
Parent - By Wolfgang Battig Date 2012-03-23 14:02
[quote="Thomas Müller"]
Hallo,

generell finde ich es gut wenn sich jemand die mühe macht was zu eigenes zu erstellen.


keine Frage!

Zitat:
Allerdings glaube ich nicht, dass bei dieser liste was anderes (reihenflolge) rauskommt als bei den bisherigen.


wie auch?

Bedenkzeit: normal
Hardware: normal
Vorgaben: normal (Silver Suite ist klasse, nutze ich auch sehr häufig)
Bedingungen: normal
.....
logische Konsequenz => Reihenfolge: normal 

Trotzdem: weiter so!
Up Topic Hauptforen / CSS-Forum / Neue Rangliste gestartet: ATOMICC

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill