[quote="Thomas Mayer (Quark)"]
Hi Michael,
sinnvoll ! -> Du hattest übrigens recht, zumindest seit 1997 wurde nur einmal um 100 Elo reduziert.
Prinzipiell stimme ich mit Dir voll überein, man kann die Elo nicht vergleichen und deshalb wäre es besser, man würde von vorneherein einen anderen Wertebereich nehmen. Warum meinetwegen Shredder 12 nicht bei 0 setzen und alle anderen dazu relativ ?
Ein Beispiel, warum es nicht vergleichbar ist:
In den Computer-Ranglisten bekommt man bei Verdopplung der Geschwindigkeit ca. +50 - +70 Elo. Menschliche Spieler sehen aber in der Regel keinen derartigen Leistungssprung, die Engines fallen trotz doppelter Geschwindigkeit immer noch auf die selben Sachen herein, bewerten die selben Positionstypen falsch etc. - weil durch die doppelte Geschwindigkeit hat sich lediglich ihr taktisches Vermögen verbessert, positionell sind sie genauso blind. Das wirkt sich eben gegen Menschen ganz anders aus als gegen andere Computerprogramme.
Den von Ben Hur vorgeschlagenen Test von Smirf gegen den Superconny kann ich leider nicht machen, ich habe keinen. Wir wärs mit nem Mephisto Mondial 68000XL ? Der wird bei Schachcomputer.info mit ca. 1980 gelistet, in der SSDF taucht er leider nicht mehr, wäre wohl bei ca. 1880.
Gruß, Thomas
[/quote]
Du beschreibst das Grundproblem an der ganzen Sache, ich habe die Tage ähnlich argumentiert:
http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=43798Eine grundlegende Annahme der Eloschen Theorie ist die Transitivität der Spielstärke in der Form: ist A x:1-Favorit gegenüber B und B y:1-Favorit gegenüber C, so ist A xy:1-Favorit gegenüber C.
In der menschlichen Praxis ist dies nicht streng aber doch (Pi mal Daumen) hinreichend der Fall. Ähnliches gilt wohl für den Vergleich von Engines untereinander.
Bei einem Mix Menschen/Engines dürfte eine Transitivität in der o.a. Form nicht mehr hinreichend gewährleistet sein, und die (hypothetische) reguläre und intensive Teilnahme von Engines am menschlichen Spielbetrieb würde wahrscheinlich das ganze ELO- bzw. DWZ-System über den Haufen werfen.
Deshalb (wenn der Mix vom Grundsatz her schon in die Hose geht) muss man sich über eine bessere Vergleichbarkeit der Rating-Listen keine allzu großen Gedanken machen.