[quote="Benno Hartwig"]
Wieviel ELO-Differenz entsteht denn tatsächlich durch solch eine Hardwareüberlegenheit?
[/quote]
Da muss ich dich dann aber doch mal wieder an die Überlegungen, die du selber so gern zu den Elo- Messungen an und für sich angestellt hast, erinnern, Benno.
Kannst du derlei, (je nach Teilnehmerfeld
) noch für ansonsten genau definierte aber auch randomisierte Testbedingunen mit großen Zahlen berechnen, gelingt dir das mit einigen wenigen Partien (z.B. am server) sicher absolut nicht mehr so, dass es über das momentan gerade dort spielende Kollektiv hinaus irgend eine Vergleichbarkeit hätte, übrigens genau so, wie bei allen anderen Testbedingungen.
Hier hast du die wirkliche Schwäche, eigentlich aber Stärke des Elo- Systems.
Das war und ist nicht dazu da, statistisch exakte Aussagen über 1000- Partien- Matches zwischen immer genau denselben Gegnern in exakt reproduzierbarer Anordnung zu messen, dazu wird es nur missbräuchlich verwendet, um die Elosion der längst völlig absurden Vergleiche mit menschlichen Elo mit Gewalt am Leben zu erhalten.
Wenn wir uns davon nicht endlich verabschieden, wird es genau das sein, was uns auf den Kopf fällt, weil die Weiterentwicklung von engines, die in diesem Maßstab demnächst völlig unkontrollierbar werden, keine Entwicklungskontrolle mehr abgibt.
Das muss offenbar von mir immer weiter gebetsmühlenartig repetiert werden, bevor auch nur irgendjemand anfängt, da mal nicht mehr krampfhaft wegzuschauen.
Elo ist eine Näherungsgleichung, die Werte gehen asymptotisch gegen einen theoretischen Maximalwert, wo der ist, richtet sich danach, wo man die Ausgangswerte ansetzt.
Eicht man ständig nach unten nach, damit die Werte oben nicht astronomisch werden, muss man sich nicht wundern, wenn die fortschreitende Spielstärke oben immer mehr in den praktisch unerreichbaren Bereich, der theoretisch nur in der Unendlichkeit erreicht wird, geht, sich also zusehends praktisch nicht mehr ausdrückt.
Das muss gar nicht hauptsächlich an der wahrscheinlich irgendwann auch gegen 100% gehenden Remishäufigkeit liegen (die kommt noch dazu, wenn man weiter in erster Linie Grundstellungsspezialisten unter den engines selektiert, in dem man sie ausschließlich an grundstellungsnahen Teststellungen gegeneinander spielen lässt!), das kommt aber sicher auch immer mehr dazu.
Ich kann wirklich nicht sagen, was mehr schuld ist:
1.Das krampfhafte willkürliche Selektieren von gerade noch irgendwie ausreichend ähnlich und ausreichend unählich starken engines als Kollektiv, damit nicht schon das die Werte völlig uninteressant macht. Einfachstes Beispiel hatte wir auch schon oft genug, eigentlich interessieren nur die ersten 5, gerade die liegen aber mittlerweile so knapp beieinander, dass nur die gegeneinander antreten zu lassen, was logischer Weise der direkte Weg wäre, genau die gegeneinander zu messen, schon kein Mensch mehr veröffentlicht, weil es die breiter gestreut gemessen Werte ad absurdum führt, auch etwas, was am server usus ist, in Ranglisten absolut pfui.
2. Das krampfhafte, auch wieder um vergleichbar zu bleiben, natürlich auch notgedrungene Festhalten an den 5-8 Zügen-Eröffungsstellungen.
Je schneller die engines über 8 Züge wegprunen, desto für sie alle, die das alle gleich machen, praktisch näher der Grundstellung beginnen sie ihre eigenen Eröffnungen zu berechnen.
Als 16 Halbzüge noch eine Welt voller Wunder für engines waren, war das etwas anderes, als jetzt, wo die bitboard- Früchtchen 15 Hz in 5 Sekunden im Arbeitsspeicher haben, nämlich das, was sie alle nur daran interessiert, beginnen sie wirklich verschieden zu rechnen praktisch einfach um diese 5 Sekunden später mit ihrem Match.
3. Das zwanghafte Festhalten an der Eloformel, warum die für sowas absolut nicht von Arpad erdacht wurde, siehst du an diesem unserem momentanen Streit zwischen den Ranglisten- und den Serverfans wieder einmal perfekt:
Geh her und lass einzelne engines in einzelnen Begegungen, wie das ja am server gemacht wird, ihre Elo gewinnen und verlieren, noch krasser: mach ein Turnier, wie darum gerade zwischen ICGA und CSVN gerungen wird, oder mach 2 oder mehrere, wie es wohl mehr und mehr werden wird.
Je weniger Partien du hast, desto mehr zählt natürlich auch die Bedenkzeit und die hardware,
vor Allem aber das Buch!Dass du das wegrechnen kannst, wenn alle dasselbe kurze haben, wissen wir, dass das im wahrsten Sinn des Wortes
zu Buche schlägt, siehst du, wenn du ein Turnier mit wenigen Partien von engines mit eigens für das Turnier editierten Büchern machst.
So gesehen haben natürlich wieder beide Seiten völlig recht, das Buch zählt Schachmacht bis Schachmatt im Turnier, nur weil da die Buchspezialisten alle ähnlich was draufhaben und die Bücher für den auch bekannten Gegner alle ziemlich ausgefuchst sind, (werden ja auch ständig gegen die anders derartig erstellten Bücher aktualisiert) lässt es sich auch nur schwer damit so durchkommen, wie's ginge, wenn nur ein Buchmacher gegen lauter Buchschwächler anträte.
Die andere Seite der Ranglistenlister hat natürlich infolgedessen auch völlig recht, dass objektivierbare Vergleiche für Ranglisten so genau nicht gemacht werden.
Was war noch gleich deine Frage?
Wieviel ELO-Differenz entsteht denn tatsächlich durch solch eine Hardwareüberlegenheit?
Das kommt auf's Buch an, Benno.
Übrigens bei Menschen auch, da ist die "hardware" Hirn sicher auch sehr verschieden, was aber schon drin ist und nicht mehr extra berechnet werden muss, macht ab einer gewissen Klasse, fürchte ich, auch den größeren Unterschied.
Vor Allem aber bei engines: ich kann nicht verstehen, dass du, nach Allem, was wir da schon hatten, danach fragst, was an Elo hinten herauskommt, wenn man am server einzelne Partien spielt, das siehts du doch ohnehin dort, am server kannst du das nach jeder einzelnen Partie neu ablesen.
Hast du noch Fragen zu Elo? Ich sage jedenfalls für sowas waren sie noch eher gedacht, als für Ranglisten, Sinn haben sie dort auch mehr, sie zeigen, wer, dem es in erster Linie darauf ankommt, unter den dort herrschenden Bedingungen zu gewinnen, wieviel von den dort gültigen Elo gewonnen hat, ungeachtet der Frage, wie oft und gegen wen musste der dazu spielen.
Kurzum daher noch mal: Elo brauchen jeweils ihr eigenes geschlossenes System zur Vergleichbarkeit.
Als alleinige Entwicklungskontrolle der software- Programmierung sind sie daher weniger und weniger verwendbar.