Stefan Pohl schrieb:
...das bisherige Ergebnis von Gull gegen die besten 6 Gegner (zwischen 6 und 7 klafft ja eine große Elolücke (Rybka/Fritz) erheblich besser ist, als gegen die schwächsten 6 Gegner (Performance gegen Top6: 3085 bzw. 3065 (worst6)). ...
Wie hast du das den ausgerechnet? Den schon mehrere Male ausdiskutierten Anfängerfehler die individuellen Performances gegen die 6 Gegner zu addieren und durch 6 zu teilen kann ich mir bei jemandem der meint Ergebnisse auf 5 Elo genau haben zu müssen, kaum vorstellen (das das für die besten 6 auch 3085 ergibt ist Zufall)!
Korrekt wäre die Punkte der besten 6 und Ihre Durchschnittselo zu errechnen und das ganze dann nochmal für die letzten sechs.
Jetzt aktuell nach 1773 Spielen würde das so aussehen:
Durchschnittselo der besten 6 = 3029 Elo
440/759 oder 57%
57% gegen 3029Elo ist ein Rating von 3077
Durchschnittselo der schlechten 6 = 2823 Elo
605,5/760 oder 80%
80% gegen 2823 Elo ist ein Rating von 3063
Das sind gerade mal 14 Elo Unterschied*, von einem Ergebniss das "erheblich besser" kann man da, wie bissher immer, nicht sprechen!
Sorry wenn ich das hier NOCHMAL wiederhole! Ich muß dir nicht sagen welche Errorbar bei 760 Spielen vorliegt und ich weiß, dass du das alles selbst weißt - mache ich nur damit nicht andere den Fehler machen.
Das könnten wir aber als Bsp nehmen, falls jemand mal wieder meint, das irgeneine nennenswerte Verzerrung stattfände, falls Engine gegen 300 Elo schwächere getestet würde.
Ingo
*Am Ende werden sich die Ratings der Gegner natürlich auch nochmal ändern und die "Onlineberechnung" ist Eloformel mit einem Bayeselorating als Start, da kommt auch nochmal eine Korrektur drauf. Genau so wie meine Berechnung einfache Eloformel war und ohne den Bayesschen Schnickschnack auskommen muß.
Dieses Rating aus dem laufenden Turnir ist immer nur ein Fingerzeig wo es hingeht. Man sollte das nicht so ernst nehmen ehe es zu Ende ist und nur mit den endgültigen Werten rechnen ...