Dein Wort in Ottos Gehörgang
Noch so ein ErrBar Verfechter.
Mit dieser fehlerhaften Ausgabe hat sich die Community keinen Gefallen getan.
Auch für Dich:
Egal wie viele Gegner z. B. 4.000 Partien produziert haben, die ErrorBar ist immer +-10 bei ca. 4.000 Partien und das ist nicht korrekt.
Je mehr Gegner, desto kleiner muss die ErrorBar bei gleicher Anzahl an Partien sein.
Dem ist nicht so und mithin schlecht um Dinge zu vergleichen.
Liste A hat 1.000 Partien und benutzte 10 Engines
Liste B hat 1.000 Partien und benutzte 20 Engines.
Sonst gleiche Bedingungen aber Abweichungen weit über ErrorBar möglich.
Das ist ein wirkliches Problem der Vergleichbarkeit von Listen und führt ein wenig in die Irre.
Weil, je weniger Gegner desto mehr Partien werden notwendig und desto größer müßte die ErrorBar sein.
Im Grunde ist die ErrorBar ne Gute Sache nur von der Umsetzung nicht perfekt.
Auch von der Auslegung durchaus unterschiedlich zu verstehen, Sinngemäß aber nicht das was dargestellt werden sollte.
Hier mal ein Ergebnis der Simulation:
1.000 Partien bei 2 Gegner ... Ausgabe ErrorBar = +- 18 ... so gesehen könnte 36 ELO ...
Lasse mal Stockfish gegen Houdini spielen und dann vergleiche wenn nur 4 weitere Engines hinzukommen, BINGO. Die eigentliche Houdini ELO passt sich an ... bin gemein oder. Nehme direkt den Angstgegner und bin schon über ErrorBar Ausgabe.
Bei 1.000 Partien und 20 Gegner nach Simulation sollte die ErrorBar ausgeben +-13
Bei 1.000 Partien und 21 Gegner nach Simulation ... +-13
Ändert sich bei ca. 24-26 Gegner auf ca. +-12, Jetzt brauche ich schon 38 Gegner um die +-11 zu knacken und dann ist schon fast Feierabend, geht kaum noch runter.
Bei 1.000 Partien und 2, 3, 4, Gegner dürfte gar keine Ausgabe erfolgen.
Bei 1.000 Partien und 5 Gegner ist es ca. +-24 und nicht +-18
Ob ich mit der Simulation richtig liege muss ich sicherlich auch noch mal prüfen. Hatte ich mal gemacht.
Also ich denke sofern ich mich erinnere ...
Ausgabe ErrorBar bei 1.000 Partien müsste unterschiedlich sein zwischen 5 und ca. 24-26 Gegner müsste die ErrorBar also variieren von ca. +-24 - +-12
Rede immer von 1.000 Partien (Anzahl unerschiedlicher Gegner).
Die Anzahl der Gegner geht in die Berechnung nicht ein.
Bei Bayesian meines Erachtens besser gelöst als bei ELOstat die Remispartien ... anderes Thema.
Kommt auch noch hinzu!
Und es kommt noch was hinzu aber dafür brauche ich länger und ich bin müde.
Aber das ganze xMal und immer wieder darzustellen ...
Will niemanden belehren aber das ist so offensichtlich nicht korrekt und so leicht zu erkennen wenn mal mehrere Auswertungen gemacht wurden.
Das Problem was seinerzeit bei der Erstellung von ELOstat bestand war, dass nur wenige gute Datenmengen zur Verfügung gestanden haben.
Der Programmierer nutzte die Winboard Ratingliste von mir (siehe Readme). Da war das Thema der Gegner gar kein Thema, weil offenbar niemand dran gedacht hat. Die Berechnungen von ELOstat beruhen nicht nur auf statistischen Wahrscheinlichkeiten, sondern auch und richtiger Weise auf themenbezogene Daten, sprich die Partiedaten die zur Verfügung gestanden haben. Damit wurden also die Ausgaben von ELOstat gegengeprüft und sofern ich mich erinnere an seine eMails auch teilweise korrigiert.
Anzahl der Gegner geht in die Berechnung also nicht ein.
Lediglich die Anzahl der Partien und die sonstigen wichtigen Berechnungsformeln.
ELOstat ist ein geiles Progamm und hilfreich. Macht das beste aus einer sicherlich nicht perfekten ELO Formel für unsere Anwendungen. Aber ist leider nicht perfekt und mithin wird dem User vermittelt ... das x unnötige Partien mehr erforderlich sind um die ErrorBar nach unten zu schaufeln.
Viele Grüße
Frank