Hi,
nun, gestern habe ich ja die SWCR Datenbank hochgeladen. Mit dieser Datenbank könnte man sich austoben, bzw. könnten sich Statistik Fans austoben.
Möchte mal ein Beispiel geben.
In der SWCR spielt jede Engine gegen jede andere Engine 40 Partien. Bei 20 Engines bzw. 19 Gegner sind das 760 Partien. Es kam vor ca. 2 Monaten mal die Frage, ob die Auswertung nicht besser wird wenn Engine 21 hinzukommt. Dann wären es doch 800 Partien. Ob nun 760, 800 oder 1.200 ... spielt keine große Rolle mehr.
Mein Thema ist es aber eher:
Der Statistik minimalistisch trotzen!
Für mich stellt sich also viel eher die Frage, würden weniger Partien nicht das gleiche Ergebnis verursachen.
Lassen wir die Datenbank sortieren bzw. den Zufall bestimmen. Gehen wir davon aus, was würde passieren wenn jede Engine gegen jede Engine anstatt 40 Partien 30 Partien gespielt hätte. Löschen wir die letzten 5 Partien der Engines jeweils mit schwarz und weiß und berechnen dann eine neue Liste ist das Ergebnis bei 570 Partien pro Engine das Gleiche
OK ...
Weiter runter ...
Schaue ich dann in die 16.000 Partien Datenbank, die beiden Tabellen von gestern, sehen wir bei Engines die nicht 760 sondern 1200 Partien gespielt haben auch keine relevanten Sprünge. Nur dann wenn eine Engine z. B. gegen alle Doch Versionen antreten musste und Doch ein Angstgegner ist ... daher halte ich von dieser Liste im Grunde nichts.
Die Frage ist also:
Wie weit kann ich nach unten gehen um bei 20 verschiedenen Engines mit so wenig Partien wie möglich ein aussagekräftiges Rating zu bestimmen.
Spielwiese, die SWCR Daten ...Für Personen die sich erst später im Beitrag einklinken ...
So ganz nach der History Channel Methode, jede 5 Minuten das was passiert ist im Beitrag wiederholen.
Treiben wir die Einzelmatches von 40 Partien auf 20 Partien runter, dass wären dann 380 Partien, sehen wir die ersten 2 von 20 Abweichungen die größer als 10 sind (zu der offiziellen SWCR mit 760 Partien pro Engine).
Aha ... also liegt die Wahrheit zwischen 380 und 570 Partien.
Um es nicht so spannend zu machen ...
Bei 400 Partien, wobei dann nur noch eine der 20 Engine um mehr als 10 ELO zu der Hauptdatenbank mit 760 Partien abweicht.
Witziger Weise natürlich Ktulu, bei Ktulu hat es auch lange gedauert bis eine stabile ELO-Vorlag.
Im Grunde hätte ich mir die Arbeit sparen können, weil ich das schon vor 10 Jahren berechnet habe bzw. auch bei der ATL-4 vor ca. 4 Jahren. Aber es ist immer wieder interessant zu sehen.
Wer möchte, kann sich die Datenbank herunterladen und selbst experimentieren.
Diese Experimente sind kein Geheimnis.
Aber nicht gezielt Partien löschen, sondern immer die letzten oder die ersten Partien zwischen den Matches. Und bitte auch nicht von den favorisierten Programmen die Verlustpartien löschen
Selbst betrügen ist langweilig.
Gruß
Frank