Angenommen ich teste eine Engine und erwarte (mit dem sicheren Gefühl:
"Ich weiß, dass es so ist!") in einem konkreten Umfeld beispielsweise eine Spielstärke im Bereich 3000 bis 3100 Elo.
Ich habe mir vorgenommen, beispielsweise 1000 Partien zu spielen.
Und nun liefern uns die ersten 50 Partien aber ein Ergebnis, welches deutlich außerhalb des erwarteten Bereiches liegen (an den ich aber immer noch superfest glaube! Und nun startet die Engine weit erfolgreicher!)
Dann habe ich ja 2 Möglichkeiten
- sturheil weiterspielen und eben am Ende alles auszurechnen
(also hinzunehmen, dass diese ersten 50 wohl erstmal tendentiell einfach verfälschend waren,
von den restlichen 950 kann ich ja kein "Gegensteuern" erwarten, sondern eben nur ein Pendeln um den Erwartungswert, ein mehr und mehr "unwichtig machen")
. diese Ergebnisse zu streichen und das Experiment einfach mit 950 Partien neu zu beginnen.
Beide Vorgehen sind machbar, und beide sind auch nicht wirklich schlecht.
Und
beide Vorgehen werden mir einen gewissen Fehler im Ergebnis liefern.
Mir ist aber nicht klar: bei welcher dieser beiden Varianten darf ich den
kleineren Fehler erwarten?
und dann ggf. eben auch die Frage: bei welchen "ungewöhnlichen Anfängen" (Umfang, Heftigkeit) sollte ich die Ergebnisse einstampfen und lieber mit etwas reduziertem Umfang neu beginnen?