Sogar -3 ELO
Es mangelt eben an Hardware Power und aktiven Testern und neuen Ideen im Code.
Es wurde schon alles getunt, jetzt muss etwas neu erfunden werden.
95% bei einem Test scheinen auch nicht mehr auszureichen.
Nachher wird ein Test der 95% bestanden hat noch mal gegen die Version ohne die Veränderung getestet und fällt dann wieder durch.
Dann schleichen sich noch Regressionen ein.
Es sollte auch ein Minimum geben z.B. 20000 Partien.
Nur weil ein Test am Anfang super gut oder super schlecht läuft, muss er nicht gleich nach 900 Partien angenommen/verworfen werden.
Wenn es z.B. 100 Siege und 200 Niederlagen und 500 Remis gibt, dann ist es immer noch möglich bis letzten Partie mehr Siege als Niederlagen zu haben.
Es ist ja nicht so das sich Sieg und Niederlage immer abwechseln. S, N, S, N, S, N.
Theoretisch könnten am Anfang 5000 Niederlagen kommen und erst danach 10000 Siege und 5000 Remis.