Benno Hartwig schrieb:
Trotz deiner ja sehr umfangreichen Testreihen sind die 95%-Intervalle bei neu hinzugekommenen Engines ja immer noch bummelig 10 ELO breit. Kleinere Fortschritte der Engines könnten da immer noch im Rauschen untergehen. Und ein einzelner Ausreißer nach oben kann einge 'enttäuschende Versionen' im Gefolge haben.
Benno
Also in diesem Fall scheint das nicht zuzutreffen und es vielmehr so zu sein, daß Marco Recht hat und sich bei der Version 140119 eine Regression eingeschlichen hat (gegen andere Gegner), denn Version 140118 liegt nach nunmehr 3600 Partien bei +4 Elo zu Stockfish 140112 (und somit +9 Elo besser als Version 140119 zu diesem Zeitpunkt).
Ergo lasse ich den Test auf jeden Fall bis zum Ende laufen, selbst wenn sich dieses minimale Plus von nur 4 Elo möglicherweise zum Ende hin verflüchtigt - was durchaus anzunehmen ist.
Ergebnis Sonntag. Stay tuned!
Stefan