[quote="Hauke Lutz"]
Ich denke gerade diese Schwankungen belegen wie wichtig es ist so viele Stellungen vorzugeben und gegen viele Engine zu testen.
Würdest du nur 100 Stellungen und evtl. nur 5 Engine nutzen, dann wäre dir das nichtmal aufgefallen...
Also mach weiter so, deine Rangliste ist eine wahre Bereicherung
[/quote]
Danke für die Blumen! Freut mich immer!
Hier ein Zwischenstand von Stockfish 131008 nach 4000 von 10000 Partien: ca. +12 Elo zu Stockfish 130910. Ein sehr schönes Plus. Mal sehen ob es so bleibt.
Und noch ein bemerkenswertes Zwischenergebnis, was (mal wieder) zeigt, wie wichtig viele Partien sind: Der Test von Stockfish 131008 läuft (wie praktisch alle meine Tests) auf 2 absolut identischen Notebooks (gleiche Hardware, gleiche Firma, gleiche Typnummer, gleiches Windows (7 64bit HomePremium)) und die LittleBlitzerGUI zeigt auch identische Knotenzahlen der Engines und ebenso identische Rechentiefen. Und auf Notebook 1 hat Stockfish nach 2035 Partien ein Zwischenergebnis von +19 Elo und auf dem anderen (auch nach 2035 Partien) von +6 Elo (und der Durchschnittswert ist dann eben +12). Und diese Abweichungsgröße ist durchaus nichts Ungewöhnliches. Zum Ende des Testlaufs (also pro Notebook 5000 Partien) laufen die Ergebnisse dann aber praktisch immer in einem ca. 5 Elo-Intervall zusammen.
Soviel zur These, daß 2000 Partien dicke reichen für ein seriöses Ranking. Würde ich nach 2000 Partien den Test beenden, hätte ich - je nachdem welchen dieser 2 Testläufe ich jetzt als Endergebnis nehmen würde - entweder ein Ergebnis von +6 oder von +19 Elo...
Es ist mir ja schon beinahe etwas peinlich, immer wieder auf solche Daten und Fakten hinzuweisen, weil ich ja auch weiß, daß andere Tester sich dadurch auf den Schlips getreten fühlen, aber so sind nun mal die Fakten. Die kann und will ich nicht ignorieren. Und ich wünschte, andere würden es mir gleichtun. Aber leider bin ich wohl der sprichwörtlich einsame Rufer in der Wüste. Oder Don Quichotte beim Kampf gegen Windmühlen.
Stefan