Thanx.
Mal gucken, ob diese nun wieder etwas bessere SF-Ergebnis dem Rauschen zu verdanken ist, oder ob es echte Spielstärkeunterschiede beschreibt.
Bei deinen Testumfängen haben die Differenzen zweier ELO-Werte ja einen 95%-Radius von knapp 10 ELO.
Falls die Versionen 5 und 140606 tatsächlich gleich stark sind/wären, dann würde mit Wahrscheinlichkeit 5% irgendeiner der beiden mind. 10 berechnete ELO vor dem anderen liegen können.
Oder eben: durchschnittlich jeder 20te derartige Vergleich zweier gleichstarker Engines weist irgendeine der beiden als um mind. 10 ELO stärker aus.
Sooo schrecklich unwahrscheinlich erscheint mir das nicht.
Benno
PS:
Ich finde schön, dass du auch die alten Haudegin und ehemalige absolute Überfliegerin Rybka in der Gegnerliste hast.
Und es ist faszinierend, dass sie inzwischen mit weniger als 30%-Quote gegen SF herummickert.
Dasaeinsberechtigung so als Vertreterin der schwächeren Gegnerschaft.