Hi Ingo,
mein Gott bist Du schnell
Der frischesten Ergebnisse kommen von Dir!
Wollte auch testen, zunächst mal im Blitz.
Bei der Vorgängerversion gab es einen schlimmen Endspiel Fehler, so dachte ich ... wenn der behoben ist ... mindestens 50 ELO mehr.
Dem scheint nicht so zu sein, aber der Programmierer konzentriert sich ja offenbar auf ein neues Projekt.
Übrigens zu Deinem ELO-Vergleich:
Mache es Dir einfacher!
1. Nehme die Partien von CEGT, CCRL (glaube die können ja heruntergeladen werden) und Deine.
2. Kennzeichne die Engines der fremden Listen mit CE für CEGT und CC für CCRL vor dem Engine Namen.
3. Suche Dir drei Vergleichsengines heraus (am Besten Engines die nicht ganz unten oder oben stehen, gut wären Engines mit vielen Partien) ... weißt Du alles selbst.
4. Nur bei den Vergleichsengines solltest du einen einheitlichen Namen wählen.
5. Idealerweise löscht Du alles an Engines, die nicht mehr als 350 Partien gespielt haben ... OK, mit dieser meiner These kannst Du Dich ja nicht anfreunden, egal.
Nun berechne eine neue Liste.
Im Grunde sind die Ergebnisse dann schon recht gut.
Siehst Du krasse Abweichungen (Naum ist wirklich so ein Fall) solltest Du die Engines mit den 3 höchsten und 3 niedristen Abweichungen einfach löschen.
Nun vergleiche die Zahlen mit den restlichen Engines.
Eine Möglichkeit!
Kommt kein perfektes aber ein brauchbares Ergebnis dabei heraus.
Kannst Du auch mit anderen Vergleichsengines wiederholen und das Ergebnis wird fast immer gleich sein.
Fest steht, dass die Abweichungen sich in einem Rahmen von +-20 halten (egal wie viele Partien, ob nun 500 oder 1000 gespielt wurden).
Gehst Du dann auf die Suche nach Gründen kannst Du diese auch leicht erklären.
Im Grunde sind die Unterschiede zwischen den Listen nicht so trivial.
Aber ich finde CEGT und CCRL werden unübersichtlich, konzentrieren zu sehr auf x64.
Das haben nur die wenigstens und insofern wird es immer komplizierter durchzublicken.
Was aber auch verständlich ist, bei dem System welches verwendet wird.
Immerhin testen die Gruppen schon über einen sehr langen Zeitraum.
Ganz unabhängig der schon oftmals diskutierten Details zu Beeinflussungsfaktoren etc..
Habs auch schon gemacht, komme mit meinen Ergebnissen sehr nahe an Deinen Ergebnissen heran.
Näher als zu allen anderen Listen, aber mit anderen Mitteln, nicht mit den Partien selbst.
Bin früher zu Zeiten der ATL-4 so vorgegangen.
Wunderte mit über Glaurung.
Die Engine tanzte nur bei mir aus der Reihe.
Hat sich aber im weiteren Verlauf meiner Partien nie gelegt.
Glaurung blieb das Problemkind
Könnte mit Ponder zu tun haben, aber ich glaube das hat eher mit der gleichmäßigen Anzahl an Partien für die jeweiligen Eng-Eng Matches zu tun.
Gruß
Frank