FGRL 60+0.60 Rangliste - 1.000.000 Partien

By GS Date 2015-12-07 19:44

Hi Andreas !

Sehr schöne Arbeit !!
Ich wünschte mir, Du hättest diese in die "240 sec./game + 2.40 sec./move" gesteckt,
dann wäre es, aus meiner Sicht, (fast) perfekt.

Viele Grüsse,
G.S.

By Ingo B. Date 2015-12-07 20:58

Hallo Andreas, Hallo Gerhard,

Ich finde den Mehraufwand schwierig. Die 240er Liste hat mir 2700 Spielen eine Errorbar von +/-9 Elo, die 60er bei 14500 Spielen eine Errorbar von +/-7 Elo. 11800 Spiele mehrm um ein maximal 4 Elo(!) besseres/genaueres Ergebniss zu erreichen*? Selbst wenn die Perfomance bei verschiedenen Zeiten vergleichen will, sollte man das irgendwie im Auge behalten und die Resourcen besser verteilen ...

Ansonsten, klasse Arbeit! Danke.

Gruß
Ingo

*Von dem ich auch noch behaupte das das schon so genau ist, dass es kein Mensch mehr am Brett fühlen kann ... da frage ich mich ein bisschen "Wofür"? Aber das betrifft mich genau so ... man muß ja kritisch bleiben.

By Ralf Mueller Date 2015-12-07 21:40

Ähnlich wie bei Stefans Liste habe ich leider das Gefühl, dass diese kurzen Bedenkzeiten doch zu kurz sind, um die langen Bedenkzeiten gut abzubilden.

Komodo 9.3 8 Elopunkte hinter einer Juni-Version von Stockfish?
Bei Stefan 25 Elopunkte hinter einer Stockfish-Version vom letzten Monat?

Das ist doch kein realistisches Ergebnis unter Turnier- und Analysebedingungen?!

By Frank Qy. Date 2015-12-07 22:40

Hi Ralf,

AMD / Intel ...
Unterschiedliche Prozessoroptimierungen wie BMI2 ...

Also ich denke auch die Liste von Andreas oder Stefan ist interessant.
Jede muss halt so betrachtet werden wie denn der Schwerpunkt des Testers gelegt wird.

Das wir alle gleiche Ergebnisse bei unterschiedlichen Bedenkzeiten etc. erzielen ist ja sicher ausgeschlossen und ob dann z. B. meine Liste bei 4x mehr Bedenkzeit auch wieder diese Spielstärkeverhältnisse widerspiegelt stelle ich z. B. selbst in Frage. Kann mir aber ausmalen wie die Ergebnisse sich entwickeln durch die Arbeiten aller zusammen. Wenn ich weiß das Endspielstarke Engines zulegen (legen in der Regel zu, die Taktiker nehmen in der Regel eher etwas ab wenn die Zeit mehr wird) kann ich mir bei fast allen Engines die Fragen anhand der Logik der Stärken und Schwächen der Engines selbst beantworten wobei das natürlich auch nur eine Vermutung wäre aber eigentlich eher mehr als nur eine Vermutung.

Was ich reizvoll finde bei den Elo Zahlen selbst ist nicht das Rating als solches, sondern wenn denn eine neue Version wie hoch in etwa die Verbesserung ist und ob ich erkennen kann das Schwachpunkte abgestellt wurden oder Stärken ausgeprägter werden.

Was einen Schatten auf Ultra Blitz wirft ist meines Erachtens das die GUI auch Zeit benötigt bzw. die einfache Zugübergabe. Was ich nie bei anderen Listen weiß ob die vielen doppelten Partien nach ECO Länge oder Zeitüberschreitungen nachgespielt wurde um die reine Spielstärkemessung nicht zu beeinflussen. Bin sehr pingelig wenn es um solche Sachen geht aber das nimmt auch alles sehr Zeit in Anspruch.

Ich glaube das jede gute Liste in sich unter den verwendeten Bedingungen genau ist. Versuche zwar selbst durch eigene Erfahrungen diese Genauigkeit immer zu verbessern aber wäre es anders würde es mir auch keinen Spaß machen.

Auch wenn so schnelle Bedenkzeiten aber so lange und beständig schon so viele Partien zu erzeugen ist schon sehr gut. Hauptsache es macht dem Ersteller noch Spaß und hier und da erfreuen sich auch andere daran.

Gruß
Frank

By Stefan Pohl Date 2015-12-08 12:16

Ralf Mueller schrieb:

Ähnlich wie bei Stefans Liste habe ich leider das Gefühl, dass diese kurzen Bedenkzeiten doch zu kurz sind, um die langen Bedenkzeiten gut abzubilden.

In meinem Endless RoundRobin mit 15'+3'' und allen 4 Cores liegt Stockfish (Version vom 2.11.) auch immerhin 13 Elo vor Komodo 9.3 (im direkten Aufeinandertreffen). Und 15'+3'' mit 4 cores entspricht auf singlecore mindestens 45'+9'', je nachdem, wie gut die Parallelisierung in der Engine umgesetzt ist.

Daß Abstände zwischen Engines geringer werden, wenn die Bedenkzeiten länger werden, ist normal, weil die Remisquote steigt. Aber daß Plätze getauscht werden, ist selten. Und auch in diesem Fall ist das nicht passiert.

Stefan

By Ralf Mueller Date 2015-12-08 13:51

Hallo Stefan,

also denkst du, dass das TCEC-Finale ein statistischer Fehler war und in Wahrheit Stockfish die bessere Engine ist?

By Tom Paul Date 2015-12-08 14:35

Ralf Mueller schrieb:

Hallo Stefan,

also denkst du, dass das TCEC-Finale ein statistischer Fehler war und in Wahrheit Stockfish die bessere Engine ist?

Klar, das weiß doch jeder.

By Stefan Pohl Date 2015-12-08 15:39

Ralf Mueller schrieb:

Hallo Stefan,

also denkst du, dass das TCEC-Finale ein statistischer Fehler war und in Wahrheit Stockfish die bessere Engine ist?

Das tcec ist in Sachen Hardware so extrem, daß ich mir dazu keine Bewertung erlauben kann und möchte. Ich denke, daß mein Endless RoundRobin was Kernzahl und Bedenkzeit angeht, wesentlich näher an der Nutzungsrealität der meisten User dran ist als das tcec.
Aber bei so vielen Kernen/Threads wie im tcec könnte Komodo in der Tat besser sein. Die Parallelisierung soll,ja bei Komodo besonders gut sein. Da ich aber zu so einer Hardware keinen Zugang habe, möchte ich da nicht groß spekulieren.

Stefan

By Tom Paul Date 2015-12-08 15:44

Stefan Pohl schrieb:

Ralf Mueller schrieb:

Hallo Stefan,

also denkst du, dass das TCEC-Finale ein statistischer Fehler war und in Wahrheit Stockfish die bessere Engine ist?

Ja und zwar ~100% besser.

By Benno Hartwig Date 2015-12-08 14:15

Das SF bei sehr kurzen Zeiten die Nase vorn hat, hat man sehr oft gesehen.
Deine "15'+3'' mit 4 cores" sind aber schon gar nicht kurz. Da finde ich es schon faszinierend.
Mal gucken, ob es bestätigende Ergebnisse bei ähnlichen Zeiten gibt.

Benno

By Stefan Pohl Date 2015-12-08 12:20

Andreas Strangmüller schrieb:

Die aktuelle Rangliste 60+0.60 umfasst mittlerweile über 1 Million Partien von 96 getesteten Engines, inklusive des neuen Komodo 9.3

<a class='urs' href='http://www.fastgm.de'>http://www.fastgm.de</a>

Deine Seite, deine Listen sind die besten weltweit. Mit weitem Abstand. Punkt.

Höchste Anerkennung - Stefan

By Volker Heiser Date 2015-12-08 19:45

Da kann man zustimmen! Über 1 Million Spiele und dazu noch fast 100 verschiedene Programme, einzigartig! Ich schaue dort immer wieder vorbei.

By Thomas Müller Date 2015-12-08 19:58

Gratuliere und auch mal DANKE!
Das ist dann doch schon richtig viel

Mit welchem programm machst du das nochmal?

gruß
thomas

By Andreas Strangmüller Date 2015-12-09 19:36

Hallo Thomas,

für diese Rangliste nehme ich die LittleBlitzer GUI

Gruß,
Andreas