Starker Auftritt von Houdini 4!

By Dirk Triebel Date 2013-11-29 16:44

Servus,

vergiss aber die Fehlertoleranz nicht!

Erstaunlich, das die Remisquote noch mal gesenkt werden konnte mit zunehmender Spieldauer und mehr gescored.

Bei Stefan Pohl 45''+500ms (Ponder off) (LS list):

1 Houdini 4 x64    3183 5 5 10000   67% 3063   43%

bei mir 1min+1s+ Ponder:

1 Houdini 4 Pro x64 : 3234   13 13 1950 71.9 %   3071   31.7 %

Und bei deinem link (list Gerhard Sonnabend) mit 5'+3" pb=on

01 Houdini 4.0 x64 (NEW) 3117   19 19   1150 80.8 %   2868   28.7 %

Gruß,
Dirk

By Gunther Phillip Date 2013-11-29 21:32

Dirk Triebel schrieb:

Servus,

vergiss aber die Fehlertoleranz nicht!
---> Rest entfernt <---

Weshalb denn? Auch das heutige Update der CEGT mit 40 in 4 zeigt 55 Punkte mehr (http://www.husvankempen.de/nunn/40_4_Ratinglist/40_4_AllVersion/rangliste.html).
Ich würde mich nicht allzu sehr an den Errorbars festkrallen, dies machen schon andere hier viel zu häufig um Fehler im eigenen Testaufbau zu erklären.
Die Cegt ist da vorbildlich und sehr zuverläßig, ich beobachte dies schon seit einigen Jahren. Nicht die Anzahl der Spiele allein ist entscheidend, es gehört schon ein
wenig mehr dazu! Die Ipon war ebenso gut, leider ist die nicht mehr online zur Zeit. Allen guten Listen gemein ist jedoch die Auswahl der Bedenkzeiten für die
Programme; sprich es werden gewisse "Grenzen" eben nicht unterschritten, vollkommen gleichgültig welche Hardware im Einsatz ist oder war.
Gruß Gunther

By Dirk Triebel Date 2013-11-30 14:25

Hallo Gunther,

die Elo Berechnung basiert auf mathematischen und statistischen Fakten. Somit könnten rein theoretisch im ungünstigsten Fall diese Errorbars auch möglich sein. Man kann sich also nicht nur das Beste aus der Berechnung heraussuchen.
Meine persönliche Meinung ist, dass das ganze Elo Modell wegen einigen Schwächen verbesserungswürdig ist. Das wurde auch im Forum schon mehrfach diskutiert.

Ich habe nix gegen die CEGT geschrieben, ganz im Gegenteil. Ich finde die Liste auch super u machen nen tollen Job, besonders auch weil ich ein Freund von PONDER ON bin, weil die Spiele nach meiner Meinung spannender und Interessanter werden.

Aber jeder darf ja seine Meinung haben.

Gruß,
Dirk

By Guest Date 2013-11-30 19:00

Dirk Triebel schrieb:

Hallo Gunther,

Meine persönliche Meinung ist, dass das ganze Elo Modell wegen einigen Schwächen verbesserungswürdig ist. Das wurde auch im Forum schon mehrfach diskutiert.

Diskutiert wurde das aber nur von den Ahnungslosen, die einfach alles mal kritisieren weil sie es nicht richtig durchblicken.

Das Elo System ist kanonish, d.h. wenn es in unserem Universum noch weitere Planten gibt mit intelligenten Lebewesen die Computer haben und Spielprogramme programmieren, so haben diese Zivilisationen ebenfalls 100% das gleiche ELO System wie wir. Nur die fixe Konstante 400 wäre wahrscheinlich dann eine andere. Aber das System ist dann trotzdem äquivalent. (bis auf Skalierung und Translation)

By Stefan Pohl Date 2013-11-30 14:49

Dirk Triebel schrieb:

Ist doch logisch, daß die Remisquote der weltbesten Engine umso geringer ist, je schwächer das Gegnerfeld im Durchschnitt war - gegen schwache Gegner gibts für eine überlegene Engine mehr Siege und weniger Remisen.
Betrachten wir doch dazu kurz die Abstände der Houdini 4 Elozahl zur Elozahl der Gegner (s.o.) in den jeweiligen Listen:
LS-Rangliste: 3183-3063=120
Triebel-Liste: 3234-3071=163
CEGT (GS): 3117-2868=249

Je kleiner dieser Wert, desto höher logischerweise die Remisquote, weil die Gegner in Relation zu Houdini eben stärker waren (im Durchschnitt). Da in der LS-Rangliste nur gegen die allerstärksten Engines getestet wird, ist die Remisquote am höchsten und das trotz der kurzen Bedenkzeit, welche ja tendenziell eher geringere Remisquoten nach sich zieht.
Ergo: Alles so, wie man es erwarten würde.

Stefan