[quote="Thomas Schoenegger"]
Also Sedat, ich habe großen Respekt für deine Arbeit. Habe mir die Spiele Datei runtergeladen und selbst wenn ich das +/- berücksichtige dürfte Kayra2 auf Rang 1 sein.
Sedat, deine Stromrechnung möchte ich nicht bezahlen müssen.
Stefan, auch 1000 Spiele Setting gegen Original sagen rein gar Nichts aus. Das wissen wir doch alle. Interessant wird es ja erst wenn ein Setting besser gegen viele Engines scort. Bei Sedat sehe ich 41 Engines Ansonsten wären ja alle Listenbetreiber dumm. Sie könnten doch gleich Houdini3 gegen Houdini 2 spielen lassen. Bei Gewinn wäre die logische Schlußfolgerung deiner Auffassung nach, ja Houdini 3 muß die Nr.1 sein. Sedats Liste ist eine Blitzliste,ja aber rechne Mal bei einem Zügedurchschnitt von 100 bei 3+2 = 380s und deine Partielänge. Ich zolle Sedat meinen gleichen Respekt wie dir oder Ingo für seine Ipon.
Sedat danke für deine Mühen
Beste Grüße Thomas
[/quote]
Dear Thomas,
Thank you for your interest and kind words
Best Wishes,
Sedat
By Stefan Pohl
Date 2012-10-07 09:42
Edited 2012-10-07 09:50
[quote="Thomas Schoenegger"]
Also Sedat, ich habe großen Respekt für deine Arbeit. Habe mir die Spiele Datei runtergeladen und selbst wenn ich das +/- berücksichtige dürfte Kayra2 auf Rang 1 sein.
Sedat, deine Stromrechnung möchte ich nicht bezahlen müssen.
Stefan, auch 1000 Spiele Setting gegen Original sagen rein gar Nichts aus. Das wissen wir doch alle. Interessant wird es ja erst wenn ein Setting besser gegen viele Engines scort. Bei Sedat sehe ich 41 Engines Ansonsten wären ja alle Listenbetreiber dumm. Sie könnten doch gleich Houdini3 gegen Houdini 2 spielen lassen. Bei Gewinn wäre die logische Schlußfolgerung deiner Auffassung nach, ja Houdini 3 muß die Nr.1 sein. Sedats Liste ist eine Blitzliste,ja aber rechne Mal bei einem Zügedurchschnitt von 100 bei 3+2 = 380s und deine Partielänge. Ich zolle Sedat meinen gleichen Respekt wie dir oder Ingo für seine Ipon.
Sedat danke für deine Mühen
Beste Grüße Thomas
[/quote]
Ein Settingtest ist nicht das gleiche wie eine Engine in einer Liste mit einer Elozahl einzuordnen, eher gleicht ein Setting dem Versuch eine Engine weiterzuentwickeln. Und um das zu tun, ist es einfacher und effizienter zunächst nur gegen die bisherige Version zu testen (beim Settingtest also gegen die Default-Engine) und nur, wenn das vielversprechend aussieht, gegen andere Engines zu testen. Das ist die übliche Vorgehensweise der Entwickler um den Testaufwand überhaupt in erträglichem Rahmen halten zu können, da sie sehr viele Ideen/Versionen erstellen und dann versuchen das Beste herauszufiltern. Auch R.Houdart und das Komodo-Team testen neue Entwicklungsbetas immer erst gegen die Vorläufer und nur wenn das ein deutlich besseres Ergebnis gibt (deutlich über 50%), testet man dann gegen andere Engines.
Die in der Sedat-Liste stärkeren Houdini-Settings basieren im Endeffekt alle auf der T3-Setting-Idee, nämlich mit höheren Pawnstormwerten eine höhere Aggressivität der Engine zu erreichen. Testet man nun so ein Setting gegen viele deutlich schwächere Engines, wird man leicht eine gewisse Elosteigerung feststellen (wie das ja in der Sedat-Rangliste auch der Fall ist). Das passiert, weil ein aggressiveres Setting die Verzerrung ein wenig minimiert, die üblicherweise auftritt, wenn man starke Engines gegen zu schwache Gegner testet. Das hatte ich hier schon mehrmach ausgeführt: Alle Engines sind Autisten und wissen nicht, wie gut bzw. schlecht ihr Gegner ist. Daher wird ein Houdini, wenn er leicht schlechter steht, gerne in ein mögliches Remis durch Dauerschach oder Zugwiederholung einschwenken, auch wenn der Gegner so viel schwächer ist, das er eigentlich die Partien dennoch gewinnen würde. Houdini weiß eben nicht, daß der Gegner so viel schlechter ist. Hat man nun ein aggressiveres Setting, erzeugt man mehr taktische Verwicklungen im Mittelspiel und die Chance erhöht sich, daß eine starke Engine dann früh einen taktischen Schlag gegen eine schwachen Gegner ausführen kann, bevor ein Remis durch Zugwiederholung o.ä. auftritt. Daher scheint ein aggressives Setting in einem solchen Test-Milieu plötzlich besser zu sein als die Default-Engine. Das ist aber eine Täuschung, die darauf basiert, das gegen zu viele zu schwach Gegner getestet wird (s.o.).
Das ist ja der Grund, warum ich weder von der IPON noch von der Sedat-Liste viel halte, wenn es darum geht, die allerbesten Engines zu testen: Es wird gegen zu viele, zu schwache Gegner getestet, was die Ergebnisse verzerrt (sehr starke Engines schneiden eben etwas schlechter ab). Das aggressive Setting reduziert nun diese Verzerrung ein wenig und dadurch scheint es dann besser zu sein als der default-Houdini. Aber das ist leider nur eine Illusion basierend auf falschen Test-Rahmenbedingungen. In meiner alten LS-Liste hatte ich ja auch mal Houdini-Settings getestet (t3 und z glaube ich) und dort konnte keines (trotz großer Partienzahl gegen diverse Gegner) besser scoren (nie außerhalb der Errorbar). Eben weil in der LS-Liste keine so schwachen Gegner vorkommen...
Gruß - Stefan
P.S: Den gleichen Effekt gab es vor einiger Zeit mit dem Stockfish PHQ-Setting in der SWCR-Liste. Auch das schien besser zu scoren, weil es aggressiver spielte. Das PHQ-Setting ist toll, weil Stocki damit super spielt, aber ein Elo-Gewinn ist es gegen gute Gegner mit Sicherheit nicht...