[quote="Wolfgang Battig"]
Oder "nur" 150 Partien je Match spielt? Oder dass auch "schwächere" Engines, die 300 oder 400 ELO hinter der Spitze liegen getestet werden?
So ist es. 75 Vorgabestellungen sind zuwenig, um den Effekt abzufedern, daß einige Stellungen einer Engine sehr gut liegen oder nicht liegen (können). Dieses Problem kann man nicht verhindern, nur mit sehr viel mehr Vorgabestellungen zumindest abfedern. Das ließe sich leicht vermeiden, wenn die IPON ein Ligen-system einführen würde, um die a) die Anzahl der Gegner pro Engine zu reduzieren, sodaß mehr Vorgabestellungen in den einzelnen Matches abgespielt werden können und b) den Verzerrungseffekt zu vermeiden, der auftritt, wenn zu starke gegen zu schwache Engines spielen. Diesen habe ich hier schon mehrfach erläutert, auch Robert Houdart hat mir diesbzgl. ausdrücklich zugestimmt. Nochmal hierhin kopiert:
Die in der Sedat-Liste stärkeren Houdini-Settings basieren im Endeffekt alle auf der T3-Setting-Idee, nämlich mit höheren Pawnstormwerten eine höhere Aggressivität der Engine zu erreichen. Testet man nun so ein Setting gegen viele deutlich schwächere Engines, wird man leicht eine gewisse Elosteigerung feststellen (wie das ja in der Sedat-Rangliste auch der Fall ist). Das passiert, weil ein aggressiveres Setting die Verzerrung ein wenig minimiert, die üblicherweise auftritt, wenn man starke Engines gegen zu schwache Gegner testet. Das hatte ich hier schon mehrmach ausgeführt: Alle Engines sind Autisten und wissen nicht, wie gut bzw. schlecht ihr Gegner ist. Daher wird ein Houdini, wenn er leicht schlechter steht, gerne in ein mögliches Remis durch Dauerschach oder Zugwiederholung einschwenken, auch wenn der Gegner so viel schwächer ist, das er eigentlich die Partien dennoch gewinnen würde. Houdini weiß eben nicht, daß der Gegner so viel schlechter ist. Hat man nun ein aggressiveres Setting, erzeugt man mehr taktische Verwicklungen im Mittelspiel und die Chance erhöht sich, daß eine starke Engine dann früh einen taktischen Schlag gegen eine schwachen Gegner ausführen kann, bevor ein Remis durch Zugwiederholung o.ä. auftritt. Daher scheint ein aggressives Setting in einem solchen Test-Milieu plötzlich besser zu sein als die Default-Engine. Das ist aber eine Täuschung, die darauf basiert, das gegen zu viele zu schwache Gegner getestet wird (s.o.).
Das ist ja der Grund, warum ich weder von der IPON noch von der Sedat-Liste viel halte, wenn es darum geht, die allerbesten Engines zu testen: Es wird gegen zu viele, zu schwache Gegner getestet, was die Ergebnisse verzerrt (sehr starke Engines schneiden eben etwas schlechter ab). Das aggressive Setting reduziert nun diese Verzerrung ein wenig und dadurch scheint es dann besser zu sein als der default-Houdini. Aber das ist leider nur eine Illusion basierend auf falschen Test-Rahmenbedingungen. In meiner alten LS-Liste hatte ich ja auch mal Houdini-Settings getestet (t3 und z glaube ich) und dort konnte keines (trotz großer Partienzahl gegen diverse Gegner) besser scoren (nie außerhalb der Errorbar). Eben weil in der LS-Liste keine so schwachen Gegner vorkommen...
Zitat:
Tu mal "Butter bei die Fische" und schwabulier nicht im Nebel rum!
All das habe ich bereits mehrfach hier erörtert. Wenn du das nicht mitkriegst, OK, aber dann wirf mir nicht vor, ich schwabulierte im Nebel rum.
Zitat:
Könnte meine CEGT-Kollegen mich und auch interessieren, und die CCRL, und die SSDF, und , und, und...
Sooo unterschiedlich sind die Testmethodiken nämlich nicht!
Stimmt leider!
Zitat:
Zitat:
und den fragwürdigen IPPO-Boykott (Ivanhoe, Robbo, Bouquet etc.)
die einen sagen fragwürdig, andere nachvollziehbar...
Ingo hat sich da klar festgelegt und es auch begründet.
Hör bitte auf, deine
Meinung als Tatsache zu verkaufen. "Der aus meiner Sicht fragwürdige..." wäre ggfs. die bessere Formulierung gewesen.
Stimmt, meine Formulierung war da sicher nicht optimal. Aber das sog. klar festlegen in der IPON ist ja gerade das Problem: Denn das scheitert zwangsläufig daran, daß man gar nicht klar sagen kann, wo nun überall Ippocode drin ist und wieviel davon erst Recht nicht. Was ist z.B. mit Critter 1.6a? Das meine ich ja gerade. Da das eben nicht klar festlegbar ist, ist jede klare Festlegung zwangsläufig immer willkürlich und eben nicht nachvollziehbar!
Um das aber auch klar zu sagen: Ich habe mich in der LS-Rangliste deshalb auch nie so festgelegt und lasse nur primitive 100%-Clone wie Deep Matrix raus und kommerzielle Engines, von denen ich meine, daß sie nur minimal variierte Ippos sind (Vitruvius). Aber auch das ist letztlich eine gewisse Willkür meinerseits. Aber ohne geht es nun mal nicht, denke ich. Nur sollte man dann eben nicht so tun, daß man sich klar festgelegt hätte, weil das nämlich schlicht nicht möglich ist - meiner unmaßgeblichen Meinung nach (war das besser so?).
Zitat:
Zitat:
Was allerdings bei der IPON gar nicht geht, ist das Geheimhalten der Partiedaten....
Da stimme ich dir ausnahmsweise mal zu
Siehste. Das ist eben kein IPON-Bashing, sondern eine indiskutable, unseriöse Vorgehensweise. Niemand wäre glücklicher als ich, wenn die IPON endlich transparent würde, ein Ligensystem einführen würde und nicht so viele Engines der Spitzengruppe weglassen würde. Das wäre super und ich bräuchte mit meiner murkeligen Hardware nicht selber eine Mini-Liste des Top-Spielstärke-Bereiches (für mehr reicht meine Hardware leider nicht aus) auf die Menschheit loszulassen.
Gruß - Stefan