Verstehe, Frank, du willst weniger Stellungen händisch aussuchen, als du für einen Stellungstest bräuchtest und mit denen dann weiterhin viele viele Partien aber vielleicht nicht ganz so viele wie bisher von ein paar mehr und stärker verschiedenén Stellungen spielen lassen?
Ok, wäre immerhin auch ein Ansatz in die richtige Richtung, scheint mir.
Aber wie viele Stellungen willst du jetzt dann wirklich nehmen und wie viele Partien meinst du damit spielen zu müssen, um zusätzliche Aussage treffen zu können?
Bisher waren wir (
) ja damit zufrieden, uns einzureden, die 5-8zügigen ausgeglichenen Eröffnungsstellungen würden das Schach abbilden, dadurch, dass die engines dann ohnehin alles andere, was es darüber hinaus noch gäbe, selbst erfinden würden.
Wenn du jetzt andere Kriterien an "Spielstärke" anlegst, wie viel mehr Daten brauchst du für wie viel mehr Erkenntnisgewinn?
Und wieso musst du für einen Stellungstest, wenn du die Stellungen ja ohnehin ausspielen lässt, also für einen ausgespielten Stellungstest, von dem ich annahm, dass es bei deiner neuen Idee auf ihn hinausliefe, wieso brauchst du weniger Stellungen, als für einen Stellungstest, so wie du ihn dir offenbar immer noch ausschließlich vorstellen kannst? Und wenn du dir schon wirklich quantitativ Partiezahlen ersparen willst, wie wär's dann auch hier mit einem echten in between?
Z.B. Ausspielen lassen von Varianten bestimmter Länge und Vergleich von denen (dem eigentlichen Partiematerial, nicht wieder nur dem ganzen oder halben Punkt am Ende) mit Testvarianten, von denen du eine HV, ein paar Nebenvarianten und einen optimalen Evalverlauf (bei dem es ja wieder gar nicht auf Absolutwerte, sondern nur auf die Relationen ankäme) kennst?
Wie schon Michael Scheidl da so ähnlich dazu gemeint hat, müsste man ja vielleicht überhaupt nicht wieder mit dem einzigen Liebkind des bisherigen Testens, mit der Statistik, an die Sache herangehen, eine reine Verhältnismäßigkeit von einzelnen engines bei einzelnen Varianten und deren Evalverläufen würde mir persönlich immer schon genügt haben, für so etwas, was bei mir schon lange zwischen Stellungstest und Beurteilung des Spielverhaltens lag.
Die Ranglisten, die wir bisher hatten, werden wir ja weiterhin haben und mir scheint nicht, dass es weniger werden werden in der nächsten Zeit.
Ich vermute mal, du gehst immer noch davon aus, die engines würden die Vielfalt, die du ihnen nicht abverlangst, von sich aus einbringen?
Sei mir nicht böse, der Grundirrtum, ich nenne ihm mal "spielen lassen statt spielen", besteht da für mich immer noch.
Wenn du nicht selbst bestimmst, was gespielt wird, wirst du nach wie vor nicht wissen, was du getestet hast. Du wirst es vielleicht besser wissen, aber eigentlich bewegt es sich für mich immer noch in der Grauzone Zufall und Notwendigkeit, wobei die Notwendigkeit immer wieder als bias verkannt wird und der bias als Zufall.