[quote="Michael Scheidl"]
Es wäre unlogisch, "unausgewogene" Eröffnungsvorgaben zu verwenden, denn solche würden offensichtlich - sofern sie mit Seitenwechsel wiederholt werden! - nivellierend wirken. Also wenn z.B. jede Vorgabe mit +/- 2.00 beginnt, bekommt man innerhalb der Top-20 Engines, mit ganz seltenen Ausnahmen, 50:50. Man würde die falsche Aussage erhalten daß alle gleich stark sind.
[/quote]
Du hast recht, Michael, wären es wirklich unausgewogene, also solche, bei denen eine Seite schon nachweisbar im deutlichen Vorteil wäre.
[quote="Michael Scheidl"]
Also ist es notwendig, von (wenigstens halbwegs) ausgewogenen Stellungen in die berechnete Partie zu starten. - Ich persönlich bin ja, wie schon öfters erwähnt, von der Kurzbuchphilosophie abgekommen und halte derzeit
Vorgaben von 8...12 bewährten, menschlichen Eröffungszügen für angebracht.
[/quote]
Auch hier sind wir uns völlig einig, abgesehen davon, dass ich die Festlegung auf 8-12 immer noch für eine völlig unnötig willkürliche Kürze halte.
In manchen Stellungen steht nach 8 Zügen das Brett in Flammen, in anderen ist nach 12 Zügen die "Ausgewogenheit" schon leicht damit zu vewechseln, dass für beide Seiten das Remis die einzig sichere Fortsetzung ist, solche Stellungen gehören natürlich erst recht nicht ins Testbuch, wären genau so schlimm wie die schon gewonnenen, kann man durch engine- evals allein auch nicht ausschließen...
Was ausgewogen, aber noch des Ausspielens wert ist, die engines selbst durch einzelne eval- Werte im Standrechnen entscheiden zu lassen und sich auf 8 (12 ist eh schon progressiv
) Züge in der Länge festzulegen, das heißt, damit diejenigen engines, die in dieses Schema passen, (und das möglichst ähnlich bewerten) zu bevorzugen, genau so, wie wenn du immer gleich von der Grundstellung aus startest.
Damit hast du Dubletten, die hast du mit den 0815 Ausgangsstellungen auch im weitesten schachlichen Sinn, es sind nur keine zuggenau gleichen Partien, abgesehen davon ,dass sie sich eh keiner anschaut, eventuell auch gar nicht anschauen darf.
Die kleinste Remishäufigkeit wirst du von der Grundstellung aus haben, obwohl die Dubletten für das rein statistische Auswerten, wenn's auf den Verlauf der Partien ja eh nicht ankommt, vollkommen egal sein könnten, tut man so, als würde man schachlich was anderes haben, hat man aber nicht, man hat scheinbar Chancengleichheit, in Wirklichkeit sind die engines, die mit der Grundstellung am besten zurecht kommen, bevorzugt.
Hätte man einen Mix aus grundstellungsnahen, aus Mittelspiel- und aus Endspielstellungen, wäre den verschiedenen Stärken und Schwächen allein schon dadurch besser Rechnung getragen.
Das alles wissen wir alle schon lange, und haben uns einfach damit abgefunden, dass das, was wir mit den Standardranglisten messen, genau so wenig allgemein gültig sein kann, wie jede beliebig andere Messmethode, wir haben aber halt was, wozu wir meinen, berechtigt, Elo sagen dürfen, Gott sei Dank!
Jetzt stehen wir aber mehr und mehr an damit, weil die engines, die seit Jahr und Tag auf diesen Standard hin geeicht, entwickelt und geklont worden sind, selbst in diesem Standardtest und selbst wenn wir sie weiter hauptsächlich auf single core und mit Kurzpartien testen, immer mehr Remis spielen und trotzdem zu Hauf gegen 3000 auflaufen.
Allein dadurch wird es irgendwann selbst dem hartgesottensten Tester klar, dass das so keinen Sinn mehr hat über den bloßen Eigensport einer eigenen Ranglistencommunity hinaus.
[quote="Michael Scheidl"]
Peter scheint gegenteiliger Meinung zu sein, aber ich bin nicht sicher ob ich ihn richtig interpretiere.
[/quote]
Du versuchst es aber immerhin konstruktiv, wie das so deine Art ist, davon abgesehen liegst du verdammt nahe genau an dem, was ich meine.
Tut mir ja auch leid, immer wieder die Kreise derjenigen zu stören, denen die heilige Kuh Celo alles ist, unter Menschenspielern kann man sich auch ganz schön Feinde machen, wenn man die ehrlich erworbenen Elo eines Meisters in den Schmutz zieht, indem man einem Züge, Varianten, die er für best moves ausgibt, mit engine- Unterstützung anzweifelt.
Wie Kortschnoi damals am Ende dieser Simultanpartie zum resignationsunwilligen Gegner sagte: "Ich bin Großmeister", war ja wahrscheinlich nicht ernst gemeint, wird aber halt immer wieder furchtbar ernst genommen.
Ich sag seit Jahr und Tag nichts anderes als das: Spielstärke ist bei Menschen und bei engines nur stellungsabhängig messbar, ob es da bei engines überhaupt noch Sinn macht, sie in Elo zu messen, sei dahingestellt, es wird nur, je näher sie in gerade dieser Kategorie zusammenrücken umso fraglicher, ob man nicht doch auch hin und wieder stellungsabhängig testen sollte (sich klarmachen, dass man es sowieso immer tut
), und auf die Celo sch.... ups, was schreib ich denn, pfeifen, wollte ich natürlich sagen.